Kapitel 9 Hamilton

Kapitel 9
Hamilton-Formalismus
Die Bedeutung des Hamilton-Formalismus wird erst bei der Beschäftigung mit
der Quantenmechanik und der statistischen Mechanik deutlich: In der Quantenmechanik geht der Hamilton-Operator, dessen Eigenfunktionen die stationären
Zustände des Systems beschreiben, auf die Hamilton-Funktion zurück. In der
statistischen Mechanik wird der Phasenraum durch die Koordinatenachsen für
Orte und Impulse aufgespannt. In der Mechanik selbst wird statt des HamiltonFormalismus meist der dazu weitgehend äquivalente Lagrange-Formalismus verwendet.
9.1
Eindimensionale Bewegung
Ein System werde durch die verallgemeinerte (oder generalisierte) Koordinate
q, die verallgemeinerte Geschwindigkeit q̇ und die Lagrange-Funktion L(q, q̇, t)
beschrieben. Später betrachten wir die Erweiterung dieses Ansatzes auf n verallgemeinerte Koordinaten und Geschwindigkeiten. Als verallgemeinerten Impuls
(auch kanonischer, generalisierter oder konjugierter Impuls genannt) definieren
wir
∂L
(9.1)
p=
∂ q̇
Alternativ können wir das System jetzt durch die verallgemeinerten Koordinaten
q und p und durch die Hamilton-Funktion
H(q, p, t) = pq̇(q, p) − L(q, q̇, t)
(9.2)
beschreiben, wobei wir den Impuls p als unabhängige Koordinate auffassen, die
nicht von der Ortskoordinate q abhängt, während q̇ eine Funktion von q und p
ist, deren explizite Form nicht bekannt sein muss. Die rechte Seite von (9.2) lässt
sich daher ebenfalls als Funktion von q, p und t verstehen. Um aus der HamiltonFunktion Bewegungsgleichungen für q und p abzuleiten, bilden wir zunächst die
partiellen Ableitungen von H. Da H(q, p, t) eine Funktion der Ortskoordinate, des
79
Impulses und der Zeit ist, sollte sich auch die rechte Seite von Gleichung (9.2) als
Funktion allein von q, p und t schreiben lassen. Falls sich Gleichung (9.1) nach
der verallgemeinerten Geschwindigkeit q̇ auflösen läßt, können wir diese explizit
als Funktion q̇(q, p) der Ortskoordinate und des Impulses darstellen und dadurch
aus der rechten Seite von Gleichung (9.2) eliminieren. Im Allgemeinen wird dies
aber nicht möglich sein, so dass wir bei der partiellen Ableitung von Gleichung
(9.2) nach q die Kettenregel anwenden müssen:
∂ q̇ ∂L ∂L ∂ q̇
∂ q̇ ∂L
∂ q̇
∂L
∂H
=p −
−
=p −
−p
=−
∂q
∂q
∂q
∂ q̇ ∂q
∂q
∂q
∂q
∂q
(9.3)
Wir formen den letzten Ausdruck mit Hilfe der Lagrange-Gleichung und der Definition des verallgemeinerten Impulses um,
 
d ∂L
∂L
=
= ṗ ,
(9.4)
∂q
dt ∂ q̇
und erhalten schließlich
∂H
= −ṗ .
∂q
(9.5)
Auf ganz ähnliche Weise können wir auch die partielle Ableitung nach dem Impuls
p berechnen:
∂H
∂ q̇ ∂L ∂ q̇
∂ q̇
∂ q̇
= q̇ + p −
= q̇ + p − p
= q̇
∂p
∂p
∂ q̇ ∂p
∂p
∂p
(9.6)
Die partiellen Ableitungen der Hamilton-Funktion nach der Ortskoordinate und
dem Impuls bilden zusammen die kanonischen oder Hamiltonschen Gleichungen:
ṗ = −
∂H
∂q
und q̇ =
∂H
.
∂p
(9.7)
Dies sind zwei Differentialgleichungen 1. Ordnung, die gleichwertig zu der einen
Differentialgleichung 2. Ordnung sind, die aus dem Lagrange-Formalismus folgt.
9.1.1
Nicht-relativistisches Teilchen im Potential
Als Beispiel betrachten wir ein nicht-relativistisches Teilchen der Masse m, das
sich im Potential V (x) längs der x-Achse bewegt und durch die LagrangeFunktion
m
(9.8)
L(x, ẋ) = ẋ2 − V (x)
2
beschrieben wird. Der verallgemeinerte Impuls lautet in diesem Fall
p=−
∂L
= mẋ ,
∂ ẋ
80
(9.9)
und für die Hamilton-Funktion erhalten wir nach Definition
m

p2
2
H(x, p) = pẋ −
ẋ − V (x) =
+ V (x) .
2
2m
(9.10)
Mit der Definition der Kraft
F (x) = −
∂V (x)
∂x
(9.11)
und der ersten kanonischen Gleichung erhalten wir die Bewegungsgleichung
ṗ = −
∂H
= F (x) ,
∂x
(9.12)
die dem zweiten Newtonschen Gesetz entspricht. Die zweite kanonische Gleichung
liefert in diesem Fall nichts Neues, nämlich nur die Darstellung von p in Abhängigkeit von ẋ.
9.2
Zeitabhängigkeit
Wir betrachten zunächst die partielle Zeitableitung von H:
∂ q̇ ∂L ∂ q̇ ∂L
∂H
=p −
−
.
∂t
∂t
∂ q̇ ∂t
∂t
(9.13)
Ein Blick auf die Definition (9.1) des verallgemeinerten Impulses macht deutlich,
daß die ersten beiden Terme in Gleichung (9.13),
p
∂ q̇ ∂L ∂ q̇
−
,
∂t
∂ q̇ ∂t
(9.14)
sich aufheben, woraus folgt, daß die partiellen Zeitableitungen von H und L bis
auf das Vorzeichen übereinstimmen:
∂H
∂L
=−
.
∂t
∂t
(9.15)
Daraus und aus den kanonischen Gleichungen gewinnen wir die totale Zeitableitung
dH
∂H
∂H
∂H
∂H
∂L
=
q̇ +
ṗ +
= −ṗq̇ + q̇ ṗ +
=−
.
(9.16)
dt
∂q
∂p
∂t
∂t
∂t
Die Hamilton-Funktion ist also genau dann eine Erhaltungsgröße, wenn sie nicht
explizit von der Zeit abhängt, oder was äquivalent ist, wenn die LagrangeFunktion nicht explizit von der Zeit abhängt. Bei abgeschlossenen Systemen ist
dies aufgrund der Homogenität der Zeit immer der Fall, und in diesem Fall ist
die Hamilton-Funktion, die wir später mit der gesamten Energie des Systems
identifizieren werden, eine Erhaltungsgröße.
81
9.3
Hamilton-Funktion mit vielen Freiheitsgraden
Wir können den Hamilton-Formalismus leicht auf ein System mit vielen Freiheitsgraden übertragen. In diesem Fall beschreiben wir das System durch n verallgemeinerte Koordinaten q1 , . . . , qn und Geschwindigkeiten q̇1 , . . . , q̇n und durch die
Lagrange-Funktion L(q1 , . . . , qn , q̇1 , . . . , q̇n , t). Als verallgemeinerte (oder kanonische) Impulse definieren wir
∂L
,
(9.17)
pj =
∂ q̇j
und die Hamilton-Funktion lautet jetzt
H(q1 , . . . , qn , p1 , . . . , pn , t) =
n

pj q̇j − L(q1 , . . . , qn , q̇1 , . . . , q̇n , t) .
(9.18)
j=1
Partielle Ableitung von Gleichung (9.18) nach der Ortskoordinate qk liefert
∂H
∂qk
n

n
n

n
∂L  ∂L ∂ q̇j
∂ q̇j
=
pj
−
−
∂q
∂q
∂ q̇j ∂qk
k
k
j=1
j=1
∂L  ∂ q̇j
∂ q̇j
=
pj
−
−
pj
∂q
∂q
∂qk
k
k
j=1
j=1
∂L
∂qk


d ∂L
= −
dt ∂qk
= −ṗk ,
= −
(9.19)
und für die partiellen Ableitungen nach den Impulsen pk erhalten wir
n
n
 ∂ q̇j  ∂L ∂ q̇j
∂H
= q̇k +
pj
−
∂pk
∂p
∂ q̇j ∂pk
k
j=1
j=1
= q̇k +
n

n
pj
j=1
∂ q̇j  ∂ q̇j
−
pj
∂pk j=1 ∂pk
= q̇k .
(9.20)
Die kanonischen Gleichungen lauten schließlich
ṗk = −
∂H
∂qk
und q̇k =
∂H
∂pk
für k = 1, . . . , n
(9.21)
Wie man leicht zeigen kann, ist die Hamilton-Funktion auch im Fall von n Freiheitsgraden genau dann eine Erhaltungsgröße, also zeitlich konstant, wenn die
Lagrange-Funktion nicht explizit von der Zeit abhängt.
82
9.4
Kovariante Hamilton-Funktion
Um eine offensichtlich kovariante (wir sagen auch manifest kovariante Formulierung der Hamilton-Funktion zu erhalten, nehmen wir die Lagrange-Funktion
(8.29) als Ausgangspunkt:
1
L = muµ uµ .
(9.22)
2
Die Komponenten des konjugierten Viererimpulses lauten dann
pµ =
∂L
= muµ
∂uµ
(9.23)
und die Vierergeschwindigkeit in Abhängigkeit vom konjugierten Viererimpuls
lautet dann
pµ
uµ =
.
(9.24)
m
Wir ersetzen nun die Vierergeschwindigkeit uµ in eine kovariante Definition der
Hamilton-Funktion,
H(xµ , pµ , τ ) = pν uν (xµ , pµ ) − L (xµ , uµ (xν , pν ), τ )
(9.25)
ein, und erhalten die gesuchte kovariante Form
H=
pµ pµ
pµ pµ pµ pµ
−
=
m
2m
2m
(9.26)
der Hamilton-Funktion eines freien Teilches in Abhängigkeit von Ort und Impuls.
Diese manifest kovariante Hamilton-Funktion ist selbstverständlich ebensowenig
eindeutig wie die Lagrange-Funktion. So ändert beispielsweise die Addition eines
konstanten Ausdrucks zur Hamilton-Funktion die Bewegungsgleichungen nicht.
Wir schreiben die erste Gruppe der Hamiltonschen Gleichungen (9.21) in manifest kovarianter Form, indem wir die Zeitableitung als Ableitung nach der Eigenzeit τ schreiben,
∂pµ
∂H
=−
=0
(9.27)
∂τ
∂xµ
und erhalten so die Bewegungsgleichung
∂pµ
=0
∂τ
(9.28)
für das freie Teilchen. Die zweite Gruppe der Hamiltonschen Gleichungen,
∂H
pµ
∂xµ
=
=
,
∂τ
∂xµ
m
(9.29)
liefert uns in diesem Beispiel nichts Neues, nämlich nur den schon bekannten
Zusammenhang zwischen der Geschwindigkeit und dem Impuls.
83
Die oben betrachtete manifest kovariante Darstellung der Hamilton-Funktion
läßt sich offenbar nicht für ein System mit mehreren Teilchen verallgemeinern,
denn diese werden, sofern sie sich gegeneinander bewegen können, keine gemeinsame Eigenzeit besitzen. Daher betrachten wir nun die Hamilton-Funktion in einem
beliebigen Inertialsystem S’, das nicht das Ruhesystem des Teilchens sein muß.
Wir nehmen an, daß die Wirkung unabhängig von der Wahl des Koordinatensystems ist, was eine hinreichende, wenn auch nicht notwendige Voraussetzung
dafür ist, daß die Bewegungsgleichungen in S’ die gleiche Form wie im Ruhesystem des Teilchens haben. Zur Vereinfachung wählen wir S’ so, daß sich das
Teilchen momentan mit der Geschwindigkeit v entlang der x′1 -Achse bewegt. Es
muß dann gelten:


S = L dτ = L′ dt = S ′ .
(9.30)
Mit dt = γdτ folgt daraus
1
L′ = γ −1 L = mu′µ u′µ
2

1
v2
1 − 2 = mc2
c
2

1−
v2
c2
(9.31)
Diese Wahl für die Lagrange-Funktion hat den Nachteil, daß der konjugierte
Impuls für positive Geschwindigkeiten ein negatives Vorzeichen bekommt. Wir
möchten, daß der konjugierte Impuls eines freien Teilchens für kleine Geschwindigkeiten mit dem klassischen Impuls p = mv zusammen fällt. Deshalb nutzen
wir die Freiheit aus, die Lagrange-Funktion mit einem beliebigen Faktor zu multiplizieren (in diesem Fall mit −2), ohne daß die Bewegungsgleichung sich ändert.
Wir verwenden daher die Lagrange-Funktion

v2
(9.32)
L = −mc2 1 − 2
c
und erhalten so den konjugierten Impuls
p=
 v
∂L
= −mc2 γ − 2 = mγv .
∂v
c
und die Hamilton-Funktion
(9.33)
mc2
.
(9.34)
γ
Zur besseren Lesbarkeit verwenden wir nur ungestrichene Größen, obwohl wir
das beliebig gewählte Inertialsystem mit S’ bezeichnet hatten. Um die HamiltonFunktion ausschließlich als Funktion des Impulses schreiben zu können (vom Ort
darf H nicht abhängen, da das Teilchen frei sein soll), müssen wir γ und v ebenfalls
als Funktionen von p schreiben.
Aus der Definition von γ erhalten wir durch Quadrieren und Neuordnen


v2
2
γ 1− 2 =1,
(9.35)
c
H = pv +
84
woraus durch geeignete Umformung
m2 γ 2 = m2 +
(mγv)2
p2
2
=
m
+
c2
c2
(9.36)
folgt. Wir können jetzt v und γ in Gleichung (9.34) durch Ausdrücke, die nur
vom Impuls abhängen ersetzen und die Hamilton-Funktion in der Form

(9.37)
H = m2 c4 + p2 c2
schreiben.
Da die Lagrange-Funktion nicht explizit von der Zeit abhängt, ist H für das
freie Teilchen zeitlich konstant. In einem Inertialsystem, in dem das Teilchen
kleine Geschwindigkeiten und damit auch kleine Impulse p ≪ mc besitzt, gilt
näherungsweise
p2
.
(9.38)
H ≈ mc2 +
2m
Für kleine Geschwindigkeiten und Impulse entspricht H also, bis auf einen konstanten Term, der klassischen kinetischen Energie p2 /2m.
Wir identifizieren den Ausdruck

H = m2 c4 + p2 c2
(9.39)
als relativistische Energie eines freien Teilchens. Im Ruhesystem des Teilchens
verschwindet sein Impuls, und die Energie des freien Teilchens, in diesem Fall
Ruheenergie genannt, lautet
E0 = mc2 .
(9.40)
Da sich wie oben festgestellt die Bewegungsgleichung nicht ändert, wenn der
Lagrange- oder der Hamilton-Funktion eine Konstante hinzugefügt wird, stellt
sich die Frage, ob die Ruheenergie (9.40) irgendeine physikalische Bedeutung
hat. Tatsächlich wäre der Ausdruck mc2 aber nur dann eine Konstante, wenn die
Ruhemasse eine Erhaltungsgröße wäre. Dies ist aber nicht der Fall: die Summe
aller Ruhemassen kann sich im Laufe der Zeit ändern. Nach Gleichung (9.40) ist
jede Änderung der Ruhemasse mit einer Änderung der Ruheenergie des Teilchens
verbunden, das heißt es gilt
∆E0 = ∆mc2 .
(9.41)
Wenn wir fordern, daß ein Teilchen dessen Ruhemasse gegen Null strebt, auch
eine gegen Null strebende Ruheenergie haben soll, dann ist die Energie (9.39)
eindeutig festgelegt.
Gleichung (9.40) sagt uns, daß ein zusammengesetztes Teilchen, bei dessen
Bildung Energie freigesetzt wurde, eine geringere Ruhemasse als die Summe der
Ruhemassen seiner Bestandteile hat. Diese Beobachtung wird auch als Massendefekt bezeichnet und läßt sich etwa bei der Verschmelzung von zwei Deuteriumkernen zu einem Heliumkern beobachten. Grundsätzlich hat auch ein Wasserstoffmolekül eine geringere Masse als die Summe der Massen zweier getrennter
85
Wasserstoffatome. Infolge der im Vergleich zur Kernfusion deutlich geringeren
Bindungsenergie ist der Massendefekt bei der Bildung des Wasserstoffmoleküls
jedoch viel schwerer zu beobachten.
Gleichung (9.40) sagt uns auch, daß ein energetisch angeregtes Teilchen träger
ist als ein gleiches Teilchen im Grundzustand. Der Begriff der Ruheenergie ist
auch von Bedeutung, wenn man versucht die Masse eines elementaren Teilchens
aus seinen Wechselwirkungen zu verstehen.
Die in (9.39) formulierte Energie eines freien Teilchens interpretieren wir als
Summe H = E0 + T aus der Ruheenergie E0 und der kinetischen Energie T . Die
kinetische Energie muß dann die Form

(9.42)
T = m2 c4 + p2 c2 − mc2
haben, oder, in Abhängigkeit von der Geschwindigkeit v:
T = mc2 (γ − 1) .
(9.43)
Daraus wird offensichtlich, daß sich die relativistische Lagrange-Funktion nicht
als Differenz zwischen kinetischer und potentieller Energie schreiben läßt. Für
kleine Geschwindigkeiten kann der Lorentz-Faktor γ durch den Ausdruck
γ ≈1+
1 v2
2 c2
für |v| ≪ c
(9.44)
angenähert werden und die kinetische Energie hat den aus der nichtrelativistischen Mechanik bekannten Wert
T =
m 2
v
2
für |v| ≪ c .
(9.45)
Wenn das Teilchen mit seiner Umgebung wechselwirkt, müssen wir zur
Lagrange-Funktion (9.32) einen Term −V hinzufügen, der diese Wechselwirkung
beschreibt. Wenn die Wechselwirkung derart ist, daß V sich als Funktion der Ortskoordinate x schreiben läßt, verschwindet die partielle Ableitung von V nach ẋ,
so daß der konjugierte Impuls weiterhin die Form p = γmẋ hat. Die relativistische
Hamilton-Funktion eines Teilchens in einem äußeren Potential V lautet dann

(9.46)
H = m2 c4 + p2 c2 + V .
9.5
Die elektromagnetische Masse
Wir versuchen, uns an einem besonders einfachen Modell des Elektrons zu veranschaulichen, wie die Energie EC einer Ladungsanordnung zu deren Ruhemasse
beiträgt. Unter der Energie der Ladungsanordnung verstehen wir dabei die Arbeit, die geleistet werden muss, um die einzelnen Ladungsbestandteile aus dem
86
Unendlichen an die Positionen zu bringen, die sie in der gewählten Ladungsanordnung einnehmen. Wir setzen dabei voraus, dass zwischen zwei Ladungen qA
und qB an den Orten rA und rB die Coulomb-Kraft
FC,A =
qA qB rA − rB
4πε0 |rA − rB |3
(9.47)
auf die Ladung A wirkt. Die Kraft auf Ladung B ergibt sich durch Vertauschung
der Indizes.
Abbildung 9.1: Einfaches Modell für ein beschleunigtes Elektron: Selbstwechselwirkung führt zur Trägheit
Unser einfaches Elektronenmodell besteht nun aus einer Hantel der Länge d,
die senkrecht zur x-Achse angeordnet ist, und an deren beiden Enden (A und B
genannt, siehe Abbildung 9.1) jeweils die Ladung qA = qB = e/2 tragen. Diese
Hantel soll fortwährend gleichförmig mit a in positive x-Richtung beschleunigt
werden. Dieses Modell lässt sich besonders einfach in einem Inertialsystem untersuchen, in dem die Hantel zum Zeitpunkt t0 = 0 im Ursprung ruht. Die in diesem
Bezugssystem abgeleiteten Ergebnisse hängen aber nicht von der günstigen Wahl
des Koordinatensystems ab, da die physikalischen Gesetze in jedem Inertialsystem gelten, also invariant gegenüber einer Geschwindigkeitstransformation sind.
Zu einem beliebigen Zeitpunkt t haben die beiden Hantelenden A und B dann
die Positionen

 2

 2
d
at
d
at
,+ ,0
und rB (t) =
,− ,0 .
(9.48)
rA (t) =
2
2
2
2
Da die Hantel zum Zeitpunkt t0 in unserem Inertialsystem ruht, wirkt zu diesem Zeitpunkt auch nur die Coulomb-Kraft (9.47) und nicht die Lorentz-Kraft,
die man im Fall einer allgemeinen Bewegung ebenfalls berücksichtigen müsste.
Wir werden im Folgenden immer wieder davon Gebrauch machen, dass wir die
Hantellänge d sehr klein wählen wollen, so dass wir bei allen Ausdrücken, die
sich als Potenzreihe von d darstellen lassen, alle Potenzen außer der niedrigsten
vernachlässigen können.
Voraussetzung für die Entstehung der elektromagnetischen Masse des Elektrons ist die Endlichkeit der Lichtgeschwindigkeit c, die die Ausbreitung aller
87
Wechselwirkungen beschränkt. Aus diesem Grund dürfen wir bei der Berechnung der Coulomb-Wechselwirkung zwischen den Ladungen A und B nicht deren
augenblickliche Positionen verwenden, sondern müssen berücksichtigen, dass die
Ladungen während der Ausbreitung der Coulomb-Kraft ihre Positionen verändert
haben. Die Coulomb-Kraft, die das Hantelende A am Ort rA (t0 ) zur Zeit t0 = 0
spürt, wird also durch das Hantelende B am Ort rB (tr ) zu einer früheren Zeit
tr < 0 (häufig als retardierte Zeit bezeichnet) hervorgerufen. Zum Zeitpunkt t0
sieht“ die Hantel ihre vergangene Position in Beschleunigungsrichtung vor sich
”
liegen und wird von dieser zurückgestoßen. Die endliche Ausbreitungsgeschwindigkeit der Coulomb-Kraft führt also dazu, dass die geladene Hantel von der
Coulomb-Kraft ihrer eigenen Vergangenheit gebremst wird. Die retardierte Zeit
tr wird durch die Beziehung
c2 t2r = r2
(9.49)
festgelegt, wobei
r = |rA (t0 ) − rB (tr )|
(9.50)
der Abstand zwischen der augenblicklichen Position von A und der retardierten
Position von B ist. Dieser Abstand hängt von der Hantellänge d und der Strecke
at2r
(9.51)
2
ab, die die Hantel innerhalb des Zeitintervalls |tr | zurücklegt. Wir dürfen in Gleichung (9.51) unbesorgt das Weg-Zeit-Gesetz der klassischen Mechanik verwenden,
da unsere Hantel für genügend kleines d und damit, wie wir gleich sehen werden,
auch kleines tr nur sehr kleine Geschwindigkeiten erreicht. Im Folgenden zeigen
wir auf sehr einfache Weise, wie wir den Abstand r für kleine Hantellängen d
annähern können. Eine strengere Betrachtung, die zum gleichen Ergebnis führt,
findet sich im Anhang (A.4).
Wenn wir jetzt grundsätzlich voraussetzen, dass sich die retardierte Zeit tr und
der Abstand r als Potenzreihen von d schreiben lassen, dann müssen die konstanten Terme verschwinden, nicht aber die linearen Terme. Andernfalls hätten wir
einen Widerspruch für den Grenzfall verschwindender Beschleunigung (a = 0),
denn in diesem Fall ruht die Hantel im Ursprung (ℓ = 0), und die Coulomb-Kraft
muss sich nur entlang der Hantel ausbreiten, so dass exakt tr = d/c und r = d
gelten. Wird die Beschleunigung von Null verschieden (a > 0), muss aufgrund
der Bewegung der Hantel (ℓ > 0) die retardierte Zeit größer werden, da sich jetzt
die Coulomb-Kraft über einen größeren Abstand r > d ausbreiten muss. Für sehr
kleine Hantellängen d können wir aber weiterhin zumindest näherungsweise
ℓ=
d
und r ≈ d
(9.52)
c
schreiben, da die Korrekturen von höherer Ordnung in d sein müssen. Bildlich
gesprochen bewegt sich das Licht viel schneller als die Hantel, so dass die Bewegung der Hantel in erster Näherung keine Rolle spielt. Für die von der Hantel
tr ≈
88
zurückgelegte Strecke ℓ verschwindet der lineare Term, so dass die erste nichttriviale Näherung von der Ordnung 2 oder höher ist. Mit Hilfe der Gleichungen
(9.51) und (9.52) kommen wir zu der Näherung
ad2
.
2c2
ℓ≈
(9.53)
Wir berechnen jetzt die Coulomb-Kraft, die Hantelende B auf Hantelende
A ausübt. Dabei interessiert uns nur die x-Komponente dieser Kraft, denn aus
Symmetriegründen müssen die y- und z-Komponenten verschwinden. Mit Hilfe
von Gleichung (9.47) erhalten wir
Fx,A = −
(e/2)2 ℓ
,
4πε0 r3
(9.54)
denn −ℓ ist die x-Komponente des Vektors (rA − rB ). Wegen (9.52) und (9.53)
dürfen wir für kleine d auch
Fx,A = −
e2
a
16πε0 2dc2
(9.55)
schreiben. Die Kraft auf das Hantelende B muss aus Symmetriegründen gleich
groß sein, so dass insgesamt auf die Hantel eine Kraft mit der x-Komponente
Fx = −
e2 a
16πε0 dc2
(9.56)
wirkt, die der Beschleunigung entgegengesetzt ist.
Nehmen wir an, die ungeladene Hantel habe eine Masse m0 und es wirke die
äußere Kraft Fext , so dass nach dem zweiten Newtonschen Gesetz
Fext = m0 a
(9.57)
gilt. Wird die Hantel nun geladen, muss auf der linken Seite von Gleichung (9.57)
zu der äußeren Kraft noch die Coulomb-Wechselwirkung der Hantel mit sich
selbst, Fx , hinzugefügt werden, so dass wir
Fext + Fx = m0 a
oder

Fext =
e2
m0 +
16πε0 dc2
(9.58)

a
(9.59)
erhalten. Den zweiten Term im Klammerausdruck können wir als elektromagnetische Masse
e2
mem =
(9.60)
16πε0 dc2
89
interpretieren, die durch die Coulomb-Wechselwirkung der Hantel mit sich selbst
entsteht. Es fällt auf, dass der Ausdruck für mem Ähnlichkeit mit der potentiellen
Energie EC der Hantel hat. Diese potentielle Energie ist gleich der Arbeit
 d
1 (e/2)2
W =−
dr ,
(9.61)
r2
∞ 4πε0
die wir leisten müssen, um zwei Ladungen e/2 aus dem Unendlichen bis auf den
Abstand d aneinander heranzubringen. Die Auswertung des Integrals liefert
EC =
e2
,
16πε0 d
(9.62)
so dass wir die Masse mem auch in der Form
mem =
EC
c2
(9.63)
schreiben können. Wenn wir unsere Hantel als einfaches Modell für das Elektron
verstehen und annehmen, die Elektronenmasse me rühre nur von der Selbstwechselwirkung der Ladungsbestandteile des Elektrons her, dann können wir Gleichung (9.60) verwenden, um mit
d=
e2
≈ 7 × 10−16 m
16πε0 me c2
(9.64)
den Radius des Elektrons abzuschätzen (dieser Wert ist um den Faktor 4 kleiner
als der in der Literatur häufig angeführte klassische“ Elektronenradius, der sich
”
aus einem Kugelmodell ergibt).
Das einfache Hantelmodell liefert auf den ersten Blick mit Gleichung (9.63)
einen mit der Speziellen Relativitätstheorie konsistenten Ausdruck für den Teil
der Elektronenmasse, der aus der Wechselwirkung der Elektronenladung mir ihrem eigenen Feld herrührt. Doch offenkundig hat dieses Modell große Schwächen.
So unterscheidet sich die für eine longitudinal bewegte Hantel erhaltene Masse mem um einen Faktor 2 von der hier für unsere transversal bewegte Hantel
erhaltenen Masse [?]. Für das realistischere (und deutlich aufwändiger zu berechnende) Modell einer homogen geladenen Kugel erhält man einen unerwünschten
Faktor 3/4 in Gleichung (9.63). Unbefriedigend ist auch der durch Gleichung
(9.64) abgeschätzte Elektronenradius, der deutlich größer als die experimentelle
Obergrenze für eine mögliche Ausdehnung des Elektrons ist, die derzeit bei etwa
10−19 m liegt. Schreibt man die gesamte Masse des Elektrons in der Form
me = m0 + mem ,
(9.65)
so erfordert ein derart kleiner Elektronenradius eine negative Masse m0 für das
ungeladene“ Elektron. Nimmt man das Elektron gar als punktförmig an, lässt
”
90
also d gegen Null streben, divergiert die Masse mem . Diese Divergenz lässt sich
auch durch eine quantenmechanische Behandlung des Problems nicht beheben. In
der Quantenelektrodynamik wendet man die Methode der Renormierung an, um
trotz solcher Divergenzen zu berechenbaren Größen zu kommen. Dabei geht man
davon aus, dass sich die Beiträge m0 und mem ebenso wie die Kopplung des Elektrons mit dem elektrischen Feld nicht einzeln beobachten lassen. Diese Größen
dürfen divergieren, wenn d beliebig klein wird, solange man endliche Werte für
die beobachtbaren Größen, wie die Elementarladung e und die Elektronenmasse
me erhält.
9.6
Erhaltungsgrößen
Eine verallgemeinerte Koordinate qk , die nicht explizit in der Lagrange-Funktion
vorkommt, wird als zyklische Koordinate bezeichnet. Für eine zyklische Koordinate qk ist
∂H
∂L
= 0 und damit
=0 .
(9.66)
∂qk
∂qk
Der zu einer zyklischen Koordinate qk konjugierte Impuls pk ist eine Erhaltungsgröße, denn nach den kanonischen Gleichungen (9.21) gilt
ṗk = −
∂H
=0.
∂qk
(9.67)
Nach Möglichkeit wird man daher für die Beschreibung eines Systems die verallgemeinerten Koordinaten qi so zu wählen suchen, dass möglichst viele Koordinaten
zyklisch sind, da für jede zyklische Koordinate eine Differentialgleichung weniger
gelöst werden muss.
Für abgeschlossene Systeme von Teilchen, auf die keine äußeren Einflüsse
vorhanden sind, lassen sich aus den Grundannahmen von der Homogenität von
Raum und Zeit und von der Isotropie des Raumes sowie aus dem Relativitätsprinzip sieben Erhaltungsgrößen bestimmen:
• Wegen der Homogenität der Zeit hängt die Lagrange-Funktion nicht explizit
von der Zeit ab, und die daraus folgende zeitliche Konstanz der HamiltonFunktion entspricht dem Energieerhaltungssatz.
• Wenn qi eine von drei generalisierten Koordinaten ist, die die Lage des
Massenmittelpunktes des Systems beschreiben, dann muss qi eine zyklische
Koordinate sein, andernfalls wäre der Raum nicht homogen. Die zu qi konjugierte Impulskoordinate pi ist dann zeitlich konstant. Da dies für alle drei
Impulskoordinaten des Massenmittelpunktes gilt, ist der Gesamtimpuls des
Systems eine vektorielle Erhaltungsgröße.
91
• Wenn die Winkelkoordinate qj eine von drei generalisierten Koordinaten
ist, die die Orientierung des Systems von Teilchen im Raum festlegen, dann
muss qj aufgrund der Isotropie des Raumes ebenfalls eine zyklische Koordinate sein. Die zu qj konjugierte Impulskoordinate pj ist dann zeitlich
konstant und hat die Dimension eines Drehimpulses. Alle drei zu den zyklischen Winkelkoordinaten konjugierten Impulse bilden zusammen eine weitere vektorielle Erhaltungsgröße, den Gesamtdrehimpuls.
• Nach dem Relativitätsprinzip gibt es keine absoluten Geschwindigkeiten,
so dass die Lagrange-Funktion nicht von der Geschwindigkeit des Massenmittelpunktes abhängen sollte (zumindest gibt es immer eine LagrangeFunktion, die nicht von dieser Geschwindigkeit abhängt und zu den gleichen Bewegungsgleichungen führt). Die drei Impulskoordinaten, die die Geschwindigkeit des Massenmittelpunktes beschreiben, sind daher zyklisch,
woraus jedoch keine neuen Erhaltungsgrößen folgen.
Eine Aussage, die die oben angestellten Betrachtungen verallgemeinert, wurde von der Mathematikerin Emmy Noether abgeleitet. Das nach ihr benannte
Noether-Theorem sagt aus, dass sich aus jeder einparametrigen Symmetrieoperation, die für ein System erlaubt ist, eine Erhaltungsgröße für das System ergibt.
9.7
Zusammenfassung
Der Hamilton-Formalismus ist weitgehend äquivalent zum LagrangeFormalismus. Nach der Definitionsgleichung (9.2) erhält man nach Definition
der kanonischen (oder konjugierten) Impulse
pj =
∂L
∂ q̇j
(9.68)
die Hamilton-Funktion
H(q1 , . . . , qn , p1 , . . . , pn , t) =
n

pj q̇j − L(q1 , . . . , qn , q̇1 , . . . , q̇n , t)
(9.69)
j=1
aus der Lagrange-Funktion. Umgekehrt kann man die Lagrange-Funktion aus der
Hamilton-Funktion gewinnen, sofern man die kanonischen Gleichungen
ṗk = −
∂H
∂qk
und q̇k =
∂H
∂pk
für k = 1, . . . , n
(9.70)
nach den verallgemeinerten Geschwindigkeiten q̇k auflösen kann. In diesem Fall
führen die kanonischen Gleichungen und die Lagrange-Gleichungen zu denselben
Bewegungsgleichungen.
92
Die Hamilton-Funktion eines Teilchens kann als Gesamtenergie des Teilchens
interpretiert werden und ist dadurch, anders als die Lagrange-Funktion, eine
messbare Größe.
Der Hamilton-Formalismus ist besonders geeignet, um Symmetrieeigenschaften des untersuchten Systems für die Aufstellung der Bewegungsgleichungen zu
nutzen. Im Fall von Symmetrieen lassen sich verallgemeinerte Koordinaten derart wählen, dass die Lagrange-Funktion nicht von ihnen abhängt. Solche Koordinaten werden dann als zyklische Koordinaten bezeichnet und die zugehörigen
Impulse sind Erhaltungsgrößen, ändern sich also im Verlauf der Zeit nicht. Ein
systematisches Verfahren, geeignete zyklische Koordinaten zu finden, stellt die
Hamilton-Jacobi-Theorie dar, die hier nicht behandelt wurde.
Die Hauptanwendungsgebiete des Hamilton-Formalismus sind die statistische
Physik und die Quantenmechanik, in der die Hamilton-Funktion zum HamiltonOperator verallgemeinert wird.
93