Theoretische Physik I (Mechanik)

Werbung
Skript zur Vorlesung
Theoretische Physik I
(Mechanik)
von Volker Meden
gehalten im Sommersemester 2014
an der RWTH Aachen
7. August 2014
2
Inhaltsverzeichnis
1 Eine kurze Einführung
5
2 Newtonsche Mechanik Teil II
2.1 Das Zweikörperproblem . . . . . . . . . . . . . . . . . . . . . . .
2.2 Bewegte Bezugssysteme . . . . . . . . . . . . . . . . . . . . . . .
2.3 Der starre Körper . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
7
22
33
3 Lagrangesche Mechanik
3.1 Systeme mit Zwangsbedingungen . . . .
3.2 Lagrangegleichungen 2. Art . . . . . . .
3.3 Lagrangegleichungen 1. Art . . . . . . .
3.4 Nochmal die Lagrangegleichungen 2. Art
3.5 Das Prinzip der kleinsten Wirkung . . .
3.6 Symmetrien und Erhaltungssätze . . . .
.
.
.
.
.
.
53
55
56
63
66
69
74
4 Schwingungen und Saiten
4.1 Kleine Schwingungen . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Schwingende Saiten . . . . . . . . . . . . . . . . . . . . . . . . . .
85
85
90
5 Hamiltonsche Mechanik
5.1 Variable, Bewegungsgleichungen
5.2 Die Poissonklammern . . . . . .
5.3 Kanonische Transformationen .
5.4 Die Hamilton-Jacobi-Gleichung
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
95
. 96
. 101
. 105
. 112
6 Grundzüge der relativistischen Mechanik
6.1 Die Lorentztransformation . . . . . . . . .
6.2 Die Kovarianz . . . . . . . . . . . . . . . .
6.3 Masse, Vierergeschwindigkeit und -impuls
6.4 Die Kraft in der relativistischen Mechanik
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
und. . .
. . . .
. . . .
. . . .
.
.
.
.
115
116
123
127
130
4
INHALTSVERZEICHNIS
Kapitel 1
Eine kurze Einführung
Zum Verständnis der Vorlesung Theoretische Physik I ist es nahezu unerläßlich,
den Inhalt der Vorlesung Einführung in die Theoretische Physik verinnerlicht
zu haben. Dies gilt sowohl für die in letzterer behandelten mathematischen Methoden, als auch die Grundlagen der Newtonschen Mechanik. Zur Vorbereitung
auf den neuen Stoff rate ich ihnen, die Kapitel 3.5 und 3.6 der letztsemestrigen
Vorlesung nocheinmal durchzuarbeiten.
In der vorliegenden Vorlesung werden wir zunächst die in der Einführungsvorlesung noch nicht behandelten Kapitel der Newtonschen Mechanik präsentieren,
nämlich das Zweikörperproblem, bewegte Bezugssysteme und den starren Körper.
Im Anschluß gehen wir zur Lagrangschen Mechanik – deren fundamentale Bewegungsgleichungen wir bereits kennen gelernt haben – und zur Hamiltonschen
Mechanik über. Den Abschluß der Vorlesung bildet ein kurzes Kapitel über die
Grundzüge der relativistischen Mechanik.
Mit Ausnahme der so genannten Variationsrechnung, die wir zu Beginn des
Kapitels über Lagrangesche Mechanik einführen werden, und relativ elementaren
Überlegungen zur analytischen Geometrie von Ellipsen und Hyperbeln haben wir
alle zum Verständnis der Physik notwendingen mathematischen Methoden in der
Vorlesung zur Einführung in die Theoretische Physik bereits kennengelernt, so
daß in der Vorlesung Theoretische Physik I die Physik im Vordergrund stehen
wird.
Wie sie sehen werden, wird ihr Abstraktionsvermögen im Laufe der Vorlesung zunehmend herausgefordert, aber gleichzeitig auch geschult. Es bietet sich
an, die neuen Herangehensweisen an die klassische Mechanik zunächst an ihnen
bereits vertrauten mechanischen Problemen “auszuprobieren”, auch wenn dabei
die Vorteile der neuen Verfahren – die meist für komplexere Probleme entwickelt
wurden – nicht immer offensichtlich werden. Sollten wir in der Vorlesung bzw.
den zugehörigen Übungen dieser Philosophie nicht folgen, so bietet es sich an,
bekannte Probleme zuhause durchzurechnen.
In der Vorlesung werden wir uns nach und nach grundsätzlichen Prinzipien
der (theoretischen) Physik nähern, wie z.B. dem Extremalprinzip und dem Zu5
6
KAPITEL 1. EINE KURZE EINFÜHRUNG
sammenhang zwischen Symmetrien und Erhaltungsgrößen. Eine allgemeine Formulierung dieser erfordert dabei erneut ein höheres Maß an Abstraktion als ihnen
bisher begegnet ist, bringt aber entsprechende Vorteile und kann schon in dieser Vorlesung, aber auch in den Vorlesungen der theoretischen Physik späterer
Semester, gewinnbringend eingesetzt werden.
Kapitel 2
Newtonsche Mechanik Teil II
2.1
Das Zweikörperproblem
Aufbauend auf unsere Überlegungen zur Bewegung eines Teilchens in einem
zweidimensionalen, konservativem Zentralfeld (siehe Kapitel 3.6 der Vorlesung
Einführung in die Theoretische Physik) wollen wir jetzt das “berühmte” Zweikörperproblem mit 1/r-Paarpotential (im Dreidimensionalen) diskutieren. Es spielte in der Entwicklung der Mechanik eine zentrale Rolle (Bewegung eines Planeten
um die Sonne).
Wir gehen davon aus, daß sich die Kräfte, die die beiden Teilchen mit Massen
m1 und m2 aufeinander ausüben aus einem Zweiteilchenpotential v(|~r1 − ~r2 |)
ableiten lassen. Damit gelten die Newtonschen Bewegungsgleichungen
~ ~r1 v ; ,
m1~r¨1 = −∇
~ ~r2 v = ∇
~ ~r1 v .
m2~r¨2 = −∇
Die Addition der beiden Gleichungen liefert für den Schwerpunkt
~ = (m1~r1 + m2~r2 )/M ,
R
mit der Gesamtmasse M = m1 + m2 die Bewegungsgleichung
~¨ = 0 ,
MR
d.h. der Schwerpunkt bewegt sich geradlinig und gleichförmig. Eine zweite Bewegungsgleichung für den Relativvektor ~r = ~r1 − ~r2 erhält man, indem man
die erste Gleichung im obigen Gleichungssystem mit m2 und die zweite mit m1
multipliziert und anschließend subtrahiert
~ r|) .
µ~r¨ = −∇v(|~
Dabei bezeichnet µ = m1 m2 /M die so genannte reduzierte Masse.
7
8
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Als Folge dieser Überlegungen haben wir das Zweiteilchenproblem auf die
Bewegung eines Teilchens der Masse µ im externen Zentralpotential v(|~r|) zurück
geführt. Die Bewegungsgleichung für die Relativkoordinate läßt sich nun auf den
in Kapitel 3.6 der letztsemestrigen Vorlesung behandelten Fall der Bewegung
eines Teilchens in zwei Dimensionen reduzieren, da das zum Potential gehörende
Kraftfeld
~ r|) = −v 0 (r) ~rˆ
−∇v(|~
ein Zentralfeld ist (Richtung der Kraft ist ~rˆ). Wie wir gesehen haben, ist für
solche der (relative) Drehimpuls ~lrel = µ ~r × ~r˙ erhalten
d
d~lrel
= µ (~r × ~r˙ ) = µ ~r × ~r¨ = 0 .
dt
dt
Wie im letzten Semester diskutiert liegt damit jede Bahnkurve in einer Ebene,
die senkrecht zu ~lrel ist. Wie üblich wählen wir unser Koordinatensystem so, daß
~lrel entlang der x3 -Achse zeigt und die Bewegung ist auf eine zweidimensionale in
der x1 -x2 -Ebene reduziert.
Folgend werden wir am Fall des Gravitationspotentials ∝ 1/r interessiert sein.
Wir werden jedoch zuvor diskutieren, daß sich unter gewissen Annahmen an das
Potential bereits wichtige Aussagen treffen lassen, ohne die Bewegungsgleichung
explizit zu lösen. Die beiden Überlegungen scheinen ihnen vielleicht zunächst als
abstrakt, sind aber von großer Nützlichkeit auch über die klassische Mechanik
hinaus.
Mechanische Ähnlichkeit: Wir betrachten ein Kraftfeld F~ (~r) mit der Eigenschaft
F~ (α~r) = αk F~ (~r)
für alle α > 0. Man nennt eine Funktion mit dieser Eigenschaft eine homogene
Funktion. Typische Beispiele sind das Gravitationsfeld (in drei Dimensionen) mit
k = −2 und ein d-dimensionaler, isotroper (alle Raumrichtungen sind äquivalent)
harmonischer Oszillator mit k = 1. Sei nun ~r(t) eine Lösung der Newtonschen
Gleichung, d.h. von m~r¨(t) = F~ (~r(t)). Durch eine so genannte Skalentransformation mit dem Faktor α > 0 ändern wir die räumliche Ausdehnung der Bahn
~r → α~r. Zum Beispiel wird aus einer Kreisbahn mit Radius r0 eine mit Radius
αr0 . Wir zeigen nun, daß man durch Umskalieren der Zeit eine neue Lösung der
Newtonschen Gleichung erhalten kann. Wir setzen für die umskalierte Zeitvariable
τ = α−ν t
und legen ν später so fest, daß sich eine neue Lösung mit
~rα (τ ) = α~r(t) = α~r(αν τ )
2.1. DAS ZWEIKÖRPERPROBLEM
9
ergibt. Differentiation dieser Gleichung nach τ liefert
m
d2~rα (τ ) ~
− F (~rα (τ )) = α2ν+1 m~r¨(t) − αk F~ (~r(t)) .
dτ 2
Setzt man nun
2ν + 1 = k ,
so veschwindet nach der Voraussetzung an das Kraftfeld die rechte Seite und
~rα (τ ) ist ebenfalls Lösung der Newtonschen Gleichung. Damit gilt
τ
= α(1−k)/2 .
(2.1)
t
Betrachten wir nun eine beliebige geschlossene Bahn mit einer Umlaufzeit
T (in den “unskalierten” Variablen). Gemäß der folgenden Skizze habe sie die
Ausdehnung L. Die skalierte Bahn hat dann die Ausdehnung L̃ mit α = L̃/L.
Nach Gl. (2.1) gilt für die Umlaufzeit T̃ der skalierten Bahn
!(1−k)/2
L̃
T̃
= α(1−k)/2 =
.
T
L
L
~
L
Für den Fall des Gravitationspotenials mit k = −2 folgt dann
!3/2
!2
!3
T̃
L̃
T̃
L̃
=
⇒
=
T
L
T
L
bzw. in Worten: Die Quadrate der Umlaufzeiten zweier Bahnen verhalten sich
wie die Kuben der Abstände. Dies ist bereits eine Form des dritten Keplerschen
Gesetzes, welches ihnen sehr wahrscheinlich in der Vorlesung zur Experimentalphysik I im letzten Semester begegnet ist. Wir werden darauf zurückkommen.
Für den d-dimensionalen, isotropen Oszillator mit k = 1 folgt
!0
T̃
T̃
L̃
=
⇒ =1,
T
L
T
also die uns bereits bekannte Unabhängigkeit der Schwingungsdauer von der Auslenkung. Man könnte die Logik nun auch umdrehen und aus dem experimentell
bestimmten Exponenten β (z.B. Planetenbahnen) in
!β
T̃
L̃
=
T
L
10
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
auf den Exponenten k der Kraft schließen (bei Planetenbahnen k = −2). Diese
Schlußweise ist von historischer Bedeutung (Newton).
Der Virialsatz: Wir betrachten die Bewegung eines Teilchens in einem konservativen Kraftfeld, wobei wir annehmen, daß das Potential V (~r) eine homogene
Funktion (α > 0)
V (α~r) = αkV V (~r)
ist. In diesem Fall existiert ein einfacher Zusammenhang zwischen dem Zeitmittelwert der potentiellen und der kinetischen Energie, falls die Bewegung in
einem beschränkten Raumgebiet verläuft. Um diesen zu beleuchten, definieren
wir zunächst, was wir unter dem zeitlichen Mittelwert verstehen wollen. Er ist
für eine Funktion f (t) definiert als
Z
1 t
f (t0 ) dt0 .
f = lim
t→∞ t
0
Mittelung der Relation
d ˙
~
m
~r · ~r = m~r˙ 2 + m~r · ~r¨ = 2T − ~r · ∇V
dt
liefert unter der Annahme, daß ~r(t) · ~r˙ (t) beschränkt ist
~ = lim m ~r(t) · ~r˙ (t) − ~r(0) · ~r˙ (0) = 0 .
2T − ~r · ∇V
t→∞ t
~ über den
Für ein homogenes Potential läßt sich nun der Mittelwert von ~r · ∇V
kV
Mittelwert von V ausdrücken. Differentiation von V (α~r) = α V (~r) nach α
liefert für α = 1
~ = kV V (~r)
~r · ∇V
und damit folgt der Virialsatz
2T = kV V .
Man kann diesen Zusammenhang sehr leicht auf mehrere Teilchen, die über homogene Zweiteilchenpotentiale wechselwirken, verallgemeinern. Aus der Energieerhaltung folgt T + V = E und damit
2
E,
kV + 2
kV
T =
E.
kV + 2
V
=
2.1. DAS ZWEIKÖRPERPROBLEM
11
Für das Gravitationspotential (Keplerproblem) mit kV = −1 folgt so V = 2E
und T = −E. Für den d-dimensionalen, isotropen Oszillator mit kV = 2 ergibt
sich T = V = E/2.
Nach diesen sehr allgemeinen Überlegungen kommen wir nun zur Diskussion
des Zweikörperproblems mit dem Gravitationspotential.
Die Keplerschen Gesetze: Besonders wichtige Zentralfelder, bei denen die potentielle Energie wie 1/r geht, die Kraft also wie 1/r2 abfällt, sind das Newtonsche
Gravitationsfeld (vermittels der Masse eines Teilchens) und das elektrostatische
Coulombfeld (vermittels der elektrischen Ladung eines Teilchens). Ersteres ist
immer anziehend, während das Coulombpotential sowohl anziehend, als auch abstoßend sein kann. Wir bezeichnen die Masse zunächst wieder mit m, werden sie
dann aber später durch die reduzierte Masse µ ersetzen. Zur Herleitung der Keplerschen Gesetze (der Planetenbewegung) betrachten wir den anziehenden Fall
mit V (r) = −α/r, α > 0. Das effektive Potential ist dann
Veff (r) = −
l2
α
+
.
r
2mr2
(2.2)
Die Position r0 des Minimums des effektiven Potentials ergibt sich durch Ableiten
und Nullsetzen zu (l 6= 0)
r0 =
l2
αm
und der Wert des Potentials V0 am Minimum damit zu
Veff (r0 ) = V0 = −
α2 m
α
=−
.
2
2l
2r0
Damit folgt
Veff (r)
r0 1 r0 2
=− +
.
2|V0 |
r
2 r
Für l 6= 0 hat das effektive Potential die folgend skizzierte Form.
(2.3)
12
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Veff/(2 |V0|)
2
Drehimpulsbarriere
0
E
-2
0
1
2
3
r/r0
Wir beginnen die Diskussion der Dynamik mit dem einfachen Spezialfall der
Kreisbewegung mit Radius r0 und der kleinen Abweichung von dieser.
Ist der Abstand des Teilchens vom Ursprung für alle Zeiten gleich r0 , so liegt
eine Kreisbahn vor. Nach den Überlegungen aus Kapitel 3.6 der Vorlesung des
letzten Semesters (Seiten 173/174 des Skripts) gilt für die Umlaufzeit T = Tφ
(mit φ(T + t0 ) − φ(t0 ) = 2π)
T = 2π
Mit Gl. (2.3) folgt l =
√
mr02
.
l
αmr0 und damit
r
m 3/2
T = 2π
r ,
α 0
d.h. das bereits oben zitierte dritte Keplersche Gesetz für den Spezialfall der
Kreisbewegung.
Um eine kleine Abweichung von der Kreisbewegung zu untersuchen, benötigen
wir die zweite Ableitung von Veff an der Stelle r0 (siehe die allgemeine Diskussion
in Kapitel 3.6 der Vorlesung des letzten Semesters). Es gilt
00
Veff
(r0 )
2α
3l2
l2
=
.
=− 3 +
r0
mr04
mr04
Das ergibt die Frequenz
r
ωr =
00
Veff
(r0 )
|l|
=
m
mr02
der Radialbewegung. Somit sind im vorliegenden Fall die Frequenzen der Radialund der Winkelbewegung (bei kleiner Abweichung von der Kreisbewegung) gleich,
2.1. DAS ZWEIKÖRPERPROBLEM
13
da auch ωφ = |l|/(mr02 ) gilt (siehe Seite 174 des Skripts des letzten Semesters).
Somit schließt die Bahnkurve bereits nach einer Umdrehung. Wir zeigen im Folgenden, daß dieses Ergebnis nicht nur für kleine Abweichungen von der Kreisbewegung gilt, sondern für den hier betrachteten Fall des Gravitationspotentials
∝ 1/r und −|V0 | ≤ E < 0, also finite Bewegungen, allgemeingültig ist.
Um die allgemeine finite Trajektorie zu diskutieren, betrachten wir die Gleichung
Z r
l
p
dr0
φ − φmin = ±
02
0 )]
r
2m[E
−
V
(r
r
eff
Z min
r
l
p
= ±
dr0 ,
02
0
2
02
2m[E + α/r − l /(2mr )]
rmin r
die wir im vergangenen Semester hergeleitet haben (siehe Seite 176 des Skripts).
Dabei bezeichnet φmin den zum minimalen Abstand der Bahn vom Ursprung rmin
gehörenden Winkel. Nach der Substitution u = 1/r0 ergibt sich (“dr0 = −du/u2 ”)
Z
1/r
√
φ − φmin = ∓
1/rmin
l
1
p
du .
2m E + αu − (l2 /[2m])u2
Den Ausdruck in der u-abhängigen Wurzel bringen wir durch quadratische Ergänzung auf die Form
E0 −
l2
l2 2 l2
l2 2
(u − u0 )2 = E 0 −
u + uu0 −
u ,
2m
2m
m
2m 0
woraus sich
u0 =
α2 m
1
αm
0
;
E
=
E
+
=
= E + |V0 | ≥ 0
l2
r0
2l2
ergibt. Nach der Substitution v = u − u0 folgt (l > 0)
Z
1/r−1/r0
φ − φmin = ∓
1/rmin −1/r0
1
p
2mE 0 /l2 − v 2
Z
1/r−1/r0
dv = ∓
1/rmin −1/r0
1
√
dv
A2 − v 2
mit
A2 =
2m
2mE 0
= 2 |V0 |(1 + E/|V0 |) = (1 + E/|V0 |)/r02 ≥ 0 .
2
l
l
Elementare Integration liefert dann
1/r−1/r
0
(2.4)
φ − φmin = ∓ arcsin (v/A)|1/rmin −1/r
0
1 1
1
1
1
1
= ∓ arcsin
−
− arcsin
−
.(2.5)
A r r0
A rmin r0
14
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Umgeformt gilt
φ − φ0 = ∓ arcsin
1
A
1
1
−
r r0
,
mit
φ0 = φmin ± arcsin
1
A
1
rmin
1
−
r0
,
bzw.
1
1
−
= A sin(∓[φ − φ0 ])
r r0
A≥0.
Wir rotieren unser Koordinatensystem nun so, daß φ0 = −3π/2 für das obere
und φ0 = −π/2 für das untere Vorzeichen gilt. Damit folgt
r0
= 1 + cos(φ) ,
r
(2.6)
p
wobei wir die so genannte Exzentrizität = r0 A = 1 + E/|V0 | eingeführt haben.
Wir haben somit die gesuchte Bahngleichung bestimmt. Für den betrachteten Fall
−|V0 | ≤ E < 0, d.h. 0 ≤ < 1 ist dies die Gleichung für eine Ellipse. Wir wollen
dies in dem folgenden Einschub genauer betrachten.
Einschub zur mathematischen Beschreibung von Ellipsen: Wir beginnen diesen mit der Definition. Eine Ellipse ist die Menge von Punkten P in einer
Ebene, für die die Summe der Abstände zu zwei festen Punkten F1 und F2 einen
konstanten Wert annimmt, also
|F1 P | + |F2 P | = const.
gilt. Man bezeichnet die Fi als die Fokuspunkte. Folgend ist eine Ellipse, in der
die wichtigen Punkte und Längen indiziert sind dargestellt.
B
P
b
c
F1
M
a−c A
F2
Der Abstand der beiden Fokuspunkte ist 2c, die Länge der kurzen Halbachse ist
b = |M B| und die der langen Halbachse a = |M A|. Wählt man als Punkt auf
der Ellipse den Punkt A, so gilt für die Summe d der Abstände von F1 und
2.1. DAS ZWEIKÖRPERPROBLEM
15
F2 , d = (a + c) + (a −
√ c) = 2a, während sich für die Wahl des Punktes B
nach Pythagoras d = 2 c2 + b2 ergibt. Kombiniert gilt also für die Längen der
Halbachsen und den halben Abstand der Fokuspunkte a2 = b2 + c2 .
Es gibt nun zwei gängige Vorgehensweisen. Man kann einerseits den Ursprung
des Koordinatensystems in einen der Fokuspunkte legen, also z.B. F2 . Damit ist
~r durch den Vektor von F2 nach P gegeben. Mit der Definition, daß ~c den Vektor
von M nach F2 bezeichnet gilt nach der Definitionsgleichung der Ellipse und
d = 2a
|~r| + |~r + 2~c| = 2a .
Quadriert man die resultierende Gleichung |~r + 2~c| = 2a − r, so folgt
~c · ~r + ar = a2 − c2 = b2 .
Definiert man nun die Exzentrizität durch c = a, d.h. 0 ≤ =
und verwendet ~c · ~r = cr cos φ, so ergibt sich
cos φ + 1 =
p
1 − b2 /a2 < 1
b2 1
a r
oder mit r0 = b2 /a (r0 ist die Länge von ~r für φ = π/2)
r0
= cos φ + 1 .
r
Dies ist die Ellipsengleichung in Polarkoordinaten, wie sie bei der Lösung des
Keplerproblems auftritt (siehe oben). Für → 0 geht die Ellipse in einen Kreis
(Spezialfall einer Ellipse) mit Radius r0 über.
Alternativ kann man den Ursprung in den Mittelpunkt M der Ellipse legen.
Drückt man den Punkt P dann durch kartesische Koordinaten aus, so lautet die
Bedingung für die Summe der Abstände
p
p
(x + c)2 + y 2 + (x − c)2 + y 2 = 2a .
Quadrieren liefert
(x + c)2 + y 2 + (x − c)2 + y 2 + 2
p
[(x + c)2 + y 2 ][(x − c)2 + y 2 ] = 4a2
und erneutes Quadrieren nach Auflösen nach dem Wurzelterm
x2 (a2 − c2 ) + y 2 a2 = a2 (a2 − c2 ) .
Unter Verwendung von a2 − c2 = b2 ergibt sich so
x2 y 2
+ 2 =1.
a2
b
16
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Dies ist die Normalform der Ellipse, deren Mittelpunkt im Ursprung liegt (in kartesischen Koordinaten). In dieser Form ergibt sich die Ellipse, wenn man sie über
“Kegelschnitte” einführt. Im Spezialfall a2 = b2 ergibt sich die Kreisgleichung.
Da wir später auch Hyperbeln benötigen werden (infinite Bewegung im Keplerproblem), wollen wir diese gleich analog zu den Ellipsen einführen.
Einschub zur mathematischen Beschreibung von Hyperbeln: Eine
Hyperbel ist die Menge von Punkten P in einer Ebene, für die die Differenz
der Abstände zu zwei festen Fokuspunkten F1 und F2 einen konstanten Wert
annimmt, also
|F1 P | − |F2 P | = const.
gilt. Folgend ist ein Paar von Hyperbelästen, in der die wichtigen Punkte und
Längen indiziert sind dargestellt.
P
A
F1
a M a
F2
Der Abstand der Fokuspunkte wird erneut mit 2c bezeichnet. Wählt man den
Punkt A (siehe Skizze) auf dem linken Ast der Hyperbel, so ergibt sich für die
Differenz der Abstände der Wert
|F1 P | − |F2 P | = −2|M A| = −2a .
Für den zu A analogen Punkt auf dem rechten Ast gilt
|F1 P | − |F2 P | = 2|M A| = 2a .
Legt man den Ursprung des Koordinatensystems in den Fokuspunkt F1 , dann
ist ~r durch den Vektor von F1 nach P gegeben und mit dem Vektor ~c von M
nach F2 folgt für die speziellen Punkte A auf dem linken/rechten Hyperbelast
(oberes/unteres Vorzeichen)
|~r| − |~r − 2~c| = ∓2a .
Quadriert man die resultierende Gleichung −|~r − 2~c| = ∓2a − r, so folgt
~c · ~r ± ar = c2 − a2 .
2.1. DAS ZWEIKÖRPERPROBLEM
17
Definiert man die Exzentrizität erneut als = c/a, wobei hier jedoch ≥ 1 gilt,
und verwendet ~c · ~r = cr cos φ, so ergibt sich
r0
= cos φ ± 1 ,
r
wobei r0 = (c2 − a2 )/a ist. Dies ist die Hyperbelgleichung (“+” linker Ast, “-”
rechter Ast) in Polarkoordinaten, die uns später begegnen wird.
Mit dem Ursprung im Mittelpunkt M bieten sich wieder kartesische Koordinaten an. Die Definitionsgleichung liefert
p
p
(x + c)2 + y 2 − (x − c)2 + y 2 = ∓2a .
Quadriert man beide Seiten, separiert den verbleibenden Wurzelterm und quadriert erneut, so erhält man analog zum Fall der Ellipse
y2
x2
+
=1.
a2 a2 − c 2
Da im Gegensatz zur Ellipse c > a gilt, definiert man b2 = c2 − a2 und erhält so
x2 y 2
− 2 =1
a2
b
als die Normalform der Gleichung des Hyperbelpaars.
Zurück zum Keplerproblem: Die Bahnkurve Gl. (2.6) der finiten Bewegung im Keplerproblem entspricht der soeben diskutierten Gleichung einer Ellipse
in Polarkoordinaten, mit dem Ursprung in einem der Fokuspunkte. Damit liegt
das Zentrum des Zentralpotentials in diesem Fokuspunkt. Es handelt sich bei dieser Einsicht um das erste Keplersche Gesetz, was wir genauer formulieren werden,
wenn wir zum Zweikörperproblem zurückkehren werden.
Es besteht ein Zusammenhang zwischen der Exzentrizität der Ellipse und dem
maximalen und minimalen Abstand rmax/min der Bahnkurve zum Ursprung. Um
diesen herzustellen, bestimmen wir zunächst rmax/min . Für vorgegebenes E mit
−|V0 | ≤ E < 0 gilt
r α 2
l2
α
±
+
Veff (rmax/min ) = E ⇒ rmax/min = −
2E 2E
2mE
p
α
= −
1 ± 1 + E/|V0 |
2E
α
= −
(1 ± ) .
2E
Die Abhängigkeit von l ist dabei in V0 “versteckt”. Die Summe von rmax und rmin
ist jedoch unabhängig von l
rmax + rmin =
α
.
|E|
18
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Wir betrachten nun
rmin (1 + ) = −
α
α
(1 − 2 ) =
= r0
2E
2|V0 |
oder geometrisch (siehe Skizze der Ellipse sowie c = a, =
r0 = b2 /a)
rmin (1 + ) = (a − c)(1 + ) = a(1 − 2 ) = a
p
1 − b2 /a2 und
b2
= r0 .
a2
Somit ergibt sich
rmin =
r0
1+
rmax =
r0
.
1−
und analog
Die Länge a der langen Halbachse ist durch
a=
rmax + rmin
α
=
2
2|E|
gegeben und somit unabhängig vom Drehimpuls l.
Um den zeitlichen Durchlauf der Ellipsenbahn zu bestimmen, verwendet man
die Drehimpulserhaltung. Es gilt
mr2 (φ(t)) φ̇(t) = l
und damit (Separation der Variablen)
t − t0
m
=
l
Z
m
l
Z
=
φ
φ0
φ
φ0
r2 (φ0 ) dφ0
r02
dφ0 .
(1 + cos φ0 )2
Das Integral läßt sich elementar ausführen, es ist jedoch nicht möglich, das Ergebnis geschlossen nach φ(t) aufzulösen.
Interessiert man sich nur für die Umlaufzeit T , so kann man die in Kapitel 3.6
der Vorlesung des letzten Semesters eingeführte Flächengeschwindigkeit (siehe
Seiten 170/171 des Skripts)
dS
l
=
dt
2m
2.1. DAS ZWEIKÖRPERPROBLEM
19
verwenden. Integration dieser Gleichung über die Zeit von 0 bis T liefert
T =
2mS
,
l
√
wobei S die Fläche der Ellipse ist. Es gilt S = πab = πa2 1 − 2 und damit
√
wegen l = αmr0
2m 2 √
πa 1 − 2
lr
√
m a2 1 − 2
= 2π
√
α
r0
r
m 3/2
= 2π
a
α
r
m
= πα
.
2|E|3
T =
(2.7)
Die dritte Zeile enthält das dritte Keplersche Gesetz, welches uns bereits mehrfach begegnet ist. Die vierte Zeile zeigt, daß die Umlaufzeit nur von der Energie
des Teilchens abhängt. Diese Einsicht hat eine historisch wichtige Rolle beim
Übergang von der klassischen Mechanik zur Quantenmechanik gemäß dem so
genannten “Korrespondenzprinzip” gespielt.
Wir kehren nun zum eigentlichen Zweikörperproblem “Planet-Sonne” zurück.
Wir müssen somit m durch die reduzierte Masse µ = m1 m2 /(m1 + m2 ) ersetzen und erhalten dann die Trajektorie der Relativbewegung ~r = ~r1 − ~r2 . Die
Ortsvektoren der beiden Massen sind
m2
~r ,
M
~ − m1 ~r .
~r2 = R
M
~+
~r1 = R
~ =0
Wir betrachten die Bewegung zunächst im Schwerpunktsystem, für das R
~
gilt. Dieses ist ein Inertialsystem (siehe oben). Wegen R = 0 gilt
m2
~r ,
m1 + m2
m1
~r2 = −
~r
m1 + m2
~r1 =
und sowohl der Planet, wie auch die Sonne folgen einer Ellipsenbahn mit einem gemeinsamen Fokuspunkt im Ursprung. Für das System “Erde-Sonne” gilt
mE /mS ≈ 3 · 10−6 und ≈ 0.017. Um das Verhalten besser graphisch darstellen
zu können, ist in der folgenden Skizze m1 /m2 = 0.1 und = 0.3 gewählt.
20
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
1
x2/r0
0.5
0
-0.5
-1
-1
-0.5
0
x1/r0
0.5
Eine zweite Möglichkeit besteht darin, die Bewegung im System der Sonne
mit ~r(t) = ~r1 (t) = ~rE (t) zu beschreiben. Es ist wichtig festzuhalten, daß es sich
bei diesem Koordinatensystem nicht um ein Inertialsystem handelt. In diesem
System bewegt sich die Erde auf einer Ellipse um die Sonne, wobei diese in einem
der Brennpunkte (Fokuspunkte) steht. Dies ist das erste Keplersche Gesetz (für
das Zweiteilchenproblem). Aufgrund des sehr großen Verhältnisses der Massen
der Sonne und der Erde, unterscheiden sich die Beschreibungen in den beiden
Koordiantensystemen nur wenig. Das zweite Keplersche Gesetz haben wir bereits
im vergangenen Semester kennen gelernt (siehe Seite 157 des Skripts). Es folgt
aus der Konstanz der Flächengeschwindigkeit und ist somit eine Manifestation
der Drehimpulserhaltung: In gleichen Zeiten werden durch ~r(t) gleiche Flächen
überstrichen.1 Wir kommen nun zur Formulierung des dritten Keplerschen Gesetzes für das Zweikörperproblem. Für den Vorfaktor in Gl. (2.7) müssen wir für
ein System “Planet-Sonne” die Ersetzung
r
r
m
µ
1
1
≈√
→
=p
α
GmP mS
GmS
G(mS + mP )
vornehmen, wobei G die Gravitationskonstante ist. Damit gilt
1
1
T = 2π p
a3/2 ≈ 2π √
a3/2 .
GmS
G(mS + mP )
1
(2.8)
Es ist wichtig festzuhalten, daß das zweite Keplersche Gesetz somit für alle Zentralpotentiale
gilt. Im Gegesatz dazu sind das erste und dritte Keplersche Gesetz spezifisch für das 1/rPotential.
2.1. DAS ZWEIKÖRPERPROBLEM
21
Die Quadrate der Umlaufzeiten zweier Bahnen verhalten sich somit wie die Kuben der langen Halbachsen und da mP /mS 1, ist der Vorfaktor (nahezu)
unabhängig vom betrachteten Planeten. Es sollte klar sein, daß die Keplerschen
Gesetze aufgrund der Anwesenheit weiterer Himmelskörper (weitere Planeten,
Monde,. . . ) bei der Beschreibung der Bewegung von Planeten “um die Sonne”
nur näherungweise gelten. Mit dieser Formulierung der drei Keplerschen Gesetze
schließen wir die Diskussion der finiten Bewegung im Keplerproblem ab.
Infinite Bewegungen im attraktiven 1/r-Potential: Positive Gesamtenergien E ≥ 0 führen im Potential Gl. (2.2) zu infiniten Bewegungen (siehe die Skizze
des Potentials). Die Schritte, die auf die Gleichung (2.6)
r0
= 1 + cos(φ) ,
r
geführt haben, können völlig
p analog vollzogen werden. In diesem Fall gilt jedoch
für die Exzentrizität = 1 + E/|V0 | ≥ 1 und die Bahnkurve beschreibt den
linken Ast einer Hyperbel. Der Spezialfall E = 0 führt auf = 1 und Gl. (2.6)
beschriebt eine Parabel mit dem Ursprung als Brennpunkt der Parabel. Trägt
man die Bahnkurve für E > 0, d.h. > 1 beginnend mit φ = 0 für zunehmende
Werte von φ auf, so divergiert r beim Grenzwinkel φc der durch
cos φc = −
1
gegeben ist. In der folgenden Skizze ist der Übergang vom Kreis mit = 0 zur
Hyperbel mit > 1 dargestellt. Die Werte der Exzentrizität sind = 0, 0.5, 0.9,
1, und 1.4.
x2/r0
5
0
-5
-10
-5
x1/r0
0
22
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Infinite Bewegungen im repulsiven 1/r-Potential: Im Hinblick auf geladene Teilchen gleicher Ladung wollen wir zusätzlich die Bewegung bei abstoßender
Wechselwirkung mit Potential V (r) = α/r, α > 0 untersuchen. In diesem Fall
nimmt Veff (r) für wachsende r monoton von ∞ nach 0 ab. Die Energie des Teilchens kann nur positiv sein und jede Bewegung ist infinit. Wie zuvor kann man
(formal) die Größen r0 = l2 /(αm) und |V0 | = α2 m/(2l2 ) definieren. Im Vergleich zur Rechnung im anziehenden Fall ergibt sich als einziger Unterschied, daß
u0 = −1/r0 . Für die Bahnkurve ergibt sich also
r0
= −1 + cos φ ,
r
=
p
1 + E/|V0 | .
Diese Gleichung beschreibt den rechten Hyperbelast (siehe oben). Somit schließt
die Trajektorie im abstoßenden Fall im Gegensatz zum anziehenden Fall das
Zentrum des Potentials im linken Brennpunkt nicht ein.
Es würde sich an dieser Stelle anbieten, eine allgemeine Diskussion der Streuung eines Teilchens an einem Potential anzuschließen. Aus Zeitgründen können
wir uns jedoch hier nicht mit der so genannten Streutheorie beschäftigen und
das, obwohl Streuexperimente in der Geschichte der Physik eine wichtige Rolle
gespielt haben. Es sei daher auf die entsprechende Literatur verwiesen.
2.2
Bewegte Bezugssysteme
Wir werden in diesem Kapitel untersuchen, wie sich die Form der Newtonschen
Gleichungen ändert, wenn man von einem inertialen Bezugssytem k in ein relativ
zu diesem bewegtes Bezugssystem K übergeht. Es sei daran erinnert, daß die
bisher verwendete Form der Newtonschen Gleichung m~x¨ = F~ (~x) per Definition
nur in Inertialsystemen gilt. Der Satz von Basisvektoren in K ist bezüglich dem
von k verschoben und verdreht, wobei die Verschiebung und Verdrehung von der
Zeit abhängen kann. Dies ist in der folgenden Skizze dargestellt (hier in einer
Ebene bzw. für den zweidimensionalen Fall).
k
K
r(t)
e1
e2
e1
E2
R(t)
r0(t)
E1
~
~ i der Ortsvektor eines Punktes relativ zum bewegten SySei R(t)
= i Xi (t)E
P
stem K. Man erhält den Ortsvektor ~r(t) = i xi (t)~ei desselben Punktes relativ
P
2.2. BEWEGTE BEZUGSSYSTEME
23
P (0)
zu k als Summe des (zeitabhängigen) Verschiebungsvektors ~r0 (t) = i xi (t)~ei
~ welches sich unter der
der Koordinatenursprünge und dem Bild des Vektors R,
(zeitabhängigen) Drehung der Koordinatenachsen von K relativ zu denen von k
ergibt. In Kapitel 2.13 der Vorlesung des letzten Semesters haben wir gelernt,
daß man Rotationen mit Hilfe von orthogonalen Matrizen A, mit der Eigenschaft AT = A−1 und Matrixelementen ai,j beschreibt. Anders ausgedrückt ist
die Rotation eine (zeitabhängige) lineare Abbildung Bt : K → k. Das Bild der
~ i aus K unter der Rotation haben wir in Kapitel 2.13 mit ~ei0 beBasisvektoren E
0
~ i.
zeichnet – Vektoren die jetzt im Allgemeinen zeitabhängig werden: ~ei (t) = Bt E
~
Damit kann man die obigen Worte zur Beziehung von ~r und R in eine Formel
fassen
~
~r(t) = ~r0 (t) + Bt R(t)
X (0)
X
0
Xi (t)~ei (t) .
=
xi (t)~ei +
i
i
Da2
0
~ei (t) =
X
~ej bj,i (t) ,
j
also
bi,j = ~e0j · ~ei ,
folgt
!
~r(t) =
X
(0)
xi (t) +
X
bi,j (t)Xj (t) ~ei .
j
i
Scheinkräfte im Lagrange-Formalismus: Wir werden nun zunächst den Lagrange-Formalismus verwenden um zu sehen, wie sich die Bewegungsgleichungen
in bewegten Bezugssystemen verändern. Dazu verwenden wir die Xi (t) als neue
(krummlinige) Koordinaten. Aus
X
0
~r(t) = ~r0 (t) +
Xi (t)~ei (t) .
i
folgt
~gi =
2
∂~r
0
= ~ei
∂Xi
Die in Kapitel 2.13 der letztsemestrigen Vorlesung eingeführte, eine Rotation beschreibende
Matrix A und die hier auftretende Matrix B, mit Matrixelementen bi,j , genügen der Beziehung
BT = A (siehe Gl. (2.44) des Skripts des letzten Semesters). Somit sind A und B invers
zueinander (da orthogonale Matrizen).
24
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
und
~r˙ =
X
i
0
Ẋi~ei +
X
0
Xi~e˙ i + ~r˙0 .
i
Mit den Relationen
∂~r˙
∂T
0
= m~r˙ ·
= m~r˙ · ~ei
∂ Ẋi
∂ Ẋi
und
∂~r˙
∂T
0
= m~r˙ ·
= m~r˙ · ~e˙ i
∂Xi
∂Xi
lautet die Lagrange-Form der Newtonschen Bewegungsgleichung in Gegenwart
der Kraft (in k)3 f~ (siehe Gl. (3.15) des Skripts der letztsemestrigen Vorlesung)
d ˙ 0
0
m
~r · ~ei = m~r˙ · ~e˙ i + ~e0i · f~ .
dt
0
Wir betrachten zunächst den Fall der zeitunabhängigen Verdrehung mit ~e˙ i (t) =
0. Damit verschwindet der erste Term auf der rechten Seite und die Gleichung
läßt sich umformen zu
⇔
⇒
~¨ = f~
m(~r¨0 + B R)
~¨ 0 + B R)
~¨ = B F~
m(B R
~¨ = F~ (R)
~ − mR
~¨ 0 = F~tot .
mR
~ in K) wirkt im
Zusätzlich zur vorgegebenen Kraft am Ort P (mit Ortsvektor R
¨
~ 0 . Sie ist die Scheinkraft, die in eibewegten System K die Trägheitskraft −mR
nem relativ zum Inertialsystem k linear beschleunigtem Bezugssystem K auftritt
(und dort ganz real ist). Dabei muß die relative Beschleunigung nicht zwangsläufig
zeitlich konstant sein, sondern kann sich durchaus ändern. Sind die beiden Bezugssysteme gar nicht gegeneinander verdreht so ist B die identische Abbildung.
Die auftretende Scheinkraft ist uns aus dem Alltag wohlbekannt. Sie wirkt z.B.,
wenn wir uns in einem Fahrstuhl befinden, der anfährt oder in einem Zug, der
beschleunigt bzw. bremst. Weiterhin ist sie die Erklärung für das Auftreten der
Gezeiten (Ebbe und Flut). Dabei ist die Beobachtung von zentraler Bedeutung,
daß die Erde, von der aus wir die Gezeiten beobachten (unser Bezugssystem ist
erdfest), kein Inertialsystem ist. Ein offensichtlicher Grund dafür ist die Rotation der Erde. Für die Erklärung der Gezeiten spielt jedoch die Tatsache, daß die
3
Wir schreiben die Kraft (in k) mit einem kleinen Buchstaben, da dies hier zur besseren
Unterscheidung für alle Vektoren bezüglich k gemacht wird.
2.2. BEWEGTE BEZUGSSYSTEME
25
Erde zum Mond hin beschleunigt wird (Gravitationskraft) die entscheidene Rolle
(siehe Übungen).
~
Bewegt sich das Bezugssystem K mit dem Teilchen mit, d.h. gilt R(t)
=
¨
~ = 0, daß die Gesamtkraft (in K) F~tot verschwindet.
const., so folgt wegen R
Als einfaches Beispiel wollen wir hier das Problem eines Fadenpendels mit
Masse m und Fadenlänge R (siehe Kapitel 3.4 des Skripts zur Einführung in die
Theoretische Physik) in einem linear beschleunigten Zug (relativ zur Erdoberfläche) betrachten. Näherungsweise können wir in diesem Problem die Erde als
ein Inertialsystem betrachten. Die durch die Rotation auftretenden Abweichungen davon werden wir weiter unten diskutieren. Im erdfesten (fast-)Inertialsystem
~ und die Normalkraft N
~ (Fadenspannung). Es gilt
wirken die Gravitationskraft G
~ +N
~ . Gehen wir nun in das zugfeste Bezugssystem, so tritt zusätzlich die
m~r¨ = G
~
Scheinkraft −m~r¨0 (t) = −mA(t)
auf. Die Bewegungsgleichung lautet in diesem
~¨ = G
~ +N
~ − mA
~=N
~ + m(~g − A)
~ =N
~ + m~geff ,
mR
wobei wir ausgenutzt haben, daß sowohl die Gravitationskraft, als auch die Trägheitskraft proportional zur Masse sind. Damit ist die Form der Bewegungsgleichung im linear beschleunigten Bezugssystem genau dieselbe wie im Inertialsy~ In einer Übungsaufgabe werden sie dieses
stem mit der Ersetzung ~g → ~g − A.
Beispiel zu Ende rechnen, indem sie den Winkel der Ruhelage im beschleuingten
System und die Kreisfrequenz der Bewegung in diesem berechnen.
Bewegt sich K geradlinig und gleichförmig relativ zu k, so verschwindet die
Trägheitskraft. In diesem Fall ist auch K ein Inertialsystem und die Newtonsche
Gleichung hat in beiden Systemen die gleiche Form (siehe die Definiton des Begriffs Inertialsystem in Kapitel 3.2 der Vorlesung des letzten Semesters).
Das Galileische Relativitätsprinzip und die Form von Kräften: Wir betrachten nun ein System von N Teilchen und wollen untersuchen, welche Einschränkungen das in Kapitel 3.2 der letztjährigen Vorlesung eingeführte Galileische Relativitärtsprinzip4 für die Form der Kräfte f~i (~r1 , ~r2 , . . . , ~rN ; ~r˙1 , ~r˙2 , . . . , ~r˙N ; t)
mit i = 1, 2, . . . , N hat. Da es sich bei den zwei Bezugssystemen zwischen denen
man hin und her transformiert um zwei Inertialsysteme k und K handeln soll,
kann der Verschiebungsvektor der Ursprünge ~r0 nur die Form ~r0 (t) = ~c + ~v0 t
haben und die durch die lineare Abbildung B gegebene relative Drehung ist zeitunabhängig. Weiterhin können wir die Zeit gemäß T = t + t0 verschieben, wobei
~ ist. Die Zeitverschiebung zählt ebenfalls zu den GaliT das Zeitargument von R
leitransformationen. In k lautet die Bewegungsgleichung
mi~r¨i = f~i (~r1 , ~r2 , . . . , ~rN ; ~r˙1 , ~r˙2 , . . . , ~r˙N ; t)
4
Kurz: Die Newtonsche Bewegungsgleichung hat in zwei Inertialsystemen zu allen Zeiten die
gleiche Form.
26
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
~¨ i )
und damit in K (wobei ~r¨i = B R
~¨ i = B −1 f~i (~r0 + B R
~ 1 , . . . , ~r0 + B R
~ N ; ~v0 + B R
~˙ 1 , . . . , ~v0 + B R
~˙ N ; T − t0 ) ,
mi R
mit der zu B inversen Abbildung B −1 (die durch die transponierte Matrix gegeben
wird). Nach dem Galileischen Relativitätsprinzip sollen nun die Kräfte F~i = B −1 f~i
~ j und R
~˙ j dieselbe Form haben wie in k. Es soll also gelten
ausgedrückt durch die R
~ 1 , . . . , ~r0 + B R
~ N ; ~v0 + B R
~˙ 1 , . . . , ~v0 + B R
~˙ N ; T − t0 )
B −1 f~i (~r0 + B R
~ 1, . . . , R
~N; R
~˙ 1 , . . . , R
~˙ N ; T ) .
= f~i (R
Für die Situation von geschwindigkeitsunabhängigen Paarkräften
X
f~i,j (~ri , ~rj ; t)
f~i =
j6=i
vereinfacht sich die Bedingung zu
X
X
~ i, R
~ j; T ) .
~ i , ~r0 + B R
~ j ; T − t0 ) =
f~i,j (R
B −1
f~i,j (~r0 + B R
j6=i
j6=i
Wir wählen nun ein beliebiges Paar von Teilchen aus und entfernen alle weiteren
Teilchen aus unserem Problem (wir betrachten also ein spezielles System mit
N = 2). Dann gilt
~ i , ~r0 + B R
~ j ; T − t0 ) = f~i,j (R
~ i, R
~ j; T ) .
B −1 f~i,j (~r0 + B R
(2.9)
Die f~i,j könnten dabei vom Teilchentyp abhängen. Die Gleichung für jeden Summanden muß aber gelten, da wir alle Teilchenpaare durchgehen können. Für diesen Fall wollen wir nun die Konsequenzen aus der Forderung der Invarianz unter
den Galileitransformationen
~ i = ~r0 (t) + B R
~i ,
~ri = ~c + ~v0 t + B R
t = T − t0
(2.10)
untersuchen. Zunächst betrachten wir die Transformation mit ~r0 (t) = 0 und bei
~ i (T ). Gleichung
der B durch die Identität gegeben ist. Damit gilt ~ri (t + t0 ) = R
(2.9) liefert dann
~ i, R
~ j ; T − t0 ) = f~i,j (R
~ i, R
~ j; T ) .
f~i,j (R
Da t0 beliebig ist folgt umgehend, daß das Galileische Relativitätsprinzip nur
gelten kann, wenn die Paarkräfte nicht explizit von der Zeit abhängen. Dies
impliziert, daß die Energie erhalten ist (siehe Diskussion im letzten Semester).
2.2. BEWEGTE BEZUGSSYSTEME
27
Die Invarianz unter Zeittranslation hängt also unmitellbar mit der Energieerhaltung zusammen. Als zweite spezielle Galileitransformation betrachten wir die mit
~v0 = 0, t0 = 0 und bei der B durch die Identität gegeben ist. Diese testet die Homogenität des Raumes, die besagt, daß kein Punkt des leeren Raumes vor einem
anderen ausgezeichnet ist. Gleichung (2.9) impliziert für diese Transformation,
daß5
~ i , ~c + R
~ j ) = f~i,j (R
~ i, R
~ j) .
f~i,j (~c + R
~ i −R
~j
Da ~c beliebig wählbar ist kann f~i,j nur eine Funktion des Relativabstandes R
sein6
~ i, R
~ j ) = f~i,j (R
~i − R
~ j) .
f~i,j (R
Für eine nicht-tiviale Drehung B (ungleich der identischen Abbildung), ~v0 = 0,
~r0 = 0 und t0 = 0 (reine Drehung) beschreibt die Invarianz unter der Galileitransformation die Isotropie des Raumes, d.h. im leeren Raum gibt es keine
ausgezeichnete Richtung. Mathematisch bedeutet die Invarianz, daß (die Homogenität des Raumes ist schon eingebaut)
~i − R
~ j ]) = f~i,j (R
~i − R
~ j)
B −1 f~i,j (B[R
und damit
~i − R
~ j ]) = B f~i,j (R
~i − R
~ j) .
f~i,j (B[R
(2.11)
Dabei ist B beliebig wählbar. Legen wir speziell die Rotationsachse in die Rich~i − R
~ j , so gilt B[R
~i − R
~ j] = R
~i − R
~j = R
~ i,j . Damit folgt
tung von R
~ i,j ) = B f~i,j (R
~ i,j ) .
f~i,j (R
~ i,j zeigt und
Diese Gleichung kann nur gelten, wenn f~i,j ebenfalls in Richtung R
es folgt
~
~ i,j ) .
~ i,j ) = Ri,j fi,j (R
f~i,j (R
Ri,j
Wählen wir jetzt wieder ein beliebiges B und setzen in Gl. (2.11) ein, so ergibt
sich
!
"
#
~ i,j
~ i,j
R
R
~ i,j ) = B
~ i,j ) .
B
fi,j (B R
fi,j (R
Ri,j
Ri,j
5
6
Die Unabhängigkeit der Paarkraft von der Zeit nutzen wir dabei bereits aus.
~ j wählt.
Dies sieht man formal, in dem man ~c = −R
28
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Wir können also folgern, daß
~ i,j ) = fi,j (R
~ i,j )
fi,j (B R
und damit
~ i,j ) = fi,j (Ri,j ) .
fi,j (R
Die im letzten Semester eingeführten Zweiteilchenkräfte (entlang der Verbindungslinie der zwei Teilchen und nur vom Abstand abhängiger Betrag) sind somit
kompatibel mit dem Galileischen Relativitätsprinzip. Aufbauend auf den Überlegungen zur Erhaltung des Gesamtimpulses in Gegenwart von Paarkräften aus
dem Kapitel 3.3 der Vorlesung des letzten Semesters erkennen wir, daß es einen
engen Zusammenhang zwischen der Homogenität und Isotropie des Raumes auf
der einen Seite und der Gesamtimpulserhaltung auf der anderen Seite gibt. Die
Invarianz unter Galileitransformationen mit ~v0 6= 0 bedingt für geschwindigkeitsunabhängige Kräfte keine weiteren Einschränkungen an die Form der Kräfte.
Scheinkräfte im Newtonschen Formalismus: Zur allgemeinen Diskussion
der Scheinkräfte (inklusive der zeitabhängigen Drehungen) kehren wir zum Newtonschen Formalismus zurück. Da es sich bei Bt um eine lineare Abbildung handelt, folgt mit Hilfe der Produktregel
⇒
~
~r(t) = ~r0 (t) + Bt R(t)
~ + Bt R(t)
~˙
~r˙ (t) = ~r˙0 (t) + Ḃt R(t)
.
(2.12)
Wir stellen zunächst Überlegungen zu dem Term an, der sich aufgrund der
Zeitabhängigkeit der Drehung ergibt
~ = Ḃt B −1 (~r − ~r0 ) = At (~r − ~r0 ) .
Ḃt R
t
Die Abbildung At : k → k ist antisymmetrisch, d.h. es gilt
At + ATt = 0 .
Dabei ist die Abbildung ATt durch die Transponierte der zu At gehörenden Matrix
gegeben. Die Antisymmetrie sieht man durch Einsetzen von ATt = Bt Ḃt−1
At + ATt = Ḃt Bt−1 + Bt Ḃt−1 =
d
d
(Bt Bt−1 ) = I = 0 ,
dt
dt
(2.13)
wobei I die identische Abbildung von k nach k bezeichnet. Die zu A (Zeitabhängigkeit unterdrückt) gehörende Matrix A ist damit antisymmetrisch mit ai,j = −aj,i ,
also


0
a1,2 a1,3
0
a2,3  .
A =  −a1,2
−a1,3 −a2,3 0
2.2. BEWEGTE BEZUGSSYSTEME
29
Damit hat die reelle Matrix A drei unabhängige
Vektors A~q (in k) erhält man gemäß


 
0
a1,2 a1,3
q1
0
a2,3   q2  = 
A~q =  −a1,2
−a1,3 −a2,3 0
q3
Matrixelemente. Das Bild des

a1,2 q2 + a1,3 q3
−a1,2 q1 + a2,3 q3  .
−a1,3 q1 − a23 q2
(2.14)
Setzt man ω1 = −a2,3 , ω2 = a1,3 und ω3 = −a1,2 , d.h.


0 −ω3 ω2
0 −ω1  ,
A =  ω3
−ω2 ω1
0
so ergibt sich das Ergebnis Gl. (2.14) auch als
A~q = ω
~ × ~q
wenn
ω
~ =
X
ωi~ei .
i
Man bezeichnet diesen Vektor als die Winkelgeschwindigkeit.7 Um die Bedeutung
~˙
zu veranschaulichen, betrachten wir den Spezialfall mit R(t)
= 0 und ~r0 (t) = 0.
˙
Dann gilt nach den obigen Überlegungen ~r(t) = At~r(t) = ω
~ × ~r(t). Mit einem
~
infinitesimalen ∆t geschrieben bedeutet das ∆r(t) = (~ω × ~r(t))∆t. Damit steht
~ senkrecht auf ~r und ω
der Vektor ∆r
~ . Aus der folgenden Skizze wird klar, daß der
Vektor ω
~ (in k) damit in Richtung der instantanen Drehachse zeigt (gemäß der
Rechte-Hand-Regel). Zusätzlich erkennt man, daß der Betrag von ω
~ dem Betrag
~
der Winkelgeschwindigkeit |φ̇| entspricht, da |∆r| = ρ|∆φ| = |~r| sin θ|φ̇|∆t.
ω (t)
∆φ
ρ
r(t) r(t+ ∆t)
θ
0
7
Der Vektor ω
~ wird im Allgemeinen zeitabhängig sein. In unser Notation unterdrücken wir
diese Zeitabhängigkeit.
30
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Der betrachtete Spezialfall tritt z.B. auf, wenn ein starrer Körper im bewegten
Bezugssystem K ruht und mit diesem um den stationären Punkt 0 rotiert. Die
~ = (~ω × ~r(t))∆t bedeutet dann, daß zu jedem Zeitpunkt eine inGleichung ∆r
stantane Drehachse existiert und daß alle Punkte der Geraden im starren Körper,
die entlang ω
~ liegt und durch 0 geht, zu diesem Zeitpunkt eine verschwindende
Geschwindigkeit haben. Die Geschwindigkeit aller anderen Punkte des Körpers
ist senkrecht zu ω
~ (der instantanen Drehachse) und proportional zum Abstand
von der Drehachse.
Wir verlassen nun den Spezialfall und kehren zu der Situation eines allgemeinen bewegten Bezugssystems K zurück. Der Vektor ω
~ ist das Bild eines Vektors
~
Ω (in K) unter der Abbildung Bt , d.h.
~
ω
~ = Bt Ω
⇔
~ = Bt−1 ω
Ω
~ .
~ als die Winkelgeschwindigkeit im Körper.8 Damit erhält man
Man bezeichnet Ω
~
für Ḃt R
~ = Ḃt B T (~r − ~r0 ) = At (~r − ~r0 ) = ω
Ḃt R
~ × (~r − ~r0 )
t
~ = (Bt Ω)
~ × (Bt R)
~ .
= ω
~ × (Bt R)
Da die lineare Abbildung (Rotation) Bt durch eine orthogonale Matrix gegeben
ist, erhält sie die Längen von Vektoren sowie alle relativen Winkel eines Vektorpaares (anschaulich klar, daß das für eine Rotation gelten muß). Damit folgt
~ = Bt (Ω
~ × R)
~ .
Ḃt R
Zusammengefaßt ergibt sich so für ~r˙ in Gl. (2.12)
~ × R(t)
~ + R(t)]
~˙
~r˙ (t) = ~r˙0 (t) + Bt [Ω
.
(2.15)
Im nächsten Schritt bestimmen wir die Beschleunigung ~r¨ und verwenden dabei
~ × V~ )
wieder die für jeden Vektor V~ in K gültige Beziehung Ḃt V~ = Bt (Ω
~ × R(t)
~ + R(t)]
~˙
~˙ × R(t)
~ +Ω
~ × R(t)
~˙ + R(t)]
~¨
~r¨(t) = ~r¨0 (t) + Ḃt [Ω
+ Bt [Ω
n
o
~ × Ω
~ × R(t)
~
~ × R(t)
~˙ + Ω
~˙ × R(t)
~ + R(t)]
~¨
+ 2Ω
.
= ~r¨0 (t) + Bt [Ω
Aus dieser Relation ergibt sich die Newtonsche Gleichung in K. In k gilt
m~r¨(t) = f~(~r, ~r˙ ; t)
und damit nach Einsetzen der obigen Relation und Anwenden von Bt−1
h
i
~¨ = F~ − m Ω
~ × (Ω
~ × R)
~ + 2Ω
~ ×R
~˙ + Ω
~˙ × R
~ + Bt−1~r¨0 ,
mR
~ im Allgemeinen zeitabhängig. In unserer Notation unterdrücken wir diese
Wie ω
~ ist Ω
Zeitabhängigkeit.
8
2.2. BEWEGTE BEZUGSSYSTEME
31
wobei
~ ~r˙0 + Bt [Ω × R
~ + R];
~˙ t) .
F~ = Bt−1 f~(~r0 + Bt R,
Dies ist das allgemeine Ergebnis für die Newtonsche Gleichung in einem System,
welches kein Inertialsystem ist. Neben der Kraft F~ treten diverse Scheinkräfte
auf der rechten Seite der Gleichung auf.
Kehren wir noch einmal zu dem zuvor im Lagrange-Formalismus behandelten
Fall zurück, daß die Rotation zeitunabhängig ist. Dann tritt als Scheinkraft nur
~¨ 0 auf.
der uns bereits bekannte Term −mB −1~r¨0 = −mR
Wir wollen nun die bei der zeitabhängigen Drehung auftretenden Scheinkräfte
diskutieren. Zusätzlich nehmen wir an, daß die Kraft geschwindigkeitsunabhängig
ist und nicht explizit von der Zeit abhängt. Für die reine Drehung mit ~r0 = 0
vereinfacht sich die Newtonsche Gleichung im bewegten Bezugssystem zu
h
i
~ −m Ω
~ × (Ω
~ × R)
~ + 2Ω
~ ×R
~˙ + Ω
~˙ × R
~ .
~¨ = Bt−1 f~(Bt R)
mR
Weiterhin wollen wir uns jetzt auf den Fall einer Zentralkraft mit f~(~r) = ~rˆf (r)
beschränken. Für diese vereinfacht sich der erste Term auf der rechten Seite der
Bewegungsgleichung im bewegten Bezugssytem wegen r = R zu
~ = Rf
~ˆ (R) .
Bt−1 f~(Bt R)
~ wie es z.B. näherungsweise bei
Bei gleichförmiger Rotation mit konstantem Ω,
der Rotation der Erde erfüllt ist, verschwindet die letzte der Scheinkräfte. Damit
erhält man für den Fall der Schwerkraft der Erde mit (Fall aus großer Höhe)
2
f (R) = −mgRE
/R2 (mit dem Erdradius RE und einer Konstanten g > 0) im
erdfesten Bezugssystem
2
~ − 2mΩ
~ ×R
~˙ − mΩ
~ × (Ω
~ × R)
~ .
~¨ = −gm RE R
mR
3
R
Den zweiten, geschwindigkeitsabhängigen Term, nennt man die Corioliskraft und
den dritten Term die Zentrifugalkraft. Betrachten wir eine Masse, die an einem
Faden hängt, welcher von einer Person, die auf der Erdoberfläche steht, gehalten
~˙ = 0, so daß die Corioliskraft verschwindet.
wird (ein Lot). In diesem Fall gilt R
Die Zentrifugalkraft sorgt dann dafür, daß das Lot nicht genau zum Erdmittel~ × (Ω
~ × R)
~ senkrecht auf der Drehachse
punkt zeigt, da die Zentrifugalkraft −mΩ
steht und von ihr weg wirkt. Dies ist in der folgenden Skizze verdeutlicht.
32
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Ω
~g
ρ
~ result. Kraft
θ
R
~ Ω (Ω R)
~ ×R
~ senkrecht zu Ω
~ ist, gilt für den Betrag der Zentrifugalkraft
Da Ω
~ Ω
~ × R|
~ = m|Ω|
~ 2 |R|
~ sin θ = mρΩ2 ,
|F~zentr | = m|Ω||
~ zur Drehachse ρ = R sin θ. Die Zentrifugalmit dem senkrechten Abstand von R
kraft hat somit am Äquator ihren größten Wert. In der Skizze ist ihr Beitrag zur
resultierenden Kraft (und damit ihr Effekt) stark übertrieben dargestellt.
Folgend betrachten wir den Wurf eines Steins. Bei diesem spielt auch die
Corioliskraft eine Rolle. Die relevante Zeitskala tW beim Steinwurf sind Sekunden.
Da Ω = 2π/(24 · 3600) 1/s ≈ 7.27 · 10−5 1/s, gilt ΩtW 1. Setzt man nun
~
~ W (t)
R(t)
= RE P~ + R
mit dem Einheitsvektor P~ , der vom Erdmittelpunkt zur Abwurfposition auf der
Oberfläch zeigt, so machen wir nur einen Fehler der Größenordnung (ΩtW )2 ,
~
wenn wir R(t)
im Ausdruck für die Zentrifugalkraft durch RE P~ ersetzen (siehe
Ausdruck für die Zentrifugalkraft). Da weiterhin RW /RE 1 (Wurfhöhe ist sehr
viel kleiner als Erdraduis), nähern wir die Gravitationskraft als −mg P~ = m~g
an (Fall aus kleiner Höhe). Nach Division durch m erhalten wir die genäherte
Bewegungsgleichung
~¨ W (t) = ~g 0 + 2(R
~˙ W (t) × Ω)
~ ,
R
(2.16)
mit dem effektiven Beschleunigungsvektor
0
~ × (Ω
~ × P~ ) ,
~g = −g P~ − RE Ω
in dem die (genäherte) Zentrifugalkraft integriert ist. Das System inhomogener,
linearer Differentialgleichungen (2.16) läßt sich exakt lösen. Da wir uns jedoch
nur für kurze Zeiten t mit Ωt 1 interessieren, erhält man die Modifikation der
Bahn durch die Corioliskraft zur Ordnung ΩtW leichter mit Hilfe der Methode
der sukzessiven Approximation. Hier betrachten wir den Fall aus geringer Höhe
~˙ W (0) = 0. Durch zweifaches Integrieren von Gl. (2.16) erhalten wir
mit R
Z t
1 0 2
~ W (t0 ) − R
~ W (0)] × Ω
~ dt0 .
~
~
RW (t) = RW (0) + ~g t + 2 [R
2
0
2.3. DER STARRE KÖRPER
33
Man nennt eine Gleichung dieses Typs, in der die Funktion und das Integral über
die Funktion auftritt, eine Integralgleichung. Im Integral – dem Korrekturterm,
~ W (t0 ) − R
~ W (0) durch
der aus der Corioliskraft resultiert – ersetzen wir nun R
0 02
den Ausdruck der nullten Näherung ~g t /2. Das Integral kann dann geschlossen
ausgeführt werden und es ergibt sich
3
~ + O([tΩ]2 ) .
~ W (t) = R
~ W (0) + 1 ~g 0 t2 + t (~g 0 × Ω)
R
2
3
Wir stellen somit fest, daß die Komponente der Bewegung in Richtung von ~g 0 zu
führender Ordnung nicht von der Corioliskraft beeinflußt wird. Weiterhin ist die
Modifikation von
p ~g quadratisch in Ω, so daß in führender Ordnung in Ω für die
Fallzeit tW = 2h/g gilt (wie ohne die Scheinkräfte). Der Stein wird nach Osten
abgelenkt und die Ablenkung hat die Größe Ωg(2h/g)3/2 sin θ/3, wobei wir erneut
den O(Ω2 ) Unterschied zwischen ~g und ~g 0 vernachlässigt haben. Der Effekt der
Corioliskraft verschwindet an den Polen und ist am Äquator am größten. Für
eine Fallhöhe h = 100m erhält man dort die meßbare Abweichung von ≈ 2.2cm.
Die Corioliskraft wirkt sich auf die horizontale Bewegung auf der Erde anders
aus als auf die gerade studierte vertikale. Das wird besonders an den Polen klar,
an denen die vertikale Bewegung gar nicht beeinflußt wird. Wird ein Geschoß am
~˙ × Ω und der Rechte-HandNordpol horizontal abgefeuert, so erfährt es gemäß R
Regel eine Abweichung nach rechts, wenn man (von der Erde aus) längs der Bahn
blickt (dem Geschoß hinterher schaut). Vom Ruhesystem aus betrachtet ist der
Effekt klar: Das Teilchen fliegt geradeaus, während sich die Erde ostwärts dreht.
Die Richtung der Corioliskraft F~cor im allgemeinen Fall kann man z.B. angeben,
~˙ = V~ in Kugelkoordinaten (mit normierten Basisvektoren; siehe
indem man R
Seite 167 des Skripts zur Vorlesung Einführung in die Theoretische Physik)
~ R + Vθ E
~ θ + Vφ E
~φ
V~ = VR E
~ = ΩE3 = Ω(cos θE
~ R − sin θE
~ θ ) erhält man
schreibt. Mit Ω
h
i
~ r + Vφ cos θE
~ θ − (VR sin θ + Vθ cos θ)E
~φ .
F~cor = 2mΩ Vφ sin θE
In der nördlichen Halbkugel wird somit ein nordwärts fliegendes Teilchen (Vφ =
VR = 0, Vθ < 0) ostwärts abgelenkt, ein südwärtsfliegendes (Vφ = VR = 0, Vθ > 0)
dagegen westwärts.
Eine sehr elegante Art, die Erdrotation zu demonstrieren ist das Foucaultsche
Pendel, dem sie in einer Übungsaufgabe begegnen werden.
2.3
Der starre Körper
In der klassischen Mechanik definiert man den Begriff des starren Körpers als ein
System von N Massepunkten (mit Massen mα ), deren Abstände |~rα − ~rβ | zeitlich
34
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
unveränderlich sind. In der Natur vorkommende “klassische” Körper erfüllen diese
Bedingung natürlich nur näherungsweise, 9 jedoch ist die “Verformung” oft so
klein, daß sie bei der Beschreibung der Bewegung des Körpers in guter Näherung
vernachlässigt werden kann.
Wir werden hier intensiven Gebrauch von den im letzten Kapitel dargestellten
Ideen machen und verwenden daher die gleiche Notation. Es bietet sich an, das
bewegte Bezugssytem K so zu legen, daß der starre Körper in ihm ruht, während
das System k ein allgemeines Inertialsystem ist. Damit gilt (in K und für α =
1, 2, . . . , N )
~˙ α = 0 .
R
Die Gl. (2.15) vereinfacht sich durch diese Wahl zu
~ ×R
~ α (t)] .
~r˙α (t) = ~r˙0 (t) + Bt [Ω
(2.17)
Die Lage des starren Körpers bezüglich des Inertialsystems k ist vollständig be~ α bekannt sind und die Beziehung zwischen k und K charakstimmt, wenn die R
terisiert ist. Wie im letzten Kapitel diskutiert, ist die Lage von K bezüglich k
bei fester Zeit t durch sechs (allgemein zeitabhängige) Zahlen charakterisiert, die
drei Komponenten des Verschiebungsvektors und die drei Komponenten von ω
~.
Die ersten drei Zahlen sind die Freiheitsgrade der Translation, die zweiten drei
die der Rotation.
Der Trägheitstensor: Als zentralen Begriff der Beschreibung der Rotation eines
starren Körpers werden wir jetzt den Trägheitstensor10 einführen. Wir werden
das anhand der Berechnung der kinetischen Energie der Bewegung eines starren
Körpers tun. Mit Gl. (2.17) ergibt sich
N
1X
mα~r˙α2
T =
2 α=1
N
2
1X
~ ×R
~ α]
mα ~r˙0 + Bt [Ω
=
2 α=1
N
1X
~ ×R
~ α ] + [Ω
~ ×R
~ α ]2 ,
=
mα ~r˙02 + 2~r˙0 · Bt [Ω
2 α=1
9
Ob ein ausgedehnter Körper als “starr” idealisiert werden kann, hängt vom Körper selbst
(Material) und den wirkenden Kräften ab.
10
Wir haben im letzten Semester bereits häufiger den Begriff des Tensors benutzt, ohne
ihn sauber zu definieren. Auch hier wollen wir davon absehen. Zuvor benötigten und jetzt
benötigen wir nur Tensoren zweiter Stufe, die man mit einer Matrix (einer linearen Abbildung)
identifizieren kann.
2.3. DER STARRE KÖRPER
35
wobei wir im letzten Schritte (letzter Term) erneut ausgenutzt haben, daß die
Abbildung Bt alle Längen und relativen Winkel invariant läßt (orthogonale Matrix).
~ S = P mα R
~ α /M ,
Es ist vorteilhaft,
den
Ursprung
von
K
in
den
Schwerpunkt
R
α
P
mit M = α mα , des starren Körpers zu legen. In diesem Fall verschwindet der
P
~α = MR
~S =
zweite Term auf der rechten Seite der obigen Gleichung, da α mα R
0. In dieser Wahl gilt ~r0 = ~rS und die kinetische Energie zerfällt in zwei Teile
N
T =
1 ˙2 1 X
~ ×R
~ α )2
M ~rS +
mα (Ω
2
2 α=1
S
= TS + Trot
,
S
mit den Beiträgen TS der Schwerpunktsbewegung und Trot
der Rotation um den
Schwerpunkt (was den Index S erklärt).
Sollte sich der Körper alternativ um einen in k festen Punkt ~rD drehen, dann
legen wir den Ursprung von K in diesen Punkt. Verschieben wir zusätzlich den
Ursprung von k in ~rD , so gilt ~r0 = 0 und es folgt
N
1X
~ ×R
~ α )2 = T D .
mα (Ω
T =
rot
2 α=1
In beiden Fällen gilt
N
Trot =
1X
~ ×R
~ α )2
mα (Ω
2 α=1
N
=
1X
~ 2R
~ α2 − [Ω
~ ·R
~ α ]2 .
mα Ω
2 α=1
Dieser Ausdruck läßt sich nun vereinfachen, wenn wir die 3 × 3-Matrix I mit den
Matrixelementen
Ii,j =
N
X
mα
~ 2 − Rα,i Rα,j
δi,j R
α
α=1
einführen. Dieses ist der Trägheitstensor. Es gilt dann
1X
Ωi Ii,j Ωj .
Trot =
2 i,j
(2.18)
~ α des starren Körpers per Definition zeitunabhängig sind, gilt
Da die Vektoren R
gleiches für den Trägheitstensor I.
Bevor wir den Trägheitstensor weiter untersuchen und exemplarisch berechnen, wollen wir auch den Gesamtdrehimpuls eines starren Körpers umschreiben.
36
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Wir starten mit dem Ausdruck für den Gesamtdrehimpuls (bezüglich eines festen
Ursprungs) in einem Inertialsystem
~ltot =
N
X
mα~rα × ~r˙α .
α=1
~ α in K aus, so folgt
Drücken wir nun ~rα und ~r˙α durch R
~ltot =
N
X
h
i
~ α × ~r˙0 + Bt Ω
~ ×R
~α
mα ~r0 + Bt R
.
α=1
Zunächst legen wir erneut den Ursprung von K in den Schwerpunkt des star~ α linear enthalten, im obigen
ren Körpers. Dann verschwinden die Terme, die R
Produkt. Es gilt
!
N
h
i
X
~ltot = M~rS × ~r˙S + Bt
~α × Ω
~ ×R
~α
mα R
α=1
N
X
= M~rS × ~r˙S + Bt
h
~R
~2 − R
~ α (Ω
~ ·R
~ α)
mα Ω
α
!
i
(2.19)
α=1
S
= ~lS + ~lrot
.
Dabei haben wir in der ersten Zeile die Invarianz von Längen und Relativwinkeln
unter der Rotation verwendet und im letzten Schritt die Beiträge der SchwerS
punktbewegung ~lS und der Rotation ~lrot
zum Gesamtdrehimpuls definiert.
Gibt es einen in k raumfesten Drehpunkt, so legen wir die Ursprünge von k
und K in diesen. Wegen ~r0 = 0 gilt dann
!
N
h
i
X
~ltot = Bt
~R
~2 − R
~ α (Ω
~ ·R
~ α)
mα Ω
= ~lD .
α
rot
α=1
In beiden Fällen gilt für den Rotationsanteil zum Drehimpuls nach Transformation nach K
~ rot = Bt−1~lrot =
L
N
X
i
h
2
~
~
~
~
~
mα ΩRα − Rα (Ω · Rα )
α=1
bzw.
~ rot = IΩ
~
L
also
Lrot,i =
X
j
Ii,j Ωj .
(2.20)
2.3. DER STARRE KÖRPER
37
~ rot und die WinkelgeschwindigEs ist wichtig festzuhalten, daß der Drehimpuls L
~
keit Ω (in K) im Allgemeinen nicht parallel sind.
Aus Gl. (2.18) folgt
1 ~
1~ ~
~ · lrot ,
· Lrot = ω
Trot = Ω
2
2
wobei wir im zweiten Schritt ausgenutzt haben, daß Bt die Winkel und Längen
invariant läßt. Der Beitrag der Rotation zur kinetischen Energie hat somit in k
und K die gleiche Form.
Wir wollen nun ausgehend von Gl. (2.20) den Beitrag der Rotation zum Drehimpuls in k berechnen. Es gilt
~lrot = Bt L
~ rot
~
= Bt IBt−1 Bt Ω
(k)
= It ω
~ ,
wobei wir im letzten Schritt den transformierten Trägheitstensor
(k)
It
= Bt IBt−1
definiert haben. Dieser ist im Gegensatz zu dem Trägheitstensor in K im Allgemeinen zeitabhängig.
Folgend wollen wir den Trägheitstensor genauer untersuchen und exemplarisch berechnen. Aus der Definition wird klar, daß I eine (reelle) symmetrische
Matrix ist. Wir haben das Eigenwertproblem für solche Matrizen in Kapitel 2.14
der Vorlesung des letzten Semesters untersucht. Wie dort diskutiert gibt es drei
paarweise senkrechte und auf eins normierte Eigenvektoren. Die zugehörigen Koordinatenachsen bezeichnet man als Hauptträgheitsachsen des starren Körpers.
Die Eigenwerte Ii (Diagonalelemente des diagonalen Trägheitstensors in der Basis
aus Eigenvektoren) bezeichnet man als Hauptträgheitsmomente.
~ i in K die Hauptträgheitsachsen des
Nehmen wir an, daß die Basisvektoren E
starren Körpers sind – was man durch eine Hauptachsentransformation immer
erreichen kann – so lautet nach Gl. (2.18) der Rotationsbeitrag zur kinetischen
Energie
1
I1 Ω21 + I2 Ω22 + I3 Ω23
Trot =
2
und die Komponenten des Rotationsbeitrags zum Drehimpuls
Lrot,i = Ii Ωi .
Damit gilt auch
Trot
1
=
2
L2rot,1 L2rot,2 L2rot,3
+
+
I1
I2
I3
.
Man unterscheidet anhand der Ii verschiedene starre Körper:
38
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
1. Ist der Köper eindimensional, liegen also alle Massepunkte auf einer Gera~ 3 -Achse, so gilt I1 = I2 6= 0 und I3 = 0. Man nennt den
den, z.B. auf der E
starren Körper dann einen Rotator.
2. Man nennt den starren Körper unsymmetrisch, falls alle Ii verschieden sind.
3. Der starre Körper heißt symmetrisch, falls zwei der Hauptträgheitsmomente
identisch sind I1 = I2 6= I3 .
4. Gilt I1 = I2 = I3 , so heißt der starre Körper kugelartig. Dabei können nicht
nur Kugeln kugelartig sein (siehe unten).
In Körpern, die eine Symmetrie aufweisen, ist es einfach die Hauptträgheitsachsen
zu bestimmen. Eine liegt in diesem Fall entlang der Symmetrieachse und die
beiden anderen können dazu senkrecht (und paarweise senkrecht) frei gewählt
werden.
Bisher haben wir den starren Körper durch die Angabe der N Massen mα und
~ α charakterisiert. In den typischen Situationen (z.B. bei
die zugehörigen Orte R
einem Kreisel) ist der Körper jedoch kontinuierlich – oft mit homogener Massendichte ρ = M/V , mit der Gesamtmasse M und dem Volumen V des Körpers. In
diesem Fall müssen wir in der Berechnung des Trägheitstensors von einer diskreten Summe zum Integral übergehen. Für den Fall der homogenen Masseverteilung
ist dies einfach, indem wir die Massen mα immer kleiner machen und die Zahl N
der Massepunkte, bei konstanter Gesamtmasse, erhöhen. Im Limes N → ∞ folgt
so
N
X
Z
mα . . . →
ρ . . . d3 x
V
α=1
, wobei das V am Integralzeichen anzeigt, daß über das Volumen des starren
Körpers zu integrieren ist. Für den Trägheitstensor ergibt sich
Z
Ii,j =
ρ δi,j ~x2 − xi xj d3 x .
V
Ist die Verteilung der Masse in einem kontinuierlichen starren Körper nicht
homogen, so müssen wir anders vorgehen. Auch wenn dieser Fall im Folgenden
keine zentrale Rolle spielen wird, wollen wir ihn hier betrachten. Wir führen
eine allgemeine ortsabhängige Massendichte ρ(~x) ein. Um den Trägheitstensor als
Integral über diese Dichte zu schreiben definieren wir
ρ(~x) =
N
X
α=1
~ α) .
mα δ(~x − R
2.3. DER STARRE KÖRPER
39
Dabei haben wir die Diracsche Deltafunktion δ(~y ) eingeführt. Sie hat (bei hinreichend harmloser Funktion f ) die Eigenschaft
Z
δ(~x − ~x0 )f (~x) d3 x = f (~x0 ) .
R3
Um dieses zu erreichen, muß die Deltafunktion bei ~x = ~x0 divergieren (unendlich
sein) und für alle anderen Punkte verschwinden. Es handelt sich bei δ(~x) somit
nicht um eine gewöhnliche Funktion, sondern eine sogenannte Distribution. Sie
werden im Laufe ihres Studiums lernen mit der Deltafunktion (und Distributionen
im Allgemeinen) umzugehen. Hier benötigen wir nur, daß
Ii,j =
=
N
X
α=1
N
X
mα
Z
mα
=
R3
Z
=
~ α )d x
δ(~x − R
3
h
R3
α=1
Z
~ 2 − Rα,i Rα,j
δi,j R
α
" N
X
~ 2 − Rα,i Rα,j
δi,j R
α
i
#
~ α)
mα δ(~x − R
δi,j ~x2 − xi xj d3 x
α=1
ρ(~x) δi,j ~x2 − xi xj d3 x ,
R3
wobei wir ausgenutzt haben, daß man unter dem Integral in Anwesenheit der
Deltafunktion Rα,i durch xi ersetzen kann. Ausgehend von diesem Ausdruck ist
es nun leicht, den Kontinuumslimes auszuführen, indem man ρ(~x) durch eine kontinuierliche Massendichte (kontinuierliche Funktion von ~x) ersetzt. Ist die Masse
homogen, so gilt ρ(~x) = ρ innerhalb des starren Körpers und ρ(~x) = 0 außerhalb.
Die explizite Berechnung von Trägheitstensoren: Wir wollen als nächstes
exemplarisch den Trägheitstensor (bzw. die Hauptträgheitsmomente) eines homogenen Zylinders und einer homogenen Kugel berechnen. In Matrixform lautet
der allgemeine Ausdruck des Trägheitstensors für einen kontinuierlichen starren
~ i }-Basis)
Körper (in der {E
 R
R
R

(xR22 + x23 )ρ(~x)d3 x R− x1 x2 ρ(~x)d3 x
− R x1 x3 ρ(~x)d3 x
(xR21 + x23 )ρ(~x)d3 x R− x2 x3 ρ(~x)d3 x  .
I =  − R x2 x1 ρ(~x)d3 x
− x3 x1 ρ(~x)d3 x
− x3 x2 ρ(~x)d3 x
(x21 + x22 )ρ(~x)d3 x
~ 3 entlang der Zylinderachse und den Ursprung in den Schwerpunkt
Legen wir E
des Zylinders der Höhe L und des Radius r0 , so verschwinden die Außerdiagonalelemente aus Symmetriegründen (anders gesagt, wir haben die Hauptträgheitsachsen aufgrund des Symmetrie bereits identifiziert). Wie man sofort sieht gilt
40
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
allgemein I1,1 + I2,2 ≥ I3,3 , I2,2 + I3,3 ≥ I1,1 und I3,3 + I1,1 ≥ I2,2 und damit auch
für die Haupträgheitsmomente
I1 + I2 ≥ I3 ,
I2 + I3 ≥ I1 ,
I3 + I1 ≥ I2 .
Die für den homogenen Zylinder auftretenden Integrale können nun leicht bestimmt werden (Polarkoordinaten in x1 -x2 -Ebene). Die fundamentalen Integrale
sind
Z L/2 Z r0
Z
Z
Z
1
2
2 3
2 3
2 3
r3 dr dx3 = πLr04 /4
(x1 + x2 )d x = π
x1 d x =
x2 d x =
2 V
−L/2
0
V
V
und
Z
x23 d3 x
V
Z
L/2
= 2π
x23
r0
Z
−L/2
rdr dx3 = πL3 r02 /12 .
0
Durch entsprechende Kombination dieser Integrale erhält man
2
r0 L 2
r2
+
I1 = I2 = M
, I3 = M 0 .
4
12
2
√
Im Spezialfall L = 3r0 ist der Zylinder kugelartig (aber keine Kugel).
Für die homogene Kugel mit Radius r0 wählen wir als den Ursprung den
Schwerpunkt. Die Wahl der drei paarweise orthogonalen Achsen ist aufgrund
der Symmetrie frei. Alle Nebendiagonalelemente verschwinden. Das fundamentale
Integral ist (in Kugelkoordinaten)
Z
Z
1
2 3
r2 d3 x
xi d x =
3 V
V
Z Z Z
1 2π π r0
=
sin θ r4 dr dθ dφ
3 0
0
0
4π r05
=
.
3 5
Damit ergibt sich
2
I1 = I2 = I3 = ρ
3
Z
V
2
r2 d3 x = M r02 .
5
In Übungsaufgaben werden sie weitere Trägheitstensoren berechnen und Situationen studieren, in denen eine Hauptachsentransformation noch explizit ausgeführt
werden muß.
Die Dynamik eines starren Körpers: In Kapitel 3.3 der Vorlesung des letzten Semesters haben wir die Bewegungsgleichungen und Erhaltungsgrößen des
2.3. DER STARRE KÖRPER
41
N -Teilchen-Problems behandelt. Basierend auf diesen wollen wir nun die Dynamik des starren Körpers untersuchen. Dabei werden die möglichen Bewegungstypen insbesondere für spezielle Klassen von starren Körpern charakterisiert. Die
Bewegungsgleichung des Schwerpunktes ~rS (im Inertialsystem k) lautet
M ~r¨S =
N
X
ext
f~αext = f~tot
.
(2.21)
α=1
Für die Ableitung des Gesamtdrehimpulses gilt
N
X
~l˙tot =
~rα × f~αext = ~ntot ,
α=1
mit dem Gesamtdrehmoment ~ntot in k. Mit
~ α = ~r0 + ~rα0 ,
~rα = ~r0 + Bt R
und Gl. (2.19) folgt
N
N
α=1
α=1
X
X 0
~l˙tot = M~rS × ~r¨S + ~l˙ S =
~rS × f~αext +
~rα × f~αext ,
rot
falls wir (siehe oben) ~r0 = ~rS wählen. Durch Ausnutzen von Gl. (2.21) können wir
daraus eine Gleichung für die Zeitableitung des Rotationsanteils des Drehimpulses
ableiten (gültig für ~r0 = ~rS )
N
N
X
X 0
~ext =
~l˙ S =
~ α ) × f~ext = ~nS ,
(Bt R
×
f
~
r
α
rot
α
α
rot
α=1
(2.22)
α=1
mit dem Rotationsanteil zum Drehmoment ~nSrot (bei der Wahl ~r0 = ~rS ). Für einen
Kreisel mit raumfestem (in k) Drehpunkt wählt man wie zuvor ~r0 = 0 und erhält
N
N
X
X
~l˙ D =
~ α ) × f~αext = ~nD
~rα × f~αext =
(Bt R
rot
rot .
α=1
(2.23)
α=1
Als Beispiel für die ein Drehmoment generierende äußere Kraft betrachten
wir die Schwerkraft f~αext = mα~g . Wir wollen zunächst den Wurf eines starren
Körpers (z.B. eines Diskus) beschreiben. Dazu legen wir den Ursprung von K
in den Schwerpunkt des Körpers, wählen also ~r0 = ~rS . Dann gilt nach unseren
allgemeinen Überlegungen
N
N
α=1
α=1
X
X
~l˙ S =
~ α ) × mα~g =
~ α )] × ~g = 0 ,
(B
R
[Bt (mα R
t
rot
42
da
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
P
α
~α = MR
~ S = 0 und das Drehmoment ~nSrot verschwindet. Damit folgt
mα R
~lS = const.
rot
und der Rotationsbeitrag zum Gesamtdrehimpuls ist eine Erhaltungsgröße.
Für den Fall eines Kreisels im Schwerefeld mit festem Drehpunkt wählen wir
~r0 = 0 (Ursprung von K und k im festen Drehpunkt; siehe oben) und erhalten
N
X
~l˙ D =
~rα × mα~g = M~rS × ~g
rot
(2.24)
α=1
also ein nicht verschwindendes Drehmoment. Neben der Schwerkraft wirkt im
Drehpunkt des Kreisels noch eine Zwangskraft. Zwangskräfte werden wir im folgenden Kapitel über den Lagrange-Formalismus diskutieren. Hier ist es nur wichtig festzuhalten, daß die Zwangskraft aufgrund der Wahl des Ursprungs von k
und K im Drehpunkt und des Faktors ~rα nicht zum Drehmoment ~nD
rot beiträgt.
Im nächsten Abschnitt wollen wir die Dynamik eines speziellen Kreisels, des symmetrischen schweren Kreisels mit festem Drehpunkt, untersuchen.
Die Dynamik des symmetrischen schweren Kreisels: Wir diskutieren die
Bewegung im Inertialsystem k, dessen Ursprung im festen Drehpunkt liegen soll.
Auch der Ursprung des körperfesten Systems K liege in diesem Punkt (d.h. es
D
gilt ~r0 = 0). Nach Gl. (2.24) gilt mit der abkürzenden Schreibweise ~l = ~ltot
~l˙ = M~rS × ~g
mit dem Ortsvektor ~rS des Schwerpunkts des Kreisels (in k). Wir legen das System
~ 3 vom Koordinatenursprung zum Schwerpunkt zeigt, also ~rS = a~e 0 =
K so, daß E
3
~ 3 gilt. Mit ~g = −g~e3 folgt
aBt E
~l˙ = M ga ~e3 × ~e 0 .
(2.25)
3
Wir benötigen eine zusätzliche Differentialgleichung für den zeitabhängigen Vek0
tor ~e3 . Diese folgt als Spezialfall der Beziehung ~r˙α = ω
~ × ~rα , die für alle festen
˙~
Punkte in K mit Rα = 0, d.h. für alle Massenpunkte des Kreisels gilt
0
0
~e˙ 3 = ω
~ × ~e3 .
(2.26)
0
In den Gln. (2.25) und (2.26) treten die zeitabhängigen Vektoren ~l, ~e3 und ω
~
~ = IΩ,
~ wobei I zeitunabhängig ist. Dagegen
auf. In K besteht die Beziehung L
ist die Abbildung zwischen der Winkelgeschwindigkeit ω
~ und dem Drehimpuls
~l in k zeitabhängig, was eine einfache Lösung des Kreiselproblems für allgemeine Hauptträgheitsmomente Ii verhindert. Wir beschränken uns daher, wie oben
2.3. DER STARRE KÖRPER
43
schon angedeutet, auf den symmetrischen Kreisel, bei dem (mindestens) zwei
Hauptträgheitsmomente identisch sind.
Wählen wir I1 = I2 , dann liegt der Schwerpunkt des Kreisels auf der Figu~ 3 gegeben ist. In diesem Fall
renachse, deren Richtung durch die Hauptachse E
gilt
~l = l1~e1 + l2~e2 + l3~e3 = L1~e 0 + L2~e 0 + L3~e 0
1
2
3
0
0
0
0
= I1 Ω1~e1 + Ω2~e2 + I3 Ω3~e3 = I1 ω
~ + (I3 − I1 )Ω3~e3 .
0
Damit liegen die zeitabhängigen Vektoren ~l, ~e3 und ω
~ in einer Ebene, d.h. sie sind
koplanar. Wir verwenden die resultierende Relation
1 ~
0
l − (I3 − I1 )Ω3~e3
ω
~ =
I1
um ω
~ aus Gl. (2.26) zu eliminieren. Man erhält so
1 ~
0
0
~e˙ 3 =
l × ~e3 .
I1
(2.27)
In k dreht somit die Figurenachse eines symmetrischen Kreisels mit der Winˆ
kelgeschindigkeit |~l|/I1 um die instantane Richtung des Drehimpulses ~l. Für den
schweren symmetrischen Kreisel (mit a > 0) ist ~l zeitabhängig.
Der kräftefreie, symmetrische Kreisel: Für speziell konstruierte Kreisel läßt
sich auch der Fall a = 0 einstellen. Dann verschwindet nach Gl. (2.25) das Drehmoment und der Kreisel verhält sich wie ein kräftefreier Kreisel mit einem raumfesten Drehimpulsvektor ~l. Die Figurenachse rotiert in diesem Fall mit der Frequenz
ωnut = |~l|/I1 um ~l. Diese Bewegung wird als Nutation bezeichnet. Auch im all0
gemeinen Fall mit a 6= 0 bezeichnet man die Rotation der Figurenachse ~e3 um
die Drehimpulsachse als Nutation. Für a 6= 0 ist die Drehimpulsachse im Gegensatz zum vorliegenden kräftefreien Fall jedoch nicht mehr zeitunabhängig (nicht
mehr raumfest). Da der Schwerpunkt im kräftefreien Fall im festen Drehpunkt
liegt, ist die ~e3 -Achse im kräftefreien Kreisel nicht ausgezeichnet. Für Anfangs0
bedingungen ~e3 (t = 0) ∼ ~l bleibt auch die Figurenachse raumfest. Zusätzlich
zur beschriebenen Nutation rotiert der starre Körper selbstverständlich um seine
Figurenachse.
Die Bewegung für a 6= 0: Für beliebige Werte von a gibt es zwei Erhaltungsgrößen. Die erste folgt aus einer skalaren Multiplikation von Gl. (2.25) mit ~e3
⇒
~l˙ · ~e3 = dl3 = M ga ~e3 × ~e 0 · ~e3 = 0
3
dt
l3 = const.
44
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Die zweite erhält man, indem man Gl. (2.27) skalar mit ~l und Gl. (2.25) skalar
0
mit ~e3 multipliziert. Die rechten Seiten geben jeweils Null, so daß durch Addition
~l · ~e˙ 0 + ~l˙ · ~e 0 = d ~l · ~e 0 = 0
3
3
3
dt
⇒
L3 = const.
folgt. Somit sind die Projektionen des Drehimpulsvektors auf die Richtung ~e3 des
0
Schwerefeldes und die Richtung ~e3 der Figurenachse Erhaltungsgrößen.
Folgend führen wir den zentralen “Trick” zur Lösung der Bewegungsgleichun~
gen des symmetrischen
schweren Kreisels ein. Wir zerlegen den Drehimpuls l in
0
der Basis ~e3 , ~e3 , ~e⊥ mit
0
~e⊥ = (~e3 × ~e3 )/ sin θ .
0
Dabei bezeichnet θ den Winkel zwischen ~e3 und ~e3 . Die drei Vektoren des Basis0
systems sind auf Eins normiert, jedoch stehen ~e3 und ~e3 nur für θ = π/2 senkrecht
aufeinander (beide stehen per Konstruktion senkrecht auf ~e⊥ ). Die Basis besteht
somit im Allgemeinen nicht aus orthogonalen Vektoren. Weiterhin liegt eine Basis
nur dann vor, wenn θ weder 0 noch π ist. Es gilt (Index v steht für vertikal, Index
s für Spin)
~l(t) = lv (t)~e3 + ls (t)~e 0 (t) + l⊥ (t)~e⊥ (t) .
3
(2.28)
Die Entwicklungskoeffizienten lv und ls lassen sich durch die Erhaltungsgrößen l3
und L3 , sowie den Winkel θ ausdrücken
l3 = ~e3 · ~l = lv + ls cos θ ,
0
L3 = ~e3 · ~l = lv cos θ + ls .
Dieses Gleichungssystem läßt sich leicht lösen und man erhält
lv =
l3 − L3 cos θ
,
sin2 θ
ls =
L3 − l3 cos θ
.
sin2 θ
(2.29)
Ist somit θ zeitabhängig so gilt Gleiches für lv und ls .
Setzt man die Entwicklung Gl. (2.28) in Gl. (2.27) ein, so ergibt sich
˙~e 0 = lv ~e3 + l⊥ ~e⊥ × ~e 0 .
3
3
I1
I1
0
Gibt man die Orientierung von ~e3 in Kugelkoordinaten mit den Winkeln θ und φ
0
an, so beschreibt φ̇ die Winkelgeschwindigkeit von ~e3 um die ~e3 -Achse und θ̇ die
um die ~e⊥ -Achse. Man kann damit ablesen, daß
φ̇ =
lv
l3 − L3 cos θ
l⊥
=
, θ̇ =
2
I1
I1
I1 sin θ
(2.30)
2.3. DER STARRE KÖRPER
45
gilt. Lösungen mit l⊥ = 0 entsprechen somit einer Kreiselbewegung mit festem
(zeitunabhängigem) Winkel θ zwischen der Richtung des Schwerefeldes ~e3 und
0
der Figurenachse ~e3 .
Um θ(t) und φ(t) zu bestimmen, verwenden wir zusätzlich die Erhaltung der
Gesamtenergie. Die kinetische Energie der Rotation ist
Trot =
L21 + L22
L2
+ 3 .
2I1
2I3
Um diese umzuschreiben betrachten wir
~l − L3~e 0 = L1~e 0 + L2~e 0 = lv~e3 + (ls − L3 )~e 0 + l⊥~e⊥ .
3
1
2
3
Quadrieren der rechten Gleichung liefert
0
2
2
= lv2 sin2 θ + l⊥
,
L21 + L22 = lv2 + (ls − L3 )2 + 2lv (ls − L3 )~e3 · ~e3 + l⊥
0
wobei wir im letzten Schritt ls −L3 = −lv cos θ (siehe Gl. (2.29)) und ~e3 ·~e3 = cos θ
verwendet haben. Ersetzt man in diesem Ausdruck lv und l⊥ gemäß Gl. (2.30),
so folgt für die kinetische Energie der Rotation
Trot =
I1 2 (l3 − L3 cos θ)2
L23
θ̇ +
+
.
2
2I3
2I1 sin2 θ
Zu Trot müssen wir noch die potentielle Energie hinzuaddieren und erhalten für
die (erhaltene) Gesamtenergie
E = Trot + M ga cos θ ,
bzw. mit E 0 = E − L23 /(2I3 ) (ebenfalls erhalten)
E0 =
I1 2 (l3 − L3 cos θ)2
θ̇ +
+ M ga cos θ .
2
2I1 sin2 θ
In dieser Gleichung sind alle auftretenden Größen außer dem Winkel θ zeitunabhängig. Differentialgleichungen dieses Typs sind uns bereits wiederholt begegnet. Identifizieren wir I1 mit der Masse eines Teilchens, so ist das verbleibende
Problem äquivalent zu einer eindimensionalen Bewegung im effektiven Potential
Veff (θ) =
(l3 − L3 cos θ)2
+ M ga cos θ .
2I1 sin2 θ
(2.31)
Wie wir diese Art Probleme (zumindest formal) lösen, sollte ihnen inzwischen
klar sein. Die folgende Abbildung zeigt das effektive Potential für verschiedene
Parameter. Das obere Kurvenpaar ist für l3 /L3 = 1.25 mit η = 0.1 (durchgezogen) und η = 0 (gestrichelt) berechnet, wobei η = 2I1 M ga/L23 . Beim unteren
Kurvenpaar gilt l3 /L3 = 0.8, bei denselben η wie oben (selbe Kodierung).
46
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
2I1Veff/L3
2
2
0
0
1
θ
2
Anhand des effektiven Potentials für die Zeitabhängigkeit von θ wird klar, daß
die Bewegung in θ-Richtung finit und periodisch ist. Wir werden darauf folgend
zurückkommen.
Nachdem θ(t) bestimmt wurde, folgt die Zeitabhängigkeit von φ durch Integration
Z t
l3 − L3 cos θ(t0 ) 0
dt .
φ(t) − φ(0) =
I1 sin2 θ(t0 )
0
Bei der Lösung der Bewegungsgleichung treten sechs Anfangsbedingungen auf:
θ(0), θ̇(0), L3 , φ(0), φ̇(0) (oder l3 , beide hängen gemäß Gl. (2.30) zusammen)
und der Anfangswinkel eines beliebigen Punktes des starren Köpers bezüglich
der Drehung um die Figurenachse.
Die Bewegung mit θ = const.: Wir beginnen die Diskussion der Bewegung
der Figurenachse mit dem Spezialfall, daß θ zeitlich konstant ist. Diese Bewegung
kann realisiert werden, wenn der Winkel den Wert θ0 annimmt, an dem das
Potential Veff (θ) minimal wird. Wir benötigen also die Ableitung
(l3 − L3 cos θ)(L3 − l3 cos θ)
− M ga sin θ
I1 sin3 θ
lv ls
=
− M ga sin θ .
I1
0
Veff
(θ) =
Die rechte Seite wird Null, wenn entweder θ = 0, π (kein Minimum) oder
lv ls
− M ga = 0 .
I1
(2.32)
Mit Gl. (2.29) liefert diese Gleichung eine Beziehung zwischen l3 , L3 und cos θ0 .
Da θ(t) = θ0 , folgt nach Gl. (2.30) l⊥ = 0 und damit für den Drehimpuls
~l(t) = lv~e3 + ls~e 0 (t) ,
3
2.3. DER STARRE KÖRPER
47
wobei lv und ls konstant und von θ0 abhängig sind.
Wir legen nun zusätzlich fest, daß a = 0 gilt (kräftefreier Kreisel). Wie bereits
oben diskutiert, ist dann ~l raumfest. Die Gleichung lv ls = 0 hat zwei Lösungen.
0
0
Für lv = 0 folgt φ̇ = 0 und damit ~l = ls~e3 = L3~e3 . In diesem Fall sind der
Drehimpulsvektor und die Figurenachse raumfest und parallel. Sie schließen mit
~e3 den Winkel θ0 ein. Die einzige Bewegung des starre Körpers ist die Rotation
um die Figurenachse. Für ls = 0 folgt ~l = lv~e3 = l3~e3 , d.h. φ̇ = l3 /I1 . Dies ist die
Nutation um die ~l-Achse (welche im vorliegenden Fall der ~e3 -Achse entspricht)
mit Öffnungswinkel θ0 . Zusätzlich rotiert der Kreisel um die Figurenachse.
Im allgemeinen Fall a 6= 0 erhält man mit lv = (L3 − ls )/ cos θ0 (siehe Gl.
(2.29)) aus Gl. (2.32) die quadratische Gleichung (in ls )
ls (L3 − ls ) = I1 M ga cos θ
mit den zwei Lösungen
ls,± =
p
L3 1 ± 1 − 2η cos θ0 ,
2
wobei η = 2I1 M ga/L23 (siehe oben). Für lv ergibt sich daraus
lv,±
p
L3 =
1 ∓ 1 − 2η cos θ0 .
2 cos θ0
Die dimensionslose Größe η ist klein, wenn die potentielle Energie des Kreisels
im Schwerefeld klein gegenüber der Rotationsenergie L23 /(2I1 ) ist. Die sich dann
0
ergebene Relation zwischen ~e3 , ~e3 und ~l ist in der folgenden Skizze dargestellt.
l
l
e3
e3
e3
e3
Für den vorliegenden Fall des schnellen schweren symmetrischen Kreisels
kann man die Wurzel in den Ausdrücken für ls,± und lv,± entwickeln. Die beiden
Lösungen unterscheiden sich durch Terme der Größenordnung η von der Lösung
des kräftefreien Kreisels. Trotzdem unterscheiden sich die “+”-Lösung und die
“φ̇ = 0”-Lösung des kräftefreien Falls qualitativ. Die Winkelgeschwindigkeit um
48
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
die ~e3 -Achse ist
φ̇± =
lv,±
M ga
=
.
I1
ls,±
Entwickelt erhält man für die +-Lösung ergibt sich
i
M ga h
η
M ga
2
=
1 + cos θ0 + O(η ) .
φ̇+ =
ls,+
L3
2
Die Figurenachse rotiert, bzw. präzidiert, mit der langsamen Präzessionsfrequenz um die ~e3 -Achse, wobei für den schnellen schweren symmetrischen Kreisel
0
φ̇+ L3 /I1 gilt. Der Gesamtdrehimpuls ~l zeigt fast in die ~e3 -Richtung (siehe die
obige Skizze). Das bedeutet, daß die Rotation des Kreisels um seine Figurenachse
über die Präzession “dominiert” (die Präzessionsfrequenz ist “klein”). Im Gegensatz dazu unterscheidet sich die “−”-Lösung (schnelle Präzession) für η 1
qualitativ nicht von der Nutation des Grenzfalls a = 0 (Rotation des Körpers um
die Figurenachse und Nutation der Figurenachse um die Drehimpulsrichtung).
Der Gesamtdrehimpuls ~l zeigt näherungsweise in die ~e3 -Richtung (siehe die obige
Skizze).
Die generische Bewegung mit E 0 > Veff (θ0 ): Folgend betrachten wir die Bewegung mit zeitlich sich änderndem θ indem sich Nutation und Präzession überlagern (und der Kreisel um seine Figurenachse rotiert). Aus der Skizze von Veff (θ)
wird klar, daß θ(t) eine periodische Funktion der Zeit ist (zwischen E 0 -abhängigen
θmin und θmax ). Wir beschränken uns auf den Fall L3 > l3 > 0 und a > 0, der im
Limes E 0 → Veff (θ0 ) der langsamen Präzession entspricht. Dann verschwindet der
erste Term in der Definitionsgleichung (2.31) für Veff bei θa=0 = arccos (l3 /L3 )).
Da das Gravitationspotential M ga cos θ monoton mit θ abnimmt, liegt das Minimum θa von Veff rechts von θa=0 . Dies ist in der folgenden Skizze illustriert.
2
2
2I1Veff/L3
a=0
a>0
E’2
E’1
0
0
1
θ
2
2.3. DER STARRE KÖRPER
49
Das Verhalten der Winkelgeschwindigkeit φ̇ versteht man leicht, wenn man die
Beziehung l3 = L3 cos θa=0 in Gl. (2.29) einsetzt und das resultierende Ergebnis
für lv in Gl. (2.30). Damit erhält man
φ̇(t) =
L3
[cos θa=0 − cos θ(t)] .
I1 sin2 [θ(t)]
Falls E 0 so gewählt wird, daß θmin > θa=0 , wie in der Skizze für E10 , hat φ̇ für alle
Zeiten dasselbe Vorzeichen (rote Kurve in der folgenden Skizze). Dagegen wechselt
für Energien mit θmin < θa=0 , wie bei E20 , φ̇ das Vorzeichen. In diesem Fall folgt
0
die Spitze von ~e3 einer Rosettenbahn (auf der Einheitskugel) zwischen θmin und
θmax (blaue Kurve in der folgenden Skizze; die schwarze Kurve zeigt den Grenzfall θmin = θa=0 ). Die Bahnkurven sind im Allgemeinen nicht geschlossen. Eine
quantitative Anlayse läßt sich ausführen, wenn man Veff durch eine Parabel um
das Minimum approximiert. Das diskutierte Verhalten der kombinierten Nutation
und Präzession ist in der folgenden Skizze für verschiedene Energien dargestellt.
Sie zeigt die Projektion der Bewegung des Punktes θ(t), φ(t) auf der Einheitskugel
auf die x1 -x2 -Ebene. Der projezierte Drehimpulsvektor ~l beschreibt eine Kreisbahn (Präzession) um den Ursprung (d.h. um die ~e3 -Richtung), um die herum
die Nutation stattfindet (Nutationsfrequenz größer als Präzessionsfrequenz).
Um die Bewegungsformen des schweren symmetrischen Kreisels besser zu verstehen, ist es sehr empfehlenswert mit dem in der Vorlesung gezeigten Java-Applet
zu experimentieren, welches unter
http://faculty.ifmo.ru/butikov/Applets/Gyroscope.html
zu finden ist. In diesem zeigt der rote Vektor bzw. die rote Spur den Drehimpulsvektor bzw. seine Projektion. Die gelbe Spur ist die Projektion der Figurenachse,
wie sie in der obigen Abbildung dargestellt ist. In der “List of Examples” des
50
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Applets sind für das gerade Diskutierte die Punkte 2 und 3 von Interesse. Dabei
empfehle ich im Punkt 2 den Kasten mit “Show Trace” wegzuklicken, da ich die
violette Bahn im Hinblick auf die obige Diskussion als verwirrend empfinde.
Die Eulerschen Kreiselgleichungen: In der Beschreibung der Dynamik des
symmetrischen schweren Kreisels im Inertialsystem k konnten wir das Problem,
daß die Beziehung zwischen Drehimplusvektor und Winkelgeschwindigkeit nur in
K einfach ist (Li = Ii Ωi ), geschickt umgehen. Für einen unsymmetrischen Kreisel
gelingt das nicht. Daher betrachten wir hier die Bewegungsgleichung (siehe Gln.
(2.22) und (2.23))
N
X
~l˙rot = ~nrot =
~ α × f~αext
Bt R
α=1
im körperfesten System K. Wie zuvor, wird folgend der Index “rot” unterdrückt.
Mit
h
i
~l˙ = d (Bt L)
~ = Ḃt L
~ + Bt L
~˙ = Bt Ω
~ ×L
~ +L
~˙
dt
~ und nach Anwenden von Bt−1
folgt unter Verwendung von ~n = Bt N
~˙ + Ω
~ ×L
~ =N
~ .
L
~ in K ist durch
Das Drehmonent N
~ =
N
N
X
~ α × B −1 f~ext
R
t
α
α=1
gegeben. Im Schwerefeld mit f~αext = mα~g (kleine Höhe) ergibt sich somit
~ =
N
N
X
~ α × B −1~g = M R
~ S × G(t)
~
mα R
,
t
(2.33)
α=1
~
mit G(t)
= Bt−1~g .
˙
Es wird klar, daß die Gleichung ~l = ~n in K eine kompliziertere Form annimmt.
~ = IΩ
~ kann man L
~ aus der Gleichung eliminieren und
Mit Hilfe der Beziehung L
erhält
~˙ + Ω
~ × IΩ
~ =N
~ .
IΩ
~ i in K als die Hauptträgheitsachsen, so folgen die
Wählt man die Basisvektoren E
Eulerschen Kreiselgleichungen
I1 Ω̇1 + (I3 − I2 )Ω2 Ω3 = N1 ,
I2 Ω̇2 + (I1 − I3 )Ω1 Ω3 = N2 ,
I3 Ω̇3 + (I2 − I1 )Ω1 Ω2 = N3 .
2.3. DER STARRE KÖRPER
51
Folgend wollen wir die Beispiele des Wurfes eines starren Körpers (z.B. Diskus) und des Kreisels mit raumfestem Drehpunkt im Schwerefeld betrachten. Für
den Wurf legen wir den Ursprung von K in den Schwerpunkt des Kreisels. Wegen
~ S = 0 verschwindet das Drehmoment Gl. (2.33) und man erhält die EulergleiR
chungen des kräftefreien Kreisels
I1 Ω̇1 + (I3 − I2 )Ω2 Ω3 = 0 ,
I2 Ω̇2 + (I1 − I3 )Ω1 Ω3 = 0 ,
I3 Ω̇3 + (I2 − I1 )Ω1 Ω2 = 0 .
Für einen symmetrischen Körper mit I1 = I2 ist die Lösung des Gleichungssystems einfach. Aus der dritten Gleichung folgt Ω3 = const., d.h. die Erhaltung
von L3 . Das übrigbleibende System von zwei linearen Differentialgleichungen mit
konstanten Koeffizienten werden sie in einer Übungsaufgabe weiter untersuchen.
Für einen unsymmetrischen starren Körper führt die allgemeine Lösung des Differentialgleichungssystems auf sogenannte elliptische Integrale (siehe Literatur;
z.B. Landau-Lifschitz, Band I, § 37). Wir werden diesen Fall hier nicht weiter
diskutieren.
Für den Kreisel mit raumfestem Drehpunkt folgt für das Drehmoment
~ = MR
~S × G
~ = M aE
~3 × G
~ ,
N
(2.34)
wobei wir das Koordinatensystem wie in der obigen Diskussion des schweren sym~ 3 zeigt vom raumfesten Drehpunkt zum
metrischen Kreisels gewählt haben (E
Schwerpunkt). Um ein geschlossenes Differentialgleichungssystem zu erhalten,
~
schreiben wir die Zeitabhängigkeit von G(t)
= Bt−1~g als Differentialgleichung
~˙ = Ḃ −1~g = B −1 Bt Ḃ −1~g = −B −1 Ḃt B −1~g = −B −1 At~g
G
t
t
t
t
t
t
−1
−1
~
~
= −Bt (~ω × ~g ) = −Bt Bt (Ω × G)
~ ×G
~ ,
= −Ω
wobei wir die Notation aus den letzten Kapitel und Gl. (2.13) benutzt haben. Mit
den Eulerschen Kreiselgleichungen (rechte Seite durch Gl. (2.34) gegeben) ergibt
sich so ein geschlossenes System von sechs nichtlinearen Differentialgleichungen
~ und G.
~ Bei der Lösung helfen die Erhaltungsgrößen
für die Komponenten von Ω
~ 2 , (ii) in k gilt ~n = M R
~ S × ~g , so daß ~l · ~g = const. = L
~ ·G
~ gilt,
(i) ~g 2 = g 2 = G
(iii) die Gesamtenergie
~ ·E
~3 +
E = M aG
3
1 X
Ωi Ii,j Ωj
2 i,j=1
ist erhalten. Ohne weitere erhaltene Größen, d.h. im allgemeinen Fall, können
auch chaotische Lösungen (siehe Kapitel 3.4 der Vorlesung des letzten Semesters)
auftreten. In den hier tiefer untersuchten Spezialfällen des kräftefreien und des
schweren symmetrischen Kreisels ist dies jedoch nicht der Fall.
52
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Kapitel 3
Lagrangesche Mechanik
Im Kapitel 3.5 der Vorlesung des letzten Semesters haben wir die Newtonschen
Bewegungsgleichungen für das Problem eines Teilchens (mit drei kartesischen Koordinaten) nach Umschreiben in drei verallgemeinerte krummlinige Koordinaten
qi , i = 1, 2, 3, in die Lagrangeform (siehe Gl. (3.15))
d ∂T
∂T
(3.1)
= ~gi · F~ +
dt ∂ q̇i
∂qi
gebracht. Für den Fall einer konservativen Kraft F~ folgt
∂L
d ∂L
=
, L=T −V .
dt ∂ q̇i
∂qi
(3.2)
Dabei sind wir in der Herleitung davon ausgegangen, daß die Beziehung xi =
xi (q1 , q2 , q3 ), i = 1, 2, 3, nicht explizit von der Zeit abhängt (siehe Seiten 165
des Skripts der Vorlesung des letzten Semesters). Bevor wir in diesem Kapitel dazu kommen, die Vorteile des Lagrangeformalismus (speziell für Systeme
mit “Zwangsbedingungen”) herauszuarbeiten, wollen wir die Herleitung für eine zeitabhängige Wahl der krummlinigen Koordinaten mit xi = xi (q1 , q2 , q3 ; t),
i = 1, 2, 3 und N -Teilchensysteme erweitern.
Für eine zeitabhängige Wahl der krummlinigen Koordinaten gilt
3
3
X
∂~r
∂~r X
∂~r
~v =
q̇j +
=
q̇j ~gj +
,
∂q
∂t
∂t
j
j=1
j=1
wobei wir ∂~r/∂qj = ~gj verwendet haben. Um Gl. (3.15) der Vorlesung des letzten
Semesters zu beweisen, benötigen wir, daß ~gi = ∂~v /∂ q̇i und
d ∂~r
∂~v
=
.
dt ∂qi
∂qi
Wie man direkt nachrechnet gelten beide Relationen auch für eine zeitabhängige
Wahl der verallgemeinerten Koordinaten. Somit läßt sich die Langrangeform der
Bewegungsgleichungen analog zum letzten Semester herleiten.
53
54
KAPITEL 3. LAGRANGESCHE MECHANIK
Für das N -Teilchensystem haben wir 3N verallgemeinerte Koordinaten α =
1, 2, . . . , N , i = 1, 2, 3: xα,i = xα,i (q1 , q2 , . . . , q3N ; t). Wir organisieren die 3N
Variablen xα,i nun neu, in dem wir einen 3N -dimensionalen Vektor


x1,1
 x1,2 


 x1,3 


 x2,1 


~r = 

·


 · 


 · 
xN,3
einführen. Analog verfahren wir mit den anderen auftretenden Vektoren.1 Die
Schritte, die zur Lagrangeform der Bewegungsgleichung für ein Teilchen geführt
haben, können nun basierend auf der Vektorform der Newtonschen Gleichung (für
alle Komponenten aller Orte der Massenpunkte ~rα gleichzeitig) p~˙ = F~ vollzogen
werden. Im ersten Schritt bilden wir wieder das Skalarprodukt auf beiden Seiten der Newtonschen Gleichung mit dem 3N -dimensionalen Vektor ~gi = ∂~r/∂qi .
Alle weiteren Schritte lassen sich in vollständiger Analogie zum Einteilchenfall
ausführen. Beachtet man noch, daß sich die kinetische Energie
P des 2Gesamtsystems durch Addition der einzelnen Terme ergibt, also T = α mα~vα /2 gilt, so
folgt
∂T
d ∂T
=
+ Qi
dt ∂ q̇i
∂qi
mit
Qi =
N
X
∂~rα
F~α ·
.
∂qi
α=1
Dabei bezeichnet F~α die Summe der externen Kräfte und Paarkräfte, die auf das
Teilchen α wirken. Für konservative Kräfte mit
~ ~rα V (~r1 , . . . , ~rN )
F~α = −∇
folgt ebenfalls wie zuvor
d ∂L
∂L
=
dt ∂ q̇i
∂qi
mit der Lagrangefunktion L = T − V . Die Bewegungsgleichungen heißen Lagrangegleichungen (2. Art). Wie bereits erwähnt, nennt man ∂L/∂ q̇i den verallgemeinerten Impuls. Konsequenterweise heißt ∂L/∂qi die verallgemeinerte Kraft.
1
Bei den Vektoren ohne Teilchen- und Komponentenindex handelt es sich um diese 3N dimensionalen Vektoren.
3.1. SYSTEME MIT ZWANGSBEDINGUNGEN
55
Dabei müssen diese Größen nicht von der Dimension des gewöhnlichen Impulses
bzw. der gewöhnlichen Kraft sein. Falls für die qi die kartesischen Koordinaten
gewählt werden, werden diese Ableitungen zum gewöhnlichen Impuls bzw. der
gewöhnlichen Kraft.
Bereits im Kapitel 3.6 der Vorlesung des letzten Semesters haben wir einen
der großen Vorteile der Lagrangeschen Formulierung der Bewegungsgleichungen
kennen gelernt: Man kann der Symmetrie eines Problems angepaßte Variable (Koordinaten) wählen. Die Bewegungsgleichungen nehmen dann eine sehr natürliche
Form an. Die Gleichungen zu Variablen die in L nicht auftauchen liefern umgehend Erhaltungsgrößen (siehe Seite 170 des Skripts des letzten Semesters).
Häufig hat man es in der Mechanik mit Situationen zu tun, in denen die
Bewegung der Teilchen räumlichen Einschränkungen unterliegt. So kann es z.B.
vorkommen, daß sich ein Teilchen für eine gewisse Zeit auf der Oberfläche eines
starren Körpers bewegen muß, z.B. auf einem Tisch oder entlang eines Drahtes
(Perle mit Loch auf Draht). Idealisiert können diese Bewegungen dann als solche
auf einer stückweise glatten Fläche bzw. entlang einer stückweise glatten Kurve
beschrieben werden. Wir müssen also für unsere Bewegung eine Nebenbedingung in
Form einer mathematischen Gleichung formulieren. Im Rahmen der Newtonschen
Mechanik wird die Bewegung aufgrund von zusätzlichen Kräften eingeschränkt,
die man zu den Wechselwirkungskräften hinzu addieren muß. Solche Zwangskräfte
sind aber meist nicht als Funktion der Orte und Geschwindigkeiten der Teilchen
bekannt. Es ist somit schwierig, sie in den Newtonschen Formalismus einzubauen.
Der Vorteil des Lagrangeformalismus besteht in dieser Hinsicht darin, daß es
gelingt, für eine wichtige Klasse von Zwangskräften (Nebenbedingungen), die
Koordinaten so zu wählen, daß die uns nicht interessierden Zwangskräfte in der
Berechnung der Teilchenbahn überhaupt nicht auftreten. In den beiden Aufgaben
auf Übungsblatt 1 haben wir sie durch Anleitung bereits diesen Vorteil ausnutzen
lassen.
Ein weiterer Grund für die Diskussion der Lagrangeschen Formulierung der
klassischen Mechanik in der Theoretischen Physik ist, daß sie den Einstieg in sehr
allgemeine Prinzipien erlaubt. Wir werden weiter unten das Variationsprinzip
und eine allgemeine Formulierung von Erhaltungssätzen (Noethersches Theorem)
kennen lernen. Weiterhin geben wir den Einstieg in die Hamiltonsche Mechanik.
3.1
Systeme mit Zwangsbedingungen
Ein System von N Massepunkten unterliegt k holonomen Zwangs-(Neben-)bedingungen, wenn die Bahnkurven ~rα , mit α = 1, 2, . . . , N , die k Gleichungen
hi (~r1 , ~r2 , . . . , ~rN ; t) = 0 ,
i = 1, 2, . . . , k
erfüllen. Hängt mindestens eine der k Gleichungen explizit von der Zeit ab,
so spricht man von holonom-rheonomen Bedigungen. Hängt dagegen keine der
56
KAPITEL 3. LAGRANGESCHE MECHANIK
Gleichungen explizit von der Zeit ab, so heißen die Nebenbedingungen holonomskleronom. Wir nehmen an, daß die k Gleichungen funktional unabhängig sind.
Diesen Begriff wollen wir primär anhand eines Beispiels erklären. Es gelte h1 (~r) =
0 und h2 (~r) = 0, dann ist die Nebenbedingung h3 (~r) = c1 h1 (~r)+c2 h2 (~r) = 0 funktional abhängig und reduziert die Zahl der effektiven Freiheitsgrade nicht weiter.
Man kann zeigen, daß die Nebenbedingungen funktional unabhängig sind, wenn
~ 1 , . . . , ∇h
~ k in (fast) allen Punkten, die die Nebenbedingung
die Gradienten ∇h
erfüllen linear unabhängig sind.
Um den Begriff der holonomen Zwangsbedingung besser zu verstehen, diskutieren wir drei Beispiele. Im ersten bewege sich ein Teilchen auf einer zeitlich
unveränderlichen Fläche, die durch die Gleichung x3 = h̃(x1 , x2 ) definiert wird.
Äquivalent gilt also für alle möglichen Bahnkurven h(x1 , x2 , x3 ) = x3 − h̃(x1 , x2 ) =
0. Wir haben also N = 1 und k = 1, d.h. dem Massepunkt verbleiben zwei Freiheitsgrade der Bewegung. Das System ist holonom-skleronom. Im zweiten Beispiel bewege sich ein Teilchen entlang einer Kurve (z.B. Perle auf Draht), die sich
selbst (auf vorgegebene Weise) im Raum bewegt. Die Kurve kann als Schnittpunkt zweier Flächen mit h1 (x1 , x2 , x3 ; t) und h2 (x1 , x2 , x3 ; t) aufgefaßt werden.
Also gilt N = 1 und k = 2. Das holonom-rheonome System hat noch einen Freiheitsgrad der Bewegung. Im dritten Beispiel betrachten wir ein Doppelpendel mit
“masselosen” Stangen der Länge l1 und l2 . Dabei hängt eine Masse m1 an einer
Stange, die an der Decke befestigt ist (Aufhängepunkt ist Ursprung) und um die
~e3 -Achse frei drehbar ist (Bewegung in ~e1 -~e2 -Ebene). Die zweite Stange ist an der
ersten Masse so befestigt, daß die Bewegung ebenfalls in der ~e1 -~e2 -Ebene stattfindet und an ihrem Ende befindet sich die Masse m2 . Somit müssen während der
Bewegung die vier Nebenbedingungen |~r1 | = l1 , |~r2 − ~r1 | = l2 , ~r1 · ~e3 = 0 = ~r2 · ~e3
erfüllt sein. Es gilt somit N = 2 und k = 4, so daß das holonom-skleronome
System noch zwei Freiheitsgrade der Bewegung hat.
Holonome Zwangsbedingungen treten in der Mechanik sehr häufig auf. Nicht
in diese Klasse von Nebenbedingungen fallen z.B. solche, die sich durch Ungleichungen ausdrücken lassen. Als Beispiel dafür sei ein Skispringer erwähnt, der
immer oberhalb der durch die Form der Schanze und des Auslaufs vorgegebenen
Fläche bleiben muß. Ebenfalls nicht in die Klasse der holonomen Zwangsbedingungen fallen solche, die beim Abrollen von Rädern entstehen. In diesem Fall
treten Geschwindigkeiten, die man bestimmen möchte linear in Gleichungen für
Nebenbedingungen auf.
3.2
Lagrangegleichungen 2. Art
~ α einIm Rahmen der Newtonschen Mechanik muß man explizit Zwangskräfte Z
führen um Nebenbedingungen zu erzwingen. Wir wollen uns folgend klar machen,
wie man vorgehen könnte und wie sich das im Lagrangeformalismus auswirkt. Für
3.2. LAGRANGEGLEICHUNGEN 2. ART
57
ein N -Teilchensystem schreiben wir (α = 1, 2, . . . , N )
~ α = F~αtot ,
mα~r¨α = F~α + Z
wobei wir die Zwangskräfte von den anderen Kräften getrennt haben. Die Anfangsbedingungen der Bewegung müssen so gewählt werden, daß sie mit den Nebenbedingungen vereinbar sind, d.h. die 6N Anfangsbedingungen ~rα (0) und ~r˙α (0)
sind nicht mehr unabhängig voneinander wählbar. Wir wollen nun versuchen,
die Nebenbedingungen durch einen Grenzübergang bei einer adäquat gewählten
Zwangskraft zu erzwingen.
Wir betrachten exemplarisch die Situation eines Teilchens mit N = 1 und
~ . In unsenehmen an, daß die “äußere” Kraft F~ konservativ ist, F~ = −∇V
rem ersten Beispiel des letzten Kapitels war die Nebenbedingung durch h(~r) =
h(x1 , x2 , x3 ) = x3 − h̃(x1 , x2 ) = 0 gegeben. Wählen wir nun
Vtot (~r) = V (~r) + A [x3 − h̃(x1 , x2 )]2 = V (~r) + A h2 (~r)
mit A > 0, so nimmt die potentielle Energie bei großem A weg von der “Zwangsfläche”’ x3 = h̃(x1 , x2 ) sehr schnell zu. Bei fest vorgegebener Gesamtenergie ist
das Teilchen damit gezwungen, sich in der Nähe dieser Fläche aufzuhalten. Im
Limes A → ∞ ist die Bewegung an die Fläche “gebunden”. Für die Kraft, die
sich aus dem Zusatzterm zum Potential ergibt gilt
~ A = −2A h(~r) ∇h(~
~ r) .
Z
Nähert man sich der Fläche an, so steht die Kraft senkrecht auf dieser, da sie
proportional zum Gardienten von h(~r) ist. Oberhalb und unterhalb der Fläche
“drückt” die Kraft das Teilchen auf die Fläche mit h(~r) = 0. Es ist nun vorteilhaft
verallgemeinerte (krummlinige) Koordinaten q1 und q2 so einzuführen, daß sie
die Lage des Massepunktes auf der Fläche charakterisieren und |q3 | ein Maß für
den Abstand von der Fläche ist. Auf der Fläche gilt q3 = 0. Damit sind die
“krummlinigen” Basisvektoren
~g1 =
∂~r
∂~r
, ~g2 =
∂q1
∂q2
tangential an der durch h(~r) = 0 bestimmten Fläche. Für den aus der Zwangskraft
stammenden Teil der in den Lagrangegleichungen auftretenden Terme Qi , i = 1, 2,
gilt
~ A · ~gi = 0
Z
~ A senkrecht auf der Fläche steht. Die Details der Konstruktion der Zwangsda Z
kraft sind dabei irrelevant, wesentlich ist nur diese Orthogonalität. Es gilt (i =
1, 2)
∂V
Qi = ~gi · F~ = −
∂qi
58
KAPITEL 3. LAGRANGESCHE MECHANIK
und damit auch
∂L∗
d ∂L∗
=
dt ∂ q̇i
∂qi
mit
L∗ = [T − V ]q3 =0=q̇3 .
Die Zwangskraft ist mithin aus der Bewegungsgleichungen für die “relevanten”
Variablen herausgefallen. In der Lagrangefunktion L∗ treten die irrelevante Koordinate q3 und ihre Ableitung q̇3 nicht mehr auf
m
L∗ = ~v 2 (q1 , q2 , 0; q̇1 , q̇2 , 0) − V (q1 , q2 , 0) .
2
Für das Teilchen auf dem Draht können wir analog vorgehen. Als verallgemeinerte Koordinate q1 wählen wir die vorzeichenbehaftete Bogenlänge ausgehend
von einem willkürlichen Anfangspunkt. Die Koordinaten q2 und q3 werden senkrecht zur instantanen Drahtachse gewählt und auf dem Draht gelte q2 = q3 = 0.
Zum äußeren Potential addieren wir den Zusatzterm A(q22 + q32 ), mit A > 0. Die
Zwangskraft ist dann wieder senkrecht zur instantanen Lage des Drahtes und es
gilt
∂L∗
d ∂L∗
=
dt ∂ q̇1
∂q1
mit
m 2
~v (q1 , 0, 0; q̇1 , 0, 0; t) − V (q1 , 0, 0; t) .
2
Aufgrund der Bewegung des Drahtes hängen ~v und V in diesem Beispiel explizit
von der Zeit ab. Die Zwangskraft selbst tritt in der Lagrangegleichung für die
relevante Variable nicht auf.
Anhand des Beispiels des oben diskutierten Doppelpendels wollen wir zeigen,
wie sich diese Überlegungen auf Mehrteilchensysteme verallgemeinern lassen. Zur
Verdeutlichung ist das Doppelpendel in der folgende Skizze dargestellt.
L∗ =
0
r2
r1
φ1
φ2
3.2. LAGRANGEGLEICHUNGEN 2. ART
59
Als verallgemeinerte Koordinaten wählen wir (Stangenlängen li )
q1 = φ1 , q2 = φ2 , q3 = |~r1 | − l1 , q4 = |~r2 − ~r1 | − l2 , q5 = x1,3 , q6 = x2,3 ,
wobei schon klar sein sollte, daß q1 und q2 die “relevanten” Koordinaten sind.
Die Ortsvektoren der beiden Massepunkte können ausgedrückt durch die verallgemeinerten Koordinaten qi wie folgt geschrieben werden
~r1 = (l1 + q3 )(~e1 cos φ1 + ~e2 sin φ1 ) + q5~e3 ,
~r2 = ~r1 + (l2 + q4 )(~e1 cos φ2 + ~e2 sin φ2 ) + q6~e3 .
Zur Berechnung der Qi benötigen wir die Vektoren ∂~rα /∂qi . Der Vektor ∂~r1 /∂φ1
ist als dünngedruckter Vektorpfeil in der obigen Skizze eingetragen. Er ist identisch zum Vektor ∂~r2 /∂φ1 . Auch der Vektor ∂~r2 /∂φ2 ist als dünner Pfeil eingezeichnet. Die Zwangskräfte wirken in Richtung der “masselosen” Stangen, d.h. es
gilt
~ 1 = a~r1 + b(~r1 − ~r2 ) ,
Z
~ 2 = c(~r1 − ~r2 ) .
Z
Für i = 1 folgt wegen ~r1 · ∂~r1 /∂φ1 = 0
Q1 = −
∂~r1
∂V
+ (b + c)
· (~r1 − ~r2 )
∂q1
∂φ1
und für i = 2 wegen ∂~r1 /∂φ2 = 0 sowie (~r1 − ~r2 ) · ∂~r2 /∂φ2 = 0
Q2 = −
∂V
.
∂q2
Versucht man die Zwangskraft, die |~r2 − ~r1 | = l2 garantiert durch ein Zweiteilchenpotential, z.B. A[(~r2 − ~r1 )2 − l22 ]2 , mit A → ∞ zu implementieren, so gilt
“action=reactio” und damit c = −b. Nehmen wir an, daß “action=reactio” für
die Zwangskraft gilt (ohne den Versuch ein zugrungeliegendes Potential zu konstruieren), so folgt ebenfalls c = −b und der Zusatzterm im Ausdruck für Q1
verschwindet. Damit erhalten wir für i = 1, 2
d ∂L∗
∂L∗
=
dt ∂ q̇i
∂qi
mit
L∗ = [T − V ]q∗ =0=q̇∗ ,
q ∗ = {q3 , q4 , q5 , q6 } .
Für q ∗ = 0 gilt
x1,1 = l1 cos φ1 , x1,2 = l1 sin φ1 ,
x2,1 = l1 cos φ1 + l2 cos φ2 , x2,2 = l1 sin φ1 + l2 sin φ2 .
60
KAPITEL 3. LAGRANGESCHE MECHANIK
Daraus können wir die kinetische Energie für q ∗ = 0 berechnen
T∗ =
m1 + m2 2 2 m2 2 2
l1 φ̇1 +
l φ̇ + m2 l1 l2 φ̇1 φ̇2 cos (φ1 − φ2 ) .
2
2 2 2
Sollten die expliziten Kräfte F~α durch das Schwerefeld der Erde gegeben sein, so
gilt weiterhin
V∗ = −(m1 + m2 )gl1 cos φ1 − m2 gl2 cos φ2 .
Ausgehend von diesen Beispielen versuchen wir nun eine allgemeine Formulierung der Beobachtung, daß nur die relevanten Koordinaten in den Lagrangegleichungen auftauchen und die Zwangskräfte im Lagrangeformalismus nicht explizit behandelt werden müssen. Dazu führen wir wie oben die 3N -dimensionalen
Vektoren (ohne Teilchen- und Komponentenindex) ein, die sich durch “Untereinanderschreiben” der Komponenten für die einzelnen Teilchen ergibt. Damit gilt
(i = 1, 2, . . . , 3N )
d ∂T
∂T
=
+ Qi
dt ∂ q̇i
∂qi
mit
~ · ~gi = (F~ + Z)
~ · ∂~r .
Qi = (F~ + Z)
∂qi
Im Fall k funktional unabhängiger holonomer Nebenbedingungen kann sich die
“Bahnkurve” ~r nicht an jedem beliebigen Punkt des R3N befinden, sondern ist auf
eine (3N − k)-dimensionale Hyperfläche beschränkt. Im Fall holonom-rheonomer
Nebenbedingungen ist diese Hyperfläche zeitabhängig. Analog zu den obigen Beispielen wird es immer möglich sein, eine idealisierte Zwangskraft zu konstruieren,
die ~r auf die Hyperfläche zwingt. Diese Zwangskraft ist orthogonal zur instantanen Hyperfläche. Wählt man die ersten 3N − k verallgemeinerten Koordinaten
q1 , q2 , . . . , q3N −k in der instantanen Hyperfläche und q ∗ = {q3N −k+1 , . . . , q3N } so,
daß q ∗ = 0 auf der Hyperfläche, so sind die ~gi für i = 1, . . . , 3N − k Tangentialvektoren an die Hyperfläche und stehen senkrecht auf der Zwangskraft
~ =0,
~gi · Z
i = 1, 2, . . . , 3N − k .
Damit gilt für expilzite Kräfte, die konservativ sind
∂V
,
Qi = F~ · ~gi = −
∂qi
i = 1, 2, . . . , 3N − k .
Für die Lagrangeschen Bewegungsgleichungen ergibt sich dann
d ∂L∗
∂L∗
=
,
dt ∂ q̇i
∂qi
L∗ = [T − V ]q∗ =0=q̇∗ ,
i = 1, 2, . . . , 3N − k .
3.2. LAGRANGEGLEICHUNGEN 2. ART
61
Dieses sind die Lagrangegleichungen 2. Art für holonome Systeme. Im folgenden
werden wir den Index ∗ weglassen, wenn klar ist, was gemeint ist. Wir haben
somit einen eleganten Formalismus entwickelt, der es erlaubt die Bewegungsgleichungen für Systeme mit holonomen Zwangsbedingungen aufzustellen, ohne sich
Gedanken über die Zwangskräfte machen zu müssen.
Historisch hat man im Zusammenhang mit Zwangskräften sogenannte virtuelle Verrückungen betrachtet. Man hat Vektoren δ~rα = ζ~α mit infinitesimalem konstruiert, wobei die ζ~α so gewählt sind, daß
~ =
ζ~ · Z
N
X
~ α · δ~rα = 0
Z
α=1
gilt. Damit leisten Zwangskräfte bei virtuellen Verrückungen keine Arbeit. Diese
Aussage bezeichnet man als das d’Alembertsche Prinzip. Mit der Einsicht, daß ζ~
eine beliebige Linearkombination der ~gi ist, die Tangentialvektoren an die Hyperfläche sind (i = 1, 2, . . . , 3N − k), ist das d’Alembertsche Prinzip äquivalent zu
unserer Annahme, daß die Zwangskräfte senkrecht auf der Hyperfläche stehen.
Nachdem man die Lagrangeschen Bewegungsgleichungen gelöst hat, ist es
möglich die Zwangskraft explizit zu berechnen (sollte sie von Interesse sein).
Man kann dazu zur ursprünglichen Newtonschen Formulierung in kartesischen
Koordinaten zurückkehren. In dieser gilt
~ α = mα~r¨α − F~α .
Z
Bei bekannter Bahnkurve läßt sich die rechte Seite berechnen und die Zwangskräfte sind bestimmt. Alternativ kann man für konservative Systeme die “restlichen” Lagrangegleichungen
d ∂L ∂L
~
, i = 3N − k + 1, 3N − k + 2, . . . , 3N
−
~gi · Z =
dt ∂ q̇i ∂qi q∗ =0=q̇∗
verwenden. Um das Vorgehen zu illustrieren, betrachten wir das Problem eines
Teilchens auf einem Ring unter Einfluß des Schwerefeldes. Dabei wählen wir das
Koordinatensystem so, daß das Schwerefeld in Richtung ~e1 zeigt und der Ursprung
im Mittelpunkt des Kreises liegt. Der Kreis liege in der ~e1 -~e2 -Ebene. Wir gehen
zu Polarkoordinaten über, wobei die relevante Variable φ (Winkel zwischen ~e1
und ~r) ist, während r(t) durch eine Zwangskraft auf r(t) = R, mit dem Radius
R des Kreises, festgelegt ist. Der ersten Strategie folgend schreiben wir
~ˆ sin φ) ,
~ = m~r¨ − F~ , F~ = mg~e1 = mg(~rˆ cos φ − φ
Z
wobei wir für die Einheitsvektoren in r- und φ-Richtung die Notation von S.
139 des Skripts der Vorlesung des letzten Semesters verwendet haben. Für die
62
KAPITEL 3. LAGRANGESCHE MECHANIK
Beschleunigung gilt
~r = R(~e1 cos φ + ~e2 sin φ) = R~rˆ ,
~ˆ ,
~r˙ = Rφ̇(−~e1 sin φ + ~e2 cos φ) = Rφ̇φ
~ˆ − Rφ̇2~rˆ .
~r¨ = Rφ̈φ
Damit können wir die Zwangskraft berechnen
h
i
~ˆ − Rφ̇2 + g cos φ ~rˆ
~ = m Rφ̈ + g sin φ φ
Z
= −m Rφ̇2 + g cos φ ~rˆ ,
da der erste Summand nach der Bewegungsgleichung (siehe letzte Gleichung auf
S. 141 des Skripts des letzten Semesters) Null ergibt. Setzt man nun nach der
Lösung der Bewegungsgleichung φ(t) ein, so ist die Zwangskraft bestimmt. Der
zweiten Strategie folgend bestimmen wir die vollständige Lagrangefunktion in den
verallgemeinerten Koordinaten r und φ
m 2
2 2
ṙ + r φ̇ + mgr cos φ .
L=
2
Setzt man nun r = R und ṙ = 0,2 so ergibt sich
L∗ =
m 2 2
R φ̇ + mgR cos φ .
2
Zur Berechnung der Zwangskraft benötigen wir
∂L
= mṙ ,
∂ ṙ
∂L
= mrφ̇2 + mg cos φ .
∂r
Eingesetzt liefert das (~gr = ~rˆ)
d ∂L ∂L
~
~gr · Z =
−
= −mRφ̇2 − mg cos φ
dt ∂ ṙ
∂r r=R,ṙ=0
also
~ = −m Rφ̇2 + g cos φ ~rˆ
Z
und damit das gleiche Ergebnis wie im ersten Zugang.
Wir werden folgend eine alternative Art Zwangskräfte zu behandeln kennen
lernen. Dieser Zugang führt auf die Lagrangegleichungen 1. Art.
2
Dem oben entwickelten allgemeinen Formalismus folgend hätten wir besser q1 = φ und
q2 = R − r gewählt. In diesem Fall müßten wir, um aus L∗ aus L zu erhalten, q2 = 0 setzen.
3.3. LAGRANGEGLEICHUNGEN 1. ART
3.3
63
Lagrangegleichungen 1. Art
Wir gehen davon aus, daß wir einen Satz {q1 , q2 , . . . , q3N } von beliebigen verallgemeinerten Koordianten haben, der noch nicht entsprechend der k holonomen
Nebenbedingungen hi (~r; t) = 0 gewählt sein muß. Wir nehmen weiterhin an, daß
die expliziten Kräfte und die Zwangskräfte aus einem Potential ableitbar sind.
Dann gilt
d ∂L ∂L
~,
−
= ~gi · Z
dt ∂ q̇i ∂qi
i = 1, 2, . . . , 3N .
(3.3)
Die ~gi = ∂~r/∂qi sind wieder die Basisvektoren im betrachteten Punkt P . Dieser
liege auf der instantanen Hyperfläche. Wir betrachten einen beliebigen Tangentialvektor ζ~ an die Hyperfläche und schreiben ihn als Linearkombination der ~gi
ζ~ =
3N
X
ci~gi =
i=1
3N
X
δqi~gi .
i=1
Aufgrund der k Nebenbedingungen können nur 3N −k der ci frei gewählt werden.
Multiplizieren wir Gl. (3.3) mit δqi und summieren über alle i, so folgt mit Hilfe
~ · ζ~ = 0, daß
des d’Alembertschen Prinzips Z
3N
X
i=1
δqi
d ∂L ∂L
−
=0.
dt ∂ q̇i ∂qi
(3.4)
Da die Bewegung auf der aus den (simultanen) Bedingungen hj (~r; t) = 0, j =
~ ~r hj senkrecht
1, 2, . . . , k, resultierenden Hyperfläche verläuft und der Gradient ∇
auf Flächen hj = const. steht, gilt
~ ~r hj · ζ~ = 0
∇
auf der instantanen Hyperfläche. Das impliziert
~ ~r hj ·
0=∇
3N
X
i=1
3N
X ∂hj
∂~r
=
,
δqi
δqi
∂qi
∂qi
i=1
j = 1, 2, . . . , k .
Addiert man dieses Ergebnis nach Multiplikation mit zunächst beliebigen zeitabhängigen Funktionen λj , die man Lagrangesche Multiplikatoren nennt, und Summation über j zu Gl. (3.4), so folgt
"
#
3N
k
X
X
d ∂L ∂L
∂hj
δqi
−
−
λj
=0.
dt ∂ q̇i ∂qi j=1 ∂qi
i=1
Wir können nun die δqi mit i = 1, 2, . . . , 3N − k frei wählen. Die k verbleibenden
δqi liegen dann fest. In den Summanden mit i = 3N −k+1, . . . , 3N wählen wir die
64
KAPITEL 3. LAGRANGESCHE MECHANIK
λj , j = 1, 2, . . . , k so, daß die Ausdrücke in den eckigen Klammern verschwinden.
Die übrigen 3N − k eckigen Klammern müssen ebenfalls verschwinden, da die
zugehörigen δqi unabhängig sind. Damit folgt
k
d ∂L ∂L X ∂hj
−
=
λj
,
dt ∂ q̇i ∂qi
∂q
i
j=1
i = 1, 2, . . . , 3N .
Zusammen mit den Relationen
hj (~r; t) = 0 ,
j = 1, 2, . . . , k
sind das (3N + k) Gleichungen für (3N + k) Unbekannte q1 , . . . , q3N ; λ1 , . . . , λk
(alles Funktionen der Zeit). Man nennt diese Gleichungen die Lagrangegleichungen 1. Art. Im Gegensatz zum Zugang, der auf die Lagrangegleichungen 2. Art
führt, werden die 3N verallgemeinerten Koordinaten als unabhängige Variablen
behandelt. Im Gegenzug ist es notwendig, die k Lagrangeschen Multiplikatoren
λj einzuführen. Der Vergleich mit Gl. (3.3) zeigt, daß für festes i auf der rech~
ten Seite der (ersten) 3N Gleichungen 1. Art die Projektion der Zwangskraft Z
(3N -dimensionaler Vektor) auf die Richtung ~gi (3N -dimensionaler Vektor) steht
k
X
j=1
λj
∂hj
~,
= ~gi · Z
∂qi
i = 1, 2, . . . , 3N .
Ein Vorteil der Lagrangegleichungen 1. Art besteht darin, daß es gelingt, sie
für eine gewisse Klasse nicht-holonomer Zwangsbedingungen zu erweitern. Probleme, die so behandelbar sind, treten aber eher im Bereich der “Technischen
Mechanik” auf, so daß wir sie hier nicht weiter behandeln wollen. Wir haben uns
an dieser Stelle den “Ausflug” zu den Lagrangegleichungen 1. Art “geleistet”,
da in ihm erstmals die Lagrangeschen Multiplikatoren auftauchen, die ihnen in
späteren Vorlesungen der Theoretischen Physik (insbesondere Theoretische Physik IV–Thermodynamik und statistische Mechanik) wiederbegegnen werden. In
Anwendungen werden wir hier nur die Lagrangegleichungen 2. Art verwenden.
Zum Abschluß dieses Kapitels wollen wir kurz untersuchen, wie sich Zwangsbedingungen auf den Energiesatz auswirken, wobei wir uns auf den Fall konservativer (expliziter) Kräfte mit
~ ~rα V (~r1 , . . . , ~rN )
F~α = −∇
beschränken wollen. Skalare Multiplikation der Newtonschen Gleichung
~ ~rα V = Z
~α
mα~r¨α + ∇
mit ~r˙α liefert
d mα ˙ 2 ˙ ~
~α .
~r + ~rα · ∇~rα V = ~r˙α · Z
dt 2 α
3.3. LAGRANGEGLEICHUNGEN 1. ART
65
Nach Summation über den Teilchenindex α folgt daraus (Vektoren ohne Index
sind 3N -dimensional)
N
X
d
~ α = ~r˙ · Z
~.
(T + V ) =
~r˙α · Z
dt
α=1
(3.5)
Für k holonome Zwangsbedingungen mit hi (~r; t) = 0, für i = 1, 2, . . . , k, liefern
~ ~r hi auf den Punkten der durch die Zwangsbedie 3N -dimensionalen Gradienten ∇
dingung gegebenen instantanen Hyperfläche einen Satz von k linear unabhängi~ auf der Hyperfläche senkrecht steht, muß es k zeitabhängige
gen Vektoren. Da Z
Koeffizienten λ̃j (t) geben, so daß
~ r; t) =
Z(~
k
X
~ ~r hj (~r; t) .
λ̃j (t)∇
(3.6)
j=1
Skalare Multiplikation mit ~gi = ∂~r/∂qi liefert
~ r; t) =
~gi · Z(~
k
k
X
X
∂hj (~r; t)
~ ~r hj (~r; t) · ∂~r =
λ̃j (t)
λ̃j (t)∇
.
∂qi
∂qi
j=1
j=1
Setzt man dieses Ergebnis auf der rechten Seite der Gl. (3.3) ein, so folgen wieder
die Lagrangegleichungen 1. Art (was eine alternative Herleitung dieser liefert).
Man sieht also, daß die λ̃j die Lagrangeschen Multiplikatoren sind. Wir lassen
somit die Schlange weg. Setzen wir nun das Ergebnis Gl. (3.6) in Gl. (3.5) ein, so
folgt für holonome Zwangsbedingungen
" k
#
X
dE
~ ~r hj (~r; t)
= ~r˙ ·
λj (t)∇
dt
j=1
" k
#
N
X
X
~ ~rα hj (~r; t)
=
~r˙α ·
λj (t)∇
α=1
= −
k
X
j=1
j=1
λj (t)
∂hj (~r; t)
.
∂t
Im letzten Schritt haben wir dabei verwendet, daß dhj /dt = 0 innerhalb der
Hyperfläche gilt. Hängen die hj also nicht explizit von der Zeit ab, verschwindet
die rechte Seite. Für holonom-skleronome Systeme gilt somit Energieerhaltung,
wenn die explizite Kraft konservativ ist.
66
3.4
KAPITEL 3. LAGRANGESCHE MECHANIK
Nochmal die Lagrangegleichungen 2. Art
Das Hauptwerkzeug innerhalb der Lagrangeschen Mechanik bei der Behandlung
praktischer Probleme sind die Lagrangegleichungen 2. Art
d ∂L
∂L
=
,
dt ∂ q̇i
∂qi
L = [T − V ]q∗ =0=q̇∗ ,
i = 1, 2, . . . , 3N − k .
In der Herleitung dieser Gleichungen mit holonomen Zwangsbedigungen sind wir
davon ausgegegangen, daß die qi für i = 1, 2, . . . , 3N − k verallgemeinerte Koordinaten in der durch die Zwangsbedingungen gegebenen Hyperfläche (innerhalb
derer die Bewegung stattfindet) sind. In dieser können die Koordinaten jedoch
frei gewählt werden. Wir wollen zeigen, daß eine beliebige, lokal fast überall umkehrbare Koordinatentransformation (innerhalb der Hyperfläche)
q̄i = q̄i (q1 , q2 , . . . , qm ; t) = q̄i (q; t) ,
qi = qi (q̄1 , q̄2 , . . . , q̄m ; t) = qi (q̄; t) ,
mit m = 3N − k, die Lagrangegleichungen invariant läßt. Differenziert man die
qi (q̄; t) nach der Zeit, so folgt
q̇i =
X ∂qi
∂qi
.
q̄˙k +
∂ q̄k
∂t
k
Man kann L als Funktion der q̄ und q̄˙ auffassen
˙ t); t) = L̄(q̄, q̄;
˙ t) .
L(q, q̇; t) = L(q(q̄; t), q̇(q̄, q̄;
Aus Gl. (3.7) folgt
∂ q̇j
∂qj
=
.
∂ q̄i
∂ q̄˙i
Um die Forminvarianz der Lagrangegleichungen zu zeigen, betrachten wir
X ∂L ∂qk
∂ L̄
∂L ∂ q̇k
=
+
,
∂ q̄i
∂qk ∂ q̄i
∂ q̇k ∂ q̄i
k
X ∂L ∂ q̇k X ∂L ∂qk
∂ L̄
=
=
.
∂
q̇
∂
q̇
∂ q̄˙i
k ∂ q̄˙i
k ∂ q̄i
k
k
Damit ergibt sich
d ∂ L̄ ∂ L̄ X
−
=
dt ∂ q̄˙i ∂ q̄i
k
d ∂L
∂L ∂qk
∂L ∂ q̇k
d ∂qk
−
−
−
.
dt ∂ q̇k ∂qk ∂ q̄i
∂ q̇k ∂ q̄i
dt ∂ q̄i
(3.7)
3.4. NOCHMAL DIE LAGRANGEGLEICHUNGEN 2. ART
67
Der erste Term in eckigen Klammern veschwindet, da die qi (t) die Lagrangegleichungen erfüllen. Im zweiten Term in eckigen Klammern müssen wir noch wie
bei der Herleitung der Lagrangegleichungen die Reihenfolge der Ableitung nach t
und der partiellen Ableitung nach q̄i vertauschen. Danach ist klar, daß auch dieser Term verschwindet und wir haben die Forminvarianz der Lagrangegleichungen
gezeigt. Es gilt also für i = 1, 2, . . . , m
∂ L̄
d ∂ L̄
=
.
˙
dt ∂ q̄i
∂ q̄i
Wir geben zum Abschluß des Kapitels über die Lagrangesche Formulierung
der Mechanik ein Kochrezept zur Verwendung dieses Formalismus an und diskutieren ein (weiteres) Beispiel. Gegeben sei ein System aus N Massepunkten
der Masse m1 , m2 , . . . , mN , das sich aufgrund holonomer Zwangsbedingungen auf
einer m ≤ 3N -dimensionalen (im rheonomen Fall zeitabhängigen) Hyperfläche F
des 3N -dimensionalen Raums bewegt. Dann geht man wie folgt vor:
1. Man wählt ein System q = (q1 , q2 , . . . , qm ) von verallgemeinerten Koordinaten so, daß der aus den ~rα (t) gebildete 3N -dimensionale Ortsvektor
~r(t) = ~r(q; t) in der Hyperfläche ist.
2. Man berechnet aus
~vα = ~r˙α =
m
X
∂~rα
i=1
∂qi
q̇i +
∂~rα
∂t
die ~vα2 .
3. Die Lagrangefunktion L erhält man dann aus
L=
N
X
mα
α=1
2
~vα2 − V (q) .
4. Man stellt die Lagrangegleichungen (i = 1, 2, . . . , m)
d ∂L
∂L
=
dt ∂ q̇i
∂qi
auf.
5. Man löst diesen Satz von gekoppelten Differentialgleichungen. Nur in den
wenigsten Fällen wird dieses analytisch gelingen.
An einem Beispiel wollen wir dieses Vorgehen veranschaulichen. Ein Massepunkt kann sich reibungsfrei auf einem geraden Draht bewegen, der unter festem
68
KAPITEL 3. LAGRANGESCHE MECHANIK
Neigungswinkel θ < π/2 relativ zur ~e3 -Achse mit vorgegebener Winkelgeschwindigkeit ω(t) = φ̇(t) um die ~e3 -Achse rotiert. Letztere ist dadurch festgelegt, daß
die Gravitationsbeschleunigung (Schwerefeld der Erde) in −~e3 -Richtung wirke. φ
ist der Winkel zwischen der Projektion der Position des Teilchens für x3 > 0 auf
die ~e1 -~e2 -Ebene und der ~e1 -Richtung.3
1. Die Hyperfläche ist eindimensional und zeitabhängig. Die freie Variable ist
der Abstand r̃ des Teilchens vom Ursprung. Dabei gelte r̃ > 0 für x3 > 0
und r̃ < 0 für x3 < 0. Der Ortsvektor des Teilchens läßt sich damit als
~r(t) = r̃(t) [sin θ(cos φ(t)~e1 + sin φ(t)~e2 ) + cos θ~e3 ] = r̃(t)~er (t)
schreiben, wobei θ zeitunabhängig ist und φ(t) die vorgegebene Zeitabhängigkeit hat.
2. Differentiation von ~r(t) liefert
˙ er (t) + r̃(t)ω(t) sin θ [− sin φ(t)~e1 + cos φ(t)~e2 ]
~r˙ (t) = r̃(t)~
˙ er (t) + r̃(t)ω(t) sin θ~eφ (t) .
= r̃(t)~
Da die Vektoren ~er (t) und ~eφ (t) für alle Zeiten orthogonal sind, folgt für
das Geschwindigkeitsquadrat
~v 2 = r̃˙ 2 + r̃2 ω 2 sin2 θ .
3. Mit dem Potential V = mgr̃ cos θ folgt für die Lagrangefunktion
L=
m ˙2
r̃ + r̃2 ω 2 sin2 θ − mgr̃ cos θ .
2
4. Um die Lagrangegleichungen zu bestimmen, benötigt man die partiellen
Ableitungen
∂L
= mr̃˙ ,
∂ r̃˙
∂L
= mr̃ω 2 sin2 θ − mg cos θ .
∂r̃
Dies liefert die Bewegungsgleichung
r̃¨ = r̃ω 2 sin2 θ − g cos θ .
5. Für ω(t) = ω0 = const. läßt sich die Differentialgleichung mit den von uns
im letzten Semester behandelten Methoden lösen. Wir wollen das hier aus
Zeitgründen nicht weiter verfolgen.
3
Die Winkel sind damit wie bei Polarkoordinaten gewählt.
3.5. DAS PRINZIP DER KLEINSTEN WIRKUNG
3.5
69
Das Prinzip der kleinsten Wirkung
In diesem Kapitel wollen wir eine alternative Herleitung der Lagrangegleichungen präsentieren. Es mag zunächst überflüssig erscheinen, auf einem weiteren
Weg die uns schon bekannten Bewegungsgleichungen herzuleiten. Er verwendet
aber mit dem Variationsprinzip eine Methode, die in vielen Bereichen der Physik
und Mathematik eine wichtige Rolle spielt. Es hat sich herausgestellt, daß sich
fast alle Bereiche der Physik – klassische Mechanik, Quantenmechanik, Optik,
Elektromagnetismus usw. – in Form von Variationsprinzipien formulieren lassen
(auch wenn das nicht die historische Sichtweise auf diese Gebiete darstellt). Wir
werden daher damit beginnen, die Variationsrechnung anhand eines Beispiels aus
der Mathematik einzuführen.
Der kürzeste Weg zwischen zwei Punkten: Als einfaches Beispiel betrachten
wir die Frage, welche Form der kürzeste Weg zwischen zwei Punkten ist. Dabei
kennen wir die Antwort bereits: Eine Gerade. Mit Hilfe der Variationsrechung
können wir diese allgemein bekannte Tatsache beweisen. Mathematisch läßt sich
das Problem wie folgt formulieren. Wir haben zwei Punkte (die in einer Ebene
liegen) (x1 , y1 ) und (x2 , y2 ) gegeben. Sie sind durch einen Pfad y(x) verbunden.
Die Aufgabe ist es, den kürzesten Pfad y(x) zu finden.
p Die Länge einer infinitesimalen Strecke auf dem Pfad ∆s kann als ∆s = (∆x)2 + (∆y)2 geschrieben
werden. Mit
dy
∆x = y 0 (x) ∆x
∆y =
dx
folgt
p
∆s = 1 + [y 0 (x)]2 ∆x .
Damit ergibt sich für die Länge L des Pfads y(x) zwischen den beiden Punkten
Z x2 p
L=
1 + [y 0 (x)]2 dx .
x1
Wir müssen somit die (oder eine) Funktion y(x) finden, für die L unter Vorgabe
des Anfangs- und Endpunkts minimal wird. Man bezeichnet L als ein Funktional,
da diese Größe von der Funktion y(x) abhängt. Ein sehr ähnliches Problem ergibt
sich im physikalischen Kontext in der Optik. Das Fermatsche Prinzip sagt, daß
für gegebenen im Allgemeinen ortsabhängigen Brechungsindex n(~r) das Licht den
Pfad zwischen zwei Punkten nimmt, für den die benötigte Zeit minimal wird. Die
lokale Geschwindigkeit des Lichts in einem Medium mit Brechungsindex n(~r) ist
dabei durch v = c/n(~r), mit der Vakuumlichtgeschwindigkeit c, gegeben. Für die
vom Licht entlang y(x) benötigte Zeit T ergibt sich so (Anfangs- und Endpunkt
liegen in einer Ebene)
Z
p
1 x2
n(x, y) 1 + [y 0 (x)]2 dx .
T =
c x1
70
KAPITEL 3. LAGRANGESCHE MECHANIK
Wir müssen somit die (eine) Funktion y(x) bestimmen, die das Integral minimiert.
In der Differentialrechnung einer Veränderlichen bestimmt man das Extremum einer Funktion, indem man diese differenziert und anschließend Null setzt.
Dabei kann das Extremum x0 ein Sattelpunkt, ein lokales Maximum oder ein
lokales Minimum sein. Man nennt diese Punkte auch stationäre Punkte, da eine infinitesimale Abweichung von x0 den Wert der Funktion nicht ändert (da die
Steigung Null ist). In Analogie wollen wir jetzt einen Pfad finden, der das Integral
stationär macht, d.h. daß eine kleine Abweichung vom stationären Pfad den Wert
des Integrals nicht ändert. Wie in der Differentialrechnung einer Veränderlichen
kann man dann jedoch noch nicht sicher sein, ob das von uns gesuchte Minimum
vorliegt. Dieses muß man getrennt untersuchen. Man nennt die Methode zur Bestimmung des stationären Pfads die Variationsrechnung.
Variation und die Euler-Lagrange-Gleichung: Wir wollen das Variationsproblem nun allgemein formulieren und betrachten ein Integral der Form
Z x2
S=
f [y(x), y 0 (x), x] dx ,
x1
wobei y(x) eine noch unbekannte Funktion ist, die die Punkte (x1 , y(x1 ) = y1 )
und (x2 , y(x2 ) = y2 ) verbindet. Unter allen Funktionen, die diese Bedingungen
erfüllen, müssen wir diejenige(n) finden, die das Integral minimiert(en). Wenn
wir die (oder eine) gesuchte Lösung mit y(x) bezeichnen, dann liefert die Kurve
Y (x) = y(x) + η(x)
mit η(x1 ) = η(x2 ) = 0 einen größeren Wert für das Integral S.4 Wir führen nun
den Parameter α ein und betrachten den Pfad
Y (x) = y(x) + αη(x) .
Damit hängt das Integral von α ab und wir bezeichnen es mit S(α). Die richtige
Kurve folgt für α = 0 und S(α) wird für α = 0 minimal. Wir können somit den
gewöhnlichen Formalismus zum Finden eines Minimums für eine Funktion einer
Veränderlichen verwenden. Es muß also dS/dα = 0 gelten. Wir betrachten somit
Z x2
d
dS
=
f [y + αη, y 0 + αη 0 , x] dx
dα
dα
x
Z 1x2 ∂f
0 ∂f
=
η
+ η 0 dx .
∂y
∂y
x1
Durch partielle Integration im zweiten Term und unter Verwendung von η(x1 ) =
η(x2 ) = 0 folgt
Z x2
dS
∂f
d ∂f
=
η(x)
−
dx .
dα
∂y dx ∂y 0
x1
4
Dabei vernachlässigen wir Fälle, in denen das Integral den gleichen Wert liefert.
3.5. DAS PRINZIP DER KLEINSTEN WIRKUNG
71
Da nun am Minimum
dS
=0
dα
für beliebige η(x) gelten muß, können wir schließen, daß
∂f
d ∂f
=
∂y
dx ∂y 0
für alle x ∈ [x1 , x2 ] gelten muß. Man nennt diese Gleichung die Euler-LagrangeGleichung. Identifizieren wir f ↔ L, x ↔ t und y ↔ q, so ist diese identisch zur
Lagrangeschen Bewegungsgleichung im Fall von einer unabhägigen verallgemeinerten Variablen. Wir werden diesen Zusammenhang sehr bald besser verstehen.
Als Anwendung wollen wir uns noch einmal unserem obigen Beispiel des
kürzesten Abstandes zwischen
zwei Punkten widmen. Wie diskutiert gilt in diep
0
0
2
sem Fall f (y, y , x) = 1 + [y ] . Die Euler-Lagrange-Gleichung hat somit wegen
∂f
=0,
∂y
∂f
y0
p
=
∂y 0
1 + [y 0 ]2
die Form
d ∂f
y0
p
=
0
⇒
=C,
dx ∂y 0
1 + [y 0 ]2
mit der Konstanten C. Umgeformt folgt
[y 0 (x)]2 = const. ⇒ y 0 (x) = const. ⇒ y(x) = ax + b ,
mit den Konstanten a und b. Damit haben wir fast bewiesen, daß eine Gerade in
der Tat die kürzeste Verbindung zwischen zwei vorgegeben Punkten ist. Offen ist
noch die Frage, ob es sich um ein Minimum oder Maximum des Integrals handelt.
Im vorliegenden Fall ist es jedoch offensichtlich, daß die Gerade ein Minimum liefert. Glücklicherweise ist es für die Anwendung der Variationsrechnung in der
Mechanik irrelevant, ob ein Minimum oder Maximum voriegt. Wichtig ist nur,
daß ein bestimmtes Integral (siehe unten) stationär wird. Das zweite Problem,
weshalb wir nur fast bewiesen haben, daß eine Gerade die kürzeste Verbindung
zwischen zwei Punkten liefert sind Wege, die man nicht in der Form y = y(x)
schreiben kann, wie z.B. einen spiralförmige Pfad. Weiterhin sind wir davon ausgegangen, daß der kürzeste Pfad in einer Ebene liegt (siehe auch das Beispiel aus
der Optik).
Wir können unsere Überlegungen erweitern, indem wir die Parameterdarstellung (Parameter x - später t für die Zeit) von Kurven im d-dimensionalen Raum
betrachten: y1 (x), y2 (x), . . . , yd (x). Die parametrische Form erlaubt es jetzt auch
72
KAPITEL 3. LAGRANGESCHE MECHANIK
spiralförmige Kurven zu beschreiben. Damit ergibt sich für das Integral, welches
stationär werden soll
Z x2
f [y1 (x), y10 (x), y2 (x), y20 (x), . . . , yd (x), yd0 (x), x] dx ,
S=
x1
wobei die yi (x1 ) und yi (x2 ) mit i = 1, 2, . . . , d festgelegt sind. Wir können nun
wie zuvor vorgehen und kleine Abweichungen αi ηi (x) vom stationären Pfad yi (x)
betrachten. Auf diese Weise bekommen wir die Euler-Lagrange-Gleichungen
∂f
d ∂f
=
,
∂yi
dx ∂yi0
i = 1, 2, . . . , d
Das Hamiltonsche Prinzip: Nach diesen Vorüberlegungen sind wir in der Lage,
die auf dem Variationsprinzip beruhenden Herleitung der Lagrangeschen Bewegungsgleichungen zu geben. Wir betrachten ein System von N Massepunkten,
welches konservativ sei und zunächst keinen Zwangsbedingungen unterliege. In
unserer bisherigen Herangehensweise haben wir zusammen mit den Bewegungsgleichungen die Anfangsorte und die Anfangsgeschwindigkeiten vorgegeben, da
sich dieses durch den Bezug zum Experiment und der Theorie der Differentialgleichungen (Eindeutigkeit der Lösung) aufdrängt. In drei Dimensionen ergeben
sich so 6N Bedingungen, um die 6N freien Konstanten der allgemeinen Lösung
der Bewegungsgleichung festzulegen. Wir werden folgend etwas anders vorgehen
– da wir Bezug zur Variationsrechnung machen werden – und nach Bahnkurven
mit festen Anfangs- und Endorten suchen. Wir definieren (konsistent mit oben)
die Lagrangefunktion als die Differenz aus kinetischer und potentieller Energie
L(~r, ~r˙ ; t) = T − V
N
1X
mα~r˙α2 − V (~r; t) ,
=
2 α=1
mit dem 3N -dimensionalen Vektor ~r wie oben. Neu führen wir jetzt das Wirkungsfunktional
Z t2
S=
L(~r(t), ~r˙ (t); t) dt
t1
ein. Die Anfangs- ~r(t1 ) und Endorte ~r(t2 ) sind dabei vorgegeben. Die EulerLagrange-Gleichungen des vorliegenden Variationsproblems entsprechen den uns
bekannten Lagrangeschen Bewegungsgleichungen. Wir können somit schließen,
daß die eindeutige Lösung der Bewegungsgleichungen unter Berücksichtigung der
Anfangsbedingungen für die ~r und ~r˙ das Wirkungsfunktional stationär werden
läßt, was man als das Hamiltonsche Prinzip bezeichnet. Geht man nun andersherum vom Wirkungsfunktional und den folgenden Euler-Lagrange-Gleichungen
3.5. DAS PRINZIP DER KLEINSTEN WIRKUNG
73
aus, so kann man durch Wahl der 6N Integrationskonstanten die Randbedingungen ~r(t1 ) und ~r(t2 ) erfüllen, es kann jedoch durchaus mehrere Lösungen geben
(da man nicht auf Eindeutigkeitssätze der Theorie der Differentialgleichungen
zurückgreifen kann). Man bezeichnet das Hamiltonsche Prinzip auch als Prinzip
der kleinsten Wirkung, da die stationären Pfade meist Minima sind.
Wir können für ein System mit holonomen Nebenbedingungen völlig analog
vorgehen, wobei die Lagrangefunktion nun von den “relevanten” verallgemeinerten Koordinaten abhängt (man sucht den extremalen Weg, der mit den Nebenbedingungen vereinbar ist). Die Euler-Lagrange-Gleichungen mit den “relevanten”
qi und q̇i entsprechen erneut den uns bekannten Lagrangeschen Bewegungsgleichungen.
Damit haben wir eine alternative Herleitung der Lagrangeschen Bewegungsgleichungen für holonome Systeme gefunden, die auf dem Variationsprinzip beruht. Diese Herleitung ist sehr elegant und gibt bereits einen ersten Eindruck
davon, wie wichtig das Varitions(Extremal-)prinzip in der (theoretischen) Physik
ist.
Für unsere späteren Überlegungen ist es wichtig festzuhalten, daß ein gegebenes Wirkungsfunktional
Z t2
S=
L(q(t), q̇(t); t) dt
t1
(wobei q bzw. q̇ für alle qi bzw. q̇i steht) eindeutige Euler-Lagrange-Gleichungen
liefert. Die Umkehrung gilt aber nicht, d.h. unterschiedliche Wirkungsfunktionale
können die gleichen Euler-Lagrange-Gleichungen liefern. Wir betrachten dazu das
Beispiel
Z t2
S̃ =
L̃(q(t), q̇(t); t) dt
t1
Z t2 d
=
cL(q(t), q̇(t); t) + G(q(t); t) dt .
dt
t1
Dabei ist c eine beliebige Konstante und G(q; t) eine beliebige differenzierbare
Funktion. Integration liefert sofort
S̃ = cS + G(q(t1 ); t1 ) − G(q(t2 ); t2 ) .
Da von der Funktion G nur die Anfangs- und Endpunkte eingehen, ändert sich bei
Variation des Weges nur der erste Summand. Für die Euler-Lagrange-Gleichungen
folgt somit
d ∂(cL)
∂(cL)
=
dt ∂ q̇i
∂qi
und nach Kürzen des Faktors c 6= 0 folgt dieselbe Euler-Lagrange-Gleichung wie
für S. Man kann die Aussage, daß die Lagrangefunktionen L und L̃ auf dieselben
Euler-Lagrange-Gleichungen führen, auch ohne Verwendung des Hamiltonschen
Prinzips durch Differentiation zeigen.
74
KAPITEL 3. LAGRANGESCHE MECHANIK
3.6
Symmetrien und Erhaltungssätze
Im Kapitel 3.3 der Vorlesung des letzten Semesters haben wir eine elementare
Diskussion von Erhaltungssätzen (Energie, Gesamtimpuls und Gesamtdrehimpuls) innerhalb des Newtonschen Formalismus gegeben. Im Zusammenhang mit
der Bewegung eines Teilchens im zweidimensionalen Zentralpotential V (r) haben
wir in Kapitel 3.6 einen ersten Kontakt mit Erhaltungssätzen innerhalb der Lagrangeschen Mechanik gehabt. Die Lagrangefunktion ist in diesem Beispiel durch
m 2
ṙ + r2 φ̇2 − V (r)
L(r, φ, ṙ, φ̇) =
2
gegeben. Aus der Beobachtung, daß L nicht explizit von φ abhängt – das Problem
also rotationssymmetrisch ist – folgt, wie im letzten Semester diskutiert, der
Flächensatz, welcher äquivalent zur Erhaltung des Drehimpulses ist. Hinter dieser
Beobachtung steckt ein allgemeines Prinzip, welches wir jetzt weiter untersuchen
wollen.
Hängt die Lagrangefunktion L von der verallgemeinerten Koordinate qi nicht
explizit ab, d.h. gilt ∂L/∂qi = 0, so nennt man diese Koordinate zyklisch. Allgemein bezeichnet man
∂L
pj =
∂ q̇j
als den zu qj kanonisch konjugierten Impuls.5 Ist die Koordinate qi zyklisch, so
folgt nach der Lagrangegleichung ṗi = 0 und damit pi = const.. Der zu einer
zyklischen Koordinate gehörende kanonisch konjugierte Impuls ist somit eine Erhaltungsgröße.
Da es bei der Lösung eines Problems offensichtlich vorteilhaft ist, möglichst
viele Erhaltungsgrößen zu kennen, stellt sich die Frage, ob es ein Prinzip gibt,
nach welchem man die Koordinaten wählen kann, um eine möglichst große Anzahl zyklischer Koordinaten zu erreichen. Beim Problem der Bewegung im zweidimensionalen Zentralpotential hatten wir die Koordinaten der Drehsymmetrie
angepaßt und so einen Erhaltungssatz gewonnen. Zusammenhänge zwischen Symmetrien und Erhaltungsgrößen haben wir ebenfalls im Kapitel 2.2 der aktuellen
Vorlesung diskutiert. Den allgemeinen Zusammenhang zwischen kontinuierlichen
Symmetrien und Erhaltungsgrößen liefert das Noethersche Theorem, welches wir
folgend herleiten wollen.
Noethersches Theorem I: Im Kapitel 3.4 haben wir diskutiert, daß die Lagrangegleichungen bei der Koordinatentransformation q̄i = q̄i (q; t) die Form behalten,
d.h. mit
d ∂L
∂L
=
, i = 1, 2, . . . , m
dt ∂ q̇i
∂qi
5
Weiter oben haben wir diese Größe recht allgemein als den verallgemeinerten Impuls bezeichnet.
3.6. SYMMETRIEN UND ERHALTUNGSSÄTZE
75
gilt ebenfalls
d ∂ L̄
∂ L̄
=
,
dt ∂ q̄˙i
∂ q̄i
i = 1, 2, . . . , m ,
˙ t) = L(q(q̄; t), q̇(q̄, q̄;
˙ t); t). Da die L und L̄ im Allgemeinen verschiewobei L̄(q̄, q̄;
dene funktionale Abhängigkeiten von den 2m + 1 Variablen haben, erfüllen die
q̄i im Allgemeinen andere Differentialgleichungen als die qi . Folgend betrachten
wir solche Koordinatentransformationen, für die die resultierenden Differentialgleichungen in den qi und q̄i dieselbe Form haben. Die Transformation soll zusätzlich differenzierbar von einem Parameter abhängen. Die wesentlichen Resultate
erhält man bei “infinitesimalen” Transformationen. Daher beschränken wir uns
auf solche der Form
q̄i = qi + hi (q; t) ,
die sich durch Taylorentwicklung einer allgemeineren Form für || 1 sowieso
ergeben. Damit folgt
!
X
∂hi
∂hi
dhi (q; t)
= q̇i + q̇k +
.
q̄˙i = q̇i + dt
∂qk
∂t
k
Aus den Überlegungen am Ende des Kapitels 3.5 zu der Frage, welche Wirkungsfunktionale zu gleichen Euler-Lagrange-Gleichungen führen, folgt, daß die Differentialgleichungen in den qi und q̄i sicherlich dann identisch sind, wenn
˙ t) = L(q̄, q̄;
˙ t) +
L̄(q̄, q̄;
d
G̃(q̄; t; ) .
dt
Koordinatentransformationen, die diese Bedingung erfüllen, bezeichnet man als
Symmetrietransformationen.
Um diese Art der Transformationen zu illustrieren, betrachten wir das einfache
Beispiel eines effektiv eindimensionalen Problems mit einem Teilchen im äußeren
Potential V (x). Dann ergibt sich die Lagrangefunktion
L(x, ẋ) =
m 2
ẋ − V (x) .
2
Als Koordinatentransformation führen wir eine Translation mit h(x; t) = a aus
und bekommen x̄ = x + a sowie x̄˙ = ẋ. Für die Lagrangefunktion folgt
m
˙ .
˙ = x̄˙ 2 − V (x̄ − a) = L̄(x̄, x̄)
L(x, ẋ) = L(x̄ − a, x̄)
2
Um zu klären, ob es sich bei der Transformation um eine Symmetrietransformation im obigen Sinne handelt, müssen wir die Differenz von L̄ und L (beides als
˙ untersuchen. Wir betrachten
Funktion von x̄ und x̄)
˙ − L(x̄, x̄)
˙ = V (x̄) − V (x̄ − a) .
L̄(x̄, x̄)
76
KAPITEL 3. LAGRANGESCHE MECHANIK
Physikalisch ist es offensichtlich, daß die Translation das vorliegende Problem nur
dann äquivalent läßt, wenn die Kraft nicht vom Ort x abhängt, also homogen ist.
Wir beschränken uns daher auf Potentiale, die linear sind, d.h. V (x) = −F x,
mit F = const.. In diesem Fall gilt G̃(x̄; t; ) = −F at + const.. Damit ist unsere
Erwartung, daß die Translation für ein homogenes Kraftfeld eine Symmetrietransformation darstellt, bestätigt.
Im allgemeinen Fall liegt eine Symmetrietransformation vor, falls es eine Funktion G̃ mit (hier ausgedrückt durch die q und q̇)
L(q, q̇; t) − L(q + h, q̇ + ḣ; t) −
d
G̃(q + h; t; ) = 0
dt
gibt. Dabei haben wir, analog zur “Multivariablen” q, h = (h1 , h2 , . . . , hm ) eingeführt. Aus dieser Gleichung können wir eine differentielle Relation herleiten,
indem wir beide Seiten nach differenzieren und anschließend = 0 setzen. Mit
d
d
G̃(q + h; t; ) = G(q + h; t; )
dt
dt
folgt
m X
∂L
i=1
d
∂L
ḣi + G(q; t; 0) = 0 .
hi +
∂qi
∂ q̇i
dt
Wir eliminieren nun unter Verwendung der Lagrangegleichung ∂L/∂qi und erhalten so
" m
#
d X ∂L
hi + G(q; t; 0) = 0 ,
dt i=1 ∂ q̇i
bzw.
m
X
∂L
i=1
∂ q̇i
hi + G =
m
X
pi hi + G(q; t; 0) = const. ,
i=1
Das ist die mathematische Formulierung des Noetherschen Theorems: Jede einparametrige (hier Parameter ) Schar von Symmetrietransformationen führt zu
einem Erhaltungssatz (einem “Bewegungsintegral”).
Für unser obiges einfaches Beispiel lautet der Erhaltungssatz (mẋ − F t)a =
const.. Für den Spezialfall der verschwindenden Kraft F = 0 entspricht dies der
Impulserhaltung. Wir werden später in allgemeinerem Kontext auf die Translation zurückkommen.
Wir wollen nun den Zusammenhang zwischen dem Noetherschen Theorem
und den uns bereits bekannten Erhaltungssätzen für ein N -Teilchen-System ohne
3.6. SYMMETRIEN UND ERHALTUNGSSÄTZE
77
Zwangsbedingungen herstellen. Dabei verwenden wir die kartesischen Koordinaten. Die Lagrangefunktion mit (im Allgemeinen zeitabhängigen) externen und
Paarkräften ist durch
"
#
N
N
X
X
m
1
i
L(~r, ~r˙ ; t) =
~r˙i2 − Vi (~r; t) −
vi,j (|~ri − ~rj |; t)
2
2 i6=j=1
i=1
gegeben. Dabei handelt es sich bei den Vektoren ohne Teilchen- und Komponentenindex wieder um die weiter oben eingeführten 3N -dimensionalen Vektoren.
Wir werden jetzt für verschiedene Funktionen ~h überprüfen, ob es sich bei der
durch sie gegebenen Transformation für unsere Lagrangefunktion um eine Symmetrietransformation handelt. Dabei verwenden wir die differentielle Form und
untersuchen, ob eine Funktion G(~r; t; 0) existiert, so daß
N h
X
i=1
i
~ ~r L · ~hi + ∇
~ ˙ L · ~h˙ i = − d G(~r; t; 0)
∇
i
~
ri
dt
gilt. Wir werden folgend
~ ~r L = −∇
~ ~r Vi −
F~i = ∇
i
i
X
~ ~r vi,j
∇
i
j6=i
verwenden. Setzen wir die obige Form der Lagrangefunktion ein, so folgt
N h
X
i=1
i
d
˙
F~i · ~hi + mi~r˙i · ~hi = − G(~r; t; 0) .
dt
Existiert ein entsprechendes G, so ergibt sich aus den allgemeinen Überlegungen
die Erhaltungsgröße
N
X
mi~r˙i · ~hi + G = const. .
i=1
1. Die räumliche Translation mit ~hi (~r; t) = ~a. Hierbei handelt es sich um eine
Symmetrietransformation, falls es ein G mit
~a ·
N
X
i=1
d
F~i = − G(~r; t; 0)
dt
gibt. Wegen “actio=reactio” tragen in der Summe über i nur die äußeren
Kräfte F~iext bei. Es muß also
~a ·
N
X
i=1
d
F~iext = ~a · F~ tot = − G(~r; t; 0) ,
dt
78
KAPITEL 3. LAGRANGESCHE MECHANIK
P ~ ext
mit der gesamten äußeren Kraft F~ tot = N
gelten. Für den Fall ohne
i=1 Fi
tot
äußere Kräfte mit F~
= 0 können wir G = 0 wählen und erhalten den
Erhaltungssatz
~a ·
N
X
mi~r˙i = const. .
i=1
Da ~a für F~ tot = 0 beliebig wählbar ist, folgt die Erhaltung des Gesamtimpulses
P~ =
N
X
mi~r˙i = const. .
i=1
Für ein (in jede Richtung) translationsinvariantes System ist somit der
Gesamtimpuls eine Erhaltungsgröße. Verschwinden die äußeren Potentiale nicht, aber es gilt
Vi (~r + ~a; t) = Vi (~r; t)
für alle i = 1, 2, . . . , N und spezielle durch ~a gegebene Richtungen, so gilt
~a · F~ tot = 0. Damit ergibt sich unter der Wahl G = 0 die Erhaltungsgröße
~a · P~ = const. ,
d.h. die Projektion des Gesamtimpulses in die Richtung dieser ~a ist erhalten.
Ist ein System somit in bestimmte Richtungen translationsinvariant, so ist
der Gesamtimpuls in diese Richtungen erhalten. Sind alle äußeren Kraftfelder F~iext räumlich homogen, d.h. F~iext (~ri ; t) = F~iext (t), so ist die Bedingung
~a · F~ tot = −dG/dt für
Z t
G(t) = −a ·
F~ tot (t0 ) dt0
t0
erfüllt. Damit folgt das “Bewegungsintegral”
Z t
tot 0
0
~
~
~a · P (t) −
F (t ) dt = const. .
t0
Da ~a aufgrund der Homogenität der äußeren Kräfte beliebig ist, gilt auch
Z t
P~ (t) −
F~ tot (t0 ) dt0 = const. .
t0
Für den oben diskutierten Spezialfall mit N = 1 und d = 1 ergibt sich aus
diesem Ergebnis das obige Resultat.
3.6. SYMMETRIEN UND ERHALTUNGSSÄTZE
79
2. Die räumliche Drehung mit ~hi (~ri ; t) = D~ri . Dabei ist D eine zeitunabhängige 3 × 3-Matrix, sodaß B = 1 + D eine Drehung mit BBT = 1 darstellt.
Daraus folgt, daß D + DT = 0 gelten muß und D eine antisymmetrische
~D
Matrix ist. Damit gibt es nach den Überlegungen von Seite 28 zu D ein φ
mit
~hi (~ri ; t) = φ
~ D × ~ri .
Wegen
h
i
˙
~ D × ~r˙i = 0
~r˙i · ~hi = ~r˙i · φ
entfällt der entsprechende Term bei der Suche nach einer Symmetrietransformation und wir suchen ein G mit
N
X
i=1
i
h
~ D × ~ri = − d G .
F~i · φ
dt
Aufgrund von “actio=reactio” tragen in der Summe wieder nur die äußeren
Kräfte bei. Wegen ~a · (~b × ~c) = ~b · (~c × ~a) folgt dann
~D ·
φ
N h
i
X
d
~
~ri × ∇~ri Vi = G .
dt
i=1
Eine beliebige räumliche Drehung ist somit eine Symmetrietransformation,
falls Vi = Vi (|~xi |), d.h. die äußeren Kräfte Zentralkräfte sind. Dann ver~ D und die obige Gleichung ist
schwindet die linke Seite für jedes beliebige φ
für G = 0 erfüllt. Der Erhaltungssatz lautet dann
N
X
i=1
~ D × ~ri ] = φ
~D ·
mi~r˙i · [φ
N
X
~D · L
~ = const. .
[~ri × p~i ] = φ
i=1
~ D beliebig ist, folgt die Erhaltung des Gesamtdrehimpulses L.
~ Liegen
Da φ
keine radialsymmetrischen Potentiale Vi vor, sondern solche, die nur eine
~ haben, für die also
spezielle Symmterieachse φ
~ × ~ri ])
Vi (~ri ) = Vi (~ri + [φ
~·L
~
~ auf die φgilt, so ist nur die Projektion des Gesamtdrehimpulses φ
Richtung erhalten. Ein Beispiel dafür ist ein Problem mit Zylindersymmetrie.
80
KAPITEL 3. LAGRANGESCHE MECHANIK
3. Die eigentliche Galileitransformation mit ~hi (~r; t) = ~v0 t. Aufgrund von “actio=reactio” tragen wieder nur die äußeren Kräfte bei und das Kriterium
für das Vorliegen einer Symmetrietransformation lautet
t~v0 · F~ tot + ~v0 ·
N
X
i=1
dG
.
mi~r˙i = t~v0 · F~ tot + ~v0 · P~ (t) = −
dt
Sind die äußeren Kräfte homogen, so wird das Kriterium durch die Funktion
Z t h
i tot 0 0
0
~
~
G(t) = −~v0 ·
F (t ) t + P (t ) dt0
t0
erfüllt. Da aufgrund der Homogenität der Kraft ~v0 beliebig ist, ist die zugehörige Erhaltungsgröße durch
Z th
i
tot 0 0
0
~
~
~
P (t)t −
F (t ) t + P (t ) dt0 = const.
t0
gegeben. Sollten die Massen mi zeitunabhängig sein (was wir ja hier meist
~
angenommen haben), so gilt P~ (t) = M dR/dt,
mit dem Schwerpunktsvektor
~
R(t). Damit folgt
Z t
~
~
P (t)t −
F~ tot (t0 ) t0 dt0 − M R(t)
= const. .
t0
Man bezeichnet den Erhaltungssatz als den Schwerpunktsatz. Für F~ tot = 0
(was P~ (t) = P~ = const. impliziert) folgt
P~
~
t + const. = V~0 t + const. ,
R(t)
=
M
also die Schwerpunktsbewegung im Fall ohne äußere Kräfte. Diese folgt auch
sofort durch Integration der Gesamtimpulserhaltung, so daß man aus der
Invarianz unter der eigentlichen Galileitransformation für F~ tot = 0 keine
zusätzliche Information gewinnt.
Mit diesen Überlegungen haben wir bis auf die Energieerhaltung alle früher
diskutierten Erhaltungssätze aus der durch das Noethersche Theorem gegebenen
Beziehung zwischen den Symmetrien (genauer den Symmetrietransformationen)
eines Systems und Erhaltungsgrößen hergeleitet. Von den bereits oben eingeführten Galileitransformationen haben wir die Translation der Zeit noch nicht betrachtet. Das liegt daran, daß wir bisher nur Symmetrietransformationen der
Form q̄i = qi + hi (q; t) betrachtet haben, bei der die verallgemeinerten Koordinaten transformiert werden, jedoch nicht die Zeitvariable. Wir werden später
auch diese Situation betrachtet – was uns dann auch auf die Energieerhaltung
3.6. SYMMETRIEN UND ERHALTUNGSSÄTZE
81
führt–, wollen aber zunächst einen Weg diskutieren, auf dem sich die Energieerhaltung im Rahmen der Lagrangeschen Formulierung der Mechanik sehr schnell
ergibt. Er führt uns auf das Konzept der Hamiltonschen Funktion.
Die Hamiltonfunktion: Wir betrachten eine Lagrangefunktion für ein N -Teilchensystem der Form L(q(t), q̇(t); t) = T (q(t), q̇(t); t) − V (q(t); t). Differentiation
nach der Zeit liefert
X ∂L
∂L
∂L
dL
=
q̇i +
q̈i +
dt
∂qi
∂ q̇i
∂t
i
X
d ∂L
∂L
∂L
=
q̇i +
q̈i +
dt ∂ q̇i
∂ q̇i
∂t
i
d X ∂L
∂L
,
(3.8)
=
q̇i +
dt i ∂ q̇i
∂t
wobei wir beim Übergang zur zweiten Zeile die Lagrangegleichung verwendet
haben. Wir definieren nun die Hamiltonfunktion H als
H=
X
pi q̇i − L =
i
X ∂L
i
∂ q̇i
q̇i − L .
Damit folgt aus Gl. (3.8)
∂L
dH
=−
.
dt
∂t
Hängt L nicht explizit von der Zeit ab, so ist damit H eine Erhaltungsgröße
∂L
= 0 ⇒ H = const. .
∂t
In den beiden obigen Beispielen – Doppelpendel (Seiten 56-58) und Perle auf dem
rotierendem Draht (Seite 66) – hängt L nicht explizit von der Zeit ab und H ist
eine Erhaltungsgröße.
Wir nehmen nun an, daß die kinetische Energie die Form
T =
1X
q̇i Ai,j (q)q̇j ,
2 i,j
mit Ai,j = Aj,i hat. Wie wir schon anhand diverser Beispiele gesehen haben, ist
dieses die generische Form für die kinetische Energie bei holonom-skleronomen
Zwangsbedingungen. Genauer kann man sich überlegen, daß die kinetische Energie diese Form hat, wenn die Transformation ~ri (q1 , . . . , qm ; t) nicht explizit von
der Zeit abhängt. Das Doppelpendel von Seiten 56-58 fällt in diese Klasse, die
82
KAPITEL 3. LAGRANGESCHE MECHANIK
Perle auf dem rotierendem Draht von Seite 66 nicht. Ist die kinetische Energie
eine quadratische Form in den q̇i , so folgt für den konjugierten Impuls
pl =
X
∂T
=
Al,j q̇j .
∂ q̇l
j
P
Es gilt also i pi q̇i = 2T . Für die angenommene Form der kinetischen Energie
ergibt sich so
H =T +V ,
d.h. die Hamiltonfunktion ist durch die Gesamtenergie gegeben. Somit haben wir
für eine nicht explizit zeitabhängige Lagrangefunktion, deren kinetischer Teil die
obige Form hat (holonom-skleronome Zwangsbedingungen), die Energieerhaltung
gezeigt (z.B. für das Doppelpendel). Im Beispiel der Perle auf dem Draht ist H
zwar erhalten, aber H ist nicht gleich der Energie, die ja offensichtlich nicht erhalten ist. Liegt eine Transformation ~ri (q1 , . . . , qm ; t) vor, die nicht explizit von
der Zeit abhängt, so ist H die Energie. Sollte jedoch das Potential explizit von
der Zeit abhängen, so ist H (d.h. die Energie) nicht erhalten.
Noethersches Theorem II: Die Überlegungen über Erhaltungsgrößen und
Symmetrietransformationen abschließend, diskutieren wir noch Transformationen, in denen auch die Zeit transformiert wird. Wie oben betrachten wir infinitesimale Transformationen
τ = t + h0 (t) ,
q̄i (τ ) = qi (t) + hi (q; t)
= qi (t(τ )) + hi (q(t(τ )); t(τ )) .
Wir werden im Folgenden die Ableitung nach τ mit einem Strich bezeichnen. Wie
man durch Verallgemeinerung der Rechnung von Seite 64 sieht, erfüllen die q̄i (τ )
die Lagrangegleichung
∂ L̄
d ∂ L̄
=
,
0
dτ ∂ q̄i
∂ q̄i
mit L̄(q̄, q̄ 0 ; τ ) = (dt/dτ ) L(q(t), q̇(t); t). Die Differentialgleichungen für die q̄i (τ )
haben sicher wieder dieselbe Form wie die für die qi (t), falls
L̄(q̄(τ ), q̄ 0 (τ ); τ ) = L(q̄(τ ), q̄ 0 (τ ); τ ) +
d
G̃(q̄(τ ); τ ) .
dτ
Also muß
dt
d
L(q(t), q̇(t); t) = L(q̄(τ ), q̄ 0 (τ ); τ ) + G̃(q̄(τ ); τ )
dτ
dτ
3.6. SYMMETRIEN UND ERHALTUNGSSÄTZE
83
gelten. Differentiation nach und anschließendes Nullsetzen von liefert mit
G̃ = G und
dt
dτ
= 1 + ḣ0 ⇒
= 1 − ḣ0 + O(2 )
dt
dτ
sowie
dt
+ h0i
dτ h
i
= q̇i (t) 1 − ḣ0 + ḣi + O(2 )
q̄i0 (τ ) = q̇i
das differentielle Kriterium
−Lḣ0 =
X ∂L
i
∂L
∂L
dG
hi +
(ḣi − ḣ0 q̇i ) +
h0 +
.
∂qi
∂ q̇i
∂t
dt
Dabei haben wir beim Übergang zur zweiten Zeile angenommen, daß das Kriterium erfüllt ist und haben die Lagrangegleichung sowie ∂L/∂t = −dH/dt verwendet. Die Terme, in denen h0 und ḣ0 auftreten, lassen sich als Zeitableitung von
Hh0 schreiben und man erhält schließlich
X ∂L
i
∂ q̇i
hi − Hh0 + G = const.
als Verallgemeinerung des Noetherschen Theorems.
Als Anwendung betrachten wir die Zeittranslation mit h0 (t) = t0 und hi = 0
für alle anderen i. Das differentielle Kriterium lautet dann
t0
∂L
dG
=−
.
∂t
dt
Diese Relation ist offensichtlich erfüllt, falls ∂L/∂t die zeitliche Ableitung einer
Funktion von q und t ist. Sei z.B.
X mi
L=
~r˙i2 − V (~r1 , . . . , ~rN ) + L0 (t)
2
i
mit zeitunabhängigen mi und zeitunbabhängigem V , soPist ∂L/∂t = L̇0 (t) und
das Kriterium ist für G(t) = −t0 [L0 (t) + c] erfüllt. Mit i p~i · ~r˙i = 2T folgt
H = T + V + L0 (t)
und der Erhaltungssatz Ht0 − G = const. lautet bei
T + V = const. ,
84
KAPITEL 3. LAGRANGESCHE MECHANIK
d.h. die Gesamtenergie ist (im Gegensatz zu H) erhalten. Für L0 = 0 ergibt sich
das Ergebnis aus dem letzten Abschnitt.
Bevor wir uns mit der hamiltonschen Formulierung der Mechanik beschäftigen
wollen, werden wir uns im nächsten Kapitel kurz Gedanken über (kleine) gekoppelte Schwingungen machen. Wir werden dabei (erneut) beleuchten, warum die
Dynamik gekoppelter harmonischer Oszillatoren eine zentrale Rolle in der klassischen Mechanik spielt. Weiterhin wollen wir anhand des Beispiels der transversen Schwingungen einer Saite die Kontinuumsmechanik kennen lernen. Neben
der Mechanik von Punktteilchen und der von starren Körpern spielt sie eine sehr
wichtige Rolle. So fällt z.B. die Dynamik strömender Flüssigkeiten und Gase,
aber auch die Verformungsdynamik von Festkörpern (z.B. Metallen), in diesen
Bereich.6
6
Diese Aussage gilt, wenn den Längenskalen auf denen man die Dynamik der Flüssigkeiten,
Gase und Festkörper betrachtet, nicht erlaubt, die mikroskopischen Konstituenten (die Moleküle
und Atome) aufzulösen.
Kapitel 4
Gekoppelte Schwingungen und
schwingende Saiten
4.1
Kleine gekoppelte Schwingungen von mehreren Freiheitsgraden
Wir betrachten ein System mit m Freiheitsgraden, welches durch die verallgemeinerten Koordinaten q = q1 , q2 , . . . , qm beschrieben wird. Das zugrundeliegende System von N Massepunkten sei durch den 3N -dimensionalen Ortsvektor ~r = ~r(q)
beschrieben, wobei keine explizite Zeitabhängigkeit in der Transformation von q
nach ~r auftritt. Weiterhin seien die Kräfte durch ein zeitunabhängiges Potential
gegeben. Die Lagrangefunktion für diese Problem lautet
m
1X
L(q, q̇) =
q̇i Ai,j (q)q̇j − V (q) = T (q, q̇) − V (q) ,
2 i,j=1
wobei
Ai,j (q) =
N
X
α=1
mα
∂~rα ∂~rα
·
.
∂qi ∂qj
Die Matrix A ist symmetrisch, d.h.P
Ai,j = Aj,i . Wie auf Seite 80 gezeigt, folgt für
den zu qi konjugierten Impuls pi = j Ai,j q̇j und damit für die Lagrangegleichung
d X
∂T
∂V
Ai,j (q)q̇j −
=−
,
dt j
∂qi
∂qi
i = 1, 2, . . . , m
(4.1)
Für allgemeine Potentiale ist dieses ein System von m gekoppelten, nicht-linearen
Differentialgleichungen zweiter Ordnung, das in dieser Allgemeinheit meist nur
numerisch gelöst werden kann. Wir wollen nun untersuchen, ob es trotzdem Situationen gibt, die man geschlossen analytisch lösen kann.
85
86
KAPITEL 4. SCHWINGUNGEN UND SAITEN
Die einfachste Möglichkeit ist dabei das Auftreten von Situationen, in denen
ein statisches Gleichgewicht vorliegt und alle qi zeitunabhängig sind. Insbesondere
gilt dann für alle Zeiten q̇i = 0 = q̈i , i = 1, 2, . . . , m. In Gl. (4.1) verschwindet
damit die linke Seite und Gleiches muß für die rechte Seite gelten. Damit kann
ein statisches Gleichgewicht nur in Punkten q 0 mit
∂V = 0 , i = 1, 2, . . . , m
∂qi 0
q
vorliegen, d.h. in Punkten, in denen die verallgemeinerte Kraft verschwindet und
das Potential stationär wird. Wir betrachten nun das Potential in der Nähe eines
dieser Punkte. In jede der m durch qi gegebenen Richtungen (d.h. als Funktion
von qi bei festgehaltenen übrigen Variablen) kann ein lokales Minimum, ein Sattelpunkt, oder ein lokales Maximum vorliegen. Hat V (q) in q 0 ein lokales Minimum,
so liegt ein lokales Minimum in jede der Richtungen vor und der Gleichgewichtspunkt heißt stabil. Andernfalls ist der Gleichgewichtspunkt instabil.
Wir betrachten nun das Verhalten der Bewegung in der Nähe eines Gleichgewichtspunktes q 0 . Ähnliche Betrachtungen haben wir bereits mehrfach im Laufe
der letztsemestrigen und der aktuellen Vorlesung angestellt. Um die Notation zu
vereinfachen, wählen wir die Koordinaten so, daß q 0 = 0 gilt. Mit dieser Wahl des
Ursprungs betrachten wir den Fall, daß die qi kleine “Auslenkungen” sind. Wir linearisieren dann die Bewegungsgleichungen oder äquivalent dazu betrachten wir
in L nur Terme, die höchstens quadratisch in den Auslenkungen und den Geschwindigkeiten q̇i sind (Talyorentwicklung).1 Da T bereits bilinear in den q̇i ist,
können wir in Ai,j (q) die Variable q durch ihren Wert am Gleichgewichtspunkt
ersetzen Ai,j = Ai,j (0). Für das Potential führen wir eine (mehrdimensionale)
Taylorentwicklung bis zu Termen zweiter Ordnung durch
m
m
X
1 X ∂ 2 V ∂V qi +
qi qj + O(q 3 ) .
V (q) = V (0) +
∂qi q=0
2 i,j=1 ∂qi ∂qj q=0
i=1
Da q = 0 ein Gleichgewichtspunkt sein soll, verschwindet der lineare Term.
Zusätzlich verschieben wir das Potential, bzw. den Energienullpunkt um den konstanten Wert V (0).2 Damit gilt
V (q) =
m
1X
qi Bi,j qj + O(q 3 ) ,
2 i,j=1
mir der symmetrischen Marix B
Bi,j
1
∂ 2 V =
= Bj,i .
∂qi ∂qj q=0
Sollten die q̇i nicht “klein” sein, dann würde die Bewegung nicht “in der Nähe” von q = 0
bleiben.
2
Das Potential bzw. der Energienullpunkt ist immer nur bis auf eine Konstante eindeutig
definiert, so daß solch eine Verschiebung jederzeit möglich ist.
4.1. KLEINE SCHWINGUNGEN
87
Vernachlässigen wir Terme dritter Ordnung und höher in q und q̇, so ist die
Lagrangefunktion die Summe zweier quadratischer Formen
m
m
1X
1X
q̇i Ai,j q̇j −
qi Bi,j qj
L =
2 i,j=1
2 i,j=1
1 ˙
1
~q · A~q˙ − ~q · B~q ,
(4.2)
2
2
P
wobei wir die Vektoren ~q = i qi~ei mit orthonormalen Basisvektoren ~ei definiert
haben (rein mathematisch, kein Bezug zu kartesischen Koordinaten). Die kinetische Energie ist eine positive Größe (für ~q˙ 6= 0). Daher muß die quadratische
Form T positiv definit sein. Die aus dem genäherten L folgenden linearisierten
Lagrangegleichungen sind
=
m
X
j=1
Ai,j q̈j = −
m
X
Bi,j qj
j=1
bzw.
A~q¨ = −B~q .
Diese Gleichungen folgen auch direkt durch Taylorentwickeln der ursprünglichen
Lagrangegleichungen.
Mathematisch betrachtet stellen die Bewegungsgleichungen jetzt ein System
linearer gekoppelter Differentialgleichungen zweiter Ordnung dar. Diese Gleichungen entkoppeln ohne weitere Rechnungen (Transformationen) nur dann, wenn die
beiden Matrizen A und B diagonal sind. Ein Beispiel für Differentialgleichungssysteme des vorliegenden Typs haben wir zu Beginn des Kapitels 2.15 der Vorlesung des letzten Semesters (siehe Seite 101 und folgende des Skripts) und einer
zugehörigen Übungsaufgabe kennen gelernt. Dort haben wir die Bewegung zweier
durch hookesche Federn (daher bereits lineare Gleichungen) gekoppelter Massen
betrachtet, in dem A diagonal ist, B jedoch nicht. In diesem Beispiel haben wir
exemplarisch untersucht, wie man die möglichen Bewegungsformen besser verstehen und das Gleichungssystem analytisch lösen kann (mit Hilfe eines Ansatzes
mit der Zeitabhängigkeit exp (iωt)), wenn man eine Hauptachsentransformation
für die Matrix B ausführt (das Eigenwertproblem löst). Wir sind dabei auf die
Normalfrequenzen und die Eigenmoden der Bewegung gestoßen. Die allgemeine
Lösung konnte man dann als Linearkombination der Bewegung in den Eigenmoden schreiben. Als weiteres Beispiel dient das in Kapitel 3.2 der aktuellen
Vorlesung diskutierte Doppelpendel mit qi = φi , i = 1, 2 (siehe Seite 56 und folgende). Die stabile Ruhelage ist durch φ1 = 0 = φ2 gegeben. Nach Entwickeln der
Ausdrücke für die kinetische und potentielle Energie (T∗ und V∗ auf Seite 58) bis
zu Termen der Ordnung φ2 und Verschieben des Nullpunktes der Energie ergibt
88
KAPITEL 4. SCHWINGUNGEN UND SAITEN
sich
l12 (m1 + m2 ) l1 l2 m2
l1 l2 m2
l22 m2
l1 (m1 + m2 )g
0
0
l2 m2 g
A=
und
B=
und B ist (bereits) diagonal. Wir wollen nun sehen, wie man im allgemeinen Fall
mit einer beliebigen symmetrischen Matrix BBasis und einer positiv definiten,
symmetrischen Matrix3 A vorgehen kann.
Die obigen Überlegungen sollten Motivation genug sein, zunächst das verallgemeinerte Eigenwertproblem
B~v = λA~v
(4.3)
zu betrachten. Da A eine positiv definite symmetrische Matrix ist, gibt es m
paarweise orthonormale Eigenvektoren ~ai mit A~ai = ai~ai , mit den4 Eigenwerten
ai > 0 (siehe Kapitel 2.14
Pder Vorlesung des letzten Semesters). Jeder Vektor
ai schreiben. Damit können wir Matrizen A±1/2
w
~ ∈ Rm läßt sich als w
~= m
i=1 ci~
definieren, für die
A
±1/2
w
~=
m
X
±1/2
c i ai
~ai
i=1
gilt. Man kann leicht nachrechnen, daß A1/2 A1/2 = A und A−1/2 A1/2 = 1 gilt.
Mit
~v = A−1/2 V~
folgt so für Gl. (4.3)
CV~ = λ1V~
(4.4)
mit C = A−1/2 BA−1/2 . Mit A und B symmetrisch, ist auch C symmetrisch
und wir haben das obige verallgemeinerte Eigenwertproblem Gl. (4.3) auf ein
gewöhnliches Gl. (4.4) zurückgeführt.5 Wir nehmen nun an, daß wir die paarweise orthonormalen Eigenvektoren V~i und Eigenwerte λi zu C bestimmt haben.
3
Eine symmetrische Matrix, die auf eine positiv definite quadratische Form führt.
In der Basis aus Eigenvektoren ist A diagonal. Damit ist es offensichtlich, daß für w·A
~ w
~ >0
für alle Vektoren w
~ ∈ Rm /{0} alle Eigenwerte ai positiv sein müssen.
5
Es ist wichtig zu bemerken, daß das verallgemeinerte Eigenwertproblem Gl. (4.3) im Allgemeinen nicht durch Multiplikation mit A−1 von links zu einem gewöhnlichen Eigenwertproblem
mit einer symmetrischen Matrix wird. Dies liegt daran, daß A−1 B im Allgemeinen nicht symmetrisch ist, selbst wenn A und B symmetrisch sind!
4
4.1. KLEINE SCHWINGUNGEN
89
Damit können wir die Eigenvektoren des verallgemeinerten Eigenwertproblems
~vi = A−1/2 V~i berechnen.6 Da A−1/2 eine lineare Abbildung mit positiven Eigenwerten darstellt, bilden die ~vi einen Satz m linear unabhängiger Vektoren, also
eine Basis. Es gilt
V~i · CV~j = δi,j λi
A1/2~vi · A−1/2 BA−1/2 A1/2~vj = δi,j λi
⇒
und damit
~vi · B~vj = δi,j λi .
(4.5)
Ebenfalls gilt
V~i · V~j = δi,j
⇒
A1/2~vi · A1/2~vj = ~vi · A~vj = δi,j .
Entwickelt man nun einen beliebigen Vektor ~q ∈ Rm nach den ~vi , ~q =
mit q̄i = ~vi · A~q = ~q · A~vi , so folgt
X
X
~q˙ · A~q˙ =
q̄˙j ~vj · A~vi q̄˙i =
q̄˙i2 ,
~q · B~q =
i,j
i
X
X
q̄j ~vj · B~vi q̄i =
i,j
(4.6)
Pm
vi
i=1 q̄i~
λi q̄i2 .
i
Diese Relationen werden wir gleich zur Lösung unseres mechanischen Problems
verwenden.
Zur praktischen Bestimmung der λi und ~vi sucht man die Nullstellen des
verallgemeinerten charakteristischen Polynoms det(B−λA) und löst anschließend
das homogene Gleichungssystem (B − λi A)~vi = 0. Die Lösung legt die ~vi nur bis
auf einen i-abhängigen Faktor fest.7 Diese m Faktoren können so gewählt werden,
daß die obigen Gleichungen (4.5) bzw. (4.6) gelten.
Wir verwenden nun das Gelernte, um unser mechanisches Problem gekoppelter Schwingungen mit kleiner Amplitude weiter zu untersuchen. Gehen wir in der
Lagrangefunktion Gl. (4.2) von den qi zu den neuen verallgemeinerten Koordinaten q̄i = ~vi · A~q über, so gilt in diesen Normalkoordinaten
m
L=
1X 2
q̄˙i − λi q̄i2
2 i=1
und die zugehörigen Lagrangegleichungen
q̄¨i = −λi q̄i ,
i = 1, 2, . . . , m
~i dimensionslos sind, während die Einträge
Beachten sie, daß die orthonormalen Vektoren V
der ~vi über A−1/2 dimensionsbehaftet sind.
7
Wir weisen noch einmal darauf hin, daß die Komponenten der ~vi im Allgemeinen dimensionsbehaftet sind.
6
90
KAPITEL 4. SCHWINGUNGEN UND SAITEN
entkoppeln. Bei der Lösung der entkoppelten Bewegungsgleichungen müssen wir
die Fälle λi > 0, λi = 0 und λi < 0 unterscheiden. Die allgemeinen Lösungen
lauten
λi = ωi2 > 0 : q̄i (t) = c1 cos (ωi t) + c2 sin (ωi t) ,
λi = 0 : q̄i (t) = c1 + c2 t ,
λi = −ki2 < 0 : q̄i (t) = c1 cosh (ki t) + c2 sinh (ki t) ,
mit den (i-abhängigen) Konstanten c1 und c2 . Der Fall λi > 0, für alle i =
1, 2, . . . , m, in dem alle Normalkoordinaten q̄i eine periodische Bewegung vollführen,
ist von besonderem Interesse. In diesem Fall heißen die ωi die Eigenfrequenzen
(oder Normalfrequenzen) der Bewegung. Die beiden oben angesprochenen Beispiele (System aus zwei Massen und drei hookeschen Federn und gekoppelte Pendel
bei kleiner Auslenkung) fallen in diese Klasse. Für beliebige Anfangsbedingungen
qi (0) und q̇i (0) lautet die Lösung dann
~q(t) =
m
X
i=1
qi (t)~ei =
m X
i=1
1 ˙
(~q(0) · A~vi ) cos (ωi t) +
~q(0) · A~vi sin (ωi t) ~vi .
ωi
Die Lösung unseres mechanischen Problems kann somit als Überlagerung von
Eigenschwingungen geschrieben werden. Falls die Eigenfrequenzen nicht in einem rationalen Verhältnis zueinander stehen, resultiert jedoch keine periodische
Bewegung.
Es bietet sich an, die Diskussion der kleinen, gekoppelten Schwingungen als
Startpunkt für eine tiefere Analyse der bereits im letzten Semester eher oberflächlich behandelten nicht-linearen Systeme und der chaotischen Bewegung zu
nutzen. Aus Zeitgründen können wir hier leider nicht darauf eingehen und verweisen auf die entsprechende Literatur. Ebenfalls böte es sich an, noch einmal
zeitlich getriebene Systeme zu untersuchen (z.B. die parametrische Resonanz).
Auch darauf müssen wir hier aus Zeitgründen verzichten.
4.2
Schwingende Saiten
Als kurzen Ausflug in die Kontinuumsmechanik wollen wir hier sehr knapp die
Bewegung einer gespannten Saite betrachten. Diese Überlegungen werden uns auf
die Wellengleichung führen, die im Kontext der elektromagnetischen Wellen eine
wichtige Rolle in der Theorievorlesung des nächsten Semesters spielen wird. Wir
nehmen an, daß die Saite in der Ruhelage entlang der x-Achse liegt. Die Position
der Saite zu einer festen Zeit können wir nun durch die Auslenkung u(x) von der
x-Achse (also in die y-Richtung) beschreiben. Wir gehen davon aus, daß die Auslenkung klein ist (was das genau bedeutet; siehe später). Die Bedingung, daß die
Saite endlich ist und an den Enden z.B. eingespannt ist, werden wir erst später in
4.2. SCHWINGENDE SAITEN
91
unsere Überlegungen einbeziehen. Eine verwandte diskrete Beschreibung würde
darin bestehen, die Saite in endliche Segmente zu zerlegen und jedes durch einen
Massepunkt zu beschreiben. In diesem Fall würde die kontinuierliche Auslenkfunktion u(x) in einen Satz diskreter Punkte ui , i = 1, 2, . . . , n, übergehen. Die
Bewegung ui (t) würde dann gemäß der Newtonschen oder Lagrangeschen Mechanik und nach Spezifikation der Kräfte durch einen Satz gekoppelter gewöhnlicher
Differentialgleichungen (siehe z.B. den letzten Abschnitt) beschrieben. Wie wir
sehen werden, wird aus diesem System im Kontinuumsfall ui (t) → u(x, t) eine
partielle Differentialgleichung, welche partielle Ableitungen nach t und x enthält.
Um die Bewegungsgleichung für die Saitenbewegung zu bestimmen, betrachten wir ein kleines Segment der Saite, welches zwischen x und x + ∆x liegt. Zur
Vereinfachung vernachlässigen wir die Gravitation und nehmen an, daß die Auslenkung für alle x und t so klein ist, daß die Saite fast parallel zur x-Achse bleibt.
Damit wird die Länge der Saite fast nicht verändert und die Saitenspannung T
bleibt für alle x und t die gleiche. Die Kraft F~ auf ein Segment der Saite ist
damit durch die Summe der Spannungskräfte durch die benachbarten Segmente
gegeben.
x+∆x
x
x
φ+∆φ
φ
Entsprechend der Skizze gilt für die Komponente der Kraft F1 in x-Richtung
F1 = T cos (φ + ∆φ) − T cos φ ,
wobei φ der Winkel zwischen der x-Achse und der Saite ist. Da φ und φ+∆φ beide
sehr klein sind, können wir den Cosinus entwickeln und bekommen zu führender
Ordnung F1 = 0. Die Kraft in x-Richtung verschwindet also, was konsistent mit
der Annahme ist, daß die Bewegung nur in y-Richtung stattfindet. Für die Kraft
F2 in y-Richtung gilt
F2 = T sin (φ + ∆φ) − T sin φ ≈ T ∆φ cos φ
∂φ
≈ T ∆x .
∂x
Die auftretende Ableitung ist eine partielle, da φ = φ(x, t). Nutzen wir noch
einmal aus, daß φ klein sein soll, so gilt φ = ∂u/∂x und es ergibt sich
∂ 2u
F2 ≈ T 2 ∆x .
∂x
92
KAPITEL 4. SCHWINGUNGEN UND SAITEN
Nach Newtons zweitem Gesetz gilt F2 = ma2 , mit der Beschleunigung a2 in yRichtung. Diese ist durch a2 = ∂ 2 u/∂t2 gegeben. Für die Masse m des Saitensegments gilt m = µ∆x, mit der Massedichte µ. Damit folgt die Bewegungsgleichung
2
∂ 2u
2 ∂ u
=
c
,
∂t2
∂x2
mit
c2 =
T
.
µ
Man nennt diese Gleichung die eindimensionale Wellengleichung , da ihre Lösung
eine Welle entlang der Saite beschreibt (siehe unten). Sie ist eine partielle Differentialgleichung. Die Größe c hat die Dimension einer Geschwindigkeit und
beschreibt die Geschwindigkeit, mit der sich die Welle ausbreitet (siehe unten).
Die Wellengleichung und ihr dreidimensionales Analogon
∂ 2u
~ 2 u = c2 ∆u ,
= c2 ∇
∂t2
beschreibt die Bewegung einer Vielzahl von Wellen, wie z.B. Schallwellen und
elektromagnetische Wellen.
Wir werden nun zeigen, daß es zwei fundamentale Lösungen der Wellengleichung gibt: Störungen u(x, t) , die sich forminvariant von links nach rechts oder
anders herum ausbreiten. Um dieses zu sehen, führen wir die Variablen v = x − ct
und w = x + ct ein. Wie sie in einer Übungsaufgabe zeigen werden, gilt dann
∂ ∂u
=0
∂v ∂w
(4.7)
mit u(x, t) = u(x(v, w), t(v, w)). Um diese Gleichung zu lösen, führen wir h =
∂u/∂w ein, so daß
∂h
=0.
∂v
Damit hängt h nicht von v (jedoch von w) ab und es folgt
∂u
= h(w) .
∂w
Für jedes v können wir diese integrieren und erhalten
Z w
u=
h(w0 )dw0 + f (v) = g(w) + f (v) .
w0
4.2. SCHWINGENDE SAITEN
93
Durch Einsetzen in Gl. (4.7) kann man sofort verifizieren, daß diese Form die Differentialgleichung erfüllt. Damit hat die allgemeine Lösung8 der Wellengleichung
die Form
u(x, t) = f (x − ct) + g(x + ct) ,
wobei g und f (im Sinne des Physikers) beliebige Funktionen sind. Um besser zu
verstehen, welche Form die Lösung hat, betrachten wir zunächst den Fall g = 0.
Dann gilt
u(x, t) = f (x − ct) .
Zur Zeit t = 0 ist u(x, 0) = f (x). Die Tatsache, daß u nur eine Funktion von
x − ct ist, bedeutet, daß sich die Störung ausgehend von der Zeit t = 0 mit der
Geschwindigkeit c nach rechts ausbreitet (jedenfalls dann, wenn c > 0, was wir
so wählen können), die Form aber invariant ist. Analog ergibt sich, daß für f = 0
die Störung forminvariant nach links propagiert. Die allgemeine Lösung ist eine
Superposition einer nach rechts und einer nach links laufenden Welle. Um eine
spezielle Lösung zu bestimmen, müssen wir u(x, 0) und die Geschwindigkeit
∂u(x, t) ∂t t=0
vorgeben, wobei wir ohne Einschränkung der Allgemeinheit angenommen haben,
daß t = 0 unserer Anfangszeit entspricht.
Eine besondere Lösung ist
u(x, t) = A sin [k(x − ct)] = A sin (kx − ωt) ,
wobei A und k beliebige relle Konstanten sind und ω = kc gilt. Diese Lösung
beschreibt eine sinusförmige Welle, die sich nach rechts ausbreitet und eine Amplitude A, Wellenlänge λ = 2π/k und Kreisfrequenz ω hat. Eine analoge sich
nach links ausbreitende Welle ist durch
u(x, t) = A sin [k(x + ct)] = A sin (kx + ωt)
beschrieben. Die Summe dieser beiden Lösungen
u(x, t) = A sin (kx − ωt) + A sin (kx + ωt) = 2A sin (kx) cos (ωt)
ist ebenfalls eine Lösung der Wellengleichung und hat die bemerkenswerte Eigenschaft, daß sie nicht propagiert. An jedem festen Punkt x bewegt sich die
Saite gemäß cos (ωt) mit der Amplitude 2A sin (kx) auf und ab. Speziell an den
8
Wir gehen hier nicht weiter auf die recht komplexe Lösungstheorie partieller Differentialgleichungen ein.
94
KAPITEL 4. SCHWINGUNGEN UND SAITEN
so genannten Knoten, den Orten, an denen sin (kx) = 0 (also bei xn = nπ/k mit
n ∈ Z) , bewegt sich die Saite gar nicht. Man nennt diese Lösung eine stehende
Welle.
Bisher sind wir implizit davon ausgegangen, daß unsere Saite unendlich lang
ist, oder zumindest so lang, daß Randeffekte keine Rolle spielen. In Gegenwart
von Enden ergeben sich zusätzliche Randbedingungen. Abhängig von der Natur
der Enden (z.B. eingespannt oder frei) ergeben sich unterschiedliche Randbedingungen. Hier werden wir nur den Fall betrachten, daß die Saite der Länge L an
beiden Enden eingespannt ist und damit u(0, t) = 0 = u(L, t) für alle Zeiten t
gelten muß. Man überzeugt sich leicht davon, daß
u(x, t) = A sin (kx) cos (ωt)
mit
k = kn = n
π
,
L
ω = ωn = cn
π
,
L
n∈Z
eine Lösung ist, die die Randbedingungen erfüllt. In einer Übungsaufgabe werden
sie dieses Problem genauer analysieren.
Nach diesem kurzen Exkurs in die Kontinuumsmechanik wollen wir nun auf
die Hamiltonsche Beschreibung der Mechanik kommen.
Kapitel 5
Hamiltonsche Mechanik
Die Lagrangeschen Bewegungsgleichungen bilden für ein holonomes System mit
m Freiheitsgraden einen Satz von m (gekoppelten) Differentialgleichungen zweiter
Ordnung. Wie wir bereits im Mathematikteil der Vorlesung des letzten Semesters
gesehen haben, ist es immer möglich aus diesem Differentialgleichungssystem eines erster Ordnung, aber mit 2m Gleichungen, zu machen, was jedoch nicht notwendigerweise ein Vorteil sein muß. Wie wir folgend sehen werden, geschieht
dieser Prozess beim Übergang von den Lagrangeschen zu den Hamiltonschen Bewegungsgleichungen auf eine wohldefinierte, kanonische (also mustergültige) Art.
Erst wenn wir die spezifische Form der Bewegungsgleichungen hergeleitet haben,
wird klar werden, wieso die 2m Gleichungen erster Ordnung eine vorteilhafte
mathematische Beschreibung darstellen. In der Hamiltonschen Mechanik steht
die Hamiltonfunktion im Fokus, die wir bereits in den Überlegungen zur Energieerhaltung (bzw. Erhaltungsgrößen allgemein) im Lagrangeschen Formalismus
kennen gelernt haben. Wie wir gesehen haben, entspricht die Hamiltonfunktion im Fall von holonom-skleronomer Zwangsbedingungen der Gesamtenergie des
betrachteten Systems, hat also im Gegensatz zur Lagrangefunktion eine klare
physikalische Bedeutung und ist für zeitunabhängige Potentiale eine Erhaltungsgröße.1 Wie die Lagrangesche Formulierung ist auch die Hamiltonsche äquivalent
zum Newtonschen Zugang, jedoch ist sie noch flexibler im Hinblick auf die Wahl
der Koordinaten als der Lagrangeformalismus. Zwangsbedingungen können analog zum Lagrangeformalismus eingebaut werden. Der Hamiltonsche Zugang ist
ebenfalls ideal zur Behandlung weiterer Erhaltungsgrößen. Wir werden diese und
weitere Vorteile der Hamiltonschen Formulierung im Laufe der Diskussion genauer kennen lernen und beleuchten.
Neben den eher technischen Vorteilen ermöglicht uns die Hamiltonsche Mechanik eine andere Darstellung der Struktur der klassischen Mechanik. Von der
Hamiltonschen Formulierung führt ein (direkter) Weg zur Quantenmechanik und
sie liefert die Grundlage der statistischen Mechanik, was weitere Begründungen
1
Dies könnte man bereits als einen der Vorteile der Hamiltonschen Mechanik gegenüber der
Lagrangeschen Mechanik bezeichnen.
95
96
KAPITEL 5. HAMILTONSCHE MECHANIK
dafür liefert, daß es wichtig ist auch den Hamiltonformalismus kennen zu lernen.
5.1
Variable, Bewegungsgleichungen und zyklische Koordinaten
Da wir die Hamiltonfunktion ja bereits im Rahmen des Lagrangeformalismus
eingeführt haben, sollte offensichtlich sein, daß dieser einen guten Startpunkt
bildet. Wir hatten die m kanonischen Impulse als
pi =
∂L
∂ q̇i
definiert, wobei L = L(q, q̇; t) gilt. Wir werden nun annehmen,2 daß man diese
Gleichung nach den m q̇i auflösen kann und so
q̇i = q̇i (q, p; t)
erhält. Dann definiert man die Hamiltonfunktion – eine Funktion der m qi , der
m pi und der Zeit t, als
H(q, p; t) =
X
pi q̇i (q, p; t) − L(q, q̇(q, p; t), t) .
i
Man bezeichnet diese Art der Variablentransformation als Legendretransformation.3 Die Hamiltonfunktion ist eine Funktion der m verallgemeinerten Koordinaten qi und der m verallgemeinerten (kanonischen) Impulse pi (sowie eventuell der
Zeit). Den Raum der 2m Variablen (q, p) bezeichnet man als den Phasenraum.
Diesen Begriff haben wir bereits im letzten Semester kennen gelernt. In den dortigen eindimensionalen Beispielen haben wir die Ebene (x, ẋ) als den Phasenraum
bezeichnet. Ein Punkt im Phasenraum charakterisiert den Zustand des mechanischen Systems eindeutig.
Wir wollen nun die fundamentalen Bewegungsgleichungen bestimmen. Dazu
2
In der Praxis stellt dies keine starke Einschränkung dar.
Im Tutorium wurde die Legendretransformation in einem allgemeineren Kontext diskutiert.
Sie spielt speziell in der Thermodynamik eine sehr zentrale Rolle.
3
5.1. VARIABLE, BEWEGUNGSGLEICHUNGEN UND. . .
97
betrachten wir
∂H
∂qj
X ∂ q̇i
∂L ∂ q̇i
∂L
=
−
−
pi
∂qj
∂ q̇i ∂qj
∂qj
i
X
∂ q̇i
∂L
∂ q̇i
− pi
−
=
pi
∂qj
∂qj
∂qj
i
∂L
∂qj
d ∂L
= −
dt ∂ q̇j
d
= − pj
dt
= −ṗj .
= −
Weiterhin gilt
∂H
∂pj
X ∂ q̇i
∂L ∂ q̇i
= q̇j +
−
pi
∂p
∂ q̇i ∂pj
j
i
= q̇j .
Wir haben damit die Hamiltonschen Gleichungen
q̇j =
∂H
∂H
, ṗj = −
∂pj
∂qj
bestimmt. Sie bilden einen Satz von 2m (gekoppelten) Differentialgleichungen erster Ordnung für die Variablen qi und pi der Hamiltonfunktion. Man nennt diese
Gleichungen auch die kanonischen Gleichungen. Die Lösung dieser Bewegungsgleichungen liefert die Phasenraumtrajektorie. Fassen wir die Phasenraumvariable
~ zusammen (Spaltenvektor, der
qi und pi zu einem 2m dimensionalen Vektor X
sich durch Untereinanderschreiben der qi und pi ergibt), so haben die Bewegungsgleichungen die einfache Form
~˙ = ~h(X;
~ t) .
X
~ indiziert einen eindeutigen Punkt im Phasenraum und bezeichnet
Jeder Punkt X
einen eindeutigen Satz von Anfangsbedingungen unseres Systems. Das System
von Differentialgleichungen, dessen Lösung direkt den Phasenraumfluß liefert, hat
für nicht explizit zeitabhängige H die besonders einfache Struktur (Ableitung von
~ = (Funktion von X).
~ Dies ist eine Standardform, die in der mathematischen
X)
Literatur häufig untersucht wurde.
Wie wir weiter unten sehen werden, erlauben die Bewegungsgleichungen Koordinatentransformationen – die sogenannten kanonischen Transformationen –
98
KAPITEL 5. HAMILTONSCHE MECHANIK
die die Form der Bewegungsgleichungen invariant lassen und die nicht nur die
verallgeinerten Orte involviert (wie im Lagrangeformalismus), sondern den ge~ Es wird also Transformationen der Form (siehe
samten Phasenraumvektor X.
unten)
Q = Q(q, p; t) ,
P = P (q, p; t)
geben. Dies ist ein großer Unterschied und entscheidener Vorteil gegenüber dem
Lagrangeformalismus. Er schafft eine größtmögliche Flexibilität, welche Variable
man verallgemeinerte Koordinate und welche verallgemeinerten Impuls nennt.
Die beiden Begriffe verschwimmen.
Als Beispiel zum Übergang vom Lagrange- zum Hamiltonformalismus betrachten wir die Lagrangefunktion (holonom-skleronome Zwangsbedingungen)
L=T −V =
1X
q̇i Ai,j (q)q̇j − V (q; t) ,
2 i,j
wobei Ai,j (q) = Aj,i (q). Der kanonischen Impuls ist somit
X
pi =
Ai,j (q)q̇j .
j
Da die kinetische Energie positiv ist, gilt detA > 0, d.h. das Inverse der Matrix
A−1 existiert und es folgt
X
q̇i =
A−1
i,j (q)pj .
j
Wie wir bereits wissen, ist die Hamiltonfunktion in diesem Fall gleich der Energie
H =T +V ,
wobei T aber durch die pi und qi ausgedrückt werden muß
1X
1X
q̇i Ai,j (q)q̇j =
pi A−1
T =
i,j (q)pj .
2 i,j
2 i,j
Im einfachsten Fall eines Teilchens der Masse m (d.h. A = m) in einer Dimension
gilt
T =
p2
.
2m
Ergänzen wir diese kinetische Energie durch ein harmonisches Potential (z.B.
Federschwingung)
1
V = mω02 q 2 ,
2
5.1. VARIABLE, BEWEGUNGSGLEICHUNGEN UND. . .
99
mit der Auslenkung q = x aus der Ruhelage, so folgt die Hamiltonfunktion des
eindimensionalen harmonischen Oszillators
H=
p2
1
+ mω02 q 2 .
2m 2
Die Hamiltonfunktion ist gleich der Gesamtenergie E und eine Erhaltungsgröße.
Die Bewegungsgleichungen lauten
p
∂H
=
⇒ ṗ = mq̈ ,
∂p
m
∂H
ṗ = −
= −mω02 q
∂q
q̇ =
und führen kombiniert auf die uns bekannte Schwingungsgleichung q̈ + ω02 q = 0.
Wie wir bereits wissen, ist H eine Erhaltungsgröße, falls L nicht explizit von
der Zeit abhängt, da
dH
∂L
=−
.
dt
∂t
Diese Beziehung läßt sich auch unter Verwendung der Hamiltonschen Gleichungen
herleiten
X ∂H
dH
∂H
∂H
=
q̇i +
ṗi +
dt
∂qi
∂pi
∂t
i
X
∂L
=
[−ṗi q̇i + q̇i ṗi ] −
∂t
i
= −
∂L
.
∂t
Im Übergang von der ersten zur zweiten Zeile haben wir dabei neben der Bewegungsgleichung ausgenutzt, daß die Ableitung nach der expliziten t-Abhängigkeit
von H durch das negative dieser von L gegeben ist. Verwenden wir nur die erste
Zeile und die Bewegungsgleichung so folgt
dH
∂H
=
.
dt
∂t
Einer der entscheidenen Vorteile des Hamiltonschen Formalismus gegenüber
dem Lagrangeschen wird klar, wenn man zyklische Koordinaten hat. Es sei daran
erinnert, daß man eine Koordinate qi als zyklisch bezeichnet, wenn sie in L nicht
auftritt. In diesem Fall ist der zugehörige kanonische Impuls pi eine Erhaltungsgröße. Aufgrund der Hamiltonschen Bewegungsgleichung
0 = ṗi = −
∂H
∂qi
100
KAPITEL 5. HAMILTONSCHE MECHANIK
und auch die Hamiltonfunktion ist unabhängig von der zyklichen Variablen qi .
Erscheint umgekehrt eine zyklische Variable nicht in H, so ist der zugehörige
kanonische Impuls erhalten. Der Vorteil des Hamiltonschen Zugangs besteht nun
darin, daß man eine zyklische Kooridnate und ihren zugehörigen Impuls in gewissem Sinne ignorieren kann. In der Lagrangefunktion tritt die verallgemeinerte
Geschwindigkeit q̇i zu einer zyklischen Koordinate qi im Allgemeinen noch auf
und wird eine komplexe Zeitabhängigkeit haben, also keine Erhaltungsgröße sein.
Dagegen kann man in der Hamiltonfunktion den Impuls pi zur zyklischen Koordinate qi auf einen konstanten Wert αi setzen und in diesem Sinne das System
um einen Freiheitsgrad von m nach m − 1 reduzieren. Die Konstante αi wird
dann später durch die Anfangsbedingungen festgelegt. Die Zeitabhängigkeit der
zyklischen Variable bestimmt man durch Lösen der Bewegungsgleichung
q̇i =
∂H
.
∂αi
Um dieses Vorgehen zu konkretisieren, nehmen wir an, daß wir die Koordinaten
so umsortiert haben, daß die zyklische Koordinate qm ist. Es gilt also
H = H(q1 , . . . , qm−1 , p1 , . . . , pm−1 , αm ; t)
und man hat nur noch ein Problem mit m − 1 Freiheitsgraden.4 Wenn jetzt
q1 (t), . . . , qm−1 (t), p1 (t), . . . , pm−1 (t) eine Lösung des Problems ist, ergibt sich αm
aus den Anfangsbedingungen und qm (t) durch Integrieren von
∂H
q̇m =
(q1 , . . . , qm−1 , p1 , . . . , pm ; t)
.
∂pm
pm =αm
Sind alle Koordinaten zyklisch, d.h. H = H(p; t), so folgt pi = αi = const. für
alle i. Man gewinnt die αi aus den Anfangsbedingungen (die αi sind Integrationskonstanten) und die qi (t) durch Integrieren von
∂H
q̇i =
(p1 , . . . , pm ; t)
= ωi (t) .
∂pi
p=α
Diese Gleichungen lassen sich leicht lösen
Z t
qi (t) =
ωi (t0 ) dt0 + ci ,
t0
4
Im Routhschen Formalismus trägt man der Tatsache Rechnung, daß der Übergang vom
Lagrangeschen zum Hamiltonschen Formalismus speziell für zyklische Koordinaten vorteilhaft
ist. Man führt dabei die Legendretransformation von den q̇i zu den pi nur für die zu zyklischen
Koordinaten gehörenden Indizes aus und endet somit bei einem teilweise Hamiltonschen und
teilweise Lagrangeschen Zugang. Wir werden diese Überlegungen hier nicht weiter verfolgen
und verweisen auf die Literatur.
5.2. DIE POISSONKLAMMERN
101
mit den Konstanten ci . Hängt H zusätzlich nicht explizit von der Zeit ab, so folgt
ωi (t) = ωi = const. und damit
qi (t) = ωi t + c̃i ,
mit einer anderen Konstanten c̃i . Man könnte geneigt sein, diese Situation (alle
Koordinaten sind zyklisch) als rein akademisch anzusehen, denn es wird bei einer ersten Wahl der verallgemeinerten Koordinaten kaum der Fall sein, daß alle
diese zyklisch sind. Wenn wir jedoch später die bereits angesprochenen allgemeinen Koordinatentransformationen auf dem Phasenraum einführen, so könnte es
gelingen, daß alle neuen Koordinaten in der Tat zyklisch sind.5
In einem nächsten Schritt wollen wir das Konzept der Poissonklammern einführen.
5.2
Die Poissonklammern
Die zeitliche Änderung einer Funktion F (q(t), p(t); t) der kanonischen Variablen6
läßt sich mit Hilfe der Hamiltonschen Gleichungen wie folgt schreiben
X ∂F
∂F
∂F
dF
=
q̇i +
ṗi +
dt
∂qi
∂pi
∂t
i
X ∂F ∂H
∂F ∂H
∂F
=
−
+
∂qi ∂pi
∂pi ∂qi
∂t
i
= {F, H}q,p +
∂F
,
∂t
(5.1)
wobei wir die sogenannten Poissonklammern
X ∂F ∂G ∂F ∂G {F, G}q,p =
−
∂qi ∂pi ∂pi ∂qi
i
für zwei Funktionen F und G der kanonischen Koordinaten definiert haben. Im
Folgenden werden wir den Index, der auf den Satz der Koordinaten (q, p) hinweist
meist, weglassen und auf die Abhängigkeit vom Koordinatensatz später eingehen.
Gemäß dieser Definition gilt (wie man direkt nachrechnet)
1. {F, G} = −{G, F }
(Antisymmetrie)
2. {c1 F1 +c2 F2 , G} = c1 {F1 , G}+c2 {F2 , G} mit beliebigen Konstanten c1 , c2
(Linearität)
5
Man verschiebt dabei die Schwierigkeit des Lösens von Systemen von Differentialgleichungen auf das algebraische Problem des Findens der richtigen Transformation. Die richtige Transformation zu finden ist dabei keineswegs trivial.
6
Dabei sollen q(t) und p(t) der Bewegungsgleichung genügen.
102
KAPITEL 5. HAMILTONSCHE MECHANIK
3. {c, F } = 0 für beliebige Konstante c
4. {F1 , {F2 , F3 }} + {F2 , {F3 , F1 }} + {F3 , {F1 , F2 }} = 0
(Jacobi-Identität)
5. {F, G1 G2 } = {F, G1 }G2 + G1 {F, G2 }
Eine wichtige Rolle in der Hamiltonschen Theorie spielen die mit den kanonischen
Variablen gebildeten Poissonklammern, die sogenannten fundamentalen Poissonklammern
X ∂qk ∂pl ∂qk ∂pl X
−
=
δk,i δl,i = δk,l
{qk , pl } =
∂qi ∂pi
∂pi ∂qi
i
i
und (ist gemäß der Definition trivial)
{qk , ql } = 0 , {pk , pl } = 0 .
Wählt man jetzt in Gl. (5.1) F = qi bzw. F = pi , so folgt
q̇i = {qi , H} ,
ṗi = {pi , H} .
Die Bewegungsgleichungen lassen sich somit elegant mit Hilfe der Poissonklammern schreiben.
Ein wichtiger Punkt ist nun, daß man die fünf Rechenregeln der Poissonklammern und die fundamentalen Poissonklammern bei Rechnungen verwenden kann,
ohne direkten Bezug zur Definition der Poissonklammern (also zu ihrer konkreten
Realisierung) zu machen. Wir wollen das anhand des Aufstellens der Bewegungsgleichungen für den eindimensionalen harmonischen Oszillator illustrieren. Für
diesen gilt
H=
1
p2
+ cq 2 ,
2m 2
mit q = x. Damit folgt
q̇ = {q, H}
1
1
1
p2
= {q,
+ cq 2 } =
{q, p2 } + c{q, q 2 }
2m 2
2m
2
1
1
=
[p{q, p} + {q, p}p] + c [q{q, q} + {q, q}q]
2m
2
p
=
m
sowie
ṗ = {p, H}
p2
1
1
1
= {p,
+ cq 2 } =
{p, p2 } + c{p, q 2 }
2m 2
2m
2
1
1
=
[p{p, p} + {p, p}p] + c [q{p, q} + {p, q}q]
2m
2
= −cq .
5.2. DIE POISSONKLAMMERN
103
Dies sind natürlich die bekannten Bewegungsgleichungen für das vorliegende Problem. Bei der Ableitung haben wir aber nirgends differenziert oder von der Definition der Poissonklammern Gebrauch gemacht. Sind die fünf Rechenregeln der
Poissonklammern, die fundamentalen Poissonklammern sowie dF/dt = {F, H} +
∂F
also anders als hier realisiert, so würde das gleiche Ergebnis folgen. Genau dies
∂t
ist in der Quantenmechanik der Fall. Dort werden die physikalischen Observablen
Ort und Impuls zu linearen Operatoren auf einem Vektorraum mit speziellen Eigenschaften (einem sogenannten Hilbertraum). Das Klammersymbol (mit allen
seinen obigen Eigenschaften) ist für zwei solcher Operatoren  und B̂ durch
{Â, B̂} =
1
1
(ÂB̂ − B̂ Â) = [Â, B̂]
i~
i~
realisiert. Man nennt [. . . , . . .] den Kommutator. Die Konstante ~ = h/(2π) ist
durch das Plancksche Wirkungsquantum h = 6.626 · 10−34 Js gegeben. Die abgeleiteten Bewegungsgleichungen für den klassischen harmonischen Oszillator gelten
dann völlig analog in der Quantenmechanik für den Orts- und den Impulsoperator.
Ebenfalls völlig analog gilt die Bewegungsgleichung (5.1) für einen allgemeinen
Operator Â(t)
1
∂ Â
dÂ
= [Â, Ĥ] +
,
dt
i~
∂t
(5.2)
wobei Ĥ der Hamiltonoperator ist, der sich nach einem bestimmten Konstruktionsprinzip (Korrespondenzprinzip; siehe die Theorie–III–Vorlesung) aus der Hamiltonfunktion ergibt.
Aus Gl. (5.1) schließt man sofort, daß F (q(t), p(t); t) eine Erhaltungsgröße ist,
wenn
{F, H} +
∂F
=0
∂t
bzw. für nicht explizit von der Zeit abhängige F
{F, H} = 0 .
Insbesondere gilt
dH
∂H
∂H
= {H, H} +
=
,
dt
∂t
∂t
da nach der Definition der Poissonklammern trivialerweise {H, H} = 0. Die Beobachtung, daß die totale Ableitung der Hamiltonfunktion nach der Zeit gleich
der partiellen ist, ist uns schon begegnet. Wir können somit (erneut) schließen,
daß H genau dann eine Erhaltungsgröße ist, wenn H nicht explizit von der Zeit
abhängt.
104
KAPITEL 5. HAMILTONSCHE MECHANIK
Ebenfalls ohne explizite Verwendung der Definitionsgleichung des Klammersymbols kann man zeigen, daß
d
{F, G} =
dt
lim ({F (t + ∆t), G(t + ∆t)} − {F (t), G(t)}) /∆t
F (t + ∆t) − F (t)
= lim
, G(t + ∆t)
∆t→0
∆t
G(t + ∆t) − G(t)
+ F (t),
∆t
dF
dG
=
, G + F,
,
dt
dt
∆t→0
wobei wir die Linearität der Poissonklammern verwendet haben. Aus dieser Überlegung folgt das Poissonsche Theorem, welches besagt, daß mit F und G auch
{F, G} eine Erhaltungsgröße ist. Dabei ist jedoch keinesfalls klar, daß {F, G}
eine neue Erhaltungsgröße (ein neues Bewegungsintegral) liefert. Es kann z.B.
vorkommen, daß man {F, G} = c + f (F, G) mit einer Konstanten c und der
Funktion f schreiben kann. Wenn F und G Erhaltungsgrößen sind, ist die rechte
Seite trivialerweise eine Erhaltungsgröße.
Wir betrachten nun zwei jeweils kanonisch konjugierte Variablensätze (q, p)
und (Q, P ) = (Q(q, p), P (q, p)), d.h. für beide Variablensätze sollen jeweils die
Hamiltonschen Bewegungsgleichungen gelten, wobei man bezüglich (q, p) die Funktion H(p, q; t) und bezüglich (Q, P ) die Funktion
H̄(Q, P ; t) = H(q(Q, P ), p(Q, P ); t)
zu nehmen hat. Die Transformation zwischen den Variablensätzen hänge an dieser
Stelle nicht explizit von der Zeit ab.7 Die Variablen (q, p) erfüllen die fundamentalen Poissonklammern (bezüglich (q, p)). Wir werden nun zeigen, daß in diesem Fall
auch die (Q, P ) die fundamentalen Poissonklammern (bezüglich (q, p)) erfüllen8
{Qk , Pl }q,p = δk,l , {Qk , Ql }q,p = 0 , {Pk , Pl }q,p = 0 .
7
Im nächsten Abschnitt betrachten wir die Transformationen genauer.
Die kanonischen Variablen (Q, P ) erfüllen natürlich die fundamentalen Poissonklammern
bezüglich (Q, P ).
8
5.3. KANONISCHE TRANSFORMATIONEN
105
Wir betrachten dazu
Q̇i =
=
=
=
X
m m X
d
∂Qi
∂Qi ∂H
∂Qi
∂Qi ∂H
Qi (q(t), p(t)) =
q̇k +
ṗk =
−
dt
∂qk
∂pk
∂qk ∂pk
∂pk ∂qk
k=1
k=1
X ∂Qi ∂ H̄ ∂Ql ∂ H̄ ∂Pl
∂Qi ∂ H̄ ∂Ql ∂ H̄ ∂Pl
+
−
+
∂q
∂Q
∂P
∂p
∂Q
∂Pl ∂qk
k
l ∂pk
l ∂pk
k
l ∂qk
k,l
X ∂ H̄ ∂Qi ∂Ql ∂Qi ∂Ql
∂ H̄ ∂Qi ∂Pl ∂Qi ∂Pl
−
+
−
∂Ql ∂qk ∂pk
∂pk ∂qk
∂Pl ∂qk ∂pk
∂pk ∂qk
k,l
X
−Ṗl {Qi , Ql }p,q + Q̇l {Qi , Pl }p,q .
l
Ein Vergleich der beiden Seiten zeigt, daß
{Qi , Pl }q,p = δi,l , {Qk , Ql }q,p = 0 .
Die fehlende Gleichung folgt analog, wenn man Ṗi betrachtet. Man kann direkt
nachrechnen (tun sie es!!), daß für die obigen beiden Variablenpaare alle Poissonklammern invariant sind, d.h.
{F, G}Q,P = {F, G}q,p
gilt. Wie oben schon angedeutet, kann man somit die Indizes an den Klammern
weglassen, wenn man sich nur auf kanonische Variablen beschränkt.9
5.3
Kanonische Transformationen
In diesem Abschnitt werden wir die bereits oben angesprochenen Transformationen auf dem Phasenraum betrachten, die es erlauben, die verallgemeinerten
Koordinaten und kanonischen Impulse zu vermischen. Dabei sollen die Hamiltonschen Bewegungsgleichungen natürlich invariant bleiben. Wir wollen zunächst
daran erinnern, daß man im Lagrangeformalismus mit Transformationen der
Form qi → q̄i (q; t) zu tun hat, die die Bewegungsgleichungen invariant lassen
(andere Wahl der verallgemeinerten Koordinaten). Wie wir im Abschnitt über
das Hamiltonsche Prinzip weiterhin gesehen haben, sind die Lagrangeschen Bewegungsgleichungen, die sich aus L und cL + dG(q; t)/dt, mit einer beliebigen
Funktion G(q; t), ergeben, identisch.
Wir wollen zunächst überprüfen, in wie weit sich die zweite Invarianz auf
den Hamiltonformalismus übertragen läßt und betrachten daher ein modifiziertes
9
Die Bewegungsgleichung hat also für beide Variablensätze dieselbe Form. Wir betonen
noch einmal, daß wir uns bisher auf Transformationen zwischen kanonischen Variablenpaaren
beschränkt haben, die nicht explizit von der Zeit abhängen.
106
KAPITEL 5. HAMILTONSCHE MECHANIK
Hamiltonsches Prinzip. Wie wir oben gezeigt haben, wird das Wirkungsfunktional
Z
t2
L(q(t), q̇(t); t) dt
S=
t1
bei festgehaltenem q(t1 ) und q(t2 ) entlang der physikalischen Bahn extremal.
Kurz schreibt man dafür oft
δS = 0 .
Formal ersetzen wir nun im Ausdruck für das Wirkungsfunktional L durch die
Hamiltonfunktion
#
Z t2 "X
m
S=
pj q̇j − H(q, p; t) dt .
t1
j=1
Da nun die p gleichberechtigten Variablen neben den q sind, hat die Variation der
Bahn in einem Extremalprinzip nun im Phasenraum zu erfolgen. Wir betrachten
daher Phasenraumtrajektorien, die ein wenig von der physikalischen Trajektorie
abweichen. In Verallgemeinerung der Überlegungen von Seite 68 betrachten wir
qj (t; α) = qj (t) + ηj (t; α) ,
pj (t; α) = pj (t) + γj (t; α)
mit
ηj (t1 ; α) = 0 = ηj (t2 ; α) ∀α ,
ηj (t; α = 0) = 0 ; γj (t; α = 0) = 0
und der physikalischen Trajektorie (q(t), p(t)). Dabei sollen die ηj (t; α) und γj (t; α)
für α → 0 mindestens linear verschwinden. Es ist wichtig zu beachten, daß die
γj (t; α) im Gegensatz zu den ηj (t; α) bei t1 und t2 nicht verschwinden müssen.
Wir betrachten
# Z t2 "X
m
d
dS =
pi (t; α)q̇i (t; α) − H(q(t; α), p(t; α); t) dt
=0.
dα α=0
dα t1
i=1
α=0
Völlig analoge Schritte wie bei der Herleitung des Hamiltonschen Prinzips führen
uns dann auf die Hamiltonschen Bewegungsgleichungen.
Aus dieser Konstruktion der Hamiltonschen Bewegungsgleichungen wird damit sofort klar, daß auch diese (wie die Lagrangeschen Bewegungsgleichungen)
invariant gegenüber Koordinatentransformationen qi → q̄i (q; t) sind, wenn man
den verallgemeinerten Impuls
pi =
∂L
∂ L̄
→ p̄i =
∂ q̇i
∂ q̄˙i
5.3. KANONISCHE TRANSFORMATIONEN
107
˙ t) = L(q(q̄; t), q̇(q̄, q̄;
˙ t); t). Wie wir sehen
geeignet mit transformiert, wobei L̄(q̄, q̄;
werden (und bereits mehrfach angedeutet haben), kann man im Hamiltonformalismus jedoch allgemeinere Transformation betrachten, die die Bewegungsgleichungen invariant lassen.
Wir wollen als nächstes zeigen, daß auch die Hamiltonschen Bewegunsgleichungen invariant unter L → L̃ = L + dG(q; t)/dt sind. Wir definieren den zu L̃
gehörenden verallgemeinerten Impuls
∂L
∂ d
∂ L̃
=
+
G(q; t)
∂ q̇j
∂ q̇j ∂ q̇j dt
"
#
m
X
∂L
∂
∂
∂G(q; t)
=
+
G(q; t) +
q̇i
∂ q̇j ∂ q̇j ∂t
∂qi
i=1
p̄j =
= pj +
∂G(q; t)
.
∂qj
(5.3)
Mit diesem konstruieren wir die neue Hamitonfunktion (q̄j = qj )
X
X
∂G(q; t)
dG
H̄ =
p̄j q̄˙j − L̃ =
pj +
q̇j − L −
∂qj
dt
j
j
= H+
X ∂G(q; t)
j
= H−
∂qj
q̇j −
X ∂G(q; t)
i
∂qi
q̇i −
∂
G(q; t)
∂t
∂
G(q; t) .
∂t
Mit der neuen Hamiltonfunktion H̄ = H(q = q̄, p(q, p̄; t); t) − ∂G/∂t, mit
pj = p̄j −
∂G(q; t)
,
∂qj
verifizieren wir jetzt die kanonischen Bewegungsgleichungen
∂ H̄
∂ q̄j
∂ H̄
∂H X ∂H ∂pi
∂ 2G
=
+
−
∂qj
∂qj
∂pi ∂qj
∂qj ∂t
i
X ∂ 2G
∂ 2G
= −ṗj −
q̇i
−
∂qj ∂qi ∂qj ∂t
i
=
= −ṗj −
d ∂
G(q; t) .
dt ∂qj
Mit Gl. (5.3) folgt also
∂ H̄
= −p̄˙j .
∂ q̄j
108
KAPITEL 5. HAMILTONSCHE MECHANIK
Es gilt ebenfalls
∂ H̄
∂ p̄j
=
X ∂H ∂pi
∂H
=
= q̇j
∂pi ∂ p̄j
∂pj
i
und damit
∂ H̄
= q̄˙j .
∂ p̄j
Die Bewegungsgleichungen sind somit invariant.
Ganz nebenbei haben wir in den letzten Überlegungen gezeigt, daß für einen
gegebenen Satz von kanonischen Variablen pj , qj auch
Q j = qj , P j = pj +
∂
G(q; t)
∂qj
(5.4)
für beliebiges G(q; t) kanonisch konjugierte Variablen sind. Die Vorgabe von qj
legt somit die dazu kanonisch konjugierten Impulse nicht eindeutig fest.
Da im Hamiltonformalismus neben den qj die pj eine gleichberechtigte Rolle
spielen, ist die Klasse der Transformationen, die die Bewegungsgleichungen invariant, lassen sehr viel größer als im Lagrangeformalismus.10 Wir betrachten also
allgemeine Transformationen
Q = Q(q, p; t) ,
P = P (q, p; t) .
Interessant für uns sind nur solche Transformationen, die die Bewegungsgleichungen invariant lassen. Wir definieren daher die Klasse der kanonischen Transformationen, für die es eine Funktion H̄ = H̄(Q, P ; t) gibt, so daß (j = 1, 2, . . . , m)
Q̇j =
∂ H̄
∂ H̄
, Ṗj = −
∂Pj
∂Qj
gilt. Wie das H̄ aus dem H hervorgeht, spielt dabei keine Rolle. Gilt
H̄(Q, P ; t) = H(q(Q, P ; t), p(Q, P ; t); t) ,
so wollen wir die Transformation kanonisch im engeren Sinn nennen. Bereits oben
haben wir gezeigt, daß Transformationen des Typs L → L̃ = L + dG(q; t)/dt
bzw. H → H̄ = H(q = q̄, p(q, p̄; t); t) − ∂G(q; t)/∂t, sowie die Koordinatentransformationen qi → q̄i (q; t), pi = ∂L/∂ q̇i → p̄i = ∂ L̄/∂ q̄˙i kanonisch sind. Um an
einem Beispiel klar zu machen, daß man durch eine kanonische Transformation
10
Ein Unterraum dieser Transformationen ergibt sich wie zu Beginn dieses Abschnitts beschrieben direkt aus den erlaubten Transformationen im Lagrangeformalismus.
5.3. KANONISCHE TRANSFORMATIONEN
109
die Konzepte verallgemeinerte Koordinate und kanonischer Impuls vermischen
kann, betrachten wir den “extremen” Fall der Transformation
Qj = Qj (q, p; t) = −pj ,
Pj = Pj (q, p; t) = qj .
Bei gegebenem H(q, p; t) folgt dann
H̄(Q, P ; t) = H(P, −Q; t)
und
∂ H̄
∂Pj
∂ H̄
∂Qj
∂H(P, −Q; t)
∂H(q, p; t)
=
= −ṗj = Q̇j ,
∂Pj
∂qj
∂H(P, −Q; t)
∂H(q, p; t)
=
=−
= −q̇j = −Ṗj .
∂Qj
∂pj
=
Damit ist die obige Transformation auf dem Phasenraum kanonisch im engeren
Sinne. Wir sehen, daß die Konzepte verallgemeinerte Koordinate und kanonischer
Impuls im Hamiltonformalismus ihre klare Bedeutung verlieren und die Qj und Pj
völlig gleichberechtigte Variablen sind. Dieses Beispiel deutet weiterhin die große
Flexibilität der Wahl der Variablen im Hamiltonformalismus an. Es macht erneut plausibel, daß es gelingen könnte, alle Qj nach einer geeigneten kanonischen
Transformation zu zyklischen Koordinaten zu machen. In der Hamilton-JacobiTheorie wird diese Überlegung zu einer Lösungsmethode ausgebaut.
Wir wollen als nächstes das modifizierte Hamiltonsche Prinzip dazu nutzen
zu zeigen, daß eine Transformation Q = Q(q, p; t), P = P (q, p; t) kanonisch ist,
falls
m
X
pj q̇j − H =
j=1
m
X
j=1
Pj Q̇j − H̄ +
dF1
,
dt
(5.5)
wobei F1 = F1 (q, Q; t) eine beliebige (hinreichend harmlose) Funktion ist.11 Man
nennt F1 die Erzeugende der Transformation. Wir zeigen zunächst, daß F1 die
Transformation und H̄ eindeutig festlegt. Dazu betrachten wir
dF1 X ∂F1
∂F1
∂F1
=
q̇j +
Q̇j +
.
dt
∂q
∂Q
∂t
j
j
j
Auflösen von Gl. (5.5) liefert
m
dF1 X =
pj q̇j − Pj Q̇j + H̄ − H .
dt
j=1
11
Es sei darauf hingewiesen, daß nicht alle kanonischen Transformationen mit Hilfe einer
Erzeugenden geschrieben werden können.
110
KAPITEL 5. HAMILTONSCHE MECHANIK
Ein Vergleich zeigt, daß
pj =
∂F1
,
∂qj
Pj = −
∂F1
∂F1
, H̄ = H +
.
∂Qj
∂t
(5.6)
Sind nun q, p und F1 vorgegeben, so löst man
pj =
∂F1
= pj (q, Q; t)
∂qj
nach den Qj auf und erhält Qj = Qj (q, p; t). Dieses Ergebnis setzen wir in
Pj = −
∂F1 (q, Q; t)
∂Qj
ein und erhalten so Pj = Pj (q, p; t). Aufgrund der dritten Relation in Gl. (5.6) ist
auch H̄ eindeutig bestimmt. Als nächstes zeigen wir, daß die durch F1 erzeugte
Transformation kanonisch ist. Dazu betrachten wir
!
!
Z t2 X
Z t2 X
m
m
dF1
S =
pj q̇j − H dt =
Pj Q̇j − H̄ +
dt
dt
t1
t
1
j=1
j=1
!
Z t2 X
m
=
Pj Q̇j − H̄ dt + F1 (q(t2 ), Q(t2 ); t2 ) − F1 (q(t1 ), Q(t1 ); t1 ) .
t1
j=1
In der zweiten Zeile müssen wir nun nach den Q und P variieren. Verwenden wir
zusätzlich die zweite der Relationen aus Gl. (5.6), so folgen aus dem modifizierten
Hamiltonschen Prinzip die Hamiltonschen Bewegungsgleichungen (nachrechnen!)
für die Q und P (aus H̄). Damit ist die durch F1 erzeugte Transformation kanonisch.
Mit Hilfe von Legendretransformationen können wir weitere Typen von Erzeugenden finden, die jeweils von einem alten und einem neuen Variablensatz
abhängen
F2 = F2 (q, P ; t)
F3 = F3 (p, Q; t)
F4 = F4 (p, P ; t) .
Dabei entscheidet das vorliegende Problem, welche Form der Erzeugenden am
günstigsten ist. Auch die drei weiteren Formen liefern dabei eindeutig eine kanonische Transformation, wie man analog zum Fall F1 zeigen kann. Wir wollen
dies hier aus Zeitgründen nicht genauer beleuchten, jedoch am Rande erwähnen,
daß kanonische
P Transformationen des Typs L → L̃ = L + dG(q; t)/dt durch
F2 (q, P ; t) = j qj Pj − G(q; t) erzeugt werden (vergleiche mit Gl. (5.4)). Stattdessen wollen wir das Beispiel einer Erzeugenden studieren. Wir betrachten
F1 (q, Q; t) = −
m
X
j=1
qj Q j .
5.3. KANONISCHE TRANSFORMATIONEN
111
und bekommen damit nach Gl. (5.6)
pj =
∂F1
= −Qj ,
∂qj
Pj = −
∂F1
= qj ,
∂Qj
d.h. die bereits oben eingeführte kanonische Transformation, die die verallgemeinerten Koordinaten und kanonischen Impulse vertauscht.
Wir wollen nun zeigen, wie man mit Hilfe einer kanonischen Transformation
die fast vollständig algebraische Lösung eines mechanischen Problems erreichen
kann. Dazu betrachten wir erneut den eindimensionalen harmonischen Oszillator
mit Hamiltonfunktion
H=
p2
1
+ mω02 q 2 .
2m 2
Wir wählen die Erzeugende
1
F1 (q, Q) = mω0 q 2 cot Q .
2
Das liefert nach Gl. (5.6)
p=
∂F1
= mω0 q cot Q ,
∂q
bzw. nach Auflösen nach q und p
r
2P
sin Q ,
q=
mω0
P =−
p=
∂F1
1
1
= mω0 q 2 2 ,
∂Q
2
sin Q
p
2P mω0 cos Q .
Wegen ∂F1 /∂t = 0 gilt für die neue Hamiltonfunktion
1
2P mω0
2P
cos2 Q + mω02
sin2 Q
2m
2
mω0
= ω0 P .
H̄(Q, P ) = H(q(Q, P ), p(Q, p)) =
Damit ist die Koordinate Q zyklisch, was P (t) = P0 = const. bedeutet. Weiterhin
gilt
Q̇ =
∂ H̄
= ω0
∂P
und damit
Q(t) = ω0 t + Q0 .
Eingesetzt liefert das auf nahezu algebraische Art die Lösung des harmoischen
Oszillators
r
2P0
q(t) =
sin (ω0 t + Q0 ) ,
mω0
p
p(t) =
2P0 mω0 cos (ω0 t + Q0 ) ,
112
KAPITEL 5. HAMILTONSCHE MECHANIK
wobei Q0 und P0 durch die Anfangsbedingungen festgelegt sind.
Es gibt verschiedene Kriterien die Kanonizität einer gegebenen Phasenraumtransformation
Q = Q(q, p; t) ,
P = P (q, p; t)
zu testen (auch wenn die Erzeugende nicht bekannt ist). Unter anderem ist die
Kanonizität genau dann sichergestellt, wenn die neuen Größen die fundamentalen
Poissonklammern erfüllen
{Qk , Pl }p,q = δk,l , {Qk , Ql }p,q = 0 , {Pk , Pl }p,q = 0 ,
was wir hier aus Zeitgründen nicht beweisen wollen (siehe die Literatur).
5.4
Die Hamilton-Jacobi-Gleichung
Wie bereits öfter angedeutet, lassen sich im Hamiltonformalismus aus der großen
Freiheit bei der Wahl von Transformationen, die die Bewegungsgleichungen invariant lassen, Lösungsstrategien für mechanische Probleme entwickeln. Man könnte z.B. eine Transformation für ein gegebenes H(q, p; t) suchen, so daß das zugehörige H̄(Q, P ; t) gleich der Hamiltonfunktion eines bereits gelösten Problems
ist. Es sollte klar sein, daß dieses nur in recht speziellen Fällen gelingen kann.
Weiterhin wäre die Lösung der Bewegungsgleichungen eines Problems dann trivial, wenn nach geeigneter Transformation alle Koordinaten zyklisch sind. Diese
Strategie haben wir bereits häufiger erwähnt und zur Lösung des eindimensionalen harmonischen Oszillators angewandt. Noch einfacher wäre es, wenn nach der
kanonischen Transformation
Qj = βj = const. ,
Pj = αj = const. ,
j = 1, 2, . . . , m
gelten würde. Die Lösung der Bewegungsgleichungen ergibt sich dann einfach
durch Umkehren der Transformation
q = q(β, α; t) ,
p = p(β, α; t) ,
wobei die αj und βj durch die Anfangsbedingungen bestimmt sind (Integrationskonstanten). Die Q und P sind sicherlich dann konstant, wenn die neue Hamiltonfunktion H̄(Q, P ; t) verschwindet, d.h.
H̄(Q, P ; t) = H(q(Q, P ; t), p(Q, P ; t); t) +
∂F1 (q(Q, P ), Q; t)
=0
∂t
gilt, da in diesem Fall
Q̇j =
∂ H̄
∂ H̄
= 0 , Ṗj = −
=0
∂Pj
∂Qj
(5.7)
5.4. DIE HAMILTON-JACOBI-GLEICHUNG
113
folgt. Nach Gl. (5.6) gilt
pj =
∂F1
.
∂qj
Setzen wir dieses und Qi = βi = const. in Gl. (5.7) ein, so folgt
∂F1 (q, β, t)
∂F1 (q, β, t)
∂F1 (q, β; t)
H q1 , . . . , q m ,
,...,
;t +
=0.
∂q1
∂qm
∂t
Diese Hamilton-Jacobi-Gleichung ist eine partielle Differentialgleichung erster
Ordnung für die Erzeugende der kanonischen Transformation F1 (q, β; t). Ist F1
bekannt, so ist das mechanische Problem (bis auf das noch nötige algebraische
Auflösen von Gleichungen) gelöst. Es gibt verschiedene Strategien, die HamiltonJacobi-Gleichung zu lösen. Wir können diese jedoch aus Zeitgründen nicht diskutieren. Es empfiehlt sich, sich die Hamilton-Jacobi-Theorie anhand von Lehrbüchern zu studieren.
114
KAPITEL 5. HAMILTONSCHE MECHANIK
Kapitel 6
Grundzüge der relativistischen
Mechanik
Die in dieser Vorlesung und der des letzten Semesters entwickelte klassische Mechanik beruht auf einigen im letzten Semester dargestellten Grundüberlegungen,
die man zu Postulaten erheben kann. Diese sind experimentell motiviert und
wurden in unser sich über zwei Semester erstreckenden Diskussion unter verschiedenen Blickwinkeln wiederholt betrachtet. Wie bereits zu Beginn des letzten
Semesters erwähnt, verlieren die Grundüberlegungen (die Postulate) ihre experimentelle Begründung, wenn wir mit Situationen konfrontiert werden, in denen
Geschwindigkeiten auftreten, die nicht mehr sehr viel kleiner als die Vakuumlichtgeschwindigkeit c ≈ 3 · 108 m/s sind. In diesem Fall müssen die Grundüberlegungen im Einklang mit den experimentellen Beobachtungen modifiziert werden,
was zu einer neuen Struktur der resultierenden Theorie der Bewegung “makroskopischer”1 Teilchen führt. Im vorliegenden Fall führt das auf die relativistische
Mechanik bzw. die spezielle Relativitätstheorie.2 Die bisher diskutierte klassische
Mechanik folgt dann im Grenzfall, von Geschwindigkeiten die sehr viel kleiner als
c sind aus der relativistischen Mechanik. Die klassische Mechanik wie von uns bisher beschrieben, ist somit eine Theorie mit eingeschränktem Gültigkeitsbereich.
Wir werden hier keine detaillierte Diskussion der speziellen Relativitätstheorie
führen, sondern uns primär den Fragen widmen, in welchem Zusammenhang ihre
Grundprinzipien zu den von uns bisher diskutierten Grundprinzipien der klassischen Mechanik stehen und in welchem Verhältnis die resultierenden Theorien zu
einander stehen. Wir werden hier insbesondere nicht im Detail auf die experimentellen Beobachtungen eingehen, die Einstein 1905 zur Formulierung der speziellen
1
Dieser nicht genau definierte Begriff soll andeuten, daß wir unsere Überlegungen nicht in
den Bereich der Quantenmechanik ausdehnen wollen.
2
Die spezielle Relativitätstheorie ist “speziell” in der Hinsicht, daß sie sich primär mit Bezugsystemen beschäftigt, die nicht gegeneinander beschleunigt sind. In der allgemeinen Relativitätstheorie (1915) betrachtet man auch beschleunigte Bezugssysteme. Wie Einstein beschrieben hat,
führt dies auf natürliche Weise zu einer Theorie der Gravitation.
115
116
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
Relativitätstheorie geführt haben. Viel zu kurz kommt ebenfalls die Diskussion
der scheinbaren Paradoxa, die mit unserem intuitiven Verständnis nur schwer in
Einklang zu bringen sind. Letzteres liegt offensichtlich daran, daß wir im Alltag
– und damit auch im Laufe der Evolution – nicht mit Phänomenen konfrontiert
sind, in denen Geschwindigkeiten von der Größe der Lichtgeschwindigkeit eine
offensichtliche Rolle spielen.
6.1
Die Lorentztransformation
In der klassischen Mechanik spielt der Begriff des Inertialsystems eine zentrale Rolle. Bewegt sich ein weiteres Bezugssystem K geradlinig und gleichförmig,
also mit konstanter Geschwindigkeit ~v0 gegenüber einem Inertialsystem k, so bildet K ebenfalls ein Inertialsystem. Dem Galileischen Relativitätsprinzip folgend
sind alle Naturgesetze in allen Inertialsystemen zu allen Zeiten gleich. Wie im
Kapitel 2.2 diskutiert, folgt für die Geschwindigkeitsvektoren in den beiden Sy~˙ (Notation wie in Kapitel 2.2). Als unmittelbare Konsequenz
stemen ~r˙ = ~v0 + R
dieser Galileitransformation ergibt sich, daß die Vakuumlichtgeschwindigkeit in
zwei relativ zueinander geradlinig, gleichförmig bewegten Bezugssystemen unterschiedlich sein sollte. Nehmen wir an, daß sich im Ursprung von k eine Lichtquelle
befindet, die sphärische Lichtwellen aussendet, welche sich mit Geschwindigkeit
c fortpflanzen.3 Der Vektor ~r sei der Ortsvektor eines Punktes auf einer gegebe~˙ = c~rˆ − ~v0 .
nen Wellenfläche. Damit gilt ~r˙ = c~rˆ. Im System K gilt dagegen R
In dem System, welches sich relativ zu dem mit der Lichtquelle geradlinig und
gleichförmig bewegt, wird somit der Betrag der Lichtgeschwindigkeit im Allgemeinen nicht gleich c sein und wegen der Richtungsabhängigkeit der Geschwindigkeit
werden die Wellen nicht mehr sphärisch sein.
Verschiedene Experimente, insbesondere das berühmte Michelson-Morley-Experiment haben jedoch gezeigt, daß die Vakuumlichtgeschwindigkeit in alle Richtungen immer gleich ist und daß sie unabhängig von der relativen geradlinig,
gleichförmigen Bewegung eines Beobachters gegenüber der Lichtquelle ist. Wollen
wir also ein Relativitätsprinzip (Einsteinsches Relativitätsprinzip) der Gleichheit
von Naturgesetzen (jetzt auch Konstanz der Lichtgeschwindigkeit; siehe ebenfalls Vorlesung zur Elektrodynamik des kommenden Semesters) in gegeneinander
geradlinig, gleichförmig bewegten Bezugssysteme aufrecht erhalten, kann die obige Galileitransformation nicht richtig sein und muß durch eine andere, die Lorentztransformation, ersetzt werden. Diese muß die Lichtgeschwindigkeit in allen
geradlinig, gleichförmig bewegten Bezugssystemen erhalten.
In Kapitel 2.2 dieser Vorlesung und Kapitel 3.2 der Vorlesung des letzten
3
Wir gehen davon aus, daß die aus der obigen Galileitransformation folgenden Überlegungen für Lichtwellen anwendbar sind. Mehr dazu (Welle-Teilchen-Dualismus) lernen sie in der
Quantenmechanik.
6.1. DIE LORENTZTRANSFORMATION
117
Semesters haben wir diskutiert (gefordert), daß die Newtonschen Bewegungsgleichungen unter der obigen Galileitransformation forminvariant bleiben (Galileisches Relativitätsprinzip). Wollen wir nun physikalische Gesetze haben, die unter der allgemeineren (noch aufzustellenden) Lorentztransformation forminvariant bleiben, so ist davon auszugehen, daß sich andere Bewegungsgesetze ergeben,
die sich nur für hinreichend kleine Geschwindigkeiten den bisher diskutierten Bewegungsgleichungen annähern. Wir müssen somit wie folgt vorgehen. Zunächst
müssen wir die Transformation finden, die die Lichtgeschwindigeit erhält. Im
Anschluß daran müssen wir die Gesetze der Mechanik auf ihre Transformationseigenschaften gegenüber dieser Lorentztransformation überprüfen. Gesetze,
deren Form nicht invariant bleibt, müssen entsprechend verallgemeinert werden.
Die sich ergebenden Folgerungen wurden in einer Vielzahl von Experimenten
bestätigt, was letzen Endes die entscheidene (einzige) Rechtfertigung für das Einsteinsche Relativitätsprinzip darstellt.
Um die Lorentztransformation zu entwickeln, betrachten wir zwei gegeneinander geradlinig, gleichförmig bewegte Bezugssysteme, deren Ursprünge zur Zeit
t = 0 zusammenfallen. Zu diesem Zeitpunkt strahle eine im Ursprung des Systems
k befestigte Lichtquelle einen Lichtblitz aus. Ein Beobachter, der sich bezüglich
k in Ruhe befindet, beobachtet eine sich mit c ausbreitende Kugelwelle. Die Gleichung der Wellenfront lautet
x21 + x22 + x23 = c2 t2 .
Die Konstanz der Lichtgeschwindigkeit impliziert nun, daß auch ein in K ruhender
Beobachter das Licht so sieht, als wenn es sich als sphärische Welle um den
Ursprung seines Bezugssystems ausbreitet. Die entsprechende Gleichung für die
Wellenfront lautet also (Notation wie in Kapitel 2.2)
X12 + X22 + X32 = c2 T 2 .
Dabei lassen wir, indem wir t durch T ersetzen, explizit die Möglichkeit zu, daß
sich beim Übergang von k nach K (oder andersherum) auch die Zeitskala transformiert. Genauer gesagt lassen wir zu, daß die gesuchte Transformation, die die
beiden Gleichungen ineinander überführt, es womöglich erforderlich macht, daß
die Zeitdifferenz zwischen zwei Ereignissen vom Bezugssystem des Beobachters
abhängt. Die beiden Gleichungen zusammenfassend muß die Transformation so
sein, daß
x21 + x22 + x23 − c2 t2 = X12 + X22 + X32 − c2 T 2 .
Diese Bedingung erinnert an die für orthogonale Transformationen (Drehungen)
geltende Invarianz der Länge von Vektoren. Führen wir also zu den drei Koordinaten xi , i = 1, 2, 3 eine vierte imaginäre Koordinate x4 = ict hinzu, so ergibt
118
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
sich für die obige Gleichung4
4
X
x2µ
µ=1
=
4
X
Xµ2 .
µ=1
Diese Überlegung zeigt, daß die gesuchte Transformation einer Drehung in einem
vierdimensionalen Raum entspricht, der aus den drei Komponenten des gewöhnlichen Raums und einer vierten, imaginären Komponente besteht, die proportional zur Zeit ist. Diesen Raum bezeichnet man als Minkowskiraum bzw. die
vierdimensionale Raum-Zeit. Die Lorentztransformationen sind die orthogonalen
Transformationen auf dem Minkowskiraum. Sie mischen die räumlichen und die
zeitliche Komponente der Raumzeit. Die Konzepte Raum und Zeit verlieren damit ihre Unabhängigkeit. Als eine Unterklasse der Lorentztransformationen sind
auch rein räumliche Drehungen zugelassen, für die t = T gilt. Wir sprechen
von einer reinen Lorentztransformation (“boost”), wenn sie keine räumliche Drehung enthält, sondern gleichförmig, geradlinig bewegte Bezugsysteme ineinader
überführt, deren Achsen parallel sind. Es sollte auch ohne Beweis klar sein, daß
sich eine allgemeine Lorentztransformation als Produkt einer räumlichen Drehung und einer reinen Lorentztransformation schreiben läßt. Es bedeutet keine
Einschränkung der Allgemeinheit (vereinfacht aber unsere Überlegungen) davon
auszugehen, daß die Relativbewegung der Bezugssysteme (der “boost”) entlang
einer Achsenrichtung, hier der x3 -Richtung, ist.
Die Transformation von den xµ auf die Xµ ist durch eine 4 × 4-Matrix A mit
Matrixelementen aµ,ν gegeben
Xµ =
4
X
aµ,ν xν .
ν=1
Da A eine orthogonale Transformation vermittelt, müssen die aµ,ν die im Kapitel
2.13 der Vorlesung des letzten Semesters diskutierten Bedingungen
4
X
aµ,ν aλ,ν = δµ,λ
ν=1
erfüllen. Anders als bisher sind jedoch nicht alle Matrixelemente reell. Da die
Koordinaten X1 , X2 und X3 reell bleiben müssen, ist es erforderlich, daß die
Elemente ai,4 für i = 1, 2, 3 rein imaginär sind. Analog folgt daraus, daß X4 rein
imaginär sein muß, daß die Elemente a4,i , i = 1, 2, 3 rein imaginär sind, während
a4,4 reell sein muß. Da die Richtungen x1 und x2 bei der Relativbewegung in
4
Es ist in der Literatur zur speziellen Relativitätstheorie weit verbreitet, griechische Buchstaben für Indizes zu verwenden, die von 1 bis 4 laufen und lateinische, für solche die von 1 bis
3 laufen.
6.1. DIE LORENTZTRANSFORMATION
119
x3 -Richtung in Ruhe bleiben, bleiben sie unter der Transformation unbeeinflußt
und es muß
X 1 = x1 ,
X 2 = x2
gelten. Um die Struktur der Matrix A weiter zu analysieren, wollen wir nun
noch argumentieren, daß die transformierten Koordinaten X3 und X4 nicht von
x1 und x2 abhängen können. Kein Ort in der x1 -x2 -Ebene ist aus physikalischen
Gründen als Ursprung des Koordinatensystems ausgezeichnet. Man kann also den
Ursprung in jeden Punkt der x1 -x2 -Ebene verschieben, ohne die Werte von X3
und X4 zu beeinflussen, so daß diese unabhängig von x1 und x2 sein müssen. Die
Matrix der Lorentztransformation kann somit nur die Form


1 0 0
0
 0 1 0
0 

A=
 0 0 a3,3 a3,4 
0 0 a4,3 a4,4
haben. Die Orthogonalitätsbedingungen liefern drei Gleichungen, die die vier
nicht-trivialen Matrixelemente verknüpfen
a23,3 + a23,4 = 1 ,
a24,3 + a24,4 = 1 ,
a3,3 a4,3 + a3,4 a4,4 = 0 .
Es ist eine vierte Bedingung nötig, um die nicht-trivialen Matrixelemente eindeutig festzulegen. Sie folgt aus der Beobachtung, daß sich der Ursprung des Systems
K (für den X3 = 0 gilt) gleichförmig entlang der x3 -Achse bewegt, so daß zur
Zeit t seine x3 -Koordinate gleich vt ist,5 d.h. es gilt
x3 = vt = −iβx4 ,
mit
β=
v
.
c
Eingesetzt in die Transformation bedeutet das für den Ursprung von K
X3 = a3,3 x3 + a3,4 x4 = x4 (a3,4 − iβa3,3 ) = 0
und damit
a3,4 = iβa3,3 .
5
Wir lassen folgend den Index 0 bei der Relativgeschwindigkeit ~v = v~e3 weg.
120
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
Die erste der Orthogonalitätsrelationen liefert damit
a23,3 (1 − β 2 ) = 1 ⇒ a3,3 = p
1
1 − β2
und folglich
iβ
.
a3,4 = p
1 − β2
Wie gefordert ist a3,3 reell und a3,4 rein imaginär solange β < 1 gilt. Dies ist
konsistent mit Einsteins Überlegung, daß es keine Geschwindigkeiten größer als
die Vakuumlichtgeschwindigkeit geben kann.6 Die verbleibenden Matrixelemente
bestimmt man mit Hilfe der weiteren Orthogonalitätsrelationen und erhält
1
,
a4,4 = p
1 − β2
−iβ
a4,3 = p
.
1 − β2
Die Matrix A hat somit die Form

1 0
0
 0 1
0

1
√
A=
 0 0
1−β 2

0 0 √−iβ 2
1−β
0
0
√ iβ
1−β 2
√1
1−β 2



 .


(6.1)
Die 2 × 2-Untermatrix in der rechten unteren Ecke hat die Struktur wie eine
Matrix
cos φ sin φ
,
− sin φ cos φ
die eine Drehung in der Ebene vermittelt. In der Tat stellt die Untermatrix eine
Drehung in der x3 -x4 -Ebene dar, wobei der Drehwinkel jedoch imaginär ist, was
aus
1
cos φ = p
>1
1 − β2
folgt. Wir können die Gleichungen der reinen Lorentztransformation auch wie
folgt schreiben
X 1 = x1 ,
6
X 2 = x2 ,
x3 − vt
X3 = p
,
1 − β2
t − vx3 /c2
T = p
.
1 − β2
(6.2)
Genaueres dazu können sie aus Büchern oder einer Vorlesung zur speziellen Relativitätstheorie erfahren.
6.1. DIE LORENTZTRANSFORMATION
121
Die Rücktransformation erhalten wir dadurch, daß wir die Transponierte der
Matrix Gl. (6.1) bilden. Wie man damit leicht nachrechnet, bekommt man so
explizite Ausdrücke für die “kleinen” Koordinaten als Funktion der “großen”, die
bis auf den Vorzeichenwechsel v → −v identisch zu Gl. (6.2) sind. Dies war zu
erwarten, da sich k relativ zu K mit Geschwindigkeit −~v bewegt.
Aus der Lorentztransformation ergeben sich Konsequenzen, die unseren gewohnten Vorstellungen zuwiderlaufen. Wir werden hier nur eine grobe Diskussion
solcher vermeintlicher Paradoxa geben.
Wir betrachten zunächst einen starren Stab, der bezüglich k in Ruhe ist und
(2)
(1)
entlang der x3 -Achse liegt. Er habe die Länge x3 − x3 = L. Ein bewegter
Beobachter (in K) mißt die Länge des Stabes, indem er zu einer festen Zeit T
(1)
(2)
die Lage der beiden Endpunkte X3 und X3 bestimmt. Aus den zu Gl. (6.2)
inversen Relationen finden wir
(1)
X + vT
(1)
,
x3 = p3
1 − β2
(2)
X + vT
(2)
x3 = p3
1 − β2
und damit
p
(2)
(1)
X3 − X 3 = L 1 − β 2 .
p
Der Stab scheint dem bewegten Beobachter damit um den Faktor 1 − β 2 < 1
verkürzt. Dies ist die berühmte Längenkontraktion. Es muß betont werden, daß
ein Beobachter in k dieselbe Längenkontraktion bei einem Stab beobachtet, der
in K ruht. Wäre dies nicht der Fall, wäre eines der Bezugssysteme ausgezeichnet,
was nach dem Relativitätsprinzip nicht erlaubt ist.
Die sogenannte Zeitdilatation wollen wir auf anschaulichere Weise erklären
und nicht einfach auf die Lorentztransformation zurückgreifen. Wir betrachten
einen Zug (Bezugssystem K), der sich mit hoher (konstanter) Geschwindigkeit v
relativ zu einem Bezugssystem k in x3 -Richtung bewegt. Ein Beobachter im Zug
(in K) löst einen Blitz aus, der aus einer am Boden befindlichen Quelle kommt.
Das Licht breitet sich bis zur Decke des Zugs aus und wird von dort zurück
auf den Ausgangspunkt am Boden reflektiert, wo eine Photozelle steht, die ein
akustisches Signal auslöst. Dieses “Gedankenexperiment” beobachtet ebenfalls
ein Beobachter in k. Von K aus betrachtet ist die Zeitdifferenz zwischen dem
Auslösen des Blitzes und dem Ertönen des Signals durch
∆T =
2h
,
c
mit der Höhe h des Zugs gegeben. Von k aus betrachtet nimmt das Licht den in
der Skizze dargestellten Weg.
122
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
B
A
D
C
Die Strecke AC hat die Länge v∆t, wenn ∆t die Zeit zwischen dem Blitz und dem
Signal ist. Damit hat das Dreieck ABD die Seitenlängen h, v∆t/2 und c∆t/2.
An dieser Stelle fließt in die Überlegung ein, daß die Vakuumlichtgeschwindigkeit
in k und K identisch ist. Weiterhin gehen wir davon aus, daß die Höhe des
Zuges (senkrecht zu ~v ) in beiden Bezugssystemen identisch ist. Bereits weiter
oben haben wir uns klar gemacht, daß dieses der Fall ist, da die Ortskoordinaten
senkrecht zu ~v nicht transformiert werden. Damit folgt nach Pythagoras
(c∆t/2)2 = h2 + (v∆t/2)2 ,
was
∆t =
1
2h
p
c
1 − β2
bedingt. Es gilt somit
∆T
.
∆t = p
1 − β2
Der gemessene Zeitunterschied zwischen dem Blitz und dem Signal ist somit in k
und K verschieden. Dieses Ergebnis gilt für alle Ereignisse (nicht nur Blitz und
Signal), die in K am gleichen Ort stattfinden. Das Ergebnis ist somit konsistent
mit der Rücktransformation
T + vX3 /c2
t= p
,
1 − β2
die aus Gl. (6.2) folgt, da bei der Bildung der Zeitdifferenz für gleiche Orte in K
die Variable X3 herausfällt. Misst er die Zeitdifferenz zwischen zwei Ereignissen,
welche am gleichen Ort in K stattfinden, so kommt der Beobachter in k zu dem
Schluß, daß eine Uhr in K langsamer läuft als seine, da ∆T < ∆t. Daher der Name
Zeitdilatation. Erneut erfordert das Relativitätsprinzip, daß ein Beobachter in K
zu einem analogen Schluß bezüglich Ereignissen kommt, die an einem festen Ort
in k stattfinden.
Wie bereits oben erwähnt implizieren die Lorentztransformationen, daß es
keine Geschwindigkeiten größer als c geben kann. Man könnte nun meinen, daß
sich solche Geschwindigkeiten erzeugen lassen, wenn man wie folgt vorgeht. Wir
nehmen an, ein Teilchen bewege sich relativ zu einem Beobachter im System k
6.2. DIE KOVARIANZ
123
mit konstanter Geschwindigkeit c/2 < w < c in x3 -Richtung, was sicherlich erlaubt ist. Ein weiterer Beobachter im System K bewege sich relativ zum ersten
mit Geschwindigkeit c/2 < v < c, jedoch in −x3 -Richtung, was ebenfalls mit der
speziellen Relativitätstheorie im Einklang ist. Könnte man nun die Relativgeschwindigkeit zwischen dem zweiten Beobachter und dem Teilchen durch simple
Addition der beiden Relativgeschwindigkeiten zum ersten Beobachter gewinnen
(wie es in der klassischen Mechanik der Fall wäre), so würde diese größer als die
Vakuumlichtgeschwindigkeit sein. Diese Relativgeschwindigkeit ist identisch zur
Geschwindigkeit des Teilchens aus K betrachtet, also zu der von k nach K transformierten Teilchengeschwindigkeit W . Um zu zeigen, daß diese simple Additionsrelation in der relativistischen Mechanik ihre Gültigkeit verliert, betrachten wir
die Lorentztransformation. Aus k beobachtet gilt für die Teilchengeschwindigkeit
∆~r
∆t→0 ∆t
w
~ = lim
mit ∆~r = ~r(t + ∆t) − ~r(t). Da die Lorentztransformation linear in den xµ ist,
folgt sofort
∆x3 + v∆t
∆t + v∆x3 /c2
∆X1 = ∆x1 , ∆X2 = ∆x2 , ∆X3 = p
, ∆T = p
.
1 − β2
1 − β2
Dabei gilt verglichen mit Gl. (6.2) v → −v, da sich K in Bezug auf k nach
Konstruktion in −x3 -Richtung bewegt. Es gilt dann
∆x3 + v∆t
∆x3 /∆t + v
∆X3
=
=
∆T
∆t + v∆x3 /c2
1 + (v/c2 )(∆x3 /∆t)
bzw.
W = W3 =
w+v
.
1 + wv/c2
Alle anderen Komponenten des Geschwindigkeitsvektors sind aufgrund unserer
Wahl der Richtungen der Koordinatenachsen Null. Dies ist das Einsteinsche Additionstheorem für Geschwindigkeiten. Man sieht, daß für 0 ≤ v < c und 0 ≤ w < c
auch 0 ≤ W < c gilt. Gilt w = c und v < c, so folgt W = c.
6.2
Die Kovarianz
Wir haben im letzten Abschnitt die Lorentztransformation konstruiert, die die
inkorrekte Galileitransformation in der speziellen Relativitätstheorie ersetzt. Wir
können nun den zweiten Schritt gehen und fordern, daß alle Gesetze der Mechanik
(und der ganzen Physik) invariant unter der Lorentztransformation sind. Es wird
sehr viel einfacher und eleganter, die Gesetze auf Forminvarianz zu untersuchen,
124
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
wenn man sie in Ausdrücken des Minkowskiraums schreibt. Wir werden zeigen,
daß es dann sehr leicht ist, die Lorentzinvarianz einer gegebenen Gleichung zu
erkennen.
Um unser Vorgehen bezüglich der Lorentztransformationen zu illustrieren, betrachten wir zunächst, wie wir im Fall des Nachweises der Invarianz physikalischer
Gesetze unter Drehungen des Raumes, also unter orthogonalen Transformationen
des R3 , vorgehen können. Eine physikalische Größe, die für sich genommen invariant unter einer Drehung des Raums ist, nennt man ein Rotationsskalar. Die Masse
m eines Teilchens, die Zeit t und der Betrag des Abstandes einer Teilchenposition
vom Ursprung r = |~r| sind Beispiele für solche Skalare. Physikalische Gesetze der
Form a = b mit zwei Rotationsskalaren a und b sind somit trivialerweise invariant unter Rotationen des R3 . Ebenfalls invariant sind Gesetze der Form f~ = ~g
(Gleichungssystem) mit zwei dreidimensionalen Vektoren, die gemäß F~ = Rf~
~ = R~g mit der Rotationsmatrix R transformiert werden. Man spricht in
und G
diesem Zusammenhang auch von der Kovarianz (unter räumlichen Rotationen)
der Terme der Gleichung
Die Lorentztransformationen wurden weiter oben mit den orthogonalen Transformationen im vierdimensionalen Minkowskiraum identifiziert. Wir führen nun
den Begriff des Lorentz- oder Viererskalars ein. Dabei handelt es sich in Analogie
zu den “gewöhnlichen” Rotationen um eine Größe, die für sich genommen invariant unter den Lorentztransformationen ist. Wie wir weiter unten zeigen werden,
kann man einen Massebegriff in der relativistischen Mechanik so einführen, daß
das adäquat definierte m ein Viererskalar ist. Die Zeit t ist, wie wir oben gesehen
haben, sicherlich kein Viererskalar. Als einen Vierervektor f bezeichnen wir einen
allgemeinen Satz von vier Zahlen, der sich unter der Lorentztransformation wie
der “verallgemeinerte Ortsvektor” (Ortsvektor im Minkowskiraum oder RaumZeit-Vektor)7 r = (x1 , x2 , x3 , ict)T transformiert, d.h. im Fall eines “boosts” wie
F = Af
mit der Matrix A aus Gl. (6.1). Die Forminvarianz eines physikalischen Gesetzes
unter Lorentztransformationen ist damit dann offensichtlich, wenn es in einer kovarianten vierdimensionalen Form geschrieben werden kann. Ein Zusammenhang,
der das Einsteinsche Relativitätsprinzip verletzt, kann nicht in eine kovariante
Form gebracht werden. Dies ist das oben angekündigte einfache Kriterium, um
festzustellen, ob ein physikalisches Gesetz mit dem Einsteinschen Relativitätsprinzip im Einklang ist.
Als Beispiel dafür, wie man ein Gesetz so umschreibt, daß sofort sichtbar
wird, ob es lorentzinvariant ist oder nicht, betrachten wir die dreidimensionale
7
Mit fortschreitender Zeit durchläuft der Raum-Zeit-Vektor r = (x1 , x2 , x3 , ict)T die sogenannte Weltlinie, was der Bahnkurve der klassischen Mechanik entspricht.
6.2. DIE KOVARIANZ
125
Wellengleichung (siehe Kapitel 4.2)
2
~ 2u = 1 ∂ u .
∇
c2 ∂t2
Im Vergleich zu der allgemeinen Gleichung aus Kapitel 4.2 soll c hier die Vakuumlichtgeschwindigkeit sein. Wir führen einen Vierergradienten mit Komponenten
∂/∂x1 , ∂/∂x2 , ∂/∂x3 und ∂/∂x4 ein, den wir mit dem Symbol bezeichnen. Um
zu zeigen, daß ein Vierervektor ist, betrachten wir (Kettenregel)
X ∂xν ∂
∂
=
.
∂Xµ
∂X
∂x
µ
ν
ν
Die xν hängen über die inverse Transformation (vermittelt durch AT ) mit den
Xµ zusammen
X
aµ,ν Xµ
xν =
µ
, so daß
X
∂
∂
aµ,ν
=
.
∂Xµ
∂x
ν
ν
Dies ist die Transformationsgleichung für die Komponenten eines Vierervektors.
Damit ist klar, daß 2 ein Viererskalar(-Differentialoperator) ist. Mit diesem
geschrieben hat die Wellengleichung die elegante Form
2 u = 0 .
Unter der Annahme, daß u ein Viererskalar ist, zeigt diese kovariante Schreibweise
sofort die Invarianz der Wellengleichung unter Lorentztransformationen.
Ein konzeptionell wichtiges Viererskalar ist durch
4
1 X
(∆τ ) = − 2
(∆xµ )2
c µ=1
2
gegeben. Da sich, wie bereits oben erwähnt, die ∆xµ wie die xµ transformieren,
ist diese Größe offensichtlich ein Viererskalar. Betrachten wir ein System K, in
dem das Teilchen momentan in Ruhe ist, d.h. ∆Xi = 0 für i = 1, 2, 3 gilt, so folgt
(Viererskalar!!)
(∆τ )2 = −
4
4
1 X
1 X
2
(∆x
)
=
−
(∆Xµ )2 = (∆T )2 .
µ
2
2
c µ=1
c µ=1
126
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
Somit ist ∆τ ein Zeitintervall, welches auf einer Uhr gemessen wird, die sich mit
dem Teilchen mitbewegt. Daher bezeichnet man ∆τ als ein Intervall der Eigenzeit.
Aus der Definitionsgleichung der Eigenzeit folgt
1p
−(∆x1 )2 − (∆x2 )2 − (∆x3 )2 + c2 (∆t)2
c v
"
u
2 2 2 #
u
1
∆x
∆x
∆x
1
2
2
= ∆tt1 − 2
+
+
.
c
∆t
∆t
∆t
∆τ =
Für hinreichend kleine ∆t entspricht die Summe in der eckigen Klammer dem
Relativgeschwindigkeitsquadrat v 2 (zwischen dem in k ruhenden Beobachter und
dem in K ruhenden Teilchen) und konsistent mit dem bei der Diskussion der
Zeitdilatation hergeleiteten Ausdruck gilt
p
(6.3)
∆τ = ∆T = ∆t 1 − β 2 .
Ist eine der Komponenten eines Vierervektors rein imaginär, wie es z.B. beim
Ortsvektor im Minkowskiraum der Fall ist, so muß das Quadrat eines solchen
Vierervektors nicht notwendig größer gleich Null sein. Man bezeichnet einen Vierervektor, dessen Quadrat größer oder gleich Null ist, als raumähnlich. Ist das
Quadrat negativ, so heißt der Vierervektor zeitähnlich. Da das Quadrat eines
Vierervektors als Viererskalar invariant unter einer Lorentztransformation ist,
ist auch die Charakterisierung als raum- oder zeitähnlich invariant. Die Namen
rühren daher, daß ein reiner Raumvektor (x4 = 0) stets positiv definit ist und
ein raumähnlicher Vierervektor so transformiert werden kann, daß seine vierte Komponente verschwindet. Ein zeitähnlicher Vierervektor kann dagegen so
transformiert werden, daß seine ersten drei Komponenten verschwinden.
Als Beispiel für diese Begrifflichkeiten betrachten wir einen Ortsvektor im
Minkowskiraum. Die Bedingung x21 + x22 + x23 = c2 t2 definiert den sogenannten
Lichtkegel. Dabei unterscheidet man den Vorwärts- (t > 0) und den Rückwärtslichtkegel (t < 0). Das Innere der Lichtkegel bilden die zeitähnlichen Vierervektoren. Wie bereits gezeigt, ist der Begriff der Zeitähnlichkeit invariant unter der
Lorentztransformation. Man kann leicht sehen, daß bei Zeitähnlichkeit auch die
Bedingung t > 0 invariant ist, so daß ein Punkt P , der im Inneren des Vorwärtslichtkegel liegt, dies in allen Bezugssystemen tut. Dies bedeutet, daß alle Beobachter übereinstimmen, daß ein Ereignis im Raum-Zeit-Punkt P nach einem
Ereignis im Ursprung der Raumzeit mit xµ = 0 für alle µ = 1, 2, 3, 4 stattfindet.
Man nennt den Vorwärtslichtkegel daher auch die absolute Zukunft. Alle Punkte
im Vorwärtslichtkegel sind durch ein sich mit c ausbreitendes Lichtsignal vom
Ursprung aus erreichbar. Raumähnliche Punkte sind dagegen nicht durch ein
Lichtsignal vom Ursprung aus erreichbar.8
8
Dies hat sehr interessante Auswirkungen auf das Konzept der Kausalität, auf die wir hier
aus Zeitgründen nicht eingehen können.
6.3. MASSE, VIERERGESCHWINDIGKEIT UND -IMPULS
6.3
127
Masse, Vierergeschwindigkeit und -impuls
Während wir uns bisher mit der Kinematik der relativistischen Mechanik beschäftigt haben, werden wir jetzt zur Dynamik kommen. Wir werden die relativistischen Ausdrücke für die Masse, die Geschwindigkeit und den Impuls einführen.
Genauer betrachtet definieren wir diese Begriffe im Rahmen der speziellen Relativitätstheorie neu. Die Leitprinzipien bei der Definition sind dabei, daß (i) für
v/c 1 sich die in der klassischen Mechanik etablierten Begriffe ergeben sollen
und (ii) die Begriffe Eigenschaften mit ihren klassischen Gegenstücken gemeinsam
haben, die uns für das jeweilige Konzept essentiell erscheinen. Für den Impuls bedeutet das z.B., daß wir eine relativistische Definition mit der Eigenschaft suchen,
daß der Gesamtimpuls für ein isoliertes System erhalten ist.
Wir wollen zunächst die relativistische Masse definieren. Die Masse m eines
Objekts ist unabhängig davon, mit welcher Geschwindigkeit es sich bewegt, als
seine Ruhemasse definiert. Als Beobachter in einem System k müssen wir somit
bei der Massenbestimmung wie folgt vorgehen. Wir müssen die zu bestimmende
Masse entweder zur Ruhe bringen oder uns selbst in ein System bringen, in dem
die Masse ruht. Danach können wir die Masse mit den Methoden der klassischen
Mechanik bestimmen. Die Definition ist offensichtlicherweise invariant unter einer
Lorentztransformation, so daß die definierte Masse wie oben angekündigt ein
Vierersaklar ist.
Als nächstes wollen wir die Vierergeschwindigkeit einführen. Wie wir bereits
gesehen haben, muß man die dreidimensionale Geschwindigkeit ~v gemäß einem
recht komplizierten Additionstheorem transformieren. Mit unseren in der Zwischenzeit angestellten Überlegungen zur Kovarianz können wir besser verstehen,
wie es dazu kommt. Die Geschwindigkeit ~v ergibt sich aus Grenzwertbildung
des Quotienten eines dreidimensionalen Vektors ∆~r und der vierten Komponente ∆t eines Vierervektors. Es ist daher nicht verwunderlich, daß sich ~v auf eigenartige Weise transformiert. Nach dieser Einsicht wird es klarer, wie wir bei
der Definition einer Vierergeschwindigkeit vorgehen sollten. Wie oben diskutiert,
transformieren sich die ∆xµ wie die xµ selbst, so daß man einen Vierervektor
∆r = (∆x1 , . . . , ∆x4 )T konstruieren kann. Bilden wir nun den Differenzenquotienten mit dem Intervall ∆τ der Eigenzeit, welches ein Viererskalar ist, und führen
den Grenzwert aus, so ergibt sich ein Vierervektor

v=
dr 
=

dτ
dx1
dτ
dx2
dτ
dx3
dτ
dt
ic dτ


 .

p
Dies ist die Vierergeschwindigkeit. Ersetzen wir gemäß Gl. (6.3) dτ = dt 1 − β 2 ,
128
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
so folgt


1
dr

=p
v=p
1 − β 2 dt
1 − β2 
1
dx1
dt
dx2
dt
dx3
dt


= p 1

1 − β2
~v
ic
.
ic
Es ist wichtig festzuhalten, daß der räumliche Teil der Vierergeschwindigkeit nicht
gleich der (gewöhnlichen) dreidimensionalen Geschwindigkeit ~v p
ist. Im Limes von
Geschwindigkeiten sehr viel kleiner als c geht der Vorfaktor 1/ 1 − β 2 quadratisch gegen 1 und der räumliche Teil von v nähert sich ~v an.
Wie oben angedeutet, soll ein nun zu definierender relativistischer Impuls
im Limes kleiner Geschwindigkeiten mit dem Impuls der klassischen Mechanik
übereinstimmen und für abgeschlossene Systeme eine Erhaltungsgröße sein. Wir
definieren den Viererimpuls als Produkt des Viererskalars m und des Vierervektors v
1
m~v
p = mv = p
.
imc
1 − β2
Den p
räumlichen Anteil des Viererimpulses (dreidimensionaler Vektor) p~ (r) =
m~v / 1 − β 2 bezeichnet man als den relativistischen Impuls. Er stimmt für kleine
Geschwindigkeiten mit dem klassischen Impuls überein. Da wir einen vierkomponentigen Impuls definiert haben, scheint es nahezuliegen, daß (wenn überhaupt;
siehe unten) eine Erhaltung aller vier Komponenten - der drei Komponenten des
realtivistischen Impulses und der vierten neuen Komponente - gelten sollte. Wie
wir gleich sehen werden, hat die vierte Komponente etwas mit der Energie zu
tun, so daß die Erhaltung des Viererimpulses bereits kombiniert die Impuls- und
die Energieerhaltung liefert.
Wir definieren die relativistische Energie E als (c/i) mal die vierte (zeitliche)
Komponente von p
mc2
E = p4 c/i = p
.
1 − β2
Zunächst einmal fällt auf, daß das so definierte E zumindest die Dimension einer
Energie hat. Betrachten wir die Energie für ein nicht-relativistisches Teilchen mit
v/c 1, so folgt durch Talyorentwicklung
mc2
1
E=p
= mc2 + mv 2 + O([v/c]4 ) .
2
1 − β2
In der klassischen Mechanik wird angenommen, daß die Masse eines Punktteilchens konstant (erhalten) ist.9 Damit ist der erste Summand aus der Perspektive
9
Wenn wir in der klassischen Mechanik zeitlich veränderliche Massen betrachtet haben,
6.3. MASSE, VIERERGESCHWINDIGKEIT UND -IMPULS
129
der klassischen Mechanik eine Konstante, die wir durch Verschieben des Energienullpunktes eliminieren können. Der verbleibende Summand ist die uns bekannte
klassische kinetische Energie T . Dies zeigt, daß die obige Definition der relativitischen Energie sinnvoll ist. Betrachten wir den elastischen Stoß zweier sonst freier
Teilchen mit kleiner Geschwindigkeit, so können wir anhand des genäherten Ausdrucks für die relativistische Energie sehr leicht die Energieerhaltung nachweisen.
Für den kinetischen Teil T gilt die Erhaltung wie in der klassischen Mechanik.
Für den Term mc2 folgt ebenfalls eine Erhaltung, da die Summe der Massen der
Teilchen vor und nach dem Stoß gleich ist. Betrachten wir nun einen inelastischen Stoß zweier Teilchen mit kleiner Geschwindigkeit. In diesem Fall sind die
kinetischen Energien vor und nach dem Stoß nicht identisch, da es zu inneren
Anregungen der Massen kommt (es wird z.B. Wärme erzeugt, die nichts anderes als eine innere Anregung der Massen ist). Wenn jetzt aber die relativistische
Energie E für alle Arten von Stoßprozessen (elastisch und inelastisch) erhalten
sein soll (was in der Tat der Fall ist), so bedeutet das (für v/c 1) gemäß
Min c2 + Tin = Mout c2 + Tout
mit den totalen Massen Min and Mout vor und nach dem Stoß wegen Tin 6= Tout ,
daß
Min 6= Mout .
Wir müssen folgern, daß sich bei der Änderung der Anregungsenergie eines Teilchens (inelastischer Prozeß) dessen Masse ändert. Sollte also die relativistische
Energie erhalten sein (was, wie schon gesagt, in der Tat der Fall ist), so bedeutet
das, daß die Masse nicht erhalten sein kann. Dies sieht man wie oben gezeigt
bereits im Limes kleiner Geschwindigkeiten. Im Alltag fällt nicht auf, daß die
Masse nicht konstant ist, da wegen
Tin − Tout = −(Min − Mout )c2
selbst bei recht großen |Tin − Tout | aufgrund der Größe von c die Massenänderung
|Min − Mout | sehr klein ist.
In der speziellen Relativitätstheorie ist der Beitrag mc2 zur Energie somit sicherlich keine irrelevante Konstante, wie es im Rahmen der klassischen Mechanik
der Fall wäre. Die Energie enthält in der relativistischen Mechanik keine freie
Konstante, da der Viererimpuls p ein Vierervektor sein soll. Jedes Hinzuaddieren
von i mal einer Konstanten zur vierten Komponente des Viererimpulses würde die
Lorentzinvarianz zerstören. Damit bekommt die Energie des Teilchens, wenn es
dann haben wir uns diese immer als aus vielen Punktteilchen zusammengestzt vorgestellt. Die
Zeitabhängigekit der Masse kam dann dadurch zu stande, daß einzelne oder mehrere Punktteilchen aus der Gesamtmasse verloren gehen.
130
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
in Ruhe ist E = mc2 eine besondere Bedeutung. Es ist die Ruheenergie. Wir definieren die relativistische kinetische Energie T (r) als die Differenz der Ruheenergie
und der Energie E
!
1
T (r) = E − mc2 = p
− 1 mc2 ≥ 0 .
2
1−β
Zum Abschluß dieses Abschnitts wollen wir drei sich aus den oben eingeführten Größen ergebene Relationen herleiten, die bei Rechnungen oft hilfreich sind.
Nach den obigen Überlegungen gilt
(r) m
~v
p~
p= p
=
.
2
ic
iE/c
1−β
Damit folgt
~v
p~ (r) c
=
.
c
E
(6.4)
Man kann somit die Geschwindigkeit eines Objekts berechnen, wenn man seinen
relativistischen Impuls und seine Energie kennt. Als nächstes betrachten wir das
Viererskalar p2 . Im Ruhesystem des Objekts gilt p = (0, 0, 0, imc)T , also p2 =
−(mc)2 . Da p2 lorentzinvariant ist, gilt in jedem Bezugssystem
p2 = −(mc)2 .
Es ist manchmal hilfreich, dieses Ergebnis zu
E 2 = (mc2 )2 + (~p (r) c)2
(6.5)
umzuschreiben.
6.4
Die Kraft in der relativistischen Mechanik
Es ist sehr viel schwieriger das Konzept der Kraft in der relativistischen Mechanik einzuführen, als es in der klassischen Mechanik der Fall war. Wie für die
Übertragung der anderen Größen gibt es auch hier verschiedene Möglichkeiten der
Definition. Ein großes Problem ergibt sich dadurch, daß sich unter dem Einfluß
einer Kraft die Ruhemasse m eines Teilchens ändern könnte. Diese Möglichkeit
gibt es in der klassischen Mechanik nicht. Wir wollen unsere Betrachtungen hier
auf Kräfte beschränken, die die Masse eines Objekts, auf das sie wirken, nicht
ändern. Viele der in der relativistischen Mechanik wichtigen Kräfte sind von diesem Typ. In diese Klasse fällt z.B. die Lorentzkraft
~ + ~v × B)
~ ,
F~ = q(E
6.4. DIE KRAFT IN DER RELATIVISTISCHEN MECHANIK
131
die auf ein Teilchen mit Ladung q in einem elektromagnetischen Feld wirkt. Von
den verschiedenen möglichen Definitionen der Kraft in der relativistischen Mechanik ist die nützlichste die eines dreidimensionalen Kraftvektors
F~
(r)
=
d~p (r)
.
dt
(6.6)
Für kleine Geschwindigkeiten v/c 1 gilt p~ (r) → p~ und damit wird F~ (r) in
diesem Limes gleich der Kraft in der klassischen Mechanik, was sicherlich sinnvoll
ist. Für eine gegebene Kraft F~ (r) liefert Gl. (6.6) eine Bewegungsgleichung. Ein
weiteres Argument für die obige Definition ergibt sich durch einen Vergleich mit
Experimenten. Es zeigt sich in diesen, daß im Fall eines Teilchens mit Ladung q
in einem elektromagnetischen Feld d~p (r) /dt durch die Lorentzkraft gegeben ist.
Der dritte Grund dafür, daß die Definition des dreidimensionalen relativistischen
Kraftvektors sinnvoll ist, folgt dadurch, daß man einen Zusammenhang zwischen
der Änderung der relativistischen kinetischen Energie und der “Arbeit” F~ (r) ·∆~r,
die aus dieser Kraft folgt herleiten kann. Um dieses zu sehen, betrachten wir Gl.
(6.5). Differenzieren nach t auf beiden Seiten der Gleichung liefert
E
d~p (r)
dE
= p~ (r) c2 ·
= p~ (r) c2 · F~
dt
dt
(r)
.
Dabei haben wir verwendet, daß nach Annahme dm/dt = 0 gilt. Nach Divison
durch E und unter Verwendung von Gl. (6.4) folgt
dE
= ~v · F~
dt
(r)
,
(6.7)
bzw.
∆E = F~
(r)
· ∆~r .
Beachtet man jetzt noch, daß E = mc2 + T (r) und ∆m = 0, so folgt
∆T (r) = F~
(r)
· ∆~r ,
also der angekündigte Zusammenhang zwischen der Änderung der kinetischen
Energie und der Änderung der zur Kraft gehörenden Arbeit.
Betrachten wir als Beispiel die Bewegung eines Teilchens der (festen) Ruhemasse m, auf welches eine zeitlich und räumlich konstante Kraft F~ (r) wirkt. Diese
Situation läßt sich z.B. für ein geladenes Teilchen in einem zeitlich und räumlich
konstanten elektrischen Feld realisieren. Das Teilchen sei zur Zeit t = 0 im Ursprung in Ruhe. Nach der Definition der Kraft gilt p~ (r) = F~ (r) t. Mit Gln. (6.4)
und (6.5) folgt dann
~v (t) =
p~ (r) c2
F~ (r) tc2
=p
E
(mc2 )2 + (F
(r) tc)2
=
F~ (r) t
p
.
m 1 + (F (r) t/[mc])2
132
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
Wenn F (r) t/(mc) 1, d.h. wenn die Zeit t viel kleiner als die charakteristische
Zeit tc = mc/F (r) ist, können wir den Nenner durch 1 ersetzen und erhalten das
nicht-relativistische Ergebnis ~v = F~ (r) t/m. Falls jedoch t/tc 1, nähert sich v
der Vakuumlichtgeschwindigkeit an, ohne sie jedoch für endliches t je zu erreichen.
Um die Position des Teilchens ~r(t) zu bestimmen, müssen wir die Gleichung für
die Geschwindigkeit unter Berücksichtigung von ~r(t = 0) = 0 integrieren. Es folgt
s

(r) 2
(r) ~
2
mc
F
 1 + F t − 1 .
~r(t) =
(r)
m
F
mc
Für t/tc 1 ergibt sich das klassische Ergebnis
~r(t) =
1 F~ (r) 2
t
2 m
also ~at2 /2, mit ~a = F~ (r) /m. Für t → ∞ gilt r(t) → ct + const.. Dieses Beispiel
zeigt, daß die Bewegung alle unsere Erwartungen erfüllt.
Wenn zumindest in einem Bezugssystem k die Kraft F~ (r) als Gradient ei~ (r) , ist die Kraft
ner Funktion V (~r) geschrieben werden kann, d.h. F~ (r) = −∇V
konservativ. Dies ist z.B. für die Bewegung eines geladenen Teilchens in einem
elektrostatischen Feld der Fall. Sollte dies der Fall sein, so ist die Arbeit, die
am Teilchen verrichtet wird, wenn es sich um ∆~r im Kraftfeld, bewegt durch
~ (r) · ∆~r = −∆V (r) gegeben. Kombiniert mit dem oben diskutierF~ (r) · ∆~r = −∇V
ten Zusammenhang zur Änderung der kinetischen Energie gilt ∆T (r) = −∆V (r) ,
bzw. ∆(T (r) +V (r) ) = 0. Dies bedeutet, daß auch in der relativistischen Mechanik
für eine konservative Kraft T (r) + V (r) erhalten ist.
Die relativistische Kraft F~ (r) ist nicht der räumliche Anteil eines Vierervektors. Dies liegt daran, daß zwar ∆~p (r) der räumliche Anteil eines Vierervektors
ist, ∆t jedoch kein Viererskalar. In dieser Hinsicht ist F~ (r) wie der Geschwindigkeitsvektor ~v = d~r/dt und die Transformation der relativistischen Kraft F~ (r) von
k nach K hat eine ähnliche Struktur wie die von ~v . In Analogie zur Geschwindigkeit ist es nun leicht zu sehen, wie man einen vierdimensionalen mit F~ (r) in
Beziehung stehenden Kraftvektor definiert, der ein Vierervektor ist.
F =
dp
,
dτ
(6.8)
mit der Eigenzeit τ . Da ∆p ein Vierervektor ist und ∆τ ein Viererskalar, handelt es sich bei F offensichtlich um einen Vierervektor. Man nennt diese Kraft
auch die Minkowskikraft. Diese Gleichung ist die lorentzinvariante Erweiterung
der Newtonschen Bewegungsgleichung. Indem wir ∆τ gemäß Gl. (6.3) auf ∆t
umschreiben, folgt
d~p (r) ~ (r)
1
1
F
dt
F =p
=p
,
1 dE
1 − β2
1 − β 2 ~v · F~ (r) /c
c dt
6.4. DIE KRAFT IN DER RELATIVISTISCHEN MECHANIK
133
wobei wir Gl. (6.7) verwendet
p haben. Wir erkennen, daß der räumliche Teil von
(r)
2
F gleich F~
geteilt
p durch 1 − β ist, so wie der räumliche Teil von v gleich
~v geteilt durch 1 − β 2 ist. Damit ist klar, daß die räumlichen Komponenten
der relativistischen Bewegungsgleichung (6.8) für v/c 1 zu den klassischen
Newtonschen Gleichungen werden. Der Vorteil der Viererkraft F gegenüber der
relativistischen Kraft F~ (r) ist, daß sie sich von einem zum anderen Bezugssystem
mit der Lorentzstransformation transformiert. Außerdem läßt sich die Lorentzinvarianz aller mit der Viererkraft formulierten Gesetze einfach überprüfen (siehe
oben). Der Nachteil besteht darin, daß sie durch die Ableitung des Impulses
bezüglich der Eigenzeit gegeben ist, während F~ (r) durch die Ableitung bezüglich
der Zeit irgendeines Bezugssystems (nicht nur des Ruhesystems) definiert ist. Da
wir meist an der Bewegung eines Teilchens bezüglich eines bestimmten Bezugssystems (welches meist nicht das Ruhesystem sein wird) interessiert sind, ist die
relativistische Kraft F~ (r) praktisch meist nützlicher als die Viererkraft F .
Wir wollen im Rahmen dieser Vorlesung darauf verzichten, ausführlich eine
Lagrangsche Formulierung der relativistischen Mechanik zu diskutieren. Es ist
dabei für eine konservative (und geschwindigkeitsunabhängige) Kraft mit Potential V (r) leicht, eine Lagrangefunktion L anzugeben, aus der sich die für konkrete
Rechnungen wichtige Bewegungsgleichung (6.6) gemäß der Lagrangeschen Gleichung (i = 1, 2, 3)
∂L
d ∂L
−
=0
dt ∂vi ∂xi
ergibt. Eine geeignet Lagrangefunktion wäre in diesem Fall z.B.
p
L = −mc2 1 − β 2 − V (r) .
Leider hat diese Lagrangefunktion jedoch noch nicht die gewünschten Transformationseigenschaften gegenüber der Lorentztransformation, da sie kein Viererskalar ist. Somit ist die obige Überlegung, die auf ein L führt, nur der erste Schritt
auf dem Weg hin zu einer relativistischen Erweiterung der Lagrangeschen Mechanik.
Herunterladen