Theoretische Physik I (Mechanik) - Server der Fachgruppe Physik

Skript zur Vorlesung
Theoretische Physik I
(Mechanik)
von Volker Meden
gehalten im Sommersemester 2012
an der RWTH Aachen
24. September 2012
2
Inhaltsverzeichnis
1 Eine kurze Einführung
5
2 Newtonsche Mechanik Teil II
2.1 Das Zweikörperproblem . . . . . . . . . . . . . . . . . . . . . . .
2.2 Bewegte Bezugssysteme . . . . . . . . . . . . . . . . . . . . . . .
2.3 Der starre Körper . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
7
22
33
3 Lagrangesche Mechanik
3.1 Systeme mit Zwangsbedingungen . . . .
3.2 Lagrangegleichungen 2. Art . . . . . . .
3.3 Lagrangegleichungen 1. Art . . . . . . .
3.4 Nochmal die Lagrangegleichungen 2. Art
3.5 Das Prinzip der kleinsten Wirkung . . .
3.6 Symmetrien und Erhaltungssätze . . . .
.
.
.
.
.
.
53
55
56
63
66
69
74
4 Schwingungen und Saiten
4.1 Kleine Schwingungen . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Schwingende Saiten . . . . . . . . . . . . . . . . . . . . . . . . . .
85
85
90
5 Hamiltonsche Mechanik
5.1 Variable, Bewegungsgleichungen
5.2 Die Poissonklammern . . . . . .
5.3 Kanonische Transformationen .
5.4 Die Hamilton-Jacobi-Gleichung
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
95
. 96
. 101
. 105
. 112
6 Grundzüge der relativistischen Mechanik
6.1 Die Lorentztransformation . . . . . . . . .
6.2 Die Kovarianz . . . . . . . . . . . . . . . .
6.3 Masse, Vierergeschwindigkeit und -impuls
6.4 Die Kraft in der relativistischen Mechanik
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
und. . .
. . . .
. . . .
. . . .
.
.
.
.
115
116
123
127
130
4
INHALTSVERZEICHNIS
Kapitel 1
Eine kurze Einführung
Zum Verständnis der Vorlesung Theoretische Physik I ist es nahezu unerläßlich,
den Inhalt der Vorlesung Einführung in die Theoretische Physik verinnerlicht
zu haben. Dies gilt sowohl für die in letzterer behandelten mathematischen Methoden, als auch die Grundlagen der Newtonschen Mechanik. Zur Vorbereitung
auf den neuen Stoff rate ich ihnen, die Kapitel 3.5 und 3.6 der letztsemestrigen
Vorlesung nocheinmal durchzuarbeiten.
In der vorliegenden Vorlesung werden wir zunächst die in der Einführungsvorlesung noch nicht behandelten Kapitel der Newtonschen Mechanik präsentieren,
nämlich das Zweikörperproblem, bewegte Bezugssysteme und den starren Körper.
Im Anschluß gehen wir zur Lagrangschen Mechanik – deren fundamentale Bewegungsgleichungen wir bereits kennen gelernt haben – und zur Hamiltonschen
Mechanik über. Den Abschluß der Vorlesung bildet ein kurzes Kapitel über die
Grundzüge der relativistischen Mechanik.
Mit Ausnahme der so genannten Variationsrechnung, die wir zu Beginn des
Kapitels über Lagrangesche Mechanik einführen werden, und relativ elementaren
Überlegungen zur analytischen Geometrie von Ellipsen und Hyperbeln haben wir
alle zum Verständnis der Physik notwendingen mathematischen Methoden in der
Vorlesung zur Einführung in die Theoretische Physik bereits kennengelernt, so
daß in der Vorlesung Theoretische Physik I die Physik im Vordergrund stehen
wird.
Wie sie sehen werden, wird ihr Abstraktionsvermögen im Laufe der Vorlesung zunehmend herausgefordert, aber gleichzeitig auch geschult. Es bietet sich
an, die neuen Herangehensweisen an die klassische Mechanik zunächst an ihnen
bereits vertrauten mechanischen Problemen “auszuprobieren”, auch wenn dabei
die Vorteile der neuen Verfahren – die meist für komplexere Probleme entwickelt
wurden – nicht immer offensichtlich werden. Sollten wir in der Vorlesung bzw.
den zugehörigen Übungen dieser Philosophie nicht folgen, so bietet es sich an,
bekannte Probleme zuhause durchzurechnen.
In der Vorlesung werden wir uns nach und nach grundsätzlichen Prinzipien
der (theoretischen) Physik nähern, wie z.B. dem Extremalprinzip und dem Zu5
6
KAPITEL 1. EINE KURZE EINFÜHRUNG
sammenhang zwischen Symmetrien und Erhaltungsgrößen. Eine allgemeine Formulierung dieser erfordert dabei erneut ein höheres Maß an Abstraktion als ihnen
bisher begegnet ist, bringt aber entsprechende Vorteile und kann schon in dieser Vorlesung, aber auch in den Vorlesungen der theoretischen Physik späterer
Semester, gewinnbringend eingesetzt werden.
Kapitel 2
Newtonsche Mechanik Teil II
2.1
Das Zweikörperproblem
Aufbauend auf unsere Überlegungen zur Bewegung eines Teilchens in einem
zweidimensionalen, konservativem Zentralfeld (siehe Kapitel 3.6 der Vorlesung
Einführung in die Theoretische Physik) wollen wir jetzt das “berühmte” Zweikörperproblem mit 1/r-Paarpotential (im Dreidimensionalen) diskutieren. Es spielte in der Entwicklung der Mechanik eine zentrale Rolle (Bewegung eines Planeten
um die Sonne).
Wir gehen davon aus, daß sich die Kräfte, die die beiden Teilchen mit Massen
m1 und m2 aufeinander ausüben aus einem Zweiteilchenpotential v(|~r1 − ~r2 |)
ableiten lassen. Damit gelten die Newtonschen Bewegungsgleichungen
~ ~r1 v ; ,
m1~r¨1 = −∇
~ ~r2 v = ∇
~ ~r1 v .
m2~r¨2 = −∇
Die Addition der beiden Gleichungen liefert für den Schwerpunkt
~ = (m1~r1 + m2~r2 )/M ,
R
mit der Gesamtmasse M = m1 + m2 die Bewegungsgleichung
~¨ = 0 ,
MR
d.h. der Schwerpunkt bewegt sich geradlinig und gleichförmig. Eine zweite Bewegungsgleichung für den Relativvektor ~r = ~r1 − ~r2 erhält man, indem man
die erste Gleichung im obigen Gleichungssystem mit m2 und die zweite mit m1
multipliziert und anschließend subtrahiert
~ r|) .
µ~r¨ = −∇v(|~
Dabei bezeichnet µ = m1 m2 /M die so genannte reduzierte Masse.
7
8
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Als Folge dieser Überlegungen haben wir das Zweiteilchenproblem auf die
Bewegung eines Teilchens der Masse µ im externen Zentralpotential v(|~r|) zurück
geführt. Die Bewegungsgleichung für die Relativkoordinate läßt sich nun auf den
in Kapitel 3.6 der letztsemestrigen Vorlesung behandelten Fall der Bewegung
eines Teilchens in zwei Dimensionen reduzieren, da das zum Potential gehörende
Kraftfeld
~ r|) = −v ′ (r) ~rˆ
−∇v(|~
ein Zentralfeld ist (Richtung der Kraft ist ~rˆ). Wie wir gesehen haben, ist für
solche der (relative) Drehimpuls ~lrel = µ ~r × ~r˙ erhalten
d~lrel
d
= µ (~r × ~r˙ ) = µ ~r × ~r¨ = 0 .
dt
dt
Wie im letzten Semester diskutiert liegt damit jede Bahnkurve in einer Ebene,
die senkrecht zu ~lrel ist. Wie üblich wählen wir unser Koordinatensystem so, daß
~lrel entlang der x3 -Achse zeigt und die Bewegung ist auf eine zweidimensionale in
der x1 -x2 -Ebene reduziert.
Folgend werden wir am Fall des Gravitationspotentials ∝ 1/r interessiert sein.
Wir werden jedoch zuvor diskutieren, daß sich unter gewissen Annahmen an das
Potential bereits wichtige Aussagen treffen lassen, ohne die Bewegungsgleichung
explizit zu lösen. Die beiden Überlegungen scheinen ihnen vielleicht zunächst als
abstrakt, sind aber von großer Nützlichkeit auch über die klassische Mechanik
hinaus.
Mechanische Ähnlichkeit: Wir betrachten ein Kraftfeld F~ (~r) mit der Eigenschaft
F~ (α~r) = αk F~ (~r)
für alle α > 0. Man nennt eine Funktion mit dieser Eigenschaft eine homogene
Funktion. Typische Beispiele sind das Gravitationsfeld (in drei Dimensionen) mit
k = −2 und ein d-dimensionaler, isotroper (alle Raumrichtungen sind äquivalent)
harmonischer Oszillator mit k = 1. Sei nun ~r(t) eine Lösung der Newtonschen
Gleichung, d.h. von m~r¨(t) = F~ (~r(t)). Durch eine so genannte Skalentransformation mit dem Faktor α > 0 ändern wir die räumliche Ausdehnung der Bahn
~r → α~r. Zum Beispiel wird aus einer Kreisbahn mit Radius r0 eine mit Radius
αr0 . Wir zeigen nun, daß man durch Umskalieren der Zeit eine neue Lösung der
Newtonschen Gleichung erhalten kann. Wir setzen für die umskalierte Zeitvariable
τ = α−ν t
und legen ν später so fest, daß sich eine neue Lösung mit
~rα (τ ) = α~r(t) = α~r(αν τ )
9
2.1. DAS ZWEIKÖRPERPROBLEM
ergibt. Differentiation dieser Gleichung nach τ liefert
d2~rα (τ ) ~
m
− F (~rα (τ )) = α2ν+1 m~r¨(t) − αk F~ (~r(t)) .
2
dτ
Setzt man nun
2ν + 1 = k ,
so veschwindet nach der Voraussetzung an das Kraftfeld die rechte Seite und
~rα (τ ) ist ebenfalls Lösung der Newtonschen Gleichung. Damit gilt
τ
= α(1−k)/2 .
(2.1)
t
Betrachten wir nun eine beliebige geschlossene Bahn mit einer Umlaufzeit
T (in den “unskalierten” Variablen). Gemäß der folgenden Skizze habe sie die
Ausdehnung L. Die skalierte Bahn hat dann die Ausdehnung L̃ mit α = L̃/L.
Nach Gl. (2.1) gilt für die Umlaufzeit T̃ der skalierten Bahn
!(1−k)/2
L̃
T̃
= α(1−k)/2 =
.
T
L
L
~
L
Für den Fall des Gravitationspotenials mit k = −2 folgt dann
!3/2
!2
!3
T̃
L̃
T̃
L̃
=
⇒
=
T
L
T
L
bzw. in Worten: Die Quadrate der Umlaufzeiten zweier Bahnen verhalten sich
wie die Kuben der Abstände. Dies ist bereits eine Form des dritten Keplerschen
Gesetzes, welches ihnen sehr wahrscheinlich in der Vorlesung zur Experimentalphysik I im letzten Semester begegnet ist. Wir werden darauf zurückkommen.
Für den d-dimensionalen, isotropen Oszillator mit k = 1 folgt
!0
L̃
T̃
T̃
=
⇒ =1,
T
L
T
also die uns bereits bekannte Unabhängigkeit der Schwingungsdauer von der Auslenkung.
!0
T̃
L̃
T̃
=
⇒ =1,
T
L
T
10
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Man könnte die Logik nun auch umdrehen und aus dem experimentell bestimmten
Exponenten β (z.B. Planetenbahnen) in
L̃
L
T̃
=
T
!β
auf den Exponenten k der Kraft schließen (bei Planetenbahnen k = −2). Diese
Schlußweise ist von historischer Bedeutung (Newton).
Der Virialsatz: Wir betrachten die Bewegung eines Teilchens in einem konservativen Kraftfeld, wobei wir annehmen, daß das Potential V (~r) eine homogene
Funktion (α > 0)
V (α~r) = αkV V (~r)
ist. In diesem Fall existiert ein einfacher Zusammenhang zwischen dem Zeitmittelwert der potentiellen und der kinetischen Energie, falls die Bewegung in
einem beschränkten Raumgebiet verläuft. Um diesen zu beleuchten, definieren
wir zunächst, was wir unter dem zeitlichen Mittelwert verstehen wollen. Er ist
für eine Funktion f (t) definiert als
1
f = lim
t→∞ t
Z
t
f (t′ ) dt′ .
0
Mittelung der Relation
d ˙
~
~r · ~r = m~r˙ 2 + m~r · ~r¨ = 2T − ~r · ∇V
m
dt
liefert unter der Annahme, daß ~r(t) · ~r˙ (t) beschränkt ist
m
~r(t) · ~r˙ (t) − ~r(0) · ~r˙ (0) = 0 .
t→∞ t
~ = lim
2T − ~r · ∇V
~ über den
Für ein homogenes Potential läßt sich nun der Mittelwert von ~r · ∇V
kV
Mittelwert von V ausdrücken. Differentiation von V (α~r) = α V (~r) nach α
liefert für α = 1
~ = kV V (~r)
~r · ∇V
und damit folgt der Virialsatz
2T = kV V .
11
2.1. DAS ZWEIKÖRPERPROBLEM
Man kann diesen Zusammenhang sehr leicht auf mehrere Teilchen, die über homogene Zweiteilchenpotentiale wechselwirken, verallgemeinern. Aus der Energieerhaltung folgt T + V = E und damit
2
E,
kV + 2
kV
E.
T =
kV + 2
V
=
Für das Gravitationspotential (Keplerproblem) mit kV = −1 folgt so V = 2E
und T = −E. Für den d-dimensionalen, isotropen Oszillator mit kV = 2 ergibt
sich T = V = E/2.
Nach diesen sehr allgemeinen Überlegungen kommen wir nun zur Diskussion
des Zweikörperproblems mit dem Gravitationspotential.
Die Keplerschen Gesetze: Besonders wichtige Zentralfelder, bei denen die potentielle Energie wie 1/r geht, die Kraft also wie 1/r 2 abfällt, sind das Newtonsche
Gravitationsfeld (vermittels der Masse eines Teilchens) und das elektrostatische
Coulombfeld (vermittels der elektrischen Ladung eines Teilchens). Ersteres ist
immer anziehend, während das Coulombpotential sowohl anziehend, als auch abstoßend sein kann. Wir bezeichnen die Masse zunächst wieder mit m, werden sie
dann aber später durch die reduzierte Masse µ ersetzen. Zur Herleitung der Keplerschen Gesetze (der Planetenbewegung) betrachten wir den anziehenden Fall
mit V (r) = −α/r, α > 0. Das effektive Potential ist dann
Veff (r) = −
l2
α
+
.
r
2mr 2
(2.2)
Die Position r0 des Minimums des effektiven Potentials ergibt sich durch Ableiten
und Nullsetzen zu (l 6= 0)
r0 =
l2
αm
und der Wert des Potentials V0 am Minimum damit zu
Veff (r0 ) = V0 = −
α
α2 m
.
=−
2
2l
2r0
Damit folgt
Veff (r)
r0 1 r0 2
=− +
.
2|V0 |
r
2 r
Für l 6= 0 hat das effektive Potential die folgend skizzierte Form.
(2.3)
12
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Veff/(2 |V0|)
2
Drehimpulsbarriere
0
E
-2
0
1
2
3
r/r0
Wir beginnen die Diskussion der Dynamik mit dem einfachen Spezialfall der
Kreisbewegung mit Radius r0 und der kleinen Abweichung von dieser.
Ist der Abstand des Teilchens vom Ursprung für alle Zeiten gleich r0 , so liegt
eine Kreisbahn vor. Nach den Überlegungen aus Kapitel 3.6 der Vorlesung des
letzten Semesters (Seite 160 des Skripts) gilt für die Umlaufzeit T = Tφ (mit
φ(T + t0 ) − φ(t0 ) = 2π)
T = 2π
Mit Gl. (2.3) folgt l =
√
mr02
.
l
αmr0 und damit
r
m 3/2
T = 2π
r ,
α 0
d.h. das bereits oben zitierte dritte Keplersche Gesetz für den Spezialfall der
Kreisbewegung.
Um eine kleine Abweichung von der Kreisbewegung zu untersuchen, benötigen
wir die zweite Ableitung von Veff an der Stelle r0 (siehe die allgemeine Diskussion
in Kapitel 3.6 der Vorlesung des letzten Semesters). Es gilt
′′
Veff
(r0 )
3l2
l2
2α
=
.
=− 3 +
r0
mr04
mr04
Das ergibt die Frequenz
ωr =
r
′′
(r0 )
Veff
|l|
=
m
mr02
der Radialbewegung. Somit sind im vorliegenden Fall die Frequenzen der Radialund der Winkelbewegung (bei kleiner Abweichung von der Kreisbewegung) gleich,
13
2.1. DAS ZWEIKÖRPERPROBLEM
da auch ωφ = |l|/(mr02 ) gilt (siehe Seite 160 des Skripts des letzten Semesters).
Somit schließt die Bahnkurve bereits nach einer Umdrehung. Wir zeigen im Folgenden, daß dieses Ergebnis nicht nur für kleine Abweichungen von der Kreisbewegung gilt, sondern für den hier betrachteten Fall des Gravitationspotentials
∝ 1/r und −|V0 | ≤ E < 0, also finite Bewegungen, allgemeingültig ist.
Um die allgemeine finite Trajektorie zu diskutieren, betrachten wir die Gleichung
Z r
l
p
φ − φmin = ±
dr ′
′2
′ )]
r
2m[E
−
V
(r
r
eff
Z min
r
l
p
dr ′ ,
= ±
′2
′
2
′2
2m[E + α/r − l /(2mr )]
rmin r
die wir im vergangenen Semester hergeleitet haben (siehe Seite 163 des Skripts).
Dabei bezeichnet φmin den zum minimalen Abstand der Bahn vom Ursprung rmin
gehörenden Winkel. Nach der Substitution u = 1/r ′ ergibt sich (“dr ′ = −du/u2”)
φ − φmin = ∓
Z
1/r
1/rmin
√
l
1
p
du .
2m E + αu − (l2 /[2m])u2
Den Ausdruck in der u-abhängigen Wurzel bringen wir durch quadratische Ergänzung auf die Form
E′ −
l2
l2 2 l2
l2 2
(u − u0 )2 = E ′ −
u + uu0 −
u ,
2m
2m
m
2m 0
woraus sich
u0 =
αm
1
=
;
2
l
r0
E′ = E +
α2 m
= E + |V0 | ≥ 0
2l2
ergibt. Nach der Substitution v = u − u0 folgt (l > 0)
φ − φmin = ∓
mit
A2 =
Z
1/r−1/r0
1/rmin −1/r0
1
p
2mE ′ /l2 − v 2
dv = ∓
Z
1/r−1/r0
1/rmin −1/r0
√
1
dv
A2 − v 2
2m
2mE ′
= 2 |V0 |(1 + E/|V0|) = (1 + E/|V0 |)/r02 ≥ 0 .
2
l
l
Elementare Integration liefert dann
1/r−1/r
0
φ − φmin = ∓ arcsin (v/A)|1/rmin −1/r
(2.4)
0
1
1
1
1
1 1
− arcsin
−
.(2.5)
−
= ∓ arcsin
A r r0
A rmin r0
14
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Umgeformt gilt
φ − φ0 = ∓ arcsin
1
A
1
1
−
r r0
,
mit
φ0 = φmin ± arcsin
1
A
1
rmin
1
−
r0
,
bzw.
1
1
−
= A sin(∓[φ − φ0 ])
r r0
A≥0.
Wir rotieren unser Koordinatensystem nun so, daß φ0 = −3π/2 für das obere
und φ0 = −π/2 für das untere Vorzeichen gilt. Damit folgt
r0
= 1 + ǫ cos(φ) ,
r
(2.6)
p
wobei wir die so genannte Exzentrizität ǫ = r0 A = 1 + E/|V0 | eingeführt haben.
Wir haben somit die gesuchte Bahngleichung bestimmt. Für den betrachteten Fall
−|V0 | ≤ E < 0, d.h. 0 ≤ ǫ < 1 ist dies die Gleichung für eine Ellipse. Wir wollen
dies in dem folgenden Einschub genauer betrachten.
Einschub zur mathematischen Beschreibung von Ellipsen: Wir beginnen diesen mit der Definition. Eine Ellipse ist die Menge von Punkten P in einer
Ebene, für die die Summe der Abstände zu zwei festen Punkten F1 und F2 einen
konstanten Wert annimmt, also
|F1 P | + |F2 P | = const.
gilt. Man bezeichnet die Fi als die Fokuspunkte. Folgend ist eine Ellipse, in der
die wichtigen Punkte und Längen indiziert sind dargestellt.
B
P
b
c
F1
M
F2
a−c A
Der Abstand der beiden Fokuspunkte ist 2c, die Länge der kurzen Halbachse ist
b = |MB| und die der langen Halbachse a = |MA|. Wählt man als Punkt auf
der Ellipse den Punkt A, so gilt für die Summe d der Abstände von F1 und
15
2.1. DAS ZWEIKÖRPERPROBLEM
F2 , d = (a + c) + (a −
√ c) = 2a, während sich für die Wahl des Punktes B
nach Pythagoras d = 2 c2 + b2 ergibt. Kombiniert gilt also für die Längen der
Halbachsen und den halben Abstand der Fokuspunkte a2 = b2 + c2 .
Es gibt nun zwei gängige Vorgehensweisen. Man kann einerseits den Ursprung
des Koordinatensystems in einen der Fokuspunkte legen, also z.B. F2 . Damit ist
~r durch den Vektor von F2 nach P gegeben. Mit der Definition, daß ~c den Vektor
von M nach F2 bezeichnet gilt nach der Definitionsgleichung der Ellipse und
d = 2a
|~r| + |~r + 2~c| = 2a .
Quadriert man die resultierende Gleichung |~r + 2~c| = 2a − r, so folgt
~c · ~r + ar = a2 − c2 = b2 .
Definiert man nun die Exzentrizität ǫ durch c = ǫa, d.h. 0 ≤ ǫ =
und verwendet ~c · ~r = cr cos φ, so ergibt sich
ǫ cos φ + 1 =
p
1 − b2 /a2 < 1
b2 1
a r
oder mit r0 = b2 /a (r0 ist die Länge von ~r für φ = π/2)
r0
= ǫ cos φ + 1 .
r
Dies ist die Ellipsengleichung in Polarkoordinaten, wie sie bei der Lösung des
Keplerproblems auftritt (siehe oben). Für ǫ → 0 geht die Ellipse in einen Kreis
(Spezialfall einer Ellipse) mit Radius r0 über.
Alternativ kann man den Ursprung in den Mittelpunkt M der Ellipse legen.
Drückt man den Punkt P dann durch kartesische Koordinaten aus, so lautet die
Bedingung für die Summe der Abstände
p
p
(x + c)2 + y 2 + (x − c)2 + y 2 = 2a .
Quadrieren liefert
(x + c)2 + y 2 + (x − c)2 + y 2 + 2
p
[(x + c)2 + y 2 ][(x − c)2 + y 2 ] = 4a2
und erneutes Quadrieren nach Auflösen nach dem Wurzelterm
x2 (a2 − c2 ) + y 2a2 = a2 (a2 − c2 ) .
Unter Verwendung von a2 − c2 = b2 ergibt sich so
x2 y 2
+ 2 =1.
a2
b
16
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Dies ist die Normalform der Ellipse, deren Mittelpunkt im Ursprung liegt (in kartesischen Koordinaten). In dieser Form ergibt sich die Ellipse, wenn man sie über
“Kegelschnitte” einführt. Im Spezialfall a2 = b2 ergibt sich die Kreisgleichung.
Da wir später auch Hyperbeln benötigen werden (infinite Bewegung im Keplerproblem), wollen wir diese gleich analog zu den Ellipsen einführen.
Einschub zur mathematischen Beschreibung von Hyperbeln: Eine
Hyperbel ist die Menge von Punkten P in einer Ebene, für die die Differenz
der Abstände zu zwei festen Fokuspunkten F1 und F2 einen konstanten Wert
annimmt, also
|F1 P | − |F2 P | = const.
gilt. Folgend ist ein Paar von Hyperbelästen, in der die wichtigen Punkte und
Längen indiziert sind dargestellt.
P
A
F1
a M a
F2
Der Abstand der Fokuspunkte wird erneut mit 2c bezeichnet. Wählt man den
Punkt A (siehe Skizze) auf dem linken Ast der Hyperbel, so ergibt sich für die
Differenz der Abstände der Wert
|F1 P | − |F2 P | = −2|MA| = −2a .
Für den zu A analogen Punkt auf dem rechten Ast gilt
|F1 P | − |F2 P | = 2|MA| = 2a .
Legt man den Ursprung des Koordinatensystems in den Fokuspunkt F1 , dann
ist ~r durch den Vektor von F1 nach P gegeben und mit dem Vektor ~c von M
nach F2 folgt für die speziellen Punkte A auf dem linken/rechten Hyperbelast
(oberes/unteres Vorzeichen)
|~r| − |~r − 2~c| = ∓2a .
Quadriert man die resultierende Gleichung −|~r − 2~c| = ∓2a − r, so folgt
~c · ~r ± ar = c2 − a2 .
17
2.1. DAS ZWEIKÖRPERPROBLEM
Definiert man die Exzentrizität ǫ erneut als ǫ = c/a, wobei hier jedoch ǫ ≥ 1 gilt,
und verwendet ~c · ~r = cr cos φ, so ergibt sich
r0
= ǫ cos φ ± 1 ,
r
wobei r0 = (c2 − a2 )/a ist. Dies ist die Hyperbelgleichung (“+” linker Ast, “-”
rechter Ast) in Polarkoordinaten, die uns später begegnen wird.
Mit dem Ursprung im Mittelpunkt M bieten sich wieder kartesische Koordinaten an. Die Definitionsgleichung liefert
p
p
(x + c)2 + y 2 − (x − c)2 + y 2 = ∓2a .
Quadriert man beide Seiten, separiert den verbleibenden Wurzelterm und quadriert erneut, so erhält man analog zum Fall der Ellipse
y2
x2
+
=1.
a2 a2 − c2
Da im Gegensatz zur Ellipse c > a gilt, definiert man b2 = c2 − a2 und erhält so
x2 y 2
− 2 =1
a2
b
als die Normalform der Gleichung des Hyperbelpaars.
Zurück zum Keplerproblem: Die Bahnkurve Gl. (2.6) der finiten Bewegung im Keplerproblem entspricht der soeben diskutierten Gleichung einer Ellipse
in Polarkoordinaten, mit dem Ursprung in einem der Fokuspunkte. Damit liegt
das Zentrum des Zentralpotentials in diesem Fokuspunkt. Es handelt sich bei dieser Einsicht um das erste Keplersche Gesetz, was wir genauer formulieren werden,
wenn wir zum Zweikörperproblem zurückkehren werden.
Es besteht ein Zusammenhang zwischen der Exzentrizität der Ellipse und dem
maximalen und minimalen Abstand rmax/min der Bahnkurve zum Ursprung. Um
diesen herzustellen, bestimmen wir zunächst rmax/min . Für vorgegebenes E mit
−|V0 | ≤ E < 0 gilt
r l2
α 2
α
±
+
Veff (rmax/min ) = E ⇒ rmax/min = −
2E 2E
2mE
p
α
= −
1 ± 1 + E/|V0|
2E
α
= −
(1 ± ǫ) .
2E
Die Abhängigkeit von l ist dabei in V0 “versteckt”. Die Summe von rmax und rmin
ist jedoch unabhängig von l
rmax + rmin =
α
.
|E|
18
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Wir betrachten nun
rmin(1 + ǫ) = −
α
α
(1 − ǫ2 ) =
= r0
2E
2|V0 |
oder geometrisch (siehe Skizze der Ellipse sowie c = ǫa, ǫ =
r0 = b2 /a)
rmin (1 + ǫ) = (a − c)(1 + ǫ) = a(1 − ǫ2 ) = a
p
1 − b2 /a2 und
b2
= r0 .
a2
Somit ergibt sich
rmin =
r0
1+ǫ
rmax =
r0
.
1−ǫ
und analog
Die Länge a der langen Halbachse ist durch
a=
α
rmax + rmin
=
2
2|E|
gegeben und somit unabhängig vom Drehimpuls l.
Um den zeitlichen Durchlauf der Ellipsenbahn zu bestimmen, verwendet man
die Drehimpulserhaltung. Es gilt
mr 2 (φ(t)) φ̇(t) = l
und damit (Separation der Variablen)
t − t0
m
=
l
=
m
l
Z
φ
φ0
φ
Z
φ0
r 2 (φ′ ) dφ′
r02
dφ′ .
(1 + ǫ cos φ′ )2
Das Integral läßt sich elementar ausführen, es ist jedoch nicht möglich, das Ergebnis geschlossen nach φ(t) aufzulösen.
Interessiert man sich nur für die Umlaufzeit T , so kann man die in Kapitel 3.6
der Vorlesung des letzten Semesters eingeführte Flächengeschwindigkeit (siehe
Seite 157 des Skripts)
l
dS
=
dt
2m
2.1. DAS ZWEIKÖRPERPROBLEM
19
verwenden. Integration dieser Gleichung über die Zeit von 0 bis T liefert
T =
2mS
,
l
√
wobei S die Fläche der Ellipse ist. Es gilt S = πab = πa2 1 − ǫ2 und damit
√
wegen l = αmr0
2m 2 √
πa 1 − ǫ2
lr
√
m a2 1 − ǫ2
= 2π
√
α
r0
r
m 3/2
= 2π
a
α
r
m
.
= πα
2|E|3
T =
(2.7)
Die dritte Zeile enthält das dritte Keplersche Gesetz, welches uns bereits mehrfach begegnet ist. Die vierte Zeile zeigt, daß die Umlaufzeit nur von der Energie
des Teilchens abhängt. Diese Einsicht hat eine historisch wichtige Rolle beim
Übergang von der klassischen Mechanik zur Quantenmechanik gemäß dem so
genannten “Korrespondenzprinzip” gespielt.
Wir kehren nun zum eigentlichen Zweikörperproblem “Planet-Sonne” zurück.
Wir müssen somit m durch die reduzierte Masse µ = m1 m2 /(m1 + m2 ) ersetzen und erhalten dann die Trajektorie der Relativbewegung ~r = ~r1 − ~r2 . Die
Ortsvektoren der beiden Massen sind
m2
~r ,
M
~ − m1 ~r .
~r2 = R
M
~+
~r1 = R
~ =0
Wir betrachten die Bewegung zunächst im Schwerpunktsystem, für das R
~
gilt. Dieses ist ein Inertialsystem (siehe oben). Wegen R = 0 gilt
m2
~r ,
m1 + m2
m1
~r2 = −
~r
m1 + m2
~r1 =
und sowohl der Planet, wie auch die Sonne folgen einer Ellipsenbahn mit einem gemeinsamen Fokuspunkt im Ursprung. Für das System “Erde-Sonne” gilt
mE /mS ≈ 3 · 10−6 und ǫ ≈ 0.017. Um das Verhalten besser graphisch darstellen
zu können, ist in der folgenden Skizze m1 /m2 = 0.1 und ǫ = 0.3 gewählt.
20
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
1
x2/r0
0.5
0
-0.5
-1
-1
-0.5
0
x1/r0
0.5
Eine zweite Möglichkeit besteht darin, die Bewegung im System der Sonne
mit ~r(t) = ~r1 (t) = ~rE (t) zu beschreiben. Es ist wichtig festzuhalten, daß es sich
bei diesem Koordinatensystem nicht um ein Inertialsystem handelt. In diesem
System bewegt sich die Erde auf einer Ellipse um die Sonne, wobei diese in einem
der Brennpunkte (Fokuspunkte) steht. Dies ist das erste Keplersche Gesetz (für
das Zweiteilchenproblem). Aufgrund des sehr großen Verhältnisses der Massen
der Sonne und der Erde, unterscheiden sich die Beschreibungen in den beiden
Koordiantensystemen nur wenig. Das zweite Keplersche Gesetz haben wir bereits
im vergangenen Semester kennen gelernt (siehe Seite 157 des Skripts). Es folgt
aus der Konstanz der Flächengeschwindigkeit und ist somit eine Manifestation
der Drehimpulserhaltung: In gleichen Zeiten werden durch ~r(t) gleiche Flächen
überstrichen.1 Wir kommen nun zur Formulierung des dritten Keplerschen Gesetzes für das Zweikörperproblem. Für den Vorfaktor in Gl. (2.7) müssen wir für
ein System “Planet-Sonne” die Ersetzung
r
r
m
µ
1
1
≈√
→
=p
α
GmP mS
GmS
G(mS + mP )
vornehmen, wobei G die Gravitationskonstante ist. Damit gilt
1
T = 2π p
1
G(mS + mP )
a3/2 ≈ 2π √
1
a3/2 .
GmS
(2.8)
Es ist wichtig festzuhalten, daß das zweite Keplersche Gesetz somit für alle Zentralpotentiale
gilt. Im Gegesatz dazu sind das erste und dritte Keplersche Gesetz spezifisch für das 1/rPotential.
21
2.1. DAS ZWEIKÖRPERPROBLEM
Die Quadrate der Umlaufzeiten zweier Bahnen verhalten sich somit wie die Kuben der langen Halbachsen und da mP /mS ≪ 1, ist der Vorfaktor (nahezu)
unabhängig vom betrachteten Planeten. Es sollte klar sein, daß die Keplerschen
Gesetze aufgrund der Anwesenheit weiterer Himmelskörper (weitere Planeten,
Monde,. . . ) bei der Beschreibung der Bewegung von Planeten “um die Sonne”
nur näherungweise gelten. Mit dieser Formulierung der drei Keplerschen Gesetze
schließen wir die Diskussion der finiten Bewegung im Keplerproblem ab.
Infinite Bewegungen im attraktiven 1/r-Potential: Positive Gesamtenergien E ≥ 0 führen im Potential Gl. (2.2) zu infiniten Bewegungen (siehe die Skizze
des Potentials). Die Schritte, die auf die Gleichung (2.6)
r0
= 1 + ǫ cos(φ) ,
r
geführt haben, können völlig
p analog vollzogen werden. In diesem Fall gilt jedoch
für die Exzentrizität ǫ = 1 + E/|V0 | ≥ 1 und die Bahnkurve beschreibt den
linken Ast einer Hyperbel. Der Spezialfall E = 0 führt auf ǫ = 1 und Gl. (2.6)
beschriebt eine Parabel mit dem Ursprung als Brennpunkt der Parabel. Trägt
man die Bahnkurve für E > 0, d.h. ǫ > 1 beginnend mit φ = 0 für zunehmende
Werte von φ auf, so divergiert r beim Grenzwinkel φc der durch
cos φc = −
1
ǫ
gegeben ist. In der folgenden Skizze ist der Übergang vom Kreis mit ǫ = 0 zur
Hyperbel mit ǫ > 1 dargestellt. Die Werte der Exzentrizität sind ǫ = 0, 0.5, 0.9,
1, und 1.4.
x2/r0
5
0
-5
-10
-5
x1/r0
0
22
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Infinite Bewegungen im repulsiven 1/r-Potential: Im Hinblick auf geladene Teilchen gleicher Ladung wollen wir zusätzlich die Bewegung bei abstoßender
Wechselwirkung mit Potential V (r) = α/r, α > 0 untersuchen. In diesem Fall
nimmt Veff (r) für wachsende r monoton von ∞ nach 0 ab. Die Energie des Teilchens kann nur positiv sein und jede Bewegung ist infinit. Wie zuvor kann man
(formal) die Größen r0 = l2 /(αm) und |V0 | = α2 m/(2l2 ) definieren. Im Vergleich zur Rechnung im anziehenden Fall ergibt sich als einziger Unterschied, daß
u0 = −1/r0 . Für die Bahnkurve ergibt sich also
r0
= −1 + ǫ cos φ ,
r
ǫ=
p
1 + E/|V0 | .
Diese Gleichung beschreibt den rechten Hyperbelast (siehe oben). Somit schließt
die Trajektorie im abstoßenden Fall im Gegensatz zum anziehenden Fall das
Zentrum des Potentials im linken Brennpunkt nicht ein.
Es würde sich an dieser Stelle anbieten, eine allgemeine Diskussion der Streuung eines Teilchens an einem Potential anzuschließen. Aus Zeitgründen können
wir uns jedoch hier nicht mit der so genannten Streutheorie beschäftigen und
das, obwohl Streuexperimente in der Geschichte der Physik eine wichtige Rolle
gespielt haben. Es sei daher auf die entsprechende Literatur verwiesen.
2.2
Bewegte Bezugssysteme
Wir werden in diesem Kapitel untersuchen, wie sich die Form der Newtonschen
Gleichungen ändert, wenn man von einem inertialen Bezugssytem k in ein relativ
zu diesem bewegtes Bezugssystem K übergeht. Es sei daran erinnert, daß die
bisher verwendete Form der Newtonschen Gleichung m~x¨ = F~ (~x) per Definition
nur in Inertialsystemen gilt. Der Satz von Basisvektoren in K ist bezüglich dem
von k verschoben und verdreht, wobei die Verschiebung und Verdrehung von der
Zeit abhängen kann. Dies ist in der folgenden Skizze dargestellt (hier in einer
Ebene bzw. für den zweidimensionalen Fall).
k
K
r(t)
e1
e2
e1
E2
R(t)
r0(t)
E1
~
~ i der Ortsvektor eines Punktes relativ zum bewegten SySei R(t)
= i Xi (t)E
P
stem K. Man erhält den Ortsvektor ~r(t) = i xi (t)~ei desselben Punktes relativ
P
23
2.2. BEWEGTE BEZUGSSYSTEME
P (0)
zu k als Summe des (zeitabhängigen) Verschiebungsvektors ~r0 (t) = i xi (t)~ei
~ welches sich unter der
der Koordinatenursprünge und dem Bild des Vektors R,
(zeitabhängigen) Drehung der Koordinatenachsen von K relativ zu denen von k
ergibt. In Kapitel 2.12 der Vorlesung des letzten Semesters haben wir gelernt,
daß man Rotationen mit Hilfe von orthogonalen Matrizen A, mit der Eigenschaft AT = A−1 und Matrixelementen ai,j beschreibt. Anders ausgedrückt ist
die Rotation eine (zeitabhängige) lineare Abbildung Bt : K → k. Das Bild der
~ i aus K unter der Rotation haben wir in Kapitel 2.12 mit ~e ′ beBasisvektoren E
i
′
~ i.
zeichnet – Vektoren die jetzt im Allgemeinen zeitabhängig werden: ~ei (t) = Bt E
~
Damit kann man die obigen Worte zur Beziehung von ~r und R in eine Formel
fassen
~
~r(t) = ~r0 (t) + Bt R(t)
X
X (0)
′
xi (t)~ei +
Xi (t)~ei (t) .
=
i
i
Da2
′
~ei (t) =
X
~ej bj,i (t) ,
j
also
bi,j = ~e′j · ~ei ,
folgt
~r(t) =
X
(0)
xi (t) +
i
X
!
bi,j (t)Xj (t) ~ei .
j
Scheinkräfte im Lagrange-Formalismus: Wir werden nun zunächst den Lagrange-Formalismus verwenden um zu sehen, wie sich die Bewegungsgleichungen
in bewegten Bezugssystemen verändern. Dazu verwenden wir die Xi (t) als neue
(krummlinige) Koordinaten. Aus
X
′
~r(t) = ~r0 (t) +
Xi (t)~ei (t) .
i
folgt
~gi =
2
∂~r
′
= ~ei
∂Xi
Die in Kapitel 2.12 der letztsemestrigen Vorlesung eingeführte, eine Rotation beschreibende
Matrix A und die hier auftretende Matrix B, mit Matrixelementen bi,j , genügen der Beziehung
BT = A. Somit sind A und B invers zueinander (da orthogonale Matrizen).
24
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
und
~r˙ =
X
i
′
Ẋi~ei +
X
′
Xi~e˙ i + ~r˙0 .
i
Mit den Relationen
∂~r˙
∂T
′
= m~r˙ ·
= m~r˙ · ~ei
∂ Ẋi
∂ Ẋi
und
∂T
∂~r˙
′
= m~r˙ ·
= m~r˙ · ~e˙ i
∂Xi
∂Xi
lautet die Lagrange-Form der Newtonschen Bewegungsgleichung in Gegenwart
der Kraft (in k)3 f~ (siehe Gl. (3.15) des Skripts der letztsemestrigen Vorlesung)
d ˙ ′
′
~r · ~ei = m~r˙ · ~e˙ i + ~e′i · f~ .
m
dt
′
Wir betrachten zunächst den Fall der zeitunabhängigen Verdrehung mit ~e˙ i (t) =
0. Damit verschwindet der erste Term auf der rechten Seite und die Gleichung
läßt sich umformen zu
⇔
⇒
~¨ = f~
m(~r¨0 + BR)
~¨ 0 + BR)
~¨ = BF~
m(BR
~¨ = F~ (R)
~ − mR
~¨ 0 = F~tot .
mR
~ in K) wirkt im
Zusätzlich zur vorgegebenen Kraft am Ort P (mit Ortsvektor R
¨
~ 0 . Sie ist die Scheinkraft, die in eibewegten System K die Trägheitskraft −mR
nem relativ zum Inertialsystem k linear beschleunigtem Bezugssystem K auftritt
(und dort ganz real ist). Dabei muß die relative Beschleunigung nicht zwangsläufig
zeitlich konstant sein, sondern kann sich durchaus ändern. Sind die beiden Bezugssysteme gar nicht gegeneinander verdreht so ist B die identische Abbildung.
Die auftretende Scheinkraft ist uns aus dem Alltag wohlbekannt. Sie wirkt z.B.,
wenn wir uns in einem Fahrstuhl befinden, der anfährt oder in einem Zug, der
beschleunigt bzw. bremst. Weiterhin ist sie die Erklärung für das Auftreten der
Gezeiten (Ebbe und Flut). Dabei ist die Beobachtung von zentraler Bedeutung,
daß die Erde, von der aus wir die Gezeiten beobachten (unser Bezugssystem ist
erdfest), kein Inertialsystem ist. Ein offensichtlicher Grund dafür ist die Rotation der Erde. Für die Erklärung der Gezeiten spielt jedoch die Tatsache, daß die
3
Wir schreiben die Kraft (in k) mit einem kleinen Buchstaben, da dies hier zur besseren
Unterscheidung für alle Vektoren bezüglich k gemacht wird.
2.2. BEWEGTE BEZUGSSYSTEME
25
Erde zum Mond hin beschleunigt wird (Gravitationskraft) die entscheidene Rolle
(siehe Übungen).
~
Bewegt sich das Bezugssystem K mit dem Teilchen mit, d.h. gilt R(t)
=
¨
~ = 0, daß die Gesamtkraft (in K) F~tot verschwindet.
const., so folgt wegen R
Als einfaches Beispiel wollen wir hier das Problem eines Fadenpendels mit
Masse m und Fadenlänge R (siehe Kapitel 3.4 des Skripts zur Einführung in die
Theoretische Physik) in einem linear beschleunigten Zug (relativ zur Erdoberfläche) betrachten. Näherungsweise können wir in diesem Problem die Erde als
ein Inertialsystem betrachten. Die durch die Rotation auftretenden Abweichungen davon werden wir weiter unten diskutieren. Im erdfesten (fast-)Inertialsystem
~ und die Normalkraft N
~ (Fadenspannung). Es gilt
wirken die Gravitationskraft G
~ +N
~ . Gehen wir nun in das zugfeste Bezugssystem, so tritt zusätzlich die
m~r¨ = G
~ auf. Die Bewegungsgleichung lautet in diesem
Scheinkraft −m~r¨0 (t) = −mA(t)
~¨ = G
~ +N
~ − mA
~=N
~ + m(~g − A)
~ =N
~ + m~geff ,
mR
wobei wir ausgenutzt haben, daß sowohl die Gravitationskraft, als auch die Trägheitskraft proportional zur Masse sind. Damit ist die Form der Bewegungsgleichung im linear beschleunigten Bezugssystem genau dieselbe wie im Inertialsy~ In einer Übungsaufgabe werden sie dieses
stem mit der Ersetzung ~g → ~g − A.
Beispiel zu Ende rechnen, indem sie den Winkel der Ruhelage im beschleuingten
Sytem und die Kreisfrequenz der Bewegung in diesem berechnen.
Bewegt sich K geradlinig und gleichförmig relativ zu k, so verschwindet die
Trägheitskraft. In diesem Fall ist auch K ein Inertialsystem und die Newtonsche
Gleichung hat in beiden Systemen die gleiche Form (siehe die Definiton des Begriffs Inertialsystem in Kapitel 3.2 der Vorlesung des letzten Semesters).
Das Galileische Relativitätsprinzip und die Form von Kräften: Wir betrachten nun ein System von N Teilchen und wollen untersuchen, welche Einschränkungen das in Kapitel 3.2 der letztjährigen Vorlesung eingeführte Galileische Relativitärtsprinzip4 für die Form der Kräfte f~i (~r1 , ~r2 , . . . , ~rN ; ~r˙1 , ~r˙2 , . . . , ~r˙N ; t)
mit i = 1, 2, . . . , N hat. Da es sich bei den zwei Bezugssystemen zwischen denen
man hin und her transformiert um zwei Inertialsysteme k und K handeln soll,
kann der Verschiebungsvektor der Ursprünge ~r0 nur die Form ~r0 (t) = ~c + ~v0 t
haben und die durch die lineare Abbildung B gegebene relative Drehung ist zeitunabhängig. Weiterhin können wir die Zeit gemäß T = t + t0 verschieben, wobei
~ ist. Die Zeitverschiebung zählt ebenfalls zu den GaliT das Zeitargument von R
leitransformationen. In k lautet die Bewegungsgleichung
mi~r¨i = f~i (~r1 , ~r2 , . . . , ~rN ; ~r˙1 , ~r˙2 , . . . , ~r˙N ; t)
4
Kurz: Die Newtonsche Bewegungsgleichung hat in zwei Inertialsystemen zu allen Zeiten die
gleiche Form.
26
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
~¨ i )
und damit in K (wobei ~r¨i = BR
~¨ i = B−1 f~i (~r0 + BR
~ 1 , . . . , ~r0 + BR
~ N ; ~v0 + BR
~˙ 1 , . . . , ~v0 + BR
~˙ N ; T − t0 ) ,
mi R
mit der zu B inversen Abbildung B−1 (die durch die transponierte Matrix gegeben
wird). Nach dem Galileischen Relativitätsprinzip sollen nun die Kräfte F~i = B−1 f~i
~ j und R
~˙ j dieselbe Form haben wie in k. Es soll also gelten
ausgedrückt durch die R
~ 1 , . . . , ~r0 + BR
~ N ; ~v0 + BR
~˙ 1 , . . . , ~v0 + BR
~˙ N ; T − t0 )
B−1 f~i (~r0 + BR
~ 1, . . . , R
~N; R
~˙ 1 , . . . , R
~˙ N ; T ) .
= f~i (R
Für die Situation von geschwindigkeitsunabhängigen Paarkräften
X
f~i =
f~i,j (~ri , ~rj ; t)
j6=i
vereinfacht sich die Bedingung zu
X
X
~ i, R
~ j; T ) .
~ i , ~r0 + BR
~ j ; T − t0 ) =
f~i,j (R
f~i,j (~r0 + BR
B−1
j6=i
j6=i
Wir wählen nun ein beliebiges Paar von Teilchen aus und entfernen alle weiteren
Teilchen aus unserem Problem (wir betrachten also ein spezielles System mit
N = 2). Dann gilt
~ i , ~r0 + BR
~ j ; T − t0 ) = f~i,j (R
~ i, R
~ j; T ) .
B−1 f~i,j (~r0 + BR
(2.9)
Die f~i,j könnten dabei vom Teilchentyp abhängen. Die Gleichung für jeden Summanden muß aber gelten, da wir alle Teilchenpaare durchgehen können. Für diesen Fall wollen wir nun die Konsequenzen aus der Forderung der Invarianz unter
den Galileitransformationen
~ i = ~r0 (t) + BR
~i ,
~ri = ~c + ~v0 t + BR
t = T − t0
(2.10)
untersuchen. Zunächst betrachten wir die Transformation mit ~r0 (t) = 0 und bei
~ i (T ). Gleichung
der B durch die Identität gegeben ist. Damit gilt ~ri (t + t0 ) = R
(2.9) liefert dann
~ i, R
~ j ; T − t0 ) = f~i,j (R
~ i, R
~ j; T ) .
f~i,j (R
Da t0 beliebig ist folgt umgehend, daß das Galileische Relativitätsprinzip nur
gelten kann, wenn die Paarkräfte nicht explizit von der Zeit abhängen. Dies
impliziert, daß die Energie erhalten ist (siehe Diskussion im letzten Semester).
2.2. BEWEGTE BEZUGSSYSTEME
27
Die Invarianz unter Zeittranslation hängt also unmitellbar mit der Energieerhaltung zusammen. Als zweite spezielle Galileitransformation betrachten wir die mit
~v0 = 0, t0 = 0 und bei der B durch die Identität gegeben ist. Diese testet die Homogenität des Raumes, die besagt, daß kein Punkt des leeren Raumes vor einem
anderen ausgezeichnet ist. Gleichung (2.9) impliziert für diese Transformation,
daß5
~ i , ~c + R
~ j ) = f~i,j (R
~ i, R
~ j) .
f~i,j (~c + R
~ i −R
~j
Da ~c beliebig wählbar ist kann f~i,j nur eine Funktion des Relativabstandes R
sein6
~ i, R
~ j ) = f~i,j (R
~i − R
~ j) .
f~i,j (R
Für eine nicht-tiviale Drehung B (ungleich der identischen Abbildung), ~v0 = 0,
~r0 = 0 und t0 = 0 (reine Drehung) beschreibt die Invarianz unter der Galileitransformation die Isotropie des Raumes, d.h. im leeren Raum gibt es keine
ausgezeichnete Richtung. Mathematisch bedeutet die Invarianz, daß (die Homogenität des Raumes ist schon eingebaut)
~i − R
~ j ]) = f~i,j (R
~i − R
~ j)
B−1 f~i,j (B[R
und damit
~i − R
~ j ]) = Bf~i,j (R
~i − R
~ j) .
f~i,j (B[R
(2.11)
Dabei ist B beliebig wählbar. Legen wir speziell die Rotationsachse in die Rich~i − R
~ j , so gilt B[R
~i − R
~ j] = R
~i − R
~j = R
~ i,j . Damit folgt
tung von R
~ i,j ) = Bf~i,j (R
~ i,j ) .
f~i,j (R
~ i,j zeigt und
Diese Gleichung kann nur gelten, wenn f~i,j ebenfalls in Richtung R
es folgt
~
~ i,j ) .
~ i,j ) = Ri,j fi,j (R
f~i,j (R
Ri,j
Wählen wir jetzt wieder ein beliebiges B und setzen in Gl. (2.11) ein, so ergibt
sich
!
"
#
~ i,j
~ i,j
R
R
~ i,j ) = B
~ i,j ) .
B
fi,j (BR
fi,j (R
Ri,j
Ri,j
5
6
Die Unabhängigkeit der Paarkraft von der Zeit nutzen wir dabei bereits aus.
~ j wählt.
Dies sieht man formal, in dem man ~c = −R
28
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Wir können also folgern, daß
~ i,j ) = fi,j (R
~ i,j )
fi,j (BR
und damit
~ i,j ) = fi,j (Ri,j ) .
fi,j (R
Die im letzten Semester eingeführten Zweiteilchenkräfte (entlang der Verbindungslinie der zwei Teilchen und nur vom Abstand abhängiger Betrag) sind somit
kompatibel mit dem Galileischen Relativitätsprinzip. Aufbauend auf den Überlegungen zur Erhaltung des Gesamtimpulses in Gegenwart von Paarkräften aus
dem Kapitel 3.3 der Vorlesung des letzten Semesters erkennen wir, daß es einen
engen Zusammenhang zwischen der Homogenität und Isotropie des Raumes auf
der einen Seite und der Gesamtimpulserhaltung auf der anderen Seite gibt. Die
Invarianz unter Galileitransformationen mit ~v0 6= 0 bedingt für geschwindigkeitsunabhängige Kräfte keine weiteren Einschränkungen an die Form der Kräfte.
Scheinkräfte im Newtonschen Formalismus: Zur allgemeinen Diskussion
der Scheinkräfte (inklusive der zeitabhängigen Drehungen) kehren wir zum Newtonschen Formalismus zurück. Da es sich bei Bt um eine lineare Abbildung handelt, folgt mit Hilfe der Produktregel
⇒
~
~r(t) = ~r0 (t) + Bt R(t)
~ + Bt R(t)
~˙
~r˙ (t) = ~r˙0 (t) + Ḃt R(t)
.
(2.12)
Wir stellen zunächst Überlegungen zu dem Term an, der sich aufgrund der
Zeitabhängigkeit der Drehung ergibt
~ = Ḃt B−1 (~r − ~r0 ) = At (~r − ~r0 ) .
Ḃt R
t
Die Abbildung At : k → k ist antisymmetrisch, d.h. es gilt
At + ATt = 0 .
Dabei ist die Abbildung ATt durch die Transponierte der zu At gehörenden Matrix
gegeben. Die Antisymmetrie sieht man durch Einsetzen von ATt = Bt Ḃt−1
At + ATt = Ḃt Bt−1 + Bt Ḃt−1 =
d
d
(Bt Bt−1 ) = I = 0 ,
dt
dt
(2.13)
wobei I die identische Abbildung von k nach k bezeichnet. Die zu A (Zeitabhängigkeit unterdrückt) gehörende Matrix A ist damit antisymmetrisch mit ai,j = −aj,i ,
also


0
a1,2 a1,3
A =  −a1,2
0
a2,3  .
−a1,3 −a2,3 0
29
2.2. BEWEGTE BEZUGSSYSTEME
Damit hat die reelle Matrix A drei unabhängige
Vektors A~q (in k) erhält man gemäß
 


0
a1,2 a1,3
q1
0
a2,3   q2  = 
A~q =  −a1,2
−a1,3 −a2,3 0
q3
Matrixelemente. Das Bild des

a1,2 q2 + a1,3 q3
−a1,2 q1 + a2,3 q3  .
−a1,3 q1 − a23 q2
(2.14)
Setzt man ω1 = −a2,3 , ω2 = a1,3 und ω3 = −a1,2 , d.h.


0 −ω3 ω2
0 −ω1  ,
A =  ω3
−ω2 ω1
0
so ergibt sich das Ergebnis Gl. (2.14) auch als
A~q = ~ω × ~q
wenn
ω
~ =
X
ωi~ei .
i
Man bezeichnet diesen Vektor als die Winkelgeschwindigkeit.7 Um die Bedeutung
~˙
zu veranschaulichen, betrachten wir den Spezialfall mit R(t)
= 0 und ~r0 (t) = 0.
˙
Dann gilt nach den obigen Überlegungen ~r(t) = At~r(t) = ~ω × ~r(t). Mit einem
~
infinitesimalen ∆t geschrieben bedeutet das ∆r(t)
= (~ω × ~r(t))∆t. Damit steht
~
der Vektor ∆r senkrecht auf ~r und ~ω . Aus der folgenden Skizze wird klar, daß der
Vektor ~ω (in k) damit in Richtung der instantanen Drehachse zeigt (gemäß der
Rechte-Hand-Regel). Zusätzlich erkennt man, daß der Betrag von ω
~ dem Betrag
~
der Winkelgeschwindigkeit |φ̇| entspricht, da |∆r| = ρ|∆φ| = |~r| sin θ|φ̇|∆t.
ω (t)
∆φ
ρ
r(t) r(t+ ∆t)
θ
0
7
Der Vektor ω
~ wird im Allgemeinen zeitabhängig sein. In unser Notation unterdrücken wir
diese Zeitabhängigkeit.
30
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Der betrachtete Spezialfall tritt z.B. auf, wenn ein starrer Körper im bewegten
Bezugssystem K ruht und mit diesem um den stationären Punkt 0 rotiert. Die
~ = (~ω × ~r(t))∆t bedeutet dann, daß zu jedem Zeitpunkt eine inGleichung ∆r
stantane Drehachse existiert und daß alle Punkte der Geraden im starren Körper,
die entlang ω
~ liegt und durch 0 geht, zu diesem Zeitpunkt eine verschwindende
Geschwindigkeit haben. Die Geschwindigkeit aller anderen Punkte des Körpers
ist senkrecht zu ω
~ (der instantanen Drehachse) und proportional zum Abstand
von der Drehachse.
Wir verlassen nun den Spezialfall und kehren zu der Situation eines allgemeinen bewegten Bezugssystems K zurück. Der Vektor ~ω ist das Bild eines Vektors
~ (in K) unter der Abbildung Bt , d.h.
Ω
~
~ω = Bt Ω
⇔
~ = B−1 ~ω .
Ω
t
~ als die Winkelgeschwindigkeit im Körper.8 Damit erhält man
Man bezeichnet Ω
~
für Ḃt R
~ = Ḃt BtT (~r − ~r0 ) = At (~r − ~r0 ) = ~ω × (~r − ~r0 )
Ḃt R
~ = (Bt Ω)
~ × (Bt R)
~ .
= ~ω × (Bt R)
Da die lineare Abbildung (Rotation) Bt durch eine orthogonale Matrix gegeben
ist, erhält sie die Längen von Vektoren sowie alle relativen Winkel eines Vektorpaares (anschaulich klar, daß das für eine Rotation gelten muß). Damit folgt
~ = Bt (Ω
~ × R)
~ .
Ḃt R
Zusammengefaßt ergibt sich so für ~r˙ in Gl. (2.12)
~ × R(t)
~ + R(t)]
~˙
~r˙ (t) = ~r˙0 (t) + Bt [Ω
.
(2.15)
Im nächsten Schritt bestimmen wir die Beschleunigung ~r¨ und verwenden dabei
~ × V~ )
wieder die für jeden Vektor V~ in K gültige Beziehung Ḃt V~ = Bt (Ω
~ × R(t)
~ + R(t)]
~˙
~˙ × R(t)
~ +Ω
~ × R(t)
~˙ + R(t)]
~¨
~r¨(t) = ~r¨0 (t) + Ḃt [Ω
+ Bt [Ω
n
o
~ × Ω
~ × R(t)
~
~ × R(t)
~˙ + Ω
~˙ × R(t)
~ + R(t)]
~¨
= ~r¨0 (t) + Bt [Ω
+ 2Ω
.
Aus dieser Relation ergibt sich die Newtonsche Gleichung in K. In k gilt
m~r¨(t) = f~(~r, ~r˙ ; t)
und damit nach Einsetzen der obigen Relation und Anwenden von Bt−1
h
i
~¨ = F~ − m Ω
~ × (Ω
~ × R)
~ + 2Ω
~ ×R
~˙ + Ω
~˙ × R
~ + B−1~r¨0 ,
mR
t
~ im Allgemeinen zeitabhängig. In unserer Notation unterdrücken wir diese
Wie ~
ω ist Ω
Zeitabhängigkeit.
8
2.2. BEWEGTE BEZUGSSYSTEME
31
wobei
~ ~r˙0 + Bt [Ω × R
~ + R];
~˙ t) .
F~ = Bt−1 f~(~r0 + Bt R,
Dies ist das allgemeine Ergebnis für die Newtonsche Gleichung in einem System,
welches kein Inertialsystem ist. Neben der Kraft F~ treten diverse Scheinkräfte
auf der rechten Seite der Gleichung auf.
Kehren wir noch einmal zu dem zuvor im Lagrange-Formalismus behandelten
Fall zurück, daß die Rotation zeitunabhängig ist. Dann tritt als Scheinkraft nur
~¨ 0 auf.
der uns bereits bekannte Term −mB−1~r¨0 = −mR
Wir wollen nun die bei der zeitabhängigen Drehung auftretenden Scheinkräfte
diskutieren. Zusätzlich nehmen wir an, daß die Kraft geschwindigkeitsunabhängig
ist und nicht explizit von der Zeit abhängt. Für die reine Drehung mit ~r0 = 0
vereinfacht sich die Newtonsche Gleichung im bewegten Bezugssystem zu
h
i
~¨ = B−1 f~(Bt R)
~ −m Ω
~ × (Ω
~ × R)
~ + 2Ω
~ ×R
~˙ + Ω
~˙ × R
~ .
mR
t
Weiterhin wollen wir uns jetzt auf den Fall einer Zentralkraft mit f~(~r) = ~rˆf (r)
beschränken. Für diese vereinfacht sich der erste Term auf der rechten Seite der
Bewegungsgleichung im bewegten Bezugssytem wegen r = R zu
~ = Rf
~ˆ (R) .
Bt−1 f~(Bt R)
~ wie es z.B. näherungsweise bei
Bei gleichförmiger Rotation mit konstantem Ω,
der Rotation der Erde erfüllt ist, verschwindet die letzte der Scheinkräfte. Damit
erhält man für den Fall der Schwerkraft der Erde mit (Fall aus großer Höhe)
2
f (R) = −mgRE
/R2 (mit dem Erdradius RE und einer Konstanten g > 0) im
erdfesten Bezugssystem
2
~¨ = −gm RE R
~ − 2mΩ
~ ×R
~˙ − mΩ
~ × (Ω
~ × R)
~ .
mR
3
R
Den zweiten, geschwindigkeitsabhängigen Term, nennt man die Corioliskraft und
den dritten Term die Zentrifugalkraft. Betrachten wir eine Masse, die an einem
Faden hängt, welcher von einer Person, die auf der Erdoberfläche steht, gehalten
~˙ = 0, so daß die Corioliskraft verschwindet.
wird (ein Lot). In diesem Fall gilt R
Die Zentrifugalkraft sorgt dann dafür, daß das Lot nicht genau zum Erdmittel~ × (Ω
~ × R)
~ senkrecht auf der Drehachse
punkt zeigt, da die Zentrifugalkraft −mΩ
steht und von ihr weg wirkt. Dies ist in der folgenden Skizze verdeutlicht.
32
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Ω
~g
θ
ρ
R
~ result. Kraft
~ Ω (Ω R)
~ ×R
~ senkrecht zu Ω
~ ist, gilt für den Betrag der Zentrifugalkraft
Da Ω
~ Ω
~ × R|
~ = m|Ω|
~ 2 |R|
~ sin θ = mρΩ2 ,
|F~zentr | = m|Ω||
~ zur Drehachse ρ = R sin θ. Die Zentrifugalmit dem senkrechten Abstand von R
kraft hat somit am Äquator ihren größten Wert. In der Skizze ist ihr Beitrag zur
resultierenden Kraft (und damit ihr Effekt) stark übertrieben dargestellt.
Folgend betrachten wir den Wurf eines Steins. Bei diesem spielt auch die
Corioliskraft eine Rolle. Die relevante Zeitskala tW beim Steinwurf sind Sekunden.
Da Ω = 2π/(24 · 3600) 1/s ≈ 7.27 · 10−5 1/s, gilt ΩtW ≪ 1. Setzt man nun
~
~ W (t)
R(t)
= RE P~ + R
mit dem Einheitsvektor P~ , der vom Erdmittelpunkt zur Abwurfposition auf der
Oberfläch zeigt, so machen wir nur einen Fehler der Größenordnung (ΩtW )2 ,
~
wenn wir R(t)
im Ausdruck für die Zentrifugalkraft durch RE P~ ersetzen (siehe
Ausdruck für die Zentrifugalkraft). Da weiterhin RW /RE ≪ 1 (Wurfhöhe ist sehr
viel kleiner als Erdraduis), nähern wir die Gravitationskraft als −mg P~ = m~g
an (Fall aus kleiner Höhe). Nach Division durch m erhalten wir die genäherte
Bewegungsgleichung
~¨ W (t) = ~g ′ + 2(R
~˙ W (t) × Ω)
~ ,
R
(2.16)
mit dem effektiven Beschleunigungsvektor
′
~ × (Ω
~ × P~ ) ,
~g = −g P~ − RE Ω
in dem die (genäherte) Zentrifugalkraft integriert ist. Das System inhomogener,
linearer Differentialgleichungen (2.16) läßt sich exakt lösen. Da wir uns jedoch
nur für kurze Zeiten t mit Ωt ≪ 1 interessieren, erhält man die Modifikation der
Bahn durch die Corioliskraft zur Ordnung ΩtW leichter mit Hilfe der Methode
der sukzessiven Approximation. Hier betrachten wir den Fall aus geringer Höhe
~˙ W (0) = 0. Durch zweifaches Integrieren von Gl. (2.16) erhalten wir
mit R
Z t
1 ′ 2
~
~
~ W (t′ ) − R
~ W (0)] × Ω
~ dt′ .
RW (t) = RW (0) + ~g t + 2 [R
2
0
2.3. DER STARRE KÖRPER
33
Man nennt eine Gleichung dieses Typs, in der die Funktion und das Integral über
die Funktion auftritt, eine Integralgleichung. Im Integral – dem Korrekturterm,
~ W (t′ ) − R
~ W (0) durch
der aus der Corioliskraft resultiert – ersetzen wir nun R
′ ′2
den Ausdruck der nullten Näherung ~g t /2. Das Integral kann dann geschlossen
ausgeführt werden und es ergibt sich
3
~ W (t) = R
~ W (0) + 1 ~g ′ t2 + t (~g ′ × Ω)
~ + O([tΩ]2 ) .
R
2
3
Wir stellen somit fest, daß die Komponente der Bewegung in Richtung von ~g ′ zu
führender Ordnung nicht von der Corioliskraft beeinflußt wird. Weiterhin ist die
Modifikation von
p ~g quadratisch in Ω, so daß in führender Ordnung in Ω für die
Fallzeit tW = 2h/g gilt (wie ohne die Scheinkräfte). Der Stein wird nach Osten
abgelenkt und die Ablenkung hat die Größe Ωg(2h/g)3/2 sin θ/3, wobei wir erneut
den O(Ω2 ) Unterschied zwischen ~g und ~g ′ vernachlässigt haben. Der Effekt der
Corioliskraft verschwindet an den Polen und ist am Äquator am größten. Für
eine Fallhöhe h = 100m erhält man dort die meßbare Abweichung von ≈ 2.2cm.
Die Corioliskraft wirkt sich auf die horizontale Bewegung auf der Erde anders
aus als auf die gerade studierte vertikale. Das wird besonders an den Polen klar,
an denen die vertikale Bewegung gar nicht beeinflußt wird. Wird ein Geschoß am
~˙ × Ω und der Rechte-HandNordpol horizontal abgefeuert, so erfährt es gemäß R
Regel eine Abweichung nach rechts, wenn man (von der Erde aus) längs der Bahn
blickt (dem Geschoß hinterher schaut). Vom Ruhesystem aus betrachtet ist der
Effekt klar: Das Teilchen fliegt geradeaus, während sich die Erde ostwärts dreht.
Die Richtung der Corioliskraft F~cor im allgemeinen Fall kann man z.B. angeben,
~˙ = V~ in Kugelkoordinaten (mit normierten Basisvektoren; siehe
indem man R
Seite 153 des Skripts zur Vorlesung Einführung in die Theoretische Physik)
~ R + Vθ E
~ θ + Vφ E
~φ
V~ = VR E
~ = ΩE3 = Ω(cos θE
~ R − sin θE
~ θ ) erhält man
schreibt. Mit Ω
h
i
~ r + Vφ cos θE
~ θ − (VR sin θ + Vθ cos θ)E
~φ .
F~cor = 2mΩ Vφ sin θE
In der nördlichen Halbkugel wird somit ein nordwärts fliegendes Teilchen (Vφ =
Vr = 0, Vθ < 0) ostwärts abgelenkt, ein südwärtsfliegendes (Vφ = Vr = 0, Vθ > 0)
dagegen westwärts.
Eine sehr elegante Art, die Erdrotation zu demonstrieren ist das Foucaultsche
Pendel, dem sie in einer Übungsaufgabe begegnen werden.
2.3
Der starre Körper
In der klassischen Mechanik definiert man den Begriff des starren Körpers als ein
System von N Massepunkten (mit Massen mα ), deren Abstände |~rα − ~rβ | zeitlich
34
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
unveränderlich sind. In der Natur vorkommende “klassische” Körper erfüllen diese
Bedingung natürlich nur näherungsweise, 9 jedoch ist die “Verformung” oft so
klein, daß sie bei der Beschreibung der Bewegung des Körpers in guter Näherung
vernachlässigt werden kann.
Wir werden hier intensiven Gebrauch von den im letzten Kapitel dargestellten
Ideen machen und verwenden daher die gleiche Notation. Es bietet sich an, das
bewegte Bezugssytem K so zu legen, daß der starre Körper in ihm ruht, während
das System k ein allgemeines Inertialsystem ist. Damit gilt (in K und für α =
1, 2, . . . , N)
~˙ α = 0 .
R
Die Gl. (2.15) vereinfacht sich durch diese Wahl zu
~ ×R
~ α (t)] .
~r˙α (t) = ~r˙0 (t) + Bt [Ω
(2.17)
Die Lage des starren Körpers bezüglich des Inertialsystems k ist vollständig be~ α bekannt sind und die Beziehung zwischen k und K charakstimmt, wenn die R
terisiert ist. Wie im letzten Kapitel diskutiert, ist die Lage von K bezüglich k
bei fester Zeit t durch sechs (allgemein zeitabhängige) Zahlen charakterisiert, die
drei Komponenten des Verschiebungsvektors und die drei Komponenten von ω
~.
Die ersten drei Zahlen sind die Freiheitsgrade der Translation, die zweiten drei
die der Rotation.
Der Trägheitstensor: Als zentralen Begriff der Beschreibung der Rotation eines
starren Körpers werden wir jetzt den Trägheitstensor10 einführen. Wir werden
das anhand der Berechnung der kinetischen Energie der Bewegung eines starren
Körpers tun. Mit Gl. (2.17) ergibt sich
N
1X
T =
mα~r˙α2
2 α=1
N
2
1X
~ ×R
~ α]
mα ~r˙0 + Bt [Ω
=
2 α=1
N
1X
~ ×R
~ α ] + [Ω
~ ×R
~ α ]2 ,
=
mα ~r˙02 + 2~r˙0 · Bt [Ω
2 α=1
9
Ob ein ausgedehnter Körper als “starr” idealisiert werden kann, hängt vom Körper selbst
(Material) und den wirkenden Kräften ab.
10
Wir haben im letzten Semester bereits häufiger den Begriff des Tensors benutzt, ohne
ihn sauber zu definieren. Auch hier wollen wir davon absehen. Zuvor benötigten und jetzt
benötigen wir nur Tensoren zweiter Stufe, die man mit einer Matrix (einer linearen Abbildung)
identifizieren kann.
35
2.3. DER STARRE KÖRPER
wobei wir im letzten Schritte (letzter Term) erneut ausgenutzt haben, daß die
Abbildung Bt alle Längen und relativen Winkel invariant läßt (orthogonale Matrix).
~ S = P mα R
~ α /M,
Es ist vorteilhaft,
den
Ursprung
von
K
in
den
Schwerpunkt
R
α
P
mit M = α mα , des starren Körpers zu legen. In diesem Fall verschwindet der
P
~α = MR
~S =
zweite Term auf der rechten Seite der obigen Gleichung, da α mα R
0. In dieser Wahl gilt ~r0 = ~rS und die kinetische Energie zerfällt in zwei Teile
N
T =
1 ˙2 1 X
~ ×R
~ α )2
mα (Ω
M ~rS +
2
2 α=1
S
= TS + Trot
,
S
mit den Beiträgen TS der Schwerpunktsbewegung und Trot
der Rotation um den
Schwerpunkt (was den Index S erklärt).
Sollte sich der Körper alternativ um einen in k festen Punkt ~rD drehen, dann
legen wir den Ursprung von K in diesen Punkt. Verschieben wir zusätzlich den
Ursprung von k in ~rD , so gilt ~r0 = 0 und es folgt
N
1X
~ ×R
~ α )2 = T D .
T =
mα (Ω
rot
2 α=1
In beiden Fällen gilt
N
Trot =
1X
~ ×R
~ α )2
mα (Ω
2 α=1
N
=
1X
~ 2R
~ 2 − [Ω
~ ·R
~ α ]2 .
mα Ω
α
2 α=1
Dieser Ausdruck läßt sich nun vereinfachen, wenn wir die 3 × 3-Matrix I mit den
Matrixelementen
Ii,j =
N
X
α=1
2
~
mα δi,j Rα − Rα,i Rα,j
einführen. Dieses ist der Trägheitstensor. Es gilt dann
1X
Trot =
Ωi Ii,j Ωj .
2 i,j
(2.18)
~ α des starren Körpers per Definition zeitunabhängig sind, gilt
Da die Vektoren R
gleiches für den Trägheitstensor I.
Bevor wir den Trägheitstensor weiter untersuchen und exemplarisch berechnen, wollen wir auch den Gesamtdrehimpuls eines starren Körpers umschreiben.
36
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Wir starten mit dem Ausdruck für den Gesamtdrehimpuls (bezüglich eines festen
Ursprungs) in einem Inertialsystem
~ltot =
N
X
α=1
mα~rα × ~r˙α .
~ α in K aus, so folgt
Drücken wir nun ~rα und ~r˙α durch R
~ltot =
N
X
α=1
h
i
~ α × ~r˙0 + Bt Ω
~ ×R
~α
mα ~r0 + Bt R
.
Zunächst legen wir erneut den Ursprung von K in den Schwerpunkt des star~ α linear enthalten, im obigen
ren Körpers. Dann verschwinden die Terme, die R
Produkt. Es gilt
!
N
h
i
X
~ltot = M~rS × ~r˙S + Bt
~α × Ω × R
~α
mα R
α=1
N
X
= M~rS × ~r˙S + Bt
α=1
S
= ~lS + ~lrot
.
!
h
i
~R
~2 − R
~ α (Ω
~ ·R
~ α)
mα Ω
α
(2.19)
Dabei haben wir in der ersten Zeile die Invarianz von Längen und Relativwinkeln
unter der Rotation verwendet und im letzten Schritt die Beiträge der SchwerS
punktbewegung ~lS und der Rotation ~lrot
zum Gesamtdrehimpuls definiert.
Gibt es einen in k raumfesten Drehpunkt, so legen wir die Ursprünge von k
und K in diesen. Wegen ~r0 = 0 gilt dann
!
N
h
i
X
~ltot = Bt
~R
~2 − R
~ α (Ω
~ ·R
~ α)
mα Ω
= ~lD .
α
rot
α=1
In beiden Fällen gilt für den Rotationsanteil zum Drehimpuls nach Transformation nach K
~ rot = B−1~lrot =
L
t
N
X
α=1
h
i
2
~
~
~
~
~
mα ΩRα − Rα (Ω · Rα )
bzw.
~ rot = IΩ
~
L
also
Lrot,i =
X
j
Ii,j Ωj .
(2.20)
37
2.3. DER STARRE KÖRPER
~ rot und die WinkelgeschwindigEs ist wichtig festzuhalten, daß der Drehimpuls L
~
keit Ω (in K) im Allgemeinen nicht parallel sind.
Aus Gl. (2.18) folgt
1~ ~
1
Trot = Ω
· Lrot = ~ω · ~lrot ,
2
2
wobei wir im zweiten Schritt ausgenutzt haben, daß Bt die Winkel und Längen
invariant läßt. Der Beitrag der Rotation zur kinetischen Energie hat somit in k
und K die gleiche Form.
Wir wollen nun ausgehend von Gl. (2.20) den Beitrag der Rotation zum Drehimpuls in k berechnen. Es gilt
~lrot = Bt L
~ rot
~
= Bt IBt−1 Bt Ω
(k)
= It ω
~ ,
wobei wir im letzten Schritt den transformierten Trägheitstensor
(k)
It = Bt IBt−1
definiert haben. Dieser ist im Gegensatz zu dem Trägheitstensor in K im Allgemeinen zeitabhängig.
Folgend wollen wir den Trägheitstensor genauer untersuchen und exemplarisch berechnen. Aus der Definition wird klar, daß I eine (reelle) symmetrische
Matrix ist. Wir haben das Eigenwertproblem für solche Matrizen in Kapitel 2.14
der Vorlesung des letzten Semesters untersucht. Wie dort diskutiert gibt es drei
paarweise senkrechte und auf eins normierte Eigenvektoren. Die zugehörigen Koordinatenachsen bezeichnet man als Hauptträgheitsachsen des starren Körpers.
Die Eigenwerte Ii (Diagonalelemente des diagonalen Trägheitstensors in der Basis
aus Eigenvektoren) bezeichnet man als Hauptträgheitsmomente.
~ i in K die Hauptträgheitsachsen des
Nehmen wir an, daß die Basisvektoren E
starren Körpers sind – was man durch eine Hauptachsentransformation immer
erreichen kann – so lautet nach Gl. (2.18) der Rotationsbeitrag zur kinetischen
Energie
1
I1 Ω21 + I2 Ω22 + I3 Ω23
Trot =
2
und die Komponenten des Rotationsbeitrags zum Drehimpuls
Lrot,i = Ii Ωi .
Damit gilt auch
Trot
1
=
2
L2rot,1 L2rot,2 L2rot,3
+
+
I1
I2
I3
.
Man unterscheidet anhand der Ii verschiedene starre Körper:
38
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
1. Ist der Köper eindimensional, liegen also alle Massepunkte auf einer Gera~ 3 -Achse, so gilt I1 = I2 6= 0 und I3 = 0. Man nennt den
den, z.B. auf der E
starren Körper dann einen Rotator.
2. Man nennt den starren Körper unsymmetrisch, falls alle Ii verschieden sind.
3. Der starre Körper heißt symmetrisch, falls zwei der Hauptträgheitsmomente
identisch sind I1 = I2 6= I3 .
4. Gilt I1 = I2 = I3 , so heißt der starre Körper kugelartig. Dabei können nicht
nur Kugeln kugelartig sein (siehe unten).
In Körpern, die eine Symmetrie aufweisen, ist es einfach die Hauptträgheitsachsen
zu bestimmen. Eine liegt in diesem Fall entlang der Symmetrieachse und die
beiden anderen können dazu senkrecht (und paarweise senkrecht) frei gewählt
werden.
Bisher haben wir den starren Körper durch die Angabe der N Massen mα und
~ α charakterisiert. In den typischen Situationen (z.B. bei
die zugehörigen Orte R
einem Kreisel) ist der Körper jedoch kontinuierlich – oft mit homogener Massendichte ρ = M/V , mit der Gesamtmasse M und dem Volumen V des Körpers. In
diesem Fall müssen wir in der Berechnung des Trägheitstensors von einer diskreten Summe zum Integral übergehen. Für den Fall der homogenen Masseverteilung
ist dies einfach, indem wir die Massen mα immer kleiner machen und die Zahl N
der Massepunkte, bei konstanter Gesamtmasse, erhöhen. Im Limes N → ∞ folgt
so
N
X
α=1
mα . . . →
Z
ρ . . . d3 x
V
, wobei das V am Integralzeichen anzeigt, daß über das Volumen des starren
Körpers zu integrieren ist. Für den Trägheitstensor ergibt sich
Z
Ii,j =
ρ δi,j ~x2 − xi xj d3 x .
V
Ist die Verteilung der Masse in einem kontinuierlichen starren Körper nicht
homogen, so müssen wir anders vorgehen. Auch wenn dieser Fall im Folgenden
keine zentrale Rolle spielen wird, wollen wir ihn hier betrachten. Wir führen
eine allgemeine ortsabhängige Massendichte ρ(~x) ein. Um den Trägheitstensor als
Integral über diese Dichte zu schreiben definieren wir
ρ(~x) =
N
X
α=1
~ α) .
mα δ(~x − R
39
2.3. DER STARRE KÖRPER
Dabei haben wir die Diracsche Deltafunktion δ(~y ) eingeführt. Sie hat (bei hinreichend harmloser Funktion f ) die Eigenschaft
Z
δ(~x − ~x0 )f (~x) d3 x = f (~x0 ) .
R3
Um dieses zu erreichen, muß die Deltafunktion bei ~x = ~x0 divergieren (unendlich
sein) und für alle anderen Punkte verschwinden. Es handelt sich bei δ(~x) somit
nicht um eine gewöhnliche Funktion, sondern eine sogenannte Distribution. Sie
werden im Laufe ihres Studiums lernen mit der Deltafunktion (und Distributionen
im Allgemeinen) umzugehen. Hier benötigen wir nur, daß
Ii,j =
=
N
X
α=1
N
X
α=1
=
=
Z
Z
R3
R3
mα
mα
~ 2 − Rα,i Rα,j
δi,j R
α
Z
R3
" N
X
α=1
h
i
2
~
~
δ(~x − Rα )d x δi,j Rα − Rα,i Rα,j
~ α)
mα δ(~x − R
3
#
δi,j ~x2 − xi xj d3 x
ρ(~x) δi,j ~x2 − xi xj d3 x ,
wobei wir ausgenutzt haben, daß man unter dem Integral in Anwesenheit der
Deltafunktion Rα,i durch xi ersetzen kann. Ausgehend von diesem Ausdruck ist
es nun leicht, den Kontinuumslimes auszuführen, indem man ρ(~x) durch eine kontinuierliche Massendichte (kontinuierliche Funktion von ~x) ersetzt. Ist die Masse
homogen, so gilt ρ(~x) = ρ innerhalb des starren Körpers und ρ(~x) = 0 außerhalb.
Die explizite Berechnung von Trägheitstensoren: Wir wollen als nächstes
exemplarisch den Trägheitstensor (bzw. die Hauptträgheitsmomente) eines homogenen Zylinders und einer homogenen Kugel berechnen. In Matrixform lautet
der allgemeine Ausdruck des Trägheitstensors für einen kontinuierlichen starren
~ i }-Basis)
Körper (in der {E
R
R

(xR22 + x23 )ρ(~x)d3 x R− x1 x2 ρ(~x)d3 x
− R x1 x3 ρ(~x)d3 x
(xR21 + x23 )ρ(~x)d3 x R− x2 x3 ρ(~x)d3 x  .
I =  − R x2 x1 ρ(~x)d3 x
− x3 x1 ρ(~x)d3 x
− x3 x2 ρ(~x)d3 x
(x21 + x22 )ρ(~x)d3 x
 R
~ 3 entlang der Zylinderachse und den Ursprung in den Schwerpunkt
Legen wir E
des Zylinders der Höhe L und des Radius r0 , so verschwinden die Außerdiagonalelemente aus Symmetriegründen (anders gesagt, wir haben die Hauptträgheitsachsen aufgrund des Symmetrie bereits identifiziert). Wie man sofort sieht gilt
40
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
allgemein I1,1 + I2,2 ≥ I3,3 , I2,2 + I3,3 ≥ I1,1 und I3,3 + I1,1 ≥ I2,2 und damit auch
für die Haupträgheitsmomente
I1 + I2 ≥ I3 , I2 + I3 ≥ I1 ,
I3 + I1 ≥ I2 .
Die für den homogenen Zylinder auftretenden Integrale können nun leicht bestimmt werden (Polarkoordinaten in x1 -x2 -Ebene). Die fundamentalen Integrale
sind
Z
Z
Z
Z L/2 Z r0
1
2 3
2 3
2
2 3
x2 d x =
(x1 + x2 )d x = π
x1 d x =
r 3 dr dx3 = πLr04 /4
2 V
V
V
−L/2
0
und
Z
V
x23 d3 x
= 2π
Z
L/2
x23
−L/2
Z
r0
0
rdr dx3 = πL3 r02 /12 .
Durch entsprechende Kombination dieser Integrale erhält man
2
r2
r0 L2
, I3 = M 0 .
+
I1 = I2 = M
4
12
2
√
Im Spezialfall L = 3r0 ist der Zylinder kugelartig (aber keine Kugel).
Für die homogene Kugel mit Radius r0 wählen wir als den Ursprung den
Schwerpunkt. Die Wahl der drei paarweise orthogonalen Achsen ist aufgrund
der Symmetrie frei. Alle Nebendiagonalelemente verschwinden. Das fundamentale
Integral ist (in Kugelkoordinaten)
Z
Z
1
2 3
r 2 d3 x
xi d x =
3 V
V
Z Z Z
1 2π π r0
=
sin θ r 4 dr dθ dφ
3 0
0
0
4π r05
=
.
3 5
Damit ergibt sich
2
I1 = I2 = I3 = ρ
3
Z
V
2
r 2 d3 x = Mr02 .
5
In Übungsaufgaben werden sie weitere Trägheitstensoren berechnen und Situationen studieren, in denen eine Hauptachsentransformation noch explizit ausgeführt
werden muß.
Die Dynamik eines starren Körpers: In Kapitel 3.3 der Vorlesung des letzten Semesters haben wir die Bewegungsgleichungen und Erhaltungsgrößen des
41
2.3. DER STARRE KÖRPER
N-Teilchen-Problems behandelt. Basierend auf diesen wollen wir nun die Dynamik des starren Körpers untersuchen. Dabei werden die möglichen Bewegungstypen insbesondere für spezielle Klassen von starren Körpern charakterisiert. Die
Bewegungsgleichung des Schwerpunktes ~rS (im Inertialsystem k) lautet
M ~r¨S =
N
X
ext
f~αext = f~tot
.
(2.21)
α=1
Für die Ableitung des Gesamtdrehimpulses gilt
N
X
~l˙tot =
~rα × f~αext = ~ntot ,
α=1
mit dem Gesamtdrehmoment ~ntot in k. Mit
~ α = ~r0 + ~r ′ ,
~rα = ~r0 + Bt R
α
und Gl. (2.19) folgt
N
N
α=1
α=1
X
X ′
~l˙tot = M~rS × ~r¨S + ~l˙ S =
~rS × f~αext +
~rα × f~αext ,
rot
falls wir (siehe oben) ~r0 = ~rS wählen. Durch Ausnutzen von Gl. (2.21) können wir
daraus eine Gleichung für die Zeitableitung des Rotationsanteils des Drehimpulses
ableiten (gültig für ~r0 = ~rS )
N
N
X ′
X
~l˙ S =
~ext =
~ α ) × f~ext = ~nS ,
~
r
×
f
(Bt R
rot
α
α
α
rot
α=1
(2.22)
α=1
mit dem Rotationsanteil zum Drehmoment ~nSrot (bei der Wahl ~r0 = ~rS ). Für einen
Kreisel mit raumfestem (in k) Drehpunkt wählt man wie zuvor ~r0 = 0 und erhält
N
N
X
X
~l˙ D =
~ α ) × f~αext = ~nD
~rα × f~αext =
(Bt R
rot
rot .
α=1
(2.23)
α=1
Als Beispiel für die ein Drehmoment generierende äußere Kraft betrachten
wir die Schwerkraft f~αext = mα~g . Wir wollen zunächst den Wurf eines starren
Körpers (z.B. eines Diskus) beschreiben. Dazu legen wir den Ursprung von K
in den Schwerpunkt des Körpers, wählen also ~r0 = ~rS . Dann gilt nach unseren
allgemeinen Überlegungen
N
N
α=1
α=1
X
X
~l˙ S =
~ α )] × ~g = 0 ,
~ α ) × mα~g =
R
[Bt (mα R
(B
t
rot
42
da
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
P
α
~α = MR
~ S = 0 und das Drehmoment ~nS verschwindet. Damit folgt
mα R
rot
~l S = const.
rot
und der Rotationsbeitrag zum Gesamtdrehimpuls ist eine Erhaltungsgröße.
Für den Fall eines Kreisels im Schwerefeld mit festem Drehpunkt wählen wir
~r0 = 0 (Ursprung von K und k im festen Drehpunkt; siehe oben) und erhalten
N
X
~l˙ D =
~rα × mα~g = M~rS × ~g
rot
(2.24)
α=1
also ein nicht verschwindendes Drehmoment. Neben der Schwerkraft wirkt im
Drehpunkt des Kreisels noch eine Zwangskraft. Zwangskräfte werden wir im folgenden Kapitel über den Lagrange-Formalismus diskutieren. Hier ist es nur wichtig festzuhalten, daß die Zwangskraft aufgrund der Wahl des Ursprungs von k
und K im Drehpunkt und des Faktors ~rα nicht zum Drehmoment ~nD
rot beiträgt.
Im nächsten Abschnitt wollen wir die Dynamik eines speziellen Kreisels, des symmetrischen schweren Kreisels mit festem Drehpunkt, untersuchen.
Die Dynamik des symmetrischen schweren Kreisels: Wir diskutieren die
Bewegung im Inertialsystem k, dessen Ursprung im festen Drehpunkt liegen soll.
Auch der Ursprung des körperfesten Systems K liege in diesem Punkt (d.h. es
D
gilt ~r0 = 0). Nach Gl. (2.24) gilt mit der abkürzenden Schreibweise ~l = ~ltot
~l˙ = M~rS × ~g
mit dem Ortsvektor ~rS des Schwerpunkts des Kreisels (in k). Wir legen das System
~ 3 vom Koordinatenursprung zum Schwerpunkt zeigt, also ~rS = a~e ′ =
K so, daß E
3
~ 3 gilt. Mit ~g = −g~e3 folgt
aBt E
~l˙ = Mga ~e3 × ~e ′ .
(2.25)
3
Wir benötigen eine zusätzliche Differentialgleichung für den zeitabhängigen Vek′
tor ~e3 . Diese folgt als Spezialfall der Beziehung ~r˙α = ~ω × ~rα , die für alle festen
~˙ α = 0, d.h. für alle Massenpunkte des Kreisels gilt
Punkte in K mit R
′
′
~e˙ 3 = ~ω × ~e3 .
(2.26)
In den Gln. (2.25) und (2.26) treten die zeitabhängigen Vektoren ~l, ~e3 und ω
~
~ = IΩ,
~ wobei I zeitunabhängig ist. Dagegen
auf. In K besteht die Beziehung L
ist die Abbildung zwischen der Winkelgeschwindigkeit ~ω und dem Drehimpuls
~l in k zeitabhängig, was eine einfache Lösung des Kreiselproblems für allgemeine Hauptträgheitsmomente Ii verhindert. Wir beschränken uns daher, wie oben
′
2.3. DER STARRE KÖRPER
43
schon angedeutet, auf den symmetrischen Kreisel, bei dem (mindestens) zwei
Hauptträgheitsmomente identisch sind.
Wählen wir I1 = I2 , dann liegt der Schwerpunkt des Kreisels auf der Figu~ 3 gegeben ist. In diesem Fall
renachse, deren Richtung durch die Hauptachse E
gilt
~l = l1~e1 + l2~e2 + l3~e3 = L1~e ′ + L2~e ′ + L3~e ′
1
2
3
′
′
′
′
= I1 Ω1~e1 + Ω2~e2 + I3 Ω3~e3 = I1 ω
~ + (I3 − I1 )Ω3~e3 .
′
Damit liegen die zeitabhängigen Vektoren ~l, ~e3 und ~ω in einer Ebene, d.h. sie sind
koplanar. Wir verwenden die resultierende Relation
1 ~
′
~ω =
l − (I3 − I1 )Ω3~e3
I1
um ~ω aus Gl. (2.26) zu eliminieren. Man erhält so
1 ~
′
′
~e˙ 3 =
l × ~e3 .
I1
(2.27)
In k dreht somit die Figurenachse eines symmetrischen Kreisels mit der Winˆ
kelgeschindigkeit |~l|/I1 um die instantane Richtung des Drehimpulses ~l. Für den
schweren symmetrischen Kreisel (mit a > 0) ist ~l zeitabhängig.
Der kräftefreie, symmetrische Kreisel: Für speziell konstruierte Kreisel läßt
sich auch der Fall a = 0 einstellen. Dann verschwindet nach Gl. (2.25) das Drehmoment und der Kreisel verhält sich wie ein kräftefreier Kreisel mit einem raumfesten Drehimpulsvektor ~l. Die Figurenachse rotiert in diesem Fall mit der Frequenz
ωnut = |~l|/I1 um ~l. Diese Bewegung wird als Nutation bezeichnet. Auch im all′
gemeinen Fall mit a 6= 0 bezeichnet man die Rotation der Figurenachse ~e3 um
die Drehimpulsachse als Nutation. Für a 6= 0 ist die Drehimpulsachse im Gegensatz zum vorliegenden kräftefreien Fall jedoch nicht mehr zeitunabhängig (nicht
mehr raumfest). Da der Schwerpunkt im kräftefreien Fall im festen Drehpunkt
liegt, ist die ~e3 -Achse im kräftefreien Kreisel nicht ausgezeichnet. Für Anfangs′
bedingungen ~e3 (t = 0) ∼ ~l bleibt auch die Figurenachse raumfest. Zusätzlich
zur beschriebenen Nutation rotiert der starre Körper selbstverständlich um seine
Figurenachse.
Die Bewegung für a 6= 0: Für beliebige Werte von a gibt es zwei Erhaltungsgrößen. Die erste folgt aus einer skalaren Multiplikation von Gl. (2.25) mit ~e3
⇒
~l˙ · ~e3 = dl3 = Mga ~e3 × ~e ′ · ~e3 = 0
3
dt
l3 = const.
44
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Die zweite erhält man, indem man Gl. (2.27) skalar mit ~l und Gl. (2.25) skalar
′
mit ~e3 multipliziert. Die rechten Seiten geben jeweils Null, so daß durch Addition
~l · ~e˙ ′ + ~l˙ · ~e ′ = d ~l · ~e ′ = 0
3
3
3
dt
⇒
L3 = const.
folgt. Somit sind die Projektionen des Drehimpulsvektors auf die Richtung ~e3 des
′
Schwerefeldes und die Richtung ~e3 der Figurenachse Erhaltungsgrößen.
Folgend führen wir den zentralen “Trick” zur Lösung der Bewegungsgleichun~
gen des symmetrischen
schweren Kreisels ein. Wir zerlegen den Drehimpuls l in
′
der Basis ~e3 , ~e3 , ~e⊥ mit
′
~e⊥ = (~e3 × ~e3 )/ sin θ .
′
Dabei bezeichnet θ den Winkel zwischen ~e3 und ~e3 . Die drei Vektoren des Basis′
systems sind auf Eins normiert, jedoch stehen ~e3 und ~e3 nur für θ = π/2 senkrecht
aufeinander (beide stehen per Konstruktion senkrecht auf ~e⊥ ). Die Basis besteht
somit im Allgemeinen nicht aus orthogonalen Vektoren. Weiterhin liegt eine Basis
nur dann vor, wenn θ weder 0 noch π ist. Es gilt (Index v steht für vertikal, Index
s für Spin)
~l(t) = lv (t)~e3 + ls (t)~e ′ (t) + l⊥ (t)~e⊥ (t) .
3
(2.28)
Die Entwicklungskoeffizienten lv und ls lassen sich durch die Erhaltungsgrößen l3
und L3 , sowie den Winkel θ ausdrücken
l3 = ~e3 · ~l = lv + ls cos θ ,
′
L3 = ~e3 · ~l = lv cos θ + ls .
Dieses Gleichungssystem läßt sich leicht lösen und man erhält
lv =
l3 − L3 cos θ
,
sin2 θ
ls =
L3 − l3 cos θ
.
sin2 θ
(2.29)
Ist somit θ zeitabhängig so gilt Gleiches für lv und ls .
Setzt man die Entwicklung Gl. (2.28) in Gl. (2.27) ein, so ergibt sich
˙~e ′ = lv ~e3 + l⊥ ~e⊥ × ~e ′ .
3
3
I1
I1
′
Gibt man die Orientierung von ~e3 in Kugelkoordinaten mit den Winkeln θ und φ
′
an, so beschreibt φ̇ die Winkelgeschwindigkeit von ~e3 um die ~e3 -Achse und θ̇ die
um die ~e⊥ -Achse. Man kann damit ablesen, daß
φ̇ =
l3 − L3 cos θ
lv
,
=
I1
I1 sin2 θ
θ̇ =
l⊥
I1
(2.30)
45
2.3. DER STARRE KÖRPER
gilt. Lösungen mit l⊥ = 0 entsprechen somit einer Kreiselbewegung mit festem
(zeitunabhängigem) Winkel θ zwischen der Richtung des Schwerefeldes ~e3 und
′
der Figurenachse ~e3 .
Um θ(t) und φ(t) zu bestimmen, verwenden wir zusätzlich die Erhaltung der
Gesamtenergie. Die kinetische Energie der Rotation ist
Trot =
L21 + L22
L2
+ 3 .
2I1
2I3
Um diese umzuschreiben betrachten wir
~l − L3~e ′ = L1~e ′ + L2~e ′ = lv~e3 + (ls − L3 )~e ′ + l⊥~e⊥ .
3
1
2
3
Quadrieren der rechten Gleichung liefert
′
2
2
L21 + L22 = lv2 + (ls − L3 )2 + 2lv (ls − L3 )~e3 · ~e3 + l⊥
= lv2 sin2 θ + l⊥
,
′
wobei wir im letzten Schritt ls −L3 = −lv cos θ (siehe Gl. (2.29)) und ~e3 ·~e3 = cos θ
verwendet haben. Ersetzt man in diesem Ausdruck lv und l⊥ gemäß Gl. (2.30),
so folgt für die kinetische Energie der Rotation
Trot =
L23
I1 2 (l3 − L3 cos θ)2
+
θ̇ +
.
2
2I3
2I1 sin2 θ
Zu Trot müssen wir noch die potentielle Energie hinzuaddieren und erhalten für
die (erhaltene) Gesamtenergie
E = Trot + Mga cos θ ,
bzw. mit E ′ = E − L23 /(2I3 ) (ebenfalls erhalten)
E′ =
I1 2 (l3 − L3 cos θ)2
+ Mga cos θ .
θ̇ +
2
2I1 sin2 θ
In dieser Gleichung sind alle auftretenden Größen außer dem Winkel θ zeitunabhängig. Differentialgleichungen dieses Typs sind uns bereits wiederholt begegnet. Identifizieren wir I1 mit der Masse eines Teilchens, so ist das verbleibende
Problem äquivalent zu einer eindimensionalen Bewegung im effektiven Potential
Veff (θ) =
(l3 − L3 cos θ)2
+ Mga cos θ .
2I1 sin2 θ
(2.31)
Wie wir diese Art Probleme (zumindest formal) lösen, sollte ihnen inzwischen
klar sein. Die folgende Abbildung zeigt das effektive Potential für verschiedene
Parameter. Das obere Kurvenpaar ist für l3 /L3 = 1.25 mit η = 0.1 (durchgezogen) und η = 0 (gestrichelt) berechnet, wobei η = 2I1 Mga/L23 . Beim unteren
Kurvenpaar gilt l3 /L3 = 0.8, bei denselben η wie oben (selbe Kodierung).
46
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
2I1Veff/L3
2
2
0
0
1
θ
2
Anhand des effektiven Potentials für die Zeitabhängigkeit von θ wird klar, daß
die Bewegung in θ-Richtung finit und periodisch ist. Wir werden darauf folgend
zurückkommen.
Nachdem θ(t) bestimmt wurde, folgt die Zeitabhängigkeit von φ durch Integration
Z t
l3 − L3 cos θ(t′ ) ′
φ(t) − φ(0) =
dt .
I1 sin2 θ(t′ )
0
Bei der Lösung der Bewegungsgleichung treten sechs Anfangsbedingungen auf:
θ(0), θ̇(0), L3 , φ(0), φ̇(0) (oder l3 , beide hängen gemäß Gl. (2.30) zusammen)
und der Anfangswinkel eines beliebigen Punktes des starren Köpers bezüglich
der Drehung um die Figurenachse.
Die Bewegung mit θ = const.: Wir beginnen die Diskussion der Bewegung
der Figurenachse mit dem Spezialfall, daß θ zeitlich konstant ist. Diese Bewegung
kann realisiert werden, wenn der Winkel den Wert θ0 annimmt, an dem das
Potential Veff (θ) minimal wird. Wir benötigen also die Ableitung
(l3 − L3 cos θ)(L3 − l3 cos θ)
− Mga sin θ
I1 sin3 θ
lv ls
− Mga sin θ .
=
I1
′
Veff
(θ) =
Die rechte Seite wird Null, wenn entweder θ = 0, π (kein Minimum) oder
lv ls
− Mga = 0 .
I1
(2.32)
Mit Gl. (2.29) liefert diese Gleichung eine Beziehung zwischen l3 , L3 und cos θ0 .
Da θ(t) = θ0 , folgt nach Gl. (2.30) l⊥ = 0 und damit für den Drehimpuls
~l(t) = lv~e3 + ls~e ′ (t) ,
3
47
2.3. DER STARRE KÖRPER
wobei lv und ls konstant und von θ0 abhängig sind.
Wir legen nun zusätzlich fest, daß a = 0 gilt (kräftefreier Kreisel). Wie bereits
oben diskutiert, ist dann ~l raumfest. Die Gleichung lv ls = 0 hat zwei Lösungen.
′
′
Für lv = 0 folgt φ̇ = 0 und damit ~l = ls~e3 = L3~e3 . In diesem Fall sind der
Drehimpulsvektor und die Figurenachse raumfest und parallel. Sie schließen mit
~e3 den Winkel θ0 ein. Die einzige Bewegung des starre Körpers ist die Rotation
um die Figurenachse. Für ls = 0 folgt ~l = lv~e3 = l3~e3 , d.h. φ̇ = l3 /I1 . Dies ist die
Nutation um die ~l-Achse (welche im vorliegenden Fall der ~e3 -Achse entspricht)
mit Öffnungswinkel θ0 . Zusätzlich rotiert der Kreisel um die Figurenachse.
Im allgemeinen Fall a 6= 0 erhält man mit lv = (L3 − ls )/ cos θ0 (siehe Gl.
(2.29)) aus Gl. (2.32) die quadratische Gleichung (in ls )
ls (L3 − ls ) = I1 Mga cos θ
mit den zwei Lösungen
ls,± =
p
L3 1 ± 1 − 2η cos θ0 ,
2
wobei η = 2I1 Mga/L23 (siehe oben). Für lv ergibt sich daraus
lv,±
p
L3 1 ∓ 1 − 2η cos θ0 .
=
2 cos θ0
Die dimensionslose Größe η ist klein, wenn die potentielle Energie des Kreisels
im Schwerefeld klein gegenüber der Rotationsenergie L23 /(2I1 ) ist. Die sich dann
′
ergebene Relation zwischen ~e3 , ~e3 und ~l ist in der folgenden Skizze dargestellt.
l
l
e3
e3
e3
e3
Für den vorliegenden Fall des schnellen schweren symmetrischen Kreisels
kann man die Wurzel in den Ausdrücken für ls,± und lv,± entwickeln. Die beiden
Lösungen unterscheiden sich durch Terme der Größenordnung η von der Lösung
des kräftefreien Kreisels. Trotzdem unterscheiden sich die “+”-Lösung und die
“φ̇ = 0”-Lösung des kräftefreien Falls qualitativ. Die Winkelgeschwindigkeit um
48
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
die ~e3 -Achse ist
φ̇± =
lv,±
Mga
=
.
I1
ls,±
Entwickelt erhält man für die +-Lösung ergibt sich
i
Mga h
η
Mga
2
=
1 + cos θ0 + O(η ) .
φ̇+ =
ls,+
L3
2
Die Figurenachse rotiert, bzw. präzidiert, mit der langsamen Präzessionsfrequenz um die ~e3 -Achse, wobei für den schnellen schweren symmetrischen Kreisel
′
φ̇+ ≪ L3 /I1 gilt. Der Gesamtdrehimpuls ~l zeigt fast in die ~e3 -Richtung (siehe die
obige Skizze). Das bedeutet, daß die Rotation des Kreisels um seine Figurenachse
über die Präzession “dominiert” (die Präzessionsfrequenz ist “klein”). Im Gegensatz dazu unterscheidet sich die “−”-Lösung (schnelle Präzession) für η ≪ 1
qualitativ nicht von der Nutation des Grenzfalls a = 0 (Rotation des Körpers um
die Figurenachse und Nutation der Figurenachse um die Drehimpulsrichtung).
Der Gesamtdrehimpuls ~l zeigt näherungsweise in die ~e3 -Richtung (siehe die obige
Skizze).
Die generische Bewegung mit E ′ > Veff (θ0 ): Folgend betrachten wir die Bewegung mit zeitlich sich änderndem θ indem sich Nutation und Präzession überlagern (und der Kreisel um seine Figurenachse rotiert). Aus der Skizze von Veff (θ)
wird klar, daß θ(t) eine periodische Funktion der Zeit ist (zwischen E ′ -abhängigen
θmin und θmax ). Wir beschränken uns auf den Fall L3 > l3 > 0 und a > 0, der im
Limes E ′ → Veff (θ0 ) der langsamen Präzession entspricht. Dann verschwindet der
erste Term in der Definitionsgleichung (2.31) für Veff bei θa=0 = arccos (l3 /L3 )).
Da das Gravitationspotential Mga cos θ monoton mit θ abnimmt, liegt das Minimum θa von Veff rechts von θa=0 . Dies ist in der folgenden Skizze illustriert.
2
2
2I1Veff/L3
a=0
a>0
E’2
E’1
0
0
1
θ
2
2.3. DER STARRE KÖRPER
49
Das Verhalten der Winkelgeschwindigkeit φ̇ versteht man leicht, wenn man die
Beziehung l3 = L3 cos θa=0 in Gl. (2.29) einsetzt und das resultierende Ergebnis
für lv in Gl. (2.30). Damit erhält man
φ̇(t) =
L3
[cos θa=0 − cos θ(t)] .
I1 sin2 [θ(t)]
Falls E ′ so gewählt wird, daß θmin > θa=0 , wie in der Skizze für E1′ , hat φ̇ für
alle Zeiten dasselbe Vorzeichen (rote Kurve in der folgenden Skizze). Dagegen
wechselt für Energien mit θmin < θa=0 , wie bei E2′ , φ̇ das Vorzeichen. In diesem
′
Fall folgt die Spitze von ~e3 einer Rosettenbahn (auf der Einheitskugel) zwischen
θmin und θmax (blaue Kurve in der folgenden Skizze; die schwarze Kurve zeigt den
Grenzfall θmin = θa=0 ). Die Bahnkurven sind im Allgemeinen nicht geschlossen.
Eine quantitative Anlayse läßt sich ausführen, wenn man Veff durch eine Parabel um das Minimum approximiert. Das diskutierte Verhalten der kombinierten
Nutation und Präzession ist in der folgenden Skizze für verschiedene Energien
dargestellt. Sie zeigt die Projektion der Bewegung des Punktes θ(t), φ(t) auf der
Einheitskugel auf die x1 -x2 -Ebene. Der projizierte Drehimpulsvektor ~l beschreibt
eine Kreisbahn (Präzession) um den Ursprung (d.h. um die ~e3 -Richtung), um
die herum die Nutation stattfindet (Nutationsfrequenz größer als Präzessionsfrequenz).
Um die Bewegungsformen des schweren symmetrischen Kreisels besser zu verstehen, ist es sehr empfehlenswert mit dem in der Vorlesung gezeigten Java-Applet
zu experimentieren, welches unter
http://faculty.ifmo.ru/butikov/Applets/Gyroscope.html
zu finden ist. In diesem zeigt der rote Vektor bzw. die rote Spur den Drehimpulsvektor bzw. seine Projektion. Die gelbe Spur ist die Projektion der Figurenachse,
50
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
wie sie in der obigen Abbildung dargestellt ist. In der “List of Examples” des
Applets sind für das gerade Diskutierte die Punkte 2 und 3 von Interesse. Dabei
empfehle ich im Punkt 2 den Kasten mit “Show Trace” wegzuklicken, da ich die
violette Bahn im Hinblick auf die obige Diskussion als verwirrend empfinde.
Die Eulerschen Kreiselgleichungen: In der Beschreibung der Dynamik des
symmetrischen schweren Kreisels im Inertialsystem k konnten wir das Problem,
daß die Beziehung zwischen Drehimplusvektor und Winkelgeschwindigkeit nur in
K einfach ist (Li = Ii Ωi ), geschickt umgehen. Für einen unsymmetrischen Kreisel
gelingt das nicht. Daher betrachten wir hier die Bewegungsgleichung (siehe Gln.
(2.22) und (2.23))
N
X
~l˙rot = ~nrot =
~ α × f~ext
Bt R
α
α=1
im körperfesten System K. Wie zuvor, wird folgend der Index “rot” unterdrückt.
Mit
h
i
~l˙ = d (Bt L)
~ = Ḃt L
~ + Bt L
~˙ = Bt Ω × L
~ +L
~˙
dt
~ und nach Anwenden von Bt−1
folgt unter Verwendung von ~n = Bt N
~˙ + Ω × L
~ =N
~ .
L
~ in K ist durch
Das Drehmonent N
N
X
~
~ α × B−1 f~ext
N=
R
t
α
α=1
gegeben. Im Schwerefeld mit
~ =
N
N
X
α=1
~
mit G(t)
= Bt−1~g .
f~αext
= mα~g (kleine Höhe) ergibt sich somit
~ α × B−1~g = M R
~ S × G(t)
~
mα R
,
t
(2.33)
˙
Es wird klar, daß die Gleichung ~l = ~n in K eine kompliziertere Form annimmt.
~ = IΩ
~ kann man L
~ aus der Gleichung eliminieren und
Mit Hilfe der Beziehung L
erhält
~˙ + Ω
~ × IΩ
~ =N
~ .
IΩ
~ i in K als die Hauptträgheitsachsen, so folgen die
Wählt man die Basisvektoren E
Eulerschen Kreiselgleichungen
I1 Ω̇1 + (I3 − I2 )Ω2 Ω3 = N1 ,
I2 Ω̇2 + (I1 − I3 )Ω1 Ω3 = N2 ,
I3 Ω̇3 + (I2 − I1 )Ω1 Ω2 = N3 .
51
2.3. DER STARRE KÖRPER
Folgend wollen wir die Beispiele des Wurfes eines starren Körpers (z.B. Diskus) und des Kreisels mit raumfestem Drehpunkt im Schwerefeld betrachten. Für
den Wurf legen wir den Ursprung von K in den Schwerpunkt des Kreisels. Wegen
~ S = 0 verschwindet das Drehmoment Gl. (2.33) und man erhält die EulergleiR
chungen des kräftefreien Kreisels
I1 Ω̇1 + (I3 − I2 )Ω2 Ω3 = 0 ,
I2 Ω̇2 + (I1 − I3 )Ω1 Ω3 = 0 ,
I3 Ω̇3 + (I2 − I1 )Ω1 Ω2 = 0 .
Für einen symmetrischen Körper mit I1 = I2 ist die Lösung des Gleichungssystems einfach. Aus der dritten Gleichung folgt Ω3 = const., d.h. die Erhaltung
von L3 . Das übrigbleibende System von zwei linearen Differentialgleichungen mit
konstanten Koeffizienten werden sie in einer Übungsaufgabe weiter untersuchen.
Für einen unsymmetrischen starren Körper führt die allgemeine Lösung des Differentialgleichungssystems auf sogenannte elliptische Integrale (siehe Literatur;
z.B. Landau-Lifschitz, Band I, § 37). Wir werden diesen Fall hier nicht weiter
diskutieren.
Für den Kreisel mit raumfestem Drehpunkt folgt für das Drehmoment
~ = MR
~S × G
~ = MaE
~3 × G
~ ,
N
(2.34)
wobei wir das Koordinatensystem wie in der obigen Diskussion des schweren sym~ 3 zeigt vom raumfesten Drehpunkt zum
metrischen Kreisels gewählt haben (E
Schwerpunkt). Um ein geschlossenes Differentialgleichungssystem zu erhalten,
~
schreiben wir die Zeitabhängigkeit von G(t)
= Bt−1~g als Differentialgleichung
~˙ = Ḃ−1~g = B−1 Bt Ḃ−1~g = −B−1 Ḃt B−1~g = −B−1 At~g
G
t
t
t
t
t
t
−1
−1
~
~
= −B (~ω × ~g ) = −B Bt (Ω × G)
t
t
~ ×G
~ ,
= −Ω
wobei wir die Notation aus den letzten Kapitel und Gl. (2.13) benutzt haben. Mit
den Eulerschen Kreiselgleichungen (rechte Seite durch Gl. (2.34) gegeben) ergibt
sich so ein geschlossenes System von sechs nichtlinearen Differentialgleichungen
~ und G.
~ Bei der Lösung helfen die Erhaltungsgrößen
für die Komponenten von Ω
~ 2 , (ii) in k gilt ~n = M R
~ S × ~g , so daß ~l · ~g = const. = L
~ ·G
~ gilt,
(i) ~g 2 = g 2 = G
(iii) die Gesamtenergie
~ ·E
~3 +
E = MaG
3
1 X
Ωi Ii,j Ωj
2 i,j=1
ist erhalten. Ohne weitere erhaltene Größen, d.h. im allgemeinen Fall, können
auch chaotische Lösungen (siehe Kapitel 3.4 der Vorlesung des letzten Semesters)
auftreten. In den hier tiefer untersuchten Spezialfällen des kräftefreien und des
schweren symmetrischen Kreisels ist dies jedoch nicht der Fall.
52
KAPITEL 2. NEWTONSCHE MECHANIK TEIL II
Kapitel 3
Lagrangesche Mechanik
Im Kapitel 3.5 der Vorlesung des letzten Semesters haben wir die Newtonschen
Bewegungsgleichungen für das Problem eines Teilchens (mit drei kartesischen Koordinaten) nach Umschreiben in drei verallgemeinerte krummlinige Koordinaten
qi , i = 1, 2, 3, in die Lagrangeform (siehe Gl. (3.15))
d ∂T
∂T
= ~gi · F~ +
(3.1)
dt ∂ q̇i
∂qi
gebracht. Für den Fall einer konservativen Kraft F~ folgt
∂L
d ∂L
=
, L=T −V .
dt ∂ q̇i
∂qi
(3.2)
Dabei sind wir in der Herleitung davon ausgegangen, daß die Beziehung xi =
xi (q1 , q2 , q3 ), i = 1, 2, 3, nicht explizit von der Zeit abhängt (siehe Seiten 151
und 153 des Skripts der Vorlesung des letzten Semesters). Bevor wir in diesem
Kapitel dazu kommen, die Vorteile des Lagrangeformalismus (speziell für Systeme
mit “Zwangsbedingungen”) herauszuarbeiten, wollen wir die Herleitung für eine
zeitabhängige Wahl der krummlinigen Koordinaten mit xi = xi (q1 , q2 , q3 ; t), i =
1, 2, 3 und N-Teilchensysteme erweitern.
Für eine zeitabhängige Wahl der krummlinigen Koordinaten gilt
3
3
X
∂~r
∂~r X
∂~r
~v =
q̇j +
=
q̇j ~gj +
,
∂q
∂t
∂t
j
j=1
j=1
wobei wir ∂~r/∂qj = ~gj verwendet haben. Um Gl. (3.15) der Vorlesung des letzten
Semesters zu beweisen, benötigen wir, daß ~gi = ∂~v /∂ q̇i und
d ∂~r
∂~v
=
.
dt ∂qi
∂qi
Wie man direkt nachrechnet gelten beide Relationen auch für eine zeitabhängige
Wahl der verallgemeinerten Koordinaten. Somit läßt sich die Langrangeform der
Bewegungsgleichungen analog zum letzten Semester herleiten.
53
54
KAPITEL 3. LAGRANGESCHE MECHANIK
Für das N-Teilchensystem haben wir 3N verallgemeinerte Koordinaten α =
1, 2, . . . , N, i = 1, 2, 3: xα,i = xα,i (q1 , q2 , . . . , q3N ; t). Wir organisieren die 3N
Variablen xα,i nun neu, in dem wir einen 3N-dimensionalen Vektor


x1,1
 x1,2 


 x1,3 


 x2,1 


~r = 

·


 · 


 · 
xN,3
einführen. Analog verfahren wir mit den anderen auftretenden Vektoren.1 Die
Schritte, die zur Lagrangeform der Bewegungsgleichung für ein Teilchen geführt
haben, können nun basierend auf der Vektorform der Newtonschen Gleichung (für
alle Komponenten aller Orte der Massenpunkte ~rα gleichzeitig) p~˙ = F~ vollzogen
werden. Im ersten Schritt bilden wir wieder das Skalarprodukt auf beiden Seiten der Newtonschen Gleichung mit dem 3N-dimensionalen Vektor ~gi = ∂~r/∂qi .
Alle weiteren Schritte lassen sich in vollständiger Analogie zum Einteilchenfall
ausführen. Beachtet man noch, daß sich die kinetische Energie
P des 2Gesamtsystems durch Addition der einzelnen Terme ergibt, also T = α mα~vα /2 gilt, so
folgt
d ∂T
∂T
=
+ Qi
dt ∂ q̇i
∂qi
mit
Qi =
N
X
∂~rα
.
F~α ·
∂qi
α=1
Dabei bezeichnet F~α die Summe der externen Kräfte und Paarkräfte, die auf das
Teilchen α wirken. Für konservative Kräfte mit
~ ~rα V (~r1 , . . . , ~rN )
F~α = −∇
folgt ebenfalls wie zuvor
∂L
d ∂L
=
dt ∂ q̇i
∂qi
mit der Lagrangefunktion L = T − V . Die Bewegungsgleichungen heißen Lagrangegleichungen (2. Art). Wie bereits erwähnt, nennt man ∂L/∂ q̇i den verallgemeinerten Impuls. Konsequenterweise heißt ∂L/∂qi die verallgemeinerte Kraft.
1
Bei den Vektoren ohne Teilchen- und Komponentenindex handelt es sich um diese 3N dimensionalen Vektoren.
3.1. SYSTEME MIT ZWANGSBEDINGUNGEN
55
Dabei müssen diese Größen nicht von der Dimension des gewöhnlichen Impulses
bzw. der gewöhnlichen Kraft sein. Falls für die qi die kartesischen Koordinaten
gewählt werden, werden diese Ableitungen zum gewöhnlichen Impuls bzw. der
gewöhnlichen Kraft.
Bereits im Kapitel 3.6 der Vorlesung des letzten Semesters haben wir einen
der großen Vorteile der Lagrangeschen Formulierung der Bewegungsgleichungen
kennen gelernt: Man kann der Symmetrie eines Problems angepaßte Variable (Koordinaten) wählen. Die Bewegungsgleichungen nehmen dann eine sehr natürliche
Form an. Die Gleichungen zu Variablen die in L nicht auftauchen liefern umgehend Erhaltungsgrößen (siehe Seite 156 des Skripts des letzten Semesters).
Häufig hat man es in der Mechanik mit Situationen zu tun, in denen die
Bewegung der Teilchen räumlichen Einschränkungen unterliegt. So kann es z.B.
vorkommen, daß sich ein Teilchen für eine gewisse Zeit auf der Oberfläche eines
starren Körpers bewegen muß, z.B. auf einem Tisch oder entlang eines Drahtes
(Perle mit Loch auf Draht). Idealisiert können diese Bewegungen dann als solche
auf einer stückweise glatten Fläche bzw. entlang einer stückweise glatten Kurve
beschrieben werden. Wir müssen also für unsere Bewegung eine Nebenbedingung in
Form einer mathematischen Gleichung formulieren. Im Rahmen der Newtonschen
Mechanik wird die Bewegung aufgrund von zusätzlichen Kräften eingeschränkt,
die man zu den Wechselwirkungskräften hinzu addieren muß. Solche Zwangskräfte
sind aber meist nicht als Funktion der Orte und Geschwindigkeiten der Teilchen
bekannt. Es ist somit schwierig, sie in den Newtonschen Formalismus einzubauen.
Der Vorteil des Lagrangeformalismus besteht in dieser Hinsicht darin, daß es
gelingt, für eine wichtige Klasse von Zwangskräften (Nebenbedingungen), die
Koordinaten so zu wählen, daß die uns nicht interessierden Zwangskräfte in der
Berechnung der Teilchenbahn überhaupt nicht auftreten. In den beiden Aufgaben
auf Übungsblatt 1 haben wir sie durch Anleitung bereits diesen Vorteil ausnutzen
lassen.
Ein weiterer Grund für die Diskussion der Lagrangeschen Formulierung der
klassischen Mechanik in der Theoretischen Physik ist, daß sie den Einstieg in sehr
allgemeine Prinzipien erlaubt. Wir werden weiter unten das Variationsprinzip
und eine allgemeine Formulierung von Erhaltungssätzen (Noethersches Theorem)
kennen lernen. Weiterhin geben wir den Einstieg in die Hamiltonsche Mechanik.
3.1
Systeme mit Zwangsbedingungen
Ein System von N Massepunkten unterliegt k holonomen Zwangs-(Neben-)bedingungen, wenn die Bahnkurven ~rα , mit α = 1, 2, . . . , N, die k Gleichungen
hi (~r1 , ~r2 , . . . , ~rN ; t) = 0 ,
i = 1, 2, . . . , k
erfüllen. Hängt mindestens eine der k Gleichungen explizit von der Zeit ab,
so spricht man von holonom-rheonomen Bedigungen. Hängt dagegen keine der
56
KAPITEL 3. LAGRANGESCHE MECHANIK
Gleichungen explizit von der Zeit ab, so heißen die Nebenbedingungen holonomskleronom. Wir nehmen an, daß die k Gleichungen funktional unabhängig sind.
Diesen Begriff wollen wir primär anhand eines Beispiels erklären. Es gelte h1 (~r) =
0 und h2 (~r) = 0, dann ist die Nebenbedingung h3 (~r) = c1 h1 (~r)+c2 h2 (~r) = 0 funktional abhängig und reduziert die Zahl der effektiven Freiheitsgrade nicht weiter.
Man kann zeigen, daß die Nebenbedingungen funktional unabhängig sind, wenn
~ 1 , . . . , ∇h
~ k in (fast) allen Punkten, die die Nebenbedingung
die Gradienten ∇h
erfüllen linear unabhängig sind.
Um den Begriff der holonomen Zwangsbedingung besser zu verstehen, diskutieren wir drei Beispiele. Im ersten bewege sich ein Teilchen auf einer zeitlich
unveränderlichen Fläche, die durch die Gleichung x3 = h̃(x1 , x2 ) definiert wird.
Äquivalent gilt also für alle möglichen Bahnkurven h(x1 , x2 , x3 ) = x3 −h̃(x1 , x2 ) =
0. Wir haben also N = 1 und k = 1, d.h. dem Massepunkt verbleiben zwei Freiheitsgrade der Bewegung. Das System ist holonom-skleronom. Im zweiten Beispiel bewege sich ein Teilchen entlang einer Kurve (z.B. Perle auf Draht), die sich
selbst (auf vorgegebene Weise) im Raum bewegt. Die Kurve kann als Schnittpunkt zweier Flächen mit h1 (x1 , x2 , x3 ; t) und h2 (x1 , x2 , x3 ; t) aufgefaßt werden.
Also gilt N = 1 und k = 2. Das holonom-rheonome System hat noch einen Freiheitsgrad der Bewegung. Im dritten Beispiel betrachten wir ein Doppelpendel mit
“masselosen” Stangen der Länge l1 und l2 . Dabei hängt eine Masse m1 an einer
Stange, die an der Decke befestigt ist (Aufhängepunkt ist Ursprung) und um die
~e3 -Achse frei drehbar ist (Bewegung in ~e1 -~e2 -Ebene). Die zweite Stange ist an der
ersten Masse so befestigt, daß die Bewegung ebenfalls in der ~e1 -~e2 -Ebene stattfindet und an ihrem Ende befindet sich die Masse m2 . Somit müssen während der
Bewegung die vier Nebenbedingungen |~r1 | = l1 , |~r2 − ~r1 | = l2 , ~r1 · ~e3 = 0 = ~r2 · ~e3
erfüllt sein. Es gilt somit N = 2 und k = 4, so daß das holonom-skleronome
System noch zwei Freiheitsgrade der Bewegung hat.
Holonome Zwangsbedingungen treten in der Mechanik sehr häufig auf. Nicht
in diese Klasse von Nebenbedingungen fallen z.B. solche, die sich durch Ungleichungen ausdrücken lassen. Als Beispiel dafür sei ein Skispringer erwähnt, der
immer oberhalb der durch die Form der Schanze und des Auslaufs vorgegebenen
Fläche bleiben muß. Ebenfalls nicht in die Klasse der holonomen Zwangsbedingungen fallen solche, die beim Abrollen von Rädern entstehen. In diesem Fall
treten Geschwindigkeiten, die man bestimmen möchte linear in Gleichungen für
Nebenbedingungen auf.
3.2
Lagrangegleichungen 2. Art
~ α einIm Rahmen der Newtonschen Mechanik muß man explizit Zwangskräfte Z
führen um Nebenbedingungen zu erzwingen. Wir wollen uns folgend klar machen,
wie man vorgehen könnte und wie sich das im Lagrangeformalismus auswirkt. Für
3.2. LAGRANGEGLEICHUNGEN 2. ART
57
ein N-Teilchensystem schreiben wir (α = 1, 2, . . . , N)
~ α = F~αtot ,
mα~r¨α = F~α + Z
wobei wir die Zwangskräfte von den anderen Kräften getrennt haben. Die Anfangsbedingungen der Bewegung müssen so gewählt werden, daß sie mit den Nebenbedingungen vereinbar sind, d.h. die 6N Anfangsbedingungen ~rα (0) und ~r˙α (0)
sind nicht mehr unabhängig voneinander wählbar. Wir wollen nun versuchen,
die Nebenbedingungen durch einen Grenzübergang bei einer adäquat gewählten
Zwangskraft zu erzwingen.
Wir betrachten exemplarisch die Situation eines Teilchens mit N = 1 und
~ . In unsenehmen an, daß die “äußere” Kraft F~ konservativ ist, F~ = −∇V
rem ersten Beispiel des letzten Kapitels war die Nebenbedingung durch h(~r) =
h(x1 , x2 , x3 ) = x3 − h̃(x1 , x2 ) = 0 gegeben. Wählen wir nun
Vtot (~r) = V (~r) + A [x3 − h̃(x1 , x2 )]2 = V (~r) + A h2 (~r)
mit A > 0, so nimmt die potentielle Energie bei großem A weg von der “Zwangsfläche”’ x3 = h̃(x1 , x2 ) sehr schnell zu. Bei fest vorgegebener Gesamtenergie ist
das Teilchen damit gezwungen, sich in der Nähe dieser Fläche aufzuhalten. Im
Limes A → ∞ ist die Bewegung an die Fläche “gebunden”. Für die Kraft, die
sich aus dem Zusatzterm zum Potential ergibt gilt
~ A = −2A h(~r) ∇h(~
~ r) .
Z
Nähert man sich der Fläche an, so steht die Kraft senkrecht auf dieser, da sie
proportional zum Gardienten von h(~r) ist. Oberhalb und unterhalb der Fläche
“drückt” die Kraft das Teilchen auf die Fläche mit h(~r) = 0. Es ist nun vorteilhaft
verallgemeinerte (krummlinige) Koordinaten q1 und q2 so einzuführen, daß sie
die Lage des Massepunktes auf der Fläche charakterisieren und |q3 | ein Maß für
den Abstand von der Fläche ist. Auf der Fläche gilt q3 = 0. Damit sind die
“krummlinigen” Basisvektoren
~g1 =
∂~r
∂~r
, ~g2 =
∂q1
∂q2
tangential an der durch h(~r) = 0 bestimmten Fläche. Für den aus der Zwangskraft
stammenden Teil der in den Lagrangegleichungen auftretenden Terme Qi , i = 1, 2,
gilt
~ A · ~gi = 0
Z
~ A senkrecht auf der Fläche steht. Die Details der Konstruktion der Zwangsda Z
kraft sind dabei irrelevant, wesentlich ist nur diese Orthogonalität. Es gilt (i =
1, 2)
∂V
Qi = ~gi · F~ = −
∂qi
58
KAPITEL 3. LAGRANGESCHE MECHANIK
und damit auch
∂L∗
d ∂L∗
=
dt ∂ q̇i
∂qi
mit
L∗ = [T − V ]q3 =0=q̇3 .
Die Zwangskraft ist mithin aus der Bewegungsgleichungen für die “relevanten”
Variablen herausgefallen. In der Lagrangefunktion L∗ treten die irrelevante Koordinate q3 und ihre Ableitung q̇3 nicht mehr auf
m
L∗ = ~v 2 (q1 , q2 , 0; q̇1 , q̇2 , 0) − V (q1 , q2 , 0) .
2
Für das Teilchen auf dem Draht können wir analog vorgehen. Als verallgemeinerte Koordinate q1 wählen wir die vorzeichenbehaftete Bogenlänge ausgehend
von einem willkürlichen Anfangspunkt. Die Koordinaten q2 und q3 werden senkrecht zur instantanen Drahtachse gewählt und auf dem Draht gelte q2 = q3 = 0.
Zum äußeren Potential addieren wir den Zusatzterm A(q22 + q32 ), mit A > 0. Die
Zwangskraft ist dann wieder senkrecht zur instantanen Lage des Drahtes und es
gilt
∂L∗
d ∂L∗
=
dt ∂ q̇1
∂q1
mit
m 2
~v (q1 , 0, 0; q̇1 , 0, 0; t) − V (q1 , 0, 0; t) .
2
Aufgrund der Bewegung des Drahtes hängen ~v und V in diesem Beispiel explizit
von der Zeit ab. Die Zwangskraft selbst tritt in der Lagrangegleichung für die
relevante Variable nicht auf.
Anhand des Beispiels des oben diskutierten Doppelpendels wollen wir zeigen,
wie sich diese Überlegungen auf Mehrteilchensysteme verallgemeinern lassen. Zur
Verdeutlichung ist das Doppelpendel in der folgende Skizze dargestellt.
L∗ =
0
r1
φ1
r2
φ2
3.2. LAGRANGEGLEICHUNGEN 2. ART
59
Als verallgemeinerte Koordinaten wählen wir (Stangenlängen li )
q1 = φ1 , q2 = φ2 , q3 = |~r1 | − l1 , q4 = |~r2 − ~r1 | − l2 , q5 = x1,3 , q6 = x2,3 ,
wobei schon klar sein sollte, daß q1 und q2 die “relevanten” Koordinaten sind.
Die Ortsvektoren der beiden Massepunkte können ausgedrückt durch die verallgemeinerten Koordinaten qi wie folgt geschrieben werden
~r1 = (l1 + q3 )(~e1 cos φ1 + ~e2 sin φ1 ) + q5~e3 ,
~r2 = ~r1 + (l2 + q4 )(~e1 cos φ2 + ~e2 sin φ2 ) + q6~e3 .
Zur Berechnung der Qi benötigen wir die Vektoren ∂~rα /∂qi . Der Vektor ∂~r1 /∂φ1
ist als dünngedruckter Vektorpfeil in der obigen Skizze eingetragen. Er ist identisch zum Vektor ∂~r2 /∂φ1 . Auch der Vektor ∂~r2 /∂φ2 ist als dünner Pfeil eingezeichnet. Die Zwangskräfte wirken in Richtung der “masselosen” Stangen, d.h. es
gilt
~ 1 = a~r1 + b(~r1 − ~r2 ) ,
Z
~ 2 = c(~r1 − ~r2 ) .
Z
Für i = 1 folgt wegen ~r1 · ∂~r1 /∂φ1 = 0
Q1 = −
∂V
∂~r1
+ (b + c)
· (~r1 − ~r2 )
∂q1
∂φ1
und für i = 2 wegen ∂~r1 /∂φ2 = 0 sowie (~r1 − ~r2 ) · ∂~r2 /∂φ2 = 0
Q2 = −
∂V
.
∂q2
Versucht man die Zwangskraft, die |~r2 − ~r1 | = l2 garantiert durch ein Zweiteilchenpotential, z.B. A[(~r2 − ~r1 )2 − l22 ]2 , mit A → ∞ zu implementieren, so gilt
“action=reactio” und damit c = −b. Nehmen wir an, daß “action=reactio” für
die Zwangskraft gilt (ohne den Versuch ein zugrungeliegendes Potential zu konstruieren), so folgt ebenfalls c = −b und der Zusatzterm im Ausdruck für Q1
verschwindet. Damit erhalten wir für i = 1, 2
d ∂L∗
∂L∗
=
dt ∂ q̇i
∂qi
mit
L∗ = [T − V ]q∗ =0=q̇∗ ,
q ∗ = {q3 , q4 , q5 , q6 } .
Für q ∗ = 0 gilt
x1,1 = l1 cos φ1 , x1,2 = l1 sin φ1 ,
x2,1 = l1 cos φ1 + l2 cos φ2 , x2,2 = l1 sin φ1 + l2 sin φ2 .
60
KAPITEL 3. LAGRANGESCHE MECHANIK
Daraus können wir die kinetische Energie für q ∗ = 0 berechnen
T∗ =
m1 + m2 2 2 m2 2 2
l1 φ̇1 +
l φ̇ + m2 l1 l2 φ̇1 φ̇2 cos (φ1 − φ2 ) .
2
2 2 2
Sollten die expliziten Kräfte F~α durch das Schwerefeld der Erde gegeben sein, so
gilt weiterhin
V∗ = −(m1 + m2 )gl1 cos φ1 − m2 gl2 cos φ2 .
Ausgehend von diesen Beispielen versuchen wir nun eine allgemeine Formulierung der Beobachtung, daß nur die relevanten Koordinaten in den Lagrangegleichungen auftauchen und die Zwangskräfte im Lagrangeformalismus nicht explizit behandelt werden müssen. Dazu führen wir wie oben die 3N-dimensionalen
Vektoren (ohne Teilchen- und Komponentenindex) ein, die sich durch “Untereinanderschreiben” der Komponenten für die einzelnen Teilchen ergibt. Damit gilt
(i = 1, 2, . . . , 3N)
d ∂T
∂T
=
+ Qi
dt ∂ q̇i
∂qi
mit
~ · ~gi = (F~ + Z)
~ · ∂~r .
Qi = (F~ + Z)
∂qi
Im Fall k funktional unabhängiger holonomer Nebenbedingungen kann sich die
“Bahnkurve” ~r nicht an jedem beliebigen Punkt des R3N befinden, sondern ist auf
eine (3N − k)-dimensionale Hyperfläche beschränkt. Im Fall holonom-rheonomer
Nebenbedingungen ist diese Hyperfläche zeitabhängig. Analog zu den obigen Beispielen wird es immer möglich sein, eine idealisierte Zwangskraft zu konstruieren,
die ~r auf die Hyperfläche zwingt. Diese Zwangskraft ist orthogonal zur instantanen Hyperfläche. Wählt man die ersten 3N − k verallgemeinerten Koordinaten
q1 , q2 , . . . , q3N −k in der instantanen Hyperfläche und q ∗ = {q3N −k+1 , . . . , q3N } so,
daß q ∗ = 0 auf der Hyperfläche, so sind die ~gi für i = 1, . . . , 3N − k Tangentialvektoren an die Hyperfläche und stehen senkrecht auf der Zwangskraft
~ = 0 , i = 1, 2, . . . , 3N − k .
~gi · Z
Damit gilt für expilzite Kräfte, die konservativ sind
∂V
Qi = F~ · ~gi = −
, i = 1, 2, . . . , 3N − k .
∂qi
Für die Lagrangeschen Bewegungsgleichungen ergibt sich dann
d ∂L∗
∂L∗
=
, L∗ = [T − V ]q∗ =0=q̇∗ ,
dt ∂ q̇i
∂qi
i = 1, 2, . . . , 3N − k .
3.2. LAGRANGEGLEICHUNGEN 2. ART
61
Dieses sind die Lagrangegleichungen 2. Art für holonome Systeme. Im folgenden
werden wir den Index ∗ weglassen, wenn klar ist, was gemeint ist. Wir haben
somit einen eleganten Formalismus entwickelt, der es erlaubt die Bewegungsgleichungen für Systeme mit holonomen Zwangsbedingungen aufzustellen, ohne sich
Gedanken über die Zwangskräfte machen zu müssen.
Historisch hat man im Zusammenhang mit Zwangskräften sogenannte virtuelle Verrückungen betrachtet. Man hat Vektoren δ~rα = ǫζ~α mit infinitesimalem ǫ
konstruiert, wobei die ζ~α so gewählt sind, daß
~ =ǫ
ζ~ · Z
N
X
α=1
~ α · δ~rα = 0
Z
gilt. Damit leisten Zwangskräfte bei virtuellen Verrückungen keine Arbeit. Diese
Aussage bezeichnet man als das d’Alembertsche Prinzip. Mit der Einsicht, daß ζ~
eine beliebige Linearkombination der ~gi ist, die Tangentialvektoren an die Hyperfläche sind (i = 1, 2, . . . , 3N − k), ist das d’Alembertsche Prinzip äquivalent zu
unserer Annahme, daß die Zwangskräfte senkrecht auf der Hyperfläche stehen.
Nachdem man die Lagrangeschen Bewegungsgleichungen gelöst hat, ist es
möglich die Zwangskraft explizit zu berechnen (sollte sie von Interesse sein).
Man kann dazu zur ursprünglichen Newtonschen Formulierung in kartesischen
Koordinaten zurückkehren. In dieser gilt
~ α = mα~r¨α − F~α .
Z
Bei bekannter Bahnkurve läßt sich die rechte Seite berechnen und die Zwangskräfte sind bestimmt. Alternativ kann man für konservative Systeme die “restlichen” Lagrangegleichungen
d ∂L ∂L
~
~gi · Z =
, i = 3N − k + 1, 3N − k + 2, . . . , 3N
−
dt ∂ q̇i ∂qi q∗ =0=q̇∗
verwenden. Um das Vorgehen zu illustrieren, betrachten wir das Problem eines
Teilchens auf einem Ring unter Einfluß des Schwerefeldes. Dabei wählen wir das
Koordinatensystem so, daß das Schwerefeld in Richtung ~e1 zeigt und der Ursprung
im Mittelpunkt des Kreises liegt. Der Kreis liege in der ~e1 -~e2 -Ebene. Wir gehen
zu Polarkoordinaten über, wobei die relevante Variable φ (Winkel zwischen ~e1
und ~r) ist, während r(t) durch eine Zwangskraft auf r(t) = R, mit dem Radius
R des Kreises, festgelegt ist. Der ersten Strategie folgend schreiben wir
~ = m~r¨ − F~ ,
Z
~ˆ sin φ) ,
F~ = mg~e1 = mg(~rˆ cos φ − φ
wobei wir für die Einheitsvektoren in r- und φ-Richtung die Notation von S.
139 des Skripts der Vorlesung des letzten Semesters verwendet haben. Für die
62
KAPITEL 3. LAGRANGESCHE MECHANIK
Beschleunigung gilt
~r = R(~e1 cos φ + ~e2 sin φ) = R~rˆ ,
~ˆ ,
~r˙ = Rφ̇(−~e1 sin φ + ~e2 cos φ) = Rφ̇φ
~ˆ − Rφ̇2~rˆ .
~r¨ = Rφ̈φ
Damit können wir die Zwangskraft berechnen
h
i
~ˆ − Rφ̇2 + g cos φ ~rˆ
~ = m Rφ̈ + g sin φ φ
Z
= −m Rφ̇2 + g cos φ ~rˆ ,
da der erste Summand nach der Bewegungsgleichung (siehe letzte Gleichung auf
S. 141 des Skripts des letzten Semesters) Null ergibt. Setzt man nun nach der
Lösung der Bewegungsgleichung φ(t) ein, so ist die Zwangskraft bestimmt. Der
zweiten Strategie folgend bestimmen wir die vollständige Lagrangefunktion in den
verallgemeinerten Koordinaten r und φ
m 2
2 2
ṙ + r φ̇ + mgr cos φ .
L=
2
Setzt man nun r = R und ṙ = 0,2 so ergibt sich
L∗ =
m 2 2
R φ̇ + mgR cos φ .
2
Zur Berechnung der Zwangskraft benötigen wir
∂L
= mṙ ,
∂ ṙ
∂L
= mr φ̇2 + mg cos φ .
∂r
Eingesetzt liefert das (~gr = ~rˆ)
d ∂L ∂L
~
= −mRφ̇2 − mg cos φ
~gr · Z =
−
dt ∂ ṙ
∂r r=R,ṙ=0
also
~ = −m Rφ̇2 + g cos φ ~rˆ
Z
und damit das gleiche Ergebnis wie im ersten Zugang.
Wir werden folgend eine alternative Art Zwangskräfte zu behandeln kennen
lernen. Dieser Zugang führt auf die Lagrangegleichungen 1. Art.
2
Dem oben entwickelten allgemeinen Formalismus folgend hätten wir besser q1 = φ und
q2 = R − r gewählt. In diesem Fall müßten wir, um aus L∗ aus L zu erhalten, q2 = 0 setzen.
63
3.3. LAGRANGEGLEICHUNGEN 1. ART
3.3
Lagrangegleichungen 1. Art
Wir gehen davon aus, daß wir einen Satz {q1 , q2 , . . . , q3N } von beliebigen verallgemeinerten Koordianten haben, der noch nicht entsprechend der k holonomen
Nebenbedingungen hi (~r; t) = 0 gewählt sein muß. Wir nehmen weiterhin an, daß
die expliziten Kräfte und die Zwangskräfte aus einem Potential ableitbar sind.
Dann gilt
d ∂L ∂L
~,
−
= ~gi · Z
dt ∂ q̇i ∂qi
i = 1, 2, . . . , 3N .
(3.3)
Die ~gi = ∂~r/∂qi sind wieder die Basisvektoren im betrachteten Punkt P . Dieser
liege auf der instantanen Hyperfläche. Wir betrachten einen beliebigen Tangentialvektor ζ~ an die Hyperfläche und schreiben ihn als Linearkombination der ~gi
ǫζ~ =
3N
X
ǫci~gi =
i=1
3N
X
δqi~gi .
i=1
Aufgrund der k Nebenbedingungen können nur 3N −k der ci frei gewählt werden.
Multiplizieren wir Gl. (3.3) mit δqi und summieren über alle i, so folgt mit Hilfe
~ · ζ~ = 0, daß
des d’Alembertschen Prinzips Z
3N
X
i=1
δqi
d ∂L ∂L
=0.
−
dt ∂ q̇i ∂qi
(3.4)
Da die Bewegung auf der aus den (simultanen) Bedingungen hj (~r; t) = 0, j =
~ ~r hj senkrecht
1, 2, . . . , k, resultierenden Hyperfläche verläuft und der Gradient ∇
auf Flächen hj = const. steht, gilt
~ ~r hj · ǫζ~ = 0
∇
auf der instantanen Hyperfläche. Das impliziert
~ ~r hj ·
0=∇
3N
X
i=1
3N
X ∂hj
∂~r
δqi
=
, j = 1, 2, . . . , k .
δqi
∂qi
∂qi
i=1
Addiert man dieses Ergebnis nach Multiplikation mit zunächst beliebigen zeitabhängigen Funktionen λj , die man Lagrangesche Multiplikatoren nennt, und Summation über j zu Gl. (3.4), so folgt
#
"
k
3N
X
X
∂hj
d ∂L ∂L
−
−
λj
=0.
δqi
dt ∂ q̇i ∂qi j=1 ∂qi
i=1
Wir können nun die δqi mit i = 1, 2, . . . , 3N − k frei wählen. Die k verbleibenden
δqi liegen dann fest. In den Summanden mit i = 3N −k+1, . . . , 3N wählen wir die
64
KAPITEL 3. LAGRANGESCHE MECHANIK
λj , j = 1, 2, . . . , k so, daß die Ausdrücke in den eckigen Klammern verschwinden.
Die übrigen 3N − k eckigen Klammern müssen ebenfalls verschwinden, da die
zugehörigen δqi unabhängig sind. Damit folgt
k
d ∂L ∂L X ∂hj
−
=
λj
, i = 1, 2, . . . , 3N .
dt ∂ q̇i ∂qi
∂q
i
j=1
Zusammen mit den Relationen
hj (~r; t) = 0 ,
j = 1, 2, . . . , k
sind das (3N + k) Gleichungen für (3N + k) Unbekannte q1 , . . . , q3N ; λ1 , . . . , λk
(alles Funktionen der Zeit). Man nennt diese Gleichungen die Lagrangegleichungen 1. Art. Im Gegensatz zum Zugang, der auf die Lagrangegleichungen 2. Art
führt, werden die 3N verallgemeinerten Koordinaten als unabhängige Variablen
behandelt. Im Gegenzug ist es notwendig, die k Lagrangeschen Multiplikatoren
λj einzuführen. Der Vergleich mit Gl. (3.3) zeigt, daß für festes i auf der rech~
ten Seite der (ersten) 3N Gleichungen 1. Art die Projektion der Zwangskraft Z
(3N-dimensionaler Vektor) auf die Richtung ~gi (3N-dimensionaler Vektor) steht
k
X
j=1
λj
∂hj
~ ,
= ~gi · Z
∂qi
i = 1, 2, . . . , 3N .
Ein Vorteil der Lagrangegleichungen 1. Art besteht darin, daß es gelingt, sie
für eine gewisse Klasse nicht-holonomer Zwangsbedingungen zu erweitern. Probleme, die so behandelbar sind, treten aber eher im Bereich der “Technischen
Mechanik” auf, so daß wir sie hier nicht weiter behandeln wollen. Wir haben uns
an dieser Stelle den “Ausflug” zu den Lagrangegleichungen 1. Art “geleistet”,
da in ihm erstmals die Lagrangeschen Multiplikatoren auftauchen, die ihnen in
späteren Vorlesungen der Theoretischen Physik (insbesondere Theoretische Physik IV–Thermodynamik und statistische Mechanik) wiederbegegnen werden. In
Anwendungen werden wir hier nur die Lagrangegleichungen 2. Art verwenden.
Zum Abschluß dieses Kapitels wollen wir kurz untersuchen, wie sich Zwangsbedingungen auf den Energiesatz auswirken, wobei wir uns auf den Fall konservativer (expliziter) Kräfte mit
~ ~rα V (~r1 , . . . , ~rN )
F~α = −∇
beschränken wollen. Skalare Multiplikation der Newtonschen Gleichung
~α
~ ~rα V = Z
mα~r¨α + ∇
mit ~r˙α liefert
d mα ˙ 2 ˙ ~
~α .
~r + ~rα · ∇~rα V = ~r˙α · Z
dt 2 α
65
3.3. LAGRANGEGLEICHUNGEN 1. ART
Nach Summation über den Teilchenindex α folgt daraus (Vektoren ohne Index
sind 3N-dimensional)
N
X
d
~ α = ~r˙ · Z
~.
(T + V ) =
~r˙α · Z
dt
α=1
(3.5)
Für k holonome Zwangsbedingungen mit hi (~r; t) = 0, für i = 1, 2, . . . , k, liefern
~ ~r hi auf den Punkten der durch die Zwangsbedie 3N-dimensionalen Gradienten ∇
dingung gegebenen instantanen Hyperfläche einen Satz von k linear unabhängi~ auf der Hyperfläche senkrecht steht, muß es k zeitabhängige
gen Vektoren. Da Z
Koeffizienten λ̃j (t) geben, so daß
~ r ; t) =
Z(~
k
X
j=1
~ ~r hj (~r; t) .
λ̃j (t)∇
(3.6)
Skalare Multiplikation mit ~gi = ∂~r/∂qi liefert
~ r; t) =
~gi · Z(~
k
X
k
X
∂hj (~r; t)
~ ~r hj (~r; t) · ∂~r =
λ̃j (t)∇
.
λ̃j (t)
∂qi
∂qi
j=1
j=1
Setzt man dieses Ergebnis auf der rechten Seite der Gl. (3.3) ein, so folgen wieder
die Lagrangegleichungen 1. Art (was eine alternative Herleitung dieser liefert).
Man sieht also, daß die λ̃j die Lagrangeschen Multiplikatoren sind. Wir lassen
somit die Schlange weg. Setzen wir nun das Ergebnis Gl. (3.6) in Gl. (3.5) ein, so
folgt für holonome Zwangsbedingungen
" k
#
X
dE
~ ~r hj (~r; t)
= ~r˙ ·
λj (t)∇
dt
j=1
#
" k
N
X
X
~ ~rα hj (~r; t)
~r˙α ·
λj (t)∇
=
α=1
= −
k
X
j=1
j=1
λj (t)
∂hj (~r; t)
.
∂t
Im letzten Schritt haben wir dabei verwendet, daß dhj /dt = 0 innerhalb der
Hyperfläche gilt. Hängen die hj also nicht explizit von der Zeit ab, verschwindet
die rechte Seite. Für holonom-skleronome Systeme gilt somit Energieerhaltung,
wenn die explizite Kraft konservativ ist.
66
3.4
KAPITEL 3. LAGRANGESCHE MECHANIK
Nochmal die Lagrangegleichungen 2. Art
Das Hauptwerkzeug innerhalb der Lagrangeschen Mechanik bei der Behandlung
praktischer Probleme sind die Lagrangegleichungen 2. Art
∂L
d ∂L
=
,
dt ∂ q̇i
∂qi
L = [T − V ]q∗ =0=q̇∗ ,
i = 1, 2, . . . , 3N − k .
In der Herleitung dieser Gleichungen mit holonomen Zwangsbedigungen sind wir
davon ausgegegangen, daß die qi für i = 1, 2, . . . , 3N − k verallgemeinerte Koordinaten in der durch die Zwangsbedingungen gegebenen Hyperfläche (innerhalb
derer die Bewegung stattfindet) sind. In dieser können die Koordinaten jedoch
frei gewählt werden. Wir wollen zeigen, daß eine beliebige, lokal fast überall umkehrbare Koordinatentransformation (innerhalb der Hyperfläche)
q̄i = q̄i (q1 , q2 , . . . , qm ; t) = q̄i (q; t) ,
qi = qi (q̄1 , q̄2 , . . . , q̄m ; t) = qi (q̄; t) ,
mit m = 3N − k, die Lagrangegleichungen invariant läßt. Differenziert man die
qi (q̄; t) nach der Zeit, so folgt
q̇i =
X ∂qi
∂qi
.
q̄˙k +
∂ q̄k
∂t
k
Man kann L als Funktion der q̄ und q̄˙ auffassen
˙ t); t) = L̄(q̄, q̄;
˙ t) .
L(q, q̇; t) = L(q(q̄; t), q̇(q̄, q̄;
Aus Gl. (3.7) folgt
∂qj
∂ q̇j
=
.
∂ q̄˙i
∂ q̄i
Um die Forminvarianz der Lagrangegleichungen zu zeigen, betrachten wir
X ∂L ∂qk
∂L ∂ q̇k
∂ L̄
,
=
+
∂ q̄i
∂qk ∂ q̄i
∂ q̇k ∂ q̄i
k
X ∂L ∂ q̇k X ∂L ∂qk
∂ L̄
=
=
.
∂ q̄˙i
∂
q̇
∂
q̇
k ∂ q̄˙i
k ∂ q̄i
k
k
Damit ergibt sich
d ∂ L̄ ∂ L̄ X
−
=
dt ∂ q̄˙i ∂ q̄i
k
d ∂L
∂L ∂qk
∂L ∂ q̇k
d ∂qk
.
−
−
−
dt ∂ q̇k ∂qk ∂ q̄i
∂ q̇k ∂ q̄i
dt ∂ q̄i
(3.7)
3.4. NOCHMAL DIE LAGRANGEGLEICHUNGEN 2. ART
67
Der erste Term in eckigen Klammern veschwindet, da die qi (t) die Lagrangegleichungen erfüllen. Im zweiten Term in eckigen Klammern müssen wir noch wie
bei der Herleitung der Lagrangegleichungen die Reihenfolge der Ableitung nach t
und der partiellen Ableitung nach q̄i vertauschen. Danach ist klar, daß auch dieser Term verschwindet und wir haben die Forminvarianz der Lagrangegleichungen
gezeigt. Es gilt also für i = 1, 2, . . . , m
∂ L̄
d ∂ L̄
=
.
dt ∂ q̄˙i
∂ q̄i
Wir geben zum Abschluß des Kapitels über die Lagrangesche Formulierung
der Mechanik ein Kochrezept zur Verwendung dieses Formalismus an und diskutieren ein (weiteres) Beispiel. Gegeben sei ein System aus N Massepunkten
der Masse m1 , m2 , . . . , mN , das sich aufgrund holonomer Zwangsbedingungen auf
einer m ≤ 3N-dimensionalen (im rheonomen Fall zeitabhängigen) Hyperfläche F
des 3N-dimensionalen Raums bewegt. Dann geht man wie folgt vor:
1. Man wählt ein System q = (q1 , q2 , . . . , qm ) von verallgemeinerten Koordinaten so, daß der aus den ~rα (t) gebildete 3N-dimensionale Ortsvektor
~r(t) = ~r(q; t) in der Hyperfläche ist.
2. Man berechnet aus
~vα = ~r˙α =
m
X
∂~rα
i=1
∂qi
q̇i +
∂~rα
∂t
die ~vα2 .
3. Die Lagrangefunktion L erhält man dann aus
L=
N
X
mα
α=1
2
~vα2 − V (q) .
4. Man stellt die Lagrangegleichungen (i = 1, 2, . . . , m)
∂L
d ∂L
=
dt ∂ q̇i
∂qi
auf.
5. Man löst diesen Satz von gekoppelten Differentialgleichungen. Nur in den
wenigsten Fällen wird dieses analytisch gelingen.
An einem Beispiel wollen wir dieses Vorgehen veranschaulichen. Ein Massepunkt kann sich reibungsfrei auf einem geraden Draht bewegen, der unter festem
68
KAPITEL 3. LAGRANGESCHE MECHANIK
Neigungswinkel θ < π/2 relativ zur ~e3 -Achse mit vorgegebener Winkelgeschwindigkeit ω(t) = φ̇(t) um die ~e3 -Achse rotiert. Letztere ist dadurch festgelegt, daß
die Gravitationsbeschleunigung (Schwerefeld der Erde) in −~e3 -Richtung wirke. φ
ist der Winkel zwischen der Projektion der Position des Teilchens für x3 > 0 auf
die ~e1 -~e2 -Ebene und der ~e1 -Richtung.3
1. Die Hyperfläche ist eindimensional und zeitabhängig. Die freie Variable ist
der Abstand r̃ des Teilchens vom Ursprung. Dabei gelte r̃ > 0 für x3 > 0
und r̃ < 0 für x3 < 0. Der Ortsvektor des Teilchens läßt sich damit als
~r(t) = r̃(t) [sin θ(cos φ(t)~e1 + sin φ(t)~e2 ) + cos θ~e3 ] = r̃(t)~er (t)
schreiben, wobei θ zeitunabhängig ist und φ(t) die vorgegebene Zeitabhängigkeit hat.
2. Differentiation von ~r(t) liefert
˙ er (t) + r̃(t)ω(t) sin θ [− sin φ(t)~e1 + cos φ(t)~e2 ]
~r˙ (t) = r̃(t)~
˙ er (t) + r̃(t)ω(t) sin θ~eφ (t) .
= r̃(t)~
Da die Vektoren ~er (t) und ~eφ (t) für alle Zeiten orthogonal sind, folgt für
das Geschwindigkeitsquadrat
~v 2 = r̃˙ 2 + r̃ 2 ω 2 sin2 θ .
3. Mit dem Potential V = mgr̃ cos θ folgt für die Lagrangefunktion
L=
m ˙2
r̃ + r̃ 2 ω 2 sin2 θ − mgr̃ cos θ .
2
4. Um die Lagrangegleichungen zu bestimmen, benötigt man die partiellen
Ableitungen
∂L
= mr̃˙ ,
∂ r̃˙
∂L
= mr̃ω 2 sin2 θ − mg cos θ .
∂r̃
Dies liefert die Bewegungsgleichung
r̃¨ = r̃ω 2 sin2 θ − cos θ .
5. Für ω(t) = ω0 = const. läßt sich die Differentialgleichung mit den von uns
im letzten Semester behandelten Methoden lösen. Wir wollen das hier aus
Zeitgründen nicht weiter verfolgen.
3
Die Winkel sind damit wie bei Polarkoordinaten gewählt.
3.5. DAS PRINZIP DER KLEINSTEN WIRKUNG
3.5
69
Das Prinzip der kleinsten Wirkung
In diesem Kapitel wollen wir eine alternative Herleitung der Lagrangegleichungen präsentieren. Es mag zunächst überflüssig erscheinen, auf einem weiteren
Weg die uns schon bekannten Bewegungsgleichungen herzuleiten. Er verwendet
aber mit dem Variationsprinzip eine Methode, die in vielen Bereichen der Physik
und Mathematik eine wichtige Rolle spielt. Es hat sich herausgestellt, daß sich
fast alle Bereiche der Physik – klassische Mechanik, Quantenmechanik, Optik,
Elektromagnetismus usw. – in Form von Variationsprinzipien formulieren lassen
(auch wenn das nicht die historische Sichtweise auf diese Gebiete darstellt). Wir
werden daher damit beginnen, die Variationsrechnung anhand eines Beispiels aus
der Mathematik einzuführen.
Der kürzeste Weg zwischen zwei Punkten: Als einfaches Beispiel betrachten
wir die Frage, welche Form der kürzeste Weg zwischen zwei Punkten ist. Dabei
kennen wir die Antwort bereits: Eine Gerade. Mit Hilfe der Variationsrechung
können wir diese allgemein bekannte Tatsache beweisen. Mathematisch läßt sich
das Problem wie folgt formulieren. Wir haben zwei Punkte (die in einer Ebene
liegen) (x1 , y1 ) und (x2 , y2) gegeben. Sie sind durch einen Pfad y(x) verbunden.
Die Aufgabe ist es, den kürzesten Pfad y(x) zu finden.
p Die Länge einer infinitesimalen Strecke auf dem Pfad ∆s kann als ∆s = (∆x)2 + (∆y)2 geschrieben
werden. Mit
dy
∆y =
∆x = y ′ (x) ∆x
dx
folgt
p
∆s = 1 + [y ′ (x)]2 ∆x .
Damit ergibt sich für die Länge L des Pfads y(x) zwischen den beiden Punkten
Z x2 p
1 + [y ′(x)]2 dx .
L=
x1
Wir müssen somit die (oder eine) Funktion y(x) finden, für die L unter Vorgabe
des Anfangs- und Endpunkts minimal wird. Man bezeichnet L als ein Funktional,
da diese Größe von der Funktion y(x) abhängt. Ein sehr ähnliches Problem ergibt
sich im physikalischen Kontext in der Optik. Das Fermatsche Prinzip sagt, daß
für gegebenen im Allgemeinen ortsabhängigen Brechungsindex n(~r) das Licht den
Pfad zwischen zwei Punkten nimmt, für den die benötigte Zeit minimal wird. Die
lokale Geschwindigkeit des Lichts in einem Medium mit Brechungsindex n(~r) ist
dabei durch v = c/n(~r), mit der Vakuumlichtgeschwindigkeit c, gegeben. Für die
vom Licht entlang y(x) benötigte Zeit T ergibt sich so (Anfangs- und Endpunkt
liegen in einer Ebene)
Z
p
1 x2
n(x, y) 1 + [y ′ (x)]2 dx .
T =
c x1
70
KAPITEL 3. LAGRANGESCHE MECHANIK
Wir müssen somit die (eine) Funktion y(x) bestimmen, die das Integral minimiert.
In der Differentialrechnung einer Veränderlichen bestimmt man das Extremum einer Funktion, indem man diese differenziert und anschließend Null setzt.
Dabei kann das Extremum x0 ein Sattelpunkt, ein lokales Maximum oder ein
lokales Minimum sein. Man nennt diese Punkte auch stationäre Punkte, da eine infinitesimale Abweichung von x0 den Wert der Funktion nicht ändert (da die
Steigung Null ist). In Analogie wollen wir jetzt einen Pfad finden, der das Integral
stationär macht, d.h. daß eine kleine Abweichung vom stationären Pfad den Wert
des Integrals nicht ändert. Wie in der Differentialrechnung einer Veränderlichen
kann man dann jedoch noch nicht sicher sein, ob das von uns gesuchte Minimum
vorliegt. Dieses muß man getrennt untersuchen. Man nennt die Methode zur Bestimmung des stationären Pfads die Variationsrechnung.
Variation und die Euler-Lagrange-Gleichung: Wir wollen das Variationsproblem nun allgemein formulieren und betrachten ein Integral der Form
Z x2
f [y(x), y ′(x), x] dx ,
S=
x1
wobei y(x) eine noch unbekannte Funktion ist, die die Punkte (x1 , y(x1 ) = y1 )
und (x2 , y(x2 ) = y2 ) verbindet. Unter allen Funktionen, die diese Bedingungen
erfüllen, müssen wir diejenige(n) finden, die das Integral minimiert(en). Wenn
wir die (oder eine) gesuchte Lösung mit y(x) bezeichnen, dann liefert die Kurve
Y (x) = y(x) + η(x)
mit η(x1 ) = η(x2 ) = 0 einen größeren Wert für das Integral S.4 Wir führen nun
den Parameter α ein und betrachten den Pfad
Y (x) = y(x) + αη(x) .
Damit hängt das Integral von α ab und wir bezeichnen es mit S(α). Die richtige
Kurve folgt für α = 0 und S(α) wird für α = 0 minimal. Wir können somit den
gewöhnlichen Formalismus zum Finden eines Minimums für eine Funktion einer
Veränderlichen verwenden. Es muß also dS/dα = 0 gelten. Wir betrachten somit
Z x2
dS
d
=
f [y + αη, y ′ + αη ′, x] dx
dα
dα
x
Z 1x2 ∂f
′ ∂f
+ η ′ dx .
=
η
∂y
∂y
x1
Durch partielle Integration im zweiten Term und unter Verwendung von η(x1 ) =
η(x2 ) = 0 folgt
Z x2
dS
∂f
d ∂f
η(x)
dx .
=
−
dα
∂y
dx ∂y ′
x1
4
Dabei vernachlässigen wir Fälle, in denen das Integral den gleichen Wert liefert.
3.5. DAS PRINZIP DER KLEINSTEN WIRKUNG
71
Da nun am Minimum
dS
=0
dα
für beliebige η(x) gelten muß, können wir schließen, daß
∂f
d ∂f
=
∂y
dx ∂y ′
für alle x ∈ [x1 , x2 ] gelten muß. Man nennt diese Gleichung die Euler-LagrangeGleichung. Identifizieren wir f ↔ L, x ↔ t und y ↔ q, so ist diese identisch zur
Lagrangeschen Bewegungsgleichung im Fall von einer unabhägigen verallgemeinerten Variablen. Wir werden diesen Zusammenhang sehr bald besser verstehen.
Als Anwendung wollen wir uns noch einmal unserem obigen Beispiel des
kürzesten Abstandes zwischen
zwei Punkten widmen. Wie diskutiert gilt in diep
′
′
2
sem Fall f (y, y , x) = 1 + [y ] . Die Euler-Lagrange-Gleichung hat somit wegen
∂f
=0,
∂y
die Form
∂f
y′
p
=
∂y ′
1 + [y ′ ]2
y′
d ∂f
p
=
0
⇒
=C,
dx ∂y ′
1 + [y ′ ]2
mit der Konstanten C. Umgeformt folgt
[y ′ (x)]2 = const. ⇒ y ′ (x) = const. ⇒ y(x) = ax + b ,
mit den Konstanten a und b. Damit haben wir fast bewiesen, daß eine Gerade in
der Tat die kürzeste Verbindung zwischen zwei vorgegeben Punkten ist. Offen ist
noch die Frage, ob es sich um ein Minimum oder Maximum des Integrals handelt.
Im vorliegenden Fall ist es jedoch offensichtlich, daß die Gerade ein Minimum liefert. Glücklicherweise ist es für die Anwendung der Variationsrechnung in der
Mechanik irrelevant, ob ein Minimum oder Maximum voriegt. Wichtig ist nur,
daß ein bestimmtes Integral (siehe unten) stationär wird. Das zweite Problem,
weshalb wir nur fast bewiesen haben, daß eine Gerade die kürzeste Verbindung
zwischen zwei Punkten liefert sind Wege, die man nicht in der Form y = y(x)
schreiben kann, wie z.B. einen spiralförmige Pfad. Weiterhin sind wir davon ausgegangen, daß der kürzeste Pfad in einer Ebene liegt (siehe auch das Beispiel aus
der Optik).
Wir können unsere Überlegungen erweitern, indem wir die Parameterdarstellung (Parameter x - später t für die Zeit) von Kurven im d-dimensionalen Raum
betrachten: y1 (x), y2 (x), . . . , yd (x). Die parametrische Form erlaubt es jetzt auch
72
KAPITEL 3. LAGRANGESCHE MECHANIK
spiralförmige Kurven zu beschreiben. Damit ergibt sich für das Integral, welches
stationär werden soll
Z x2
S=
f [y1 (x), y1′ (x), y2 (x), y2′ (x), . . . , yd (x), yd′ (x), x] dx ,
x1
wobei die yi (x1 ) und yi (x2 ) mit i = 1, 2, . . . , d festgelegt sind. Wir können nun
wie zuvor vorgehen und kleine Abweichungen αi ηi (x) vom stationären Pfad yi (x)
betrachten. Auf diese Weise bekommen wir die Euler-Lagrange-Gleichungen
∂f
d ∂f
=
,
∂yi
dx ∂yi′
i = 1, 2, . . . , d
Das Hamiltonsche Prinzip: Nach diesen Vorüberlegungen sind wir in der Lage,
die auf dem Variationsprinzip beruhenden Herleitung der Lagrangeschen Bewegungsgleichungen zu geben. Wir betrachten ein System von N Massepunkten,
welches konservativ sei und zunächst keinen Zwangsbedingungen unterliege. In
unserer bisherigen Herangehensweise haben wir zusammen mit den Bewegungsgleichungen die Anfangsorte und die Anfangsgeschwindigkeiten vorgegeben, da
sich dieses durch den Bezug zum Experiment und der Theorie der Differentialgleichungen (Eindeutigkeit der Lösung) aufdrängt. In drei Dimensionen ergeben
sich so 6N Bedingungen, um die 6N freien Konstanten der allgemeinen Lösung
der Bewegungsgleichung festzulegen. Wir werden folgend etwas anders vorgehen
– da wir Bezug zur Variationsrechnung machen werden – und nach Bahnkurven
mit festen Anfangs- und Endorten suchen. Wir definieren (konsistent mit oben)
die Lagrangefunktion als die Differenz aus kinetischer und potentieller Energie
L(~r, ~r˙ ; t) = T − V
N
1X
mα~r˙α2 − V (~r; t) ,
=
2 α=1
mit dem 3N-dimensionalen Vektor ~r wie oben. Neu führen wir jetzt das Wirkungsfunktional
Z t2
L(~r(t), ~r˙ (t); t) dt
S=
t1
ein. Die Anfangs- ~r(t1 ) und Endorte ~r(t2 ) sind dabei vorgegeben. Die EulerLagrange-Gleichungen des vorliegenden Variationsproblems entsprechen den uns
bekannten Lagrangeschen Bewegungsgleichungen. Wir können somit schließen,
daß die eindeutige Lösung der Bewegungsgleichungen unter Berücksichtigung der
Anfangsbedingungen für die ~r und ~r˙ das Wirkungsfunktional stationär werden
läßt, was man als das Hamiltonsche Prinzip bezeichnet. Geht man nun andersherum vom Wirkungsfunktional und den folgenden Euler-Lagrange-Gleichungen
3.5. DAS PRINZIP DER KLEINSTEN WIRKUNG
73
aus, so kann man durch Wahl der 6N Integrationskonstanten die Randbedingungen ~r(t1 ) und ~r(t2 ) erfüllen, es kann jedoch durchaus mehrere Lösungen geben
(da man nicht auf Eindeutigkeitssätze der Theorie der Differentialgleichungen
zurückgreifen kann). Man bezeichnet das Hamiltonsche Prinzip auch als Prinzip
der kleinsten Wirkung, da die stationären Pfade meist Minima sind.
Wir können für ein System mit holonomen Nebenbedingungen völlig analog
vorgehen, wobei die Lagrangefunktion nun von den “relevanten” verallgemeinerten Koordinaten abhängt (man sucht den extremalen Weg, der mit den Nebenbedingungen vereinbar ist). Die Euler-Lagrange-Gleichungen mit den “relevanten”
qi und q̇i entsprechen erneut den uns bekannten Lagrangeschen Bewegungsgleichungen.
Damit haben wir eine alternative Herleitung der Lagrangeschen Bewegungsgleichungen für holonome Systeme gefunden, die auf dem Variationsprinzip beruht. Diese Herleitung ist sehr elegant und gibt bereits einen ersten Eindruck
davon, wie wichtig das Varitions(Extremal-)prinzip in der (theoretischen) Physik
ist.
Für unsere späteren Überlegungen ist es wichtig festzuhalten, daß ein gegebenes Wirkungsfunktional
Z t2
S=
L(q(t), q̇(t); t) dt
t1
(wobei q bzw. q̇ für alle qi bzw. q̇i steht) eindeutige Euler-Lagrange-Gleichungen
liefert. Die Umkehrung gilt aber nicht, d.h. unterschiedliche Wirkungsfunktionale
können die gleichen Euler-Lagrange-Gleichungen liefern. Wir betrachten dazu das
Beispiel
Z t2
L̃(q(t), q̇(t); t) dt
S̃ =
t1
Z t2 d
cL(q(t), q̇(t); t) + G(q(t); t) dt .
=
dt
t1
Dabei ist c eine beliebige Konstante und G(q; t) eine beliebige differenzierbare
Funktion. Integration liefert sofort
S̃ = cS + G(q(t1 ); t1 ) − G(q(t2 ); t2 ) .
Da von der Funktion G nur die Anfangs- und Endpunkte eingehen, ändert sich bei
Variation des Weges nur der erste Summand. Für die Euler-Lagrange-Gleichungen
folgt somit
∂(cL)
d ∂(cL)
=
dt ∂ q̇i
∂qi
und nach Kürzen des Faktors c 6= 0 folgt dieselbe Euler-Lagrange-Gleichung wie
für S. Man kann die Aussage, daß die Lagrangefunktionen L und L̃ auf dieselben
Euler-Lagrange-Gleichungen führen, auch ohne Verwendung des Hamiltonschen
Prinzips durch Differentiation zeigen.
74
KAPITEL 3. LAGRANGESCHE MECHANIK
3.6
Symmetrien und Erhaltungssätze
Im Kapitel 3.3 der Vorlesung des letzten Semesters haben wir eine elementare
Diskussion von Erhaltungssätzen (Energie, Gesamtimpuls und Gesamtdrehimpuls) innerhalb des Newtonschen Formalismus gegeben. Im Zusammenhang mit
der Bewegung eines Teilchens im zweidimensionalen Zentralpotential V (r) haben
wir in Kapitel 3.6 einen ersten Kontakt mit Erhaltungssätzen innerhalb der Lagrangeschen Mechanik gehabt. Die Lagrangefunktion ist in diesem Beispiel durch
m 2
L(r, φ, ṙ, φ̇) =
ṙ + r 2 φ̇2 − V (r)
2
gegeben. Aus der Beobachtung, daß L nicht explizit von φ abhängt – das Problem
also rotationssymmetrisch ist – folgt, wie im letzten Semester diskutiert, der
Flächensatz, welcher äquivalent zur Erhaltung des Drehimpulses ist. Hinter dieser
Beobachtung steckt ein allgemeines Prinzip, welches wir jetzt weiter untersuchen
wollen.
Hängt die Lagrangefunktion L von der verallgemeinerten Koordinate qi nicht
explizit ab, d.h. gilt ∂L/∂qi = 0, so nennt man diese Koordinate zyklisch. Allgemein bezeichnet man
∂L
pj =
∂ q̇j
als den zu qj kanonisch konjugierten Impuls.5 Ist die Koordinate qi zyklisch, so
folgt nach der Lagrangegleichung ṗi = 0 und damit pi = const.. Der zu einer
zyklischen Koordinate gehörende kanonisch konjugierte Impuls ist somit eine Erhaltungsgröße.
Da es bei der Lösung eines Problems offensichtlich vorteilhaft ist, möglichst
viele Erhaltungsgrößen zu kennen, stellt sich die Frage, ob es ein Prinzip gibt,
nach welchem man die Koordinaten wählen kann, um eine möglichst große Anzahl zyklischer Koordinaten zu erreichen. Beim Problem der Bewegung im zweidimensionalen Zentralpotential hatten wir die Koordinaten der Drehsymmetrie
angepaßt und so einen Erhaltungssatz gewonnen. Zusammenhänge zwischen Symmetrien und Erhaltungsgrößen haben wir ebenfalls im Kapitel 2.2 der aktuellen
Vorlesung diskutiert. Den allgemeinen Zusammenhang zwischen kontinuierlichen
Symmetrien und Erhaltungsgrößen liefert das Noethersche Theorem, welches wir
folgend herleiten wollen.
Noethersches Theorem I: Im Kapitel 3.4 haben wir diskutiert, daß die Lagrangegleichungen bei der Koordinatentransformation q̄i = q̄i (q; t) die Form behalten,
d.h. mit
d ∂L
∂L
=
, i = 1, 2, . . . , m
dt ∂ q̇i
∂qi
5
Weiter oben haben wir diese Größe recht allgemein als den verallgemeinerten Impuls bezeichnet.
3.6. SYMMETRIEN UND ERHALTUNGSSÄTZE
75
gilt ebenfalls
∂ L̄
d ∂ L̄
=
,
dt ∂ q̄˙i
∂ q̄i
i = 1, 2, . . . , m ,
˙ t) = L(q(q̄; t), q̇(q̄, q̄;
˙ t); t). Da die L und L̄ im Allgemeinen verschiewobei L̄(q̄, q̄;
dene funktionale Abhängigkeiten von den 2m + 1 Variablen haben, erfüllen die
q̄i im Allgemeinen andere Differentialgleichungen als die qi . Folgend betrachten
wir solche Koordinatentransformationen, für die die resultierenden Differentialgleichungen in den qi und q̄i dieselbe Form haben. Die Transformation soll zusätzlich differenzierbar von einem Parameter ǫ abhängen. Die wesentlichen Resultate
erhält man bei “infinitesimalen” Transformationen. Daher beschränken wir uns
auf solche der Form
q̄i = qi + ǫhi (q; t) ,
die sich durch Taylorentwicklung einer allgemeineren Form für |ǫ| ≪ 1 sowieso
ergeben. Damit folgt
!
X
dhi (q; t)
∂hi
∂hi
q̄˙i = q̇i + ǫ
q̇k +
.
= q̇i + ǫ
dt
∂qk
∂t
k
Aus den Überlegungen am Ende des Kapitels 3.5 zu der Frage, welche Wirkungsfunktionale zu gleichen Euler-Lagrange-Gleichungen führen, folgt, daß die Differentialgleichungen in den qi und q̄i sicherlich dann identisch sind, wenn
˙ t) = L(q̄, q̄;
˙ t) +
L̄(q̄, q̄;
d
G̃(q̄; t; ǫ) .
dt
Koordinatentransformationen, die diese Bedingung erfüllen, bezeichnet man als
Symmetrietransformationen.
Um diese Art der Transformationen zu illustrieren, betrachten wir das einfache
Beispiel eines effektiv eindimensionalen Problems mit einem Teilchen im äußeren
Potential V (x). Dann ergibt sich die Lagrangefunktion
L(x, ẋ) =
m 2
ẋ − V (x) .
2
Als Koordinatentransformation führen wir eine Translation mit h(x; t) = a aus
und bekommen x̄ = x + ǫa sowie x̄˙ = ẋ. Für die Lagrangefunktion folgt
m
˙ = x̄˙ 2 − V (x̄ − ǫa) = L̄(x̄, x̄)
˙ .
L(x, ẋ) = L(x̄ − ǫa, x̄)
2
Um zu klären, ob es sich bei der Transformation um eine Symmetrietransformation im obigen Sinne handelt, müssen wir die Differenz von L̄ und L (beides als
˙ untersuchen. Wir betrachten
Funktion von x̄ und x̄)
˙ − L(x̄, x̄)
˙ = V (x̄) − V (x̄ − ǫa) .
L̄(x̄, x̄)
76
KAPITEL 3. LAGRANGESCHE MECHANIK
Physikalisch ist es offensichtlich, daß die Translation das vorliegende Problem nur
dann äquivalent läßt, wenn die Kraft nicht vom Ort x abhängt, also homogen ist.
Wir beschränken uns daher auf Potentiale, die linear sind, d.h. V (x) = −F x,
mit F = const.. In diesem Fall gilt G̃(x̄; t; ǫ) = −ǫF at + const.. Damit ist unsere
Erwartung, daß die Translation für ein homogenes Kraftfeld eine Symmetrietransformation darstellt, bestätigt.
Im allgemeinen Fall liegt eine Symmetrietransformation vor, falls es eine Funktion G̃ mit (hier ausgedrückt durch die q und q̇)
L(q, q̇; t) − L(q + ǫh, q̇ + ǫḣ; t) −
d
G̃(q + ǫh; t; ǫ) = 0
dt
gibt. Dabei haben wir, analog zur “Multivariablen” q, h = (h1 , h2 , . . . , hm ) eingeführt. Aus dieser Gleichung können wir eine differentielle Relation herleiten,
indem wir beide Seiten nach ǫ differenzieren und anschließend ǫ = 0 setzen. Mit
d
d
G̃(q + ǫh; t; ǫ) = ǫ G(q + ǫh; t; ǫ)
dt
dt
folgt
m X
∂L
i=1
d
∂L
ḣi + G(q; t; 0) = 0 .
hi +
∂qi
∂ q̇i
dt
Wir eliminieren nun unter Verwendung der Lagrangegleichung ∂L/∂qi und erhalten so
" m
#
d X ∂L
hi + G(q; t; 0) = 0 ,
dt i=1 ∂ q̇i
bzw.
m
X
∂L
i=1
∂ q̇i
hi + G =
m
X
pi hi + G(q; t; 0) = const. ,
i=1
Das ist die mathematische Formulierung des Noetherschen Theorems: Jede einparametrige (hier Parameter ǫ) Schar von Symmetrietransformationen führt zu
einem Erhaltungssatz (einem “Bewegungsintegral”).
Für unser obiges einfaches Beispiel lautet der Erhaltungssatz (mẋ − F t)a =
const.. Für den Spezialfall der verschwindenden Kraft F = 0 entspricht dies der
Impulserhaltung. Wir werden später in allgemeinerem Kontext auf die Translation zurückkommen.
Wir wollen nun den Zusammenhang zwischen dem Noetherschen Theorem
und den uns bereits bekannten Erhaltungssätzen für ein N-Teilchen-System ohne
3.6. SYMMETRIEN UND ERHALTUNGSSÄTZE
77
Zwangsbedingungen herstellen. Dabei verwenden wir die kartesischen Koordinaten. Die Lagrangefunktion mit (im Allgemeinen zeitabhängigen) externen und
Paarkräften ist durch
#
"
N
N
X
X
m
1
i
vi,j (|~ri − ~rj |; t)
L(~r, ~r˙ ; t) =
~r˙i2 − Vi (~r; t) −
2
2 i6=j=1
i=1
gegeben. Dabei handelt es sich bei den Vektoren ohne Teilchen- und Komponentenindex wieder um die weiter oben eingeführten 3N-dimensionalen Vektoren.
Wir werden jetzt für verschiedene Funktionen ~h überprüfen, ob es sich bei der
durch sie gegebenen Transformation für unsere Lagrangefunktion um eine Symmetrietransformation handelt. Dabei verwenden wir die differentielle Form und
untersuchen, ob eine Funktion G(~r; t; 0) existiert, so daß
N h
i
X
~ ~r L · ~hi + ∇
~ ˙ L · ~h˙ i = − d G(~r; t; 0)
∇
i
~
ri
dt
i=1
gilt. Wir werden folgend
~ ~r L = −∇
~ ~r Vi −
F~i = ∇
i
i
X
j6=i
~ ~r vi,j
∇
i
verwenden. Setzen wir die obige Form der Lagrangefunktion ein, so folgt
N h
i
X
d
˙
F~i · ~hi + mi~r˙i · ~hi = − G(~r; t; 0) .
dt
i=1
Existiert ein entsprechendes G, so ergibt sich aus den allgemeinen Überlegungen
die Erhaltungsgröße
N
X
i=1
mi~r˙i · ~hi + G = const. .
1. Die räumliche Translation mit ~hi (~r; t) = ~a. Hierbei handelt es sich um eine
Symmetrietransformation, falls es ein G mit
~a ·
N
X
i=1
d
F~i = − G(~r; t; 0)
dt
gibt. Wegen “actio=reactio” tragen in der Summe über i nur die äußeren
Kräfte F~iext bei. Es muß also
~a ·
N
X
i=1
d
F~iext = ~a · F~ tot = − G(~r; t; 0) ,
dt
78
KAPITEL 3. LAGRANGESCHE MECHANIK
P
~ ext gelten. Für den Fall ohne
mit der gesamten äußeren Kraft F~ tot = N
i=1 Fi
äußere Kräfte mit F~ tot = 0 können wir G = 0 wählen und erhalten den
Erhaltungssatz
~a ·
N
X
mi~r˙i = const. .
i=1
Da ~a für F~ tot = 0 beliebig wählbar ist, folgt die Erhaltung des Gesamtimpulses
P~ =
N
X
mi~r˙i = const. .
i=1
Für ein (in jede Richtung) translationsinvariantes System ist somit der
Gesamtimpuls eine Erhaltungsgröße. Verschwinden die äußeren Potentiale nicht, aber es gilt
Vi (~r + ǫ~a; t) = Vi (~r; t)
für alle i = 1, 2, . . . , N und spezielle durch ~a gegebene Richtungen, so gilt
~a · F~ tot = 0. Damit ergibt sich unter der Wahl G = 0 die Erhaltungsgröße
~a · P~ = const. ,
d.h. die Projektion des Gesamtimpulses in die Richtung dieser ~a ist erhalten.
Ist ein System somit in bestimmte Richtungen translationsinvariant, so ist
der Gesamtimpuls in diese Richtungen erhalten. Sind alle äußeren Kraftfelder F~iext räumlich homogen, d.h. F~iext (~ri ; t) = F~iext (t), so ist die Bedingung
~a · F~ tot = −dG/dt für
Z t
F~ tot (t′ ) dt′
G(t) = −a ·
t0
erfüllt. Damit folgt das “Bewegungsintegral”
Z t
tot ′
′
~
~
~a · P (t) −
F (t ) dt = const. .
t0
Da ~a aufgrund der Homogenität der äußeren Kräfte beliebig ist, gilt auch
Z t
P~ (t) −
F~ tot (t′ ) dt′ = const. .
t0
Für den oben diskutierten Spezialfall mit N = 1 und d = 1 ergibt sich aus
diesem Ergebnis das obige Resultat.
3.6. SYMMETRIEN UND ERHALTUNGSSÄTZE
79
2. Die räumliche Drehung mit ~hi (~ri ; t) = D~ri . Dabei ist D eine zeitunabhängige 3 × 3-Matrix, sodaß B = 1 + ǫD eine Drehung mit BBT = 1 darstellt.
Daraus folgt, daß D + DT = 0 gelten muß und D eine antisymmetrische
~D
Matrix ist. Damit gibt es nach den Überlegungen von Seite 28 zu D ein φ
mit
~hi (~ri ; t) = φ
~ D × ~ri .
Wegen
h
i
˙
~ D × ~r˙i = 0
~r˙i · ~hi = ~r˙i · φ
entfällt der entsprechende Term bei der Suche nach einer Symmetrietransformation und wir suchen ein G mit
N
X
i=1
h
i
~ D × ~ri = − d G .
F~i · φ
dt
Aufgrund von “actio=reactio” tragen in der Summe wieder nur die äußeren
Kräfte bei. Wegen ~a · (~b × ~c) = ~b · (~c × ~a) folgt dann
~D ·
φ
N h
i
X
d
~
~ri × ∇~ri Vi = G .
dt
i=1
Eine beliebige räumliche Drehung ist somit eine Symmetrietransformation,
falls Vi = Vi (|~xi |), d.h. die äußeren Kräfte Zentralkräfte sind. Dann ver~ D und die obige Gleichung ist
schwindet die linke Seite für jedes beliebige φ
für G = 0 erfüllt. Der Erhaltungssatz lautet dann
N
X
i=1
~ D × ~ri ] = φ
~D ·
mi~r˙i · [φ
N
X
i=1
~D · L
~ = const. .
[~ri × p~i ] = φ
~ D beliebig ist, folgt die Erhaltung des Gesamtdrehimpulses L.
~ Liegen
Da φ
keine radialsymmetrischen Potentiale Vi vor, sondern solche, die nur eine
~ haben, für die also
spezielle Symmterieachse φ
~ × ~ri ])
Vi (~ri ) = Vi (~ri + ǫ[φ
~·L
~
~ auf die φgilt, so ist nur die Projektion des Gesamtdrehimpulses φ
Richtung erhalten. Ein Beispiel dafür ist ein Problem mit Zylindersymmetrie.
80
KAPITEL 3. LAGRANGESCHE MECHANIK
3. Die eigentliche Galileitransformation mit ~hi (~r; t) = ~v0 t. Aufgrund von “actio=reactio” tragen wieder nur die äußeren Kräfte bei und das Kriterium
für das Vorliegen einer Symmetrietransformation lautet
t~v0 · F~ tot + ~v0 ·
N
X
i=1
dG
mi~r˙i = t~v0 · F~ tot + ~v0 · P~ (t) = −
.
dt
Sind die äußeren Kräfte homogen, so wird das Kriterium durch die Funktion
Z t h
i tot ′ ′
′
~
~
G(t) = −~v0 ·
F (t ) t + P (t ) dt′
t0
erfüllt. Da aufgrund der Homogenität der Kraft ~v0 beliebig ist, ist die zugehörige Erhaltungsgröße durch
Z th
i
tot ′ ′
′
~
~
~
P (t)t −
F (t ) t + P (t ) dt′ = const.
t0
gegeben. Sollten die Massen mi zeitunabhängig sein (was wir ja hier meist
~
angenommen haben), so gilt P~ (t) = MdR/dt,
mit dem Schwerpunktsvektor
~
R(t). Damit folgt
Z t
~
~
P (t)t −
F~ tot (t′ ) t′ dt′ − M R(t)
= const. .
t0
Man bezeichnet den Erhaltungssatz als den Schwerpunktsatz. Für F~ tot = 0
(was P~ (t) = P~ = const. impliziert) folgt
P~
~
R(t)
=
t + const. = V~0 t + const. ,
M
also die Schwerpunktsbewegung im Fall ohne äußere Kräfte. Diese folgt auch
sofort durch Integration der Gesamtimpulserhaltung, so daß man aus der
Invarianz unter der eigentlichen Galileitransformation für F~ tot = 0 keine
zusätzliche Information gewinnt.
Mit diesen Überlegungen haben wir bis auf die Energieerhaltung alle früher
diskutierten Erhaltungssätze aus der durch das Noethersche Theorem gegebenen
Beziehung zwischen den Symmetrien (genauer den Symmetrietransformationen)
eines Systems und Erhaltungsgrößen hergeleitet. Von den bereits oben eingeführten Galileitransformationen haben wir die Translation der Zeit noch nicht betrachtet. Das liegt daran, daß wir bisher nur Symmetrietransformationen der
Form q̄i = qi + ǫhi (q; t) betrachtet haben, bei der die verallgemeinerten Koordinaten transformiert werden, jedoch nicht die Zeitvariable. Wir werden später
auch diese Situation betrachtet – was uns dann auch auf die Energieerhaltung
3.6. SYMMETRIEN UND ERHALTUNGSSÄTZE
81
führt–, wollen aber zunächst einen Weg diskutieren, auf dem sich die Energieerhaltung im Rahmen der Lagrangeschen Formulierung der Mechanik sehr schnell
ergibt. Er führt uns auf das Konzept der Hamiltonschen Funktion.
Die Hamiltonfunktion: Wir betrachten eine Lagrangefunktion für ein N-Teilchensystem der Form L(q(t), q̇(t); t) = T (q(t), q̇(t); t) − V (q(t); t). Differentiation
nach der Zeit liefert
X ∂L
∂L
∂L
dL
=
q̇i +
q̈i +
dt
∂qi
∂ q̇i
∂t
i
X
∂L
∂L
d ∂L
q̇i +
q̈i +
=
dt ∂ q̇i
∂ q̇i
∂t
i
d X ∂L
∂L
=
q̇i +
,
(3.8)
dt i ∂ q̇i
∂t
wobei wir beim Übergang zur zweiten Zeile die Lagrangegleichung verwendet
haben. Wir definieren nun die Hamiltonfunktion H als
H=
X
i
pi q̇i − L =
X ∂L
i
∂ q̇i
q̇i − L .
Damit folgt aus Gl. (3.8)
dH
∂L
=−
.
dt
∂t
Hängt L nicht explizit von der Zeit ab, so ist damit H eine Erhaltungsgröße
∂L
= 0 ⇒ H = const. .
∂t
In den beiden obigen Beispielen – Doppelpendel (Seiten 56-58) und Perle auf dem
rotierendem Draht (Seite 66) – hängt L nicht explizit von der Zeit ab und H ist
eine Erhaltungsgröße.
Wir nehmen nun an, daß die kinetische Energie die Form
T =
1X
q̇i Ai,j (q)q̇j ,
2 i,j
mit Ai,j = Aj,i hat. Wie wir schon anhand diverser Beispiele gesehen haben, ist
dieses die generische Form für die kinetische Energie bei holonom-skleronomen
Zwangsbedingungen. Genauer kann man sich überlegen, daß die kinetische Energie diese Form hat, wenn die Transformation ~ri (q1 , . . . , qm ; t) nicht explizit von
der Zeit abhängt. Das Doppelpendel von Seiten 56-58 fällt in diese Klasse, die
82
KAPITEL 3. LAGRANGESCHE MECHANIK
Perle auf dem rotierendem Draht von Seite 66 nicht. Ist die kinetische Energie
eine quadratische Form in den q̇i , so folgt für den konjugierten Impuls
pl =
X
∂T
=
Al,j q̇j .
∂ q̇l
j
P
Es gilt also i pi q̇i = 2T . Für die angenommene Form der kinetischen Energie
ergibt sich so
H =T +V ,
d.h. die Hamiltonfunktion ist durch die Gesamtenergie gegeben. Somit haben wir
für eine nicht explizit zeitabhängige Lagrangefunktion, deren kinetischer Teil die
obige Form hat (holonom-skleronome Zwangsbedingungen), die Energieerhaltung
gezeigt (z.B. für das Doppelpendel). Im Beispiel der Perle auf dem Draht ist H
zwar erhalten, aber H ist nicht gleich der Energie, die ja offensichtlich nicht erhalten ist. Liegt eine Transformation ~ri (q1 , . . . , qm ; t) vor, die nicht explizit von
der Zeit abhängt, so ist H die Energie. Sollte jedoch das Potential explizit von
der Zeit abhängen, so ist H (d.h. die Energie) nicht erhalten.
Noethersches Theorem II: Die Überlegungen über Erhaltungsgrößen und
Symmetrietransformationen abschließend, diskutieren wir noch Transformationen, in denen auch die Zeit transformiert wird. Wie oben betrachten wir infinitesimale Transformationen
τ = t + ǫh0 (t) ,
q̄i (τ ) = qi (t) + ǫhi (q; t)
= qi (t(τ )) + ǫhi (q(t(τ )); t(τ )) .
Wir werden im Folgenden die Ableitung nach τ mit einem Strich bezeichnen. Wie
man durch Verallgemeinerung der Rechnung von Seite 64 sieht, erfüllen die q̄i (τ )
die Lagrangegleichung
d ∂ L̄
∂ L̄
=
,
′
dτ ∂ q̄i
∂ q̄i
mit L̄(q̄, q̄ ′ ; τ ) = (dt/dτ ) L(q(t), q̇(t); t). Die Differentialgleichungen für die q̄i (τ )
haben sicher wieder dieselbe Form wie die für die qi (t), falls
L̄(q̄(τ ), q̄ ′ (τ ); τ ) = L(q̄(τ ), q̄ ′ (τ ); τ ) +
d
G̃(q̄(τ ); τ ) .
dτ
Also muß
d
dt
L(q(t), q̇(t); t) = L(q̄(τ ), q̄ ′ (τ ); τ ) + G̃(q̄(τ ); τ )
dτ
dτ
3.6. SYMMETRIEN UND ERHALTUNGSSÄTZE
83
gelten. Differentiation nach ǫ und anschließendes Nullsetzen von ǫ liefert mit
G̃ = ǫG und
dτ
dt
= 1 + ǫḣ0 ⇒
= 1 − ǫḣ0 + O(ǫ2 )
dt
dτ
sowie
dt
+ ǫh′i
dτ h
i
= q̇i (t) 1 − ǫḣ0 + ǫḣi + O(ǫ2 )
q̄i′ (τ ) = q̇i
das differentielle Kriterium
−Lḣ0 =
X ∂L
i
∂L
∂L
dG
hi +
(ḣi − ḣ0 q̇i ) +
h0 +
.
∂qi
∂ q̇i
∂t
dt
Dabei haben wir beim Übergang zur zweiten Zeile angenommen, daß das Kriterium erfüllt ist und haben die Lagrangegleichung sowie ∂L/∂t = −dH/dt verwendet. Die Terme, in denen h0 und ḣ0 auftreten, lassen sich als Zeitableitung von
Hh0 schreiben und man erhält schließlich
X ∂L
i
∂ q̇i
hi − Hh0 + G = const.
als Verallgemeinerung des Noetherschen Theorems.
Als Anwendung betrachten wir die Zeittranslation mit h0 (t) = t0 und hi = 0
für alle anderen i. Das differentielle Kriterium lautet dann
t0
∂L
dG
=−
.
∂t
dt
Diese Relation ist offensichtlich erfüllt, falls ∂L/∂t die zeitliche Ableitung einer
Funktion von q und t ist. Sei z.B.
X mi
L=
~r˙i2 − V (~r1 , . . . , ~rN ) + L0 (t)
2
i
mit zeitunabhängigen mi und zeitunbabhängigem V , soPist ∂L/∂t = L̇0 (t) und
das Kriterium ist für G(t) = −t0 [L0 (t) + c] erfüllt. Mit i ~pi · ~r˙i = 2T folgt
H = T + V + L0 (t)
und der Erhaltungssatz Ht0 − G = const. lautet bei
T + V = const. ,
84
KAPITEL 3. LAGRANGESCHE MECHANIK
d.h. die Gesamtenergie ist (im Gegensatz zu H) erhalten. Für L0 = 0 ergibt sich
das Ergebnis aus dem letzten Abschnitt.
Bevor wir uns mit der hamiltonschen Formulierung der Mechanik beschäftigen
wollen, werden wir uns im nächsten Kapitel kurz Gedanken über (kleine) gekoppelte Schwingungen machen. Wir werden dabei (erneut) beleuchten, warum die
Dynamik gekoppelter harmonischer Oszillatoren eine zentrale Rolle in der klassischen Mechanik spielt. Weiterhin wollen wir anhand des Beispiels der transversen Schwingungen einer Saite die Kontinuumsmechanik kennen lernen. Neben
der Mechanik von Punktteilchen und der von starren Körpern spielt sie eine sehr
wichtige Rolle. So fällt z.B. die Dynamik strömender Flüssigkeiten und Gase,
aber auch die Verformungsdynamik von Festkörpern (z.B. Metallen), in diesen
Bereich.6
6
Diese Aussage gilt, wenn den Längenskalen auf denen man die Dynamik der Flüssigkeiten,
Gase und Festkörper betrachtet, nicht erlaubt, die mikroskopischen Konstituenten (die Moleküle
und Atome) aufzulösen.
Kapitel 4
Gekoppelte Schwingungen und
schwingende Saiten
4.1
Kleine gekoppelte Schwingungen von mehreren Freiheitsgraden
Wir betrachten ein System mit m Freiheitsgraden, welches durch die verallgemeinerten Koordinaten q = q1 , q2 , . . . , qm beschrieben wird. Das zugrundeliegende System von N Massepunkten sei durch den 3N-dimensionalen Ortsvektor ~r = ~r(q)
beschrieben, wobei keine explizite Zeitabhängigkeit in der Transformation von q
nach ~r auftritt. Weiterhin seien die Kräfte durch ein zeitunabhängiges Potential
gegeben. Die Lagrangefunktion für diese Problem lautet
m
1X
L(q, q̇) =
q̇i Ai,j (q)q̇j − V (q) = T (q, q̇) − V (q) ,
2 i,j=1
wobei
Ai,j (q) =
N
X
α=1
mα
∂~rα ∂~rα
·
.
∂qi ∂qj
Die Matrix A ist symmetrisch, d.h.P
Ai,j = Aj,i . Wie auf Seite 80 gezeigt, folgt für
den zu qi konjugierten Impuls pi = j Ai,j q̇j und damit für die Lagrangegleichung
∂T
∂V
d X
Ai,j (q)q̇j −
=−
,
dt j
∂qi
∂qi
i = 1, 2, . . . , m
(4.1)
Für allgemeine Potentiale ist dieses ein System von m gekoppelten, nicht-linearen
Differentialgleichungen zweiter Ordnung, das in dieser Allgemeinheit meist nur
numerisch gelöst werden kann. Wir wollen nun untersuchen, ob es trotzdem Situationen gibt, die man geschlossen analytisch lösen kann.
85
86
KAPITEL 4. SCHWINGUNGEN UND SAITEN
Die einfachste Möglichkeit ist dabei das Auftreten von Situationen, in denen
ein statisches Gleichgewicht vorliegt und alle qi zeitunabhängig sind. Insbesondere
gilt dann für alle Zeiten q̇i = 0 = q̈i , i = 1, 2, . . . , m. In Gl. (4.1) verschwindet
damit die linke Seite und Gleiches muß für die rechte Seite gelten. Damit kann
ein statisches Gleichgewicht nur in Punkten q 0 mit
∂V = 0 , i = 1, 2, . . . , m
∂qi 0
q
vorliegen, d.h. in Punkten, in denen die verallgemeinerte Kraft verschwindet und
das Potential stationär wird. Wir betrachten nun das Potential in der Nähe eines
dieser Punkte. In jede der m durch qi gegebenen Richtungen (d.h. als Funktion
von qi bei festgehaltenen übrigen Variablen) kann ein lokales Minimum, ein Sattelpunkt, oder ein lokales Maximum vorliegen. Hat V (q) in q 0 ein lokales Minimum,
so liegt ein lokales Minimum in jede der Richtungen vor und der Gleichgewichtspunkt heißt stabil. Andernfalls ist der Gleichgewichtspunkt instabil.
Wir betrachten nun das Verhalten der Bewegung in der Nähe eines Gleichgewichtspunktes q 0 . Ähnliche Betrachtungen haben wir bereits mehrfach im Laufe
der letztsemestrigen und der aktuellen Vorlesung angestellt. Um die Notation zu
vereinfachen, wählen wir die Koordinaten so, daß q 0 = 0 gilt. Mit dieser Wahl des
Ursprungs betrachten wir den Fall, daß die qi kleine “Auslenkungen” sind. Wir linearisieren dann die Bewegungsgleichungen oder äquivalent dazu betrachten wir
in L nur Terme, die höchstens quadratisch in den Auslenkungen und den Geschwindigkeiten q̇i sind (Talyorentwicklung).1 Da T bereits bilinear in den q̇i ist,
können wir in Ai,j (q) die Variable q durch ihren Wert am Gleichgewichtspunkt
ersetzen Ai,j = Ai,j (0). Für das Potential führen wir eine (mehrdimensionale)
Taylorentwicklung bis zu Termen zweiter Ordnung durch
m
m
X
∂V 1 X ∂ 2 V V (q) = V (0) +
qi +
qi qj + O(q 3 ) .
∂qi
2
∂qi ∂qj
q=0
i=1
i,j=1
q=0
Da q = 0 ein Gleichgewichtspunkt sein soll, verschwindet der lineare Term.
Zusätzlich verschieben wir das Potential, bzw. den Energienullpunkt um den konstanten Wert V (0).2 Damit gilt
V (q) =
m
1X
qi Bi,j qj + O(q 3 ) ,
2 i,j=1
mir der symmetrischen Marix B
Bi,j
1
∂ 2 V = Bj,i .
=
∂qi ∂qj q=0
Sollten die q̇i nicht “klein” sein, dann würde die Bewegung nicht “in der Nähe” von q = 0
bleiben.
2
Das Potential bzw. der Energienullpunkt ist immer nur bis auf eine Konstante eindeutig
definiert, so daß solch eine Verschiebung jederzeit möglich ist.
87
4.1. KLEINE SCHWINGUNGEN
Vernachlässigen wir Terme dritter Ordnung und höher in q und q̇, so ist die
Lagrangefunktion die Summe zweier quadratischer Formen
m
m
1X
1X
q̇i Ai,j q̇j −
qi Bi,j qj
L =
2 i,j=1
2 i,j=1
1 ˙
1
(4.2)
~q · A~q˙ − ~q · B~q ,
2
2
P
wobei wir die Vektoren ~q = i qi~ei mit orthonormalen Basisvektoren ~ei definiert
haben (rein mathematisch, kein Bezug zu kartesischen Koordinaten). Die kinetische Energie ist eine positive Größe (für ~q˙ 6= 0). Daher muß die quadratische
Form T positiv definit sein. Die aus dem genäherten L folgenden linearisierten
Lagrangegleichungen sind
=
m
X
j=1
Ai,j q̈j = −
m
X
Bi,j qj
j=1
bzw.
A~q¨ = −B~q .
Diese Gleichungen folgen auch direkt durch Taylorentwickeln der ursprünglichen
Lagrangegleichungen.
Mathematisch betrachtet stellen die Bewegungsgleichungen jetzt ein System
linearer gekoppelter Differentialgleichungen zweiter Ordnung dar. Diese Gleichungen entkoppeln ohne weitere Rechnungen (Transformationen) nur dann, wenn die
beiden Matrizen A und B diagonal sind. Ein Beispiel für Differentialgleichungssysteme des vorliegenden Typs haben wir zu Beginn des Kapitels 2.15 der Vorlesung des letzten Semesters (siehe Seite 101 und folgende des Skripts) und einer
zugehörigen Übungsaufgabe kennen gelernt. Dort haben wir die Bewegung zweier
durch hookesche Federn (daher bereits lineare Gleichungen) gekoppelter Massen
betrachtet, in dem A diagonal ist, B jedoch nicht. In diesem Beispiel haben wir
exemplarisch untersucht, wie man die möglichen Bewegungsformen besser verstehen und das Gleichungssystem analytisch lösen kann (mit Hilfe eines Ansatzes
mit der Zeitabhängigkeit exp (iωt)), wenn man eine Hauptachsentransformation
für die Matrix B ausführt (das Eigenwertproblem löst). Wir sind dabei auf die
Normalfrequenzen und die Eigenmoden der Bewegung gestoßen. Die allgemeine
Lösung konnte man dann als Linearkombination der Bewegung in den Eigenmoden schreiben. Als weiteres Beispiel dient das in Kapitel 3.2 der aktuellen
Vorlesung diskutierte Doppelpendel mit qi = φi , i = 1, 2 (siehe Seite 56 und folgende). Die stabile Ruhelage ist durch φ1 = 0 = φ2 gegeben. Nach Entwickeln der
Ausdrücke für die kinetische und potentielle Energie (T∗ und V∗ auf Seite 58) bis
zu Termen der Ordnung φ2 und Verschieben des Nullpunktes der Energie ergibt
88
KAPITEL 4. SCHWINGUNGEN UND SAITEN
sich
A=
l12 (m1 + m2 ) l1 l2 m2
l1 l2 m2
l22 m2
B=
l1 (m1 + m2 )g
0
0
l2 m2 g
und
und B ist (bereits) diagonal. Wir wollen nun sehen, wie man im allgemeinen Fall
mit einer beliebigen symmetrischen Matrix BBasis und einer positiv definiten,
symmetrischen Matrix3 A vorgehen kann.
Die obigen Überlegungen sollten Motivation genug sein, zunächst das verallgemeinerte Eigenwertproblem
B~v = λA~v
(4.3)
zu betrachten. Da A eine positiv definite symmetrische Matrix ist, gibt es m
paarweise orthonormale Eigenvektoren ~ai mit A~ai = ai~ai , mit den4 Eigenwerten
ai > 0 (siehe Kapitel 2.13
Pder Vorlesung des letzten Semesters). Jeder Vektor
ai schreiben. Damit können wir Matrizen A±1/2
w
~ ∈ Rm läßt sich als w
~= m
i=1 ci~
definieren, für die
A
±1/2
w
~=
m
X
±1/2
ci ai
~ai
i=1
gilt. Man kann leicht nachrechnen, daß A1/2 A1/2 = A und A−1/2 A1/2 = 1 gilt.
Mit
~v = A−1/2 V~
folgt so für Gl. (4.3)
CV~ = λ1V~
(4.4)
mit C = A−1/2 BA−1/2 . Mit A und B symmetrisch, ist auch C symmetrisch
und wir haben das obige verallgemeinerte Eigenwertproblem Gl. (4.3) auf ein
gewöhnliches Gl. (4.4) zurückgeführt.5 Wir nehmen nun an, daß wir die paarweise orthonormalen Eigenvektoren V~i und Eigenwerte λi zu C bestimmt haben.
3
Eine symmetrische Matrix, die auf eine positiv definite quadratische Form führt.
In der Basis aus Eigenvektoren ist A diagonal. Damit ist es offensichtlich, daß für w·A
~ w
~ >0
für alle Vektoren w
~ ∈ Rm /{0} alle Eigenwerte ai positiv sein müssen.
5
Es ist wichtig zu bemerken, daß das verallgemeinerte Eigenwertproblem Gl. (4.3) im Allgemeinen nicht durch Multiplikation mit A−1 von links zu einem gewöhnlichen Eigenwertproblem
mit einer symmetrischen Matrix wird. Dies liegt daran, daß A−1 B im Allgemeinen nicht symmetrisch ist, selbst wenn A und B symmetrisch sind!
4
89
4.1. KLEINE SCHWINGUNGEN
Damit können wir die Eigenvektoren des verallgemeinerten Eigenwertproblems
~vi = A−1/2 V~i berechnen.6 Da A−1/2 eine lineare Abbildung mit positiven Eigenwerten darstellt, bilden die ~vi einen Satz m linear unabhängiger Vektoren, also
eine Basis. Es gilt
V~i · CV~j = δi,j λi
A1/2~vi · A−1/2 BA−1/2 A1/2~vj = δi,j λi
⇒
und damit
~vi · B~vj = δi,j λi .
(4.5)
Ebenfalls gilt
V~i · V~j = δi,j
⇒
A1/2~vi · A1/2~vj = ~vi · A~vj = δi,j .
Entwickelt man nun einen beliebigen Vektor ~q ∈ Rm nach den ~vi , ~q =
mit q̄i = ~vi · A~q = ~q · A~vi , so folgt
X
X
q̄˙i2 ,
q̄˙j ~vj · A~vi q̄˙i =
~q˙ · A~q˙ =
~q · B~q =
i,j
i
X
X
i,j
q̄j ~vj · B~vi q̄i =
(4.6)
Pm
vi
i=1 q̄i~
λi q̄i2 .
i
Diese Relationen werden wir gleich zur Lösung unseres mechanischen Problems
verwenden.
Zur praktischen Bestimmung der λi und ~vi sucht man die Nullstellen des
verallgemeinerten charakteristischen Polynoms det(B−λA) und löst anschließend
das homogene Gleichungssystem (B − λi A)~vi = 0. Die Lösung legt die ~vi nur bis
auf einen i-abhängigen Faktor fest.7 Diese m Faktoren können so gewählt werden,
daß die obigen Gleichungen (4.5) bzw. (4.6) gelten.
Wir verwenden nun das Gelernte, um unser mechanisches Problem gekoppelter Schwingungen mit kleiner Amplitude weiter zu untersuchen. Gehen wir in der
Lagrangefunktion Gl. (4.2) von den qi zu den neuen verallgemeinerten Koordinaten q̄i = ~vi · A~q über, so gilt in diesen Normalkoordinaten
m
L=
1X 2
q̄˙i − λi q̄i2
2 i=1
und die zugehörigen Lagrangegleichungen
q̄¨i = −λi qi ,
i = 1, 2, . . . , m
~i dimensionslos sind, während die Einträge
Beachten sie, daß die orthonormalen Vektoren V
der ~vi über A−1/2 dimensionsbehaftet sind.
7
Wir weisen noch einmal darauf hin, daß die Komponenten der ~vi im Allgemeinen dimensionsbehaftet sind.
6
90
KAPITEL 4. SCHWINGUNGEN UND SAITEN
entkoppeln. Bei der Lösung der entkoppelten Bewegungsgleichungen müssen wir
die Fälle λi > 0, λi = 0 und λi < 0 unterscheiden. Die allgemeinen Lösungen
lauten
λi = ωi2 > 0 : q̄i (t) = c1 cos (ωi t) + c2 sin (ωi t) ,
λi = 0 : q̄i (t) = c1 + c2 t ,
λi = −ωi2 < 0 : q̄i (t) = c1 cosh (ki t) + c2 sinh (ki t) ,
mit den (i-abhängigen) Konstanten c1 und c2 . Der Fall λi > 0, für alle i =
1, 2, . . . , m, in dem alle Normalkoordinaten q̄i eine periodische Bewegung vollführen,
ist von besonderem Interesse. In diesem Fall heißen die ωi die Eigenfrequenzen
(oder Normalfrequenzen) der Bewegung. Die beiden oben angesprochenen Beispiele (System aus zwei Massen und drei hookeschen Federn und gekoppelte Pendel
bei kleiner Auslenkung) fallen in diese Klasse. Für beliebige Anfangsbedingungen
qi (0) und q̇i (0) lautet die Lösung dann
q~(t) =
m
X
i=1
m X
1 ˙
~q(0) · A~vi sin (ωi t) ~vi .
qi (t)~ei =
(~q(0) · A~vi ) cos (ωi t) +
ω
i
i=1
Die Lösung unseres mechanischen Problems kann somit als Überlagerung von
Eigenschwingungen geschrieben werden. Falls die Eigenfrequenzen nicht in einem rationalen Verhältnis zueinander stehen, resultiert jedoch keine periodische
Bewegung.
Es bietet sich an, die Diskussion der kleinen, gekoppelten Schwingungen als
Startpunkt für eine tiefere Analyse der bereits im letzten Semester eher oberflächlich behandelten nicht-linearen Systeme und der chaotischen Bewegung zu
nutzen. Aus Zeitgründen können wir hier leider nicht darauf eingehen und verweisen auf die entsprechende Literatur. Ebenfalls böte es sich an, noch einmal
zeitlich getriebene Systeme zu untersuchen (z.B. die parametrische Resonanz).
Auch darauf müssen wir hier aus Zeitgründen verzichten.
4.2
Schwingende Saiten
Als kurzen Ausflug in die Kontinuumsmechanik wollen wir hier sehr knapp die
Bewegung einer gespannten Saite betrachten. Diese Überlegungen werden uns auf
die Wellengleichung führen, die im Kontext der elektromagnetischen Wellen eine
wichtige Rolle in der Theorievorlesung des nächsten Semesters spielen wird. Wir
nehmen an, daß die Saite in der Ruhelage entlang der x-Achse liegt. Die Position
der Saite zu einer festen Zeit können wir nun durch die Auslenkung u(x) von der
x-Achse (also in die y-Richtung) beschreiben. Wir gehen davon aus, daß die Auslenkung klein ist (was das genau bedeutet; siehe später). Die Bedingung, daß die
Saite endlich ist und an den Enden z.B. eingespannt ist, werden wir erst später in
91
4.2. SCHWINGENDE SAITEN
unsere Überlegungen einbeziehen. Eine verwandte diskrete Beschreibung würde
darin bestehen, die Saite in endliche Segmente zu zerlegen und jedes durch einen
Massepunkt zu beschreiben. In diesem Fall würde die kontinuierliche Auslenkfunktion u(x) in einen Satz diskreter Punkte ui , i = 1, 2, . . . , n, übergehen. Die
Bewegung ui (t) würde dann gemäß der Newtonschen oder Lagrangeschen Mechanik und nach Spezifikation der Kräfte durch einen Satz gekoppelter gewöhnlicher
Differentialgleichungen (siehe z.B. den letzten Abschnitt) beschrieben. Wie wir
sehen werden, wird aus diesem System im Kontinuumsfall ui (t) → u(x, t) eine
partielle Differentialgleichung, welche partielle Ableitungen nach t und x enthält.
Um die Bewegungsgleichung für die Saitenbewegung zu bestimmen, betrachten wir ein kleines Segment der Saite, welches zwischen x und x + ∆x liegt. Zur
Vereinfachung vernachlässigen wir die Gravitation und nehmen an, daß die Auslenkung für alle x und t so klein ist, daß die Saite fast parallel zur x-Achse bleibt.
Damit wird die Länge der Saite fast nicht verändert und die Saitenspannung T
bleibt für alle x und t die gleiche. Die Kraft F~ auf ein Segment der Saite ist
damit durch die Summe der Spannungskräfte durch die benachbarten Segmente
gegeben.
x+∆x
x
x
φ+∆φ
φ
Entsprechend der Skizze gilt für die Komponente der Kraft F1 in x-Richtung
F1 = T cos (φ + ∆φ) − T cos φ ,
wobei φ der Winkel zwischen der x-Achse und der Saite ist. Da φ und φ+∆φ beide
sehr klein sind, können wir den Cosinus entwickeln und bekommen zu führender
Ordnung F1 = 0. Die Kraft in x-Richtung verschwindet also, was konsistent mit
der Annahme ist, daß die Bewegung nur in y-Richtung stattfindet. Für die Kraft
F2 in y-Richtung gilt
F2 = T sin (φ + ∆φ) − T sin φ ≈ T ∆φ cos φ
∂φ
≈ T ∆x .
∂x
Die auftretende Ableitung ist eine partielle, da φ = φ(x, t). Nutzen wir noch
einmal aus, daß φ klein sein soll, so gilt φ = ∂u/∂x und es ergibt sich
∂2u
F2 ≈ T 2 ∆x .
∂x
92
KAPITEL 4. SCHWINGUNGEN UND SAITEN
Nach Newtons zweitem Gesetz gilt F2 = ma2 , mit der Beschleunigung a2 in yRichtung. Diese ist durch a2 = ∂ 2 u/∂t2 gegeben. Für die Masse m des Saitensegments gilt m = µ∆x, mit der Massedichte µ. Damit folgt die Bewegungsgleichung
2
∂2u
2 ∂ u
=
c
,
∂t2
∂x2
mit
c2 =
T
.
µ
Man nennt diese Gleichung die eindimensionale Wellengleichung , da ihre Lösung
eine Welle entlang der Saite beschreibt (siehe unten). Sie ist eine partielle Differentialgleichung. Die Größe c hat die Dimension einer Geschwindigkeit und
beschreibt die Geschwindigkeit, mit der sich die Welle ausbreitet (siehe unten).
Die Wellengleichung und ihr dreidimensionales Analogon
∂2u
~ 2 u = c2 ∆u ,
= c2 ∇
∂t2
beschreibt die Bewegung einer Vielzahl von Wellen, wie z.B. Schallwellen und
elektromagnetische Wellen.
Wir werden nun zeigen, daß es zwei fundamentale Lösungen der Wellengleichung gibt: Störungen u(x, t) , die sich forminvariant von links nach rechts oder
anders herum ausbreiten. Um dieses zu sehen, führen wir die Variablen v = x−ct
und w = x + ct ein. Wie sie in einer Übungsaufgabe zeigen werden, gilt dann
∂ ∂u
=0
∂v ∂w
(4.7)
mit u(x, t) = u(x(v, w), t(v, w)). Um diese Gleichung zu lösen, führen wir h =
∂u/∂w ein, so daß
∂h
=0.
∂v
Damit hängt h nicht von v (jedoch von w) ab und es folgt
∂u
= h(w) .
∂w
Für jedes v können wir diese integrieren und erhalten
Z w
u=
h(w ′ )dw ′ + f (v) = g(w) + f (v) .
w0
4.2. SCHWINGENDE SAITEN
93
Durch Einsetzen in Gl. (4.7) kann man sofort verifizieren, daß diese Form die Differentialgleichung erfüllt. Damit hat die allgemeine Lösung8 der Wellengleichung
die Form
u(x, t) = f (x − ct) + g(x + ct) ,
wobei g und f (im Sinne des Physikers) beliebige Funktionen sind. Um besser zu
verstehen, welche Form die Lösung hat, betrachten wir zunächst den Fall g = 0.
Dann gilt
u(x, t) = f (x − ct) .
Zur Zeit t = 0 ist u(x, 0) = f (x). Die Tatsache, daß u nur eine Funktion von
x − ct ist, bedeutet, daß sich die Störung ausgehend von der Zeit t = 0 mit der
Geschwindigkeit c nach rechts ausbreitet (jedenfalls dann, wenn c > 0, was wir
so wählen können), die Form aber invariant ist. Analog ergibt sich, daß für f = 0
die Störung forminvariant nach links propagiert. Die allgemeine Lösung ist eine
Superposition einer nach rechts und einer nach links laufenden Welle. Um eine
spezielle Lösung zu bestimmen, müssen wir u(x, 0) und die Geschwindigkeit
∂u(x, t) ∂t t=0
vorgeben, wobei wir ohne Einschränkung der Allgemeinheit angenommen haben,
daß t = 0 unserer Anfangszeit entspricht.
Eine besondere Lösung ist
u(x, t) = A sin [k(x − ct)] = A sin (kx − ωt) ,
wobei A und k beliebige relle Konstanten sind und ω = kc gilt. Diese Lösung
beschreibt eine sinusförmige Welle, die sich nach rechts ausbreitet und eine Amplitude A, Wellenlänge λ = 2π/k und Kreisfrequenz ω hat. Eine analoge sich
nach links ausbreitende Welle ist durch
u(x, t) = A sin [k(x + ct)] = A sin (kx + ωt)
beschrieben. Die Summe dieser beiden Lösungen
u(x, t) = A sin (kx − ωt) + A sin (kx + ωt) = 2A sin (kx) cos (ωt)
ist ebenfalls eine Lösung der Wellengleichung und hat die bemerkenswerte Eigenschaft, daß sie nicht propagiert. An jedem festen Punkt x bewegt sich die
Saite gemäß cos (ωt) mit der Amplitude 2A sin (kx) auf und ab. Speziell an den
8
Wir gehen hier nicht weiter auf die recht komplexe Lösungstheorie partieller Differentialgleichungen ein.
94
KAPITEL 4. SCHWINGUNGEN UND SAITEN
so genannten Knoten, den Orten, an denen sin (kx) = 0 (also bei xn = nπ/k mit
n ∈ Z) , bewegt sich die Saite gar nicht. Man nennt diese Lösung eine stehende
Welle.
Bisher sind wir implizit davon ausgegangen, daß unsere Saite unendlich lang
ist, oder zumindest so lang, daß Randeffekte keine Rolle spielen. In Gegenwart
von Enden ergeben sich zusätzliche Randbedingungen. Abhängig von der Natur
der Enden (z.B. eingespannt oder frei) ergeben sich unterschiedliche Randbedingungen. Hier werden wir nur den Fall betrachten, daß die Saite der Länge L an
beiden Enden eingespannt ist und damit u(0, t) = 0 = u(L, t) für alle Zeiten t
gelten muß. Man überzeugt sich leicht davon, daß
u(x, t) = A sin (kx) cos (ωt)
mit
k = kn = n
π
,
L
ω = ωn = cn
π
,
L
n∈Z
eine Lösung ist, die die Randbedingungen erfüllt. In einer Übungsaufgabe werden
sie dieses Problem genauer analysieren.
Nach diesem kurzen Exkurs in die Kontinuumsmechanik wollen wir nun auf
die Hamiltonsche Beschreibung der Mechanik kommen.
Kapitel 5
Hamiltonsche Mechanik
Die Lagrangeschen Bewegungsgleichungen bilden für ein holonomes System mit
m Freiheitsgraden einen Satz von m (gekoppelten) Differentialgleichungen zweiter
Ordnung. Wie wir bereits im Mathematikteil der Vorlesung des letzten Semesters
gesehen haben, ist es immer möglich aus diesem Differentialgleichungssystem eines erster Ordnung, aber mit 2m Gleichungen, zu machen, was jedoch nicht notwendigerweise ein Vorteil sein muß. Wie wir folgend sehen werden, geschieht
dieser Prozess beim Übergang von den Lagrangeschen zu den Hamiltonschen Bewegungsgleichungen auf eine wohldefinierte, kanonische (also mustergültige) Art.
Erst wenn wir die spezifische Form der Bewegungsgleichungen hergeleitet haben,
wird klar werden, wieso die 2m Gleichungen erster Ordnung eine vorteilhafte
mathematische Beschreibung darstellen. In der Hamiltonschen Mechanik steht
die Hamiltonfunktion im Fokus, die wir bereits in den Überlegungen zur Energieerhaltung (bzw. Erhaltungsgrößen allgemein) im Lagrangeschen Formalismus
kennen gelernt haben. Wie wir gesehen haben, entspricht die Hamiltonfunktion im Fall von holonom-skleronomer Zwangsbedingungen der Gesamtenergie des
betrachteten Systems, hat also im Gegensatz zur Lagrangefunktion eine klare
physikalische Bedeutung und ist für zeitunabhängige Potentiale eine Erhaltungsgröße.1 Wie die Lagrangesche Formulierung ist auch die Hamiltonsche äquivalent
zum Newtonschen Zugang, jedoch ist sie noch flexibler im Hinblick auf die Wahl
der Koordinaten als der Lagrangeformalismus. Zwangsbedingungen können analog zum Lagrangeformalismus eingebaut werden. Der Hamiltonsche Zugang ist
ebenfalls ideal zur Behandlung weiterer Erhaltungsgrößen. Wir werden diese und
weitere Vorteile der Hamiltonschen Formulierung im Laufe der Diskussion genauer kennen lernen und beleuchten.
Neben den eher technischen Vorteilen ermöglicht uns die Hamiltonsche Mechanik eine andere Darstellung der Struktur der klassischen Mechanik. Von der
Hamiltonschen Formulierung führt ein (direkter) Weg zur Quantenmechanik und
sie liefert die Grundlage der statistischen Mechanik, was weitere Begründungen
1
Dies könnte man bereits als einen der Vorteile der Hamiltonschen Mechanik gegenüber der
Lagrangeschen Mechanik bezeichnen.
95
96
KAPITEL 5. HAMILTONSCHE MECHANIK
dafür liefert, daß es wichtig ist auch den Hamiltonformalismus kennen zu lernen.
5.1
Variable, Bewegungsgleichungen und zyklische Koordinaten
Da wir die Hamiltonfunktion ja bereits im Rahmen des Lagrangeformalismus
eingeführt haben, sollte offensichtlich sein, daß dieser einen guten Startpunkt
bildet. Wir hatten die m kanonischen Impulse als
pi =
∂L
∂ q̇i
definiert, wobei L = L(q, q̇; t) gilt. Wir werden nun annehmen,2 daß man diese
Gleichung nach den m q̇i auflösen kann und so
q̇i = q̇i (q, p; t)
erhält. Dann definiert man die Hamiltonfunktion – eine Funktion der m qi , der
m pi und der Zeit t, als
H(q, p; t) =
X
i
pi q̇i (q, p; t) − L(q, q̇(q, p; t), t) .
Man bezeichnet diese Art der Variablentransformation als Legendretransformation.3 Die Hamiltonfunktion ist eine Funktion der m verallgemeinerten Koordinaten qi und der m verallgemeinerten (kanonischen) Impulse pi (sowie eventuell der
Zeit). Den Raum der 2m Variablen (q, p) bezeichnet man als den Phasenraum.
Diesen Begriff haben wir bereits im letzten Semester kennen gelernt. In den dortigen eindimensionalen Beispielen haben wir die Ebene (x, ẋ) als den Phasenraum
bezeichnet. Ein Punkt im Phasenraum charakterisiert den Zustand des mechanischen Systems eindeutig.
Wir wollen nun die fundamentalen Bewegungsgleichungen bestimmen. Dazu
2
In der Praxis stellt dies keine starke Einschränkung dar.
Im Tutorium wurde die Legendretransformation in einem allgemeineren Kontext diskutiert.
Sie spielt speziell in der Thermodynamik eine sehr zentrale Rolle.
3
5.1. VARIABLE, BEWEGUNGSGLEICHUNGEN UND. . .
97
betrachten wir
∂H
∂qj
X ∂ q̇i
∂L
∂L ∂ q̇i
−
=
pi
−
∂qj
∂ q̇i ∂qj
∂qj
i
X
∂L
∂ q̇i
∂ q̇i
−
− pi
=
pi
∂qj
∂qj
∂qj
i
∂L
∂qj
d ∂L
= −
dt ∂ q̇j
d
= − pj
dt
= −ṗj .
= −
Weiterhin gilt
∂H
∂pj
X ∂ q̇i
∂L ∂ q̇i
= q̇j +
pi
−
∂p
∂ q̇i ∂pj
j
i
= q̇j .
Wir haben damit die Hamiltonschen Gleichungen
q̇j =
∂H
,
∂pj
ṗj = −
∂H
∂qj
bestimmt. Sie bilden einen Satz von 2m (gekoppelten) Differentialgleichungen erster Ordnung für die Variablen qi und pi der Hamiltonfunktion. Man nennt diese
Gleichungen auch die kanonischen Gleichungen. Die Lösung dieser Bewegungsgleichungen liefert die Phasenraumtrajektorie. Fassen wir die Phasenraumvariable
~ zusammen (Spaltenvektor, der
qi und pi zu einem 2m dimensionalen Vektor X
sich durch Untereinanderschreiben der qi und pi ergibt), so haben die Bewegungsgleichungen die einfache Form
~˙ = ~h(X;
~ t) .
X
~ indiziert einen eindeutigen Punkt im Phasenraum und bezeichnet
Jeder Punkt X
einen eindeutigen Satz von Anfangsbedingungen unseres Systems. Das System
von Differentialgleichungen, dessen Lösung direkt den Phasenraumfluß liefert, hat
für nicht explizit zeitabhängige H die besonders einfache Struktur (Ableitung von
~ = (Funktion von X).
~ Dies ist eine Standardform, die in der mathematischen
X)
Literatur häufig untersucht wurde.
Wie wir weiter unten sehen werden, erlauben die Bewegungsgleichungen Koordinatentransformationen – die sogenannten kanonischen Transformationen –
98
KAPITEL 5. HAMILTONSCHE MECHANIK
die die Form der Bewegungsgleichungen invariant lassen und die nicht nur die
verallgeinerten Orte involviert (wie im Lagrangeformalismus), sondern den ge~ Es wird also Transformationen der Form (siehe
samten Phasenraumvektor X.
unten)
Q = Q(q, p; t) ,
P = P (q, p; t)
geben. Dies ist ein großer Unterschied und entscheidener Vorteil gegenüber dem
Lagrangeformalismus. Er schafft eine größtmögliche Flexibilität, welche Variable
man verallgemeinerte Koordinate und welche verallgemeinerten Impuls nennt.
Die beiden Begriffe verschwimmen.
Als Beispiel zum Übergang vom Lagrange- zum Hamiltonformalismus betrachten wir die Lagrangefunktion (holonom-skleronome Zwangsbedingungen)
L= T −V =
1X
q̇i Ai,j (q)q̇j − V (q; t) ,
2 i,j
wobei Ai,j (q) = Aj,i (q). Der kanonischen Impuls ist somit
X
pi =
Ai,j (q)q̇j .
j
Da die kinetische Energie positiv ist, gilt detA > 0, d.h. das Inverse der Matrix
A−1 existiert und es folgt
X
A−1
q̇i =
i,j (q)pj .
j
Wie wir bereits wissen, ist die Hamiltonfunktion in diesem Fall gleich der Energie
H =T +V ,
wobei T aber durch die pi und qi ausgedrückt werden muß
1X
1X
T =
q̇i Ai,j (q)q̇j =
pi A−1
i,j (q)pj .
2 i,j
2 i,j
Im einfachsten Fall eines Teilchens der Masse m (d.h. A = m) in einer Dimension
gilt
T =
p2
.
2m
Ergänzen wir diese kinetische Energie durch ein harmonisches Potential (z.B.
Federschwingung)
1
V = mω02 q 2 ,
2
5.1. VARIABLE, BEWEGUNGSGLEICHUNGEN UND. . .
99
mit der Auslenkung q = x aus der Ruhelage, so folgt die Hamiltonfunktion des
eindimensionalen harmonischen Oszillators
H=
p2
1
+ mω02 q 2 .
2m 2
Die Hamiltonfunktion ist gleich der Gesamtenergie E und eine Erhaltungsgröße.
Die Bewegungsgleichungen lauten
p
∂H
=
⇒ ṗ = mq̈ ,
∂p
m
∂H
= −mω02 q
ṗ = −
∂q
q̇ =
und führen kombiniert auf die uns bekannte Schwingungsgleichung q̈ + ω02 q = 0.
Wie wir bereits wissen, ist H eine Erhaltungsgröße, falls L nicht explizit von
der Zeit abhängt, da
∂L
dH
=−
.
dt
∂t
Diese Beziehung läßt sich auch unter Verwendung der Hamiltonschen Gleichungen
herleiten
X ∂H
dH
∂H
∂H
=
q̇i +
ṗi +
dt
∂qi
∂pi
∂t
i
X
∂L
=
[−ṗi q̇i + q̇i ṗi ] −
∂t
i
= −
∂L
.
∂t
Im Übergang von der ersten zur zweiten Zeile haben wir dabei neben der Bewegungsgleichung ausgenutzt, daß die Ableitung nach der expliziten t-Abhängigkeit
von H durch das negative dieser von L gegeben ist. Verwenden wir nur die erste
Zeile und die Bewegungsgleichung so folgt
∂H
dH
=
.
dt
∂t
Einer der entscheidenen Vorteile des Hamiltonschen Formalismus gegenüber
dem Lagrangeschen wird klar, wenn man zyklische Koordinaten hat. Es sei daran
erinnert, daß man eine Koordinate qi als zyklisch bezeichnet, wenn sie in L nicht
auftritt. In diesem Fall ist der zugehörige kanonische Impuls pi eine Erhaltungsgröße. Aufgrund der Hamiltonschen Bewegungsgleichung
0 = ṗi = −
∂H
∂qi
100
KAPITEL 5. HAMILTONSCHE MECHANIK
und auch die Hamiltonfunktion ist unabhängig von der zyklichen Variablen qi .
Erscheint umgekehrt eine zyklische Variable nicht in H, so ist der zugehörige
kanonische Impuls erhalten. Der Vorteil des Hamiltonschen Zugangs besteht nun
darin, daß man eine zyklische Kooridnate und ihren zugehörigen Impuls in gewissem Sinne ignorieren kann. In der Lagrangefunktion tritt die verallgemeinerte
Geschwindigkeit q̇i zu einer zyklischen Koordinate qi im Allgemeinen noch auf
und wird eine komplexe Zeitabhängigkeit haben, also keine Erhaltungsgröße sein.
Dagegen kann man in der Hamiltonfunktion den Impuls pi zur zyklischen Koordinate qi auf einen konstanten Wert αi setzen und in diesem Sinne das System
um einen Freiheitsgrad von m nach m − 1 reduzieren. Die Konstante αi wird
dann später durch die Anfangsbedingungen festgelegt. Die Zeitabhängigkeit der
zyklischen Variable bestimmt man durch Lösen der Bewegungsgleichung
q̇i =
∂H
.
∂αi
Um dieses Vorgehen zu konkretisieren, nehmen wir an, daß wir die Koordinaten
so umsortiert haben, daß die zyklische Koordinate qm ist. Es gilt also
H = H(q1 , . . . , qm−1 , p1 , . . . , pm−1 , αm ; t)
und man hat nur noch ein Problem mit m − 1 Freiheitsgraden.4 Wenn jetzt
q1 (t), . . . , qm−1 (t), p1 (t), . . . , pm−1 (t) eine Lösung des Problems ist, ergibt sich αm
aus den Anfangsbedingungen und qm (t) durch Integrieren von
∂H
(q1 , . . . , qm−1 , p1 , . . . , pm ; t)
.
q̇m =
∂pm
pm =αm
Sind alle Koordinaten zyklisch, d.h. H = H(p; t), so folgt pi = αi = const. für
alle i. Man gewinnt die αi aus den Anfangsbedingungen (die αi sind Integrationskonstanten) und die qi (t) durch Integrieren von
∂H
q̇i =
= ωi (t) .
(p1 , . . . , pm ; t)
∂pi
p=α
Diese Gleichungen lassen sich leicht lösen
Z t
ωi (t′ ) dt′ + ci ,
qi (t) =
t0
4
Im Routhschen Formalismus trägt man der Tatsache Rechnung, daß der Übergang vom
Lagrangeschen zum Hamiltonschen Formalismus speziell für zyklische Koordinaten vorteilhaft
ist. Man führt dabei die Legendretransformation von den q̇i zu den pi nur für die zu zyklischen
Koordinaten gehörenden Indizes aus und endet somit bei einem teilweise Hamiltonschen und
teilweise Lagrangeschen Zugang. Wir werden diese Überlegungen hier nicht weiter verfolgen
und verweisen auf die Literatur.
101
5.2. DIE POISSONKLAMMERN
mit den Konstanten ci . Hängt H zusätzlich nicht explizit von der Zeit ab, so folgt
ωi (t) = ωi = const. und damit
qi (t) = ωi t + c̃i ,
mit einer anderen Konstanten c̃i . Man könnte geneigt sein, diese Situation (alle
Koordinaten sind zyklisch) als rein akademisch anzusehen, denn es wird bei einer ersten Wahl der verallgemeinerten Koordinaten kaum der Fall sein, daß alle
diese zyklisch sind. Wenn wir jedoch später die bereits angesprochenen allgemeinen Koordinatentransformationen auf dem Phasenraum einführen, so könnte es
gelingen, daß alle neuen Koordinaten in der Tat zyklisch sind.5
In einem nächsten Schritt wollen wir das Konzept der Poissonklammern einführen.
5.2
Die Poissonklammern
Die zeitliche Änderung einer Funktion F (q(t), p(t); t) der kanonischen Variablen6
läßt sich mit Hilfe der Hamiltonschen Gleichungen wie folgt schreiben
X ∂F
dF
∂F
∂F
=
q̇i +
ṗi +
dt
∂qi
∂pi
∂t
i
X ∂F ∂H
∂F
∂F ∂H
+
−
=
∂qi ∂pi
∂pi ∂qi
∂t
i
= {F, H}q,p +
∂F
,
∂t
(5.1)
wobei wir die sogenannten Poissonklammern
X ∂F ∂G ∂F ∂G {F, G}q,p =
−
∂qi ∂pi ∂pi ∂qi
i
für zwei Funktionen F und G der kanonischen Koordinaten definiert haben. Im
Folgenden werden wir den Index, der auf den Satz der Koordinaten (q, p) hinweist
meist, weglassen und auf die Abhängigkeit vom Koordinatensatz später eingehen.
Gemäß dieser Definition gilt (wie man direkt nachrechnet)
1. {F, G} = −{G, F }
(Antisymmetrie)
2. {c1 F1 +c2 F2 , G} = c1 {F1 , G}+c2 {F2 , G} mit beliebigen Konstanten c1 , c2
(Linearität)
5
Man verschiebt dabei die Schwierigkeit des Lösens von Systemen von Differentialgleichungen auf das algebraische Problem des Findens der richtigen Transformation. Die richtige Transformation zu finden ist dabei keineswegs trivial.
6
Dabei sollen q(t) und p(t) der Bewegungsgleichung genügen.
102
KAPITEL 5. HAMILTONSCHE MECHANIK
3. {c, F } = 0 für beliebige Konstante c
4. {F1 , {F2 , F3 }} + {F2 , {F3 , F1 }} + {F3 , {F1 , F2 }} = 0
(Jacobi-Identität)
5. {F, G1 G2 } = {F, G1 }G2 + G1 {F, G2}
Eine wichtige Rolle in der Hamiltonschen Theorie spielen die mit den kanonischen
Variablen gebildeten Poissonklammern, die sogenannten fundamentalen Poissonklammern
X ∂qk ∂pl ∂qk ∂pl X
−
=
δk,i δl,i = δk,l
{qk , pl } =
∂qi ∂pi
∂pi ∂qi
i
i
und (ist gemäß der Definition trivial)
{qk , ql } = 0 ,
{pk , pl } = 0 .
Wählt man jetzt in Gl. (5.1) F = qi bzw. F = pi , so folgt
q̇i = {qi , H} ,
ṗi = {pi , H} .
Die Bewegungsgleichungen lassen sich somit elegant mit Hilfe der Poissonklammern schreiben.
Ein wichtiger Punkt ist nun, daß man die fünf Rechenregeln der Poissonklammern und die fundamentalen Poissonklammern bei Rechnungen verwenden kann,
ohne direkten Bezug zur Definition der Poissonklammern (also zu ihrer konkreten
Realisierung) zu machen. Wir wollen das anhand des Aufstellens der Bewegungsgleichungen für den eindimensionalen harmonischen Oszillator illustrieren. Für
diesen gilt
H=
p2
1
+ cq 2 ,
2m 2
mit q = x. Damit folgt
q̇ = {q, H}
p2
1
1
1
= {q,
+ cq 2 } =
{q, p2 } + c{q, q 2}
2m 2
2m
2
1
1
[p{q, p} + {q, p}p] + c [q{q, q} + {q, q}q]
=
2m
2
p
=
m
sowie
ṗ = {p, H}
1
1
1
p2
+ cq 2 } =
{p, p2 } + c{p, q 2 }
= {p,
2m 2
2m
2
1
1
[p{p, p} + {p, p}p] + c [q{p, q} + {p, q}q]
=
2m
2
= −cq .
103
5.2. DIE POISSONKLAMMERN
Dies sind natürlich die bekannten Bewegungsgleichungen für das vorliegende Problem. Bei der Ableitung haben wir aber nirgends differenziert oder von der Definition der Poissonklammern Gebrauch gemacht. Sind die fünf Rechenregeln der
Poissonklammern, die fundamentalen Poissonklammern sowie dF/dt = {F, H} +
∂F
also anders als hier realisiert, so würde das gleiche Ergebnis folgen. Genau dies
∂t
ist in der Quantenmechanik der Fall. Dort werden die physikalischen Observablen
Ort und Impuls zu linearen Operatoren auf einem Vektorraum mit speziellen Eigenschaften (einem sogenannten Hilbertraum). Das Klammersymbol (mit allen
seinen obigen Eigenschaften) ist für zwei solcher Operatoren Â und B̂ durch
{Â, B̂} =
1
1
(ÂB̂ − B̂ Â) = [Â, B̂]
i~
i~
realisiert. Man nennt [. . . , . . .] den Kommutator. Die Konstante ~ = h/(2π) ist
durch das Plancksche Wirkungsquantum h = 6.626 · 10−34Js gegeben. Die abgeleiteten Bewegungsgleichungen für den klassischen harmonischen Oszillator gelten
dann völlig analog in der Quantenmechanik für den Orts- und den Impulsoperator.
Ebenfalls völlig analog gilt die Bewegungsgleichung (5.1) für einen allgemeinen
Operator Â(t)
1
∂ Â
dÂ
= [Â, Ĥ] +
,
dt
i~
∂t
(5.2)
wobei Ĥ der Hamiltonoperator ist, der sich nach einem bestimmten Konstruktionsprinzip (Korrespondenzprinzip; siehe die Theorie–III–Vorlesung) aus der Hamiltonfunktion ergibt.
Aus Gl. (5.1) schließt man sofort, daß F (q(t), p(t); t) eine Erhaltungsgröße ist,
wenn
{F, H} +
∂F
=0
∂t
bzw. für nicht explizit von der Zeit abhängige F
{F, H} = 0 .
Insbesondere gilt
dH
∂H
∂H
= {H, H} +
=
,
dt
∂t
∂t
da nach der Definition der Poissonklammern trivialerweise {H, H} = 0. Die Beobachtung, daß die totale Ableitung der Hamiltonfunktion nach der Zeit gleich
der partiellen ist, ist uns schon begegnet. Wir können somit (erneut) schließen,
daß H genau dann eine Erhaltungsgröße ist, wenn H nicht explizit von der Zeit
abhängt.
104
KAPITEL 5. HAMILTONSCHE MECHANIK
Ebenfalls ohne explizite Verwendung der Definitionsgleichung des Klammersymbols kann man zeigen, daß
d
{F, G} =
dt
lim ({F (t + ∆t), G(t + ∆t)} − {F (t), G(t)}) /∆t
F (t + ∆t) − F (t)
= lim
, G(t + ∆t)
∆t→0
∆t
G(t + ∆t) − G(t)
+ F (t),
∆t
dG
dF
,
, G + F,
=
dt
dt
∆t→0
wobei wir die Linearität der Poissonklammern verwendet haben. Aus dieser Überlegung folgt das Poissonsche Theorem, welches besagt, daß mit F und G auch
{F, G} eine Erhaltungsgröße ist. Dabei ist jedoch keinesfalls klar, daß {F, G}
eine neue Erhaltungsgröße (ein neues Bewegungsintegral) liefert. Es kann z.B.
vorkommen, daß man {F, G} = c + f (F, G) mit einer Konstanten c und der
Funktion f schreiben kann. Wenn F und G Erhaltungsgrößen sind, ist die rechte
Seite trivialerweise eine Erhaltungsgröße.
Wir betrachten nun zwei jeweils kanonisch konjugierte Variablensätze (q, p)
und (Q, P ) = (Q(q, p), P (q, p)), d.h. für beide Variablensätze sollen jeweils die
Hamiltonschen Bewegungsgleichungen gelten, wobei man bezüglich (q, p) die Funktion H(p, q; t) und bezüglich (Q, P ) die Funktion
H̄(Q, P ; t) = H(q(Q, P ), p(Q, P ); t)
zu nehmen hat. Die Transformation zwischen den Variablensätzen hänge an dieser
Stelle nicht explizit von der Zeit ab.7 Die Variablen (q, p) erfüllen die fundamentalen Poissonklammern (bezüglich (q, p)). Wir werden nun zeigen, daß in diesem Fall
auch die (Q, P ) die fundamentalen Poissonklammern (bezüglich (q, p)) erfüllen8
{Qk , Pl }q,p = δk,l ,
7
{Qk , Ql }q,p = 0 , {Pk , Pl }q,p = 0 .
Im nächsten Abschnitt betrachten wir die Transformationen genauer.
Die kanonischen Variablen (Q, P ) erfüllen natürlich die fundamentalen Poissonklammern
bezüglich (Q, P ).
8
5.3. KANONISCHE TRANSFORMATIONEN
105
Wir betrachten dazu
Q̇i =
=
=
=
X
m m X
∂Qi
∂Qi ∂H
d
∂Qi
∂Qi ∂H
Qi (q(t), p(t)) =
q̇k +
ṗk =
−
dt
∂qk
∂pk
∂qk ∂pk
∂pk ∂qk
k=1
k=1
X ∂Qi ∂ H̄ ∂Ql ∂ H̄ ∂Pl
∂Qi ∂ H̄ ∂Ql ∂ H̄ ∂Pl
−
+
+
∂qk ∂Ql ∂pk
∂Pl ∂pk
∂pk ∂Ql ∂qk
∂Pl ∂qk
k,l
X ∂ H̄ ∂Qi ∂Ql ∂Qi ∂Ql ∂ H̄ ∂Qi ∂Pl ∂Qi ∂Pl +
−
−
∂Ql ∂qk ∂pk
∂pk ∂qk
∂Pl ∂qk ∂pk
∂pk ∂qk
k,l
X
−Ṗl {Qi , Ql }p,q + Q̇l {Qi , Pl }p,q .
l
Ein Vergleich der beiden Seiten zeigt, daß
{Qi , Pl }q,p = δi,l , {Qk , Ql }q,p = 0 .
Die fehlende Gleichung folgt analog, wenn man Ṗi betrachtet. Man kann direkt
nachrechnen (tun sie es!!), daß für die obigen beiden Variablenpaare alle Poissonklammern invariant sind, d.h.
{F, G}Q,P = {F, G}q,p
gilt. Wie oben schon angedeutet, kann man somit die Indizes an den Klammern
weglassen, wenn man sich nur auf kanonische Variablen beschränkt.9
5.3
Kanonische Transformationen
In diesem Abschnitt werden wir die bereits oben angesprochenen Transformationen auf dem Phasenraum betrachten, die es erlauben, die verallgemeinerten
Koordinaten und kanonischen Impulse zu vermischen. Dabei sollen die Hamiltonschen Bewegungsgleichungen natürlich invariant bleiben. Wir wollen zunächst
daran erinnern, daß man im Lagrangeformalismus mit Transformationen der
Form qi → q̄i (q; t) zu tun hat, die die Bewegungsgleichungen invariant lassen
(andere Wahl der verallgemeinerten Koordinaten). Wie wir im Abschnitt über
das Hamiltonsche Prinzip weiterhin gesehen haben, sind die Lagrangeschen Bewegungsgleichungen, die sich aus L und cL + dG(q; t)/dt, mit einer beliebigen
Funktion G(q; t), ergeben, identisch.
Wir wollen zunächst überprüfen, in wie weit sich die zweite Invarianz auf
den Hamiltonformalismus übertragen läßt und betrachten daher ein modifiziertes
9
Die Bewegungsgleichung hat also für beide Variablensätze dieselbe Form. Wir betonen
noch einmal, daß wir uns bisher auf Transformationen zwischen kanonischen Variablenpaaren
beschränkt haben, die nicht explizit von der Zeit abhängen.
106
KAPITEL 5. HAMILTONSCHE MECHANIK
Hamiltonsches Prinzip. Wie wir oben gezeigt haben, wird das Wirkungsfunktional
S=
Z
t2
L(q(t), q̇(t); t) dt
t1
bei festgehaltenem q(t1 ) und q(t2 ) entlang der physikalischen Bahn extremal.
Kurz schreibt man dafür oft
δS = 0 .
Formal ersetzen wir nun im Ausdruck für das Wirkunsgfunktional L durch die
Hamiltonfunktion
#
Z t2 "X
m
S=
pj q̇j − H(q, p; t) dt .
t1
j=1
Da nun die p gleichberechtigten Variablen neben den q sind, hat die Variation der
Bahn in einem Extremalprinzip nun im Phasenraum zu erfolgen. Wir betrachten
daher Phasenraumtrajektorien, die ein wenig von der physikalischen Trajektorie
abweichen. In Verallgemeinerung der Überlegungen von Seite 68 betrachten wir
qj (t; α) = qj (t) + ηj (t; α) , pj (t; α) = pj (t) + γj (t; α)
mit
ηj (t1 ; α) = 0 = ηj (t2 ; α) ∀α ,
ηj (t; α = 0) = 0 ;
γj (t; α = 0) = 0
und der physikalischen Trajektorie (q(t), p(t)). Dabei sollen die ηj (t; α) und γj (t; α)
für α → 0 mindestens linear verschwinden. Es ist wichtig zu beachten, daß die
γj (t; α) im Gegensatz zu den ηj (t; α) bei t1 und t2 nicht verschwinden müssen.
Wir betrachten
# Z t2 "X
m
d
dS =0.
pi (t; α)q̇i (t; α) − H(q(t; α), p(t; α); t) dt
=
dα α=0
dα t1
i=1
α=0
Völlig analoge Schritte wie bei der Herleitung des Hamiltonschen Prinzips führen
uns dann auf die Hamiltonschen Bewegungsgleichungen.
Aus dieser Konstruktion der Hamiltonschen Bewegungsgleichungen wird damit sofort klar, daß auch diese (wie die Lagrangeschen Bewegungsgleichungen)
invariant gegenüber Koordinatentransformationen qi → q̄i (q; t) sind, wenn man
den verallgemeinerten Impuls
pi =
∂L
∂ L̄
→ p̄i =
∂ q̇i
∂ q̄˙i
107
5.3. KANONISCHE TRANSFORMATIONEN
˙ t) = L(q(q̄; t), q̇(q̄, q̄;
˙ t); t). Wie wir sehen
geeignet mit transformiert, wobei L̄(q̄, q̄;
werden (und bereits mehrfach angedeutet haben), kann man im Hamiltonformalismus jedoch allgemeinere Transformation betrachten, die die Bewegungsgleichungen invariant lassen.
Wir wollen als nächstes zeigen, daß auch die Hamiltonschen Bewegunsgleichungen invariant unter L → L̃ = L + dG(q; t)/dt sind. Wir definieren den zu L̃
gehörenden verallgemeinerten Impuls
∂L
∂ d
∂ L̃
=
+
G(q; t)
∂ q̇j
∂ q̇j
∂ q̇j dt
"
#
m
X
∂L
∂G(q; t)
∂
∂
=
+
q̇i
G(q; t) +
∂ q̇j
∂ q̇j ∂t
∂qi
i=1
p̄j =
= pj +
∂G(q; t)
.
∂qj
(5.3)
Mit diesem konstruieren wir die neue Hamitonfunktion (q̄j = qj )
X
X
dG
∂G(q; t)
q̇j − L −
H̄ =
p̄j q̄˙j − L̃ =
pj +
∂qj
dt
j
j
= H+
X ∂G(q; t)
j
= H−
∂qj
q̇j −
∂
G(q; t) .
∂t
X ∂G(q; t)
i
∂qi
q̇i −
∂
G(q; t)
∂t
Mit der neuen Hamiltonfunktion H̄ = H(q = q̄, p(q, p̄; t); t) − ∂G/∂t, mit
pj = p̄j −
∂G(q; t)
,
∂qj
verifizieren wir jetzt die kanonischen Bewegungsgleichungen
∂ H̄
∂ q̄j
∂ H̄
∂H X ∂H ∂pi
∂2G
=
+
−
∂qj
∂qj
∂pi ∂qj
∂qj ∂t
i
X ∂2G
∂2G
−
= −ṗj −
q̇i
∂qj ∂qi ∂qj ∂t
i
=
= −ṗj −
d ∂
G(q; t) .
dt ∂qj
Mit Gl. (5.3) folgt also
∂ H̄
= −p̄˙j .
∂ q̄j
108
KAPITEL 5. HAMILTONSCHE MECHANIK
Es gilt ebenfalls
∂ H̄
∂ p̄j
=
X ∂H ∂pi
∂H
=
= q̇j
∂pi ∂ p̄j
∂pj
i
und damit
∂ H̄
= q̄˙j .
∂ p̄j
Die Bewegungsgleichungen sind somit invariant.
Ganz nebenbei haben wir in den letzten Überlegungen gezeigt, daß für einen
gegebenen Satz von kanonischen Variablen pj , qj auch
Qj = qj , Pj = pj +
∂
G(q; t)
∂qj
(5.4)
für beliebiges G(q; t) kanonisch konjugierte Variablen sind. Die Vorgabe von qj
legt somit die dazu kanonisch konjugierten Impulse nicht eindeutig fest.
Da im Hamiltonformalismus neben den qj die pj eine gleichberechtigte Rolle
spielen, ist die Klasse der Transformationen, die die Bewegungsgleichungen invariant, lassen sehr viel größer als im Lagrangeformalismus.10 Wir betrachten also
allgemeine Transformationen
Q = Q(q, p; t) ,
P = P (q, p; t) .
Interessant für uns sind nur solche Transformationen, die die Bewegungsgleichungen invariant lassen. Wir definieren daher die Klasse der kanonischen Transformationen, für die es eine Funktion H̄ = H̄(Q, P ; t) gibt, so daß (j = 1, 2, . . . , m)
Q̇j =
∂ H̄
∂ H̄
, Ṗj = −
∂Pj
∂Qj
gilt. Wie das H̄ aus dem H hervorgeht, spielt dabei keine Rolle. Gilt
H̄(Q, P ; t) = H(q(Q, P ; t), p(Q, P ; t); t) ,
so wollen wir die Transformation kanonisch im engeren Sinn nennen. Bereits oben
haben wir gezeigt, daß Transformationen des Typs L → L̃ = L + dG(q; t)/dt
bzw. H → H̄ = H(q = q̄, p(q, p̄; t); t) − ∂G(q; t)/∂t, sowie die Koordinatentransformationen qi → q̄i (q; t), pi = ∂L/∂ q̇i → p̄i = ∂ L̄/∂ q̄˙i kanonisch sind. Um an
einem Beispiel klar zu machen, daß man durch eine kanonische Transformation
10
Ein Unterraum dieser Transformationen ergibt sich wie zu Beginn dieses Abschnitts beschrieben direkt aus den erlaubten Transformationen im Lagrangeformalismus.
109
5.3. KANONISCHE TRANSFORMATIONEN
die Konzepte verallgemeinerte Koordinate und kanonischer Impuls vermischen
kann, betrachten wir den “extremen” Fall der Transformation
Qj = Qj (q, p; t) = −pj ,
Pj = Pj (q, p; t) = qj .
Bei gegebenem H(q, p; t) folgt dann
H̄(Q, P ; t) = H(P, −Q; t)
und
∂ H̄
∂Pj
∂ H̄
∂Qj
∂H(P, −Q; t)
∂H(q, p; t)
=
= −ṗj = Q̇j ,
∂Pj
∂qj
∂H(P, −Q; t)
∂H(q, p; t)
=
=−
= −q̇j = −Ṗj .
∂Qj
∂pj
=
Damit ist die obige Transformation auf dem Phasenraum kanonisch im engeren
Sinne. Wir sehen, daß die Konzepte verallgemeinerte Koordinate und kanonischer
Impuls im Hamiltonformalismus ihre klare Bedeutung verlieren und die Qj und Pj
völlig gleichberechtigte Variablen sind. Dieses Beispiel deutet weiterhin die große
Flexibilität der Wahl der Variablen im Hamiltonformalismus an. Es macht erneut plausibel, daß es gelingen könnte, alle Qj nach einer geeigneten kanonischen
Transformation zu zyklischen Koordinaten zu machen. In der Hamilton-JacobiTheorie wird diese Überlegung zu einer Lösungsmethode ausgebaut.
Wir wollen als nächstes das modifizierte Hamiltonsche Prinzip dazu nutzen
zu zeigen, daß eine Transformation Q = Q(q, p; t), P = P (q, p; t) kanonisch ist,
falls
m
X
j=1
pj q̇j − H =
m
X
j=1
Pj Q̇j − H̄ +
dF1
,
dt
(5.5)
wobei F1 = F1 (q, Q; t) eine beliebige (hinreichend harmlose) Funktion ist.11 Man
nennt F1 die Erzeugende der Transformation. Wir zeigen zunächst, daß F1 die
Transformation und H̄ eindeutig festlegt. Dazu betrachten wir
∂F1
∂F1
dF1 X ∂F1
q̇j +
Q̇j +
=
.
dt
∂q
∂Q
∂t
j
j
j
Auflösen von Gl. (5.5) liefert
m
dF1 X pj q̇j − Pj Q̇j + H̄ − H .
=
dt
j=1
11
Es sei darauf hingewiesen, daß nicht alle kanonischen Transformationen mit Hilfe einer
Erzeugenden geschrieben werden können.
110
KAPITEL 5. HAMILTONSCHE MECHANIK
Ein Vergleich zeigt, daß
pj =
∂F1
∂F1
∂F1
, Pj = −
, H̄ = H +
.
∂qj
∂Qj
∂t
(5.6)
Sind nun q, p und F1 vorgegeben, so löst man
pj =
∂F1
= pj (q, Q; t)
∂qj
nach den Qj auf und erhält Qj = Qj (q, p; t). Dieses Ergebnis setzen wir in
Pj = −
∂F1 (q, Q; t)
∂Qj
ein und erhalten so Pj = Pj (q, p; t). Aufgrund der dritten Relation in Gl. (5.6) ist
auch H̄ eindeutig bestimmt. Als nächstes zeigen wir, daß die durch F1 erzeugte
Transformation kanonisch ist. Dazu betrachten wir
!
!
Z t2 X
Z t2 X
m
m
dF1
Pj Q̇j − H̄ +
dt
S =
pj q̇j − H dt =
dt
t1
t
1
j=1
j=1
!
Z t2 X
m
=
Pj Q̇j − H̄ dt + F1 (q(t2 ), Q(t2 ); t2 ) − F1 (q(t1 ), Q(t1 ); t1 ) .
t1
j=1
In der zweiten Zeile müssen wir nun nach den Q und P variieren. Verwenden wir
zusätzlich die zweite der Relationen aus Gl. (5.6), so folgen aus dem modifizierten
Hamiltonschen Prinzip die Hamiltonschen Bewegungsgleichungen (nachrechnen!)
für die Q und P (aus H̄). Damit ist die durch F1 erzeugte Transformation kanonisch.
Mit Hilfe von Legendretransformationen können wir weitere Typen von Erzeugenden finden, die jeweils von einem alten und einem neuen Variablensatz
abhängen
F2 = F2 (q, P ; t)
F3 = F3 (p, Q; t)
F4 = F4 (p, P ; t) .
Dabei entscheidet das vorliegende Problem, welche Form der Erzeugenden am
günstigsten ist. Auch die drei weiteren Formen liefern dabei eindeutig eine kanonische Transformation, wie man analog zum Fall F1 zeigen kann. Wir wollen
dies hier aus Zeitgründen nicht genauer beleuchten, jedoch am Rande erwähnen,
daß kanonische
P Transformationen des Typs L → L̃ = L + dG(q; t)/dt durch
F2 (q, P ; t) = j qj Pj − G(q; t) erzeugt werden (vergleiche mit Gl. (5.4)). Stattdessen wollen wir das Beispiel einer Erzeugenden studieren. Wir betrachten
F1 (q, Q; t) = −
m
X
j=1
qj Qj .
5.3. KANONISCHE TRANSFORMATIONEN
111
und bekommen damit nach Gl. (5.6)
pj =
∂F1
∂F1
= −Qj , Pj = −
= qj ,
∂qj
∂Qj
d.h. die bereits oben eingeführte kanonische Transformation, die die verallgemeinerten Koordinaten und kanonischen Impulse vertauscht.
Wir wollen nun zeigen, wie man mit Hilfe einer kanonischen Transformation
die fast vollständig algebraische Lösung eines mechanischen Problems erreichen
kann. Dazu betrachten wir erneut den eindimensionalen harmonischen Oszillator
mit Hamiltonfunktion
p2
1
H=
+ mω02 q 2 .
2m 2
Wir wählen die Erzeugende
1
F1 (q, Q) = mω0 q 2 cot Q .
2
Das liefert nach Gl. (5.6)
p=
∂F1
= mω0 q cot Q ,
∂q
bzw. nach Auflösen nach q und p
r
2P
q=
sin Q ,
mω0
P =−
p=
∂F1
1
1
= mω0 q 2 2 ,
∂Q
2
sin Q
p
2P mω0 cos Q .
Wegen ∂F1 /∂t = 0 gilt für die neue Hamiltonfunktion
1
2P
2P mω0
cos2 Q + mω02
sin2 Q
2m
2
mω0
= ω0 P .
H̄(Q, P ) = H(q(Q, P ), p(Q, p)) =
Damit ist die Koordinate Q zyklisch, was P (t) = P0 = const. bedeutet. Weiterhin
gilt
Q̇ =
∂ H̄
= ω0
∂P
und damit
Q(t) = ω0 t + Q0 .
Eingesetzt liefert das auf nahezu algebraische Art die Lösung des harmoischen
Oszillators
r
2P0
sin (ω0 t + Q0 ) ,
q(t) =
mω0
p
2P0 mω0 cos (ω0 t + Q0 ) ,
p(t) =
112
KAPITEL 5. HAMILTONSCHE MECHANIK
wobei Q0 und P0 durch die Anfangsbedingungen festgelegt sind.
Es gibt verschiedene Kriterien die Kanonizität einer gegebenen Phasenraumtransformation
Q = Q(q, p; t) ,
P = P (q, p; t)
zu testen (auch wenn die Erzeugende nicht bekannt ist). Unter anderem ist die
Kanonizität genau dann sichergestellt, wenn die neuen Größen die fundamentalen
Poissonklammern erfüllen
{Qk , Pl }p,q = δk,l ,
{Qk , Ql }p,q = 0 , {Pk , Pl }p,q = 0 ,
was wir hier aus Zeitgründen nicht beweisen wollen (siehe die Literatur).
5.4
Die Hamilton-Jacobi-Gleichung
Wie bereits öfter angedeutet, lassen sich im Hamiltonformalismus aus der großen
Freiheit bei der Wahl von Transformationen, die die Bewegungsgleichungen invariant lassen, Lösungsstrategien für mechanische Probleme entwickeln. Man könnte z.B. eine Transformation für ein gegebenes H(q, p; t) suchen, so daß das zugehörige H̄(Q, P ; t) gleich der Hamiltonfunktion eines bereits gelösten Problems
ist. Es sollte klar sein, daß dieses nur in recht speziellen Fällen gelingen kann.
Weiterhin wäre die Lösung der Bewegungsgleichungen eines Problems dann trivial, wenn nach geeigneter Transformation alle Koordinaten zyklisch sind. Diese
Strategie haben wir bereits häufiger erwähnt und zur Lösung des eindimensionalen harmonischen Oszillators angewandt. Noch einfacher wäre es, wenn nach der
kanonischen Transformation
Qj = βj = const. ,
Pj = αj = const. ,
j = 1, 2, . . . , m
gelten würde. Die Lösung der Bewegungsgleichungen ergibt sich dann einfach
durch Umkehren der Transformation
q = q(β, α; t) ,
p = p(β, α; t) ,
wobei die αj und βj durch die Anfangsbedingungen bestimmt sind (Integrationskonstanten). Die Q und P sind sicherlich dann konstant, wenn die neue Hamiltonfunktion H̄(Q, P ; t) verschwindet, d.h.
H̄(Q, P ; t) = H(q(Q, P ; t), p(Q, P ; t); t) +
∂F1 (q(Q, P ), Q; t)
=0
∂t
gilt, da in diesem Fall
Q̇j =
∂ H̄
∂ H̄
= 0 , Ṗj = −
=0
∂Pj
∂Qj
(5.7)
5.4. DIE HAMILTON-JACOBI-GLEICHUNG
113
folgt. Nach Gl. (5.6) gilt
pj =
∂F1
.
∂qj
Setzen wir dieses und Qi = βi = const. in Gl. (5.7) ein, so folgt
∂F1 (q, β, t)
∂F1 (q, β; t)
∂F1 (q, β, t)
,...,
;t +
=0.
H q1 , . . . , qm ,
∂q1
∂qm
∂t
Diese Hamilton-Jacobi-Gleichung ist eine partielle Differentialgleichung erster
Ordnung für die Erzeugende der kanonischen Transformation F1 (q, β; t). Ist F1
bekannt, so ist das mechanische Problem (bis auf das noch nötige algebraische
Auflösen von Gleichungen) gelöst. Es gibt verschiedene Strategien, die HamiltonJacobi-Gleichung zu lösen. Wir können diese jedoch aus Zeitgründen nicht diskutieren. Es empfiehlt sich, sich die Hamilton-Jacobi-Theorie anhand von Lehrbüchern zu studieren.
114
KAPITEL 5. HAMILTONSCHE MECHANIK
Kapitel 6
Grundzüge der relativistischen
Mechanik
Die in dieser Vorlesung und der des letzten Semesters entwickelte klassische Mechanik beruht auf einigen im letzten Semester dargestellten Grundüberlegungen,
die man zu Postulaten erheben kann. Diese sind experimentell motiviert und
wurden in unser sich über zwei Semester erstreckenden Diskussion unter verschiedenen Blickwinkeln wiederholt betrachtet. Wie bereits zu Beginn des letzten
Semesters erwähnt, verlieren die Grundüberlegungen (die Postulate) ihre experimentelle Begründung, wenn wir mit Situationen konfrontiert werden, in denen
Geschwindigkeiten auftreten, die nicht mehr sehr viel kleiner als die Vakuumlichtgeschwindigkeit c ≈ 3 · 108 m/s sind. In diesem Fall müssen die Grundüberlegungen im Einklang mit den experimentellen Beobachtungen modifiziert werden,
was zu einer neuen Struktur der resultierenden Theorie der Bewegung “makroskopischer”1 Teilchen führt. Im vorliegenden Fall führt das auf die relativistische
Mechanik bzw. die spezielle Relativitätstheorie.2 Die bisher diskutierte klassische
Mechanik folgt dann im Grenzfall, von Geschwindigkeiten die sehr viel kleiner als
c sind aus der relativistischen Mechanik. Die klassische Mechanik wie von uns bisher beschrieben, ist somit eine Theorie mit eingeschränktem Gültigkeitsbereich.
Wir werden hier keine detaillierte Diskussion der speziellen Relativitätstheorie
führen, sondern uns primär den Fragen widmen, in welchem Zusammenhang ihre
Grundprinzipien zu den von uns bisher diskutierten Grundprinzipien der klassischen Mechanik stehen und in welchem Verhältnis die resultierenden Theorien zu
einander stehen. Wir werden hier insbesondere nicht im Detail auf die experimentellen Beobachtungen eingehen, die Einstein 1905 zur Formulierung der speziellen
1
Dieser nicht genau definierte Begriff soll andeuten, daß wir unsere Überlegungen nicht in
den Bereich der Quantenmechanik ausdehnen wollen.
2
Die spezielle Relativitätstheorie ist “speziell” in der Hinsicht, daß sie sich primär mit Bezugsystemen beschäftigt, die nicht gegeneinander beschleunigt sind. In der allgemeinen Relativitätstheorie (1915) betrachtet man auch beschleunigte Bezugssysteme. Wie Einstein beschrieben hat,
führt dies auf natürliche Weise zu einer Theorie der Gravitation.
115
116
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
Relativitätstheorie geführt haben. Viel zu kurz kommt ebenfalls die Diskussion
der scheinbaren Paradoxa, die mit unserem intuitiven Verständnis nur schwer in
Einklang zu bringen sind. Letzteres liegt offensichtlich daran, daß wir im Alltag
– und damit auch im Laufe der Evolution – nicht mit Phänomenen konfrontiert
sind, in denen Geschwindigkeiten von der Größe der Lichtgeschwindigkeit eine
offensichtliche Rolle spielen.
6.1
Die Lorentztransformation
In der klassischen Mechanik spielt der Begriff des Inertialsystems eine zentrale Rolle. Bewegt sich ein weiteres Bezugssystem K geradlinig und gleichförmig,
also mit konstanter Geschwindigkeit ~v0 gegenüber einem Inertialsystem k, so bildet K ebenfalls ein Inertialsystem. Dem Galileischen Relativitätsprinzip folgend
sind alle Naturgesetze in allen Inertialsystemen zu allen Zeiten gleich. Wie im
Kapitel 2.2 diskutiert, folgt für die Geschwindigkeitsvektoren in den beiden Sy~˙ (Notation wie in Kapitel 2.2). Als unmittelbare Konsequenz
stemen ~r˙ = ~v0 + R
dieser Galileitransformation ergibt sich, daß die Vakuumlichtgeschwindigkeit in
zwei relativ zueinander geradlinig, gleichförmig bewegten Bezugssystemen unterschiedlich sein sollte. Nehmen wir an, daß sich im Ursprung von k eine Lichtquelle
befindet, die sphärische Lichtwellen aussendet, welche sich mit Geschwindigkeit c
fortpflanzen.3 Der Vektor ~r sei der Ortsvektor eines Punktes auf einer gegebenen
~˙ = c~rˆ−~v0 . In dem SyWellenfläche. Damit gilt ~r˙ = c~rˆ. Im System K gilt dagegen R
stem, welches sich relativ zu dem mit der Lichquelle geradlinig und gleichförmig
bewegt, wird somit der Betrag der Lichtgeschwindigkeit im Allgemeinen nicht
gleich c sein und wegen der Richtungsabhängigkeit der Geschwindigkeit werden
die Wellen nicht mehr sphärisch sein.
Verschiedene Experimente, insbesondere das berühmte Michelson-Morley-Experiment haben, jedoch gezeigt, daß die Vakuumlichtgeschwindigkeit in alle Richtungen immer gleich ist und daß sie unabhängig von der relativen geradlinig,
gleichförmigen Bewegung eines Beobachters gegenüber der Lichtquelle ist. Wollen
wir also ein Relativitätsprinzip (Einsteinsches Relativitätsprinzip) der Gleichheit
von Naturgesetzen (jetzt auch Konstanz der Lichtgeschwindigkeit; siehe ebenfalls Vorlesung zur Elektrodynamik des kommenden Semesters) in gegeneinander
geradlinig, gleichförmig bewegten Bezugssysteme aufrecht erhalten, kann die obige Galileitransformation nicht richtig sein und muß durch eine andere, die Lorentztransformation, ersetzt werden. Diese muß die Lichtgeschwindigeit in allen
geradlinig, gleichförmig bewegten Bezugssystemen erhalten.
In Kapitel 2.2 dieser Vorlesung und Kapitel 3.2 der Vorlesung des letzten
3
Wir gehen davon aus, daß die aus der obigen Galileitransformation folgenden Überlegungen für Lichtwellen anwendbar sind. Mehr dazu (Welle-Teilchen-Dualismus) lernen sie in der
Quantenmechanik.
6.1. DIE LORENTZTRANSFORMATION
117
Semesters haben wir diskutiert (gefordert), daß die Newtonschen Bewegungsgleichungen unter der obigen Galileitransformation forminvariant bleiben (Galileisches Relativitätsprinzip). Wollen wir nun physikalische Gesetze haben, die unter der allgemeineren (noch aufzustellenden) Lorentztransformation forminvariant bleiben, so ist davon auszugehen, daß sich andere Bewegungsgesetze ergeben,
die sich nur für hinreichend kleine Geschwindigkeiten den bisher diskutierten Bewegungsgleichungen annähern. Wir müssen somit wie folgt vorgehen. Zunächst
müssen wir die Transformation finden, die die Lichtgeschwindigeit erhält. Im
Anschluß daran müssen wir die Gesetze der Mechanik auf ihre Transformationseigenschaften gegenüber dieser Lorentztransformation überprüfen. Gesetze,
deren Form nicht invariant bleibt, müssen entsprechend verallgemeinert werden.
Die sich ergebenden Folgerungen wurden in einer Vielzahl von Experimenten
bestätigt, was letzen Endes die entscheidene (einzige) Rechtfertigung für das Einsteinsche Relativitätsprinzip darstellt.
Um die Lorentztransformation zu entwickeln, betrachten wir zwei gegeneinander geradlinig, gleichförmig bewegte Bezugssysteme, deren Ursprünge zur Zeit
t = 0 zusammenfallen. Zu diesem Zeitpunkt strahle eine im Ursprung des Systems
k befestigte Lichtquelle einen Lichtblitz aus. Ein Beobachter, der sich bezüglich
k in Ruhe befindet, beobachtet eine sich mit c ausbreitende Kugelwelle. Die Gleichung der Wellenfront lautet
x21 + x22 + x23 = c2 t2 .
Die Konstanz der Lichtgeschwindigkeit impliziert nun, daß auch ein in K ruhender
Beobachter das Licht so sieht, als wenn es sich als sphärische Welle um den
Ursprung seines Bezugssystems ausbreitet. Die Entsprechende Gleichung für die
Wellenfront lautet also (Notation wie in Kapitel 2.2)
X12 + X22 + X32 = c2 T 2 .
Dabei lassen wir, indem wir t durch T ersetzen, explizit die Möglichkeit zu, daß
sich beim Übergang von k nach K (oder andersherum) auch die Zeitskala transformiert. Genauer gesagt lassen wir zu, daß die gesuchte Transformation, die die
beiden Gleichungen ineinander überführt, es womöglich erforderlich macht, daß
die Zeitdifferenz zwischen zwei Ereignissen vom Bezugssystem des Beobachters
abhängt. Die beiden Gleichungen zusammenfassend muß die Transformation so
sein, daß
x21 + x22 + x23 − c2 t2 = X12 + X22 + X32 − c2 T 2 .
Diese Bedingung erinnert an die für orthogonale Transformationen (Drehungen)
geltende Invarianz der Länge von Vektoren. Führen wir also zu den drei Koordinaten xi , i = 1, 2, 3 eine vierte imaginäre Koordinate x4 = ict hinzu, so ergibt
118
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
sich für die obige Gleichung4
4
X
x2µ
µ=1
=
4
X
Xµ2 .
µ=1
Diese Überlegung zeigt, daß die gesuchte Transformation einer Drehung in einem
vierdimensionalen Raum entspricht, der aus den drei Komponenten des gewöhnlichen Raums und einer vierten, imaginären Komponente besteht, die proportional zur Zeit ist. Diesen Raum bezeichnet man als Minkowskiraum bzw. die
vierdimensionale Raum-Zeit. Die Lorentztransformationen sind die orthogonalen
Transformationen auf dem Minkowskiraum. Sie mischen die räumlichen und die
zeitliche Komponente der Raumzeit. Die Konzepte Raum und Zeit verlieren damit ihre Unabhängigkeit. Als eine Unterklasse der Lorentztransformationen sind
auch rein räumliche Drehungen zugelassen, für die t = T gilt. Wir sprechen
von einer reinen Lorentztransformation (“boost”), wenn sie keine räumliche Drehung enthält, sondern gleichförmig, geradlinig bewegte Bezugsysteme ineinader
überführt, deren Achsen parallel sind. Es sollte auch ohne Beweis klar sein, daß
sich eine allgemeine Lorentztransformation als Produkt einer räumlichen Drehung und einer reinen Lorentztransformation schreiben läßt. Es bedeutet keine
Einschräkung der Allgemeinheit (vereinfacht aber unsere Überlegungen) davon
auszugehen, daß die Relativbewegung der Bezugssysteme (der “boost”) entlang
einer Achsenrichtung, hier der x3 -Richtung, ist.
Die Transformation von den xµ auf die Xµ ist durch eine 4 × 4-Matrix A mit
Matrixelementen aµ,ν gegeben
Xµ =
4
X
aµ,ν xν .
ν=1
Da A eine orthogonale Transformation vermittelt, müssen die aµ,ν die im Kapitel
2.12 der Vorlesung des letzten Semesters diskutierten Bedingungen
4
X
aµ,ν aλ,ν = δµ,λ
ν=1
erfüllen. Anders als bisher sind jedoch nicht alle Matrixelemente reell. Da die
Koordinaten X1 , X2 und X3 reell bleiben müssen, ist es erforderlich, daß die
Elemente ai,4 für i = 1, 2, 3 rein imaginär sind. Analog folgt daraus, daß X4 rein
imaginär sein muß, daß die Elemente a4,i , i = 1, 2, 3 rein imaginär sind, während
a4,4 reell sein muß. Da die Richtungen x1 und x2 bei der Relativbewegung in
4
Es ist in der Literatur zur speziellen Relativitätstheorie weit verbreitet, griechische Buchstaben für Indizes zu verwenden, die von 1 bis 4 laufen und lateinische, für solche die von 1 bis
3 laufen.
6.1. DIE LORENTZTRANSFORMATION
119
x3 -Richtung in Ruhe bleiben, bleiben sie unter der Transformation unbeeinflußt
und es muß
X1 = x1 ,
X2 = x2
gelten. Um die Struktur der Matrix A weiter zu analysieren, wollen wir nun
noch argumentieren, daß die transformierten Koordinaten X3 und X4 nicht von
x1 und x2 abhängen können. Kein Ort in der x1 -x2 -Ebene ist aus physikalischen
Gründen als Ursprung des Koordinatensystems ausgezeichnet. Man kann also den
Ursprung in jeden Punkt der x1 -x2 -Ebene verschieben, ohne die Werte von X3
und X4 zu beeinflussen, so daß diese unabhängig von x1 und x2 sein müssen. Die
Matrix der Lorentztransformation kann somit nur die Form


1 0 0
0
 0 1 0
0 

A=
 0 0 a3,3 a3,4 
0 0 a4,3 a4,4
haben. Die Orthogonalitätsbedingungen liefern drei Gleichungen, die die vier
nicht-trivialen Matrixelemente verknüpfen
a23,3 + a23,4 = 1 ,
a24,3 + a24,4 = 1 ,
a3,3 a4,3 + a3,4 a4,4 = 0 .
Es ist eine vierte Bedingung nötig, um die nicht-trivialen Matrixelemente eindeutig festzulegen. Sie folgt aus der Beobachtung, daß sich der Ursprung des Systems
K (für den X3 = 0 gilt) gleichförmig entlang der x3 -Achse bewegt, so daß zur
Zeit t seine x3 -Koordinate gleich vt ist,5 d.h. es gilt
x3 = vt = −iβx4 ,
mit
β=
v
.
c
Eingesetzt in die Transformation bedeutet das für den Ursprung von K
X3 = a3,3 x3 + a3,4 x4 = x4 (a3,4 − iβa3,3 ) = 0
und damit
a3,4 = iβa3,3 .
5
Wir lassen folgend den Index 0 bei der Relativgeschwindigkeit ~v = v~e3 weg.
120
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
Die erste der Orthogonalitätsrelationen liefert damit
und folglich
a23,3 (1 − β 2 ) = 1 ⇒ a3,3 = p
1
1 − β2
iβ
.
a3,4 = p
1 − β2
Wie gefordert ist a3,3 reell und a3,4 rein imaginär solange β < 1 gilt. Dies ist
konsistent mit Einsteins Überlegung, daß es keine Geschwindigkeiten größer als
die Vakuumlichtgeschwindigkeit geben kann.6 Die verbleibenden Matrixelement
bestimmt man mit Hilfe der weiteren Orthogonalitätsrelationen und erhält
a4,4 = p
1
1 − β2
,
a4,3 = p
Die Matrix A hat somit die Form

1 0
0
 0 1
0

1
√
A=
 0 0
1−β 2

0 0 √−iβ 2
1−β
−iβ
1 − β2
0
0
√ iβ
1−β 2
√1
1−β 2
.



 .


(6.1)
Die 2 × 2-Untermatrix in der rechten unteren Ecke hat die Struktur wie eine
Matrix
cos φ sin φ
− sin φ cos φ
, die eine Drehung in der Ebene vermittelt. In der Tat stellt die Untermatrix eine
Drehung in der x3 -x4 -Ebene dar, wobei der Drehwinkel jedoch imaginär ist, was
aus
cos φ = p
1
1 − β2
>1
folgt. Wir können die Gleichungen der reinen Lorentztransformation auch wie
folgt schreiben
X1 = x1 ,
6
X2 = x2 ,
x3 − vt
X3 = p
,
1 − β2
t − vx3 /c2
T = p
.
1 − β2
(6.2)
Genaueres dazu können sie aus Büchern oder einer Vorlesung zur speziellen Relativitätstheorie erfahren.
121
6.1. DIE LORENTZTRANSFORMATION
Die Rücktransformation erhalten wir dadurch, daß wir die Transponierte der
Matrix Gl. (6.1) bilden. Wie man damit leicht nachrechnet, bekommt man so
explizite Ausdrücke für die “kleinen” Koordinaten als Funktion der “großen”, die
bis auf den Vorzeichenwechsel v → −v identisch zu Gl. (6.2) sind. Dies war zu
erwarten, da sich k relativ zu K mit Geschwindigkeit −~v bewegt.
Aus der Lorentztransformation ergeben sich Konsequenzen, die unseren gewohnten Vorstellungen zuwiderlaufen. Wir werden hier nur eine grobe Diskussion
solcher vermeindlicher Paradoxa geben.
Wir betrachten zunächst einen starren Stab, der bezüglich k in Ruhe ist und
(2)
(1)
entlang der x3 -Achse liegt. Er habe die Länge x3 − x3 = L. Ein bewegter
Beobachter (in K) mißt die Länge des Stabes, indem er zu einer festen Zeit T
(1)
(2)
die Lage der beiden Endpunkte X3 und X3 bestimmt. Aus den zu Gl. (6.2)
inversen Relationen finden wir
(1)
und damit
X + vT
(1)
x3 = p3
,
1 − β2
(2)
X + vT
(2)
x3 = p3
1 − β2
p
(2)
(1)
X3 − X3 = L 1 − β 2 .
p
Der Stab scheint dem bewegten Beobachter damit um den Faktor 1 − β 2 < 1
verkürzt. Dies ist die berühmte Längenkontraktion. Es muß betont werden, daß
ein Beobachter in k dieselbe Längenkontraktion bei einem Stab beobachtet, der
in K ruht. Wäre dies nicht der Fall, wäre eines der Bezugssysteme ausgezeichnet,
was nach dem Relativitätsprinzip nicht erlaubt ist.
Die sogenannte Zeitdilatation wollen wir auf anschaulichere Weise erklären
und nicht einfach auf die Lorentztransformation zurückgreifen. Wir betrachten
einen Zug (Bezugssystem K), der sich mit hoher (konstanter) Geschwindigkeit v
relativ zu einem Bezugssystem k in x3 -Richtung bewegt. Ein Beobachter im Zug
(in K) löst einen Blitz aus, der aus einer am Boden befindlichen Quelle kommt.
Das Licht breitet sich bis zur Decke des Zugs aus und wird von dort zurück
auf den Ausgangspunkt am Boden reflektiert, wo eine Photozelle steht, die ein
akustisches Signal auslöst. Dieses “Gedankenexperiment” beobachtet ebenfalls
ein Beobachter in k. Von K aus betrachtet ist die Zeitdifferenz zwischen dem
Auslösen des Blitzes und dem ertönen des Signals durch
∆T =
2h
,
c
mit der Höhe h des Zugs gegeben. Von k aus betrachtet nimmt das Licht den in
der Skizze dargestellten Weg.
122
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
B
A
D
C
Die Strecke AC hat die Länge v∆t, wenn ∆t die Zeit zwischen dem Blitz und dem
Signal ist. Damit hat das Dreieck ABD die Seitenlängen h, v∆t/2 und c∆t/2.
An dieser Stelle fließt in die Überlegung ein, daß die Vakuumlichtgeschwindigkeit
in k und K identisch ist. Weiterhin gehen wir davon aus, daß die Höhe des
Zuges (senkrecht zu ~v) in beiden Bezugssystemen identisch ist. Bereits weiter
oben haben wir uns klar gemacht, daß dieses der Fall ist, da die Ortskoordinaten
senkrecht zu ~v nicht transformiert werden. Damit folgt nach Pythagoras
(c∆t/2)2 = h2 + (v∆t/2)2
, was
∆t =
bedingt. Es gilt somit
2h
1
p
c
1 − β2
∆t = p
∆T
1 − β2
.
Der gemessene Zeitunterschied zwischen dem Blitz und dem Signal ist somit in k
und K verschieden. Dieses Ergebnis gilt für alle Ereignisse (nicht nur Blitz und
Signal), die in K am gleichen Ort stattfinden. Das Ergebnis ist somit konsistent
mit der Rücktransformation
T + vX3 /c2
t= p
1 − β2
, die aus Gl. (6.2) folgt, da bei der Bildung der Zeitdifferenz für gleiche Orte in K
die Variable X3 herausfällt. Misst er die Zeitdifferenz zwischen zwei Ereignissen,
welche am gleichen Ort in K stattfinden, so kommt der Beobachter in k zu dem
Schluß, daß eine Uhr in K langsamer läuft als seine, da ∆T < ∆t. Daher der Name
Zeitdilatation. Erneut erfordert das Relativitätsprinzip, daß ein Beobachter in K
zu einem analogen Schluß bezüglich Ereignissen kommt, die an einem festen Ort
in k stattfinden.
Wie bereits oben erwähnt implizieren die Lorentztransformationen, daß es
keine Geschwindigkeiten größer als c geben kann. Man könnte nun meinen, daß
sich solche Geschwindigkeiten erzeugen lassen, wenn man wie folgt vorgeht. Wir
nehmen an, ein Teilchen bewege sich relativ zu einem Beobachter im System k
123
6.2. DIE KOVARIANZ
mit konstanter Geschwindigkeit c/2 < w < c in x3 -Richtung, was sicherlich erlaubt ist. Ein weiterer Beobachter im System K bewege sich relativ zum ersten
mit Geschwindigkeit c/2 < v < c, jedoch in −x3 -Richtung, was ebenfalls mit der
speziellen Relativitätstheorie im Einklang ist. Könnte man nun die Relativgeschwindigkeit zwischen dem zweiten Beobachter und dem Teilchen durch simple
Addition der beiden Relativgeschwindigkeiten zum ersten Beobachter gewinnen
(wie es in der klassischen Mechanik der Fall wäre), so würde diese größer als die
Vakuumlichtgeschwindigkeit sein. Diese Relativgeschwindigkeit ist identisch zur
Geschwindigkeit des Teilchens aus K betrachtet, also zu der von k nach K transformierten Teilchengeschwindigkeit W . Um zu zeigen, daß diese simple Additionsrelation in der relativistischen Mechanik ihre Gültigkeit verliert, betrachten wir
die Lorentztransformation. Aus k beobachtet gilt für die Teilchengeschwindigkeit
∆~r
∆t→0 ∆t
w
~ = lim
mit ∆~r = ~r(t + ∆t) − ~r(t). Da die Lorentztransformation linear in den xµ ist,
folgt sofort
∆X1 = ∆x1 ,
∆X2 = ∆x2 ,
∆x3 + v∆t
∆X3 = p
,
1 − β2
∆T =
∆t + v∆x3 /c2
p
.
1 − β2
Dabei gilt verglichen mit Gl. (6.2) v → −v, da sich K in Bezug auf k nach
Konstruktion in −x3 -Richtung bewegt. Es gilt dann
∆x3 + v∆t
∆x3 /∆t + v
∆X3
=
=
∆T
∆t + v∆x3 /c2
1 + (v/c2 )(∆x3 /∆t)
bzw.
W = W3 =
w+v
.
1 + wv/c2
Alle anderen Komponenten des Geschwindigkeitsvektors sind aufgrund unserer
Wahl der Richtungen der Koordinatenachsen Null. Dies ist das Einsteinsche Additionstheorem für Geschwindigkeiten. Man sieht, daß für 0 ≤ v < c und 0 ≤ w < c
auch 0 ≤ W < c gilt. Gilt w = c und v < c, so folgt W = c.
6.2
Die Kovarianz
Wir haben im letzten Abschnitt die Lorentztransformation konstruiert, die die
inkorrekte Galileitransformation in der speziellen Relativitätstheorie ersetzt. Wir
können nun den zweiten Schritt gehen und fordern, daß alle Gesetze der Mechanik
(und der ganzen Physik) invariant unter der Lorentztransformation sind. Es wird
sehr viel einfacher und eleganter, die Gesetze auf Forminvarianz zu untersuchen,
124
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
wenn man sie in Ausdrücken des Minkowskiraums schreibt. Wir werden zeigen,
daß es dann sehr leicht ist, die Lorentzinvarianz einer gegebenen Gleichung zu
erkennen.
Um unser Vorgehen bezüglich der Lorentztransformationen zu illustrieren, betrachten wir zunächst, wie wir im Fall des Nachweises der Invarianz physikalischer
Gesetze unter Drehungen des Raumes, also unter orthogonalen Transformationen
des R3 , vorgehen können. Eine physikalische Größe, die für sich genommen invariant unter einer Drehung des Raums ist, nennt man ein Rotationsskalar. Die Masse
m eines Teilchens, die Zeit t und der Betrag des Abstandes einer Teilchenposition
vom Ursprung r = |~r| sind Beispiele für solche Skalare. Physikalische Gesetze der
Form a = b mit zwei Rotationsskalaren a und b sind somit trivialerweise invariant unter Rotationen des R3 . Ebenfalls invariant sind Gesetze der Form f~ = ~g
(Gleichungssystem) mit zwei dreidimensionalen Vektoren, die gemäß F~ = Rf~
~ = R~g mit der Rotationsmatrix R transformiert werden. Man spricht in
und G
diesem Zusammenhang auch von der Kovarianz (unter räumlichen Rotationen)
der Terme der Gleichung
Die Lorentztransformationen wurden weiter oben mit den orthogonalen Transformationen im vierdimensionalen Minkowskiraum identifiziert. Wir führen nun
den Begriff des Lorentz- oder Viererskalars ein. Dabei handelt es sich in Analogie
zu den “gewöhnlichen” Rotationen um eine Größe, die für sich genommen invariant unter den Lorentztransformationen ist. Wie wir weiter unten zeigen werden,
kann man einen Massebegriff in der relativistsischen Mechanik so einführen, daß
das adäquat definierte m ein Viererskalar ist. Die Zeit t ist, wie wir oben gesehen
haben, sicherlich kein Viererskalar. Als einen Vierervektor f bezeichnen wir einen
allgemeinen Satz von vier Zahlen, der sich unter der Lorentztransformation wie
der “verallgemeinerte Ortsvektor” (Ortsvektor im Minkowskiraum oder RaumZeit-Vektor)7 r = (x1 , x2 , x3 , ict)T transformiert, d.h. im Fall eines “boosts” wie
F = Af
mit der Matrix A aus Gl. (6.1). Die Forminvarianz eines physikalischen Gesetzes
unter Lorentztransformationen ist damit dann offensichtlich, wenn es in einer kovarianten vierdimensionalen Form geschrieben werden kann. Ein Zusammenhang,
der das Einsteinsche Relativitätsprinzip verletzt, kann nicht in eine kovariante
Form gebracht werden. Dies ist das oben angekündigte einfache Kriterium, um
festzustellen, ob ein physikalisches Gesetz mit dem Einsteinschen Relativitätsprinzip im Einklang ist.
Als Beispiel dafür, wie man ein Gesetz so umschreibt, daß sofort sichtbar
wird, ob es lorentzinvariant ist oder nicht, betrachten wir die dreidimensionale
Mit fortschreitender Zeit durchläuft der Raum-Zeit-Vektor r = (x1 , x2 , x3 , ict)T die sogenannte Weltlinie, was der Bahnkurve der klassischen Mechanik entspricht.
7
125
6.2. DIE KOVARIANZ
Wellengleichung (siehe Kapitel 4.2)
2
~ 2u = 1 ∂ u .
∇
c2 ∂t2
Im Vergleich zu der allgemeinen Gleichung aus Kapitel 4.2 soll c hier die Vakuumlichtgeschwindigkeit sein. Wir führen einen Vierergradienten mit Komponenten
∂/∂x1 , ∂/∂x2 , ∂/∂x3 und ∂/∂x4 ein, den wir mit dem Symbol bezeichnen. Um
zu zeigen, daß ein Vierervektor ist, betrachten wir (Kettenregel)
X ∂xν ∂
∂
=
.
∂Xµ
∂X
∂x
µ
ν
ν
Die xν hängen über die inverse Transformation (vermittelt durch AT ) mit den
Xµ zusammen
X
xν =
aµ,ν Xµ
µ
, so daß
X
∂
∂
=
aµ,ν
.
∂Xµ
∂x
ν
ν
Dies ist die Transformationsgleichung für die Komponenten eines Vierervektors.
Damit ist klar, daß 2 ein Viererskalar(-Differentialoperator) ist. Mit diesem
geschrieben hat die Wellengleichung die elegante Form
2 u = 0 .
Unter der Annahme, daß u ein Viererskalar ist, zeigt diese kovariante Schreibweise
sofort die Invarianz der Wellengleichung unter Lorentztransformationen.
Ein konzeptionell wichtiges Viererskalar ist durch
4
1 X
(∆τ ) = − 2
(∆xµ )2
c µ=1
2
gegeben. Da sich, wie bereits oben erwähnt, die ∆xµ wie die xµ transformieren,
ist diese Größe offensichtlich ein Viererskalar. Betrachten wir ein System K, in
dem das Teilchen momentan in Ruhe ist, d.h. ∆Xi = 0 für i = 1, 2, 3 gilt, so folgt
(Viererskalar!!)
4
4
1 X
1 X
2
(∆xµ ) = − 2
(∆Xµ )2 = (∆T )2 .
(∆τ ) = − 2
c µ=1
c µ=1
2
126
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
Somit ist ∆τ ein Zeitintervall, welches auf einer Uhr gemessen wird, die sich mit
dem Teilchen mitbewegt. Daher bezeichnet man ∆τ als ein Intervall der Eigenzeit.
Aus der Definitionsgleichung der Eigenzeit folgt
1p
−(∆x1 )2 − (∆x2 )2 − (∆x3 )2 + c2 (∆t)2
c v
"
u
2 2 2 #
u
∆x
∆x
∆x
1
1
2
2
.
+
+
= ∆tt1 − 2
c
∆t
∆t
∆t
∆τ =
Für hinreichend kleine ∆t entspricht die Summe in der eckigen Klammer dem
Relativgeschwindigkeitsquadrat v 2 (zwischen dem in k ruhenden Beobachter und
dem in K ruhenden Teilchen) und konsistent mit dem bei der Diskussion der
Zeitdilatation hergeleiteten Ausdruck gilt
p
∆τ = ∆T = ∆t 1 − β 2 .
(6.3)
Ist eine der Komponenten eines Vierervektors rein imaginär, wie es z.B. beim
Ortsvektor im Minkowskiraum der Fall ist, so muß das Quadrat eines solchen
Vierervektors nicht notwendig größer gleich Null sein. Man bezeichnet einen Vierervektor, dessen Quadrat größer oder gleich Null ist, als raumähnlich. Ist das
Quadrat negativ, so heißt der Vierervektor zeitähnlich. Da das Quadrat eines
Vierervektors als Viererskalar invariant unter einer Lorentztransformation ist,
ist auch die Charakterisierung als raum- oder zeitähnlich invariant. Die Namen
rühren daher, daß ein reiner Raumvektor (x4 = 0) stets positiv definit ist und
ein raumähnlicher Vierervektor so transformiert werden kann, daß seine vierte Komponente verschwindet. Ein zeitähnlicher Vierervektor kann dagegen so
transformiert werden, daß seine ersten drei Komponenten verschwinden.
Als Beispiel für diese Begrifflichkeiten betrachten wir einen Ortsvektor im
Minkowskiraum. Die Bedingung x21 + x22 + x23 = c2 t2 definiert den sogenannten
Lichtkegel. Dabei unterscheidet man den Vorwärts- (t > 0) und den Rückwärtslichtkegel (t < 0). Das Innere der Lichtkegel bilden die zeitähnlichen Vierervektoren. Wie bereits gezeigt, ist der Begriff der Zeitähnlichkeit invariant unter der
Lorentztransformation. Man kann leicht sehen, daß bei Zeitähnlichkeit auch die
Bedingung t > 0 invariant ist, so daß ein Punkt P , der im Inneren des Vorwärtslichtkegel liegt, dies in allen Bezugssystemen tut. Dies bedeutet, daß alle Beobachter übereinstimmen, daß ein Ereignis im Raum-Zeit-Punkt P nach einem
Ereignis im Ursprung der Raumzeit mit xµ = 0 für alle µ = 1, 2, 3, 4 stattfindet.
Man nennt den Vorwärtslichtkegel daher auch die absolute Zukunft. Alle Punkte
im Vorwärtslichtkegel sind durch ein sich mit c ausbreitendes Lichtsignal vom
Ursprung aus erreichbar. Raumähnliche Punkte sind dagegen nicht durch ein
Lichtsignal vom Ursprung aus erreichbar.8
8
Dies hat sehr interessante Auswirkungen auf das Konzept der Kausalität, auf die wir hier
aus Zeitgründen nicht eingehen können.
6.3. MASSE, VIERERGESCHWINDIGKEIT UND -IMPULS
6.3
127
Masse, Vierergeschwindigkeit und -impuls
Während wir uns bisher mit der Kinematik der relativistischen Mechanik beschäftigt haben, werden wir jetzt zur Dynamik kommen. Wir werden die relativistischen Ausdrücke für die Masse, die Geschwindigkeit und den Impuls einführen.
Genauer betrachtet definieren wir diese Begriffe im Rahmen der speziellen Relativitätstheorie neu. Die Leitprinzipien bei der Definition sind dabei, daß (i) für
v/c ≪ 1 sich die in der klassischen Mechanik etablierten Begriffe ergeben sollen
und (ii) die Begriffe Eigenschaften mit ihren klassischen Gegenstücken gemeinsam
haben, die uns für das jeweilige Konzept essentiell erscheinen. Für den Impuls bedeutet das z.B., daß wir eine relativistische Definition mit der Eigenschaft suchen,
daß der Gesamtimpuls für ein isoliertes System erhalten ist.
Wir wollen zunächst die relativistische Masse definieren. Die Masse m eines
Objekts ist unabhängig davon, mit welcher Geschwindigkeit es sich bewegt, als
seine Ruhemasse definiert. Als Beobachter in einem System k müssen wir somit
bei der Massenbestimmung wie folgt vorgehen. Wir müssen die zu bestimmende
Masse entweder zur Ruhe bringen oder uns selbst in ein System bringen, in dem
die Masse ruht. Danach können wir die Masse mit den Methoden der klassischen
Mechanik bestimmen. Die Definition ist offensichtlicherweise invariant unter einer
Lorentztransformation, so daß die definierte Masse wie oben angekündigt ein
Vierersaklar ist.
Als nächstes wollen wir die Vierergeschwindigkeit einführen. Wie wir bereits
gesehen haben, muß man die dreidimensionale Geschwindigkeit ~v gemäß einem
recht komplizierten Additionstheorem transformieren. Mit unseren in der Zwischenzeit angestellten Überlegungen zur Kovarianz können wir besser verstehen,
wie es dazu kommt. Die Geschwindigkeit ~v ergibt sich aus Grenzwertbildung
des Quotienten eines dreidimensionalen Vektors ∆~r und der vierten Komponente ∆t eines Vierervektors. Es ist daher nicht verwunderlich, daß sich ~v auf eigenartige Weise transformiert. Nach dieser Einsicht wird es klarer, wie wir bei
der Definition einer Vierergeschwindigkeit vorgehen sollten. Wie oben diskutiert,
transformieren sich die ∆xµ wie die xµ selbst, so daß man einen Vierervektor
∆r = (∆x1 , . . . , ∆x4 )T konstruieren kann. Bilden wir nun den Differenzenquotienten mit dem Intervall ∆τ der Eigenzeit, welches ein Viererskalar ist, und führen
den Grenzwert aus, so ergibt sich ein Vierervektor
v=

dr 
=

dτ
dx1
dτ
dx2
dτ
dx3
dτ
dt
ic dτ


 .

p
Dies ist die Vierergeschwindigkeit. Ersetzen wir gemäß Gl. (6.3) dτ = dt 1 − β 2 ,
128
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
so folgt

1

1
dr

v=p
=p
1 − β 2 dt
1 − β2 
dx1
dt
dx2
dt
dx3
dt
ic


= p 1

1 − β2
~v
ic
.
Es ist wichtig festzuhalten, daß der räumliche Teil der Vierergeschwindigkeit nicht
gleich der (gewöhnlichen) dreidimensionalen Geschwindigkeit ~v p
ist. Im Limes von
Geschwindigkeiten sehr viel kleiner als c geht der Vorfaktor 1/ 1 − β 2 quadratisch gegen 1 und der räumliche Teil von v nähert sich ~v an.
Wie oben angedeutet, soll ein nun zu definierender relativistischer Impuls
im Limes kleiner Geschwindigkeiten mit dem Impuls der klassischen Mechanik
übereinstimmen und für abgeschlossene Systeme eine Erhaltungsgröße sein. Wir
definieren den Viererimpuls als Produkt des Viererskalars m und des Vierervektors v
1
m~v
.
p = mv = p
imc
1 − β2
Den p
räumlichen Anteil des Viererimpulses (dreidimensionaler Vektor) p~ (r) =
m~v / 1 − β 2 bezeichnet man als den relativistischen Impuls. Er stimmt für kleine
Geschwindigkeiten mit dem klassischen Impuls überein. Da wir einen vierkomponentigen Impuls definiert haben, scheint es nahezuliegen, daß (wenn überhaupt;
siehe unten) eine Erhaltung aller vier Komponenten - der drei Komponenten des
realtivistischen Impulses und der vierten neuen Komponente - gelten sollte. Wie
wir gleich sehen werden, hat die vierte Komponente etwas mit der Energie zu
tun, so daß die Erhaltung des Viererimpulses bereits kombiniert die Impuls- und
die Energieerhaltung liefert.
Wir definieren die relativistische Energie E als (c/i) mal die vierte (zeitliche)
Komponente von p
E = p4 c/i = p
mc2
1 − β2
.
Zunächst einmal fällt auf, daß das so definierte E zumindest die Dimension einer
Energie hat. Betrachten wir die Energie für ein nicht-relativistisches Teilchen mit
v/c ≪ 1, so folgt durch Talyorentwicklung
E=p
mc2
1
= mc2 + mv 2 + O([v/c]2 ) .
2
1 − β2
In der klassischen Mechanik wird angenommen, daß die Masse eines Punktteilchens konstant (erhalten) ist.9 Damit ist der erste Summand aus der Perspektive
9
Wenn wir in der klassischen Mechanik zeitlich veränderliche Massen betrachtet haben,
6.3. MASSE, VIERERGESCHWINDIGKEIT UND -IMPULS
129
der klassischen Mechanik eine Konstante, die wir durch Verschieben des Energienullpunktes eliminieren können. Der verbleibende Summand ist die uns bekannte
klassische kinetische Energie T . Dies zeigt, daß die obige Definition der relativitischen Energie sinnvoll ist. Betrachten wir den elastischen Stoß zweier sonst freier
Teilchen mit kleiner Geschwindigkeit, so können wir anhand des genäherten Ausdrucks für die relativistische Energie sehr leicht die Energieerhaltung nachweisen.
Für den kinetischen Teil T gilt die Erhaltung wie in der klassischen Mechanik.
Für den Term mc2 folgt ebenfalls eine Erhaltung, da die Summe der Massen der
Teilchen vor und nach dem Stoß gleich ist. Betrachten wir nun einen inelastischen Stoß zweier Teilchen mit kleiner Geschwindigkeit. In diesem Fall sind die
kinetischen Energien vor und nach dem Stoß nicht identisch, da es zu inneren
Anregungen der Massen kommt (es wird z.B. Wärme erzeugt, die nichts anderes als eine innere Anregung der Massen ist). Wenn jetzt aber die relativistische
Energie E für alle Arten von Stoßprozessen (elastisch und inelastisch) erhalten
sein soll (was in der Tat der Fall ist), so bedeutet das (für v/c ≪ 1) gemäß
Min c2 + Tin = Mout c2 + Tout
mit den totalen Massen Min and Mout vor und nach dem Stoß wegen Tin 6= Tout ,
daß
Min 6= Mout .
Wir müssen folgern, daß sich bei der Änderung der Anregungsenergie eines Teilchens (inelastischer Prozeß) dessen Masse ändert. Sollte also die relativistische
Energie erhalten sein (was, wie schon gesagt, in der Tat der Fall ist), so bedeutet
das, daß die Masse nicht erhalten sein kann. Dies sieht man wie oben gezeigt
bereits im Limes kleiner Geschwindigkeiten. Im Alltag fällt nicht auf, daß die
Masse nicht konstant ist, da wegen
Tin − Tout = −(Min − Mout )c2
selbst bei recht großen |Tin − Tout | aufgrund der Größe von c die Massenänderung
|Min − Mout | sehr klein ist.
In der speziellen Relativitätstheorie ist der Beitrag mc2 zur Energie somit sicherlich keine irrelevante Konstante, wie es im Rahmen der klassischen Mechanik
der Fall wäre. Die Energie enthält in der relativistischen Mechanik keine freie
Konstante, da der Viererimpuls p ein Vierervektor sein soll. Jedes Hinzuaddieren
von i mal einer Konstanten zur vierten Komponente des Viererimpulses würde die
Lorentzinvarianz zerstören. Damit bekommt die Energie des Teilchens, wenn es
dann haben wir uns diese immer als aus vielen Punktteilchen zusammengestzt vorgestellt. Die
Zeitabhängigekit der Masse kam dann dadurch zu stande, daß einzelne oder mehrere Punktteilchen aus der Gesamtmasse verloren gehen.
130
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
in Ruhe ist E = mc2 eine besondere Bedeutung. Es ist die Ruheenergie. Wir definieren die relativistische kinetische Energie T (r) als die Differenz der Ruheenergie
und der Energie E
!
1
T (r) = E − mc2 = p
− 1 mc2 ≥ 0 .
2
1−β
Zum Abschluß dieses Abschnitts wollen wir drei sich aus den oben eingeführten Größen ergebene Relationen herleiten, die bei Rechnungen oft hilfreich sind.
Nach den obigen Überlegungen gilt
(r) m
~v
p~
.
=
p= p
2
iE/c
ic
1−β
Damit folgt
~v
p~ (r) c
=
.
c
E
(6.4)
Man kann somit die Geschwindigkeit eines Objekts berechnen, wenn man seinen
relativistischen Impuls und seine Energie kennt. Als nächstes betrachten wir das
Viererskalar p2 . Im Ruhesystem des Objekts gilt p = (0, 0, 0, imc)T , also p2 =
−(mc)2 . Da p2 lorentzinvariant ist, gilt in jedem Bezugssystem
p2 = −(mc)2 .
Es ist manchmal hilfreich, dieses Ergebnis zu
E 2 = (mc2 )2 + (~p (r) c)2
(6.5)
umzuschreiben.
6.4
Die Kraft in der relativistischen Mechanik
Es ist sehr viel schwieriger das Konzept der Kraft in der relativistischen Mechanik einzuführen, als es in der klassischen Mechanik der Fall war. Wie für die
Übertragung der anderen Größen gibt es auch hier verschiedene Möglichkeiten der
Definition. Ein großes Problem ergibt sich dadurch, daß sich unter dem Einfluß
einer Kraft die Ruhemasse m eines Teilchens ändern könnte. Diese Möglichkeit
gibt es in der klassischen Mechanik nicht. Wir wollen unsere Betrachtungen hier
auf Kräfte beschränken, die die Masse eines Objekts, auf das sie wirken, nicht
ändern. Viele der in der relativistischen Mechanik wichtigen Kräfte sind von diesem Typ. In diese Klasse fällt z.B. die Lorentzkraft
~ + ~v × B)
~ ,
F~ = q(E
6.4. DIE KRAFT IN DER RELATIVISTISCHEN MECHANIK
131
die auf ein Teilchen mit Ladung q in einem elektromagnetischen Feld wirkt. Von
den verschiedenen möglichen Definitionen der Kraft in der relativistischen Mechanik ist die nützlichste die eines dreidimensionalen Kraftvektors
F~
(r)
=
d~p (r)
.
dt
(6.6)
Für kleine Geschwindigkeiten v/c ≪ 1 gilt p~ (r) → p~ und damit wird F~ (r) in
diesem Limes gleich der Kraft in der klassischen Mechanik, was sicherlich sinnvoll
ist. Für eine gegebene Kraft F~ (r) liefert Gl. (6.6) eine Bewegungsgleichung. Ein
weiteres Argument für die obige Definition ergibt sich durch einen Vergleich mit
Experimenten. Es zeigt sich in diesen, daß im Fall eines Teilchens mit Ladung q
in einem elektromagnetischen Feld d~p (r) /dt durch die Lorentzkraft gegeben ist.
Der dritte Grund dafür, daß die Definition des dreidimensionalen relativistsischen
Kraftvektors sinnvoll ist, folgt dadurch, daß man einen Zusammenhang zwischen
der Änderung der relativistischen kinetischen Energie und der “Arbeit” F~ (r) · ∆~r,
die aus dieser Kraft folgt herleiten kann. Um dieses zu sehen, betrachten wir Gl.
(6.5). Differenzieren nach t auf beiden Seiten der Gleichung liefert
E
d~p (r)
dE
= ~p (r) c2 ·
= ~p (r) c2 · F~
dt
dt
(r)
.
Dabei haben wir verwendet, daß nach Annahme dm/dt = 0 gilt. Nach Divison
durch E und unter Verwendung von Gl. (6.4) folgt
dE
= ~v · F~
dt
(r)
,
(6.7)
bzw.
∆E = F~
(r)
· ∆~r .
Beachtet man jetzt noch, daß E = mc2 + T (r) und ∆m = 0, so folgt
∆T (r) = F~
(r)
· ∆~r ,
also der angekündigte Zusammenhang zwischen der Änderung der kinetischen
Energie und der Änderung der zur Kraft gehörenden Arbeit.
Betrachten wir als Beispiel die Bewegung eines Teilchens der (festen) Ruhemasse m, auf welches eine zeitlich und räumlich konstante Kraft F~ (r) wirkt. Diese
Situation läßt sich z.B. für ein geladenes Teilchen in einem zeitlich und räumlich
konstanten elektrischen Feld realisieren. Das Teilchen sei zur Zeit t = 0 im Ursprung in Ruhe. Nach der Definition der Kraft gilt p~ (r) = F~ (r) t. Mit Gln. (6.4)
und (6.5) folgt dann
~v (t) =
F~ (r) tc2
p~ (r) c2
=p
E
(mc2 )2 + (F
(r) tc)2
=
F~ (r) t
p
.
m 1 + (F (r) t/[mc])2
132
KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK
Wenn F (r) t/(mc) ≪ 1, d.h. wenn die Zeit t viel kleiner als die charakteristische
Zeit tc = mc/F (r) ist, können wir den Nenner durch 1 ersetzen und erhalten das
nicht-relativistische Ergebnis ~v = F~ (r) t/m. Falls jedoch t/tc ≫ 1, nähert sich v
der Vakuumlichtgeschwindigkeit an, ohne sie jedoch für endliches t je zu erreichen.
Um die Position des Teilchens ~r(t) zu bestimmen, müssen wir die Gleichung für
die Geschwindigkeit unter Berücksichtigung von ~r(t = 0) = 0 integrieren. Es folgt

s
(r) 2
(r) ~
2
mc
F
 1 + F t − 1 .
~r(t) =
(r)
m
F
mc
Für t/tc ≪ 1 ergibt sich das klassische Ergebnis
~r(t) =
1 F~ (r) 2
t
2 m
also ~at2 /2, mit ~a = F~ (r) /m. Für t → ∞ gilt r(t) → ct + const.. Dieses Beispiel
zeigt, daß die Bewegung alle unsere Erwartungen erfüllt.
Wenn zumindest in einem Bezugssystem k die Kraft F~ (r) als Gradient ei~ (r) , ist die Kraft
ner Funktion V (~r) geschrieben werden kann, d.h. F~ (r) = −∇V
konservativ. Dies ist z.B. für die Bewegung eines geladenen Teilchens in einem
elektrostatischen Feld der Fall. Sollte dies der Fall sein, so ist die Arbeit, die
am Teilchen verrichtet wird, wenn es sich um ∆~r im Kraftfeld, bewegt durch
~ (r) · ∆~r = −∆V (r) gegeben. Kombiniert mit dem oben diskutierF~ (r) · ∆~r = −∇V
ten Zusammenhang zur Änderung der kinetischen Energie gilt ∆T (r) = −∆V (r) ,
bzw. ∆(T (r) + V (r) ) = 0. Dies bedeutet, daß auch in der relativistischen Mechanik
für eine konservative Kraft T (r) + V (r) erhalten ist.
Die relativistische Kraft F~ (r) ist nicht der räumliche Anteil eines Vierervektors. Dies liegt daran, daß zwar ∆~p (r) der räumliche Anteil eines Vierervektors
ist, ∆t jedoch kein Viererskalar. In dieser Hinsicht ist F~ (r) wie der Geschwindigkeitsvektor ~v = d~r/dt und die Transformation der relativistischen Kraft F~ (r) von
k nach K hat eine ähnliche Struktur wie die von ~v. In Analogie zur Geschwindigkeit ist es nun leicht zu sehen, wie man einen vierdimensionalen mit F~ (r) in
Beziehung stehenden Kraftvektor definiert, der ein Vierervektor ist.
dp
,
(6.8)
dτ
mit der Eigenzeit τ . Da ∆p ein Vierervektor ist und ∆τ ein Viererskalar, handelt es sich bei F offensichtlich um einen Vierervektor. Man nennt diese Kraft
auch die Minkowskikraft. Diese Gleichung ist die lorentzinvariante Erweiterung
der Newtonschen Bewegungsgleichung. Indem wir ∆τ gemäß Gl. (6.3) auf ∆t
umschreiben, folgt
d~p (r) ~ (r)
1
1
F
dt
F =p
,
=p
1 dE
1 − β2
1 − β 2 ~v · F~ (r) /c
c dt
F =
6.4. DIE KRAFT IN DER RELATIVISTISCHEN MECHANIK
133
wobei wir Gl. (6.7) verwendet
p haben. Wir erkennen, daß der räumliche Teil von
(r)
2
geteilt
F gleich F~
p durch 1 − β ist, so wie der räumliche Teil von v gleich
~v geteilt durch 1 − β 2 ist. Damit ist klar, daß die räumlichen Komponenten
der relativistischen Bewegungsgleichung (6.8) für v/c ≪ 1 zu den klassischen
Newtonschen Gleichungen werden. Der Vorteil der Viererkraft F gegenüber der
relativistischen Kraft F~ (r) ist, daß sie sich von einem zum anderen Bezugssystem
mit der Lorentzstransformation transformiert. Außerdem läßt sich die Lorentzinvarianz aller mit der Viererkraft formulierten Gesetze einfach überprüfen (siehe
oben). Der Nachteil besteht darin, daß sie durch die Ableitung des Impulses
bezüglich der Eigenzeit gegeben ist, während F~ (r) durch die Ableitung bezüglich
der Zeit irgendeines Bezugssystems (nicht nur des Ruhesystems) definiert ist. Da
wir meist an der Bewegung eines Teilchens bezüglich eines bestimmten Bezugssystems (welches meist nicht das Ruhesystem sein wird) interessiert sind, ist die
relativistische Kraft F~ (r) praktisch meist nützlicher als die Viererkraft F .
Wir wollen im Rahmen dieser Vorlesung darauf verzichten, ausführlich eine
Lagrangsche Formulierung der relativistischen Mechanik zu diskutieren. Es ist
dabei für eine konservative (und geschwindigkeitsunabhängige) Kraft mit Potential V (r) leicht, eine Lagrangefunktion L anzugeben, aus der sich die für konkrete
Rechnungen wichtige Bewegungsgleichung (6.6) gemäß der Lagrangeschen Gleichung (i = 1, 2, 3)
d ∂L
∂L
−
=0
dt ∂vi ∂xi
ergibt. Eine geeignet Lagrangefunktion wäre in diesem Fall z.B.
p
L = −mc2 1 − β 2 − V (r) .
Leider hat diese Lagrangefunktion jedoch noch nicht die gewünschten Transformationseigenschaften gegenüber der Lorentztransformation, da sie kein Viererskalar ist. Somit ist die obige Überlegung, die auf ein L führt, nur der erste Schritt
auf dem Weg hin zu einer relativistischen Erweiterung der Lagrangeschen Mechanik.