11 Lagrangesche Mechanik

11 Lagrangesche Mechanik
Tatsächlich lässt sich der Impuls eines Teilchens aus seiner Energie ableiten, und zwar im
wahrsten Sinne des Wortes. Stellen wir die Geschwindigkeit des Teilchens der Masse m in einem
kartesischen Koordinatensystem durch v = vi ei dar, so ist seine kinetische Energie
In diesem Kapitel werden wir den ersten Schritt zu einer allgemeinen Formulierung aller heute bekannten fundamentalen physikalischen Theorien machen. Allerdings ist dieser erste Schritt
sehr bescheiden. Wir werden im Prinzip nichts anderes tun als die Newtonschen Bewegungsgleichungen in einer mathematisch etwas anspruchsvolleren, “geometrischen” Form aufzuschreiben.
Diese neue Formulierung der Newtonschen Mechanik wurde im 18. Jahrhundert entwickelt
und geht im wesentlichen auf d’Alembert, Lagrange und Euler zurück. Sie ist begrifflich sehr viel
abstrakter als die Newtonsche Formulierung, bietet aber eine Reihe von praktischen und konzeptionellen Vorteilen. Ein wichtiger, ganz pragmatischer Vorteil ist, dass sich typische mechanische
Systeme, wie sie in technischen Anwendungen auftreten, sehr viel effizienter berechnen lassen
als mit den Newtonschen Mitteln.
Eine andere, für die theoretische Physik besonders wichtige Eigenschaft der neuen Formulierung ist, dass sich mit ihr viele allgemeine Sätze beweisen lassen, mir deren Hilfe sich Aussagen
über die Lösungen von Bewegungsgleichungen machen lassen, auch wenn man diese nicht explizit angeben kann. Der wohl wichtigste derartige Satz ist das Noether-Theorem, wonach es einen
Zusammenhang zwischen den Symmetrien eines Systems und seinen Erhaltungsgrößen. Bis wir
zu diesem zentralen Theorem kommen, müssen wir uns allerdings erst mit einigen neuen Begriffen vertraut machen.
Die Methoden, die wir hier entwickeln werden, lassen sich weit über die Mechanik hinaus auch
in anderen Teilgebieten der Physik anwenden. Daher werden uns die Begriffe, die wir in diesem
Kapitel einführen, fast überall wieder begegnen. Wie schon angedeutet, geht dies sogar so weit,
dass sich alle heute als fundamental angesehenen Theorien in dieses Schema einordnen lassen.
Einen Hinweis darauf, dass zum Beispiel auch die Elektrodynamik eine solche Formulierung
zulässt, wird sich am Ende dieses Kapitels ergeben. Ansonsten werden wir uns hier jedoch nur
mit mechanischen Systemen beschäftigen.
T =
1
1
m v · v = m v i vi .
2
2
(11.1)
Es ist üblich, die Funktion, die der Geschwindigkeit die kinetische Energie zuordnet, mit T zu bezeichnen. Wenn wir sie partiell nach den Komponenten der Geschwindigkeit ableiten, bekommen
wir
∂T
= m vi = pi ,
(11.2)
∂vi
also die Komponenten des Impulses. Der Impuls ist die Ableitung der Energie nach der Geschwindigkeit.
Das lässt sich verallgemeinern. Für ein System von N Teilchen mit Massen m n ist die gesamte
kinetische Energie eine Funktion der Geschwindigkeiten vn = vn,i ei der einzelnen Teilchen,
T =
1X
1X
m n vn · v n =
mn vn,i vn,i .
2 n
2 n
(11.3)
Die Funktion T hängt jetzt von 3 N reellen Variablen ab, nämlich den Komponenten der Geschwindigkeiten vn,i , mit n ∈ {1, . . . , N } als Teilchenindex und i ∈ {x, y, z} als Vektorindex.
Für Vektorindizes soll wieder die Summenkonvention gelten, und da wir eine Orthonormalbasis
verwenden, können wir alle Indizes nach unten schreiben.
Bilden wir nun wieder die partiellen Ableitungen der Funktion T , so finden wir
∂T
= mn vn,i = pn,i .
∂vn,i
(11.4)
Das sind die Komponenten des Impulses des Teilchens Nummer n. Wir können auf diese Weise
durch Ableiten der kinetischen Energie eines Systems von beliebig vielen Teilchen jedem einzelnen Teilchen seinen Impuls zuordnen.
Energie und Impuls
Bei der allgemeinen Diskussion der Newtonschen Bewegungsgleichungen für ein System von
Punktteilchen hatten wir die Impulse der Teilchen als nützlich Hilfsgrößen eingeführt. Damit
konnten wir ein System von Differenzialgleichungen zweiter Ordnung in ein System erster Ordnung überführen. Außerdem gab es für Systeme ohne äußere Kräfte einen Erhaltungssatz für den
Gesamtimpuls, also für die Summe der Impulse aller Teilchen. Das konnten wir verwenden, um
die Bewegungsgleichungen weiter zu vereinfachen und um deren Lösungen zu klassifizieren.
Den Impuls hatten wir als das Produkt von Masse und Geschwindigkeit definiert, weil so seine
Zeitableitung durch die Kraft gegeben war, die auf ein Teilchen einwirkt. Wir wollen nun zeigen,
dass es noch eine alternative Definition der Größe “Impuls” gibt. Diese wird sich später als sehr
viel allgemeiner erweisen. Sie ist weit über die Mechanik hinaus anwendbar. Sie gibt dem Begriff
“Impuls” eine ähnlich wichtige Bedeutung wie etwa dem Begriff “Energie”, der ja auch in allen
Bereichen der Physik von zentraler Bedeutung ist.
Der Impuls eines Teilchens ist die Ableitung der kinetischen Energie nach der Geschwindigkeit dieses Teilchens.
27
Wie sich gleich zeigen wird, ist es an dieser Stelle ganz wesentlich, dass es sich um eine Funktion
T handelt, die von den Geschwindigkeiten aller Teilchen abhängt. Die Funktion T ist also dem
System als ganzes zugeordnet, nicht den einzelnen Teilchen.
Die Bewegungsgleichungen lassen sich nun wie folgt formulieren. Die Teilchen bewegen sich
auf Bahnen rn (t), oder in kartesischen Koordinaten rn,i (t). Dann ist natürlich vn (t) = ṙn (t)
bzw. vn,i (t) = ṙn,i (t), und somit
∂T ∂T
=
(t).
(11.5)
pn,i (t) =
∂vn,i vn =ṙn (t)
∂ ṙn,i
Der Ausdruck ist so zu verstehen, dass wir erst die Funktion T nach v n,i ableiten, und dann
diese Funktion für vn = ṙn (t) auswerten, also die gegebene Bahnkurve einsetzen, so dass der
Ausdruck zu einer Funktion der Zeit wird. Um die Notation etwas zu verkürzen, schreiben wir
dafür auch einfach ∂T /∂ ṙn,i .
Jetzt müssen wir den Impuls nur noch nach der Zeit ableiten und mit der Kraft gleichsetzen,
d ∂T
ṗn,i (t) =
(t) = Fn,i (t).
(11.6)
dt ∂ ṙn,i
Der Konfigurationsraum besteht aus allen möglichen Anordnungen der Teilchen im Ortsraum,
das heißt aus allen möglichen Konfigurationen von N Teilchen. Einen Punkt in diesem Raum bezeichnen wir mit q ∈ Q, und seine Koordinaten mit q µ , wobei µ ein laufender Index ist, der 3 N
Werte annimmt. Um die Beziehung zu den einzelnen Teilchen deutlich zu machen, können wir als
Indexmenge die Symbole µ ∈ {x1 , y1 , z1 , x2 , y2 , z2 , . . . , xN , yN , zN } verwenden. Wir können
die Koordinaten aber auch einfach von 1 bis 3 N durchnummerieren. Wir sagen, dass ein System aus N Teilchen 3 N Freiheitsgrade besitzt. Die Zahl der Freiheitsgrade eines mechanischen
System ist die Dimension des Konfigurationsraumes, dim Q = 3 N .
Wir schreiben den Index bei q µ nach oben, weil der Konfigurationsraum im allgemeinen kein
metrischer Raum ist. Wir können zwar den Abstand zwischen zwei Punkten oder zwei Teilchen
im Ortsraum messen. Es ist aber eine völlig andere Frage, was unter dem “Abstand” von zwei
verschiedenen Konfigurationen von N Teilchen zu verstehen ist. Jedenfalls gibt es keine unmittelbar auf der Hand liegende Antwort auf die Frage, wie weit zwei Konfigurationen voneinander
entfernt sind. Es gibt auf dem Konfigurationsraum keine Metrik, folglich auch keine kartesischen
Koordinaten, und deshalb müssen wir zwischen Vektoren und dualen Vektoren unterscheiden.
Wie wird nun die Zeitentwicklung des Systems beschreiben? Offenbar durch eine Bahn q(t) im
Konfigurationsraum Q, die zu jedem Zeitpunkt angibt, welche Konfiguration das System gerade
einnimmt. Sie wird explizit durch die Koordinatenfunktionen q µ (t) dargestellt. Das ist eine parametrisierte Kurve in einem affinen Raum. Wir können daher den Tangentenvektor q̇(t) bilden,
dessen Komponenten durch die Ableitungen q̇ µ (t) gegeben sind. Dies ist ein Vektor in dem zugeordneten Vektorraum TQ des Konfigurationsraumes Q. Um die Sprechweise möglichst einfach
zu halten, nennen wir q(t) den Ort und q̇(t) die Geschwindigkeit des Systems zum Zeitpunkt t.
Wir fassen quasi alle Orte der Teilchen zu einem Ort in Q zusammen, und alle Geschwindigkeiten
der Teilchen zu einem Geschwindigkeitsvektor in TQ.
Die oben eingeführte alternative Formulierung der Bewegungsgleichungen für ein System aus
N Teilchen stellt sich jetzt wie folgt dar. Zuerst definieren wir die kinetische Energie als Funktion
der Geschwindigkeiten der Teilchen, das heißt als Funktion eines Vektors q̇ ∈ TQ. Sie ist eine
quadratische Funktion der Komponenten q̇ µ , die sich ganz allgemein wie folgt schreiben lässt,
Die Kräfte Fn = Fn,i ei sind in der Regel als Funktionen der Orte und der Geschwindigkeiten
gegeben. Setzen wir wieder die Bahnen rn (t) ein, so ergibt sich eine Funktion der Zeit, die die
Ableitung des Impulses nach der Zeit bestimmt. Die Gleichungen (11.6) bilden dann ein System
von 3 N gekoppelten Differenzialgleichungen zweiter Ordnung für die Koordinatenfunktionen
rn,i (t). Dies sind natürlich die bekannten Newtonschen Bewegungsgleichungen.
Auf den ersten Blick scheint damit nicht viel gewonnen zu sein. Genau genommen sehen die
Gleichungen (11.6) sogar ziemlich kompliziert aus, nicht zuletzt wegen der etwas verschachtelten
Ableitungen. Was allerdings auffällt, ist, dass die Massen mn anscheinend aus den Bewegungsgleichungen verschwunden sind. Natürlich sind sie nicht wirklich verschwunden. Aber sie gehen
jetzt nur noch implizit über die Definition der Funktion T ein.
In den Newtonschen Formulierung der Bewegungsgleichungen ist die Masse ein Maß für die
Trägheit eines Teilchens, also das Verhältnis von Impuls zu Geschwindigkeit. Hier ist die Masse statt dessen ein Maß für die kinetische Energie, die ein bewegtes Teilchen besitzt, und der
Impuls ist definiert als die Ableitung der Energie nach der Geschwindigkeit. Das ändert an den
mathematischen Zusammenhängen zwischen diesen Größen nichts, bietet aber eine alternative
Interpretation der Begriffe.
Aufgabe 11.1 Wir nehmen an, dass die Kräfte konservativ sind und nur von den Orten der Teilchen abhängen. Dann existiert ein Potenzial V, das eine Funktion der Orte r n ist, und die Kraft
Fn ist der negative Gradient von V bezüglich des Ortes rn . Folglich gelten die Bewegungsgleichungen
∂V
d ∂T
(t) = Fn,i (t) = −
(t).
(11.7)
dt ∂ ṙn,i
∂rn,i
T =
Andererseits wissen wir, dass in diesem Fall die Energie E = T + V eine Erhaltungsgr öße ist.
Man zeige, dass sich dies aus (11.7) ergibt, wobei man nur annehmen muss, dass die Funktion T
rein quadratisch ist, also homogen vom Grad 2 in den Komponenten den Geschwindigkeiten.
1
Mµν q̇ µ q̇ ν .
2
(11.8)
Die 3 N ×3 N -Matrix Mµν ist die Massenmatrix des Systems. Für den hier beschriebenen Fall
hat sie eine einfache Diagonalform


m1
m1
0




m1


.

.
..
Mµν = 
(11.9)



m
N


0
mN
mN
Der Konfigurationsraum
Die Bewegungsgleichungen in der Form (11.6) lassen sich etwas einfacher darstellen, wenn wir
das folgende neue Konzept einführen. Wir fassen die Ortskoordinaten r n,i aller N Teilchen als
Koordinaten eines Punktes in einem 3 N -dimensionalen Raum auf. Diesen Raum nennen wir den
Konfigurationsraum des Systems, und wir bezeichnen ihn mit Q.
28
Ihre Einträge sind die Massen der einzelnen Teilchen, wobei jede Masse genau dreimal auftritt, entsprechend den drei Komponenten der Geschwindigkeit, die zu diesem Teilchen gehören.
Schreibt man die Summe über µ und ν in (11.8) explizit aus, so findet man wieder den Ausdruck
(11.3).
Dass wir die Massen zu einer Matrix mit zwei unteren Indizes zusammengefasst haben, ist
im wesentlichen dadurch motiviert, dass sich diese Matrix nun wie ein symmetrischer Tensor
der Stufe (0, 2) auf dem Konfigurationsraum Q verhält. Durch (11.8) wird eine symmetrische,
bilineare Abbildung M : TQ × TQ → R definiert, so dass T = M (q̇, q̇)/2 ist. Wir werden
darauf gleich noch näher eingehen.
Im nächsten Schritt definieren wir die Impulse, indem wir die partiellen Ableitungen der Funktion T nach den Komponenten q̇ µ der Geschwindigkeit bilden. Das ergibt
pµ =
∂T
= Mµν q̇ µ .
∂ q̇ µ
Kräfte nur vom Ort abhängen, gilt
Fµ =
d ∂T
µ (t) = Fµ (t).
dt ∂ q̇
⇒
ṗµ (t) =
∂V
d ∂T
(t)
= µ (t).
dt ∂ q̇ µ
∂q
(11.12)
Damit hier die rechte und die linke Seite der Gleichung zusammenpassen, muss auf beiden Seiten
ein dualer Vektor stehen. Das ist auch der Fall, und es impliziert, dass auch der Impuls in dualer
Vektor sein muss.
Damit haben wir bereits die wichtigsten Begriffe eingeführt, die wir zur systematischen Beschreibung eines allgemeinen mechanischen Systems benötigen.
Die Konfiguration eines mechanischen Systems wird durch einen Punkt im Konfigurationsraum dargestellt. Die Geschwindigkeit ist ein Vektor, Impuls und Kraft
sind duale Vektoren in diesem Raum.
(11.10)
Um ein konkretes mechanisches System zu beschrieben, benötigen wir zwei Informationen über
das System. Wir müssen erstens wissen, wie die Geschwindigkeiten mit den Impulsen zusammenhängen. Dies geschieht durch die Abgabe der Funktion T , die die kinetische Energie als
Funktion der Geschwindigkeiten darstellt. Für ein N -Teilchen-System bedeutet das im wesentlichen, dass wir die Massen der Teilchen kennen müssen. Und wir müssen natürlich zweitens
wissen, wie die Kraft F konkret als Funktionen des Ortes q, der Geschwindigkeit q̇ und der Zeit
t gegeben ist. Für ein System mit Potenzialkräften ist das äquivalent zur Angabe der Potenzialfunktion V.
Wie man leicht durch Einsetzen der Matrix (11.9) bestätigt, sind das die 3 N Komponenten der
Impulse der einzelnen Teilchen. Diese können wir wieder zu einem 3 N -dimensionalen Vektor
zusammenfassen. Aus (11.10) ergibt sich jedoch, dass die Komponenten p µ ihren Index unten
tragen. Folglich ist die Geschwindigkeit q̇ ∈ TQ ein Vektor, während der Impuls p ∈ T∗ Q des
Systems ein dualer Vektor ist.
Da die Kraft die Zeitableitung des Impulses ist, muss auch das ein dualer Vektor F ∈ T ∗ Q
sein. Es gilt, in Komponenten aufgeschrieben,
ṗµ (t) =
∂V
∂q µ
Aufgabe 11.2 Man betrachte ein System aus drei Teilchen mit Massen m 1 , m2 und m3 , die sich
gegenseitig durch Gravitationskräfte anziehen. Wie sieht in diesem Fall das Potenzial aus? Man
mache sich an diesem Beispiel klar, dass es sich um eine reelle Funktion V auf einem neundimensionalen Raum Q handelt.
(11.11)
Genau wie die Komponenten pµ des Impulses p ergeben sich die 3 N Komponenten Fµ der Kraft
F aus den ursprünglichen Komponenten Fn,i dadurch, dass wir sie einfach nur neu nummerieren. Wir fassen den Teilchenindex n und den Vektorindex i zu einem einzigen Vektorindex µ
zusammen, der 3 N Werte annimmt.
Inhaltlich ändert sich an den Bewegungsgleichungen nichts. Es handelt sich noch immer um ein
Gleichungssystem für 3 N unbekannte Funktionen, nur dass wir diese jetzt mit q µ (t) bezeichnen.
Die Kraft F ist typischerweise als Funktion des Ortes q und der Geschwindigkeit q̇ gegeben, und
sie kann natürlich auch explizit von der Zeit abhängen. Erst durch Einsetzen einer Bahn q(t) wird
daraus eine Funktion, die nur noch von der Zeit anhängt. Das gleiche gilt für den Impuls. Die
partielle Ableitung ∂T /∂ q̇ µ ist eine Funktion der Geschwindigkeit q̇, und durch Einsetzen einer
Bahn q(t) wird sie zu einer Funktion der Zeit.
Dass Kraft und Impuls duale Vektoren auf dem Konfigurationsraum sind, lässt sich auch noch
auf eine ganz andere Weise erklären. Für konservative Systeme ist die Kraft der Gradient des Potenzials. Die potenzielle Energie eines N -Teilchen-Systems ist eine Funktion der Orte der Teilchen, also eine skalare Funktion V auf dem Konfigurationsraum. Folglich ist der Gradient davon
ein dualer Vektor, oder genauer ein duales Vektorfeld auf Q. Für konservative Systeme, deren
Aufgabe 11.3 Die Massenmatrix Mµν eines mechanischen Systems ist symmetrisch und positiv,
da die kinetische Energie stets positiv ist und nur dann gleich Null, wenn alle Teilchen ruhen.
Man kann sie daher als Metrik auf dem Konfigurationsraum interpretieren, der dadurch zu einem
metrischen affinen Raum wird. Wenn man dies tut, welche anschauliche Vorstellung verbindet sich
dann mit dem Abstand von zwei Konfigurationen? Wann liegen zwei gegebene Konfigurationen
nahe beieinander, wann sind sie weit voneinander entfernt?
Ein einfaches Beispiel
Um den Begriff des Konfigurationsraumes etwas besser zu verstehen, betrachten wir ein einfaches
Beispiel. Zwei Teilchen wechselwirken miteinander durch eine linear vom Abstand abhängende
Kraft. Es handelt sich im wesentlichen um einen harmonischen Oszillator, der aus zwei Teilchen
besteht. Um das ganze so einfach wie möglich zu halten, und um das Ergebnis auch grafisch
darstellen zu können, sollen sich die Teilchen nur in eine Raumrichtung bewegen. Dadurch sparen
29
wir uns das Ausschreiben einiger Indizes, verlieren jedoch keine wesentlichen Aspekte von dem,
worum es hier gehen soll.
Es seien also m1 und m2 die Massen der beiden Teilchen, q 1 und q 2 ihre Ortskoordinaten,
und q̇ 1 und q̇ 2 die Geschwindigkeiten. Die Orte q µ , mit µ ∈ {1, 2}, sind die Koordinaten eines
Punktes q ∈ Q, wobei der Konfigurationsraum Q ein zweidimensionaler affiner Raum ist. Die
Geschwindigkeiten q̇ µ sind entsprechend die Komponenten eines Vektors q̇ ∈ TQ.
Für die kinetische und die potenzielle Energie setzen wir
1
1
T = m1 (q̇ 1 )2 + m2 (q̇ 2 )2 ,
2
2
1
V = κ (q 1 − q 2 )2 ,
2
wobei wir die Abkürzungen
m+ = m 1 + m 2 ,
∂T
p2 = 2 = m2 q̇ 2 ,
∂ q̇
p+ =
(11.13)
∂V
= κ (q 2 − q 1 ),
∂q 1
F2 = −
∂V
= κ (q 1 − q 2 ).
∂q 2
ṗ2 = F2
⇒
m1 q̈ 1 = κ (q 2 − q 1 ),
m2 q̈ 2 = κ (q 1 − q 2 ).
(11.14)
(11.15)
ṗ+ = F+ ,
q2 = q+ −
m1
q− .
m1 + m 2
(11.16)
(11.18)
Da es sich um eine lineare Transformation handelt, gelten die gleichen Umrechnungsformel auch
für die Geschwindigkeiten. Wir müssen nur alle q’s mit einem Punkt versehen, oder einfach die
Gleichungen (11.17) und (11.18) nach der Zeit ableiten. Nach einer kurzen Rechnung findet man
dann die folgenden neuen Ausdrücke für die kinetische und die potenzielle Energie,
T =
1
1
m+ (q̇ + )2 + m− (q̇ − )2 ,
2
2
V=
1
κ (q − )2 ,
2
∂T
= m− q̇ − ,
∂ q̇ −
(11.21)
∂V
= 0,
∂q +
F− = −
∂V
= −κ q − .
∂q −
(11.22)
ṗ+ = F+
⇒
m+ q̈ + = 0,
m− q̈ − = −κ q − .
(11.23)
Die Lösungen dieser Gleichungen können wir sofort angeben. Für q + müssen wir eine
gleichförmige Bewegung einsetzen, das heißt das System bewegt sich mit konstanter Geschwindigkeit in Richtung der q + -Achse. In Richtung der q − -Achse finden wir eine harmonische Oszillation mit der Eigenfrequenz ω 2 = κ/m− .
Was haben wir bei dieser Herleitung anders gemacht als früher, als wir ein solches System
schon einmal im Rahmen der Newtonschen Mechanik diskutiert haben? Der wesentliche Unterschied liegt darin, dass wir an keiner Stelle die Bewegungsgleichungen selbst transformiert haben.
Wir haben nicht die Definitionen (11.18) der neuen Koordinaten in die Bewegungsgleichungen
(11.16) eingesetzt. Statt dessen haben wir nur die zwei Größen, von denen wir ausgegangen sind,
nämlich die Funktionen T und V, durch die neuen Koordinaten ausgedrückt.
In Abbildung 11.1(a) ist der zweidimensionale Konfigurationsraum Q mit der q 1 - und q 2 -Achse
dargestellt. Das Potenzial V(q) hängt nur von q 1 − q 2 ab, so dass die Linien mit V = konst
Geraden sind, die parallel zur Winkelhalbierenden verlaufen. Die Linien T = konst im Raum TQ
der Geschwindigkeiten sind Ellipsen, deren Halbachsen durch die Massen m 1 und m2 bestimmt
sind. Eine solche Ellipse ist in der Abbildung eingezeichnet.
Nun hatten wir gesehen, dass die Dynamik des Systems, also letztlich die Bewegungsgleichungen, eindeutig durch die beiden Funktion T und V bestimmt wird. Insbesondere ist das dynamische Verhalten des Systems völlig unabhängig davon, welche Koordinaten wir benutzen, um eine
explizite Rechnung durchzuführen. Die Dynamik des Systems ist ein Art geometrische Eigenschaft des Konfigurationsraumes, die unabhängig von der Wahl irgendeines Koordinatensystems
ist, genau wie die Geometrie des Ortsraumes als abstrakte Struktur unabhängig von den Koordinatensystemen ist, die wir verwenden, um den Raum zu beschreiben.
oder umgekehrt
m2
q− ,
m1 + m 2
p− =
Daraus lesen wir wieder die Bewegungsgleichungen ab. Sie haben sich ein wenig vereinfacht und
lauten nun
Wir wissen bereits, wie wir diese Gleichungen am einfachsten lösen können. Die Idee besteht im
wesentlichen darin, die Bewegung des Schwerpunktes von der relativen Bewegung der Teilchen
zu entkoppeln.
Das neue ist, dass wir dies nun als Koordinatentransformation auf dem Konfigurationsraum Q
auffassen können. Die Transformation, die hier zum Ziel führt, ist
m1
m2
q1 +
q2 ,
q− = q1 − q2 ,
(11.17)
q+ =
m1 + m 2
m1 + m 2
q1 = q+ +
∂T
= m+ q̇ + ,
∂ q̇ +
F+ = −
Die Teilchen ziehen sich mit einer linear mit dem Abstand ansteigenden Kraft an. Schließlich
ergeben sich aus dieser Gleichung und der vorigen die Bewegungsgleichungen
ṗ1 = F1 ,
(11.20)
und für die Komponenten der Kraft gilt jetzt
und für die Komponenten der Kraft gilt
F1 = −
m1 m2
m1 + m 2
für die gesamte und die reduzierte Masse eingeführt haben. Wiederholen wir jetzt die ganze Prozedur noch einmal, so finden wir die Impulse
wobei κ eine Federkonstante ist, die die Anziehungskraft zwischen den beiden Teilchen bestimmt.
Für die Impulse ergibt sich daraus, wie nicht anders zu erwarten ist,
∂T
p1 = 1 = m1 q̇ 1 ,
∂ q̇
m− =
(11.19)
30
q2
ne ganz andere “natürliche” Wahl der Koordinaten nahe legen, nämlich die Koordinaten (q + , q − ).
In diesen Koordinaten nehmen die beiden für die Dynamik relevanten Funktionen T und V eine
besonders einfache Form an.
Das Ziel der folgenden Überlegungen ist es deshalb, von der unmittelbaren physikalischen
Vorstellung Abstand zu nehmen, dass die Bewegungen eines mechanischen Systems im dreidimensionalen Ortsraum stattfinden. Statt dessen wollen wir den Konfigurationsraum als denjenigen Raum betrachten, in dem sich das System bewegt. Das ist der erste Schritt hin zu einer
Abstraktion, die es letztlich auch ermöglicht, ganz andere dynamische Systeme, wie etwa das
elektromagnetische Feld, mit den gleichen Methoden zu beschreiben und dabei die gleichen mathematischen Strukturen zu verwenden.
q+
replacements
(c)
(d)
q1
q−
(a)
(b)
Aufgabe 11.5 Es soll ein System von zwei Teilchen gleicher Masse m betrachtet werden, die
zusätzlich eine lineare rücktreibende Kraft von außen spüren. Diese soll eine Federkonstante κ
haben, die Wechselwirkung eine Federkonstante κ̃. Es ist dann
1
1
1
V = κ (q 1 )2 + (q 2 )2 + κ̃ (q 1 − q 2 )2 .
T = m (q̇ 1 )2 + (q̇ 2 )2 ,
(11.24)
2
2
2
Abbildung 11.1: Der Konfigurationsraum eines Zwei-Teilchen-Systems mit linearer Wechselwirkung. Die gestrichelten Geraden sind die Linien konstanter potenzieller Energie V = konst. Die
gestrichelte Ellipse ist eine Linie konstanter kinetischer Energie T = konst im Raum der Geschwindigkeiten. Die durchgezogene Linie ist eine typische Bahn. Die Koordinaten in (a) sind
den Teilchen angepasst, die Koordinaten in (b) den Eigenmoden des Systems.
Man finde eine lineare Transformation zu neuen Koordinaten (q + , q − ), so dass
1
1
1
1
V = κ+ (q + )2 + κ− (q − )2
(11.25)
m+ (q̇ + )2 + m− (q̇ − )2 ,
2
2
2
2
gilt. Man bestimme die Größen m± und κ± , und daraus die Eigenfrequenzen ω± des System.
Sind die neuen Koordinaten eindeutig bestimmt? Wenn nicht, welche Freiheiten gibt es bei der
Wahl?
T =
Wir können deshalb zu einem beliebigen anderen Koordinatensystem übergehen, das der Dynamik des Systems besser angepasst ist. Ein solches Koordinatensystem ist in Abbildung 11.1(b)
dargestellt. Die q + -Achse ist so gewählt, dass sie im Minimum des Potenzials liegt. Daher hängt
die Funktion V jetzt nur noch von q − ab, und zwar unabhängig davon, in welche Richtung die
q − -Achse zeigt. Aber auch für diese Achse gibt es eine bevorzugte Wahl. Sie ist so gelegt, dass
in dem quadratischen Ausdruck für T keine gemischten Terme auftreten, die das Produkt q̇ + q̇ −
enthalten.
Aufgabe 11.6 Man wiederhole die einzelnen Schritte in diesem Abschnitt f ür ein System von zwei
Teilchen, die sich im dreidimensionalen Raum bewegen. Um die Zerlegung in Schwerpunkt- und
Relativbewegung durchzuführen, hatten wir in Kapitel 3 den Schwerpunktimpuls (3.53) und den
relativen Impuls (3.54) eingeführt. Man zeige, dass diese Größen den hier definierten Impulsen
p+ und p− entsprechen.
Aufgabe 11.4 Man zeige, dass die lineare Transformation (11.17) durch diese beiden Forderungen an die neuen Koordinaten q + und q − bis auf Skalierungen eindeutig festgelegt ist. Die einzige Freiheit, die noch bleibt, ist eine Transformation q̃ + = α q + und q̃ − = β q − mit Konstanten
α, β 6= 0.
Aufgabe 11.7 Der Übergang zwischen den beiden Koordinatensystemen (q 1 , q 2 ) und (q + , q − )
ist eine affine Koordinatentransformation auf dem Konfigurationsraum Q. Man zeige, dass der
Impuls und die Kraft dabei wie duale Vektoren transformieren. Es gilt also
pα =
Das abstrakte Konzept des Konfigurationsraumes eines mechanischen Systems kann also bei der
Lösung der Bewegungsgleichungen hilfreich sein. Es zeigt nämlich, dass die Koordinaten, die
sich auf natürliche Weise aus der physikalischen Situation ergeben, nicht immer die sind, die
dem eigentlichen dynamischen Prozess am besten angepasst sind. In unserem Beispiel liegt es
durch die Beschreibung des Systems eigentlich auf der Hand, dass die “natürlichen” Koordinaten
diejenigen sind, die sich auf die beiden Teilchen beziehen, also (q 1 , q 2 ).
Lassen wir jedoch die physikalische Anschauung für einen Moment außer acht, und betrachten
nur die mathematischen Strukturen des Konfigurationsraumes Q, so stellen wir fest, dass diese ei-
∂q µ
pµ ,
∂q α
bzw. pµ =
∂q α
pα ,
∂q µ
mit µ ∈ {1, 2},
α ∈ {+, −},
(11.26)
und entsprechend für Fµ und Fα .
Aufgabe 11.8 Sowohl in (11.13) als auch in (11.19) lässt sich die kinetische Energie durch eine
Massenmatrix darstellen. Mit den Bezeichnungen aus Aufgabe 11.7 gilt f ür die Einträge dieser
Matrix in den beiden Koordinatensystemen
M11 = m1 ,
31
M22 = m2 ,
bzw. M++ = m+ ,
M−− = m− ,
(11.27)
Wenn T als quadratische Funktion durch eine Massenmatrix gegeben ist, ist die zweite Ableitung
genau diese Massenmatrix. Wir sehen, dass (11.29) nichts anderes ist als eine etwas ungewöhnliche Darstellung der Newtonschen Bewegungsgleichungen, wonach Masse mal Beschleunigung
gleich Kraft ist.
Es stellt sich daher die Frage, warum wir diese merkwürdige Formulierung überhaupt benutzen.
Die Bewegungsgleichung (11.30) sieht doch viel einfacher aus. Sie stellt über die Massenmatrix
eine Beziehung zwischen der Kraft F ∈ T∗ Q und der Beschleunigung q̈ ∈ TQ her, und beschreibt so die Bewegungen des Systems im Konfigurationsraum auf eine geometrische Art und
Weise, die zudem noch unabhängig von der Wahl der Koordinaten ist. Da alle drei beteiligten
Objekte wie Tensoren transformieren, gilt die Gleichung in jedem affinen Koordinatensystem.
Das haben wir gerade verwendet, um die Bewegungsgleichungen für einen zusammengesetzten
harmonischen Oszillator zu entkoppeln
Um die Bewegungsgleichungen für ein gegebenes mechanisches System aufstellen und lösen
zu können, genügt das jedoch meistens nicht. Wir müssen auch krummlinige Koordinatensysteme
verwenden. Das Zentralkraftproblem, und insbesondere das Keplersche Problem der Planetenbahnen, konnten wir zum Beispiel erst erfolgreich angehen, nachdem wir Kugelkoordinaten eingeführt hatten. In krummlinigen Koordinatensystem gilt jedoch die einfache Darstellung (11.30)
der Bewegungsgleichungen nicht mehr.
Zwar können wir die Massenmatrix Mµν auch in einem krummlinigen Koordinatensystem darstellen, wobei ihre Komponenten dann ortsabhängig werden. Um jedoch die Beschleunigung in
krummlinigen Koordinatensystemen darzustellen, benötigen wir eine kovariante Ableitung. Dies
hatten wir in Kapitel 10 und insbesondere in Aufgabe 10.26 gesehen. Es genügt nicht, einfach die
zweite Ableitung der Koordinatenfunktionen q µ (t) zu bilden.
Es stellt sich nun heraus, dass es sehr viel einfacher ist, die Gleichung (11.29) in ein krummliniges Koordinatensystem zu transformieren, als die scheinbar einfachere Gleichung (11.30). Wir
müssen dazu noch nicht einmal das Konzept der kovarianten Ableitung explizit verwenden, obwohl wir letztlich wieder eine solche bilden werden. Zudem ist das Ergebnis so allgemein, dass
wir von der kinetischen Energie noch nicht einmal annehmen müssen, dass sie homogen vom
Grad 2 ist, also quadratisch in den Geschwindigkeiten. Das wird sich später als nützlich erweisen, wenn wir sehr viel allgemeinere Bewegungsgleichungen betrachten.
Das Ziel ist nun, die Bewegungsgleichung (11.29) in einem krummlinigen Koordinatensystem
auf dem Konfigurationsraum Q darzustellen. Dazu sei weiterhin {q µ } ein affines Koordinatensystem, in dem die Gleichung in der angegebenen Form gelten soll. Die krummlinigen Koordinaten
bezeichnen wir mit {q α }. Oft nennt man diese auch verallgemeinerte oder generalisierte Koordinaten.
Die Unterscheidung zwischen den beiden Koordinatensystemen erfolgt, wie bisher auch, durch
zwei verschiedene Indexmengen. Für die affinen Koordinaten verwenden wir die Indizes µ, ν, . . .,
für die verallgemeinerten Koordinaten die Indizes α, β, . . .. Für ein N -Teilchen-System können
die Koordinaten q µ zum Beispiel die kartesischen Ortskoordinaten {x1 , y1 , z1 , . . . , xN , yN , zN }
der einzelnen Teilchen sein, und als verallgemeinerte Koordinaten q α können wir die Darstellun-
und alle anderen Komponenten sind jeweils Null. Man verifiziere, dass f ür diese Matrix das Transformationsverhalten für einen Tensor der Stufe (0, 2) gilt, also
Mαβ =
∂q µ ∂q ν
Mµν ,
∂q α ∂q β
(11.28)
wieder mit µ ∈ {1, 2} und α ∈ {+, −}.
Aufgabe 11.9 In Abbildung 11.1(a) stehen die Koordinatenachsen senkrecht aufeinander, in Abbildung 11.1(b) nicht. Hat dieser Umstand irgendeine Bedeutung?
Aufgabe 11.10 Ist in Abbildung 11.1 m1 oder m2 die größere Masse?
Verallgemeinerte Koordinaten
Wir kehren nun wieder zu der allgemeinen Situation zurück, die bei einem N -Teilchen-System
mit beliebigen Wechselwirkungen vorliegt. Die kinetische Energie T ist dann eine quadratische
Funktion der Geschwindigkeit q̇ ∈ TQ, und die Kraft ist ein dualer Vektor F ∈ T∗ Q, der
zunächst vom Ort q ∈ Q, der Geschwindigkeit q̇ ∈ TQ, und möglicherweise auch von der Zeit
t abhängt. Weitere Annahmen machen wir nicht. Insbesondere muss die Kraft nicht konservativ
sein.
Dann gelten, wie wir gezeigt haben, die Bewegungsgleichungen (11.11), also
d ∂T
= Fµ .
dt ∂ q̇ µ
(11.29)
Wir erinnern noch einmal daran, was die Notation bedeutet. Die linke Seite ist so zu verstehen,
dass wir zuerst die Funktion T als gewöhnliche Funktion der Komponenten q̇ µ der Geschwindigkeit betrachten, diese Funktion partiell ableiten, und dann die Bahn q(t) und ihre Ableitung q̇(t)
einsetzen. Dadurch wird der Ausdruck ∂T /∂ q̇ µ zu einer Funktion der Zeit, die wir dann wieder
nach t ableiten können.
Wir schreiben wie üblich die partiellen Ableitungen von Funktionen nach ihren Argumenten
mit einem geschwungenen ‘∂’. Dagegen ist die totale Zeitableitung ‘d/dt’ immer so zu verstehen,
dass wir den Ausdruck, auf den sie wirkt, entlang einer bestimmten Bahn q(t) auswerten, und
diese Funktion dann nach t ableiten. An dieser Stelle haben die Ableitungssymbole ‘∂’ und ‘d’
also wirklich unterschiedliche Bedeutungen.
Da dies im folgenden sehr wichtig ist, machen wir es uns noch einmal dadurch klar, dass wir
die Bewegungsgleichungen (11.29) etwas expliziter ausschreiben. Da die Funktion T und damit
auch die Ableitungen ∂T /∂ q̇ µ nur indirekt über q̇ µ (t) von der Zeit t abhängen, gilt natürlich die
Kettenregel, also
∂2T
∂ 2 T dq̇ ν
d ∂T = µ ν q̈ ν
µ =
µ
ν
dt ∂ q̇
∂ q̇ ∂ q̇ dt
∂ q̇ ∂ q̇
⇒
Mµν q̈ ν = Fµ .
(11.30)
32
gen derselben Orte in Kugelkoordinaten {r1 , ϑ1 , ϕ1 , . . . , rN , ϑN , ϕN } verwenden.
Die Umrechnung zwischen den beiden Koordinatensystemen erfolgt dadurch, dass wir die affinen Koordinaten q µ als Funktionen der verallgemeinerten Koordinaten q α darstellen. Um ein
möglichst allgemeines Ergebnis zu bekommen, lassen wir sogar zu, dass diese Funktionen explizit von der Zeit abhängen. Mit anderen Worten, wir können sogar zu jedem Zeitpunkt ein anderes
krummliniges Koordinatensystem verwenden. Die Übergangsfunktionen haben dann die Form
q µ = q µ {q α }, t .
(11.31)
In krummlinigen Koordinaten hängt die kinetische Energie vom den
Ortskoordinaten, den Komponenten der Geschwindigkeit und explizit von der
Zeit ab.
Am besten machen wir uns das wieder an einem Beispiel klar. Wir betrachten ein einzelnes Teilchen, das sich frei im Raum bewegt. Als affine Koordinaten q µ verwenden wir (x, y, z), und
als verallgemeinerte Koordinaten q α , um auch eine explizite Zeitabhängigkeit zu bekommen, rotierende Zylinderkoordinaten (r, ϕ, z). Die zeitabhängigen Übergangsfunktionen (11.31) sollen
explizit durch
x = r cos(ϕ − ω t),
y = r sin(ϕ − ω t)
(11.35)
Nun betrachten wir eine Bahn q(t) des Systems im Konfigurationsraum. In krummlinigen Koordinaten wird diese Bahn durch einen Satz von Funktionen q α (t) dargestellt. Folglich gilt für die
Darstellung derselben Bahn in affinen Koordinaten
q µ (t) = q µ {q α (t)}, t .
(11.32)
gegeben sein. Die Winkelgeschwindigkeit ω gibt an, wie schnell sich das Koordinatensystem
dreht. Die Koordinate z bleibt einfach unverändert. Sie spielt in den folgenden Überlegungen
keine Rolle. Wenn wir diese Gleichungen nach der Zeit t ableiten, finden wir
ẋ = ṙ cos(ϕ − ω t) − (ϕ̇ − ω) r sin(ϕ − ω t),
Wenn wir diese Gleichung nach der Zeit ableiten, finden wir die affinen Komponenten q̇ µ (t) der
Geschwindigkeit, ausgedrückt durch die verallgemeinerten Koordinaten q α (t) und deren Zeitableitungen q̇ α (t), den verallgemeinerten Geschwindigkeiten. Auf der rechten Seite müssen wir
dazu die partiellen Ableitungen der affinen Koordinaten nach den krummlinigen Koordinaten bilden, und zusätzlich die partielle Ableitung der Übergangsfunktionen nach der Zeit,
q̇ µ (t) =
α
∂q µ
∂q µ
α
{q α (t)}, t .
α {q (t)}, t q̇ (t) +
∂q
∂t
ẏ = ṙ sin(ϕ − ω t) + (ϕ̇ − ω) r cos(ϕ − ω t).
Das sind die explizit ausgeschriebenen Gleichungen (11.34) für dieses spezielle Beispiel. Die
rechten Seiten hängen nicht nur von den verallgemeinerten Geschwindigkeiten (ṙ, ϕ̇) ab, sondern
auch von den Koordinaten (r, ϕ) und sogar explizit von der Zeit t. Für die kinetische Energie
ergibt sich
1
1
T = m (ẋ2 + ẏ 2 + ż 2 ) = m (ṙ2 + r2 (ϕ̇ − ω)2 + ż 2 ).
(11.37)
2
2
Auch diese Funktion ist wieder quadratisch in den verallgemeinerten Geschwindigkeiten, aber sie
hängt zusätzlich von r ab, und sie enthält auch noch Terme, die proportional zu ω und ω 2 sind.
Das ist auch klar, denn die kinetische Energie eines Teilchens, dass in diesem Koordinatensystem
“ruht”, kreist ja in Wirklichkeit mit der Winkelgeschwindigkeit ω um den Ursprung.
(11.33)
Wir schreiben das etwas verkürzt in der Form
q̇ µ =
∂q µ α ∂q µ
q̇ +
.
∂q α
∂t
(11.36)
(11.34)
Der erste Term beschreibt wie üblich die Transformation eines Vektors von einem Koordinatensystem in ein anderes. Der zweite Term tritt auf, weil das krummlinige Koordinatensystem
zusätzlich von der Zeit abhängen kann. Wenn die Koordinaten q α (t) zeitlich konstant sind, so
bedeutet das nämlich nicht, dass die Teilchen ruhen, also die Konfiguration q(t) zeitlich konstant
ist.
Nun können wir die kinetische Energie T als Funktion der neuen Koordinaten ausdrücken.
Ursprünglich war T ({q̇ µ }) eine Funktion, die nur von den Komponenten q̇ µ der Geschwindigkeit
abhing. Da diese aber nun über (11.34) sowohl von den verallgemeinerten Geschwindigkeiten q̇ α
als auch von den verallgemeinerten Koordinaten q α und sogar der Zeit t abhängen, wird die
kinetische Energie jetzt zu einer Funktion T ({q α }, {q̇ α }, t).
Das ist letztlich nichts anderes als die weiter oben bereits gemachte Feststellung, dass die
Massenmatrix eines mechanischen Systems in krummlinigen Koordinaten ortsabhängig wird,
da es sich um die Darstellung eines Tensors in einem krummlinigen Koordinatensystem handelt. Da dieses Koordinatensystem zudem von der Zeit abhängt, ergibt sich zusätzlich noch eine
Zeitabhängigkeit.
Aufgabe 11.11 In welcher konkreten physikalischen Situation w ürde die Wahl eines solchen Koordinatensystems nahe liegen?
Aufgabe 11.12 Man ersetze in (11.35) ω t durch eine beliebige Funktion γ(t) und zeige, dass
sich dann auch eine explizit zeitabhängige Energiefunktion T ergibt.
Die d’Alembertschen Gleichungen
Wir wollen nun die Bewegungsgleichungen in krummlinigen Koordinaten darstellen. Da die kinetische Energie T ursprünglich nur eine Funktion der Geschwindigkeiten q̇ µ war, können wir die
partiellen Ableitungen von T nach q α und q̇ α durch die Ableitungen der ursprünglichen Funktion
T nach q̇ µ ausdrücken. Mit Hilfe der Kettenregel finden wir
∂T
∂T ∂ q̇ µ
∂T ∂q µ
.
α =
µ
α =
∂ q̇
∂ q̇ ∂ q̇
∂ q̇ µ ∂q α
33
(11.38)
Hier haben wir verwendet, dass aus (11.34) ∂ q̇ µ /∂ q̇ α = ∂q µ /∂q α folgt.
Die partiellen Ableitungen ∂q µ /∂q α , die in (11.38) vorkommen, sind die ortsabhängigen Übergangsmatrizen für die Koordinatentransformation von {q µ } nach {q α }. Wir haben also gezeigt,
dass sich die partiellen Ableitungen pα = ∂T /∂ q̇ α bzw. pµ = ∂T /∂ q̇ µ bei einer Koordinatentransformation wie die Komponenten eines dualen Vektors verhalten. Dies ist natürlich der
Impulsvektor p ∈ T∗ Q des Systems. Seine Komponenten pα bezüglich des krummlinigen Koordinatensystems werden auch als verallgemeinerte Impulse bezeichnet.
Die entsprechende Rechnung für die partiellen Ableitungen von T nach den Koordinaten q α ist
etwas komplizierter, da wir dazu die rechte Seite von (11.34) nochmal nach q α ableiten müssen.
Das ergibt
∂T ∂ q̇ µ
∂T ∂ 2 q µ
∂ 2 qµ ∂T
β
=
=
q̇
+
.
(11.39)
∂q α
∂ q̇ µ ∂q α
∂ q̇ µ ∂q α ∂q β
∂q α ∂t
Wenn wir nun dies und (11.42) in die Bewegungsgleichung (11.29) einsetzen, so lassen sich
diese schließlich wie folgt schreiben,
d’Alembertsche
Bewegungsgleichung
(11.40)
Auch das ist natürlich wieder so zu verstehen, dass wir zuerst die partiellen Ableitungen bilden,
dann eine Bahn q(t) einsetzen, die wir jetzt wahlweise durch die Koordinatenfunktionen q µ (t)
oder q α (t) darstellen können, und anschließend die totalen Zeitableitungen d/dt bilden.
Der erste Term in der Klammer ist genau der, den wir suchen, nämlich die linke Seite von
(11.29). Um den zweiten Term weiter umzuformen, benutzen wir, dass die affinen Koordinaten
q µ sowohl implizit über die krummlinigen Koordinaten als auch explizit von der Zeit abhängen.
Daher gilt
d ∂q µ
∂ 2 qµ
∂ 2 qµ
β
.
(11.41)
=
q̇
+
dt ∂q α
∂q α ∂t
∂q α ∂q β
d
dt
d
dt
Das ist aber genau der Ausdruck in der Klammer in (11.39). Wir finden also
d ∂T ∂q µ
d ∂T
∂T
.
α −
α =
dt ∂ q̇
∂q
dt ∂ q̇ µ ∂q α
(11.44)
Die in dieser Form dargestellten Bewegungsgleichungen für ein mechanisches System heißen d’Alembertsche Gleichungen. Bis auf den zusätzlichen Term auf der linken Seite, der die
Abhängigkeit der kinetischen Energie von den Koordinaten berücksichtigt, haben sie die gleiche
Form wie vorher die Gleichungen (11.29) in affinen Koordinaten. Und es gibt natürlich wieder
eine reelle Gleichung für jeden Freiheitsgrad des Systems.
Tatsächlich verschwindet der zusätzliche Term auf der linken Seite, wenn der Zusammenhang
zwischen q µ und q α affin und zeitunabhängig ist. Dann sind die neuen Geschwindigkeiten q̇ α
lineare Funktionen der alten Geschwindigkeiten q̇ µ , und somit hängt auch die kinetische Energie nur von q̇ α , aber nicht von q α ab. Die allgemeinere Form (11.44) gilt also auch für affine
Koordinatensysteme.
Um die Bewegungsgleichungen für ein spezielles mechanisches System auf diese Form zu
bringen, müssen wir nur zwei Dinge tun. Wir müssen die kinetische Energie T als Funktion der
verallgemeinerten Koordinaten und deren Zeitableitungen darstellen, und wir müssen dasselbe
mit der Kraft F tun. Bei der Kraft müssen wir zusätzlich beachten, dass es sich dabei um einen
dualen Vektor handelt. Wir müssen deshalb gemäß (11.43) den Index transformieren.
Um an unserem Beispiel von oben zu demonstrieren, dass die d’Alembertschen Gleichungen
tatsächlich die richtigen Bewegungsgleichungen sind, setzen wir für T die Funktion (11.37) ein.
Die Kraft soll der Einfachheit halber verschwinden, und wir setzen auch ω = 0. Das Zylinderkoordinatensystem soll also nicht rotieren. Dann ergeben sich nach einer kurzen Rechnung die
folgenden Bewegungsgleichungen
Wir wollen nun versuchen, die linke Seite der Gleichung (11.29) durch die krummlinigen Koordinaten auszudrücken. Als Ansatz bietet sich dazu an, die Zeitableitung von (11.38) zu bilden,
d ∂T ∂q µ d ∂T ∂q µ
∂T d ∂q µ d ∂T
.
α =
µ
α =
µ
α +
dt ∂ q̇
dt ∂ q̇ ∂q
dt ∂ q̇
∂q
∂ q̇ µ dt ∂q α
d ∂T
∂T
= Fα .
α −
dt ∂ q̇
∂q α
(11.42)
∂T
d
∂T
m ṙ − m r ϕ̇2 = 0,
−
=
∂ ṙ
∂r
dt
∂T
∂T
d
∂T
d
d ∂T
−
=
−
=
m r2 ϕ̇ = 0,
m ż = 0.
∂ ϕ̇
∂ϕ
dt
dt ∂ ż
∂z
dt
(11.45)
Das bemerkenswerte an diesem Beispiel ist, dass die beiden letzten Gleichungen ganz automatisch die entscheidenden Erhaltungssätze liefern, die wir benutzen können, um die Bewegungsgleichungen zu lösen. Es ist nämlich m ż = pz die Impulskomponente in z-Richtung, und
pϕ = m r2 ϕ̇ der Drehimpuls um die z-Achse. Beides sind natürlich für ein kräftefreies Teilchen
Erhaltungsgrößen.
Ebenfalls bemerkenswert ist, dass die Komponente pϕ = ∂T /∂ ϕ̇ des Impulses nach unserer neuen, allgemeinen Definition, wonach der Impuls die Ableitung der Energie nach der Geschwindigkeit ist, gerade der Drehimpuls ist, der einer Rotation in Richtung der Koordinaten ϕ
entspricht. Anscheinend passt sich der Begriff “Drehimpuls” sehr gut in dieses allgemeine Konzept ein. Darauf werden wir später aber noch im Detail eingehen.
Um das für die Bewegungsgleichung zu verwenden, multiplizieren wir diese mit der Übergangsmatrix ∂q µ /∂q α und setzen
∂q µ
Fα = α Fµ .
(11.43)
∂q
Die Größen Fα werden als verallgemeinerte Kräfte bezeichnet. Es sind die Komponenten des
Kraftvektors F ∈ T∗ Q, dargestellt in den krummlinigen Koordinaten. Die Gleichung (11.43)
beschreibt wieder das Transformationsverhalten eines dualen Vektors unter einer Koordinatentransformation.
34
Aufgabe 11.13 Man finde die allgemeine Lösung der Bewegungsgleichungen (11.45) und zeige,
dass sich in dem dargestellten Beispiel auch für ω 6= 0 aus den d’Alembertschen Gleichungen die
richtigen Bewegungsgleichungen für ein freies Teilchen ergeben.
Die d’Alembertschen Bewegungsgleichungen lauten jetzt
∂T
∂V
d ∂T
− α + α = 0.
dt ∂ q̇ α
∂q
∂q
Aufgabe 11.14 Welche physikalischen Dimensionen haben die verallgemeinerten Koordinaten
(r, ϕ, z) in dem gezeigten Beispiel? Welche physikalischen Dimensionen haben folglich die verallgemeinerten Impulse (pr , pϕ , pz ) und Kräfte (Fr , Fϕ , Fz ), wenn diese nicht gleich Null gesetzt
sind?
Da das Potenzial V nicht von der Geschwindigkeit abhängt, lässt sich das sogar noch einfacher
schreiben. Wir definieren eine Funktion
LagrangeFunktion
Aufgabe 11.15 Die kinetische Energie T sei eine homogene quadratische Funktion der verallgemeinerten Geschwindigkeiten q̇ α . Sie hänge nicht explizit von t, aber in irgendeiner Weise von
den verallgemeinerten Koordinaten q α ab. Man zeige, dass dann die zeitliche Änderung der kinetischen Energie durch die mechanische Leistung gegeben ist, die sich als Produkt von Kraft und
Geschwindigkeit ergibt,
dT
= F · q̇ = Fµ q̇ µ = Fα q̇ α .
(11.46)
dt
Warum kann die rechte Seite dieser Gleichung in jedem beliebigen Koordinatensystem ausgewertet werden?
Mit dieser Funktion können die d’Alembertschen Bewegungsgleichungen in einer sehr kompakten Form geschrieben werden, nämlich
LagrangeGleichung
d ∂L
∂L
− α = 0.
dt ∂ q̇ α
∂q
(11.51)
Die gesamte Dynamik eines mechanischen System wird somit durch eine einzige Funktion L
auf dem Konfigurationsraum beschrieben. Diese Funktion können wir in einem beliebigen Koordinatensystem darstellen, so dass die Lagrange-Gleichung (11.51) auch in jedem beliebigen
Koordinatensystem ausgewertet werden kann. Auch hier ergibt sich natürlich wieder eine reelle
Differenzialgleichung für jeden Freiheitsgrad, also für jeden Wert, den der Index α annehmen
kann.
Für die explizite Herleitung von Bewegungsgleichungen für mechanische System ist die
Lagrange-Funktion ein sehr effizientes Werkzeug. Wir wollen das am Beispiel des allgemeinen
Zentralkraftproblems demonstrieren. Ein Teilchen der Masse m befinde sich in einem Potenzial
V = V (r). Seine kinetische Energie, in Kugelkoordinaten ausgedrückt, ist
Die Lagrange-Funktion
Besonders einfach ist die Situation dann, wenn alle auftretenden Kräfte Potenzialkräfte sind. Dann
ist nämlich die Kraft der Gradient des Potenzials, und dann gilt natürlich in jedem Koordinatensystem, dass die Komponenten dieses dualen Vektors durch die partiellen Ableitungen nach den
Koordinaten gegeben sind. Explizit,
⇒
(11.50)
Die Lagrange-Funktion ist die Differenz von kinetischer und potenzieller Energie.
Die gerade durchgeführte Herleitung, bei der die Koordinaten q µ affin waren, ist also nur ein
Spezialfall von diesem allgemeinen Transformationsverhalten.
∂q µ
∂q µ ∂V
∂V
F α = α Fµ = − α
= − α.
∂q
∂q ∂q µ
∂q
L = T − V,
die auch wieder vom Ort, der Geschwindigkeit und eventuell explizit von der Zeit abhängt. Diese
Funktion heißt Lagrange-Funktion.
Aufgabe 11.16 Man zeige, dass sich die linke Seite der d’Alembertschen Gleichung wie ein dualer Vektor transformiert, und zwar beim Übergang von einem beliebigen krummlinigen Koordinatensystem zu einem beliebigen anderen. Man führe dazu einen zweiten Satz von krummlinigen
Koordinaten q µ ein, stelle diese als Funktionen von q α dar, und zeige
d ∂T
∂T
∂q µ d ∂T
∂T .
(11.47)
α −
α =
α
µ −
dt ∂ q̇
∂q
∂q
dt ∂ q̇
∂q µ
∂V
Fµ = − µ
∂q
(11.49)
T =
1
m ṙ2 + r2 ϑ̇2 + r2 sin2 ϑ ϕ̇2 .
2
(11.52)
Aufgabe 11.17 Wieso ergibt sich dieser Ausdruck unmittelbar aus der Darstellung (10.54) der
Euklidischen Metrik in Kugelkoordinaten?
(11.48)
Die Lagrange-Funktion für dieses System ist folglich
Das Potenzial kann dabei auch von t abhängen, und die Umrechnungsformel (11.48) gilt auch
dann, wenn die verallgemeinerten Koordinaten q α aus q µ durch eine zeitabhängige Transformation auseinander hervor gehen. In diesem Fall sind die Übergangsmatrizen ∂q µ /∂q α zwar
zeitabhängig, aber die Beziehung (11.48) gilt immer noch zu jedem Zeitpunkt.
L=T −V =
35
1
m ṙ2 + r2 ϑ̇2 + r2 sin2 ϑ ϕ̇2 − V (r).
2
(11.53)
L = L1 + L2 schreiben, wobei L1 nur von einem Teil der Koordinaten abhängt, und L2 nur
von den übrigen Koordinaten, so sind die beiden Sätze von Bewegungsgleichungen unabhängig
voneinander. Sie können unabhängig voneinander gelöst werden, so als würde es sich um zwei
voneinander getrennte mechanische System handeln.
Diese Funktion müssen wir jetzt nur noch in (11.51) einsetzen und die entsprechenden partiellen
Ableitungen bilden, um die Bewegungsgleichungen zu bekommen,
d
∂L ∂L
m ṙ − m r ϑ̇2 − m r sin2 ϑ ϕ̇2 + V 0 (r) = 0,
−
=
∂ ṙ
∂r
dt
d
∂L ∂L
=
m r2 ϑ̇ − m r2 sin ϑ cos ϑ ϕ̇2 = 0
−
∂ϑ
dt
∂ ϑ̇
d
d ∂L ∂L
m r2 sin2 ϑ ϕ̇ = 0.
−
=
dt ∂ ϕ̇ ∂ϕ
dt
d
dt
d
dt
Aufgabe 11.20 Man wende den Satz aus Aufgabe 11.19 auf ein System von zwei Teilchen an,
die sich frei im dreidimensionalen Raum bewegen und durch die Gravitationskraft anziehen. Welches sind hier die am besten geeigneten verallgemeinerten Koordinaten, in denen die LagrangeFunktion sogar in vier unabhängige Summanden zerfällt?
(11.54)
Kräfte und Potenziale
Aus der zweiten Gleichung entnehmen wir, dass diese für ϑ(t) = π/2 erfüllt ist. Es ist also
möglich, dass sich das Teilchen nur in der Äquatorebene aufhält. Tatsächlich genügt es dazu, die
Anfangsbedingungen ϑ(t0 ) = π/2 und ϑ̇(t0 ) = 0 zu wählen. Die erste und die dritte Gleichung
vereinfachen sich dann zu
d
m ṙ − m r ϕ̇2 + V 0 (r) = 0,
dt
d
m r2 ϕ̇ = 0.
dt
Die d’Alembertsche Formulierung der Bewegungsgleichungen können wir für jedes mechanische
System verwenden. Wir müssen nur, wenn wir ein krummliniges oder sogar zeitabhängiges Koordinatensystem verwenden, die Komponenten der Kräfte entsprechend in die verallgemeinerten
Kräfte umrechnen. Wir können dies tun, indem wir direkt die Teilchenkoordinaten r n,i bzw. die
Teilchenorte rn im dreidimensionalen Raum als Funktionen der krummlinigen Koordinaten q α
auf dem Konfigurationsraum darstellen, also
rn,i = rn,i {q α }, t
bzw. rn = rn {q α }, t .
(11.57)
(11.55)
Wir finden wieder die Drehimpulserhaltung pϕ = m r2 ϕ̇ = konst, und für die radiale Bewegungsgleichung können wir ein effektives Potenzial einführen,
m r̈ = −Ve 0 (r),
mit
pϕ2
Ve (r) = V (r) +
.
2 m r2
Hier ist n wieder der Teilchenindex, und i der Index für ein kartesisches Koordinatensystem im
dreidimensionalen Raum. Die verallgemeinerten Kräfte Fα ergeben sich dann aus der allgemeinen Formel (11.43), wobei wir die Summe über den Index µ aufspalten müssen in eine Summe
über die Teilchen n und eine Summe über die Vektorkomponenten i. Das ergibt
(11.56)
Was wir in Kapitel 8 erst durch mühsames Umrechnen der Koordinaten herleiten mussten, ergibt
sich hier ohne größeren Aufwand, indem wir einfach die Lagrange-Funktion in Kugelkoordinaten
darstellen.
Natürlich haben wir dafür schon ein wenig Vorarbeit geleistet, indem wir zum Beispiel die
Euklidische Metrik in Kugelkoordinaten dargestellt haben, so dass wir dies in (11.52) verwenden konnten. Trotzdem ist die Herleitung jetzt sehr viel einfacher. Denn wir haben hier nicht
nur, wie in Kapitel 8, die Bewegungsgleichungen für ein Teilchen in der Äquatorebene bekommen, sondern mit (11.54) auch die für ein Teilchen, das sich beliebig im Raum bewegt und eine
nicht verschwindende Geschwindigkeit ϑ̇ hat. Das wäre mit den Methoden in Kapitel 8 ungleich
schwieriger gewesen.
Fα =
X ∂rn,i
n
∂q
α
Fn,i =
X ∂rn
n
∂q α
· Fn .
(11.58)
Die Summe über den Vektorindex i können wir auch wieder als Skalarprodukt im Euklidischen
Raum schreiben. In dieser Form lassen sich die verallgemeinerten Kräfte oft am einfachsten berechnen.
Als Beispiel betrachten wir eine Reibungskraft als typisches Beispiel für eine Kraft, die sich
nicht aus einem Potenzial ableiten lässt. Das System bestehe aus nur einem Teilchen, und wir
benutzen Zylinderkoordinaten (r, ϕ, z). Der Ort des Teilchens ist dann
Aufgabe 11.18 Man zeige, dass der Ausdruck für pϕ = m r2 sin2 ϑ ϕ̇ in der letzten Gleichung
in (11.54) auch für ϑ 6= π/2 die z-Komponente des Drehimpulses des Teilchens ist.
r = o + r cos ϕ ex + +r sin ϕ ey , +z ez ,
(11.59)
wobei (ex , ey , ez ) eine Orthonormalbasis ist. Die kinetische Energie entnehmen wir aus (11.37),
indem wir dort ω = 0 setzen,
Aufgabe 11.19 Am Beispiel des gekoppelten harmonischen Oszillators von weiter oben, und
auch schon früher in Kapitel 6, hatten wir gesehen, dass eine nützlich Strategie zur Lösung
von Bewegungsgleichungen deren Entkoppelung ist. Man beweise folgenden allgemeinen Satz.
Lässt sich die Lagrange-Funktion eines mechanischen Systems als Summe von zwei Funktionen
T =
36
1
m (ṙ2 + r2 ϕ̇2 + ż 2 ).
2
(11.60)
Von der Kraft nehmen an, dass es sich um eine lineare Reibungskraft handelt. Sie soll proportional
zur Geschwindigkeit und ihr entgegengerichtet sein,
F = −η ṙ
Fα =
⇒
∂r
∂r
∂r ∂r
· F = −η α · ṙ = −η α · β q̇ β .
∂q α
∂q
∂q
∂q
Aufgabe 11.22 Man führe die gleiche Rechnung in Kugelkoordinaten aus. Welche verallgemeinerten Komponenten (Fr , Fϑ , Fϕ ) ergeben sich in diesem Fall für die die Reibungskraft?
Natürlich sind Zylinder- oder Kugelkoordinaten in diesem Fall nicht die am besten an das Problem
angepassten Koordinaten. Die Bewegungsgleichungen in kartesischen Koordinaten sind viel einfacher, da sie für eine lineare Reibungskraft unmittelbar entkoppeln. Wir können aber eine kleine
Variation an diesem Problem vornehmen, so dass das nicht mehr der Fall ist.
Das leicht veränderte Problem dient gleichzeitig als Beispiel für eine verallgemeinerte Form
der Bewegungsgleichungen, die sich als Kombination der d’Alembertschen und Lagrangeschen
Form ergibt. Da Kräfte additiv sind, können wir sie in konservative Kräfte und solche Kräfte
zerlegen, die sich nicht aus einem Potenzial ableiten lassen. Wir fassen dann alle konservativen Kräfte zu einem Potenzial V zusammen und definieren wie üblich eine Lagrange-Funktion
L = T − V. Dann müssen wir aber die nicht-konservativen Kräfte noch zusätzlich in die Bewegungsgleichungen aufnehmen, indem wir ihre verallgemeinerten Komponenten F α auf die rechte
Seite schreiben.
Als Kombination der Bewegungsgleichungen (11.44) und (11.51) ergibt sich dann
(11.61)
Die Summe über n in (11.58) ist hier trivial, da nur ein Teilchen vorhanden ist. Der letzte Ausdruck ergibt sich, indem wir die Geschwindigkeit ṙ mit Hilfe der Kettenregel als Funktion der
verallgemeinerten Geschwindigkeiten q̇ α ausdrücken. Die Skalarprodukte
gαβ =
∂r ∂r
∂ri ∂ri
∂ri ∂rj
·
= α β = α β δij
∂q α ∂q β
∂q ∂q
∂q ∂q
(11.62)
für α, β ∈ {r, ϕ, z} haben wir bereits einmal ausgerechnet. Das sind nämlich die Komponenten
der Metrik in Zylinderkoordinaten, die in kartesischen Koordinaten durch g ij = δij dargestellt
wird. Mit (10.49), um die Koordinate z ergänzt, ergibt sich
grr = 1,
gϕϕ = r2 ,
gzz = 1,
(11.63)
und alle anderen Komponenten sind gleich Null. Im Falle eines Ein-Teilchen-Systems wird
auf diese Weise natürlich auch auf dem Konfigurationsraum eine Metrik definiert, und diese
können wir in beliebigen krummlinigen Koordinatensystemen darstellen. Für die verallgemeinerten Kräfte ergibt sich daraus
Fα = −η gαβ q̇ β
⇒
Fr = −η ṙ,
Fϕ = −η r2 ϕ̇,
Fz = −η ż.
allgemeine
Bewegungsgleichung
L=T −V =
d
d
d
m ṙ = m r ϕ̇2 − η ṙ,
m r2 ϕ̇ = −η r2 ϕ̇,
m ż) = −η ż.
(11.65)
dt
dt
dt
Aufgabe 11.21 Man gebe die Lösung dieser Bewegungsgleichungen mit den Anfangsbedingungen
ṙ(0) = 0,
ϕ(0) = 0,
ϕ̇(0) = ω,
z(0) = 0,
ż(0) = v
(11.67)
Für V = 0 ist L = T , und es ergibt sich wieder die d’Alembertsche Formulierung. Für F α = 0
sind alle Kräfte konservativ, und es ergibt sich die Lagrangesche Formulierung.
Als Beispiel fügen wir zu unserem oben definierten Teilchen mit Reibungskraft ein Potenzial
V = V (r) hinzu, das nur vom Abstand von der z-Achse abhängen soll. In diesem Fall sind die
Zylinderkoordinaten etwas besser an das Problem angepasst, denn dann hängt das Potenzial nur
von einer Koordinate ab. Wir können uns als Realisierung eines solchen Systems ein elektrisch
geladenes Teilchen vorstellen, das sich in einem Medium, das eine Reibung verursacht, in der
Nähe eines geladenen Drahtes befindet.
Um die Bewegungsgleichungen in der Form (11.67) aufzuschreiben, müssen wir nur statt der
kinetischen Energie (11.60) die Lagrange-Funktion
(11.64)
Die verallgemeinerten Kräfte sind nicht einfach proportional zu den verallgemeinerten Geschwindigkeiten, sondern es tritt bei der ϕ-Komponente eine ortsabhängige Proportionalitätskonstante
auf. Dafür gibt es wieder eine einfache geometrische Erklärung. Die Kraft ist ein dualer Vektor, die Geschwindigkeit dagegen ein Vektor. Deshalb wird der Zusammenhang zwischen den
beiden durch die Metrik hergestellt, und deren Komponenten sind in krummlinigen Koordinaten
ortsabhängig.
Die linke Seite der d’Alembertschen Gleichung hatten wir bereits in (11.45) ausgerechnet. Auf
der rechten Seite steht jetzt die Kraft (11.64). Folglich ergeben sich für das Teilchen mit linearer
Reibung die Bewegungsgleichungen
r(0) = ρ,
d ∂L
∂L
= Fα .
α −
dt ∂ q̇
∂q α
1
m ṙ2 + r2 ϕ̇2 + ż 2 − V (r)
2
(11.68)
verwenden. Die Reibungskraft ist die gleiche wie vorher. Folglich ändert sich nur die Bewegungsgleichung für die Koordinate r, denn nur in sie geht die Ableitung des Potenzials ein. Es
genügt außerdem, nur die Bewegungsgleichungen für r und ϕ zu betrachten, da die Bewegung in
z-Richtung ohnehin entkoppelt,
(11.66)
d
m ṙ = m r ϕ̇2 − η ṙ − V 0 (r),
dt
an. Der Trick besteht auch hier darin, zuerst die Bewegungsgleichungen f ür den Drehimpuls
pϕ = m r2 ϕ̇ zu lösen. Es handelt sich zwar jetzt nicht mehr um eine Erhaltungsgr öße, aber
sie lässt sich dennoch lösen, und danach entkoppeln die übrigen Bewegungsgleichungen.
37
d
m r2 ϕ̇ = −η r2 ϕ̇.
dt
(11.69)
Aufgabe 11.23 Das Potenzial sei V (r) = κ r 2 /2, bewirke also eine lineare, rücktriebende Kraft.
Welche Lösung ergibt sich dann aus den Anfangsbedingungen (11.66)? Auch hier l ässt sie sich
wieder bestimmen, wenn man zuerst die unveränderte Bewegungsgleichung für den Drehimpuls
pϕ = m r2 ϕ̇ löst.
Alle drei Felder können zudem von der Zeit abhängen. Das ist offenbar die allgemeinste Funktion
L mit den verlangen Eigenschaften. Der spezielle Fall eines gewöhnlichen Teilchens der Masse m
in einem Potenzial V (r, t) ist darin enthalten. In diesem Fall müssen wir nur M ij (r, t) = m δij ,
Ai (r, t) = 0 und φ(r, t) = V (r, t) setzen.
Wie lauten nun die Bewegungsgleichungen, die sich aus (11.70) ergeben? Wir müssen dazu
nur die Gleichung (11.51) auswerten. Zunächst ist
Aufgabe 11.24 Es sei V (r) irgendeine monoton wachsende Funktion, so dass das Minimum des
Potenzials auf der z-Achse liegt. Man zeige, dass in diesem Fall jede Bewegung, unabh ängig von
den Anfangsbedingungen, früher oder später in der Nähe der z-Achse endet. Es gilt also r(t) → 0
für t → ∞.
∂L
= Mkj (r, t) ṙj + Ak (r, t).
∂ ṙk
Aufgabe 11.25 Man führe wieder die analogen Überlegungen in Kugelkoordinaten durch, wobei
das Potenzial in diesem Fall kugelsymmetrisch sein soll. Man zeige entsprechend, dass bei einem
monoton ansteigenden Potenzial V (r) das Teilchen stets in der N ähe des Ursprungs endet, also
auch hier r(t) → 0 für t → ∞ gilt.
Diese Größe müssen wir nach der Zeit ableiten, wobei wir jetzt beachten müssen, dass wir zuerst
für r eine Bahn r(t) einsetzen müssen, und dass wir zusätzlich die explizite Zeitabhängigkeit
der Felder Mij und Ai berücksichtigen müssen. Es genügt, den Ausdruck wie folgt teilweise mit
Hilfe der Kettenregel auszuwerten,
d
d ∂L
Mkj (r, t) ṙj + ∂i Ak (r, t) ṙi + ∂t Ak (r, t).
=
dt ∂ ṙk
dt
Die Lorentz-Kraft
Mit der Mischform (11.67) haben wir die allgemeinste Darstellung für die Bewegungsgleichungen eines mechanischen Systems in einem beliebigen krummlinigen Koordinatensystem angegeben. Wir wollen jetzt noch der Frage nachgehen, was das allgemeinste Kraftgesetz ist, das sich
allein aus einer Lagrange-Funktion ableiten lässt. Bisher hatten wir argumentiert, dass es dazu ein
Potenzial V geben muss, also eine Funktion des Ortes q ∈ Q, deren Gradient die Kraft ist.
Eine genauere Betrachtung zeigt jedoch, dass sich eine viel größere Klasse von Kräfte durch
eine Lagrange-Funktion beschreiben lässt. Interessanterweise sind es genau diejenigen Kräfte,
die wir als elektromagnetische Kräfte kennen. Das ist ein sehr bemerkenswerter Umstand, denn
es zeigt, dass es offenbar einen Zusammenhang zwischen der Lagrangeschen Formulierung der
Mechanik und anderen, fundamentalen physikalischen Theorien gibt.
Um herauszufinden, welche Arten von Kräften sich prinzipiell aus einer Lagrange-Funktion
ableiten lassen, betrachten wir irgendeine Funktion L, die ein Polynom vom Grad 2 in den Geschwindigkeiten ist, aber ansonsten beliebig vom Ort und der Zeit abhängt. Das ist natürlich noch
längst nicht die allgemeinste mögliche Lagrange-Funktion. Da aber für mechanische Systeme die
kinetische Energie immer eine quadratische Funktion der Geschwindigkeit ist, treten nur solche
Lagrange-Funktionen für physikalisch realistische Systeme auf.
Wir sind außerdem bescheiden und betrachten nur ein einzelnes Teilchen, also einen dreidimensionalen Konfigurationsraum, dessen Koordinaten wir mit ri bezeichnen. Dies seien die üblichen
kartesischen Koordinaten im Euklidischen Raum, so dass wir alle Indizes nach unten schreiben
können. Die Lagrange-Funktion lautet dann
L=
1
Mij (r, t) ṙi ṙj + Ai (r, t) ṙi − φ(r, t),
2
(11.71)
(11.72)
Als Abkürzungen haben wir hier ∂t für die partielle Ableitung ∂/∂t nach der Zeit verwendet, und
wie üblich ist ∂i die Ableitung ∂/∂ri nach den räumlichen Koordinaten.
Jetzt müssen wir noch den zweiten Term in der Bewegungsgleichung ausrechnen. Das ergibt
1
∂L
= ∂k Mij (r, t) ṙi ṙj + ∂k Ai (r, t) ṙi − ∂k φ(r, t).
∂rk
2
(11.73)
Wenn wir die Terme dann noch ein wenig ordnen, bekommen wir die Lagrange-Gleichung
1
d
Mkj ṙj − ∂k Mij ṙi ṙj = ∂k Ai − ∂i Ak ṙi − ∂k φ + ∂t Ak .
dt
2
(11.74)
Diese Gleichung können wir wie folgt interpretieren. Auf der linken Seite steht die Zeitableitung
des Impulses. Allerdings hängt der Impuls jetzt nicht mehr einfach nur linear mit der Geschwindigkeit zusammen, sondern über eine orts- und zeitabhängige Massenmatrix M ij .
Das ist etwas ungewöhnlich, aber zumindest im Prinzip können wir uns ja durchaus vorstellen, dass die Trägheit eines Teilchens keine feste Eigenschaft des Teilchen ist, sondern von Ort,
Zeit und sogar der Bewegungsrichtung im Raum abhängt. Genau dies wird durch die orts- und
zeitabhängige Massenmatrix Mij ausgedrückt, also durch den quadratischen Teil der LagrangeFunktion. Der zusätzliche Term auf der linken Seite ist derselbe, der sich auch in einem krummlinigen Koordinatensystem ergibt, wenn dort die Massenmatrix ortsabhängig ist.
Da die Kraft auf der rechten Seite der interessantere Aspekt der Bewegungsgleichung ist, setzen wir von nun an Mij = m δij , betrachten also ein “gewöhnliches” Teilchen mit der Masse m.
Auf der linken Seite der Bewegungsgleichung (11.74) steht dann m r̈ k , also Masse mal Beschleunigung. Die Kraft Fk auf der rechten Seite hängt aber immer noch vom Ort, der Geschwindigkeit
(11.70)
wobei Mij ein beliebiges symmetrisches Tensorfeld zweiter Stufe ist, Ai ein beliebiges Vektorfeld, und φ ein beliebiges skalares Feld, jeweils auf dem dreidimensionalen Euklidischen Raum.
38
Aufgabe 11.26 Aus der elementaren Elektrodynamik ist bekannt, dass sich die Felder E und B
nicht ändern, wenn wir die Potenziale φ und A wie folgt eichtransformieren,
und von der Zeit ab. Es ist also nicht einfach eine Potenzialkraft. Eine kurze Rechnung zeigt, dass
wir diese speziele Form einer Kraft bereits kennen. Definieren wir nämlich zwei neue Vektorfelder,
(11.75)
Bi = εijk ∂j Ak und Ei = ∂i φ + ∂t Ai ,
φ0 = φ −
dann gilt für die Kraft auf der rechten Seite von (11.74)
Fk = εkij ṙi Bj + Ek
oder F = ṙ × B + E.
q
1
m ṙ · ṙ + A(r, t) · ṙ − q φ(r, t)
2
c
(11.76)
L0 = L +
q
ṙ × B + q E,
c
mit B = ∇ × A,
E = −∇φ −
(11.77)
1
∂t A.
c
1
∂t B = 0,
c
∇ · B = 0.
q dΛ
c dt
(11.81)
Aufgabe 11.27 Man beweise folgenden allgemeinen Satz. Es sei L irgendeine LagrangeFunktion auf einem Konfigurationsraum Q, die nicht einmal quadratisch in den Geschwindigkeiten sein muss. Sie wird in einem beliebigen Koordinatensystem dargestellt als Funktion der
Ortskoordinaten q α , der Geschwindigkeiten q̇ α und der Zeit t. Eine zweite Lagrange-Funktion L0
sei definiert durch
dΛ
∂Λ
∂Λ
= L + α q̇ α +
,
(11.82)
L0 = L +
dt
∂q
∂t
(11.78)
Bemerkenswert an diesem Ergebnis ist nicht nur, dass die Lorentz-Kraft offenbar die allgemeinste Form einer Kraft ist, die sich für ein einzelnes Teilchen aus einer Lagrange-Funktion ableiten
lässt. Das eigentlich verblüffende ist, dass nur solche elektrische und magnetische Felder auftreten, die Lösungen der homogenen Maxwell-Gleichungen sind, für die also gilt
∇×E+
(11.80)
gegeben ist. Die Zeitableitung d/dt ist wie üblich so zu verstehen ist, dass wir die Funktion Λ erst
entlang einer Bahn auswerten, und das Ergebnis dann als Funktion von Ort und Geschwindigkeit
darstellen.
verwenden, um die Bewegungsgleichung mit den richtigen Konstanten zu bekommen, nämlich
m r̈ =
A0 = A + ∇Λ,
wobei Λ irgendeine Funktion von Ort und Zeit ist. Das ergibt sich auch durch Einsetzen unmittelbar aus (11.78). Die Lagrangefunktion L ändert sich jedoch, wenn wir diese Transformation
durchführen. Man zeige, dass die transformierte Funktion durch
Das ist die elektromagnetische Lorentz-Kraft. Nur die Ladungen und, je nach Wahl des Einheitensystems, die Lichtgeschwindigkeit fehlt in dieser Darstellung. Das lässt sich aber leicht beheben.
Hat das Teilchen eine Masse m und eine Ladung q, und verwenden wir das Gaußsche Maßsystem,
so müssen wir die Lagrange-Funktion
L=
1
∂t Λ,
c
wobei Λ irgendeine Funktion der Orte q α und der Zeit t ist. Dann ergeben sich aus L und L0
dieselben Bewegungsgleichungen (11.51). Verschiedene Lagrange-Funktionen L und L 0 führen
also auf die gleichen Bewegungsgleichungen, wenn sie sich nur um die totale Zeitableitung einer
Funktion Λ unterscheiden.
(11.79)
Denn genau diese Felder lassen sich durch ein elektrisches Potenzial φ und ein magnetisches
Vektorpotenzial A wie in (11.78) darstellen.
Es lassen sich also nicht nur Potenzialkräfte aus einer Lagrange-Funktion ableiten, sondern
auch geschwindigkeitsabhängige Kräfte, wenn sie die Form der Lorentz-Kraft haben. Dass dem
so ist, können wir an dieser Stelle nur feststellen. Dass es sich dabei um eine sehr tiefsinnige
Erkenntnis handelt, wird erst sehr viel später klar werden, wenn wir nämlich zeigen, dass sich
auch die Bewegungsgleichungen des elektromagnetischen Feldes, also die Maxwell-Gleichungen
aus einer Lagrange-Funktion ableiten lassen.
Dann wird sich diese Eigenschaft der Lorentz-Kraft nämlich als eine Konsistenzbedingung
ergeben, und es werden dabei auch die inhomogenen Maxwell-Gleichungen eine Rolle spielen.
Aber das geht natürlich zu weit über die klassische Mechanik hinaus, als das wir es an dieser
Stelle wirklich verstehen können. Wir werden uns im folgenden auf rein mechanische Systeme
beschränken, und im nächsten Kapitel den Umgang mit Lagrange-Funktion ausführlich üben.
39