11 Lagrangesche Mechanik

Werbung
11 Lagrangesche Mechanik
Tatsächlich lässt sich der Impuls eines Teilchens aus seiner Energie ableiten, und zwar im
wahrsten Sinne des Wortes. Stellen wir die Geschwindigkeit des Teilchens der Masse m in einem
kartesischen Koordinatensystem durch v = vi ei dar, so ist seine kinetische Energie
In diesem Kapitel werden wir den ersten Schritt zu einer allgemeinen Formulierung aller heute bekannten fundamentalen physikalischen Theorien machen. Allerdings ist dieser erste Schritt
sehr bescheiden. Wir werden im Prinzip nichts anderes tun als die Newtonschen Bewegungsgleichungen in einer mathematisch etwas anspruchsvolleren, “geometrischen” Form aufzuschreiben.
Diese neue Formulierung der Newtonschen Mechanik wurde im 18. Jahrhundert entwickelt
und geht im wesentlichen auf d’Alembert, Lagrange und Euler zurück. Sie ist begrifflich sehr viel
abstrakter als die Newtonsche Formulierung, bietet aber eine Reihe von praktischen und konzeptionellen Vorteilen. Ein wichtiger, ganz pragmatischer Vorteil ist, dass sich typische mechanische
Systeme, wie sie in technischen Anwendungen auftreten, sehr viel effizienter berechnen lassen
als mit den Newtonschen Mitteln.
Eine andere, für die theoretische Physik besonders wichtige Eigenschaft der neuen Formulierung ist, dass sich mit ihr viele allgemeine Sätze beweisen lassen, mir deren Hilfe sich Aussagen
über die Lösungen von Bewegungsgleichungen machen lassen, auch wenn man diese nicht explizit angeben kann. Der wohl wichtigste derartige Satz ist das Noether-Theorem, wonach es einen
Zusammenhang zwischen den Symmetrien eines Systems und seinen Erhaltungsgrößen. Bis wir
zu diesem zentralen Theorem kommen, müssen wir uns allerdings erst mit einigen neuen Begriffen vertraut machen.
Die Methoden, die wir hier entwickeln werden, lassen sich weit über die Mechanik hinaus auch
in anderen Teilgebieten der Physik anwenden. Daher werden uns die Begriffe, die wir in diesem
Kapitel einführen, fast überall wieder begegnen. Wie schon angedeutet, geht dies sogar so weit,
dass sich alle heute als fundamental angesehenen Theorien in dieses Schema einordnen lassen.
Einen Hinweis darauf, dass zum Beispiel auch die Elektrodynamik eine solche Formulierung
zulässt, wird sich am Ende dieses Kapitels ergeben. Ansonsten werden wir uns hier jedoch nur
mit mechanischen Systemen beschäftigen.
T =
1
1
m v · v = m v i vi .
2
2
(11.1)
Es ist üblich, die Funktion, die der Geschwindigkeit die kinetische Energie zuordnet, mit T zu bezeichnen. Wenn wir sie partiell nach den Komponenten der Geschwindigkeit ableiten, bekommen
wir
∂T
= m vi = pi ,
(11.2)
∂vi
also die Komponenten des Impulses. Der Impuls ist die Ableitung der Energie nach der Geschwindigkeit.
Das lässt sich verallgemeinern. Für ein System von N Teilchen mit Massen m n ist die gesamte
kinetische Energie eine Funktion der Geschwindigkeiten vn = vn,i ei der einzelnen Teilchen,
T =
1X
1X
m n vn · v n =
mn vn,i vn,i .
2 n
2 n
(11.3)
Die Funktion T hängt jetzt von 3 N reellen Variablen ab, nämlich den Komponenten der Geschwindigkeiten vn,i , mit n ∈ {1, . . . , N } als Teilchenindex und i ∈ {x, y, z} als Vektorindex.
Für Vektorindizes soll wieder die Summenkonvention gelten, und da wir eine Orthonormalbasis
verwenden, können wir alle Indizes nach unten schreiben.
Bilden wir nun wieder die partiellen Ableitungen der Funktion T , so finden wir
∂T
= mn vn,i = pn,i .
∂vn,i
(11.4)
Das sind die Komponenten des Impulses des Teilchens Nummer n. Wir können auf diese Weise
durch Ableiten der kinetischen Energie eines Systems von beliebig vielen Teilchen jedem einzelnen Teilchen seinen Impuls zuordnen.
Energie und Impuls
Bei der allgemeinen Diskussion der Newtonschen Bewegungsgleichungen für ein System von
Punktteilchen hatten wir die Impulse der Teilchen als nützlich Hilfsgrößen eingeführt. Damit
konnten wir ein System von Differenzialgleichungen zweiter Ordnung in ein System erster Ordnung überführen. Außerdem gab es für Systeme ohne äußere Kräfte einen Erhaltungssatz für den
Gesamtimpuls, also für die Summe der Impulse aller Teilchen. Das konnten wir verwenden, um
die Bewegungsgleichungen weiter zu vereinfachen und um deren Lösungen zu klassifizieren.
Den Impuls hatten wir als das Produkt von Masse und Geschwindigkeit definiert, weil so seine
Zeitableitung durch die Kraft gegeben war, die auf ein Teilchen einwirkt. Wir wollen nun zeigen,
dass es noch eine alternative Definition der Größe “Impuls” gibt. Diese wird sich später als sehr
viel allgemeiner erweisen. Sie ist weit über die Mechanik hinaus anwendbar. Sie gibt dem Begriff
“Impuls” eine ähnlich wichtige Bedeutung wie etwa dem Begriff “Energie”, der ja auch in allen
Bereichen der Physik von zentraler Bedeutung ist.
Der Impuls eines Teilchens ist die Ableitung der kinetischen Energie nach der Geschwindigkeit dieses Teilchens.
27
Wie sich gleich zeigen wird, ist es an dieser Stelle ganz wesentlich, dass es sich um eine Funktion
T handelt, die von den Geschwindigkeiten aller Teilchen abhängt. Die Funktion T ist also dem
System als ganzes zugeordnet, nicht den einzelnen Teilchen.
Die Bewegungsgleichungen lassen sich nun wie folgt formulieren. Die Teilchen bewegen sich
auf Bahnen rn (t), oder in kartesischen Koordinaten rn,i (t). Dann ist natürlich vn (t) = ṙn (t)
bzw. vn,i (t) = ṙn,i (t), und somit
∂T ∂T
=
(t).
(11.5)
pn,i (t) =
∂vn,i vn =ṙn (t)
∂ ṙn,i
Der Ausdruck ist so zu verstehen, dass wir erst die Funktion T nach v n,i ableiten, und dann
diese Funktion für vn = ṙn (t) auswerten, also die gegebene Bahnkurve einsetzen, so dass der
Ausdruck zu einer Funktion der Zeit wird. Um die Notation etwas zu verkürzen, schreiben wir
dafür auch einfach ∂T /∂ ṙn,i .
Jetzt müssen wir den Impuls nur noch nach der Zeit ableiten und mit der Kraft gleichsetzen,
d ∂T
ṗn,i (t) =
(t) = Fn,i (t).
(11.6)
dt ∂ ṙn,i
Der Konfigurationsraum besteht aus allen möglichen Anordnungen der Teilchen im Ortsraum,
das heißt aus allen möglichen Konfigurationen von N Teilchen. Einen Punkt in diesem Raum bezeichnen wir mit q ∈ Q, und seine Koordinaten mit q µ , wobei µ ein laufender Index ist, der 3 N
Werte annimmt. Um die Beziehung zu den einzelnen Teilchen deutlich zu machen, können wir als
Indexmenge die Symbole µ ∈ {x1 , y1 , z1 , x2 , y2 , z2 , . . . , xN , yN , zN } verwenden. Wir können
die Koordinaten aber auch einfach von 1 bis 3 N durchnummerieren. Wir sagen, dass ein System aus N Teilchen 3 N Freiheitsgrade besitzt. Die Zahl der Freiheitsgrade eines mechanischen
System ist die Dimension des Konfigurationsraumes, dim Q = 3 N .
Wir schreiben den Index bei q µ nach oben, weil der Konfigurationsraum im allgemeinen kein
metrischer Raum ist. Wir können zwar den Abstand zwischen zwei Punkten oder zwei Teilchen
im Ortsraum messen. Es ist aber eine völlig andere Frage, was unter dem “Abstand” von zwei
verschiedenen Konfigurationen von N Teilchen zu verstehen ist. Jedenfalls gibt es keine unmittelbar auf der Hand liegende Antwort auf die Frage, wie weit zwei Konfigurationen voneinander
entfernt sind. Es gibt auf dem Konfigurationsraum keine Metrik, folglich auch keine kartesischen
Koordinaten, und deshalb müssen wir zwischen Vektoren und dualen Vektoren unterscheiden.
Wie wird nun die Zeitentwicklung des Systems beschreiben? Offenbar durch eine Bahn q(t) im
Konfigurationsraum Q, die zu jedem Zeitpunkt angibt, welche Konfiguration das System gerade
einnimmt. Sie wird explizit durch die Koordinatenfunktionen q µ (t) dargestellt. Das ist eine parametrisierte Kurve in einem affinen Raum. Wir können daher den Tangentenvektor q̇(t) bilden,
dessen Komponenten durch die Ableitungen q̇ µ (t) gegeben sind. Dies ist ein Vektor in dem zugeordneten Vektorraum TQ des Konfigurationsraumes Q. Um die Sprechweise möglichst einfach
zu halten, nennen wir q(t) den Ort und q̇(t) die Geschwindigkeit des Systems zum Zeitpunkt t.
Wir fassen quasi alle Orte der Teilchen zu einem Ort in Q zusammen, und alle Geschwindigkeiten
der Teilchen zu einem Geschwindigkeitsvektor in TQ.
Die oben eingeführte alternative Formulierung der Bewegungsgleichungen für ein System aus
N Teilchen stellt sich jetzt wie folgt dar. Zuerst definieren wir die kinetische Energie als Funktion
der Geschwindigkeiten der Teilchen, das heißt als Funktion eines Vektors q̇ ∈ TQ. Sie ist eine
quadratische Funktion der Komponenten q̇ µ , die sich ganz allgemein wie folgt schreiben lässt,
Die Kräfte Fn = Fn,i ei sind in der Regel als Funktionen der Orte und der Geschwindigkeiten
gegeben. Setzen wir wieder die Bahnen rn (t) ein, so ergibt sich eine Funktion der Zeit, die die
Ableitung des Impulses nach der Zeit bestimmt. Die Gleichungen (11.6) bilden dann ein System
von 3 N gekoppelten Differenzialgleichungen zweiter Ordnung für die Koordinatenfunktionen
rn,i (t). Dies sind natürlich die bekannten Newtonschen Bewegungsgleichungen.
Auf den ersten Blick scheint damit nicht viel gewonnen zu sein. Genau genommen sehen die
Gleichungen (11.6) sogar ziemlich kompliziert aus, nicht zuletzt wegen der etwas verschachtelten
Ableitungen. Was allerdings auffällt, ist, dass die Massen mn anscheinend aus den Bewegungsgleichungen verschwunden sind. Natürlich sind sie nicht wirklich verschwunden. Aber sie gehen
jetzt nur noch implizit über die Definition der Funktion T ein.
In den Newtonschen Formulierung der Bewegungsgleichungen ist die Masse ein Maß für die
Trägheit eines Teilchens, also das Verhältnis von Impuls zu Geschwindigkeit. Hier ist die Masse statt dessen ein Maß für die kinetische Energie, die ein bewegtes Teilchen besitzt, und der
Impuls ist definiert als die Ableitung der Energie nach der Geschwindigkeit. Das ändert an den
mathematischen Zusammenhängen zwischen diesen Größen nichts, bietet aber eine alternative
Interpretation der Begriffe.
Aufgabe 11.1 Wir nehmen an, dass die Kräfte konservativ sind und nur von den Orten der Teilchen abhängen. Dann existiert ein Potenzial V, das eine Funktion der Orte r n ist, und die Kraft
Fn ist der negative Gradient von V bezüglich des Ortes rn . Folglich gelten die Bewegungsgleichungen
∂V
d ∂T
(t) = Fn,i (t) = −
(t).
(11.7)
dt ∂ ṙn,i
∂rn,i
T =
Andererseits wissen wir, dass in diesem Fall die Energie E = T + V eine Erhaltungsgr öße ist.
Man zeige, dass sich dies aus (11.7) ergibt, wobei man nur annehmen muss, dass die Funktion T
rein quadratisch ist, also homogen vom Grad 2 in den Komponenten den Geschwindigkeiten.
1
Mµν q̇ µ q̇ ν .
2
(11.8)
Die 3 N ×3 N -Matrix Mµν ist die Massenmatrix des Systems. Für den hier beschriebenen Fall
hat sie eine einfache Diagonalform


m1
m1
0




m1


.

.
..
Mµν = 
(11.9)



m
N


0
mN
mN
Der Konfigurationsraum
Die Bewegungsgleichungen in der Form (11.6) lassen sich etwas einfacher darstellen, wenn wir
das folgende neue Konzept einführen. Wir fassen die Ortskoordinaten r n,i aller N Teilchen als
Koordinaten eines Punktes in einem 3 N -dimensionalen Raum auf. Diesen Raum nennen wir den
Konfigurationsraum des Systems, und wir bezeichnen ihn mit Q.
28
Ihre Einträge sind die Massen der einzelnen Teilchen, wobei jede Masse genau dreimal auftritt, entsprechend den drei Komponenten der Geschwindigkeit, die zu diesem Teilchen gehören.
Schreibt man die Summe über µ und ν in (11.8) explizit aus, so findet man wieder den Ausdruck
(11.3).
Dass wir die Massen zu einer Matrix mit zwei unteren Indizes zusammengefasst haben, ist
im wesentlichen dadurch motiviert, dass sich diese Matrix nun wie ein symmetrischer Tensor
der Stufe (0, 2) auf dem Konfigurationsraum Q verhält. Durch (11.8) wird eine symmetrische,
bilineare Abbildung M : TQ × TQ → R definiert, so dass T = M (q̇, q̇)/2 ist. Wir werden
darauf gleich noch näher eingehen.
Im nächsten Schritt definieren wir die Impulse, indem wir die partiellen Ableitungen der Funktion T nach den Komponenten q̇ µ der Geschwindigkeit bilden. Das ergibt
pµ =
∂T
= Mµν q̇ µ .
∂ q̇ µ
Kräfte nur vom Ort abhängen, gilt
Fµ =
d ∂T
µ (t) = Fµ (t).
dt ∂ q̇
⇒
ṗµ (t) =
∂V
d ∂T
(t)
= µ (t).
dt ∂ q̇ µ
∂q
(11.12)
Damit hier die rechte und die linke Seite der Gleichung zusammenpassen, muss auf beiden Seiten
ein dualer Vektor stehen. Das ist auch der Fall, und es impliziert, dass auch der Impuls in dualer
Vektor sein muss.
Damit haben wir bereits die wichtigsten Begriffe eingeführt, die wir zur systematischen Beschreibung eines allgemeinen mechanischen Systems benötigen.
Die Konfiguration eines mechanischen Systems wird durch einen Punkt im Konfigurationsraum dargestellt. Die Geschwindigkeit ist ein Vektor, Impuls und Kraft
sind duale Vektoren in diesem Raum.
(11.10)
Um ein konkretes mechanisches System zu beschrieben, benötigen wir zwei Informationen über
das System. Wir müssen erstens wissen, wie die Geschwindigkeiten mit den Impulsen zusammenhängen. Dies geschieht durch die Abgabe der Funktion T , die die kinetische Energie als
Funktion der Geschwindigkeiten darstellt. Für ein N -Teilchen-System bedeutet das im wesentlichen, dass wir die Massen der Teilchen kennen müssen. Und wir müssen natürlich zweitens
wissen, wie die Kraft F konkret als Funktionen des Ortes q, der Geschwindigkeit q̇ und der Zeit
t gegeben ist. Für ein System mit Potenzialkräften ist das äquivalent zur Angabe der Potenzialfunktion V.
Wie man leicht durch Einsetzen der Matrix (11.9) bestätigt, sind das die 3 N Komponenten der
Impulse der einzelnen Teilchen. Diese können wir wieder zu einem 3 N -dimensionalen Vektor
zusammenfassen. Aus (11.10) ergibt sich jedoch, dass die Komponenten p µ ihren Index unten
tragen. Folglich ist die Geschwindigkeit q̇ ∈ TQ ein Vektor, während der Impuls p ∈ T∗ Q des
Systems ein dualer Vektor ist.
Da die Kraft die Zeitableitung des Impulses ist, muss auch das ein dualer Vektor F ∈ T ∗ Q
sein. Es gilt, in Komponenten aufgeschrieben,
ṗµ (t) =
∂V
∂q µ
Aufgabe 11.2 Man betrachte ein System aus drei Teilchen mit Massen m 1 , m2 und m3 , die sich
gegenseitig durch Gravitationskräfte anziehen. Wie sieht in diesem Fall das Potenzial aus? Man
mache sich an diesem Beispiel klar, dass es sich um eine reelle Funktion V auf einem neundimensionalen Raum Q handelt.
(11.11)
Genau wie die Komponenten pµ des Impulses p ergeben sich die 3 N Komponenten Fµ der Kraft
F aus den ursprünglichen Komponenten Fn,i dadurch, dass wir sie einfach nur neu nummerieren. Wir fassen den Teilchenindex n und den Vektorindex i zu einem einzigen Vektorindex µ
zusammen, der 3 N Werte annimmt.
Inhaltlich ändert sich an den Bewegungsgleichungen nichts. Es handelt sich noch immer um ein
Gleichungssystem für 3 N unbekannte Funktionen, nur dass wir diese jetzt mit q µ (t) bezeichnen.
Die Kraft F ist typischerweise als Funktion des Ortes q und der Geschwindigkeit q̇ gegeben, und
sie kann natürlich auch explizit von der Zeit abhängen. Erst durch Einsetzen einer Bahn q(t) wird
daraus eine Funktion, die nur noch von der Zeit anhängt. Das gleiche gilt für den Impuls. Die
partielle Ableitung ∂T /∂ q̇ µ ist eine Funktion der Geschwindigkeit q̇, und durch Einsetzen einer
Bahn q(t) wird sie zu einer Funktion der Zeit.
Dass Kraft und Impuls duale Vektoren auf dem Konfigurationsraum sind, lässt sich auch noch
auf eine ganz andere Weise erklären. Für konservative Systeme ist die Kraft der Gradient des Potenzials. Die potenzielle Energie eines N -Teilchen-Systems ist eine Funktion der Orte der Teilchen, also eine skalare Funktion V auf dem Konfigurationsraum. Folglich ist der Gradient davon
ein dualer Vektor, oder genauer ein duales Vektorfeld auf Q. Für konservative Systeme, deren
Aufgabe 11.3 Die Massenmatrix Mµν eines mechanischen Systems ist symmetrisch und positiv,
da die kinetische Energie stets positiv ist und nur dann gleich Null, wenn alle Teilchen ruhen.
Man kann sie daher als Metrik auf dem Konfigurationsraum interpretieren, der dadurch zu einem
metrischen affinen Raum wird. Wenn man dies tut, welche anschauliche Vorstellung verbindet sich
dann mit dem Abstand von zwei Konfigurationen? Wann liegen zwei gegebene Konfigurationen
nahe beieinander, wann sind sie weit voneinander entfernt?
Ein einfaches Beispiel
Um den Begriff des Konfigurationsraumes etwas besser zu verstehen, betrachten wir ein einfaches
Beispiel. Zwei Teilchen wechselwirken miteinander durch eine linear vom Abstand abhängende
Kraft. Es handelt sich im wesentlichen um einen harmonischen Oszillator, der aus zwei Teilchen
besteht. Um das ganze so einfach wie möglich zu halten, und um das Ergebnis auch grafisch
darstellen zu können, sollen sich die Teilchen nur in eine Raumrichtung bewegen. Dadurch sparen
29
wir uns das Ausschreiben einiger Indizes, verlieren jedoch keine wesentlichen Aspekte von dem,
worum es hier gehen soll.
Es seien also m1 und m2 die Massen der beiden Teilchen, q 1 und q 2 ihre Ortskoordinaten,
und q̇ 1 und q̇ 2 die Geschwindigkeiten. Die Orte q µ , mit µ ∈ {1, 2}, sind die Koordinaten eines
Punktes q ∈ Q, wobei der Konfigurationsraum Q ein zweidimensionaler affiner Raum ist. Die
Geschwindigkeiten q̇ µ sind entsprechend die Komponenten eines Vektors q̇ ∈ TQ.
Für die kinetische und die potenzielle Energie setzen wir
1
1
T = m1 (q̇ 1 )2 + m2 (q̇ 2 )2 ,
2
2
1
V = κ (q 1 − q 2 )2 ,
2
wobei wir die Abkürzungen
m+ = m 1 + m 2 ,
∂T
p2 = 2 = m2 q̇ 2 ,
∂ q̇
p+ =
(11.13)
∂V
= κ (q 2 − q 1 ),
∂q 1
F2 = −
∂V
= κ (q 1 − q 2 ).
∂q 2
ṗ2 = F2
⇒
m1 q̈ 1 = κ (q 2 − q 1 ),
m2 q̈ 2 = κ (q 1 − q 2 ).
(11.14)
(11.15)
ṗ+ = F+ ,
q2 = q+ −
m1
q− .
m1 + m 2
(11.16)
(11.18)
Da es sich um eine lineare Transformation handelt, gelten die gleichen Umrechnungsformel auch
für die Geschwindigkeiten. Wir müssen nur alle q’s mit einem Punkt versehen, oder einfach die
Gleichungen (11.17) und (11.18) nach der Zeit ableiten. Nach einer kurzen Rechnung findet man
dann die folgenden neuen Ausdrücke für die kinetische und die potenzielle Energie,
T =
1
1
m+ (q̇ + )2 + m− (q̇ − )2 ,
2
2
V=
1
κ (q − )2 ,
2
∂T
= m− q̇ − ,
∂ q̇ −
(11.21)
∂V
= 0,
∂q +
F− = −
∂V
= −κ q − .
∂q −
(11.22)
ṗ+ = F+
⇒
m+ q̈ + = 0,
m− q̈ − = −κ q − .
(11.23)
Die Lösungen dieser Gleichungen können wir sofort angeben. Für q + müssen wir eine
gleichförmige Bewegung einsetzen, das heißt das System bewegt sich mit konstanter Geschwindigkeit in Richtung der q + -Achse. In Richtung der q − -Achse finden wir eine harmonische Oszillation mit der Eigenfrequenz ω 2 = κ/m− .
Was haben wir bei dieser Herleitung anders gemacht als früher, als wir ein solches System
schon einmal im Rahmen der Newtonschen Mechanik diskutiert haben? Der wesentliche Unterschied liegt darin, dass wir an keiner Stelle die Bewegungsgleichungen selbst transformiert haben.
Wir haben nicht die Definitionen (11.18) der neuen Koordinaten in die Bewegungsgleichungen
(11.16) eingesetzt. Statt dessen haben wir nur die zwei Größen, von denen wir ausgegangen sind,
nämlich die Funktionen T und V, durch die neuen Koordinaten ausgedrückt.
In Abbildung 11.1(a) ist der zweidimensionale Konfigurationsraum Q mit der q 1 - und q 2 -Achse
dargestellt. Das Potenzial V(q) hängt nur von q 1 − q 2 ab, so dass die Linien mit V = konst
Geraden sind, die parallel zur Winkelhalbierenden verlaufen. Die Linien T = konst im Raum TQ
der Geschwindigkeiten sind Ellipsen, deren Halbachsen durch die Massen m 1 und m2 bestimmt
sind. Eine solche Ellipse ist in der Abbildung eingezeichnet.
Nun hatten wir gesehen, dass die Dynamik des Systems, also letztlich die Bewegungsgleichungen, eindeutig durch die beiden Funktion T und V bestimmt wird. Insbesondere ist das dynamische Verhalten des Systems völlig unabhängig davon, welche Koordinaten wir benutzen, um eine
explizite Rechnung durchzuführen. Die Dynamik des Systems ist ein Art geometrische Eigenschaft des Konfigurationsraumes, die unabhängig von der Wahl irgendeines Koordinatensystems
ist, genau wie die Geometrie des Ortsraumes als abstrakte Struktur unabhängig von den Koordinatensystemen ist, die wir verwenden, um den Raum zu beschreiben.
oder umgekehrt
m2
q− ,
m1 + m 2
p− =
Daraus lesen wir wieder die Bewegungsgleichungen ab. Sie haben sich ein wenig vereinfacht und
lauten nun
Wir wissen bereits, wie wir diese Gleichungen am einfachsten lösen können. Die Idee besteht im
wesentlichen darin, die Bewegung des Schwerpunktes von der relativen Bewegung der Teilchen
zu entkoppeln.
Das neue ist, dass wir dies nun als Koordinatentransformation auf dem Konfigurationsraum Q
auffassen können. Die Transformation, die hier zum Ziel führt, ist
m1
m2
q1 +
q2 ,
q− = q1 − q2 ,
(11.17)
q+ =
m1 + m 2
m1 + m 2
q1 = q+ +
∂T
= m+ q̇ + ,
∂ q̇ +
F+ = −
Die Teilchen ziehen sich mit einer linear mit dem Abstand ansteigenden Kraft an. Schließlich
ergeben sich aus dieser Gleichung und der vorigen die Bewegungsgleichungen
ṗ1 = F1 ,
(11.20)
und für die Komponenten der Kraft gilt jetzt
und für die Komponenten der Kraft gilt
F1 = −
m1 m2
m1 + m 2
für die gesamte und die reduzierte Masse eingeführt haben. Wiederholen wir jetzt die ganze Prozedur noch einmal, so finden wir die Impulse
wobei κ eine Federkonstante ist, die die Anziehungskraft zwischen den beiden Teilchen bestimmt.
Für die Impulse ergibt sich daraus, wie nicht anders zu erwarten ist,
∂T
p1 = 1 = m1 q̇ 1 ,
∂ q̇
m− =
(11.19)
30
q2
ne ganz andere “natürliche” Wahl der Koordinaten nahe legen, nämlich die Koordinaten (q + , q − ).
In diesen Koordinaten nehmen die beiden für die Dynamik relevanten Funktionen T und V eine
besonders einfache Form an.
Das Ziel der folgenden Überlegungen ist es deshalb, von der unmittelbaren physikalischen
Vorstellung Abstand zu nehmen, dass die Bewegungen eines mechanischen Systems im dreidimensionalen Ortsraum stattfinden. Statt dessen wollen wir den Konfigurationsraum als denjenigen Raum betrachten, in dem sich das System bewegt. Das ist der erste Schritt hin zu einer
Abstraktion, die es letztlich auch ermöglicht, ganz andere dynamische Systeme, wie etwa das
elektromagnetische Feld, mit den gleichen Methoden zu beschreiben und dabei die gleichen mathematischen Strukturen zu verwenden.
q+
replacements
(c)
(d)
q1
q−
(a)
(b)
Aufgabe 11.5 Es soll ein System von zwei Teilchen gleicher Masse m betrachtet werden, die
zusätzlich eine lineare rücktreibende Kraft von außen spüren. Diese soll eine Federkonstante κ
haben, die Wechselwirkung eine Federkonstante κ̃. Es ist dann
1
1
1
V = κ (q 1 )2 + (q 2 )2 + κ̃ (q 1 − q 2 )2 .
T = m (q̇ 1 )2 + (q̇ 2 )2 ,
(11.24)
2
2
2
Abbildung 11.1: Der Konfigurationsraum eines Zwei-Teilchen-Systems mit linearer Wechselwirkung. Die gestrichelten Geraden sind die Linien konstanter potenzieller Energie V = konst. Die
gestrichelte Ellipse ist eine Linie konstanter kinetischer Energie T = konst im Raum der Geschwindigkeiten. Die durchgezogene Linie ist eine typische Bahn. Die Koordinaten in (a) sind
den Teilchen angepasst, die Koordinaten in (b) den Eigenmoden des Systems.
Man finde eine lineare Transformation zu neuen Koordinaten (q + , q − ), so dass
1
1
1
1
V = κ+ (q + )2 + κ− (q − )2
(11.25)
m+ (q̇ + )2 + m− (q̇ − )2 ,
2
2
2
2
gilt. Man bestimme die Größen m± und κ± , und daraus die Eigenfrequenzen ω± des System.
Sind die neuen Koordinaten eindeutig bestimmt? Wenn nicht, welche Freiheiten gibt es bei der
Wahl?
T =
Wir können deshalb zu einem beliebigen anderen Koordinatensystem übergehen, das der Dynamik des Systems besser angepasst ist. Ein solches Koordinatensystem ist in Abbildung 11.1(b)
dargestellt. Die q + -Achse ist so gewählt, dass sie im Minimum des Potenzials liegt. Daher hängt
die Funktion V jetzt nur noch von q − ab, und zwar unabhängig davon, in welche Richtung die
q − -Achse zeigt. Aber auch für diese Achse gibt es eine bevorzugte Wahl. Sie ist so gelegt, dass
in dem quadratischen Ausdruck für T keine gemischten Terme auftreten, die das Produkt q̇ + q̇ −
enthalten.
Aufgabe 11.6 Man wiederhole die einzelnen Schritte in diesem Abschnitt f ür ein System von zwei
Teilchen, die sich im dreidimensionalen Raum bewegen. Um die Zerlegung in Schwerpunkt- und
Relativbewegung durchzuführen, hatten wir in Kapitel 3 den Schwerpunktimpuls (3.53) und den
relativen Impuls (3.54) eingeführt. Man zeige, dass diese Größen den hier definierten Impulsen
p+ und p− entsprechen.
Aufgabe 11.4 Man zeige, dass die lineare Transformation (11.17) durch diese beiden Forderungen an die neuen Koordinaten q + und q − bis auf Skalierungen eindeutig festgelegt ist. Die einzige Freiheit, die noch bleibt, ist eine Transformation q̃ + = α q + und q̃ − = β q − mit Konstanten
α, β 6= 0.
Aufgabe 11.7 Der Übergang zwischen den beiden Koordinatensystemen (q 1 , q 2 ) und (q + , q − )
ist eine affine Koordinatentransformation auf dem Konfigurationsraum Q. Man zeige, dass der
Impuls und die Kraft dabei wie duale Vektoren transformieren. Es gilt also
pα =
Das abstrakte Konzept des Konfigurationsraumes eines mechanischen Systems kann also bei der
Lösung der Bewegungsgleichungen hilfreich sein. Es zeigt nämlich, dass die Koordinaten, die
sich auf natürliche Weise aus der physikalischen Situation ergeben, nicht immer die sind, die
dem eigentlichen dynamischen Prozess am besten angepasst sind. In unserem Beispiel liegt es
durch die Beschreibung des Systems eigentlich auf der Hand, dass die “natürlichen” Koordinaten
diejenigen sind, die sich auf die beiden Teilchen beziehen, also (q 1 , q 2 ).
Lassen wir jedoch die physikalische Anschauung für einen Moment außer acht, und betrachten
nur die mathematischen Strukturen des Konfigurationsraumes Q, so stellen wir fest, dass diese ei-
∂q µ
pµ ,
∂q α
bzw. pµ =
∂q α
pα ,
∂q µ
mit µ ∈ {1, 2},
α ∈ {+, −},
(11.26)
und entsprechend für Fµ und Fα .
Aufgabe 11.8 Sowohl in (11.13) als auch in (11.19) lässt sich die kinetische Energie durch eine
Massenmatrix darstellen. Mit den Bezeichnungen aus Aufgabe 11.7 gilt f ür die Einträge dieser
Matrix in den beiden Koordinatensystemen
M11 = m1 ,
31
M22 = m2 ,
bzw. M++ = m+ ,
M−− = m− ,
(11.27)
Wenn T als quadratische Funktion durch eine Massenmatrix gegeben ist, ist die zweite Ableitung
genau diese Massenmatrix. Wir sehen, dass (11.29) nichts anderes ist als eine etwas ungewöhnliche Darstellung der Newtonschen Bewegungsgleichungen, wonach Masse mal Beschleunigung
gleich Kraft ist.
Es stellt sich daher die Frage, warum wir diese merkwürdige Formulierung überhaupt benutzen.
Die Bewegungsgleichung (11.30) sieht doch viel einfacher aus. Sie stellt über die Massenmatrix
eine Beziehung zwischen der Kraft F ∈ T∗ Q und der Beschleunigung q̈ ∈ TQ her, und beschreibt so die Bewegungen des Systems im Konfigurationsraum auf eine geometrische Art und
Weise, die zudem noch unabhängig von der Wahl der Koordinaten ist. Da alle drei beteiligten
Objekte wie Tensoren transformieren, gilt die Gleichung in jedem affinen Koordinatensystem.
Das haben wir gerade verwendet, um die Bewegungsgleichungen für einen zusammengesetzten
harmonischen Oszillator zu entkoppeln
Um die Bewegungsgleichungen für ein gegebenes mechanisches System aufstellen und lösen
zu können, genügt das jedoch meistens nicht. Wir müssen auch krummlinige Koordinatensysteme
verwenden. Das Zentralkraftproblem, und insbesondere das Keplersche Problem der Planetenbahnen, konnten wir zum Beispiel erst erfolgreich angehen, nachdem wir Kugelkoordinaten eingeführt hatten. In krummlinigen Koordinatensystem gilt jedoch die einfache Darstellung (11.30)
der Bewegungsgleichungen nicht mehr.
Zwar können wir die Massenmatrix Mµν auch in einem krummlinigen Koordinatensystem darstellen, wobei ihre Komponenten dann ortsabhängig werden. Um jedoch die Beschleunigung in
krummlinigen Koordinatensystemen darzustellen, benötigen wir eine kovariante Ableitung. Dies
hatten wir in Kapitel 10 und insbesondere in Aufgabe 10.26 gesehen. Es genügt nicht, einfach die
zweite Ableitung der Koordinatenfunktionen q µ (t) zu bilden.
Es stellt sich nun heraus, dass es sehr viel einfacher ist, die Gleichung (11.29) in ein krummliniges Koordinatensystem zu transformieren, als die scheinbar einfachere Gleichung (11.30). Wir
müssen dazu noch nicht einmal das Konzept der kovarianten Ableitung explizit verwenden, obwohl wir letztlich wieder eine solche bilden werden. Zudem ist das Ergebnis so allgemein, dass
wir von der kinetischen Energie noch nicht einmal annehmen müssen, dass sie homogen vom
Grad 2 ist, also quadratisch in den Geschwindigkeiten. Das wird sich später als nützlich erweisen, wenn wir sehr viel allgemeinere Bewegungsgleichungen betrachten.
Das Ziel ist nun, die Bewegungsgleichung (11.29) in einem krummlinigen Koordinatensystem
auf dem Konfigurationsraum Q darzustellen. Dazu sei weiterhin {q µ } ein affines Koordinatensystem, in dem die Gleichung in der angegebenen Form gelten soll. Die krummlinigen Koordinaten
bezeichnen wir mit {q α }. Oft nennt man diese auch verallgemeinerte oder generalisierte Koordinaten.
Die Unterscheidung zwischen den beiden Koordinatensystemen erfolgt, wie bisher auch, durch
zwei verschiedene Indexmengen. Für die affinen Koordinaten verwenden wir die Indizes µ, ν, . . .,
für die verallgemeinerten Koordinaten die Indizes α, β, . . .. Für ein N -Teilchen-System können
die Koordinaten q µ zum Beispiel die kartesischen Ortskoordinaten {x1 , y1 , z1 , . . . , xN , yN , zN }
der einzelnen Teilchen sein, und als verallgemeinerte Koordinaten q α können wir die Darstellun-
und alle anderen Komponenten sind jeweils Null. Man verifiziere, dass f ür diese Matrix das Transformationsverhalten für einen Tensor der Stufe (0, 2) gilt, also
Mαβ =
∂q µ ∂q ν
Mµν ,
∂q α ∂q β
(11.28)
wieder mit µ ∈ {1, 2} und α ∈ {+, −}.
Aufgabe 11.9 In Abbildung 11.1(a) stehen die Koordinatenachsen senkrecht aufeinander, in Abbildung 11.1(b) nicht. Hat dieser Umstand irgendeine Bedeutung?
Aufgabe 11.10 Ist in Abbildung 11.1 m1 oder m2 die größere Masse?
Verallgemeinerte Koordinaten
Wir kehren nun wieder zu der allgemeinen Situation zurück, die bei einem N -Teilchen-System
mit beliebigen Wechselwirkungen vorliegt. Die kinetische Energie T ist dann eine quadratische
Funktion der Geschwindigkeit q̇ ∈ TQ, und die Kraft ist ein dualer Vektor F ∈ T∗ Q, der
zunächst vom Ort q ∈ Q, der Geschwindigkeit q̇ ∈ TQ, und möglicherweise auch von der Zeit
t abhängt. Weitere Annahmen machen wir nicht. Insbesondere muss die Kraft nicht konservativ
sein.
Dann gelten, wie wir gezeigt haben, die Bewegungsgleichungen (11.11), also
d ∂T
= Fµ .
dt ∂ q̇ µ
(11.29)
Wir erinnern noch einmal daran, was die Notation bedeutet. Die linke Seite ist so zu verstehen,
dass wir zuerst die Funktion T als gewöhnliche Funktion der Komponenten q̇ µ der Geschwindigkeit betrachten, diese Funktion partiell ableiten, und dann die Bahn q(t) und ihre Ableitung q̇(t)
einsetzen. Dadurch wird der Ausdruck ∂T /∂ q̇ µ zu einer Funktion der Zeit, die wir dann wieder
nach t ableiten können.
Wir schreiben wie üblich die partiellen Ableitungen von Funktionen nach ihren Argumenten
mit einem geschwungenen ‘∂’. Dagegen ist die totale Zeitableitung ‘d/dt’ immer so zu verstehen,
dass wir den Ausdruck, auf den sie wirkt, entlang einer bestimmten Bahn q(t) auswerten, und
diese Funktion dann nach t ableiten. An dieser Stelle haben die Ableitungssymbole ‘∂’ und ‘d’
also wirklich unterschiedliche Bedeutungen.
Da dies im folgenden sehr wichtig ist, machen wir es uns noch einmal dadurch klar, dass wir
die Bewegungsgleichungen (11.29) etwas expliziter ausschreiben. Da die Funktion T und damit
auch die Ableitungen ∂T /∂ q̇ µ nur indirekt über q̇ µ (t) von der Zeit t abhängen, gilt natürlich die
Kettenregel, also
∂2T
∂ 2 T dq̇ ν
d ∂T = µ ν q̈ ν
µ =
µ
ν
dt ∂ q̇
∂ q̇ ∂ q̇ dt
∂ q̇ ∂ q̇
⇒
Mµν q̈ ν = Fµ .
(11.30)
32
gen derselben Orte in Kugelkoordinaten {r1 , ϑ1 , ϕ1 , . . . , rN , ϑN , ϕN } verwenden.
Die Umrechnung zwischen den beiden Koordinatensystemen erfolgt dadurch, dass wir die affinen Koordinaten q µ als Funktionen der verallgemeinerten Koordinaten q α darstellen. Um ein
möglichst allgemeines Ergebnis zu bekommen, lassen wir sogar zu, dass diese Funktionen explizit von der Zeit abhängen. Mit anderen Worten, wir können sogar zu jedem Zeitpunkt ein anderes
krummliniges Koordinatensystem verwenden. Die Übergangsfunktionen haben dann die Form
q µ = q µ {q α }, t .
(11.31)
In krummlinigen Koordinaten hängt die kinetische Energie vom den
Ortskoordinaten, den Komponenten der Geschwindigkeit und explizit von der
Zeit ab.
Am besten machen wir uns das wieder an einem Beispiel klar. Wir betrachten ein einzelnes Teilchen, das sich frei im Raum bewegt. Als affine Koordinaten q µ verwenden wir (x, y, z), und
als verallgemeinerte Koordinaten q α , um auch eine explizite Zeitabhängigkeit zu bekommen, rotierende Zylinderkoordinaten (r, ϕ, z). Die zeitabhängigen Übergangsfunktionen (11.31) sollen
explizit durch
x = r cos(ϕ − ω t),
y = r sin(ϕ − ω t)
(11.35)
Nun betrachten wir eine Bahn q(t) des Systems im Konfigurationsraum. In krummlinigen Koordinaten wird diese Bahn durch einen Satz von Funktionen q α (t) dargestellt. Folglich gilt für die
Darstellung derselben Bahn in affinen Koordinaten
q µ (t) = q µ {q α (t)}, t .
(11.32)
gegeben sein. Die Winkelgeschwindigkeit ω gibt an, wie schnell sich das Koordinatensystem
dreht. Die Koordinate z bleibt einfach unverändert. Sie spielt in den folgenden Überlegungen
keine Rolle. Wenn wir diese Gleichungen nach der Zeit t ableiten, finden wir
ẋ = ṙ cos(ϕ − ω t) − (ϕ̇ − ω) r sin(ϕ − ω t),
Wenn wir diese Gleichung nach der Zeit ableiten, finden wir die affinen Komponenten q̇ µ (t) der
Geschwindigkeit, ausgedrückt durch die verallgemeinerten Koordinaten q α (t) und deren Zeitableitungen q̇ α (t), den verallgemeinerten Geschwindigkeiten. Auf der rechten Seite müssen wir
dazu die partiellen Ableitungen der affinen Koordinaten nach den krummlinigen Koordinaten bilden, und zusätzlich die partielle Ableitung der Übergangsfunktionen nach der Zeit,
q̇ µ (t) =
α
∂q µ
∂q µ
α
{q α (t)}, t .
α {q (t)}, t q̇ (t) +
∂q
∂t
ẏ = ṙ sin(ϕ − ω t) + (ϕ̇ − ω) r cos(ϕ − ω t).
Das sind die explizit ausgeschriebenen Gleichungen (11.34) für dieses spezielle Beispiel. Die
rechten Seiten hängen nicht nur von den verallgemeinerten Geschwindigkeiten (ṙ, ϕ̇) ab, sondern
auch von den Koordinaten (r, ϕ) und sogar explizit von der Zeit t. Für die kinetische Energie
ergibt sich
1
1
T = m (ẋ2 + ẏ 2 + ż 2 ) = m (ṙ2 + r2 (ϕ̇ − ω)2 + ż 2 ).
(11.37)
2
2
Auch diese Funktion ist wieder quadratisch in den verallgemeinerten Geschwindigkeiten, aber sie
hängt zusätzlich von r ab, und sie enthält auch noch Terme, die proportional zu ω und ω 2 sind.
Das ist auch klar, denn die kinetische Energie eines Teilchens, dass in diesem Koordinatensystem
“ruht”, kreist ja in Wirklichkeit mit der Winkelgeschwindigkeit ω um den Ursprung.
(11.33)
Wir schreiben das etwas verkürzt in der Form
q̇ µ =
∂q µ α ∂q µ
q̇ +
.
∂q α
∂t
(11.36)
(11.34)
Der erste Term beschreibt wie üblich die Transformation eines Vektors von einem Koordinatensystem in ein anderes. Der zweite Term tritt auf, weil das krummlinige Koordinatensystem
zusätzlich von der Zeit abhängen kann. Wenn die Koordinaten q α (t) zeitlich konstant sind, so
bedeutet das nämlich nicht, dass die Teilchen ruhen, also die Konfiguration q(t) zeitlich konstant
ist.
Nun können wir die kinetische Energie T als Funktion der neuen Koordinaten ausdrücken.
Ursprünglich war T ({q̇ µ }) eine Funktion, die nur von den Komponenten q̇ µ der Geschwindigkeit
abhing. Da diese aber nun über (11.34) sowohl von den verallgemeinerten Geschwindigkeiten q̇ α
als auch von den verallgemeinerten Koordinaten q α und sogar der Zeit t abhängen, wird die
kinetische Energie jetzt zu einer Funktion T ({q α }, {q̇ α }, t).
Das ist letztlich nichts anderes als die weiter oben bereits gemachte Feststellung, dass die
Massenmatrix eines mechanischen Systems in krummlinigen Koordinaten ortsabhängig wird,
da es sich um die Darstellung eines Tensors in einem krummlinigen Koordinatensystem handelt. Da dieses Koordinatensystem zudem von der Zeit abhängt, ergibt sich zusätzlich noch eine
Zeitabhängigkeit.
Aufgabe 11.11 In welcher konkreten physikalischen Situation w ürde die Wahl eines solchen Koordinatensystems nahe liegen?
Aufgabe 11.12 Man ersetze in (11.35) ω t durch eine beliebige Funktion γ(t) und zeige, dass
sich dann auch eine explizit zeitabhängige Energiefunktion T ergibt.
Die d’Alembertschen Gleichungen
Wir wollen nun die Bewegungsgleichungen in krummlinigen Koordinaten darstellen. Da die kinetische Energie T ursprünglich nur eine Funktion der Geschwindigkeiten q̇ µ war, können wir die
partiellen Ableitungen von T nach q α und q̇ α durch die Ableitungen der ursprünglichen Funktion
T nach q̇ µ ausdrücken. Mit Hilfe der Kettenregel finden wir
∂T
∂T ∂ q̇ µ
∂T ∂q µ
.
α =
µ
α =
∂ q̇
∂ q̇ ∂ q̇
∂ q̇ µ ∂q α
33
(11.38)
Hier haben wir verwendet, dass aus (11.34) ∂ q̇ µ /∂ q̇ α = ∂q µ /∂q α folgt.
Die partiellen Ableitungen ∂q µ /∂q α , die in (11.38) vorkommen, sind die ortsabhängigen Übergangsmatrizen für die Koordinatentransformation von {q µ } nach {q α }. Wir haben also gezeigt,
dass sich die partiellen Ableitungen pα = ∂T /∂ q̇ α bzw. pµ = ∂T /∂ q̇ µ bei einer Koordinatentransformation wie die Komponenten eines dualen Vektors verhalten. Dies ist natürlich der
Impulsvektor p ∈ T∗ Q des Systems. Seine Komponenten pα bezüglich des krummlinigen Koordinatensystems werden auch als verallgemeinerte Impulse bezeichnet.
Die entsprechende Rechnung für die partiellen Ableitungen von T nach den Koordinaten q α ist
etwas komplizierter, da wir dazu die rechte Seite von (11.34) nochmal nach q α ableiten müssen.
Das ergibt
∂T ∂ q̇ µ
∂T ∂ 2 q µ
∂ 2 qµ ∂T
β
=
=
q̇
+
.
(11.39)
∂q α
∂ q̇ µ ∂q α
∂ q̇ µ ∂q α ∂q β
∂q α ∂t
Wenn wir nun dies und (11.42) in die Bewegungsgleichung (11.29) einsetzen, so lassen sich
diese schließlich wie folgt schreiben,
d’Alembertsche
Bewegungsgleichung
(11.40)
Auch das ist natürlich wieder so zu verstehen, dass wir zuerst die partiellen Ableitungen bilden,
dann eine Bahn q(t) einsetzen, die wir jetzt wahlweise durch die Koordinatenfunktionen q µ (t)
oder q α (t) darstellen können, und anschließend die totalen Zeitableitungen d/dt bilden.
Der erste Term in der Klammer ist genau der, den wir suchen, nämlich die linke Seite von
(11.29). Um den zweiten Term weiter umzuformen, benutzen wir, dass die affinen Koordinaten
q µ sowohl implizit über die krummlinigen Koordinaten als auch explizit von der Zeit abhängen.
Daher gilt
d ∂q µ
∂ 2 qµ
∂ 2 qµ
β
.
(11.41)
=
q̇
+
dt ∂q α
∂q α ∂t
∂q α ∂q β
d
dt
d
dt
Das ist aber genau der Ausdruck in der Klammer in (11.39). Wir finden also
d ∂T ∂q µ
d ∂T
∂T
.
α −
α =
dt ∂ q̇
∂q
dt ∂ q̇ µ ∂q α
(11.44)
Die in dieser Form dargestellten Bewegungsgleichungen für ein mechanisches System heißen d’Alembertsche Gleichungen. Bis auf den zusätzlichen Term auf der linken Seite, der die
Abhängigkeit der kinetischen Energie von den Koordinaten berücksichtigt, haben sie die gleiche
Form wie vorher die Gleichungen (11.29) in affinen Koordinaten. Und es gibt natürlich wieder
eine reelle Gleichung für jeden Freiheitsgrad des Systems.
Tatsächlich verschwindet der zusätzliche Term auf der linken Seite, wenn der Zusammenhang
zwischen q µ und q α affin und zeitunabhängig ist. Dann sind die neuen Geschwindigkeiten q̇ α
lineare Funktionen der alten Geschwindigkeiten q̇ µ , und somit hängt auch die kinetische Energie nur von q̇ α , aber nicht von q α ab. Die allgemeinere Form (11.44) gilt also auch für affine
Koordinatensysteme.
Um die Bewegungsgleichungen für ein spezielles mechanisches System auf diese Form zu
bringen, müssen wir nur zwei Dinge tun. Wir müssen die kinetische Energie T als Funktion der
verallgemeinerten Koordinaten und deren Zeitableitungen darstellen, und wir müssen dasselbe
mit der Kraft F tun. Bei der Kraft müssen wir zusätzlich beachten, dass es sich dabei um einen
dualen Vektor handelt. Wir müssen deshalb gemäß (11.43) den Index transformieren.
Um an unserem Beispiel von oben zu demonstrieren, dass die d’Alembertschen Gleichungen
tatsächlich die richtigen Bewegungsgleichungen sind, setzen wir für T die Funktion (11.37) ein.
Die Kraft soll der Einfachheit halber verschwinden, und wir setzen auch ω = 0. Das Zylinderkoordinatensystem soll also nicht rotieren. Dann ergeben sich nach einer kurzen Rechnung die
folgenden Bewegungsgleichungen
Wir wollen nun versuchen, die linke Seite der Gleichung (11.29) durch die krummlinigen Koordinaten auszudrücken. Als Ansatz bietet sich dazu an, die Zeitableitung von (11.38) zu bilden,
d ∂T ∂q µ d ∂T ∂q µ
∂T d ∂q µ d ∂T
.
α =
µ
α =
µ
α +
dt ∂ q̇
dt ∂ q̇ ∂q
dt ∂ q̇
∂q
∂ q̇ µ dt ∂q α
d ∂T
∂T
= Fα .
α −
dt ∂ q̇
∂q α
(11.42)
∂T
d
∂T
m ṙ − m r ϕ̇2 = 0,
−
=
∂ ṙ
∂r
dt
∂T
∂T
d
∂T
d
d ∂T
−
=
−
=
m r2 ϕ̇ = 0,
m ż = 0.
∂ ϕ̇
∂ϕ
dt
dt ∂ ż
∂z
dt
(11.45)
Das bemerkenswerte an diesem Beispiel ist, dass die beiden letzten Gleichungen ganz automatisch die entscheidenden Erhaltungssätze liefern, die wir benutzen können, um die Bewegungsgleichungen zu lösen. Es ist nämlich m ż = pz die Impulskomponente in z-Richtung, und
pϕ = m r2 ϕ̇ der Drehimpuls um die z-Achse. Beides sind natürlich für ein kräftefreies Teilchen
Erhaltungsgrößen.
Ebenfalls bemerkenswert ist, dass die Komponente pϕ = ∂T /∂ ϕ̇ des Impulses nach unserer neuen, allgemeinen Definition, wonach der Impuls die Ableitung der Energie nach der Geschwindigkeit ist, gerade der Drehimpuls ist, der einer Rotation in Richtung der Koordinaten ϕ
entspricht. Anscheinend passt sich der Begriff “Drehimpuls” sehr gut in dieses allgemeine Konzept ein. Darauf werden wir später aber noch im Detail eingehen.
Um das für die Bewegungsgleichung zu verwenden, multiplizieren wir diese mit der Übergangsmatrix ∂q µ /∂q α und setzen
∂q µ
Fα = α Fµ .
(11.43)
∂q
Die Größen Fα werden als verallgemeinerte Kräfte bezeichnet. Es sind die Komponenten des
Kraftvektors F ∈ T∗ Q, dargestellt in den krummlinigen Koordinaten. Die Gleichung (11.43)
beschreibt wieder das Transformationsverhalten eines dualen Vektors unter einer Koordinatentransformation.
34
Aufgabe 11.13 Man finde die allgemeine Lösung der Bewegungsgleichungen (11.45) und zeige,
dass sich in dem dargestellten Beispiel auch für ω 6= 0 aus den d’Alembertschen Gleichungen die
richtigen Bewegungsgleichungen für ein freies Teilchen ergeben.
Die d’Alembertschen Bewegungsgleichungen lauten jetzt
∂T
∂V
d ∂T
− α + α = 0.
dt ∂ q̇ α
∂q
∂q
Aufgabe 11.14 Welche physikalischen Dimensionen haben die verallgemeinerten Koordinaten
(r, ϕ, z) in dem gezeigten Beispiel? Welche physikalischen Dimensionen haben folglich die verallgemeinerten Impulse (pr , pϕ , pz ) und Kräfte (Fr , Fϕ , Fz ), wenn diese nicht gleich Null gesetzt
sind?
Da das Potenzial V nicht von der Geschwindigkeit abhängt, lässt sich das sogar noch einfacher
schreiben. Wir definieren eine Funktion
LagrangeFunktion
Aufgabe 11.15 Die kinetische Energie T sei eine homogene quadratische Funktion der verallgemeinerten Geschwindigkeiten q̇ α . Sie hänge nicht explizit von t, aber in irgendeiner Weise von
den verallgemeinerten Koordinaten q α ab. Man zeige, dass dann die zeitliche Änderung der kinetischen Energie durch die mechanische Leistung gegeben ist, die sich als Produkt von Kraft und
Geschwindigkeit ergibt,
dT
= F · q̇ = Fµ q̇ µ = Fα q̇ α .
(11.46)
dt
Warum kann die rechte Seite dieser Gleichung in jedem beliebigen Koordinatensystem ausgewertet werden?
Mit dieser Funktion können die d’Alembertschen Bewegungsgleichungen in einer sehr kompakten Form geschrieben werden, nämlich
LagrangeGleichung
d ∂L
∂L
− α = 0.
dt ∂ q̇ α
∂q
(11.51)
Die gesamte Dynamik eines mechanischen System wird somit durch eine einzige Funktion L
auf dem Konfigurationsraum beschrieben. Diese Funktion können wir in einem beliebigen Koordinatensystem darstellen, so dass die Lagrange-Gleichung (11.51) auch in jedem beliebigen
Koordinatensystem ausgewertet werden kann. Auch hier ergibt sich natürlich wieder eine reelle
Differenzialgleichung für jeden Freiheitsgrad, also für jeden Wert, den der Index α annehmen
kann.
Für die explizite Herleitung von Bewegungsgleichungen für mechanische System ist die
Lagrange-Funktion ein sehr effizientes Werkzeug. Wir wollen das am Beispiel des allgemeinen
Zentralkraftproblems demonstrieren. Ein Teilchen der Masse m befinde sich in einem Potenzial
V = V (r). Seine kinetische Energie, in Kugelkoordinaten ausgedrückt, ist
Die Lagrange-Funktion
Besonders einfach ist die Situation dann, wenn alle auftretenden Kräfte Potenzialkräfte sind. Dann
ist nämlich die Kraft der Gradient des Potenzials, und dann gilt natürlich in jedem Koordinatensystem, dass die Komponenten dieses dualen Vektors durch die partiellen Ableitungen nach den
Koordinaten gegeben sind. Explizit,
⇒
(11.50)
Die Lagrange-Funktion ist die Differenz von kinetischer und potenzieller Energie.
Die gerade durchgeführte Herleitung, bei der die Koordinaten q µ affin waren, ist also nur ein
Spezialfall von diesem allgemeinen Transformationsverhalten.
∂q µ
∂q µ ∂V
∂V
F α = α Fµ = − α
= − α.
∂q
∂q ∂q µ
∂q
L = T − V,
die auch wieder vom Ort, der Geschwindigkeit und eventuell explizit von der Zeit abhängt. Diese
Funktion heißt Lagrange-Funktion.
Aufgabe 11.16 Man zeige, dass sich die linke Seite der d’Alembertschen Gleichung wie ein dualer Vektor transformiert, und zwar beim Übergang von einem beliebigen krummlinigen Koordinatensystem zu einem beliebigen anderen. Man führe dazu einen zweiten Satz von krummlinigen
Koordinaten q µ ein, stelle diese als Funktionen von q α dar, und zeige
d ∂T
∂T
∂q µ d ∂T
∂T .
(11.47)
α −
α =
α
µ −
dt ∂ q̇
∂q
∂q
dt ∂ q̇
∂q µ
∂V
Fµ = − µ
∂q
(11.49)
T =
1
m ṙ2 + r2 ϑ̇2 + r2 sin2 ϑ ϕ̇2 .
2
(11.52)
Aufgabe 11.17 Wieso ergibt sich dieser Ausdruck unmittelbar aus der Darstellung (10.54) der
Euklidischen Metrik in Kugelkoordinaten?
(11.48)
Die Lagrange-Funktion für dieses System ist folglich
Das Potenzial kann dabei auch von t abhängen, und die Umrechnungsformel (11.48) gilt auch
dann, wenn die verallgemeinerten Koordinaten q α aus q µ durch eine zeitabhängige Transformation auseinander hervor gehen. In diesem Fall sind die Übergangsmatrizen ∂q µ /∂q α zwar
zeitabhängig, aber die Beziehung (11.48) gilt immer noch zu jedem Zeitpunkt.
L=T −V =
35
1
m ṙ2 + r2 ϑ̇2 + r2 sin2 ϑ ϕ̇2 − V (r).
2
(11.53)
L = L1 + L2 schreiben, wobei L1 nur von einem Teil der Koordinaten abhängt, und L2 nur
von den übrigen Koordinaten, so sind die beiden Sätze von Bewegungsgleichungen unabhängig
voneinander. Sie können unabhängig voneinander gelöst werden, so als würde es sich um zwei
voneinander getrennte mechanische System handeln.
Diese Funktion müssen wir jetzt nur noch in (11.51) einsetzen und die entsprechenden partiellen
Ableitungen bilden, um die Bewegungsgleichungen zu bekommen,
d
∂L ∂L
m ṙ − m r ϑ̇2 − m r sin2 ϑ ϕ̇2 + V 0 (r) = 0,
−
=
∂ ṙ
∂r
dt
d
∂L ∂L
=
m r2 ϑ̇ − m r2 sin ϑ cos ϑ ϕ̇2 = 0
−
∂ϑ
dt
∂ ϑ̇
d
d ∂L ∂L
m r2 sin2 ϑ ϕ̇ = 0.
−
=
dt ∂ ϕ̇ ∂ϕ
dt
d
dt
d
dt
Aufgabe 11.20 Man wende den Satz aus Aufgabe 11.19 auf ein System von zwei Teilchen an,
die sich frei im dreidimensionalen Raum bewegen und durch die Gravitationskraft anziehen. Welches sind hier die am besten geeigneten verallgemeinerten Koordinaten, in denen die LagrangeFunktion sogar in vier unabhängige Summanden zerfällt?
(11.54)
Kräfte und Potenziale
Aus der zweiten Gleichung entnehmen wir, dass diese für ϑ(t) = π/2 erfüllt ist. Es ist also
möglich, dass sich das Teilchen nur in der Äquatorebene aufhält. Tatsächlich genügt es dazu, die
Anfangsbedingungen ϑ(t0 ) = π/2 und ϑ̇(t0 ) = 0 zu wählen. Die erste und die dritte Gleichung
vereinfachen sich dann zu
d
m ṙ − m r ϕ̇2 + V 0 (r) = 0,
dt
d
m r2 ϕ̇ = 0.
dt
Die d’Alembertsche Formulierung der Bewegungsgleichungen können wir für jedes mechanische
System verwenden. Wir müssen nur, wenn wir ein krummliniges oder sogar zeitabhängiges Koordinatensystem verwenden, die Komponenten der Kräfte entsprechend in die verallgemeinerten
Kräfte umrechnen. Wir können dies tun, indem wir direkt die Teilchenkoordinaten r n,i bzw. die
Teilchenorte rn im dreidimensionalen Raum als Funktionen der krummlinigen Koordinaten q α
auf dem Konfigurationsraum darstellen, also
rn,i = rn,i {q α }, t
bzw. rn = rn {q α }, t .
(11.57)
(11.55)
Wir finden wieder die Drehimpulserhaltung pϕ = m r2 ϕ̇ = konst, und für die radiale Bewegungsgleichung können wir ein effektives Potenzial einführen,
m r̈ = −Ve 0 (r),
mit
pϕ2
Ve (r) = V (r) +
.
2 m r2
Hier ist n wieder der Teilchenindex, und i der Index für ein kartesisches Koordinatensystem im
dreidimensionalen Raum. Die verallgemeinerten Kräfte Fα ergeben sich dann aus der allgemeinen Formel (11.43), wobei wir die Summe über den Index µ aufspalten müssen in eine Summe
über die Teilchen n und eine Summe über die Vektorkomponenten i. Das ergibt
(11.56)
Was wir in Kapitel 8 erst durch mühsames Umrechnen der Koordinaten herleiten mussten, ergibt
sich hier ohne größeren Aufwand, indem wir einfach die Lagrange-Funktion in Kugelkoordinaten
darstellen.
Natürlich haben wir dafür schon ein wenig Vorarbeit geleistet, indem wir zum Beispiel die
Euklidische Metrik in Kugelkoordinaten dargestellt haben, so dass wir dies in (11.52) verwenden konnten. Trotzdem ist die Herleitung jetzt sehr viel einfacher. Denn wir haben hier nicht
nur, wie in Kapitel 8, die Bewegungsgleichungen für ein Teilchen in der Äquatorebene bekommen, sondern mit (11.54) auch die für ein Teilchen, das sich beliebig im Raum bewegt und eine
nicht verschwindende Geschwindigkeit ϑ̇ hat. Das wäre mit den Methoden in Kapitel 8 ungleich
schwieriger gewesen.
Fα =
X ∂rn,i
n
∂q
α
Fn,i =
X ∂rn
n
∂q α
· Fn .
(11.58)
Die Summe über den Vektorindex i können wir auch wieder als Skalarprodukt im Euklidischen
Raum schreiben. In dieser Form lassen sich die verallgemeinerten Kräfte oft am einfachsten berechnen.
Als Beispiel betrachten wir eine Reibungskraft als typisches Beispiel für eine Kraft, die sich
nicht aus einem Potenzial ableiten lässt. Das System bestehe aus nur einem Teilchen, und wir
benutzen Zylinderkoordinaten (r, ϕ, z). Der Ort des Teilchens ist dann
Aufgabe 11.18 Man zeige, dass der Ausdruck für pϕ = m r2 sin2 ϑ ϕ̇ in der letzten Gleichung
in (11.54) auch für ϑ 6= π/2 die z-Komponente des Drehimpulses des Teilchens ist.
r = o + r cos ϕ ex + +r sin ϕ ey , +z ez ,
(11.59)
wobei (ex , ey , ez ) eine Orthonormalbasis ist. Die kinetische Energie entnehmen wir aus (11.37),
indem wir dort ω = 0 setzen,
Aufgabe 11.19 Am Beispiel des gekoppelten harmonischen Oszillators von weiter oben, und
auch schon früher in Kapitel 6, hatten wir gesehen, dass eine nützlich Strategie zur Lösung
von Bewegungsgleichungen deren Entkoppelung ist. Man beweise folgenden allgemeinen Satz.
Lässt sich die Lagrange-Funktion eines mechanischen Systems als Summe von zwei Funktionen
T =
36
1
m (ṙ2 + r2 ϕ̇2 + ż 2 ).
2
(11.60)
Von der Kraft nehmen an, dass es sich um eine lineare Reibungskraft handelt. Sie soll proportional
zur Geschwindigkeit und ihr entgegengerichtet sein,
F = −η ṙ
Fα =
⇒
∂r
∂r
∂r ∂r
· F = −η α · ṙ = −η α · β q̇ β .
∂q α
∂q
∂q
∂q
Aufgabe 11.22 Man führe die gleiche Rechnung in Kugelkoordinaten aus. Welche verallgemeinerten Komponenten (Fr , Fϑ , Fϕ ) ergeben sich in diesem Fall für die die Reibungskraft?
Natürlich sind Zylinder- oder Kugelkoordinaten in diesem Fall nicht die am besten an das Problem
angepassten Koordinaten. Die Bewegungsgleichungen in kartesischen Koordinaten sind viel einfacher, da sie für eine lineare Reibungskraft unmittelbar entkoppeln. Wir können aber eine kleine
Variation an diesem Problem vornehmen, so dass das nicht mehr der Fall ist.
Das leicht veränderte Problem dient gleichzeitig als Beispiel für eine verallgemeinerte Form
der Bewegungsgleichungen, die sich als Kombination der d’Alembertschen und Lagrangeschen
Form ergibt. Da Kräfte additiv sind, können wir sie in konservative Kräfte und solche Kräfte
zerlegen, die sich nicht aus einem Potenzial ableiten lassen. Wir fassen dann alle konservativen Kräfte zu einem Potenzial V zusammen und definieren wie üblich eine Lagrange-Funktion
L = T − V. Dann müssen wir aber die nicht-konservativen Kräfte noch zusätzlich in die Bewegungsgleichungen aufnehmen, indem wir ihre verallgemeinerten Komponenten F α auf die rechte
Seite schreiben.
Als Kombination der Bewegungsgleichungen (11.44) und (11.51) ergibt sich dann
(11.61)
Die Summe über n in (11.58) ist hier trivial, da nur ein Teilchen vorhanden ist. Der letzte Ausdruck ergibt sich, indem wir die Geschwindigkeit ṙ mit Hilfe der Kettenregel als Funktion der
verallgemeinerten Geschwindigkeiten q̇ α ausdrücken. Die Skalarprodukte
gαβ =
∂r ∂r
∂ri ∂ri
∂ri ∂rj
·
= α β = α β δij
∂q α ∂q β
∂q ∂q
∂q ∂q
(11.62)
für α, β ∈ {r, ϕ, z} haben wir bereits einmal ausgerechnet. Das sind nämlich die Komponenten
der Metrik in Zylinderkoordinaten, die in kartesischen Koordinaten durch g ij = δij dargestellt
wird. Mit (10.49), um die Koordinate z ergänzt, ergibt sich
grr = 1,
gϕϕ = r2 ,
gzz = 1,
(11.63)
und alle anderen Komponenten sind gleich Null. Im Falle eines Ein-Teilchen-Systems wird
auf diese Weise natürlich auch auf dem Konfigurationsraum eine Metrik definiert, und diese
können wir in beliebigen krummlinigen Koordinatensystemen darstellen. Für die verallgemeinerten Kräfte ergibt sich daraus
Fα = −η gαβ q̇ β
⇒
Fr = −η ṙ,
Fϕ = −η r2 ϕ̇,
Fz = −η ż.
allgemeine
Bewegungsgleichung
L=T −V =
d
d
d
m ṙ = m r ϕ̇2 − η ṙ,
m r2 ϕ̇ = −η r2 ϕ̇,
m ż) = −η ż.
(11.65)
dt
dt
dt
Aufgabe 11.21 Man gebe die Lösung dieser Bewegungsgleichungen mit den Anfangsbedingungen
ṙ(0) = 0,
ϕ(0) = 0,
ϕ̇(0) = ω,
z(0) = 0,
ż(0) = v
(11.67)
Für V = 0 ist L = T , und es ergibt sich wieder die d’Alembertsche Formulierung. Für F α = 0
sind alle Kräfte konservativ, und es ergibt sich die Lagrangesche Formulierung.
Als Beispiel fügen wir zu unserem oben definierten Teilchen mit Reibungskraft ein Potenzial
V = V (r) hinzu, das nur vom Abstand von der z-Achse abhängen soll. In diesem Fall sind die
Zylinderkoordinaten etwas besser an das Problem angepasst, denn dann hängt das Potenzial nur
von einer Koordinate ab. Wir können uns als Realisierung eines solchen Systems ein elektrisch
geladenes Teilchen vorstellen, das sich in einem Medium, das eine Reibung verursacht, in der
Nähe eines geladenen Drahtes befindet.
Um die Bewegungsgleichungen in der Form (11.67) aufzuschreiben, müssen wir nur statt der
kinetischen Energie (11.60) die Lagrange-Funktion
(11.64)
Die verallgemeinerten Kräfte sind nicht einfach proportional zu den verallgemeinerten Geschwindigkeiten, sondern es tritt bei der ϕ-Komponente eine ortsabhängige Proportionalitätskonstante
auf. Dafür gibt es wieder eine einfache geometrische Erklärung. Die Kraft ist ein dualer Vektor, die Geschwindigkeit dagegen ein Vektor. Deshalb wird der Zusammenhang zwischen den
beiden durch die Metrik hergestellt, und deren Komponenten sind in krummlinigen Koordinaten
ortsabhängig.
Die linke Seite der d’Alembertschen Gleichung hatten wir bereits in (11.45) ausgerechnet. Auf
der rechten Seite steht jetzt die Kraft (11.64). Folglich ergeben sich für das Teilchen mit linearer
Reibung die Bewegungsgleichungen
r(0) = ρ,
d ∂L
∂L
= Fα .
α −
dt ∂ q̇
∂q α
1
m ṙ2 + r2 ϕ̇2 + ż 2 − V (r)
2
(11.68)
verwenden. Die Reibungskraft ist die gleiche wie vorher. Folglich ändert sich nur die Bewegungsgleichung für die Koordinate r, denn nur in sie geht die Ableitung des Potenzials ein. Es
genügt außerdem, nur die Bewegungsgleichungen für r und ϕ zu betrachten, da die Bewegung in
z-Richtung ohnehin entkoppelt,
(11.66)
d
m ṙ = m r ϕ̇2 − η ṙ − V 0 (r),
dt
an. Der Trick besteht auch hier darin, zuerst die Bewegungsgleichungen f ür den Drehimpuls
pϕ = m r2 ϕ̇ zu lösen. Es handelt sich zwar jetzt nicht mehr um eine Erhaltungsgr öße, aber
sie lässt sich dennoch lösen, und danach entkoppeln die übrigen Bewegungsgleichungen.
37
d
m r2 ϕ̇ = −η r2 ϕ̇.
dt
(11.69)
Aufgabe 11.23 Das Potenzial sei V (r) = κ r 2 /2, bewirke also eine lineare, rücktriebende Kraft.
Welche Lösung ergibt sich dann aus den Anfangsbedingungen (11.66)? Auch hier l ässt sie sich
wieder bestimmen, wenn man zuerst die unveränderte Bewegungsgleichung für den Drehimpuls
pϕ = m r2 ϕ̇ löst.
Alle drei Felder können zudem von der Zeit abhängen. Das ist offenbar die allgemeinste Funktion
L mit den verlangen Eigenschaften. Der spezielle Fall eines gewöhnlichen Teilchens der Masse m
in einem Potenzial V (r, t) ist darin enthalten. In diesem Fall müssen wir nur M ij (r, t) = m δij ,
Ai (r, t) = 0 und φ(r, t) = V (r, t) setzen.
Wie lauten nun die Bewegungsgleichungen, die sich aus (11.70) ergeben? Wir müssen dazu
nur die Gleichung (11.51) auswerten. Zunächst ist
Aufgabe 11.24 Es sei V (r) irgendeine monoton wachsende Funktion, so dass das Minimum des
Potenzials auf der z-Achse liegt. Man zeige, dass in diesem Fall jede Bewegung, unabh ängig von
den Anfangsbedingungen, früher oder später in der Nähe der z-Achse endet. Es gilt also r(t) → 0
für t → ∞.
∂L
= Mkj (r, t) ṙj + Ak (r, t).
∂ ṙk
Aufgabe 11.25 Man führe wieder die analogen Überlegungen in Kugelkoordinaten durch, wobei
das Potenzial in diesem Fall kugelsymmetrisch sein soll. Man zeige entsprechend, dass bei einem
monoton ansteigenden Potenzial V (r) das Teilchen stets in der N ähe des Ursprungs endet, also
auch hier r(t) → 0 für t → ∞ gilt.
Diese Größe müssen wir nach der Zeit ableiten, wobei wir jetzt beachten müssen, dass wir zuerst
für r eine Bahn r(t) einsetzen müssen, und dass wir zusätzlich die explizite Zeitabhängigkeit
der Felder Mij und Ai berücksichtigen müssen. Es genügt, den Ausdruck wie folgt teilweise mit
Hilfe der Kettenregel auszuwerten,
d
d ∂L
Mkj (r, t) ṙj + ∂i Ak (r, t) ṙi + ∂t Ak (r, t).
=
dt ∂ ṙk
dt
Die Lorentz-Kraft
Mit der Mischform (11.67) haben wir die allgemeinste Darstellung für die Bewegungsgleichungen eines mechanischen Systems in einem beliebigen krummlinigen Koordinatensystem angegeben. Wir wollen jetzt noch der Frage nachgehen, was das allgemeinste Kraftgesetz ist, das sich
allein aus einer Lagrange-Funktion ableiten lässt. Bisher hatten wir argumentiert, dass es dazu ein
Potenzial V geben muss, also eine Funktion des Ortes q ∈ Q, deren Gradient die Kraft ist.
Eine genauere Betrachtung zeigt jedoch, dass sich eine viel größere Klasse von Kräfte durch
eine Lagrange-Funktion beschreiben lässt. Interessanterweise sind es genau diejenigen Kräfte,
die wir als elektromagnetische Kräfte kennen. Das ist ein sehr bemerkenswerter Umstand, denn
es zeigt, dass es offenbar einen Zusammenhang zwischen der Lagrangeschen Formulierung der
Mechanik und anderen, fundamentalen physikalischen Theorien gibt.
Um herauszufinden, welche Arten von Kräften sich prinzipiell aus einer Lagrange-Funktion
ableiten lassen, betrachten wir irgendeine Funktion L, die ein Polynom vom Grad 2 in den Geschwindigkeiten ist, aber ansonsten beliebig vom Ort und der Zeit abhängt. Das ist natürlich noch
längst nicht die allgemeinste mögliche Lagrange-Funktion. Da aber für mechanische Systeme die
kinetische Energie immer eine quadratische Funktion der Geschwindigkeit ist, treten nur solche
Lagrange-Funktionen für physikalisch realistische Systeme auf.
Wir sind außerdem bescheiden und betrachten nur ein einzelnes Teilchen, also einen dreidimensionalen Konfigurationsraum, dessen Koordinaten wir mit ri bezeichnen. Dies seien die üblichen
kartesischen Koordinaten im Euklidischen Raum, so dass wir alle Indizes nach unten schreiben
können. Die Lagrange-Funktion lautet dann
L=
1
Mij (r, t) ṙi ṙj + Ai (r, t) ṙi − φ(r, t),
2
(11.71)
(11.72)
Als Abkürzungen haben wir hier ∂t für die partielle Ableitung ∂/∂t nach der Zeit verwendet, und
wie üblich ist ∂i die Ableitung ∂/∂ri nach den räumlichen Koordinaten.
Jetzt müssen wir noch den zweiten Term in der Bewegungsgleichung ausrechnen. Das ergibt
1
∂L
= ∂k Mij (r, t) ṙi ṙj + ∂k Ai (r, t) ṙi − ∂k φ(r, t).
∂rk
2
(11.73)
Wenn wir die Terme dann noch ein wenig ordnen, bekommen wir die Lagrange-Gleichung
1
d
Mkj ṙj − ∂k Mij ṙi ṙj = ∂k Ai − ∂i Ak ṙi − ∂k φ + ∂t Ak .
dt
2
(11.74)
Diese Gleichung können wir wie folgt interpretieren. Auf der linken Seite steht die Zeitableitung
des Impulses. Allerdings hängt der Impuls jetzt nicht mehr einfach nur linear mit der Geschwindigkeit zusammen, sondern über eine orts- und zeitabhängige Massenmatrix M ij .
Das ist etwas ungewöhnlich, aber zumindest im Prinzip können wir uns ja durchaus vorstellen, dass die Trägheit eines Teilchens keine feste Eigenschaft des Teilchen ist, sondern von Ort,
Zeit und sogar der Bewegungsrichtung im Raum abhängt. Genau dies wird durch die orts- und
zeitabhängige Massenmatrix Mij ausgedrückt, also durch den quadratischen Teil der LagrangeFunktion. Der zusätzliche Term auf der linken Seite ist derselbe, der sich auch in einem krummlinigen Koordinatensystem ergibt, wenn dort die Massenmatrix ortsabhängig ist.
Da die Kraft auf der rechten Seite der interessantere Aspekt der Bewegungsgleichung ist, setzen wir von nun an Mij = m δij , betrachten also ein “gewöhnliches” Teilchen mit der Masse m.
Auf der linken Seite der Bewegungsgleichung (11.74) steht dann m r̈ k , also Masse mal Beschleunigung. Die Kraft Fk auf der rechten Seite hängt aber immer noch vom Ort, der Geschwindigkeit
(11.70)
wobei Mij ein beliebiges symmetrisches Tensorfeld zweiter Stufe ist, Ai ein beliebiges Vektorfeld, und φ ein beliebiges skalares Feld, jeweils auf dem dreidimensionalen Euklidischen Raum.
38
Aufgabe 11.26 Aus der elementaren Elektrodynamik ist bekannt, dass sich die Felder E und B
nicht ändern, wenn wir die Potenziale φ und A wie folgt eichtransformieren,
und von der Zeit ab. Es ist also nicht einfach eine Potenzialkraft. Eine kurze Rechnung zeigt, dass
wir diese speziele Form einer Kraft bereits kennen. Definieren wir nämlich zwei neue Vektorfelder,
(11.75)
Bi = εijk ∂j Ak und Ei = ∂i φ + ∂t Ai ,
φ0 = φ −
dann gilt für die Kraft auf der rechten Seite von (11.74)
Fk = εkij ṙi Bj + Ek
oder F = ṙ × B + E.
q
1
m ṙ · ṙ + A(r, t) · ṙ − q φ(r, t)
2
c
(11.76)
L0 = L +
q
ṙ × B + q E,
c
mit B = ∇ × A,
E = −∇φ −
(11.77)
1
∂t A.
c
1
∂t B = 0,
c
∇ · B = 0.
q dΛ
c dt
(11.81)
Aufgabe 11.27 Man beweise folgenden allgemeinen Satz. Es sei L irgendeine LagrangeFunktion auf einem Konfigurationsraum Q, die nicht einmal quadratisch in den Geschwindigkeiten sein muss. Sie wird in einem beliebigen Koordinatensystem dargestellt als Funktion der
Ortskoordinaten q α , der Geschwindigkeiten q̇ α und der Zeit t. Eine zweite Lagrange-Funktion L0
sei definiert durch
dΛ
∂Λ
∂Λ
= L + α q̇ α +
,
(11.82)
L0 = L +
dt
∂q
∂t
(11.78)
Bemerkenswert an diesem Ergebnis ist nicht nur, dass die Lorentz-Kraft offenbar die allgemeinste Form einer Kraft ist, die sich für ein einzelnes Teilchen aus einer Lagrange-Funktion ableiten
lässt. Das eigentlich verblüffende ist, dass nur solche elektrische und magnetische Felder auftreten, die Lösungen der homogenen Maxwell-Gleichungen sind, für die also gilt
∇×E+
(11.80)
gegeben ist. Die Zeitableitung d/dt ist wie üblich so zu verstehen ist, dass wir die Funktion Λ erst
entlang einer Bahn auswerten, und das Ergebnis dann als Funktion von Ort und Geschwindigkeit
darstellen.
verwenden, um die Bewegungsgleichung mit den richtigen Konstanten zu bekommen, nämlich
m r̈ =
A0 = A + ∇Λ,
wobei Λ irgendeine Funktion von Ort und Zeit ist. Das ergibt sich auch durch Einsetzen unmittelbar aus (11.78). Die Lagrangefunktion L ändert sich jedoch, wenn wir diese Transformation
durchführen. Man zeige, dass die transformierte Funktion durch
Das ist die elektromagnetische Lorentz-Kraft. Nur die Ladungen und, je nach Wahl des Einheitensystems, die Lichtgeschwindigkeit fehlt in dieser Darstellung. Das lässt sich aber leicht beheben.
Hat das Teilchen eine Masse m und eine Ladung q, und verwenden wir das Gaußsche Maßsystem,
so müssen wir die Lagrange-Funktion
L=
1
∂t Λ,
c
wobei Λ irgendeine Funktion der Orte q α und der Zeit t ist. Dann ergeben sich aus L und L0
dieselben Bewegungsgleichungen (11.51). Verschiedene Lagrange-Funktionen L und L 0 führen
also auf die gleichen Bewegungsgleichungen, wenn sie sich nur um die totale Zeitableitung einer
Funktion Λ unterscheiden.
(11.79)
Denn genau diese Felder lassen sich durch ein elektrisches Potenzial φ und ein magnetisches
Vektorpotenzial A wie in (11.78) darstellen.
Es lassen sich also nicht nur Potenzialkräfte aus einer Lagrange-Funktion ableiten, sondern
auch geschwindigkeitsabhängige Kräfte, wenn sie die Form der Lorentz-Kraft haben. Dass dem
so ist, können wir an dieser Stelle nur feststellen. Dass es sich dabei um eine sehr tiefsinnige
Erkenntnis handelt, wird erst sehr viel später klar werden, wenn wir nämlich zeigen, dass sich
auch die Bewegungsgleichungen des elektromagnetischen Feldes, also die Maxwell-Gleichungen
aus einer Lagrange-Funktion ableiten lassen.
Dann wird sich diese Eigenschaft der Lorentz-Kraft nämlich als eine Konsistenzbedingung
ergeben, und es werden dabei auch die inhomogenen Maxwell-Gleichungen eine Rolle spielen.
Aber das geht natürlich zu weit über die klassische Mechanik hinaus, als das wir es an dieser
Stelle wirklich verstehen können. Wir werden uns im folgenden auf rein mechanische Systeme
beschränken, und im nächsten Kapitel den Umgang mit Lagrange-Funktion ausführlich üben.
39
Herunterladen