11 Lagrangesche Mechanik In diesem Kapitel werden wir den ersten Schritt zu einer allgemeinen Formulierung aller heute bekannten fundamentalen physikalischen Theorien machen. Allerdings ist dieser erste Schritt sehr bescheiden. Wir werden im Prinzip nichts anderes tun als die Newtonschen Bewegungsgleichungen in einer mathematisch etwas anspruchsvolleren, “geometrischen” Form aufzuschreiben. Diese neue Formulierung der Newtonschen Mechanik wurde im 18. Jahrhundert entwickelt und geht im wesentlichen auf d’Alembert, Lagrange und Euler zurück. Sie ist begrifflich sehr viel abstrakter als die Newtonsche Formulierung, bietet aber eine Reihe von praktischen und konzeptionellen Vorteilen. Ein wichtiger, ganz pragmatischer Vorteil ist, dass sich typische mechanische Systeme, wie sie in technischen Anwendungen auftreten, sehr viel effizienter berechnen lassen als mit den Newtonschen Mitteln. Eine andere, für die theoretische Physik besonders wichtige Eigenschaft der neuen Formulierung ist, dass sich mit ihr viele allgemeine Sätze beweisen lassen, mir deren Hilfe sich Aussagen über die Lösungen von Bewegungsgleichungen machen lassen, auch wenn man diese nicht explizit angeben kann. Der wohl wichtigste derartige Satz ist das Noether-Theorem, wonach es einen Zusammenhang zwischen den Symmetrien eines Systems und seinen Erhaltungsgrößen. Bis wir zu diesem zentralen Theorem kommen, müssen wir uns allerdings erst mit einigen neuen Begriffen vertraut machen. Die Methoden, die wir hier entwickeln werden, lassen sich weit über die Mechanik hinaus auch in anderen Teilgebieten der Physik anwenden. Daher werden uns die Begriffe, die wir in diesem Kapitel einführen, fast überall wieder begegnen. Wie schon angedeutet, geht dies sogar so weit, dass sich alle heute als fundamental angesehenen Theorien in dieses Schema einordnen lassen. Einen Hinweis darauf, dass zum Beispiel auch die Elektrodynamik eine solche Formulierung zulässt, wird sich am Ende dieses Kapitels ergeben. Ansonsten werden wir uns hier jedoch nur mit mechanischen Systemen beschäftigen. Energie und Impuls Bei der allgemeinen Diskussion der Newtonschen Bewegungsgleichungen für ein System von Punktteilchen hatten wir die Impulse der Teilchen als nützlich Hilfsgrößen eingeführt. Damit konnten wir ein System von Differenzialgleichungen zweiter Ordnung in ein System erster Ordnung überführen. Außerdem gab es für Systeme ohne äußere Kräfte einen Erhaltungssatz für den Gesamtimpuls, also für die Summe der Impulse aller Teilchen. Das konnten wir verwenden, um die Bewegungsgleichungen weiter zu vereinfachen und um deren Lösungen zu klassifizieren. Den Impuls hatten wir als das Produkt von Masse und Geschwindigkeit definiert, weil so seine Zeitableitung durch die Kraft gegeben war, die auf ein Teilchen einwirkt. Wir wollen nun zeigen, dass es noch eine alternative Definition der Größe “Impuls” gibt. Diese wird sich später als sehr viel allgemeiner erweisen. Sie ist weit über die Mechanik hinaus anwendbar. Sie gibt dem Begriff “Impuls” eine ähnlich wichtige Bedeutung wie etwa dem Begriff “Energie”, der ja auch in allen Bereichen der Physik von zentraler Bedeutung ist. Tatsächlich lässt sich der Impuls eines Teilchens aus seiner Energie ableiten, und zwar im wahrsten Sinne des Wortes. Stellen wir die Geschwindigkeit des Teilchens der Masse m in einem kartesischen Koordinatensystem durch v = vi ei dar, so ist seine kinetische Energie T = 1 1 m v · v = m vi vi . 2 2 (11.1) Es ist üblich, die Funktion, die der Geschwindigkeit die kinetische Energie zuordnet, mit T zu bezeichnen. Wenn wir sie partiell nach den Komponenten der Geschwindigkeit ableiten, bekommen wir ∂T = m vi = pi , ∂vi 42 (11.2) also die Komponenten des Impulses. Der Impuls ist die Ableitung der Energie nach der Geschwindigkeit. Das lässt sich verallgemeinern. Für ein System von N Teilchen mit Massen m n ist die gesamte kinetische Energie eine Funktion der Geschwindigkeiten vn = vn,i ei der einzelnen Teilchen, T = 1X 1X m n vn · v n = mn vn,i vn,i . 2 n 2 n (11.3) Die Funktion T hängt jetzt von 3 N reellen Variablen ab, nämlich den Komponenten der Geschwindigkeiten vn,i , mit n ∈ {1, . . . , N } als Teilchenindex und i ∈ {x, y, z} als Vektorindex. Für Vektorindizes soll wieder die Summenkonvention gelten, und da wir eine Orthonormalbasis verwenden, können wir alle Indizes nach unten schreiben. Bilden wir nun wieder die partiellen Ableitungen der Funktion T , so finden wir ∂T = mn vn,i = pn,i . ∂vn,i (11.4) Das sind die Komponenten des Impulses des Teilchens Nummer n. Wir können auf diese Weise durch Ableiten der kinetischen Energie eines Systems von beliebig vielen Teilchen jedem einzelnen Teilchen seinen Impuls zuordnen. Der Impuls eines Teilchens ist die Ableitung der kinetischen Energie nach der Geschwindigkeit dieses Teilchens. Wie sich gleich zeigen wird, ist es an dieser Stelle ganz wesentlich, dass es sich um eine Funktion T handelt, die von den Geschwindigkeiten aller Teilchen abhängt. Die Funktion T ist also dem System als ganzes zugeordnet, nicht den einzelnen Teilchen. Die Bewegungsgleichungen lassen sich nun wie folgt formulieren. Die Teilchen bewegen sich auf Bahnen rn (t), oder in kartesischen Koordinaten rn,i (t). Dann ist natürlich vn (t) = ṙn (t) bzw. vn,i (t) = ṙn,i (t), und somit ∂T ∂T (t). (11.5) = pn,i (t) = ∂vn,i n = ˙ n (t) ∂ ṙn,i Der Ausdruck ist so zu verstehen, dass wir erst die Funktion T nach v n,i ableiten, und dann diese Funktion für vn = ṙn (t) auswerten, also die gegebene Bahnkurve einsetzen, so dass der Ausdruck zu einer Funktion der Zeit wird. Um die Notation etwas zu verkürzen, schreiben wir dafür auch einfach ∂T /∂ ṙ n,i . Jetzt müssen wir den Impuls nur noch nach der Zeit ableiten und mit der Kraft gleichsetzen, d ∂T ṗn,i (t) = (t) = Fn,i (t). (11.6) dt ∂ ṙn,i Die Kräfte Fn = Fn,i ei sind in der Regel als Funktionen der Orte und der Geschwindigkeiten gegeben. Setzen wir wieder die Bahnen rn (t) ein, so ergibt sich eine Funktion der Zeit, die die Ableitung des Impulses nach der Zeit bestimmt. Die Gleichungen (11.6) bilden dann ein System von 3 N gekoppelten Differenzialgleichungen zweiter Ordnung für die Koordinatenfunktionen r n,i (t). Dies sind natürlich die bekannten Newtonschen Bewegungsgleichungen. Auf den ersten Blick scheint damit nicht viel gewonnen zu sein. Genau genommen sehen die Gleichungen (11.6) sogar ziemlich kompliziert aus, nicht zuletzt wegen der etwas verschachtelten Ableitungen. Was allerdings auffällt, ist, dass die Massen mn anscheinend aus den Bewegungsgleichungen verschwunden sind. Natürlich sind sie nicht wirklich verschwunden. Aber sie gehen jetzt nur noch implizit über die Definition der Funktion T ein. In den Newtonschen Formulierung der Bewegungsgleichungen ist die Masse ein Maß für die Trägheit eines Teilchens, also das Verhältnis von Impuls zu Geschwindigkeit. Hier ist die Masse statt dessen ein 43 Maß für die kinetische Energie, die ein bewegtes Teilchen besitzt, und der Impuls ist definiert als die Ableitung der Energie nach der Geschwindigkeit. Das ändert an den mathematischen Zusammenhängen zwischen diesen Größen nichts, bietet aber eine alternative Interpretation der Begriffe. Aufgabe 11.1 Wir nehmen an, dass die Kräfte konservativ sind und nur von den Orten der Teilchen abhängen. Dann existiert ein Potenzial V, das eine Funktion der Orte r n ist, und die Kraft Fn ist der negative Gradient von V bezüglich des Ortes rn . Folglich gelten die Bewegungsgleichungen d ∂T ∂V (t) = Fn,i (t) = − (t). (11.7) dt ∂ ṙn,i ∂rn,i Andererseits wissen wir, dass in diesem Fall die Energie E = T + V eine Erhaltungsgr öße ist. Man zeige, dass sich dies aus (11.7) ergibt, wobei man nur annehmen muss, dass die Funktion T rein quadratisch ist, also homogen vom Grad 2 in den Komponenten den Geschwindigkeiten. Der Konfigurationsraum Die Bewegungsgleichungen in der Form (11.6) lassen sich etwas einfacher darstellen, wenn wir das folgende neue Konzept einführen. Wir fassen die Ortskoordinaten r n,i aller N Teilchen als Koordinaten eines Punktes in einem 3 N -dimensionalen Raum auf. Diesen Raum nennen wir den Konfigurationsraum des Systems, und wir bezeichnen ihn mit Q. Der Konfigurationsraum besteht aus allen möglichen Anordnungen der Teilchen im Ortsraum, das heißt aus allen möglichen Konfigurationen von N Teilchen. Einen Punkt in diesem Raum bezeichnen wir mit q ∈ Q, und seine Koordinaten mit q µ , wobei µ ein laufender Index ist, der 3 N Werte annimmt. Um die Beziehung zu den einzelnen Teilchen deutlich zu machen, können wir als Indexmenge die Symbole µ ∈ {x1 , y1 , z1 , x2 , y2 , z2 , . . . , xN , yN , zN } verwenden. Wir können die Koordinaten aber auch einfach von 1 bis 3 N durchnummerieren. Wir sagen, dass ein System aus N Teilchen 3 N Freiheitsgrade besitzt. Die Zahl der Freiheitsgrade eines mechanischen System ist die Dimension des Konfigurationsraumes, dim Q = 3 N . Wir schreiben den Index bei q µ nach oben, weil der Konfigurationsraum im allgemeinen kein metrischer Raum ist. Wir können zwar den Abstand zwischen zwei Punkten oder zwei Teilchen im Ortsraum messen. Es ist aber eine völlig andere Frage, was unter dem “Abstand” von zwei verschiedenen Konfigurationen von N Teilchen zu verstehen ist. Jedenfalls gibt es keine unmittelbar auf der Hand liegende Antwort auf die Frage, wie weit zwei Konfigurationen voneinander entfernt sind. Es gibt auf dem Konfigurationsraum keine Metrik, folglich auch keine kartesischen Koordinaten, und deshalb müssen wir zwischen Vektoren und dualen Vektoren unterscheiden. Wie wird nun die Zeitentwicklung des Systems beschreiben? Offenbar durch eine Bahn q(t) im Konfigurationsraum Q, die zu jedem Zeitpunkt angibt, welche Konfiguration das System gerade einnimmt. Sie wird explizit durch die Koordinatenfunktionen q µ (t) dargestellt. Das ist eine parametrisierte Kurve in einem affinen Raum. Wir können daher den Tangentenvektor q̇(t) bilden, dessen Komponenten durch die Ableitungen q̇ µ (t) gegeben sind. Dies ist ein Vektor in dem zugeordneten Vektorraum TQ des Konfigurationsraumes Q. Um die Sprechweise möglichst einfach zu halten, nennen wir q(t) den Ort und q̇(t) die Geschwindigkeit des Systems zum Zeitpunkt t. Wir fassen quasi alle Orte der Teilchen zu einem Ort in Q zusammen, und alle Geschwindigkeiten der Teilchen zu einem Geschwindigkeitsvektor in TQ. Die oben eingeführte alternative Formulierung der Bewegungsgleichungen für ein System aus N Teilchen stellt sich jetzt wie folgt dar. Zuerst definieren wir die kinetische Energie als Funktion der Geschwindigkeiten der Teilchen, das heißt als Funktion eines Vektors q̇ ∈ TQ. Sie ist eine quadratische Funktion der Komponenten q̇ µ , die sich ganz allgemein wie folgt schreiben lässt, T = 1 Mµν q̇ µ q̇ ν . 2 44 (11.8) Die 3 N ×3 N -Matrix Mµν ist die Massenmatrix des Systems. Für den hier beschriebenen Fall hat sie eine einfache Diagonalform m1 m1 0 m1 . . Mµν = (11.9) . . m N 0 mN mN Ihre Einträge sind die Massen der einzelnen Teilchen, wobei jede Masse genau dreimal auftritt, entsprechend den drei Komponenten der Geschwindigkeit, die zu diesem Teilchen gehören. Schreibt man die Summe über µ und ν in (11.8) explizit aus, so findet man wieder den Ausdruck (11.3). Dass wir die Massen zu einer Matrix mit zwei unteren Indizes zusammengefasst haben, ist im wesentlichen dadurch motiviert, dass sich diese Matrix nun wie ein symmetrischer Tensor der Stufe (0, 2) auf dem Konfigurationsraum Q verhält. Durch (11.8) wird eine symmetrische, bilineare Abbildung M : TQ × TQ → R definiert, so dass T = M (q̇, q̇)/2 ist. Wir werden darauf gleich noch näher eingehen. Im nächsten Schritt definieren wir die Impulse, indem wir die partiellen Ableitungen der Funktion T nach den Komponenten q̇ µ der Geschwindigkeit bilden. Das ergibt pµ = ∂T = Mµν q̇ µ . ∂ q̇ µ (11.10) Wie man leicht durch Einsetzen der Matrix (11.9) bestätigt, sind das die 3 N Komponenten der Impulse der einzelnen Teilchen. Diese können wir wieder zu einem 3 N -dimensionalen Vektor zusammenfassen. Aus (11.10) ergibt sich jedoch, dass die Komponenten pµ ihren Index unten tragen. Folglich ist die Geschwindigkeit q̇ ∈ TQ ein Vektor, während der Impuls p ∈ T∗ Q des Systems ein dualer Vektor ist. Da die Kraft die Zeitableitung des Impulses ist, muss auch das ein dualer Vektor F ∈ T ∗ Q sein. Es gilt, in Komponenten aufgeschrieben, d ∂T (t) = Fµ (t). (11.11) ṗµ (t) = dt ∂ q̇ µ Genau wie die Komponenten pµ des Impulses p ergeben sich die 3 N Komponenten Fµ der Kraft F aus den ursprünglichen Komponenten Fn,i dadurch, dass wir sie einfach nur neu nummerieren. Wir fassen den Teilchenindex n und den Vektorindex i zu einem einzigen Vektorindex µ zusammen, der 3 N Werte annimmt. Inhaltlich ändert sich an den Bewegungsgleichungen nichts. Es handelt sich noch immer um ein Gleichungssystem für 3 N unbekannte Funktionen, nur dass wir diese jetzt mit q µ (t) bezeichnen. Die Kraft F ist typischerweise als Funktion des Ortes q und der Geschwindigkeit q̇ gegeben, und sie kann natürlich auch explizit von der Zeit abhängen. Erst durch Einsetzen einer Bahn q(t) wird daraus eine Funktion, die nur noch von der Zeit anhängt. Das gleiche gilt für den Impuls. Die partielle Ableitung ∂T /∂ q̇ µ ist eine Funktion der Geschwindigkeit q̇, und durch Einsetzen einer Bahn q(t) wird sie zu einer Funktion der Zeit. Dass Kraft und Impuls duale Vektoren auf dem Konfigurationsraum sind, lässt sich auch noch auf eine ganz andere Weise erklären. Für konservative Systeme ist die Kraft der Gradient des Potenzials. Die potenzielle Energie eines N -Teilchen-Systems ist eine Funktion der Orte der Teilchen, also eine skalare Funktion V auf dem Konfigurationsraum. Folglich ist der Gradient davon ein dualer Vektor, oder genauer ein duales Vektorfeld auf Q. Für konservative Systeme, deren Kräfte nur vom Ort abhängen, gilt ∂V ∂V d ∂T Fµ = µ ⇒ ṗµ (t) = (t) = µ (t). (11.12) ∂q dt ∂ q̇ µ ∂q 45 Damit hier die rechte und die linke Seite der Gleichung zusammenpassen, muss auf beiden Seiten ein dualer Vektor stehen. Das ist auch der Fall, und es impliziert, dass auch der Impuls in dualer Vektor sein muss. Damit haben wir bereits die wichtigsten Begriffe eingeführt, die wir zur systematischen Beschreibung eines allgemeinen mechanischen Systems benötigen. Die Konfiguration eines mechanischen Systems wird durch einen Punkt im Konfigurationsraum dargestellt. Die Geschwindigkeit ist ein Vektor, Impuls und Kraft sind duale Vektoren in diesem Raum. Um ein konkretes mechanisches System zu beschrieben, benötigen wir zwei Informationen über das System. Wir müssen erstens wissen, wie die Geschwindigkeiten mit den Impulsen zusammenhängen. Dies geschieht durch die Abgabe der Funktion T , die die kinetische Energie als Funktion der Geschwindigkeiten darstellt. Für ein N -Teilchen-System bedeutet das im wesentlichen, dass wir die Massen der Teilchen kennen müssen. Und wir müssen natürlich zweitens wissen, wie die Kraft F konkret als Funktionen des Ortes q, der Geschwindigkeit q̇ und der Zeit t gegeben ist. Für ein System mit Potenzialkräften ist das äquivalent zur Angabe der Potenzialfunktion V. Aufgabe 11.2 Man betrachte ein System aus drei Teilchen mit Massen m 1 , m2 und m3 , die sich gegenseitig durch Gravitationskräfte anziehen. Wie sieht in diesem Fall das Potenzial aus? Man mache sich an diesem Beispiel klar, dass es sich um eine reelle Funktion V auf einem neundimensionalen Raum Q handelt. Aufgabe 11.3 Die Massenmatrix Mµν eines mechanischen Systems ist symmetrisch und positiv, da die kinetische Energie stets positiv ist und nur dann gleich Null, wenn alle Teilchen ruhen. Man kann sie daher als Metrik auf dem Konfigurationsraum interpretieren, der dadurch zu einem metrischen affinen Raum wird. Wenn man dies tut, welche anschauliche Vorstellung verbindet sich dann mit dem Abstand von zwei Konfigurationen? Wann liegen zwei gegebene Konfigurationen nahe beieinander, wann sind sie weit voneinander entfernt? Ein einfaches Beispiel Um den Begriff des Konfigurationsraumes etwas besser zu verstehen, betrachten wir ein einfaches Beispiel. Zwei Teilchen wechselwirken miteinander durch eine linear vom Abstand abhängende Kraft. Es handelt sich im wesentlichen um einen harmonischen Oszillator, der aus zwei Teilchen besteht. Um das ganze so einfach wie möglich zu halten, und um das Ergebnis auch grafisch darstellen zu können, sollen sich die Teilchen nur in eine Raumrichtung bewegen. Dadurch sparen wir uns das Ausschreiben einiger Indizes, verlieren jedoch keine wesentlichen Aspekte von dem, worum es hier gehen soll. Es seien also m1 und m2 die Massen der beiden Teilchen, q 1 und q 2 ihre Ortskoordinaten, und q̇ 1 und 2 q̇ die Geschwindigkeiten. Die Orte q µ , mit µ ∈ {1, 2}, sind die Koordinaten eines Punktes q ∈ Q, wobei der Konfigurationsraum Q ein zweidimensionaler affiner Raum ist. Die Geschwindigkeiten q̇ µ sind entsprechend die Komponenten eines Vektors q̇ ∈ TQ. Für die kinetische und die potenzielle Energie setzen wir T = 1 1 m1 (q̇ 1 )2 + m2 (q̇ 2 )2 , 2 2 V= 1 κ (q 1 − q 2 )2 , 2 (11.13) wobei κ eine Federkonstante ist, die die Anziehungskraft zwischen den beiden Teilchen bestimmt. Für die Impulse ergibt sich daraus, wie nicht anders zu erwarten ist, p1 = ∂T = m1 q̇ 1 , ∂ q̇ 1 p2 = 46 ∂T = m2 q̇ 2 , ∂ q̇ 2 (11.14) und für die Komponenten der Kraft gilt F1 = − ∂V 2 1 1 = κ (q − q ), ∂q F2 = − ∂V 1 2 2 = κ (q − q ). ∂q (11.15) Die Teilchen ziehen sich mit einer linear mit dem Abstand ansteigenden Kraft an. Schließlich ergeben sich aus dieser Gleichung und der vorigen die Bewegungsgleichungen ṗ1 = F1 , ṗ2 = F2 ⇒ m1 q̈ 1 = κ (q 2 − q 1 ), m2 q̈ 2 = κ (q 1 − q 2 ). (11.16) Wir wissen bereits, wie wir diese Gleichungen am einfachsten lösen können. Die Idee besteht im wesentlichen darin, die Bewegung des Schwerpunktes von der relativen Bewegung der Teilchen zu entkoppeln. Das neue ist, dass wir dies nun als Koordinatentransformation auf dem Konfigurationsraum Q auffassen können. Die Transformation, die hier zum Ziel führt, ist q+ = m2 m1 q1 + q2, m1 + m 2 m1 + m 2 q− = q1 − q2, (11.17) oder umgekehrt m2 m1 q −, q2 = q+ − q−. (11.18) m1 + m 2 m1 + m 2 Da es sich um eine lineare Transformation handelt, gelten die gleichen Umrechnungsformel auch für die Geschwindigkeiten. Wir müssen nur alle q’s mit einem Punkt versehen, oder einfach die Gleichungen (11.17) und (11.18) nach der Zeit ableiten. Nach einer kurzen Rechnung findet man dann die folgenden neuen Ausdrücke für die kinetische und die potenzielle Energie, q1 = q+ + T = 1 1 m+ (q̇ + )2 + m− (q̇ − )2 , 2 2 V= 1 κ (q − )2 , 2 (11.19) wobei wir die Abkürzungen m1 m2 (11.20) m1 + m 2 für die gesamte und die reduzierte Masse eingeführt haben. Wiederholen wir jetzt die ganze Prozedur noch einmal, so finden wir die Impulse m+ = m 1 + m 2 , p+ = m− = p− = ∂T = m− q̇ − , ∂ q̇ − (11.21) F− = − ∂V = −κ q − . ∂q − (11.22) ∂T = m+ q̇ + , ∂ q̇ + und für die Komponenten der Kraft gilt jetzt F+ = − ∂V = 0, ∂q + Daraus lesen wir wieder die Bewegungsgleichungen ab. Sie haben sich ein wenig vereinfacht und lauten nun ṗ+ = F+ , ṗ+ = F+ ⇒ m+ q̈ + = 0, m− q̈ − = −κ q − . (11.23) Die Lösungen dieser Gleichungen können wir sofort angeben. Für q + müssen wir eine gleichförmige Bewegung einsetzen, das heißt das System bewegt sich mit konstanter Geschwindigkeit in Richtung der q + -Achse. In Richtung der q − -Achse finden wir eine harmonische Oszillation mit der Eigenfrequenz ω 2 = κ/m− . Was haben wir bei dieser Herleitung anders gemacht als früher, als wir ein solches System schon einmal im Rahmen der Newtonschen Mechanik diskutiert haben? Der wesentliche Unterschied liegt darin, dass 47 q2 q+ replacements q1 q− (c) (d) (b) (a) Abbildung 11.1: Der Konfigurationsraum eines Zwei-Teilchen-Systems mit linearer Wechselwirkung. Die gestrichelten Geraden sind die Linien konstanter potenzieller Energie V = konst. Die gestrichelte Ellipse ist eine Linie konstanter kinetischer Energie T = konst im Raum der Geschwindigkeiten. Die durchgezogene Linie ist eine typische Bahn. Die Koordinaten in (a) sind den Teilchen angepasst, die Koordinaten in (b) den Eigenmoden des Systems. wir an keiner Stelle die Bewegungsgleichungen selbst transformiert haben. Wir haben nicht die Definitionen (11.18) der neuen Koordinaten in die Bewegungsgleichungen (11.16) eingesetzt. Statt dessen haben wir nur die zwei Größen, von denen wir ausgegangen sind, nämlich die Funktionen T und V, durch die neuen Koordinaten ausgedrückt. In Abbildung 11.1(a) ist der zweidimensionale Konfigurationsraum Q mit der q 1 - und q 2 -Achse dargestellt. Das Potenzial V(q) hängt nur von q 1 − q 2 ab, so dass die Linien mit V = konst Geraden sind, die parallel zur Winkelhalbierenden verlaufen. Die Linien T = konst im Raum TQ der Geschwindigkeiten sind Ellipsen, deren Halbachsen durch die Massen m1 und m2 bestimmt sind. Eine solche Ellipse ist in der Abbildung eingezeichnet. Nun hatten wir gesehen, dass die Dynamik des Systems, also letztlich die Bewegungsgleichungen, eindeutig durch die beiden Funktion T und V bestimmt wird. Insbesondere ist das dynamische Verhalten des Systems völlig unabhängig davon, welche Koordinaten wir benutzen, um eine explizite Rechnung durchzuführen. Die Dynamik des Systems ist ein Art geometrische Eigenschaft des Konfigurationsraumes, die unabhängig von der Wahl irgendeines Koordinatensystems ist, genau wie die Geometrie des Ortsraumes als abstrakte Struktur unabhängig von den Koordinatensystemen ist, die wir verwenden, um den Raum zu beschreiben. Wir können deshalb zu einem beliebigen anderen Koordinatensystem übergehen, das der Dynamik des Systems besser angepasst ist. Ein solches Koordinatensystem ist in Abbildung 11.1(b) dargestellt. Die q + Achse ist so gewählt, dass sie im Minimum des Potenzials liegt. Daher hängt die Funktion V jetzt nur noch von q − ab, und zwar unabhängig davon, in welche Richtung die q − -Achse zeigt. Aber auch für diese Achse gibt es eine bevorzugte Wahl. Sie ist so gelegt, dass in dem quadratischen Ausdruck für T keine gemischten Terme auftreten, die das Produkt q̇ + q̇ − enthalten. Aufgabe 11.4 Man zeige, dass die lineare Transformation (11.17) durch diese beiden Forderungen an die neuen Koordinaten q + und q − bis auf Skalierungen eindeutig festgelegt ist. Die einzige Freiheit, die noch bleibt, ist eine Transformation q̃ + = α q + und q̃ − = β q − mit Konstanten α, β 6= 0. 48 Das abstrakte Konzept des Konfigurationsraumes eines mechanischen Systems kann also bei der Lösung der Bewegungsgleichungen hilfreich sein. Es zeigt nämlich, dass die Koordinaten, die sich auf natürliche Weise aus der physikalischen Situation ergeben, nicht immer die sind, die dem eigentlichen dynamischen Prozess am besten angepasst sind. In unserem Beispiel liegt es durch die Beschreibung des Systems eigentlich auf der Hand, dass die “natürlichen” Koordinaten diejenigen sind, die sich auf die beiden Teilchen beziehen, also (q 1 , q 2 ). Lassen wir jedoch die physikalische Anschauung für einen Moment außer acht, und betrachten nur die mathematischen Strukturen des Konfigurationsraumes Q, so stellen wir fest, dass diese eine ganz andere “natürliche” Wahl der Koordinaten nahe legen, nämlich die Koordinaten (q + , q − ). In diesen Koordinaten nehmen die beiden für die Dynamik relevanten Funktionen T und V eine besonders einfache Form an. Das Ziel der folgenden Überlegungen ist es deshalb, von der unmittelbaren physikalischen Vorstellung Abstand zu nehmen, dass die Bewegungen eines mechanischen Systems im dreidimensionalen Ortsraum stattfinden. Statt dessen wollen wir den Konfigurationsraum als denjenigen Raum betrachten, in dem sich das System bewegt. Das ist der erste Schritt hin zu einer Abstraktion, die es letztlich auch ermöglicht, ganz andere dynamische Systeme, wie etwa das elektromagnetische Feld, mit den gleichen Methoden zu beschreiben und dabei die gleichen mathematischen Strukturen zu verwenden. Aufgabe 11.5 Es soll ein System von zwei Teilchen gleicher Masse m betrachtet werden, die zus ätzlich eine lineare rücktreibende Kraft von außen spüren. Diese soll eine Federkonstante κ haben, die Wechselwirkung eine Federkonstante κ̃. Es ist dann T = 1 m (q̇ 1 )2 + (q̇ 2 )2 , 2 V= 1 1 κ (q 1 )2 + (q 2 )2 + κ̃ (q 1 − q 2 )2 . 2 2 (11.24) Man finde eine lineare Transformation zu neuen Koordinaten (q + , q − ), so dass T = 1 1 m+ (q̇ + )2 + m− (q̇ − )2 , 2 2 V= 1 1 κ+ (q + )2 + κ− (q − )2 2 2 (11.25) gilt. Man bestimme die Größen m± und κ± , und daraus die Eigenfrequenzen ω± des System. Sind die neuen Koordinaten eindeutig bestimmt? Wenn nicht, welche Freiheiten gibt es bei der Wahl? Aufgabe 11.6 Man wiederhole die einzelnen Schritte in diesem Abschnitt f ür ein System von zwei Teilchen, die sich im dreidimensionalen Raum bewegen. Um die Zerlegung in Schwerpunkt- und Relativbewegung durchzuführen, hatten wir in Kapitel 3 den Schwerpunktimpuls (3.53) und den relativen Impuls (3.54) eingeführt. Man zeige, dass diese Größen den hier definierten Impulsen p+ und p− entsprechen. Aufgabe 11.7 Der Übergang zwischen den beiden Koordinatensystemen (q 1 , q 2 ) und (q + , q − ) ist eine affine Koordinatentransformation auf dem Konfigurationsraum Q. Man zeige, dass der Impuls und die Kraft dabei wie duale Vektoren transformieren. Es gilt also pα = ∂q µ pµ , ∂q α bzw. pµ = ∂q α pα , ∂q µ mit µ ∈ {1, 2}, α ∈ {+, −}, (11.26) und entsprechend für Fµ und Fα . Aufgabe 11.8 Sowohl in (11.13) als auch in (11.19) lässt sich die kinetische Energie durch eine Massenmatrix darstellen. Mit den Bezeichnungen aus Aufgabe 11.7 gilt f ür die Einträge dieser Matrix in den beiden Koordinatensystemen M11 = m1 , M22 = m2 , bzw. M++ = m+ , 49 M−− = m− , (11.27) und alle anderen Komponenten sind jeweils Null. Man verifiziere, dass f ür diese Matrix das Transformationsverhalten für einen Tensor der Stufe (0, 2) gilt, also Mαβ = ∂q µ ∂q ν Mµν , ∂q α ∂q β (11.28) wieder mit µ ∈ {1, 2} und α ∈ {+, −}. Aufgabe 11.9 In Abbildung 11.1(a) stehen die Koordinatenachsen senkrecht aufeinander, in Abbildung 11.1(b) nicht. Hat dieser Umstand irgendeine Bedeutung? Aufgabe 11.10 Ist in Abbildung 11.1 m1 oder m2 die größere Masse? Verallgemeinerte Koordinaten Wir kehren nun wieder zu der allgemeinen Situation zurück, die bei einem N -Teilchen-System mit beliebigen Wechselwirkungen vorliegt. Die kinetische Energie T ist dann eine quadratische Funktion der Geschwindigkeit q̇ ∈ TQ, und die Kraft ist ein dualer Vektor F ∈ T∗ Q, der zunächst vom Ort q ∈ Q, der Geschwindigkeit q̇ ∈ TQ, und möglicherweise auch von der Zeit t abhängt. Weitere Annahmen machen wir nicht. Insbesondere muss die Kraft nicht konservativ sein. Dann gelten, wie wir gezeigt haben, die Bewegungsgleichungen (11.11), also d ∂T = Fµ . dt ∂ q̇ µ (11.29) Wir erinnern noch einmal daran, was die Notation bedeutet. Die linke Seite ist so zu verstehen, dass wir zuerst die Funktion T als gewöhnliche Funktion der Komponenten q̇ µ der Geschwindigkeit betrachten, diese Funktion partiell ableiten, und dann die Bahn q(t) und ihre Ableitung q̇(t) einsetzen. Dadurch wird der Ausdruck ∂T /∂ q̇ µ zu einer Funktion der Zeit, die wir dann wieder nach t ableiten können. Wir schreiben wie üblich die partiellen Ableitungen von Funktionen nach ihren Argumenten mit einem geschwungenen ‘∂’. Dagegen ist die totale Zeitableitung ‘d/dt’ immer so zu verstehen, dass wir den Ausdruck, auf den sie wirkt, entlang einer bestimmten Bahn q(t) auswerten, und diese Funktion dann nach t ableiten. An dieser Stelle haben die Ableitungssymbole ‘∂’ und ‘d’ also wirklich unterschiedliche Bedeutungen. Da dies im folgenden sehr wichtig ist, machen wir es uns noch einmal dadurch klar, dass wir die Bewegungsgleichungen (11.29) etwas expliziter ausschreiben. Da die Funktion T und damit auch die Ableitungen ∂T /∂ q̇ µ nur indirekt über q̇ µ (t) von der Zeit t abhängen, gilt natürlich die Kettenregel, also d ∂T ∂2T ∂ 2 T dq̇ ν = q̈ ν = dt ∂ q̇ µ ∂ q̇ µ ∂ q̇ ν dt ∂ q̇ µ ∂ q̇ ν ⇒ Mµν q̈ ν = Fµ . (11.30) Wenn T als quadratische Funktion durch eine Massenmatrix gegeben ist, ist die zweite Ableitung genau diese Massenmatrix. Wir sehen, dass (11.29) nichts anderes ist als eine etwas ungewöhnliche Darstellung der Newtonschen Bewegungsgleichungen, wonach Masse mal Beschleunigung gleich Kraft ist. Es stellt sich daher die Frage, warum wir diese merkwürdige Formulierung überhaupt benutzen. Die Bewegungsgleichung (11.30) sieht doch viel einfacher aus. Sie stellt über die Massenmatrix eine Beziehung zwischen der Kraft F ∈ T∗ Q und der Beschleunigung q̈ ∈ TQ her, und beschreibt so die Bewegungen des Systems im Konfigurationsraum auf eine geometrische Art und Weise, die zudem noch unabhängig von der Wahl der Koordinaten ist. Da alle drei beteiligten Objekte wie Tensoren transformieren, gilt die Gleichung in jedem affinen Koordinatensystem. Das haben wir gerade verwendet, um die Bewegungsgleichungen für einen zusammengesetzten harmonischen Oszillator zu entkoppeln 50 Um die Bewegungsgleichungen für ein gegebenes mechanisches System aufstellen und lösen zu können, genügt das jedoch meistens nicht. Wir müssen auch krummlinige Koordinatensysteme verwenden. Das Zentralkraftproblem, und insbesondere das Keplersche Problem der Planetenbahnen, konnten wir zum Beispiel erst erfolgreich angehen, nachdem wir Kugelkoordinaten eingeführt hatten. In krummlinigen Koordinatensystem gilt jedoch die einfache Darstellung (11.30) der Bewegungsgleichungen nicht mehr. Zwar können wir die Massenmatrix Mµν auch in einem krummlinigen Koordinatensystem darstellen, wobei ihre Komponenten dann ortsabhängig werden. Um jedoch die Beschleunigung in krummlinigen Koordinatensystemen darzustellen, benötigen wir eine kovariante Ableitung. Dies hatten wir in Kapitel 10 und insbesondere in Aufgabe 10.26 gesehen. Es genügt nicht, einfach die zweite Ableitung der Koordinatenfunktionen q µ (t) zu bilden. Es stellt sich nun heraus, dass es sehr viel einfacher ist, die Gleichung (11.29) in ein krummliniges Koordinatensystem zu transformieren, als die scheinbar einfachere Gleichung (11.30). Wir müssen dazu noch nicht einmal das Konzept der kovarianten Ableitung explizit verwenden, obwohl wir letztlich wieder eine solche bilden werden. Zudem ist das Ergebnis so allgemein, dass wir von der kinetischen Energie noch nicht einmal annehmen müssen, dass sie homogen vom Grad 2 ist, also quadratisch in den Geschwindigkeiten. Das wird sich später als nützlich erweisen, wenn wir sehr viel allgemeinere Bewegungsgleichungen betrachten. Das Ziel ist nun, die Bewegungsgleichung (11.29) in einem krummlinigen Koordinatensystem auf dem Konfigurationsraum Q darzustellen. Dazu sei weiterhin {q µ } ein affines Koordinatensystem, in dem die Gleichung in der angegebenen Form gelten soll. Die krummlinigen Koordinaten bezeichnen wir mit {q α }. Oft nennt man diese auch verallgemeinerte oder generalisierte Koordinaten. Die Unterscheidung zwischen den beiden Koordinatensystemen erfolgt, wie bisher auch, durch zwei verschiedene Indexmengen. Für die affinen Koordinaten verwenden wir die Indizes µ, ν, . . ., für die verallgemeinerten Koordinaten die Indizes α, β, . . .. Für ein N -Teilchen-System können die Koordinaten q µ zum Beispiel die kartesischen Ortskoordinaten {x1 , y1 , z1 , . . . , xN , yN , zN } der einzelnen Teilchen sein, und als verallgemeinerte Koordinaten q α können wir die Darstellungen derselben Orte in Kugelkoordinaten {r1 , ϑ1 , ϕ1 , . . . , rN , ϑN , ϕN } verwenden. Die Umrechnung zwischen den beiden Koordinatensystemen erfolgt dadurch, dass wir die affinen Koordinaten q µ als Funktionen der verallgemeinerten Koordinaten q α darstellen. Um ein möglichst allgemeines Ergebnis zu bekommen, lassen wir sogar zu, dass diese Funktionen explizit von der Zeit abhängen. Mit anderen Worten, wir können sogar zu jedem Zeitpunkt ein anderes krummliniges Koordinatensystem verwenden. Die Übergangsfunktionen haben dann die Form (11.31) q µ = q µ {q α }, t . Nun betrachten wir eine Bahn q(t) des Systems im Konfigurationsraum. In krummlinigen Koordinaten wird diese Bahn durch einen Satz von Funktionen q α (t) dargestellt. Folglich gilt für die Darstellung derselben Bahn in affinen Koordinaten q µ (t) = q µ {q α (t)}, t . (11.32) Wenn wir diese Gleichung nach der Zeit ableiten, finden wir die affinen Komponenten q̇ µ (t) der Geschwindigkeit, ausgedrückt durch die verallgemeinerten Koordinaten q α (t) und deren Zeitableitungen q̇ α (t), den verallgemeinerten Geschwindigkeiten. Auf der rechten Seite müssen wir dazu die partiellen Ableitungen der affinen Koordinaten nach den krummlinigen Koordinaten bilden, und zusätzlich die partielle Ableitung der Übergangsfunktionen nach der Zeit, ∂q µ ∂q µ {q α (t)}, t . (11.33) q̇ µ (t) = α {q α (t)}, t q̇ α (t) + ∂q ∂t Wir schreiben das etwas verkürzt in der Form ∂q µ ∂q µ . (11.34) q̇ µ = α q̇ α + ∂q ∂t 51 Der erste Term beschreibt wie üblich die Transformation eines Vektors von einem Koordinatensystem in ein anderes. Der zweite Term tritt auf, weil das krummlinige Koordinatensystem zusätzlich von der Zeit abhängen kann. Wenn die Koordinaten q α (t) zeitlich konstant sind, so bedeutet das nämlich nicht, dass die Teilchen ruhen, also die Konfiguration q(t) zeitlich konstant ist. Nun können wir die kinetische Energie T als Funktion der neuen Koordinaten ausdrücken. Ursprünglich war T ({q̇ µ }) eine Funktion, die nur von den Komponenten q̇ µ der Geschwindigkeit abhing. Da diese aber nun über (11.34) sowohl von den verallgemeinerten Geschwindigkeiten q̇ α als auch von den verallgemeinerten Koordinaten q α und sogar der Zeit t abhängen, wird die kinetische Energie jetzt zu einer Funktion T ({q α }, {q̇ α }, t). Das ist letztlich nichts anderes als die weiter oben bereits gemachte Feststellung, dass die Massenmatrix eines mechanischen Systems in krummlinigen Koordinaten ortsabhängig wird, da es sich um die Darstellung eines Tensors in einem krummlinigen Koordinatensystem handelt. Da dieses Koordinatensystem zudem von der Zeit abhängt, ergibt sich zusätzlich noch eine Zeitabhängigkeit. In krummlinigen Koordinaten hängt die kinetische Energie vom den Ortskoordinaten, den Komponenten der Geschwindigkeit und explizit von der Zeit ab. Am besten machen wir uns das wieder an einem Beispiel klar. Wir betrachten ein einzelnes Teilchen, das sich frei im Raum bewegt. Als affine Koordinaten q µ verwenden wir (x, y, z), und als verallgemeinerte Koordinaten q α , um auch eine explizite Zeitabhängigkeit zu bekommen, rotierende Zylinderkoordinaten (r, ϕ, z). Die zeitabhängigen Übergangsfunktionen (11.31) sollen explizit durch x = r cos(ϕ − ω t), y = r sin(ϕ − ω t) (11.35) gegeben sein. Die Winkelgeschwindigkeit ω gibt an, wie schnell sich das Koordinatensystem dreht. Die Koordinate z bleibt einfach unverändert. Sie spielt in den folgenden Überlegungen keine Rolle. Wenn wir diese Gleichungen nach der Zeit t ableiten, finden wir ẋ = ṙ cos(ϕ − ω t) − (ϕ̇ − ω) r sin(ϕ − ω t), ẏ = ṙ sin(ϕ − ω t) + (ϕ̇ − ω) r cos(ϕ − ω t). (11.36) Das sind die explizit ausgeschriebenen Gleichungen (11.34) für dieses spezielle Beispiel. Die rechten Seiten hängen nicht nur von den verallgemeinerten Geschwindigkeiten (ṙ, ϕ̇) ab, sondern auch von den Koordinaten (r, ϕ) und sogar explizit von der Zeit t. Für die kinetische Energie ergibt sich T = 1 1 m (ẋ2 + ẏ 2 + ż 2 ) = m (ṙ 2 + r 2 (ϕ̇ − ω)2 + ż 2 ). 2 2 (11.37) Auch diese Funktion ist wieder quadratisch in den verallgemeinerten Geschwindigkeiten, aber sie hängt zusätzlich von r ab, und sie enthält auch noch Terme, die proportional zu ω und ω 2 sind. Das ist auch klar, denn die kinetische Energie eines Teilchens, dass in diesem Koordinatensystem “ruht”, kreist ja in Wirklichkeit mit der Winkelgeschwindigkeit ω um den Ursprung. Aufgabe 11.11 In welcher konkreten physikalischen Situation w ürde die Wahl eines solchen Koordinatensystems nahe liegen? Aufgabe 11.12 Man ersetze in (11.35) ω t durch eine beliebige Funktion γ(t) und zeige, dass sich dann auch eine explizit zeitabhängige Energiefunktion T ergibt. 52 Die d’Alembertschen Gleichungen Wir wollen nun die Bewegungsgleichungen in krummlinigen Koordinaten darstellen. Da die kinetische Energie T ursprünglich nur eine Funktion der Geschwindigkeiten q̇ µ war, können wir die partiellen Ableitungen von T nach q α und q̇ α durch die Ableitungen der ursprünglichen Funktion T nach q̇ µ ausdrücken. Mit Hilfe der Kettenregel finden wir ∂T ∂T ∂ q̇ µ ∂T ∂q µ = = . ∂ q̇ α ∂ q̇ µ ∂ q̇ α ∂ q̇ µ ∂q α (11.38) Hier haben wir verwendet, dass aus (11.34) ∂ q̇ µ /∂ q̇ α = ∂q µ /∂q α folgt. Die partiellen Ableitungen ∂q µ /∂q α , die in (11.38) vorkommen, sind die ortsabhängigen Übergangsmatrizen für die Koordinatentransformation von {q µ } nach {q α }. Wir haben also gezeigt, dass sich die partiellen Ableitungen pα = ∂T /∂ q̇ α bzw. pµ = ∂T /∂ q̇ µ bei einer Koordinatentransformation wie die Komponenten eines dualen Vektors verhalten. Dies ist natürlich der Impulsvektor p ∈ T ∗ Q des Systems. Seine Komponenten pα bezüglich des krummlinigen Koordinatensystems werden auch als verallgemeinerte Impulse bezeichnet. Die entsprechende Rechnung für die partiellen Ableitungen von T nach den Koordinaten q α ist etwas komplizierter, da wir dazu die rechte Seite von (11.34) nochmal nach q α ableiten müssen. Das ergibt ∂T ∂ q̇ µ ∂T ∂ 2 q µ β ∂T ∂2qµ = µ α = µ q̇ + α . ∂q α ∂ q̇ ∂q ∂ q̇ ∂q ∂t ∂q α ∂q β (11.39) Wir wollen nun versuchen, die linke Seite der Gleichung (11.29) durch die krummlinigen Koordinaten auszudrücken. Als Ansatz bietet sich dazu an, die Zeitableitung von (11.38) zu bilden, d ∂T d ∂T ∂q µ d ∂T ∂q µ ∂T d ∂q µ = + = . dt ∂ q̇ α dt ∂ q̇ µ ∂q α dt ∂ q̇ µ ∂q α ∂ q̇ µ dt ∂q α (11.40) Auch das ist natürlich wieder so zu verstehen, dass wir zuerst die partiellen Ableitungen bilden, dann eine Bahn q(t) einsetzen, die wir jetzt wahlweise durch die Koordinatenfunktionen q µ (t) oder q α (t) darstellen können, und anschließend die totalen Zeitableitungen d/dt bilden. Der erste Term in der Klammer ist genau der, den wir suchen, nämlich die linke Seite von (11.29). Um den zweiten Term weiter umzuformen, benutzen wir, dass die affinen Koordinaten q µ sowohl implizit über die krummlinigen Koordinaten als auch explizit von der Zeit abhängen. Daher gilt ∂2qµ ∂2 qµ β d ∂q µ = α β q̇ + α . dt ∂q α ∂q ∂t ∂q ∂q (11.41) Das ist aber genau der Ausdruck in der Klammer in (11.39). Wir finden also d ∂T ∂q µ ∂T d ∂T − = . dt ∂ q̇ α ∂q α dt ∂ q̇ µ ∂q α (11.42) Um das für die Bewegungsgleichung zu verwenden, multiplizieren wir diese mit der Übergangsmatrix ∂q µ /∂q α und setzen ∂q µ Fα = α Fµ . (11.43) ∂q Die Größen Fα werden als verallgemeinerte Kräfte bezeichnet. Es sind die Komponenten des Kraftvektors F ∈ T∗ Q, dargestellt in den krummlinigen Koordinaten. Die Gleichung (11.43) beschreibt wieder das Transformationsverhalten eines dualen Vektors unter einer Koordinatentransformation. 53 Wenn wir nun dies und (11.42) in die Bewegungsgleichung (11.29) einsetzen, so lassen sich diese schließlich wie folgt schreiben, ∂T d ∂T d’Alembertsche = Fα . (11.44) α − Bewegungsgleichung dt ∂ q̇ ∂q α Die in dieser Form dargestellten Bewegungsgleichungen für ein mechanisches System heißen d’Alembertsche Gleichungen. Bis auf den zusätzlichen Term auf der linken Seite, der die Abhängigkeit der kinetischen Energie von den Koordinaten berücksichtigt, haben sie die gleiche Form wie vorher die Gleichungen (11.29) in affinen Koordinaten. Und es gibt natürlich wieder eine reelle Gleichung für jeden Freiheitsgrad des Systems. Tatsächlich verschwindet der zusätzliche Term auf der linken Seite, wenn der Zusammenhang zwischen q µ und q α affin und zeitunabhängig ist. Dann sind die neuen Geschwindigkeiten q̇ α lineare Funktionen der alten Geschwindigkeiten q̇ µ , und somit hängt auch die kinetische Energie nur von q̇ α , aber nicht von q α ab. Die allgemeinere Form (11.44) gilt also auch für affine Koordinatensysteme. Um die Bewegungsgleichungen für ein spezielles mechanisches System auf diese Form zu bringen, müssen wir nur zwei Dinge tun. Wir müssen die kinetische Energie T als Funktion der verallgemeinerten Koordinaten und deren Zeitableitungen darstellen, und wir müssen dasselbe mit der Kraft F tun. Bei der Kraft müssen wir zusätzlich beachten, dass es sich dabei um einen dualen Vektor handelt. Wir müssen deshalb gemäß (11.43) den Index transformieren. Um an unserem Beispiel von oben zu demonstrieren, dass die d’Alembertschen Gleichungen tatsächlich die richtigen Bewegungsgleichungen sind, setzen wir für T die Funktion (11.37) ein. Die Kraft soll der Einfachheit halber verschwinden, und wir setzen auch ω = 0. Das Zylinderkoordinatensystem soll also nicht rotieren. Dann ergeben sich nach einer kurzen Rechnung die folgenden Bewegungsgleichungen d dt d dt ∂T ∂T d − = m ṙ − m r ϕ̇2 = 0, ∂ ṙ ∂r dt ∂T ∂T d d ∂T ∂T d − = m r 2 ϕ̇ = 0, − = m ż = 0. ∂ ϕ̇ ∂ϕ dt dt ∂ ż ∂z dt (11.45) Das bemerkenswerte an diesem Beispiel ist, dass die beiden letzten Gleichungen ganz automatisch die entscheidenden Erhaltungssätze liefern, die wir benutzen können, um die Bewegungsgleichungen zu lösen. Es ist nämlich m ż = pz die Impulskomponente in z-Richtung, und pϕ = m r 2 ϕ̇ der Drehimpuls um die z-Achse. Beides sind natürlich für ein kräftefreies Teilchen Erhaltungsgrößen. Ebenfalls bemerkenswert ist, dass die Komponente pϕ = ∂T /∂ ϕ̇ des Impulses nach unserer neuen, allgemeinen Definition, wonach der Impuls die Ableitung der Energie nach der Geschwindigkeit ist, gerade der Drehimpuls ist, der einer Rotation in Richtung der Koordinaten ϕ entspricht. Anscheinend passt sich der Begriff “Drehimpuls” sehr gut in dieses allgemeine Konzept ein. Darauf werden wir später aber noch im Detail eingehen. Aufgabe 11.13 Man finde die allgemeine Lösung der Bewegungsgleichungen (11.45) und zeige, dass sich in dem dargestellten Beispiel auch für ω 6= 0 aus den d’Alembertschen Gleichungen die richtigen Bewegungsgleichungen für ein freies Teilchen ergeben. Aufgabe 11.14 Welche physikalischen Dimensionen haben die verallgemeinerten Koordinaten (r, ϕ, z) in dem gezeigten Beispiel? Welche physikalischen Dimensionen haben folglich die verallgemeinerten Impulse (pr , pϕ , pz ) und Kräfte (Fr , Fϕ , Fz ), wenn diese nicht gleich Null gesetzt sind? Aufgabe 11.15 Die kinetische Energie T sei eine homogene quadratische Funktion der verallgemeinerten Geschwindigkeiten q̇ α . Sie hänge nicht explizit von t, aber in irgendeiner Weise von den verallgemeinerten Koordinaten q α ab. Man zeige, dass dann die zeitliche Änderung der kinetischen Energie durch die 54 mechanische Leistung gegeben ist, die sich als Produkt von Kraft und Geschwindigkeit ergibt, dT = F · q̇ = Fµ q̇ µ = Fα q̇ α . dt (11.46) Warum kann die rechte Seite dieser Gleichung in jedem beliebigen Koordinatensystem ausgewertet werden? Aufgabe 11.16 Man zeige, dass sich die linke Seite der d’Alembertschen Gleichung wie ein dualer Vektor transformiert, und zwar beim Übergang von einem beliebigen krummlinigen Koordinatensystem zu einem beliebigen anderen. Man führe dazu einen zweiten Satz von krummlinigen Koordinaten q µ ein, stelle diese als Funktionen von q α dar, und zeige d ∂T ∂T ∂q µ d ∂T ∂T . (11.47) − = − dt ∂ q̇ α ∂q α ∂q α dt ∂ q̇ µ ∂q µ Die gerade durchgeführte Herleitung, bei der die Koordinaten q µ affin waren, ist also nur ein Spezialfall von diesem allgemeinen Transformationsverhalten. Die Lagrange-Funktion Besonders einfach ist die Situation dann, wenn alle auftretenden Kräfte Potenzialkräfte sind. Dann ist nämlich die Kraft der Gradient des Potenzials, und dann gilt natürlich in jedem Koordinatensystem, dass die Komponenten dieses dualen Vektors durch die partiellen Ableitungen nach den Koordinaten gegeben sind. Explizit, ∂V ∂q µ ∂q µ ∂V ∂V Fµ = − µ ⇒ F α = α Fµ = − α µ = − α . (11.48) ∂q ∂q ∂q ∂q ∂q Das Potenzial kann dabei auch von t abhängen, und die Umrechnungsformel (11.48) gilt auch dann, wenn die verallgemeinerten Koordinaten q α aus q µ durch eine zeitabhängige Transformation auseinander hervor gehen. In diesem Fall sind die Übergangsmatrizen ∂q µ /∂q α zwar zeitabhängig, aber die Beziehung (11.48) gilt immer noch zu jedem Zeitpunkt. Die d’Alembertschen Bewegungsgleichungen lauten jetzt ∂T ∂V d ∂T = 0. α − α + dt ∂ q̇ ∂q ∂q α (11.49) Da das Potenzial V nicht von der Geschwindigkeit abhängt, lässt sich das sogar noch einfacher schreiben. Wir definieren eine Funktion LagrangeFunktion L = T − V, (11.50) die auch wieder vom Ort, der Geschwindigkeit und eventuell explizit von der Zeit abhängt. Diese Funktion heißt Lagrange-Funktion. Die Lagrange-Funktion ist die Differenz von kinetischer und potenzieller Energie. Mit dieser Funktion können die d’Alembertschen Bewegungsgleichungen in einer sehr kompakten Form geschrieben werden, nämlich d ∂L ∂L Lagrange− = 0. (11.51) α Gleichung dt ∂ q̇ ∂q α Die gesamte Dynamik eines mechanischen System wird somit durch eine einzige Funktion L auf dem Konfigurationsraum beschrieben. Diese Funktion können wir in einem beliebigen Koordinatensystem darstellen, so dass die Lagrange-Gleichung (11.51) auch in jedem beliebigen Koordinatensystem ausgewertet 55 werden kann. Auch hier ergibt sich natürlich wieder eine reelle Differenzialgleichung für jeden Freiheitsgrad, also für jeden Wert, den der Index α annehmen kann. Für die explizite Herleitung von Bewegungsgleichungen für mechanische System ist die LagrangeFunktion ein sehr effizientes Werkzeug. Wir wollen das am Beispiel des allgemeinen Zentralkraftproblems demonstrieren. Ein Teilchen der Masse m befinde sich in einem Potenzial V = V (r). Seine kinetische Energie, in Kugelkoordinaten ausgedrückt, ist T = 1 m ṙ 2 + r 2 ϑ̇2 + r 2 sin2 ϑ ϕ̇2 . 2 (11.52) Aufgabe 11.17 Wieso ergibt sich dieser Ausdruck unmittelbar aus der Darstellung (10.54) der Euklidischen Metrik in Kugelkoordinaten? Die Lagrange-Funktion für dieses System ist folglich L=T −V = 1 m ṙ 2 + r 2 ϑ̇2 + r 2 sin2 ϑ ϕ̇2 − V (r). 2 (11.53) Diese Funktion müssen wir jetzt nur noch in (11.51) einsetzen und die entsprechenden partiellen Ableitungen bilden, um die Bewegungsgleichungen zu bekommen, d ∂L ∂L m ṙ − m r ϑ̇2 − m r sin2 ϑ ϕ̇2 + V 0 (r) = 0, − = ∂ ṙ ∂r dt d ∂L ∂L m r 2 ϑ̇ − m r 2 sin ϑ cos ϑ ϕ̇2 = 0 − = ∂ϑ dt ∂ ϑ̇ d ∂L ∂L d m r 2 sin2 ϑ ϕ̇ = 0. − = dt ∂ ϕ̇ ∂ϕ dt d dt d dt (11.54) Aus der zweiten Gleichung entnehmen wir, dass diese für ϑ(t) = π/2 erfüllt ist. Es ist also möglich, dass sich das Teilchen nur in der Äquatorebene aufhält. Tatsächlich genügt es dazu, die Anfangsbedingungen ϑ(t0 ) = π/2 und ϑ̇(t0 ) = 0 zu wählen. Die erste und die dritte Gleichung vereinfachen sich dann zu d m ṙ − m r ϕ̇2 + V 0 (r) = 0, dt d m r 2 ϕ̇ = 0. dt (11.55) Wir finden wieder die Drehimpulserhaltung pϕ = m r 2 ϕ̇ = konst, und für die radiale Bewegungsgleichung können wir ein effektives Potenzial einführen, m r̈ = −Ve 0 (r), pϕ2 mit Ve (r) = V (r) + . 2 m r2 (11.56) Was wir in Kapitel 8 erst durch mühsames Umrechnen der Koordinaten herleiten mussten, ergibt sich hier ohne größeren Aufwand, indem wir einfach die Lagrange-Funktion in Kugelkoordinaten darstellen. Natürlich haben wir dafür schon ein wenig Vorarbeit geleistet, indem wir zum Beispiel die Euklidische Metrik in Kugelkoordinaten dargestellt haben, so dass wir dies in (11.52) verwenden konnten. Trotzdem ist die Herleitung jetzt sehr viel einfacher. Denn wir haben hier nicht nur, wie in Kapitel 8, die Bewegungsgleichungen für ein Teilchen in der Äquatorebene bekommen, sondern mit (11.54) auch die für ein Teilchen, das sich beliebig im Raum bewegt und eine nicht verschwindende Geschwindigkeit ϑ̇ hat. Das wäre mit den Methoden in Kapitel 8 ungleich schwieriger gewesen. Aufgabe 11.18 Man zeige, dass der Ausdruck für pϕ = m r 2 sin2 ϑ ϕ̇ in der letzten Gleichung in (11.54) auch für ϑ 6= π/2 die z-Komponente des Drehimpulses des Teilchens ist. 56 Aufgabe 11.19 Am Beispiel des gekoppelten harmonischen Oszillators von weiter oben, und auch schon früher in Kapitel 6, hatten wir gesehen, dass eine nützlich Strategie zur Lösung von Bewegungsgleichungen deren Entkoppelung ist. Man beweise folgenden allgemeinen Satz. L ässt sich die Lagrange-Funktion eines mechanischen Systems als Summe von zwei Funktionen L = L1 + L2 schreiben, wobei L1 nur von einem Teil der Koordinaten abhängt, und L2 nur von den übrigen Koordinaten, so sind die beiden Sätze von Bewegungsgleichungen unabhängig voneinander. Sie können unabhängig voneinander gelöst werden, so als würde es sich um zwei voneinander getrennte mechanische System handeln. Aufgabe 11.20 Man wende den Satz aus Aufgabe 11.19 auf ein System von zwei Teilchen an, die sich frei im dreidimensionalen Raum bewegen und durch die Gravitationskraft anziehen. Welches sind hier die am besten geeigneten verallgemeinerten Koordinaten, in denen die Lagrange-Funktion sogar in vier unabhängige Summanden zerfällt? Kräfte und Potenziale Die d’Alembertsche Formulierung der Bewegungsgleichungen können wir für jedes mechanische System verwenden. Wir müssen nur, wenn wir ein krummliniges oder sogar zeitabhängiges Koordinatensystem verwenden, die Komponenten der Kräfte entsprechend in die verallgemeinerten Kräfte umrechnen. Wir können dies tun, indem wir direkt die Teilchenkoordinaten r n,i bzw. die Teilchenorte rn im dreidimensionalen Raum als Funktionen der krummlinigen Koordinaten q α auf dem Konfigurationsraum darstellen, also rn,i = rn,i {q α }, t bzw. rn = rn {q α }, t . (11.57) Hier ist n wieder der Teilchenindex, und i der Index für ein kartesisches Koordinatensystem im dreidimensionalen Raum. Die verallgemeinerten Kräfte Fα ergeben sich dann aus der allgemeinen Formel (11.43), wobei wir die Summe über den Index µ aufspalten müssen in eine Summe über die Teilchen n und eine Summe über die Vektorkomponenten i. Das ergibt Fα = X ∂rn,i n ∂q α Fn,i = X ∂rn n ∂q α · Fn . (11.58) Die Summe über den Vektorindex i können wir auch wieder als Skalarprodukt im Euklidischen Raum schreiben. In dieser Form lassen sich die verallgemeinerten Kräfte oft am einfachsten berechnen. Als Beispiel betrachten wir eine Reibungskraft als typisches Beispiel für eine Kraft, die sich nicht aus einem Potenzial ableiten lässt. Das System bestehe aus nur einem Teilchen, und wir benutzen Zylinderkoordinaten (r, ϕ, z). Der Ort des Teilchens ist dann r = o + r cos ϕ ex + +r sin ϕ ey , +z ez , (11.59) wobei (ex , ey , ez ) eine Orthonormalbasis ist. Die kinetische Energie entnehmen wir aus (11.37), indem wir dort ω = 0 setzen, 1 T = m (ṙ 2 + r 2 ϕ̇2 + ż 2 ). (11.60) 2 Von der Kraft nehmen an, dass es sich um eine lineare Reibungskraft handelt. Sie soll proportional zur Geschwindigkeit und ihr entgegengerichtet sein, F = −η ṙ ⇒ Fα = ∂r ∂r ∂r ∂r β q̇ . · α · F = −η α · ṙ = −η ∂q ∂q ∂q α ∂q β (11.61) Die Summe über n in (11.58) ist hier trivial, da nur ein Teilchen vorhanden ist. Der letzte Ausdruck ergibt sich, indem wir die Geschwindigkeit ṙ mit Hilfe der Kettenregel als Funktion der verallgemeinerten 57 Geschwindigkeiten q̇ α ausdrücken. Die Skalarprodukte gαβ = ∂r ∂r ∂ri ∂ri ∂ri ∂rj = α β = α β δij α · β ∂q ∂q ∂q ∂q ∂q ∂q (11.62) für α, β ∈ {r, ϕ, z} haben wir bereits einmal ausgerechnet. Das sind nämlich die Komponenten der Metrik in Zylinderkoordinaten, die in kartesischen Koordinaten durch g ij = δij dargestellt wird. Mit (10.49), um die Koordinate z ergänzt, ergibt sich grr = 1, gϕϕ = r 2 , gzz = 1, (11.63) und alle anderen Komponenten sind gleich Null. Im Falle eines Ein-Teilchen-Systems wird auf diese Weise natürlich auch auf dem Konfigurationsraum eine Metrik definiert, und diese können wir in beliebigen krummlinigen Koordinatensystemen darstellen. Für die verallgemeinerten Kräfte ergibt sich daraus Fα = −η gαβ q̇ β ⇒ Fr = −η ṙ, Fϕ = −η r 2 ϕ̇, Fz = −η ż. (11.64) Die verallgemeinerten Kräfte sind nicht einfach proportional zu den verallgemeinerten Geschwindigkeiten, sondern es tritt bei der ϕ-Komponente eine ortsabhängige Proportionalitätskonstante auf. Dafür gibt es wieder eine einfache geometrische Erklärung. Die Kraft ist ein dualer Vektor, die Geschwindigkeit dagegen ein Vektor. Deshalb wird der Zusammenhang zwischen den beiden durch die Metrik hergestellt, und deren Komponenten sind in krummlinigen Koordinaten ortsabhängig. Die linke Seite der d’Alembertschen Gleichung hatten wir bereits in (11.45) ausgerechnet. Auf der rechten Seite steht jetzt die Kraft (11.64). Folglich ergeben sich für das Teilchen mit linearer Reibung die Bewegungsgleichungen d m ṙ = m r ϕ̇2 − η ṙ, dt d m r 2 ϕ̇ = −η r 2 ϕ̇, dt d m ż) = −η ż. dt (11.65) Aufgabe 11.21 Man gebe die Lösung dieser Bewegungsgleichungen mit den Anfangsbedingungen r(0) = ρ, ṙ(0) = 0, ϕ(0) = 0, ϕ̇(0) = ω, z(0) = 0, ż(0) = v (11.66) an. Der Trick besteht auch hier darin, zuerst die Bewegungsgleichungen f ür den Drehimpuls pϕ = m r 2 ϕ̇ zu lösen. Es handelt sich zwar jetzt nicht mehr um eine Erhaltungsgr öße, aber sie lässt sich dennoch lösen, und danach entkoppeln die übrigen Bewegungsgleichungen. Aufgabe 11.22 Man führe die gleiche Rechnung in Kugelkoordinaten aus. Welche verallgemeinerten Komponenten (Fr , Fϑ , Fϕ ) ergeben sich in diesem Fall für die die Reibungskraft? Natürlich sind Zylinder- oder Kugelkoordinaten in diesem Fall nicht die am besten an das Problem angepassten Koordinaten. Die Bewegungsgleichungen in kartesischen Koordinaten sind viel einfacher, da sie für eine lineare Reibungskraft unmittelbar entkoppeln. Wir können aber eine kleine Variation an diesem Problem vornehmen, so dass das nicht mehr der Fall ist. Das leicht veränderte Problem dient gleichzeitig als Beispiel für eine verallgemeinerte Form der Bewegungsgleichungen, die sich als Kombination der d’Alembertschen und Lagrangeschen Form ergibt. Da Kräfte additiv sind, können wir sie in konservative Kräfte und solche Kräfte zerlegen, die sich nicht aus einem Potenzial ableiten lassen. Wir fassen dann alle konservativen Kräfte zu einem Potenzial V zusammen und definieren wie üblich eine Lagrange-Funktion L = T − V. Dann müssen wir aber die nicht-konservativen Kräfte noch zusätzlich in die Bewegungsgleichungen aufnehmen, indem wir ihre verallgemeinerten Komponenten Fα auf die rechte Seite schreiben. 58 Als Kombination der Bewegungsgleichungen (11.44) und (11.51) ergibt sich dann allgemeine Bewegungsgleichung ∂L d ∂L = Fα . α − dt ∂ q̇ ∂q α (11.67) Für V = 0 ist L = T , und es ergibt sich wieder die d’Alembertsche Formulierung. Für F α = 0 sind alle Kräfte konservativ, und es ergibt sich die Lagrangesche Formulierung. Als Beispiel fügen wir zu unserem oben definierten Teilchen mit Reibungskraft ein Potenzial V = V (r) hinzu, das nur vom Abstand von der z-Achse abhängen soll. In diesem Fall sind die Zylinderkoordinaten etwas besser an das Problem angepasst, denn dann hängt das Potenzial nur von einer Koordinate ab. Wir können uns als Realisierung eines solchen Systems ein elektrisch geladenes Teilchen vorstellen, das sich in einem Medium, das eine Reibung verursacht, in der Nähe eines geladenen Drahtes befindet. Um die Bewegungsgleichungen in der Form (11.67) aufzuschreiben, müssen wir nur statt der kinetischen Energie (11.60) die Lagrange-Funktion L=T −V = 1 m ṙ 2 + r 2 ϕ̇2 + ż 2 − V (r) 2 (11.68) verwenden. Die Reibungskraft ist die gleiche wie vorher. Folglich ändert sich nur die Bewegungsgleichung für die Koordinate r, denn nur in sie geht die Ableitung des Potenzials ein. Es genügt außerdem, nur die Bewegungsgleichungen für r und ϕ zu betrachten, da die Bewegung in z-Richtung ohnehin entkoppelt, d m ṙ = m r ϕ̇2 − η ṙ − V 0 (r), dt d m r 2 ϕ̇ = −η r 2 ϕ̇. dt (11.69) Aufgabe 11.23 Das Potenzial sei V (r) = κ r 2 /2, bewirke also eine lineare, rücktriebende Kraft. Welche Lösung ergibt sich dann aus den Anfangsbedingungen (11.66)? Auch hier l ässt sie sich wieder bestimmen, wenn man zuerst die unveränderte Bewegungsgleichung für den Drehimpuls pϕ = m r 2 ϕ̇ löst. Aufgabe 11.24 Es sei V (r) irgendeine monoton wachsende Funktion, so dass das Minimum des Potenzials auf der z-Achse liegt. Man zeige, dass in diesem Fall jede Bewegung, unabh ängig von den Anfangsbedingungen, früher oder später in der Nähe der z-Achse endet. Es gilt also r(t) → 0 für t → ∞. Aufgabe 11.25 Man führe wieder die analogen Überlegungen in Kugelkoordinaten durch, wobei das Potenzial in diesem Fall kugelsymmetrisch sein soll. Man zeige entsprechend, dass bei einem monoton ansteigenden Potenzial V (r) das Teilchen stets in der Nähe des Ursprungs endet, also auch hier r(t) → 0 für t → ∞ gilt. Die Lorentz-Kraft Mit der Mischform (11.67) haben wir die allgemeinste Darstellung für die Bewegungsgleichungen eines mechanischen Systems in einem beliebigen krummlinigen Koordinatensystem angegeben. Wir wollen jetzt noch der Frage nachgehen, was das allgemeinste Kraftgesetz ist, das sich allein aus einer LagrangeFunktion ableiten lässt. Bisher hatten wir argumentiert, dass es dazu ein Potenzial V geben muss, also eine Funktion des Ortes q ∈ Q, deren Gradient die Kraft ist. Eine genauere Betrachtung zeigt jedoch, dass sich eine viel größere Klasse von Kräfte durch eine Lagrange-Funktion beschreiben lässt. Interessanterweise sind es genau diejenigen Kräfte, die wir als elektromagnetische Kräfte kennen. Das ist ein sehr bemerkenswerter Umstand, denn es zeigt, dass es offenbar einen Zusammenhang zwischen der Lagrangeschen Formulierung der Mechanik und anderen, fundamentalen physikalischen Theorien gibt. 59 Um herauszufinden, welche Arten von Kräften sich prinzipiell aus einer Lagrange-Funktion ableiten lassen, betrachten wir irgendeine Funktion L, die ein Polynom vom Grad 2 in den Geschwindigkeiten ist, aber ansonsten beliebig vom Ort und der Zeit abhängt. Das ist natürlich noch längst nicht die allgemeinste mögliche Lagrange-Funktion. Da aber für mechanische Systeme die kinetische Energie immer eine quadratische Funktion der Geschwindigkeit ist, treten nur solche Lagrange-Funktionen für physikalisch realistische Systeme auf. Wir sind außerdem bescheiden und betrachten nur ein einzelnes Teilchen, also einen dreidimensionalen Konfigurationsraum, dessen Koordinaten wir mit ri bezeichnen. Dies seien die üblichen kartesischen Koordinaten im Euklidischen Raum, so dass wir alle Indizes nach unten schreiben können. Die LagrangeFunktion lautet dann 1 (11.70) L = Mij (r, t) ṙi ṙj + Ai (r, t) ṙi − φ(r, t), 2 wobei Mij ein beliebiges symmetrisches Tensorfeld zweiter Stufe ist, Ai ein beliebiges Vektorfeld, und φ ein beliebiges skalares Feld, jeweils auf dem dreidimensionalen Euklidischen Raum. Alle drei Felder können zudem von der Zeit abhängen. Das ist offenbar die allgemeinste Funktion L mit den verlangen Eigenschaften. Der spezielle Fall eines gewöhnlichen Teilchens der Masse m in einem Potenzial V (r, t) ist darin enthalten. In diesem Fall müssen wir nur Mij (r, t) = m δij , Ai (r, t) = 0 und φ(r, t) = V (r, t) setzen. Wie lauten nun die Bewegungsgleichungen, die sich aus (11.70) ergeben? Wir müssen dazu nur die Gleichung (11.51) auswerten. Zunächst ist ∂L = Mkj (r, t) ṙj + Ak (r, t). ∂ ṙk (11.71) Diese Größe müssen wir nach der Zeit ableiten, wobei wir jetzt beachten müssen, dass wir zuerst für r eine Bahn r(t) einsetzen müssen, und dass wir zusätzlich die explizite Zeitabhängigkeit der Felder M ij und Ai berücksichtigen müssen. Es genügt, den Ausdruck wie folgt teilweise mit Hilfe der Kettenregel auszuwerten, d d ∂L Mkj (r, t) ṙj + ∂i Ak (r, t) ṙi + ∂t Ak (r, t). (11.72) = dt ∂ ṙk dt Als Abkürzungen haben wir hier ∂t für die partielle Ableitung ∂/∂t nach der Zeit verwendet, und wie üblich ist ∂i die Ableitung ∂/∂ri nach den räumlichen Koordinaten. Jetzt müssen wir noch den zweiten Term in der Bewegungsgleichung ausrechnen. Das ergibt ∂L 1 = ∂k Mij (r, t) ṙi ṙj + ∂k Ai (r, t) ṙi − ∂k φ(r, t). ∂rk 2 (11.73) Wenn wir die Terme dann noch ein wenig ordnen, bekommen wir die Lagrange-Gleichung 1 d Mkj ṙj − ∂k Mij ṙi ṙj = ∂k Ai − ∂i Ak ṙi − ∂k φ + ∂t Ak . dt 2 (11.74) Diese Gleichung können wir wie folgt interpretieren. Auf der linken Seite steht die Zeitableitung des Impulses. Allerdings hängt der Impuls jetzt nicht mehr einfach nur linear mit der Geschwindigkeit zusammen, sondern über eine orts- und zeitabhängige Massenmatrix Mij . Das ist etwas ungewöhnlich, aber zumindest im Prinzip können wir uns ja durchaus vorstellen, dass die Trägheit eines Teilchens keine feste Eigenschaft des Teilchen ist, sondern von Ort, Zeit und sogar der Bewegungsrichtung im Raum abhängt. Genau dies wird durch die orts- und zeitabhängige Massenmatrix Mij ausgedrückt, also durch den quadratischen Teil der Lagrange-Funktion. Der zusätzliche Term auf der linken Seite ist derselbe, der sich auch in einem krummlinigen Koordinatensystem ergibt, wenn dort die Massenmatrix ortsabhängig ist. 60 Da die Kraft auf der rechten Seite der interessantere Aspekt der Bewegungsgleichung ist, setzen wir von nun an Mij = m δij , betrachten also ein “gewöhnliches” Teilchen mit der Masse m. Auf der linken Seite der Bewegungsgleichung (11.74) steht dann m r̈k , also Masse mal Beschleunigung. Die Kraft Fk auf der rechten Seite hängt aber immer noch vom Ort, der Geschwindigkeit und von der Zeit ab. Es ist also nicht einfach eine Potenzialkraft. Eine kurze Rechnung zeigt, dass wir diese speziele Form einer Kraft bereits kennen. Definieren wir nämlich zwei neue Vektorfelder, Bi = εijk ∂j Ak und Ei = ∂i φ + ∂t Ai , (11.75) dann gilt für die Kraft auf der rechten Seite von (11.74) Fk = εkij ṙi Bj + Ek oder F = ṙ × B + E. (11.76) Das ist die elektromagnetische Lorentz-Kraft. Nur die Ladungen und, je nach Wahl des Einheitensystems, die Lichtgeschwindigkeit fehlt in dieser Darstellung. Das lässt sich aber leicht beheben. Hat das Teilchen eine Masse m und eine Ladung q, und verwenden wir das Gaußsche Maßsystem, so müssen wir die Lagrange-Funktion 1 q L = m ṙ · ṙ + A(r, t) · ṙ − q φ(r, t) (11.77) 2 c verwenden, um die Bewegungsgleichung mit den richtigen Konstanten zu bekommen, nämlich m r̈ = q ṙ × B + q E, c mit B = ∇ × A, E = −∇φ − 1 ∂t A. c (11.78) Bemerkenswert an diesem Ergebnis ist nicht nur, dass die Lorentz-Kraft offenbar die allgemeinste Form einer Kraft ist, die sich für ein einzelnes Teilchen aus einer Lagrange-Funktion ableiten lässt. Das eigentlich verblüffende ist, dass nur solche elektrische und magnetische Felder auftreten, die Lösungen der homogenen Maxwell-Gleichungen sind, für die also gilt ∇×E+ 1 ∂t B = 0, c ∇ · B = 0. (11.79) Denn genau diese Felder lassen sich durch ein elektrisches Potenzial φ und ein magnetisches Vektorpotenzial A wie in (11.78) darstellen. Es lassen sich also nicht nur Potenzialkräfte aus einer Lagrange-Funktion ableiten, sondern auch geschwindigkeitsabhängige Kräfte, wenn sie die Form der Lorentz-Kraft haben. Dass dem so ist, können wir an dieser Stelle nur feststellen. Dass es sich dabei um eine sehr tiefsinnige Erkenntnis handelt, wird erst sehr viel später klar werden, wenn wir nämlich zeigen, dass sich auch die Bewegungsgleichungen des elektromagnetischen Feldes, also die Maxwell-Gleichungen aus einer Lagrange-Funktion ableiten lassen. Dann wird sich diese Eigenschaft der Lorentz-Kraft nämlich als eine Konsistenzbedingung ergeben, und es werden dabei auch die inhomogenen Maxwell-Gleichungen eine Rolle spielen. Aber das geht natürlich zu weit über die klassische Mechanik hinaus, als das wir es an dieser Stelle wirklich verstehen können. Wir werden uns im folgenden auf rein mechanische Systeme beschränken, und im nächsten Kapitel den Umgang mit Lagrange-Funktion ausführlich üben. Aufgabe 11.26 Aus der elementaren Elektrodynamik ist bekannt, dass sich die Felder E und B nicht ändern, wenn wir die Potenziale φ und A wie folgt eichtransformieren, φ0 = φ − 1 ∂t Λ, c A0 = A + ∇Λ, 61 (11.80) wobei Λ irgendeine Funktion von Ort und Zeit ist. Das ergibt sich auch durch Einsetzen unmittelbar aus (11.78). Die Lagrangefunktion L ändert sich jedoch, wenn wir diese Transformation durchführen. Man zeige, dass die transformierte Funktion durch L0 = L + q dΛ c dt (11.81) gegeben ist. Die Zeitableitung d/dt ist wie üblich so zu verstehen ist, dass wir die Funktion Λ erst entlang einer Bahn auswerten, und das Ergebnis dann als Funktion von Ort und Geschwindigkeit darstellen. Aufgabe 11.27 Man beweise folgenden allgemeinen Satz. Es sei L irgendeine Lagrange-Funktion auf einem Konfigurationsraum Q, die nicht einmal quadratisch in den Geschwindigkeiten sein muss. Sie wird in einem beliebigen Koordinatensystem dargestellt als Funktion der Ortskoordinaten q α , der Geschwindigkeiten q̇ α und der Zeit t. Eine zweite Lagrange-Funktion L0 sei definiert durch L0 = L + dΛ ∂Λ ∂Λ = L + α q̇ α + , dt ∂q ∂t (11.82) wobei Λ irgendeine Funktion der Orte q α und der Zeit t ist. Dann ergeben sich aus L und L0 dieselben Bewegungsgleichungen (11.51). Verschiedene Lagrange-Funktionen L und L 0 führen also auf die gleichen Bewegungsgleichungen, wenn sie sich nur um die totale Zeitableitung einer Funktion Λ unterscheiden. 62