Analytische Mechanik Prof. Dr. Peter van Dongen WS 2009/10 Institut für Physik Staudingerweg 7, 55128 Mainz c Copyright 2004 Peter van Dongen, Mainz, Germany letzte Aktualisierung: 5. Februar 2010 Inhaltsverzeichnis Vorwort 1 1 Spezielle Relativitätstheorie 1.1 Erste Konsequenzen der Postulate . . . . . . . . . . . . . 1.2 Der Abstand und die Eigenzeit . . . . . . . . . . . . . . 1.3 4-Schreibweise und Lorentz-Transformationen . . . . . . . . 1.3.1 Poincaré- und Lorentz-Transformationen . . . . . . . 1.4 Physikalische Konsequenzen der Lorentz-Invarianz . . . . . . 1.5 4-Vektoren . . . . . . . . . . . . . . . . . . . . . . . 1.6 Masse und Energie . . . . . . . . . . . . . . . . . . . . 1.7 Die Lorentz-Kraft und elektromagnetische Felder . . . . . . 2 4 6 10 12 13 16 21 23 2 Lagrange-Formalismus 2.1 Die Newton’sche Mechanik . . . . . . . . . . . . . . . . 2.2 Die Lagrange-Funktion . . . . . . . . . . . . . . . . . . 2.3 Das Hamilton’sche Extremalprinzip . . . . . . . . . . . . . 2.3.1 Einfache Beispiele aus der Variationsrechnung . . . . 2.4 Invarianzen der Lagrange-Gleichung . . . . . . . . . . . . 2.4.1 Addition einer vollständigen Zeitableitung . . . . . . 2.4.2 Galilei-Invarianz . . . . . . . . . . . . . . . . . . 2.4.3 Eichinvarianz . . . . . . . . . . . . . . . . . . . 2.4.4 Invarianz unter „Zeitumkehr“ . . . . . . . . . . . . 2.5 Zwangsbedingungen . . . . . . . . . . . . . . . . . . . 2.6 Verallgemeinerte Koordinaten . . . . . . . . . . . . . . . 2.6.1 Die Bewegungsgleichung in verallgemeinerten Koordinaten 2.6.2 Verallgemeinerte Kräfte . . . . . . . . . . . . . . . 2.7 Das Hamilton’sche Prinzip in verallgemeinerten Koordinaten . 2.8 Die Lagrange-Gleichungen der ersten Art . . . . . . . . . . 2.9 Beispiel einer rheonomen Zwangsbedingung . . . . . . . . . 2.10 Erhaltungsgrößen . . . . . . . . . . . . . . . . . . . . . 2.10.1 Elimination von zyklischen Koordinaten . . . . . . . 2.11 Das Noether-Theorem . . . . . . . . . . . . . . . . . . 25 26 28 34 38 42 42 42 44 45 47 51 53 55 61 62 66 70 72 74 3 Hamilton-Formalismus 3.1 Die Legendre-Transformation . . . . . . . . . . . . . . . 3.1.1 Funktionen mehrerer Variabler . . . . . . . . . . . . 3.1.2 Funktionen mit zusätzlichen „Dummy“-Variablen . . . 79 80 83 85 ------------------------------------------------------------------------------------------------------------------ INHALTSVERZEICHNIS 3.2 3.3 3.4 3.5 3.1.3 Anwendung auf die Lagrange-Funktion . . . . . . . . 86 Beispiele für die Wirkung des Hamilton- Formalismus . . . . 91 3.2.1 Geschwindigkeitsunabhängige Kräfte . . . . . . . . . 91 3.2.2 Lorentz-Kräfte . . . . . . . . . . . . . . . . . . 93 Ein Variationsprinzip für die Hamilton-Gleichungen . . . . . . 94 Erhaltungsgrößen und Poisson-Klammern . . . . . . . . . 96 3.4.1 Beispiel: Vektoren . . . . . . . . . . . . . . . . . 99 Kanonische Transformationen . . . . . . . . . . . . . . . 100 3.5.1 Alternative Formulierungen der Berührungstransformation . . . . . . . . . . . . . . . . . . . . . . . . 104 3.5.2 Berührungstransformationen als Gruppe . . . . . . . 105 4 Relativistische Dynamik 4.1 Kräftefreie Teilchen . . . . . . . . . . . . . . . . . . . . 4.2 Wechselwirkung mit dem elektromagnetischen Feld . . . . . . . . . . . . . . . . . . . . . . . 4.3 Das Coulomb-Problem für ein einzelnes Teilchen . . . . . . . 106 107 Literaturverzeichnis 120 111 114 ii Vorwort Dieses Theorie-2-Skript ist eine überarbeitete Version der geTEXten Notizen, die ich im Laufe des SS 2004 zur Vorbereitung einer Kursvorlesung Theorie II: Allgemeine Mechanik vor Mainzer Studierenden geschrieben habe. Für die Fertigstellung dieses „Compuskripts“ möchte ich mich zunächst ganz herzlich bei meinen zwei Stützen, Elvira Helf und Albrecht Seelmann, bedanken. Frau Helf hat sich um den Text gekümmert, Herr Seelmann um die Formeln, die Grafiken und das Stichwortverzeichnis. Herrn Jun.-Prof. Nils Blümer bin ich dankbar für seine Kommentare zum Skript. Die Verantwortung für den Inhalt liegt natürlich bei mir. Sollte der Leserin oder dem Leser eine Unstimmigkeit auffallen, bitte ich um eine Mitteilung ([email protected]). Die aktuelle Version dieses Skripts findet man auf der Homepage meiner Gruppe: http://komet337.physik.uni-mainz.de/Group/. Bei der Themenwahl habe ich mich sowohl am Mainzer Theoriekanon als auch an den Inhalten der Vorlesungen, die die Studierenden bereits gehört hatten, orientiert. Als allgemeine Hintergrundinformation seien die Referenzen [1] – [8] empfohlen, wobei ich anmerken muss, dass die Darstellungen in [6] oft sehr „physikalisch“, diejenigen in [7] für Studierende im dritten Semester dagegen vielleicht allzu „mathematisch“ sind; Referenz [8] ist eine Fundgrube voller Ideen und Ergebnisse für den eher mathematisch interessierten Leser, mutet jedoch manchmal etwas altmodisch an. Ebenfalls eine Fundgrube ist das herrliche Buch „Über die Theorie des Kreisels“ von Klein und Sommerfeld [9]. Die Referenzen [10] und [11] sind insbesondere als weiterführende Literatur über die Spezielle Relativitätstheorie von Interesse. Speziell für astronomische Anwendungen der Mechanik seien die Bücher [12] und [13] empfohlen. Für konkrete Rechnungen liefern die mathematischen Handbücher [14] und [15] wertvolle Hilfestellungen. Ich hoffe, dass dieses Skript sich zumindest für Mainzer Studierende als nützlich erweist, und wünsche ihnen viel Erfolg und auch Spaß bei ihrer Erkundung der Analytischen Mechanik, die ja die Basis bildet für nahezu die gesamte Theoretische Physik. Mainz, im Oktober 2009 P. G. J. van Dongen Kapitel 1 Spezielle Relativitätstheorie Die Struktur der speziellen Relativitätstheorie ist derjenigen der nicht-relativistischen Klassischen Mechanik sehr ähnlich: In beiden Fällen beschreibt man die Dynamik von Körpern mit Hilfe einer (nicht-gekrümmten) vierdimensionalen Raum-Zeit. In beiden Fällen ist es sehr hilfreich, sich bei der Beschreibung dieser Dynamik zunächst auf Punkt teilchen zu konzentrieren. In beiden Fällen gilt das Relativitätsprinzip, das die Existenz von Inertialsystemen postuliert. Genau wie in der nicht-relativistischen Mechanik sind Inertialsysteme auch in der Relativitätstheorie durch die zwei Eigenschaften charakterisiert, dass alle physikalischen Gesetze in allen Inertialsystemen zu jedem Zeitpunkt gleich sind und dass alle Koordinatensysteme, die sich relativ zu einem Inertialsystem in geradlinig-gleichförmiger Bewegung befinden, selbst ebenfalls Inertialsysteme sind. Die Äquivalenz aller Inertialsysteme impliziert insbesondere auch die Homogenität und die Isotropie des Raums und der Zeit. Schließlich gilt sowohl für die Relativitätstheorie als auch für die nicht-relativistische Klassische Mechanik das deterministische Prinzip, das besagt, dass die auf ein Teilchen einwirkenden Kräfte nur vom Ortsvektor und von der Geschwindigkeit dieses Teilchens sowie von der Zeit abhängig sein können. Neben diesen Gemeinsamkeiten, von denen das Relativitätspostulat besonders wichtig ist, gibt es zwischen der relativistischen (R) und der nicht-relativistischen (NR) Mechanik auch einen wesentlichen Unterschied, der durch ein zweites Postulat zum Ausdruck gebracht wird: (R): Die Lichtgeschwindigkeit im Vakuum hat in allen Inertialsystemen denselben Wert c = 2, 997925 · 108 m/s. (NR): Die Lichtgeschwindigkeit ist effektiv unendlich groß im Vergleich zu allen anderen in der Theorie auftretenden Geschwindigkeiten. Das zweite Postulat bedeutet physikalisch, dass die Wechselwirkung zwischen Teilchen (z. B. durch Austausch von Strahlungsenergie oder Einwirkung von elektromagnetischen Kräften) in der nicht-relativistischen Theorie instantan erfolgt, während die Ausbreitungsgeschwindigkeit c der Wechselwirkung in der relativistischen Theorie eine endliche universelle Konstante (gültig in jedem Inertialsystem) ist. Das zweite Postulat der NR-Mechanik kann bekanntlich auch in der folgenden Weise formuliert werden: ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE (NR): Die Länge eines Zeitintervalls und der Abstand zweier gleichzeitiger Ereignisse sind in der nicht-relativistischen klassischen Mechanik absolute (d. h. beobachterunabhängige) Größen. Mathematisch bedeutet das zweite Postulat, dass die Newton’sche nicht-relativistische Mechanik kovariant unter Galilei-Transformationen und die Einstein’sche relativistische Mechanik kovariant unter Lorentz-Transformationen ist. Das relativistische Pendant der absoluten Größen „Zeit“ und „Abstand“ in der Newton’schen Mechanik ist der beobachterunabhängige „infinitesimale Abstand “ ds = [c2 (dt)2 − (dx)2 ]1/2 infinitesimal benachbarter Ereignisse, der somit eine der zentralen Größen der Relativitätstheorie darstellt. Eine Bemerkung noch zum Anwendungsbereich der speziellen Relativitätstheorie: Die nicht-relativistische Klassische Mechanik beschreibt die Dynamik physikalischer Objekte unter der Einwirkung von Kräften, die mikroskopisch auf Gravitationswechselwirkung oder elektromagnetische Wechselwirkung zurückgeführt werden können. Da die spezielle Relativitätstheorie Gravitationskräfte bekanntlich nicht beschreiben kann (hierfür benötigt man die allgemeine Relativitätstheorie), bleiben als ihr Anwendungsbereich nur elektromagnetische Kräfte übrig. Im Rahmen der speziellen Relativitätstheorie beschreibt man also typischerweise die Dynamik elektromagnetischer Felder bei vorgegebenen Ladungen und Strömen oder die Dynamik von Ladungen und Strömen bei vorgegebenen elektromagnetischen Feldern. Die zentralen Gleichungen der speziellen Relativitätstheorie sind daher die Maxwell-Gleichungen und die Lorentz’sche Bewegungsgleichung. Da diese beiden Pfeiler der Elektrodynamik Teilsysteme beschreiben und das Relativitätsprinzip für Teilsysteme - wie wir wissen - nur dann Sinn macht, wenn zusätzlich angegeben wird, wie die „Außenwelt“ mittransformiert wird, ist klar, dass die Bestimmung des Transformationsverhaltens von Ladungen, Strömen und Feldern unter Lorentz-Transformationen im Folgenden von großer Bedeutung sein wird. Etliche Ergebnisse der speziellen Relativitätstheorie waren bereits vor Einsteins Arbeit (1905) bekannt. Erwähnt seien insbesondere die Lorentz-Transformation in linearer (Lorentz, 1895) und in beliebiger Ordnung (Larmor, 1898; Lorentz 1899; Poincaré, 1905), die Lorentz- (oder Fitzgerald-Lorentz-)Kontraktion (Fitzgerald, 1889; Lorentz, 1892), die Lorentz-Kraft (Lorentz, 1895), die Gruppenstruktur der Lorentz-Transformationen, das Relativitätsprinzip, die Invarianz der Eigenzeit und das Additionsgesetz für Geschwindigkeiten (Poincaré, 1905). Das Großartige von Einsteins Beitrag (1905) ist die Reduktion der Theorie auf zwei Postulate und die Herleitung von alten und auch neuen Ergebnissen aus diesen Postulaten.1 Interessant ist noch, dass neben Lorentz’ Arbeit (1895) das Fizeau’sche Experiment (1851) und die Aberration von Sternenlicht (Bradley, 1729) Einsteins Denken beeinflusst haben, das oft zitierte MichelsonMorley-Experiment jedoch kaum. Für mehr Details sei auf die ausgezeichnete Einstein-Biografie „Subtle is the Lord“ von Abraham Pais (Oxford University Press, 1982) verwiesen. 1 Neu sind z. B. der transversale Doppler-Effekt , die Fresnel-Formel c′ = und das sogenannte „Zwillingsparadoxon“. c n +v 1− 1 n2 3 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE 1.1 Erste Konsequenzen der Postulate Eine sofortige Konsequenz aus den Postulaten der speziellen Relativitätstheorie ist, dass die Zeit (anders als in der Newton’schen Mechanik) keine absolute Größe ist. Betrachten wir nämlich zwei Bezugssysteme K ′ und K, wobei K ′ die Geschwindigkeit vrel (K ′ , K) = v relativ zu K hat, und nehmen wir an, dass in K ′ entlang der x′ · v̂-Achse ein Sender S und (in gleichem Abstand von S) zwei Empfänger E1 und E2 ruhen (siehe Abbildung 1.1). Zur Zeit t = 0 sendet S zwei Lichtsignale aus, eins zu E1 und eins zu E2 . Beide Empfänger werden ihre Signale (wegen der Isotropie des Raums) in K ′ gleichzeitig erhalten. Für einen Beobachter in K jedoch wird der Empfänger E1 sein Signal zuerst erhalten, da E1 sich auf das Licht, das sich auch in K mit der Geschwindigkeit c ausbreitet, zubewegt. Ereignisse, die also gleichzeitig sind in K ′ , müssen nicht gleichzeitig sein in K, und Zeitintervalle, die gleich sind in K ′ , sind im Allgemeinen ungleich in K. S E1 K E2 0 x v ^ v 0 K xv ^ Abbildung 1.1: Gleichzeitigkeit von Ereignissen in zwei Inertialsystemen Betrachten wir das Transformationsverhalten von Längen im Ortsraum und von Zeitintervallen etwas genauer. Abstände senkrecht zur Geschwindigkeitsrichtung werden in beiden Systemen K und K ′ als gleich groß empfunden. Nehmen wir z. B. an, im Ursprung 0 von K und im Ursprung 0′ von K ′ stehen zwei parallel zueinander (und senkrecht zur x · v̂-Achse) ausgerichteten Latten, beide mit einer Länge ℓ in ihrem Ruhesystem und beide mit einer Kreissäge an ihrem oberen Ende (siehe Abbildung 1.2). Wir nehmen des Weiteren an, dass 0 und 0′ für t = t′ = 0 zusammenfallen. Nun kann L′ aus der Sicht eines Beobachters im System K nicht kürzer als L selbst sein, da sonst (im Widerspruch zum Relativitätsprinzip) L durchgesägt wird und L′ unversehrt bleibt. Umgekehrt kann L′ aus der Sicht des Beobachters in K auch nicht länger sein. Also sind beide (aus der Sicht von Beobachtern in K oder K ′ ) gleich lang. L 0 K 0 K 00 L 0 Abbildung 1.2: Invarianz einer Länge senkrecht zur Geschwindigkeitsrichtung Befestigen wir nun statt der Kreissäge jeweils zwei Spiegel an den beiden 4 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE Latten, einen am oberen und einen am unteren Ende, und senden wir einen Lichtstrahl hin und her zwischen beiden Spiegeln (siehe Abbildung 1.3). Wir haben in dieser Weise zwei identische Uhren konstruiert, die in ihrem jeweiligen Ruhesystem durch die Periode T = 2ℓ/c charakterisiert werden. Berechnen wir nun die Periode T ′ der bewegten Uhr in K ′ aus der Sicht eines Beobachters in K. In einer Periode legt der Lichtstrahl in der an L′ befestigten Uhr – wie inqAbbildung 6.4 dargestellt – aus der Sicht des Beobachters in K einen Weg 2 2 ℓ2 + 12 vT ′ zurück. Da das Licht in K aufgrund des zweiten Postulats die Geschwindigkeit c hat, muss T′ = 2 c É ℓ2 + 1 ′ 2 vT 2 d. h. T ≡ γT 1 − β2 2ℓ/c T′ = q 1− 2 = p v c gelten. Aus der Sicht des Beobachters in K dauert die Periode einer bewegten Uhr also länger als diejenige einer identischen Uhr in K, laufen bewegte Uhren demnach generell langsamer. Diese Konsequenz der Postulate der Relativitätstheorie wird als Zeitdilatation bezeichnet. L 0 K 0 00 L K 0 Abbildung 1.3: Zwei identische Uhren in den Inertialsystemen K und K ′ x? ` 0 0 1 0 vT 2 vT 0 xk Abbildung 1.4: Berechnung der Periode einer sich relativ zum Beobachter mit der Geschwindigkeit v bewegenden Uhr Kippen wir nun die Uhr in K ′ , so dass die Latte L′ in Geschwindigkeitsrichtung zeigt (siehe Abbildung 1.5). Die Länge und die Periode der Uhr in K ′ sind 5 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE nach wie vor ℓ bzw. T , und die Periode aus der Sicht eines Beobachters in K ist T ′ . Bestimmen wir nun die Länge ℓ′ der bewegten Uhr in K ′ aus der Sicht des Beobachters in K. Diese Uhr bewegt sich (aus der Sicht von K) mit einer Geschwindigkeit v nach rechts. Nehmen wir an, dass ein Lichtstrahl eine Zeit t′LR bzw. t′RL benötigt, um sich von links nach rechts oder rechts nach links zu bewegen. Aus der Sicht von K gilt: t′LR = ℓ′ + vt′LR c , t′LR = ℓ′ /c 1−β t′RL = t′RL = ℓ′ − vt′RL c d. h. und daher , γT = T ′ = t′LR + t′RL = Es folgt also: ℓ′ = ℓ′ /c 1+β ℓ′ c 1 1 + 1−β 1+β = 2ℓ′ /c 2γ 2 ℓ′ = . 1 − β2 c ℓ Tc = , 2γ γ so dass die Länge eines bewegten Körpers in der Geschwindigkeitsrichtung verkürzt ist (im Vergleich zur Ruhelänge). Diese Konsequenz der Relativitätstheorie wird Lorentz- (oder Fitzgerald-Lorentz-)Kontraktion genannt. L 0 K 0 v K Abbildung 1.5: Zur Lorentz- bzw. Längenkontraktion 1.2 Der Abstand und die Eigenzeit In der Einführung wurde bereits darauf hingewiesen, dass die nicht-relativistischen absoluten Größen „Zeit“ und „Abstand“ in der Relativitätstheorie durch den beobachterunabhängigen „infinitesimalen Abstand“ ersetzt werden. Der infinitesimale Abstand ist in der Relativitätstheorie von zentraler Bedeutung, da seine Invarianz unter Koordinatentransformationen zwischen Inertialsystemen zeigt, dass die physikalischen Gesetze Lorentz-kovariant sind. Im Folgenden führen wir die Begriffe „Abstand“ und „Eigenzeit“ ein und leiten ein Theorem (Einstein, 1905) über die Eigenzeit bewegter Bezugssysteme ab. Betrachten wir die Emission eines Lichtsignals am Ort x1 zur Zeit t1 im Bezugssystem K und seine Absorption am Ort x2 zur späteren Zeit t2 , ebenfalls in K. Da das Signal sich in K gemäß dem zweiten Postulat mit der Geschwindigkeit c ausbreitet, gilt offensichtlich c2 (t2 − t1 )2 − (x2 − x1 )2 = 0 . 6 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE Seien die entsprechenden Koordinaten im Inertialsystem K ′ mit vrel (K ′ , K) = v durch (x′1 , t′1 ) und (x′2 , t′2 ) gegeben, dann gilt analog: c2 (t′2 − t′1 )2 − (x′2 − x′1 )2 = 0 , da das Lichtsignal in K ′ nach dem zweiten Postulat ebenfalls die Geschwindigkeit c hat. Die Größe 1 s ≡ [c2 (t2 − t1 )2 − (x2 − x1 )2 ] 2 wird als Abstand zwischen den Ereignissen bei (x1 , t1 ) und (x2 , t2 ) bezeichnet. Das obige Argument zeigt, dass die Aussage s = 0 in allen Inertialsystemen gilt, falls sie in irgendeinem Inertialsystem zutrifft. Der Abstand infinitesimal benachbarter Ereignisse (x, t) und (x + dx, t + dt) in K ist durch ds = È (1.1) c2 (dt)2 − (dx)2 gegeben. Analog gilt in einem beliebigen Inertialsystem K ′ für den Abstand È ′ infinitesimal benachbarter Ereignisse: ds = c2 (dt′ )2 − (dx′ )2 , und wiederum impliziert ds = 0 in K die Identität ds′ = 0 für alle K ′ . Das negative Vorzeichen von (dx)2 in (1.1) zeigt, dass der Abstand hier nicht gemäß der euklidischen, sondern nach einer (von Hermann Minkowski eingeführten) pseudoeuklidischen Geometrie definiert wird. Der Abstand infinitesimal benachbarter Ereignisse ds wird alternativ auch als Linienelement oder als differentielles (Raum-Zeit-) Intervall bezeichnet. Es ist übrigens zu beachten, dass die infinitesimale Größe ds kein H exaktes Differential darstellt, so dass die Auswertung von Integralen der Form ds entlang einer geschlossenen Schleife im Allgemeinen nicht Null ergibt. Die Invarianz der Aussage ds = 0 unter Koordinatentransformationen, d. h. die Äquivalenz der Aussagen ds = 0 im Inertialsystem K und ds′ = 0 in K ′ , hat weitreichende Konsequenzen. Um dies zu sehen, versuchen wir, diese Gleichunu gen geometrisch zu interpretieren. Mit den Notationen dx dt ≡ u und c ≡ β u gilt in K: u2 ) = c2 (dt)2 (1 − β 2u ) . c2 Die geometrische Interpretation von ds = 0 in K ist daher, dass der dimensionslose Geschwindigkeitsvektor βu auf einer Kugel mit Radius 1 und Mittelpunkt 0 liegt, so dass |u| = c gilt. Da die Gleichung ds = 0 die Ausbreitung von Lichtsignalen beschreibt, kann dieses Ergebnis nicht erstaunen. Wir betrachten nun die Interpretation von ds′ = 0 in K ′ : Hierzu nehmen wir an, dass die Orts- und Zeitkoordinaten (x′ , t′ ) in K ′ gemäß x′ = x′ (x, t; v) und t′ = t′ (x, t; v) mit den Koordinaten (x, t) in K verknüpft sind. In diesem Fall gilt die lineare Beziehung 0 = (ds)2 = c2 (dt)2 − (dx)2 = c2 (dt)2 (1 − c dt′ c dt =Λ dx′ dx , Λ(x, t; v) ≡ ∂t′ ∂t 1 ∂x′ c ∂t c ∂t′ ∂x T ∂x′ ∂x , wobei die Matrix Λ offensichtlich reell ist.2 Die Gleichung 0 = (ds′ )2 = c2 (dt′ )2 − (dx′ )2 2 Die Transformationsmatrix Λ, die (c dt, dx) in K mit (c dt′ , dx′ ) in K ′ verknüpft, wird als Lorentz-Transformation bezeichnet. Wir werden später sehen, dass Λ(x, t; v) zwar explizit von v abhängt, aber unabhängig von (x, t) ist. 7 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE in K ′ kann daher in der Form c dt′ 0= dx′ T 1 0 mit ∼ 0T −11 B(x, t; v) ≡ Λ 1 0 c dt′ c dt = dx′ dx T c dt 1 B = c2 (dt)2 dx βu T 1 B βu 0T Λ −11 (1.2) geschrieben werden, wobei die Matrix B reell und symmetrisch ist. Diese Gleichung für β u in K ′ stellt nur dann eine Kugel mit Radius 1 und Mittelpunkt 0 dar, wenn die Matrix B die Form 1 1 ε 0 B= 0T −11 , (1.3) ε = ε(x, t; v) hat, wobei ε reellwertig (mit ε 6= 0) ist. Es folgt: (ds′ )2 = 1 2 1 c (dt)2 (1 − β 2u ) = (ds)2 ε ε und daher: ds ds′ 2 = ε(x, t; v) . Hierbei kann ε jedoch wegen der Homogenität des Raums und der Zeit nicht von (x, t) oder (x′ , t′ ) und wegen der Isotropie des Raums nicht von v̂ abhängen. Somit ist nur eine Abhängigkeit vom Geschwindigkeitsbetrag v möglich: (ds)2 = ε(v)(ds′ )2 . Betrachten wir nun umgekehrt eine Koordinatentransformation vom Inertialsystem K ′ zum Inertialsystem K, so dass vrel (K, K ′ ) = −v gilt, dann erhält man analog (ds′ )2 = ε(v)(ds)2 . Kombination der beiden Transformationen liefert (ds)2 = ε(v)(ds′ )2 = [ε(v)]2 (ds)2 bzw. [ε(v)]2 = 1 . Wegen ε(0) = 1 und der Kontinuität von ε(v) als Funktion der Relativgeschwindigkeit v kommt nur die Wurzel ε(v) = ε(0) = 1 in Betracht. Wir erhalten somit: (ds)2 = (ds′ )2 (1.4) und nach einer Integration auch: s = s′ . Der Abstand ist also invariant unter Koordinatentransformation von einem Inertialsystem in ein anderes: (s21 )2 = c2 (t21 )2 − (x21 )2 = c2 (t′21 )2 − (x′21 )2 = (s′21 )2 , (1.5) wobei t21 ≡ t2 − t1 definiert wurde, usw. Durch Einsetzen des Ergebnisses ε = 1 in (1.2) und (1.3) können wir außerdem schließen, dass die LorentzTransformation Λ die Matrixgleichung 1 0 ∼ 1 0T =Λ −11 0 0T Λ −11 (1.6) 8 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE erfüllen muss. Diese Konsistenzgleichung schränkt die mögliche Form der Transformationsmatrix Λ stark ein. Aus (1.5) wird klar, dass man nur dann zu zwei Ereignissen im System K ein anderes Bezugssystem K ′ finden kann, in dem diese Ereignisse am selben Ort auftreten (x′21 = 0), wenn (s21 )2 = c2 (t′21 )2 > 0 ist. Man bezeichnet reelle Abstände, (s21 )2 > 0, als zeit artig. Analog kann man nur dann zu zwei Ereignissen in K ein Bezugssystem K ′ finden, in dem diese Ereignisse gleichzeitig auftreten (t′21 = 0), falls (s21 )2 = −(x′21 )2 < 0 gilt. Imaginäre Abstände, (s21 )2 < 0, heißen raumartig. Nullabstände, (s21 )2 = 0, werden als licht artig bezeichnet. Diese Einteilung ist invariant unter Koordinatentransformationen und daher absolut. Sie wird häufig mit Hilfe eines einfachen „Weltbilds“ (oder auch „Minkowski-Diagramm“) dargestellt. Neben dem Lichtkegel (s21 )2 = 0, der lichtartige Abstände zwischen Ereignissen repräsentiert, unterscheidet man die absolute Zukunft, (s21 )2 > 0 mit t21 > 0, die absolute Vergangenheit, (s21 )2 > 0 mit t21 < 0, und das absolut Entfernte, (s21 )2 < 0. Eine kausale Beziehung zwischen zwei Ereignissen ist nur dann möglich, wenn ihr Abstand zeit- oder eventuell lichtartig ist, d. h. wenn (s21 )2 ≥ 0 gilt. t21 Zukunft entfernt entfernt x21 Vergangenheit Abbildung 1.6: Weltbild mit Lichtkegel Mit dem invarianten infinitesimalen Abstand ds ist offensichtlich eine invariante infinitesimale Zeit dτ verknüpft: Ê ds dτ ≡ = c 1 1− 2 c dx dt r 2 dt = 1− u 2 c dt = È 1 − βu2 dt = dt . (1.7) γu Diese Gleichung besagt, dass in einem bewegten Bezugssystem (z. B. für ein Teilchen), das sich mit der Geschwindigkeit u(t) relativ zum Inertialsystem K 9 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE bewegt, die Zeit dτ = γdtu vergeht, wenn die unbewegte Uhr in K die Zeitdauer dt anzeigt. Nur wenn das bewegte Bezugssystem und das Inertialsystem K identisch sind, so dass ihre Relativgeschwindigkeit verschwindet: u(t) = 0, gilt dτ = dt; aus diesem Grund wird τ als die „Eigenzeit“ des bewegten Bezugssystems bezeichnet. Integration von (1.7) liefert: Zt2 τ2 − τ1 = dt Zt2 È 1 − βu (t)2 = t1 dt t1 1 . γu (t) (1.8) Man sieht wiederum, dass bewegte Uhren langsamer laufen als ruhende. Wenn also zwei Uhren U1 und U2 anfangs im Inertialsystem K zusammen sind, U1 auch weiterhin in K verbleibt und U2 sich entlang einer geschlossenen Schleife bewegt, so dass beide Uhren schließlich wieder zusammen sind, dann ist U2 aufgrund von (1.7) und (1.8) im Vergleich zu U1 zurückgeblieben. Dieses Resultat geht auf Einstein (1905) zurück, der es als „Theorem“ bezeichnete. Die Fehlbezeichnung Uhren- oder Zwillingsparadoxon ist jüngeren Datums (Langevin, 1911). 1.3 4-Schreibweise und Lorentz-Transformationen Aufgrund der fundamentalen Bedeutung des invarianten Abstands infinitesimal benachbarter Ereignisse: d(ct) (ds) = c (dt) − (dx) = dx 2 2 2 T 2 1 0 0T −11 d(ct) d(ct) d(ct) = · dx d(−x) dx ist klar, dass es vorteilhaft ist, einen kontravarianten 4-Vektor xµ ≡ (ct, x) (µ = 0, 1, 2, 3) , den metrischen Tensor gµν = g µν ≡ 1 0 0T −11 und den mit xµ assoziierten kovarianten 4-Vektor xµ ≡ gµν xν = (ct, −x) einzuführen.3 Generell kann man den metrischen Tensor dazu verwenden, Indizes herunter- oder heraufzuziehen. Es gilt z. B.: gµν g νρ = gµρ ≡ δµρ , g µν gνρ = g µρ = δ µρ , wobei δµρ oder δ µρ das übliche Kronecker-δ bezeichnet. Hierbei wird implizit über zweimal (einmal unten und einmal oben) auftretende Indizes summiert (Einstein-Konvention). Wir führen die ko- bzw. kontravarianten Ableitungen 3 Hierbei sollte man den Namen „kontravariant“ und „kovariant“ nicht zu viel Gewicht beimessen: In seiner „Theory of Relativity“ plädiert Pauli dafür, diese Bezeichnungen zu vertauschen, bzw. sie durch die älteren Namen „kogredient“ und „kontragredient“ zu ersetzen. Wie man sieht: That which we call a rose by any other name would smell as sweet. 10 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE nach den Raum-Zeit-Koordinaten wie folgt ein: ∂µ ≡ ∂ ∂xµ ; ∂ µ = g µν ∂ν = ∂ . ∂xµ Der d’Alembert-Operator kann dementsprechend als Skalarprodukt ∂µ ∂ µ geschrieben werden: = 1 ∂2 − ∆ = g µν ∂µ ∂ν = ∂µ ∂ µ . c2 ∂t2 Das Quadrat der infinitesimalen Eigenzeit bzw. des Raum-Zeit-Intervalls ds ist ebenfalls als Skalarprodukt darstellbar: c2 (dτ )2 = (ds)2 = c2 (dt)2 − (dx)2 = gµν dxµ dxν = dxµ dxµ . Die linearen Transformationen des 4-Vektors xµ , die die Eigenzeit dτ invariant lassen, werden als Poincaré-Transformationen oder als inhomogene LorentzTransformationen bezeichnet: xµ → (x′ )µ = Λµν xν + aµ . (1.9) Hierbei gilt ΛT gΛ = g, denn die Invarianz der Eigenzeit erfordert: c2 (dτ )2 = gµν dxµ dxν = gµν d(x′ )µ d(x′ )ν = gµν Λµρ Λν σ dxρ dxσ d. h. gρσ = (ΛT )ρ µ gµν Λν σ oder kurz: g = ΛT gΛ . Die Inverse der Lorentz-Transformation folgt als Λ−1 = gΛT g, oder explizit: (Λ−1 )µν = (gΛT g)µν = g µρ (ΛT )ρσ g σν = (ΛT )µν = Λν µ . Hierbei ist zu beachten, dass die transponierte Lorentz-Transformation (ΛT )µν ≡ Λν µ = gνρ g µσ Λρ σ nicht (wie im Falle einer dreidimensionalen Drehung) der gespiegelten Matrix (Λ̃)µν ≡ Λν µ entspricht; die gemischt räumlich-zeitlichen Matrixelemente erhalten ein zusätzliches Minuszeichen. Aufgrund der Identität ∼ gµν = (ΛT gΛ)µν = (ΛT )µρ gρσ Λσν = Λρµ gρσ Λσν = (Λ)µρ gρσ Λσν ist klar, dass die Bestimmungsgleichung g = ΛT gΛ für Lorentz-Transformationen in 4-Schreibweise genau dem Resultat (1.6) in konventioneller Matrixnotation entspricht. Wir haben bisher zwar gezeigt, dass das Skalarprodukt (1.1) invariant ist unter linearen Transformationen, die dann unbedingt die Form einer PoincaréTransformation haben müssen, aber man kann umgekehrt auch leicht zeigen, dass nicht-lineare Transformationen das Skalarprodukt nicht invariant lassen. Hierzu gibt es ein physikalisches und ein mathematisches Argument. Das physikalische Argument ist, dass eine nicht-lineare Transformation eine geradliniggleichförmige Bewegung in einem Inertialsystem in eine nicht-geradlinige oder nicht-gleichförmige Bewegung in einem anderen Koordinatensystem transformiert, das daher kein Inertialsystem sein kann. Das mathematische Argument basiert auf der Invarianz der Eigenzeit, gµν dxµ dxν = c2 (dτ )2 = c2 (dτ ′ )2 = = gαβ dx′α dx′β gαβ ∂µ (x′α )∂ν (x′β )dxµ dxν . 11 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE Da diese Gleichung für alle dxµ gelten soll, gilt die Identität gµν = gαβ ∂µ (x′α )∂ν (x′β ) , die Gleichung (1.6) in 4-Schreibweise darstellt, und daher, nach der Differentiation bezüglich xγ : 0 = ≡ gαβ [∂γ ∂µ (x′α )∂ν (x′β ) + ∂µ (x′α )∂γ ∂ν (x′β )] gαβ Γαβ γµν . 0 = αβ αβ gαβ (Γαβ γµν + Γµγν − Γνµγ ) Folglich ist auch: = = gαβ [2∂γ ∂µ (x′α )∂ν (x′β ) + ∂µ (x′α )∂γ ∂ν (x′β ) + ∂γ (x′α )∂µ ∂ν (x′β ) −∂ν ∂µ (x′α )∂γ (x′β ) − ∂µ (x′α )∂ν ∂γ (x′β )] 2gαβ ∂γ ∂µ (x′α )∂ν (x′β ) . Da die Matrizen gαβ und ∂ν (x′β ) beide nicht-singulär sind, folgt sofort ∂γ ∂µ (x′α ) = 0 , so dass x′α notwendigerweise eine lineare Funktion der Koordinaten xµ ist, d. h.: x′α = Λαµ xµ +aµ . Einsetzen in (1.4) ergibt die Relation ΛT gΛ = g in (1.9). Hiermit ist auch bewiesen, dass die Matrix Λ in (1.6) tatsächlich (x, t)-unabhängig ist, wie angekündigt. 1.3.1 Poincaré- und Lorentz-Transformationen Poincaré-Transformationen bestehen - wie gesagt - aus einem homogenen Anteil, der als Lorentz-Transformation Λ bezeichnet wird, und einem inhomogenen Anteil (d.h. einer Translation). Die Gesamtheit aller Lorentz-Transformationen Λ|ΛT gΛ = g bildet eine Gruppe, die Lorentz-Gruppe L. Die Gruppenstruktur der Lorentz-Gruppe folgt direkt aus der Relation ΛT gΛ = g, denn wenn Λ1 und Λ2 zur Lorentz-Gruppe gehören, gilt dasselbe für das Produkt Λ1 Λ2 : T T T T (ΛT 2 Λ1 )g(Λ1 Λ2 ) = Λ2 (Λ1 gΛ1 )Λ2 = Λ2 gΛ2 = g . 2 Außerdem folgt aus ΛT gΛ = g, dass [det(Λ)] = 1 und daher det(Λ) = ±1 gilt. Innerhalb der Lorentz-Gruppe L ist die eigentliche orthochrone LorentzGruppe L↑+ , deren Elemente die Bedingungen Λ00 ≥ 1 und det(Λ) = 1 erfüllen, am wichtigsten. Zu dieser Untergruppe L↑+ von L gehören die gewöhnlichen Drehungen ΛR (α) um eine feste Achse α̂: ΛR (α) = 1 0 0T R(α) mit R(α)x = α̂(α̂ · x) − α̂ × (α̂ × x) cos(α) + (α̂ × x) sin(α) und die Geschwindigkeitstransformationen ΛB (φ, β̂) im Orts-Zeit-Raum, die auch als „boosts“, bezeichnet werden: ΛB (φ, β̂) = 11 + [cosh(φ) − 1] − sinh(φ)β̂ − sinh(φ)β̂ ! T [cosh(φ) − 1]β̂β̂ T . (1.10) 12 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE Hierbei hängen der Einheitsvektor β̂ und der Parameter φ über die Beziehung v = c tanh(φ)β̂ mit der Relativgeschwindigkeit v der Bezugssysteme zusammen. T Das Produkt β̂ β̂ ist als Dyade aufzufassen. Im Falle der Geschwindigkeitstransformation lautet die Beziehung zwischen x′ und x also explizit: ct′ = x′ −1/2 Mit der Relation cosh(φ) = 1 − tanh2 (φ) ′ ct x′ = cosh(φ)ct − sinh(φ)(x · β̂) − sinh(φ)ctβ̂ + [x − (x · β̂)β̂] + cosh(φ)(x · β̂)β̂ ct − βxk 0 +γ x⊥ (xk − vt)β̂ = 1 − β2 −1/2 . = γ folgt: wobei xk ≡ x · β̂ die Projektion von x auf die β̂-Richtung und x⊥ ≡ x − xk β̂ den senkrechten Anteil darstellt. Bei fester Geschwindigkeit v erhält man im Limes c → ∞ offensichtlich die Galilei-Transformation zurück: t′ = t , x′ = x − vt. Die Untergruppe L↑+ der Lorentz-Gruppe ist eine kontinuierliche Gruppe (Lie-Gruppe) und hat dann auch die entsprechende Struktur: Aufgrund der expliziten Darstellung von Drehungen und Boosts, s. Gleichung (1.10), zeigt man leicht, dass mehrmalige Anwendung kleiner Drehungen eine große Drehung ergibt: h ΛR (α) = ΛR α in , n ΛB (φ, β̂) = ΛB φ , β̂ n n (n ∈ N) . (1.11) Da der Definitionsbereich von φ = artanh(v/c) unbegrenzt ist, ist die LorentzGruppe nicht kompakt. Außerdem folgt aus (1.10) und (1.11), dass man allgemeine eigentliche, orthochrone Lorentz-Transformationen als Λ = e−iα·L−φ·M , φ ≡ φβ̂ , Lk = 0 0 0T ℓk , Mk = êTk ∅3 0 êk (1.12) darstellen kann, wobei ∅3 die 3 × 3-Nullmatrix ist und ℓ = (ℓ1 , ℓ2 , ℓ3 ) die Drehmatrizen sind: ℓ1 = 0 0 0 0 0 0 −i i 0 , ℓ2 = 0 0 0 0 −i 0 i 0 0 , ℓ3 = 0 i 0 −i 0 0 0 0 0 . Die Erzeuger L und M der Lie-Gruppe L↑+ erfüllen die Vertauschungsrelationen [Li , Lj ] = iεijk Lk , [Mi , Mj ] = iεijk Lk , [Li , Mj ] = iεijk Mk . Aus der Darstellung (1.12) folgt sofort Λ† 6= Λ−1 , so dass die (nicht-kompakte!) Lie-Gruppe L↑+ offensichtlich nicht-unitär ist. 1.4 Physikalische Konsequenzen der Lorentz-Invarianz Wir haben oben festgestellt, dass das zweite Einstein’sche Postulat (in Kombination mit weiteren Annahmen über die Homogenität und Isotropie von Raum und Zeit) die Lorentz-Invarianz des Skalarprodukts c2 (dτ )2 = (ds)2 = c2 (dt)2 − (dx)2 = dxµ dxµ (1.13) 13 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE bedingt. Umgekehrt impliziert die Invarianz dieses Skalarprodukts das zweite Postulat, also kann (1.13) als die zentrale Gleichung der Relativitätstheorie angesehen werden. Die Invarianz von (1.13) unter Lorentz-Transformationen bedeutet, dass alle physikalisch messbaren Größen entweder gemäß der LorentzGruppe oder zumindest einer geeigneten Darstellung dieser Gruppe transformiert werden. Da Rotationen in der Relativitätstheorie meist unwesentlich sind, konzentrieren wir uns im Folgenden überwiegend auf Geschwindigkeitstransformationen, so dass die Koordinaten zweier Inertialsysteme K und K ′ mit vrel (K ′ , K) = v, deren Ursprünge zur Zeit t = t′ = 0 zusammenfallen, durch ct′ x′ − sinh(φ) cosh(φ)β̂ cosh(φ) 0 + x⊥ − sinh(φ)β̂ = 1 0 +γ x⊥ −β = −β β̂ ct xk ct xk (1.14) verknüpft sind. Da die x⊥ -Komponenten invariant sind unter Lorentz-Transformationen, ist es oft sinnvoll, die zweidimensionale Darstellung ct′ x′k =γ −β 1 1 −β ct xk (1.15) einzuführen. Explizit lautet (1.15): ′ t ′ x k γ(t − cv2 xk ) γ(xk − vt) = = t xk bzw. = = γ(t′ + cv2 x′k ) . γ(x′k + vt′ ) (1.16) Gleichung (1.14) zeigt, dass ein Maßstab, der im Inertialsystem K senkrecht zu β̂ aufgestellt ist und dort die Länge ℓ hat, in K ′ genauso lang ist. Andererseits hat ein Maßstab, parallel zu β̂ in K, aus der Sicht von K ′ eine kleinere Länge: (1) ℓ′ < ℓ. Nehmen wir nämlich an, der Stab befinde sich in Ruhe zwischen xk und (1) (2) (2) xk , so dass xk − xk = ℓ gilt. Eine Messung der Länge des Stabs zur Zeit t′ in K ′ ergibt dann: ′(2) ℓ′ = xk ′(1) − xk = 1 (2) x − vt′ − γ k 1 (1) ℓ xk − vt′ = . γ γ (1.17) Dies ist die bereits bekannte Lorentz-Kontraktion. In der Herleitung geht also entscheidend ein, dass die Koordinaten x′(1) und x′(2) der Endpunkte bei dieser Längenmessung in K ′ gleichzeitig (zur selben Zeit t′ ) bestimmt werden. Aus (1.17) folgt noch, dass das Volumen V eines p beliebigen Körpers, der in K ruht, aus der Sicht von K ′ um einen Faktor γ1 = 1 − β 2 kleiner ist, da es sich bei der Geschwindigkeitstransformation in der β̂-Richtung um diesen Faktor verringert. Auch die Zeitdilatation lässt sich mit Hilfe der Lorentz-Transformation leicht nachweisen. Betrachten wir z. B. eine Uhr, die in K ′ ruht und anzeigt, dass zwischen zwei Ereignissen, die beide am Ort (x′k , x′⊥ ) in K ′ stattfanden, die Zeit ∆t′ = t′2 − t′1 vergangen ist. Für einen Beobachter in K ist zwischen beiden Ereignissen sogar ∆t = t2 − t1 = γ(t′2 + v ′ v x ) − γ(t′1 + 2 x′k ) = γ∆t′ c2 k c 14 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE vergangen, so dass er zum Schluss kommt, dass die Uhr in K ′ nachgeht: Bewegte Uhren laufen langsamer. Lorentz-Transformationen sind im Allgemeinen nicht-kommutativ, und das Gleiche gilt für Geschwindigkeitstransformationen. Man überprüft zum Beispiel leicht, dass ΛB (φ1 , ê1 )ΛB (φ2 , ê2 ) 6= ΛB (φ2 , ê2 )ΛB (φ1 , ê1 ) gilt. Eine Ausnahme sind Boosts in derselben Richtung: ΛB (φ2 , β̂)ΛB (φ1 , β̂) = ΛB (φ1 + φ2 , β̂) , denn Matrixmultiplikation zeigt: cosh(φ2 ) − sinh(φ2 ) − sinh(φ2 ) cosh(φ2 ) cosh(φ1 ) − sinh(φ1 ) − sinh(φ1 ) cosh(φ1 ) = cosh(φ1 +φ2 ) − sinh(φ1 +φ2 ) − sinh(φ1 +φ2 ) cosh(φ1 +φ2 ) . Die entsprechenden Geschwindigkeiten β1 , β2 und β1+2 sind also durch β1+2 = tanh(φ1 + φ2 ) = tanh[artanh(β1 ) + artanh(β2 )] β1 + β 2 = 1 + β 1 β2 (1.18) miteinander verknüpft. Hiermit haben wir das Additionsgesetz für (parallel ausgerichtete) Geschwindigkeiten erhalten. Wir betrachten - etwas allgemeiner und aus einem anderen Blickwinkel zwei Inertialsysteme K und K ′ mit vrel (K ′ , K) = v, deren Koordinaten durch eine Lorentz-Transformation verbunden sind: 1 ct 0 = +γ x x′⊥ β β β̂ ct′ x′k (1.19) . Führen wir noch die Geschwindigkeiten u≡ dx dt dx′ dt′ u′ ≡ , mit den Geschwindigkeitskomponenten uk = u· β̂ und u⊥ = u−uk β̂ und analog für u′ ein. Aus der ersten Zeile in (1.19) folgt: dt =γ dt′ ′ β dxk 1+ c dt′ dt′ 1 , = dt γ 1 + c12 vu′k bzw. und die zweite Zeile impliziert: dx dx′⊥ +γ = u= dt dt′ βc + dx′k β̂ dt′ u′⊥ + γ(v + u′k )β̂ dt′ . = dt γ 1 + c12 vu′k (1.20) Komponentenweise erhält man also: uk = u′k + v 1+ 1 ′ c2 vuk , u⊥ = u′⊥ γ 1+ 1 ′ c2 vuk . (1.21) Die Nichtkommutativität der Lorentz-Transformationen ist auch in (1.20) klar ersichtlich, denn u hängt nicht-symmetrisch von u′ und v ab. 15 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE Aus (1.21) kann auch das Transformationsverhalten von Winkeln bestimmt werden. Nehmen wir an, ein Teilchen bewegt sich in K mit der Geschwindigkeit u, die einen Winkel ϑ mit der β̂-Richtung einschließt: uk = u cos(ϑ) , u⊥ = u sin(ϑ)û⊥ ; analog gilt dann u′k = u′ cos(ϑ′ ) und u′⊥ = u′ sin(ϑ′ )û⊥ . Einsetzen in (1.21) liefert: u cos(ϑ) = u′ cos(ϑ′ ) + v 1 + c12 vu′ cos(ϑ′ ) , u sin(ϑ) = u′ sin(ϑ′ ) γ 1+ 1 ′ c2 vu , cos(ϑ′ ) und daher: tan(ϑ) = u′ sin(ϑ′ ) . γ[u′ cos(ϑ′ ) + v] Falls das „Teilchen“ ein Photon, oder klassisch: ein Lichtstrahl, ist und sich mit der Geschwindigkeit c bewegt, vereinfacht sich diese Formel auf tan(ϑ) = sin(ϑ′ ) . γ[cos(ϑ′ ) + β] (1.22) Diese Richtungsänderung des Lichts beim Übergang auf ein anderes Inertialsystem ist als Aberration bekannt und wurde erstmals 1725 von dem britischen Astronomen James Bradley beobachtet. Bradley entdeckte, dass die Position der Sterne sich ändert aufgrund der Bewegung der Erde in ihrer Umlaufbahn um die Sonne. Für kleine β-Werte erhält man aus (1.22): ϑ − ϑ′ ∼ [tan(ϑ) − tan(ϑ′ )] ∼ tan(ϑ′ ) cos2 (ϑ′ ) 1− β cos(ϑ′ ) −1 , und daher: ∆ϑ ≡ ϑ′ − ϑ ∼ β sin(ϑ′ ) + O(β 2 ) , in Übereinstimmung mit Bradleys Ergebnissen. 1.5 4-Vektoren Jede physikalische Größe aµ = (a0 , a1 , a2 , a3 ), die unter Lorentz-Transformationen genauso transformiert wird wie der 4-Ortsvektor xµ , (a′ )µ = Λµν aν , heisst kontravarianter 4-Vektor, jede Größe aµ , die wie xµ transformiert wird, (a′ )µ = Λµν aν , Λµν = gµρ g νσ Λρσ , ein kovarianter 4-Vektor. Mit Hilfe des metrischen Tensors kann man aus einem kovarianten 4-Vektor immer einen kontravarianten 4-Vektor machen, aµ = g µν aν , und umgekehrt. Das Quadrat eines 4-Vektors ist als a2 ≡ aµ aµ 16 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE definiert; es ist offensichtlich invariant unter Lorentz-Transformationen. Vektoren mit a2 > 0, a2 = 0 oder a2 < 0 werden zeit-, licht- oder raumartig genannt. Eine Größe, die invariant ist unter Lorentz-Transformationen, wird allgemein ein (Lorentz-)Skalar genannt. Auch das Skalarprodukt zweier unterschiedlicher 4-Vektoren, a · b ≡ aµ b µ = aµ b µ ist Lorentz-invariant und daher ein Skalar: (a′ )µ (b′ )µ = gµν (a′ )ν (b′ )µ = Λµσ gµν Λν ρ bσ aρ = (ΛT gΛ)σρ bσ aρ = gσρ bσ aρ = aσ bσ . Falls ϕ(x) ein Skalar ist, dann ist der 4-Gradient ∂ϕ = ∂µ ϕ = ∂xµ 1 ∂ϕ , ∇ϕ c ∂t ein kovarianter 4-Vektor. Dies folgt aus der Form der Poincaré-Transformation: (x′ )µ = Λµν xν + aµ bzw. xµ = (Λ−1 )µν [(x′ )ν − aν ] , die das Transformationsverhalten der Ableitungen: ∂ν′ = ∂xµ ∂µ = (Λ−1 )µν ∂µ = Λν µ ∂µ ∂(x′ )ν impliziert. Analog ist ∂ µ ϕ wegen (∂ ′ )ν = Λν µ ∂ µ ein kontravarianter 4-Vektor. Das Skalarprodukt ∂aµ = ∂µ aµ = ∂ µ aµ ≡ ∂ · a ∂xµ wird als 4-Divergenz bezeichnet; die 4-Divergenz ist also invariant unter LorentzTransformationen. Ein weiterer 4-Vektor ist die 4-Geschwindigkeit uµ eines Teilchens, das sich mit der 3-Geschwindigkeit u(t) im Inertialsystem K bewegt, dxµ u ≡ ds µ r , ds = cdt 1− u 2 c . Es ist zu beachten, dass die so definierte 4-Geschwindigkeit dimensionslos ist,4 da sowohl xµ als auch s die Dimension einer Länge besitzen. Da uµ also als Ableitung von xµ (einem 4-Vektor) nach dem Abstand s des Teilchens (einem Skalar) definiert ist, wird uµ selbst ebenfalls wie ein 4-Vektor transformiert. Die explizite Form von uµ ist: d u (ct, x) 1 uµ = qdt 2 = q 2 1, c ≡ γu (1, β u ) . 1 − uc c 1 − uc 4 Wir übernehmen hiermit die Notation von Landau und Lifschitz, Band II. Auch die Konµ ist üblich. In vielen Büchern sind beide Konventionen sowieso ununtervention uµ = dx dτ scheidbar, da c = 1 gesetzt wird. 17 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE Entweder aus dieser expliziten Form oder direkt aus dxµ dxµ = (ds)2 kann man nun u2 = uµ uµ = 1 folgern. Das Quadrat der 4-Geschwindigkeit ist also auf Eins normiert; ihre Komponenten sind daher nicht unabhängig. µ Analog definiert man die 4-Beschleunigung du ds , die ebenfalls ein 4-Vektor ist und die physikalische Dimension [Länge−1 ] hat. Durch Ableiten von uµ uµ = 1 findet man, dass die 4-Beschleunigung stets senkrecht auf der 4-Geschwindigkeit µ steht: du ds uµ = 0. Wir untersuchen nun das Transformationsverhalten einiger Größen, die in der Elektrodynamik relevant sind. Als erste Größe betrachten wir die elektrische Ladung von Elementarteilchen oder ganzen Körpern. Es ist ein experimentelles Faktum, dass die elektrische Ladung ein Lorentz-Skalar ist. Alles andere würde unserer Alltagserfahrung widersprechen: Obwohl die Ionen und Elektronen in Festkörpern sehr unterschiedliche Geschwindigkeiten haben und diese außerdem temperatur- und materialabhängig sind, sind Alltagsgegenstände - wie wir wissen - elektrisch neutral. Es folgt, dass die Ladungsdichte wie ρ′ = γv ρ0 transformiert wird, wenn ρ0 die Ladungsdichte im Ruhesystem K darstellt und ρ′ die Ladungsdichte in einem Inertialsystem K ′ mit vrel (K ′ , K) = v. Dies folgt sofort daraus, dass die Gesamtladung in einem Volumenelement erhalten ist, ρ0 dV = ρ′ dV ′ , und das Volumenelement gemäß dV ′ = dV γv transformiert wird. Nehmen wir nun an, die Ladungsdichte ruht nicht in K, sondern bewegt sich mit der Geschwindigkeit u in diesem Inertialsystem. Sie befindet sich somit offensichtlich in Ruhe im Inertialsystem K ′ mit vrel (K ′ , K) = u. Die in K 2 gemessene Ladungsdichte ist daher ρ = γu ρ0 mit γu ≡ (1 − uc2 )−1/2 . Neben der Ladungsdichte misst K auch eine Stromdichte j = ρu = γu ρ0 u. Insgesamt verhält j µ ≡ (cρ, j) = ρ0 cγu 1, u = ρ0 cγu (1, βu ) = ρ0 cuµ c sich also wie ein 4-Vektor und wird dementsprechend als 4-Stromdichte bezeichnet. Folglich wird j µ gemäß der Lorentz-Gruppe transformiert. In diesem Argument wurde vorausgesetzt, dass alle an ρ beteiligten Einzelladungen die gleiche Geschwindigkeit u haben. Im allgemeinen Fall, in dem die Ladungsdichte aus Ladungen unterschiedlicher Geschwindigkeit aufgebaut ist, erreicht man denselben Schluss, dass j µ = (cρ, j) wie ein kontravarianter 4-Vektor transformiert wird, indem man sich die Gesamtladungsdichte aus Teilladungsdichten uniformer Geschwindigkeit aufgebaut denkt. Das Erhaltungsgesetz für die Gesamtladung, das in differentieller Form als Kontinuitätsgleichung darstellbar ist, lautet in der 4-Schreibweise 0= ∂ 0 ∂ ∂(cρ) ∂ ∂ρ j + i j i = ∂µ j µ . +∇·j = + i ji = ∂t ∂(ct) ∂x ∂x0 ∂x Die manifeste Lorentz-Invarianz dieser Gleichung zeigt, dass die Gesamtladung in allen Inertialsystemen erhalten ist, falls sie in irgendeinem Inertialsystem erhalten ist. Wir zeigen nun, dass auch das skalare Potential Φ und das Vektorpotential A zu einem 4-Vektor, dem 4-Potential Aµ = (Φ, cA), kombiniert werden können. Aus den homogenen Maxwell-Gleichungen ∇ · B = 0 und ∇ × E + ∂B ∂t = 0 folgt 18 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE bekanntlich: E = −∇Φ − ∂A ∂t , B=∇×A. Die inhomogenen Maxwell-Gleichungen liefern daher: 1 (cρ) ε0 c ∂ 1 ρ = ∇ · E = −∆Φ − ∇ · A ε0 ∂t 1 ∂2 ∂ 1 ∂Φ = − ∆ Φ − ∇ · A + c2 ∂t2 ∂t c2 ∂t ∂ ∂Φ ∂ = Φ − ∇ · (cA) + = Φ − (∂ν Aν ) ∂(ct) ∂(ct) ∂(ct) = und 1 j ε0 c = µ0 cj = c ∇ × B − ε0 µ0 ∂E ∂t ∂Φ ∂ 2 A −∇ − ∂t ∂t2 2 1 ∂ A 1 ∂Φ = c ∇(∇ · A) − ∆A + 2 2 + 2 ∇ c ∂t c ∂t ∂Φ ∂ = ∇ ∇ · (cA) + + (cA) = (cA) − (∂ν Aν ) . ∂(ct) ∂(−x) 1 = c ∇ × (∇ × A) − 2 c Die Kombination dieser beiden Gleichungen liefert in 4-Schreibweise: 1 µ j = Aµ − ∂ µ (∂ν Aν ) . ε0 c (1.23) Die linke Seite dieser Gleichung ist ein 4-Vektor, also muss auch die rechte Seite wie ein 4-Vektor transformiert werden. Wegen der Eichfreiheit bei der Wahl von Aµ bedeutet dies noch keineswegs, dass die einzelnen Terme Aµ und ∂ µ (∂ν Aν ) in (1.23) wie 4-Vektoren transformiert werden; um dies zu erreichen, muss man die Eichung festlegen. Die Eichtransformation hat in 4-Schreibweise die Form Aµ −→ õ ≡ Aµ + ∂ µ Λ , wobei Λ eine zunächst beliebige Funktion des 4-Ortsvektors xν ist. Um diese Eichfreiheit zu eliminieren, wird häufig die Lorenz-Eichung, ∂ν Aν = 0 , (1.24) auferlegt. Die Bestimmungsgleichung für das 4-Potential reduziert sich in dieser Eichung auf: Aµ = 1 µ j . ε0 c (1.25) Die Lorenz-Eichung läßt sich immer realisieren, denn wenn ∂ν Āν 6= 0 gilt, kann man immer eine Funktion χ und ein neues 4-Potential Aµ einführen: χ ≡ −∂µ Āµ 19 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE Aµ ≡ Āµ + ∂ µ χ , so dass Aµ dieselben physikalischen Felder wie Āµ beschreibt und außerdem die Lorenz-Bedingung ∂µ Aµ = 0 erfüllt. Die Lorenz-Bedingung (1.24) legt das 4-Potential nicht eindeutig fest, da auch das alternative Potential õ = Aµ + ∂ µ Λ , (1.26) Λ = 0 die gleichen physikalischen Felder beschreibt und die Lorenz-Bedingung erfüllt. Das 4-Potential ist in der Lorenz-Eichung also bis auf eine Lösung der Wellengleichung bestimmt. Für alle möglichen Lorentz-Skalare Λ in (1.26) sind sowohl Aµ als auch õ physikalisch äquivalente 4-Vektoren. Gleichung (1.25) zeigt, dass das 4-Potential in der Lorenz-Eichung eine inhomogene Wellengleichung erfüllt. Genau wie bei der alternativen (und äquivalenten) Formulierung mit Hilfe der Coulomb-Eichung stellen wir fest, dass die Maxwell-Theorie elektromagnetische Wellen vorhersagt. Falls keine Quellen des elektromagnetischen Feldes vorhanden sind, also für j µ = 0, genügt Aµ (x) der homogenen Wellengleichung Aµ = 0 und kann somit als Überlagerung ebener Wellen der Form Aµ (x) = = ω (A0 )µ ei(k·x−ωt) = (A0 )µ e−i( c ct−k·x) ν (A0 )µ e−ikν x = (A0 )µ e−iϕ(x) (1.27) geschrieben werden, wobei die Phase ϕ(x) = kν xν und der 4-Wellenvektor k ν = ω c,k mit der Frequenz ω = c|k| eingeführt wurden. Nehmen wir an, (1.27) gilt im Inertialsystem K. Im Inertialsystem K ′ mit vrel (K ′ , K) = v gilt dann: ′ ′ (A′ )µ (x′ ) = Λµν Aν (x) = Λµν (A0 )ν e−iϕ(x) = (A′0 )µ e−iϕ (x ) mit (A′0 )µ ≡ Λµν (A0 )ν und ϕ′ (x′ ) ≡ ϕ(x) = kν xν = kν (Λ−1 )ν µ (x′ )µ = kν Λµν (x′ )µ ≡ (k ′ )µ (x′ )µ . Wir stellen also fest, dass die Amplitude des 4-Potentials wie ein 4-Vektor und die Phase wie ein Lorentz-Skalar transformiert werden. Außerdem haben wir die wichtige Entdeckung gemacht, dass auch der 4-Wellenvektor k ν ein echter 4-Vektor ist, d. h. gemäß der Lorentz-Gruppe transformiert wird: (k ′ )µ = Λµν kν bzw. (k ′ )µ = Λµν k ν . Im Falle von Wellenpaketen, d. h. von Überlagerungen ebener Wellen, gelten diese Schlussfolgerungen auch für jede einzelne FourierKomponente. Aus der Quantenmechanik ist bekannt, dass ein Photon mit dem Wellenvektor k und der Frequenz ω einen Impuls p = ~k und eine Energie E = ~ω besitzt. Für den Spezialfall des Photons stellen wir hier also erstmals fest, dass Impuls und Energie in der Relativitätstheorie zu einem 4-Vektor vereint wer den: pµ ≡ Ec , p = ~ ωc , k = ~k µ . Wir werden später sehen, dass diese enge Verflechtung von Energie und Impuls auch allgemeiner gilt. 20 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE Die Lorentz-Transformation für den 4-Wellenvektor k µ = ω c,k k · β̂ ≡ k cos(ϑ) und k⊥ ≡ k − kk β̂ ≡ k sin(ϑ)k̂⊥ : 1 ω ′ /c 0 = +γ ′ k k⊥ −β −β β̂ mit kk ≡ ω/c kk zeigt, dass die Frequenz ω der Welle abhängig vom Einfallswinkel ϑ wie folgt transformiert wird: ω ′ = γ(ω − βckk ) = γω 1 − β kk k = γω[1 − β cos(ϑ)] . (1.28) Hierbei ist das Transformationsgesetz für den Winkel, |k′⊥ | |k⊥ |/k sin(ϑ) |k⊥ | = k = = ω k kk′ γ[cos(ϑ) − β] γ kk − β c γ k −β tan(ϑ′ ) = oder umgekehrt tan(ϑ) = sin(ϑ′ ) , γ[cos(ϑ′ ) + β] natürlich gleich dem Gesetz (1.22) für die Transformation von Winkeln, das wir im Rahmen unserer Untersuchung von Aberration von Sternenlicht erhielten. Gleichung (1.28) beschreibt den relativistischen Doppler-Effekt : Die Frequenz ω wird nicht nur mit dem winkelabhängigen Faktor 1 − βv cos(ϑ) multipliziert, der bereits vom nicht-relativistischen Doppler-Effekt bekannt ist, sondern auch mit dem Faktor γv , der also eine relativistische Korrektur darstellt und sogar für transversal einfallendes Licht (ϑ = π2 ) einen Doppler-Effekt hervorruft („transversaler Doppler-Effekt“). Beim longitudinalen Doppler-Effekt (ϑ = 0 bzw. ϑ = π) wird die Frequenz ω wie folgt transformiert: Ê ′ ω = 1−β ω 1+β Ê (ϑ = 0) , ′ ω = 1+β ω 1−β (ϑ = π) . Beim transversalen Doppler-Effekt (ϑ = π2 ) tritt offensichtlich eine Rotverschiebung auf: ω = γ1v ω ′ < ω ′ . Als typische Anwendung des transversalen DopplerEffekts betrachten wir einen Stern, der im Inertialsystem K ′ ruht und dort Licht mit der Frequenz ω ′ ausstrahlt. Ein Beobachter auf der Erde („Inertialsystem K“), für den dieses Licht unter dem Winkel ϑ = π2 relativ zur v-Richtung einfällt, wird die kleinere Frequenz ω = ω ′ /γv messen. Der transversale Doppler-Effekt ist eine Konsequenz der Zeitdilatation, denn für den Beobachter auf der Erde wird eine in K ′ ruhende Uhr (in diesem Fall also der Licht ausstrahlende Stern) um einen Faktor γ1v langsamer laufen als eine Uhr, die im Inertialsystem K ruht. 1.6 Masse und Energie Wegen der einfachen quantenmechanischen Relation E = ~ω für die Energie eines Photons mit der Frequenz ω kann man aufgrund des Doppler-Effekts, Gleichung (1.28), sofort das Transformationsgesetz für die Energie elektromagnetischer Strahlung angeben: Sendet ein Körper in seinem Ruhesystem K insgesamt N Photonen der Frequenz ω unter einem Winkel ϑ zur β̂-Achse aus, 21 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE so misst ein Beobachter im Inertialsystem K ′ mit vrel (K ′ , K) = v = v β̂ die ausgestrahlte Energie E ′ = N ~ω ′ = γN ~ω[1 − β cos(ϑ)] = γE[1 − β cos(ϑ)] . (1.29) Betrachten wir nun einen Körper der Masse m0 in seinem Ruhesystem K, der in den Richtungen ϑ und ϑ − π jeweils N Photonen der Frequenz ω ausstrahlt, stets zwei Photonen (eins in jeder Richtung) zur gleichen Zeit. Die Energie des Körpers vor und nach dem Ausstrahlen sei E(0) bzw. E (0) (0). Schreiben wir noch: 2N ~ω = ε, dann lautet das Gesetz der Energieerhaltung in K: E(0) = E (0) (0) + 21 ε + 21 ε = E (0) (0) + ε . ! N h m0 ! N h # (# ) ^ Abbildung 1.7: Ausstrahlung von Photonen in zwei entgegengesetzte Richtungen Auch in K ′ gilt Energieerhaltung, nun für die Energien des bewegten Körpers und der Strahlung: E(v) = E (0) (v) + 21 εγ[1 − β cos(ϑ)] + 21 εγ[1 − β cos(ϑ − π)] = E (0) (v) + εγ . Zieht man die Energieerhaltungsgesetze in K und K ′ unter Verwendung von (0) Ekin (v) ≡ E (0) (v) − E (0) (0) Ekin (v) ≡ E(v) − E(0) , voneinander ab, so folgt für β = v c ≪ 1: (0) 2 2 1 1 2 m0 v − 2 εβ 2 ε 1 2 m0 − c 2 v Ekin (v) = Ekin (v) − ε(γ − 1) ∼ = (0) Das Massendefizit µ0 ≡ m0 − m0 = ε c2 (0) = 21 m0 v 2 . entspricht also einer Energie ε: ε = µ0 c2 . Da man prinzipiell die ganze Ruhemasse eines Körpers in Strahlung umwandeln kann (z. B. durch Annihilation von Materie und Antimaterie), folgt für E (0) (0) = E (0) (v) = 0 aus den beiden Energieerhaltungsgesetzen: E(0) = ε = m0 c2 , E(v) = εγ = γm0 c2 = mc2 . Hierbei wurde die relativistische Masse m ≡ γm0 eingeführt. Masse und Energie sind demnach äquivalent. Außerdem folgt nun auch für Teilchen, dass der 4Impulsvektor pµ ≡ u E = m0 cγu (1, β u ) = m0 cuµ , mu = mc 1, c c 22 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE ein 4-Vektor ist, der die physikalischen Größen Energie E und Impuls p = mu = γu m0 u untrennbar miteinander verknüpft. Das hier dargestellte Argument stammt aus einer Arbeit von A. Einstein (Annalen der Physik, 17, 639 (1905)), in der er übrigens interessanterweise eine klassische (d. h. nicht-quantenmechanische) Herleitung des Transformationsgesetzes (1.29) für die Strahlungsenergie gab. Das Konzept des Photons, das er ja selbst wenige Monate zuvor in seiner Arbeit über den photoelektrischen Effekt vorgeschlagen hatte, muss ihm wohl noch zu spekulativ erschienen sein. 1.7 Die Lorentz-Kraft und elektromagnetische Felder Bevor wir uns der Formulierung des relativistischen Kraftgesetzes, d.h. der Lorentz’schen Bewegungsgleichung widmen, betrachten wir die folgenden Ableitungen des 4-Potentials nach dem 4-Ortsvektor: F µν ≡ ∂ µ Aν − ∂ ν Aµ . Diese Ableitungen sind physikalisch äußerst relevant, da sie die Komponenten der elektrischen und magnetischen Felder bilden. Wir werden sie daher bei der relativistischen Formulierung der Lorentz-Kraft benötigen. Aus der Definition folgt sofort, dass F µν antisymmetrisch unter Vertauschung der Indizes (µν) ist; insbesondere gilt also F µµ = 0. Die explizite Form von F µν folgt aus F µµ = 0 und F i0 F ij = = ∂A ∂ A − ∂ A = −∇Φ − ∂t εijk (−cBk ) = −cεijk Bk i 0 0 i = Ei i als F µν = 0 E1 E2 E3 −E1 0 cB3 −cB2 −E2 −cB3 0 cB1 −E3 cB2 −cB1 0 . (1.30) Da die Elemente von F µν vollständig durch (E, B) bestimmt werden, heißt F µν auch elektromagnetischer Feldtensor. Die relativistische Variante der Lorentz-Kraft ist nun durch K µ ≡ qF µν uν = quν (∂ µ Aν − ∂ ν Aµ ) definiert. Da die 4-Geschwindigkeit uµ , das 4-Potential Aµ und die Ableitungen ∂ µ alle 4-Vektoren sind, werden sowohl uν Aν als auch der Differentialoperator uν ∂ ν unter Lorentz-Transformationen als Skalare und K µ selbst daher als kontravarianter 4-Vektor transformiert. Durch explizite Berechnung sieht man außerdem, dass K µ in der Tat eine relativistische Verallgemeinerung der Lorentz-Kraft darstellt: Kµ = q(F µ0 u0 + F µj uj ) = qγu [F µ0 + F µj (−βj )] = qγu (E · β , E + u × B) , (1.31) 23 ------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE wobei benutzt wurde: F ij (−βj ) = (−εijk cBk )(−βj ) = c(β × B)i = (u × B)i . Der Zeitanteil von K µ in (4.2) ist genau die Leistung, die das elektromagnetische Feld am Teilchen verrichtet. Betrachten wir nun die Gleichung m 0 c2 d2 xµ d2 xµ = m = Kµ 0 ds2 dτ 2 , dτ = dt γu , (1.32) die K µ mit einem anderen 4-Vektor, der 4-Beschleunigung, in Verbindung bringt. Gleichung (4.3) ist sicherlich korrekt im momentanen Ruhesystem des Teilchens, denn dann lautet sie: 0 , m0 d2 x dt2 = (0 , qE) . Da das Gesetz (4.3) in diesem speziellen Inertialsystem gilt und Lorentzkovariant formuliert wurde, muss es nach dem Relativitätsprinzip in jedem Inertialsystem gelten. Wir haben somit in der Form von Gleichung (4.3) die relativistische Formulierung der Lorentz’schen Bewegungsgleichung gefunden. Es ist klar, dass das Kraftgesetz (4.3) in der Speziellen Relativitätstheorie von zentraler Bedeutung ist, da es die Dynamik geladener Teilchen in beliebigen elektromagnetischen Feldern vollständig festlegt. Es sei schließlich noch daran erinnert, dass die 4-Beschleunigung stets senkrecht auf der 4-Geschwindigkeit stehen muss. Das Gleiche muss gemäß (4.3) dann natürlich auch für die 4-Kraft K µ gelten. Aufgrund der Antisymmetrie von F µν folgt tatsächlich: duµ uµ = uµ dτ q 1 Kµ = uµ F µν uν = 0 , m0 c m0 c so dass diese Konsistenzbedingung automatisch erfüllt ist. 24 Kapitel 2 Lagrange-Formalismus Während sich die „Einführung in die Theoretische Physik“ (Theorie 1) überwiegend mit der Newton’schen Bewegungsgleichung, ihren Invarianzeigenschaften und ihren physikalischen Vorhersagen befasste, werden wir uns im Folgenden (im Rahmen der Theorie-2-Vorlesung) mit dem Gedankengut von Newtons Erben auseinandersetzen. Die analytische Mechanik wurde im 18. und 19. Jahrhundert insbesondere von d’Alembert, Euler, Lagrange, Hamilton und Jacobi vorangetrieben, wobei allerdings auch viele andere (Johann Bernoulli, Maupertuis, Gauß, Cauchy, Poisson, Poincaré, . . . ) wichtige Beiträge geliefert haben. Als wichtigste Weiterentwicklungen im 20. Jahrhundert können wohl die Theorie dynamischer Systeme (mit Anwendungen in der Himmelsmechanik) und - im weiteren Sinne - die spezielle und allgemeine Relativitätstheorie, die Statistische Mechanik und die Quantenmechanik angesehen werden. Die Verzweigungen der Mechanik sind mittlerweile so zahlreich und ihre Methoden auch in anderen Bereichen so wertvoll, dass sie ohne Übertreibung als Fundament der Theoretischen Physik angesehen werden kann. In der Theorie-1-Vorlesung haben wir die Newton’sche Bewegungsgleichung, ṗi = Fi (X, Ẋ, t) , pi ≡ mi ẋi , mit X ≡ (x1 , x2 , . . . , xN ) , Ẋ ≡ (ẋ1 , ẋ2 , . . . , ẋN ) als Kern einer recht aussagekräftigen Theorie kennen gelernt, mit deren Hilfe sich grundsätzlich jedes Problem der Mechanik beschreiben lässt. Die Frage, warum die Theorie hiermit nicht bereits abgeschlossen ist, ja: warum sie überhaupt weiterentwickelt werden soll, ist daher durchaus berechtigt. Ein offensichtlicher Grund, weshalb die bisher vorgestellte Theorie nicht als abgeschlossen gelten kann, ist, dass sie nur für einzelne Teilchen (Massenpunkte) formuliert und untersucht wurde. Im Hinblick auf die Anwendung der Theorie in der realen Welt muss die Newton’sche Mechanik unbedingt auch für starre und elastische Körper und für ideale und zähe Flüssigkeiten weiterentwickelt werden. Zur Lösung dieser Aufgabe hat insbesondere Euler sehr viel beigetragen; auch die Arbeiten von Cauchy (über elastische Körper) und Navier und Stokes (über zähe Flüssigkeiten) waren auf diesem Gebiet von großer Bedeutung. -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Es gibt jedoch noch viele andere Fragen, die von der Newton’schen Mechanik nicht beantwortet werden. Man möchte z. B. besser verstehen, warum die Newton’sche Bewegungsgleichung, die ja die physikalische Bahn eines Systems bestimmt, überhaupt gilt: Ist die physikalische Bahn in irgendeinem Sinne (im Vergleich zu anderen denkbaren Bahnen zwischen den gleichen Anfangs- und Endpunkten) ausgezeichnet? Ist sie in irgendeinem Sinne „optimal“? Diese Frage konnte – wie wir sehen werden – in sehr eleganter Weise von Euler, Lagrange und Hamilton beantwortet werden. Des Weiteren ist die Newton’sche Bewegungsgleichung zunächst einmal in kartesischen Koordinaten formuliert und gilt zunächst nur in Inertialsystemen. Man möchte daher wissen, welche Bewegungsgleichungen für nicht-kartesische Koordinaten und Nicht-Inertialsysteme gelten und natürlich auch, welche Symmetrie- und Invarianzeigenschaften diese neuen Gleichungen besitzen. Eine ähnliche Frage drängt sich auf für die große und wichtige Klasse von Systemen mit Zwangsbedingungen (man denke z. B. an das sphärische und das mathematische Pendel oder an Hantelmoleküle). Außerdem stellt sich generell die Frage nach allgemeinen Lösungsverfahren für mechanische Probleme: Welche Form der Bewegungsgleichung ist am besten als Startpunkt für formale Untersuchungen geeignet? Wie ist die Bewegungsgleichung zu transformieren, damit sie sich wesentlich vereinfacht? Zur Beantwortung dieser Frage haben insbesondere Hamilton und Jacobi viel beigetragen. Schließlich hat sich herausgestellt, dass die Newton’sche Theorie für bestimmte Anwendungen und Weiterentwicklungen nicht die optimale Formulierung ist; Beispiele sind die Durchführung der Störungstheorie in der Himmelsmechanik und die Entwicklung der Quantenmechanik. Aus allen diesen Gründen brauchen wir ein wesentlich tieferes Verständnis der Struktur der klassischen Mechanik, und wir müssen uns mit weiteren wichtigen Anwendungen (z. B. mit der Physik starrer bzw. elastischer Körper) auseinander setzen. Dementsprechend werden wir uns im Folgenden sowohl mit den Grundlagen als auch mit der Anwendung befassen, wobei wir allerdings sehen werden, dass Grundlage und Anwendung in der analytischen Mechanik oft Hand in Hand gehen. In diesem zweiten Kapitel der Theorie-2-Vorlesung versuchen wir, einige der oben angesprochenen Fragen zu beantworten. Wir werden klären, inwiefern die physikalische Bahn in irgendeinem Sinne ausgezeichnet ist, und wir betrachten Nicht-Inertialsysteme, nicht-kartesische Koordinatensysteme und Systeme mit Zwangsbedingungen. Außerdem untersuchen wir die Beziehung zwischen den Symmetrien eines physikalischen Systems und seinen Erhaltungsgrößen. Der Formalismus, der uns die Beantwortung aller dieser Fragen ermöglicht, wurde – wie bereits angedeutet – insbesondere von d’Alembert, Euler, Lagrange, Hamilton und Jacobi geprägt und ist aufgrund von dessen herausragender Rolle zu Recht nach dem größten Mathematiker des 18. Jahrhunderts, Joseph Louis Lagrange, benannt worden. 2.1 Die Newton’sche Mechanik Bevor wir uns mit der Weiterentwicklung der Newton’schen Theorie befassen, rufen wir zuerst ihre wichtigsten Ausgangspunkte und Resultate in Erinnerung. Aufgrund des deterministischen Prinzips der klassischen Mechanik ist die physikalische Bahn X(t) = (x1 (t), . . . , xN (t)) eines N -Teilchen-Systems voll- 26 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS ständig durch die Anfangswerte der Koordinaten und Geschwindigkeiten festgelegt. Die entsprechende (nach Newton benannte) Bewegungsgleichung lautet für den Spezialfall zeitunabhängiger träger Massen mi : mi ẍi = Fi (X, Ẋ, t) (2.1) (i = 1, 2, . . . , N ) , wobei Fi die auf das i-te Teilchen einwirkende Kraft darstellt. Die Newton’sche Bewegungsgleichung (2.1) wird in kartesischen Koordinaten formuliert und gilt zunächst nur für Inertialsysteme. Die Gesamtkraft Fi in (2.1) ist im Allgemeinen (in) aufgebaut aus inneren Kräften Fi , die aufgrund von Wechselwirkung mit (ex) anderen Teilchen auf das i-te Teilchen wirken, und äußeren Kräften Fi , die die Wechselwirkung des N -Teilchen-Systems mit der „Außenwelt“ darstellen: (in) Fi = Fi (ex) ({xji }, {ẋji }) + Fi (X, Ẋ, t) . Hierbei kann man häufig annehmen, dass die inneren Kräfte das dritte Newton’sche Gesetz erfüllen: (in) Fi = X , fji j6=i fji = fji (|xji |)x̂ji . Für solche Kräfte, die das Gesetz „actio = −reactio“ erfüllen und konservativ sind, gilt (in) Fi = −∇i Vin (i = 1, 2, . . . , N ) , wobei das Potential der inneren Kräfte durch Vin (X) = X i<j Vji (|xji |) , Z x Vji (x) = Vji (x0 ) + dx′ fji (x′ ) x0 gegeben ist. Analog gilt für konservative äußere Kräfte: (ex) Fi = −∇i Vex (i = 1, 2, . . . , N ) , (ex) so dass auch Fi in diesem Fall aus einem Potential Vex (X) abgeleitet werden kann. Definieren wir also ein Gesamtpotential V (X) ≡ Vin (X) + Vex (X) , so gilt Fi = −(∇i V )(X) . Es ist bemerkenswert, dass Fi in diesem Fall weder von den Geschwindigkeiten {ẋj } noch explizit von der Zeitvariablen t abhängig ist. Bei der weiteren Diskussion gibt es einen wesentlichen Unterschied zwischen abgeschlossenen mechanischen Systemen und Teilsystemen. Abgeschlossene mechanische Systeme sind dadurch definiert, dass keine äußeren Kräfte auftreten bzw. dass diese für alle praktischen Zwecke vernachlässigt werden können: (ex) Fi =0 (i = 1, 2, . . . , N ) . 27 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS In diesem Fall gilt das Relativitätsprinzip, das die Existenz von Inertialsystemen postuliert. Es sei daran erinnert, dass Inertialsysteme durch die zwei Eigenschaften charakterisiert sind, dass alle physikalischen Gesetze in allen Inertialsystemen gleich sind und dass alle Koordinatensysteme, die sich relativ zu einem Inertialsystem in geradlinig-gleichförmiger Bewegung befinden, selbst auch Inertialsysteme sind. Inertialsysteme sind durch Galilei-Transformationen der Form x′ (x, t) = σR(α)−1 x − vt − ξ , t′ (x, t) = t − τ verbunden; unter solchen Transformationen ist die Newton’sche Bewegungsgleichung also forminvariant. Für abgeschlossene Systeme gilt allgemein, dass der Gesamtimpuls, der Gesamtdrehimpuls und die Gesamtenergie erhalten sind. Beispiele von abgeschlossenen mechanischen Systemen sind das allgemeine Zweiteilchenproblem (mit dem Kepler-Problem als Spezialfall) und das allgemeine N -Teilchen-Problem (mit den „kleinen Schwingungen“ als Spezialfall). Das Sonnensystem kann in guter Näherung als abgeschlossenes System angesehen werden. (ex) Teilsysteme sind an die Außenwelt gekoppelt; für sie gilt Fi 6= 0 für mindestens ein i ∈ {1, 2, . . . , N }. Die Bewegungsgleichung für Teilsysteme ist nicht ohne Weiteres forminvariant unter Galilei-Transformationen. Ihre Forminvarianz setzt voraus, dass das Transformationsverhalten der äußeren Kräfte explizit bekannt ist und dass sie bei der Galilei-Transformation mittransformiert werden. Von den vorher für abgeschlossene Systeme erwähnten Erhaltungsgrößen ist für Teilsysteme nur die Gesamtenergie erhalten, vorausgesetzt, dass sowohl die inneren als auch die äußeren Kräfte konservativ sind. Für den Gesamtimpuls und den Gesamtdrehimpuls erhält man jedoch die Bewegungsgleichungen dP X (ex) = Fi (X, Ẋ, t) ≡ F(ex) (X, Ẋ, t) dt i=1 N und dL X (ex) = xi × Fi ≡ N(ex) (X, Ẋ, t) , dt i=1 N die zeigen, dass diese physikalischen Größen für Teilsysteme im Allgemeinen nicht erhalten sind. Da diese Bewegungsgleichungen Vektor identitäten sind, ist es jedoch durchaus möglich, dass eine der Komponenten von F(ex) oder eine Komponente des Gesamtdrehmoments N(ex) Null ist; in diesem Fall wäre die entsprechende Komponente von P bzw. L erhalten. Bekannte Beispiele von Teilsystemen sind der harmonische Oszillator mit Reibung und einer antreibenden Kraft, das sphärische Pendel (mit dem mathematischen Pendel als Spezialfall) und das geladene Teilchen in einem elektromagnetischen Feld, auf das also die Lorentz-Kraft FLor = q(E + ẋ × B) wirkt. 2.2 Die Lagrange-Funktion Bemerkenswert an der Newton’schen Mechanik ist, dass die Bewegungsgleichung mi ẍi = Fi Vektorcharakter hat und die Gesamtenergie durch zwei skalare 28 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS P Größen, die kinetische Energie Ekin = i 12 mi ẋ2i und die potentielle Energie V ({xj }), bestimmt ist. Wir nehmen hierbei an, dass die Kräfte konservativ sind. Die Begriffe „Vektor“ und „Skalar“ werden hierbei – im Sinne der Tensorrechnung – durch das Transformationsverhalten der Kräfte bzw. der Energien unter orthogonalen Transformationen bestimmt. Im Folgenden zeigen wir – zunächst nur für einige Spezialfälle –, dass sowohl die Bewegungsgleichung als auch die Gesamtenergie in vielen Fällen durch eine einzelne skalare Funktion, die sogenannte Lagrange-Funktion, bestimmt werden. Aufgrund der Tatsache, dass die Kenntnis einer einzelnen skalaren Funktion die Dynamik komplizierter Vielteilchensysteme vollständig festlegt, vereinfacht sich der Formalismus in hohem Maße. Im Verlauf dieses Kapitels werden wir sehen, dass diese Vereinfachung nicht nur für die Newton’sche Mechanik in kartesischen Koordinaten zutrifft, sondern weitgehend verallgemeinert werden kann. Ein Wort vorab über Ableitungen. Wir werden im Folgenden Energien und Kräfte betrachten, die – in einem N -Teilchen-System – von den Variablen (X, Ẋ, t), d. h. von den Koordinaten der Teilchen, ihren Geschwindigkeiten und eventuell explizit von der Zeitvariablen t abhängen können. Diese physikalischen Größen sind für beliebige Werte der Variablen X, Ẋ und t definiert und werden dementsprechend auch als Funktionen von 6N + 1 unabhängigen Variablen ∂ (X, Ẋ, t) aufgefasst. Dies bedeutet konkret, dass bei der Ableitung ∂xjα bzw. ∂ ∂ ẋjα ∂ die (mit j = 1, 2, . . . , N und α = 1, 2, 3) oder bei der Zeitableitung ∂t anderen 6N Variablen festzuhalten sind. Neben den 6N +1 unabhängigen Variablen (X, Ẋ, t) werden wir zur Beschreibung der physikalischen Bahn, die die Lösung der Newton’schen Bewegungsgleichung zu vorgegebenen Anfangsbedingungen {xj (0)} und {ẋj (0)} darstellt, die Notation {xφj (t)} bzw. Xφ (t) einführen. Generell werden die Eigenschaften (z. B. die Energien, Kräfte, usw.) der physikalischen Bahn im Folgenden mit Hilfe des Index „φ“ bezeichnet. In der Literatur sind Aussagen, die für allgemeine Bahnen {xj (t)} zutreffen, und solche, die nur für die physikalische Bahn {xφj (t)} gelten, oft nicht klar getrennt. In diesem Abschnitt werden wir den Unterschied explizit angeben; falls Missverständnisse ausgeschlossen sind, wird der Index „φ“ in späteren Abschnitten unterdrückt. Betrachten wir zunächst den einfachen Fall eines einzelnen Teilchens unter der Einwirkung einer konservativen äußeren Kraft. Die kinetische Energie kann (für allgemeine Bahnen und insbesondere auch für die physikalische Bahn) mit Hilfe einer Funktion T (ẋ) beschrieben werden, die nur von der Geschwindigkeit des Teilchens abhängt: T (ẋ) = 21 mẋ2 , 2 Ekin (t) ≡ 21 m [ẋφ (t)] = T (ẋφ (t)) , und die äußere Kraft kann aus einem Potential abgeleitet werden: F(x) = F(ex) (x) = −(∇V )(x) . Mit Hilfe der Definition L(x, ẋ) ≡ T (ẋ) − V (x) kann die Bewegungsgleichung mẍφ = − ∂V ∂x (xφ ) daher in der Form einer Lagrange- 29 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Gleichung,1 d ∂V ∂V (xφ ) = (mẋφ ) + (xφ ) ∂x dt ∂x ∂V ∂L d ∂L d ∂T (ẋφ ) + (xφ ) = (xφ , ẋφ ) − (xφ , ẋφ ) = dt ∂ ẋ ∂x dt ∂ ẋ ∂x 0 = mẍφ + , d. h. als ∂L d ∂L (xφ , ẋφ ) − (xφ , ẋφ ) = 0 dt ∂ ẋ ∂x geschrieben werden. Auch die Gesamtenergie des Teilchens in der physikalischen Bahn lässt sich mit Hilfe der Funktion L ausdrücken: E = T (ẋφ ) + V (xφ ) = mẋ2φ − [T (ẋφ ) − V (xφ )] ∂T ∂L = ẋφ · (ẋφ ) − L(xφ , ẋφ ) = ẋφ · (xφ , ẋφ ) − L(xφ , ẋφ ) ∂ ẋ ∂ ẋ . Wir stellen fest, dass die Dynamik dieses einfachen Systems in der Tat vollständig durch eine einzelne skalare Funktion L(x, ẋ) beschrieben werden kann. Die Funktion L wird als die Lagrange-Funktion für dieses Problem bezeichnet. Wir werden im Folgenden sehen, dass die Darstellung der Bewegungsgleichung und der Gesamtenergie E mit Hilfe einer Lagrange-Funktion L auch auf komplexere physikalische Systeme übertragen werden kann. Die Verallgemeinerung auf N -Teilchen-Systeme mit konservativen inneren und äußeren Kräften ist einfach. Die kinetische Energie ist nun durch T (Ẋ) = N X 2 1 2 mi ẋi , i=1 Ekin ≡ T (Ẋφ ) und das Potential durch V (X) = Vin (X) + Vex (X) gegeben. Die Bewegungsgleichung lautet 0 = mi ẍφi − Fφi = mi ẍφi + ∂V ∂V d ∂T (Xφ ) = (Ẋφ ) + (Xφ ) , ∂xi dt ∂ ẋi ∂xi so dass mit der Definition L(X, Ẋ) ≡ T (Ẋ) − V (X) nun die Lagrange-Gleichung ∂L d ∂L (Xφ , Ẋφ ) − (Xφ , Ẋφ ) = 0 dt ∂ ẋi ∂xi 1 Diese (i = 1, 2, . . . , N ) Gleichung wird in der Variationsrechnung als Euler-Lagrange-Gleichung bezeichnet. Der Sprachgebrauch in der Physik ist differenzierter: Die Bestimmungsgleichung extremaler Lösungen von Variationsprinzipien wird in der Punktmechanik als Lagrange-Gleichung bezeichnet und nur in der Kontinuumsmechanik bzw. klassischen Feldtheorie als Euler-LagrangeGleichung. 30 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS oder auch kurz ∂L d ∂L (Xφ , Ẋφ ) = 0 (Xφ , Ẋφ ) − dt ∂ Ẋ ∂X gilt. Für die erhaltene Gesamtenergie erhält man den Ausdruck: X E = T (Ẋφ ) + V (Xφ ) = = X i i mi ẋ2φi − T (Ẋφ ) − V (Xφ ) ∂L ∂L (Xφ , Ẋφ ) − L(Xφ , Ẋφ ) , ẋφi · (Xφ , Ẋφ ) − L(Xφ , Ẋφ ) = Ẋφ · ∂ ẋi ∂ Ẋ so dass die skalare Lagrange-Funktion L wiederum ausreicht, die Dynamik des Systems vollständig zu beschreiben. Als nächste Stufe der Verallgemeinerung betrachten wir ein N -TeilchenSystem mit inneren Kräften, die – wie vorher – das dritte Newton’sche Gesetz erfüllen, und äußeren Kräften, die zwar aus einem Potential abgeleitet werden können, nun aber explizit zeitabhängig sind: (ex) Fi wf = −(∇i Vex )(X, t) . Solche Kräfte, die im Allgemeinen nicht-konservativ sind, werden als wirbelfrei bezeichnet. Da die Kräfte nicht konservativ sind, ist die Gesamtenergie des Systems im Allgemeinen nicht erhalten. Wir konzentrieren uns im Folgenden daher auf die Formulierung der Bewegungsgleichung mit Hilfe einer LagrangeFunktion. Aus der Definition L(X, Ẋ, t) ≡ T (Ẋ) − V (X, t) mit wf V (X, t) ≡ Vin (X) + Vex (X, t) folgt nun: 0 = mi ẍφi − Fφi d = dt ∂T ∂ ẋi ∂V + ∂xi φ d = dt ∂L ∂ ẋi ∂L − ∂xi , φ so dass die Bewegungsgleichung sogar für diesen recht allgemeinen zeitabhängigen Fall die Form einer Lagrange-Gleichung, d dt ∂L ∂ ẋi − ∂L ∂xi =0 , φ hat und somit vollständig durch die skalare Funktion L = T − V bestimmt wird. Der Index „φ“ deutet wie üblich an, dass die entsprechenden Größen für die physikalische Bahn auszuwerten sind. Beispiele von wirbelfreien Kraftfeldern wären langsam veränderliche elektrische Felder oder zeitlich veränderliche Gravitationskräfte. Da wir nun sowohl konservative (ortsabhängige) als auch wirbelfreie (ortsund zeitabhängige) Kräfte mit Hilfe einer Lagrange-Funktion beschreiben können, stellt sich die Frage, ob sich das Konzept der Lagrange-Funktion auch auf 31 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS geschwindigkeitsabhängige Kräfte übertragen lässt. Wir untersuchen diese Frage zuerst für den wichtigen Spezialfall elektromagnetischer Kräfte. Falls sich im elektromagnetischen Feld nur ein einzelnes geladenes Teilchen der Masse m und Ladung q befindet, lautet die Bewegungsgleichung mẍφ = FLor (xφ , ẋφ , t) = q [E(xφ , t) + ẋφ × B(xφ , t)] , wobei die (E, B)-Felder bekanntlich (siehe Kapitel 2 der Rechenmethoden-2Vorlesung) aus den elektromagnetischen Potentialen (Φ, A) abgeleitet werden können: E = −∇Φ − ∂A ∂t , B=∇×A . Aufgrund dieser Darstellung der Felder mit Hilfe von Potentialen sieht man leicht ein, dass auch die Lorentz-Kraft FLor aus einem Potential VLor (x, ẋ, t) ≡ q [Φ(x, t) − ẋ · A(x, t)] abgeleitet werden kann, wobei das Potential nun allerdings nicht nur orts- und zeit- sondern auch geschwindigkeitsabhängig ist. Aus der Vektoridentität ẋ × (∇ × A) = ∇(ẋ · A) − (ẋ · ∇)A folgt nämlich: FLor (x, ẋ, t) = q(E + ẋ × B) = q −∇Φ − § ∂A + ẋ × (∇ × A) ∂t ª ∂A ∂ + (ẋ · ∇)A = q − (Φ − ẋ · A) − ∂x ∂t ∂ d ∂VLor d ∂VLor = − VLor − q A = − + ∂x dt ∂x dt ∂ ẋ . Mit Hilfe der Definition L(x, ẋ, t) ≡ T (ẋ) − VLor (x, ẋ, t) vereinfacht sich die Bewegungsgleichung also zu d ∂T 0 = mẍφ − FLor (xφ , ẋφ , t) = − dt ∂ ẋ d ∂L − = dt ∂ ẋ d ∂VLor dt ∂ ẋ ∂L , ∂x φ ∂VLor + ∂x φ so dass die Dynamik des Systems auch in diesem Fall vollständig durch eine einzelne skalare Lagrange-Funktion bestimmt ist. Diese Schlussfolgerung lässt sich leicht verallgemeinern: Für N geladene Teilchen kann die Lorentz-Kraft nämlich als FLor i d = qi [E(xi , t) + ẋi × B(xi , t)] = dt Lor ∂Vex ∂ ẋi mit Lor Vex (X, Ẋ, t) = N X i=1 qi [Φ(xi , t) − ẋi · A(xi , t)] − Lor ∂Vex ∂xi 32 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS geschrieben werden. Falls die inneren Kräfte des N -Teilchen-Systems das dritte Newton’sche Gesetz erfüllen und die eventuell vorliegenden nicht-elektromagnetischen Kräfte wirbelfrei sind, kann die Gesamtkraft (in) Fi = Fi (wf) + Fi + FLor = i d dt ∂V ∂ ẋi − ∂V ∂xi aus dem Potential wf Lor V (X, Ẋ, t) ≡ Vin + Vex + Vex abgeleitet werden, und es folgt wiederum d dt ∂L ∂ ẋi ∂L − ∂xi =0 L(X, Ẋ, t) ≡ T − V , φ . Sogar in diesem recht allgemeinen und komplexen Fall kann die Dynamik in der Form einer einzelnen Funktion zusammengefasst werden. Es ist übrigens nicht so, dass alle möglichen Kraftgesetze mit Hilfe einer geeigneten Lagrange-Funktion in der Form einer Lagrange-Gleichung geschrieben werden können. Eine wichtige Ausnahme, für die keine Lagrange-Funktion existiert, sind Reibungskräfte: Zum Beispiel lässt sich die Bewegungsgleichung für ein einzelnes Teilchen, wf mẍφ = −(∇Vex )(xφ , t) + FR (ẋφ ) mit FR = −k ẋφ , nicht als Lagrange-Gleichung schreiben, da die Reibungskraft FR (ẋ) nicht in der ∂VR ∂VR d mit V − Form dt R = VR (x, ẋ, t) dargestellt werden kann. In diesem ∂ ẋ ∂x Fall benötigt man zwei skalare Funktionen, um die Dynamik des Systems zu beschreiben. Neben der Lagrange-Funktion wf L(x, ẋ, t) = T (ẋ) − Vex (x, t) , die den Einfluss der wirbelfreien äußeren Kraft beschreibt, führt man üblicherweise noch eine Dissipationsfunktion F ein: FR = − ∂F ∂ ẋ , F(ẋ) ≡ 21 k ẋ2 . Mit Hilfe dieser zwei skalaren Funktionen L und F kann die Bewegungsgleichung nun als d ∂L ∂L ∂F + =0 − dt ∂ ẋ ∂x ∂ ẋ φ geschrieben werden. Das Konzept der Dissipationsfunktion, das erstmals von Rayleigh eingeführt wurde, kann problemlos für N -Teilchen-Systeme verallgemeinert werden. Abschließend stellen wir fest, dass die Newton’sche Bewegungsgleichung für viele Systeme (jedoch nicht für alle) als Lagrange-Gleichung darstellbar ist. Im Folgenden zeigen wir, dass, falls eine Darstellung als Lagrange-Gleichung möglich ist, die physikalische Bahn aus einem Extremalprinzip bestimmt werden kann. Das Extremalprinzip liefert eine präzise Antwort auf die am Anfang dieses Kapitels gestellte Frage, wodurch die physikalische Bahn unter allen denkbaren Bahnen zwischen fest vorgegebenen Anfangs- und Endpunkten ausgezeichnet ist. 33 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS 2.3 Das Hamilton’sche Extremalprinzip Der Einfachheit halber betrachten wir zunächst nur ein einzelnes Teilchen, dessen Dynamik durch die Lagrange-Funktion L(x, ẋ, t) bestimmt wird. Die Anfangsbedingungen seien so, dass das Teilchen sich zur Zeit t1 am Ort x1 und zur späteren Zeit t2 am Ort x2 befindet. Unsere Aufgabe ist also, zu klären, in welcher Hinsicht die physikalische Bahn xφ , die die Lagrange-Gleichung d dt ∂L ∂ ẋ − ∂L =0 ∂x und die Anfangs- und Endbedingungen xφ (t1 ) = x1 und xφ (t2 ) = x2 erfüllt, unter allen denkbaren Bahnen x(t) mit x(t1 ) = x1 und x(t2 ) = x2 ausgezeichnet ist. Die Antwort auf eine solche Frage nach tieferem Verständnis ist – wie immer – nur dann hilfreich, wenn sie konzeptionell einfacher als die ursprüngliche Formulierung (d. h. in diesem Fall also die Lagrange-Gleichung) ist. Das Hamilton’sche Extremalprinzip ist in diesem Sinne äußerst hilfreich, da es alle möglichen Probleme der Lagrange’schen Mechanik und somit – wie wir gesehen haben – sehr viele Probleme der Newton’schen Mechanik in der einfachen (oder zumindest kurzen und eleganten) Formel (2.2) δS = 0 zusammenfasst. Die Kürze dieser Formel ist jedoch trügerisch: Konzeptionell ist sie keineswegs trivial. Im Folgenden wird erklärt, was die Symbole δ und S und die Null im rechten Glied genau bedeuten und in welchem Sinne beide Glieder gleich sind. Eine zentrale Rolle im Hamilton’schen Extremalprinzip spielt das sogenannte Wirkungsfunktional (x ,t ) S(x12,t12) [x] Zt2 = dt L(x(t), ẋ(t), t) , t1 das meistens kurz als S[x] oder S geschrieben und als die Wirkung bezeichnet wird. Das Wirkungsfunktional S[x] ist in der Tat ein Funktional , da es Funktionen (nämlich alle möglichen Bahnen x(t) mit x(t1 ) = x1 und x(t2 ) = x2 , insbesondere also auch die physikalische Bahn xφ (t)) auf reelle Zahlen abbildet: (x ,t ) S[x] ∈ R. Außerdem ist das Wirkungsfunktional S(x12,t12) in ihrer Abhängigkeit von den Anfangs- und Endkoordinaten (x1 , t1 ) bzw. (x2 , t2 ) eine normale Funktion. Das Wirkungsfunktional hat die physikalische Dimension [Energie] × [Zeit] = [Wirkung] . Hiermit ist die Bedeutung des Symbols S in (2.2) geklärt. Wir betrachten das Wirkungsfunktional im Folgenden für die physikalische Bahn xφ (t) und auch für benachbarte Bahnen x(t), die also nur geringfügig von der physikalischen Bahn abweichen: x(t) = xφ (t) + εξ(t) (ξ(t) ∈ R3 fest, ε ≪ 1) . (2.3) Wir sind hierbei insbesondere am Verhalten der Wirkung im Limes ε → 0 interessiert. Wegen der Bedingungen x(t1 ) = x1 und x(t2 ) = x2 muss ξ(t1 ) = ξ(t2 ) = 0 34 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS gelten; ansonsten ist die Funktion ξ(t) beliebig. Um die Variation der Bahn nahe xφ untersuchen zu können, führen wir die Notation δx ein: (δx)(t) ≡ x(t) − xφ (t) = εξ(t) und bezeichnen den Operator δ als Variation. Wir werden diesen Operator auch allgemeiner verwenden, um die Abweichung von physikalischen Größen von ihrem Wert für die physikalische Bahn zu beschreiben. Betrachten wir ein paar Beispiele: Die Variation δ ẋ der Geschwindigkeit ist durch (δ ẋ)(t) ≡ ẋ(t) − ẋφ (t) = εξ̇(t) definiert. Sei G(x, ẋ, t) allgemein eine Größe, die von den Bahnkoordinaten, der Geschwindigkeit und der Zeit abhängig ist. Ihre Variation δG ist dann durch (δG)(x, ẋ, t) ≡ G(x(t), ẋ(t), t) − G(xφ (t), ẋφ (t), t) gegeben, wobei x(t) die benachbarte Bahn (2.3) von xφ darstellt. Es ist wichtig, zu beachten, dass hierbei nur die Bahnvariablen (x(t), ẋ(t)) und nicht die Zeit t variiert werden. Die Variation δS des Wirkungsfunktionals ist schließlich durch (x ,t ) (x ,t ) (x ,t ) (δS)(x21 ,t21 ) [x] ≡ S(x12,t12) [x] − S(x12,t12) [xφ ] (x ,t ) (x ,t ) = S(x12,t12) [xφ + εξ] − S(x12,t12) [xφ ] gegeben. Die Variation δ hat die Eigenschaft, dass sie mit der Zeitableitung kommutiert: δ dxφ d(x − xφ ) d dx x (t) = (t) − (t) = (t) = dt dt dt dt d δx (t) dt oder kurz: d d = δ dt dt δ . Außerdem kommutiert die Variation δ mit bestimmten Integralen: Zt2 Zt2 dt L(x(t), ẋ(t), t) = δ t1 t1 Zt2 = t1 Zt2 dt L(x(t), ẋ(t), t) − dt L(xφ (t), ẋφ (t), t) t1 Zt2 dt (δL)(x(t), ẋ(t), t) = t1 oder kurz: Zt2 δ Zt2 dt = t1 dt δ t1 . dt L(x(t), ẋ(t), t) − L(xφ (t), ẋφ (t), t) d dt 35 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS 36 Hiermit sind auch die Bedeutung und einige der Eigenschaften des Symbols δ in (2.2) geklärt. Das Hamilton’sche Extremalprinzip besagt nun, dass das Wirkungsfunktional für x = xφ extremal ist. Dies bedeutet mathematisch, dass (x ,t ) (δS)(x12 ,t12 ) [xφ + εξ] = O(ε2 ) (ε → 0) und daher auch 1 (x ,t ) lim (δS)(x21 ,t21 ) [xφ + εξ] = 0 ε (2.4) ε→0 gilt. Da das linke Glied von (2.4) ein lineares Funktional von ξ darstellt, ist auch die Null im rechten Glied von (2.4) oder (2.2) als Funktional zu interpretieren, und das Gleichheitszeichen in diesen beiden Gleichungen deutet daher die Identität zweier Funktionale an. Wir zeigen nun, dass das Hamilton’sche Extremalprinzip äquivalent zur Lagrange-Gleichung ist. Hierzu berechnen wir 1ε δS und fordern, dass diese Größe im Limes ε → 0 Null ist: 1 1 δS = δ ε ε 1 = ε Zt2 t1 Zt2 t1 = Zt2 dt (δL)(x(t), ẋ(t), t) t1 dt L(xφ (t) + εξ(t), ẋφ (t) + εξ̇(t), t) − L(xφ (t), ẋφ (t), t) Zt2 dt t1 = 1 dt L(x(t), ẋ(t), t) = ε ∂L ∂L (xφ (t), ẋφ (t), t) · ξ(t) + (xφ (t), ẋφ (t), t) · ξ̇(t) + O(ε) ∂x ∂ ẋ t 2 ∂L (xφ (t), ẋφ (t), t) · ξ(t) ∂ ẋ t1 Zt2 § dt + t1 ª d ∂L ∂L (xφ (t), ẋφ (t), t) − (xφ (t), ẋφ (t), t) ∂x dt ∂ ẋ · ξ(t) + O(ε) Der erste Term im rechten Glied ist Null wegen der Bedingung ξ(t1 ) = ξ(t2 ) = 0, und die O(ε)-Korrektur ist im Limes ε → 0 vernachlässigbar. Das Hamilton’sche Prinzip (2.4) kann also nur dann gelten, wenn für alle möglichen Funktionen ξ(t) mit ξ(t1 ) = ξ(t2 ) = 0: Zt2 § dt t1 ª d ∂L ∂L (xφ (t), ẋφ (t), t) − (xφ (t), ẋφ (t), t) ∂x dt ∂ ẋ · ξ(t) = 0 gilt, und dies ist wiederum nur dann möglich, wenn die physikalische Bahn xφ die Lagrange-Gleichung erfüllt: ∂L d ∂L (xφ (t), ẋφ (t), t) − (xφ (t), ẋφ (t), t) = 0 . ∂x dt ∂ ẋ (2.5) Umkehrung dieser Argumentenkette zeigt, dass aus der Lagrange-Gleichung das Hamilton’sche Prinzip folgt, so dass beide Gleichungen äquivalent sind. . -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Um den mathematischen Inhalt der Lagrange-Gleichung (2.5) besser zu verstehen, schreiben wir die Variation δS der Wirkung in der Form Zt2 dt δS = t1 d ∂L − ∂x dt ∂L ∂ ẋ φ · (δx)(t) + O(ε2 ) , wobei der Index „φ“ wiederum andeutet, dass die entsprechende Größe an der Stelle der physikalischen Bahn auszuwerten ist. Vergleicht man diesen Ausdruck für δS nun mit der Variation einer normalen Funktion S({xi }) in der Nähe eines Punktes {xφi }: δS ≡ S({xφi + dxi }) − S({xφi }) = X ∂S i ∂xi ({xφi }) · dxi + . . . , wobei die Rolle der kontinuierlichen Variablen t also durch die diskrete Variable i übernommen wird, so wird klar, dass das linke Glied der Lagrange-Gleichung (2.5) als Ableitung des Funktionals S nach der Bahn x an der Stelle (xφ , t) zu interpretieren ist: d ∂L − ∂x dt ∂L ∂ ẋ = φ δS [xφ ] . δx(t) δS δx(t) wird dementsprechend als Funktionalableitung bezeichnet. Die Ableitung Die Lagrange-Gleichung (2.5) impliziert daher, dass die Funktionalableitung des Wirkungsfunktionals an der Stelle der physikalischen Bahn Null ist: δS [xφ ] = 0 . δx(t) Hiermit ist die genaue Bedeutung der Formel δS = 0 in (2.2) geklärt. Der Deutlichkeit halber sollte betont werden, dass wir nur gezeigt haben, dass das Wirkungsfunktional für die physikalische Bahn extremal, und nicht, dass es „optimal“ (minimal oder maximal) ist. Um zu entscheiden, ob xφ einem Minimum, Maximum oder Sattelpunkt von S[x] entspricht, müsste man offensichtlich die zweite Ableitung von S[x] an der Stelle x = xφ bestimmen. Da die physikalische Bahn jedoch durch die Nullstellen der ersten Ableitung des Wirkungsfunktionals bestimmt wird, unerachtet, ob ein Minimum, Maximum oder Sattelpunkt vorliegt, ist im Voraus schon klar, dass die Frage nach der Natur des Extremums mathematisch zwar interessant, physikalisch jedoch vollkommen irrelevant ist. Anhand konkreter Beispiele zeigt man außerdem leicht, dass die physikalische Bahn (abhängig von den Anfangsbedingungen) sowohl ein Minimum als auch ein Maximum von S[x] darstellen kann, so dass das „Vorzeichen“ der zweiten Ableitung an der Stelle x = xφ offenbar unerheblich ist. Die Verallgemeinerung des Hamilton’schen Prinzips auf beliebige N -TeilchenSysteme unter der Einwirkung innerer und äußerer Kräfte ist sehr einfach, vorausgesetzt zumindest, dass die Dynamik dieser Systeme mit Hilfe einer LagrangeFunktion beschrieben werden kann. Die physikalische Bahn kann nun als Xφ (t) ≡ (xφ1 (t), . . . , xφN (t)) dargestellt werden, und das Wirkungsfunktional ist durch (X ,t ) S(X12,t12) [X] Zt2 = dt L(X(t), Ẋ(t), t) t1 37 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS mit X(t) = (x1 (t), . . . , xN (t)), usw. gegeben. Das Hamilton’sche Prinzip lautet 1 (X ,t ) lim (δS)(X12 ,t12 ) [Xφ + εΞ] = 0 , ε Ξ(t) ≡ {ξi (t)} ε→0 mit ξi (t1 ) = ξ i (t2 ) = 0 für alle i = 1, 2, . . . , N , und aus dem Hamilton’schen Prinzip folgt nun die Lagrange-Gleichung d ∂L ∂L (Xφ , Ẋφ , t) − (Xφ , Ẋφ , t) = 0 ∂xi dt ∂ ẋi (i = 1, 2, . . . , N ) , bzw. ∂L d ∂L (Xφ , Ẋφ , t) = 0 (Xφ , Ẋφ , t) − ∂X dt ∂ Ẋ , die umgekehrt wiederum das Hamilton’sche Prinzip impliziert und auch als Bedingung für die Funktionalableitung der Wirkung, δS [Xφ ] = 0 δX(t) , geschrieben werden kann. Zusammenfassend haben wir also gezeigt, dass die in der Lagrange-Gleichung enthaltene Dynamik generell aus einem Variationsprinzip abgeleitet werden kann. 2.3.1 Einfache Beispiele aus der Variationsrechnung Wir übersetzen einige altbekannte Variationsprobleme in die Sprache des Lagrange-Formalismus. Da diese Probleme allerdings statischer Natur sind, wird die Rolle der Zeitvariablen hierbei durch eine relevante Länge übernommen, die wir – um die Analogie zu verdeutlichen – mit dem Symbol t bezeichnen werden. Kürzeste Verbindung zwischen zwei Punkten Nehmen wir an, die Punkte (x1 , y1 , z1 ) und (x2 , y2 , z2 ) im dreidimensionalen Raum sind durch eine Kurve K miteinander verbunden, die durch die Variable x parametrisiert werden kann: K= x, y(x), z(x) | x1 ≤ x ≤ x2 © . Gesucht ist die kürzeste Verbindung È zwischen beiden Punkten. Da die infinitesimale Bogenlänge durch ds = (dx)2 + (dy)2 + (dz)2 gegeben ist, folgt die Gesamtlänge der Kurve als Zx2 S= Zx2 ds = x1 dx È 1 + [y ′ (x)]2 + [z ′ (x)]2 . x1 Wechselt man an dieser Stelle die Notation: (x, y, z) → (t, x1 , x2 ) ≡ (t, x) ; (xi , yi , zi ) → (ti , xi ) (i = 1, 2) , 38 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS so entsteht ein Ausdruck für die Länge der Kurve: Zt2 dt L(ẋ(t)) S= L(ẋ) ≡ , t1 È 1 + ẋ21 + ẋ22 = p 1 + ẋ2 , der die Form eines Wirkungsfunktionals für die Dynamik eines Teilchens im zweidimensionalen x-Raum hat. Die Lagrange-Gleichung für ein Extremum dieser Wirkung (d. h. in der ursprünglichen Formulierung: für die kürzeste Verbindung) lautet d d ∂L ẋ ∂L √ = − , dt ∂ ẋ ∂x dt 1 + ẋ2 √ so dass ẋ/ 1 + ẋ2 und somit auch die „Geschwindigkeit“ ẋ selbst eine Erhaltungsgröße darstellt. Die Lösung des Minimierungsproblems ist daher: 0= (t, x(t)) = (t1 , x1 ) + (1, ẋ1 )(t − t1 ) , ẋ1 ≡ x2 − x1 t2 − t1 , und diese Lösung stellt in der ursprünglichen Formulierung genau eine Gerade dar. Die Brachystochrone Gesucht ist nun nicht der kürzeste, sondern der schnellste Weg K im Schwerkraftfeld g = −gêz von (x1 , y1 , z1 ) nach (x2 , y2 , z2 ). Wir können o. B. d. A. annehmen, dass (x1 , y1 , z1 ) = 0 gilt, und wir wählen y2 = 0, so dass die physikalische Situation spiegelsymmetrisch bezüglich der (x, z)-Ebene ist und der Weg K somit gänzlich in dieser Ebene verlaufen wird. Aus dem Energieerhaltungssatz 2 1 2 mv + mgz = E folgt,Èdass die Geschwindigkeit des Teilchens energie- und höhenabhängig ist: v = 2g(zE − z) mit zE ≡ E/mg. Die für den Weg K benötigte Zeitdauer ist daher Zt2 T = Zs2 dt = t1 0 ds = v Ê Zx2 dx 0 1 + (dz/dx)2 2g(zE − z) . Wechseln wir nun wie folgt die Notation: (T, x, x2 , z − zE ) → (S, t, T, x) , so ist die zu minimierende Größe Z S[x] = Ê T dt L(x, ẋ) , 0 L(x, ẋ) = 1 + ẋ2 −2gx formal äquivalent zum Wirkungsfunktional für ein Teilchen in einem eindimensionalen Raum. Start- und Endpunkt der Bahn x(t) sind hierbei durch 39 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS x(0) = −zE ≡ x1 ≤ 0 und x(T ) = z2 − zE ≡ x2 ≤ 0 gegeben. Die LagrangeGleichung für die Bahn des Teilchens, d dt ∂L ∂ ẋ − ∂L =0 , ∂x kann nach einigen Umformungen auf d 1 x(1 + ẋ2 ) = 0 bzw. x(1 + ẋ2 ) = − l dt 2 vereinfacht werden, wobei − 21 l eine Integrationskonstante ist. Die Lösung dieser Differentialgleichung kann mit Hilfe einer Winkelvariablen ξ parametrisiert werden, t − t0 = 1 l[ξ − sin(ξ)] 4 , 1 x = − l[1 − cos(ξ)] 4 , und hat somit die Form einer Zykloide (siehe auch § 4.4 des Theorie-1-Skripts). Die Kettenlinie Das Problem der „Kettenlinie“, also der von einer Kette (oder einem Seil) im Schwerkraftfeld nahe der Erde beschriebenen Kurve, weicht insofern von den beiden vorigen Problemen ab, als das „Wirkungsfunktional“ nun unter einer Zwangsbedingung variiert werden soll. Im Falle der Kette ist das „Wirkungsfunktional“ durch die potentielle Energie der Kette im Schwerkraftfeld und die Zwangsbedingung durch die konstante und vorgegebene Länge L der Kette gegeben. Wir bezeichnen die (konstant angenommene) Massendichte der Kette als ρ, die Schwerkraftbeschleunigung als g und die kartesische Koordinate der Kette parallel zur Erdoberfläche als t, so dass die Kette sich in der t-z-Ebene befindet. Gesucht ist die Form z(t) der Kette mit minimaler potentieller Energie. Wir nehmen der Einfachheit halber an, dass Aufhängepunkte der Kette sich beide auf gleicher Höhe befinden und durch − 12 ℓ, R bzw. + 21 ℓ, R , natürlich mit ℓ ≤ L, gegeben sind. Da die potentielle Energie der Kette und die Zwangsbedingung vorgegebener Länge durch 1 Z2 ℓ È dt ρg z(t) 1 + [z ′ (t)]2 Epot = − 12 ℓ 1 Z2 ℓ , dt È 1 + [z ′ (t)]2 = L − 21 ℓ gegeben sind, kann das zu minimierende Wirkungsfunktional mit Hilfe eines Lagrange-Parameters λ als 2 1 Z2 ℓ S[z, λ] = È dt ρg z − 12 ℓ 6 1 + (z ′ )2 − ρgλ 4 − 12 ℓ 1 2ℓ Z dt L (z(t), z ′ (t)) + ρgλL , = − 12 ℓ 3 1 Z2 ℓ È dt 7 1 + (z ′ )2 − L5 È L = ρg[z(t) − λ] 1 + [z ′ (t)]2 40 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS geschrieben werden. Die Stationarität von S als Funktion von λ und Funktional von z impliziert nun: 1 1 ∂S =L− 0= ρg ∂λ Z2 ℓ dt È − 12 ℓ 1 ∂L d 1 δS = − 0= ρg δz(t) ρg ∂z dt È = 1 + (z ′ )2 − (2.6) 1 + [z ′ (t)]2 ∂L ∂z ′ d z′ (z − λ) È dt 1 + (z ′ )2 (2.7) . Multiplikation von Gleichung (2.7) mit 2(z − λ)z ′ / einmal: 2 È 1 + (z ′ )2 liefert zunächst 3 ′ ′ (z − λ)z d 4 (z − λ)z 5 È 0 = 2(z − λ)z ′ − 2 È 1 + (z ′ )2 dt 1 + (z ′ )2 8 2 32 9 < ′ (z − λ)z 5 = d = (z − λ)2 − 4 È dt : 1 + (z ′ )2 ; und daher nach einer ersten Integration: (z ′ )2 (z − λ)2 = = a2 ≥ 0 ′ 2 1 + (z ) 1 + (z ′ )2 (z − λ)2 1 − Die Differentialgleichung z ′ = ± t0 ±t a h z−λ a 2 i1/2 −1 hat im Allgemeinen die Lösun- mit beliebigem t0 ∈ R. Die Symmetrie z(± 21 ℓ) = R gen z(t) = λ + a cosh erlaubt jedoch nur t0 = 0 bzw. z(t) = λ + a cosh(t/a), wobei λ und a außerdem ℓ die Bedingung λ + a cosh 2a = R erfüllen müssen. Eine weitere Beziehung zwischen λ und a folgt aus Gleichung (2.6) als: r 1 Z2 ℓ L= dt ℓ/2a Z 1 + sinh 2 t a − 12 ℓ dτ cosh(τ ) = 2a sinh = 2a 0 ℓ 2a , so dass der Parameter y ≡ 2a ℓ (und somit a) durch die Bedingung L/ℓ = y sinh(y −1 ) festgelegt ist. Hiermit folgt der Lagrange-Parameter λ als λ = R − a cosh ℓ 2a = R − 21 ℓy cosh(y −1 ) . Die gesuchte Kettenlinie ist daher schließlich durch z(t) = R + 12 ℓy cosh 2t ℓy − cosh(y −1 ) gegeben und hat offensichtlich die Form eines Kosinus-hyperbolicus. 41 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS 2.4 Invarianzen der Lagrange-Gleichung Wir diskutieren die Invarianz der Lagrange’schen Bewegungsgleichung unter Galilei-Transformationen, unter Eichtransformationen (und allgemeiner: unter Addition einer vollständigen Zeitableitung zur Lagrange-Funktion) und unter „Zeitumkehr“. Wir betrachten zunächst die Addition einer vollständigen Zeitableitung zur Lagrange-Funktion. 2.4.1 Addition einer vollständigen Zeitableitung Die Invarianz der Lagrange-Gleichung unter Hinzufügen einer vollständigen Zeitableitung einer beliebigen Funktion der Koordinaten und der Zeit: L → L′ = L + X ∂λ d ẋj · (∇j λ)({xi }, t) + λ({xi }, t) = L + ({xi }, t) dt ∂t j folgt daraus, dass der Zusatzterm liefert: d dt ∂ dλ ∂ ẋi dt dλ dt " keinen Beitrag zur Lagrange-Gleichung ∂ ∂ dλ d − = ∂xi dt dt ∂ ẋi = X j ∂λ ∂λ ẋj · + ∂xj ∂t !# − ∂ dλ ∂xi dt ∂ dλ d ∂λ − =0 . dt ∂xi ∂xi dt Noch klarer geht die Invarianz der Bewegungsgleichung unter Addition einer vollständigen Zeitableitung daraus hervor, dass der Zusatzterm dλ dt das Wirkungsfunktional nur um eine Konstante ändert: (X ,t ) S ′ (X21 ,t21 ) Zt2 dt L′ (X(t), Ẋ(t), t) X = t1 Zt2 dt L(X(t), Ẋ(t), t) + = t1 (X ,t ) d λ(X(t), t) dt = S(X12,t12) X + λ(X2 , t2 ) − λ(X1 , t1 ) . Da diese zusätzliche Konstante in der Wirkung für alle möglichen Bahnen X(t) = {xi (t)} mit festen Anfangs- und Endpunkten X(t1 ) = X1 und X(t2 ) = X2 gleich ist, spielt sie bei der Bestimmung der extremalen Lösung keine Rolle. 2.4.2 Galilei-Invarianz Wir betrachten zunächst abgeschlossene mechanische Systeme, für die die Bewegungsgleichung automatisch forminvariant unter Galilei-Transformationen ist. Um das Transformationsverhalten der Lagrange-Funktion bestimmen zu können, benötigen wir Information über die potentielle und die kinetische Energie. Das Transformationsverhalten dieser beiden Größen ist bereits aus Abschnitt 3.2 des Theorie-1-Skripts bekannt: Die potentielle Energie ist invariant unter Galilei-Transformationen: V ′ = V (X′ ) = V (X) = V , 42 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS vorausgesetzt, dass die inneren Kräfte das dritte Newton’sche Gesetz erfüllen. Die kinetische Energie T wird wie folgt transformiert: T′ = X1 2 i = X1 2 i =T + mi (ẋ′i )2 = X1 i 2 mi (ẋi − vα )2 = T + d λ(X, t) dt , 2 mi σR(α)−1 (ẋi − vα ) λ≡ X 1 2 i X i 2 mi vα − mi ẋi · vα 1 2 mi vα t − mi xi · vα 2 . Insgesamt ändert die Lagrange-Funktion sich also um eine vollständige Zeitableitung: d λ(X, t) , dt und wir wissen bereits aus dem vorigen Abschnitt, dass dies die Bewegungsgleichung nicht beeinflusst. Das Argument für die Invarianz der Bewegungsgleichung eines Teil systems verläuft sehr ähnlich: Nun ist auch der Beitrag äußerer Kräfte mitzuberücksichtigen, und die Invarianz der Bewegungsgleichung erfordert, dass diese äußeren Kräfte (die „Außenwelt“) bei der Galilei-Transformation explizit mittransformiert werden. Wir unterscheiden wieder nicht-elektromagnetische äußere Kräfte und Lorentz-Kräfte . Damit die Bewegungsgleichung mi ẍi = Fi Galilei-invariant ist, muss in beiden Fällen das vierte Newton’sche Gesetz (siehe Abschnitt [??] des Theorie-1-Skripts) erfüllt sein: L′ = T ′ − V ′ = L + F′i = σR(α)−1 Fi . Betrachten wir nun zuerst die recht große Klasse von wirbelfreien (nicht-elektromagnetischen) äußeren Kräften. In diesem Fall muss das Potential invariant sein, damit die Kräfte als echte Vektoren transformiert werden: ′ wf wf Vex (X′ , t′ ) = Vex (X, t) wf = Vex {σR(α)x′i + vα (t′ + τ ) + ξ α } , t′ + τ , denn dies impliziert: ′ Fiγ =− wf ∂ ∂ ∂xiβ ∂Vex wf ′ wf Vex =− ′ = − ′ Vex ′ ∂xiγ ∂xiγ ∂xiγ ∂xiβ = σR(α)βγ Fiβ = σ R̃(α)γβ Fiβ oder in Vektorschreibweise: F′i = σR(α)−1 Fi . Da die potentielle Energie also invariant ist unter Galilei-Transformationen und die Lagrange-Funktion sich auch in Anwesenheit wirbelfreier äußerer Kräfte nur um eine vollständige Zeitableitung ändert, ist die Bewegungsgleichung für die Gesamtdynamik des N Teilchen-Systems nach wie vor invariant. Berücksichtigen wir schließlich auch mögliche elektromagnetische äußere Kräfte (Lorentz-Kräfte), die zusätzlich auf die Teilchen wirken können, so müssen wir das Transformationsverhalten des Potentials VLor = X i qi [Φ(xi , t) − ẋi · A(xi , t)] 43 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS unter Galilei-Transformationen und somit auch dasjenige der elektromagnetischen Potentiale (Φ, A) kennen. Das Transformationsverhalten der E, B-Felder unter Galilei-Transformationen ist bereits aus der Theorie-1-Vorlesung bekannt (s. Abschnitt 5.5): E′ (x′ , t′ ) = σR(α)−1 [E(x, t) + vα × B(x, t)] B′ (x′ , t′ ) = R(α)−1 B(x, t) . Diese Beziehung zwischen den Feldern ist erfüllt, falls die elektromagnetischen Potentiale (Φ, A) und (Φ′ , A′ ) in den beiden Inertialsystemen wie folgt miteinander verknüpft sind: A′ (x′ , t′ ) = σR(α)−1 A(x, t) Φ′ (x′ , t′ ) = Φ(x, t) − vα · A(x, t) , vα ≡ σR(α)v . Da nun für alle Teilchen Φ(xi , t) − ẋi · A(xi , t) invariant unter Galilei-Transformationen ist: Φ′ − ẋ′ · A′ = Φ − vα · A − σR(α)−1 (ẋ − vα ) · σR(α)−1 A = Φ − vα · A − (ẋ − vα ) · A = Φ − ẋ · A , ′ gilt insgesamt VLor = VLor , so dass auch der Beitrag der Lorentz-Kräfte zum Gesamtpotential invariant ist. Auch unter Berücksichtigung von Lorentz-Kräften ändert sich die Lagrange-Funktion also lediglich um eine vollständige Zeitableitung, so dass die Bewegungsgleichung für die Gesamtdynamik nach wie vor invariant ist. 2.4.3 Eichinvarianz Bei einer Eichtransformation werden die elektromagnetischen Potentiale (A, Φ) wie folgt transformiert: 1 à ≡ A − ∇Λ c , Φ̃ ≡ Φ + 1 ∂Λ c ∂t , wobei die orts- und zeitabhängige Funktion Λ(x, t) beliebig ist. Die Felder E und B und somit auch die Maxwell-Gleichungen und die Lorentz’sche Bewegungsgleichung sind invariant unter einer solchen Eichtransformation. Da die Größe Φ − ẋ · A sich nur um eine vollständige Zeitableitung ändert: 1 ∂Λ + ẋ · ∇Λ c ∂t 1 d = Φ − ẋ · A + Λ(x, t) , c dt Φ′ − ẋ · A′ = Φ − ẋ · A + gilt dasselbe für den Beitrag der Lorentz-Kräfte zur potentiellen Energie: ′ VLor = X i qi [Φ′ (xi , t) − ẋi · A′ (xi , t)] = VLor + und für die Lagrange-Funktion: L′ = L − d X qi Λ(xi , t) dt i c . d X qi Λ(xi , t) dt i c 44 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Hiermit kann die Invarianz der Bewegungsgleichung unter Eichtransformationen wiederum aufgrund der Addition einer vollständigen Zeitableitung zur LagrangeFunktion verstanden werden. 2.4.4 Invarianz unter „Zeitumkehr“ Es ist wohl klar, dass es physikalisch vollkommen unmöglich ist, die Zeit rückwärts verlaufen zu lassen, so dass der Begriff „Zeitumkehr“ streng genommen keinen Sinn hat. Unter „Zeitumkehr“ versteht man in der Klassischen Mechanik dann auch eher das instantane Umkehren aller Geschwindigkeiten, wobei die Zeit in üblicher Weise weiter vorwärts verläuft. Dementsprechend bedeutet die „Invarianz unter Zeitumkehr“ der Dynamik eines Teilchens oder eines Mehrteilchensystems, das dieses Teilchen bzw. dieses System seine Bahn bei Umkehrung aller Geschwindigkeiten noch einmal durchläuft, nun aber in entgegengesetzter Richtung. x x2 x1 t1 t2 t Abbildung 2.1: Invarianz unter Zeitumkehr Startet das Teilchen z. B. zur Zeit t1 am Ort x1 mit der Geschwindigkeit ẋ1 und erreicht es den Ort x2 zur Zeit t2 , so muss die Umkehrung seiner Geschwindigkeit zur Zeit t2 dazu führen, dass es zur Zeit 2t2 − t1 den Ort x1 wieder erreicht, nun aber mit der Geschwindigkeit −ẋ1 . Falls x(t) die für t1 ≤ t ≤ t2 durchlaufene Bahn darstellt, so bedeutet Invarianz unter Zeitumkehr, dass die für t2 ≤ t′ ≤ 2t2 − t1 (nach einer Umkehrung der Geschwindigkeit zur Zeit t2 ) durchlaufene Bahn durch x(2t2 − t′ ) ≡ x′ (t′ ) gegeben ist. Mutatis mutandis gilt für ein N -Teilchensystem, das invariant unter Zeitumkehr ist, dass die Bahn für t2 ≤ t′ ≤ 2t2 − t1 durch {xi (2t2 − t′ )} ≡ {x′i (t′ )} gegeben ist. Der Einfachheit halber führen wir wieder die Schreibweise X(t) ≡ (x1 (t), x2 (t), . . . , xN (t)) , Ẋ(t) ≡ (ẋ1 (t), ẋ2 (t), . . . , ẋN (t)) und analog für X′ (t′ ) und Ẋ′ (t′ ) ein. Allgemein lautet die Newton’sche Bewegungsgleichung: mi d2 xi (t) = Fi (X, Ẋ, t) , dt2 mi d2 x′i ′ (t ) = Fi (X′ , Ẋ′ , t′ ) (dt′ )2 . 45 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Invarianz unter Zeitumkehr bedeutet Fi (X′ , Ẋ′ , t′ ) = mi d2 xi d2 x′i ′ (t ) = m (2t2 − t′ ) i (dt′ )2 dt2 = Fi (X(2t2 − t′ ), Ẋ(2t2 − t′ ), 2t2 − t′ ) = Fi (X′ , −Ẋ′ , 2t2 − t′ ) , so dass das Kraftgesetz für alle (X, Ẋ, t) die Bedingung (2.8) Fi (X, Ẋ, t) = Fi (X, −Ẋ, 2t2 − t) erfüllen muss. Für das Gesamtpotential des N -Teilchen-Systems impliziert Gleichung (2.8): V (X, Ẋ, t) = V (X, −Ẋ, 2t2 − t) . Dies bedeutet, dass die Lagrange-Funktion die Bedingung L(X, Ẋ, t) = L(X, −Ẋ, 2t2 − t) erfüllen soll, und daher auch, dass die Wirkung invariant unter „Zeitumkehr“ ist: 2tZ2 −t1 ′ ′ ′ ′ ′ ′ dt L X (t ), Ẋ (t ), t S = ′ 2tZ2 −t1 = t2 Zt2 = t1 t2 dt L X(t), −Ẋ(t), 2t2 − t = dt′ L X(2t2 − t′ ), −Ẋ(2t2 − t′ ), t′ Zt2 dt L X(t), Ẋ(t), t = S . t1 Hiermit ist auch das Transformationsverhalten des Wirkungsfunktionals unter „Zeitumkehr“ geklärt. Für innere Kräfte in einem N -Teilchen-System, die das dritte Newton’sche Gesetz erfüllen und somit zeit- und geschwindigkeitsunabhängig sind, ist die Bedingung (2.8) automatisch erfüllt. Damit (2.8) für wirbelfreie äußere Kräfte nicht-elektromagnetischer Natur gilt, die ja ebenfalls geschwindigkeitsunabhängig sind, muss der entsprechende Beitrag zum Potential die Eigenschaft wf wf Vex (X, t) = Vex (X, 2t2 − t) (2.9) besitzen. Physikalisch bedeutet (2.9), dass auch alle Geschwindigkeiten der Teilchen in der „Außenwelt“ zur Zeit t2 umgekehrt werden müssen, damit die Gesamtdynamik invariant unter einer „Zeitumkehr“ zur Zeit t2 ist. Im Falle der Lorentz-Kraft impliziert (2.8) für die E- und B-Felder: E(x, 2t2 − t) = E(x, t) , (2.10) B(x, 2t2 − t) = −B(x, t) bzw. für die elektromagnetischen Potentiale: Φ(x, 2t2 − t) = Φ(x, t) , A(x, 2t2 − t) = −A(x, t) . (2.11) Man sieht, dass Zeitumkehrinvarianz nur dann gegeben ist, wenn das Magnetfeld zur Zeit t2 das Vorzeichen wechselt. Wiederum bedeutet dies physikalisch, dass 46 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS auch die Geschwindigkeiten aller Teilchen in der Außenwelt (und somit auch alle Ströme), die ja das Magnetfeld erzeugen, zur Zeit t2 umgekehrt werden müssen. Bisher haben wir lediglich die Forderung auferlegt, dass das System invariant unter Zeitumkehr bezüglich eines festen Zeitpunkts t2 sein soll. Wird nun die strengere Forderung auferlegt, dass die Zeitumkehrinvarianz zu jedem Zeitpunkt wf t2 vorliegen soll, so zeigt (2.9), dass das Potential Vex zeitunabhängig sein muss, so dass die entsprechende Kraft nicht nur wirbelfrei sondern auch konservativ ist. Für den elektromagnetischen Fall zeigen (2.10) und (2.11), dass nur statische elektrische Felder, E = E(x) bzw. Φ = Φ(x) mit A = 0 und B = 0, mit der Zeitumkehrinvarianz zu jedem Zeitpunkt verträglich sind. 2.5 Zwangsbedingungen Bei den bisher diskutierten mechanischen N -Teilchen-Systemen waren die 3N kartesischen Koordinaten X ≡ (x1 , x2 , . . . , xN ) grundsätzlich unabhängig voneinander, so dass der ganze 3N -dimensionale X-Raum dem System zur Verfügung stand oder zumindest der verfügbare Raumbereich 3N -dimensional war. Unabhängig variierbare Ortskoordinaten werden allgemein als Freiheitsgrade eines mechanischen Systems bezeichnet; die bisher behandelten Systeme haben somit 3N Freiheitsgrade. Die Anzahl der Freiheitsgrade eines N -Teilchen-Systems kann durchaus (viel) kleiner als 3N sein. Dies ist immer dann der Fall, wenn Beziehungen der Form fm (X, t) = fm (x1 , x2 , . . . , xN , t) = 0 (m = 1, 2, . . . , Z) (2.12) zwischen den kartesischen Koordinaten des Systems vorliegen. Solche Einschränkungen der Beweglichkeit eines Systems sind uns schon bei der Behandlung des sphärischen Pendels (s. § 4.3 des Theorie-1-Skripts) begegnet. Sie werden allgemein als Zwangsbedingungen, oder genauer: als holonome Zwangsbedingungen bezeichnet. Ist die Zwangsbedingung explizit zeitabhängig oder gerade zeitunabhängig, so kann sie zusätzlich als „rheonom“ bzw. „skleronom“ bezeichnet werden. Wir nehmen im Folgenden an, dass jede der Z holonomen Zwangsbedingungen (2.12) die Anzahl der unabhängig variierbaren Ortskoordinaten des Systems um Eins reduziert, so dass die Gesamtzahl f der Freiheitsgrade genau gleich 3N − Z ist. Natürlich hätte man alle Z Zwangsbedingungen in Gleichung (2.12) mit Hilfe einer einzelnen Bedingung der Form f (X, t) ≡ Z X 2 [fm (X, t)] = 0 m=1 zusammenfassen können. Wir werden eine solche Kompaktschreibweise im Folgenden jedoch nicht verwenden, um die eindeutige Relation f = 3N −Z zwischen der Anzahl der Freiheitsgrade und der Zahl der holonomen Zwangsbedingungen nicht zu verlieren. Hierzu reicht es, zusätzlich anzunehmen, dass die Funktionen fm , die die Zwangsbedingungen charakterisieren, für alle X mit fm (X, t) = 0 stetig differenzierbar und die Gradienten ∂fm /∂X (m = 1, . . . , Z) linear unabhängig sind. Da die Anzahl der Freiheitsgrade eines N -Teilchen-Systems, das den Zwangsbedingungen (2.12) unterliegt, also durch f = 3N − Z gegeben ist, kann jede 47 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS mögliche Konfiguration X = (x1 , . . . , xN ) des Systems mit Hilfe von 3N − Z unabhängigen neuen Koordinaten (q1 , q2 , . . . , qf ) ≡ q beschrieben werden: xi = xi (q1 , q2 , . . . , qf , t) = xi (q, t) (i = 1, 2, . . . , N ) . (2.13) Die unabhängig variierbaren Koordinaten {qk } werden als verallgemeinerte Koordinaten bezeichnet; die Menge aller dem System zur Verfügung stehenden q-Werte heisst der Konfigurationsraum des Systems und wird im Folgenden als Q bezeichnet. Die Menge aller dem System zur Verfügung stehenden X-Werte {X(q, t) | q ∈ Q} bildet eine (im Allgemeinen zeitabhängige) f -dimensionale Mannigfaltigkeit, die wir als die Bewegungsmannigfaltigkeit des Systems bezeichnen werden. Wir werden den Spezialfall einer eindimensionalen Mannigfaltigkeit (f = 1) als Kurve bezeichnen, den einer (3N − 1)-dimensionalen Mannigfaltigkeit (Z = 1) als Fläche. Betrachten wir ein paar Beispiele: Das sphärische Pendel bewegt sich bekanntlich über eine Kugelfläche. In diesem Fall ist die „Bewegungsmannigfaltigkeit“ also zweidimensional. Falls der Aufhängepunkt des Pendelstabs, dessen Länge wir als l bezeichnen, als Ursprung des Koordinatensystems gewählt wird, lautet die (skleronome) holonome Zwangsbedingung für das sphärische Pendel: f (x, t) ≡ x2 − l2 = 0 . Wählen wir als unsere verallgemeinerten Koordinaten die üblichen Winkelvariablen (ϑ, ϕ), so ist der Konfigurationsraum durch Q = [0, π] × [0, 2π) gegeben. Um die Stetigkeit der Variablen ϕ(t) über mehrere Umläufe hinweg zu gewährleisten, ist es zweckmäßig, den Konfigurationsraum auf [0, π] × R auszudehnen, wobei identifiziert wird: x(ϑ, ϕ) = x(ϑ, ϕ + 2π). Man erhält das mathematische Pendel entweder als Spezialfall des sphärischen Pendels (für spezielle Anfangsbedingungen) oder durch Auferlegen einer zusätzlichen (skleronomen, holonomen) Zwangsbedingung: f1 (x, t) ≡ x2 − l2 = 0 , f2 (x, t) ≡ x2 = 0 . Die Bewegungsmannigfaltigkeit ist nun eine Kurve (und zwar ein Kreisrand). Falls wir als verallgemeinerte Koordinate den üblichen Winkel ϕ wählen, ist der Konfigurationsraum durch Q = [0, 2π) oder [bei periodischer Fortsetzung mit x(ϕ) = x(ϕ + 2π)] durch R gegeben. Wird am Aufhängepunkt des mathematischen Pendels gerüttelt, so dass er sich nicht im Ursprung, sondern am zeitlich veränderlichen Ort a(t) = (a1 (t), 0, a3 (t)) befindet, so liegen zwei holonome Zwangsbedingungen vor: f1 (x, t) ≡ |x − a(t)|2 − l2 = 0 , f2 (x, t) ≡ x2 = 0 , (2.14) wobei die erste rheonom und die zweite nach wie vor skleronom ist. Die Bewegungsmannigfaltigkeit ist wiederum eine Kurve, die nun allerdings explizit zeitabhängig ist. Als weiteres Beispiel einer Zwangsbedingung betrachten wir ein Hantelmolekül , d. h. zwei Atome (mit den Massen m1 bzw. m2 ), die durch einen starren Stab (der Länge l) miteinander verbunden sind. Ein solches Hantelmolekül ist ein einfaches klassisches Modell für reale zweiatomige Moleküle wie O2 , N2 oder CO. Eine makroskopische Anzahl solcher Hantelmoleküle könnte daher dazu 48 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS verwendet werden, einige der wichtigsten atmosphärischen Gase zu beschreiben. Die (skleronome, holonome) Zwangsbedingung für die Koordinaten x1 und x2 der zwei Atome eines Hantelmoleküls lautet |x1 − x2 |2 − l2 = 0 , und für N Atome (mit N gerade), die insgesamt erhält man: fm (X, t) ≡ |x2m − x2m−1 |2 − l2 = 0 1 2N Hantelmoleküle formen, (m = 1, 2, . . . , 21 N ) . Die Anzahl der Freiheitsgrade ist in diesem Fall durch f = 3N − Z = 3N − 21 N = 25 N gegeben. Ein einfaches Modell für ein lineares Polymer entsteht, wenn man die Atome mit den Indizes m und m + 1 für 1 ≤ m ≤ N − 1 durch N − 1 Stäbe mit den Längen lm verbindet. Die Zwangsbedingung lautet in diesem Fall: 2 fm (X, t) ≡ |xm+1 − xm |2 − lm =0 (m = 1, . . . , N − 1) , und die Anzahl der Freiheitsgrade ist f = 3N − (N − 1) = 2N + 1. Selbstverständlich kann man auch Modelle für verzweigte Polymere konstruieren, wobei jedes Atom nun mit mehr als zwei Partnern verbunden sein darf. Außerdem sei der starre Körper erwähnt, der insgesamt nur f = 6 Freiheitsgrade hat. Dies folgt sofort daraus, dass der Massenschwerpunkt des Körpers beweglich ist und der Körper sich um eine Achse drehen kann, d. h. dass der Gesamtimpuls P und der Gesamtdrehimpuls L des starren Körpers a priori beliebige Werte annehmen können. Dementsprechend wird der starre Körper i. A. durch Z = 3N − f = 3N − 6 Zwangsbedingungen charakterisiert.2 Als letztes Beispiel einer (skleronomen) holonomen Zwangsbedingung diskutieren wir die Bewegung einer Kugel3 mit dem Radius R über eine ideale glatte Ebene. Wir wählen das Koordinatensystem so, dass die Ebene durch {x3 = 0} gegeben ist. Da zwischen der Kugel und der idealen glatten Ebene keine Reibung stattfindet, bewirkt die Ebene lediglich, dass sich der Mittelpunkt xM der Kugel in der (x3 = R)-Ebene befindet. Die Zwangsbedingung lautet dementsprechend: f (xM , t) ≡ ê3 · xM − R = 0 , (2.15) und von den 6 Freiheitsgraden eines freien starren Körpers bleiben für die Kugel auf der idealen glatten Ebene nur noch 5 übrig. Man könnte diese 5 Freiheitsgrade z. B. durch die zwei freien Komponenten xM1 und xM2 des Mittelpunkts und durch drei Winkelvariablen (ϑ, ϕ, ψ) charakterisieren, wobei die Winkelvariablen z. B. die Richtung der Achse durch xM und einen fest gewählten Punkt 2 Diese Zählung der Freiheitsgrade und Zwangsbedingungen trifft nur für N ≥ 3 zu: Für N = 2 ist die Drehimpulskomponente in Richtung des Stabs gleich Null (f = 5, Z = 1), für N = 1 gilt L = 0 (und somit f = 3, Z = 0). 3 In konkreten Untersuchungen solcher Kugeln (siehe z. B. Abschnitt [??]) werden wir (der Einfachheit halber) eine sphärisch symmetrische Massenverteilung voraussetzen, so dass der Kugelmittelpunkt zugleich auch Massenschwerpunkt ist. Deshalb die Notation xM . 49 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS xP der Kugeloberfläche und die Orientierung der Kugel relativ zu dieser Achse festlegen. Jede Zwangsbedingung, die nicht holonom ist, heisst nicht-holonom. Eine mögliche Form einer nicht-holonomen Zwangsbedingung ist eine Einschränkung der Beweglichkeit, die nur als Ungleichung darstellbar ist: f (X, t) = f (x1 , x2 , . . . , xN , t) ≥ 0 . Als einfaches Beispiel mit N = 1 sei die Kugel auf der idealen glatten Ebene erwähnt, die nun auch über die Ebene hüpfen kann, so dass der Mittelpunkt xM die Ungleichung f (xM , t) ≡ ê3 · xM − R ≥ 0 erfüllt. Eine andere mögliche Form einer nicht-holonomen Zwangsbedingung ist eine Beziehung zwischen Koordinaten, Geschwindigkeiten und eventuell der Zeit, die nicht in der Form (2.16) f (x1 , x2 , . . . , xN , t) = 0 darstellbar ist. Hierzu zunächst Folgendes: Obwohl jede holonome Zwangsbedingung der Form (2.16) für alle möglichen Bahnen X(t) die Beziehung df = N X ∂f i=1 ∂xi · dxi + X ∂f ∂f df · ẋi + = =0 dt ∂xi ∂t i=1 N ∂f dt = 0 ∂t , (2.17) zwischen Koordinaten, Geschwindigkeiten und der Zeit impliziert, können umgekehrt nicht alle Beziehungen N X ϕi (X, t)·dxi +ϕ0 (X, t)dt = 0 , i=1 N X ϕi (X, t)· ẋi +ϕ0 (X, t) = 0 (2.18) i=1 auch in der Form (2.16) geschrieben werden. Die genaue Bedingung dafür, dass Gleichung P (2.18) in der Form (2.16) darstellbar ist, ist, dass das Differential dΦ ≡ ϕi · dxi + ϕ0 dt exakt ist, d. h. dass für alle i, j = 1, 2, . . . , N : i ∂ϕiα ∂ϕjβ = ∂xjβ ∂xiα (α, β = 1, 2, 3) , ∂ϕi ∂ϕ0 = ∂t ∂xi gilt. Falls dΦ nicht exakt ist, aber γ(X, t) dΦ wohl, heißt γ(X, t) ein integrierender Faktor . Die Beziehung (2.17) für das exakte Differential df wird dementsprechend als integrabel bezeichnet, und Beziehungen der Form (2.18), die sogar nach Multiplikation mit beliebigen Funktionen γ(X, t) nicht integrabel sind, heißen nicht-integrabel . Nicht-integrable Beziehungen zwischen den Koordinaten, den Geschwindigkeiten und der Zeit sind ein weiteres wichtiges Beispiel für nicht-holonome Zwangsbedingungen. Als konkrete Anwendung betrachten wir wiederum die Kugel mit dem Radius R auf der (x3 = 0)-Ebene, wobei wir nun allerdings annehmen, dass diese Ebene ideal rau ist. Dies bedeutet, dass die Kugel nur rollen kann, jedoch nicht 50 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS gleiten. Die Geschwindigkeit des Kontaktpunkts der Kugel mit der (x3 = 0)Ebene ist daher zu jeder Zeit genau Null. Für die Geschwindigkeitskomponente in ê3 -Richtung kann diese Einschränkung nach wie vor mit Hilfe der holonomen Zwangsbedingung (2.15) beschrieben werden. Die Einschränkung der Geschwindigkeitskomponenten in ê1 - und ê2 -Richtung führt auf zwei Beziehungen zwischen den Winkelgeschwindigkeiten (ϑ̇, ϕ̇, ψ̇), die nicht-integrabel und daher nicht-holonom sind. Die explizite Form dieser zwei nicht-holonomen Zwangsbedingungen wird später (im Rahmen der Untersuchung der Dynamik starrer Körper) im Detail hergeleitet. Auf jeden Fall sollte klar sein, dass die Untersuchung der Dynamik einer realen Kugel (z. B. derjenigen eines Fußballs) auf einer realen Ebene (z. B. auf einem Rasen) im Allgemeinen sehr schwierig ist: Der Ball kann rollen, gleiten und hüpfen, und der Rasen ist weder ideal glatt noch ideal rau. Da außerdem noch Luftreibung zu berücksichtigen ist, durch inelastische Stöße Dissipation auftritt und der Ball nur näherungsweise als „rund“ angesehen werden kann, ist klar, dass eine detaillierte physikalische Untersuchung realer Ballspiele äußerst kompliziert wäre. Die gleiche Aussage trifft wohl für nahezu alle makroskopischen Vorgänge zu. 2.6 Verallgemeinerte Koordinaten Wir beschränken uns im Folgenden auf N -Teilchen-Systeme mit holonomen Zwangsbedingungen der Form (2.12), so dass der Konfigurationsraum des Systems, wie in (2.13) dargestellt, mit Hilfe von f = 3N − Z verallgemeinerten Koordinaten {qk } beschrieben werden kann: xi = xi (q1 , q2 , . . . , qf , t) ≡ xi (q, t) (i = 1, 2, . . . , N ) . (2.19) Neben q ≡ (q1 , . . . , qf ) und X = (x1 , . . . , xN ) führen wir auch Kürzel q̇ und Ẋ für die Geschwindigkeiten (q̇1 , . . . , q̇f ) bzw. (ẋ1 , . . . , ẋN ) ein. Damit sowohl die Bewegungsmannigfaltigkeit {X(q, t) | q ∈ Q} als auch der Konfigurationsraum f -dimensional sind, muss die Darstellung (2.19) unbedingt nicht-singulär sein, ∂X (q, t) an der Bewegungsmannigfaltigkeit im d. h. die f Tangentialvektoren ∂q k Punkte q zur Zeit t müssen linear unabhängig sein. Aus (2.19) folgt für die Differentiale dxi : dxi = f X ∂xi k=1 ∂qk (q, t)dqk + ∂xi (q, t)dt ∂t (2.20) und daher auch für die Geschwindigkeiten ẋi : ẋi (q, q̇, t) = f X ∂xi k=1 ∂qk (q, t)q̇k + ∂xi (q, t) ∂t (i = 1, 2, . . . , N ) . (2.21) Hiermit sind die Beziehungen zwischen den kartesischen Koordinaten und Geschwindigkeiten und den verallgemeinerten Koordinaten und Geschwindigkeiten vollständig bekannt. Diese Beziehungen können dazu verwendet werden, physikalische Größen, die bereits als Funktion der kartesischen Koordinaten und Geschwindigkeiten bekannt sind, nun als Funktion der verallgemeinerten Variablen (q, q̇) zu bestimmen. Um diese (im Allgemeinen unterschiedlichen) Funktionen 51 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS unterscheiden zu können, wird die kartesische Variante im Folgenden stets durch einen Index „K“ gekennzeichnet. Als Beispiel betrachten wir die kinetische Energie: TK (X, Ẋ, t) = N X 2 1 2 mi ẋi i=1 = N X 1 2 mi i=1 X ∂xi ∂xi q̇k + ∂qk ∂t k (2.22) !2 ≡ T (q, q̇, t) . Es ist klar, dass T (q, q̇, t) auch als Funktion der verallgemeinerten Geschwindigkeiten im Allgemeinen quadratisch (jedoch nicht unbedingt homogen quadratisch) ist: 1 2 T (q, q̇, t) = X akl q̇k q˙l + X kl (2.23) ak q̇k + a0 k mit akl (q, t) ≡ ak (q, t) ≡ a0 (q, t) ≡ N X mi ∂xi ∂xi (q, t) · (q, t) ∂qk ∂ql mi ∂xi ∂xi (q, t) · (q, t) ∂qk ∂t i=1 N X i=1 1 2 N X i=1 mi 2 ∂xi (q, t) ∂t . Nur wenn die holonomen Zwangsbedingungen zeitunabhängig (skleronom) sind i und die verallgemeinerten Koordinaten so gewählt werden, dass ∂x ∂t (q, t) = 0 gilt, hat T (q, q̇, t) also im Allgemeinen eine homogen quadratische Form als Funktion der {q̇k }. Aus der allgemeinen Form (2.23) der kinetischen Energie folgt, dass T (q, q̇, t) strikt konvex als Funktion der Geschwindigkeiten ist, d. h. dass die Matrix ∂2T ∂ q̇2 = (akl ) ≡ A positiv definit ist. Der Begriff positiv definit wurde bereits in § 3.5.1 des Theorie-1-Skripts definiert: Für jeden Vektor u = (u1 , u2 , . . . , uf ) 6= √ 0 gilt in diesem Fall uT Au > 0. Führen wir noch die Definitionen yi ≡ mi xi und Y ≡ (y1 , y2 , . . . , yN ) ein, so folgt für die Matrix (akl ) in (2.23) in der Tat: uT Au = X k,l uk akl ul = X uk k,l ∂Y 2 ∂Y ∂Y · ul = u > 0 . ∂qk ∂ql ∂q Im letzten Schritt geht entscheidend ein, dass die f Tangentialvektoren © ∂X ∂qk © ∂Y und somit auch die f Vektoren ∂q linear unabhängig sind, so dass für alle k ∂Y u 6= 0 auch ∂q u 6= 0 gilt. Es folgt, dass der „Massentensor “ (akl ) positiv definit und T (q, q̇, t) somit strikt konvex als Funktion von q̇ ist. Dieses Faktum wird von entscheidender Bedeutung bei der Formulierung der Hamilton-Theorie in Kapitel 2 sein. Es sei noch einmal darauf hingewiesen, dass die Argumente (q, q̇, t) der kinetischen Energie T als unabhängige Variablen anzusehen sind, da die Argumente 52 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS (X, Ẋ, t) von TK (soweit die Zwangsbedingung dies zulässt) unabhängig sind. Die Unabhängigkeit der Variablen (q, q̇, t) geht auch klar aus Gleichung (2.20) hervor, da die Differentiale {dqk } und dt hier unabhängig von (q, t) sind. Wegen der Unabhängigkeit der (q, q̇, t) folgt z. B. aus (2.21): ∂xi ∂ ẋi (q, t) = (q, t) ∂ q̇k ∂qk (2.24) . Wir werden diese Beziehung im Folgenden mehrmals verwenden. 2.6.1 Die Bewegungsgleichung in verallgemeinerten Koordinaten Die Newton’sche Bewegungsgleichung stellt nach dem zweiten Newton’schen Gesetz eine Beziehung zwischen der Trägheitskraft mi ẍi des i-ten Teilchens und der auf das i-te Teilchen einwirkenden Kraft Fi her, die eine Funktion der kartesischen Koordinaten, der Geschwindigkeiten und der Zeit ist: Z mi ẍi = Fi (X, Ẋ, t) = FK i + Fi (i = 1, 2, . . . , N ) . (2.25) Hierbei kann die explizite Form der Kraft Fi natürlich sehr kompliziert sein; im Folgenden wird jedoch nur wichtig sein, zwei Beiträge zur Gesamtkraft Fi zu unterscheiden: Kräfte FZi , die (z. B. von Stäben, Drähten, Oberflächen usw.) auf das i-te Teilchen ausgeübt werden, um die Einhaltung der Zwangsbedingung zu erzwingen, und daher als Zwangskräfte bezeichnet werden, und alle anderen Kräfte, die wir - da sie Funktionen der kartesischen Koordinaten und GeschwinK digkeiten (und eventuell der Zeit) sind - als FK i bezeichnen werden. In Fi sind also die üblichen inneren und äußeren Kräfte enthalten, die auch in Abwesenheit der Zwangsbedingung auf das i-te Teilchen einwirken würden. Die Grundidee hinter der Herleitung der Bewegungsgleichung in verallgemeinerten Koordinaten ist besonders einfach: Statt der 3N nicht-unabhängigen Gleichungen (2.25) für die kartesischen Koordinaten {xφi (t)} der physikalischen Bahn erwartet man f unabhängige Bewegungsgleichungen (d. h. gewöhnliche Differentialgleichungen zweiter Ordnung) für die verallgemeinerten Koordinaten {qφk (t)}. Andererseits wissen wir, dass die Bewegungsmannigfaltigkeit des N -Teilchen-Systems (und daher auch die Tangentialebenen an dieser Bewegungsmannigfaltigkeit) f -dimensional sind. Die Idee ist nun, den Gleichungssatz (2.25) auf f voneinander unabhängige Tangentialvektoren im Punkte Xφ (t) = X(qφ (t), t) der Bewegungsmannigfaltigkeit zu projizieren. Jede dieser Projektionen liefert eine Bewegungsgleichung, so dass man insgesamt genau f unabhängige Bewegungsgleichungen für die verallgemeinerten Koordinaten {qφk (t)} erhält. Konkret funktioniert dieses Verfahren wie folgt: Wir betrachten nun den Punkt Xφ (t) = X(qφ (t), t) der physikalischen Bahn, die durch (2.25) beschrieben wird, sowie beliebige Vektoren δq ≡ (δq1 , δq2 , . . . , δqf ) ∈ Rf . Der Vektor Ξ≡ f X ∂X k=1 ∂qk (qφ (t), t)δqk = ∂X (qφ (t), t) δq ∂q stellt also geometrisch einen Tangentialvektor an der Bewegungsmannigfaltigkeit im Punkte Xφ (t) zur Zeit t dar. Folglich bildet die Menge aller Vektoren X 53 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS der Form X = Xφ (t) + Ξ = Xφ (t) + ∂X ∂q (δq ∈ Rf ) δq φ die Tangentialebene an der Bewegungsmannigfaltigkeit im Punkte Xφ (t) zur Zeit t. Wir führen nun die Notation δxi für den Beitrag des i-ten Teilchens zum Tangentialvektor Ξ ein: Ξ = X − Xφ (t) ≡ δX ≡ (δx1 , δx2 , . . . , δxN ) und projizieren das rechte und auch das linke Glied von (2.25) auf die ΞRichtung. Projektion der Kräfte (F1 , F2 , . . . , FN ) auf die Ξ-Richtung liefert eine Größe mit der Dimension einer Energie: N X i=1 Fi (Xφ (t), Ẋφ (t), t) · δxi ≡ δW (2.26) . Die Größe δW stellt formal die Arbeit dar, die die in der physikalischen Bahn wirkenden Kräfte Fi (Xφ (t), Ẋφ (t), t) zum Zeitpunkt t entlang der Variationen {δxi } verrichten würden.4 Aufgrund der Newton’schen Bewegungsgleichung (2.25) ist die Hilfsgröße δW alternativ auch durch δW = N X i=1 (2.27) mi ẍφi (t) · δxi gegeben. Wir werden im Folgenden zuerst (2.27) und dann (2.26) mit Hilfe der verallgemeinerten Koordinaten umformulieren. Aus der Äquivalenz der beiden Ausdrücke und der Beliebigkeit des Tangentialvektors Ξ folgt dann die Bewegungsgleichung in verallgemeinerten Koordinaten. Der Ausdruck (2.27) lässt sich mit Hilfe der Identitäten (2.21) und (2.24) und der in (2.22) eingeführten Funktionen TK und T wie folgt umformulieren: δW = N X i=1 = X i,k = X " mi ẍφi · mi " k f X ∂xi k=1 ∂qk ∂ ẋi d ẋi · dt ∂ q̇k d ∂ dt ∂ q̇k X # (qφ (t), t)δqk − ẋi · ! 2 1 2 mi ẋi i d ∂xi dt ∂qk ∂ − ∂qk δqk φ X i !# 2 1 2 mi ẋi δqk . φ Im letzten Schritt wurde die Unabhängigkeit der Ableitungen nach den Variablen q und q̇ verwendet: X ∂ 2 xi d ∂xi ∂ 2 xi = q̇l + dt ∂qk ∂ql ∂qk ∂t∂qk l ∂ = ∂qk X ∂xi l ∂xi q̇l + ∂ql ∂t ! ∂ ẋi = ∂qk (2.28) . 4 Es ist klar, dass δW lediglich eine mathematische Hilfsgröße ist, die nicht experimentell gemessen werden kann, da die Variation δX = Ξ vollkommen unabhängig von der tatsächlichen Bewegungsrichtung Ẋφ (t) des Systems ist. 54 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Aus der Definition T (q, q̇, t) ≡ TK = δW = X d ∂T dt k ∂T − ∂qk ∂ q̇k P i 1 2 mi ẋ2i folgt nun: δqk (2.29) . φ Betrachten wir nun andererseits den Ausdruck (2.26), so folgt δW = N X i=1 " Fφi · f X ∂xi k=1 ∂qk # (qφ (t), t)δqk = f X k=1 Fφk δqk , (2.30) wobei die verallgemeinerten Kräfte Fk (q, q̇, t) ≡ N X i=1 Fi · ∂xi ∂qk Fφk ≡ Fk (qφ , q̇φ , t) , eingeführt wurden. Der Vergleich von (2.29) und (2.30) liefert nun sofort die Identität X d ∂T k dt ∂ q̇k − ∂T − Fk ∂qk δqk = 0 . φ Da diese Identität für beliebige Tangentialvektoren Ξ (und somit für beliebige Variationen δq) gelten soll, folgt d dt ∂T ∂ q̇k − ∂T − Fk ∂qk =0 (k = 1, 2, . . . , f ) . (2.31) φ Dies ist die allgemeine Form der Lagrange’schen Bewegungsgleichung in verallgemeinerten Koordinaten. Wir werden im Folgenden sehen, dass sie sich durch eine nähere Betrachtung der verallgemeinerten Kräfte Fk noch erheblich vereinfachen lässt. 2.6.2 Verallgemeinerte Kräfte Die in (2.31) verbleibenden verallgemeinerten Kräfte Fk stellen insofern ein Problem dar, als sie neben den explizit bekannten inneren und äußeren Kräften Z FK i auch die (zunächst unbekannten) Zwangskräfte Fi enthalten: Fk = N X i=1 X ∂xi ∂xi X Z ∂xi = + FK F · i · ∂qk ∂qk i=1 i ∂qk i=1 N Fi · N . (2.32) Ein Beispiel kann hier hilfreich sein: In Abschnitt 4.3 des Theorie-1-Skripts konnten wir die auf das sphärische Pendel einwirkende Zwangskraft explizit berechnen: FZ (x, ẋ) = −λ(x, ẋ)x̂ , λ= mẋ2 − mg(x̂ · ê3 ) . x Die Zwangskraft wirkt somit in Richtung des Stabes, steht also senkrecht auf der durch die Zwangsbedingung f (x, t) = x2 − l2 = 0 definierten Fläche und verrichtet daher keine Arbeit. Es ist nun plausibel (und lässt sich für konkrete 55 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Modelle auch beweisen), dass dieses Ergebnis verallgemeinert werden kann: Falls eine (skleronome oder rheonome) holonome Zwangsbedingung keine Reibungskräfte hervorruft, gilt generell, dass die Zwangskraft FZ1 , FZ2 , . . . , FZN senkrecht auf der Bewegungsmannigfaltigkeit steht und daher keinen Beitrag zu Fk liefert: FkZ ≡ N X i=1 FZi · ∂xi =0 ∂qk (2.33) (k = 1, 2, . . . , f ) . Im Falle einer zeitabhängigen (rheonomen) Zwangsbedingung bedeutet dies natürlich nicht, dass diese Zwangsbedingung bei einer realen Bewegung dXφ (t) = Ẋφ (t)dt überhaupt keine Arbeit verrichtet. In diesem Fall ist der Beitrag der Zwangskräfte zur Leistung (d. h. zur Arbeit pro Zeiteinheit) durch X X dxi dW Z = = FZi · FZi · dt dt i=1 i=1 N = f X k=1 f X ∂xi N FkZ q̇k + Ft = Ft k=1 , ∂xi q̇k + ∂qk ∂t Ft ≡ N X i=1 ! FZi · ∂xi ∂t gegeben. Obwohl die verallgemeinerten Kräfte FkZ (in Abwesenheit von Reibung) alle gleich Null sind, muss die mit der Zeitvariablen t verknüpfte verallgemeinerte Kraft Ft keineswegs Null sein. In der analytischen Mechanik (d. h. bei der Formulierung des Lagrange- und des Hamilton-Formalismus) beschränkt man sich üblicherweise auf Systeme, die die Bedingung FkZ = 0 exakt oder zumindest in genügend guter Näherung erfüllen. Da im Wesentlichen keine anderen Annahmen gemacht werden, kann Gleichung (2.33) als zentrales Postulat der Analytischen Mechanik angesehen werden. Es ist kein Postulat im Sinne eines fundamentalen, jedoch unbeweisbaren Naturgesetzes, sondern eher im Sinne einer Annahme, Voraussetzung oder Einschränkung: Wir wissen ja, dass Gleichung (2.33) in Anwesenheit von Reibung sicherlich nicht gilt. Da die Zwangskräfte aufgrund des zentralen Postulats (2.33) also nicht zur verallgemeinerten Kraft Fk beitragen, vereinfacht sich (2.32) zu Fk (q, q̇, t) = N X i=1 FK i · ∂xi ∂qk . (2.34) Wir haben hiermit ein großartiges Resultat erzielt: Da das rechte Glied von (2.34) nur noch von den (explizit bekannten) inneren und äußeren Kräften abhängig und auch Fk somit explizit als Funktion von (q, q̇, t) bekannt ist, hängt die Bewegungsgleichung (2.31), d dt ∂T ∂ q̇k − ∂T = Fk ∂qk (k = 1, 2, . . . , f ) , überhaupt nicht mehr von den Zwangskräften ab! Dies vereinfacht die Lösung der Bewegungsgleichung natürlich enorm und stellt einen der großen Vorteile des Lagrange-Formalismus dar.5 Ein weiterer Vorteil ist offensichtlich, dass der 5 Spätestens an dieser Stelle wird der Sinn der Projektion auf die Tangentialebene in Ab- 56 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Lagrange-Formalismus weitgehend unabhängig von der Wahl der verallgemeinerten Koordinaten {qk } ist: Hätten wir statt {qk } andere Koordinaten {q̄k } gewählt: xi = x̄i (q̄1 , q̄2 , . . . , q̄k , t) = x̄i (q̄, t) (i = 1, 2, . . . , N ) , so hätte man ebenfalls eine Gleichung der Form (2.31) erhalten, allerdings mit anderen Ausdrücken für die kinetische Energie und die verallgemeinerten Kräfte: (T, Fk ) → (T̄ , F̄k ). Die Struktur (nicht aber die explizite Form) der LagrangeGleichung (2.31) ist daher invariant unter allgemeinen Punkttransformationen der Koordinaten, bzw. q̄ = q̄(q, t) q̄k ≡ q̄k (q, t) . Hierbei muss man natürlich fordern, dass die Transformation nicht-singulär ist, d. h. dass det ∂∂qq̄kl 6= 0 gilt. Geschwindigkeitsunabhängige Kräfte Innere Kräfte, die das dritte Newton’sche Gesetz erfüllen, sowie wirbelfreie nichtelektromagnetische äußere Kräfte können bekanntlich aus einem Potential hergeleitet werden: K FK i = −(∇i V )(X, t) , wobei der Index „K“ wie üblich physikalische Größen in kartesischen Koordinaten bezeichnet. Die verallgemeinerte Kraft Fk folgt daher als: Fk = N X i=1 X ∂V K ∂xi ∂V ∂xi =− · =− (q, t) ∂qk ∂x ∂q ∂q i k k i=1 N FK i · (2.35) , wobei das Potential V (q, t) als Funktion der verallgemeinerten Koordinaten durch V (q, t) ≡ V K (X(q, t), t) definiert ist. Definieren wir nun die Lagrange-Funktion (wie üblich) als L(q, q̇, t) ≡ T (q, q̇, t) − V (q, t) (2.36) , so folgt aus (2.31) und (2.35): 0= d dt ∂T ∂ q̇k − ∂T ∂V d ∂(T − V ) ∂(T − V ) + = − ∂qk ∂qk dt ∂ q̇k ∂qk − ∂L ∂qk , d. h. d 0= dt ∂L ∂ q̇k (k = 1, 2, . . . , f ) . (2.37) schnitt [2.6.1] klar: Durch diese Projektion werden die Zwangskräfte, die senkrecht auf der Bewegungsmannigfaltigkeit stehen, herausprojiziert und somit aus der Lagrange-Gleichung in verallgemeinerten Koordinaten eliminiert. 57 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Es muss wohl kaum darauf hingewiesen werden, dass die letzten beiden Gleichungen nur für die physikalische Bahn qφ (t) gelten. Die Bewegungsgleichung (2.37) hat also genau dieselbe Struktur wie diejenige, die wir für den einfachen Fall ohne Zwangsbedingungen in kartesischen Koordinaten hergeleitet haben! Gleichung (2.37) wird als die Lagrange-Gleichung der 2. Art bezeichnet. Aus Gleichung (2.36) folgt noch, dass die Lagrange-Funktion eines Systems mit geschwindigkeitsunabhängigen Kräften im Allgemeinen strikt konvex als Funktion der Geschwindigkeit q̇ ist, denn das Potential V (q, t) in (2.36) ist geschwindigkeitsunabhängig und die kinetische Energie T (q, q̇, t) ist bekanntlich strikt konvex als Funktion von q̇ (siehe Abschnitt [2.6]). Lorentz-Kräfte Nehmen wir an, die Teilchen sind geladen und spüren nicht nur die vorher diskutierten geschwindigkeitsunabhängigen Kräfte, sondern auch äußere elektromagnetische Kräfte (Lorentz-Kräfte). Solche Lorentz-Kräfte können bekanntlich (siehe Abschnitt [2.2], Seite 32) ebenfalls aus einem (nun jedoch geschwindigkeitsabhängigen) Potential hergeleitet werden: FLor = i d dt K ∂VLor ∂ ẋi − K ∂VLor ∂xi , K wobei VLor durch K VLor (X, Ẋ, t) = N X i=1 q̂i [Φ(xi , t) − ẋi · A(xi , t)] ≡ VLor (q, q̇, t) (2.38) definiert ist und die Ladung des i-ten Teilchens (um Verwechslung mit den verallgemeinerten Koordinaten {qk } zu vermeiden) vorübergehend als q̂i bezeichnet wird. Die Einführung des Potentials VLor (q, q̇, t) als Funktion der verallgemeinerten Koordinaten ist sehr sinnvoll, da man unter Verwendung von (2.24) und (2.28) leicht d dt ∂VLor ∂ q̇k = N X i=1 = N X i=1 X d ∂VLor = ∂qk dt i=1 N − d dt FLor · i K ∂VLor ∂ ẋi ∂VLor ∂ ẋi · ∂ ẋi ∂ q̇k − ∂VLor ∂xi ∂VLor ∂ ẋi · − · ∂xi ∂qk ∂ ẋi ∂qk K K ∂VLor ∂xi ∂VLor d − · + · ∂xi ∂qk ∂ ẋi dt ∂xi ∂qk ∂ ẋi − ∂qk ∂xi = FkLor ∂qk zeigen kann. Die verallgemeinerte Gesamtkraft FkG ≡ Fk + FkLor ist somit durch FkG d = dt ∂VG ∂ q̇k − ∂VG ∂qk , VG ≡ V + VLor gegeben, und mit der Definition L = T − VG der Lagrange-Funktion erhält man auch unter Berücksichtigung zusätzlicher Lorentz-Kräfte eine Bewegungsgleichung der Form (2.37). 58 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Wir zeigen nun, dass man auch für den Fall verallgemeinerter Koordinaten elektromagnetische Potentiale definieren kann und dass das Konzept der Eichinvarianz vollständig auf die verallgemeinerte Darstellung übertragbar ist. Elektromagnetische Potentiale lassen sich aufgrund von (2.38) definieren: VLor (q, q̇, t) = N X i=1 " q̂i ΦK (xi , t) − ≡ Φ(q, t) − X X ∂xi k ∂xi q̇k + ∂qk ∂t ! # · AK (xi , t) q̇k Ak (q, t) k mit Φ(q, t) N X = i=1 Ak (q, t) N X = q̂i ΦK (xi , t) − q̂i i=1 ∂xi · AK (xi , t) ∂t ∂xi · AK (xi , t) . ∂qk Es ist zu beachten, dass die Lagrange-Funktion auch für Systeme mit zusätzlichen Lorentz-Kräften strikt konvex als Funktion der Geschwindigkeit q̇ ist; dies folgt sofort daraus, dass die kinetische Energie strikt konvex ist (siehe Abschnitt [2.6]) und das Potential VLor (q, q̇, t) linear von der Geschwindigkeit abhängt. Es folgt außerdem, dass die verallgemeinerte Lorentz-Kraft FkLor in der üblichen Art und Weise mit Hilfe verallgemeinerter elektrischer und magnetischer Felder dargestellt werden kann: FkLor d = dt =− ∂VLor ∂ q̇k X = Ek + q̇l l X l − ∂VLor ∂qk ∂Ak ∂Ak + ∂ql ∂t Bkl q̇l = d ∂Φ X ∂Al q̇l + (−Ak ) − dt ∂qk ∂qk l ! − ∂Φ + ∂qk X q̇l l ∂Al ∂qk , wobei definiert wurde:6 Ek ≡ − ∂Φ ∂Ak − ∂qk ∂t Bkl ≡ , ∂Ak ∂Al − ∂qk ∂ql . Eichinvarianz bedeutet in kartesischen Koordinaten, dass die Eichtransformation 1 ÃK ≡ AK − ∇ΛK c , Φ̃K ≡ ΦK + 1 ∂ΛK c ∂t 6 Die Analogie wird klarer, wenn man bedenkt, dass die Lorentz-Kraft FLor = q(E + ẋ × B) in kartesischen Koordinaten alternativ auch als FLor = q(Ek + k X ekl ẋl ) B (k, l = 1, 2, 3) l ekl mittels einer Dualidarstellbar ist. Hierbei ist der antisymmetrische echte Tensor B ekl ≡ εklm Bm . Umgekehrt tätstransformation eindeutig mit dem Pseudovektor B verknüpft: B elm , so dass B und B e in der Tat „dual“ sind. gilt auch Bk = 21 εklm B 59 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS die Lagrange-Funktion lediglich um eine vollständige Zeitableitung ändert, d X q̂i K Λ (xi , t) , dt i=1 c N L̃K = LK − und somit die Lagrange-Gleichung invariant lässt. In verallgemeinerten Koordinaten erhält man mit Hilfe der Definition Λ(q, t) ≡ N X q̂i ΛK (xi , t) i=1 für die elektromagnetischen Potentiale: 1 X ∂xi 1 ∂Λ · (∇ΛK )(xi , t) = Ak − q̂i c i=1 ∂qk c ∂qk N Ãk = Ak − 1X ∂xi ∂ΛK 1 ∂Λ Φ̃ = Φ + (xi , t) + · ∇ΛK (xi , t) = Φ + q̂i c i=1 ∂t ∂t c ∂t N und somit für die Lagrange-Funktion: ∂Λ X ∂Λ + q̇k ∂t ∂qk 1 L̃ = L − c ! k =L− 1 dΛ c dt (2.39) , so dass auch in diesem Fall die Lagrange-Gleichung der 2. Art invariant ist: Der Beweis, dass die Addition einer vollständigen Zeitableitung die Bewegungsgleichung nicht ändert, verläuft für verallgemeinerte Koordinaten vollkommen analog zum kartesischen Fall (s. Abschnitt 1.4.1). Reibungskräfte Wir wissen bereits, dass Reibungskräfte im Allgemeinen nicht mit Hilfe einer Lagrange-Funktion beschrieben werden können und die Einführung einer Dissipationsfunktion erfordern. In kartesischen Koordinaten („K“) gilt für die Reibungskraft („R“), die auf das i-te Teilchen wirkt: FK i,R = − ∂F K ∂ ẋi , P 1 2 wobei z. B. die Wahl F K (Ẋ) = i 2 ki ẋi für die Dissipationsfunktion dem ẋ entspricht. Allgemein erhält man mit einfachen Reibungsgesetz FK = −k i i i,R der Definition F(q, q̇, t) ≡ F K (Ẋ) für die verallgemeinerte Reibungskraft: Fk,R = N X i=1 X ∂F K ∂ ẋi ∂F ∂xi =− · =− ∂qk ∂ ẋ ∂ q̇ ∂ q̇k i k i=1 N FK i,R · so dass die Lagrange-Gleichung der 2. Art die Form d 0= dt ∂L ∂ q̇k − ∂F ∂L + ∂qk ∂ q̇k , 60 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS annimmt. Fazit ist also, dass auch Reibungskräfte sich problemlos mit Hilfe von verallgemeinerten Koordinaten beschreiben lassen. Einige historische Begriffe Das zentrale Postulat (2.33) der Analytischen Mechanik impliziert für beliebige Variationen {δqk } der physikalischen Bahn im Konfigurationsraum: 0= f X k=1 FkZ δqk = N X i=1 FZi · δxi . (2.40) Setzt man nun die Newton’sche Bewegungsgleichung (2.25) in (2.40) ein, so entsteht die Identität N X i=1 mi ẍi − FK · δxi = 0 . i (2.41) Es ist klar, dass man ausgehend von (2.41) die Bewegungsgleichung (2.31) mit Fk in der Form (2.34) herleiten könnte. In der Tat hat die Identität (2.41) Lagrange als Startpunkt für die Herleitung seiner „Lagrange-Gleichung“ (2.31) gedient, so dass Gleichung (2.41), die ursprünglich von Bernoulli und d’Alembert aufgestellt wurde und als d’Alembert’sches Prinzip bekannt ist, historisch sehr wichtig war.7 Des Weiteren sollte erwähnt werden, dass die Variation δxi in (2.26) und (2.27) in der Literatur oft als virtuelle Verrückung bezeichnet wird. Dementsprechend wird (2.40) im Jargon so interpretiert, dass die virtuelle Arbeit der Zwangskräfte stets Null ist. Da die Größe δW in (2.26) und (2.27) jedoch lediglich ein mathematisches Hilfsmittel darstellt, weder real noch virtuell etwas „verrückt“ und weder real noch virtuell „Arbeit“ geleistet wird, scheinen solche historischen Begriffe eher irreführend als hilfreich zu sein. 2.7 Das Hamilton’sche Prinzip in verallgemeinerten Koordinaten Die Formulierung des Hamilton’schen Prinzips und die Herleitung der Bewegungsgleichung aus dem Variationsprinzip erfolgen für verallgemeinerte Koordinaten völlig analog zum kartesischen Fall. Wir fassen die wichtigsten Schritte kurz zusammen. Wir bezeichnen die physikalische Bahn im Konfigurationsraum als qφ (t) = {qφk (t)} und betrachten allgemein benachbarte Bahnen q(t) = {qk (t)}, die zur Anfangs- und zur Endzeit mit der physikalischen Bahn zusammenfallen: q(t1 ) = qφ (t1 ) ≡ q1 , q(t2 ) = qφ (t2 ) ≡ q2 . Definieren wir also die Variationen (δqk )(t) ≡ qk (t) − qφk (t) = εκk (t) , (δq)(t) ≡ q(t) − qφ (t) = εκ(t) 7 Für den Spezialfall, dass keine Zwangskräfte vorliegen und somit FZ = 0 gilt, reduziert i sich (2.41) zum üblichen zweiten Newton’schen Gesetz. 61 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS mit κ(t) = {κk (t)}, so gilt κ(t1 ) = κ(t2 ) = 0. Die Wirkung wird auch für verallgemeinerte Koordinaten als Zeitintegral der Lagrange-Funktion definiert: Zt2 (q ,t ) S(q12,t12) [q] dt L(q(t), q̇(t), t) = (2.42) , t1 und das Hamilton’sche Prinzip lautet: 1 (q ,t ) lim (δS)(q21 ,t21 ) [qφ + εκ] = 0 ε ε→0 (∀κ mit κ(t1 ) = κ(t2 ) = 0) . Die Variation der Wirkung nahe der physikalischen Bahn kann leicht berechnet werden: 1 1 δS = δ ε ε 1 = ε Zt2 dt L(q(t), q̇(t), t) t1 Zt2 dt [L(qφ (t) + εκ(t), q̇φ (t) + εκ̇(t), t) − L(qφ (t), q̇φ (t), t)] t1 Zt2 § dt = t1 ª d ∂L ∂L (qφ (t), q̇φ (t), t) − (qφ (t), q̇φ (t), t) ∂q dt ∂ q̇ · κ(t) + O(ε) , so dass man als Konsequenz des Hamilton’schen Prinzips die Lagrange-Gleichung (der zweiten Art) erhält: 0= δS δq(t) = φ ∂L d ∂L (qφ (t), q̇φ (t), t) − (qφ (t), q̇φ (t), t) ∂q dt ∂ q̇ . (2.43) Da die Wirkung S in (2.42) auch in der allgemeinen Formulierung die Form eines Zeitintegrals hat und die Anfangs- und Endpunkte bei der Variation festgehalten werden, ist klar, dass die Bewegungsgleichung invariant ist unter der Addition einer vollständigen Zeitableitung zur Lagrange-Funktion: L → L′ ≡ L + ∂λ ∂λ d λ(q, t) = L + q̇ · (q, t) + (q, t) dt ∂q ∂t , da diese Transformation die Wirkung lediglich um eine additive Konstante ändert: S → S ′ = S + λ(q2 , t2 ) − λ(q1 , t1 ) = S + Konstante . Ein Beispiel einer Transformation, die die Lagrange-Funktion lediglich um eine vollständige Zeitableitung ändert, ist die Eichtransformation in verallgemeinerten Koordinaten, s. Gleichung (2.39). 2.8 Die Lagrange-Gleichungen der ersten Art Die Lagrange-Gleichungen der zweiten Art haben den Vorteil, dass sie (wegen der Eliminierung aller Zwangskräfte) eine sehr einfache Struktur besitzen, und 62 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS den Nachteil, dass man überhaupt keine Information über eben diese Zwangskräfte erhält. Manchmal benötigt man als Physiker jedoch unbedingt Information über die Zwangskräfte, z. B. wenn geklärt werden muss, ob ein Seil, dessen Seilspannung einen gewissen Wert nicht überschreiten darf, einen bestimmten dynamischen Vorgang ohne zu reißen übersteht. Zur Berechnung von Zwangskräften verwendet man die Lagrange-Gleichungen der ersten Art. Der Einfachheit halber betrachten wir im Folgenden nur holonome Zwangsbedingungen. Nehmen wir an, ein N -Teilchen-System unterliegt insgesamt Z holonomen Zwangsbedingungen der Form f¯m (x1 , x2 , . . . , xN , t) = 0 (m = 1, 2, . . . , Z) , die also Z Zwangskräfte erzeugen, von denen man allerdings nur die ersten z ≤ Z kennen möchte. Die auf das i-te Teilchen wirkende Kraft hat somit, analog zu Gleichung (2.25), die allgemeine Form Z−z + Fzi Fi = FK i + Fi , wobei FK i die inneren und äußeren Kräfte (in kartesischen Koordinaten) darstellt, die nicht auf Zwangskräfte zurückzuführen sind, und Fzi und FZ−z die i Wirkung der ersten z bzw. der letzten Z −z Zwangsbedingungen repräsentieren. Analog zum Vorgang in Abschnitt [2.6] führen wir nun 3N − (Z − z) = f + z verallgemeinerte Koordinaten q = (q1 , q2 , . . . , qf +z ) ein, mit deren Hilfe die Z − z Zwangsbedingungen mit den Indizes z + 1 ≤ m ≤ Z automatisch berücksichtigt werden können. Unter den üblichen Annahmen (innere Kräfte, die das dritte Newton’sche Gesetz erfüllen, usw.) erhält man die Bewegungsgleichung d dt ∂L ∂ q̇k − ∂L − Fkz ∂qk =0 (k = 1, 2, . . . , f + z) , (2.44) φ wobei die verallgemeinerte Kraft Fkz die Wirkung der Zwangskräfte Fzi darstellt, Fkz = N X i=1 Fzi · ∂xi ∂qk , die von den verbleibenden z Zwangsbedingungen hervorgerufen werden: fm (q, t) ≡ f¯m (X(q, t), t) = 0 (m = 1, 2, . . . , z) . (2.45) Aufgrund von (2.45) ist der Konfigurationsraum der Lösungen von (2.44) effektiv f -dimensional. Für alle möglichen Variationen δqk in der f -dimensionalen Tangentialebene an der Bewegungsmannigfaltigkeit muss gelten: F z · δq = f +z X k=1 Fkz δqk = 0 , so dass die Zwangskraft F z ≡ (F1z , . . . , Ffz+z ) stets senkrecht auf der Mannigfaltigkeit {fm (q, t) = 0 | m = 1, 2, . . . , z} steht. Da das orthogonale Komplement der Tangentialebene an {fm (q, t) = 0} im Punkte (qφ , t) durch die Gradienten ∂fm ∂q (qφ , t) mit 1 ≤ m ≤ z aufgespannt wird: (δfm )(q, t) = ∂fm (qφ , t) · (δq)(t) = 0 ∂q (m = 1, 2, . . . , z) , 63 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS muss für gewisse Proportionalitätskonstanten λm (t): F zφ = z X λm (t) m=1 ∂fm (qφ , t) ∂q gelten. Einsetzen in (2.44) liefert für die Bewegungsgleichung: d dt ∂L ∂ q̇k − ∂L ∂qk = φ z X λm (t) m=1 fm (qφ (t), t) = 0 ∂fm (qφ , t) ∂qk (k = 1, 2, . . . , f +z) (2.46) (2.47) (m = 1, 2, . . . , z) . Der Gleichungssatz (2.46) + (2.47) enthält insgesamt f + 2z unabhängige Gleichungen für die f +2z Unbekannten {qφk }, {λm } und ist somit vollständig lösbar. Die mit den Zwangsbedingungen fm = 0 (1 ≤ m ≤ z) verknüpften Zwangskräfte sind also im Unterraum {f¯m = 0 | z + 1 ≤ m ≤ Z} durch (m) Fφ = λm (t) ∂fm (qφ , t) ∂q (2.48) (m = 1, 2, . . . , z) gegeben. Ein wichtiger Spezialfall tritt auf für z = Z. In diesem Fall gilt f = 3N − z bzw. f + z = 3N , so dass (2.48) die vollständige Zwangskraft (zum Beispiel: die vollständige Seilspannung) im 3N -dimensionalen Raum darstellt. Die Form der Bewegungsgleichung (2.46) kann hierbei durch eine geeignete Wahl der verallgemeinerten Koordinaten im 3N -dimensionalen Raum optimiert werden. Gleichung (2.46) wird allgemein (nicht nur für z = Z) als die Lagrange-Gleichung der ersten Art bezeichnet. Die Lagrange-Gleichung der ersten Art (2.46) kann auch leicht aus einem Variationsprinzip hergeleitet werden. Die entsprechende Verallgemeinerung des Hamilton’schen Prinzips hat die Form 1 (q ,t ) lim (δ S̄)(q12 ,t12 ) [qφ + εκ] = 0 ε (∀κ mit κ(t1 ) = κ(t2 ) = 0) ε→0 mit (q ,t ) S̄(q12,t12) [q] " Zt2 ≡ dt L (q(t), q̇(t), t) + z X # λm (t)fm (q(t), t) , (2.49) m=1 t1 denn für die stationäre Lösung von S̄ gilt genau (2.46): δ S̄ 0= δq(t) " φ d ∂L − = ∂q dt ∂L ∂ q̇ z X ∂fm + λm (t) ∂q m=1 # . φ Alternativ, und vielleicht noch eleganter, kann man den vollständigen Gleichungssatz (2.46) + (2.47) aus einem Variationsprinzip der Form 1 (q ,t ) lim (δ S̄)(q12 ,t12 ) [q, λ] = 0 , ε ε→0 herleiten, wobei S̄[q, λ] formal dieselbe Struktur wie S̄[q] in (2.49) hat, die Variation (δq)(t) denselben Einschränkungen (δq)(t1 ) = (δq)(t2 ) = 0 unterworfen 64 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS ist wie vorher und die Variation (δλ)(t) mit λ ≡ {λm } auch zu den Anfangsund Endzeiten t1 bzw. t2 keinerlei Einschränkungen unterworfen ist. Die EulerLagrange-Gleichungen für den stationären Punkt der Wirkung S̄[q, λ], betrachtet als Funktional von q und λ, liefern nun sowohl die Lagrange-Gleichung der ersten Art (2.46) als auch die Zwangsbedingungen (2.47). Hiermit ist gezeigt, dass man auch Zwangskräfte aus einem Variationsprinzip berechnen kann, vorausgesetzt, dass die entsprechenden Zwangsbedingungen holonom sind. Es sollte hinzugefügt werden, dass die Lagrange-Gleichungen der 1. Art (2.46) + (2.47) nicht immer explizit gelöst werden müssen, um die Zwangskräfte zu berechnen. Manchmal erhält man die Lösung (einschließlich der Zwangskräfte) nämlich einfacher über einen kleinen Umweg: Eliminiert man die verbleibenden z Zwangsbedingungen, indem man verallgemeinerte Koordinaten q̄ = (q̄1 , q̄2 , . . . , q̄f ) einführt, die die f -dimensionale Fläche parametrisieren, auf der sich das System im q-Raum bewegt, und löst man die Lagrange-Gleichungen der zweiten Art im q̄-Raum, so erhält man die physikalische Bahn des Systems in der Form q̄φ (t) im q̄- bzw. qφ (t) = q(q̄φ (t), t) im q-Raum. Einsetzen dieser Lösung qφ (t) in das linke Glied von (2.46) liefert einen expliziten Ausdruck für die Gesamtzwangskraft im rechten Glied von (2.46). Die Gesamtzwangskraft lässt © m | m = 1, 2, . . . ,z sich eindeutig als Linearkombination der Gradienten ∂f ∂q m schreiben; die Komponente in Richtung ∂f ∂q stellt hierbei die mit der m-ten Zwangsbedingung verknüpfte Zwangskraft (2.48) dar. Ob die Lagrange-Gleichungen der ersten Art (2.46) + (2.47) für (qφ (t), λφ (t)) oder diejenigen der zweiten Art für q̄φ (t) technisch einfacher lösbar sind, lässt sich im Voraus nicht immer entscheiden; die Antwort hängt in konkreten Anwendungen natürlich auch stark von der Wahl der verallgemeinerten Koordinaten q̄ ab. Beispiel: das sphärische Pendel Als Beispiel für die Beschreibung von Zwangskräften im Rahmen des LagrangeFormalismus betrachten wir noch einmal das sphärische Pendel, das ausführlich in § 4.3 des Theorie-1-Skripts untersucht wurde. Die Lagrange-Funktion und die relevante (skleronome, holonome) Zwangsbedingung sind durch L(x, ẋ, t) = 12 mẋ2 − mgx3 , f (x) ≡ l − |x| = 0 gegeben. Die Bahn x(t), die das Wirkungsfunktional (x ,t ) S̄(x12,t12) [x] Z t2 = dt [L (x(t), ẋ(t), t) + λ(t)f (x(t))] t1 stationär macht, erfüllt die Lagrange-Gleichung der ersten Art, 0= ∂L d − ∂x dt ∂L ∂ ẋ + λ(t) ∂f = −mgê3 − mẍ − λ(t)x̂ ∂x , und außerdem die Zwangsbedingung |x| = l. Ausgehend von diesen Gleichungen findet man - genau wie früher - , dass der Lagrange-Multiplikator λ(t) die Form λ(t) = m[ẋφ (t)]2 − mgê3 · x̂φ (t) l (2.50) 65 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS hat und dass Lösungen nur für Anfangsbedingungen mit |x(0)| = l und x(0) · ẋ(0) = 0 möglich sind. Für den Spezialfall des mathematischen Pendels erhält man relativ einfache und explizite Ergebnisse. In diesem Fall kann die Dynamik bequem mit Hilfe einer verallgemeinerten Koordinate ψ(t) beschrieben werden: sin(ψ) 0 − cos(ψ) xφ (t) = l , ẋφ (t) = lψ̇ cos(ψ) 0 sin(ψ) . Aus der Bewegungsgleichung ψ̈ = − gl sin(ψ) folgt durch einmalige Integration die Beziehung ψ̇ 2 = 2 gl [cos(ψ) − cos(ψmax )]. Einsetzen dieser Resultate in (2.50) liefert: λ(t) = mg l 2 g ψ̇ + cos(ψ) = 3mg cos(ψ) − 2 3 cos(ψmax ) , (2.51) wobei ψ(t) explizit mit Hilfe spezieller Funktionen bestimmt werden kann (siehe § 4.3.1 des Theorie-1-Skripts). Die vom Stab auf den Massenpunkt ausgeübte Zwangskraft ist durch −λ(t)x̂ gegeben. Gleichung (2.51) zeigt, dass die Winkelabhängigkeit dieser Zwangskraft für das mathematische Pendel sehr einfach ist. 2.9 Beispiel einer rheonomen Zwangsbedingung In diesem Abschnitt zeigen wir, dass die Zeitabhängigkeit einer Zwangsbedingung das physikalische Verhalten eines Systems in dramatischer Weise beeinflussen kann, sogar dann, wenn die Amplitude der zeitlichen Änderungen sehr gering ist. Als konkretes Beispiel betrachten wir ein mathematisches Pendel in der x1 − x3 − Ebene, dessen Aufhängepunkt a(t) mit kleiner Amplitude, jedoch hoher Frequenz periodisch bewegt wird: a(t) = a1 cos(ωt) 0 a2 sin(ωt) ≡ È (a1 )2 + (a2 )2 a(t) ā1 cos(ωt) 0 ā2 sin(ωt) . x3 g ϕ l x1 m, x(t) Abbildung 2.2: Mathematisches Pendel mit kleiner Amplitude des Aufhängepunkts Hierbei soll „kleine Amplitude“ bedeuten, dass der dimensionslose Parameter ε≡ È (a1 )2 + (a2 )2 /l 66 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS klein ist: ε ≪ 1, während „hohe Frequenz“ andeutet, dass È die Frequenz ω der g/l des ungestörten Störung sehr viel größer als die Pendelfrequenz ω0 ≡ mathematischen Pendels ist: ω/ω0 ≫ 1. Die kartesischen Koordinaten der Pendelmasse m in der x1 − x3 -Ebene sind der rheonomen Zwangsbedingung |x(t)−a(t)| = l unterworfen und können somit in der Form x(t) = a(t) + l sin(ϕ) 0 − cos(ϕ) dargestellt werden; hierbei spielt ϕ die Rolle einer verallgemeinerten Koordinate. Die Lagrange-Funktion L(ϕ, ϕ̇, t) ist offensichtlich durch 2 cos(ϕ) 1 − mg [a2 sin(ωt) − l cos(ϕ)] 0 L(ϕ, ϕ̇, t) = m ȧ(t) + lϕ̇ 2 sin(ϕ) bzw. (nach der Elimination einer vollständigen Zeitableitung) durch L(ϕ, ϕ̇, t) = 21 ml2 ϕ̇2 +εω 2 ml2 [ā1 cos(ωt) sin(ϕ) − ā2 sin(ωt) cos(ϕ)]+mgl cos(ϕ) gegeben. Die Lagrange-Gleichung lautet ϕ̈ = −ω02 sin(ϕ) + εω 2 F (ϕ, ωt) , (2.52) wobei die schnell variierende äußere Kraft F (ϕ, τ ) durch F (ϕ, τ ) ≡ ā1 cos(τ ) cos(ϕ) + ā2 sin(τ ) sin(ϕ) , τ ≡ ωt definiert wird. Es ist klar, dass die Amplitude εω 2 der schnell variierenden Kraft für genügend hohe Frequenzen auch für ε ≪ 1 recht groß sein kann. Um die Wirkung einer schnell variierenden Kraft mit (möglicherweise) recht großer Amplitude besser einschätzen zu können, betrachten wir ein einfaches, exakt lösbares Modell, das man durch Linearisierung aus (2.52) erhält: ϕ̈ = −ω02 ϕ + ε̄ω 2 cos(ωt) , ε̄ ≡ εā1 ≪ 1 . Diese Gleichung beschreibt genau den harmonischen Oszillator mit einer antreibenden Kraft (jedoch ohne Reibung), der in § 4.2.2 des Theorie-1-Skripts untersucht wurde. Wir können die dort berechnete Lösung (mit geringen Änderungen in der Notation) übernehmen: ϕ(t) = ϕ(0) cos(ω0 t) + ε̄ω 2 ϕ̇(0) sin(ω0 t) + 2 [cos(ωt) − cos(ω0 t)] ω0 ω0 − ω 2 . Für ω ≃ ω0 wird der letzte Term im rechten Glied bekanntlich sehr groß (Resonanz). Im Falle der schnell variierenden Kraft sind wir jedoch primär an relativ großen ω-Werten interessiert; man erhält für ω ≫ ω0 : ω2 ϕ̇(0) sin(ω0 t) − ε̄ [cos(ωt) − cos(ω0 t)] + O ε̄ 02 ω0 ω 2 ϕ̇(0) ω = [ϕ(0) + ε̄] cos(ω0 t) + sin(ω0 t) − ε̄ cos(ωt) + O ε̄ 02 ω0 ω 2 ω ≡ Φ(t) − ε̄ cos(ωt) + O ε̄ 02 . ω ϕ(t) = ϕ(0) cos(ω0 t) + 67 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Wir lernen somit, dass die Lösung ϕ(t) durch rapide Oszillationen mit kleiner Amplitude (ε̄ ≪ 1) um die Funktion Φ(t) charakterisiert wird, wobei Φ(t) langsam variiert und das mittlere Verhalten von ϕ(t) widerspiegelt. Allgemeiner erwartet man daher physikalisch, dass die Überlagerung der langsam variierenden Kraft −ω02 sin(ϕ) und der schnell variierenden Kraft F (ϕ, ωt) in (2.52) eine Pendelbewegung hervorruft, die durch kleine Oszillationen um ein wohldefiniertes mittleres Verhalten charakterisiert ist. Dies entspricht dem Ansatz: ϕω (t) = Φ(t) + ε ∞ X εm ωn ξmn (t, τ ) (2.53) ε = Φ(t) + εξ00 (t, τ ) + ε2 ξ10 (t, τ ) + ξ01 (t, τ ) + . . . , ω wobei die Funktionen ξmn der Variablen t und τ 2π-periodisch als Funktion von τ und unabhängig von den Parametern ε und ω sind. Die Funktion Φ(t) bestimmt das mittlere Verhalten der Bahn ϕω (t) und wird als das Leitzentrum bezeichnet. Um die Worte „mittleres Verhalten“ zu präzisieren, führen wir die Zeitmittelung einer Funktion f (t, τ ) ein, die 2π-periodisch in der Variablen τ ist: m,n=0 1 f¯(t) ≡ 2π τZ 0 +π dτ f (t, τ ) , f (t, τ + 2π) = f (t, τ ) . (2.54) τ0 −π Bei dieser Zeitmittelung werden die Variablen t und τ als formal unabhängig aufgefasst. Wegen der 2π-Periodizität ist f¯(t) unabhängig von τ0 . Wir fordern nun, dass Φ(t) den Zeitmittelwert der Lösung ϕω (t) beschreibt: bzw. ξmn (t) = 0 Φ(t) = ϕω (t) (m, n ∈ N) (2.55) . Da Φ langsam variiert als Funktion der Zeit und ξmn schnell, wird Φ im Jargon als „langsame Variable“ und ξmn entsprechend als „schnelle Variable“ bezeichnet. Wir werden im Folgenden versuchen, die „schnellen Variablen“ zu eliminieren und eine geschlossene Gleichung für Φ(t) aufzustellen. Einsetzen des Ansatzes (2.53) in die Lagrange-Gleichung (2.52) liefert unter Vernachlässigung von Termen höherer Ordnung in den Parametern ε oder ω1 : ∂ 2 ξ10 1 ∂ 2 ξ01 2 ∂ 2 ξ00 ∂ 2 ξ00 + ε + + Φ̈ + εω ∂τ 2 ∂τ 2 ω ∂τ 2 ω ∂t∂τ ∂F (Φ, τ ) = −ω02 sin(Φ) + εω 2 F (Φ, τ ) + εξ00 . (2.56) ∂Φ Ein Vergleich der führenden τ -abhängigen Terme in beiden Gliedern zeigt, dass ξ00 in einfacher Weise mit der schnell variierenden Kraft zusammenhängt: 2 ∂ 2 ξ00 (t, τ ) = F (Φ(t), τ ) bzw. ξ00 (t, τ ) = −F (Φ(t), τ ) . ∂τ 2 Eine Zeitmittelung (2.54) liefert nun aufgrund von (2.55) und der 2π-periodischen τ -Abhängigkeit der Funktionen ξmn : Φ̈ ∂F ∂F = −ω02 sin(Φ) − ε2 ω 2 F ∂Φ ∂Φ 2 ∂Vf 1 ∂F =− (Φ) = −ω02 sin(Φ) − ε2 ω 2 2 ∂Φ ∂Φ = −ω02 sin(Φ) + ε2 ω 2 ξ00 (2.57) 68 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS mit Vf (Φ) ≡ = ω02 [1 − cos(Φ)] + 21 ε2 ω 2 F 2 ω02 [1 − cos(Φ)] + 41 ε2 ω 2 ā21 cos2 (Φ) + ā22 sin2 (Φ) (2.58) . Bei Bedarf kann man durch den Vergleich der höheren Ordnungen in (2.56) weitere Korrekturen ausrechnen: ∂ξ00 ∂ξ01 = −2 , ∂τ ∂t ξ01 = −2Φ̇ [ā1 sin(τ ) sin(Φ) + ā2 cos(τ ) cos(Φ)] ∂ 2 ξ10 ∂ = − 21 (F 2 − F 2 ) , ∂τ 2 ∂Φ 1 ξ10 = − [cos(2τ ) sin(2Φ) − 2ā1 ā2 sin(2τ ) cos(2Φ)] 16 . Die Bewegungsgleichung (2.57) stellt ein hochinteressantes Ergebnis dar: Das Leitzentrum Φ(t) des Pendels bewegt sich offenbar im effektiven Potential Vf (Φ), dessen Form explizit von der Amplitude und der Frequenz der oszillierenden Bewegung des Aufhängepunktes abhängig ist! Wir betrachten das effektive Potential Vf (Φ) in (2.58) nun etwas genauer: Für eine kreisförmige Bewegung des Aufhängepunktes (ā1 = ā2 = √12 ) passiert offenbar nichts Interessantes, da der Zusatzterm im rechten Glied von (2.58) in diesem Fall konstant (d. h. Φ-unabhängig) ist. Für ā1 6= ā2 folgen die stationären Punkte des Potentials aus 0 = Vf′ (Φ) = ω02 sin(Φ) [1 − Ω cos(Φ)] , Ω≡ ε2 ω 2 (ā21 − ā22 ) 2ω02 als Φ = 0, π, Φ± mit Φ± ≡ ± arccos(Ω−1 ). Um die Stabilität dieser stationären Punkte zu untersuchen, berechnen wir die zweite Ableitung des Potentials: Vf′′ (Φ) = ω02 cos(Φ) − Ω 2 cos2 (Φ) − 1 © . Es folgt: Vf′′ (0) = ω02 (1−Ω) , Vf′′ (π) = −ω02 (1+Ω) , Vf′′ (Φ± ) = ω02 Ω − 1 Ω . Für eine überwiegend horizontale Bewegung des Aufhängepunktes (ā1 > ā2 bzw. Ω > 0) folgt also, dass die übliche Ruhelage Φ = 0 nur für niedrige Frequenzen (Ω < 1) stabil ist; für höhere Frequenzen (Ω > 1) ist die stabile Ruhelage durch Φ± gegeben, so dass das Pendel in der Ruhelage schräg zur Seite ausgelenkt ist. Für eine überwiegend vertikale Bewegung (ā1 < ā2 bzw. Ω < 0) ist die übliche Ruhelage Φ = 0 immer stabil, die stationären Punkte Φ± (die nur für |Ω| > 1 existieren) sind immer instabil, und die senkrechte Lage (Φ = π) ist instabil für niedrige (−1 < Ω < 0) und stabil für hohe (Ω < −1) Frequenzen. Bei einer überwiegend vertikalen Oszillation des Aufhängepunktes und genügend hohen Frequenzen kann ein Pendel also durchaus Kopf stehen! 69 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS 2.10 Erhaltungsgrößen Bei der Untersuchung eines mechanischen Systems ist es sehr wichtig, möglichst viele (falls möglich: alle) Erhaltungsgrößen zu bestimmen, da diese zum einen zur Klassifizierung der Lösungen verwendet werden können und zum anderen die konkrete Berechnung dieser Lösungen stark vereinfachen. Wir diskutieren einige naheliegende Methoden, ausgehend von einer vorgegebenen Lagrange-Funktion L(q, q̇, t) Erhaltungsgrößen zu konstruieren. Falls die Lagrange-Funktion nicht explizit von der Zeitvariablen abhängt, ist das Jacobi-Integral J(q, q̇, t) ≡ X ∂L ∂ q̇k k q̇k − L für die physikalische Bahn erhalten. Dies folgt sofort aus dJ dt = φ ( X d ∂L dt k = ∂ q̇k ( X d ∂L dt k ∂L ∂L X ∂L ∂L q̇k + q̈k − q̇k + q̈k − ∂ q̇k ∂t ∂qk ∂ q̇k − ∂ q̇k ∂L ∂L q̇k − ∂qk ∂t ) k ) =− φ ∂L ∂t φ . φ Um die Bedeutung des Jacobi-Integrals besser zu verstehen, betrachten wir als Beispiel ein System, das skleronomen Zwangsbedingungen unterworfen ist, und wir nehmen an, dass die verallgemeinerten Koordinaten zeitunabhängig gewählt wurden: xi = xi (q). In diesem Fall hängt auch die kinetische Energie nicht explizit von der Zeit ab und hat nach (2.23) die allgemeine Form T (q, q̇) = 1 2 X akl (q)q̇k q̇l , akl = alk . kl Wir nehmen außerdem an, dass die verallgemeinerten Kräfte Fk konservativ sind und somit nach (2.35) aus einem zeitunabhängigen Potential V (q) hergeleitet werden können. Für ein solches System gilt: " Jφ = X ∂T k ∂ q̇k # q̇k − (T − V ) φ = [2T − (T − V )]φ = (T + V )φ = E , so dass das Jacobi-Integral gleich der Energie des Systems ist. In diesem Fall dE ∂L impliziert ∂L ∂t = 0 also dt = 0. Umgekehrt ist es nicht so, dass ∂t 6= 0 notwendigerweise bedeutet, dass die Energie des Systems nicht erhalten ist. Als Beispiel betrachten wir zwei äquivalente Lagrange-Funktionen L und L′ , die gemäß d L′ = L + λ(q, t) = L + dt X ∂λ l ∂λ q̇l + ∂ql ∂t ! miteinander verknüpft sind; außerdem soll ∂L ∂t = 0 und Jφ = E = konstant gelten. Da die Energie für L erhalten ist, muss das Gleiche für die äquivalente 70 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Lagrange-Funktion L′ gelten. Da das Jacobi-Integral für L′ durch J′ = X ∂L′ ∂ q̇k k =J+ X k q̇k − L′ = J + X q̇k k ∂ ∂ q̇k X ∂λ ∂λ − q̇k ∂qk ∂λ q̇l + ∂ql ∂t l dλ dt − ! dλ dt =J− ∂λ ∂t gegeben ist, hat die Erhaltungsgröße Energie in diesem Fall die Form ∂λ E= J + ∂t ′ = " X ∂L′ φ k ∂λ q̇k − L + ∂ q̇k ∂t # ′ . φ Wir stellen fest, dass die Energie für L′ im Allgemeinen nicht gleich dem JacobiIntegral J ′ ist, obwohl das Jacobi-Integral auch in diesem Fall wertvolle Hinweise auf die Existenz einer Erhaltungsgröße liefert. Falls die Lagrange-Funktion L(q, q̇, t) nicht explizit von der verallgemeinerten Koordinate ql abhängt (für irgendein l ∈ {1, 2, . . . , f }), so wird diese Koordinate als zyklisch bezeichnet. Die Existenz einer zyklischen Koordinate, d dt ∂L ∂ q̇l − ∂L ∂ql = φ d dt ∂L ∂ q̇l =0 , φ impliziert unmittelbar die Existenz einer Erhaltungsgröße: ∂L (qφ , q̇φ , t) = konstant . ∂ q̇l Die physikalische Größe pl (q, q̇, t) ≡ ∂∂L q̇l (q, q̇, t) wird generell (d. h. nicht nur, wenn sie für die physikalische Bahn erhalten ist) als der mit ql assoziierte verallgemeinerte Impuls (auch: als der „konjugierte“ oder „kanonische“ Impuls) bezeichnet.8 Diese Bezeichnung ist naheliegend, da z. B. für den einfachen Fall L = 21 mẋ2 − V (x) in der Tat ∂L ∂ ẋ = mẋ = p folgt. In allgemeineren Beispielen muss ∂∂L q̇l (q, q̇, t) jedoch nicht unbedingt die physikalische Dimension [Impuls] haben. Zum Beispiel hängt die Lagrange-Funktion des Zweiteilchenproblems in Relativkoordinaten (s. Gleichung (3.26) des Theorie1-Skripts) nicht explizit von der Variablen ϕ ab: L(x, ẋ, ϕ, ϕ̇, t) = 21 µ(ẋ2 + x2 ϕ̇2 ) − V (x) (2.59) , 2 so dass der verallgemeinerte Impuls ∂L ∂ ϕ̇ = µx ϕ̇ , den wir in § 3.3 des Theorie-1Skriptes als Drehimpuls identifizieren konnten, eine Erhaltungsgröße darstellt. (S) Als weitere Erhaltungsgröße folgt wegen ∂L = ∂t = 0 die Gesamtenergie E 1 2 2 2 µ( ẋ + x ϕ̇ ) + V (x). 2 8 Es ist zu beachten, dass der verallgemeinerte Impuls p = (p , p , . . . , p ) eines physi1 2 f kalischen Systems, wie auch die Lagrange-Funktion, nicht eindeutig definiert ist. Die zu L liefert nämlich den verallgemeinerten Impuls äquivalente Lagrange-Funktion L′ = L + dλ dt p′ = ∂L′ ∂ = ∂ q̇ ∂ q̇ L+ ∂λ ∂λ · q̇ + ∂q ∂t = ∂L ∂λ ∂λ + = p+ (q, t) ∂ q̇ ∂q ∂q der um eine orts- und zeitabhängige Funktion von p abweicht. , 71 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Ein anderes Beispiel für eine Lagrange-Funktion mit einer zyklischen Koordinate und einem assoziierten erhaltenen verallgemeinerten Impuls ist das geladene Teilchen in einem elektromagnetischen Feld, L(x, ẋ, t) = 21 mẋ2 − q̂ [Φ(x, t) − ẋ · A(x, t)] , ∂A ∂Φ = 0 und ∂x = 0. In diesem Fall ist die 3-Komponente des verallmit z. B. ∂x 3 3 gemeinerten Impulses p = ∂L ∂ ẋ erhalten: d dp3 = dt dt ∂L ∂ ẋ3 = d ∂L =0 [mẋ3 + q̂A3 (x1 , x2 , t)] = dt ∂x3 . Die Interpretation ist, dass unter diesen Bedingungen der Gesamtimpuls der Materie und des Feldes in 3-Richtung erhalten ist. Ähnlich wie vorher bei der Diskussion des Jacobi-Integrals, muss auch nun angemerkt werden, dass die Abwesenheit offensichtlicher zyklischer Koordinaten nicht notwendigerweise die Nicht-Existenz von Impulsintegralen impliziert. Zum Beispiel enthält die Lagrange-Funktion (2.59) für das Zweiteilchenproblem in kartesischen Koordinaten, È L(x1 , x2 , ẋ1 , ẋ2 , t) = 21 µ(ẋ21 + ẋ22 ) − V ( x21 + x22 ) , keine offensichtlichen zyklischen Ortskoordinaten. Dennoch wissen wir, dass die 3-Komponente µ(x1 ẋ2 − x2 ẋ1 ) des Drehimpulses eine Erhaltungsgröße darstellt. Aus diesem Beispiel lernen wir erstens, dass die Existenz zyklischer Koordinaten von der Wahl des Koordinatensystems abhängt, und zweitens, dass es vorteilhaft ist, die verallgemeinerten Koordinaten so zu wählen, dass die Lagrange-Funktion möglichst viele zyklische Koordinaten enthält. Letzteres, also die Bestimmung des optimalen Koordinatensystems, ist das Ziel der Transformationstheorie. 2.10.1 Elimination von zyklischen Koordinaten Betrachten wir eine Lagrange-Funktion L(f +1) , die nicht explizit von der Koordinate qf +1 abhängt: L(f +1) = L(f +1) (q, q̇, q̇f +1 , t) , q ≡ (q1 , . . . , qf ) . (2.60) Da qf +1 also zyklisch ist, stellt der assoziierte Impuls pf +1 = ∂L(f +1) ∂ q̇f +1 (2.61) für die physikalische Bahn eine Erhaltungsgröße dar, die dazu verwendet werden kann, q̇f +1 als Funktion von (q, q̇, t) sowie der Konstanten pf +1 zu bestimmen: q̇f +1 = f (q, q̇, t; pf +1 ) . (2.62) Diese Beziehung erlaubt es uns offensichtlich, q̇f +1 gänzlich aus den Bewegungsgleichungen für qφ (t) zu eliminieren. Durch Elimination einer zyklischen Variablen kann man daher die Dimensionalität eines Problems reduzieren und es somit (unter Umständen: erheblich) vereinfachen. 72 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Man kann sich nun fragen, ob die zyklische Koordinate qf +1 nicht auch sofort in der Lagrange-Funktion (statt erst in der Bewegungsgleichung) eliminiert werden kann. Im Wesentlichen haben wir dies bereits einmal stillschweigend getan, als wir (in Gleichung (3.26) des Theorie-1-Skripts) die zyklische Winkelvaria|L|2 ble ϕ eliminierten und die Energie als 21 µẋ2 + Vf (x) mit Vf (x) ≡ V (x) + 2µx 2 schrieben. Hier wurde also effektiv die neue Lagrange-Funktion L(x, ẋ, t) ≡ 12 µẋ2 − Vf (x) eingeführt, die die Dynamik eines eindimensionalen Teilchens im Potential Vf (x) beschreibt. Wir zeigen nun, dass diese Elimination auch für die allgemeine Lagrange-Funktion (2.60) durchgeführt werden kann und dass die LagrangeFunktion nach der Elimination die Form L(f ) (q, q̇, t; pf +1 ) ≡ L(f +1) (q, q̇, q̇f +1 , t) − pf +1 q̇f +1 (2.63) hat. Da wir bereits wissen, dass der verallgemeinerte Impuls pf +1 in (2.61) für die physikalische Bahn (qφ , qφ,f +1 ) erhalten ist, beschränken wir uns hierbei auf solche Bahnen (q, qf +1 ), für die (2.61) mit konstantem pf +1 und somit auch (2.62) gilt. Dies bedeutet also, dass die Größe pf +1 in (2.63) für alle betrachteten Bahnen (q, qf +1 ) den gleichen Wert hat und zeitunabhängig ist, und folglich auch, dass q̇f +1 in (2.63) stets durch das rechte Glied von (2.62) zu ersetzen ist. Um zu zeigen, dass die Lagrange-Funktion L(f ) in (2.63) die korrekte Bewegungsgleichung für qφ (t) erzeugt, betrachten wir die mit L(f ) verknüpfte Wirkung: (q ,t ) S(q12,t12) [q] Zt2 dt L(f ) (q, q̇, t; pf +1 ) . = t1 Für die physikalische Bahn qφ muss unbedingt δS = 0 gelten. Wir überprüfen, dass die in (2.63) angegebene Lagrange-Funktion L(f ) in der Tat diese Bedingung erfüllt. Der zentrale Punkt hierbei ist, dass die Zeitabhängigkeit von qf +1 (t) hierbei aufgrund von (2.62) durch Zt dt′ f (q(t′ ), q̇(t′ ), t′ ; pf +1 ) qf +1 (t) = qf +1 (t1 ) + t1 festgelegt ist und keineswegs δqf +1 (t1 ) = δqf +1 (t R 2 ) = 0 gelten muss. Aus diesem Grunde entstehen bei der Variation des Terms dt L(f +1) in der Wirkung S[q] zusätzliche Randterme, die vom zweiten Term −pf +1 q̇f +1 in (2.63) kompensiert werden müssen: Zt2 t2 dt L(f +1) (q,q̇, q̇f +1 , t) = (pf +1 δqf +1 ) δ t1 t1 + f +1 Zt2 X dt k=1 t1 ∂L(f +1) d − ∂qk dt ∂L(f +1) ∂ q̇k Zt2 t1 φ (δqk )(t) + O(ε2 ) Zt2 2 = pf +1 δ dt q̇f +1 + O(ε ) = δ t1 dt pf +1 q̇f +1 + O(ε2 ) . 73 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Hierbei wurde verwendet, dass pf +1 bei der Variation für alle betrachteten Bahnen (q(t), qf +1 (t)) gleich und zeitunabhängig ist. Es folgt nun sofort, dass für L(f ) in (2.63) in der Tat δS = 0 gilt, so dass die physikalische Bahn qφ die mit L(f ) assoziierte Lagrange-Gleichung erfüllt. Für das vorher angesprochene Zweiteilchenproblem folgt z. B. L(1) (x, ẋ, t) = L(2) (x, ẋ, ϕ, ϕ̇, t) − pϕ ϕ̇ 1 = µ(ẋ2 + x2 ϕ̇2 ) − V (x) − µx2 ϕ̇2 2 |L|2 1 = µẋ2 − Vf (x) , Vf (x) = V (x) + 2 2µx2 , |L| wobei ϕ̇ = µx 2 verwendet wurde. Bisher haben wir nur den Fall betrachtet, dass die Lagrange-Funktion eine einzelne zyklische Koordinate qf +1 aufweist. Falls mehrere zyklische Variablen qz ≡ (qf +1 , qf +2 , . . . , qf +n ) vorliegen, L(f +n) = L(f +n) (q, q̇, q̇z , t) , sind alle Komponenten des assoziierten Impulses pz = (pf +1 , pf +2 , . . . , pf +n ) erhalten: pz = ∂L(f +n) (q, q̇, q̇z , t) bzw. q̇z = f (q, q̇, t; pz ) . ∂ q̇z (2.64) Die gleichen Argumente wie vorher zeigen nun, dass die Lagrange-Funktion nach der Elimination aller qz -Variablen die Form L(f ) (q, q̇, t; pz ) ≡ L(f +n) (q, q̇, q̇z , t) − pz · q̇z (2.65) hat, wobei q̇z durch die Funktion f (q, q̇, t; pz ) in (2.64) zu ersetzen ist und der Impuls pz für alle betrachteten Bahnen den gleichen Wert hat und zeitunabhängig ist. Die Lagrange-Funktion nach der Elimination der zyklischen qz -Variablen, also L(f ) in (2.65), wird üblicherweise als die Routh-Funktion bezeichnet.9 2.11 Das Noether-Theorem In Abschnitt [2.10] konnten wir einige wichtige Erhaltungsgrößen identifizieren, deren Existenz darauf beruhte, dass entweder die Zeitvariable t oder eine der verallgemeinerten Koordinaten qk zyklisch ist, so dass die Lagrange-Funktion eine Invarianz unter Translationen der Form t′ = t + α bzw. qk′ = qk + α (α ∈ R) 9 Bei der Behandlung der Hamilton-Mechanik werden wir sehen, dass die Elimination der verallgemeinerten Geschwindigkeiten q̇z zugunsten der Impulse pz , oder genauer: die Transformation von L(f +n) (q, q̇, q̇z , t) auf −L(f ) (q, q̇, t; pz ), mathematisch gesprochen eine LegendreTransformation darstellt. Die Anwendung einer solchen Transformation ist hier besonders geschickt, da die Variablen qz zyklisch und die Impulse pz somit erhalten sind. 74 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS aufweist. Wir versuchen nun, einen allgemeineren Zusammenhang zwischen Invarianzen der Lagrange-Funktion und Erhaltungsgrößen herzustellen und betrachten hierzu allgemein Punkttransformationen der Form t′ = t′ (t; α) , q′ = q′ (q, t; α) , (2.66) die von einem kontinuierlich variierbaren Parameter α abhängig sind. Der Parameter α kann hierbei ein- oder mehrdimensional sein. Die Umkehrung von (2.66) ist: t = t(t′ ; α) , q = q(q′ , t′ ; α) . Wir nehmen im Folgenden an, dass der Parameterwert α = 0 der Identität entspricht: t′ (t; 0) = t t(t′ ; 0) = t′ , q′ (q, t; 0) = q , q(q′ , t′ ; 0) = q′ , so dass die Raum-Zeit-Koordinaten für kleine Parameterwerte nur geringfügig abgeändert werden: (q′ , t′ ) = (q, t) + O(|α|). Wir definieren nun die neue Lagrange-Funktion L′ (q′ , q̇′ , t′ ) durch L(q, q̇, t)dt ≡ L′ (q′ , q̇′ , t′ ; α)dt′ , q̇′ ≡ dq′ dt′ (2.67) , d. h. explizit: dt L′ (q′ , q̇′ , t′ ; α) = L q(q′ , t′ ; α), q̇(q′ , q̇′ , t′ ; α), t(t′ ; α) (t′ ; α) . dt′ Die Forminvarianz der Bewegungsgleichung ist – wie wir wissen – gewährleistet, falls eine Beziehung der Form dλ ′ ′ (q , t ; α) (2.68) dt′ zwischen der „neuen“ und der „alten“ Lagrange-Funktion und somit eine Beziehung der Form L′ (q′ , q̇′ , t′ ; α) = L(q′ , q̇′ , t′ ) + t′2 S ′ [q′ ] = S[q′ ] + λ(q′ , t′ ; α) t′1 zwischen der neuen und der alten Wirkung vorliegt: Wir wissen ja, dass die Addition einer vollständigen Zeitableitung zur Lagrange-Funktion die Bewegungsgleichung invariant lässt. Damit α = 0 der Identität entspricht, muss λ(q′ , t′ ; 0) = 0 gelten. Kombination von (2.67) und (2.68) liefert nun: L(q, q̇, t)dt = L(q′ , q̇′ , t′ )dt′ + (dλ)(q′ , t′ ; α) . (2.69) Wir nehmen im Folgenden an, dass die Transformation (2.66) die Bewegungsgleichung invariant lässt, so dass (2.69) gilt, und untersuchen die entsprechenden Konsequenzen. Der Einfachheit halber führen wir die Notation (q′ , t′ ) = Tα (q, t) ein, die die Wirkung des Operators Tα definiert, und wir schreiben α = αα̂. Wir beschränken uns im Folgenden auf Transformationen, die eine 1-Parameter-Gruppe bilden: T(α1 +α2 )α̂ = Tα1 α̂ Tα2 α̂ (α̂ fest, α1,2 ∈ R) . 75 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Da eine beliebige Transformation Tα in diesem Fall aus Transformationen Tα/N aufgebaut werden kann, die für N → ∞ nur geringfügig von der Identität abweichen: Tα = (Tα/N )N (N = 1, 2, . . .) , reicht es aus, die Wirkung von Tα für |α| → 0 zu untersuchen. Man kann sich diese Wirkung im Limes |α| → 0 beschaffen, indem man die interessierenden physikalischen Größen bis zur linearen Ordnung in α um α = 0 entwickelt. Um den linearen Beitrag zu einer physikalischen Größe anzugeben, führen wir die Notation „D“ ein. Zum Beispiel gilt t′ = t′ (t; α) = t + Dt + O(α2 ) , Dt ≡ ∂t′ (t; 0) · α ∂α und q′ = q′ (q, t; α) = q + Dq + O(α2 ) , und daher Á Dq ≡ ∂q′ (q, t; 0) · α ∂α Á dt′ d d 1 + (Dt) + O(α2 ) = q̇ + (Dq) dt dt dt d d = q̇ + Dq̇ + O(α2 ) , Dq̇ ≡ (Dq) − q̇ (Dt) . dt dt dq′ dq′ = ′ dt dt q̇′ = (2.70) Außerdem gilt λ(q′ , t′ ; α) = (Dλ)(q, t) + O(α2 ) , (Dλ)(q, t) ≡ ∂λ (q, t; 0) · α . ∂α Für das Differential dt benötigen wir noch die Beziehung dt′ = dt+D(dt)+O(α2 ) mit D(dt) ≡ ∂ 2 t′ (t; 0) · αdt = d(Dt) ∂t∂α . Einsetzen dieser Beziehungen in (2.69) liefert nun: 0 = L(q + Dq, q̇ + Dq̇, t + Dt)d(t + Dt) − L(q, q̇, t)dt + d [(Dλ)(q, t)] ∂L ∂L = (q, q̇, t) · Dq + (q, q̇, t) · Dq̇ ∂q ∂ q̇ ∂L + (q, q̇, t)Dt dt + L(q, q̇, t)d(Dt) + d [(Dλ)(q, t)] ∂t und daher: 0= ∂L d(Dq) ∂L d(Dt) d(Dλ) ∂L · Dq + · + Dt − J + ∂q ∂ q̇ dt ∂t dt dt . (2.71) Hierbei wurden (2.70) und die Definition J ≡ q̇ · ∂L ∂ q̇ − L des Jacobi-Integrals verwendet. Die Lagrange-Funktion muss also für eine bestimmte Funktion λ die 76 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Bedingungsgleichung (2.71) erfüllen, damit Forminvarianz der Bewegungsgleichung vorliegen kann. Wir betrachten Gleichung (2.71) nun speziell für die physikalische Bahn qφ (t). In diesem Fall gilt ∂L ∂q = φ d dt ∂L ∂ q̇ , φ dJφ ∂L =− dt ∂t , φ so dass (2.71) auch in der Form 0= d dt ∂L · Dq − JDt + Dλ ∂ q̇ (2.72) φ darstellbar ist. Wir haben hiermit ein sehr wichtiges Ergebnis erhalten: Falls eine Transformation durchgeführt wird, die die Bewegungsgleichung invariant lässt und somit die Bedingungsgleichung (2.71) erfüllt, ist ∂L · Dq − JDt + Dλ ∂ q̇ = konstant (2.73) φ eine Erhaltungsgröße! Dieser Zusammenhang zwischen kontinuierlichen Symmetrien der Lagrange-Funktion und Erhaltungsgrößen ist als das Noether-Theorem bekannt. Wir diskutieren im Folgenden einige Beispiele. Zeittranslation Zeittranslationen der Form t′ = t + α mit α ∈ R bilden eine 1-Parameterd Gruppe. Es folgt Dt = α, Dq = 0 und daher auch dt (Dq) = 0. Wir zeigen, dass sich auch unter der Annahme Dλ = 0 eine nicht-triviale Erhaltungsgröße finden lässt: Die Bedingungsgleichung (2.71), die die Invarianz der Bewegungsgleichung gewährleisten soll, vereinfacht sich in diesem Fall auf ∂L ∂t = 0. Nur wenn die Lagrange-Funktion nicht explizit zeitabhängig ist, liegt also eine Invarianz vor. Die assoziierte Erhaltungsgröße folgt aus (2.72) als Jφ , d. h. (falls auch die Zwangsbedingungen zeitunabhängig sind) als die Energie. Die Tatsache, dass Jφ eine Erhaltungsgröße darstellt, falls die Zeitvariable zyklisch ist, ist natürlich schon aus Abschnitt [2.10] bekannt. Translationen im Konfigurationsraum Wir betrachten nun Translationen der Form q′ = q + α, wobei α = αα̂ ein f -dimensionaler Vektor im Konfigurationsraum ist und α̂ zunächst festgehalten wird. Wir suchen wiederum Erhaltungsgrößen für Dλ = 0. Es gilt Dt = 0, d (Dq) = 0, so dass sich die Bedingungsgleichung (2.71) Dq = αα̂ und daher dt ∂L auf ∂q · α̂ = 0 reduziert; die entsprechende Erhaltungsgröße ist dann ∂L ∂ q̇ · α̂. Wiederum reproduzieren wir also ein bereits aus Abschnitt [2.10] bekanntes Ergebnis: Falls eine der verallgemeinerten Koordinaten zyklisch ist, ist der assoziierte verallgemeinerte Impuls erhalten. Für den Spezialfall, dass ∂L ∂q · α̂ = 0 für mehrere oder gar alle Einheitsvektoren α̂ gilt, folgt, dass mehrere oder gar alle Komponenten des verallgemeinerten Impulses ∂L ∂ q̇ erhalten sind. 77 -------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS Drehungen im Ortsraum Für Drehungen gilt R(α)xi = xi + α × xi + O(α2 ), s. Gleichung (2.18) des Theorie-1-Skripts, so dass unter der Annahme Dλ = 0 nun Dxi = α × xi , d dt (Dxi ) = α × ẋi und Dt = 0 folgt. Die Bedingungsgleichung (2.71) für die Existenz einer Invarianz lautet nun: 0 = α̂ · X xi × i ∂L ∂L + ẋi × ∂xi ∂ ẋi , und die assoziierte Erhaltungsgröße ist diePentsprechende Komponente des verallgemeinerten Gesamtdrehimpulses L = i xi × pi mit pi ≡ ∂∂L ẋi : X ∂L i ∂ ẋi · (α̂ × xi ) = α̂ · X i ∂L xi × ∂ ẋi ! = α̂ · L = konstant . Dies ergänzt einige Resultate für den Gesamtdrehimpuls aus Kapitel 3 und 4 des Theorie-1-Skripts. Geschwindigkeitstransformationen Betrachten wir schließlich den letzten Baustein der allgemeinen Galilei-Transformation, die Geschwindigkeitstransformation x′i = xi − vt, wobei die Geschwindigkeit v die Rolle des Parameters α aus dem allgemeinen Formalismus spielt und daher vorübergehend mit α bezeichnet wird: x′i = xi − αt. Es folgt d (Dxi ) = −α und Dt = 0. Wir konzentrieren uns auf abgeschlosDxi = −αt, dt sene mechanische Systeme, die also invariant P ∂L unter Translationen der Form x′i = xi − ξ sind und die Eigenschaft i ∂xi = 0 besitzen. In diesem Fall vereinfacht sich die Bedingungsgleichung (2.71) auf 0 = (−α) · X ∂L i d(Dλ) d + = ∂ ẋi dt dt Dλ − α · X ! mi xi , i so dass Dλ nun ungleich Null ist und in einfacher Weise mit dem Massenschwerpunkt zusammenhängt: Dλ = α · M xM (t). Die assoziierte Erhaltungsgröße folgt nun aus (2.72) als Dλ − αt · X ∂L i ∂ ẋi = M α · xM (t) − 1 P(t)t = konstant , M (2.74) wobei für translationsinvariante Systeme natürlich auch der Gesamtimpuls erhalten ist: P(t) = P(0). Da (2.74) für abgeschlossene mechanische Systeme für alle Geschwindigkeitsrichtungen α̂ gelten soll, folgt: xM (t) − 1 P(t) · t = konstant . M Dass es in abgeschlossenen Systemen generell mindestens zwei Erhaltungsgrößen 1 gibt, P(t) und xM (t) − M P(t)t, konnten wir auch bereits in § 3.1 des Theorie1-Skripts feststellen. 78 Kapitel 3 Hamilton-Formalismus Die Behandlung des Lagrange-Formalismus im vorigen Kapitel hat gezeigt, dass man die Dynamik komplizierter wechselwirkender Vielteilchensysteme in äußeren Kraftfeldern auch dann, wenn diese Systeme Zwangsbedingungen unterworfen sind, vollständig mit Hilfe einer einzelnen skalaren Funktion L(q, q̇, t), der Lagrange-Funktion, beschreiben kann. Für nahezu alle praktischen Zwecke ist die Lagrange-Theorie völlig ausreichend und wegen ihrer einfachen Struktur und ihrer direkteren Verbindung mit der Newton’schen Theorie dem in diesem Kapitel zu behandelnden (und grundsätzlich äquivalenten) Hamilton-Formalismus vorzuziehen. Wie bereits in der Einführung zu Kapitel 1 erklärt wurde, gibt es dennoch gute Gründe für die Behandlung der Hamilton’schen Formulierung der Klassischen Mechanik: Die Hamilton-Theorie ist hochelegant und gibt die tiefsten Einblicke in die Struktur der Klassischen Mechanik. Für bestimmte, historisch sehr wichtige Anwendungen, insbesondere für die Durchführung der Störungstheorie in der Himmelsmechanik, ist die Hamilton’sche Formulierung besser geeignet als die Lagrange-Theorie. Die Hamilton-Theorie ist auch ein besserer Startpunkt für formale (mathematische) Untersuchungen. Die Struktur der Hamilton’schen Bewegungsgleichungen ist invariant unter einer weitaus größeren Klasse von Transformationen als diejenige der Lagrange-Gleichungen. Dementsprechend ist der Hamilton-Formalismus ein besserer Startpunkt für die Transformationstheorie, die bezweckt, die Bewegungsgleichungen mittels geeigneter Transformationen möglichst stark zu vereinfachen. Und selbstverständlich ist auch sehr wichtig, dass die Hamilton-Theorie die Basis für die theoretische Beschreibung der Quantenmechanik liefert, nicht nur im nicht-relativistischen Fall, der mit Hilfe der Schrödinger-Gleichung beschrieben wird, sondern auch bei der Formulierung der Klein-Gordon- und Dirac-Gleichungen in der relativistischen Theorie. Zur Motivation für die Entwicklung eines neuen Formalismus zunächst Folgendes: Die Lagrange-Theorie (der zweiten Art) hat ganz allgemein gezeigt, dass das Jacobi-Integral J(q, q̇, t) = ∂L · q̇ − L ∂ q̇ (3.1) für Systeme, deren Lagrange-Funktion nicht explizit von der Zeitvariablen abhängt, eine Erhaltungsgröße darstellt und (falls auch die Zwangsbedingungen und die Transformationsvorschrift xi (q) zeitunabhängig sind) als die Energie ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS interpretiert werden kann. Außerdem haben wir gelernt, dass der verallgemeinerte Impuls pk (q, q̇, t) ≡ ∂L (q, q̇, t) ∂ q̇k (3.2) eine Erhaltungsgröße ist, falls L nicht explizit von der Koordinate qk abhängt. Aus diesen Gründen spielen die physikalischen Größen J und p ≡ (p1 , p2 , . . . , pf ) auch dann eine prominente Rolle im Lagrange-Formalismus, wenn sie nicht exakt erhalten sind. Man könnte sich daher fragen, ob es nicht hilfreich wäre, die Lagrange-Funktion L durch J in (3.1) und die verallgemeinerte Geschwindigkeit q̇ durch p in (3.2) zu ersetzen. Dies würde u.a. erfordern, die Geschwindigkeit q̇ durch Inversion der Beziehung (3.2) zu bestimmen: q̇ = q̇(q, p, t) und diese in (3.1) einzusetzen. Man erhält in dieser Weise eine Funktion H(q, p, t), die von den verallgemeinerten Koordinaten, verallgemeinerten Impulsen und von der Zeit abhängig ist. Hierbei sind nun (q, p, t) als unabhängige Variablen anzusehen: H(q, p, t) ≡ J(q, q̇(q, p, t), t) . (3.3) Eine solche Beschreibung mit Hilfe einer Funktion H(q, p, t) hätte mindestens dann Vorteile, wenn die Energie oder eine Komponente des verallgemeinerten Impulses eines Systems erhalten ist. Wir werden im Laufe dieses Kapitels sehen, dass die Idee, von L auf H zu transformieren, auch in vielerlei anderer Hinsicht äußerst fruchtbar ist. Die Funktion H(q, p, t) bildet die Basis der HamiltonTheorie und wird als die Hamilton-Funktion bezeichnet. Bevor wir uns im Detail mit den physikalischen Eigenschaften der HamiltonFunktion und mit der Herleitung entsprechender Bewegungsgleichungen befassen, untersuchen wir zunächst die mathematischen Eigenschaften der Transformation, die durch die Gleichungen (3.1) - (3.3) beschrieben wird und von L(q, q̇, t) auf H(q, p, t) führt. Eine solche Transformation wird als LegendreTransformation bezeichnet; sie findet in nahezu allen Bereichen der Physik wichtige Anwendungen. Legendre-Transformationen verknüpfen zum Beispiel die verschiedenen thermodynamischen Potentiale (wie die Freie Energie und die Entropie) in der Thermodynamik und der Statistischen Physik. Außerdem sind Legendre-Transformationen von großer Bedeutung in klassischen Feldtheorien und auch in der Quantenfeldtheorie. Feldtheorien können gewissermaßen als Verallgemeinerung der Klassischen Mechanik angesehen werden: Während Teilchensysteme in der Klassischen Mechanik durch endlich viele Freiheitsgrade und durch Lagrange- und Hamilton-Funktionen charakterisiert sind, besitzt ein Feld ein Kontinuum von Freiheitsgraden und wird durch Lagrange- und HamiltonDichten beschrieben. Hierbei sind die Lagrange- und die Hamilton-Variante in beiden Theorien durch Legendre-Transformationen miteinander verknüpft. 3.1 Die Legendre-Transformation Wir betrachten zuerst die Legendre-Transformation einer Funktion F (u) einer eindimensionalen reellen Variablen u ∈ R, die in ihrem Definitionsbereich zweimal differenzierbar ist und eine streng positive zweite Ableitung hat: F ′′ (u) > 0. 80 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS Wir werden solche Funktionen als strikt konvex bezeichnen.1 Die strikte Konvexität von F (u) wird im Folgenden wesentlich sein.2 Bevor wir die Legendre-Transformierte G(v) von F (u) definieren, führen wir zunächst die Hilfsfunktion Ü u) ≡ vu − F (u) G(v, (3.4) ein, die (neben u) auch noch von einer zweiten Variablen v abhängig ist. Als Ü u) strikt konkav: Funktion von u ist die Hilfsfunktion G(v, Ü ∂ 2G = −F ′′ (u) < 0 ∂u2 , so dass sie für den Wert v der neuen Variablen entweder kein Maximum oder ein eindeutiges Maximum bei um (v) besitzt, wobei um (v) durch 0= Ü ∂G (v, um (v)) = v − F ′ (um (v)) ∂u (3.5) bestimmt wird. Wir betrachten im Folgenden nur solche v-Werte, für die ein eindeutiges Maximum um (v) existiert. Das Maximum um (v) steigt streng monoton an als Funktion von v, denn aus (3.5) folgt durch Ableiten: u′m (v) = [F ′′ (um (v))]−1 > 0. Die Legendre-Transformierte G(v) von F (u) wird nun durch Ü um (v)) G(v) ≡ G(v, , d. h. durch Einsetzen von um (v) in (3.4) definiert. Wir diskutieren einige Eigenschaften der Legendre-Transformierten G(v) von 1 Es ist vielleicht interessant, darauf hinzuweisen, dass die in der Mathematik verwendete Definition der strikten Konvexität geringfügig allgemeiner ist; sie lautet: F (λu1 + (1 − λ)u2 ) < λF (u1 ) + (1 − λ)F (u2 ) (0 < λ < 1) . Diese Definition ist insofern allgemeiner, als nicht gefordert wird, dass F (u) zweimal differenzierbar ist. Außerdem gibt es Funktionen, wie z.B. F (u) = u4 (u ∈ R), die nach der mathematischen Definition strikt konvex sind und das Kriterium F ′′ (u) > 0 für einzelne uWerte (im Beispiel: für u = 0) verletzen. Umgekehrt zeigt man leicht, dass das Kriterium F ′′ (u) > 0 die obige Ungleichung impliziert, so dass unsere „strikt konvexen“ Funktionen auch nach der mathematischen Definition strikt konvex sind. 2 Natürlich darf F (u) auch strikt konkav sein, so dass im Definitionsbereich der Funktion F nun F ′′ (u) < 0 gilt, da in diesem Fall −F (u) strikt konvex ist. Genauer formuliert: Mit Hilfe der Definitionen F̄ (u) ≡ −F (u) , Ḡ(v) ≡ −G(−v) , v̄ ≡ −v , ūm (v̄) ≡ um (v) kann man die Bestimmungsgleichungen G(v) = vum (v) − F (um (v)) und v = F ′ (um (v)) auch als Legendre-Transformation der strikt konvexen Funktion F̄ (u) darstellen: Ḡ(v̄) = v̄ ūm (v̄) − F̄ (ūm (v̄)) , v̄ = F̄ ′ (ūm (v̄)) . Wir werden uns im Folgenden überwiegend mit strikt konvexen und eher weniger mit konkaven Funktionen befassen. 81 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS Ü G(v, u) G(v) vu F (u) u Abbildung 3.1: Konstruktion der Legendre-Transformierten G(v) von F (u) . F (u): Die Funktion G(v) ist ebenfalls strikt konvex; dies folgt aus d2 [vum (v) − F (um (v))] dv 2 d {um (v) + [v − F ′ (um (v))] u′m (v)} = dv = u′m (v) > 0 . G′′ (v) = Außerdem ist die Legendre-Transformierte von G wiederum durch F gegeben; aus diesem Grund heißen F und G „dual“ und wird die Legendre-Transformation auch als „Dualitätstransformation“ bezeichnet. Um die Legendre-Transformierte von G zu bestimmen, definieren wir zunächst die Hilfsfunktion Ü(u, v) ≡ uv − G(v) = uv − [vum (v) − F (um (v))] F . Ü strikt konkav als Funktion von v und hat daher Da G strikt konvex ist, ist F ′ entweder kein Maximum oder ein eindeutiges Maximum vm (u) mit vm (u) > 0, das durch 0= Ü ∂F (u, vm (u)) = u − G′ (vm (u)) = u − um (vm (u)) ∂v bestimmt wird. Wir stellen fest, dass vm durch Inversion aus um folgt und um−1 gekehrt: vm = u−1 m bzw. um = vm . Die Legendre-Transformierte von G(v) ist daher durch Ü(u, vm (u)) = vm (u) [u − um (vm (u))] + F (um (vm (u))) = F (u) F ∗ (u) ≡ F gegeben, so dass F ∗ = F gilt und F und G in der Tat dual sind. Als letzte Eigenschaft der Legendre-Transformierten G(v) sei die Young’sche Ungleichung erwähnt: vu ≤ F (u) + G(v) , (3.6) 82 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS Ü u) ihr globales Maximum als die sofort daraus folgt, dass die Hilfsfunktion G(v, Funktion von u für u = um (v) annimmt: Ü u) ≤ G(v, Ü um (v)) = G(v) vu − F (u) = G(v, . Wir werden im Folgenden einige Beispiele von Legendre-Transformationen behandeln. Als erstes Beispiel betrachten wir die (strikt konvexe) Funktion F (u) = 1 2 Ü u) = vu − 1 u2 hat ihr Maximum als u . Die entsprechende Hilfsfunktion G(v, 2 2 Funktion von u bei u = um (v) = v, so dass die Legendre-Transformierte G von F durch G(v) = vum (v) − 1 2 [um (v)]2 = v 2 − 21 v 2 = 21 v 2 gegeben ist. Wir stellen fest, dass G und F in diesem Fall dieselbe funktionale Form haben, so dass diese Funktionen selbstdual sind. Die Gültigkeit der Young’schen Ungleichung, uv ≤ 21 (u2 + v 2 ) bzw. 0 ≤ 21 (u − v)2 , ist in diesem Fall leicht nachvollziehbar. Als zweites Beispiel betrachten wir die Funktion F (u) = p1 up mit u > 0, p ∈ R und p > 1, die ebenfalls strikt konvex Ü u) = vu − 1 up und daher um (v) = v 1/(p−1) . Definieren wir nun ist. Es folgt G(v, p p die reelle Zahl q ∈ R durch q ≡ p−1 > 1, so ist die Legendre-Transformierte G von F durch p 1 1 1 p−1 1 v = v q (v > 0) G(v) = vum (v) − F (um (v)) = v 1+ p−1 − p q gegeben, und die Young’sche Ungleichung: uv ≤ 1 p 1 q u + v p q (p, q > 1 , 1 1 + = 1) p q ist in diesem Fall weitaus weniger trivial. 3.1.1 Funktionen mehrerer Variabler Auch bei der Legendre-Transformation von Funktionen F (u), die von mehreren Variablen u = (u1 , u2 , . . . , un ) abhängig sind, müssen wir strikte Konvexität fordern.3 Für mindestens zweimal differenzierbare Funktionen F (u) bedeutet dies nun, dass die Matrix der zweiten Ableitungen von F positiv definit ist, d. h. dass für alle Vektoren h 6= 0: hT ∂2F (u) h > 0 ∂u2 Ü u) ein: gilt.4 Wir führen die Hilfsfunktion G(v, Ü u) ≡ v · u − F (u) , G(v, 3 Selbstverständlich darf die Funktion F (u) auch strikt konkav sein, aber konkave Funktionen sind für uns zunächst weniger relevant. 4 Die in der konvexen Analysis übliche, geringfügig allgemeinere Definition lautet für Funktionen mehrerer Variablen: F (λu1 + (1 − λ)u2 ) < λF (u1 ) + (1 − λ)F (u2 ) (0 < λ < 1) . Es ist wiederum sehr einfach, zu zeigen, dass unsere Definition diese Ungleichung impliziert. 83 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS die strikt konkav als Funktion von u ist und deshalb als Funktion von u entweder kein Maximum oder ein eindeutiges Maximum um (v) hat, das im letzteren Fall durch 0= Ü ∂F ∂G (v, um (v)) = v − (um (v)) ∂u ∂u (3.7) definiert ist. Wir fügen zwei Bemerkungen hinzu: Erstens folgt durch Ableiten m von (3.7) bezüglich v, dass die Matrix ∂u ∂v (v) positiv definit ist: −1 ∂um ∂2F (um (v)) (v) = ∂v ∂u2 , 2 da ∂∂uF2 positiv definit ist. Zweitens zeigt man leicht, dass die Lösung um (v) von (3.7), falls sie existiert, eindeutig ist, denn die Annahme zweier unterschiedlicher Lösungen u1 und u2 mit u2 − u1 ≡ u21 6= 0 führt sofort zu einem Widerspruch: 0= ∂F ∂u (u2 ) − Z1 dλ = 0 uT 21 ∂2F ∂u2 ∂F ∂u (u1 ) · u21 = Zu2 u1 du · ∂2F ∂u2 (u) u21 (u1 + λu21 ) u21 > 0 . Hierbei wurde der Integrationsweg von u1 nach u2 durch u = u1 + λu21 parametrisiert. Die Legendre-Transformierte G von F folgt nun als Ü um (v)) = v · um (v) − F (um (v)) G(v) ≡ G(v, , 2 und zweifache Ableitung nach v zeigt nun, dass ∂∂vG2 positiv definit und G selbst somit strikt konvex ist. Zur Berechnung der Legendre-Transformierten von G benötigen wir zuerst wiederum die Hilfsfunktion Ü(u, v) ≡ u · v − G(v) = u · v − [v · um (v) − F (um (v))] F , die strikt konkav ist als Funktion von v und (falls dieses existiert) ein eindeutiges Maximum hat für v = vm (u) mit 0= Ü ∂F ∂G (u, vm (u)) = u − (vm (u)) = u − um (vm (u)) ∂v ∂v . −1 Es folgt daher wiederum, dass vm = u−1 m bzw. um = vm gilt. Die LegendreTransformierte von G ist nun: Ü(u, vm (u)) = vm (u)·[u − um (vm (u))] + F (um (vm (u))) = F (u) , F ∗ (u) = F so dass F und G auch im mehrdimensionalen Fall dual sind: F ∗ = F . Die Young’sche Ungleichung folgt aus Ü u) ≤ G(v, Ü um (v)) = G(v) v · u − F (u) = G(v, 84 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS als v · u ≤ F (u) + G(v) . Wir beschränken uns auf ein einzelnes Beispiel: Die Legendre-Transformierte von F (u) = 21 u2 ist G(v) = 21 v2 , so dass die Funktion F (u) = 12 u2 auch für u ∈ Rn selbstdual ist; die Young’sche Ungleichung ist in diesem Fall durch u · v ≤ 12 (u2 + v2 ) gegeben. 3.1.2 Funktionen mit zusätzlichen „Dummy“-Variablen Als nächste Stufe der Verallgemeinerung betrachten wir Funktionen F (u, w), die von mehreren Variablen u ≡ (u1 , u2 , . . . , un ) und w ≡ (w1 , w2 , . . . , wn′ ) abhängig sind und nur bezüglich der u-Variablen Legendre-transformiert werden. Diese Verallgemeinerung ist physikalisch äußerst relevant, da wir im Folgenden Legendre-Transformationen bezüglich der Geschwindigkeiten q̇, jedoch nicht bezüglich der Koordinaten q und der Zeit t durchführen werden. Für Funktionen F (u, w), die nur bezüglich der Variablen u Legendre-transformiert werden, können wir grundsätzlich alle Ergebnisse von Abschnitt [3.1.1] Ü u) durch G(v, Ü u, w), um (v) übernehmen, falls F (u) überall durch F (u, w), G(v, durch um (v, w), G(v) durch G(v, w) und vm (u) durch vm (u, w) ersetzt wird. Insbesondere gilt also: v= ∂F (um (v, w), w) ∂u G(v, w) = v · um (v, w) − F (um (v, w), w) , . Im Folgenden sind u. a. die Ableitungen und Differentiale von G(v, w) relevant. Für die partiellen Ableitungen von G bezüglich v und w erhält man T ∂G ∂um (v, w) = um (v, w) + (v, w) ∂v ∂v v− ∂F (um (v, w), w) = um (v, w) ∂u bzw. T ∂um ∂F ∂F ∂G v− (v, w) = (v, w) (um (v, w), w) − (um (v, w), w) ∂w ∂w ∂u ∂w ∂F (um (v, w), w) . =− ∂w Es folgt für das Differential dG: dG = um (v, w) · dv − ∂F (um (v, w), w) · dw ∂w , (3.8) und umgekehrt gilt natürlich auch: dF = vm (u, w) · du − für das Differential dF . ∂G (vm (u, w), w) · dw ∂w (3.9) 85 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS 3.1.3 Anwendung auf die Lagrange-Funktion Wir untersuchen nun die Legendre-Transformation der Lagrange-Funktion L(q, q̇, t) bezüglich der Geschwindigkeiten q̇, wobei zu beachten ist, dass die Koordinaten q und die Zeit t bei dieser Transformation nur als Parameter auftreten und somit „Dummy“-Variablen sind. Die Legendre-Transformation bezüglich q̇ ist nur deshalb möglich, weil die Lagrange-Funktion L(q, q̇, t), wie wir aus Abschnitt [2.6.2] wissen, für alle uns interessierenden Probleme eine strikt konvexe Funktion der Geschwindigkeiten ist. Wir wenden nun die Ideen und Ergebnisse der letzten beiden Abschnitte an und führen eine neue Variable p = (p1 , p2 , . . . , pf ), den kanonisch zu q konjugierten Impuls, und eine Hilfsfunktion Ü H(q, p, q̇, t) ≡ p · q̇ − L(q, q̇, t) Ü ist strikt konkav als Funktion von q̇ und hat daher (als ein. Die Hilfsgröße H Funktion von q̇) ein eindeutiges Maximum für q̇ = q̇m (q, p, t), wobei q̇m durch 0= Ü ∂H ∂L (q, p, q̇m , t) = p − (q, q̇m , t) ∂ q̇ ∂ q̇ (3.10) definiert ist. Die Legendre-Transformierte von L(q, q̇, t) ist nun durch H(q, p, t) ≡ p · q̇m (q, p, t) − L(q, q̇m (q, p, t), t) (3.11) gegeben und wird, wie wir bereits aus der Einführung zu diesem Kapitel wissen, als die Hamilton-Funktion bezeichnet. Da die Lagrange-Funktion strikt konvex ist als Funktion von q̇, ist H strikt konvex als Funktion des kanonisch zu q konjugierten Impulses p. Auch die Rücktransformation kann daher problemlos durchgeführt werden: Die Hilfsfunktion e L(q, q̇, p, t) ≡ q̇ · p − H(q, p, t) (3.12) ist strikt konkav als Funktion von p und hat ein eindeutiges Maximum für p = pm (q, q̇, t), wobei pm durch 0= e ∂H ∂L (q, q̇, pm , t) = q̇ − (q, pm , t) ∂p ∂p definiert ist. Die Legendre-Transformierte der Hamilton-Funktion, e q̇, pm (q, q̇, t), t) L∗ (q, q̇, t) ≡ L(q, = pm · [q̇ − q̇m (q, pm , t)] + L(q, q̇m (q, pm , t), t) ist aufgrund der Beziehungen q̇ = q̇m (q, pm (q, q̇, t), t) , p = pm (q, q̇m (q, p, t), t) wieder gleich der ursprünglichen Lagrange-Funktion: L∗ (q, q̇, t) = L(q, q̇, t) , (3.13) 86 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS so dass L und H in diesem Sinne dual sind. Die Differentiale von H und L sind aufgrund von (3.8) und (3.9) wie ∂L ∂L (q, q̇m , t) · dq − (q, q̇m , t)dt ∂q ∂t ∂H ∂H dL = pm (q, q̇, t) · dq̇ − (q, pm , t) · dq − (q, pm , t)dt ∂q ∂t dH = q̇m (q, p, t) · dp − (3.14) miteinander verknüpft, und als Kuriosum sei noch die Young’sche Ungleichung erwähnt: p · q̇ ≤ L(q, q̇, t) + H(q, p, t) , die in der Physik allerdings weniger Anwendung findet. Wir fügen einige Bemerkungen hinzu. Nicht-Eindeutigkeit der Hamilton-Funktion Zuerst sei darauf hingewiesen, dass die Hamilton-Funktion eines physikalischen Systems nicht eindeutig definiert ist. Dies folgt direkt daraus, dass die LagrangeFunktion nicht eindeutig festgelegt ist, da man immer durch Addition einer vollständigen Zeitableitung eine äquivalente Lagrange-Funktion erzeugen kann: L′ = L + ∂λ ∂λ d λ(q, t) = L + (q, t) · q̇ + (q, t) dt ∂q ∂t . Ü Dies hat zur Konsequenz, dass sich auch die Hilfsfunktion H(q, p, q̇, t) ändert ′ und das Maximum dieser Hilfsfunktion sich von q̇m nach q̇m verschiebt: p= ∂L ∂λ ∂L′ (q, q̇′m , t) = (q, q̇′m , t) + (q, t) . ∂ q̇ ∂ q̇ ∂q (3.15) Hieraus folgt sofort: q̇′m (q, p, t) = q̇m (q, p − ∂λ , t) . ∂q Die neue Hamilton-Funktion folgt nun als ∂λ ∂λ ′ · q̇ − ∂q m ∂t ∂λ ∂λ (q, t) = p− · q̇′m − L(q, q̇′m , t) − ∂q ∂t ∂λ ∂λ = H(q, p − , t) − (q, t) . ∂q ∂t H ′ (q, p, t) = p · q̇′m − L′ = p · q̇′m − L − (3.16) Da die beiden Hamilton-Funktionen H und H ′ dasselbe physikalische Problem beschreiben, sind sie vollständig äquivalent. Die Hamilton-Gleichungen Als zweite Bemerkung fügen wir hinzu, dass die Koordinaten, Impulse und die Zeit (q, p, t) in der Hamilton-Funktion grundsätzlich unabhängige Variablen 87 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS sind und erst durch die Bewegungsgleichung, d. h. für die physikalische Bahn, miteinander verknüpft werden. Führen wir noch einmal den verallgemeinerten Impuls p(q, q̇, t) der Lagrange-Theorie ein: p(q, q̇, t) = ∂L (q, q̇, t) , ∂ q̇ so kann die Lagrange’sche Bewegungsgleichung für qφ (t) auch als ṗφ (t) = ∂L (qφ (t), q̇φ (t), t) ∂q , (3.17) pφ (t) ≡ p (qφ (t), q̇φ (t), t) geschrieben werden. Inversion der Beziehung pφ = dass ∂L ∂ q̇ (qφ , q̇φ , t) zeigt zunächst, (3.18) q̇φ = q̇m (qφ , pφ , t) und daher aufgrund von (3.13) auch pφ = pm (qφ , q̇φ , t) gilt. Nun wissen wir bereits aus (3.14), dass allgemein die Beziehungen ∂H ∂L (q, p, t) = − (q, q̇m , t) , ∂q ∂q ∂H (q, p, t) = q̇m (q, p, t) ∂p gelten. Insbesondere findet man daher für die physikalische Bahn: ∂L ∂H (qφ , q̇φ , t) = − (qφ , pφ , t) ∂q ∂q , q̇m (qφ , pφ , t) = ∂H (qφ , pφ , t) ∂p . Einsetzen dieser Resultate in (3.17) und (3.18) liefert nun ein sehr wichtiges Ergebnis: ṗφ = − ∂H (qφ , pφ , t) , ∂q q̇φ = ∂H (qφ , pφ , t) ∂p (3.19) oder, wie diese Gleichungen meist kurz dargestellt werden: ṗ = − ∂H ∂q , q̇ = ∂H ∂p . Der Gleichungssatz (3.19) enthält insgesamt 2f Gleichungen für die 2f Unbekannten pφ (t) und qφ (t) und ist somit für vorgegebene Anfangsbedingungen pφ (0) und qφ (0) vollständig und eindeutig lösbar. Der Satz (3.19) stellt die Bewegungsgleichungen des Systems in der Hamilton-Formulierung dar und wird somit als die Hamilton-Gleichungen bezeichnet. Sie bilden die Basis für alles Weitere in diesem Kapitel. Aus den Hamilton-Gleichungen für die physikalische Bahn folgt sofort, dass die Größe Hφ (t) ≡ H(qφ (t), pφ (t), t) erhalten ist, falls H und somit auch L nicht explizit zeitabhängig sind: d d ∂H ∂H ∂H Hφ (t) = H(qφ , pφ , t) = · q̇φ + · ṗφ + dt dt ∂q φ ∂p φ ∂t ∂H ∂H ∂H ∂H ∂H · − · + = ∂q φ ∂p φ ∂p φ ∂q φ ∂t φ ∂H ∂L =− , = ∂t φ ∂t φ φ 88 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS wobei im letzten Schritt (3.14) verwendet wurde. Da Hφ gleich dem JacobiIntegral Jφ ist: Hφ = pφ · q̇φ − Lφ = ∂L · q̇ − L ∂ q̇ (3.20) = Jφ φ und Jφ für Lagrange-Funktionen, die nicht explizit von der Zeit abhängen, gleich der Energie des Systems ist,5 kann auch Hφ mit der Energie identifiziert werden, ∂L falls ∂H ∂t = − ∂t = 0 gilt. Wie bereits in Abschnitt [2.10] gezeigt wurde, gilt umgekehrt sicherlich nicht, dass die Energie eines Systems notwendigerweise ∂L nicht erhalten ist, falls ∂H ∂t = − ∂t 6= 0 gilt. In diesem Fall kann die Energie nicht unbedingt mit Hφ bzw. Jφ identifiziert werden. Observablen und Messgrößen Gleichung (3.20) kann auch so interpretiert werden, dass die Hamilton-Funktion im Hamilton-Formalismus dem Jacobi-Integral in der Lagrange-Theorie entspricht: H(q, p, t) = J(q, q̇m (q, p, t), t) , J(q, q̇, t) = H(q, pm (q, q̇, t), t) und dass beide Größen für alle möglichen physikalischen Bahnen gleich sind: Hφ (t) = H(qφ , pφ , t) = J(qφ , q̇φ , t) = Jφ (t) . Dies ist nur ein Beispiel dafür, dass jede Messgröße A eines physikalischen Systems in der Lagrange-Theorie mit Hilfe einer Observablen AL (q, q̇, t) und im Hamilton-Formalismus mit Hilfe einer Observablen AH (q, p, t) beschrieben werden kann, wobei AL und AH gemäß AH (q, p, t) = AL (q, q̇m (q, p, t), t) , AL (q, q̇, t) = AH (q, pm (q, q̇, t), t) miteinander verknüpft sind und für alle möglichen physikalischen Bahnen den gleichen Messwert für A vorhersagen: AH (qφ , pφ , t) = AL (qφ , q̇φ , t) ≡ Aφ (t) . Analog gibt es einen einfachen Zusammenhang zwischen Observablen AL (q, q̇, t) in der Lagrange-Theorie und Observablen AN (X, Ẋ, t) in der Newton’schen Mechanik: AL (q, q̇, t) = AN (X(q, t), Ẋ(q, q̇, t), t) , denn bei einer „Messung“ liefern auch diese beiden Größen dasselbe Ergebnis: AN (Xφ , Ẋφ , t) = AL (qφ , q̇φ , t) = Aφ (t) . Betrachten wir zwei Beispiele: Für ein Teilchen der Masse m im Potential V (x) sind die Messgrößen „Impuls“, „Drehimpuls“ und „Energie“ in den verschiedenen Darstellungen durch 8 < mẋ AL,N (x, ẋ, t) = : mx × ẋ , 1 2 m ẋ + V (x) 2 8 < p AH (x, p, t) = : x×p p2 /2m + V (x) 5 Wie wir wissen, gilt dies genau genommen nur dann, wenn neben der Lagrange-Funktion auch die Zwangsbedingungen und die Transformationsvorschrift {xi (q)} nicht explizit zeitabhängig sind. 89 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS gegeben. Für ein geladenes Teilchen der Masse m und Ladung q̂ muss man den verallgemeinerten Impuls ∂L ∂ ẋ = mẋ + q̂A(x, t), der nicht eichinvariant ist, klar vom (offensichtlich eichinvarianten) kinetischen Impuls mẋ unterscheiden. Für die Messgrößen „kinetischer Impuls“, „kinetischer Drehimpuls“ und „kinetische Energie“ erhält man nun: 8 < mẋ AL,N (x, ẋ, t) = : mx × ẋ , 1 2 2 mẋ AH (x, p, t) = 8 < p − q̂A(x, t) : x × (p − q̂A) 1 2 2m (p − q̂A) , und alle diese Observablen sind eichinvariant. Forminvarianz der Hamilton-Gleichungen? Wir konnten vorher feststellen, dass die Hamilton-Funktion, ähnlich wie die Lagrange-Funktion, nicht eindeutig definiert ist, da sie unter Addition einer vollständigen Zeitableitung zu L ihre Form ändert. Einerseits ist daher klar, dass auch die Hamilton-Gleichungen für (qφ , pφ ) ihre Form ändern werden, andererseits ist ebenso offensichtlich, dass die Lösung qφ (t), eine Messgröße, unter einer solchen Transformation invariant sein muss. Wir vergleichen die Bewegungsgleichungen vor und nach der Transformation: Vor der Transformation werde das System durch die Hamilton-Funktion H(q, p, t) beschrieben; die entsprechenden Hamilton-Gleichungen q̇φ = ∂H (qφ , pφ , t) , ∂p ṗφ = − ∂H (qφ , pφ , t) ∂q (3.21) sind unter Berücksichtigung der Anfangsbedingungen qφ (0) ≡ q0 und d pφ (0) ≡ p0 zu lösen. Durch Addition einer vollständigen Zeitableitung dt λ(q, t) zu L ändert sich der Impuls gemäß (3.15), so dass nach der Transformation p′φ (t) = ∂λ ∂λ ∂L (qφ , q̇φ , t) + (qφ , t) = pφ (t) + (qφ , t) ∂ q̇ ∂q ∂q (3.22) gilt. Die Hamilton-Gleichungen nach der Transformation folgen aus (3.16) als ∂H ∂λ (qφ , t), t qφ , p′φ − ∂p ∂q ∂H ∂λ d ∂λ (qφ , t), t + (qφ , t) , ṗ′φ = − qφ , p′φ − ∂q ∂q dt ∂q q̇φ = (3.23) die mit den Anfangsbedingungen qφ (0) = q0 , p′φ (0) = p0 + ∂λ (q0 , 0) ∂q zu lösen sind. In der Tat sind die Hamilton-Gleichungen selbst also nicht forminvariant; man sieht jedoch auch sofort, dass sich (3.23) auf (3.21) reduziert, wenn die Relation (3.22) verwendet wird, d. h. wenn p′φ − ∂λ ∂q in (3.23) durch pφ ersetzt wird. Die Lösung qφ (t) ist daher unabhängig von der Wahl der Funktion λ(q, t), wie es natürlich auch sein sollte. 90 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS 3.2 Beispiele für die Wirkung des HamiltonFormalismus Um die Wirkung der Hamilton-Theorie zu illustrieren, behandeln wir nun einige Beispiele. Wir diskutieren insbesondere Systeme mit konservativen (oder allgemeiner: wirbelfreien) Kräften und Systeme unter der Einwirkung elektromagnetischer Kräfte. Als spezielle Anwendung betrachten wir noch einmal das Problem der kleinen Schwingungen. 3.2.1 Geschwindigkeitsunabhängige Kräfte Wir behandeln zuerst Systeme mit konservativen oder wirbelfreien Kräften, die also durch ein Potential V (q, t) und eine Lagrange-Funktion der Form (3.24) L(q, q̇, t) = T (q, q̇, t) − V (q, t) beschrieben werden können. Hierbei ist die kinetische Energie T (q, q̇, t) allgemein quadratisch als Funktion der Geschwindigkeiten: T (q, q̇, t) = 1 2 X akl (q, t)q̇k q̇l + k,l X ak (q, t)q̇k + a0 (q, t) k ≡ 21 q̇T M (q, t)q̇ + a(q, t) · q̇ + a0 (q, t) , wobei der Massentensor M (q, t) symmetrisch und positiv definit ist und T und daher auch L somit strikt konvex als Funktionen von q̇ sind. Ein wichtiger Spezialfall von (3.24) tritt auf, wenn die Zwangsbedingungen und die Transformation xi (q, t) in (2.19) und daher auch T nicht-explizit zeitabhängig sind: (3.25) L(q, q̇, t) = T (q, q̇) − V (q, t) . Wie bereits in Abschnitt [2.6] bemerkt wurde, hat T in diesem Fall die einfachere, homogen quadratische Form T (q, q̇) = 1 2 X k,l akl (q)q̇k q̇l ≡ 21 q̇T M (q)q̇ mit zeitunabhängigem Massentensor M (q). Wir betrachten im Folgenden zuerst den Spezialfall (3.25) und dann den allgemeineren Fall (3.24). Für die Legendre-Transformation der Lagrange-Funktion in (3.25) benötigen wir die Funktion q̇m (q, p), die durch (3.10) definiert wird: p= ∂L (q, q̇m , t) = M (q)q̇m ∂ q̇ , q̇m (q, p) = M (q)−1 p . Die Hamilton-Funktion folgt nun aus (3.11) als H(q, p, t) = = = = p · q̇m − L(q, q̇m , t) pT M −1 p − −1 1 p)T M (M −1 p) 2 (M pT M −1 − 21 (M −1 )T M M −1 p + V (q, t) −1 1 T p 2 p M (q) + V (q, t) − V (q, t) (3.26) 91 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS und die Hamilton-Gleichungen lauten q̇ = ∂M −1 ∂H ṗk = − = 12 pT − ∂qk ∂qk p− ∂H ∂p = M −1 p bzw. ∂V ∂M −1 ∂V p− = 12 pT M −1 M ∂qk ∂qk ∂qk . Das Ergebnis (3.26) zeigt, dass die Hamilton-Funktion auch in der Form H(q, p, t) = T (q, q̇m (q, p)) + V (q, t) darstellbar ist. Wir stellen also fest, dass eine Lagrange-Funktion der Form L = T − V auf eine Hamilton-Funktion der Form H = T + V führt, falls die kinetische Energie zeit- und das Potential geschwindigkeitsunabhängig sind. Zum Beispiel erhält man für ein einzelnes Teilchen der Masse m unter der Einwirkung wirbelfreier Kräfte, das durch die Lagrange-Funktion L(x, ẋ, t) = 21 mẋ2 − V (x, t) beschrieben wird, den einfachen Ausdruck H(x, p, t) = p2 /2m + V (x, t) für die Hamilton-Funktion und dementsprechend ∂V (x, t) ∂x für die Hamilton-Gleichungen. Ein wichtiger Spezialfall ist der (isotrope) harmonische Oszillator mit zeitunabhängigem Potential V (x) = 21 mω 2 x2 , der der folgenden Form für die Lagrange- bzw. Hamilton-Funktion entspricht: ẋ = p/m , ṗ = − L(x, ẋ) = 21 mẋ2 − 21 mω 2 x2 , H(x, p) = p2 /2m + 21 mω 2 x2 (3.27) . 2 Die Lagrange-Gleichung ẍ = −ω x ist uns aus der Theorie I gut vertraut; die Hamilton-Gleichungen lauten: ẋ = p/m , ṗ = −mω 2 x . Es ist zu beachten, dass die Hamilton-Funktion des harmonischen Oszillators eine hohe Symmetrie aufweist, da beide Terme die gleiche homogen quadratische Struktur besitzen. Diese hohe Symmetrie hat z. B. zur Konsequenz, dass das Energiespektrum des quantenmechanischen 3-dimensionalen harmonischen Oszillators eine hohe Entartung aufweist. Die Legendre-Transformation der allgemeinen geschwindigkeitsunabhängigen Lagrange-Funktion L(q, q̇, t) in (3.24) erfolgt vollkommen analog: Die Funktion q̇m (q, p, t) folgt nun aus (3.10) und (3.24) als p= ∂L (q, q̇m , t) = M (q, t)q̇m + a(q, t) ∂ q̇ , q̇m = M −1 (p − a) . Einsetzen in (3.11) liefert nun: H(q, p, t) = = p · q̇m − L(q, q̇m , t) pT M −1 (p − a) − 1 2 (p − a)T M −1 (p − a) +aT M −1 (p − a) + a0 (q, t) − V (q, t) = 1 2 (p − a)T M −1 (p − a) + [V (q, t) − a0 (q, t)] , (3.28) 92 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS ein Ergebnis, das zeigt, dass die Hamilton-Funktion für Lagrange-Funktionen der Form (3.24) im Allgemeinen gewiss nicht die Struktur H = T + V hat. Die −1 (p − a) und Hamilton-Gleichungen sind für H in (3.28) durch q̇ = ∂H ∂p = M ṗk = − ∂H ∂M −1 ∂a ∂a0 ∂V = 12 (p− a)T M −1 M (p− a)+ (p− a)T M −1 + − ∂qk ∂qk ∂qk ∂qk ∂qk gegeben. 3.2.2 Lorentz-Kräfte Für Systeme geladener Teilchen, die (zusätzlich) unter der Einwirkung äußerer elektromagnetischer Kräfte stehen, ist aus Abschnitt [2.6.2] bekannt, dass die Lagrange-Funktion die Struktur L(q, q̇, t) = T (q, q̇, t) − VG (q, q̇, t) mit VG = V + VLor , VLor (q, q̇, t) = Φ(q, t) − A(q, t) · q̇ hat, wobei A(q, t) = (A1 , A2 , . . . , Af ) eine Kurzform für die verschiedenen Komponenten Ak (q, t) des verallgemeinerten Vektorpotentials ist. Es folgt: L = T − VG = T − V − VLor = = 1 T 2 q̇ M q̇ + a · q̇ + a0 1 T 2 q̇ M q̇ + (a + A) · q̇ − V − (Φ − A · q̇) − (V − a0 + Φ) , so dass die Lagrange-Funktion genau die Form (3.24) hat, falls man dort a durch a + A und a0 durch a0 − Φ ersetzt. Mit diesen Änderungen folgt die Hamilton-Funktion direkt aus (3.28) als H(q, p, t) = 21 (p−a−A)T M −1 (p−a−A)+V (q, t)−a0 (q, t)+Φ(q, t) . (3.29) Falls nur äußere elektromagnetische Kräfte wirken, entfällt der Term V (q, t), der die inneren Kräfte und die äußeren Kräfte nicht-elektromagnetischer Natur beschreibt. Als einfaches Beispiel betrachten wir ein System N nicht-wechselwirkender Teilchen unter der Einwirkung von Lorentz-Kräften; wir beschreiben das System in kartesischen Koordinaten, so dass die kinetische Energie die Form P T = i 12 mi ẋ2i hat und das verallgemeinerte Vektorpotential durch A(q, t) = (q̂1 A(x1 , t), q̂2 A(x2 , t), . . . , q̂N A(xN , t)) gegeben ist. Außerdem hat das verallgemeinerte skalare Potential Φ(q, t) die Form Φ(q, t) = N X q̂i ΦK (xi , t) , i=1 wobei ΦK das skalare Potential in kartesischen Koordinaten bezeichnet. In diesem Fall reduziert sich (3.29) auf die Form H(X, P, t) = N § X 1 i=1 2mi 2 ª K [pi − q̂i A(xi , t)] + q̂i Φ (xi , t) 93 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS mit P = (p1 , p2 , . . . , pN ). Für ein einzelnes geladenes Teilchen im elektromagnetischen Feld erhält man also H(x, p, t) = 1 2 [p − q̂A(x, t)] + q̂ΦK (x, t) 2m . Die Kombination p − q̂A des kanonisch zu x konjugierten Impulses p und des Vektorpotentials A ist sehr allgemein: Sie tritt z. B. auch in der Quantenmechanik und der Quantenfeldtheorie auf und hat sich daher einen eigenen Namen (die „minimale Kopplung“) verdient. Um die Wirkung elektromagnetischer Felder beschreiben zu können, muss man in der Hamilton-Funktion eines Teilchens (oder quantenmechanisch: im Hamilton-Operator ) lediglich einen Potentialterm q̂ΦK (x, t) hinzufügen und den Impuls p (quantenmechanisch: den Impulsoperator ) durch p − q̂A(x, t) ersetzen. 3.3 Ein Variationsprinzip für die HamiltonGleichungen Aus den Abschnitten [2.7] und [2.8] wissen wir, dass die Lagrange-Gleichungen der zweiten bzw. ersten Art allgemein aus einem Variationsprinzip, dem „Hamilton’schen Prinzip“, hergeleitet werden können. Wir zeigen nun, dass man die Hamilton-Gleichungen (3.19) ebenfalls aus einem Wirkungsprinzip herleiten kann. Hierzu betrachten wir neben der physikalischen Bahn (qφ (t), pφ (t)) im Phasenraum auch allgemeine benachbarte Bahnen (q(t), p(t)), deren q-Werte zur Anfangs- und zur Endzeit mit denjenigen der physikalischen Bahn zusammenfallen: q(t1 ) = qφ (t1 ) ≡ q1 und q(t2 ) = qφ (t2 ) ≡ q2 . Es wird also ausdrücklich nicht gefordert, dass auch die kanonisch zu q konjugierten Impulse p zur Anfangs- und zur Endzeit für alle Bahnen gleich sind. Definieren wir also die Variationen (δq)(t) ≡ q(t) − qφ (t) ≡ εκ(t) , (δp)(t) ≡ p(t) − pφ (t) ≡ επ(t) , (3.30) so gilt κ(t1 ) = κ(t2 ) = 0, während π(t1 ) und π(t2 ) beliebig (aber endlich) sind. Als Wirkungsfunktional betrachten wir nun das Zeitintegral der in Abe schnitt [3.1.3] eingeführten Hilfsfunktion L(q, q̇, p, t): (q ,t ) Se(q12,t12) [q, p] Zt2 ≡ e (q(t), q̇(t), p(t), t) dt L t1 Zt2 = t1 dt [q̇(t) · p(t) − H(q(t), p(t), t)] , (3.31) 94 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS und wir bestimmen den stationären Punkt dieser Wirkung: 0 = 1 e (q2 ,t2 ) lim (δ S) (q1 ,t1 ) [qφ + εκ, pφ + επ] ε↓0 ε " Zt2 = dt t1 ( Zt2 = dt t1 e ∂L ∂q φ · κ(t) + e d ∂L − ∂q dt e ∂L ∂ q̇ e ∂L ∂ q̇ (3.32) φ · κ̇(t) + · κ(t) + φ e ∂L ∂p e ∂L ∂p # φ · π(t) ) φ · π(t) . Das rechte Glied kann nur dann für alle κ(t) mit κ(t1 ) = κ(t2 ) = 0 und für alle π(t) gleich Null sein, wenn die beiden Bedingungen 0= 0= e ∂L ∂q e ∂L ∂p d − dt φ φ e ∂L ∂ q̇ = q̇φ − φ =− ∂H (qφ , pφ , t) − ṗφ ∂q ∂H (qφ , pφ , t) ∂p erfüllt sind, d. h. wenn die Hamilton-Gleichungen (3.19) gelten. Hiermit ist gezeigt, dass auch die Hamilton-Gleichungen als Bedingungsgleichungen für die Existenz eines stationären Punktes eines entsprechenden Wirkungsfunktionals angesehen werden können. Die Nomenklatur in der Literatur ist nicht einheitlich: Das Wirkungsfunktional (3.31) wird manchmal als „kanonisches Integral“ und das Variationsprinzip (3.32) manchmal als „modifiziertes Hamilton’sches Prinzip“ bezeichnet. Es ist auch nicht besonders schwierig, die Lagrange- und Hamilton-Gleichungen gleichzeitig aus einem Wirkungsfunktional abzuleiten. Hierzu führen wir drei unabhängig variierbare Größen q(t), p(t) und v(t) ein, die die Koordinaten, Impulse und Geschwindigkeiten der möglichen Bahnen darstellen. Die Variationen sind nun durch (3.30) mit κ(t1 ) = κ(t2 ) = 0 und beliebigem π(t1 ) und π(t2 ) gegeben; zusätzlich definieren wir: (δv)(t) ≡ v(t) − vφ (t) ≡ εϕ(t) [ϕ(t1 ), ϕ(t2 ) beliebig] . Wir betrachten das Wirkungsfunktional Ü Ü(q2 ,t2 ) [q, p, v] ≡ S (q1 ,t1 ) Zt2 e e (q(t), p(t), v(t), q̇(t), t) dt L t1 mit e e (q, p, v, q̇, t) ≡ L(q, v, t) + p · (q̇ − v) L . Dieses Wirkungsfunktional kann auch so interpretiert werden, dass die Größe R dt L(q, v, t) mit der Zwangsbedingung v = q̇ zu variieren ist; die Impulse p(t) treten in dieser Interpretation als Lagrange-Parameter auf, die die Einhaltung dieser Zwangsbedingung gewährleisten sollen. Man erhält nun drei Bedingungs- 95 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS gleichungen für den stationären Punkt des Wirkungsfunktionals: e 0 = e ∂L = q̇ − v ∂p e (3.33a) e e ∂L ∂ q̇ 0 = e ∂L d − ∂q dt 0 = e ∂L ∂L = (q, V, t) − p , ∂V ∂ q̇ = ∂L d (q, v, t) − p ∂q dt (3.33b) e (3.33c) aus denen unmittelbar hervorgeht, dass dieser stationäre Punkt in der Tat mit der physikalischen Bahn zu identifizieren ist. Kombination von (3.33a) und (3.33c) liefert die Gleichungen pφ (t) = ∂L (qφ , q̇φ , t) , ∂ q̇ (3.34) q̇φ = q̇m (qφ , pφ , t) , mit deren Hilfe sich (3.33b) auf die Standardform der Lagrange-Gleichung reduzieren lässt: d ∂L ∂L (qφ , q̇φ , t) = ṗφ (t) = (qφ , q̇φ , t) . dt ∂ q̇ ∂q Außerdem impliziert die zweite Gleichung in (3.34) einerseits wegen q̇m = q̇φ = q̇m (qφ , pφ , t) = ∂H ∂p : ∂H (qφ , pφ , t) ∂p und andererseits durch Einsetzen in (3.33b): ∂L ∂L (qφ , Vφ , t) = (qφ , q̇φ , t) ∂q ∂q ∂L ∂H = (qφ , q̇m (qφ , pφ , t), t) = − (qφ , pφ , t) ∂q ∂q ṗφ = , so dass auch die Hamilton-Gleichungen erfüllt sind. 3.4 Erhaltungsgrößen und Poisson-Klammern Eine Observable in der Hamilton-Theorie ist – wie wir wissen – eine Funktion A(q, p, t), die, ausgewertet für die physikalische Bahn, Aφ (t) = A qφ , pφ , t , eine experimentell messbare Eigenschaft A des Systems quantitativ beschreibt. Beispiele sind neben dem (kinetischen) Impuls, dem (kinetischen) Drehimpuls und der (kinetischen) Energie der Massenschwerpunkt, das magnetische Moment oder das elektrische Dipolmoment. Die Zeitentwicklung einer Observablen folgt sofort aus den Hamilton-Gleichungen: d d Aφ = A qφ , pφ , t = dt dt ∂A ∂H ∂A = · − · ∂q ∂p ∂p ∂A ∂A ∂A · q̇φ + · ṗφ + ∂q φ ∂p φ ∂t φ ∂A ∂A ∂H + = {A, H}φ + ∂q φ ∂t φ ∂t φ (3.35) , 96 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS wobei wir die Poisson-Klammer {A, B} zweier Funktionen A(q, p, t) und B(q, p, t) allgemein als {A, B} ≡ X ∂A ∂B ∂A ∂B ∂A ∂B ∂A ∂B − · − · = ∂q ∂p ∂p ∂q ∂qk ∂pk ∂pk ∂qk (3.36) k definieren. Besonders wichtige Observablen sind die sogenannten Erhaltungsgrößen, deren Wert sich im Laufe der Bewegung des Systems nicht ändert, für die d Aφ = 0 gilt. Erhaltungsgrößen werden alternativ auch als Bewegungsinalso dt tegrale oder als Integrale der Bewegung bezeichnet. Es folgt aus (3.35), dass für eine Erhaltungsgröße d Aφ = {A, H}φ + dt ∂A ∂t (3.37) =0 φ gilt. Falls diese Erhaltungsgröße also nicht explizit von der Zeit abhängt, ∂A ∂t = 0, vereinfacht sich (3.37) auf {A, H}φ = 0. Poisson-Klammern {A, H} von Observablen A mit der Hamilton-Funktion sind also sehr wichtig, da sie die Zeitentwicklung dieser Observablen (mit)bestimmen und Hinweise darauf liefern, ob die Observable eventuell erhalten ist. Aus diesem Grund untersuchen wir die Eigenschaften der allgemeinen Poisson-Klammer {A, B} in (3.36) im Folgenden etwas detaillierter. Einige Eigenschaften der Poisson-Klammer sind offensichtlich: Sie ist schiefsymmetrisch, {A, B} = −{B, A} , bilinear: {α1 A1 + α2 A2 , B} = α1 {A1 , B} + α2 {A2 , B} {A, β1 B1 + β2 B2 } = β1 {A, B1 } + β2 {A, B2 } und hat die Eigenschaften {A, C} {A1 A2 , B} ∂ {A, B} ∂t = 0 [für C = C(t)] = A1 {A2 , B} + A2 {A1 , B} § ª § ª ∂A ∂B . = , B + A, ∂t ∂t (3.38) Außerdem gilt die Jacobi-Identität (3.39) {A, {B, C}} + {B, {C, A}} + {C, {A, B}} = 0 , die weniger offensichtlich ist und wie folgt bewiesen werden kann: Mit Hilfe der Definitionen ∂A ak ≡ ∂pk Akl ≡ , ∂A ∂qk ∂2A ∂qk ∂ql 2 A − ∂p∂k ∂q l 2 A − ∂q∂k ∂p l Ǒ ∂2A ∂pk ∂pl (und analog für die Observablen B und C) zeigt man leicht durch explizite Berechnung: {A, {B, C}} = 1 2 X k,l T T T aT k Ckl bl + bk Ckl al − ak Bkl cl − ck Bkl al . 97 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS Den zweiten und dritten Term im linken Glied von (3.39) bestimmt man durch zyklische Vertauschung. Einsetzen dieser Ergebnisse in (3.39) zeigt nun, dass jeder Beitrag zweimal vorkommt, allerdings mit unterschiedlichem Vorzeichen, so dass das linke Glied von (3.39) insgesamt Null ergibt. Hiermit ist die JacobiIdentität bewiesen. Aus der Jacobi-Identität (3.39) und der Rechenregel (3.38) folgt noch das Poisson’sche Theorem, das besagt, dass auch die Poisson-Klammer zweier Erhaltungsgrößen eine Erhaltungsgröße darstellt. Erfüllen die Observablen A und B nämlich die Bewegungsgleichungen: d Aφ = {A, H}φ + dt ∂A ∂t =0 , φ d Bφ = {B, H}φ + dt ∂B ∂t =0 , φ so folgt aufgrund von (3.38) und (3.39): ∂ d {A, B}φ = {{A, B}, H}φ + {A, B} dt ∂t φ § = −{{B, H}, A}φ − {{H, A}, B}φ + § = {A, H} + ∂A ,B ∂t ª § φ − {B, H} + ∂A ,B ∂t ª ª § + A, φ ∂B ∂t ª φ ∂B ,A = 0 , ∂t so dass in der Tat auch {A, B}φ erhalten ist. Man hat hiermit eine Methode gefunden, aus zwei bekannten Erhaltungsgrößen A und B eine dritte (nämlich {A, B}) herzuleiten. Dass die Erhaltungsgröße {A, B} dann auch nicht-trivial (d. h. ungleich Null und unabhängig von A und B) ist, ist im Voraus natürlich nicht garantiert. Wir betrachten ein paar Spezialfälle der allgemeinen Poisson-Klammer: Für die Poisson-Klammer {A, q} einer beliebigen Observablen A(q, p, t) mit den verallgemeinerten Koordinaten q ergibt sich: {A, q} = ∂A ∂A ∂q ∂A ∂q ∂A − = −11 =− ∂p ∂q ∂q ∂p ∂p ∂p , und für die Klammer mit den verallgemeinerten Impulsen p erhält man: {A, p} = ∂p ∂A ∂p ∂A ∂A ∂A − = 11 = ∂p ∂q ∂q ∂p ∂q ∂q . Falls A selbst auch eine der Koordinaten oder einen der Impulse darstellt, ergibt sich: {qk , ql } = 0 , {pk , pl } = 0 , {qk , pl } = δkl . (3.40) Die Beziehungen (3.40) werden als die fundamentalen Poisson-Klammern bezeichnet. In der Tat haben sie grundlegende Bedeutung, da sie – wie wir später feststellen werden – invariant unter kanonischen Transformationen sind. Außerdem sollte darauf hingewiesen werden, dass es einen engen Zusammenhang zwischen der Poisson-Klammer in der Klassischen Mechanik und dem quantenmechanischen Kommutator gibt. Genauer formuliert: Man kann zeigen, dass Erwartungswerte von Kommutatoren sich im klassischen Limes auf PoissonKlammern reduzieren. 98 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS 3.4.1 Beispiel: Vektoren In der Newton’schen Mechanik (Abschnitt [??]) haben wir Vektoren kennengelernt als physikalische Größen, die unter Drehungen im dreidimensionalen Raum genau so transformiert werden wie der Ortsvektor x oder der Impulsvektor p = mẋ. Hierbei wurde zwischen echten Vektoren und Pseudovektoren unterschieden, abhängig davon, ob sich die Größe unter Raumspiegelungen genau so wie der Ortsvektor oder gerade entgegengesetzt verhielt. Man kann „Vektoren“ auch anders (und, wie wir später sehen werden, äquivalent) definieren mit Hilfe von Poisson-Klammern. Hierzu betrachten wir zunächst die Poisson-Klammer des Ortsvektors mit dem Bahndrehimpuls L = x × p: {Lk , xl } = εkmn {xm pn , xl } = εkmn xm (−δnl ) = εklm xm , wobei die fundamentale Poisson-Klammer {xl , pn } = δnl eingesetzt wurde. Analog folgt für die Poisson-Klammer des Impulsvektors mit dem Bahndrehimpuls: {Lk , pl } = εklm pm und für die Klammer des Bahndrehimpulses mit sich selbst: {Lk , Ll } = εklm Lm (3.41) . Es ist bemerkenswert, dass die Poisson-Klammern von L mit den drei Vektoren x, p und L alle die gleiche Struktur besitzen: {Lk , vl } = εklm vm (3.42) . Allgemeiner können wir daher einen Vektor v alternativ dadurch definieren, dass diese Größe die Eigenschaft (3.42) haben soll. In Abschnitt [??] zeigen wir, dass diese alternative Definition eines Vektors äquivalent zur in der Newton’schen Mechanik üblichen Definition ist. Keine Aussage wird in (3.42) darüber gemacht, ob der Vektor v ein echter oder ein Pseudovektor ist, d. h. wie v unter Raumspiegelungen transformiert wird. Falls v1 und v2 beide Vektoren im Sinne von (3.42) sind, ist übrigens auch das Kreuzprodukt v1 × v2 ein Vektor in diesem Sinne: {Lk , (v1 × v2 )l } = εklm (v1 × v2 )m und zeigt das Skalarprodukt v1 · v2 das typische Verhalten {Lk , v1 · v2 } = 0 eines Skalars. Aus diesen Regeln kann man sofort schließen, dass auch eine zusammengesetzte Größe wie z. B. der Lenz’sche Vektor a= 1 p × L + V (x)x µ , V (x) = − GµM x , L=x×p die Vertauschungsbeziehungen {Lk , al } = εklm am aufweist und somit wie ein Vektor transformiert wird. (3.43) 99 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS 3.5 Kanonische Transformationen Wie bereits in der Einführung zu diesem Kapitel betont, hat man im HamiltonFormalismus grundsätzlich viel mehr Freiheit, Transformationen durchzuführen, als in der Lagrange-Theorie. Die Struktur der Lagrange-Gleichungen ist, wie wir wissen, invariant unter Punkttransformationen der Form q̄ = q̄(q, t). Die Transformation der Hamilton-Gleichungen erfolgt jedoch im Phasenraum {(q, p)}, so dass sich neben den Koordinaten q im Allgemeinen auch die Impulse p ändern werden: (q, p) → (q̄, p̄) mit q̄ = q̄(q, p, t) , p̄ = p̄(q, p, t) . (3.44) Wir werden eine solche Transformation im Phasenraum als eine kanonische Transformation bezeichnen, falls die Struktur der Hamilton-Theorie unter dieser Transformation invariant ist, so dass die transformierten Bewegungsgleichungen wiederum aus einer Hamilton-Funktion H̄(q̄, p̄, t) hergeleitet werden können und somit „echte“ Hamilton-Gleichungen sind. Aus den ursprünglichen Hamilton-Gleichungen q̇ = ∂H ∂p , ṗ = − ∂H ∂q werden durch eine kanonische Transformation also neue Bewegungsgleichungen der Form q̄˙ = ∂ H̄ ∂ p̄ , p̄˙ = − ∂ H̄ ∂ q̄ erzeugt. Neben dem ursprünglichen Variationsprinzip: δ Se = 0 , (q ,t ) Se (q12,t12) [q, p] = Zt2 e q̇, p, t) dt L(q, (3.45) t1 e ≡ q̇ · p − H(q, p, t) gilt daher auch nach der Transformation: mit L Ǖ = 0 δS , Ǖ(q̄2 ,t2 ) [q̄, p̄] = S (q̄1 ,t1 ) Zt2 ē ˙ p̄, t) dt L(q̄, q̄, (3.46) t1 ē ≡ q̄˙ · p̄ − H̄(q̄, p̄, t). Es ist wichtig, darauf zu achten, dass die Randbemit L dingungen der Variationsprinzipien (3.45) und (3.46) nicht äquivalent sind: In (3.45) gilt (δq)(t1 ) = (δq)(t2 ) = 0 mit (δp)(t1 ) und (δp)(t2 ) beliebig, während beim Variationsprozess (3.46) q̄(t1 ) und q̄(t2 ) festgehalten werden und p̄(t1 ) und p̄(t2 ) beliebig sind. Dass diese Bedingungen nicht äquivalent sind, folgt sofort aus (3.44). Des Weiteren sei darauf hingewiesen, dass man (3.44) im Prinzip um eine Gleichung der Form t̄ = t̄(t) ergänzen könnte, so dass auch die Zeit bei der kanonischen Transformation mittransformiert wird;6 da solche Verallgemei6 Ein einfaches Beispiel einer kanonischen Transformation, bei der sich auch die Zeit ändert, ist die in Abschnitt [2.11] diskutierte Gleichförmigkeitstransformation x̄i = λxi mit 1 1 ˙ = λ 21 γ−1 L(X, Ẋ) t̄ = λ1− 2 γ t und daher auch x̄˙ i = λ 2 γ ẋi . In diesem Fall gilt L̄(X̄, X̄) und daher mit der Definition P ≡ (p1 , p2 , . . . , pN ) auch P̄ = λ−1 P, so dass H̄(X̄, P̄) = 1 ˙ P̄) = λ 12 γ−1 L ē X̄, X̄, e(X, Ẋ, P) folgt. Das Wirkungsfunktional ist unλ 2 γ−1 H(X, P) bzw. L( ē = Se. ter der Gleichförmigkeitstransformation interessanterweise invariant: S 100 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS nerungen in der Physikliteratur jedoch eher unüblich sind, beschränken wir uns im Folgenden auf Transformationen der Form (3.44). Aus der gleichzeitigen Gültigkeit der Variationsprinzipien (3.45) und (3.46) e und L ē in diesen kann man keineswegs schließen, dass die Hilfsfunktionen L beiden Fällen gleich sind. Wir betrachten zwei Beispiele, aus denen hervorgeht, e und L ē im Allgemeinen ungleich sind: Als erstes Beispiel betrachten wir dass L eine einfache Reskalierung der Impulsvariablen: q̄ = q , p̄ = λ−1 p , H̄(q̄, p̄, t) = λ−1 H(q̄, λp̄, t) . Man überprüft leicht, dass die kanonische Struktur unter dieser Transformation erhalten ist: ∂ H̄ ∂H = (q, p, t) = q̇ = q̄˙ ∂ p̄ ∂p ∂ H̄ ∂H − = −λ−1 (q, p, t) = λ−1 ṗ = p̄˙ . ∂ q̄ ∂q ē = q̄˙ · p̄ − H̄(q̄, p̄, t) = λ−1 L e und daher auch S Ǖ = λ−1 S. e Außerdem folgt L Diese Reskalierung der Impulse weist eine gewisse Ähnlichkeit mit der in der Fußnote diskutierten Gleichförmigkeitstransformation auf, nur werden bei der Gleichförmigkeitstransformation auch die Koordinaten und die Zeit reskaliert. Als zweites, wesentlich weniger triviales und wesentlich wichtigeres Beispiel ē 6= L e diskutieren wir die Berührungsfür eine kanonische Transformation mit L 7 transformation, die durch die Gleichung e ē ˙ p̄, t) + q̄, L(q, q̇, p, t) = L(q̄, d F1 (q, q̄, t) dt (3.47) mit einer zunächst beliebigen Funktion F1 (q, q̄, t) der alten und neuen Koore 6= L. ē Es dinaten definiert ist. Offensichtlich gilt auch nun im Allgemeinen L ist zu bedenken, dass die alten und neuen Variablen (q, p) und (q̄, p̄) in (3.47) durch (3.44) verknüpft sind, so dass nur jeweils zwei dieser vier Vektoren (oder genauer: nur 2f deren 4f Komponenten) als unabhängig angesehen werden können. Wir zeigen im Folgenden, in welcher Weise die Berührungstransformation (q, p) → (q̄, p̄) durch die Wahl von F1 festgelegt wird; da die Funktion F1 diese Transformation erzeugt, wird sie als die erzeugende Funktion der Berührungstransformation bezeichnet. Wir zeigen außerdem, dass die Transformation (3.47) kanonisch ist, so dass die Bewegungsgleichungen für die neue physikalische Bahn (q̄φ , p̄φ ) wiederum die Form von Hamilton-Gleichungen besitzen; e und L ē zur Zeit t1 bzw. t2 wegen der unterschiedlichen Randbedingungen für L ist diese Invarianz der kanonischen Struktur keineswegs trivial.8 7 Der Name „Berührungstransformation“ (engl.: contact transformation) stammt aus der projektiven Geometrie und ist bei der hier diskutierten Anwendung einer solchen Transformation in der Physik weniger anschaulich. 8 In vielen Lehrbüchern wird inkorrekterweise behauptet, dass die Invarianz der kanonischen e und L ē sich „nur“ um eine vollständige Zeitableitung unterStruktur sofort daraus folgt, dass L scheiden, so wie auch die Addition einer vollständigen Zeitableitung in der Lagrange-Theorie die Bewegungsgleichung invariant lässt. Die Subtilität bei den Randbedingungen wird in diesem Argument völlig übersehen. Im Unterschied zur Lagrange-Theorie liefert die vollständige Zeitableitung in (3.47) zum Beispiel einen nicht-verschwindenden Beitrag zur Variation der e, s. Gleichung (3.53). Wirkung δS 101 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS Wir untersuchen nun zuerst, in welcher Weise die Berührungstransformation (q, p) → (q̄, p̄) durch die erzeugende Funktion F1 festgelegt wird. Aus der 1 expliziten Form der vollständigen Ableitung dF dt in (3.47), d ∂F1 ∂F1 ∂F1 F1 (q, q̄, t) = · q̇ + · q̄˙ + dt ∂q ∂ q̄ ∂t , e und L ē folgt sofort: und der Definition von L q̇ · p − H(q, p, t) = q̄˙ · p̄ − H̄(q̄, p̄, t) + bzw. p− ∂F1 ∂q · dq − p̄ + ∂F1 ∂ q̄ ∂F1 ∂F1 ∂F1 · q̇ + · q̄˙ + ∂q ∂ q̄ ∂t · dq̄ + H̄ − H − ∂F1 ∂t dt = 0 . Da die Variablen (q, q̄, t) in (3.47) als unabhängig anzusehen sind, muss gelten: p= ∂F1 ∂q , p̄ = − ∂F1 ∂ q̄ , H̄ = H + ∂F1 ∂t (3.48) . Die Berührungstransformation (q, p) → (q̄, p̄) wird durch die erzeugende Funktion F1 (q, q̄, t) also eindeutig festgelegt: Falls (q, p) vorgegeben ist, kann q̄(q, p, t) durch Inversion der ersten Gleichung in (3.48) bestimmt werden; der neue Impuls p̄ folgt dann aus der zweiten und die neue Hamilton-Funktion H̄ aus der dritten Gleichung in (3.48). Falls umgekehrt (q̄, p̄) vorgegeben ist, folgt q(q̄, p̄, t) analog durch Inversion der zweiten Gleichung in (3.48). Diese Inversionen sind allerdings nur dann möglich, wenn det ∂ 2 F1 /∂q∂ q̄ 6= 0 gilt. Dies zeigt bereits, dass F1 in der Praxis keineswegs beliebig ist. Weitere Einschränkungen werden klar, wenn man allgemein Invertierbarkeit der Gleichungen p = ∂F1 /∂q und p̄ = −∂F1 /∂ q̄ fordert, so dass diese Gleichungen eindeutig nach zwei der vier Variablen (q, p, q̄, p̄) aufgelöst werden können, falls die anderen zwei Variablen vorgegeben sind. Sind beispielsweise (p, q̄) vorgegeben, so kann q eindeutig bestimmt werden, falls F1 eine strikt konvexe (oder konkave) Funktion der Variablen q ist: q = qm (p, q̄, t) p≡ , ∂F1 (qm , q̄, t) . ∂q (3.49) Sind andererseits die Variablen (q, p̄) vorgegeben, dann kann die Gleichung p̄ = −∂F1 /∂ q̄ eindeutig nach q̄ aufgelöst werden, falls F1 strikt konvex (oder konkav) als Funktion von q̄ ist: q̄ = q̄m (q, p̄, t) p̄ ≡ − , ∂F1 (q, q̄m , t) . ∂ q̄ (3.50) Sind schließlich die Variablen (p, p̄) vorgegeben, so können die beiden Gleichungen p = ∂F1 /∂q und p̄ = −∂F1 /∂ q̄ nach (q, q̄) aufgelöst werden, falls F1 strikt konvex oder konkav in diesen Variablen ist: q = q̄ qmm (p, p̄, t) p , q̄mm (p, p̄, t) −p̄ ∂F1 ∂q ≡ (qmm , q̄mm , t) . ∂F1 ∂ q̄ (qmm , q̄mm , t) 102 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS (3.51) Diese Formeln zeigen außerdem, dass die erzeugende Funktion F1 genügend glatt (d. h. differenzierbar) sein muss. Wir zeigen schließlich, dass die Berührungstransformation (3.47) kanonisch ist, d. h. die Struktur der Hamilton-Gleichungen invariant lässt. Wir verwenden die übliche Notation: δq = εK, δp = επ, δq̄ = εK̄, δ p̄ = επ̄. Das Wirkungsfunktional Se folgt aus (3.47) als Zt2 (q ,t ) Se 2 2 [q, p] = (q1 ,t1 ) t1 Zt2 = t1 dt [p · q̇ − H(q, p, t)] t2 dt p̄ · q̄˙ − H̄(q̄, p̄, t) + F1 (q(t), q̄(t), t) . (3.52) t1 Es ist wichtig, zu bedenken, dass beim Variationsprinzip δ Se = 0 zwar K(t1 ) = K(t2 ) = 0, jedoch im Allgemeinen nicht K̄(t1 ) = K̄(t2 ) = 0 gilt. Es folgt aus (3.52): 0 = 1 e (q2 ,t2 ) lim (δ S) (q1 ,t1 ) [q, p] ε ε→0 Zt2 = t1 = t2 ˙ − ∂ H̄ · K̄ − ∂ H̄ · π̄ + ∂F1 · K̄ dt q̄˙ · π̄ + p̄ · K̄ ∂ q̄ ∂ p̄ ∂ q̄ t1 t2 Zt2 ∂F1 ∂ H̄ ∂ H̄ ˙ ˙ p̄ + · K̄ + dt · π̄ − p̄ + · K̄ q̄ − ∂ q̄ ∂ p̄ ∂ q̄ t1 Zt2 = ∂ H̄ q̄˙ − ∂ p̄ dt t1 . t1 ∂ H̄ · π̄ − p̄˙ + ∂ q̄ · K̄ . (3.53) Im letzten Schritt wurde (3.48) verwendet. Man sieht, dass die vollständige Zeitableitung in (3.47) sehr wohl zur Variation der Wirkung beiträgt und genau gegen einen weiteren, bei der partiellen Integration erzeugten Randterm wegfällt. Des Weiteren ist klar, dass das rechte Glied von (3.53) nur dann für alle (π, K), oder äquivalent: für alle (π̄, K̄), Null sein kann, falls q̄˙ = ∂ H̄ ∂ p̄ , p̄˙ = − ∂ H̄ ∂ q̄ gilt, d. h. falls die kanonische Struktur der Bewegungsgleichungen invariant ist. Hiermit ist gezeigt, dass jede Berührungstransformation in der Tat auch kanonisch ist. Als einfaches Beispiel einer Berührungstransformation betrachten wir (3.47) mit F1 (q, q̄, t) = −q · q̄. Es folgt aus (3.48), dass die alten und neuen Variablen gemäß p = −q̄, p̄ = q miteinander verknüpft sind, so dass bei der Transformation (q, p) durch (p̄, −q̄) ersetzt wird und „Koordinaten“ und „Impulse“ somit ihre Rollen vertauschen. Der Unterschied zwischen Koordinaten und Impulsen geht daher im Hamilton-Formalismus vollständig verloren. Die Freiheit, 103 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS die man hiermit gewinnt, hat allerdings auch einen Preis, da die klare Struktur der Hamilton-Funktion als duale Funktion der Lagrange-Funktion, insbesondere die strikte Konvexität als Funktion der Impulse, bei kanonischen Transformationen im Allgemeinen ebenfalls verloren geht. 3.5.1 Alternative Formulierungen der Berührungstransformation Die zweite Gleichung in (3.48), p̄ = ∂(−F1 )/∂ q̄, zeigt in Kombination mit (3.50), dass man statt der erzeugenden Funktion F1 auch die Legendre-Transformierte F2 (q, p̄, t) von F1 (genauer: von −F1 ) bezüglich der Variablen q̄ einführen kann: F2 (q, p̄, t) ≡ p̄ · q̄m (q, p̄, t) − [−F1 (q, q̄m (q, p̄, t), t)] . Es folgt aus dem allgemeinen Ergebnis (3.8) für Differentiale von LegendreTransformierten mit Dummy-Variablen und aus (3.50), dass ∂F2 =p , ∂q ∂F2 ∂ p̄ = q̄m (q, p̄, t) = q̄ , ∂F2 = H̄ − H ∂t gilt, so dass man auch F2 als erzeugende Funktion der Berührungstransformation verwenden kann. 1 Eine dritte mögliche Formulierung ergibt sich aus der Gleichung p = ∂F ∂q in Kombination mit (3.49), da man aufgrund dessen die Legendre-Transformierte −F3 (p, q̄, t) von F1 bezüglich der Variablen q einführen kann: −F3 (p, q̄, t) ≡ p · qm (p, q̄, t) − F1 qm (p, q̄, t), q̄, t . Die Ableitungen von F3 folgen sofort aus (3.8) und (3.49): − ∂F3 = qm (p, q̄, t) = q , ∂p ∂F3 ∂ q̄ = −p̄ , ∂F3 = H̄ − H ∂t , und wiederum kann man statt F1 auch F3 als erzeugende Funktion verwenden. Als vierte Möglichkeit kann man aufgrund von (3.48) und (3.51) auch die Legendre-Transformierte −F4 (p, p̄, t) von F1 (q, q̄, t) bezüglich der Variablen (q, q̄) einführen: −F4 (p, p̄, t) ≡ p −p̄ · qmm (p, p̄, t) q̄mm (p, p̄, t) − F1 (qmm , q̄mm , t) . Die Ableitungen der Legendre-Transformierten F4 folgen wiederum aus (3.8), nun in Kombination mit (3.51): ∂F4 = −qmm (p, p̄, t) = −q , ∂p ∂F4 = H̄ − H , ∂t ∂F4 ∂ p̄ = q̄mm (p, p̄, t) = q̄ , und das Ergebnis zeigt, dass man äquivalent auch F4 als erzeugende Funktion verwenden kann. 104 ---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS Typische Beispiele für die drei alternativen Formulierungen der Berührungstransformation sind die Identität (q, p) → (q, p), die durch die erzeugenden Funktionen F2 (q, p̄, t) = q · p̄ bzw. F3 (p, q̄, t) = −p · q̄ beschrieben wird, die Vertauschung (q, p) → (−p, q), die auch durch die erzeugende Funktion F4 (p, p̄, t) = −p · p̄ hervorgerufen wird, und die Punkttransformation q → q′ (q, t), die durch F2 (q, p̄, t) = q′ (q, t) · p̄ erzeugt wird. Bemerkenswert an diesen Beispielen ist, dass die erzeugenden Funktionen alle linear (und somit konvex, aber nicht strikt konvex) in mindestens einem ihrer Argumente sind; zumindest in diesen Beispielen führt dies nicht zu Problemen. 3.5.2 Berührungstransformationen als Gruppe Man sieht sehr leicht ein, dass die Berührungstransformationen eine Gruppe bilden. Erstens gehört die Identität zur Gruppe, denn sie wird z. B. durch F2 = q· p̄ dargestellt. Zweitens gibt es zu jeder erzeugenden Funktion F1 , die (q, p, H) in (q̄, p̄, H̄) überführt und durch (3.54) dF1 = p · dq − p̄ · dq̄ + (H̄ − H)dt charakterisiert wird, eine Inverse F1′ , die (q̄, p̄, H̄) auf (q, p, H) abbildet und das Differential dF1′ = p̄ · dq̄ − p · dq + (H − H̄)dt hat; konkret ist diese Inverse durch F1′ (q̄, q, t) = −F1 (q, q̄, t) gegeben. Drittens gehört auch das Produkt zweier Berührungstransformationen zur Gruppe: Falls F1 (q, q̄, t) durch (3.54) gegeben ist und (q, p, H) auf (q̄, p̄, H̄) abbildet und ¯ , t) das Differential F1′ (q̄, q̄ ¯ − H̄)dt ¯ + (H̄ ¯ · dq̄ dF1′ = p̄ · dq̄ − p̄ ¯ ) abbildet, gilt auch ¯ , H̄ ¯ , p̄ hat und (q̄, p̄, H̄) auf (q̄ ¯ − H dt = dF ′′ ¯ + H̄ ¯ · dq̄ d (F1 + F1′ ) = p · dq − p̄ 1 , ¯ ) erzeugt. ¯ , H̄ ¯ , p̄ ¯ , t) ≡ F1 + F1′ die Transformation (q, p, H) → (q̄ so dass F1′′ (q, q̄ Viertens ist die Assoziativität dreier Berührungstransformationen F1 (q, q̄, t) , ¯ , t) , F1′ (q̄, q̄ ¯ , t) ¯ , q̄ F1′′ (q̄ dadurch gewährleistet, dass (F1 + F1′ ) + F1′′ = F1 + (F1′ + F1′′ ) gilt. Alle Gruppeneigenschaften sind somit erfüllt. Die Gruppe der Berührungstransformationen ist kontinuierlich und zusammenhängend. Dies sieht man noch am einfachsten daraus, dass jede Transformation stetig mit der Identität verbunden werden kann, denn für alle F2 (q, p̄, t) und alle λ ∈ [0, 1] stellt auch F2 (q, p̄, t; λ) ≡ q · p̄ + λ [F2 (q, p̄, t) − q · p̄] eine mögliche erzeugende Funktion einer Berührungstransformation dar. 105 Kapitel 4 Relativistische Dynamik Nachdem in den vorigen beiden Kapiteln die analytische Struktur der nichtrelativistischen klassischen Mechanik erforscht wurde, lautet unsere nächste Aufgabe, zu bestimmen, ob und inwiefern die neuen Einsichten und Zusammenhänge auch auf die relativistische klassische Mechanik (d.h. auf die Spezielle Relativitätstheorie) übertragbar sind. Hierzu rufen wir in Erinnerung, dass das relativistische Kraftgesetz durch K µ ≡ qF µν uν = quν (∂ µ Aν − ∂ ν Aµ ) mit F µν = 0 E1 E2 E3 −E1 0 cB3 −cB2 −E2 −cB3 0 cB1 −E3 cB2 −cB1 0 (4.1) . gegeben ist. Da die Elemente von F µν vollständig durch (E, B) bestimmt werden, heißt F µν bekanntlich auch elektromagnetischer Feldtensor. Durch explizite Berechnung sieht man, dass K µ in der Tat eine relativistische Verallgemeinerung der Lorentz-Kraft darstellt: Kµ = q(F µ0 u0 + F µj uj ) = qγu [F µ0 + F µj (−βj )] = qγu (E · β , E + u × B) (4.2) , wobei benutzt wurde: F ij (−βj ) = (−εijk cBk )(−βj ) = c(β × B)i = (u × B)i . Der Zeitanteil von K µ in (4.2) ist genau die Leistung, die das elektromagnetische Feld am Teilchen verrichtet. Die Gleichung d2 xµ d2 xµ dt , (4.3) = m0 = K µ , dτ = 2 ds dτ 2 γu bringt K µ mit einem anderen 4-Vektor, der 4-Beschleunigung, in Verbindung. Nachdem die Form des relativistischen Kraftgesetzes nun geklärt ist, widmen wir uns im Folgenden der Frage nach der Existenz eines Wirkungsprinzips, aus dem die Lorentz’sche Bewegungsgleichung hergeleitet werden kann, zunächst für kräftefreie Teilchen (K µ = 0) und dann auch für Teilchen in Wechselwirkung mit einem elektromagnetischen Feld. m 0 c2 ---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK 4.1 Kräftefreie Teilchen Der gesuchte kanonische Formalismus (mit einem entsprechenden Wirkungsfunktional, einer Lagrange-Funktion, einer Hamilton-Funktion, usw.) muss natürlich vor allem imstande sein, die Dynamik des kräftefreien Teilchens zu reproduzieren. Die Bewegungsgleichung eines Teilchens in Abwesenheit von Feldern (F µν = 0) folgt sofort aus (4.3) mit K µ = 0 als dxµ d2 xµ = 0 bzw. γ = konstant u dτ 2 dt und hat die Lösung m0 γu u = konstant bzw. u = konstant . In diesem Spezialfall liegt also erwartungsgemäß eine geradlinig-gleichförmige Bewegung vor. Die Energie eines kräftefreien Teilchens folgt aus Einsteins berühmter Formel als E = γu m0 c2 = mc2 . Auch dieses Resultat ist zu reproduzieren, wobei „Energie“ im kanonischen Formalismus (zumindest für nicht explizit zeitabhängige Lagrange-Funktionen) mit der Hamilton-Funktion der physikalischen Bahn zu identifizieren ist. Schließlich sollen sich alle neuen (relativistischen) Ergebnisse im nicht-relativistischen Limes auf die altbekannten Formeln reduzieren. Ein geeignetes Wirkungsfunktional, das alle diese Bedingungen erfüllt und außerdem Lorentz-invariant ist1 , wurde bereits 1906 von Max Planck angegeben: Z2 SM = S12 [x] = −m0 c 1 Zt2 ds = −m0 c dt′ 2 t1 1 γu (t′ ) . (4.4) Hierbei sind „1“ und „2“ zwei Ereignisse, die wir einfachheitshalber als „Beginn“ und „Ende“ bezeichnen werden und die in jedem Inertialsystem durch wohldefinierte Orts- und Zeitkoordinaten xµ1 = (ct1 , x1 ) und xµ2 = (ct2 , x2 ) festgelegt sind. Bei der Variation von S sind xµ1 und xµ2 - wie üblich - festzuhalten. Die physikalische Bahn ist - wie üblich - durch den stationären Punkt von SM gegeben, 0= δSM δx(t) , und man kann SM in (4.4) - wiederum wie üblich - mit Hilfe einer LagrangeFunktion formulieren: Zt2 dt′ L (x(t′ ), ẋ(t′ ); t′ ) SM = , t1 1 In diesem Kapitel wird die Wirkung stets eine Lorentz-invariante Größe sein. Dennoch ist es vielleicht gut zu beachten, dass die Lorentz-Invarianz der Wirkung logisch nicht zwingend erforderlich ist: Nur die Bewegungsgleichungen (und somit alle Messgrößen) müssen unbedingt Lorentz-invariant sein. Wie in der nicht-relativistischen Mechanik gilt auch in der Relativitätstheorie, dass die Bewegungsgleichungen invariant sind unter Transformationen der Lagranged λ(x, t), da in diesem Fall S → S ′ = S+λ(x2 , t2 )−λ(x1 , t1 ) Funktion der Form L → L′ = L+ dt gilt. Durch eine „geeignete“ Wahl von λ(x, t) könnte man die Lorentz-Invarianz von S also prinzipiell zerstören. Es sei auch daran erinnert, dass die Lagrange-Funktion und daher auch die Wirkung in der nicht-relativistischen Mechanik, trotz der Galilei-Invarianz aller Bewed 1 mv2 t − mv · x . gungsgleichungen, selbst nicht Galilei-invariant sind: L′ = L + dt 2 107 ---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK wobei die Lagrange-Funktion L explizit durch m 0 c2 = −m0 c2 L(x, ẋ; t) = − γu (t) Ê 1− u(t) c Ê 2 = −m0 c2 1− ẋ(t) c 2 (4.5) gegeben ist. Im nicht-relativistischen Limes erhält man: L(x, ẋ; t) ∼ ∼ −m0 c 1 1− 2 2 2 ẋ c 1 − 8 ẋ2 c2 2 + ··· 1 m0 ẋ2 1 + O(βu2 ) + vollständige Zeitableitung 2 , so dass sich die Lagrange-Funktion des freien Teilchens (abgesehen von physikalisch irrelevanten Termen) auf das altbekannte Ergebnis L = 21 m0 ẋ2 reduziert. Die Bewegungsgleichung des relativistischen kräftefreien Teilchens folgt aus (4.5) als: 0= ∂L d − ∂x dt ∂L ∂ ẋ 2 3 2 =− d dx d 4 (−ẋ/c ) 5 −m0 c2 È = −m0 γu dt dt dt 2 2 1 − (ẋ /c ) . (4.6) Die Lösung von (4.6) lautet offensichtlich, dass u = dx dt und daher auch γu konstant (d. h. zeitunabhängig) sein müssen, so dass (4.6) auch in der Form d d d 0 = γu γu (ct, x) = dt dt dτ dxµ dτ = d2 xµ dτ 2 geschrieben werden kann. Das Wirkungsfunktional (4.4) reproduziert also tatsächlich die Bewegungsgleichung des relativistischen kräftefreien Teilchens. Nach dem Hamilton’schen Prinzip soll die Wirkung für die physikalische Bahn bekanntlich extremal sein, und wir konnten diese Eigenschaft von SM für die „echte“ (geradlinig-gleichförmige) Bewegung eines freien Teilchens in der Tat nachweisen. Im Falle des Wirkungsfunktionals (4.4) kann man sogar relativ leicht zeigen, dass die Wirkung für die physikalische Bahn auch minimal ist. Dies folgt unschwer aus der Lorentz-Invarianz von SM : Wir nehmen an, dass der Abstand zwischen den Ereignissen 1 und 2 zeitartig ist (sonst gäbe es keine Bahn zwischen beiden). In diesem Fall gibt es ein Inertialsystem K ′ , in dem beide Ereignisse am selben Ort auftreten (x′1 = x′2 ). Der Gesamtabstand zwischen 1 und 2, ′ Z2 Zt2 dt′ ds = c 1 t′1 1 γ (t′ ) , u′ wird nun sicherlich durch ein in K ′ am Ort x′1 = x′2 ruhendes Teilchen (mit u′ = 0 und daher γu′ = 1) maximiert, denn jede Bewegung (mit u′ 6= 0 und daher γu′ > 1) führt zu einem kleineren Wert des Gesamtabstands. Folglich minimiert das in K ′ ruhende Teilchen das Wirkungsfunktional, zumindest in diesem speziellen Bezugssystem. Aus der Lorentz-Invarianz der Wirkung (4.4) und dem gerade hergeleiteten Ergebnis in K ′ folgt nun mittels einer LorentzTransformation, dass die optimale Bahn in jedem Inertialsystem geradliniggleichförmig sein muss. Hiermit ist gezeigt, dass SM in (4.4) tatsächlich in allen Inertialsystemen durch die physikalische Bahn minimiert wird. 108 ---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK Der verallgemeinerte Impuls eines Teilchens ist in der üblichen Art und Weise, nämlich gemäß p= m0 ẋ ∂L = È = γu m0 u , ∂ ẋ 1 − (ẋ2 /c2 ) mit seiner Geschwindigkeit u verknüpft. Folglich gibt es auch eine einfache Beziehung zwischen dem 3-Impuls und den räumlichen Komponenten der 4Geschwindigkeit uµ = γu (1, β u ): pi = m0 γu ui = m0 cui (i = 1, 2, 3) , wobei pi , ui und ui nun die i-te Komponente der 3-Vektoren p und u bzw. des kontravarianten 4-Vektors uµ darstellen. Da die Lagrange-Funktion nicht explizit von der Zeitvariablen abhängt, ist die Energie des Teilchens eine Erhaltungsgröße; sie ist wie üblich durch das Jacobi-Integral gegeben: − = p · ẋ − L = È 1 − (ẋ2 /c2 ) E(ẋ) r m0 ẋ · ẋ −m0 c 2 ẋ2 1− 2 c = γu m0 c2 [β 2 + (1 − β2 )] = γu m0 c2 = m0 c2 u0 (4.7) . Kombination mit unserem Ergebnis für den 3-Impuls zeigt, dass der 4-Impuls nun durch den kontra- bzw. kovarianter 4-Vektor pµ ≡ E c, p = m0 cuµ , pµ = E c, −p = m0 cuµ dargestellt wird. Aus der Normierung der 4-Geschwindigkeit, uµ uµ = 1, folgt noch (m0 c)2 = (m0 c)2 uµ uµ = pµ pµ = 2 E c − p2 und daher für die Energie eines freien Teilchens als Funktion seines verallgemeinerten Impulses: E(p) = È p2 c2 + m20 c4 (4.8) . Im nicht-relativistischen Limes reduzieren sich (4.7) und (4.8) auf die Ausdrücke E(ẋ) = m0 c2 + 12 m0 ẋ2 + · · · , E(p) = m0 c2 + p2 + ··· 2m0 , die neben der altbekannten kinetischen Energie auch die Ruheenergie m0 c2 enthalten. Es sei noch einmal darauf hingewiesen (s. Abschnitt 6.6 des Theorie-1Skripts), dass der Energienullpunkt eines Teilchens oder eines Körpers in der Relativitätstheorie exakt festgelegt ist: Wird die Ruhemasse eines Teilchens vollständig in Strahlung umgewandelt, so ist die Restenergie per definitionem Null. Dies steht im Gegensatz zur nicht-relativistischen Klassischen Mechanik, in der der Energienullpunkt eines Körpers beliebig gewählt werden kann. Die Energie eines ultrarelativistischen Teilchens oder eines „Teilchens“ der Ruhemasse m0 = 0 (z. B. eines Photons) folgt aus (4.8) als E = pc; der entsprechende Impuls ist daher p = E/c. 109 ---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK Wir betrachten nun die Hamilton’sche Variante des kanonischen Formalismus. Mit der Energie-Impulsrelation (4.8) hat man auch bereits die Form der Hamilton-Funktion eines kräftefreien Teilchens bestimmt: È p2 c2 + m20 c4 H(x, p; t) = . Die Hamilton-Gleichungen lauten: ṗ = − ∂H =0 ∂x , ẋ = ∂H pc2 = È ∂p p2 c2 + m20 c4 . Wir schließen hieraus wiederum, dass u = ẋ für das kräftefreie Teilchen konstant ist, so dass eine geradlinig-gleichförmige Bewegung vorliegt. Es sei noch darauf hingewiesen, dass der kanonische Formalismus nicht nur für einzelne Punktteilchen („Elementarteilchen“), sondern auch für ausgedehnte Körper anwendbar ist. Wir zeigen nun, dass der kanonische Formalismus auch in manifest kovarianter Form darstellbar ist. Hierzu gehen wir von der Wirkung Z2 SM = −m0 c ds 1 aus und wenden das Prinzip der kleinsten Wirkung an, nach dem die Variation der Wirkung bei festgehaltenen Endpunkten (δxµ1 = δxµ2 = 0), Z2 δSM = −m0 c δ(ds) = −m0 c 1 Z2 = = −m0 c 1 Z2 È δ( dxµ dxµ ) 1 dxµ δ(dxµ ) = −m0 c ds Z2 2 −m0 cuµ δxµ + m0 c δxµ 1 1 Z2 uµ d(δxµ ) 1 duµ ds ds (4.9) Null sein soll für beliebige Variationen δxµ : Z2 δxµ δSM = m0 c 1 duµ ds = 0 . ds µ µ Es folgt du ds = 0, so dass die physikalische Bahn xφ wiederum einer geradliniggleichförmigen Bewegung entspricht. Aus der nicht-relativistischen Mechanik ist bekannt, dass neben dem Impuls und der Energie auch der Drehimpuls eines kräftefreien Teilchens (oder eines Teilchens unter der Einwirkung von Zentralkräften) erhalten ist: Es gilt dL dt = 0 mit L≡x×p= x2 p3 − x3 p2 x3 p1 − x1 p3 x1 p2 − x2 p1 , Li = εijk xj pk . 110 ---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK Man erwartet natürlich, dass dieses Erhaltungsgesetz in irgendeiner Form auch in der Relativitätstheorie überlebt. Aufgrund der expliziten Gestalt des Pseudovektors L erscheint es plausibel, dass seine Komponenten den räumlich-räumlichen Anteil eines antisymmetrischen Tensors bilden könnten, ähnlich der Rolle des B-Felds im elektromagnetischen Feldtensor F µν . Der Ansatz Lµν = xµ pν − xν pµ führt tatsächlich sofort zum Erfolg: dLµν ds dxµ ν dpν dxν µ dpµ p + xµ − dp − xν ds ds ds ds uµ pν − uν pµ = m0 c(uµ uν − uν uµ ) = 0 = = . Der (echte) antisymmetrische Tensor 2. Stufe Lµν ist daher (im Falle des kräftefreien Teilchens) eine Erhaltungsgröße: Lµν = 0 ℓ 0 −L3 L2 −ℓT L3 −L2 0 L1 −L1 0 , ℓ≡ E x − pct . c Neben dem Drehimpuls ist also auch der Vektor ℓ erhalten, was lediglich bedeutet, dass das Teilchen sich mit konstanter Geschwindigkeit bewegt: x= c ℓ + ut , E u= c2 p p= E γu m0 . Auch der Begriff des relativistischen Drehimpulses läßt sich auf Systeme mehrerer Teilchen verallgemeinern. Wie üblich sind die hier hergeleiteten Erhaltungsgesetze mit Invarianzen der Wirkung verknüpft. Die Impulserhaltung folgt aus der Translationsinvarianz im Ortsraum und die Energieerhaltung aus der Translationsinvarianz in der Zeit. Die Erhaltung des Drehimpuls-4-Tensors ist eine Konsequenz der LorentzInvarianz. Zusammenfassend läßt sich also sagen, dass die hergeleiteten Erhaltungsgesetze die Invarianz des Systems unter Poincaré-Transformationen widerspiegeln. 4.2 Wechselwirkung mit dem elektromagnetischen Feld Wir versuchen nun, ein Wirkungsfunktional für die Ankopplung der Teilchen an das elektromagnetische Feld zu konstruieren. Wir wissen bereits aus unserer Untersuchung der Dynamik nicht -relativistischer Teilchen, s. Abschnitt [2.2], dass die Lagrange-Funktion in der nicht-relativistischen Theorie durch L = LM + LWW mit LM = 1 mẋ2 2 , LWW = q[ẋ · A(x, t) − Φ(x, t)] (4.10) 111 ---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK gegeben ist, so dass der Wechselwirkungsterm in der nicht-relativistischen Wirkung die Form Zt2 (4.11) dt [u · A(x, t) − Φ(x, t)] SWW = q t1 hat. Andererseits ist es aufgrund unserer Erfahrungen mit kräftefreien relativistischen Teilchen naheliegend, zu fordern, dass auch der Wechselwirkungsterm im Wirkungsfunktional Lorentz-invariant sein soll. Interessanterweise ist die Wechselwirkung SWW in (4.11) bereits Lorentz-invariant. Mit uµ = γu (1, −β) und Aµ = (Φ, cA) folgt nämlich, dass Zt2 SWW = q t1 dt q [γu β · (cA) − γu Φ] = − γu c Z2 ds uν Aν 1 manifest Lorentz-invariant ist und somit auch den korrekten relativistischen Ausdruck darstellt. Die Gesamtwirkung für das Wechselwirkungsproblem lautet also: Z2 SM+WW q −m0 c − uν Aν c ds = 1 Zt2 dt = t1 q −m0 c 2 1− u2 c2 + qu · A − qΦ (4.12) , wobei (4.11) mit dem Planck’schen Wirkungsfunktional (4.4) für das kräftefreie Teilchen kombiniert wurde. Der Integrand in (4.12) stellt die Lagrange-Funktion eines geladenen Teilchens in Wechselwirkung mit elektromagnetischen Feldern dar. Wir bestimmen zunächst die relevanten Ausdrücke für den kanonischen Impuls, die Energie und die Hamilton-Funktion. Der verallgemeinerte oder kanonische Impuls folgt aus der Lagrange-Funktion in (4.12) als p= ∂L = γu m0 u + qA = π + qA ∂u , wobei wir außerdem den kinetischen Impuls π ≡ p − qA = γu m0 u eingeführt haben. Die entsprechenden 4-Vektoren sind durch q q pµ = m0 cuµ + Aµ = π µ + Aµ c c , q π µ ≡ pµ − Aµ = m0 cuµ c (4.13) gegeben. Die Hamilton-Funktion folgt in gewohnter Weise durch eine LegendreTransformation aus der Lagrange-Funktion: H ∂L −L ∂u = u· = u · (γu m0 u + qA) − = γu m0 c 2 u2 1 + 2 c2 γu −m0 c2 + qu · A − qΦ γu + qΦ = γu m0 c2 + qΦ(x, t) , (4.14) 112 ---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK wobei allerdings (analog zum nicht-wechselwirkenden Fall) die Geschwindigkeit u durch den kanonischen Impuls p zu ersetzen ist: È H(x, p; t) = π2 c2 + m20 c4 + qΦ É 2 p − qc A = c2 + m20 c4 + qΦ (4.15) . 0 Ein Vergleich von (4.14) und (4.13) zeigt, dass die zeitliche Komponente p des 4-Impulses nun durch H/c gegeben ist, so dass pµ = Hc , p gilt. Die HamiltonFunktion (4.14) oder (4.15) darf nun jedoch nicht als die Energie des Teilchens interpretiert werden: Der erste Term im rechten Glied von (4.14) oder (4.15) stellt zwar - wie im nicht-wechselwirkenden Fall - die kinetische Energie inklusive der Ruheenergie dar, aber der zweite Term kann nicht als potentielle Energie interpretiert werden (er ist nicht einmal eichinvariant). Wir folgern hieraus, dass die Summe von kinetischer Energie und Ruheenergie nach wie vor durch E(u) = γu m0 c2 = È È m 0 c2 1 − u2 /c2 = π 2 c2 + m20 c4 (4.16) gegeben ist, nun aber im Allgemeinen (wegen der Wechselwirkung mit dem elektromagnetischen Feld) keine Erhaltungsgröße sein kann. Dies alles ist natürlich vollkommen analog zur nicht-relativistischen Theorie. Wir betrachten noch einmal die Wirkung (4.12) in manifest kovarianter Form und leiten die Bewegungsgleichung für ein relativistisches geladenes Teilchen im È elektromagnetischen Feld her. Mit Hilfe der Identität ds = dxµ dxµ erhalten wir aufgrund des Hamilton’schen Prinzips: Z2 0 = δSM+WW = δ 1 Z2 = 1 = −m0 c (−m0 c ds − qc Aν dxν ) dxµ d(δxµ ) − qc Aν d(δxν ) − qc (∂ µ Aν )(δxµ )dxν ds 2 −(m0 cuµ + qc Aµ )δxµ 1 Z2 + δxµ 1 2 µ dxν dxν d x − qc (∂ µ Aν ) m0 c 2 + qc (∂ ν Aµ ) ds . (4.17) ds ds ds Man erhält die Bewegungsgleichung des geladenen Teilchens wie gewohnt als Bestimmungsgleichung für den stationären Punkt von SM+WW bei einer Variation mit festgehaltenen Endpunkten: 2 µ d2 xµ 2d x = m c = quν (∂ µ Aν − ∂ ν Aµ ) = quν F µν = K µ . 0 dτ 2 ds2 Die Wirkung (4.12) beschreibt also tatsächlich die relativistische Dynamik eines geladenen Teilchens unter der Einwirkung der Lorentz-Kraft. Die relativistische Bewegungsgleichung kann alternativ auch in der Form m0 m0 d2 xµ dτ 2 = = d dπ µ (cuµ ) = γu dt dt K µ = qγu (E · βu , E + u × B) m0 γu 113 ---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK geschrieben werden. Mit π µ = m0 cuµ = γu m0 c(1, βu ) folgt daher einerseits für den dreidimensionalen kinetischen Impuls: dπ = q(E + u × B) , dt (4.18) π = γu m 0 u und andererseits für die zeitliche Änderung der Energie (4.16) des Teilchens durch Wechselwirkung mit dem elektromagnetischen Feld: d d dE = (γu m0 c2 ) = (π 0 c) = qE · u , (4.19) dt dt dt wobei das rechte Glied die Leistung darstellt, die das elektromagnetische Feld am Teilchen verrichtet. Da die Energieänderung unmittelbar aus (4.16) und der Bewegungsgleichung für den kinetischen Impuls folgt, c2 π · dπ dE q dt π · (E + u × B) = qE · u , = È = 2 dt γ 2 2 4 u m0 π c + m0 c und die zweite der beiden Gleichungen (4.18) und (4.19) daher redundant ist, reicht es, sich bei der Untersuchung der Dynamik eines geladenen Teilchens auf die erste dieser beiden Gleichungen zu beschränken. Interessant ist noch, dass auch die relativistischen Bewegungsgleichungen (4.18) und (4.19) invariant sind unter Zeitumkehr, da in diesem Fall (π, t, u, B) das Vorzeichen wechseln und q und E invariant sind. Analog findet man, dass (4.18) und (4.19) invariant sind unter einer Raumspiegelung am Ursprung, wobei die Felder gemäß E → −E und B → B transformiert werden. Abgesehen von diesen diskreten Symmetrien weist die Theorie zwei kontinuierliche Symmetrien auf, denn abgesehen von der offensichtlichen LorentzInvarianz der Wirkung liegt wiederum eine Eichinvarianz vor: Ersetzt man das 4-Potential Aµ durch (A′ )µ ≡ Aµ + ∂ µ Λ, wobei Λ - wie wir in der Theorie-1Vorlesung gesehen haben - unbedingt ein Lorentz-Skalar sein muss, damit der 4-Vektorcharakter von Aµ erhalten bleibt, dann wird die Wirkung gemäß S→S ′ = Z2 1 −m0 c ds − qc dxν (Aν + ∂ ν Λ) Z2 = S− q c Z2 ν 1 (∂ Λ)dxν = S − q c 1 dΛ = S − qc [Λ(2) − Λ(1)] transformiert. Man sieht also einerseits, dass sich bei einer Variation der Wirkung bei festgehaltenen Endpunkten nichts ändert: Die von S und S ′ vorhergesagten physikalischen Bahnen sind identisch. Andererseits ist klar, dass die Transformationseigenschaften der Wirkung sich nicht durch die Eichtransformation ändern: Die Wirkung S ′ ist Lorentz-invariant, wenn S dies ist, da die Funktion Λ in der Eichtransformation ein Lorentz-Skalar sein muss. 4.3 Das Coulomb-Problem für ein einzelnes Teilchen Wir betrachten nun die Dynamik eines geladenen relativistischen Teilchens (mit der Ladung q und der Ruhemasse m0 ) in einem Zentralpotential der Form 114 ---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK q0 mit x ≡ |x|; das Vektorpotential sei A(x) = 0. Dieses Modell Φ(x) = 4πε 0x beschreibt die Bewegung eines geladenen Teilchens im Coulomb-Feld eines anderen, immobilen Teilchens der Ladung q0 , das sich im Ursprung x = 0 befindet. Das 4-Potential Aµ = (Φ, cA) erfüllt im Ruhesystem der immobilen Masse sowohl die Coulomb- als auch die Lorenz-Eichung. Die Wirkung dieses Problems ist É Zt2 dt −m0 c S= t1 2 1− 2 ẋ c − qΦ(x) , die Bewegungsgleichung lautet dπ = qE dt , E = −∇Φ = π = γu m 0 u , q0 êx 4πε0 x2 , und es gibt zwei offensichtliche Erhaltungsgrößen, nämlich erstens den Drehimpuls L = x × π: d dπ dL = (x × π) = u × π + x × = x × (qE) = 0 dt dt dt È 0 und zweitens die Gesamtenergie Eg = π 2 c2 + m20 c4 − xa (mit a ≡ −qq 4πε0 ), die wegen der Zeitunabhängigkeit der Lagrange-Funktion gleich der HamiltonFunktion ist: dEg dt = dπ dt c2 π · È π 2 c2 + m20 c4 = u· − + a dx c2 π · (qE) a dx + 2 = 2 2 x dt γm0 c x dt a a a dx êx + 2 = 2 2 x x dt x dx − u · êx = 0 dt . Im nicht-relativistischen Grenzfall, Zt2 dt SNR = 2 1 2 m0 ẋ t1 − qΦ(x) , in dem π = m0 u gilt, existiert noch eine dritte Erhaltungsgröße, der „Lenz’sche Vektor“ a ≡ u × L − aêx , da =0 , dt a·L=0 , der vom Brennpunkt der elliptischen Bahn zum „Perihel“ (also zum Punkt der Umlaufbahn, der dem Zentrum am nächsten liegt) zeigt. Für EgNR < 0 sind alle Bahnen im nicht-relativistischen Grenzfall bekanntlich geschlossen. Wir bestimmen nun die Lösung der relativistischen Bewegungsgleichungen. Genau wie im nicht-relativistischen Fall ist es hierbei vorteilhaft, den Drehimpuls in ê3 -Richtung zu wählen und die Umlaufbahn, die nun in der (x1 , x2 )Ebene verläuft, mit Hilfe von Polarkoordinaten zu beschreiben: L = −m0 c2 È 1− 1 2 c2 (ẋ + x2 ϕ̇2 ) + a x . 115 ---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK Die zu x und ϕ konjugierten Impulse sind ∂L = γm0 ẋ ≡ πx ∂ ẋ , ∂L = γm0 x2 ϕ̇ ≡ πϕ ∂ ϕ̇ , und die Euler-Lagrange-Gleichungen lauten d ∂L = dt ∂ ẋ d ∂L = dt ∂ ϕ̇ dπx ∂L a = = γm0 xϕ̇2 − 2 dt ∂x x dπϕ ∂L = =0 . dt ∂ϕ Da die Lagrange-Funktion ϕ-unabhängig (und ϕ daher eine zyklische Variable) ist, stellt πϕ eine Erhaltungsgröße dar; im Wesentlichen ist πϕ durch den Drehimpuls gegeben: L = x × π = γm0 x × u = γm0 x × (ẋêx + xϕ̇êϕ ) = γm0 x2 ϕ̇(êx × êϕ ) = πϕ ê3 , so dass (wie im nicht-relativistischen Fall) πϕ = |L| gilt. Man zeigt nun leicht, dass Kreisbahnen nur dann möglich sind, wenn der dimensionslose Parameter ā ≡ πaϕ c Werte im Intervall 0 < ā < 1 annimmt: Für eine Kreisbahn (mit πx = γm0 ẋ = 0 und daher a = γm0 x3 ϕ̇2 > 0 und andererseits a = γm0 x3 ϕ̇2 = πϕ xϕ̇ = πϕ |u| = βu πϕ c dπx dt = 0) gilt nämlich einerseits , so dass insgesamt 0 < ā = βu < 1 gilt. Man sollte hierbei bedenken, dass der Parameter ā bei geeigneter Wahl der Ladungen q und q0 grundsätzlich jeden reellen Wert annehmen kann (ā ∈ R). Der Radius der Kreisbahn folgt für 0 < ā < 1 als: x= a ā|L|c |L| p 1 − ā2 = = γm0 |u|2 γm0 c2 βu2 m0 cā , so dass für ā ↑ 1 bei festem |L| offenbar x ↓ 0 gilt. Um die Form allgemeiner Bahnen zu bestimmen, verwenden wir die Erhaltungsgesetze für die Gesamtenergie Eg und den Drehimpuls L. Wegen π = γm0 (ẋêx + xϕ̇êϕ ) = πx êx + πϕ êϕ x gilt für die (erhaltene) Gesamtenergie: q È 2 a a + − = c (πx )2 + Lx2 + (m0 c)2 − Eg = x x und daher für den Impuls in radialer Richtung: π 2 c2 m20 c4 (πx )2 = (γm0 ẋ)2 = 1 a 2 L2 − 2 − (m0 c)2 E + g c2 x x . Dividiert man das linke und das rechte Glied nun durch (πϕ )2 = L2 , so erhält 1 man eine gewöhnliche Differentialgleichung für x(ϕ) : d(x−1 ) dϕ 2 = γm0 ẋ γm0 x2 ϕ̇ 2 = πx πϕ 2 = 2 m0 c 1 a 2 1 − E + − g πϕ2 c2 x x2 πϕ . 116 ---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK Mit Hilfe des dimensionslosen Parameters ā ≡ d(x−1 ) dϕ 2 a πϕ c erhalten wir den Ausdruck: = Eg2 − (m0 c2 )2 1 Eg ā 1 − (1 − ā2 ) 2 + 2 2 (πϕ c) x πϕ c x = Eg2 − (m0 c2 )2 Eg ā 1 − (1 − ā2 ) − (πϕ c)2 x πϕ c(1 − ā2 ) (4.20) 2 + Eg2 ā2 (πϕ c)2 (1 − ā2 ) Eg2 − (m0 c2 )2 (1 − ā2 ) 1 Eg ā − (1 − ā2 ) − 2 2 (πϕ c) (1 − ā ) x πϕ c(1 − ā2 ) = 2 . (4.21) Führen wir noch die dimensionslose Länge ξ≡ |a|m0 x |ā|m0 cx = 2 πϕ πϕ und die dimensionslosen Parameter r Eg η≡ m 0 c2 , 1− ε≡ 1 − η2 ā2 ein, dann erhalten wir für ā2 = 1 aus (4.20): dξ −1 dϕ 2 = sgn(ā) 2η + η2 − 1 ξ und für ā2 6= 1 aus (4.21): dξ −1 dϕ 2 = 1 sgn(ā)η ε2 − (1 − ā2 ) − 1 − ā2 ξ 1 − ā2 2 . Im Folgenden konzentrieren wir uns auf attraktive Coulomb-Wechselwirkung zwischen den beiden Ladungen, d. h. wir betrachten ā > 0. In diesem Fall erhalten wir die Gleichungen: dξ −1 dϕ dξ −1 dϕ 2 = 2η − (1 − η 2 ) ξ = η ε2 1 − (1 − ā2 ) − 1 − ā2 ξ 1 − ā2 2 (4.22) (ā = 1) 2 (0 < ā 6= 1) , (4.23) die leicht mit Standardmethoden lösbar sind. Die Lösung von (4.22) folgt aus È d(ξ −1 ) 2η ξ − (1 − η 2 ) q =d 1 η 2η ξ − (1 − η 2 ) = ±dϕ = d[±(ϕ − ϕ0 )] als 2η = η 2 (ϕ − ϕ0 )2 + (1 − η 2 ) bzw. ξ ξ= η 2 (ϕ 2η . (4.24) − ϕ0 )2 + (1 − η 2 ) Für η < 1 folgt ξ ↓ 0 für ϕ → ∞, so dass sich das Teilchen mit der Ladung q im Falle ā = 1 spiralförmig in das Anziehungszentrum im Ursprung hineinbewegt! 117 ---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK Das gleiche Ergebnis erhält man für η > 1, falls ẋ(0) < 0 (oder äquivalent: ϕ(0) > ϕ0 ) gilt. Falls η > 1 und ẋ(0) > 0 (oder äquivalent: ϕ(0) < ϕ0 ) gilt, verschwindet das Teilchen ins Unendliche (ξ → ∞ für t → ∞). Um Gleichung (4.23) für ξ(ϕ) mit ā 6= 1 zu lösen, führen wir die Hilfsvariablen X −1 |1 − ā2 | ≡ ε 1 η − ξ 1 − ā2 , Φ≡ È |1 − ā2 | ϕ ein und erhalten die Differentialgleichung dX −1 dΦ 2 = sgn(1 − ā2 )(1 − X −2 ) , deren Lösung für schwache Coulomb-Anziehung (0 < ā < 1) die Form X −1 = cos(Φ − Φ0 ) bzw. p © 1 1 2 (ϕ − ϕ ) η + ε cos 1 − ā = 0 ξ 1 − ā2 (4.25) und für starke Coulomb-Anziehung (ā > 1) die Form X −1 = cosh(Φ − Φ0 ) bzw. p © 1 1 = 2 −η + ε cosh ā2 − 1 (ϕ − ϕ0 ) ξ ā − 1 (4.26) hat. Die Lösung (4.26) im Falle starker Anziehung zeigt also dasselbe Phänomen ξ ↓ 0 für ϕ → ∞, das auch bereits aus der Lösung (4.24) für ā = 1 hervorging, allerdings sagt (4.26) keine algebraische Spirale (mit ξ ∝ ϕ−2 ), sondern exponen√ 2 tielles Verhalten voraus: ξ ∝ e− ā −1ϕ . Interessant an den Lösungen (4.24) und (4.26) für ā ≥ 1 ist noch, dass die Zeit, die das Teilchen der Ladung q benötigt, um in den Ursprung hineinzufallen, endlich ist. Außerdem ist interessant, dass für ā ≥ 1 und η ≥ 1 zwar ξ → ∞ gilt (wie man für einen Streuzustand erwartet), falls anfangs ϕ < ϕ0 ist; für einen Anfangswert ϕ > ϕ0 folgt jedoch ξ ↓ 0 für ϕ → ∞. Wir schließen hieraus, dass Zustände, die man nicht-relativistisch als Streuzustände klassifizieren würde, in der Relativitätstheorie durchaus gebunden sein können. Die Lösung für schwache Coulomb-Anziehung (ā < 1) zeigt einige Gemeinsamkeiten mit der nicht-relativistischen Lösung, aber auch drastische Unterschiede. Im nicht-relativistischen Limes (ā → 0, η → 1) reduziert sich die Lösung (4.25) auf die bekannte Form der nicht-relativistischen Umlaufbahn, ξ= x 1 = p 1 + ε cos(ϕ − ϕ0 ) p= L2 m0 a q , ε= 1+ 2ENR L2 m0 a2 , die für ε < 1 eine Ellipse, für ε = 1 eine Parabel und für ε > 1 eine Hyperbel beschreibt. Allgemein gilt für ā < 1 die von der nicht-relativistischen Lösung 118 ---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK bekannte Klassifizierung nach Bindungszuständen (η < 1), für die ξ immer endlich bleibt, und Streuzuständen (η ≥ 1), für die im Langzeitlimes ξ → ∞ gilt. Im Gegensatz zur nicht-relativistischen Lösung sind die relativistischen Umlaufbahnen jedoch im Allgemeinen nicht geschlossen und somit nicht-periodisch als Funktion der Zeit2 : ξ(ϕ + 2π) 6= ξ(ϕ) . Es ist klar, dass mit der Nicht-Geschlossenheit der Umlaufbahn auch der Verlust der dritten Erhaltungsgröße (also des Lenz’schen Vektors) einhergeht, denn der Lenz’sche Vektor markiert ja gerade die räumliche Ausrichtung der periodisch durchlaufenen Umlaufbahn. √ in Ausnahmefällen, z. B. wenn 1 − ā2 = m < 1 (mit m, n ∈ N+ teilerfremd) n gilt, erhält man geschlossene Bahnen; im angegebenen Beispiel enthält eine Periode genau n Umläufe um den Ursprung. 2 Nur 119 Literaturverzeichnis [1] Dare A. Wells, Lagrangian Dynamics, McGraw-Hill (New York, 1967). [2] Herbert Goldstein, Classical Mechanics, Addison-Wesley (Reading, 1978). [3] F. Scheck, Mechanik - Von den Newton’schen Gleichungen zum deterministischen Chaos, Springer Verlag (7. Auflage, 2002). [4] H. C. Corben, Philip Stehle, Classical Mechanics, Dover (New York, 1994). [5] Cornelius Lanczos, The variational principles of mechanics, Fourth Edition, Dover (New York, 1986). [6] L. D. Landau, E. M. Lifschitz, Lehrbuch der Theoretischen Physik, Band I, Akademie-Verlag (Berlin, 1981). [7] V. I. Arnold, Mathematical Methods of Classical Mechanics, SpringerVerlag (New York, 1978). [8] E. T. Whittaker, A treatise on the analytical dynamics of particles and rigid bodies, Cambridge Univ. Press (Cambridge, 1965). [9] F. Klein, A. Sommerfeld, Über die Theorie des Kreisels, B. G. Teubner (Stuttgart, 1965). [10] W. Rindler, Introduction to Special Relativity, Oxford University Press (Oxford, 1991). [11] R. U. Sexl, H. K. Urbantke, Relativity, Groups, Particles, Springer-Verlag (Berlin, 2001). [12] Carl D. Murray, Stanley F. Dermott, Solar System Dynamics, Cambridge University Press (Cambridge, 1999). [13] J. M. A. Danby, Fundamentals of Celestial Mechanics, Willmann-Bell (Richmond, Virginia, 1988). Mathematische Handbücher: [14] M. Abramowitz, I. A. Stegun, Handbook of Mathematical Functions, Dover (New York, 1970) ------------------------------------------------------------------------------------------------------------ LITERATURVERZEICHNIS [15] I. S. Gradshteyn, I. M. Ryzhik, Table of Integrals, Series and Products, Academic Press (New York, 1980) 121