Kapitel 7 Hamiltonsches Prinzip Kapitel 1 und 2 waren der Beschreibung von Bewegungen, der Kinematik gewidmet. Dabei wurde die Bewegung eines Teilches als gegeben betrachtet und die Frage nach der Ursache der Bewegung wurde nicht gestellt. Dies ist die Aufgabe der Dynamik, die die Änderung der gleichförmigen Bewegung auf Wechselwirkungen zwischen Teilchen und Feldern zurückführt, die als Kräfte beschrieben werden. In der klassischen Mechanik wurde dieser Zusammenhang das erste Mal in den Newtonschen Gesetzen formuliert. Wenn das zweite Newtonsche Gesetz in der Form F = mr̈r (7.1) geschrieben wird, erhält man eine Differentialgleichung zweiter Ordnung, die es erlaubt, die Position r (t) eines Teilchens zu jedem beliebigen Zeitpunkt t in der Zukunft oder in der Vergangenheit aus einem Satz von Anfangsbedingungen r (t0 ) und ṙr (t0 ), dem Ort und der Geschwindigkeit zu einer bestimmten Zeit t0 , zu bestimmen. Die Kraft F muss dabei an jedem Ort und zu jeder Zeit bekannt sein. Das zweite Newtonsche Gesetz kann man als differentiellen Ansatz ansehen, bei dem die Bahnkurve eines Teilchens dadurch berechnet wird, dass man die infinitesimale Änderung von Ort und Geschwindigkeit zu einem gegebenen Zeitpunkt bestimmt. Ein anderer Weg, die Bahnkurve zu berechnen, den man als integralen Ansatz bezeichnen könnte, besteht darin, zu untersuchen, wie sich der Wert eines Funktionals F [rr (t)] ändert, wenn die Bahnkurve r (t) variiert wird. Üblicherweise versucht man, für gegebene Wechselwirkungen, ein solches Funktional zu finden, das für die richtige Bahnkurve, also die Bahnkurve die tatsächlich durchlaufen wird, extremal wird. Solche Variationsprinzipien haben in der Physik eine lange Tradition. Der antike Mathematiker Heron von Alexandria formulierte etwa um die Zeitenwende ein Prinzip des kürzesten Weges für die Ausbreitung von Lichtstrahlen, um die Reflektion an Spiegeln zu erklären. Der arabische Mathematiker al-Haitham (965 bis etwa 1040) hat dieses Prinzip 1021 in ein Prinzip der kürzesten Zeit umformuliert, um auch die Brechung von Lichtstrahlen zu erklären. Der französische Mathematiker Pierre de Fermat (etwa 1600 bis 1665) formulierte 55 Abbildung 7.1: Brechung von Lichtstrahlen an Grenzflächen. das Prinzip der kürzesten Zeit 1662 in seiner modernen Form als Extremalprinzip, und ihm zu Ehren wird es auch als Fermatsches Prinzip bezeichnet. 7.1 Fermatsches Prinzip Im Rahmen der Wellenoptik lässt sich dieses Prinzip aus dem Huygenschen Prinzip ableiten, das besagt, dass jeder Punkt einer Wellenfront wieder Ausgangspunkt einer Kugelwelle ist. Wenn ein Weg für das Licht extremal ist (das heißt die Zeit, die das Licht für diesen Weg benötigt, ist minimal oder maximal - oder es liegt ein Sattelpunkt vor), dann ist die Laufzeit des Lichts auf diesem Weg in erster Ordnung gleich der Laufzeit des Lichts auf dicht benachbarten Wegen. Der Phasenunterschied von Lichtstrahlen auf diesen benachbarten Wegen verschwindet dann in erster Ordnung und es kommt zu konstruktiver Interferenz. Bei anderen Wegen, die nicht extremal sind, weisen Lichtstrahlen auf benachbarten Wegen einen Phasenunterschied auf, und es kommt zu destruktiver Interferenz. Abbildung 7.1 veranschaulicht dies am Bespiel der Brechung an der Grenzfläche zwischen zwei Medien mit unterschiedlicher optischer Dichte. Für den Lichtstrahl 3 wird die Laufzeit minimal, und der Phasenunterschied zwischen Lichtstrahl 3 und 4 verschwindet, so dass diese Strahlen konstruktiv interferieren. Die Lichtstrahlen 1 und 2 können dagegen wegen eines Phasenunterschieds destruktiv interferieren. 7.2 Interferenz Betrachten wir ein mikroskopisches Teilchen, das durch eine Wellenfunktion ψ = Aeiφ beschrieben wird. Wir nehmen an, dass sich die Welle ψ auf allen möglichen Wegen ausbreitet, und dass es dabei zu destruktiver und konstruktiver Interferenz kommen kann. Sowohl der Vorfaktor A als auch die Phase φ hängen von Ort r und Zeit t ab. Der Einfachheit halber gehen wir aber davon aus, dass sich A nur sehr langsam mit r und t ändert. Die Interferenz zwischen zwei Wellen, die verschiedene Wege genommen haben, hängt dann nur von der Phase ab, die wir in der Form φ = k · r − ωt (7.2) 56 schreiben. Dabei ist ω = 2πν die Kreisfrequenz und k der Wellenvektor mit dem Betrag |k| = 2π/λ. Längs eines infinitesimalen Wegstückes dr ändert sich die Phase dann um dφ = k · dr − ω dt (7.3) Das Wegstück können wir in Abhängigkeit vom Impuls p = m dr/dt als dr = vdt = pdt/m schreiben, wobei m die Masse des Teilchens ist. Für die Änderung der Phase erhalten wir dann 1 k · p − ω dt . (7.4) dφ = m Um die Abhängigkeit der Phasenänderung von der Energie E und dem Impuls p des mikroskopischen Teilchens zu erhalten, verwenden wir die Planckformel E = h̄ω (mit h̄ = h/2π) und die de-Broglie-Wellenlänge λ = h/|p|. Für den Impuls schreiben wir dann p = h̄k. Die Phasenänderung lautet dann 1 p2 − E dt . (7.5) dφ = h̄ m Identifizieren die Differenz aus kinetischer Energie (T = p2 /2m) und potentieller Energie (V = E − T ) als Lagrange-Funktion L = T − V , dann folgt dφ = 1 L dt . h̄ (7.6) Durch Integration über die Zeit erhalten wir dann die Phasendifferenz zwischen den Zeitpunkten t1 und t2 : 1 t2 φ2 − φ1 = L dt . (7.7) h̄ t1 Das Integral auf der rechten Seite von (7.7) bezeichnen wir als Wirkung t2 S= L dt . (7.8) t1 Damit zwei Wellen konstruktiv interferieren können, müssen sie die gleiche Phasendifferenz φ2 − φ1 aufweisen, das heißt die Wirkung (7.8) muss gleich sein. Nehmen wir an, eine Welle nimmt einen Weg, für den die Wirkung extremal wird, das heißt benachbarte Wege führen zu praktisch der gleichen Wirkung. In diesem Fall wird sich die Welle mit allen Wellen, die auf benachbarten Wegen gelaufen sind, konstruktiv interferieren, das heißt die Wahrscheinlichkeit, das Teilchen auf diesem Weg zu finden ist groß. Wenn die Wirkung sehr groß gegenüber h̄ ist, wie das bei makroskopischen Teilchen der Fall ist, dann führen schon kleine Abweichungen von dem Weg mit extremaler Wirkung zu destruktiver Interferenz, und das Teilchen ist nur längs einer scharf abgegrenzten Bahn zu finden. 57 7.3 Hamiltonsches Prinzip Ein Teilchen, dessen Bewegung auf die x-Achse beschränkt sei, befinde sich zum Zeitpunkt t1 am Ort x1 und zur Zeit t2 am Ort x2 . Das Hamiltonsche Prinzip besagt nun, dass es mindestens eine Funktion L(x, ẋ) gibt, so dass die Bahnkurve x(t) zwischen diesen beiden Randpunkten derart verläuft, dass die Wirkung S, die durch das Integral t2 L(x, ẋ, t) dt, (7.9) S= t1 definiert wird, minimal wird, sofern die Zeitpunkte t1 und t2 nicht zu weit voneinander entfernt sind. Die tatsächlich durchlaufene Bahnkurve x(t) unterscheidet sich also von allen anderen Bahnkurven dadurch, dass sie zu einer kleineren Wirkung S führt. Wenn wir die einschränkende Bedingung für die Länge des Zeitintervalls t2 − t1 weglassen wollen, müssen wir das Hamiltonsche Prinzip etwas allgemeiner formulieren: die Wirkung wird dann für die tatsächliche Bahnkurve stationär, das heißt es wird entweder die kleinstmögliche oder die größtmögliche Wirkung erzielt, oder aber die Wirkung hat eine Art von verallgemeinertem Wendepunkt. Die Wirkung ist mathematisch gesehen ein Funktional, das heißt in diesem Fall die Abbildung aus der Menge möglicher Bahnkurven auf die Menge der reellen Zahlen. Obwohl in der Definition der Wirkung, (7.11), auch die Ge˙ auftaucht, verwenden wir nur die Bahnkurve x(t) als Argument schwindigkeit x(t) dieses Funktionals, S = S[x(t)] (7.10) denn die Geschwindigkeit ẋ(t) wird eindeutig durch die Bahnkurve x(t) bestimmt. Das Hamiltonsche Prinzip fordert nur die Existenz einer geeigneten Funktion L, die wir im Folgenden als Lagrange-Funktion bezeichnen werden, sagt aber nichts darüber aus, wie diese Funktion aussieht. Wir werden später allgemeine Eigenschaften der Lagrange-Funktion festlegen. Wie diese aber genau aussieht, hängt von den betrachteten physikalischen Objekten ab, die untersucht werden, und von den Wechselwirkungen zwischen diesen Objekten. Wir können das Hamiltonsche Prinzip leicht für die Bewegung eines Teilchens im dreidimensionalen Raum verallgemeinern, indem wir in (7.9) die x-Koordinate durch den Ortsvektor r ersetzen. Die Wirkung lautet dann t2 S= L(r, ṙ, t) dt . (7.11) t1 7.4 Bewegung im unbeschleunigten System Betrachten wir als Beispiel die kräftefreie Bewegung einer einzelnen, punktförmigen Masse m. Wenn wir uns speziell in einem Inertialsystem befinden, schreiben 58 Abbildung 7.2: Verlauf der Geschwindigkeit für einen freien Massenpunkt. wir die Lagrangefunktion versuchsweise als Differenz L = T − V zwischen der kinetischen Energie T und der potentiellen Energie V . Im Abschnitt (??) finden wir einige Gründe für diese Wahl. Die potentielle Energie können wir in diesem Fall gleich Null setzen, so dass die Lagrangefunktion gleich der kinetischen Energie ist, m (7.12) L = v2 . 2 Befindet sich das Teilchen zu den Zeitpunkten t1 und t2 an den Orten r1 und r2 , dann ist die Wirkung durch m t2 2 S= v dt (7.13) 2 t1 gegeben. Intuitiv kann man schon erkennen, dass die rechte Seite von (7.13) minimal wird, wenn die Geschwindigkeit konstant ist und damit gleich der Durcht schnittsgeschwindigkeit v = t12 v dt. Jede Abweichung von der Durchschnittsgeschwindigkeit macht das Integral nur größer aber nie kleiner. Diese intuitive Erwartung lässt sich auch ohne großen Aufwand beweisen, indem wir die Wirkung in zwei Summanden aufspalten, m t2 2 v dt (7.14) S = 2 t1 m t2 2 S = −v + v2 + v2 dt 2 t1 m t2 2 S = −v + 2vv + (v − v)2 dt 2 t1 m m t2 2 S = (t2 − t1 )v + (v − v)2 dt , 2 2 t1 von denen der erste Summand konstant und der zweite entweder größer als Null ist oder gleich Null ist. Der zweite Fall tritt ein, wenn sich der Massenpunkt zu jedem Zeitpunkt mit der konstanten Durchschnittsgeschwindigkeit v bewegt. Die geradlinig-gleichförmige Bewegung, r(t) = r1 + (t − t1 )v, ist also genau die Bahnkurve, die die Wirkung (7.13) des kräftefreien Massenpunktes minimiert. Diese 59 Bahn, die gerade Verbindung, ist gleichzeitig auch der kürzeste Weg, den der Massenpunkt von r1 zu r2 nehmen kann. Hier sehen wir eine Analogie zum Fermatschen Prinzip, nach dem das Licht sich in Bereichen mit konstanter Lichtgeschwindigkeit den kürzesten Weg zwischen zwei Punkten wählt. Für den einfachen Spezialfall der kräftefreien Bewegung eines Massenpunktes haben wir gesehen, dass das Hamiltonsche Prinzip zum gleichen Ergebnis führt wie die Newtonsche Mechanik. Später werden wir sehen, dass dies für alle mechanischen Systeme gilt. 7.5 Bewegung im beschleunigten System Das Hamiltonsche Prinzip gilt auch in Nicht-Inertialsystemen. Allerdings müssen wir dann die Lagrangefunktion entsprechend transformieren. Bleiben wir bei dem einfachen Beispiel der kräftefreien Bewegung eines einzelnen Massenpunktes, den wir aber diesmal in einem Koordinatensystem S’ beschreiben wollen, das gegenüber dem ursprünglich gewählten Inertialsystem konstant mit a beschleunigt ist. Die Koordinaten im beschleunigten System S’ lauten dann 1 r = r′ + at2 2 und v = v′ + at , (7.15) sofern die Geschwindigkeit klein gegenüber der Lichtgeschwindigkeit ist, und wir die Galilei-Transformation anwenden dürfen. Wenn wir den Ausdruck für v aus Gleichung (7.15) in die Lagrangefunktion (7.12) einsetzen, erhalten wir für die Lagrangefunktion L′ im beschleunigten System m m L′ (v′ ) = L(v) = v2 = (v′ + at)2 (7.16) 2 2 Wie wir im folgenden Abschnitt zeigen werden, führt diese Lagrangefunktion im beschleunigten Koordinatensystem S’ auf die beschleunigte Bewegung v′ = v − at (7.17) wie wir es entsprechend der Transformationsgleichungen (7.15) erwarten. 7.6 Verallgemeinerte Koordinaten Bisher haben wir ausschließlich kartesische Koordinaten für die Beschreibung physikalischer Gesetze verwendet. Bei vielen physikalischen Gesetzen wird die Formulierung durch die Wahl der Koordinaten bestimmt. Das Hamiltonsche Prinzip dagegen, in seiner kürzesten Form durch δS = 0 (7.18) wiedergegeben, ist offenbar unabhängig von der Wahl der Koordinaten, die wir erst benötigen, wenn wir die Wirkung S explizit beschreiben wollen. Auch wenn 60 die Wirkung im Allgemeinen keine messbare Größe ist, nehmen wir doch an, dass die Wirkung unabhängig von der Wahl der Koordinaten sein soll, da sonst auch die Bewegungsgleichungen von der Wahl der Koordinaten abhängen würden. Die Tatsache, dass die Wirkung S nicht eindeutig ist, dass also verschiedene Wirkungen auf die gleiche Bewegungsgleichung führen können, ändert an dieser Betrachtung nichts. Um nun die Schlussfolgerungen aus dem Hamiltonschen Prinzip so allgemein wie möglich zu halten verwenden wir im Folgenden wo es möglich ist verallgemeinerte Koordinaten (auch generalisierte Koordinaten genannt). Dies gibt uns die Möglichkeit im konkreten Einzelfall solche Koordinaten zu verwenden, die eine möglichst einfache Beschreibung des konkret betrachteten Systems erlauben. Dies werden in der Regel Koordinaten sein, die die Symmetrien des Problems widerspiegeln. Bei Zentralkräften wie der Coulomb- oder der Gravitationskraft, die spährisch symmetrisch sind, also nur vom Abstand zum Zentrum abhängen, sind dies beispielsweise die Kugelkoordinaten r, θ und φ. Betrachten wir ein System aus N Massenpunkten, das durch die 3N kartesischen Koordinaten xi (i = 1, . . . , 3N ) und die dazugehörigen kartesischen Geschwindigkeiten ẋi beschrieben wird. Wenn wir dieses System gleichwertig durch 3N verallgemeinerte Koordinaten qj und verallgemeinerte Geschwindigkeiten q̇j beschreiben können, dann müssen die verallgemeinerten Koordinaten durch eineindeutige (oder bijektive) Funktionen fj aus den kartesichen Koordinaten erhalten lassen: qj = fj (x1 , . . . , x3N , t) mit j = 1, . . . , 3N . (7.19) Da die Funktionen fj bijektiv sein sollen, muss es Umkehrfunktionen gj geben, mit deren Hilfe man die kartesischen Koordinaten aus den verallgemeinerten Koordinaten erhält: xj = gj (q1 , . . . , q3N , t) mit j = 1, . . . , 3N . (7.20) Die verallgemeinerten Geschwindigkeiten q̇ erhalten wir durch Ableitung von (7.19) nach der Zeit: q̇j = dfj dt mit j = 1, . . . , 3N . (7.21) Durch Anwendung der Kettenregel folgt daraus q̇j = 3N ∂fj ∂xi i=1 ∂xi ∂t + ∂fj ∂t mit j = 1, . . . , 3N (7.22) mit j = 1, . . . , 3N . (7.23) oder q̇j = 3N ∂fj i=1 ∂xi ẋi + ∂fj ∂t 61 Die verallgemeinerten Geschwindigkeiten q̇j hängen also von den kartesischen Koordinaten xi und von den kartesischen Geschwindigkeiten ẋi ab. Das Entsprechende gilt auch für die kartesischen Geschwindigkeiten: ẋi = 3N ∂gi j=1 ∂qj q˙j + ∂gi ∂t mit i = 1, . . . , 3N . (7.24) Als besonders einfaches Beispiel betrachten wir die Beschreibung eines Massenpunktes, der sich in der x-y-Ebene bewegt, durch Polarkoordinaten r und φ. Die Transformationsgleichungen für die Koordinaten lauten y (7.25) r = x2 + y 2 und φ = arctan x sowie x = r cos φ und y = r sin φ . (7.26) Für die verallgemeinerten Geschwindigkeiten erhalten wir nach (7.23) xẋ + y ẏ ṙ = x2 + y 2 und φ̇ = −2 y ẋy + xẏ . x x2 + y 2 (7.27) Umgekehrt gilt für die kartesischen Geschwindigkeiten ẋ = ṙ cos φ − rφ̇ sin φ und ẏ = ṙ sin φ + rφ̇ cos φ . 7.7 (7.28) Lagrange-Gleichungen Für ein System, das durch N verallgemeinerte Koordinaten qi beschrieben wird, lässt sich das Wirkungsintegral (7.11) wie folgt verallgemeinern: t2 S= L(q1 , . . . , qN , q̇1 , . . . , q̇N , t) dt . (7.29) t1 Gesucht sind jetzt (als verallgemeinerte Bahnkurve) N Funktionen qi (t), für die die Wirkung S extremal wird. Diese Funktionen sind durch N gekoppelte Differentialgleichungen bestimmt, die als Lagrange-Gleichungen (oder genauer als Lagrange-Gleichungen 2. Art) bezeichnet werden: d ∂L ∂L − = 0 mit i = 1, . . . , N . (7.30) dt ∂ q̇i ∂qi Diese Lagrange-Gleichungen sind nichts anderes als die Verallgemeinerung der Euler-Lagrange-Gleichung (6.19) auf N Koordinaten angewandt auf das Minimierungsproblem δS = 0 für die in (7.29) definierte Wirkung. Ebenso wie das Hamiltonsche Prinzip sind auch die Lagrange-Gleichungen unabhängig von der Wahl der Koordinaten. Um das Verhalten eines physikalischen Systems im Ablauf der Zeit zu beschreiben, können wir nach dem folgenden Schema vorgehen: 62 • Zunächst muss die (oder besser eine) für das System passende LagrangeFunktion gefunden werden. Durch diesen Schritt ist physikalische Beschreibung des Systems bereits festgelegt. • Mit Hilfe der Lagrange-Gleichungen werden dann die Bewegungsgleichungen aufgestellt. • Im letzten Schritt müssen die Bewegungsgleichungen gelöst werden, was häufig nur näherungsweise oder nur mit numerischen Verfahren möglich ist. 7.8 Zusammenfassung Das Hamiltonsche Prinzip besagt, dass sich die Bahnkurve, die ein Teilchen durchläuft, durch die Variation eines Funktionals bestimmen lässt. Ein solches Funktional ist die Wirkung t2 S= L(x, ẋ, t) dt , (7.31) t1 die durch Integration einer (nicht notwendigerweise eindeutigen) LagrangeFunktion L festgelegt wird. Für die tatsächlich durchlaufene Bahnkurve x(t) liefert das Funktional der Wirkung einen extremalen Wert, so dass die Variation der Wirkung für diese Bahnkurve verschwindet: δS = 0 . (7.32) Das bedeutet, dass kleine Änderungen der Bahnkurve in erster Näherung die Wirkung nicht ändern. Unterstellt man dem Teilchen Wellencharakter, dann interferieren benachbarte Bahnkurven konstruktiv. Um für ein konkretes Problem die Bahnkurve zu bestimmen, muss eine passende Lagrange-Funktion gefunden werden, die alle Wechselwirkungen des Teilchens mit seiner Umgebung berücksichtigt. Die Suche nach der richtigen LagrangeFunktion ist gleichwertig mit der Suche nach physikalischen Gesetzen zur Beschreibung von Wechselwirkungen, denn diese Gesetze lassen sich mit dem Variationsprinzip δS = 0 aus der Lagrange-Funktion gewinnen. Wir vermuten, dass sich die Lagrange-Funktion in vielen Fällen als Differenz aus kinetischer und potentieller Energie schreiben lässt: L=T −V . (7.33) Für ein freies Teilchen in einem Inertialsystem führt diese Vermutung zum ersten Newtonschen Gesetz. 63 Das Hamiltonsche Prinzip lässt sich auch auf Nichtinertialsysteme anwenden. In diesen Fällen muss die Lagrange-Funktion entsprechend der Beschleunigung des Bezugssystem angepasst werden, was gleichwertig zur Einführung von Trägheitskräften für Nichtinertialsysteme ist. Das Hamiltonsche Prinzip ist auch unabhängig von der Wahl der Koordinaten. Beschreibt man ein System durch einen beliebigen Satz von verallgemeinerten Koordinaten qi , lautet die Wirkung t2 L(q1 , . . . , qN , q̇1 , . . . , q̇N , t) dt . (7.34) S= t1 Die Bedingung, dass die Variation dieser Wirkung für eine bestimmte N dimensionale Bahnkurve (q1 (t), . . . , qN (t)) verschwindet, ist äquivalent zu den N Lagrange-Gleichungen für die verallgemeinerten Koordinaten: ∂L d ∂L = 0 mit i = 1, . . . , N . (7.35) − dt ∂ q̇i ∂qi 64