Kapitel 1 Grundlagen: Newtonsche Mechanik 1.1 Einleitung Mit der Entwicklung der klassischen Mechanik begann die moderne Physik. Die klassische Mechanik befasst sich mit der Vorhersage der Bewegung materieller Körper. Die wesentlichen Grundlagen wurden von Isaak Newton im 17. Jahrhundert gelegt und haben bis heute ihre Gültigkeit. Allerdings muss man sich dabei auch bewusst machen, dass die Gültigkeit der Newtonschen Mechanik nicht universell ist. Wenn die Geschwindigkeiten sehr groß werden, wird die Newtonsche Mechanik durch die spezielle Relativitätstheorie ersetzt. Wenn die Entfernungen kosmische Ausmaße annehmen, benötigt man die allgemeine Relativitätstheorie. Wenn umgekehrt die Entfernungen auf atomare Skalen kommen, muss man die Quantenmechanik anwenden. Und wenn die Teilchenzahlen von der Größenordnung 1023 sind und die Teilchen sich chaotisch bewegen, benötigt man zur Beschreibung makroskopischer Variablen die statistische Mechanik. In diesem ersten Kapitel wiederholen wir nach einem historischen Rückblick die wesentlichen Elemente der Newtonschen Mechanik, die schon von der Experimentalphysik I und der Einführung in die Theoretische Physik vertraut sind. Da viele Aufgaben in der Newtonschen Mechanik, insbesondere wenn Zwangsbedingungen vorliegen, recht aufwändig zu lösen sind, hat man schon recht bald nach Newton andere Formulierungen der klassischen Mechanik entwickelt, in denen sich diese Probleme leichter lösen lassen. Gleichzeitig gewähren diese Formulierungen tiefere Einblicke in die Eigenschaften der klassischen Mechanik, und sie enthalten wichtige Konzepte und Prinzipien, die auch in anderen Gebieten der Theoretischen Physik eine zentrale Rolle spielen. Mit diesen anderen Formulierungen der Mechanik, mit allgemeinen Prinzipien, und mit speziellen Themen werden wir uns in den weiteren Kapiteln dieser Vorlesung befassen. 1.2 Kleiner historischer Überblick Einen wichtigen Beitrag zur Entwicklung der klassischen Mechanik leistete die Astronomie und das Bestreben, die Planetenbahnen zu verstehen. Schon in der Antike wurde vereinzelt ein heliozentrisches Weltbild vertreten, so z.B. von Aristarch von Samos (ca 310-230 v. Chr.), der auch beeindruckende Überlegungen zur Berechnung von Größe und Abstand von Sonne und Mond anstellte. Das heliozentrische Weltbild konnte sich aber nicht gegen das von Ptolemäus (85-165 n.Chr.) vertretene geozentrische Weltbild behaupten. Ein wichtiger Grund hierfür war die fehlende Fixsternparallaxe (das ist eine scheinbare Veränderung der Position der Fixsterne am Himmel im Jahresverlauf). Ptolemäus beschrieb die Planetenbahnen durch Epizyklen (Kreisbahnen auf Kreisbahnen) und konnte unter Verwendung von mehr als 80 solcher Kreise eine beeindruckend große Genauigkeit in der Vorhersage der Planetenbewegung erzielen. Das Ptolemäische Weltbild war fester Bestandteil der mittelalterlichen Weltsicht und war durch viele plausible Argumente untermauert. Als Kopernikus (1473-1543) das heliozentrische Weltbild vor- 3 schlug, gab es daher lange anhaltenden Widerstand. Es dauerte deutlich länger als 100 Jahre, bis das heliozentrische Weltbild anfing sich durchzusetzen. Kopernikus und andere Vertreter dieses Weltbilds argumentierten mit der größeren Einfachheit (man benötigte nur noch 34 Kreise) und dem grösseren Erklärungspotenzial (mehrere unabhängige Fakten, wie z.B. die scheinbare Umlaufdauer der Planeten um die Erde und die generelle Gestalt der Bahnen, konnten nun durch eine gemeinsame Erklärung begründet werden). Die Gegner argumentierten wie schon in der Antike mit der fehlenden Fixsternparallaxe, dem Ruhen der Atmosphäre und mit der Beobachtung, dass senkrecht nach oben geworfene Steine wieder am Ausgangsort landen. Durch die Berechnungen von Johannes Kepler (1571-1630) und die Beobachtungen von Galileo Galilei (1564-1642) wurden die Argumente für das heliozentrische Weltbild immer stärker. Als schließlich Issac Newton (1642-1727) die Planetenbahnen aus der Gravitationskraft zwischen der Sonne und den Planeten, verbunden mit dem Newtonschen Bewegungsgesetz, ableiten konnte, war kein Widerstand gegen das heliozentrische Weltbild mehr möglich. Interessant an all diesen historischen Entwicklungen ist auch, dass sowohl die Vertreter des ptolemäischen Weltbildes, als auch die des heliozentrischen Weltbildes ihre Überzeugungen mit religiösen Argumenten untermauerten. Meist weiß man nur um den Widerstand der katholischen Kirche gegen Galilei. Doch dies gibt einen falschen Eindruck von dem sehr komplexen Verhältnis zwischen Christentum und Wissenschaft. Als positives Beispiel kann man Johannes Kepler anführen. Seine Suche nach den Gesetzen der Planetenbewegung war durch seinen Glauben motiviert. Er war nämlich davon überzeugt, dass Gott ein großer Mathematiker ist und die Welt deshalb nach mathematischen Gesetzen geschaffen hat, und dass der Mensch, weil er Gottes Ebenbild ist, diese Gesetze herausfinden kann. 1.3 Grundlegende Begriffe der Newtonschen Mechanik Die grundlegenden Variablen in der Newtonschen Mechanik sind Raum ~r und Zeit t, Masse m und Kraft F~ . Der Raum ist bei Newton dreidimensional, unbegrenzt und euklidisch. Körper können in diesem Raum ruhen oder sich in ihm bewegen. Die Zeit ist bei Newton eine absolute Zeit, die für jeden Beobachter gleich schnell dahinströmt. Wie wir heute wissen, ist die Vorstellung eines absoluten Raums und einer absoluten Zeit nicht zutreffend. Dies lehrt uns, dass die Vorstellungen über das Wesen der Welt, die man sich aufgrund einer Theorie macht, falsch sein können, auch wenn die mit dieser Theorie durchgeführten Berechnungen richtig sind. 1.4 Mechanik eines Teilchens In vielen Fällen ist es ausreichend, die Bewegung eines Körpers als Bahn eines Massepunktes zu beschreiben. Wenn allerdings Rotationen oder Deformationen wichtig werden, muss der Körper als ausgedehntes Objekt beschrieben werden. Eine Bahnkurve wird durch einen Vektor ~r(t) beschrieben. r Der entsprechende Geschwindigkeitsvektor ~v = ~r˙ ≡ d~ dt ist tangential zur Bahnkurve und berechnet sich als ~r(t) − ~r(t − ∆t) ~v (t) = lim ∆t→0 ∆t 4 Der Beschleunigungsvektor ist ~a = ~v˙ = ~r¨ ≡ d2 ~ r dt2 Das Newtonsche Bewegungsgesetz besagt: Es gibt Bezugssysteme (Inertialsysteme), in denen die Bewegung eines Teilchens der Masse m beschrieben wird durch d~ p d F~ = = (m~v ) dt dt (1.1) Hierbei ist p~ ≡ m~v der Linearimpuls. Seine zeitliche Änderung ist d (m~v ) = ṁ~v + m~a , dt woraus F~ = m~a folgt, wenn m konstant ist (was wir in der nichtrelativistischen Mechanik immer annehmen). In einem Intertialsystem bewegt sich folglich ein kräftefreies Teilchen geradlinig und mit konstanter Geschwindigkeit: m~r¨ = 0 ⇒ ~r(t) = ~r(0) + ~v (0)t Anmerkung: Über Kräftefreiheit zu entscheiden, ist oft nicht trivial. Das 1. Newtonsche Axiom besagt, Jeder Körper verharrt im Zustand der Ruhe oder gleichförmig ” geradlinigen Bewegung, solange keine Kraft auf ihn einwirkt“. Damit postuliert Newton die Existenz von p Intertialsystemen. Das Bewegungsgesetz F~ = d~ dt wird als 2. Axiom bezeichnet. Dieses gilt ebenso wie das erste Gesetz nur in Inertialsystemen. Das Newtonsche Bewegungsgesetz legt für eine gemessene Beschleunigung nur das Verhältnis von |F~ | zu m fest, definiert also weder F~ noch m. Die Bestimmung von m und damit F~ wird durch das 3. Axiom ( actio = reactio“) möglich: Die Wirkungen zweier Körper aufeinander sind stets gleich und von ” ” entgegengesetzter Richtung“. Übt Teilchen 1 auf Teilchen 2 die Kraft F~21 aus, so gilt dann: ~r¨ 1 ¨ ¨ ~ ~ m1~r1 = F12 = −F21 = −m2~r2 ⇒ m2 = m1 ~r¨2 Dies erlaubt die Bestimmung einer Masse m2 als Vielfaches einer bekannten (oder als Norm verwendeten) Masse m1 . Weitere Basisgrößen sind die Längeneinheit Meter (m) und die Zeiteinheit Sekunde (s). Außerdem gibt es eine Reihe von aus den Basisgrößen abgeleiteten Größen, wie zum Beispiel die Krafteinheit Newton (N = kg sm2 ). Aus den Newtonschen Gesetzen lassen sich mehrere Erhaltungssätze ableiten: 1. Linearimpuls p~: Wenn die Gesamtkraft Null ist, bleibt der lineare Impuls erhalten: d~ p = F~ = 0 ⇒ p~ = const dt ~ eines Teilchens um einen Punkt 0: Der Drehimpuls ist definiert als 2. Drehimpuls L ~ ≡ ~r × p~ . L 5 (1.2) Der Drehimpuls ändert sich, wenn ein Drehmoment ~ ≡ ~r × F~ N (1.3) angreift: ~ dL d d~r d~ p ~. = (~r × p~) = × p~ + ~r × = ~v × p~ +~r × F~ = N | {z } dt dt dt dt =0 Also ist ~ dL dt ~ = 0 ist. = 0, wenn N 3. Gesamtenergie T+V: Zunächst berechnen wir die an einem Teilchen geleistete Arbeit längs einer Kurve C Z F~ · d~r W12 = (1.4) C Das Kurvenintegral geht in ein gewöhnliches Integral über, falls die im Zeitintervall [t1 , t2 ] durchlaufene Kurve durch ~r(t) mit d~r(t) d~r(t) = dt = ~v (t)dt dt beschrieben wird (v ≡ |~v |): Z~r2 W12 = F~ (~r(t), ~v (t), t) · d~r ≡ Zt2 F~ (~r(t), ~v (t), t) · ~v (t)dt = m t1 ~ r1 Zt2 d~v m · ~v (t)dt = dt 2 t1 Damit ist W12 = Zt2 d 2 (v (t))dt . dt t1 m 2 (v − v12 ) ≡ T2 − T1 2 2 (1.5) gleich der Änderung der kinetischen Energie T ≡ m 2 v . 2 (1.6) Wir betrachten im Folgenden Kraftfelder F~ (~r), die nicht von der Geschwindigkeit abhängen. Ein solches Kraftfeld ist konservativ, wenn I F~ (~r) · d~r = 0 (1.7) C ist für jede geschlossene Kurve C. Für konservative Kräfte hängt die Arbeit nicht vom Weg ab, wie folgende Rechnung zeigt: F~ · d~r = C1 R R F~ · d~r + C1 −C2 F~ · d~r = C2 R I F~ · d~r + | {z } R C2 F~ · d~r =0 ~ × F~ = 0. Da Mit Hilfe des Stokesschen Satzes kann die Bedingung (1.7) geschrieben werden als ∇ die Rotation von Gradienten verschwindet, gilt ~ (~r) . F~ (~r) = −∇V Das skalare Feld V (~r) heißt Potenzial oder potenzielle Energie. 6 (1.8) Wer lieber zu Fuß rechnet mit explizit ausgeschriebenen Vektorkomponenten, kann folgende Beziehungen benutzen: Wir verwenden zeitlich konstante orthogonale Einheitsvektoren ~ex , ~ey , ~ez bzgl. eines Ursprungs. Damit ist x ~r = x~ex + y~ey + z~ez = y z und ∂ ∂x ∂ ∂y ∂ ∂z ~ × F~ = ∇ ∂Fz − Fx ∂yx × Fy = ∂F ∂z − ∂Fy Fz ∂x − und ∂Fy ∂z ∂Fz ∂x ∂Fx ∂y ∂V ~ (~r) = ∇V ∂V (~ r) ex ∂x ~ + ∂V (~ r) ey ∂y ~ + ∂V (~ r) ez ∂z ~ ∂x . = ∂V ∂y ∂V ∂z Wir drücken schließlich die oben berechnete Arbeit für konservative Kraftfelder durch das Potenzial aus: Zt2 Zt2 Zt2 d ~ ~ W12 = F · ~v (t)dt = − ∇V · ~v (t)dt = − ( V )dt = −(V (r~2 ) − V (r~1 )) . dt t1 t1 t1 Den vorletzten Schritt können wir mit Hilfe der Kettenregel nachvollziehen: ∂V dx ∂V dy ∂V dz d ~ · d~r . V (~r(t)) = + + ≡ ∇V dt ∂x dt ∂y dt ∂z dt dt Also folgt schließlich W12 = V1 − V2 (1.9) Daraus folgt mit (1.5) der Energieerhaltungssatz: W12 = T2 − T1 = V1 − V2 ⇔ T1 + V1 = T2 + V2 (1.10) Für konservative Kräfte ist die Summe aus kinetischer und potenzieller Energie konstant! Beispiel 1: x2 N Die Kraft F~ = (y, 2m , x + z) m bewege ein Teilchen zwischen den Punkten ~r1 = (2m, 0, 0) und ~r2 = (2m, 0, 4m). a) Berechne die geleistete Arbeit auf einer Geraden parallel zur z-Achse. b) Hängt die Arbeit von der Wahl des Weges zwischen den beiden Punkten ab? Lösung: a) Mit dem Einheitsvektor ~ez in z-Richtung gilt d~r = ~ez dz und Z~r2 W = ~ r1 F~ · d~r = 4m Z4m Z4m N 1 N F~ (2m, 0, z) · ~ez dz = (2m + z) dz = (2mz + z 2 ) = 16N m m 2 m 0 0 0 b) Die Arbeit hängt genau dann nicht vom Weg ab, wenn das Kraftfeld konservativ ist. Dazu muss die Rotation des Kraftfeldes verschwinden, d. h. es müssen die Integrabilitätsbedingungen ∂Fi /∂rk = ∂Fk /∂~ri (i, k = 1, 2, 3) erfüllt sein. Wir testen dies für i = x und k = y: N ∂Fy xN ∂Fx = 6= = 2 . ∂y m ∂x m 7 Also existiert kein Potenzial, und das Linienintegral ist wegabhängig. Beispiel 2: Skifahrer Die Anfangsgeschwindigkeit sei ~v (t = 0) = v~0 = 0. Was ist die Endgeschwindigkeit (ohne Reibung)? Lösung: Wir lösen diese Aufgabe mit Hilfe der Energieerhaltung. Wir haben nämlich mit F~ = m~g ein konservatives Kraftfeld. Bei z = h gilt: E1 = T1 + V1 = V1 = mgh . Bei z = 0 gilt: E2 = T2 + V2 = T2 = 1 mv 2 . 2 Also folgt aus der Energieerhaltung: mgh = p 1 mv 2 ⇒ v = 2gh . 2 Die Fallbeschleunigung beträgt im Mittel über die Erdoberfläche g = 9, 81 1.5 m . s2 Mechanik eines Systems von Teilchen Wir betrachten ein System aus N Teilchen, deren Orte und Massen wir mit r~i und mi bezeichnen, mit i = 1, 2, . . . , N . Eine Kraft auf das Teilchen i heißt innere Kraft, wenn sie von einem anderen Teilchen j ausgeht, sonst heißt sie äußere Kraft (F~ (ex) ). Hängt die innere Kraft, die zwei Teilchen aufeinander ausüben, nicht von der Anwesenheit eines dritten Teilchens ab, so heißt sie Zweikörperkraft, sonst Mehrkörperkraft. Für zentrale Zweikörperkräfte gilt für die vom Teilchen j auf Teilchen i ausgeübte Kraft (r = |~r|): ~rij F~ij (~rij ) = fij (rij ) , rij ~rij ≡ ~ri − ~rj . (1.11) Beispiele für zentrale Zweikörperkräfte sind die Coulombkraft zwischen zwei Ladungen e1 und e2 e1 e2 ~r12 F~12 = 2 r12 r12 (1.12) und die Gravitationskraft zwischen zwei Massen m1 und m2 m1 m2 ~r12 F~12 = −G 2 . r12 r12 Hierbei ist G die Newtonsche Gravitationskonstante G ' 6, 673 · 10−11 N m2 kg −2 . 8 (1.13) Das Potenzial der Gravitationskraft ist V12 = −G m1 m2 . r12 (1.14) ~ ij (r) Allgemein hängen die Potenziale Vij zu konservativen zentralen Zweikörperkräften F~ij (~r) = −∇V nur vom Abstandsbetrag r = |~r| ab. Dies zeigen wir folgendermaßen: ∂ ∂ ∂ ~ −∇Vij (r) = − Vij (r)~ex + Vij (r)~ey + Vij (r)~ez ∂x ∂y ∂z dVij (r) ∂r ∂r ∂r = − ~ex + ~ey + ~ez dr ∂x ∂y ∂z ~r = fij (r) ≡ F~ij (~r) r mit dVij (r) ∂r ∂ p 2 x , = x + y 2 + z 2 = etc. dr ∂x ∂x r Für Mehrteilchensysteme gilt der Schwerpunktsatz, der Drehimpulssatz, und der Energiesatz, die wir im Folgenden herleiten. fij (r) = − 1.5.1 Schwerpunktsatz Den Schwerpunktsatz erhalten wir ausgehend von den Bewegungsgleichungen d~ pi (ex) = F~i + dt X j mit F~ij für i = 1, ..., N . j6=i Für innere Kräfte gilt F~ij = −F~ji (actio = reactio). Es ist F~ii = 0. Also ist N X d~ pi i=1 dt = N X (ex) F~i + i=1 N X F~ij i,j=1 | {z } =0 Wir definieren den Gesamtimpuls P~ = N X p~i , i=1 die gesamte äußere Kraft (z.B. die Gewichtskraft) F~ (ex) = N X (ex) F~i , i=1 die Gesamtmasse M= N X mi i=1 und den Ortsvektor des Schwerpunkts N X ~ = 1 R mi~ri . M i=1 9 (1.15) Damit erhalten wir P~ = N X d mi~r˙i = M dt i=1 ! N 1 X mi~ri M i=1 {z } | ~ R also ~˙ . P~ = M R (1.16) Der Gesamtimpuls ist identisch mit dem Schwerpunktimpuls. Mit (1.15) folgt der Schwerpunktsatz ˙ ~¨ = F~ (ex) . P~ = M R (1.17) Der Schwerpunkt bewegt sich so, als ob die gesamte Masse in ihm vereint wäre und alle äußeren Kräfte an ihm wirken würden. 1.5.2 Drehimpulssatz ~ der N Teilchen Den Drehimpulssatz leiten wir ausgehend von der Formel für den Gesamtdrehimpuls L her. Unter Verwendung von (1.2) ergibt sich ~ = L N X N X ~i = L i=1 ~ri × p~i . (1.18) i=1 ~ (ex) ist die Summe der einzelnen Momente (1.3): Das äußere Gesamtdrehmoment N ~ (ex) = N N X (ex) ~ri × F~i . (1.19) i=1 Damit ist die Zeitableitung des Drehimpulses ~ dL dt = N N X X d d (~ri × p~i ) = ~ri × mi~r˙i dt dt i=1 i=1 N N N X X X (ex) F~ij = mi~r˙i × ~r˙i +mi~ri × ~r¨i = ~ri × F~i + | {z } i=1 = N X i=1 i=1 =0 (ex) ~ri × F~i + N X (~ri − ~rj ) × F~ij . j=1 (1.20) i<j Der letzte Term verschwindet für Zentralkräfte F~ij , da F~ij ∝ (~ri − ~rj ) und da F~ij = −F~ji . Also ist N X ~ dL ~ (ex) = ~i , =N N dt i=1 ~ i = ~ri × F~ (ex) , N i (1.21) d.h. die zeitliche Änderung des Gesamtdrehimpulses ist gleich dem Drehmoment aller äußeren Kräfte. Bisher bezogen sich alle Drehimpulse auf den Ursprung des Koordinatensystems. Man kann jedoch auch ein anderes Koordinatensystem K 0 einführen, dessen Ursprung im Massenschwerpunkt verankert ist. Dann gilt folgende Koordinatentransformation: ~ + ~ri 0 , ~ri = R 10 (1.22) wobei ~ri 0 die Darstellung des Ortsvektors in K 0 ist: X ~ri 0 = ri 0~ei 0 . (1.23) i Die Geschwindigkeiten transformieren sich gemäß ~ =R ~˙ V ~ + ~vi 0 , ~vi = V (1.24) und wir erhalten den Gesamtdrehimpuls ~ = L N X ~ri × p~i = i=1 N X ~ + ~ri 0 × V ~ + ~vi 0 mi R i=1 ~ ×V ~M + = R N X N X ~ + mi (~ri 0 × ~vi 0 ) mi~ri 0 ×V i=1 i=1 {z | } =0 ! N d X 0 ~ mi~ri . +R × dt i=1 | {z } (1.25) =0 Da sich alle Vektoren ~ri 0 auf den Schwerpunkt beziehen, verschwindet ~ + PN mi~ri 0 = M R), ~ und wir erhalten MR i=1 ~ =L ~ (Bahn) + L ~ (Eigen) = R ~ × P~ + L N X PN i=1 mi~ri 0 (wegen ~ri 0 × p~i 0 PN i=1 mi~ri = (1.26) i=1 Der Gesamtdrehimpuls setzt sich also zusammen aus dem Drehimpuls des im Schwerpunkt konzentrierten Systems (Bahndrehimpuls) und dem Drehimpuls der Bewegung bezüglich des Massenzentrums (innerer oder Eigendrehimpuls). Wir schließen daraus, dass der Gesamtdrehimpuls vom Koordinatenursprung abhängt. 1.5.3 Energiesatz Für zentrale Zweiteilchenkräfte können wir die Bewegungsgleichung des i-ten Teilchens schreiben als X (ex) ~i mi~r¨i = −∇ Vij + F~i . (1.27) j mit j6=i ~ i bedeutet hierbei den Gradienten bzgl. des Ortsvektors von Teilchen i. Multipliziert man Das Symbol ∇ die Gleichung skalar mit ~r˙i , so erhält man nach Summation über i N X i=1 N mi~r˙i · ~r¨i = 2 1 d X mi ~r˙i = − 2 dt i=1 = − d dt V ~ i Vij + ~r˙i · ∇ N X (ex) ~r˙i · F~i i=1 i,j=1,i6=j N N X X (ex) ~ i + ~r˙j · ∇ ~ j Vij + ~r˙i · ∇ ~r˙i · F~i . i<j=1 Mit N X (1.28) i=1 ~ · ~r˙ ergibt sich (~r(t)) = ∇V N N N 2 X 1 d X d X mi ~r˙i = − Vij + ~r˙i · F~ (ex) 2 dt i=1 dt i,j=1,i<j i=1 11 (1.29) oder N N N X X X d 1 (ex) 2 mi (~vi ) + Vij = ~vi · F~i . dt i=1 2 i,j=1,i<j i=1 (1.30) Wir definieren als innere Energie des Systems die Summe aller kinetischer Energien der Massenpunkte T = N X 1 i=1 2 mi~vi 2 (1.31) und potentieller Wechselwirkungsenergien der Zweiteilchenkräfte N X V = Vij (1.32) i,j=1,i<j und erhalten den Energiesatz N X d (ex) . (T + V ) = ~vi · F~i dt i=1 (1.33) Dieser besagt, dass die Änderung der inneren Energie eines N -Teilchensystems gleich der Gesamtleistung der äußeren Kräfte ist. 1.5.4 Die 10 Erhaltungsgrößen eines abgeschlossenen Systems Per definitionem verschwinden in einem abgeschlossenen System alle äußeren Kräfte. In diesem Fall ergeben sich folgende Erhaltungsgrößen: • Gesamtimpuls: dP~ =0 dt ~ = 1 P~ t + R ~ 0. Der Schwerpunkt bewegt sich gleichförmig: R M (1.34) • Gesamtdrehimpuls: ~ dL = 0, dt ~ =R ~ × P~ + L ~0 L (1.35) • (innere) Energie: dE = 0, E = T + V dt Die innere Energie ist jetzt identisch mit der Gesamtenergie. (1.36) ~ − 1 P~ t, P~ , L, ~ E} bilden die zehn klassischen Erhaltungsgrößen eines abgeschlossenen Die Größen {R M Systems. Wir werden später sehen, dass diese Erhaltungssätze allgemein für abgeschlossene Systeme gelten und letztlich allein aus den Raum-Zeit Postulaten der Newtonschen Mechanik herleitbar sind. Aufgaben 2 2 2 2 1. Gegeben ist ein Kraftfeld in zwei Dimensionen, F~ = axe−x −y ~ex + bye−x −y ~ey mit a, b ∈ R. (a) Welche Bedingung müssen a und b erfüllen, damit das Kraftfeld konservativ ist? 12 (b) Berechnen Sie für allgemeine a und b die Arbeit, die das Feld leistet, wenn ein Teilchen sich geradlinig von (x, y) = (0, 0) über (0, 1) nach (1, 1) bewegt. (c) Geben Sie (ohne Rechnung) die Arbeit an, die das Feld leistet, wenn das Teilchen sich geradlinig von (0, 0) über (1, 0) nach (1, 1) bewegt. Welche Bedingung müssen a und b erfüllen, damit die Arbeit in beiden Fällen gleich ist? 2. Ein Pendel der Masse m hängt an einer masselosen Stange der Länge l und ist so gelagert, dass es sich reibungsfrei um 360 Grad bzw 2π in der x − y-Ebene drehen kann. Die Gravitationskraft wirkt in −y-Richtung. Die Auslenkung aus der stabilen Ruhelage wird durch den Winkel ϕ beschrieben. ~ des Pendels um den Aufhängepunkt durch m, l und ϕ̇ aus. (a) Drücken Sie den Drehimpuls L (b) Das Pendel wird anfangs in die instabile Gleichgewichtslage ϕ = π gebracht und aus der Ruhe losgelassen. Berechnen Sie mit dem Energieerhaltungssatz die Geschwindigkeit ~v und ~ beim Durchgang durch den Punkt ϕ = 0. den Drehimpuls L (c) Nun wird das Pendel bei einer beliebigen Anfangsauslenkung ϕ0 losgelassen (mit Anfangsimpuls 0). Drücken Sie unter Verwendung der Energieerhaltung die Schwingungsperiode T als Integral aus. Dieses Integral lässt sich näherungsweise berechnen, indem man kleine ϕ0 betrachtet und den Integranden bis zur vierten Ordnung in ϕ0 bzw ϕ entwickelt. Was ergibt sich daraus für die Schwingungsperiode T ? (d) Zeichnen Sie in der ϕ − Lz -Ebene alle qualitativ verschiedenen Trajektorien, die das Pendel nehmen kann. Man nennt ein solches Bild ein Phasenraumportrait. 13 Kapitel 2 Zwangsbedingungen und das d’Alembert-Prinzip 2.1 Zwangsbedingungen Oft treten in der Mechanik Zwangsbedingungen auf, die den Newtonschen Bewegungsgleichungen mi~r¨i = F~i , i = 1, . . . , N geometrische Einschränkungen auferlegen. Dadurch wird die Zahl der Freiheitsgrade verringert, und sie beträgt nicht mehr 3N . Es erweist sich als zweckmäßig, die Koordinaten so zu wählen, dass sie möglichst gut zu den Zwangsbedingungen passen. Kartesische Koordinaten sind längst nicht immer die beste Wahl. Wir führen sogenannte verallgemeinerte (“generalisierte”) Koordinaten ein. Dies dürfen beliebige Größen sein, die die Konfigurationen eines mechanischen Systems kennzeichnen können. Sie müssen nicht die Dimension einer Länge haben. Wir kennen von den Zylinder- und Polarkoordinaten schon die Winkel als verallgemeinerte Koordinaten. Allgemein notieren wir verallgemeinerte Koordinaten mit qj , j = 1, . . . , 3N . Die kartesischen Koordinaten lassen sich als Funktionen der qj und der Zeit schreiben: xi = xi (q1 , . . . , q3N ; t), 2.1.1 yi = yi (q1 , . . . , q3N ; t), zi = zi (q1 , . . . , q3N ; t) . Klassifizierung von Zwangsbedingungen Holonome Zwangsbedingungen Holonome Zwangsbedingungen haben für ein System, das durch 3N verallgemeinerte Koordinaten festgelegt ist, die Form fi (q1 , . . . , q3N ; t) = 0 , i = 1, . . . , k mit k ≤ 3N . (2.1) In differenzieller Form wird dies zu dfi = X aij dqj + bi dt = 0 , j = 1, . . . , 3N (2.2) j mit ∂fi ∂fi , bi ≡ . ∂qj ∂t Wenn Zwangsbedingungen nur in differenzieller Form gegeben sind, kann man erkennen, dass sie holonom sind, indem man die Integrabilitätsbedingungen überprüft. Es muss nämlich gelten aij ≡ ∂ 2 fi ∂aij ∂ail ∂ 2 fi ∂aij ∂bi ≡ = ≡ und = . ∂ql ∂qj ∂ql ∂qj ∂qj ∂ql ∂t ∂qj 14 (2.3) Wenn es k holonome Zwangsbedingungen gibt, wird die Zahl der Freiheitsgrade auf 3N − k erniedrigt. Wir betrachten drei Beispiele: 1. Starrer Körper: In einem starren Körper können sich die Abstände zwischen den Punkten nicht ändern. Seine Lage wird durch drei körperfeste Punkte, die nicht auf einer Geraden liegen, eindeutig bestimmt. Diese drei Punkte haben feste Abstände |~ri − ~rj | (mit i, j = 1, 2, 3) voneinander, so dass sie zusammen nicht 9 sondern nur 6 Freiheitsgrade haben. Dies ist somit auch die Zahl der Freiheitsgrade des starren Körpers. 2. Zylinder mit Radius r, der auf einer Ebene rollt: Da der Zylinder die Richtung seiner Achse nicht ändern kann, betrachten wir einen zweidimensionalen Querschnitt, also eine Kreisscheibe, die auf einer Geraden rollt, die mit der x-Achse den Winkel α bildet. In einer zweidimensionalen Welt hat ein starrer Körper nur noch 3 Freiheitsgrade, für unsere Kreisschreibe sind dies z.B. die Koordinaten des Auflagepunkts (xA , yA ) und der Rollwinkel ϕ. Die Zwangsbedingungen sind xA − rϕ cos α = 0 und yA − rϕ sin α = 0 . (2.4) Es bleibt also ein Freiheitsgrad übrig. 3. Rutschende Perle auf rotierendem parabelförmigem Draht: Ein parabelförmiger Draht rotiere mit der Winkelgeschwindigkeit ω um die z-Achse. In Zylinderkoordinaten r, ϕ, z gelten für die Perle die folgenden Zwangsbedingungen: ϕ = ωt( oder ωt − π) und z − ar2 = 0 . (2.5) Hierbei ist a die (positive) Krümmung der Parabel am Ursprung. Es bleibt also ein Freiheitsgrad übrig. 2.1.2 Nicht-holonome Zwangsbedingungen Nicht-holonome Zwangsbedingungen sind geometrische Einschränkungen, die sich nicht durch Gleichungen zwischen den generalisierten Koordinaten und der Zeit darstellen lassen. Sie können die Form von Ungleichungen haben, oder sie können eine differenzielle Form haben, die nicht die Integrabilitätsbedingungen (2.3) erfüllt. Beispiele sind 15 1. Teilchen im würfelförmigen Kasten: hier gelten die Einschränkungen 0 ≤ x ≤ L , z≤L. 0 ≤ y ≤ L, 0≤ 2. Rollende Kreisschreibe: Eine Kreisschreibe ist ein starrer Körper und hat ohne Berücksichtigung der Zwangsbedingungen 6 Freiheitsgrade. Wenn man die Bedingung auferlegt, dass ein Punkt des Umfangs die Auflageebene berühren soll, bleiben 5 Freiheitsgrade. Wir wählen als verallgemeinerte Koordinaten die Koordinaten des Auflagepunktes (xA , yA ), die “Rollrichtung” ϕ (Winkel zwischen der x-Achse und der Schnittlinie von Scheibenebene und Boden), den Neigungswinkel ϑ der Scheibe und den Rollwinkel ψ. Die Rollbedingung (vgl. (2.4)) sorgt dafür, dass die Scheibe sich zu jedem Zeitpunkt in Richtung der momentanen Scheibenebene bewegt: dxA = −r dψ cos ϕ und dyA = −r dψ sin ϕ . (2.6) Da die Scheibenebene ihre Orientierung ändern kann, ist dies aber keine holonome Zwangsbedingung. Die Scheibe kann sich zwar immer nur in der Richtung bewegen, in der ihre Ebene zeigt, aber sie kann im Laufe der Zeit trotzdem jede durch die 5 Freiheitsgrade beschriebene Konfiguration einnehmen. Das ist wie bei einem Fahrrad: Man kann zwar immer nur in Richtung des Vorderrades fahren, aber indem man das Vorderrad geeignet dreht, kann man letztlich überall hinkommen, mit jeder gewünschten Fahrradorientierung und -neigung (naja....) und jedem gewünschten Drehwinkel der Räder. (Die Analogie zwischen Fahrrad und Kreisscheibe ist offensichtlicher, wenn man ein Einrad statt eines normalen Fahrrads betrachtet....). Division durch dt führt die Zwangsbedingungen (2.6) über in ẋA + rψ̇ cos ϕ = 0 , ẏA + rψ̇ sin ϕ = 0 . (2.7) Da es für ϕ keine Zwangsbedingung gibt (im Gegensatz zu obigem Beispiel mit dem rollenden Zylinder), lässt sich die Bedingung (2.6) bzw. (2.7) nicht integrieren. Nichtholonome Zwangsbedingungen, die eine differenzielle Form haben, haben allgemein die Gestalt X aij dqj + bi dt = 0 , (2.8) j bzw. X aij q̇j + bi = 0 . (2.9) j Die aij und bi erfüllen nicht die Bedingung (2.3). Sie haben die allgemeine Form aij = aij (q1 , . . . , q3N ; t) 16 bi = bi (q1 , . . . , q3N ; t) . (2.10) Sie hängen von den verallgemeinerten Koordinaten und der Zeit ab, aber nicht von den Geschwindigkeiten. Zwangsbedingungen, die die Zeit explizit enthalten, heißen “rheonom” (d.h. “fließend”), zeitunabhängige Zwangsbedingungen heißen skleronom (“starr”). Von den bisher genannten Beispielen ist nur das Beispiel mit der Perle auf dem rotierenden Draht (2.5) rheonom. 2.1.3 Zwangskräfte Aufgrund von Zwangsbedingungen gibt es neben den “inneren” (zwischen den Teilen des Systems wirkenden) und “äußeren” (von außen angreifenden) Kräften noch die sogenannten “Zwangskräfte”, die durch diejenigen Vorrichtungen ausgeübt werden, die für die Zwangsbedingungen verantwortlich sind. Wenn z.B. ein Buch auf einem Tisch liegt, übt die Tischfläche auf das Buch eine Zwangskraft aus, die der Gravitationskraft entgegengerichtet und ebenso groß wie diese ist, so dass das Buch auf dem Tisch ruht. Wenn es Zwangsbedingungen gibt, müssen diese Zwangskräfte in den Newtonschen Bewegungsgleichungen berücksichtigt werden: ~i , mi~r¨i = F~i + Z (2.11) ~ i die Zwangskraft auf das wobei F~i die Summe aus den äußeren und inneren Kräften darstellt und Z i-te Teilchen. Allgemeine Regeln zur Bestimmung der Zwangskräfte werden wir später formulieren. Für den Fall, dass wir es mit zeitunabhängigen Zwangsbedingungen zu tun haben (wie Berandungen, Verbindungsstangen, etc.), gilt die Regel, dass die Zwangskräfte insgesamt keine Arbeit verrichten dürfen. Wenn sie es täten, wäre der Energieerhaltungssatz verletzt und man könnte ein Perpetuum mobile bauen. Da den Berandungen und Stangen etc. keine Energie zugeführt wird, können sie auch keine abgeben. Um diese Bewegungsgleichungen zu lösen, muss man die Zwangskräfte entweder berechnen oder eliminieren. Dies kann man durch ein systematisches Vorgehen wie im Folgenden gezeigt durchführen. Mit Hilfe der k Zwangsbedingungen kann man die generalisierten Koordinaten auf 3N − k unabhängige Koordinaten reduzieren und die k Zwangskräfte eliminieren. Allerdings werden die Rechnungen recht schnell aufwendig, und wir werden im weiteren Verlauf der Vorlesung elegantere Methoden zum Lösen von mechanischen Aufgaben mit Zwangbedingungen kennenlernen. Beispiel 1: Teilchen im Kreiskegel Eine Punktmasse m gleitet reibungsfrei auf der Innenseite eines Kreiskegels. Die Gravitationskraft wirkt in negative z-Richtung. z g r ϕ y x (Bild stammt von http://www.semibyte.de/dokuwiki/nat/graphiken/physik/teilchen auf kreiskegel) Die Bewegungsgleichungen (2.11) sind mẍ = Zx ; mÿ = Zy ; mz̈ = Zz − mg . Wir wählen Zylinderkoordinaten (r, z, ϕ) als generalisierte Koordinaten. Die Zwangsbedingung ist r − z tan α = 0 , wobei α den Winkel der Zylinderwand mit der z-Achse darstellt (nicht im Bild eingezeichnet). Wir wählen r und ϕ als unabhängige Koordinaten. Dann gilt (x, y, z) = r(cos ϕ, sin ϕ, cot α) . 17 Also ist ẍ = r̈ cos ϕ − 2ṙϕ̇ sin ϕ − rϕ̈ sin ϕ − rϕ̇2 cos ϕ ÿ = r̈ sin ϕ + 2ṙϕ̇ cos ϕ + rϕ̈ cos ϕ − rϕ̇2 sin ϕ z̈ = r̈ cot α . Eingesetzt in die Bewegungsgleichungen gibt das Zx Zy Zz = m(r̈ cos ϕ − 2ṙϕ̇ sin ϕ − rϕ̈ sin ϕ − rϕ̇2 cos ϕ) = m(r̈ sin ϕ + 2ṙϕ̇ cos ϕ + rϕ̈ cos ϕ − rϕ̇2 sin ϕ) = m(r̈ cot α + g) . (2.12) (2.13) (2.14) Diese drei Gleichungen enthalten fünf Unbekannte: r(t), ϕ(t), Zx , Zy , Zz . Wir müssen also zum Lösen der Gleichungen noch weitere Informationen verwenden. Diese stecken in der Bedingung, dass die Zwangskräfte senkrecht auf den Wänden stehen (weil sie keine Arbeit verrichten). Also gilt q Zy cos ϕ = Zx sin ϕ und Zz = Zx2 + Zy2 tan α bzw. Zz cos ϕ = −Zx tan α. Wir subtrahieren die mit sin ϕ multiplizierte Gleichung (2.12) von der mit cos ϕ multiplizierten Gleichung (2.13) und erhalten 2ṙϕ̇ + rϕ̈ = 0 . (2.15) Addition der mit tan α multiplizierten Gleichung (2.12) und der mit cos ϕ multiplizierten Gleichung (2.14) ergibt (tan α + cot α)r̈ − rϕ̇2 tan α + g = 0 . (2.16) Wir haben also zwei gekoppelte Differenzialgleichungen für die beiden unabhängigen Variablen r und ϕ. (Bemerkung: Dieses Problem ist nur dann wohl definiert, wenn man davon ausgeht, dass die Geschwindigkeit des Teilchens eine von Null verschiedene Komponente in ϕ-Richtung hat. Sonst würde das Teilchen in der Kegelspitze landen, wo die Zwangsbedingung nicht mehr differenzierbar ist. Wir gehen also hier und bei allen später im Skript vorkommenden Rechnungen zu diesem Problem davon aus, dass es eine Geschwindigkeitskomponente in ϕ-Richtung gibt.) Beispiel 2: Rollpendel ohne Reibung: Der Aufhängepunkt eines Pendels sei in der x-Achse angebracht und mit einer Masse m1 versehen, die längs der x-Achse reibungsfrei gleiten kann. Die Pendelmasse m2 hängt an einem masselosen Faden der Länge l. Die 4 Koordinaten x1 , y1 , x2 , y2 , die die Position der Massen m1 und m2 beschreiben, unterliegen zwei Zwangsbedingungen, so dass nur zwei unabhängige Koordinaten übrigbleiben. Wir wählen als unabhängige generalisierte Koordinaten den Auslenkwinkel ϕ und die Position x1 der Masse m1 . Nach (2.11) lauten die Bewegungsgleichungen m1 ẍ1 = Z1x , m2 ẍ2 = Z2x , m1 ÿ1 = −m1 g + Z1y m2 ÿ2 = −m2 g + Z2y . 18 Die Zwangsbedingungen sind y1 = 0 und (x2 − x1 )2 + (y2 − y1 )2 = l2 . Wir eliminieren nun x2 und y2 via x2 = x1 + l sin ϕ , und ẍ2 = ẍ1 + y2 = −l cos ϕ d (lϕ̇ cos ϕ) = ẍ1 + lϕ̈ cos ϕ − lϕ̇2 sin ϕ dt und d (lϕ̇ sin ϕ) = lϕ̈ sin ϕ + lϕ̇2 cos ϕ . dt Die Bewegungsgleichungen für die unabhängigen Koordinaten x1 und ϕ sind dann ÿ2 = m1 g = Z1y m1 ẍ1 = Z1x m2 (ẍ1 + lϕ̈ cos ϕ − lϕ̇2 sin ϕ) = Z2x m2 (lϕ̈ sin ϕ + lϕ̇2 cos ϕ + g) = Z2y . (2.17) Die erste Gleichung ist keine Bewegungsgleichung und wird zur Bestimmung der Bahn nicht benötigt. Wir haben also 3 Gleichungen für die 5 Größen x1 , ϕ, Z1x , Z2x , Z2y . Allerdings sind die drei Zwangskraftkomponenten nicht unabhängig voneinander. Es ist nämlich Z1x = −Z2x und Z2x cos ϕ = −Z2y sin ϕ . Mit (2.17) folgt m1 ẍ1 = −m2 (ẍ1 + lϕ̈ cos ϕ − lϕ̇2 sin ϕ) und daraus (m1 + m2 )ẍ1 = m2 l(ϕ̇2 sin ϕ − ϕ̈ cos ϕ) . (2.18) Analog erhalten wir auch m2 (ẍ1 + lϕ̈ cos ϕ − lϕ̇2 sin ϕ) cos ϕ = −m2 (lϕ̈ sin ϕ + lϕ̇2 cos ϕ + g) sin ϕ und daraus ẍ1 cos ϕ + lϕ̈ + g sin ϕ = 0 . Also haben wir zwei gekoppelte Differenzialgleichungen für die beiden Variablen x1 und ϕ. 19 (2.19) 2.2 Das d’Alembert-Prinzip Um die Schwierigkeiten zu beseitigen, dass Zwangskräfte i.A. unbekannt sind, soll hier die Mechanik so formuliert werden, dass in ihr Zwangskräfte nicht auftreten. Diese neue Formulierung beruht auf der schon gemachten Feststellung, dass Zwangsflächen, Achsen, Stangen usw. nicht den Energieerhaltungssatz verletzen. Dies bedeutet, dass Zwangsbedingungen keine Arbeit leisten, es sei denn, sie werden durch Antriebe bewegt. Dann liegen aber rheonome Zwangsbedingungen vor. Durch einen Trick können wir erreichen, dass wir die von ihnen verrichtete Arbeit nicht berücksichtigen müssen: Wir betrachten nämlich sogenannte “virtuelle Verrückungen”, das sind mit den Zwangsbedingungen verträgliche Verschiebungen bei festgehaltener Zeit: Definition: Eine virtuelle Verrückung δ~ri des i-ten Teilchens ist eine Verschiebung mit den Eigenschaften • δ~ri ist infinitesimal • δ~ri ist mit den Zwangsbedingungen verträglich • δ~ri erfolgt instantan, d.h. dt = 0 (daher “virtuell”) Ein einfaches Beispiel ist eine Perle auf einem bewegten Draht: Der Draht sei parallel zu x-Achse und bewege sich mit Geschwindigkeit v in y-Richtung. Für reelle Verschiebungen d~r der Perle ist dt 6= 0, und bei einer reellen Verschiebung hat d~r eine von Null verschiedene y-Komponente. Eine virtuelle Verschiebung δr dagegen ist parallel zur x-Achse. Mit den Bewegungsgleichungen (2.11) ~i mi~r¨i − F~i = Z folgt N N X X ~ i · δ~ri (mi~r¨i − F~i ) · δ~ri = Z i=1 (2.20) i=1 Wir postulieren nun: Zwangskräfte verrichten in ihrer Gesamtheit keine virtuelle Zwangsarbeit, d.h. N X ~ i · δ~ri = 0 . Z (2.21) i=1 Das bedeutet, dass zeitunabhängige Zwangsbedingungen und festgehaltene zeitabhängige Zwangsbedingungen keine Arbeit verrichten. Zwangsbedingungen können nur dann Arbeit verrichten, wenn diese aktiv in das System hineingesteckt wird, indem Stangen, Berandungen etc. verschoben werden. Das d’Alembert-Prinzip (2.21) führt mit (2.20) auf die d’Alembert-Gleichung N X (mi~r¨i − F~i ) · δ~ri = 0 . (2.22) i=1 Sie enthält keine Zwangskräfte und ist zur Lösung von Problemen mit Zwangsbedingungen geeignet. 20 Beachte: Die Summanden in (2.22) dürfen nicht einzeln gleich Null gesetzt werden! Für k holonome Zwangsbedingungen mit unabhängigen Koordinaten qj , j = 1, . . . , 3N − k und der Transformation ~ri = ~ri (q1 , . . . , q3N −k ; t) , , i = 1, . . . N gilt δ~ri = 3N −k X j=1 ∂~ri δqj . ∂qj (2.23) In (2.23) tritt ∂~ri /∂t nicht auf, da δ~ri instantan ist. Einsetzen von (2.23) in (2.22) ergibt "N # 3N −k X X ∂~ri ¨ ~ (mi~ri − Fi ) · δqj = 0 . ∂qj j=1 i=1 Die ersten 3N − k Werte von δqj können unabhängig gewählt werden. (Die übrigen k Werte liegen dann eindeutig fest, weil die Zwangsbedingungen erfüllt sein müssen.) Insbesondere kann man auch alle bis auf einen der ersten 3N − k Werte von δqj zu Null setzen. Damit ergeben sich die d’Alembert-Gleichungen für holonome Zwangsbedigungen: N X ∂~ri (mi~r¨i − F~i ) · = 0, ∂qj i=1 j = 1, . . . 3N − k . (2.24) Anhand des Rollpendels können wir sowohl sehen, dass die Summanden in (2.21) der virtuellen Zwangsarbeit ungleich null sind, als auch dass sich die Bewegungsgleichungen der unabhängigen Freiheitsgrade mit den d’Alembert-Gleichungen sehr schnell herleiten lassen. ~1 = Z ~ Schiene + Die virtuellen Verrückungen sind δ~r1 und δ~r2 = δ~r1 + δ~r2rot . Die Zwangskräfte sind Z 1 ~ F aden und Z ~ 2 = −Z ~ F aden . Damit ergibt sich Z 1 1 ~ 1 · δ~r1 = (Z ~ 1Schiene + Z ~ 1F aden ) · δ~r1 = Z ~ 1F aden · δ~r1 Z Und ~ 2 · δ~r2 = −Z ~ 1F aden · (δ~r1 + δ~r2rot ) = −Z ~ 1F aden · δ~r1 . Z Die Summe dieser beiden Terme ist Null, wie es sein muss, aber die einzelnen Terme sind von Null verschieden (außer wenn ϕ = 0 ist). Die d’Alembert-Gleichungen für das Rollpendel sind (m1~r¨1 − F~1 ) · δ~r1 + (m2~r¨2 − F~2 ) · δ~r2 = 0 mit den äußeren Kräften F~1 F~2 = = −g~ey . m1 m2 21 Damit ergibt sich m1 ẍ1 δx1 + m2 [ẍ2 δx2 + (ÿ2 + g)δy2 ] = 0 . Transformation auf die unabhängigen Koordinaten x1 und ϕ führt zu den Ersetzungen x2 = x1 + l sin ϕ , y2 = −l cos ϕ und damit auf δx2 = δx1 + lδϕ cos ϕ , δy2 = lδϕ sin ϕ . Einsetzen ergibt wegen der Unabhängigkeit von δx1 und δϕ m1 ẍ1 + m2 ẍ2 = 0 und m2 [ẍ2 l cos ϕ + (ÿ2 + g)l sin ϕ] = 0 . Wenn wir jetzt noch ẍ2 und ÿ2 durch die unabhängigen Variablen ausdrücken, erhalten wir die Bewegungsgleichungen m1 ẍ1 + m2 (ẍ1 + lϕ̈ cos ϕ − lϕ̇2 sin ϕ) = 0 und ẍ1 cos ϕ + lϕ̈ + g sin ϕ = 0 . Dies sind die Gleichungen, die wir schon direkt aus den Newtonschen Gleichungen hergeleitet haben (siehe (2.18) und (2.19)), aber das war viel umständlicher. Auch das Beispiel mit dem Teilchen im Kreiskegel rechnen wir nun mit dem d’Alembert-Prinzip: Es ist (m~r¨ − m~g ) · δ~r = m[ẍδx + ÿδy + (z̈ + g)δz] = 0 . Wegen der Zwangsbedingung r − tan α = 0 sind nur zwei der drei Variablen unabhängig. In Zylinderkoordinaten (x, y, z) = r(cos ϕ, sin ϕ, cot α) sind die virtuellen Verschiebungen δx = δr cos ϕ − r sin ϕδϕ , δy = δr sin ϕ + r cos ϕδϕ δz = δr cot α . Damit lautet die d’Alembert-Gleichung [2ṙϕ̇ + rϕ̈]rδϕ + [(tan α + cot α)r̈ − rϕ̇2 tan α + g] cot αδr = 0 . (2.25) Wegen der Unabhängigkeit von δϕ und δr müssen beide eckige Klammern verschwinden, und wir erhalten die schon bekannten Bewegungsgleichungen (2.15) und (2.16). Wir erhalten also folgende Gebrauchsanweisung für Probleme mit holonomen Zwangsbedingungen: • Bestimmen der holonomen Zwangsbedingungen • Aufstellen der d’Alembert-Gleichungen • Einsetzen der unabhängigen virtuellen Verrückungen ~ ~ Für Systeme, die PNsich~ im ~Gleichgewicht befinden, verschwindet die Gesamtkraft Fi + Zi für jedes Teilchen, also gilt i=1 (Fi + Zi ) · δ~ri = 0. Mit dem d’Alembert-Prinzip (2.21) folgt N X F~i · δ~ri = 0 , i=1 22 (2.26) d.h. im Gleichgewicht verschwindet die virtuelle Arbeit aller eingeprägten Kräfte. Diese Bedingung kann benützt werden, um Gleichgewichtsprobleme zu lösen. Als Beispiel betrachten wir eine Leiter an der Wand: (das Bild habe ich von http://www.matheplanet.com/matheplanet/nuke/html/uploads/8/23028 leiter2.gif geklaut.) Eine Leiter der Länge L und Masse M steht an der Wand und wird von einer Frau der Masse m bis zur Länge l bestiegen. Die Leiter hat an beiden Enden Rollen, so dass keine Reibung gegen Wand und Boden auftritt. An ihrem unteren Ende ist ein Seil befestigt, um das Wegrutschen zu verhindern. Wie groß ist die Kraft F , mit der das Seil die Leiter hält? Es existieren 4 Zwangsbedingungen: L L cos µ , yS = sin µ . 2 2 Von den 5 Variablen xS , yS , xB , yB , µ ist also nur eine unabhängig. Wir wählen µ, das über die Beziehung xA = L cos µ mit dem Auflagepunkt xA zusammenhängt. Es gibt drei Kräfte, nämlich die Gravitationskraft der Frau, die am Punkt B angreift, die Gravitationskraft der Leiter, die am Schwerpunkt S angreift, und die Kraft, die die Leiter hält und am Auflagepunkt A angreift. Die Bedingung (2.26) lautet also xB = (L − l) cos µ , yB = l sin µ , xS = M~g · δ~rS + m~g · δ~rB + F~ · δ~rA = 0 bzw. − M gδyS − mgδyB − F δxA = 0 . Ausgedrückt durch die unabhängige Variable µ sind die virtuellen Verrückungen δxA = −L sin µδµ , so dass wir erhalten. Also ist δyB = l cos µδµ , δyS = L cos µδµ , 2 L −M g cos µ − mgl cos µ + F L sin µ δµ = 0 2 M l F = g cot µ +m . 2 L Aufgaben 1. Nennen Sie mehrere Beispiele für holonome und nicht holonome Zwangsbedingungen. 2. Leiten Sie das Hebelgesetz F1 r1 = F2 r2 aus der Gleichgewichtsbedingung (2.26) her. (Bild ist von http://wapedia.mobi/de/Hebelgesetz?t=2.) 3. (Diese Aufgabe entspricht Aufgaben 3-5 und 4-1 im Kuypers.) Betrachten Sie die Perle auf dem gebogenen rotierenden Draht (Abschnitt 2.1.1. aus dem Skript). Stellen Sie die Bewegungsgleichungen auf zwei Wegen auf: 23 (a) Gehen Sie wie in Abschnitt 2.1.3. vor und formulieren Sie zunächst die Newtonschen Gleichungen samt Zwangskräften. Eliminieren Sie dann die Zwangskräfte und gehen Sie zu unabhängigen Koordinaten über. (b) Gehen Sie wie in 2.2. vor. Starten Sie also mit den d’Alembert-Gleichungen. 24 Kapitel 3 Lagrange-Gleichungen zweiter Art 3.1 Herleitung Der folgende Lagrange-Formalismus zweiter Art ist zu d’Alembert mit holonomen Zwangsbedingungen äquivalent, jedoch bei der Aufstellung von Bewegungsgleichungen in der Praxis überlegen. Wir gehen aus von der d’Alembert-Gleichung (2.22), N X (mi~r¨i − F~i ) · δ~ri = 0, ~ri = ~ri (q1 , . . . , qn ; t), i = 1, . . . , N i=1 wobei die verallgemeinerten Koordinaten qj , j = 1, . . . , n voneinander abhängen dürfen. Mit der Ersetzung δ~ri = erhalten wir N X F~i · δ~ri = i=1 X ∂~ri δqj ∂qj j "N X X j # X ∂~ r i F~i · δqj ≡ Qj δqj . ∂qj i=1 j (3.1) Wir definieren also die verallgemeinerte Kraft Qj = N X ∂~ri F~i · . ∂q j i=1 (3.2) Wir machen weiterhin in der d’Alembert-Gleichung die folgende Umformung: "N # N n X X X ∂~ri ¨ ¨ δqj mi~ri · δ~ri = mi~ri · ∂qj i=1 j=1 i=1 n X N X ∂~ri d ∂~ri d ˙ ˙ = mi~ri · − mi~ri · δqj dt ∂qj dt ∂qj j=1 i=1 " ! # n X N X d ∂~r˙i ∂~r˙i ˙ ˙ = mi~ri · − mi~ri · δqj , dt ∂ q̇j ∂qj j=1 i=1 wobei für die letzte Umformung ~r˙i = X ∂~ri ∂~ri ∂~r˙i ∂~ri q̇j + ⇒ = ∂q ∂t ∂ q̇ ∂q j j j j 25 (3.3) und X ∂ 2~ri d ∂~ri ∂ 2~ri ∂ d~ri ∂~r˙i = q̇l + = ≡ dt ∂qj ∂ql ∂qj ∂t∂qj ∂qj dt ∂qj (3.4) l benutzt wurde. Mit der Notation ~vi = ~r˙i und vi = |~vi | ist demnach " ! # N N N X X d ∂ X1 ∂ X1 2 2 ¨ mi vi − mi vi δqj mi~ri · δ~ri = dt ∂ q̇j i=1 2 ∂qj i=1 2 i=1 j X d ∂T ∂T − δqj = dt ∂ q̇j ∂qj j mit der kinetischen Energie T = 1 2 P i (3.5) mi vi2 . Mit (3.1) und (3.5) folgt N X X d ∂T ∂T ¨ ~ (mi~ri − Fi ) · δ~ri = − − Qj δqj = 0 . dt ∂ q̇j ∂qj i=1 j (3.6) Wenn wir k holonome Zwangsbedingungen haben, also n = 3N − k unabhängige qj und daher auch n unabhängige δqj , dann folgt d ∂T ∂T − − Qj = 0 dt ∂ q̇j ∂qj j = 1, . . . , 3N − k . (3.7) Gleichung (3.7) gilt für beliebige verallgemeinerte Kräfte Qj . Mit der weiteren Annahme, dass Kräfte ~ i V ), gilt konservativ sind (d.h. F~i = −∇ Qj = N X N X ∂~ri ~ i V · ∂~ri , F~i ∇ =− ∂q ∂qj j i=1 i=1 j = 1, . . . , 3N − k . Letztes ist wegen ~ri = ~ri (q1 , . . . , q3N −k ; t) die partielle Ableitung der Potenzialfunktion V (~r1 , . . . , ~rN ): N X ∂V ~ i V · ∂~ri , ∇ = ∂qj ∂qj i=1 also Qj = − ∂V . ∂qj (3.8) Damit kann (3.7) geschrieben werden als d ∂T ∂(T − V ) − = 0. dt ∂ q̇j ∂qj Da das Potenzial V unabhängig von den generalisierten Geschwindigkeiten ist, d.h. ∂V /∂ q̇j = 0, können wir auch schreiben d ∂(T − V ) ∂(T − V ) − = 0. dt ∂ q̇j ∂qj Wir definieren nun die Lagrange-Funktion L=T −V 26 (3.9) und erhalten damit die Lagrange-Gleichungen zweiter Art d ∂L ∂L − =0 , dt ∂ q̇j ∂qj j = 1, . . . , 3N − k . (3.10) Die Lagrange-Gleichungen zweiter Art gelten auch für manche geschwindigkeitsabhängige, “generalisierte” Potenziale V = V (q1 , . . . , q3N −k , q̇1 , . . . , q̇3N −k ; t) , (3.11) und zwar dann, wenn die Kräfte sich in der Form Qj = − ∂V d ∂V + ∂qj dt ∂ q̇j (3.12) schreiben lassen. Ein wichtiges Beispiel hierfür ist die elektromagnetische Kraft auf eine bewegte Ladung e, die Lorentzkraft, die sich aus dem generalisierten Potenzial ~ V = e(φ − ~v · A) (3.13) ~ r, t) das Vektorpotenzial des Elektrodynamik ist. ableiten lässt, wobei φ(~r, t) das skalare Potenzial und A(~ (siehe Übungen.) 3.2 Gebrauchsanweisung Mit den Lagrange-Gleichungen zweiter Art lassen sich viele Mechanik-Aufgaben elegant lösen. Die Gebrauchsanweisung zur Aufstellung dieser Gleichungen ist folgende: (i) Schreibe L = T − V als Funktion der 3N kartesischen Koordinaten oder als Funktion von 3N geeigneten generalisierten Koordinaten q1 , . . . , q3N und der 3N Geschwindigkeiten q̇1 , . . . , q̇3N . (ii) Drücke die 3N Koordinaten durch 3N − k unabhängige generalisierte Koordinaten aus, bei k holonomen Zwangsbedingungen. (Bemerkung: Mit etwas Übung kann man oft die Lagrange-Funktion L direkt als Funktion der q1 , . . . , q3N −k schreiben. Dann kann man Schritt 1 überspringen.) (iii) Bestimme L als Funktion der unabhängigen Koordinaten, Geschwindigkeiten und evtl. der Zeit. (iv) Stelle die Lagrange-Gleichungen zweiter Art auf. 3.3 Beispiele Als Beispiel nehmen wir wieder das Teilchen im Kreiskegel und das Rollpendel. Die vier Schritte der Gebrauchsanweisung sind für das Teilchen im Kreiskegel die folgenden: z g r ϕ y x 27 (i) T −V = m 2 (ṙ + ż 2 + r2 ϕ̇2 ) − mgz 2 (ii) z = r cot α (iii) L= m (1 + cot2 α)ṙ2 + r2 ϕ̇2 − mgr cot α 2 (iv) d ∂L ∂L − dt ∂ ṙ ∂r d ∂L ∂L − dt ∂ ϕ̇ ∂ϕ = (1 + cot2 α)r̈ − rϕ̇2 + g cot α = 0 , = mr(2ṙϕ̇ + rϕ̈) = 0 . (2.16) (2.15) Für das Rollpendel sind die 4 Schritte: (i) T V m1 2 m2 2 ẋ + (ẋ + ẏ22 ) 2 1 2 2 = m2 gy2 + const = L = T −V (ii) x2 = x1 + l sin ϕ , y2 = −l cos ϕ (iii) ẋ2 = ẋ1 + lϕ̇ cos ϕ , ẏ2 = lϕ̇ sin ϕ L= m1 2 m2 2 ẋ + (ẋ + l2 ϕ̇2 + 2lẋ1 ϕ̇ cos ϕ) + m2 gl cos ϕ = const 2 1 2 1 = d [m1 ẋ1 + m2 (ẋ1 + lϕ̇ cos ϕ)] = (m1 + m2 )ẍ1 + m2 l(ϕ̈ cos ϕ − ϕ̇2 sin ϕ) = 0 dt (iv) d ∂L ∂L − dt ∂ ẋ1 ∂x1 d ∂L ∂L − dt ∂ ϕ̇ ∂ϕ = m2 l(lϕ̈ + ẍ1 cos ϕ + g sin ϕ) = 0 28 3.4 Lagrange-Formalismus mit Reibung Reibungskräfte sind wegabhängig und können nicht aus einem Potenzial V abgeleitet werden. Zu ihrer Beschreibung gehen wir von (3.7) für beliebige eingeprägte generalisierte Kräfte Qj aus (k holonome Zwangsbedingungen). Diejenigen Kräfte, die sich aus einem Potenzial ableiten lassen, berücksichtigen wir wieder in der Funktion L, und die Nicht-Potenzial-Kräfte bezeichnen wir mit Rj (diese müssen nicht notwendig Reibungskräfte sein). Wir erhalten dann eine erweiterte Gleichung (3.10): d ∂L ∂L − − Rj = 0 , dt ∂ q̇j ∂qj j = 1, . . . , 3N − k . (3.14) (R) Für Reibungskräfte F~i , i = 1, . . . , N , ist nach (3.2) Rj ≡ 3.4.1 N X ri (R) ∂~ F~i · . ∂q j i=1 (3.15) Einschub: Reibungstypen 1. Haftreibung: Die Haftreibungskraft hat einen maximalen Wert, bei dessen Überschreiten die Haftung endet und Gleiten beginnt. (R) FHaf t ≤ f0 N mit einer dimensionslose Haftreibungszahl f0 und der Normalkraft N , die z.B. die Zwangskraft ~ sein kann. N = |Z| 2. Gleitreibung: Der Betrag der Reibungskraft ist nahezu geschwindigkeitsunabhängig ~v F~ (R) = −f N v 3. Reibung in Fluiden (also Gasen und Flüssigkeiten): % ~v F~ (R) = −cw A v 2 2 v mit der Querschnittsfläche A des bewegten Objekts und der Dichte % des Fluids. Der Widerstandsbeiwert cw ist für große Geschwindigkeiten konstant, so dass die Reibungskraft proportional zu v 2 ist, und diese Reibung tritt in Form von Wirbeln und Turbulenzen auf. Für kleine v ist cw proportional zu 1/v, so dass die Reibungskraft proportional zu v wird. 3.4.2 Dissipationsfunktion Oft lassen sich Reibungskräfte auf das i-te Teilchen schreiben als ~vi (R) F~i = −hi (vi ) , vi vi ≡ |~vi | i = 1, . . . , N . (3.16) Mit (3.15) folgt: Rj = − N X hi (vi ) N ~vi ∂~ri (3.3) X ~vi ∂~vi · = − hi (vi ) · vi ∂qj vi ∂ q̇j i=1 hi (vi ) ∂vi . ∂ q̇j i=1 = − N X i=1 29 (3.17) Für die letzte Gleichung wurde benutzt: ~vi · ∂~vi 1 ∂(~vi · ~vi ) 1 ∂vi2 ∂vi = = = vi . ∂ q̇j 2 ∂ q̇j 2 ∂ q̇j ∂ q̇j Die sogenannte Dissipationsfunktion P erfüllt die Beziehung N X ∂P ∂vi ≡ hi (vi ) ∂ q̇j ∂ q̇j i=1 j = 1, . . . , 3N − k , (3.18) ∂P . ∂ q̇j (3.19) d.h. mit (3.17): Rj = − Nach (3.14) lautet die “Lagrange-Gleichung mit Reibung” dann d ∂L ∂L ∂P − + =0 . dt ∂ q̇j ∂qj ∂ q̇j (3.20) Die Dissipationsfunktion P kann gemäß (3.18) geschrieben werden als P = N Z X i=1 vi hi (v̂i )dv̂i , (3.21) 0 d.h. mit (3.21) gilt N N X ∂P ∂vi X ∂P ∂vi ∂ hi (vi ) = hi (vi ) ⇒ P = = ∂vi ∂ q̇j ∂v ∂ q̇ ∂ q̇j i j i=1 i=1 und daher (3.18). Wir betrachten ein Beispiel: Eine Masse m gleite mit Gleitreibung auf der (x, y)-Ebene. Es ist also F~ (R) = −f mg ~vv und damit h(v) = f mg. Also ist Z v p P = h(v̂)dv̂ = f mgv = f mg ẋ2 + ẏ 2 0 Es ist L=T −V =T = m 2 (ẋ + ẏ 2 ) . 2 Wir überprüfen noch die Gültigkeit von (3.20): d ∂L ∂L ∂P − + dt ∂ ẋ ∂x ∂ ẋ = d ∂L ∂L ∂P − + dt ∂ ẏ ∂y ∂ ẏ = ẋ =0 mẍ + f mg p 2 ẋ + ẏ 2 ẏ mÿ + f mg p =0 2 ẋ + ẏ 2 30 Wir wählen die x-Achse in ~v -Richtung, d.h. y = ẏ = ÿ = 0. Dann ist mẍ + f mg = 0 bzw. ẍ = −f g . Mit den Anfangsbedingungen x(0) = x0 und ẋ(0) = v0 ergibt sich 1 x(t) = x0 + v0 t − f gt2 , 2 wobei der maximale Wert von t, bei dem die Masse zur Ruhe kommt, durch die Bedingung ẋ(t) = v0 − f gt = 0 festgelegt ist, also tmax = fv0g . Aufgaben 1. Betrachten Sie die Perle auf dem gebogenen rotierenden Draht (Abschnitt 2.1.1. aus dem Skript), die auch auf dem vorigen Übungsblatt behandelt wurde. Stellen Sie die Bewegungsgleichungen auf, indem Sie die 4 Schritte der Gebrauchsanweisung für den Lagrange-Formalismus durchgehen. Sie haben nun diese Aufgabe auf drei verschiedene Arten gelöst. Welche fanden Sie am einfachsten? ~ ~ 2. Betrachten Sie ein Teilchen der Ladung e in einem homogenen E-Feld und B-Feld. ~ und B ~ und die Geschwindigkeit ~v des Teilchens (a) Drücken Sie die Kraft auf das Teilchen durch E aus. ~ der Elektrodynamik an, aus denen sich E ~ und (b) Geben Sie die zugehörigen Potenziale φ und A ~ ~ ~ ~ ~ ~ ~ B ermitteln lassen. (Zur Erinnerung: Es ist E = −∇φ − ∂ A/dt und B = ∇ × A. (c) Zeigen Sie, dass die drei Komponenten der Kraft auf das Teilchen sich schreiben lassen als ~ (Es reicht, wenn Sie das in kartesischen Qj = −∂V /∂qj + (d/dt)(∂V /∂ q̇j ) mit V = e(φ − ~v · A). Koordinaten zeigen.) 3. (= Aufgabe 2 Blatt 6 Berges-Uebungen) Eine Kugel mit Radius r und Masse m ist an einer Feder mit Federkonstante k befestigt und bewegt sich nur in z-Richtung. Die Kugel befinde sich in einer Flüssigkeit mit Viskosität η. Auf die Kugel wirkt die Stokessche Reibungskraft F (R) = −6πηrż , wobei ż die Geschwindigkeit der Kugel ist (der Auftrieb kann vernachlässigt werden). Auf die Kugel wirkt die Gewichtskraft in negativer z-Richtung. (a) Bestimmen Sie die Bewegungsgleichung der Kugel mit Hilfe des Lagrange-Formalismus mit Reibung. (b) Zum Zeitpunkt t = 0 befinde sich die Kugel im Abstand b von der Gleichgewichtslage in Ruhe. Lösen Sie die Bewegungsgleichung unter der Annahme k> 31 (3πηr)2 . m Kapitel 4 Symmetrien und Erhaltungssätze; Noether-Theorem 4.1 Forminvarianz der Lagrange-Gleichungen Die Lagrange-Gleichungen haben den großen Vorteil, dass sie für holonome Zwangsbedingungen wie geschaffen sind, und dass ihre Form immer dieselbe ist, egal welche Koordinaten und Bezugssysteme man verwendet. Dies ist bei den Newtonschen Gleichungen nicht so. Für die Bewegung in einem Zentralpotenzial lauten die Gleichungen in Polarkoordinaten nämlich nicht mr̈ = −∂V /∂r und mr2 ϕ̈ = −∂V /∂ϕ = 0, wie man bei Forminvarianz erwarten würde, sondern m(r̈ − rϕ̇2 ) = −∂V /∂r und mr(rϕ̈ + 2ṙϕ̇) = 0 . (Herleitung geht am schnellsten über Lagrange, mit T = m(ṙ2 + r2 ϕ̇2 )/2 und V = V (r).) Auch beim d’Alembert-Prinzip müssen Beschleunigungen und Verrückungen umständlich auf die generalisierten Variablen umgerechnet werden. Wir zeigen jetzt explizit, dass die Lagrange-Gleichungen unter Punkttransformationen invariant sind, also dass sie in allen Koordinaten- und Bezugssystemen die gleiche Form haben: Wir betrachten die “alten” Koordinaten {qi }, für die die Lagrange-Gleichungen gelten sollen, und wir wechseln zu neuen Koordinaten {Qj }, die mit den alten Koordinaten über die Beziehungen qi = qi (Q, t) zusammenhängen. Wir verwenden im folgenden öfter die vereinfachte Schreibweise q bzw. Q für {qi } bzw. {Qj }. Es gilt q̇i = 3N −k X j=1 ∂qi ∂qi Q̇j + . ∂Qj ∂t Daraus folgt die für das Folgende wichtige Beziehung ∂ q̇i ∂qi . = ∂Qj ∂ Q̇j (4.1) Die Lagrange-Funktion in den neuen Koordinaten nennen wir L0 (Q, Q̇, t), und sie hängt mit der “alten” Lagrange-Funktion zusammen über h i L0 (Q, Q̇, t) = L q(Q, t), q̇(Q, Q̇, t), t . (4.2) Wir müssen jetzt noch zeigen, dass auch mit der neuen Lagrange-Funktion und den neuen Koordinaten die Lagrange-Gleichungen gelten. Dazu berechnen wir 3N −k X ∂L ∂qi ∂L ∂ q̇i ∂L0 = + ∂Qj ∂qi ∂Qj ∂ q̇i ∂Qj i=1 32 und 3N −k 3N −k X ∂L0 ∂L ∂ q̇i (4.1) X ∂L ∂qi = = ∂ q̇i ∂ Q̇j ∂ q̇i ∂Qj ∂ Q̇j i=1 i=1 und folglich 3N −k X d ∂L0 d ∂L ∂qi ∂L ∂ q̇i = + , dt ∂ Q̇j dt ∂ q̇i ∂Qj ∂ q̇i ∂Qj i=1 woraus die Lagrange-Gleichungen in den neuen Koordinaten folgen: ∂L0 d ∂L0 − = 0, dt ∂ Q̇j ∂Qj j = 1, . . . , 3N − k . (4.3) Die Forminvarianz der Lagrange-Gleichungen ist sehr nützlich. Dadurch kann man leicht und schnell die Bewegungsgleichungen in allen Koordinatensystemen und auch in beschleunigten Bezugssystemen aufstellen. Auch zur Konstruktion von Erhaltungsgrößen ist der Lagrange-Formalismus wie geschaffen. Kontinuierliche Transformationen, die die Lagrange-Funktion invariant lassen, deuten auf Erhaltungsgrößen hin, wie wir im nächsten Teilkapitel sehen werden. Darüber hinaus ist der Lagrange-Formalismus für die klassische Feldtheorie von großer Bedeutung. 4.2 Zyklische Koordinaten und Erhaltungssätze Die Lösung der aufgestellten Bewegungsgleichungen erfordert für jede Gleichung, die zweiter Ordnung in der Zeit ist, zwei Integrationen. Bei vielen Problemen kann man mehrere erste Integrale der Bewegungsgleichungen sofort erhalten, d.h. Beziehungen der Form f (q1 , q2 , . . . ; q̇1 , q̇2 , . . . ; t) = konst für alle Lösungen qj (t) von (3.10). Dazu gehören die in Kapitel 1 abgeleiteten Erhaltungssätze. Ist L = T − V von einer bestimmten Koordinate nicht explizit abhängig, so findet man mit den Lagrange-Gleichungen zweiter Art sofort eine Erhaltungsgröße: ∂L d ∂L d ∂L − = =0 dt ∂ q̇j ∂qj dt ∂ q̇j ⇒ ∂L = konst . ∂ q̇j (4.4) Eine Koordinate qj heißt zyklisch, wenn q̇j in L = T − V auftritt, nicht jedoch qj . Nach (4.4) ist also der sogenannte konjugierte Impuls (oder kanonische Impuls) pj ≡ ∂L ∂ q̇j (4.5) eine Erhaltungsgröße, wenn qj eine zyklische Variable ist. Wir betrachten zwei Beispiele, eines mit und eines ohne zyklische Variablen: • Wurf: Es ist 1 m(ẋ2 + ẏ 2 + ż 2 ) − mgz , 2 d.h. x und y sind zyklisch. Die entsprechenden Erhaltungsgrößen sind L=T −V = px = ∂L = mẋ , ∂ ẋ 33 py = ∂L = mẏ . ∂ ẏ • Pendel: Es ist T = 1 1 m(ẋ2 + ẏ 2 ) = ml2 ϕ̇2 2 2 und V = mgy + konst = −mgl cos ϕ + konst und damit 1 2 2 ml ϕ̇ + mgl cos ϕ + konst . 2 Die einzige unabhängige Variable, ϕ, ist nicht zyklisch, und folglich ist der Drehimpuls pϕ = ∂L/∂ ϕ̇ = ml2 ϕ̇ nicht erhalten. L= Bemerkungen: (i) Ist qj keine kartesische Koordinate, so hat pj nicht notwendig die Dimension eines Impulses. Das Produkt pj qj hat aber immer dieselbe Dimension, nämlich die einer Wirkung, also kg m2 s−1 . (ii) Für geschwindigkeitsabhängige Potenziale wird der konjugierte Impuls nicht mit dem üblichen mechanischen Impuls identisch sein. Für das Teilchen im elektromagnetischen Feld (3.13) gilt L= 1 ˙2 ~ r) · ~r˙ m~r − eφ(~r) + eA(~ 2 (4.6) und damit ∂L = mẋ + eAx . (4.7) ∂ ẋ Der letzte Term ist ein Zusatzterm, der den mechanischen Impuls vom kanonischen Impuls verschie~ unabhängig von ~r sind, so ist ~r zyklisch und (4.7) eine Erhaltungsgröße. den macht. Wenn φ und A px = (iii) Es besteht ein enger Zusammenhang zwischen Erhaltungsgrößen und Symmetrien. Ist ein physikalisches System invariant unter einer Verschiebung qj → qj0 = qj + α, so hängt L nicht explizit von qj ab, und pj ist eine Erhaltungsgröße. So impliziert zum Beispiel eine Invarianz des Systems unter Translationen ~r → ~r0 = ~r + α~a die Impulserhaltung. (Siehe den Abschnitt 4.5 zum NoetherTheorem.) (iv) Zu L(q, q̇, t) kann die totale zeitliche Ableitung einer Funktion addiert werden, ohne die LagrangeGleichungen zu ändern: d L0 (q, q̇, t) = L(q, q̇, t) + f (q, t) . (4.8) dt Wir zeigen dies, indem wir nachrechnen, dass d ∂ df ∂ df − =0 dt ∂ q̇j dt ∂qj dt ist. Es ist nämlich X ∂f d ∂f f (q, t) = q̇j + dt ∂q ∂t j j 34 und damit X ∂2f ∂ df ∂f d ∂ df ∂2f = und = q̇l + ∂ q̇j dt ∂qj dt ∂ q̇j dt ∂ql ∂qj ∂t∂qj l und X ∂2f ∂2f ∂ df = q̇l + , ∂qj dt ∂qj ∂ql ∂t∂qj l was derselbe Ausdruck wie in der Zeile darüber ist. Koordinatentransformationen, die L bis auf eine totale Zeitableitung einer Funktion invariant lassen, heißen Symmetrietransformationen. 4.3 Hamiltonfunktion Hängt L nicht explizit von der Zeit ab, ∂L/∂t = 0, dann gilt X X dL X ∂L ∂L d ∂L ∂L d ∂L = q̇j + q̈j = q̇j + q̈j = q̇j . dt ∂qj ∂ q̇j dt ∂ q̇j ∂ q̇j dt ∂ q̇j j j j Also ist die sogenannte Hamiltonfunktion H≡ X ∂L q̇j − L ∂ q̇j j (4.9) eine Erhaltungsgröße, d.h. dH/dt = 0, wenn ∂L/∂t = 0 ist. Als Beispiel betrachten wir eine gleitende Perle auf einem rotierenden, geraden Draht. Die Zwangsbedigung ϕ − ωt = 0 mit ω = konst ist rheonom. Wegen V = 0 gilt L = T = E. Die Lagrange-Funktion ist 2 2 ! m 2 m d d m L = (ẋ + ẏ 2 ) = (r cos ϕ) + (r sin ϕ) = (ṙ2 + r2 ω 2 ) = E 6= konst , 2 2 dt dt 2 und die Hamiltonfunktion ist H= m ∂L ṙ − L = (ṙ2 − r2 ω 2 ) = konst , ∂ ṙ 2 da ∂L/∂t = 0 ist. Wir können dies auch explizit nachrechnen: Aus den Lagrange-Gleichungen zweiter Art erhalten wir mit den Anfangsbedingungen r(0) = a und ṙ(0) = 0 die Lösung r(t) = a cosh(ωt) und ṙ(t) = aω sinh(ωt). Also ist m E = a2 ω 2 (sinh2 (ωt) + cosh2 (ωt)) = E(t) 2 und m H = a2 ω 2 (sinh2 (ωt) − cosh2 (ωt)) = konst . | {z } 2 =−1 35 4.4 Energieerhaltung Da Zwangskräfte in der Lagrangeschen Mechanik eliminiert sind, kann die reale Zwangsarbeit rheonomer Zwangsbedingungen nicht berücksichtigt werden. Folglich lässt sich für rheonome Zwangsbedingungen aus L nicht E = konst ableiten, wie das vorige Beispiel zeigt. Es gilt der folgende Satz: Wenn L nicht explizit zeitabängig ist, ist H konstant und entspricht für skleronome, holonome Zwangsbedingungen und konservative Kräfte der Gesamtenergie, d.h., H =E =T +V . (4.10) Wir wir gesehen haben, sind aber im Allgemeinen die Bedingungen H = konst und H = E zwei verschiedene Sachverhalte. Wir zeigen, dass für konservative Kräfte und zeitunabhängiges L die Hamiltonfunktion H = T + V ist, indem wir benützen, dass ∂V /∂ q̇j = 0 ist (woraus ∂L/∂ q̇j = ∂T /∂ q̇j folgt), und indem wir T durch die unabhängigen Koordinaten qj ausdrücken: T = N X mi i=1 2 ~r˙i2 = 2 N X ∂~ri X ∂~ri ∂~ri 1 X ∂T 1 XX q̇j = q̇j = q̇l q̇j . mi 2 ∂qj 2 j i=1 ∂ql ∂qj 2 j ∂ q̇j j l {z } | N X mi i=1 (4.11) ∂T /∂ q̇j Damit ist H= X ∂T X ∂L q̇j − L = q̇j − L = 2T − L = T + V = E . ∂ q̇j ∂ q̇j j j Nun haben wir genügend Werkzeuge erarbeitet, um mit Hilfe der Erhaltungsgrößen das Lösen der Bewegungsgleichungen zu vereinfachen. Wir nehmen wieder das Beispiel des Teilchens im Kreiskegel: Die Lagrange-Funktion hatten wir schon hergeleitet: m (1 + cot2 α)ṙ2 + r2 ϕ̇2 − mgr cot α . 2 Sie hängt nicht explizit von ϕ ab, also ist ϕ eine zyklische Variable und L=T −V = pϕ = ∂L = mr2 ϕ̇ = konst ∂ ϕ̇ (4.12) eine Erhaltungsgröße. Dies sieht man auch anhand der Bewegungsgleichung (2.15), die ja mr(2ṙϕ̇+rϕ̈) = d 2 dt mr ϕ̇ = 0 lautet. Es gibt noch eine zweite Erhaltungsgröße, nämlich die Energie, deren Ausdruck sich von demjenigen für L nur durch das Vorzeichen des Potenzialterms unterscheidet: m E =T +V = (1 + cot2 α)ṙ2 + r2 ϕ̇2 + mgr cot α = konst . (4.13) 2 36 Auch diese Gleichung können wir aus den Bewegungsgleichungen herleiten, doch das ist umständlicher: Wir setzen (4.12) in (2.16) ein und multiplizieren mit ṙm cot α und erhalten # # " " p2ϕ p2ϕ ṙ d m 2 2 2 + gmr cot α = 0 . (1 + cot α)ṙ + m (1 + cot α)ṙr̈ − 2 3 + g ṙ cot α = m r dt 2 2mr2 Die zwei Gleichungen (4.12) und (4.13) sind Differenzialgleichungen erster Ordnung für die beiden unabhängigen Variablen r(t) und ϕ(t). Auflösen der Gleichung (4.13) nach dt und Integration ergibt Z 1 dr q t=± . (4.14) p2ϕ sin α 2 E − − mgr cot α m 2mr 2 Für Bahnbereiche, in denen r(t) wächst (fällt), ist das positive (negative) Vorzeichen zu nehmen. Diese Gleichung liefert r(t). Nach ihrer Berechnung kann ϕ(t) mit Hilfe der Gleichung (4.12) ermittelt werden: Z pϕ dt ϕ(t) = . (4.15) 2 m r (t) Wir haben also gesehen, dass aufgrund der beiden Erhaltungsgrößen nur noch zwei Integrationen zur Berechnung des Bahnverlaufs nötig sind. Wir werden insbesondere im Zusammenhang mit der Planetenbewegung den Vorteil dieser Methode an weiteren Beispielen schätzen lernen. In dem betrachteten Beispiel gab es genauso viele Erhaltungsgrößen wie Freiheitsgrade, nämlich zwei, und dies ermöglichte es uns, explizite Ausdrücke für die Teilchenbahn zu ermitteln. Wir werden später sehen, dass ganz allgemein ein mechanisches System dann integrabel (also im Prinzip lösbar) ist, wenn die Zahl der unabhängigen Erhaltungsgrößen genauso groß ist wie die Zahl der Freiheitsgrade. Wenn die Zahl der Erhaltungsgrößen kleiner ist, ist das System nicht integrabel, sondern es führt auf chaotische Bewegung. Chaotische Systeme haben die Eigenschaft, dass sich ihr Zeitverlauf aus den Anfangsbedingungen nur begrenzt vorhersagen lässt, da winzige Veränderungen der Anfangsbedingungen schon nach kurzer Zeit zu einem völlig anderen Verhalten führen können. Leider gibt es für das Auffinden von Erhaltungsgrößen kein Patentrezept. Nur wenn Symmetrien vorliegen, können wir Erhaltungsgrößen auf einfach Weise finden, indem wir die generalisierten Koordinaten so wählen, dass mit der Symmetrie eine zyklische Variable verbunden ist. Im folgenden Teilkapitel sehen wir, dass ganz allgemein Symmetrien mit Erhaltungsgrößen verbunden sind. 4.5 Das Noether-Theorem Wir haben gesehen, dass Koordinaten, deren Verschiebung qi → qi 0 = qi + α die Lagrange-Funktion nicht ändert, zyklisch sind, und dass die entsprechenden Impulse Erhaltungsgrößen sind. Wir wollen dieses Ergebnis jetzt verallgemeinern und zeigen, dass ein genereller Zusammenhang besteht zwischen dem Auftreten von Erhaltungsgrößen und Transformationen, die die Lagrange-Funktion nicht ändern, also invariant lassen. Zu diesem Zweck untersuchen wir die Koordinatentransformationen qi → qi 0 = qi 0 (q1 , . . . , q3N −k , t, α) , i = 1, . . . , 3N − k , (4.16) die invertierbar seien, 0 qi = qi (q10 , . . . , q3N −k , t, α) , 37 i = 1, . . . , 3N − k , (4.17) und in den kontinuierlichen Parametern α stetig differenzierbar sein müssen. Ferner soll für α = 0 die identische Transformation vorliegen, qi 0 (q1 , . . . , q3N −k , t, α = 0) = qi , i = 1, . . . , 3N − k . Wir schreiben verkürzt qi 0 = qi 0 (q, t, α) und qi = qi (q 0 , t, α) . Wichtige Beispiele für solche Koordinatentransformationen sind Translationen ~r → ~r 0 = ~r + α~a und Rotationen um die z-Achse 0 x x cos α y → y 0 = sin α z z0 0 − sin α cos α 0 0 x x cos α − y sin α 0 · y = x sin α + y cos α . 1 z z Die neue Lagrange-Funktion L0 erhalten wir, indem wir in der alten Lagrange-Funktion die Ersetzung (4.17) machen: d (4.18) L0 (q 0 , q̇ 0 , t, α) = L q(q 0 , t, α), q(q 0 , t, α), t . dt Wir berechnen im Folgenden, wie L0 sich mit α ändert und betrachten dann den Fall, dass L nicht von α abhängt. Dies wird uns einen Erhaltungssatz liefern. Es ist " # 3N −k d X qi (q 0 , t, α) ∂L ∂qi (q 0 , t, α) ∂L ∂ dt ∂L0 (q 0 , q̇ 0 , t, α) = + ∂α ∂qi ∂α ∂ q̇i ∂α i=1 3N −k X d ∂L ∂qi (q 0 , t, α) ∂L d ∂qi (q 0 , t, α) = + dt ∂ q̇i ∂α ∂ q̇i dt ∂α i=1 "3N −k # d X ∂L ∂qi (q 0 , t, α) . = dt i=1 ∂ q̇i ∂α Diese Gleichung gilt für alle α. Wenn wir α = 0 setzen, gehen die qi 0 in die qi über. Es ist "3N −k # ∂L0 (q 0 , q̇ 0 , t, α) d X ∂L ∂qi (q 0 , t, α) . = ∂α dt i=1 ∂ q̇i ∂α α=0 (4.19) α=0 Bemerkung: Die partielle Ableitung bzgl. α ist bei festgehaltenen übrigen Argumenten der Funktion L0 , also bei festen q 0 und q̇ 0 und t zu nehmen. Den Unterschied zwischen einer partiellen und einer totalen Ableitung wird deutlich, wenn man Gleichung (4.18) nach α ableitet: Während die Funktion L0 die Argumente q 0 , q̇ 0 , t, α hat, hat die Funktion L die Argumente q, q̇, t. Weil q und q̇ widerum von α abhängen, können wir also schreiben dL(q, q̇, t) ∂L0 (q 0 , q̇ 0 , t, α) = ∂α dα wobei die Abhängigkeit von α auf der rechten Seite in den q und q̇ versteckt ist. Die Auswertung der rechten Seite erfolgt wie in der oben an (4.18) anschließenden Rechnung. Wir betrachten nun den Fall, dass die Koordinatentransformation (4.16) die Lagrange-Funktion invariant lässt: (4.18) Invarianz L(q, q̇, t) = L0 (q 0 , q̇ 0 , t, α) = L(q 0 , q̇ 0 , t) . (4.20) 38 Dann haben die neuen Koordinaten qi 0 dieselbe Lagrange-Funktion und dieselben Bewegungsgleichungen wie die alten Koordinaten qi . Die neue Lagrange-Funktion hängt nicht vom Parameter α ab, also ∂L0 = 0. ∂α α=0 Zusammen mit Gleichung (4.19) folgt damit das für die moderne Physik bedeutende Noether-Theorem: Die Funktion 3N −k X ∂L ∂qi (q 0 , t, α) I(q, q̇, t) = (4.21) ∂ q̇i ∂α α=0 i=1 ist eine Erhaltungsgröße, wenn die Lagrange-Funktion unter der kontinuierlichen, stetig differenzierbaren Koordinatentransformation (4.16) invariant ist. Zu jeder Transformation (4.16), die die LagrangeFunktion nicht ändert, gehört also eine Erhaltungsgröße, die durch (4.21) leicht ermittelt werden kann. Der Umkehrschluss gilt allerdings nicht: nicht zu jeder Erhaltungsgröße gibt es eine Symmetrietransformation der Lagrange-Funktion, wie wir im Zusammenhang mit der Planetenbewegung am Beispiel des Lenzschen Vektors sehen werden. Der Erhaltungssatz, der zu einer zyklischen Koordinate qi gehört, ist ein Spezialfall des NoetherTheorems, da die Unabhängigkeit der Lagrange-Funktion von qi die Invarianz von L unter Translation von qi zur Folge hat. Es gibt sogar auch dann eine Erhaltungsgröße, wenn die Lagrange-Funktion unter den Transformationen (4.16) nicht invariant ist, sondern einen zusätzlichen Term erhält, der die totale zeitliche Ableitung einer beliebigen Funktion F (q 0 , t, α) ist: d d (4.22) L0 (q 0 , q̇ 0 , t, α) = L q(q 0 , t, α), q(q 0 , t, α), t = L(q 0 , q̇ 0 , t) + F (q 0 , t, α) . dt dt Es folgt nämlich ∂L0 (q 0 , q̇ 0 , t, α) d ∂F (q 0 , t, α) = , ∂α dt ∂α α=0 α=0 und folglich ist die Funktion J(q, q̇, t) = 3N −k X i=1 ∂L(q, q̇, t) ∂qi (q 0 , t, α) ∂F (q 0 , t, α) − ∂ q̇i ∂α ∂α α=0 α=0 (4.23) eine Erhaltungsgröße. 4.5.1 Die 10 Erhaltungsgrößen abgeschlossener N -Teilchensysteme Wir leiten im Folgenden die im ersten Kapitel erwähnten 10 Erhaltungsgrößen abgeschlossener N Teilchensysteme aus dem Noether-Theorem her. Wir beschränken uns auf den wichtigen Fall, dass die Zweiteilchenpotenziale nur vom Abstand der Teilchen abhängen. Die Lagrange-Funktion ist dann L= N X mi i=1 2 ~r˙i2 − N X Vij (|~ri − ~rj |) . i<j 1. Die Lagrange-Funktion ist nicht explizit von der Zeit abhängig und demnach invariant unter Zeitverschiebungen. Also ist die Hamiltonfunktion eine Erhaltungsgröße und gleich der Energie E = T +V , weil keine von außen auferlegten Zwangsbedingungen vorliegen und die Kräfte konservativ sind. Also ist die Energie konstant. 39 2. Die Lagrange-Funktion ist unter Drehungen invariant, denn sie hängt nur vom Betrag der Geschwindigkeits- und Abstandsvektoren ab, nicht von ihrer Richtung. Wir zeigen im Folgenden, dass aus Invarianz unter Drehungen um die z-Achse die Erhaltung von Lz folgt. Analog lässt sich die Erhaltung von Lx und Ly zeigen, so dass auch der Gesamtdrehimpuls ~ = L N X ~ri × p~i i=1 erhalten ist. Eine Rotation um die z-Achse entspricht der Transformation (vgl. die Gleichung vor (4.18)) xi cos α sin α 0 xi 0 xi 0 cos α + yi 0 sin α yi = − sin α cos α 0 · yi 0 = −xi 0 sin α + yi 0 cos α . zi 0 0 1 zi 0 zi Also ist ∂xi (~r 0 , α) = −xi 0 sin α + yi 0 cos α = yi ∂α und ∂yi (~r 0 , α) = −xi 0 cos α − yi 0 sin α = −xi . ∂α Mit L0 = N X mi 2 i=1 2 ~r˙ 0i − N X Vij (|~ri 0 − ~rj 0 |) . i<j ergibt sich die gesuchte Erhaltungsgröße zu N X ∂L i=1 ∂ ẋi yi + X N ∂L mi (ẋi y − ẏi x) = −Lz . (−yi ) = ∂ ẏi i=1 3. Die Lagrange-Funktion ist unter den Verschiebungen ~ri → ~ri 0 = ~ri + α~b invariant. Folglich ist die Funktion I= N N X X ∂L ∂~ri (~ri 0 , α) · =− p~i · ~b = −P~ · ~b ∂α r˙i i=1 ∂ ~ i=1 eine Erhaltungsgröße. Da der Vektor ~b beliebig ist, ist der Gesamtimpuls P~ eine Erhaltungsgröße. 4. Die reinen Galileitransformationen ~ri → ~ri 0 = ~ri + α~v t überführen die alte Lagrange-Funktion in L0 = N X mi i=1 2 (~r˙i 0 − α~v )2 − d Vij (~ri 0 − ~rj 0 ) = L(~r 0 , ~r˙ 0 ) + F (~r 0 , t, α) dt i<j X mit 0 F (~r , t, α) = α N X i=1 40 mi α 2 ~v 2 t − ~ri 0 · ~v . Die Erhaltungsgröße J(~r, ~r˙, t) lautet N N X X ∂F ∂L ∂~ri (~r 0 , t, α) − = J= (−~ pi · ~v t + mi~ri · ~v ) = (−P~ t + M~rS ) · ~v · ˙ ∂α ∂α ∂ ~ r α=0 i=1 i=1 α=0 mit der Schwerpunktkoordinate ~rS und der Gesamtmasse M . Da J für jedes ~v eine Erhaltungsgröße ist, ist auch der Ausdruck in Klammern −P~ t + M~rS eine Erhaltungsgröße. ~ P~ und −P~ t + M~rS . Damit haben wir die 10 Erhaltungsgrößen bestimmt: E, L, Aufgaben 1. Begründen Sie, dass ein eindimensionales mechanisches System mẍ = F (x), dessen Kraft nicht explizit zeitabhängig ist, nicht chaotisch sein kann. 2. Betrachten Sie das Rollpendel. (a) Wieviele Freiheitsgrade und wieviele Erhaltungsgrößen hat dieses System? Schreiben Sie explizit die Erhaltungsgrößen hin. Nennen Sie diejenige Erhaltungsgröße, die nicht die Energie ist, px . (b) Berechnen Sie die Koordinaten (x2 , y2 ) als Funktion von ϕ und zeigen Sie, dass sich m2 für px = 0 auf einer Ellipsenbahn bewegt. R (c) Berechnen Sie den Zusammenhang zwischen ϕ und t in der Gestalt t = dϕ . . . . 41 Kapitel 5 Lagrange-Gleichungen erster Art 5.1 Vorbemerkungen Die Lagrange-Gleichungen erster Art (Lagrange-I) sind den Lagrange-Gleichungen zweiter Art (LagrangeII) recht ähnlich. Sie unterscheiden sich in drei Aspekten: 1. In Lagrange-II wird die Lagrange-Funktion nur durch die 3N − k unabhängigen verallgemeinerten Koordinaten und die zugehörigen Geschwindigkeiten ausgedrückt. In Lagrange-I wird die LagrangeFunktion durch alle 3N verallgemeinerten Koordinaten ausgedrückt. Man darf im Lagrange-IFormalismus also keine Koordinaten mit Hilfe der Zwangsbedingungen eliminieren, wenn man die Lagrange-Funktion L = T − V aufstellt. 2. Die Lagrange-I-Gleichungen sind den Lagrange-II-Gleichungen sehr ähnlich (s.u.), aber sie enthalten jeweils einen zusätzlichen Summanden, der von den Zwangskräften herrührt. 3. Die Lagrange-I-Gleichungen gelten auch für nicht holonome Zwangsbedingungen, wenn diese sich in differenzieller Form schreiben lassen, während die Lagrange-II-Gleichungen nur für holonome Zwangsbedingungen gelten. Da in den Lagrange-I-Gleichungen die Zwangskräfte explizit drinstehen, ist es praktisch, sie zu verwenden, wenn man Zwangskräfte berechnen muss. Das Berechnen von Zwangskräften wird z.B. bei Gleitreibung ~ ist, siehe Abschnitt 3.4.1), bei der Berechnung der realen Zwangsarbeit nötig (weil F~ (R) = −f |Z|v̂ bei rheonomen Zwangsbedingungen, oder auch bei der Dimensionierung von technischen Anlagen, z.B. Achterbahnen. Allerdings kann man bei holonomen Zwangsbedingungen die Zwangskräfte auch aus dem Lagrange-IIFormalismus herleiten. Wir demonstrieren dies im Folgenden, bevor wir dann den Lagrange-I-Formalismus vorstellen. Die Berechnung der Zwangskräfte über den Lagrange-II-Formalismus geht über die Beziehung (2.11), also ~ i = mi~r¨i − F~i . Z ~i. Wenn man die Lösung ~ri (t) bestimmt hat, hat man auch ~r¨i und damit Z Um diese Beziehung auf verallgemeinerte Koordinaten qj umzuschreiben (mit j = 1, . . . , 3N ), definieren wir analog zu den verallgemeinerten Kräften Qj (siehe (3.2)) nun verallgemeinerte Zwangskräfte Zj als Zj ≡ (3.6) = N X N N X ∂~ri X ~ ∂~ri ~ i · ∂~ri = mi~r¨i − Fi · , Z ∂qj ∂qj ∂qj i=1 i=1 i=1 d ∂T ∂T − − Qj . dt ∂ q̇j ∂qj j = 1, . . . , 3N (5.1) 42 Falls sich die Kräfte Qj aus einem Potenzial gemäß (3.8) bzw. (3.12) ableiten lassen, so gilt mit L=T −V ∂L d ∂L − = Zj , j = 1, . . . , 3N . (5.2) dt ∂ q̇j ∂qj An dieser Stelle ist ganz wichtig, dass L nun eine Funktion von allen 3N Variablen ist und nicht nur der 3N − k unabhängigen Variablen. Wir merken uns also den auch für das Folgende wichtigen Sachverhalt: Wenn man die LagrangeFunktion durch alle 3N Variablen ausdrückt, steht bei den entsprechenden Lagrange-Gleichungen auf der rechten Seite nicht Null, sondern die jeweilige Komponente der verallgemeinerten Zwangskraft. (Man kann (5.2) wieder in die Lagrange-Gleichungen zweiter Art überführen, indem man mit den virtuellen Verrückungen δqj multipliziert und über j = 1, . . . , 3N summiert. Der Term mit den Zwangskräften verschwindet mit dem d’Alembert-Prinzip (2.21). Wenn man L nun als Funktion der 3N − k unabhängigen Variablen schreibt, verschwinden die Summanden für die abhängigen Variablen, und wir erhalten die Lagrange-II-Gleichungen (3.10) für die 3N − k unabhängigen Koordinaten.) Wir erhalten folgendes Rezept für die Berechnung der Zwangskräfte aus Lagrange-II bei holonomen Zwangsbedingungen: (i) Stelle L für die unabhängigen Koordinaten auf und löse Lagrange-II (ii) Drücke L durch alle 3N (abhängigen) Koordinaten aus und bestimme (5.2). Als Beispiel verwenden wir die gleitende Perle auf einem rotierenden, geraden Draht aus dem vorigen Kapitel. Zunächst stellen wir die Lagrange-Gleichungen zweiter Art auf und lösen sie: L= m 2 (ṙ + r2 ω 2 ) , 2 r̈ − rω = 0 r(t) = a cosh(ωt) für r(t = 0) = a , ṙ(t = 0) = 0 . Dann nehmen wir die zweite Koordinate, ϕ, dazu und berechnen die Zwangskräfte: m 2 (ṙ + r2 ϕ̇2 ) , 2 d ∂L ∂L − = m(r̈ − rϕ̇2 ) = 0 , Zr = dt ∂ ṙ ∂r d ∂L ∂L Zϕ = − = mr(2ṙϕ̇ + rϕ̈) = ma2 ω 2 sinh(2ωt) . dt ∂ ϕ̇ ∂ϕ L= Im letzten Schritt der Berechnung der Zwangskräfte haben wir jeweils r = a cosh(ωt) und ϕ = ωt eingesetzt und am Schluss das Additionstheorem 2 cosh(ωt) sinh(ωt) = sinh(2ωt) verwendet. 43 5.2 Herleitung der Lagrange-Gleichungen erster Art Wir beginnen mit dem d’Alembert-Prinzip und (3.6), d.h. 3N X ∂T d ∂T − − Qj δqj = 0 , dt ∂ q̇j ∂qj j=1 bzw., falls die verallgemeinerten Kräfte Qj aus einem Potenzial V ableitbar sind, 3N X ∂L d ∂L − δqj = 0 . dt ∂ q̇j ∂qj j=1 (5.3) Hierbei ist L eine Funktion von allen 3N Koordinaten und 3N Geschwindigkeiten. Ein solches “Variationsproblem” (nämlich die Bestimmung der qj (t) mit Nebenbedingungen – den Zwangsbedingungen) löst man mit Hilfe von sogenannten Lagrange-Multiplikatoren. Wir schreiben für die Zwangsbedingungen wie in (2.8) 3N X aij dqj + bi dt = 0 , i = 1, . . . , k . j=1 Da für virtuelle Verrückungen dt = 0 ist, gilt 3N X aij δqj = 0 , i = 1, . . . , k . j=1 Also gilt auch k X i=1 λi 3N X aij δqj = 0 (5.4) j=1 mit zunächst beliebigen Lagrange-Multiplikatoren λi , die i.A. eine Funktion der qj und q̇j und von t sind. Wenn man die Gleichungen gelöst und folglich q(t) bestimmt hat, hat man auch λi als Funktion der Zeit. Subtraktion von (5.3) und (5.4) gibt ! k 3N X ∂L X d ∂L − − λi aij δqj = 0 . (5.5) dt ∂ q̇j ∂qj j=1 i=1 Nun kommt der entscheidende gedankliche Schritt: Wir können die λi so wählen, dass jede der Klammern in (5.5) verschwindet. Wir können nämlich die k Funktionen λi so wählen, dass k Klammern (sagen wir: Nummer 3N − k + 1 bis 3N ) in (5.5) verschwinden. Dann haben wir noch eine verbleibende Summe über 3N − k Terme, in denen aber nun die δqj unabhängig voneinander gewählt werden können, weil wir ja 3N − k unabhängige Variablen haben. Also müssen auch die verbleibenden 3N − k Klammern verschwinden. Wir erhalten somit die Lagrange-Gleichungen erster Art: k ∂L X d ∂L = + λi aij , dt ∂ q̇j ∂qj i=1 j = 1, . . . , 3N . (5.6) Dies sind 3N Gleichungen für 3N +k Unbekannte (die qj und die λi ), die zusammen mit den k Gleichungen für die Zwangsbedingungen alle Unbekannten festlegen. 44 Durch Vergleich mit (5.2) erkennen wir, dass k X λi aij = Zj , j = 1, . . . , 3N (5.7) i=1 ist. Die Gebrauchsanweisung für Lagrange-Gleichungen erster Art ist die folgende: (i) Wähle 3N Koordinaten und stelle die Zwangsbedingungen in differenzieller Form auf. (ii) Schreibe L = T − V als Funktion der 6N Variablen qj , q̇j . (iii) Stelle die 3N Lagrange-I-Gleichungen auf und löse sie zusammen mit den Zwangsbedingungen. Bemerkung: In der Praxis verwendet man auch gerne eine Variante mit weniger Koordinaten. Die eben durchgeführte Herleitung der Lagrange-I-Gleichungen kann auch mit n < 3N generalisierten Koordinaten durchgeführt werden, wobei n > 3N − k ist. Die Zahl der Lagrange-Parameter in (5.4) reduziert sich hierbei auf k + n − 3N . In der Gleichung (5.6) ist dann i nur bis k + n − 3N zu summieren, und j läuft von 1 bis n. 5.3 Beispiele 5.3.1 Teilchen im Kreiskegel z g r ϕ y x Wir wählen als Koordinaten die Zylinderkoordinaten z, r, ϕ. Die Zwangsbedingung ist f (z, r, ϕ) = r − z tan α = 0, bzw. in differenzieller Form: ∂f ∂f dz + dr = − tan α dz + dr = 0 . ∂z ∂r Die Lagrange-Funktion ist L=T −V = m 2 (ż + ṙ2 + r2 ϕ̇2 ) − mgz . 2 Die Lagrange-I-Gleichungen sind also d ∂L ∂L ∂f − =λ ⇒ mz̈ + mg = −λ tan α dt ∂ ż ∂z ∂z ∂f d ∂L ∂L − =λ ⇒ mr̈ − mrϕ̇2 = λ dt ∂ ṙ ∂r ∂r d ∂L ∂L ∂f − =λ ⇒ mr2 ϕ̈ + 2mrṙϕ̇ = 0 . dt ∂ ϕ̇ ∂ϕ ∂ϕ 45 Wir haben also drei Lagrange-I-Gleichungen und eine Zwangsbedingung zur Bestimmung der 4 Unbekannten z(t), r(t), ϕ(t), λ(t). Wenn man die Unbekannten bestimmt hat, hat man auch die Zwangskräfte: Zz = −λ(t) tan α Zr = λ(t) , Zϕ = 0 . Zur Lösung dieser Gleichungen kann man zunächst die Zwangskraft samt einer der drei Variablen (z.B. z) eliminieren und die Bewegungsgleichungen für die nun unabhängigen verbleibenden Variablen r und ϕ lösen. Hierzu kann man die Zwangsbedingung in der Form z̈ = r̈ cot α in die erste Lagrange-I-Gleichung einsetzen (das gibt m(r̈ cot α + g) = −λ tan α) und dann hierzu die mit tan α multiplizierte zweite Lagrange-I-Gleichung addieren. Dies gibt (tan α + cot α)r̈ − rϕ̇2 tan α + g = 0 . Zusammen mit der dritten Lagrange-I-Gleichung haben wir wieder die schon bekannten Bewegungsgleichungen ermittelt. Wenn man r(t) und ϕ(t) berechnet hat, kann man dann über die Zwangsbedingung auch z(t) bestimmen und über eine der drei Lagrange-I-Gleichungen dann λ(t). Dann hat man auch Zz und Zϕ . 5.3.2 Rollpendel Im Folgenden stellen wir die Lagrange-Gleichungen erster Art für das Rollpendel auf und bestimmen einen Zusammenhang zwischen der Zwangskraft, die die Schiene ausübt, und der Zwangskraft, die der Faden ausübt. Die Lagrange-Gleichungen zweiter Art für das Rollpendel haben wir in Abschnitt 3.3 aufgestellt. Die beiden Zwangsbedingungen lauten f1 (x1 , y1 , r, ϕ) = y1 = 0 und f2 (x1 , y1 , r, ϕ) = r − l = 0 . Nur zwei der insgesamt 8 partiellen Ableitungen der beiden Zwangsbedingungen nach den 4 Variablen sind von Null verschieden. Diese partiellen Ableitungen entsprechen den Koeffizienten aij aus (2.8), und die beiden von Null verschiedenen Koeffizienten sind ∂f2 ∂f1 = a23 = 1 . = a12 = 1 und ∂y1 ∂r Die Lagrange-Funktion ist T −V = m2 2 m1 2 ẋ1 + ẏ12 + ẋ2 + ẏ22 − m1 gy1 − m2 gy2 , 2 2 bzw ausgedrückt durch die verallgemeinerten Koordinaten r und ϕ statt x2 = x1 + r sin ϕ und y2 = y1 − r cos ϕ: L= m2 2 m1 + m2 2 ẋ1 + ẏ12 + ṙ + r2 ϕ̇2 + 2ṙ (ẋ1 sin ϕ − ẏ1 cos ϕ) + 2rϕ̇ (ẋ1 cos ϕ + ẏ1 sin ϕ) −m1 gy1 −m2 g(y1 −r cos ϕ) . 2 2 Die Lagrange-Gleichungen lauten nach Einsetzen der Zwangsbedingungen: Lx1 Ly1 : (m1 + m2 )ẍ1 + m2 l(ϕ̈ cos ϕ − ϕ̇2 sin ϕ) = 0 2 : m2 l(ϕ̈ sin ϕ + ϕ̇ cos ϕ) + (m1 + m2 )g = λ1 = ZSchiene 2 (5.8) (5.9) Lr : m2 (ẍ1 sin ϕ − lϕ̇ − g cos ϕ) = λ2 = −ZF aden (5.10) Lϕ : m2 l(ẍ1 cos ϕ − lϕ̈ + g sin ϕ) = 0 . (5.11) Die erste und letzte dieser Gleichungen sind die Bewegungsgleichungen für x1 und ϕ, die wir schon früher hergeleitet haben. Für den Fall px1 = 0 berechnen wir in den Übungen eine Lösung (Aufgabe 2 zu Kapitel 46 4). Wenn man eine Lösung hat, kann man mit Hilfe der zweiten und dritten Gleichung die Zwangskräfte ermitteln. Wir bestimmen jetzt noch einen Zusammenhang der beiden verallgemeinerten Zwangskräfte: ZSchiene lässt sich mit der vierten Lagrange-Gleichung umrechnen: ZSchiene = (m1 + m2 cos2 ϕ)g + m2 (lϕ̇2 − ẍ1 sin ϕ) cos ϕ = m1 g + ZF aden cos ϕ . Dieses Ergebnis ist anschaulich plausibel, da die Schiene zum einen die Gewichtskraft der Masse m1 und zum anderen die Zugkraft des Fadens kompensieren muss. 5.3.3 Ein Beispiel mit Reibung Als weiteres Beispiel betrachten wir eine Perle auf einem ruhenden, parabelförmigen Draht mit Gleitreibung, ~ = −f |Z| ~ p(ẋ, ẏ) . F~ (R) = −f |Z|v̂ ẋ2 + ẏ 2 Die Dissipationsfunktion (3.21) ist Z P = v p ~ ~ ẋ2 + ẏ 2 . f |Z|dv̂ = f |Z| 0 Die Zwangsbedingung lautet f (x, y) = y − ax2 = 0, bzw. df = dy − 2ax dx. Die Lagrange-Funktion ist m L = T − V = (ẋ2 + ẏ 2 ) − mgy , 2 und die Lagrange-I-Gleichungen sind d ∂L ∂L ∂P ∂f ~ p ẋ − + =λ ⇒ mẍ + f |Z| = −2axλ = Zx dt ∂ ẋ ∂x ∂ ẋ ∂x ẋ2 + ẏ 2 und ∂f d ∂L ∂L ∂P ~ p ẏ − + =λ ⇒ mÿ + mg + f |Z| = λ = Zy . dt ∂ ẏ ∂y ∂ ẏ ∂y ẋ2 + ẏ 2 Wir verwenden die Zwangsbedingung, q um y zu eliminieren: y − ax2 = 0 ⇒ ẏ = 2axẋ , ÿ = 2a(ẋ2 + xẍ). √ ~ = Z 2 + Z 2 = λ 4a2 x2 + 1, er ist also von y unabhängig. Der Betrag der Zwangskraft ist |Z| x y Dies ist in die beiden Lagrange-I-Gleichungen einzusetzen, aus denen dann λ eliminiert werden kann. Das Vorzeichen der Wurzel und damit die Richtung der Zwangskraft hängt davon ab, ob die Perle sich gerade nach rechts bewegt (positives ẋ) oder nach links (negatives ẋ). Es ergibt sich für ẋ > 0: √ f λ 4a2 x2 + 1 ẋ mẍ + √ = −2axλ ⇒ mẍ + f λ = −2axλ ẋ2 + 4a2 x2 ẋ2 47 und √ f λ 4a2 x2 + 1 2axẋ =λ 2ma(ẋ + xẍ) + mg + √ ẋ2 + 4a2 x2 ẋ2 2 ⇒ 2ma(ẋ2 + xẍ) + mg + 2axf λ = λ . Elimination von λ führt nach elementaren Rechenschritten auf (1 + 4a2 x2 )ẍ + (2ax + f )(2aẋ2 + g) = 0 . Für ẋ < 0 ergibt sich entsprechend (1 + 4a2 x2 )ẍ + (2ax − f )(2aẋ2 + g) = 0 . Damit haben wir sowohl die Zwangskräfte, als auch die Bewegungsgleichungen bestimmt. Aufgaben 1. In dem Beispiel mit der Leiter an der Wand (s. Ende von Kapitel 2) wurde die Kraft F auf ein Seil, das die Leiter an ihrem Ort festhält, mit Hilfe des d’Alembert-Prinzips errechnet. Bestimmen Sie die Zwangskraft F nun mit den Lagrange-Gleichungen erster Art. 2. Berechnen Sie die Lagrange-Gleichungen erster Art und die Ausdrücke für die verallgemeinerte Zwangskraft für ein gewöhnliches Pendel, also für eine Masse m an einem Faden der Länge l, das nur in der x − y-Ebene schwingen kann. 3. (Aufgabe 2 der Bachelor-Klausur von 2005) 48 Ein Massepunkt (1) bewegt sich auf der x-Achse und ein zweiter Massepunkt (2) bewegt sich auf der y-Achse. Beide Massepunkte haben gleiche Massen m und sind durch eine masselose Stange der Länge b miteinander verbunden. Die Bewegung sei reibungsfrei und die Schwerkraft wirke in Richtung der Winkelhalbierenden der x-Richtung und y-Richtung. (a) Stellen Sie die lagrangeschen Bewegungsgleichungen erster Art für x1 und y2 auf. (b) Drücken Sie x1 und y2 durch den Winkel ϕ der Stange mit der x-Achse aus und berechnen Sie die Bewegungsgleichung für ϕ. (c) Bestimmen Sie die Gleichgewichtslagen. (d) Berechnen Sie die Frequenz ω0 der Schwingung für kleine Auslenkungen aus der stabilen Gleichgewichtslage. 49 Kapitel 6 Hamiltonsches Prinzip Das von W. R. Hamilton (1805 - 1864) im Alter von 18 Jahren entdeckte Hamiltonsche Prinzip ist gleichwertig mit den Lagrange-Formalismen. Letztere können sehr effizient aus dem Hamiltonschen Prinzip abgeleitet werden. Das Hamiltonsche Prinzip ist ein Extremalprinzip. Wir werden also eine Größe definieren, die durch die klassischen Bahnen minimiert oder maximiert wird oder dort einen Sattelpunkt hat. Diese Größe ist die sogenannte “Wirkung”. Solche Extremalprinzipien stecken nicht nur hinter den Bewegungsgleichungen der klassischen Mechanik, sondern treten auch in anderen Gebieten der Physik auf. Ein Beispiel hierfür ist das Prinzip der Strahlenoptik, dass die Lichtstrahlen den zeitlich kürzesten Weg nehmen. 6.1 Variationsrechnung (ohne Nebenbedingungen) Bevor wir das Hamiltonsche Prinzip behandeln, befassen wir uns zunächst allgemein mit der Variationsrechnung. Bei der Variationsrechnung geht es darum, eine Funktion zu finden, die eine bestimmte Größe maximiert oder minimiert. Wir formulieren diese Aufgabe folgendermaßen: Gegeben sei eine Funktion F = F (y(x), y 0 (x), x) mit stetig differenzierbarem y(x) und mit y 0 (x) ≡ dy/dx. Gegeben seien außerdem zwei Punkte P1 und P2 mit den Koordinaten (x1 , y1 ) und (x2 , y2 ). Für welche Kurve y(x) zwischen P1 und P2 wird das Integral Z x2 I≡ F (y(x), y 0 (x), x) dx (6.1) x1 extremal? Zur Lösung dieser Aufgabe betrachten wir alle Kurven in der Umgebung der gesuchten Lösung: Sei y(x) die gesuchte Kurve und η(x) eine beliebige Funktion mit η(x1 ) = η(x2 ) = 0. Dann heißt ŷ(x) = y(x) + εη(x) (6.2) die variierte Kurve. ε ist ein kleiner Parameter, und δy(x) ≡ εη(x) (6.3) d d δy(x) = εη 0 (x) ≡ δy 0 (x) = δ y(x) , dx dx (6.4) heißt Variation der Kurve y(x). Es gilt d.h. Variation und Differentiation sind vertauschbar. 50 Nach diesen Definitionen und Vorüberlegungen betrachten wir jetzt das Integral I, wobei wir für y(x) den Ansatz (6.2) einsetzen und I als Funktion von ansehen: Z x2 F (y + εη, y 0 + εη 0 , x) dx . (6.5) I(ε) ≡ x1 Wir suchen ein Extremum von I. Das bedeutet, dass Z x2 ∂F (y, y 0 , x) dI ∂F (y, y 0 , x) 0 = η (x) dx = 0 η(x) + dε ε=0 ∂y ∂y 0 x1 (6.6) sein muss für alle Funktionen η(x). Wir formen den zweiten Summanden durch partielle Integration um: x2 Z x2 Z x2 ∂F (y, y 0 , x) 0 d ∂F (y, y 0 , x) ∂F (y, y 0 , x) partielle Integration η (x)dx = − η(x) . (6.7) η(x) dx + 0 0 ∂y dx ∂y ∂y x1 x1 x1 | {z } null, da η(x1 )=η(x2 )=0 Eingesetzt in (6.6) ergibt sich Z x2 x1 ∂F (y, y 0 , x) d ∂F (y, y 0 , x) − ∂y dx ∂y 0 η(x)dx = 0 (6.8) Dies ist genau dann für alle möglichen Funktionen η(x) erfüllt, wenn d ∂F ∂F − =0 0 dx ∂y ∂y (6.9) ist. (Das folgt aus dem “Fundamental-Lemma der Variationsrechnung ohne Nebenbedingungen”.) Wir haben also die Aufgabe, das Integral I zu maximieren (oder minimieren), zurückgeführt auf die Aufgabe, die Differenzialgleichung (6.9) zu lösen. Hängt der Integrand F (y, y 0 ) nicht explizit von x ab, ist es zur Lösung konkreter Aufgaben zweckmäßig, die Bedingung (6.9) auf die Bedingung H ≡ F − y0 ∂F = konst ∂y 0 (6.10) umzuschreiben. Test: H = konst bedeutet dH/dx = 0, und dies sieht man anhand von ∂F ∂F ∂F d ∂F ∂F d ∂F dH 0 = y0 + y 00 0 − y 00 0 − y 0 = y − = 0. dx ∂y ∂y ∂y dx ∂y 0 ∂y dx ∂y 0 | {z } =0 nach Gl. (6.9) Also ist H = konst genau dann erfüllt, wenn Gl. (6.9) erfüllt ist. 6.2 Beispiel: Brachistochronen-Problem Als Beispiel für die Variationsrechnung mit einer Variablen betrachten wir das sogenannte BrachistochronenProblem. Dieses in der Geschichte der Mathematik berühmte Problem wurde 1696 von Johann Bernoulli gestellt und begründete die Variationsrechnung: Ein Massepunkt mit Anfangsgeschwindigkeit Null soll im Gravitationsfeld reibungsfrei von P1 = (x1 , 0) nach P2 = (x2 , y2 ) laufen. (Es zeige die y-Achse in Richtung der Gravitationskraft, so dass y2 > 0 ist.) Gesucht ist diejenige Zwangsfläche, die die hierfür benötigte Zeit minimiert. 51 Wir beschreiben die Zwangsfläche, auf der die Masse rutscht, durch die Kurve y(x), wobei y(x1 ) = 0 und y(x2 ) = y2 ist. Die Laufzeit ist gegeben durch Z x2 ds T = v x1 mit 1 mv 2 = mgy(x) . 2 (Beim letzten Schritt haben wir den Energieerhaltungssatz mit v0 = 0 verwendet.) Also ist Z x2 s 1 + y 02 1 dx . T =√ y 2g x1 ds2 = dx2 + dy 2 und Ein Extremum von T zu finden bedeutet, Gl. (6.9) mit F = (6.10) H = konst mit H = F − y 0 ∂F/∂y 0 zu lösen. Letzteres führt auf s 1 =c (1 + y 02 )y p (1 + y 02 )/y zu lösen, bzw. die Gleichung bzw. mit der Ersetzung r0 = 1/(2c2 ) Z x2 Z y2 r dx = x1 y1 Mit der Substitution y = 2r0 sin2 y dy . 2r0 − y ϕ = r0 (1 − cos ϕ) 2 wird dies zu Z ϕ2 x2 − x1 = 2r0 ϕ1 sin2 ϕ cos ϕ2 q 2 dϕ = 2r0 1 − sin2 ϕ2 Z ϕ2 sin2 ϕ1 ϕ dϕ = r0 2 Z ϕ2 ϕ1 2 (1 − cos ϕ)dϕ = r0 (ϕ − sin ϕ)|ϕ ϕ1 . Zur Vereinfachung setzen wir x1 = 0. Außerdem ist wegen y1 = 0 auch ϕ1 = 0. Dann gilt y2 = r0 (1 − cos ϕ2 ) und x2 = r0 (ϕ2 − sin ϕ2 ) . Diese beiden Gleichungen legen die Parameter r0 und ϕ2 fest, weil ja x2 und y2 gegeben sind. Wenn wir als obere Integrationsgrenze nicht x2 und y2 bzw. ϕ2 wählen, sondern einen beliebigen Wert zwischen dem Anfangs- und Endpunkt, erhalten wir die gesamte Form der Zwangsfläche: y = r0 (1 − cos ϕ) und x = r0 (ϕ − sin ϕ) . Man nennt dies eine Zykloide. Die Steigung y 0 = dy/dx bekommt man, indem man dy/dϕ und dx/dϕ berechnet und durcheinander dividiert. Dies ergibt dy sin ϕ = , dx 1 − cos ϕ was für ϕ < π positiv ist und für ϕ > π negativ wird. Wenn also x2 /y2 so groß ist, dass ϕ > π wird, hat die Zwangsfläche ein Minimum, d.h. der tiefste Punkt liegt tiefer als der Endpunkt. Dies tritt auf für x2 > y2 π/2. 52 6.3 Verallgemeinerung auf mehrere Variablen Wenn F von mehreren Funktionen yi (x) und ihren Ableitungen abhängt, also F = F (y1 , ..., yn ; y10 , ..., yn0 ; x), dann erhalten wir ganz analog ∂F d ∂F − = 0 , i = 1, ..., n . (6.11) dx ∂yi 0 ∂yi Diese Gleichungen werden als Euler-Lagrange-Gleichungen bezeichnet. Wir definieren wieder ŷi (x) = yi (x) + δyi (x) mit δyi (x) = i ηi (x). Die Variation δI des Integrals (6.1) auf den Kurven yi (x) ist definiert als Z x2 X n n X ∂F d ∂F ∂I = δI = − δyi dx . (6.12) εi ∂εi ε1 =...=εn =0 ∂yi dx ∂yi 0 x1 i=1 i=1 I heißt stationär falls δI = 0 ist für alle ηi (x), also wenn die Euler-Lagrange-Gleichungen erfüllt sind. Wenn I stationär ist, heißt das allerdings noch nicht, dass ein Maximum oder Minimum von I vorliegt. Es kann auch eine Art “Sattelpunkt” vorliegen. Aber für das folgende Hamiltonsche Prinzip ist die Frage, ob I extremal ist oder “nur” stationär, irrelevant, da in seiner Formulierung nur erwähnt wird, dass I stationär ist. Es wird keine Aussage darüber gemacht, dass I einen Extremwert annehmen muss. 6.4 Hamiltonsches Prinzip Die Euler-Lagrange-Gleichungen haben genau die Form der Lagrange-Gleichungen zweiter Art. Dies sehen wir, wenn wir die Ersetzungen x → t, y → q, F → L machen. Die Funktion I nennen wir jetzt S. Das Hamiltonsche Prinzip lautet folgendermaßen: Die Bewegung eines mechanischen Systems zwischen den Zeiten t1 und t2 verläuft derart, dass die Wirkung Z t2 S≡ L (q, q̇, t) dt stationär ist. (6.13) t1 Das bedeutet, dass δS = 0 (6.14) ist, was auch das Prinzip der stationären Wirkung genannt wird. In der Formulierung (6.13) ist dieses Prinzip für alle Systeme gültig, deren Kräfte sich gemäß (3.8) oder (3.12) aus einem Potenzial ableiten lassen und deren Zwangsbedingungen holonom bzw. differentiell sind. Wenn es k holonome Zwangsbedingungen gibt, ist L = L (q1 , ..., q3N −k ; q˙1 , ..., q̇3N −k ; t) und Z δS = −k t2 3N X t1 j=1 d ∂L ∂L − ∂qj dt ∂ q˙j δqj dt = 0 . (6.15) Hier repräsentiert δqi (t) eine Variation von qi (t) zum Zeitpunkt t. Das entspricht der in Kapitel 2 definierten virtuellen Verrückung. Mit (6.15) ist nach dem Fundamental-Lemma der Variationsrechnung das Hamiltonsche Prinzip zu den Lagrange-Gleichungen zweiter Art (3.10) äquivalent. Mit dem Hamiltonschen Prinzip lässt sich auf elegante Art die “Eichinvarianz” der Lagrange-Gleichungen zeigen, also dass die zwei Lagrange-Funktionen L(q, q̇, t) und L0 (q, q̇, t) mit L0 (q, q̇, t) = cL(q, q̇, t) + d f (q, t) dt (6.16) auf dieselben Lagrange-Gleichungen führen. Wir haben dies schon in Anschluss an (4.8) gezeigt, und wir 53 zeigen dies jetzt nochmal auf eine andere Art: Z t2 Ldt = 0 δ Z t1 t2 ⇒δ L0 dt t2 Z = δ c t1 Z t1 t2 Z = δ t1 = t2 Ldt + t1 d f (q, t)dt dt d f (q, t)dt = δ (f (q(t2 ), t2 ) − f (q(t1 ), t1 )) dt 0 da an den Endpunkten keine Variation durchgeführt wird. 6.5 Variation mit Nebenbedingungen und Lagrange-Gleichungen erster Art Die Lagrange-Gleichungen erster Art (5.6) lassen sich durch die Methode der Lagrange-Multiplikatoren ableiten. Die Lagrange-Funktion wird jetzt in Abhängigkeit von allen 3N verallgemeinerten Koordinaten aufgestellt. Die Gleichung (6.15) wird also dahingehend geändert, dass eine Summation über alle 3N verallgemeinerten Koordinaten auftritt, Z 3N t2 X t1 j=1 d ∂L ∂L − ∂qj dt ∂ q˙j δqj dt = 0 . (6.17) Die virtuellen Verrückungen δqi (t) sind Zwangsbedingungen unterworfen und nicht unabhängig. Es gilt wieder 3N X aij δqj = 0 , i = 1, . . . , k . j=1 Wir addieren nun einen Term Z k 3N X t2 X t1 λi aij δqj dt = 0 j=1 i=1 zu (6.17) und erhalten Z 3N t2 X t1 j=1 k ∂L d ∂L X − + λi aij ∂qj dt ∂ q˙j i=1 ! δqj dt = 0 . (6.18) Die Lagrangeschen Multiplikatoren λi werden so gewählt, dass die Terme in den k runden Klammern, die vor den k abhängigen δqj stehen, Null ergeben. Die restlichen 3N − k Klammern verschwinden ebenfalls, da die zugehörigen δqj unabhängig sind. Es ergeben sich also wieder die Lagrange-Gleichungen erster Art (5.6). 6.6 Beispiele Als erstes Beispielsystem betrachten wir einen harmonischen Oszillator. Hier werden wir zeigen, dass die Wirkung nicht immer minimal ist, sondern dass sie für Zeiten, die größer als die halbe Schwingungsperiode sind, einen Sattelpunkt hat. Die Wirkung des harmonischen Oszillators ist Z t2 m 2 D 2 ẋ − x dt . S[x] = 2 2 t1 54 Wir setzen p in Folgenden t1 = 0 und x(t1 ) = 0. Die Lösung der Bewegungsgleichungen ist x(t) = A sin ωt mit ω = D/m, und sie ist die Lösung der Bedingung δS = 0. Wir betrachten nun eine variierte Bahn x̂(t) = x(t) + η(t) mit η(0) = η(t2 ) = 0. Für diese Bahn lautet die Wirkung Z Z t2 2 t2 2 mη̇ − Dη 2 dt . [mẋη̇ − Dxη]dt + S[x + η] = S[x] + 2 0 0 Wir integrieren jeweils den ersten Term in den eckigen Klammern partiell und verwenden η(0) = η(t2 ) = 0. Dies führt auf Z t2 Z 2 t2 [mẍ + Dx]ηdt − S[x + η] = S[x] − [mη̈ + Dη] ηdt ≡ S[x] + ∆S . 2 0 0 | {z } =0 Wir entwickeln die Abweichungen η(t) in eine Fourierreihe, η(t) = ∞ X bk sin k=1 kπ t t2 und benutzen die Orthogonalitätsrelationen Z t2 kπ lπ t2 sin t sin t dt = δkl , t t 2 2 2 0 woraus mη̈ + Dη = ∞ X " D−m k=1 kπ t2 2 # bk sin kπ t t2 folgt. Also ist ∞ 2 X ∆S = − 2 k,l=1 " D−m kπ t2 2 # Z t2 bk bl sin 0 " 2 # ∞ lπ 2 t 2 X kπ kπ t sin t dt = − D−m b2k . t2 t2 2 2 t2 k=1 Für r t2 > π m π T = = D ω0 2 gibt es ein k0 so, dass die eckigen Klammern für k < k0 positiv und für k > k0 negativ sind. Also ist für η1 (t) ≡ k0 X bk sin k=1 kπ t t2 das ∆S negativ, also S[x] > S[x + η1 ]. Für η2 (t) ≡ ∞ X bk sin k=k0 +1 kπ t t2 dagegen ist ∆S positiv, also S[x] < S[x+η2 ]. Folglich ist S[x] für t2 > T /2 weder minimal noch maximal. Als zweite Anwendung betrachten wir eine schwingende Saite. Hier ist unser Ziel, aus dem Prinzip der stationären Wirkung die Wellengleichung für diese Saite abzuleiten. Wir bezeichnen die Länge der Saite mit l und ihre Massenbelegung mit % (das hat die Einheit kg/m). Die Saite werde an beiden Enden 55 festgehalten und mit einer konstanten Kraft F vorgespannt. Die Auslenkung an der Stelle x wird mit y(x, t) bezeichnet. Wir gehen davon aus, dass die Auslenkung so klein ist, dass dadurch F nicht verändert wird. Gegenüber der bisher betrachteten Situation sind die y jetzt keine diskreten Variablen (wie es die qj waren), sondern sie hängen kontinuierlich von x ab. Man hat also statt den Summen über j ein Integral über x in der Lagrange-Funktion. Wir berechnen zuerst die Lagrange-Funktion L = T − V . Es ist Z % l 2 ẏ (x, t)dx T = 2 0 und Z ds − l V = F δl = F Z lp =F ! 1 + y 02 dx − l . 0 An geeigneter Stelle werden wir uns daran erinnern, dass y 0 eine kleine Größe ist. Variation der Wirkung ergibt # Z Z t2 "Z l p % 2 02 ẏ − F 1 + y dx + F l dt δ Ldt = δ 2 0 t1 # Z t2 Z l " Z t2 Z l ẏ 0 %ẏδ ẏ − F p [%ẏδ ẏ − F ẏδy 0 ] dxdt = δy dxdt ' 02 1+y 0 0 t1 t1 Z l Z t2 Z t2 Z l = %ẏδy|tt21 dx − F y 0 δy|l0 dt − [%ÿ − F y 00 ] δy dx dt 0 Z t1 t1 t2 l Z %ẏ[δy(x, t2 ) − δy(x, t1 )]dx − F = 0 0 y 0 [δy(l, t) − δy(0, t)]dt − t1 Z t2 t1 Z l [%ÿ − F y 00 ] δy dx dt . 0 Die Variation verschwindet am Anfang und am Ende der Zeit, also ist δy(x, t1 ) = δy(x, t2 ) = 0 für alle x. Außerdem verschwindet die Variation an den Rändern der Saite, und es ist δy(0, t) = δy(l, t) = 0 für alle t. Damit bleibt nur der dritte Term übrig, und es folgt Z t2 Z l δS = − [%ÿ − F y 00 ] δy dx dt . t1 0 Da die Variationen δy(x, t) beliebig sind, kann das Doppelintegral nur verschwinden, wenn der Term in der eckigen Klammer Null ist. Damit haben wir die Wellengleichung 1 ÿ(x, t) = y 00 (x, t) c2 erhalten. Die Fortpflanzungsgeschwindigkeit der Welle ist c = (6.19) p F/%. Bemerkung: Man kann die Bewegungsgleichung der Saite auch direkt aus den Lagrange-Gleichungen zweiter Art erhalten, wenn man die Saite diskretisiert. Wir unterteilen die Saite in N = l/∆x kleine Abschnitte der Länge ∆x. Wir schreiben also xj = j∆x , yj = y(xj ) , y0 = yj+1 − yj ∆x und machen die Ersetzung Z dxf (x, t) → X ∆xf (xj , t) . j Damit ist L= N −1 N −1 % X 2 F X yj+1 − yj ẏj (t)∆xj − ∆xj , 2 j=0 2 j=0 (∆xj )2 56 wobei wir wieder p 1 + y 02 durch 1 + y 02 /2 ersetzt haben. Die Lagrange-Gleichungen zweiter Art sind also d ∂L yj − yj−1 yj − yj+1 ∂L = %ÿj ∆xj = F + = . dt ∂ ẏj ∆x ∆x ∂yj Das führt auf %ÿj = F 2yj − yj+1 − yj−1 (∆x)2 und schließlich, wenn wir wieder zum Kontinuum gehen, auf %ÿ = F y 00 . Aufgaben 1. Seifenhaut: Eine Seifenhaut, die zwischen zwei an den Positionen x1 und x2 um die x-Achse zentrierten Kreisen mit den Radien y1 und y2 eingespannt ist, nimmt eine minimale Fläche ein. (a) Stellen Sie eine Bedingung für diese Fläche auf. (b) Berechnen Sie die Kurve y(x), die die minimale Fläche beschreibt. Gehen Sie dabei aus von ∂F F − y 0 ∂y 0 = konst. ≡ a (siehe Gleichung (6.10) im Skript). In Ihrem Ergebnis für y(x) darf die Konstante a drinstehen. Erklären Sie am Ende, durch welche Bedingung der Wert von a festgelegt wird. (Hinweis: Vielleicht brauchen Sie folgende Beziehung: cosh2 (x)−1 = sinh2 (x).) 2. Weisen Sie nach, dass sich ein Teilchen, das infolge von Zwangskräften auf einer gekrümmten Fläche laufen muss, ansonsten aber kräftefrei ist, auf einer Geodäten (also der kürzest möglichen Verbindung zwischen zwei Punkten) bewegt. (Statt der gekrümmten Fläche kann man auch einen gekrümmten Raum betrachten - das findet bei der Allgemeinen Relativitätstheorie eine Anwendung.) 3. Hochspannungsleitung: Gegeben ist ein Kabel, das an den Enden xA und xB auf derselben Höhe yA = yB aufgehängt ist und nicht den Boden berühren kann. Im Folgenden soll schrittweise die Form des Kabels berechnet werden, indem die potenzielle Energie minimiert wird. R (a) Stellen Sie die potenzielle Energie in der Form Upot = F (y, y 0 ) dx auf, wobei y(x) die Form des Kabels beschreibt. (b) Das Kabel habe die Länge L (wobei der Abstand der beiden R Pfosten xB − xA < L sei). Schreiben Sie diese Nebenbedingung in Form eines Integrals g(y, y 0 ) dx − L = 0. (c) Um die Variation mit Nebenbedingungen zu lösen, soll eine erweiterte Funktion F̃ aufgestellt werden, die die Nebenbedingungen enthält: F̃ = F + λg mit λ ∈ R. ∂ F̃ Gehen Sie nun von der Beziehung F̃ − y 0 ∂y 0 = konst. ≡ a (analog zu Gleichung (6.10) im Skript) aus, um aus der erweiterten Funktion F̃ eine Lösung für die Kurve des Kabels y(x) zu bestimmen. Ihr Ergebnis für y(x) darf von a und λ abhängen. (Hinweis: Vielleicht brauchen Sie folgende Beziehung: cosh2 (x) − 1 = sinh2 (x).) (d) Geben Sie die beiden Beziehungen an, durch die a und λ festgelegt sind. 57 Kapitel 7 Zentralkraft In diesem und den folgenden drei Kapiteln behandeln wir Anwendungen des bisher behandelten Stoffs. In diesem Kapitel diskutieren wir das Problem zweier Körper, die sich unter dem Einfluss einer wechselseitigen Zentralkraft bewegen. Zentralkräfte zeigen in Richtung der Verbindungslinie der beiden Körper. Wir beschränken uns wie in Abschnitt 1.5 auf konservative Zentralkräfte, deren Betrag nur vom Betrag des Abstands der beiden Körper abhängt, aber nicht von der Richtung. Wir betrachten zwei Teilchen mit den Massen m1 , m2 und der Kraft F~ = F~ (~r, t) zwischen ihnen, wobei ~r ≡ ~r1 − ~r2 ist: m1~r¨1 = F~ (~r, t) , 7.1 m2~r¨2 = −F~ (~r, t) (7.1) Allgemeine Lösung der Bewegungsgleichungen Unser Ziel ist es, diese Bewegungsgleichungen zu lösen. Da dies ein abgeschlossenes Zweiteilchensystem ist, ist es zweckmäßig, einen Koordinatenwechsel zu Schwerpunkts- und Relativkoordinaten vorzunehmen. Von der Schwerpunktbewegung wissen wir nämlich schon, dass für sie die Erhaltung von Impuls und Drehimpuls gilt. Der Schwerpunkts-Vektor ist ~ = m1~r1 + m2~r2 . R m1 + m2 Addition der beiden Gleichungen in (7.1) führt auf (vgl. (1.17)) m1~r¨1 + m2~r¨2 = 0 ⇒ ¨ ¨ ~¨ = m1~r1 + m2~r2 = 0 . R m1 + m2 (7.2) Die Bewegung des Schwerpunkts ist also gleichförmig. Subtraktion der aus (7.1) durch Multiplikation mit den Massen erhaltenen Gleichungen m2 m1~r¨1 = m2 F~ , ergibt m1 m2~r¨2 = −m1 F~ m1 m2 ¨ ~ ~r = F (~r, t) m1 + m2 mit der sogenannten reduzierten Masse m≡ m1 m2 . m1 + m2 (7.3) (7.4) Aus Gleichungen (7.2) und (7.3) erkennen wir, dass die Schwerpunktsbewegung und die Relativbewe~ nicht von der für ~r abhängt und gung völlig voneinander entkoppelt sind, also dass die Gleichung für R umgekehrt. 58 Im Folgenden betrachten wir nur noch die Relativbewegung. Wir sehen an Gleichung (7.3), dass die Relativbewegung zweier Massen, die von außen nicht beeinflusst werden, zur Bewegung eines Einteilchensystems mit reduzierter Masse m äquivalent ist: m~r¨ = F~ (~r, t) (7.5) Zentralkräfte zeigen immer auf einen bestimmten Punkt, das sog. Kraftzentrum, den wir o.B.d.A. in den Ursprung des Koordinatensystems legen. Ein Beispiel hierfür ist die Gravitationskraft zwischen zwei Massen (1.13) m~r¨ = −G mM ~r m1 m2 ~r = −G 2 r2 r r r wobei M ≡ m1 + m2 . Nach (1.21) ist der Drehimpuls konstant, d.h. ~ = ~r × p~ = konst. L Dies folgt auch aus dem Noether-Theorem, da eine Rotationsinvarianz vorliegt: weder die kinetische, noch die potenzielle Energie ändern sich bei einer Rotation des Koordinatensystems. Das Problem besitzt Kugelsymmetrie, d.h. Drehungen um irgendeine feste Achse haben keinen Einfluss auf die Lösungen. Da der Ortsvektor senkrecht zum konstanten Drehimpuls steht, ~ = ~r · (~r × p~) = 0 , ~r · L ~ = 0 ist ~r k ~r˙ , d.h. die Bewegung verlaufen Zentralkraftbewegungen in einer Ebene. (Für den Spezialfall L verläuft sogar längs einer Linie.) Konservative Zentralkräfte lassen sich ausdrücken als ~r F~ (~r) = f (r) , r f (r) = − dV (r) , dr (7.6) wobei das Potenzial V (r) nur von r ≡ |~r| abhängt (Vgl. Abschnitt 1.5). Weil die Bewegung in einer Ebene stattfindet, reicht es, das System durch zwei Freiheitsgrade zu beschreiben. Wir wählen Polarkoordinaten und verwenden den Lagrange-Formalismus: m 2 L= ṙ + r2 ϕ̇2 − V (r) . (7.7) 2 Die entsprechenden Bewegungsgleichungen sind mr̈ = − dV + mrϕ̇2 dr und mr(rϕ̈ + 2ṙϕ̇) = 0 . Wegen der zweiten Zeitableitungen sind zur Lösung eigentlich vier Integrationen nötig. Unter Verwendung der Erhaltungsgrößen können wir dies auf zwei Integrationen reduzieren. Die Variable ϕ ist zyklisch, also ist pϕ = ∂L = mr2 ϕ̇ = konst ∂ ϕ̇ (7.8) eine Erhaltungsgröße. Dies ist der Drehimpuls. Außerdem sind alle zu Beginn von Abschnitt 4.4 genannten Bedingungen dafür erfüllt, dass die Energie eine Erhaltungsgröße ist. Insbesondere ist L nicht explizit zeitabhängig. Es gilt also E= p2ϕ m 2 (7.8) m 2 ṙ + r2 ϕ̇2 + V (r) = ṙ + + V (r) = konst . 2 2 2mr2 59 (7.9) Wir gehen weiterhin so vor wie beim Lösen der Aufgabe mit dem Teilchen im Kreiskegel (Abschnitt 4.4). Auflösen von (7.9) nach ṙ ergibt s p2ϕ 2 dr . (7.10) ṙ ≡ =± E − V (r) − dt m 2mr2 Die beiden Vorzeichen gelten jeweils für verschiedene Bahnabschnitte, nämlich für diejenigen, bei denen r mit der Zeit zunimmt, und für diejenigen, bei denen r mit der Zeit abnimmt. Der Ausdruck unter der Wurzel in Gleichung (7.10) darf nicht negativ sein. Wenn er Null wird, also wenn ṙ = 0 bzw. V (r) + p2ϕ =E 2mr2 (7.11) ist, hat die Bewegung dort einen Umkehrpunkt. Damit es einen minimalen Abstand gibt, muss −V (r) im Limes r → 0 negativ werden, oder, wenn es positiv ist, langsamer anwachsen als p2ϕ /2mr2 . Wenn es auch einen maximal möglichen Abstand gibt, nennt man die Bewegung “gebunden”. Es bleiben jetzt noch zwei Integrationen übrig, denn die Gleichungen erster Ordnung (7.8),(7.10) sind noch zu lösen. Integration von (7.10) mit r0 ≡ r(t = 0) ergibt Z r dr0 dt 1 r ⇒ t = ± (7.12) = ±r . dr p2ϕ p2ϕ r0 2 2 0 m E − V (r) − 2mr 2 m E − V (r ) − 2mr 0 2 Die Radialbewegung r = r(t) ergibt sich aus der Umkehrung von (7.12) für vorgegebene V (r), E, pϕ . Diese Lösungen gelten jeweils für Abschnitte, bei denen ṙ ein festes Vorzeichen hat. An den Umkehrpunkten werden die Lösungen zu verschiedenen Vorzeichen aneinander gefügt. pϕ Mit (7.8), d.h. ϕ̇ = dϕ dt = mr 2 (t) und ϕ0 ≡ ϕ(t = 0) ist ϕ(t) = pϕ m t Z dt0 r2 (t0 ) 0 + ϕ0 . (7.13) Damit ist das Problem formal auf Integrale mit vier (Integrations-)konstanten pϕ , E, r0 , ϕ0 zurückgeführt. Wenn man sich nur für die Bahngestalt, und nicht für den zeitlichen Ablauf interessiert, bestimmt man die geometrische Bahn r(ϕ) bzw. ϕ(r) statt der beiden Größen r(t), ϕ(t). Die Berechnung geht so: 1) 1),2) ⇒ (7.8) dt = mr2 dϕ , pϕ mr2 dϕ = ± r pϕ 2 m ⇒ 7.2 ϕ(r) = ± pϕ m Z dr ⇔ E − V (r) − r r0 dr (7.10) 2) dt = ± r p2ϕ r0 2 2 m E − V (r) − dϕ = ± 2mr 2 dr0 r 2 m E − V (r0 ) − p2ϕ 2mr 0 2 + ϕ0 . pϕ m p2ϕ 2mr 2 dr r r2 2 m E − V (r) − p2ϕ 2mr 2 (7.14) Das zweite Keplersche Gesetz Das zweite Keplersche Gesetz besagt, dass der “Fahrstrahl”, also die Verbindungslinie von der Sonne zu dem betrachteten Planeten, in gleicher Zeit gleiche Flächen überstreicht. Historisch betrachtet hat Kepler dieses Gesetz vor seinen beiden anderen Gesetzen gefunden, als er die Bahn des Planeten Mars genau untersuchte und feststellte, dass die Geschwindigkeit des Planeten schneller ist, wenn der Planet näher an der Sonne ist. 60 Dieses Gesetz folgt direkt aus der Drehimpulserhaltung und gilt für alle konservativen Zentralkräfte, nicht nur für Kräfte der Form f (r) ∝ 1/r2 . Wir bezeichnen die überstrichene Fläche mit A, und für die Änderung von A gilt ⇒ dA = dA dt = 1 r rdϕ 2 1 2 dϕ (7.8) pϕ = r = konst . 2 dt 2m (7.15) Also ist 12 r2 ϕ̇ die Flächengeschwindigkeit, d.h. die Fläche, die vom Radiusvektor pro Zeiteinheit überstrichen wird, und sie ist identisch mit dem Drehimpuls. 7.3 Das effektive Potenzial Für Potenziale vom Typ V (r) = arn+1 , d.h. Kräfte F ∝ rn , führen die Bewegungsgleichungen für n = 1, −2, −3 auf elementare Integrale und für n = 5, 3, 0, −4, −5, −7 auf die sogenannten elliptischen Funktionen (siehe z.B. Goldstein S.81-83). Berechnungen und Ergebnisse sind i.A. kompliziert. Qualitative Aussagen über die radiale Bewegung lassen sich aber durch Betrachtung des effektiven Potenzials Veff (r) machen. Wir schreiben die Gesamtenergie (7.9) als E= m 2 ṙ + Veff (r) 2 (7.16) mit dem sogenannten “effektiven Potenzial” Veff (r) ≡ V (r) + p2ϕ 2 |2mr {z } . (7.17) Zentrifugalpotenzial Dieses setzt sich zusammen aus dem zur Zentralkraft gehörenden Potenzial und dem “Zentrifugalpotenzial”, aus dessen Ableitung nach r sich die Zentrifugalkraft ergibt. Als Beispiel betrachten wir den harmonischen Oszillator, der durch das Potenzial V (r) = 1 2 fr 2 definiert ist, also ist die Kraft F~ (~r) = −f~r eine lineare Rückstellkraft, wie z.B. bei einem Pendel mit kleiner Auslenkung oder einer Masse an einer elastischen Feder. 61 Das effektive Potenzial geht sowohl für r → 0 als auch für r → ∞ gegen Unendlich und hat dazwischen irgendwo ein Minimum. Die Energie muss mindestens so groß wie das effektive Potenzial an diesem Minimum sein, damit eine Lösung (7.10) existiert. Die Bewegung hat zwei Umkehrpunkte, die sich aus der Bedingung E = Veff (r) ergeben. Die Bewegung ist also “gebunden”. Für pϕ = 0 gilt Veff = V , und die Bewegung verläuft längs einer Geraden, z.B. längs der x-Achse. Die lineare Rückstellkraft Fx = −f x führt dann auf eine einfache harmonische Schwingung. Für pϕ 6= 0 geht die Bewegung nicht durch das Kraftzentrum. An der komponentenweisen Darstellung Fx = −f x und Fy = −f y sehen wir, dass die Bewegung die Resultierende zweier harmonischer Schwingungen im rechten Winkel zueinander mit gleicher Frequenz ist. Dies führt i.A. auf elliptische Bahnen. (Wenn die Frequenzen nicht gleich wären, ergäben sich Lissajous-Figuren.) Wenn E den minimal möglichen Wert hat, nämlich den des Minimums von Veff (r), dann liegt eine Kreisbahn vor. Das Minimum von Veff ergibt sich aus der Gleichung 0= p2ϕ dVeff = fr − , dr mr3 und der Radius der Kreisbahn ergibt sich folglich zu r0 = 7.4 p2ϕ mf !1/4 . Geschlossene und offene Bahnen Für eine gebundene Bewegung zwischen zwei Umkehrpunkten r1 , r2 ändert sich ϕ bei einem vollen Zyklus r1 → r2 → r1 mit (7.14) um Z p ϕ r2 dr0 r ∆ϕ = + 2 m r1 0 2 2 0 ) − pϕ E − V (r r 02 m 2mr Z r1 0 pϕ dr r − m r2 0 2 2 p2ϕ 0 r m E − V (r ) − 2mr 02 Z pϕ r2 dr0 r = 2 . m r1 0 2 2 p2ϕ 0 r m E − V (r ) − 2mr 0 2 Die Bahn heißt geschlossen, falls ∆ϕ = m 2π n 62 (7.18) ist mit ganzen Zahlen m und n, d.h. wenn n Radialzyklen m Umläufe ergeben, so dass sich die Kurve nach m Umfäufen schließt. Sonst ist die Bahn offen. Nur der harmonische Oszillator, V = f2 r2 , und das Keplerpotenzial, V = − αr , haben finite geschlossene Bahnen für alle Anfangsbedingungen. 7.5 Kepler-Potenzial Das wichtigste Zentralkraftpotenzial, das Kepler-Potenzial V (r) = −G α m1 m2 ≡− r r (7.19) der Planetenbewegung, wird im Folgenden ausführlich behandelt. Das effektive Potenzial für Bewegungen im Gravitationsfeld ist nach (7.17) p2ϕ α . Veff (r) = − + r 2mr2 Damit ist 1 E = Veff (r) + mṙ2 , 2 was genau derselbe Ausdruck ist, den man in einem eindimensionalen System hätte, in dem das Potenzial dem Veff entspricht. Folgende Fälle sind zu unterscheiden: 1) E = E1 ≥ 0: Da das effektive Potenzial für r → 0 gegen +∞ geht, gibt es einen minimalen Abstand r1 der Masse m vom Kraftzentrum. Dieser ist durch die Bedingung Veff (r1 ) = E1 festgelegt. Da Veff für genügend große r negativ ist, gibt es keinen äußeren Umkehrpunkt. Die Bahn ist infinit und beschreibt einen Streuvorgang, d.h. ein aus dem Unendlichen ankommendes Teilchen wird aufgrund des Zentrifugalpotenzials zurückgestoßen und wandert wieder ins Unendliche. Nur für pϕ = 0 stürzt das Teilchen ins Kraftzentrum. Wir werden später herausfinden, dass für pϕ 6= 0 und E1 > 0 eine Hyperbelbahn und für E1 = 0 eine Parabelbahn vorliegt. 2) Wenn E negativ ist, ist die Bewegung gebunden, weil Veff für r → ∞ gegen Null geht, also für genügend große r über dem Wert von E liegt. Es gibt also zwei Umkehrpunkte, diese seien bei den Radien r2 (innen) und r3 (außen). Wir bezeichnen mit E2 die Energie Veff (r2 ) und mit E3 den minimalen Wert von Veff . Wenn E3 < E = E2 < 0 ist, ist die Bahn finit und beschreibt einen gebundenen Zustand. Das Teilchen läuft zwischen den Umkehrpunkten r2 und r3 hin und her. 3) Die Energie entspricht dem Minimum von Veff . Die Bahn bildet einen Kreis mit Radius 63 p2ϕ α dVeff = r0 = 2 − =0 dr r r0 mr03 ⇒ r0 = p2ϕ . mα (7.20) Wir berechnen nun noch die geometrische Bahn ϕ(r). (7.19) in (7.14) eingesetzt ergibt: Z r dr0 q + ϕ0 . ϕ(r) = ± 2 2mE r0 r 0 − r10 2 + 2mα p2 r 0 + p2 ϕ Substitution u0 = 1 r0 (7.21) ϕ ⇒ du0 = − r10 2 dr0 ergibt Z u du0 ϕ(u) = ∓ q u0 −u0 2 + 2mα 0 p2ϕ u + 2mE p2ϕ + ϕ0 . Unter Benutzung von Z dx 2 ax + bx + c für a < 0 , b2 − 4ac > 0 ergibt sich √ = 1 √ arccos −a 2ax + b √ b2 − 4ac ϕ(u) = −2u + ∓ arccos r 2mα p2ϕ = p2 2mα p2ϕ 2 8mE p2ϕ + + ϕ̂0 1− ϕ u ∓ arccos q mα 2 + ϕ̂0 . 2Ep 1 + mα2ϕ (7.22) (7.23) Auflösen von (7.22) nach u ergibt mit cos (±(ϕ − ϕ̂0 )) = cos(ϕ − ϕ̂0 ) dann " # r 2Ep2ϕ 1 mα ≡u= 2 1− 1+ cos(ϕ − ϕ̂0 ) . r pϕ mα2 Wir wählen ϕ0 ≡ ϕ̂0 + π. Mit cos(ϕ − ϕ0 + π) = − cos(ϕ − ϕ0 ) lautet dann die Bahngleichung 1 = C (1 + ε cos(ϕ − ϕ0 )) . r (7.24) Wir definieren die Exzentrizität ε der Bahn r ε≡ 1+ 2Ep2ϕ . mα2 p2 (7.25) ϕ C −1 = mα heißt “Parameter” der Bahn, der Winkel ϕ0 das Perihel. (Bei ϕ = ϕ0 ist die Bahn dem Koordinatenursprung am nächsten.) Die Bahngleichung (7.24) ist die Gleichung eines Kegelschnittes, dessen einer Brennpunkt im Koordinatenursprung (Kraftzentrum) liegt. Für die betrachteten Fälle in der Diskussion des effektiven Potenzials ergeben sich die folgenden Bahneigenschaften: 1) E = E1 ≥ 0: (7.25) a) E = E1 > 0 ⇒ ε > 1, d.h. die Bahn ist eine Hyperbel b) E = E1 = 0 ⇒ ε = 1, d.h. die Bahn ist eine Parabel 64 2) E3 < E = E2 < 0 ⇒ 0 < ε < 1, d.h. die Bahn ist eine Ellipse. Dass die Planetenbahnen Ellipsen sind, ist das Erste Keplersche Gesetz. (7.25) mit cos(ϕp −ϕ0 )=1 Perihel-Abstand: rp = Aphel-Abstand: rA cos(ϕA −ϕ0 )=−1 = 1 , C(1 + ε) 1 C(1 − ε) (7.26) vom Koordinatenursprung. Die große Halbachse a der Ellipse ist definiert als a= rP + rA 2 (7.26) = 1 C(1 − ε2 ) (7.25) = − p2ϕ mα2 α =− . mα 2Ep2ϕ 2E Also ist α , 2a d.h. die Energie des Teilchens auf der Ellipsenbahn hängt nur von a ab. E=− (7.27) Zur Bestimmung der kleinen Halbachse b setzen wir ϕ0 = 0. Der Abstand c des Kraftzentrums vom Ellipsenmittelpunkt ist c = a − rP = . C(1 − 2 ) Die kleine Halbachse schneidet die Ellipse bei einem Winkel ϕ, der durch die Bedingung r(ϕ) cos(ϕ) = −c gegeben ist. Dies ergibt cos(ϕ) = − und r−1 = C(1 − 2 ). Die Länge der kleinen Halbachse ist gegeben durch die Bedingung b2 = r2 − c2 , was schließlich b= 1 √ C 1 − 2 ergibt. Damit können wir das dritte Keplersche Gesetz herleiten: Die Fläche der Ellipse ist A = πab = π C 2 (1 1 πa3/2 = √ . 2 3/2 − ) C Außerdem ist die Fläche A wegen dem zweiten Keplerschen Gesetz (7.15) identisch mit pϕ T /2m, wobei T die Umlaufdauer ist. Gleichsetzen dieser beiden Ausdrücke für A und Einsetzen der Konstanten ergibt das Dritte Keplersche Gesetz a3 = konst , T2 (7.28) wobei wir seit Newton auch den Wert der Konstanten kennen, konst = α G(m1 + m2 ) = . 4mπ 2 4π 2 Da die Masse eines Planenten sehr viel kleiner ist als die Sonnenmasse, kann die Summe der beiden Massen durch die Sonnenmasse genähert werden. Dann ist das Verhältnis a2 /T 3 weder von der Planetenmasse, noch von seiner Energie oder seienm Drehimpuls abhängig. Also ist dieses Verhältnis für alle Planeten gleich. 65 3) E = E3 ≡ Veff (7.20) p2ϕ mα r0 = mα2 mα2 =− 2 + pϕ 2p2ϕ | {z } | {z } −α/r (7.25) ⇒ ⇒ 2 = − mα 2p2 ϕ p2ϕ /(2mr 2 ) ε = 0, d.h. die Bahn ist ein Kreis; p2ϕ r0 = C −1 = mα α E=− 2r0 aus (7.24) für ε = 0 folgt: (7.29) D.h., für r0 = a sind die Energien für Kreis- und Ellipsenbahnen gleich. Aufgaben 1. Betrachten Sie das Teilchen im Kreiskegel. Gehen Sie aus von der Rechnung in Abschnitt 4.4. (a) Schreiben Sie durch Einführen einer modifizierten Masse und eines modifizierten Winkels die Lagrange-Funktion so um, dass sie genau wie diejenige eines Zentralpotenzials aussieht. (b) Was ist das effektive Potenzial? (c) Skizzieren Sie Veff (r) und begründen Sie hieraus, dass die Bewegung gebunden ist. Zeichnen Sie in Ihrer Skizze den minimalen und den maximalen Radius ein. (d) Für welches r resultiert eine Kreisbahn? (e) Erwarten Sie, dass die Bahnen geschlossen sind? ~ als 2. Lenz-Vektor: Für die Bahn ~r(t) im Kepler-Potenzial definieren wir den Lenzschen Vektor Λ ~ ~ = m ~r˙ × (~r × ~r˙ ) − ~r = p~ × L − ~r . Λ α r αm r Zeigen Sie ~ ist eine Erhaltungsgröße, d.h. dΛ/dt ~ (a) Λ = 0. ~ ist gleich der Exzentrizität . (b) |Λ| ~ zeigt zum Perihel, also Λ ~ k ~rP . (rP ist der Vektor vom Kraftzentrum zum Perihel.) (c) Λ 66 Kapitel 8 Streuung im Zentralkraftfeld Eine wichtige Anwendung von Zentralkraftfeldern ist die Streutheorie. Streuphänomene werden in vielen Bereichen der Physik untersucht, um die Eigenschaften der Materie auf verschiedensten Längen- und Energieskalen zu ergründen, von Femtometern (und GeV) in der Teilchenphysik bis zu Nanometern (und meV) in der Festkörperphysik. Wegen der Wellennatur von Teilchen muss die Energie der Geschosse um so höher sein, je kleiner die Struktur ist, die man anhand ihres Streuverhaltens untersuchen möchte. Die Berechnungen müssen deshalb in der Regel im Rahmen der Quantentheorie durchgeführt werden. Trotzdem ist die Methode der Streutheorie in der klassischen Mechanik und der Quantenmechanik weitgehend gleich, und teilweise werden Aussagen der klassischen Streutheorie zumindest approximativ in der Quantenmechanik bestätigt. Die Bilder und Formeln im folgenden Text sind für den Fall eines abstoßenden Potenzials gemacht. Streuung in einem anziehenden Potenzial geht analog. 8.1 Stoßparameter Als erstes wichtiges Konzept definieren wir den Stoßparameter s. Wir gehen davon aus, dass die Kraft im Unendlichen auf Null geht, so dass das Teilchen zunächst mit Geschwindigkeit v0 auf einer geraden Bahn angeflogen kommt, dann durch das Kraftzentrum abgelenkt wird, und sich nach dem Stoß wieder einer (anderen) geraden Bahn annähert. Verlängert man diese asymptotischen geraden Bahnen am Kraftzentrum vorbei, dann ist der Stoßparameter s der geringste Abstand dieser Geraden vom Kraftzentrum. Der Drehimpuls der einlaufenden Teilchen bzgl. des Kraftzentrums lässt sich durch s ausdrücken: √ pϕ = mv0 s = 2mE s , E= 1 mv 2 = konst 2 0 wobei v0 die Anfangsgeschwindigkeit für große Abstände vom Kraftzentrum ist und die Kraft für große Abstände gegen Null gehen soll. Im Zentralkraftfeld ist die Bewegung symmetrisch bzgl. des Perihels P . Daher ist der Streuwinkel θ = π − 2ϕ0 . 67 Der Winkel ϕ0 im Perihel der Bahn ist nach (7.14): ϕ0 = ϕ(r∞ ) − ϕ(rmin ) Z dr pϕ ∞ r = m rmin 2 2 r m E − V (r) − p2ϕ 2mr 2 Durch die Substitution u = 1/r und mit p2ϕ = 2mEs2 ergibt sich für den Streuwinkel: Z umax θ(s) = π − 2s 0 8.2 du p . 2 2 1 − s u − V (1/u)/E (8.1) Differentieller Wirkungsquerschnitt Um genügend Statistik zu erhalten, schießt man nicht nacheinander einzelne Teilchen auf das Target, sondern verwendet “homogene” Teilchenstrahlen mit möglichst großer Teilchendichte. Die Intensität I ist die Zahl der Teilchen, die pro Sekunde durch eine Einheitsfläche senkrecht zur Teilchengeschwindigkeit laufen (Einheit von I: s−1 m−2 ). Der Teilchenstrahl enthält also Teilchen mit verschiedenen Stoßparametern. Die Zahl der pro Zeiteinheit einfallenden Teilchen mit einem Stoßparameter, der zwischen s und s + ds liegt, beträgt 2πsds | {z } I . Fläche Dies muss gleich der Anzahl der Teilchen sein, die in einen Raumwinkel dΩ = 2π sin θdθ zwischen θ und θ + dθ gestreut werden (vorausgesetzt der Zusammenhang zwischen θ und s ist eindeutig). Den Zusammenhang zwischen dem Stoßparameter s und dem Streuwinkel θ schreiben wir als 2πsds I = −σ(θ) |2π sin {z θdθ} I . dΩ Das negative Vorzeichen kommt daher, dass für größere s eine geringere Kraft auf das Teilchen wirkt, d.h. der Streuwinkel wird kleiner. Der Proportionalitätsfaktor σ(θ) ≡ dσ/dΩ mit der Einheit Fläche wird als differentieller Wirkungsquerschnitt bezeichnet: σ(θ) = − s ds , sin θ dθ 0 ≤ θ ≤ π. Integriert man den Wirkungsquerschnitt über den gesamten Raumwinkel, der zu dem Bereich θ > θ0 gehört, so erhält man diejenige Querschnittsfläche des einfallenden Teilchenstrahls, deren Teilchen um 68 mindestens den Winkel θ0 gestreut werden. Für den Wirkungsquerschnitt hat sich die Einheit “Barn” eingebürgert. Ein Barn ist 10−28 Quadratmeter. Das englische Wort “barn” bedeutet “Scheune”. Bei Streuexperimenten mit Atomkernen maß man überraschend große Wirkungsquerschnitte für die Streuung mit Streuwinkeln größer als 90 Grad, verglichen mit der Querschnittsfläche der Atomkerne. So kam es zu der Namensgebung. 8.3 Rutherford-Streuung Wir betrachten die Streuung geladener Teilchen im Coulomb-Feld, mit einem abstoßenden Potenzial der Form K V (r) = + , r d.h. die Energie ist immer größer als Null, und es treten nur infinite Bahnen auf. Das Coulomb-Potenzial hat genau dieselbe Form wie das Gravitationspotenzial, das wir im vorigen Kapitel ausführlich behandelt haben. Wir müssen nur den Parameter α durch −K ersetzen. Also erhalten wir die (7.24) entsprechende Bahngleichung, indem wir das Vorzeichen von C umkehren: 1 = C (−1 + ε cos(ϕ − ϕ0 )) , r wobei definiert ist als (vgl. (7.25)) r p2ϕ 2Ep2ϕ −1 ε≡ 1+ , C = . mK 2 mK Im Gegensatz zum vorigen Kapitel verschieben wir ϕ0 nicht um π, da wir ϕ0 wieder so definieren wollen, dass bei diesem Winkel das Perihel ist. Also ist r minimal für ϕ = ϕ0 . Wir wählen ϕ0 so, dass ϕ(r∞ ) = 0 ist. Also ist 1 1 0= = C (−1 + ε cos(0 − ϕ0 )) ⇔ cos ϕ0 = . r∞ ε Für den Streuwinkel θ gilt 0 ≤ θ ≤ π und π θ θ ≡ π − 2ϕ0 ⇒ sin ≡ sin − ϕ0 = cos ϕ0 . 2 2 √ Mit pϕ = 2mE s ergibt Auflösen von sin nach s: K s= 2E 1 sin2 θ 1 = =q 2 ε !1/2 θ 2 −1 = 1 1+ K θ cot 2E 2 2Es 2 K mit sin2 x = 1 . 1 + cot2 x Also ist der Wirkungsquerschnitt σ(θ) cot0 ( θ2 )=− 21 = sin θ=2 sin = s ds sin θ dθ 2 K θ 1 1 cot 2E 2 sin θ 2 sin2 2 1 K 1 . 4 2E sin4 θ2 − = θ 2 1 sin2 θ 2 cos θ 2 θ 2 1906 bis 1913 führten Rutherford, Geiger und Marsden Streuexperimente durch, bei denen sie α-Teilchen auf eine nur ca einen µm dicke Goldfolie schossen. Für die Auswertung der Experimente war die exakte Übereinstimmung von klassischem und (erst später berechneten) quantenthereotischem Wirkungsquerschnitt ein glücklicher Umstand. 69 8.4 Totaler Wirkungsquerschnitt Der totale Wirkungsquerschnitt ist definiert als Z Z σtot = σ(θ)dΩ = 2π π σ(θ) sin θ dθ . (8.2) 0 In der Rutherford-Streuung ist der totale Wirkungsquerschnitt unendlich. Dies kommt daher, dass das Coulomb-Potenzial eine unendliche Reichweite hat. Der totale Wirkungsquerschnitt ist die Zahl aller Teilchen, die pro Sekunde in alle Richtungen gestreut werden, dividiert durch die einfallende Intensität I. Wegen der unendlichen Reichweite des Potenzials werden auch noch solche Teilchen gestreut, die einen großen Stoßparameter haben. Die Gesamtzahl der pro Zeiteinheit gestreuten Teilchen divergiert also. Nur wenn das Potenzial für große Abstände schnell genug abfällt, ist der totale Wirkungsquerschnitt endlich. 8.5 Streuung an einer ideal reflektierenden Kugel Wir wählen eine feststehende Kugel vom Radius R als Streuzentrum und streuen Massepunkte elastisch an ihr. Den Einfallswinkel senkrecht zur Kugeloberfläche, der mit dem Ausfallswinkel identisch ist, nennen wir γ. Er hängt mit dem Stoßparameter s über die Beziehung sin γ = s R zusammen. Also ist der Streuwinkel θ θ = π − 2γ = π − 2 arcsin s . R Der Zusammenhang zwischen s und θ ist also s = R sin π−θ θ = R cos . 2 2 Daraus ergibt sich der differenzielle Wirkungsquerschnitt R cos θ2 R s ds s R θ θ R2 σ(θ) = = sin = sin = . sin θ dθ sin θ 2 2 sin θ 2 2 4 Er ist also unabhängig vom Winkel θ. Für den totalen Wirkungsquerschnitt erhalten wir Z Z π σtot = σ(θ)dΩ = 2π σ(θ) sin θdθ = πR2 . 0 Dies entspricht der Querschnittsfläche der Kugel, was zu erwarten war. 8.6 Streuung im Laborsystem Bisher wurde nur die Streuung im Feld eines im Koordinatenursprung verankerten Kraftzentrums untersucht. In der Praxis aber werden Teilchen nicht auf ein ortsfestes Kraftzentrum geschossen, sondern auf andere Teilchen, die entweder durch den Stoß in Bewegung versetzt werden oder sich von Anfang an ebenfalls bewegen. Der im Laborsystem gemessene Streuwinkel θL ist nicht identisch mit dem Streuwinkel θ im Schwerpunktsystem. Wir müssen daher eine Beziehung zwischen den Winkeln θ und θL aufstellen. Wir beschränken uns dabei auf den Fall, dass das Targetteilchen mit der Masse m2 vor der Streuung im Laborsystem ruht. Wir bezeichnen die Geschwindigkeiten vor der Streuung mit ~v und nach der Streuung mit 70 ~u. Im Laborsystem geben wir allen Ortsvektoren und Geschwindigkeiten den Index L, und im Schwerpunktsystem geben wir ihnen keinen Index. Da das Teilchen 2 vor dem Stoß ruht, ist die Geschwindigkeit des Schwerpunkts im Laborsystem gegeben durch m1 ~v1L . ~vSL = m1 + m2 Die Geschwindigkeit nach der Streuung erfüllt die Gleichung u1L sin θL = u1 sin θ , da die Geschwindigkeitskomponenten senkrecht zur Schwerpunktsbewegung in beiden Bezugssystemen gleich sind. Außerdem gilt u1L cos θL = u1 cos θ + vSL . Division der ersten durch die zweite Gleichung führt auf tan θL = sin θ vL1 . 1 cos θ + m1m+m 2 u1 (8.3) Wegen der Energieerhaltung ist im Schwerpunktsystem die Geschwindigkeit u1 des Teilchens 1 nach der Streuung gleich der Geschwindigkeit v1L − vSL des Teilchens 1 vor der Streuung: u1 = v1L − vSL = v1L − m1 m2 v1L = v1L . m1 + m2 m1 + m2 Einsetzen in (8.3) ergibt tan θL = sin θ m1 . cos θ + m 2 (8.4) Der Streuwinkel im Laborsystem ist also stets kleiner als im Schwerpunktsystem. Quadrieren der Gleichung (8.4) führt auf eine quadratische Gleichung für cos θ. Von den beiden Lösungen dieser Gleichung ist diejenige zu nehmen, für die im Fall m1 m2 der Streuwinkel im Laborund Schwerpunktsystem fast gleich ist. Man erhält also s 2 m1 m1 2 cos θ = − 1 − cos θL + cos θL 1 − (1 − cos2 θL ) . (8.5) m2 m2 Wir haben also unter Verwendung des Energie- und des Impulssatzes die Beziehung zwischen dem Streuwinkel θ im Schwerpunktsystem und dem Streuwinkel θL im Laborsystem gefunden. Der Streuwinkel ψL des Targetteilchens kann durch eine ähnliche Rechnung ermittelt werden. Das Ergebnis ist π−θ . (8.6) ψL = 2 Es ist noch interessant, den Fall m1 = m2 zu betrachten. Gleichung (8.4) liefert tan θL = sin θ θ = tan . 1 + cos θ 2 (8.7) Daraus folgt θ . 2 Da θ nicht größer als 180o sein kann, ist der Streuwinkel θL < 90o . Wenn Projektil und Targetteilchen gleich schwer sind, erfolgt die Streuung im Laborsystem also in Vorwärtsrichtung. Die Gleichungen (8.6) und (8.7) ergeben zusammen π ψL + θ L = . 2 θL = 71 Also laufen gleich schwere Teilchen nach der elastischen Streuung unter einem Winkel von 90o im Laborsystem auseinander (wenn der Stoß nicht so zentral ist, dass die erste Kugel nach dem Stoß liegenbleibt). Dieses Ergebnis ist jedem Billardspieler bekannt und setzt vier Bedingungen voraus: Der Stoß ist elastisch, beide Teilchen sind gleich schwer, die Masse m2 ruht vor dem Stoß und die Kräfte beim Stoß wirken in radialer Richtung. Nicht nur der Streuwinkel, auch die differenziellen Wirkungsquerschnitte sind in beiden Bezugssystemen verschieden. Im Laborsystem ist die Intensität der einfallenden Teilchen größer als im Schwerpunktsystem, weil ihre Geschwindigkeit größer ist. Wir bezeichnen diese Intensität mit IL . Der differenzielle Wirkungsquerschnitt im Laborsystem wird durch folgende Beziehung definiert: Zahl der pro Sekunde in den Raumwinkel dΩL gestreuten Teilchen . Intensität IL der einfallenden Teilchen (8.8) Die Zahl der Teilchen, die pro Sekunde mit einem Stoßparameter im Intervall [s, s + ds] einlaufen, ist gleich der Zahl der Teilchen, die pro Sekunde in den Winkelbereich [θL , θL + dθL ] gestreut werden: σL (θL )dΩL = σL (θL )2π sin θL dθL = IL · 2πs|ds| = IL · σL (θL )2π sin θL |dθL | . Daraus folgt s s ds = σL (θL ) = sin θL dθL sin θ ds sin θ · dθ sin θL dθ sin θ dθL = σ(θ) sin θL dθ = σ(θ) d cos θ . d cos θL dθL Wenn wir für cos θ die rechte Seite von (8.5) einsetzen, ergibt sich nach einer kurzen Rechnung 2 m1 1 + cos (2θ ) L m2 m1 σL (θL ) = σ(θ) 2 cos θL + . 2 m2 2 1 sin θ 1− m L m2 Für den Streuwinkel θ im Laborsystem in dieser Formel ist Gleichung (8.5) zu nehmen. Wir betrachten wieder den Spezialfall m1 = m2 . Dann ist wegen (8.7) θL = θ/2 und folglich 1 + cos(2θL ) σL (θL ) = σ(θ) · 2 cos θL + = 4σ(2θL ) cos θL . cos θL (8.9) (8.10) Aufgaben 1. Berechnen Sie den differenziellen Wirkungsquerschnitt σ(θ) im Zentralkraftfeld V (r) = β/r2 mit β > 0. (a) Stellen Sie eine Beziehung für den Streuwinkel in Abhängigkeit vom Stoßparameter, also für θ(s), in Form eines Integrals auf. (b) Welche Beziehung besteht zwischen dem minimalen Abstand rmin und dem Stoßparameter s? (c) Lösen Sie das unter a) erhaltene Integral für θ(s). (Hinweis: Für das Kepler-Potenzial haben wir in Kap. 7 bereits ein ähnliches Integral gelöst.) (d) Stellen Sie nun den differentiellen Wirkungsquerschnitt σ(θ) auf. 2. Betrachten Sie zwei identische Kugeln der Masse m1 und des Radius R1 . Die eine Kugel sei am Anfang ruhend, und die andere wird an ihr elastisch gestreut. Berechnen Sie den differenziellen und den totalen Wirkungsquerschnitt im Laborsystem. 72 Kapitel 9 Starrer Körper In diesem Kapitel betrachten wir die Bewegung starrer Körper. Ein starrer Körper ist ein Körper mit fest vorgegebener Massenverteilung %(~r), dessen Gestalt sich nicht ändert. Seine Masse ist Z M = d3 r%(~r) . In diesem Kapitel werden keine Deformationen betrachtet. Der starre Körper kann also nur seine Lage und seine Orientierung ändern, d.h. er hat 6 Freiheitsgrade, wie wir in Kapitel 2 gesehen haben. Wir betrachten zwei verschiedene Koordinatensysteme: Ein raumfestes Koordinatensystem K (Laborsystem) mit den Achsen x, y, z, und ein fest im Schwerpunkt S des starren Körpers verankertes intrinsisches Koordinatensystem K mit den Achsen x1 , x2 , x3 . Im System K ist die Massenverteilung % unabhängig von der Zeit, ganz gleich, welche Bewegung der Körper ausführt. 9.1 Kinetische Energie und Trägheitstensor Um die kinetische Energie zu ermitteln, beginnen wir mit der Betrachtung infinitesimaler Verrückungen des Körpers. Der Punkt P habe die Position ~r in K und die Position ~x = ~r − ~rS in K. Verschiebt und rotiert man den starren Körper ein wenig, so gilt für P : d~r = d~rS + d~ ϕ × ~x . (9.1) Die Richtung n̂ = d~ ϕ |d~ ϕ| (9.2) ist die Rotationsachse (Rotation im Uhrzeigersinn wenn man in Achsenrichtung schaut), und |d~ ϕ| ist der Winkel, um den der Körper gedreht wird bei festgehaltenem S. Die Drehung ist im folgenden Bild veranschaulicht: n̂ |d~ ϕ| d~x ~x α Wir verwenden |d~x| = |~x| sin (α)|d~ ϕ| und d~x ⊥ n̂, ~x, und erhalten somit d~x = d~ ϕ × ~x. Wir dividieren die Gleichung (9.1) durch dt d~r d~rs d~ ϕ = + × ~x dt dt dt 73 und schreiben dies in der Form ~ +ω ~v = V ~ × ~x . (9.3) ~ ist die Geschwindigkeit des Schwerpunkts S. V Als nächstes bestimmen wir den Ausdruck für die kinetische Energie. Im körperfesten Koordinatensystem ist Z d3 x ~x%(~x) = 0 , (9.4) da der Ursprung im Schwerpunkt liegt. Die kinetische Energie ist dann Z 2 1 ~ +ω d3 x%(~x) V ~ × ~x T = 2 Z Z Z 1~2 1 1~ 3 3 = V d x%(~x) + V × ω ~ d x ~x%(~x) + d3 x%(~x)(~ ω × ~x)2 . 2 2 2 | {z } | {z } (9.5) 0 M Den letzten Summanden schreiben wir unter Verwendung der Beziehung (~a × ~b)2 = ~a2~b2 − (~a · ~b)2 als 1 ωj Jjk ωk 2 mit Z Jjk := d3 x%(~x) ~x2 δjk − xj xk . (9.6) Hier haben wir die “Einsteinsche Summenkonvention” verwendet, d.h. es wird über doppelt auftretende Indizes summiert. Also haben wir die kinetische Energie in zwei Beiträge zerlegt, die wir unter Verwendung der Matrixschreibweise für den Trägheitstensor schreiben können als T = Ttrans + Trot = 1 ~2 1 t ω. MV + ω ~ J~ 2 2 (9.7) Das Trägheitsmoment bezgl. eines anderen Koordinatensystems, dessen Ursprung nicht im Schwerpunkt ist, erhalten wir mit dem Satz von Steiner: Sei J der Trägheitstensor, wie er im körperfesten System K berechnet wird, das im Schwerpunkt S 0 zentriert ist, und sei K ein zu K achsenparalleles System, das gegenüber diesem um ~a verschoben ist. 0 Dann ist der in K berechnete Trägheitstensor Z 0 Jij = (9.8) d3 x0 %(~x0 ) ~x02 δij − x0i x0j ~ x0 =~ x+~ a ↓ = Jij + M ~a2 δij − ai aj (denn alle in ~x linearen Terme verschwinden wegen der Schwerpunktbedingung). 74 (9.9) Hauptträgheitsachsensystem: Da der Trägheitstensor reell und symmetrisch ist, lässt er sich durch eine orthogonale Transformation auf Diagonalform bringen: I1 0 0 R0 J R−1 = J 0 = 0 I2 0 0 0 0 I3 2 Z y2 + y32 0 0 0 y32 + y12 0 = d3 y%(~y ) (9.10) 2 2 0 0 y1 + y2 Hierzu bestimmt man die Eigenwerte Ii und Eigenvektoren ω ~ (i) : ω (i) = Ii ω ~ (i) . J~ (9.11) R−1 hat als Spalten die ω ~ (i) . I1 , I2 , I3 sind die (Haupt-)Trägheitsmomente des starren Körpers. Sie sind 0 positiv und erfüllen die Ungleichung I1 + I2 ≥ I3 (und analog unter zyklischer Vertauschung der Indizes). Dasjenige körperfeste System, in dem der Trägheitstensor diagonal ist, heißt Hauptträgheitsachsensystem. (Bei Entartung der Eigenwerte gibt es eine Wahlfreiheit.) Als Beispiel berechnen wir das Trägheitsmoment einer homogenen Kugel der Dichte % und des Radius R: Es ist I1 = I2 = I3 aus Symmetriegründen, und das Hauptachsensystem ist im Kugelzentrum verankert. Es ist Z Z R 8π%R5 . I1 + I2 + I3 = 3I = 2% r2 d3 x = 8π% r4 dr = 5 0 Mit % = 3M 4πR3 erhalten wir daraus I= 9.2 2 M R2 . 5 (9.12) Drehimpuls und Bewegungsgleichung des starren Körpers Wie wir in Kapitel 1 gesehen haben, setzt sich der Drehimpuls zusammen aus dem Bahndrehimpuls und dem Eigendrehimpuls. Wenn wir den Ursprung des Laborsystems in den Schwerpunkt des Körpers legen, verschwindet der Bahndrehimpuls. Es bleibt also ~ = L Z Z = ˙ =~ ~ x ω ×~ x d x%(~x)~x × ~x˙ 3 ↓ Z = d3 x%(~x)~x × (~ ω × ~x) d3 x%(~x) ~x2 ω ~ − (~x · ω ~ )~x = J~ ω. Also ist ~ = J~ L ω. (9.13) ~ hat im allgemeinen nicht dieselbe Richtung wie ω L ~ . Es hat nur dann dieselbe Richtung, wenn ω ~ parallel zu einer Hauptachse ist. Die Rotationsenergie können wir nun auch durch den Drehimpuls ausdrücken: Aus (9.7) und (9.13) erhalten wir 1 ~. ~ ·L (9.14) Trot = ω 2 75 Wenn ω ~ zur i-ten Hauptachse parallel ist, vereinfachen sich die beiden letzten Gleichungen zu ~ = Ii ω L ~ und Trot = (9.15) 1 Ii ω ~2 . 2 (9.16) Eine zeitliche Änderung des Drehimpulses wird durch ein Drehmoment verursacht (siehe (1.20)), X X ~ dL (ex) ~i . = ~ri × F~i = N dt i i 9.3 Kräftefreier Kreisel Wir betrachten einen rotationssymmetrischen starren Körper (Kreisel) in Abwesenheit von äußeren ~ vorgegeben Kräften. Sei die x3 -Achse die Symmetrieachse, so dass I1 = I2 6= I3 ist. Weiterhin sei L ~ und bilde den Winkel θ 6= 0 mit der Symmetrieachse. Wir legen die x1 -Achse in die von L und der Symmetrieachse aufgespannte Ebene. Dann steht die x2 -Achse senkrecht auf dieser Ebene, und L2 = ω2 = 0. Also liegt ω ~ in der (1, 3)-Ebene. Diese Situation ist in der folgenden Abbildung am Beispiel eines ellipsoidförmigen Kreisels dargestellt, wobei die (1, 3)-Ebene die Papierebene ist: ~ L ω ~ x3 x1 ω ~Pr ω ~l ~ ω Wie schon erwähnt, liegen die Vektoren L, ~ und die Symmetrieachse in einer Ebene, und da man diese Betrachtung zu jedem Zeitpunkt anstellen kann, liegen sie folglich immer in einer Ebene. ~ näher an der x1 -Achse als der Vektor ω In unserem Beispiel ist I1 > I3 . Deshalb liegt der Vektor L ~ . Die Symmetrieachse x3 bewegt sich nach hinten“ (also senkrecht zur Papierebene). Sie rotiert gleichförmig ” ~ Man um die Richtung des raumfesten L. nennt dies die reguläre Präzession“. Die Frequenz der regulären ” Präzession erhalten wir durch Aufspalten von ω ~ in eine Komponente ω ~ l parallel zur x3 -Achse und eine ~ Komponente ω ~ P r parallel zu L: ω ~ =ω ~l + ω ~Pr . ω ~ l ist irrelevant für die Präzessionsbewegung. Wir berechnen daher ωP r = |~ ωP r |: Aus ω1 = ωP r sin (θ) (9.17) ~ sin (θ) = I1 ω1 = I1 ωP r sin (θ) L1 = |L| (9.18) und erhalten wir ωP r = ~ |L| . I1 (9.19) ω ~ überstreicht bei der regulären Präzession den Spurkegel“, die Symmetrieachse den Nutationskegel“: ” ” 76 ~ L ω ~ ~x3 Die Winkelgeschwindigkeit um die Symmetrieachse können wir auch durch den Drehimpuls und die Trägheitsmomente ausdrücken: Es ist ω3 = 9.4 ~ cos(θ) L3 |L| = . I3 I3 (9.20) Starre Körper mit nur einem Freiheitsgrad Nun betrachten wir starre Körper mit äußeren Kräften und beschränken uns zunächst auf Systeme mit nur einem Freiheitsgrad. Es ist zum Beispiel der Körper fest auf einer Rotationsachse montiert, oder er rollt auf einer Unterlage in nur einer Richtung. In beiden Fällen behält die Rotationsachse ihre Richtung bei, und wir können den Winkel ϕ als Freiheitsgrad wählen. Wir wählen die z-Richtung parallel zur Rotationsachse. Die kinetische Energie im Laborsystem hat dann die Beiträge Trot = Ttrans = 1 Jzz ϕ̇2 2 1 ~2 1 M V = M ~r˙s2 , 2 2 (9.21) (9.22) wobei ~r˙s die Geschwindigkeit des Schwerpunkts längs seiner Bahnkurve ist. Als Beispiel betrachten wir eine Walze auf einer schiefen Ebene: y ϕ α Die Walze habe den Radius R, die Masse M und die Länge l. Der Schwerpunkt der Walze sei in der Mitte der Walze. Der Zusammenhang zwischen der Position y auf der Ebene und dem Rollwinkel ϕ ist ẏ = Rϕ̇ , (9.23) und die Lagrange-Funktion ist 1 L = Jzz 2 ẏ R 2 1 + M ẏ 2 + M g sin (α)y . 2 (9.24) Die Lagrange-Gleichung d ∂L ∂L = dt ∂ ẏ ∂y (9.25) führt auf ÿ = M g sin (α) . Jzz R2 + M 77 (9.26) Wenn die Massenverteilung homogen ist, ist % konstant und M = R2 π%l und Z Jzz l Z R 0 Z 2π dr r dz = % 0 dϕ r2 0 R4 1 = %l2π = M R2 . 4 2 (9.27) Also ist 2 g sin α . (9.28) 3 Im Unterschied hierzu lautet die Bewegungsgleichung, wenn die Walze reibungsfrei gleitet ohne zu rollen ÿ = ÿ = g sin α . 9.5 Die Eulerschen Gleichungen Nun heben wir die Beschränkung auf einen Freiheitsgrad auf. Wir bestimmen die Bewegungsgleichungen bezogen auf das körperfeste System K, dessen Ursprung im Schwerpunkt liegt. Hierbei ist es wichtig sich bewusst zu machen, dass auch K ein Inerzialsystem sein soll. Wenn wir also die Zeitableitung diverser Größen bestimmen, betrachten wir die Basisvektoren des Systems K als konstant. Man wählt sozusagen zu jedem Zeitpunkt ein neues Inerzialsystem, bzgl. dessen alle Größen angegeben werden. Im Kuypers werden die so berechneten Zeitableitungen “körperfeste Zeitableitungen” genannt. Wir hatten ~ = dL ~ N dt und ~x˙ = ω ~ × ~x und ~ = L Z d3 x %(~x)~x × (~ ω × ~x) . Bemerkung: Wir verstehen alle Größen auf dieser Seite (Vektoren, Tensoren) im System K, aber schreiben keine Querstriche über die Größen. Wir erhalten Z h i ~ dL = d3 x%(~x) (~ ω × ~x) × (~ ω × ~x) + ~x × (ω ~˙ × ~x) + ~x × (~ ω × (~ ω × ~x)) dt Z =0+J ·ω ~˙ + ω ~ × (~x × (~ ω × ~x))%(~x)d3 x und somit ~ =J ·ω ~. N ~˙ + ω ~ ×L Dabei haben wir benutzt, dass ~a × (~b × (~a × ~b)) = ~b × (~a × (~a × ~b)) ist. Denn die linke Seite ist ~a × (~a · b2 − ~b(~a · ~b)) = −(~a × ~b)(~a · ~b) = (~b × ~a)(~a · ~b) und die rechte Seite ist ~b × (~a(~a · ~b) − ~ba2 ) = (~b × ~a)(~a · ~b) = linke Seite . 78 (9.29) Wenn J diagonal ist, lauten die Eulerschen Gleichungen I1 ω̇1 ω1 I1 ω1 I1 ω̇1 + ω2 ω3 (I3 − I2 ) ~ = I2 ω̇2 + ω2 × I2 ω2 = I2 ω̇2 + ω3 ω1 (I1 − I3 ) . N I3 ω̇3 ω3 I3 ω3 I3 ω̇3 + ω1 ω2 (I2 − I1 ) (9.30) Diese Gleichungen sind nichtlinear und führen damit im Allgemeinen auf komplizierte Bewegungen. Wir kommen nun zum Kreisel zurück und betrachten daher noch einmal einen rotationssymmetrischen ~ = 0 und I1 = I2 . Aus der dritten Eulerstarren Körper ohne äußere Kräfte (wie in 9.3). Es ist also N Gleichung folgt sofort, dass ω̇3 = 0 ist. Wenn wir die erste Euler-Gleichung nach der Zeit ableiten und ω̇2 durch die zweite Euler-Gleichung ausdrücken, erhalten wir ω̈1 + ω1 (I1 − I3 )2 ω32 = 0. I12 Wir definieren ω02 = (I1 − I3 )2 ω32 I12 und erhalten damit ω1 = A sin(ω0 t − φ) (9.31) ω2 = −A cos(ω0 t − φ) , (9.32) und ~ rotieren mit wobei A und φ durch die Anfangsbedingungen festzulegen sind. Die Vektoren ω ~ und L Frequenz ω0 um die Symmetrieachse. Dies wird in der Literatur auch “Nutation” genannt. Die Frequenz ω0 ist verschieden von der Präzessionsfrequenz ωP r aus Gleichung (9.19), mit der die Symmetrieachse im Laborsystem um den Drehimpuls rotiert. 9.6 Der Schwere Kreisel x3 S O Der Kreisel im Schwerefeld ist ein anspruchsvolles Thema der theoretischen Mechanik, und wir beschränken uns hier auf eine Berechnung der wesentlichen Phänomene. Der Kreisel sei rotationssymmetrisch um die x3 -Achse, und wir definieren l = OS , wobei O der Punkt ist, in dem der Kreisel gestützt wird. Da der Punkt O fest ist, bleiben von den 6 Freiheitsgraden des starren Körpers nur 3 übrig. Wir wählen 3 Winkel als Freiheitsgrade, die sogenannten “Eulerschen Winkel”: • θ : Winkel zwischen z-Achse und x3 -Achse; • φ: Winkel zwischen Projektion der x3 -Achse auf den Boden und der x-Achse des Laborsystems; • ψ: Winkel zwischen x1 -Achse und der Verbindungslinie von S zur z-Achse (Linie ⊥ x3 -Achse) . 79 x3 z S x1 x2 y θ O x −φ Also gibt θ die Neigung des Kreisels an, man nennt θ auch den “Nutationswinkel”. Der Winkel φ wird “Präzessionswinkel” genannt, und er gibt die Orientierung der auf den Boden projizierten Kreiselachse an. Der Winkel ψ ist der “Eigenrotationswinkel”. Die kinetische Energie ausgedrückt durch die 3 Winkel ist 1 2 1 T = (I1 + M l2 ) θ̇2 + φ̇2 sin2 θ + I3 ψ̇ + φ̇ cos θ (9.33) 2 | {z } 2 I10 Die potenzielle Energie ist V = M gl cos (θ) . ∂L = 0 und ∂L Die Lagrange-Funktion L = T − V erfüllt die Gleichungen ∂ψ ∂φ = 0. Also sind ψ und φ zyklische Variablen, und ∂L (9.34) Pψ ≡ ∂ ψ̇ und ∂L Pφ ≡ (9.35) ∂ φ̇ sind Erhaltungsgrößen. Außerdem ist auch die Gesamtenergie E = T + V eine Erhaltungsgröße. Wir haben folglich genauso viele Erhaltungsgrößen wie Freiheitsgrade und können die Lösung der Bewegungsgleichungen finden. Wir drücken zunächst φ̇ und ψ̇ durch die Erhaltungsgrößen aus: Pψ = I3 ψ̇ + φ̇ cos θ (9.36) Pφ = I10 sin2 θ + I3 cos2 θ φ̇ + I3 ψ̇ cos θ (9.37) Pφ − Pψ cos θ ⇒ φ̇ = (9.38) I10 sin2 θ Pψ ψ̇ = − φ̇ cos θ . (9.39) I3 Dies wird in den Ausdruck für die Energie eingesetzt: 2 1 I10 θ̇2 + φ̇2 sin2 θ + I3 ψ̇ + φ̇ cos θ + M gl cos θ E = T +V = 2 2 1 0 2 Pψ2 (Pφ − Pψ cos θ) = I1 θ̇ + + M gl + − M gl (1 − cos θ) . 2 2 2I3 2I10 sin θ | {z } (9.40) ≡Uef f (θ) Weil E eine Erhaltungsgröße ist, ist auch E0 ≡ E − Pψ2 1 − M gl = I10 θ̇2 + Uef f (θ) 2I3 2 80 (9.41) eine Erhaltungsgröße. Der Ausdruck für E 0 ist der eines gewöhnlichen eindimensionalen Problems mit der Variablen θ und dem Potenzial Uef f . Wir diskutieren die Dynamik des Kreisels im Folgenden qualitativ: • Es ist E 0 > Uef f (so wie beim Zentralkraftproblem E ≥ Vef f gilt). • Wenn Pφ 6= Pψ ist: limθ→0 Uef f = limθ→π Uef f = ∞ • Definiere u(t) = cos θ(t). Dann ist θ̇2 = u̇2 1 − u2 und u̇2 = f (u) mit 2 2E 0 2M gl(1 − u) (Pφ − Pψ u) + − f (u) = 1 − u I10 I10 I102 2 (9.42) u ∈ [−1, 1] und f (u) ≥ 0 . Wir unterscheiden drei Fälle: 1. u = 1 entspricht Pφ = Pψ und u̇ = 0 (stehender Kreisel) 2. u = −1 bedeutet Pφ = −Pψ und u̇ = 0 (hängender Kreisel) 3. −1 < u < 1: schiefer Kreisel • f (u) ist positiv zwischen zwei Werten u1 , u2 ∈] − 1, 1[. Also bewegt sich θ(t) zwischen zwei Werten θ1 und θ2 . Betrachte φ̇ = (mit u0 = Pφ u0 − u I10 1 − u2 Pψ Pφ ) zusätzlich zu θ̇ bzw. u̇: Man muss 3 Fälle unterscheiden, je nachdem wie u0 relativ zu u1 und u2 liegt: 1. u0 > u2 (bzw. u0 < u1 ): ⇒ φ̇ hat stets dasselbe Vorzeichen. Die Bewegung des Durchstoßpunktes der x3 -Achse durch eine Kugelschale (in deren Mittelpunkt der Auflagepunkt ist) sieht folgendermaßen aus: 2. u1 < u0 < u2 ⇒ φ̇ hat am oberen Breitengrad ein anderes Vorzeichen als am unteren: 81 3. u0 = u1 oder u0 = u2 φ̇ verschwindet an einem Breitenkreis. Aufgaben 1. Wir betrachten ein Jojo (Masse M , Trägheitmoment Jzz bzgl. Symmetrie-Achse, Fadenlänge L, Faden sei masselos). Der Radius der Achse, um die der Faden gewickelt ist, sei R (siehe Bild), und der Schwerpunkt S sei in der Mitte der Achse. ~ex (a) Bestimmen Sie die Lagrangefunktion. (b) Bestimmen Sie die Bewegungsgleichungen. (c) Am untersten Punkt, wenn der Faden vollständig abgewickelt ist, wird das Jojo elastisch reflektiert. Was ist folglich die Schwingungsperiode? 2. Ein Halbkreiszylinder (d.i. ein längs der Symmetrieachse halbierter Zylinder) mit dem Radius R und der Masse M (mit homogener Massenverteilung) führt auf einer horizontalen Ebene unter dem Einfluss der Schwerkraft eine Wippbewegung aus (er rollt also auf dem runden Teil seiner Berandung hin und her). (a) Bestimmen Sie die Trägheitsmomente IA , IS , IP um die Zylinderachse A, die Schwerpunktsachse S und den Auflagepunkt P . (b) Bestimmen Sie die Bewegungsgleichung für den Kippwinkel ϕ. (c) Was ist die Schwingungsperiode im Grenzfall kleiner Kippwinkel? (d) Schreiben Sie die drei verschiedenen Möglichkeiten hin, die kinetische Energie in einen Translationsund einen Rotationsanteil zu zerlegen, indem Sie jede der drei in a) erwähnten Achsen einmal als Rotationsachse verwenden. 82 Kapitel 10 Schwingungen In diesem vierten Kapitel zur Anwendung der Lagrange-Mechanik befassen wir uns mit Schwingungen. Wir betrachten hier in erster Linie kleine Schwingungen um eine stabile Gleichgewichtslage. Allgemein ist die Schwingungstheorie eine der bedeutendsten Anwendungen der Mechanik. Sie bildet eine wichtige Grundlage des Maschinenbaus und der Elektrotechnik, deren Schwingkreise ähnlichen Differenzialgleichungen unterliegen wie mechanische Schwinger. Der harmonische Oszillator spielt eine zentrale Rolle, da er nicht nur in der klassischen Mechanik auftritt, sondern auch für die theoretische Formulierung der Quantenmechanik und der Quantenfeldtheorie eine bedeutende Rolle spielt. 10.1 Schwingungen mit einem Freiheitsgrad Dieses Unterkapitel behandelt zwei wichtige Beispiele als Vorbereitung auf die Behandlung von Schwingungen mit mehreren Freiheitsgraden: den gedämpften harmonischen Oszillator und den durch eine harmonische Kraft erregten, gedämpften harmonischen Oszillator. 10.1.1 Gedämpfter harmonischer Oszillator Die Bewegungsgleichung des gedämpften harmonischen Oszillators mit der Auslenkung x(t) lautet mẍ + dẋ + Dx = 0 . Dies beschreibt ein Federpendel mit masseloser Feder und eingehängter Masse m sowie Federkonstante D. Wir definieren ω02 = D/m und γ = d/(2m) und erhalten dann ẍ + 2γ ẋ + ω02 x = 0 . (10.1) Diese lineare, homogene Differenzialgleichung führt mit dem bekannten Ansatz x(t) = ceλt (10.2) λ2 + 2λγ + ω02 = 0 (10.3) auf die charakteristische Gleichung mit den beiden Wurzeln λ1 = −γ + q γ 2 − ω02 , λ2 = −γ − Drei Fälle sind zu unterscheiden: 83 q γ 2 − ω02 . (10.4) 1. γ 2 < ω02 (gedämpfte Schwingung) p Mit ω ≡ ω02 − γ 2 ergibt sich die allgemeine Lösung x(t) = e−γt c1 eiωt + c2 e−iωt . (10.5) Die reellen Anfangsbedingungen x(0) = x0 , ẋ(0) = ẋ0 führen auf c1 = ⇒ x0 γx0 + ẋ0 + , 2 2iω x(t) mit x0 γx0 + ẋ0 − 2 2iω = γx0 + ẋ0 sin ωt e−γt x0 cos ωt + ω = Ae−γt sin(ωt + ϕ0 ) s A= c2 = c∗1 = x20 + γx0 + ẋ0 ω (10.7) 2 , (10.6) tan ϕ0 = x0 ω . γx0 + ẋ0 (10.8) Bei einer gedämpften, harmonischen Schwingung nimmt demnach die Amplitude exponentiell ab, und die Eigenfrequenz ω der gedämpften Schwingung ist kleiner als die Eigenfrequenz ω0 der ungedämpften Schwingung. 2. γ 2 > ω02 (Kriechfall) p Wir definieren κ = γ 2 − ω02 . Die Lösung sieht genauso aus wie im vorigen Fall, nur dass wir statt iω jetzt überall ein κ schreiben. Die allgemeine Lösung ist also x(t) = e−γt c1 eκt + c2 e−κt mit c1 = x0 γx0 + ẋ0 + , 2 2κ c2 = (10.9) x0 γx0 + ẋ0 − . 2 2κ Dies gibt γx0 + ẋ0 x(t) = e−γt x0 cosh κt + sinh κt . κ (10.10) Dies beschreibt keine Schwingung, sondern eine so genannte aperiodische Kriechbewegung. Die aperiodische Auslenkung geht für große Zeiten gegen Null. 3. γ 2 = ω02 (aperiodischer Grenzfall) Diesen Fall lösen wir am einfachsten, indem wir im Ergebnis (10.10) den Grenzübergang κ → 0 machen. Wir erhalten also x(t) = e−γt (x0 + (γx0 + ẋ0 )t) . (10.11) Die asymptotische Annäherung an die Nulllage ist hier schneller als im Fall b). Deshalb arbeiten Zeigermessinstrumente im aperiodischen Grenzfall. Die drei Fälle sind in der folgenden Graphik skizziert: 84 10.1.2 Periodisch getriebener gedämpfter harmonischer Oszillator Wir betrachten für die erzwungene Schwingung eines gedämpften harmonischen Oszillators die Bewegungsgleichung ẍ + 2γ ẋ + ω02 x = f0 eiΩt . (10.12) Nach der Theorie der linearen Differenzialgleichungen ergibt sich die allgemeine Lösung der linearen, inhomogenen Differenzialgleichung (10.12), indem man zur Lösung der homogenen Gleichung (10.1) eine spezielle Lösung der inhomogenen Gleichung addiert. Wie wir gesehen haben, geht die homogene Lösung mit der Zeit gegen Null. Wir erwarten daher, dass nach Abklingen der homogenen Lösung nur eine spezielle Lösung übrig bleibt, die keinen gedämpften Beitrag enthält, und dass dann der Oszillator mit der erregenden Frequenz Ω schwingt. Zur Berechnung dieser speziellen ungedämpften Lösung der inhomogenen Gleichung wählen wir den Ansatz xs (t) = As ei(Ωt−ϕs ) , (10.13) mit konstanter, reeller Amplitude As und Phase ϕs . Einsetzen in (10.12) ergibt As (−Ω2 + 2iγΩ + ω02 ) = f0 eiϕs = f0 (cos ϕ + i sin ϕ) . Diese Gleichung ist erfüllt, wenn auf beiden Seiten die absoluten Beträge q As (ω02 − Ω2 )2 + 4γ 2 Ω2 = f0 85 (10.14) (10.15) und die Quotienten aus den imaginären und reellen Anteilen gleich sind tan ϕs = 2γΩ . ω02 − Ω2 (10.16) Für γ 2 < ω02 (gedämpfte Schwingung), d.h. mit (10.7), und dem Realteil der speziellen Lösung (10.13) ist die allgemeine Lösung q x(t) = Ae−γt sin (10.17) ω02 − γ 2 t + ϕ0 + As cos (Ωt − ϕs ) . Die angeregte Schwingung setzt sich demnach aus einem gedämpften und einem ungedämpften Anteil zusammen. Der gedämpfte Anteil beschreibt die Einschwingung, auch Transiente genannt. Für große Zeiten (t 1/γ) bleibt nur die stationäre Lösung übrig, die hier gerade der speziellen Lösung xs (t) entspricht. Wir schreiben die Schwingungsamplitude As der stationären Lösung durch Umformen von (10.15) als f0 /ω02 . As = r 2 γ 2 Ω2 Ω2 1 − ω2 + 4 ω2 ω2 0 2 0 0 /ω02 Für γ ≤ 1/2 hat As als Funktion von Ω ein Maximum; für größere γ hat sie kein Maximum, sondern fällt mit wachsendem monoton ab. Im ersten Fall spricht man von einer Resonanzkurve. Das Maximum Ωp p ist bei Amax = f0 / 2γ ω02 − γ 2 bei der Resonanzfrequenz ΩR = ω02 − 2γ 2 . Die Phasendifferenz ϕs zwischen der erregenden Kraft und der erzwungenen Schwingung ist nach (10.16) ϕs = arctan 2γΩ (+π) , − Ω2 ω02 wobei der letzte Summand π nur für Ω > ω0 auftritt, so dass dann π2 < ϕ (Ω > ω0 ) < π ist. Die folgenden Überlegungen machen den Summanden +π klar: ϕs muss stetig von Ω abhängen. Außerdem ist zu erwarten, dass die Phasendifferenz zwischen treibender Kraft und Schwingung des Oszillators umso größer wird, je schneller die treibende Kraft oszilliert. Für die weitere Analyse betrachten wir ein paar spezielle Fälle: Für Ω ω0 sind Oszillator und äußere Kraft praktisch in Phase; Der Oszillator folgt der einwirkenden Kraft mit nur geringer Verzögerung, d. h. ϕs ' 0. Für Ω = ω0 ist die Phasendifferenz stets π/2, weil die linke Seite von (10.14) rein imaginär ist. Für Ω ω0 schwingt der Oszillator im Gegentakt zur äußeren Kraft, d. h. ϕs ' π. Dies kann man z.B. daraus folgern, dass für Ω → ∞ die linke Seite von (10.14) gegen Minus Unendlich läuft. Eine weitere spezielle Situation ist der Fall γ → 0. Dann ist wird die linke Seite von (10.14) reell und wechselt bei Ω = ω0 das Vorzeichen. Also springt die Phasendifferenz von ϕ = 0 für Ω < ω0 auf ϕ = π für Ω > ω0 . Die folgende Graphik zeigt den Verlauf für verschiedene Werte von γ, wobei die Kurven mit einer größeren Steigung bei ω0 größere Werte von γ haben. 86 10.2 Schwingungen mit mehreren Freiheitsgraden Wir betrachten nun ein System aus N miteinander wechselwirkenden Teilchen, die zusammen eine stabile Gleichgewichtslage haben. Wenn wir nur kleine Auslenkungen aus der Gleichgewichtslage betrachten, wird das zu einem System aus N gekoppelten Oszillatoren, die um die Gleichgewichtslage schwingen und nahezu linearen Rückstellkräften unterliegen. Das System sei konservativ. Eventuell gibt es k holonome, skleronome Zwangsbedingungen. Es folgt, dass die kinetische Energie eine quadratische Funktion der n = 3N − k generalisierten Geschwindigkeiten ist (vgl. (4.11)): T = n 1 X Tij (q1 , ..., qn )q˙i q˙j , 2 i,j=1 (10.18) mit symmetrischen Koeffizienten Tij = Tji . Die Koordinaten der Gleichgewichtslage q0i legen wir in den Koordinatenursprung, so dass die qi (mit i = 1, ..., n), die Auslenkungen aus dem Gleichgewicht bezeichnen. Entwicklung in eine Taylorreihe um die Gleichgewichtslage ergibt n X ∂Tij (q) ql + ... (10.19) Tij (q1 , ..., qn ) ≡ Tij (q) = Tij (0) + ∂ql 0 l=1 Für genügend kleine Auslenkungen beträgt die kinetische Energie mit (10.18) T ' n 1 X Tij q̇i q̇j 2 i,j=1 , Tij ≡ Tij (0). (10.20) Da die q̇i ebenso wie die qi kleine Größen sind, ist dieser führende Term der Taylorentwicklung für unsere Betrachtungen ausreichend. Für ein konservatives System existiert eine potenzielle Energie V . Wir machen auch für V eine Taylorentwicklung: n n X 1 X ∂ 2 V (q) ∂V (q) V (q) = V (0) + q + qi qj + ... (10.21) i | {z } ∂qi 0 2 i,j=1 ∂qi ∂qj 0 i=1 | {z } irrelevant =0 Der 2. Term ist 0 für die Gleichgewichtslage, da die potenzielle Energie dort minimal ist. Folglich ist das Potenzial in der Umgebung der Gleichgewichtslage ungefähr gleich n n 1 X ∂ 2 V 1 X V (q) ' q q ≡ Vij qi qj . i j 2 i,j=1 ∂qi ∂qj 0 2 i,j=1 Die Matrizen V und T sind symmetrisch und positiv definit. Die Lagrange-Funktion n 1 X (Tij q̇i q̇j − Vij qi qj ) L(q, q̇) = 2 i,j=1 (10.22) (10.23) ergibt die Bewegungsgleichungen n X (Tij q̈j + Vij qj ) = 0 , i = 1, ..., n. (10.24) j=1 Der Ansatz qj (t) = Caj eiωt , 87 j = 1, ..., n (10.25) löst die n Differenzialgleichungen (10.24), wie wir gleich sehen werden. Dabei ist C ein zweckmäßiger Skalenfaktor. Einsetzen ergibt n X (Vij − ω 2 Tij )aj = 0 , i = 1, ..., n. (10.26) j=1 In Matrix-Schreibweise lautet (10.26) (V − ω 2 T )~a = 0, (10.27) wobei V und T die (n × n)-Matrizen mit den Einträgen Vij bzw. Tij sind. Das lineare System (10.26) bzw. (10.27) hat nur dann nichttriviale Lösungen, d.h. aj 6= 0 für mindestens ein j, wenn die Determinante verschwindet: det(V − ω 2 T ) = 0 . (10.28) Diese Bedingung legt die möglichen Werte von ω 2 fest. Sie ist eine charakteristische Gleichung in Form eines Polynoms vom Grad n in der Variablen ω 2 . V , T sind beide reell, symmetrisch und positiv definit, d.h.alle n Lösungen ω 2 sind positiv, ω12 , ω22 , ..., ωn2 > 0. (10.29) (Einige der Lösungen können gleich sein. Diese so genannten Entartungen betrachten wir nicht.) Seien ~ar die Eigenvektoren des verallgemeinerten Eigenwertproblems (10.27), deren Normierung wir etwas weiter unten festlegen. Wir benutzen diese Eigenvektoren für einen Wechsel des Koordinatensystems, ähnlich wie bei der Hauptachsentransfomationin Kapitel 9). Die ~ar sind definiert durch die Bedingung (10.30) V ~ar = ωr2 T~ar , r = 1, ..., n. Ähnlich wie bei gewöhnlichen Eigenwertproblemen mit symmetrischen Matrizen können wir für die ~ar eine Art Orthogonalitätsbeziehung erhalten. Wir betrachten zwei Eigenvektoren ~a1 und ~a2 zu den Eigenwerten ω12 und ω22 . Weil die Matrizen T und V symmetrisch sind, gelten die folgenden Beziehungen: V ~a1 ~at2 V ~a1 = = ω12 T~a1 ; ~at2 V ~a1 = ω12~at2 T~a1 ~at1 V ~a2 ω22~at1 T~a2 = und analog mit der Vertauschung von 1 und 2; = ω22~at2 T~a1 . Die zweite und dritte Zeile sind nur dann miteinander verträglich, wenn ~at2 T~a1 = 0 ist, wenn die Eigenvektoren ~a1 und ~a2 verschieden sind. Dies führt uns mit einer entsprechend gewählten Normierung der ~ar und mit der Definition A = (~a1 , ~a2 , ..., ~an ) auf die Beziehung 1 0 1 At T A = .. Unter Verwendung von (10.30) folgt daraus ω12 A VA= t ≡ 1. . 0 (10.31) 1 0 ω22 .. . ωn2 0 88 ≡ Ω2 , (10.32) d.h. die Matrix A diagonalisiert simultan V und T . Die Normalkoordinaten Qr sind definiert über die Beziehungen ~q ≡ n X ~ ~ar Qr ≡ AQ. (10.33) r=1 Einsetzen von (10.33) in die Lagrange-Funktion (10.23) ergibt: L = = = = ≡ 1 ˙t ˙ (~q T ~q − ~qt V ~q) 2 1 ~˙ t T (AQ) ~˙ − (AQ) ~ t V (AQ)) ~ ((AQ) 2 1 ~˙ t t ~˙ − Q ~ t At V AQ) ~ (Q A T AQ 2 1 ~˙ t ~˙ ~ t Ω2 Q) ~ . (Q Q − Q 2 n 1X 2 (Q̇ − ωr2 Q2r ). 2 r=1 r (10.34) Gl. (10.34) zeigt, dass die Normalkoordinaten n entkoppelte harmonische Oszillatoren mit Eigenfrequenzen ωr beschreiben, mit den Lagrange-Gleichungen Q̈r + ωr2 Qr = 0, r = 1, ..., n. (10.35) Wir haben also ein Problem mit n Freiheitsgraden auf n Probleme mit je einem Freiheitsgrad reduziert. 10.3 Beispiel 1: Zwei gekoppelte, ungedämpfte Oszillatoren Wir betrachten zwei identische harmonische Oszillatoren, die durch eine Feder mit der Federkonstanten D12 verbunden sind und die sich nur auf einer horizontalen Geraden bewegen können. Die kinetische und potenzielle Energie und die Lagrangfunktion sind also T = m 2 (q̇ + q̇22 ), 2 1 ⇒L= mit D 2 D 2 D12 q + q2 + (q2 − q1 )2 2 1 2 2 2 1 1 X (Tij q̇i q̇j − Vij qi qj ) ≡ (~q˙t T ~q˙ − ~qt V ~q) 2 i,j=1 2 T =m V = 1 0 0 1 , V = D + D12 −D12 −D12 D + D12 . Die Eigenfrequenzen ω1 und ω2 und die Eigenvektoren ~a1 und ~a2 erhalten wir durch Lösen der Gleichung (10.35). Es ergibt sich 1 1 1 A= √ 1 −1 2m 89 und r ω1 = D , m r ω2 = D + 2D12 . m Die Spalten der Matrix A sind die beiden Eigenvektoren, die Normierung ist gemäß (10.31) gewählt. Die Gleichung (10.32) führt auf 1 D 0 t A VA= . 0 D + 2D12 m Die Normalkoordinaten ergeben sich gemäß (10.33) mit At A = r ~ = A−1 ~q = mAt ~q Q ⇒ Q1 = m (q1 + q2 ), 2 1 m 1: r Q2 = m (q1 − q2 ). 2 Ihre Bewegungsgleichungen lauten Q̈1 + ω12 Q1 = 0, Q̈2 + ω22 Q2 = 0 . Die allgemeine Lösung ergibt sich aus ~ ~q = AQ ⇒ q1 = √ 1 (Q1 + Q2 ), 2m q2 = √ 1 (Q1 − Q2 ). 2m Bem.: Die Normalschwingungen (auch Fundamentalschwingungen oder Eigenschwingungen genannt) haben eine einfache Interpretation. Für die Anfangsbedingungen q1 (0) = q2 (0), q̇1 (0) = q̇2 (0) wird nur die erste, gleichphasige Normalschwingung angeregt, bei der die Amplitudenfaktoren gleich sind, d.h. a11 = a21 . Für die zweite Normalschwingung ist a12 = −a22 , wobei diese gegenphasige Schwingung durch die Anfangsbedingungen q1 (0) = −q2 (0), q̇1 (0) = −q̇2 (0) angeregt wird. Überlagerung der Normalschwingungen kann zu neuen Phänomenen führen, wie der so genannten Schwebung. Sie tritt auf, wenn |ω1 − ω2 | ω1 ist. Wir betrachten die Anfangsbedingung q1 (0) = A , q̇1 (0) = q2 (0) = q̇2 (0) = 0. Dies führt auf die Lösung q1 (t) = q2 (t) = A ω2 − ω1 ω2 + ω1 (cos ω1 t + cos ω2 t) = A cos t cos t , 2 2 2 A ω2 − ω1 ω2 + ω1 (cos ω1 t − cos ω2 t) = A sin t sin t , 2 2 2 die im folgenden Bild skizziert ist: 90 Der erste Faktor auf der rechten Seite bedeutet ein An- und Abschwellen der Amplitude. Dabei wandert die Energie mit der Schwebungsfrequenz ω2 − ω1 zwischen den Oszillatoren hin und her. Man nennt dieses Phänomen Schwebung. p Wir haben gesehen, dass durch die Kopplung zweier Oszillatoren die Eigenfrequenz ω1 = D/m in die beiden Eigenfrequenzen ω1 und ω2 aufspaltet. Entsprechend findet man bei der Kopplung von N Oszillatoren eine Aufspaltung in N Eigenfrequenzen, falls keine Entartungen auftreten. Dieses Ergebnis ist über die Mechanik hinaus von großer Bedeutung für die Physik, so z.B. für das Energiespektrum von Elektronen in Festkörpern, bei dem die Aufspaltung der sehr dicht liegenden Einzelniveaus zu sogenannten Energiebändern führt. 10.4 Beispiel 2: Erzwungene Schwingungen zweier gekoppelter Oszillatoren Wir betrachten nun die Situation, dass zwei gekoppelte Oszillatoren von außen periodisch getrieben werden. Diese periodische Kraft wenden wir auf den Oszillator 1 an, wie in dem Bild dargestellt. Die Beiträge zur Lagrange-Funktion sind m T = (q̇12 + q̇22 ) 2 und D D12 D (q2 − q1 )2 . V = (q1 − A cos Ωt)2 + q22 + 2 2 2 Die Lagrange-Gleichungen ergeben dann mq̈1 + (D + D12 )q1 − D12 q2 = DA cos Ωt mq̈2 + (D + D12 )q2 − D12 q1 = 0. Im Gegensatz zum getriebenen gedämpften Oszillator im Unterkapitel 10.1 nehmen wir keinen Dämpfungsterm in die Gleichungen auf. Die Lösung der homogenen Differenzialgleichungen wurde im vorangehenden Beispiel besprochen. Vom einfachen Oszillator wissen wir, dass ungedämpfte, stationäre Schwingungen die Phasenverschiebung ϕs = 0 bzw. ϕs = π zwischen der erregenden Kraft und der erzwungenen Schwingung haben. Für eine spezielle Lösung betrachten wir daher den Ansatz qi (t) = Ai cos Ωt 91 i = 1, 2 , wobei Phasenverschiebungen 0 bzw. π durch positive bzw. negative Amplituden Ai beschrieben werden. Einsetzen ergibt (ω32 − Ω2 )A1 − − D12 A2 m = f0 D12 A1 + (ω32 − Ω2 )A2 m mit ω32 ≡ D + D12 , m = f0 ≡ 0 DA . m Die Lösung des Gleichungssystems lautet A1 A2 = f0 = f0 ω32 − Ω2 (ω32 − Ω2 )2 − = f0 D12 2 m D12 m (ω32 − Ω2 )2 − D12 m 2 = f0 (ω12 ω32 − Ω2 − Ω2 )(ω22 − Ω2 ) ω32 − ω12 , (ω12 − Ω2 )(ω22 − Ω2 ) wobei ω1 und ω2 wie im vorigen Beispiel definiert sind als ω12 ≡ D , m ω22 ≡ D + 2D12 . m Erwartungsgemäß werden die Amplituden bei diesen Frequenzen unendlich. (Wenn man den Dämpfungsterm dazunimmt, werden die Amplituden nicht unendlich, sondern haben ein Maximum in der Nähe der Eigenfrequenzen.) Besonders bemerkenswert ist das Ergebnis A1 (Ω = ω3 ) = 0 , A2 (Ω = ω3 ) = − AD . D12 D.h. die rechte Masse schwingt im stationären Fall mit solcher Amplitude, dass sich die beiden an der linken Masse angreifenden Federkräfte gegenseitig aufheben. Man benutzt diesen Effekt zur Konstruktion von Schwingungstilgern: Maschinenschwingungen, die durch harmonische Anregungen konstanter Frequenz erzeugt werden, lassen sich durch einen angekoppelten, geeignet abgestimmten zweiten Schwinger eliminieren. Aufgaben 1. Gekoppelte Pendel: Zwei Pendel der Längen l1 und l2 mit den Massen m1 und m2 werden durch eine horizontale Feder verbunden. Die Feder wird an den beiden (wie immer masselosen) Pendelstangen auf der Höhe l < l1 , l2 unterhalb der Aufhängepunkte angebracht. Der Abstand der beiden Pendel sei wesentlich größer als l, so dass die Feder stets nahezu horizontal bleibt. (a) Stellen Sie die Bewegungsgleichungen für die beiden Pendel auf. (b) Integrieren Sie die Bewegungsgleichungen zunächst für den Spezialfall m1 = m2 und l1 = l2 und in der Näherung kleiner Ausschläge. Wählen Sie die Anfangsbedingungen ϕ1 (0) = ϕ0 und ϕ̇1 = ϕ̇2 = ϕ2 = 0. Bemerkung: ϕ0 muss eine kleine Größe sein. (c) Lösen Sie jetzt diese Aufgabe auch für m1 6= m2 , aber immer noch mit l1 = l2 . (d) Betrachten Sie zum Schluss den Fall m1 6= m2 und l1 6= l2 , immer noch für dieselben Anfangsbedingungen wie in (b) und für kleine Ausschläge. 2. Gehen Sie aus von der Wellengleichung (6.19). 92 (a) Zeigen Sie, dass diese Gleichung zu der durch (10.24) beschriebenen Kategorie von Systemen gehört, indem Sie die x-Werte diskretisieren. Wie sieht die Matrix Vij aus? (b) Nun betrachten Sie wieder die kontinuerliche Variante. Betrachten Sie eine an beiden Enden fixierte Saite, also y(x = 0, t) = y(x = l, t) = 0. Was ist der zu (10.25) analoge Lösungsansatz für die kontinuierliche Wellengleichung (6.19)? Welche allgemeine Form haben also die Lösungen? (c) Finden Sie noch eine weitere Klasse von Lösungen, wenn Sie sich nicht um die Randbedingungen kümmern? 93 Kapitel 11 Der Hamilton-Formalismus 11.1 Einleitung In diesem Kapitel befassen wir uns mit einer weiteren Formulierung der klassischen Mechanik, nämlich mit der Hamiltonschen Mechanik, die in den 1830er Jahren vom irischen Mathematiker Sir William Rowan Hamilton entwickelt wurde. Zum expliziten Lösen von Aufgaben ist sie nicht besser geeignet als die Lagrange-Mechanik, aber sie ist für Computersimulationen besser geeignet, gewährt tiefere Einsichten in die Struktur der klassischen Mechanik und ist eine wichtige Grundlage für die Chaos-Theorie, für die statistische Mechanik und für die Quantenmechanik. Zwischen der Lagrange-Mechanik und der Hamilton-Mechanik bestehen die folgenden wichtigen Unterschiede: 1. Die Lagrange-Mechanik geht von der Lagrange-Funktion L(q, q̇, t) aus, während die HamiltonMechanik von der Hamiltonfunktion X q̇i pi − L H(q, p, t) = i (siehe (4.9)) ausgeht. Ganz wichtig ist hierbei, dass als Variablen der Hamiltonfunktion die generalisierten Koordinaten qi und die zu diesen Koordinaten konjugierten Impulse pi = ∂L ∂ q̇i (siehe (4.5)) gewählt werden. Alle q̇i müssen also durch die p und q ausgedrückt werden. (Das wird bei Übungsaufgaben häufig vergessen......) 2. Während es beim Lagrange-Formalismus für jeden Freiheitsgrad eine Bewegungsgleichung zweiter Ordnung in der Zeit gibt (also mit der zweiten Zeitableitung), gibt es im Hamilton-Formalismus pro Freiheitsgrad zwei Bewegungsgleichungen erster Ordnung in der Zeit, je eine für die zeitliche Änderung von qi und von pi . Man kann also die Dynamik mechanischer Systeme im HamiltonFormalismus als Trajektorien im sogenannten Phasenraum auffassen, der von den 2n Koordinaten pi und qi aufgespannt wird. Wir betrachten in diesem und allen folgenden Kapiteln nur den Fall, dass es holonome Zwangsbedingungen oder keine Zwangsbedingungen gibt. Die Zahl der Freiheitsgrade ist also n = 3N − k, und die Indizes der qi und pi laufen folglich immer von 1 bis n. 11.2 Die Hamiltonschen Bewegungsgleichungen Die Bewegungsgleichungen im Hamilton-Formalismus lassen sich auf zwei Wegen herleiten, nämlich direkt P aus den Lagrange-Gleichungen, verbunden mit dem Zusammenhang H = i pi q̇i − L, und auch aus dem 94 Hamiltonschen Prinzip (dem Prinzip der stationären Wirkung). Wir gehen im Folgenden durch beide Herleitungen. 11.2.1 Herleitung der Hamiltonschen Gleichungen aus den Lagrange-Gleichungen Der Zusammenhang zwischen H und L ist ganz analog zu dem Zusammenhang zwischen verschiedenen thermodynamischen Potenzialen, nämlich über eine Legendre-Transformation. Legendre-Transformationen in der Thermodynamik werden verwendet, um von einer Variablen zu einer anderen zu wechseln, die mit der partiellen Ableitung des Potenzials nach der ersten Variablen identisch ist. Ein Wechsel von den Variablen q̇i zu den Variablen pi = ∂L/∂ q̇i ist genau von dieser Art. Wir sehen dies explizit, indem wir das totale Differenzial von H hinschreiben: dH = X pi dq̇i + X q̇i dpi − i i X ∂L X ∂L ∂L dqi − dq̇i − dt . ∂q ∂ q̇ ∂t i i i i Mit den Lagrange-Gleichungen zweiter Art und (3.6) folgt d ∂L d ∂L = = pi ≡ ṗi ∂qi dt ∂ q̇i dt und damit dH = X q̇i dpi − X ṗi dqi − i i X ∂H X ∂H ∂L ∂H dpi + dqi + dt ≡ dt . ∂t ∂p ∂q ∂t i i i i Die rechte Seite ist das vollständige Differenzial von H(q, p, t). Koeffizientenvergleich ergibt q̇i = ∂H , ∂pi ṗi = − ∂H ∂qi (11.1) und ∂H ∂L =− . ∂t ∂t Die Gleichungen (11.1) sind die sogenannten Hamiltonschen Bewegungsgleichungen. 11.2.2 (11.2) Herleitung der Hamiltonschen Gleichungen aus Hamiltonschem Prinzip Die Hamiltonschen Bewegungsgleichungen lassen sich auch aus der Bedingung herleiten, dass die Wirkung S stationär wird: # # Z t2 "X Z t2 "X pi dqi − Hdt = 0 . (11.3) pi q̇i − H(q, p, t) = δ dt δS ≡ δ t1 t1 i i Die Variation von S ist so zu nehmen, dass der Anfangs- und der Endpunkt des Integrals im Phasenraum vorgegeben sind, aber die Phasenraumtrajektorie zwischen diesen beiden Punkten variiert wird mit einer Änderung δq(t), δp(t). keine klassische Trajektorie p,q,t 2 p , q , t1 1 2 2 klass. Trajektorie 1 95 Dies ist anders als in Kapitel 6, wo nur q(t) variiert wurde. Wir werden gleich sehen, dass eine unabhängige Variation von q und p auf die Hamiltonschen Bewegungsgleichungen führt. Dies bedeutet, dass der Hamilton-Formalismus eine Darstellung der Mechanik ist, in der q und p als gleichberechtigte Variablen betrachtet werden dürfen. Weitere Umformung von (11.3) führt auf # Z Z t2 "X t2 X ∂H ∂H pi δ q̇i + q̇i δpi − dt pi q̇i − H(q, p, t) = dt 0 = δ δqi − δpi ∂qi ∂pi t1 t1 i i Z t2 X ∂H ∂H − ṗi δqi + q̇i − δpi . (11.4) dt − = ∂qi ∂pi t1 i Beim Übergang zur letzten Zeile wurde in dem Term mit q̇ partiell integriert, so wie wir das schon in Kapitel 6 gemacht haben. Wenn wir erlauben, dass die δpi und die δqi voneinander unabhängig sind und zu jedem Zeitpunkt anders gewählt werden können, müssen die beiden Ausdrücke in den runden Klammern verschwinden, woraus die Hamiltonschen Gleichungen folgen. 11.2.3 Beispiel: Teilchen im Kreiskegel Wir leiten die Hamiltonschen Bewegungsgleichungen für ein Teilchen im Kreiskegel her. Die hierfür notwendigen Schritte können als allgemeines Rezept für die Aufstellung von Hamiltonschen Bewegungsgleichungen verwendet werden. Wir nummerieren sie daher im Folgenden durch. 1. Berechnung von T und V und der Lagrange-Funktion: Wir übernehmen sie aus dem Abschnitt 4.4: L=T −V = m (1 + cot2 α)ṙ2 + r2 ϕ̇2 − mgr cot α . 2 2. Bestimmung der zu den generalisierten Koordinaten kanonisch konjugierten Impulse: Die beiden Variablen sind ϕ und r, und die zu ihnen konjugierten Impulse sind pϕ = und pr = ∂L = mr2 ϕ̇ ∂ ϕ̇ ∂L = mṙ(1 + cot2 α) . ∂ ṙ 3. Berechnen von H: Da wir es mit zeitunabhängigen Zwangsbedingungen zu tun haben, können wir direktPH = T + V verwenden. Wir nehmen jetzt aber den allgemeineren Weg über die Formel H = i pi q̇i − L: H = pr ṙ + pϕ ϕ̇ − L = 1 m(r2 ϕ̇2 + ṙ2 (1 + cot2 α)) + mgr cot α . 2 4. Wechsel von den Variablen ϕ̇ und ṙ zu pϕ und pr : Zu diesem Zweck drücken wir in H die Geschwindigkeiten ϕ̇ und ṙ durch die Impulse pϕ und pr aus und erhalten H= p2ϕ p2r + + mgr cot α . 2mr2 2m(1 + cot2 α) 96 (11.5) 5. Bestimmen der Hamiltonschen Bewegungsgleichungen: ϕ̇ ṗϕ ṙ ṗr ∂H pϕ = , ∂pϕ mr2 ∂H = 0, = − ∂ϕ pr ∂H = = , ∂pr m(1 + cot2 α) p2ϕ ∂H − mg cot α . = = − ∂r mr3 = Die erste und dritte Gleichung stimmen mit obigen Beziehungen für die kanonischen Impulse überein. Die zweite Gleichung entspricht der Tatsache, dass ϕ eine zyklische Variable ist. Die vierte Gleichung entspricht der Gleichung (4.10). Wir sehen, dass das Aufstellen der Hamiltonschen Bewegungsgleichungen komplizierter ist als der LagrangeFormalismus, da wir zunächst durch diesen hindurch gehen müssen, um die kanonischen Impulse korrekt zu identifizieren. 11.3 Erhaltungsgrößen und Poissonklammern Wir untersuchen nun, wie sich Erhaltungsgrößen im Hamiltonformalismus äußern. Zunächst betrachten wir nochmal die Bedingungen, unter denen die Hamiltonfunktion selbst eine Erhaltungsgröße ist. Unter Verwendung der Hamiltonschen Gleichung ergibt sich X ∂H X ∂H ∂H dH q̇i + ṗi + = dt ∂q ∂p ∂t i i i i X ∂H ∂H ∂H ∂H ∂H − + + = ∂q ∂p ∂p ∂q ∂t i i i i i = ∂H . ∂t Also ist H genau dann eine Erhaltungsgröße, wenn ∂H/∂t = 0 ist. Mit (11.2) erhalten wir wieder die schon in Kapitel 4 formulierte Bedingung, dass H eine Erhaltungsgröße ist, wenn L nicht explizit von der Zeit abhängt. Außerdem hatten wir schon in Kapitel 4 gesehen, dass wenn die Zwangsbedingungen skleronom und die Kräfte konservativ sind, H identisch mit der Energie E ist. Als nächstes betrachten wir eine beliebige differenzierbare Funktion f (q, p, t) der Koordinaten, Impulse und evtl. der Zeit und untersuchen, unter welchen Bedingungen sie eine Erhaltungsgröße ist. Es ist X ∂f X ∂f ∂f df q̇i + ṗi + = dt ∂q ∂p ∂t i i i i X ∂f ∂H ∂H ∂f ∂f − + + = ∂q ∂p ∂p ∂q ∂t i i i i i ≡ [f, H] + ∂f . ∂t (11.6) Hier haben wir die sogenannte Poisson-Klammer eingeführt. Allgemein ist die Poissonklammer zweier differenzierbarer Funktionen von p und q definiert als X ∂f ∂g ∂f ∂g [f, g] = . (11.7) − ∂qi ∂pi ∂pi ∂qi i 97 Es folgt also, dass eine Funktion f eine Erhaltungsgröße ist, wenn sie nicht explizit zeitabhängig ist und ihre Poisson-Klammer mit H verschwindet. Als Beispiel betrachten wir wieder das Teilchen im Kreiskegel. Wir wissen, dass pϕ eine Erhaltungsgröße ist. Im Folgenden berechnen wir die Poissonklammer von pϕ mit H, wobei H durch (11.5) gegeben ist: ∂pϕ ∂H ∂pϕ ∂H ∂pϕ ∂H ∂pϕ ∂H [pϕ , H] = + − − . ∂ϕ ∂pϕ ∂r ∂pr ∂pϕ ∂ϕ ∂pr ∂r Der erste, zweite und vierte Term verschwinden, weil pϕ nicht von den anderen drei Variablen abhängt, denn alle Größen werden ja als Funktion von r, ϕ, pr , pϕ betrachtet. Also hängt pϕ nur von pϕ ab. Der erste Faktor des dritten Terms ist daher 1, aber dafür verschwindet der zweite Faktor. Also ist [pϕ , H] = 0, wie es sein muss, wenn pϕ eine Erhaltungsgröße ist. Es besteht ein enger Zusammenhang zwischen den Poisson-Klammern der klassischen Mechanik und den Kommutatoren der Quantenmechanik. Viele Beziehungen, die in der klassischen Mechanik unter Verwendung von Poissonklammern gelten, gelten analog in der Quantemechanik, wenn man die PoissonKlammern durch Kommutatoren ersetzt (und noch einen Faktor i~ dranmultipliziert). Von besonderer Bedeutung sind hier die sog. fundamentalen Poissonklammern [qi , pj ] = δij , [qi , qj ] = [pi , pj ] = 0 . (11.8) In der Quantenmechanik folgt aus der Tatsache, dass der Kommutator von qi mit pi nicht verschwindet, die Unschärferelation. 11.4 Der Phasenraum und die Liouville-Gleichung Der durch die 2n Koordinaten pi und qi aufgespannte Phasenraum ist sehr nützlich zur Veranschaulichung der Dynamik von Systemen. Wir haben in Aufgabe 2d) in Kapitel 1 ein sogenanntes Phasenraumportrait für das Pendel gezeichnet, das die qualitativ verschiedenen Trajektorien zeigt: In der Chaostheorie sind solche Phasenraumbilder ein wichtiges Hilfsmittel, um sich die komplexen Sachverhalte zu veranschaulichen und um auch ohne Rechnungen einen qualitativen Eindruck von dem Verhalten eines Systems zu vermitteln. Deshalb diskutieren wir in diesem Unterkapitel einige Eigenschaften des Phasenraums. Die folgenden Überlegungen gelten in der angegebenen Form, wenn H nicht explizit von der Zeit abhängt. Wenn H explizit von der Zeit abhängt, kann man sich mit einem Trick einen Phasenraum mit zeitunabhängigen Phasenraumportraits konstruieren: Man führt eine weitere Koordinate ein, nennen wir sie s(t), die den einfachen Zeitverlauf ṡ = 1 hat. Man macht den Phasenraum also 2n + 1-dimensional. 98 11.4.1 Trajektorien im Phasenraum Da die Hamiltonschen Bewegungsgleichungen von erster Ordnung in der Zeitableitung sind, ist eine Trajektorie (q(t), p(t)) im Phasenraum durch einen zu einer Zeit t0 festgelegten Punkt (q(0), p(0)) eindeutig bestimmt. Dies gilt nicht nur vorwärts in der Zeit, sondern auch rückwärts in der Zeit. Wir können jedem Punkt im Phasenraum einen Pfeil zuordnen, dessen Richtung die Richtung und Länge die “Geschwindigkeit” (q̇1 , . . . , q̇n , ṗ1 , . . . , ṗn ) in diesem Punkt angeben. Die Geschwindigkeit lässt sich mit Hilfe der Hamiltonschen Gleichungen berechnen. Aus diesen Überlegungen folgt die in der Praxis sehr hilfreiche Regel, dass sich Trajektorien im Phasenraum nicht schneiden dürfen. Denn wenn sie sich schneiden würden, gäbe es Punkte, in denen die Richtung des Geschwindigkeitsvektors nicht eindeutig wäre. Die Zeitentwicklung Hamiltonscher Systeme ist aber deterministisch. Die einzig möglichen Punkte, in denen mehrere Trajektorien zusammenkommen können, sind instabile Gleichgewichtspunkte, in denen die Geschwindigkeit Null ist, man betrachte hierzu das Phasenraumportrait des Pendels (siehe vorige Seite). Der instabile Gleichgewichtspunkt bei (φ = (2n + 1)π, Lz = 0) entspricht dem senkrecht nach oben stehenden Pendel. Man nennt einen solchen Punkt, in den sowohl Trajektorien hinein- als auch hinauslaufen und in dessen Umgebung deshalb die Trajektorien Hyperbelform haben, einen hyperbolischen Fixpunkt. Den stabilen Gleichgewichtspunkt bei (φ = 2nπ, Lz = 0) nennt man übrigens einen elliptischen Fixpunkt. 11.4.2 Die Liouville-Gleichung Es ist oft zweckmäßig, nicht nur eine, sondern viele Trajektorien im Phasenraum gleichzeitig zu betrachten. Dies macht man z.B. bei Teilchenbeschleunigern und in der statistischen Mechanik. Das Vorgehen in der statistischen Mechanik wird im Folgenden näher erläutert: In der statistischen Mechanik betrachtet man z.B. ein “Gas” aus N Teilchen, das in eine Kammer eingesperrt ist, mit den n = 3N Ortskoordinaten qi und den entsprechenden Impulskoordinaten pi . Die Dynamik des gesamten Teilchengases lässt sich also durch die Trajektorie eines Punktes im 6N dimensionalen Phasenraum darstellen. Wir schreiben ~x = (q1 , . . . , qn , p1 , . . . , pn ) . (11.9) Die Bewegungsgleichungen (11.1) lassen sich also zusammenfassen als ~x˙ = f~(~x) (11.10) mit der durch die rechten Seiten der beiden Gleichungen (11.1) gegebenen Funktion f~. Um die Brücke zwischen der klassischen Mechanik und der statistischen Mechanik zu bauen, betrachtet man nun nicht ein einzelnes System, sondern ein ganzes Ensemble von solchen Systemen. Da man die Anfangsbedingung sowieso nicht mit beliebiger Genauigkeit angeben kann, betrachtet man das Ensemble von Systemen, deren Anfangszustand im Rahmen einer gewählten Genauigkeit übereinstimmt. Im Phasenraum füllen all diese Anfangszustände des Ensembles ein kleines endliches Volumen aus. Wir wählen das Ensemble so, dass die Dichte der Systeme in diesem kleinen Volumen einen konstanten Wert ̺0 hat und außerhalb verschwindet. Nun betrachtet man die zeitliche Entwicklung all dieser Systeme gleichzeitig im Phasenraum. Jeder Punkt des anfänglich gewählten Volumenelements bewegt sich gemäß Gleichung (11.10). Das Volumenelement bewegt sich also und deformiert sich dabei. Wir zeigen zunächst, dass sich das Gesamtvolumen dabei nicht ändert. Hierzu machen wir den Ansatz V = l1 l2 . . . l2n (mit infinitesimalen li ), wir gehen also davon aus, dass das Volumenelement ein 2n-dimensionaler “Quader” (i) (i) ist, dessen Kanten sich in jeder der 2n Dimensionen von xa bis xe erstrecken. Durch Taylorentwicklung 99 (1) (1) erhalten wir l˙1 = ẋe − ẋa ≃ l1 ∂f1 /∂x(1) . Damit folgt V̇ = = = = l˙1 l2 . . . l2n + l˙2 l1 l3 . . . l2n + . . . ∂f1 ∂f2 l1 l2 . . . l2n + (2) l2 l1 l3 . . . l2n + . . . ∂x(1) ∂x X ∂fi l1 l2 . . . l2n ∂x(i) i ~ · f~ . V∇ (11.11) Die Divergenz der Funktion f~ entscheidet also, wie sich das Phasenraumvolumen unter der Dynamik ändert. Für unsere Hamiltonschen Bewegungsgleichungen gilt ~ · f~ = ∇ n X ∂ ∂H ∂ ∂H = 0. − ∂qi ∂pi ∂pi ∂qi i=1 (11.12) Das Phasenraumvolumen ändert sich also nicht, sondern deformiert sich nur. Wir bezeichnen mit ̺(~x, t) die Dichte der Zustände unseres Ensembles im Phasenraum. Sie hat am Anfang den Wert ̺0 innerhalb des gewählten Volumenelements, und außerhalb ist sie 0. Wir haben eben gezeigt, dass sich das Phasenraumvolumenelement unter der Hamiltonschen Dynamik deformiert, aber dass es nicht sein Volumen ändert. Also gibt es auch zu späteren Zeiten nur Bereiche mit Dichte ̺0 und 0, die aber immer feiner verwoben werden. Wir stellen jetzt noch eine allgemeine Bewegungsgleichung, die sogenannte Liouville-Gleichung, für die Dichte ̺(~x, t) auf, die auch dann gilt, wenn ̺(~x, t) nicht konstant ist. Wir gehen aus von einer allgemeinen Funktion ̺(~x, t). Wir leiten die Liouville-Gleichung aus den Hamiltonschen Gleichungen her, indem wir mit der Kontinuitätsgleichung starten und die rechte Seite mit Hilfe der Hamiltonschen Gleichungen umformen: ∂̺ ~ ̺~x˙ = −∇ ∂t X ∂ ∂H ∂ ∂H ̺ − ̺ = ∂pi ∂qi ∂qi ∂pi i X ∂H ∂ ∂H ∂ = ̺, − ∂q ∂p ∂pi ∂qi i i i ∂̺ ∂t = [H, ̺] . (11.13) In der letzten Zeile tritt wieder eine Poisson-Klammer auf. Die Liouville-Gleichung besagt also, dass die zeitliche Änderung der Phasenraumdichte ̺ durch die Poisson-Klammer der Hamiltonfunktion mit ̺ gegeben ist. Für den speziellen, oben behandelten Fall, dass ̺ innerhalb eines gewissen Volumens den konstanten Wert ̺0 und außerhalb den Wert Null hat, ergibt sich ∂̺/∂t = 0 an allen Orten außer an den Rändern des Volumenelements, die sich ja verschieben. 11.4.3 Invariante Mannigfaltigkeiten Zur Veranschaulichung der Dynamik Hamiltonscher Systeme ist es hilfreich, invariante Mannigfaltigkeiten (auch “invariante Mengen” genannt) im Phasenraum zu identifizieren. Dies sind Mengen von Punkten im Phasenraum, die unter der Zeitentwicklung auf sich selbst abgebildet werden. Das bedeutet, dass wenn man die Zeitentwicklung aller Trajektorien, die in diesen Punkten starten, gleichzeitig betrachtet, diese Menge auf sich selbst abgebildet wird. Zwei wichtige Arten von invarianten Mengen sollen im Folgenden kurz vorgestellt werden: Fixpunkte und periodische Bahnen. 100 Fixpunkte Fixpunkte ~x∗ sind Gleichgewichtslösungen von (11.10), also von 0 = f (~x∗ ) . In der Umgebung eines Fixpunktes können wir die Phasenraumtrajektorien durch Taylorentwicklung im Abstand vom Fixpunkt berechnen: Wir setzen ~x(t) = ~x∗ + ~u(t) , und X dxi dui = = fi (~x∗ + ~u(t)) ≃ dt dt j Dies ist eine Matrixgleichung der Form ~u˙ = A~u mit Aij = Diese Gleichung hat Lösungen der Form ~u(t) = ∂fi ∂xj 2n X ∂fi ∂xj uj (t) . ~ x∗ (11.14) . ~ x∗ ~vk eλk t , k=1 wobei ~vk die Lösung der Eigenwertgleichung A~vk = λk ~vk ist. Da die Matrixelemente von A reell sind, gibt es zu jedem komplexen Eigenwert einen komplex konjugierten Partner. In zwei Dimensionen haben wir zwei Eigenwerte p 1 λ1,2 = τ ± τ 2 − 4∆ , ∆ = λ1 λ2 , τ = λ1 + λ2 . 2 τ ist die Spur von A und ∆ die Determinante. Wir unterscheiden die folgenden Fälle (siehe Abb. 11.1): • ∆ > 0 und τ 2 −4∆ > 0: Beide Eigenwerte sind reell und haben dasselbe Vorzeichen. Der Fixpunkt ist ein Knoten. Seine Stabilität wird durch das Vorzeichen von τ bestimmt. Bei einem stabilen Knoten schmiegen sich die Trajektorien mit der Zeit immer stärker an die “langsame” Eigenrichtung (d.h. die mit dem kleineren |λ|) an, bei einem instabilen Knoten richtet sich die Trajektorie mit der Zeit an der “schnellen” Eigenrichtung aus. • ∆ < 0: Die Eigenwerte sind reell und haben entgegengesetztes Vorzeichen. Der Fixpunkt ist ein Sattelpunkt, auch hyperbolischer Fixpunkt genannt. Es gibt eine stabile und eine instabile Richtung. • ∆ > 0 und τ 2 −4∆ < 0: Die Eigenwerte sind komplex konjugiert. Der Fixpunkt ist eine Spirale. Seine Stabilität wird durch das Vorzeichen von τ bestimmt. Wir setzen λ1 = λ′ + iλ′′ und λ2 = λ′ − iλ′′ an. Dann ist ′ ′′ ′ ′′ ~u(t) = ~v1 e(λ +iλ )t + ~v2 e(λ −iλ )t . ~u ist reell, und folglich sind ~v1 und ~v2 komplex konjugiert, ~v1 = ~v ′ + i~v ′′ und ~v2 = ~v ′ − i~v ′′ . Dies gibt ′ ~u(t) = 2eλ t (~v ′ cos λ′′ t − ~v ′′ sin λ′′ t) . Die relative Orientierung von ~v ′ und ~v ′′ und das Vorzeichen von λ′′ bestimmen den Drehsinn der Spirale. 101 • τ = 0: Der Fixpunkt ist ein Zentrum, auch elliptischer Fixpunkt genannt. Die Trajektorien laufen in geschlossenen Bahnen um ihn herum. • τ 2 − 4∆ = 0: In diesem Fall sind entweder alle Richtungen Eigenrichtungen zum selben Eigenwert und wir haben einen Stern, oder es gibt nur eine Eigenrichtung, und dann ist der Fixpunkt entartet. In beiden Fällen befindet sich der Fixpunkt an der Grenze zwischen Knoten und Spirale. • ∆ = 0: In diesem Fall ist ein Eigenwert 0. Aus der entsprechenden Eigenrichtung läuft man weder aus dem Fixpunkt heraus, noch in ihn hinein. Es gibt also eine ganze Linie von Fixpunkten. stabiler Knoten Sattelpunkt stabile Spirale instabiler Knoten entarteter Fixpunkt Zentrum Stern Fixpunktlinie instabile Spirale Abbildung 11.1: Die erwähnten Arten von Fixpunkten in 2 Dimensionen. Allerdings können die meisten dieser Fixpunkte bei Hamiltonschen Systemen nicht auftreten. Wegen der Gleichung (11.12) darf ein Phasenraumvolumenelement auch in der Umgebung dieses Fixpunktes seine Größe nicht ändern, und deshalb muss die Summe der Eigenwerte Null sein. Zentrum und Sattelpunkt, also elliptische und hyperbolische Fixpunkte, sind daher die einzig möglichen Fixpunkte in Hamiltonschen Systemen mit zweidimensionalem Phasenraum. In 2n > 2 Dimensionen hat ein Fixpunkt mehr als zwei Eigenrichtungen, die zum Teil stabil, zum Teil instabil sind (man braucht beides, damit das Phasenraumvolumen erhalten ist). Dann kann es z.B. ein komplex konjugiertes Paar von Eigenwerten geben, dessen Eigenvektoren eine Ebene aufspannen, in der Trajektoren spiralförmig in den Fixpunkt hineinlaufen, während sie längs anderer Eigenrichtungen aus dem Fixpunkt herauslaufen, oder umgekehrt. Periodische Bahnen Eine periodische Trajektorie ist eine Trajektorie, die sich exakt schließt. Wenn sie stabil ist, bleiben benachbarte Trajektorien in ihrer Nähe und wickeln sich evtl um sie herum. Wenn sie aber instabil ist, 102 entfernen sich benachbarte Trajektorien in der instabilen Eigenrichtung exponenziell schnell in der Zeit von ihr (und folglich auch voneinander). Um dies genauer zu verstehen, betrachten wir einen sogenannten Poincaré-Schnitt durch die Umgebung einer periodischen Traektorie. Wir wählen einen Punkt auf dieser Trajektorie und schieben gedanklich ein Blatt Papier durch diesen Punkt, so dass die Papierebene senkrecht auf die Trajektorie steht. (Die Dimension des “Papierblatts” ist allerdings größer als 2, wenn die periodische Trajektorie samt ihrer Umgebung einen mehr als dreidimensionalen Unterraum des Phasenraums ausfüllt....) Wir verfolgen nun eine Trajektorie, die in der Nachbarschaft unserer periodischen Trajektorie startet, in der Zeit. Jedesmal, wenn sie unser Blatt Papier durchstößt, markieren wir den Durchstoßpunkt. So bekommen wir eine Abfolge von Durchstoßpunkten, die in der Nähe des Durchstoßpunkts der periodischen Trajektorie liegen. Dann machen wir dasselbe für eine andere Trajektorie und markieren die Durchstoßpunkte dieser zweiten Trajektorie in einer anderen Farbe, usw. Eine Trajektorie wird also zu einer Kette von Durchstoßpunkten, und das sich ergebende Gesamtbild ist ganz analog zum Phasenraumportrait in der Umgebung eines Fixpunkts. So werden stabile periodische Bahnen im Poincaré-Schnitt zu elliptischen Fixpunkten und instabile periodische Bahnen zu hyperbolischen Fixpunkten oder (in höheren Dimensionen) zu Fixpunkten mit mehr als einer stabilen und/oder instabilen Eigenrichtung. Aufgaben 1. Berechnen Sie für die Perle auf dem parabelförmigen, rotierenden Draht (s. Kap. 2.1.1 und Übungsaufgabe 1 von Kap. 3) die Hamiltonfunktion und die Hamiltonschen Gleichungen. Wenn Sie überschüssige Energie und Zeit haben, dann berechnen Sie beides auch noch für das Rollpendel. (Die LagrangeFunktion wurde in Kap. 3.3 hergeleitet.) 2. Zeigen Sie, dass sich die Hamiltonschen Bewegungsgleichungen mit Hilfe der Poisson-Klammern schreiben lassen als q̇i = [qi , H] , ṗi = [pi , H] . ~ 2 ] ≡ [Lx , L2 + L2 + L2 ]. (Bem.: Lx ist die 3. Berechnen Sie die Poissonklammern [Lx , Ly ] und [Lx , L z y x x-Komponente des Drehimpulses, also Lx = ypz − zpy .) 4. In Aufgabe 2d) von Kapitel 1 haben Sie die Bahnen im Phasenraum für ein Pendel gezeichnet. (a) Zeichnen Sie nun ein analoges Bild für einen hüpfenden Gummiball, der auf dem Boden elastisch reflektiert wird und zwischen diesen Reflexionen nur der Gravitationskraft ausgesetzt ist. Betrachten Sie dieses System nur in einer Dimension (d.h. der Ball hüpft senkrecht nach oben). (b) Markieren Sie nun im Phasenraum die Fläche, die zwischen zwei Energien E1 und E2 und zwischen zwei Impulsen p1 und p2 liegt. Rechnen Sie explizit nach, dass sich dieses “Phasenraumvolumen” mit der Zeit nicht ändert (also dass alle Trajektorien, die in dieser Fläche zur Zeit t0 starten, zu einer späteren Zeit t1 eine gleich große Fläche bilden). 103 Kapitel 12 Der Hamilton-Jacobi-Formalismus Wenn man ausgehend vom Hamilton-Formalismus versucht, Transformationen auf neue Koordinaten und Impulse so durchzuführen, dass die Bewegung möglichst einfach wird, also dass es möglichst viele zyklische Variablen gibt, gelangt man zur Hamilton-Jacobi-Gleichung. In diesem Kapitel befassen wir uns zunächst mit sogenannten kanonischen Transformationen, um dann zu untersuchen, welche Bedingungen erfüllt sein müssen, damit man auf eine einfache Bewegung kommen kann. Dies wird der letzte Schritt sein auf dem Weg, ein Kriterium für die Lösbarkeit mechanischer Probleme aufzustellen. 12.1 Kanonische Transformationen In Kapitel 4 haben wir gezeigt, dass die Lagrange-Gleichungen unter Punkttransformationen forminvariant sind. Wenn wir also von den Koordinaten q zu den Koordinaten Q = Q(q, t)i wechseln und die h entsprechend transformierte Lagrange-Funktion L′ (Q, Q̇, t) = L q(Q, t), q̇(Q, Q̇, t), t ermitteln, gelten auch in den neuen Koordinaten und mit der neuen Lagrange-Funktion die Lagrange-Gleichungen zweiter Art. Weil die Hamilton-Gleichungen direkt aus den Lagrange-Gleichungen abgeleitet werden können, folgt somit auch, dass die Hamilton-Gleichungen unter Punkttransformationen forminvariant sind. Um die neue Hamiltonfunktion zu erhalten, können wir zunächst L′ bestimmen, daraus die neuen Impulse P ermitteln und damit schließlich die Hamiltonfunktion und die Hamiltonschen Gleichungen in den neuen Koordinaten und Impulsen aufstellen. Im Folgenden wollen wir Transformationen der Koordinaten und Impulse direkt im Hamilton-Formalismus durchführen. Wir betrachten Transformationen von den Variablen q, p und der Hamiltonfunktion H(q, p, t) auf neue Variablen Q, P und eine neue Hamiltonfunktion K(Q, P, t) und verlangen, dass die Hamiltonschen Bewegungsgleichungen Q̇i = ∂K , ∂Pi Ṗi = − ∂K ∂Qi mit den neuen Variablen und der neuen Hamiltonfunktion ebenfalls gelten. Diese sogenannten kanonischen Transformationen sind allgemeiner als die Punkttransformationen. Aus dem eben Gesagten ist klar, dass jede Punkttransformation auch eine kanonische Transformation ist, aber längst nicht jede kanonische Transformation lässt sich als Punkttransformation darstellen. Da die Hamiltonschen Bewegungsgleichungen aus dem Hamiltonschen Prinzip (11.3) folgen, ist eine Transformation genau dann kanonisch, wenn das Hamiltonsche Prinzip nach der Transformation weiterhin erfüllt ist. Wir benutzen diese Bedingung, um ein Rezept zur Erzeugung kanonischer Transformationen zu erhalten. Die Bedingung (11.3) lautet in den neuen Koordinaten # Z t2 "X Pi Q̇i − K(Q, P, t) = 0 , dt δ t1 i 104 wobei die Variation an den Anfangs- und EndpunktenP verschwindet, δQi (t P1 ) = δQi (t2 ) = δPi (t1 ) = δPi (t2 ) = 0. Der Vergleich mit (11.3) ergibt, dass sich ( i pi q̇i − H) und ( i Pi Q̇i − K) nur um einen Faktor und um die totale Zeitableitung einer Funktion F unterscheiden dürfen: P X X X X d(F + i Pi Qi ) dG dF Ṗi Qi −K + Ṗi Qi −K + =− ≡− . (12.1) Pi Q̇i −K + pi q̇i −H) = c( dt dt dt i i i i (Das ist analog zu den Überlegungen im Abschnitt 6.4.) Wir setzen c = 1, denn ein c 6= 1 lässt sich durch eine Änderung der Skala für Q und K immer auf c = 1 abbilden. Die Funktion F bzw. G ist eine beliebige stetig differenzierbare Funktion der alten und neuen Variablen (wobei von den 4 Variablensätzen q, p, Q, P nur 2 unabhängig sind.) Wir wählen G als Funktion der alten Koordinaten und der neuen Impulse, G = G(q, P, t) und erhalten dG X ∂G ∂G ∂G q̇i + Ṗi + = . dt ∂q ∂P ∂t i i i Wenn wir dies in (12.1) einsetzen und die linke und rechte Seite vergleichen, erhalten wir pi = ∂G , ∂qi Qi = ∂G , ∂Pi K=H+ ∂G . ∂t (12.2) Wir habe also ein Rezept dafür gefunden, eine kanonische Transformation durchzuführen: Man nehme eine differenzierbare Funktion G(q, P, t) und stelle die Beziehungen (12.2) auf. Man überprüfe, dass die Transformation umkehrbar ist, dass also jedem Phasenraumpunkt q, p ein Phasenraumpunkt Q, P im neuen System zugeordnet ist und umgekehrt. Damit ist der Zusammenhang zwischen den alten und neuen Variablen und die neue Funktion K bestimmt. Man nennt G die erzeugende Funktion der kanonischen Transformation. Es gibt insgesamt 4 verschiedene Möglichkeiten, über eine Erzeugende Funktion einen Zusammenhang zwischen den alten und neuen Variablen herzustellen, da es 4 verschiedene Kombinationen eines alten und eines neuen Variablensatzes gibt. Statt einer erzeugenden Funktion G(q, P, t) kann man also auch eine Funktion F1 (q, Q, t) oder eine Funktion F3 (Q, p, t) oder eine Funktion F4 (p, P, t) wählen und die zu (12.2) analogen Beziehungen aufstellen. In Lehrbüchern, die alle 4 Möglichkeiten zur Erzeugung von kanonischen Transformationen explizit behandeln, wird unsere Erzeugende Funktion F2 (q, P, t) genannt. Da wir im Folgenden aber nur die Variante mit F2 (also G) benötigen, diskutieren wir die anderen Varianten nicht. P Um ein konkretes Beispiel zu betrachten, wählen wir die erzeugende Funktion G = i qi Pi + H∆t mit einem kleinen Zeitintervall ∆t. Die Beziehungen (12.2) sind dann pi Qi K ∂H(q, P, t) ∂G = Pi + ∆t ≃ Pi − ṗi ∆t , ⇒ Pi = pi + ṗi ∆t ≃ pi (t + ∆t) ; ∂qi ∂qi ∂G ∂H(q, P, t) ∂H(q, p, t) = = qi + ∆t ≃ qi + ∆t ≃ qi (t + ∆t) ; ∂Pi ∂Pi ∂pi ∂H(q, P, t) ≃ H(q, p, t + ∆t) . = H+ ∂t = Die durch G erzeugte kanonische Transformation macht also eine Translation in der Zeit um ∆t. Wenn ∆t infinitesimal klein ist, können alle ≃-Beziehungen in dieser Rechnung durch = ersetzt werden, denn die vernachlässigten Terme sind von der Ordnung (∆t)2 , was gegenüber der Ordnung ∆t unendlich viel kleiner ist, wenn ∆t infinitesimal klein ist. Zum Schluss notieren wir noch einen wichtigen Satz (ohne Beweis): Eine umkehrbare Transformation von q, p, H nach Q, P, K ist genau dann kanonisch, wenn die fundamentalen Poissonklammern [Qi , Pj ] = δij , [Qi , Qj ] = [Pi , Pj ] = 0 gelten. Dies überprüft man durch Einsetzen von Qi (q, p) und Pi (q, p) und Ausnützen von (11.8). 105 12.2 Die Hamilton-Jacobi-Gleichung Die Hamilton-Jacobi-Gleichung erhält man, wenn man nach einer kanonischen Transformation sucht, die sowohl die neuen Koordinaten Qi , als auch die neuen Impulse Pi zu Konstanten der Bewegung macht, also Pi = αi und Qi = βi mit Konstanten αi und βi , deren Werte von den Anfangsbedingungen abhängen, aber sich mit der Zeit nicht ändern. Wenn man eine solche Transformation gefunden hat, hat man nämlich auch die Lösung der Bewegungsgleichungen für q und p gefunden, da diese ja als Funktionen von Q, P, t, also von β, α, t geschrieben werden können. Man hat dann also die Trajektorien des Systems als Funktion der Zeit und der Anfangsbedingungen berechnet. Freilich ist das Finden einer solchen Transformation genauso schwer wie das direkte Lösen der LagrangeGleichungen, so dass auch die Hamilton-Jacobi-Theorie meist keine echte Hilfe beim Lösen mechanischer Probleme ist. Ihr Nutzen liegt vielmehr darin, dass sie neue Einsichten in die Struktur der klassischen Mechanik gewährt, so dass wir bald hinreichende Bedingungen für die Lösbarkeit mechanischer Probleme aufstellen können. Eine Transformation auf konstante Q und P ist z.B. erreicht, wenn K(Q, P, t) = 0 ist. Denn dann ist ja ∂K =0 ∂Pi Q̇i = und Ṗi = − ∂K = 0, ∂Qi d.h. weder die Q noch die P ändern sich mit der Zeit. Aus K = 0 folgt mit der dritten Gleichung von (12.2) K =H+ ∂G = 0, ∂t (12.3) also (mit der ersten Gleichung von (12.2)) ∂G(q, P, t) ∂G(q, P, t) ,t = − . H q, ∂q ∂t (12.4) Dies ist die Hamilton-Jacobi-Gleichung. Die Funktion G nennt man R Prinzipalfunktion oder auch Hamiltonsche Wirkungsfunktion. Sie ist identisch mit der Wirkung S = L dt: Aus der Bedingung (12.1) erhalten wir nämlich mit Ṗi = 0 und K = 0 X pi q̇i − H = i dG dt (12.5) und daraus durch Integration G= Z dt X pi q̇i − H i ! = Z dtL . Wir schreiben deshalb ab jetzt S statt G, und statt P schreiben wir α, um deutlich zu machen, dass es sich um Konstanten handelt. Die Hamilton-Jacobi-Gleichung hat dann die Form ∂S(q, α, t) ∂S(q, α, t) H q, ,t = − . ∂q ∂t (12.6) Die Hamilton-Jacobi-Gleichung ist eine partielle Differenzialgleichung zur Bestimmung der Wirkungsfunktion S(q, α). Wir haben also das ursprüngliche Problem, die Lagrange-Gleichungen oder die Hamiltonschen Bewegungsgleichungen zu lösen, ersetzt durch das Problem, die Erzeugende S einer kanonischen 106 Transformation zu finden. Aus 2n gewöhnlichen Differenzialgleichungen für die q und p der Hamiltonschen Formulierung wurde nun eine partielle Differenzialgleichung für S. Hiermit haben wir eine weitere Formulierung mechanischer Probleme gefunden. (Nach Newton, d’Alembert, Lagrange und Hamilton ist das jetzt die fünfte Formulierung.) Es gibt einige mechanische Probleme, die sich recht schnell mit der Hamilton-Jacobi-Gleichung lösen lassen, da die Hamilton-Jacobi-Gleichung in diesen Problemen sich bei geeigneter Koordinatenwahl leicht in einen Satz unabhängiger Gleichungen für die einzelnen Koordinaten separieren lässt. (Wir machen eine solche Separation in der Übungsaufgabe 3 am Ende dieses Kapitels.) Bespiel: Harmonischer Oszillator Als einfaches Beispiel betrachten wir einen harmonischen Oszillator. Der Phasenraum ist zweidimensional, aber weil die Energie erhalten ist, ist jede Trajektorie in einem eindimensionalen Unterraum gefangen. Die eindimensionalen Probleme lassen sich immer durch eine direkte Integration lösen. Also ist auch die Hamilton-Jacobi-Gleichung für eindimensionale Systeme mit einer nicht explizit von der Zeit abhängenden Hamiltonfunktion immer durch eine Integration lösbar. Für den harmonischen Oszillator ist H= p2 m + ω2 q2 . 2m 2 Die Hamilton-Jacobi-Gleichung lautet somit # " 2 ∂S 1 1 ∂S 2 2 + mω q + = 0. 2 m ∂q ∂t Mit dem Ansatz S = W − P t können wir die Zeit loswerden und erhalten # " 2 1 1 ∂W 2 2 + mω q = P . 2 m ∂q (12.7) Auf der linken Seite steht die Hamiltonfunktion. Da sie nicht explizit zeitabhängig ist, ist sie eine Erhaltungsgröße und identisch mit E, also ist der neue Impuls gegeben durch die Erhaltungsgröße P = E. Auflösen nach W gibt p ∂W (q, E) = ± 2mE − m2 ω 2 q 2 = p . ∂q Integration ergibt W (q, E) = mω q Z 0 und ∂W 1 ∂S = −t= Q= ∂E ∂E ω Z 0 q r 2E − q ′2 dq ′ mω 2 dq ′ q 2E mω 2 − q ′2 1 − t = arcsin ω r mω 2 q 2E ! − t. (12.8) (Den Anfangspunkt q0 des Integrals haben wir hier ohne Verlust von Allgemeinheit des in der nächsten Zeile angegebenen Ergebnisses auf 0 gesetzt.) Damit ist r r 2E 2E sin(ω(t + Q)) ≡ sin(ωt + ϕ0 ) . q(t) = 2 mω mω 2 Wir haben also q ausgedrückt durch den neuen “Impuls” P = E und durch die neue Koordinate Q = ϕ0 /ω, die die Anfangsphase festlegt, und durch die Zeit t. Damit haben wir die Bewegungsgleichung gelöst. 107 12.3 Die zeitunabhängige Hamilton-Jacobi-Gleichung Die kanonische Transformation auf K = 0, die wir im vorigen Unterkapitel durchgeführt haben, führt in einen trivialen Phasenraum: Es ist Q̇i = Ṗi = 0 für alle i, d.h. alle Trajektorien sind Fixpunkte. Der neue Phasenraum weiß also nichts mehr von der Struktur des ursprünglichen Phasenraums, und wir können aus ihm keine weiteren Erkenntnisse gewinnen. Um weitere Fortschritte bei der Suche nach Kriterien für die Lösbarkeit mechanischer Probleme zu machen, führen wir im Folgenden eine modifizierte kanonische Transformation durch, die mehr Einsichten gewährt. Wir beschränken uns auf Systeme mit einer nicht explizit zeitabhängigen Hamiltonfunktion. Wenn die Hamiltonfunktion nicht explizit von der Zeit abhängt, kann man die Zeit durch den Ansatz S(q, α, t) = W (q, α) − Et aus der Hamilton-Jacobi-Gleichung (12.6) eliminieren, so wie wir es im Beispiel des harmonischen Oszillators gemacht haben. Man nennt W die Charakteristische Funktion. Die Hamilton-Jacobi-Gleichung lautet mit dieser Ersetzung ∂W H q, =E. (12.9) ∂q Wir wählen jetzt W statt S als Erzeugende der kanonischen Transformation. Aus der dritten Gleichung von (12.2) folgt dann K(Q, α) = H(q(Q, α), p(Q, α)) . Weil die α ja konstant sein sollen, darf K nicht von den Q abhängen (sonst wäre mindestens ein α̇i = ∂K/∂Qi 6= 0), also lässt sich auch H allein als Funktion der α schreiben. Wenn die Energie als eine dieser Größen gewählt wurde, ist natürlich einfach H = E. Aus der ersten Gleichung von (12.2) erhalten wir jetzt keine konstanten Q mehr, sondern Q̇i = ∂K/∂Pi ≡ ∂K/∂αi ≡ ωi = konst , woraus Qi (t) = ωi t + Qi (0) (12.10) folgt. Wir haben also diesmal nicht eine Transformation auf lauter Konstanten gemacht, sondern auf eine freie Bewegung, mit konstanten Impulsen und linear in der Zeit anwachsenden Koordinaten. Die Pi können irgendwelche Konstanten der Bewegung sein, z.B. Anfangswerte der Impulse oder auch Erhaltungsgrößen. Da wir schon die Energie als Konstante verwendet haben, setzen wir schonmal P1 ≡ α1 = E. Die Pi legen zusammen mit den Qi (0) den Anfangspunkt einer Trajektorie fest. Um die kanonische Transformation auf diese freie Bewegung explizit zu finden, muss man freilich auch hier wieder die Hamilton-Jacobi-Gleichung lösen oder auf einem anderen Weg die Lösung der Bewegungsgleichungen finden. Allerdings werden uns einige Überlegungen zur Beschaffenheit des Phasenraums und zur Auswirkung von Erhaltungsgrößen ermöglichen, allgemeine Bedingungen zu finden, unter denen eine kanonische Transformation auf eine freie Bewegung möglich ist. Doch vorher betrachten wir wieder das Beispiel des harmonischen Oszillators. Nochmal der harmonische Oszillator Wenn wir den harmonischen Oszillator mit der Erzeugenden W kanonisch transformieren, erhalten wir statt (12.8) ! r Z mω 2 1 1 q ∂W dq ′ q = arcsin = q . Q= ∂E ω 0 ω 2E 2E − q ′2 mω 2 Also ist der Zusammenhang zwischen den alten und neuen Koordinaten jetzt r 2E sin(ωQ(t)) . q(t) = mω 2 108 Den Zeitverlauf Q(t) erhalten wir aus Q̇ = ∂K(E) = 1. ∂E Also ist Q = t + Q0 und r 2E sin(ωt + ϕ0 ) mω 2 (mit ϕ0 = ωQ0 ), wie es sein muss. Die Koordinate Q macht eine freie Bewegung mit konstantem “Impuls” P (der mit E identisch ist). Es mag zunächst verwundern, wie eine geradlinig gleichförmige freie Bewegung in den neuen Koordinaten Q mit einer periodischen Schwingung in den alten Kooridnaten q verträglich ist. Die periodische Schwingung des harmonischen Oszillators ist nämlich auf einen begrenzten Bereich von q-Werten beschränkt, während bei einer freien Bewegung die Koordinate Q alle Werte von minus Unendlich bis plus Unendlich durchlaufen kann. (Wir können Trajektorien nicht nur vorwärts in der Zeit, sondern auch rückwärts in der Zeit laufen lassen.) Die Auflösung des Rätsels liegt natürlich darin, dass Werte Q + 2π/ω nicht von Werten Q unterschieden werden können, da sie genau demselben Zustand des Systems entsprechen (wegen der Sinusfunktion in der Abbildung von Q auf q). Um dieser Tatsache Rechnung zu tragen, geben wir der Q-Achse sogenannte periodische Randbedingungen: Statt die Achse von minus bis plus Unendlich laufen zu lassen, nehmen wir den Abschnitt von 0 bis 2π/ω und schließen diesen Abschnitt ringförmig: Wenn wir “oben” beim Wert 2π/ω hinauslaufen, laufen wir “unten” bei 0 wieder rein (und umgekehrt). q(t) = Die Notation wäre einfacher, wenn wir als Periode der Q-Koordinate nicht 2π/ω, sondern einfach 2π hätten. Dies können wir dadurch erzielen, dass wir statt der Wahl P = E die Wahl P = E/ω treffen. Dann bekommen wir Q̇ = ω , ⇒ Q = Q0 + ωt . Dasselbe können wir auch in höheren Dimensionen machen. Ein n-dimensionaler harmonischer Oszillator hat die Hamiltonfunktion n 1 X 2 pi + m2 ωi2 qi2 . H= 2m i=1 Die Hamiltonschen Bewegungsgleichungen der n Dimensionen sind unabhängig voneinander und können jede für P sich gelöst werden. In jedem Freiheitsgrad steckt ein Beitrag Ei zur Gesamtenergie, und es ist E = i Ei . Wir wählen Pi = Ei /ωi und erhalten dann r 2Pi Qi = ωi t + Qi0 , und qi (t) = sin Qi (t) . mω Für alle Qi wählen wir periodische Randbedingungen. Wir beschränken also jedes Qi auf den Bereich [0, 2π] und betrachten den Wert 2π als identisch mit 0. Wenn also eine der Koordinaten mit positiver Geschwindigkeit beim Wert 2π ankommt, wird sie auf 0 gesetzt. Wenn sie mit negativer Geschwindigkeit bei 0 ankommt, wird sie auf 2π gesetzt. Wenn wir all diese einander entsprechenden Punkte, die auf den Randflächen des Würfels [0, 2π]n liegen, miteinander verbinden, erhalten wir einen n-dimensionalen Torus. Einen zweidimensionalen Torus kann man sich gut vorstellen (als Autoreifenschlauch oder als Donut oder Bagel), da man ihn in den dreidimensionalen Raum einbetten kann, bei höheren Dimensionen wird es mit der Anschauung schwieriger... In mehr als einer Dimension ist die Bewegung eines harmonischen Oszillators i.A. nicht periodisch, sondern quasiperiodisch. Nur wenn die Frequenzen ωi in rationalen Verhältnissen zueinander stehen, können sich die Trajektorien auf dem Torus exakt schließen. Wenn alle Frequenzen in irrationalen Verhältnissen zueinander stehen, überdeckt eine Trajektorie im Laufe der Zeit den gesamten Torus immer dichter, d.h. sie kommt jedem Punkt auf dem Torus im Laufe der Zeit beliebig nahe. 109 12.4 Einige allgemeine Überlegungen Wir haben mit dem n-dimensionalen harmonischen Oszillator ein Beispiel dafür gesehen, wie die kanonische Transformation mit der charakteristischen Funktion W (q, α) für die neuen Koordinaten Q auf eine Bewegung mit konstanter Geschwindigkeit führt. Weil die Bewegung beschränkt ist (also nicht nach Unendlich abhauen kann), findet sie auf einem Torus statt. Nun fragen wir, ob es eine derartige Transformation für jedes nicht explizit zeitabhängige, durch die Hamiltonschen Bewegungsgleichungen beschriebene System geben kann. Wie wir gesehen haben, ist eine solche Transformation äquivalent zum Lösen der Bewegungsgleichungen. Sowohl bzgl. der Funktion W , als auch bzgl. der Lösungen q(t), p(t) der Bewegungsgleichungen hat man üblicherweise die Vorstellung, dass sie stetig differenzierbar sein muss und sich in irgendeiner Form hinschreiben lässt (zumindest als Integral oder in sonst einer Form, die die Funktion eindeutig festlegt). Diese Vorstellung beinhaltet auch, dass eine kleine Änderung der Parameter (also der αi oder der Anfangsbedingungen) auf eine kleine Änderung der Lösung führen. Außerdem bedeutet die Existenz der Erzeugenden Funktion W auch, dass man eine Formulierung der Lösung gefunden hat, die die gesamte zukünftige (und ebenso die vergangene) Zeitentwicklung beinhaltet. Es gibt nur eine Möglichkeit, wie eine beschränkte Bewegung, die für alle Zeiten eine geradlinig gleichförmige Bewegung in allen n Koordinaten Qi ist, aussehen kann: sie muss auf einem n-dimensionalen Torus verlaufen. Das Lösen der Hamilton-Jacobi-Gleichung für nicht explizit zeitabhängige Systeme ist also äquivalent zum Durchführen einer kanonischen Transformation auf eine gleichförmige Bewegung auf einem n-dimensionalen Torus, der durch Konstanten α1 , . . . , αn charakterisiert ist. (Wir schließen jetzt mal den ganz spezielle Bedingungen erfordernden Fall aus, dass eine einzige Trajektorie quasiperiodisch einen mehr als n-dimensionalen Torus im Phasenraum abdeckt.) Um herauszufinden, unter welchen Bedingungen eine solche Transformation allgemein möglich ist, gehen wir jetzt nicht mathematisch exakt vor, sondern versuchen, eine möglichst gute Anschauung über die Eigenschaften des Phasenraums zu gewinnen, die für eine solche Transformation nötig sind. 12.4.1 Unterteilung des Phasenraums mit Hilfe von Erhaltungsgrößen Zunächst überlegen wir, wie sich verschiedene Trajektorien auf den Phasenraum verteilen können. Wir betrachten wieder Systeme ohne explizite Zeitabhängigkeit. Die Energie ist also eine Erhaltungsgröße. Der Phasenraum lässt sich damit in Energieschalen unterteilen. Eine Energieschale zur Energie E beinhaltet alle Punkte des Phasenraums, die zu einer Energie in einem infinitesimal kleinen Intervall [E, E + dE] gehören. Wenn wir einen bestimmten Punkt (q, p) des Phasenraums als Anfangspunkt einer Trajektorie wählen, dann bleibt die gesamte Trajektorie innerhalb derjenigen Energieschale, in der der Anfangspunkt liegt. Die Energieschale ist (2n − 1)-dimensional. Es gibt Systeme, in denen eine Trajektorie die gesamte Energieschale abdeckt, also im Laufe der Zeit jedem Punkt der Energieschale beliebig nahe kommt. Man nennt solche Systeme ergodisch. Sie spielen eine wichtige Rolle in der statistischen Mechanik. Die Bewegung in einem ergodischen System kann man nicht durch eine kanonische Transformation auf einen n-dimensionalen Torus bringen, da eine einzelne Trajektorie ja schon einen 2n − 1-dimensionalen Unterraum des Phasenraums dicht bedeckt, also einen Raum höherer Dimension ausfüllt. Die Assoziation von Konstanten α2 , ..., αn mit dieser Trajektorie bringt keine besonderen Einsichten. Man kann sie zwar als Anfangsimpulse zur Zeit t = 0 wählen, doch da zu späteren Zeiten auch alle anderen Impulswerte der Energieschale auftreten, unterscheidet sich diese Trajektorie abgesehen vom Startpunkt nicht von anderen Trajektorien in dieser Impulsschale. Ein solches System ist also nicht integrabel, d.h. die HamiltonJacobi-Gleichung kann nicht gelöst werden. (Wir schließen wieder den ganz speziellen Fall aus, dass die Trajektorie sich so ordentlich durch den Phasenraum bewegt, dass sie auf einen 2n − 1-dimensionalen Torus transformiert werden kann.) Wenn es neben der Energie weitere Erhaltungsgrößen gibt, können wir die Energieschalen unterteilen in Schalen niedrigerer Dimension, die jeweils zu bestimmten Werten der Erhaltungsgrößen gehören. Trajektorien bleiben dann jeweils in derjenigen Unterschale gefangen, in der sie gestartet sind. Wenn es n unabhängige Erhaltungsgrößen gibt, sind die Trajektorien in einem n-dimensionalen Unterraum gefangen. 110 Systeme mit n unabhängigen Erhaltungsgrößen sind also potenzielle Kandidaten für integrable Systeme, in denen die Hamilton-Jacobi-Gleichung lösbar ist. Noch mehr unabhängige Erhaltungsgrößen zu fordern, macht keinen Sinn, denn n = 3N − k ist die Zahl der räumlichen Koordinaten des Systems, und diese hatten wir schon so gewählt, dass alle Zwangbedingungen berücksichtigt sind. Wenn eine Trajektorie in einem Unterraum des Phasenraums gefangen ist, der eine Dimension kleiner als n hat, bedeutet dies, dass sie nicht alle räumlichen Dimensionen sehen kann. Also hat man von Anfang an mehr räumliche Koordinaten als nötig gewählt. Diesen Fall wollen wir daher ausschließen. Dann gibt es maximal n unabhängige Erhaltungsgrößen. Wir werden später an einem Beispiel sehen, dass auch, wenn es außer der Energie keine weiteren Erhaltungsgrößen gibt, Trajektorien in n-dimensionalen Unterräumen gefangen sein können, doch typischerweise gibt es neben diesen Trajekorien auch solche, die einen 2n − 1-dimensionalen Teil des Phasenraums überdecken. 12.4.2 Von der Gefährlichkeit hyperbolischer Fixpunkte und instabiler periodischer Bahnen Nachdem wir geklärt haben, unter welchen Bedingungen Trajektorien in n-dimensionalen Unterräumen des Phasenraums gefangen sind, fragen wir als nächstes, wie das durch die Hamiltonschen Gleichungen (11.10) gegebene Vektorfeld beschaffen sein muss, damit eine kanonische Transformation eines zusammenhängenden, endlichen Teils des Phasenraums von der ursprünglichen Form (11.10) auf eine freie Bewegung, also auf ein Vektorfeld der Form ~x˙ = konst möglich ist. Hierzu betrachten wir nochmal das Phasenraumportrait des Pendels: Wir sehen, dass es zwei Sorten von Trajektorien gibt: diejenigen, bei denen das Pendel in einem begrenzten Winkelbereich hin- und herschwingt, und diejenigen, bei denen das Pendel überschlägt und sich immer in derselben Richtung dreht. Diese beiden Sorten von Trajektorien unterscheiden sich durch ihre Energiewerte. Im Energieintervall [−mgl, mgl[ schwingt das Pendel hin und her, im Energiebereich E > mgl überschlägt es sich. Diese beiden Bereiche sind durch die Trajektorien zu E = mgl voneinander getrennt. Diese Trajektorien sind sogenannte heterokline Trajektorien, die zwei hyperbolische Fixpunkte miteinander verbinden, indem sie aus dem einen Fixpunkt in seiner instabilen Eigenrichtung herauslaufen und in den anderen Fixpunkt aus der stabilen Eigenrichtung einmünden. Es ist anschaulich klar, dass man für jeden dieser beiden Energiebereiche eine Transformation auf eine gleichförmige Bewegung auf einem eindimensionalen “Torus” (also einem Kreis) machen kann. In dem ersten Energiebereich, in dem das Pendel hin- und herschwingt, haben wir eine ähnliche Situation wie beim harmonischen Oszillator, für den wir diese Transformation explizit gemacht haben. Die neue Koordinate Q = ωt läuft gleichförmig von 0 nach 2π, während das Pendel von der Ruhelage zunächst nach rechts zum maximalen Ausschlag, dann nach links zum maximalen Ausschlag auf der anderen Seite, und zurück zum Nulldurchgang schwingt. 111 Im anderen Energiebereich, in dem das Pendel überschlägt, ist die neue Koordinate Q einfach eine in der Zeit geeignet gestreckte und gestauchte Funktion ϕ(t), so dass Q gleichförmig in der Zeit anwächst (oder abfällt). Die spezielle Trajektorie, die diese beiden Energiebereiche trennt, lässt sich nicht auf diese Weise transformieren. Der Grund hierfür ist der hyperbolische Fixpunkt, dem sich die Trajektorie im Limes t → ∞ immer mehr annähert, und an dem die Länge des Pfeils, der die Geschwindigkeit der Trajektorien im Phasenraum angibt, Null ist. Bei einer Bewegung auf einem Torus ist die Geschwindigkeit überall von Null verschieden und die Richtung der Bewegung an jedem Punkt eindeutig. Wir folgern also: die Transformation eines durch einen endlichen Energiebereich gegebenen Teils des Phasenraums auf eine gleichförmige Bewegung ist unmöglich, wenn dieser Teil des Phasenraums hyperbolische Fixpunkte enthält. Elliptische Fixpunkte sind harmloser, da sie als ein auf die Größe Null geschrumpfter Torus angesehen werden können. Hyperbolische Fixpunkte haben noch eine weitere wichtige Eigenschaft: Wenn man in ihrer unmittelbaren Umgebung ist und in der instabilen Eigenrichtung rausläuft, entfernt sich die Trajektorie für kleine Zeiten gemäß einer Exponentialfunktion von dem Fixpunkt. Beim Pendel (und bei allen anderen zeitunabhängigen eindimensionalen Systemen) ist die Existenz von hyperbolischen Fixpunkten harmlos, da sie nur einen einzigen Energiewert betreffen (bzw. für allgemeine eindimensionale Systeme eine endliche Anzahl von Energiewerten in jedem endlichen Energieintervall). Für die Energiebereiche unterhalb und oberhalb der Energie des hyperbolischen Fixpunkts (oder, wenn es mehrere solcher Fixpunkte gibt, für die Energiebereiche zwischen den Fixpunkten) ist eine kanonische Transformation auf Tori möglich. Das System ist also integrabel, benötigt aber für verschiedene Bereiche des Phasenraums verschiedene Transformationen. In höherdimensionalen Systemen ist die Situation komplexer. Auch hier kann keine kanonische Transformation auf eine freie Bewegung durchgeführt werden, wenn der betrachtete Bereich des Phasenraums hyperbolische Fixpunkte (also Fixpunkte mit stabilen und instabilen Eigenrichtungen) enthält. Doch es gibt noch weitere gefährliche Objekte in höherdimensionalen Systemen, nämlich instabile periodische Trajektorien. Ebenso wie Fixpunkte bilden die Punkte einer periodischen Bahn eine invariante Menge im Phasenraum. Wenn wir uns nun noch bewusst machen, dass solche invarianten Mengen nach einer kanonischen Transformation mit der Erzeugenden W (q, α) wieder eine invariante Menge sein müssen, aber dass ein Torus keine instabilen periodischen Bahnen enthält, folgt, dass Phasenraumbereiche, die instabile periodische Bahnen enthalten, nicht auf eine freie Bewegung transformiert werden können. All diese Überlegungen führen uns also zu der Schlussfolgerung, dass die Hamilton-Jacobi-Gleichung lösbar ist, also dass die Dynamik sich auf eine freie Bewegung transformieren lässt, wenn es n Erhaltungsgrößen gibt und wenn es innerhalb der Phasenraumbereiche, die gemeinsam transformiert werden sollen, keine instabilen periodischen Bahnen oder Fixpunkte gibt. Damit sind wir vorbereitet für den Satz von Liouville über integrable Systeme und für den Nachweis, dass nicht integrable Systeme typischerweise chaotisch sind. Aufgaben 1. Führen Sie eine kanonische Transformation mit der Erzeugenden G = tieren Sie dieses Ergebnis? 2. Zeigen Sie, dass die Transformation Qi = pi , ist. Wie interpretieren Sie dieses Ergebnis? Pi = −qi , P i qi Pi K(Q, P, t) = H(−P, Q, t) kanonisch 3. (a) Stellen Sie die Hamilton-Jacobi-Gleichung für das Zentralkraftproblem H= auf. 1 2 pϕ p + + V (r) 2m r r2 112 durch. Wie interpre- (b) Separieren Sie zunächst die Zeit ab, so dass Sie eine partielle Differenzialgleichung für W bekommen. Setzen Sie α1 = E und machen Sie den Ansatz W (r, ϕ, E, α2 ) = W1 (r, E, α2 ) + W2 (ϕ, E, α2 ). Warum funktioniert dieser Ansatz? (c) Formen Sie diese Gleichung so um, dass auf der einen Seite keine ϕ-Abhängigkeit und auf der anderen Seite keine r-Abhängigkeit ist. (d) Da die rechte und linke Seite von verschiedenen Variablen abhängen, müssen sie gleich einer Konstanten sein. Identifizieren Sie diese mit α2 und schreiben Sie die resultierenden Ausdrücke für W1 und W2 auf. Diese Ausdrücke dürfen noch einfache Integrale enthalten. (e) Finden Sie einen Zusammenhang zwischen pϕ und α2 . (f) Schreiben Sie das somit erhaltene Ergebnis für S auf und berechnen Sie daraus Ausdrücke für die neuen Koordinaten β1 und β2 . 113 Kapitel 13 Integrable und nicht integrable Systeme In diesem Kapitel behandeln wir den Satz von Liouville, der eine hinreichende Bedingung für die Integrabilität eines Systems liefert. Außerdem zeigen wir, dass ein integrables System sofort nichtintegrabel wird, wenn man zu seiner Hamiltonfunktion einen kleinen Term addiert, der nicht dieselben Erhaltungsgrößen hat. 13.1 Der Satz von Liouville über integrable Systeme Der Satz von Liouville besagt, dass ein räumlich beschränktes Hamiltonsches System mit n Freiheitsgraden integrabel ist, wenn es n Funktionen Ii (q, p) gibt, die von den Koordinaten und Impulsen, aber nicht von der Zeit abhängen und folgende drei Eigenschaften haben: 1. Die Funktionen Ii (q, p) sind Erhaltungsgrößen. 2. Alle ihre Poissonklammern verschwinden, d.h. [Ii , Ij ] = 0 (13.1) für alle Paare i, j. Man sagt auch, die Ii sind in Involution. 3. Ihre totalen Differenziale dIi = n X ∂Ii ∂qk k=1 dqk + ∂Ii dpk ∂pk sind linear unabhängig, d.h. der Rang der n × 2n Koeffizientenmatrix (∂Ii /∂qk , ∂Ii /∂pk ) ist n. Die erste und dritte Eigenschaft sind notwendig, damit der Phasenraum in n-dimensionale Mannigfaltigkeiten zerlegt werden kann, die jeweils zu konstanten Werten der Erhaltungsgrößen gehören. Die zweite Eigenschaft ist nötig, damit innerhalb dieser Mannigfaltigkeiten die Erzeugende W (p, I) der kanonischen Transformation auf eine freie Bewegung konstruiert werden kann. Dann folgt, dass diese Mannigfaltigkeiten Tori sind. Wir zeigen dies, indem wir die Funktion W konstruieren. Sie ist nämlich wegen W = S + Et und Z X Z X Z X pi q̇i − E)dt = ( pi dqi − Edt) = pi dqi − Et S= ( i i gegeben durch W (q, I) = Z q q0 i X i 114 pi (q ′ , I)dqi′ . (13.2) Der Integrationsweg ist innerhalb der n-dimensionalen Mannigfaltigkeit zu den angegebenen Werten I zu nehmen. Die Funktion W (q, I) ist wohldefiniert, wenn sie unabhängig vom Integrationsweg ist. Wir müssen also zeigen, dass der Wert des Integrals sich nicht ändert, wenn wir den Weg bei festem Anfangsund Endpunkt kontinuierlich deformieren. Dies folgt daraus, dass alle Poissonklammern zwischen den Ii verschwinden, wie wir im Folgenden skizzieren: Wir können ein infinitesimales Wegelement d~q innerhalb der n-dimensionalen Mannigfaltigkeit dadurch erzeugen, dass wir die Hamiltonschen Gleichungen über eine infinitesimale Zeit dt anwenden. Dies gibt d~ q (1) = (∂H/∂~p)dt und eine damit verbundene Änderung des Impulses d~ p(1) = −(∂H/∂~q)dt . Wir können außerdem n− 1 davon linear unabhängige infinitesimale Wegelemente dadurch erzeugen, dass wir die n − 1 anderen Erhaltungsgrößen jeweils wie eine Hamiltonfunktion behandeln, also d~ q (j) = (∂Ij /∂~p)dτj und d~ p(j) = −(∂Ij /∂~q)dτj setzen, für j = 2, . . . , n (den Index j = 1 haben wir ja schon für die Hamiltonfunktion, also die Erhaltungsgröße Energie vergeben). Weil die Poissonklammern der Erhaltungsgrößen verschwinden, ändern sich die Werte der Erhaltungsgrößen nicht, wir bleiben also innerhalb derselben Mannigfaltigkeit, wenn wir ein solches Wegelement konstruieren. (Dies zeigt man ganz genau so wie die Rechnung (11.6).) Also können wir die Wegelemente des Integrationswegs in (13.2) als Linearkombination der ~q(j) ausdrücken. Wir können einen gegebenen Integrationsweg beliebig genau dadurch nähern, dass wir in einer richtig gewählten Reihenfolge die Ij jeweils infinitesimale Wegelemente erzeugen lassen. Das Integral in (13.2) ist unter stetigen Deformationen des Integrationswegs genau dann invariant, wenn die Reihenfolge der infinitesimalen Schritte vertauscht werden darf. Dies zeigen wir für zwei aufeinanderfolgende Schritte d~q(j) und d~q(k) : Wenn wir von einem Ausgangspunkt (q0 , p0 ) zuerst Ij über eine infinitesimale “Zeit” dτj anwenden, und dann Ik über eine infinitesimale “Zeit” dτk , erhalten wir einen Beitrag ~ · d~ ~ + d~ ~ · d~q(j) + ~p(~q0 , I)d~ ~ q (k) + d~ dW = p~(~ q0 , I) q (j) + (~ p(~ q0 , I) p(j) )d~q(k) = p~(~q0 , I) p(j) d~q(k) zum Integral. Wenn wir die umgekehrte Reihenfolge wählen, lautet der letzte Term d~ p(k) )d~q(j) . Nun ist aber ∂Ik ∂Ij ∂Ij ∂Ik dτj dτk = − dτj dτk = d~ p(k) d~q(j) . d~ p(j) d~ q (k) = − ∂~q ∂~ p ∂~q ∂~p Im vorletzten Schritt haben wir verwendet, dass die Poissonklammer [Ij , Ik ] verschwindet. Wir haben also gezeigt, dass dW unabhängig von der Reihenfolge der beiden Schritte ist. (Diese ganze Rechnung ist nichts anderes als der Satz von Stokes in n Dimensionen.) 13.2 Wirkungs- und Winkelvariablen Beim Nachweis der Eindeutigkeit der Funktion W haben wir eine Sache ignoriert: Es gibt nämlich Integrale I X pi (q ′ , I)dqi′ i auf dem Torus, die nicht verschwinden. Dies sind die Integrale über Wege um den Torus herum, die sich nicht stetig auf einen Punkt zusammenziehen lassen. Es gibt n verschiedene nicht ineinander deformierbare Wege Cj . Also gibt es auch n verschiedene Integrale I X 1 Jj ≡ pi (q, I)dqi , (13.3) 2π Cj i 115 die den Torus charakterisieren. Man nennt sie Wirkungsvariablen. Dies bedeutet, dass W doch nicht eindeutig definiert ist, da man zwischen zwei Punkten auf dem Torus Integrationswege nehmen kann, die sich in ihrer Windungszahl um den Torus in jeder der n Dimensionen unterscheiden können. Doch dies spiegelt nur die Tatsache wider, dass auch die Qj nur bis auf Vielfache von 2π∂K/∂Ij eindeutig sind. Da die Wirkungsvariablen einen Torus eindeutig charakterisieren, müssen sie sich als Funktionen der Erhaltungsgrößen Ii schreiben lassen. Dies bedeutet, dass sie selbst Erhaltungsgrößen sind. Wir hätten von Anfang an als neue verallgemeinerte Impulse P in der Erzeugenden W der kanonischen Transformation statt der I die Variablen J wählen können. Die entsprechenden verallgemeinerten neuen Koordinaten Qi nennen wir Winkelvariablen θi , und diese genügen den Beziehungen ∂W (q, J) ∂Ji (13.4) ∂K(J) ≡ ωi = konst. ∂Ji (13.5) θi = und der Bewegungsgleichung θ̇i = Wir können die den Torus charakterisierenden Integrale (13.3) auch in den neuen Koordinaten berechnen. Wir erhalten dann I X 1 Jj ≡ Ji dθi . 2π Cj i Wenn wir die geschlossene Kurve Cj als Weg von (θ1 , . . . , θj , . . . θn ) = (0, . . . , 0, . . . , 0) nach (θ1 , . . . , θj , . . . θn ) = (0, . . . , 2π, . . . , 0) nehmen, erhalten wir die Identität Jj = Jj , wie es sein muss. Die Wirkungsvariablen sind also eindeutig und verändern sich nicht unter einer kanonischen Transformation. Der Vorfaktor 1/(2π) vor dem Integral (13.3) führt dazu, dass die θi bei einer Umrundung des Torus genau um 2π anwachsen, also als echte Winkel verstanden werden können. 13.3 Eine kleine Änderung von H kann ein System nichtintegrabel machen Nun beginnen wir mit einem integrablen System in der Formulierung mit Wirkungs- und Winkelvariablen und mit einer (zeitunabhängigen) Hamilton-Funktion H0 , aber addieren eine kleine “Störung” ǫH1 , die z.B. die bisher vernachlässigten Effete der Umgebung des betrachteten Systems auf die Dynamik dieses Systems beinhaltet: H(θ, J) = H0 (J) + ǫH1 (θ, J) . In der Darstellung durch Wirkungs- und Winkelvariable hängt H0 nur von den J ab, weil die Hamiltonfunktion H ja identisch mit K(J) ist. Wenn H1 explizit von den θ abhängt, hat das durch H beschriebene System keine n Erhaltungsgrößen mehr. Wir zeigen im Folgenden, dass das System dann auch nicht mehr integrabel ist. solche Überlegungen wurden übrigens schon um das Jahr 1890 durch Henri Poincaré angestellt. Wir versuchen, eine kanonische Transformation auf neue Variablen J ′ , θ′ zu finden, so dass die Hamilton-Funktion nur von J ′ abhängt. Wenn es uns gelingt, ist das neue System integrabel, aber wenn wir zeigen können, dass es keine solche Transformation gibt, ist das System nicht integrabel. Die zeitunabhängige Hamilton-Jacobi-Gleichung für die gesuchte Transformation lautet ∂W H , θ = H(J ′ ) . ∂θ Wir entwickeln W in Potenzen von ǫ und behalten in der folgenden Rechnung nur die Terme bis zur linearen Ordnung in ǫ: W = W (θ, J ′ ) = θJ ′ + ǫW1 (θ, J ′ ) + . . . . 116 P ′ (Bemerkung: Das Produkt θJ ′ ist zu lesen als θ~ · J~′ bzw. i θi Ji . Der Einfachheit halber lassen wir in dieser Rechnung die Vektorpfeile bzw. Summierungen und Laufindizes weg.) Der erste Term in der vorigen Gleichung ist derjenige, den man für H1 = 0 hätte, und er macht eine kanonische Transformation, bei der die alten und neuen Variablen identisch sind. Wenn man den Ausdruck für W in die zeitunabhängige Hamilton-Jacobi-Gleichung einsetzt, erhält man ∂W1 ∂W1 ∂H0 ∂W1 ′ ′ H(J ) ≃ H0 J + ǫ + ǫH1 θ, ≃ H0 (J ′ ) + ǫ + ǫH1 (θ, J ′ ) . ∂θ ∂θ ∂J ′ ∂θ Die von θ abhängigen Terme verschwinden in der Ordnung ǫ, wenn ∂W1 ∂H0 ∂W1 ≡ω = −H1 (θ, J ′ ) ∂J ′ ∂θ ∂θ ist. Um dies zu lösen, entwickeln wir W1 und H1 in einer Fourierreihe in θ (denn θ hat ja die Periode 2π): X W1 (θ, J ′ ) = W1,n (J ′ )ein·θ n6=0 ′ H1 (θ, J ) = X H1,n (J ′ )ein·θ (13.6) n6=0 wobei n = (n1 , n2 , . . . ) ist (mit ganzzahligen ni ). Der Summand n = 0 tritt nicht auf, da er in H1 nur einen konstanten und damit überflüssigen Beitrag zur Energie macht, und da er in W1 wegen der Ableitung nach θ sowieso keine Auswirkung hat. Damit erhalten wir das Ergebnis W (J ′ , θ) = θ · J ′ + iǫ X H1,n (J ′ ) ein·θ . n · ω(J ′ ) (13.7) n6=0 Man sieht, dass der Beitrag proportional zu ǫ nicht immer klein ist, da er für ω·n= 0 divergiert. Für ein System mit zwei Freiheitsgraden bedeutet dies ω 1 n1 + ω 2 n2 = 0 bzw. n2 ω1 =− . ω2 n1 Für rationale Frequenzverhältnisse gibt es also Resonanzen, die die Störungstheorie kaputt machen, so dass das System in diesem Fall nicht mit Hilfe der Störungstheorie integriert werden kann. Die am Anfang dieser Rechnung gemachte Annahme, dass eine kleine Änderung von H zu einer kleinen Änderung der Trajektorien führt, erweist sich also als falsch. Früher hoffte man, dass die gefundenen Resonanzen durch Terme, die in höherer Ordnung in ǫ kommen (wir haben ja nur bis zur ersten Ordnung gerechnet), möglicherweise kompensiert werden, oder dass man einen anderen Ansatz finden kann, um das durch H0 + ǫH1 gegebene mechanische Problem zu lösen. Doch heute wissen wir, dass dies i.A. nicht möglich ist. Das KAM-Theorem und das Poicaré-Birkhoff-Theorem (aus Kapitel 14) werden das deutlich machen. 13.4 Das KAM-Theorem Wir haben im vorigen Abschnitt gesehen, dass rationale Tori durch H1 zerstört werden, weil Resonanzen auftreten. Nun fragen wir, was mit irrationalen Tori passiert. Werden sie nur deformiert, oder werden sie auch zerstört? Das kommt darauf an, wie “nah” das irrationale Frequenzverhältnis an rationalen Zahlen 117 ist, wie das KAM-Theorem zeigt, das wir im Folgenden in seiner einfachsten Version behandeln. KAM steht hierbei für die drei Namen Kolmogorov (1954), Arnold (1963) und Moser (1967). Diese Personen stellten Bedingungen dafür auf, dass die störungstheoretische Rechnung konvergierende Summen ergibt. Das betrifft sowohl die Summation der Fourierkomponenten, als auch die Summation der Terme jeder Ordnung in ǫ. Bei der Begründung des Theorems befassen wir uns hier nur mit der ersten Sorte von Summe. Wir geben das KAM-Theorem hier für 2 Freiheitsgrade an. Die allgemeine Formulierung kann in der Originalliteratur gefunden werden. Das KAM-Theorem besagt, dass wenn die Jacobi-Determinante der Frequenzen nicht Null ist, also wenn (det ∂ωi /∂Jj ) 6= 0 ist, diejenigen Tori, deren Frequenzverhältnis für alle rationalen Zahlen m/s die Ungleichung ω1 m k(ǫ) > 2.5 (13.8) − ω2 s s erfüllt, stabil sind unter der Störung ǫH1 , solange ǫ genügend klein ist. k(ǫ) ist hierbei eine stetige Funktion, die für ǫ → 0 verschwindet. Wir zeigen zunächst, dass diejenigen Frequenzverhältnisse, die die Bedingung (13.8) erfüllen, ein nichtverschwindenes Maß haben. Die Gesamtlänge aller Intervalle in 0 ≤ ω1 /ω2 ≤ 1, für die (13.8) nicht gilt, erfüllt die Ungleichung L<2 ∞ X k(ǫ) s=1 s2.5 · s = 2k(ǫ) ∞ X s−1.5 = konst. · k(ǫ) → 0 s=1 für ǫ → 0. (Der Faktor s kommt daher, dass es s verschiedene Werte von m gibt, und der Faktor 2 kommt daher, dass der Ausdruck in den Betragsstrichen in (13.8) positiv oder negativ sein kann.) Dies bedeutet, dass diejenigen Frequenzverhältnisse, für die die ursprüngliche Bewegung auf dem Torus durch die Störung nur leicht verändert wird, ein Maß 1 − konst. · k(ǫ) haben. Für genügend große ǫ werden √ schließlich alle Tori zerstört. Der letzte Torus, der zerstört wird, entspricht der “irrationalsten Zahl” ( 5 − 1)/2. Um die Konvergenz des Ausdrucks für W1 zu begründen, betrachten wir die Summe in (13.7) für einen irrationalen Torus mit den Frequenzen ω1 > 0 und ω2 > 0, die die Bedingung (13.8) erfüllen, und zeigen, dass sie konvergiert. Es ist ω 1 n2 ω1 n2 k(ǫ) |ω1 n1 + ω2 n2 | ≥ |n1 |ω2 − ≥ ω2 − ≥ ω2 ω2 n1 ω2 n1 |n1 |2.5 und folglich X H 1,n in·θ e n6=0 n · ω = = ≤ ≤ n H1,n ein·θ − H1,−n e−in·θ n·ω mit ω·n>0 X 2ℑH1,n ein·θ n·ω n mit ω·n>0 2ℑH1,n ein·θ X n·ω n mit ω·n>0 X 1 2ℑH1,n ein·θ |n1 |2.5 . ω2 k(ǫ) X (13.9) n mit ω·n>0 Das Symbol ℑ steht für den Imaginärteil. Der letzte Term in (13.7) ist klein, wenn das Ergebnis (13.9) multipliziert mit ǫ klein ist. Dies ist der Fall, wenn die Summe konvergiert und k(ǫ) entsprechend gewählt wird. Die Summe konvergiert, wenn die Fourierkomponenten von H1 für große n1 und n2 mindestens wie 1/(n3.5 1 n2 ) abfallen. Wenn sie stärker abfallen, kann statt des Exponenten 2.5 ein größerer Exponent gewählt werden, und wir können für noch mehr Tori zeigen, dass sie nicht zerstört werden. Allgemein versucht man jeweils, die Abschätzungen möglichst gut auf das konkrete System zuzuschneiden. 118 13.5 Was bedeutet das anschaulich? Wir haben gesehen, dass Tori mit rationalen Frequenzverhältnissen, also mit geschlossenen, periodischen Bahnen, durch eine Störung kaputt gemacht werden. Dies können wir uns anschaulich plausibel machen: Eine geschlossene Bahn kommt immer wieder an genau derselben Stelle im Phasenraum vorbei. Dort spürt sie die Störung H1 immer auf die gleiche Weise. Also kann H1 bei jedem Umlauf die Bahn ein Stück weiter in derselben Richtung ablenken. Im Laufe der Zeit addieren sich diese kleinen Änderungen zu einer großen Änderung der Bahn auf. Bei einer quasiperiodischen Bahn ist dies anders, da die Bahn ja nicht immer wieder dieselben Punkte im Phasenraum durchläuft. Wenn die quasiperiodische Bahn jedoch nah an einer periodischen ist, kommt sie mehrfach nahe an demselben Punkt vorbei, bevor sie in andere Bereiche des Phasenraums geht. Je kürzer die Periode der Bahn (also je kleiner s in (13.8)) ist und je stärker die Störung (also je größer ǫ) ist, desto eher schafft die Störung es, auch eine quasiperiodische Bahn stark zu ändern. Dies ist das anschauliche Ergebnis des KAM-Theorems. Wir können dies auch auf unser Sonnensystem anwenden: Wir betrachten die Störung der Bahn eines Objekts A (z.B. ein Asteroid) durch einen Planeten B (z.B. Jupiter). Um die Störung zeitunabhängig zu machen, setzen wir uns in ein Bezugssystem, das mit Jupiter wandert. Aus Sicht dieses Bezugssystem ist der Planet auf einer quasiperiodischen Bahn mit zwei Frequenzen, die sich aus dem Umlaufzeiten von A und B ergeben. Wenn die Umlaufzeiten der beiden Himmelskörper um die Sonne in einem rationalen Verhältnis zueinander stehen, sagen wir 3:1, dann sieht der Asteroid bei jedem dritten Umlauf den Jupiter wieder an derselben Stelle und wird durch ihn in derselben Richtung abgelenkt. Diese kleinen Störungen, die immer in derselben Richtung wirken, können sich über Jahrmillionen soweit aufaddieren, dass der Asteroid aus seiner Bahn geworfen wird. Genau dies ist auch in der Vergangenheit passiert, und man findet im Asteroidengürtel die sogenannten “Kirkwood”-Lücken bei Umlaufzeiten, die in Resonanz mit der Umlaufzeit des Jupiter stehen, wie in diesem Bild gezeigt, das auf der Wikipedia-Seite zum Asteroidengürtel zu finden ist: Auch die Lücken in den Ringen des Saturn kann man so erklären. Dort wo die Lücken sind, steht die Umlaufdauer der Teilchen in einem rationalen Verhältnis (mit niedrigem s) zur Umlaufdauer eines Saturn-Mondes. 119 Aufgaben 1. Betrachten Sie die in den folgenden Teilaufgaben genannten mechanischen Systeme mit zeitunabhängiger Hamiltonfunktion und mit konservativen Kräften und holonomen, skleronomen Zwangsbedingungen (bzw. ohne Zwangsbedingungen), die wir dieses Semester gelöst haben. Finden Sie zu jedem dieser Systeme n Erhaltungsgrößen, die in Involution miteinander stehen. (a) Der Skifahrer (Kapitel 1) (b) Das Teilchen im Kreiskegel (c) Das Rollpendel (d) Das Kepler-Problem (Kapitel 7) 2. Betrachten Sie das Zentralkraftproblem. (a) Diskutieren Sie folgende Behauptung: Die Wirkungsvariablen des Zentralkraftproblems sind gegeben durch I 1 Jϕ = pϕ dϕ = pϕ 2π und Jr = mit Vef f (r) = p2ϕ 2mr 2 1 2π I pr dr = 1 π Z rmax rmin q 2m(E − Vef f (r))dr + V (r). (b) Eigentlich ist n = 3 für das Zentralkraftproblem. Wo bleibt die dritte Dimension und die dritte Wirkungsvariable? (c) Berechnen Sie für das Kepler-Problem explizit Jr als Funktion von E. Ermitteln Sie daraus den Zusammenhang E(Jr , Jϕ ), und aus diesem die Frequenzen ωr und ωϕ . Wie interpretieren Sie das Ergebnis ωr = ωϕ ? 120 Kapitel 14 Das Entstehen von Chaos: Poincaré-Birkhoff-Theorem und gekickter Rotator 14.1 Instabile Tori und das Poincaré-Birkhoff-Theorem Was passiert, wenn Tori zerstört werden? Hierauf gibt das Poincaré-Birkhoff-Theorem (1935) eine Antwort. Wir betrachten wieder den Fall n = 2, in dem die Tori zweidimensional sind, und wir konzentrieren uns auf die Umgebung eines rationalen Torus. Wir werden zeigen, dass der ursprüngliche rationale Torus beim Einschalten der Störung in kleinere Tori zerfällt. Zwischen diesen Tori ist die Bewegung vollständig irregulär. Dies lässt sich am besten mit einer Poincaré-Abbildung veranschaulichen. Wir legen in Gedanken ein Blatt Papier durch den Torus, so dass ein Schnitt in Form eines Kreises entsteht. (Einen Kreis gibt es, solange wir H1 = 0 wählen.) Wir betrachten eine Trajektorie auf diesem Torus. In Zeitabständen T2 = 2π/ω2 kommt die Trajektorie durch unsere Schnittebene durch. Jedes Mal ist sie um einen Winkel T2 · ω1 versetzt. Wir erhalten also eine Folge von Durchstoßpunkten der Trajektorie durch unsere Schnittebene. Wenn der Torus rational ist (ω1 /ω2 = m/s), dann ist der Durchstoßpunkt Nummer s + 1 identisch mit Nummer 1. Für irrationale Tori überdecken im Lauf der Zeit die Durchstoßpunkte den Kreis. Nun betrachten wir nicht nur einen Torus, sondern alle Tori innerhalb eines gewissen Intervalls von Werten der Wirkungsvariablen. In der Schnittebene bilden diese Tori dann einen konzentrischen Satz von Kreisen, deren Radius kontinuierlich von der Wirkungsvariablen J1 abhängt. Die Abfolge von Durchstoßpunkten einer Trajektorie durch die Schnittebene können wir in Polarkoordinaten durch eine diskrete Abbildung M darstellen, die definiert ist durch die beiden Beziehungen ri+1 = ri = r(t = i · θi+1 = θi + 2π 2π ) ω2 ω1 = θi + 2πα(r) . ω2 (14.1) Für ein rationales Verhältnis α ≡ (ω1 /ω2 ) = m/s ist jeder Punkt auf dem Kreis ein Fixpunkt der s-fach iterierten Abbildung M s . Nun addieren wir eine Störung ǫH1 . Weil wir wieder ǫ als klein betrachten, können wir die geänderte Abbildung, die wir mit Mǫ bezeichnen, durch eine Taylorentwicklung bis zur ersten Ordnung in ǫ nähern: ri+1 = ri + ǫf (ri , θi ) θi+1 = θi + 2πα(ri ) + ǫg(ri , θi ) . 121 (14.2) Weil wir von einem stetigem H1 ausgehen, nehmen wir auch an, dass f und g stetige Funktionen sind. Was können wir über die Fixpunkte von (Mǫ )s sagen? Um dies zu diskutieren, untersuchen wir den Fall, dass α(r) stetig mit r anwächst. (Der umgekehrte Fall, dass α(r) stetig mit r abfällt, lässt sich ganz analog behandeln.) Dazu betrachten wir zunächst alle Punkte mit demselben Winkel θi und verschiedenem Radius ri . Diejenigen mit einem kleinen ri (so dass α(ri ) < m/s ist) werden von der Abbildung M s im Uhrzeigersinn gedreht (θi+1 < θi ), während diejenigen mit einem großen ri (so dass α(ri ) > m/s ist) von der Abbildung M s gegen den Uhrzeigersinn gedreht werden (θi+1 > θi ). Diejenigen mit dem Radius, der zu α(ri ) = m/s gehört, werden auf sich selbst abgebildet. Wenn die Störung eingeschaltet wird (und damit M s durch (Mǫ )s ersetzt wird), werden für genügend kleine ǫ ebenfalls die Punkte (ri , θi ) zu kleineren ri im Uhrzeigersinn gedreht, während die Punkte zu genügend großen ri gegen den Uhrzeigersinn gedreht werden. Im Gegensatz zur ungestörten Abbildung kann sich hierbei der Radius ändern. Irgendwo zwischen den kleinen und großen ri muss es einen Punkt (Rǫ (θi ), θi ) geben, der unter der Abbildung (Mǫ )s seinen Winkel erhält. Dieses Argument gilt für jeden Winkel θi , so dass es für jeden Winkel θi einen solchen Punkt gibt, dessen Winkel sich unter (Mǫ )s nicht ändert. Also gibt es eine geschlossene Kurve von Punkten, die unter (Mǫ )s ihren Winkel nicht ändern (siehe Abb. 14.1). Nun betrachten wir diese Kurve samt der s Mε(Rε) Rε Abbildung 14.1: Die Kurve Rǫ derjenigen Punkte, die unter der Abbildung (Mǫ )s nicht ihren Winkel ändern, und die Kurve (Mǫ )s (Rǫ ). Kurve (Mǫ )s (Rǫ ). Diese beiden Kurven können nicht identisch sein, da dies ja bedeuten würde, dass der rationale Torus nicht zerstört wird. Beide Kurven müssen dieselbe Fläche einschließen. Daraus folgt, dass sie sich an einer geraden Anzahl von Stellen schneiden. Die Schnittpunkte, die auf beiden Kurven Rǫ und (Mǫ )s (Rǫ ) liegen, sind Fixpunkte von (Mǫ )s . Wir betrachten nun die Umgebung dieser Schnittpunkte: (Abb.14.2). Man sieht, dass abwechselnd elliptische Fixpunkte (Zentren) und hyperbolische Fixpunkte Abbildung 14.2: Man erhält abwechselnd elliptische und hyperbolische Fixpunkte. (Sattelpunkte) auftreten. Um einen elliptischen Fixpunkt gibt es geschlossene Trajektorien. Dies bedeutet, 122 dass der elliptische Fixpunkt von Tori umgeben ist. Wir haben also folgendes Szenario: Durch das Einschalten einer Störung ǫH1 werden alle rationalen Tori zerstört. Ein Torus des Frequenzverhältnisses m/s war in der diskreten Abbildung, die wir betrachtet haben, ein Ring, auf dem alle Punkte die Periode s haben. Nach Zerstörung des Torus gibt es noch (mindestens) eine stabile Trajektorie der Periode s und eine instabile Trajektorie der Periode s. Um jeden Punkt der stabilen Trajektorie gibt es einen neuen Satz von Tori. Hier können wir nun das KAMTheorem und das Poincaré-Birkhoff-Theorem wieder anwenden: In dem Satz von neuen Tori darf es auch keine rationalen Tori geben. Statt ihrer gibt es eine stabile und eine instabile periodische Trajektorie. Um die Punkte der stabilen Trajektorie gibt es wieder Tori, aber die rationalen Tori sind auch hier zerstört und durch weitere stabile und instabile Trajektorien ersetzt, etc... Wir erhalten also eine selbstähnliche Struktur, die auf allen Skalen zu finden ist. Zum Schluss diskutieren wir noch die Rolle der hyperbolischen Fixpunkte. Die Trajektorien, die in ihrer Nähe beginnen, werden von ihnen abgestoßen. Aber sie können nicht sehr weit wandern, da sie in radialer Richtung zwischen den benachbarten nicht zerstörten Tori eingesperrt sind und in tangentialer Richtung den elliptischen Fixpunkten nicht zu nahe kommen können. In der Umgebung der hyperbolischen Fixpunkte bewegen sich die Trajektorien chaotisch und füllen den ihnen zugänglichen Phasenraum aus. Um einen genaueren Eindruck von den Trajektorien in der Nähe der hyperbolischen Fixpunkte zu bekommen, betrachten wir die zu diesem Fixpunkt gehörige stabile und instabile Mannigfaltigkeit. Die stabile Mannigfaltigkeit ist die Linie all derjenigen Punkte, die unter der Iteration in den Fixpunkt hineinlaufen. Die instabile Mannigfaltigkeit sind all diejenigen Punkte, die unter einer Rückwärtsiteration in den Fixpunkt laufen. Man kann diese Mannigfaltigkeiten dadurch konstruieren, dass man mit demjenigen Teil der Mannigfaltigkeit beginnt, der sich in unmittelbarer Nähe (zum Beispiel innerhalb eines Abstands ǫ) des Fixpunktes befindet. Unter wiederholter Vorwärtsiteration (bzw. Rückwärtsiteration) aller Punkte auf diesem Linienstück erhält man dann die instabile (bzw. stabile) Mannigfaltigkeit. Eine Mannigfaltigkeit kann sich nicht selbst schneiden, denn sonst hätte ein Punkt ja zwei Vorgänger bzw. Nachfolger, was bei einer deterministischen Dynamik nicht möglich ist. Die instabile Mannigfaltigkeit kann unter Vorwärtsiteration entweder in der Nähe des Fixpunktes bleiben oder auf einen benachbarten Fixpunkt zulaufen. Im ersten Fall schneidet sie irgendwann die stabile Mannigfaltigkeit des eigenen Fixpunktes. Man nennt einen solchen Schnittpunkt einen homoklinen Punkt. Wenn es einen Schnittpunkt gibt, gibt es aber unendlich viele. Der Grund ist, dass sich der Schnittpunkt unter der Iteration wieder auf einen Schnittpunkt abbildet. Dies kann nicht derselbe Schnittpunkt sein, da wir sonst eine periodische Bahn hätten, was im Wiederspruch damit ist, dass jeder Punkt der Mannigfaltigkeiten unter einer Vorwärts(bzw. Rückwärts-) Iteration in den hyperbolischen Fixpunkt läuft. Es gibt also eine unendliche Folge von Schnittpunkten, die sich in beiden Iterationsrichtungen dem Fixpunkt nähern. Abb. 14.3 zeigt den qualitativen Verlauf der beiden Mannigfaltigkeiten. Wenn die instabile Mannigfaltigkeit eines Fixpunk1 2 3 H 0 Abbildung 14.3: Die stabile und instabile Mannigfaltigkeit eines hyperbolischen Fixpunktes H, wenn sie sich schneiden. Der Schnittpunkt 0 der beiden Mannigfaltigkeiten und die ersten drei seiner vorwärts Iterierten sind gekennzeichnet. 123 tes unter Vorwärtsiteration auf einen benachbarten Fixpunkt zuläuft, schneidet sie sich irgendwann mit der stabilen Mannigfaltigkeit des Nachbarfixpunktes. In diesem Fall spricht man von einem heteroklinen Punkt, und es gibt ebenfalls unendlich viele Schnittpunkte. Diese Überlegungen zeigen uns, dass chaotische Bereiche in der Umgebung hyperbolischer Fixpunkte auftreten. Dies passt sehr gut mit unserer Beobachtung im letzten Kapitel zusammen, dass Phasenraumbereiche, die hyperbolische Fixpunkte enthalten, nicht integrabel sind. Das Poincaré-Birkhoff-Theorem zeigt uns nun, dass es in dem durch H0 + ǫH1 beschriebenen System keinen Bereich im Phasenraum gibt, in dem es keinen hyperbolischen Fixpunkt gibt. Denn beliebig nah an einem irrationalen Torus befinden sich immer auch rationale Tori... Also gibt es für ein nicht integrables System keine stückweise stetig differenzierbare erzeugende Funktion W (q, P ), die eine globale Transformation des Phasenraums auf eine freie Bewegung macht. Was wir (im Poincaré-Schnitt) als hyperbolische Fixpunkte identifiziert haben, sind im kontinuierlichen System instabile periodische Bahnen. Chaotische Bereiche sind dicht von solchen instabilen periodischen Bahnen durchsetzt. Wir haben in Kapitel 11 gesehen, dass in der Nähe eines hyperbolischen Fixpunktes (und analog in der Nähe einer instabilen periodischen Bahn) der Abstand einer Trajektorie zu diesem Fixpunkt exponenziell in der Zeit anwächst, wenn man längs der instabilen Eigenrichtung herausläuft. Dies ist letztlich die Ursache für die fundamentale Eigenschaft chaotischer Bewegung, dass sich benachbarte Trajektorien exponenziell schnell voneinander entfernen, solange ihr Abstand klein ist. 14.2 Beispiel: Der gekickte Rotator Das Standardbeispiel für Hamiltonsches Chaos ist der gekickte Rotator. Dies ist ein rotierender Stab der Länge l und des Trägheitsmoments I, der an einem Ende reibungsfrei gelagert ist. Wenn keine Kraft auf ihn wirkt, rotiert er also mit konstanter Winkelgeschwindigkeit θ̇. Der frei rotierende Stab liegt daher mit der Winkelvariablen θ und der Wirkungsvariablen pθ (Drehimpuls) schon automatisch in der durch die Hamilton-Jacobi-Gleichung angestrebten einfachen Form einer freien Bewegung vor. Nun gibt man dem Stab zu Zeiten t = τ, 2τ, . . . einen Stoß der Impulsstärke K/l in einer vorgegebenen Richtung. Die Hamiltonfunktion lautet H(pθ , θ, t) = X p2θ + K cos θ δ(t − nτ ) , 2I n wobei der erste Tern die kinetische Energie aufgrund der Rotationsbewegung ist und der zweite Term dafür sorgt, dass der Drehimpuls zu Zeiten nτ durch die Stöße jeweils eine Änderung um den Wert K sin θ bekommt, wie die Bewegungsgleichungen zeigen: dpθ dt dθ dt = K sin θ X δ(t − nτ ) n = pθ . I (14.3) Der Drehimpuls pθ ändert sich also diskontinuierlich zu den Zeiten nτ , wobei der Kraftstoß in +x-Richtung geht, so dass die Drehimpulsänderung für θ = ±π am größten ist. Dies ist eigentlich kein System mit zeitunabhängigem Hamilton-Operator, wie wir sie die ganze Zeit betrachtet haben. Doch diese Art von zeitabhängiger Störung ist die einfachste Art, Chaos in möglichst niedrigen Dimensionen zu erzeugen. Wenn wir das System immer nur zu diskreten Zeiten betrachten (wie bei einer Beobachtung mit dem Stroboskop), bekommen wir dasselbe Szenario, wie wenn wir durch einen zweidimensionalen Torus eines zeitunabhängigen Systems einen Poincaré-Schnitt machen. Wir gehen also von den kontinuierlichen Gleichungen zu einer diskreten Abbildung über. Seien pn und θn der Drehimpuls und der Winkel unmittelbar nach dem n-ten Stoß. Integration der Gleichungen (14.3) 124 über den Stoß und die Vereinfachung τ /I = 1 gibt pn+1 − pn θn+1 = = K sin θn+1 (θn + pn ) mod 2π . (14.4) Diese diskrete Abbildung nennt man oft die Standardabbildung. Die Fläche im Phasenraum bleibt unter dieser Abbildung erhalten, denn es ist ∂θn+1 /∂θn ∂θn+1 /∂pn 1 1 det = det = 1. ∂pn+1 /∂θn ∂pn+1 /∂pn K cos θn+1 1 + K cos θn+1 Die nächsten drei Abbildungen zeigen die Trajektorien der Standardabbildung für verschiedene Werte des Parameters K. Der Anfangswert der Impulse wurde immer im Intervall [0, 2π[ gewählt. Da die Impulse sich auch aus diesem Intervall herausbewegen (um so weiter, je größer K ist), haben wir in den Abbildungen immer p mod 2π aufgetragen. Für K = 0 ist das System integrabel, und man sieht nur reguläre Tori, die sich als waagrechte Bänder durch das Bild ziehen. Mit zunehmendem K zerfallen immer mehr Tori und gibt es immer größere chaotische Regionen. Bei K ≃ 0.97 zerfällt der letzte ursprüngliche Torus. Für genügend große K füllt vermutlich eine einzige Trajektorie den ganzen Phasenraum gleichmäßig aus. 14.3 Konsequenzen aus der Existenz von Chaos Wir haben also gesehen, dass ein nichtverschwindender Anteil des Phasenraums mechanischer Systeme, die nicht die strengen Bedingungen für Integrabilität erfüllen, aus chaotischen Trajektorien besteht. Chaos zeichnet sich dadurch aus, dass benachbarte Trajektorien exponentiell schnell in der Zeit auseinanderlaufen, was dazu führt, dass kleinste Veränderungen der Anfangsbedingungen schon nach recht kurzer Zeit zu völlig verschiedenem Bahnverlauf führen. Da Anfangsbedingungen prinzipiell nur mit endlicher Genauigkeit festgelegt oder gemessen werden können, sind chaotische Systeme nur über einen begrenzten Zeithorizont vorhersagbar. Diese Erkenntnis kam seit den 1960er Jahren, als man anfing, Bewegungsgleichungen mit den ersten Computern zu integrieren. Doch es dauerte noch 20 Jahre, bis klar wurde, ein wie generelles und weit verbreitetes Phänomen Chaos ist. Die Erforschung chaotischer Dynamik ist auch heute ein sehr aktives Forschungsgebiet, auf dem wegen der schwierigen mathematischen Beschreibung und der Vielfalt der Phänomene immer noch viele neue Erkenntnisse gewonnen werden können. Als Fazit sei ein Abschnitt aus dem Buch “The Transition to Chaos” von Linda Reichl (S. 3) zitiert, der 300 Jahre nach der Veröffentlichung von Newtons principia eine Bilanz im Lichte der Erkenntnisse der Chaostheorie zieht: “The belief that Newtonian mechanics is a basis for determinism was formally laid to rest by Sir James Lighthill in a lecture to the Royal Society on the three hundredth anniversary of Newton’s Principa. In his lecture Lighthill says . . . I speak . . . once again on behalf of the global fraternity of practitioners of mechanics. We are all deeply conscious today that the enthusiasm of our forebears for the marvelous achievements of Newtonian mechanics led them to make generalizations in this area of predictability which, indeed, we may have generally tended to believe before 1960, but which we now recognize were false. We collectively wish to apologize for having misled the general educated public by spreading ideas about the determinism of systems satisfying Newton’s laws of motion that, after 1960, were proved incorrect. . . ” 125 Abbildung 14.4: Trajektorien der Standardabbildung für K = 0, 0.3, 0.6 (von oben nach unten). 126 Abbildung 14.5: Trajektorien der Standardabbildung für K = 0.8 und 0.97 (von oben nach unten). Die mittlere Abbildung ist ein Zoom in die für K = 0.8. 127 Abbildung 14.6: Trajektorien der Standardabbildung für K = 1.6, 2.5 und 5 (von oben nach unten). Die dritte Abbildung zeigt eine der beiden einzigen Inseln. 128 Downloaded from rspa.royalsocietypublishing.org on January 2, 2012 The Royal Society is collaborating with JSTOR to digitize, preserve, and extend access to Proceedings of the Royal Society of London. Series A, Mathematical and Physical Sciences. ® www.jstor.org Downloaded from rspa.royalsocietypublishing.org on January 2, 2012 Downloaded from rspa.royalsocietypublishing.org on January 2, 2012 Downloaded from rspa.royalsocietypublishing.org on January 2, 2012 Downloaded from rspa.royalsocietypublishing.org on January 2, 2012 Downloaded from rspa.royalsocietypublishing.org on January 2, 2012 Downloaded from rspa.royalsocietypublishing.org on January 2, 2012 Downloaded from rspa.royalsocietypublishing.org on January 2, 2012 Downloaded from rspa.royalsocietypublishing.org on January 2, 2012 Downloaded from rspa.royalsocietypublishing.org on January 2, 2012 Downloaded from rspa.royalsocietypublishing.org on January 2, 2012 Downloaded from rspa.royalsocietypublishing.org on January 2, 2012 Downloaded from rspa.royalsocietypublishing.org on January 2, 2012 Downloaded from rspa.royalsocietypublishing.org on January 2, 2012 Downloaded from rspa.royalsocietypublishing.org on January 2, 2012 Downloaded from rspa.royalsocietypublishing.org on January 2, 2012