Skript zur Vorlesung Theoretische Physik I (Mechanik) von Volker Meden gehalten im Sommersemester 2014 an der RWTH Aachen 7. August 2014 2 Inhaltsverzeichnis 1 Eine kurze Einführung 5 2 Newtonsche Mechanik Teil II 2.1 Das Zweikörperproblem . . . . . . . . . . . . . . . . . . . . . . . 2.2 Bewegte Bezugssysteme . . . . . . . . . . . . . . . . . . . . . . . 2.3 Der starre Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 22 33 3 Lagrangesche Mechanik 3.1 Systeme mit Zwangsbedingungen . . . . 3.2 Lagrangegleichungen 2. Art . . . . . . . 3.3 Lagrangegleichungen 1. Art . . . . . . . 3.4 Nochmal die Lagrangegleichungen 2. Art 3.5 Das Prinzip der kleinsten Wirkung . . . 3.6 Symmetrien und Erhaltungssätze . . . . . . . . . . 53 55 56 63 66 69 74 4 Schwingungen und Saiten 4.1 Kleine Schwingungen . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Schwingende Saiten . . . . . . . . . . . . . . . . . . . . . . . . . . 85 85 90 5 Hamiltonsche Mechanik 5.1 Variable, Bewegungsgleichungen 5.2 Die Poissonklammern . . . . . . 5.3 Kanonische Transformationen . 5.4 Die Hamilton-Jacobi-Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 . 96 . 101 . 105 . 112 6 Grundzüge der relativistischen Mechanik 6.1 Die Lorentztransformation . . . . . . . . . 6.2 Die Kovarianz . . . . . . . . . . . . . . . . 6.3 Masse, Vierergeschwindigkeit und -impuls 6.4 Die Kraft in der relativistischen Mechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 und. . . . . . . . . . . . . . . . . . . 115 116 123 127 130 4 INHALTSVERZEICHNIS Kapitel 1 Eine kurze Einführung Zum Verständnis der Vorlesung Theoretische Physik I ist es nahezu unerläßlich, den Inhalt der Vorlesung Einführung in die Theoretische Physik verinnerlicht zu haben. Dies gilt sowohl für die in letzterer behandelten mathematischen Methoden, als auch die Grundlagen der Newtonschen Mechanik. Zur Vorbereitung auf den neuen Stoff rate ich ihnen, die Kapitel 3.5 und 3.6 der letztsemestrigen Vorlesung nocheinmal durchzuarbeiten. In der vorliegenden Vorlesung werden wir zunächst die in der Einführungsvorlesung noch nicht behandelten Kapitel der Newtonschen Mechanik präsentieren, nämlich das Zweikörperproblem, bewegte Bezugssysteme und den starren Körper. Im Anschluß gehen wir zur Lagrangschen Mechanik – deren fundamentale Bewegungsgleichungen wir bereits kennen gelernt haben – und zur Hamiltonschen Mechanik über. Den Abschluß der Vorlesung bildet ein kurzes Kapitel über die Grundzüge der relativistischen Mechanik. Mit Ausnahme der so genannten Variationsrechnung, die wir zu Beginn des Kapitels über Lagrangesche Mechanik einführen werden, und relativ elementaren Überlegungen zur analytischen Geometrie von Ellipsen und Hyperbeln haben wir alle zum Verständnis der Physik notwendingen mathematischen Methoden in der Vorlesung zur Einführung in die Theoretische Physik bereits kennengelernt, so daß in der Vorlesung Theoretische Physik I die Physik im Vordergrund stehen wird. Wie sie sehen werden, wird ihr Abstraktionsvermögen im Laufe der Vorlesung zunehmend herausgefordert, aber gleichzeitig auch geschult. Es bietet sich an, die neuen Herangehensweisen an die klassische Mechanik zunächst an ihnen bereits vertrauten mechanischen Problemen “auszuprobieren”, auch wenn dabei die Vorteile der neuen Verfahren – die meist für komplexere Probleme entwickelt wurden – nicht immer offensichtlich werden. Sollten wir in der Vorlesung bzw. den zugehörigen Übungen dieser Philosophie nicht folgen, so bietet es sich an, bekannte Probleme zuhause durchzurechnen. In der Vorlesung werden wir uns nach und nach grundsätzlichen Prinzipien der (theoretischen) Physik nähern, wie z.B. dem Extremalprinzip und dem Zu5 6 KAPITEL 1. EINE KURZE EINFÜHRUNG sammenhang zwischen Symmetrien und Erhaltungsgrößen. Eine allgemeine Formulierung dieser erfordert dabei erneut ein höheres Maß an Abstraktion als ihnen bisher begegnet ist, bringt aber entsprechende Vorteile und kann schon in dieser Vorlesung, aber auch in den Vorlesungen der theoretischen Physik späterer Semester, gewinnbringend eingesetzt werden. Kapitel 2 Newtonsche Mechanik Teil II 2.1 Das Zweikörperproblem Aufbauend auf unsere Überlegungen zur Bewegung eines Teilchens in einem zweidimensionalen, konservativem Zentralfeld (siehe Kapitel 3.6 der Vorlesung Einführung in die Theoretische Physik) wollen wir jetzt das “berühmte” Zweikörperproblem mit 1/r-Paarpotential (im Dreidimensionalen) diskutieren. Es spielte in der Entwicklung der Mechanik eine zentrale Rolle (Bewegung eines Planeten um die Sonne). Wir gehen davon aus, daß sich die Kräfte, die die beiden Teilchen mit Massen m1 und m2 aufeinander ausüben aus einem Zweiteilchenpotential v(|~r1 − ~r2 |) ableiten lassen. Damit gelten die Newtonschen Bewegungsgleichungen ~ ~r1 v ; , m1~r¨1 = −∇ ~ ~r2 v = ∇ ~ ~r1 v . m2~r¨2 = −∇ Die Addition der beiden Gleichungen liefert für den Schwerpunkt ~ = (m1~r1 + m2~r2 )/M , R mit der Gesamtmasse M = m1 + m2 die Bewegungsgleichung ~¨ = 0 , MR d.h. der Schwerpunkt bewegt sich geradlinig und gleichförmig. Eine zweite Bewegungsgleichung für den Relativvektor ~r = ~r1 − ~r2 erhält man, indem man die erste Gleichung im obigen Gleichungssystem mit m2 und die zweite mit m1 multipliziert und anschließend subtrahiert ~ r|) . µ~r¨ = −∇v(|~ Dabei bezeichnet µ = m1 m2 /M die so genannte reduzierte Masse. 7 8 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II Als Folge dieser Überlegungen haben wir das Zweiteilchenproblem auf die Bewegung eines Teilchens der Masse µ im externen Zentralpotential v(|~r|) zurück geführt. Die Bewegungsgleichung für die Relativkoordinate läßt sich nun auf den in Kapitel 3.6 der letztsemestrigen Vorlesung behandelten Fall der Bewegung eines Teilchens in zwei Dimensionen reduzieren, da das zum Potential gehörende Kraftfeld ~ r|) = −v 0 (r) ~rˆ −∇v(|~ ein Zentralfeld ist (Richtung der Kraft ist ~rˆ). Wie wir gesehen haben, ist für solche der (relative) Drehimpuls ~lrel = µ ~r × ~r˙ erhalten d d~lrel = µ (~r × ~r˙ ) = µ ~r × ~r¨ = 0 . dt dt Wie im letzten Semester diskutiert liegt damit jede Bahnkurve in einer Ebene, die senkrecht zu ~lrel ist. Wie üblich wählen wir unser Koordinatensystem so, daß ~lrel entlang der x3 -Achse zeigt und die Bewegung ist auf eine zweidimensionale in der x1 -x2 -Ebene reduziert. Folgend werden wir am Fall des Gravitationspotentials ∝ 1/r interessiert sein. Wir werden jedoch zuvor diskutieren, daß sich unter gewissen Annahmen an das Potential bereits wichtige Aussagen treffen lassen, ohne die Bewegungsgleichung explizit zu lösen. Die beiden Überlegungen scheinen ihnen vielleicht zunächst als abstrakt, sind aber von großer Nützlichkeit auch über die klassische Mechanik hinaus. Mechanische Ähnlichkeit: Wir betrachten ein Kraftfeld F~ (~r) mit der Eigenschaft F~ (α~r) = αk F~ (~r) für alle α > 0. Man nennt eine Funktion mit dieser Eigenschaft eine homogene Funktion. Typische Beispiele sind das Gravitationsfeld (in drei Dimensionen) mit k = −2 und ein d-dimensionaler, isotroper (alle Raumrichtungen sind äquivalent) harmonischer Oszillator mit k = 1. Sei nun ~r(t) eine Lösung der Newtonschen Gleichung, d.h. von m~r¨(t) = F~ (~r(t)). Durch eine so genannte Skalentransformation mit dem Faktor α > 0 ändern wir die räumliche Ausdehnung der Bahn ~r → α~r. Zum Beispiel wird aus einer Kreisbahn mit Radius r0 eine mit Radius αr0 . Wir zeigen nun, daß man durch Umskalieren der Zeit eine neue Lösung der Newtonschen Gleichung erhalten kann. Wir setzen für die umskalierte Zeitvariable τ = α−ν t und legen ν später so fest, daß sich eine neue Lösung mit ~rα (τ ) = α~r(t) = α~r(αν τ ) 2.1. DAS ZWEIKÖRPERPROBLEM 9 ergibt. Differentiation dieser Gleichung nach τ liefert m d2~rα (τ ) ~ − F (~rα (τ )) = α2ν+1 m~r¨(t) − αk F~ (~r(t)) . dτ 2 Setzt man nun 2ν + 1 = k , so veschwindet nach der Voraussetzung an das Kraftfeld die rechte Seite und ~rα (τ ) ist ebenfalls Lösung der Newtonschen Gleichung. Damit gilt τ = α(1−k)/2 . (2.1) t Betrachten wir nun eine beliebige geschlossene Bahn mit einer Umlaufzeit T (in den “unskalierten” Variablen). Gemäß der folgenden Skizze habe sie die Ausdehnung L. Die skalierte Bahn hat dann die Ausdehnung L̃ mit α = L̃/L. Nach Gl. (2.1) gilt für die Umlaufzeit T̃ der skalierten Bahn !(1−k)/2 L̃ T̃ = α(1−k)/2 = . T L L ~ L Für den Fall des Gravitationspotenials mit k = −2 folgt dann !3/2 !2 !3 T̃ L̃ T̃ L̃ = ⇒ = T L T L bzw. in Worten: Die Quadrate der Umlaufzeiten zweier Bahnen verhalten sich wie die Kuben der Abstände. Dies ist bereits eine Form des dritten Keplerschen Gesetzes, welches ihnen sehr wahrscheinlich in der Vorlesung zur Experimentalphysik I im letzten Semester begegnet ist. Wir werden darauf zurückkommen. Für den d-dimensionalen, isotropen Oszillator mit k = 1 folgt !0 T̃ T̃ L̃ = ⇒ =1, T L T also die uns bereits bekannte Unabhängigkeit der Schwingungsdauer von der Auslenkung. Man könnte die Logik nun auch umdrehen und aus dem experimentell bestimmten Exponenten β (z.B. Planetenbahnen) in !β T̃ L̃ = T L 10 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II auf den Exponenten k der Kraft schließen (bei Planetenbahnen k = −2). Diese Schlußweise ist von historischer Bedeutung (Newton). Der Virialsatz: Wir betrachten die Bewegung eines Teilchens in einem konservativen Kraftfeld, wobei wir annehmen, daß das Potential V (~r) eine homogene Funktion (α > 0) V (α~r) = αkV V (~r) ist. In diesem Fall existiert ein einfacher Zusammenhang zwischen dem Zeitmittelwert der potentiellen und der kinetischen Energie, falls die Bewegung in einem beschränkten Raumgebiet verläuft. Um diesen zu beleuchten, definieren wir zunächst, was wir unter dem zeitlichen Mittelwert verstehen wollen. Er ist für eine Funktion f (t) definiert als Z 1 t f (t0 ) dt0 . f = lim t→∞ t 0 Mittelung der Relation d ˙ ~ m ~r · ~r = m~r˙ 2 + m~r · ~r¨ = 2T − ~r · ∇V dt liefert unter der Annahme, daß ~r(t) · ~r˙ (t) beschränkt ist ~ = lim m ~r(t) · ~r˙ (t) − ~r(0) · ~r˙ (0) = 0 . 2T − ~r · ∇V t→∞ t ~ über den Für ein homogenes Potential läßt sich nun der Mittelwert von ~r · ∇V kV Mittelwert von V ausdrücken. Differentiation von V (α~r) = α V (~r) nach α liefert für α = 1 ~ = kV V (~r) ~r · ∇V und damit folgt der Virialsatz 2T = kV V . Man kann diesen Zusammenhang sehr leicht auf mehrere Teilchen, die über homogene Zweiteilchenpotentiale wechselwirken, verallgemeinern. Aus der Energieerhaltung folgt T + V = E und damit 2 E, kV + 2 kV T = E. kV + 2 V = 2.1. DAS ZWEIKÖRPERPROBLEM 11 Für das Gravitationspotential (Keplerproblem) mit kV = −1 folgt so V = 2E und T = −E. Für den d-dimensionalen, isotropen Oszillator mit kV = 2 ergibt sich T = V = E/2. Nach diesen sehr allgemeinen Überlegungen kommen wir nun zur Diskussion des Zweikörperproblems mit dem Gravitationspotential. Die Keplerschen Gesetze: Besonders wichtige Zentralfelder, bei denen die potentielle Energie wie 1/r geht, die Kraft also wie 1/r2 abfällt, sind das Newtonsche Gravitationsfeld (vermittels der Masse eines Teilchens) und das elektrostatische Coulombfeld (vermittels der elektrischen Ladung eines Teilchens). Ersteres ist immer anziehend, während das Coulombpotential sowohl anziehend, als auch abstoßend sein kann. Wir bezeichnen die Masse zunächst wieder mit m, werden sie dann aber später durch die reduzierte Masse µ ersetzen. Zur Herleitung der Keplerschen Gesetze (der Planetenbewegung) betrachten wir den anziehenden Fall mit V (r) = −α/r, α > 0. Das effektive Potential ist dann Veff (r) = − l2 α + . r 2mr2 (2.2) Die Position r0 des Minimums des effektiven Potentials ergibt sich durch Ableiten und Nullsetzen zu (l 6= 0) r0 = l2 αm und der Wert des Potentials V0 am Minimum damit zu Veff (r0 ) = V0 = − α2 m α =− . 2 2l 2r0 Damit folgt Veff (r) r0 1 r0 2 =− + . 2|V0 | r 2 r Für l 6= 0 hat das effektive Potential die folgend skizzierte Form. (2.3) 12 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II Veff/(2 |V0|) 2 Drehimpulsbarriere 0 E -2 0 1 2 3 r/r0 Wir beginnen die Diskussion der Dynamik mit dem einfachen Spezialfall der Kreisbewegung mit Radius r0 und der kleinen Abweichung von dieser. Ist der Abstand des Teilchens vom Ursprung für alle Zeiten gleich r0 , so liegt eine Kreisbahn vor. Nach den Überlegungen aus Kapitel 3.6 der Vorlesung des letzten Semesters (Seiten 173/174 des Skripts) gilt für die Umlaufzeit T = Tφ (mit φ(T + t0 ) − φ(t0 ) = 2π) T = 2π Mit Gl. (2.3) folgt l = √ mr02 . l αmr0 und damit r m 3/2 T = 2π r , α 0 d.h. das bereits oben zitierte dritte Keplersche Gesetz für den Spezialfall der Kreisbewegung. Um eine kleine Abweichung von der Kreisbewegung zu untersuchen, benötigen wir die zweite Ableitung von Veff an der Stelle r0 (siehe die allgemeine Diskussion in Kapitel 3.6 der Vorlesung des letzten Semesters). Es gilt 00 Veff (r0 ) 2α 3l2 l2 = . =− 3 + r0 mr04 mr04 Das ergibt die Frequenz r ωr = 00 Veff (r0 ) |l| = m mr02 der Radialbewegung. Somit sind im vorliegenden Fall die Frequenzen der Radialund der Winkelbewegung (bei kleiner Abweichung von der Kreisbewegung) gleich, 2.1. DAS ZWEIKÖRPERPROBLEM 13 da auch ωφ = |l|/(mr02 ) gilt (siehe Seite 174 des Skripts des letzten Semesters). Somit schließt die Bahnkurve bereits nach einer Umdrehung. Wir zeigen im Folgenden, daß dieses Ergebnis nicht nur für kleine Abweichungen von der Kreisbewegung gilt, sondern für den hier betrachteten Fall des Gravitationspotentials ∝ 1/r und −|V0 | ≤ E < 0, also finite Bewegungen, allgemeingültig ist. Um die allgemeine finite Trajektorie zu diskutieren, betrachten wir die Gleichung Z r l p dr0 φ − φmin = ± 02 0 )] r 2m[E − V (r r eff Z min r l p = ± dr0 , 02 0 2 02 2m[E + α/r − l /(2mr )] rmin r die wir im vergangenen Semester hergeleitet haben (siehe Seite 176 des Skripts). Dabei bezeichnet φmin den zum minimalen Abstand der Bahn vom Ursprung rmin gehörenden Winkel. Nach der Substitution u = 1/r0 ergibt sich (“dr0 = −du/u2 ”) Z 1/r √ φ − φmin = ∓ 1/rmin l 1 p du . 2m E + αu − (l2 /[2m])u2 Den Ausdruck in der u-abhängigen Wurzel bringen wir durch quadratische Ergänzung auf die Form E0 − l2 l2 2 l2 l2 2 (u − u0 )2 = E 0 − u + uu0 − u , 2m 2m m 2m 0 woraus sich u0 = α2 m 1 αm 0 ; E = E + = = E + |V0 | ≥ 0 l2 r0 2l2 ergibt. Nach der Substitution v = u − u0 folgt (l > 0) Z 1/r−1/r0 φ − φmin = ∓ 1/rmin −1/r0 1 p 2mE 0 /l2 − v 2 Z 1/r−1/r0 dv = ∓ 1/rmin −1/r0 1 √ dv A2 − v 2 mit A2 = 2m 2mE 0 = 2 |V0 |(1 + E/|V0 |) = (1 + E/|V0 |)/r02 ≥ 0 . 2 l l Elementare Integration liefert dann 1/r−1/r 0 (2.4) φ − φmin = ∓ arcsin (v/A)|1/rmin −1/r 0 1 1 1 1 1 1 = ∓ arcsin − − arcsin − .(2.5) A r r0 A rmin r0 14 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II Umgeformt gilt φ − φ0 = ∓ arcsin 1 A 1 1 − r r0 , mit φ0 = φmin ± arcsin 1 A 1 rmin 1 − r0 , bzw. 1 1 − = A sin(∓[φ − φ0 ]) r r0 A≥0. Wir rotieren unser Koordinatensystem nun so, daß φ0 = −3π/2 für das obere und φ0 = −π/2 für das untere Vorzeichen gilt. Damit folgt r0 = 1 + cos(φ) , r (2.6) p wobei wir die so genannte Exzentrizität = r0 A = 1 + E/|V0 | eingeführt haben. Wir haben somit die gesuchte Bahngleichung bestimmt. Für den betrachteten Fall −|V0 | ≤ E < 0, d.h. 0 ≤ < 1 ist dies die Gleichung für eine Ellipse. Wir wollen dies in dem folgenden Einschub genauer betrachten. Einschub zur mathematischen Beschreibung von Ellipsen: Wir beginnen diesen mit der Definition. Eine Ellipse ist die Menge von Punkten P in einer Ebene, für die die Summe der Abstände zu zwei festen Punkten F1 und F2 einen konstanten Wert annimmt, also |F1 P | + |F2 P | = const. gilt. Man bezeichnet die Fi als die Fokuspunkte. Folgend ist eine Ellipse, in der die wichtigen Punkte und Längen indiziert sind dargestellt. B P b c F1 M a−c A F2 Der Abstand der beiden Fokuspunkte ist 2c, die Länge der kurzen Halbachse ist b = |M B| und die der langen Halbachse a = |M A|. Wählt man als Punkt auf der Ellipse den Punkt A, so gilt für die Summe d der Abstände von F1 und 2.1. DAS ZWEIKÖRPERPROBLEM 15 F2 , d = (a + c) + (a − √ c) = 2a, während sich für die Wahl des Punktes B nach Pythagoras d = 2 c2 + b2 ergibt. Kombiniert gilt also für die Längen der Halbachsen und den halben Abstand der Fokuspunkte a2 = b2 + c2 . Es gibt nun zwei gängige Vorgehensweisen. Man kann einerseits den Ursprung des Koordinatensystems in einen der Fokuspunkte legen, also z.B. F2 . Damit ist ~r durch den Vektor von F2 nach P gegeben. Mit der Definition, daß ~c den Vektor von M nach F2 bezeichnet gilt nach der Definitionsgleichung der Ellipse und d = 2a |~r| + |~r + 2~c| = 2a . Quadriert man die resultierende Gleichung |~r + 2~c| = 2a − r, so folgt ~c · ~r + ar = a2 − c2 = b2 . Definiert man nun die Exzentrizität durch c = a, d.h. 0 ≤ = und verwendet ~c · ~r = cr cos φ, so ergibt sich cos φ + 1 = p 1 − b2 /a2 < 1 b2 1 a r oder mit r0 = b2 /a (r0 ist die Länge von ~r für φ = π/2) r0 = cos φ + 1 . r Dies ist die Ellipsengleichung in Polarkoordinaten, wie sie bei der Lösung des Keplerproblems auftritt (siehe oben). Für → 0 geht die Ellipse in einen Kreis (Spezialfall einer Ellipse) mit Radius r0 über. Alternativ kann man den Ursprung in den Mittelpunkt M der Ellipse legen. Drückt man den Punkt P dann durch kartesische Koordinaten aus, so lautet die Bedingung für die Summe der Abstände p p (x + c)2 + y 2 + (x − c)2 + y 2 = 2a . Quadrieren liefert (x + c)2 + y 2 + (x − c)2 + y 2 + 2 p [(x + c)2 + y 2 ][(x − c)2 + y 2 ] = 4a2 und erneutes Quadrieren nach Auflösen nach dem Wurzelterm x2 (a2 − c2 ) + y 2 a2 = a2 (a2 − c2 ) . Unter Verwendung von a2 − c2 = b2 ergibt sich so x2 y 2 + 2 =1. a2 b 16 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II Dies ist die Normalform der Ellipse, deren Mittelpunkt im Ursprung liegt (in kartesischen Koordinaten). In dieser Form ergibt sich die Ellipse, wenn man sie über “Kegelschnitte” einführt. Im Spezialfall a2 = b2 ergibt sich die Kreisgleichung. Da wir später auch Hyperbeln benötigen werden (infinite Bewegung im Keplerproblem), wollen wir diese gleich analog zu den Ellipsen einführen. Einschub zur mathematischen Beschreibung von Hyperbeln: Eine Hyperbel ist die Menge von Punkten P in einer Ebene, für die die Differenz der Abstände zu zwei festen Fokuspunkten F1 und F2 einen konstanten Wert annimmt, also |F1 P | − |F2 P | = const. gilt. Folgend ist ein Paar von Hyperbelästen, in der die wichtigen Punkte und Längen indiziert sind dargestellt. P A F1 a M a F2 Der Abstand der Fokuspunkte wird erneut mit 2c bezeichnet. Wählt man den Punkt A (siehe Skizze) auf dem linken Ast der Hyperbel, so ergibt sich für die Differenz der Abstände der Wert |F1 P | − |F2 P | = −2|M A| = −2a . Für den zu A analogen Punkt auf dem rechten Ast gilt |F1 P | − |F2 P | = 2|M A| = 2a . Legt man den Ursprung des Koordinatensystems in den Fokuspunkt F1 , dann ist ~r durch den Vektor von F1 nach P gegeben und mit dem Vektor ~c von M nach F2 folgt für die speziellen Punkte A auf dem linken/rechten Hyperbelast (oberes/unteres Vorzeichen) |~r| − |~r − 2~c| = ∓2a . Quadriert man die resultierende Gleichung −|~r − 2~c| = ∓2a − r, so folgt ~c · ~r ± ar = c2 − a2 . 2.1. DAS ZWEIKÖRPERPROBLEM 17 Definiert man die Exzentrizität erneut als = c/a, wobei hier jedoch ≥ 1 gilt, und verwendet ~c · ~r = cr cos φ, so ergibt sich r0 = cos φ ± 1 , r wobei r0 = (c2 − a2 )/a ist. Dies ist die Hyperbelgleichung (“+” linker Ast, “-” rechter Ast) in Polarkoordinaten, die uns später begegnen wird. Mit dem Ursprung im Mittelpunkt M bieten sich wieder kartesische Koordinaten an. Die Definitionsgleichung liefert p p (x + c)2 + y 2 − (x − c)2 + y 2 = ∓2a . Quadriert man beide Seiten, separiert den verbleibenden Wurzelterm und quadriert erneut, so erhält man analog zum Fall der Ellipse y2 x2 + =1. a2 a2 − c 2 Da im Gegensatz zur Ellipse c > a gilt, definiert man b2 = c2 − a2 und erhält so x2 y 2 − 2 =1 a2 b als die Normalform der Gleichung des Hyperbelpaars. Zurück zum Keplerproblem: Die Bahnkurve Gl. (2.6) der finiten Bewegung im Keplerproblem entspricht der soeben diskutierten Gleichung einer Ellipse in Polarkoordinaten, mit dem Ursprung in einem der Fokuspunkte. Damit liegt das Zentrum des Zentralpotentials in diesem Fokuspunkt. Es handelt sich bei dieser Einsicht um das erste Keplersche Gesetz, was wir genauer formulieren werden, wenn wir zum Zweikörperproblem zurückkehren werden. Es besteht ein Zusammenhang zwischen der Exzentrizität der Ellipse und dem maximalen und minimalen Abstand rmax/min der Bahnkurve zum Ursprung. Um diesen herzustellen, bestimmen wir zunächst rmax/min . Für vorgegebenes E mit −|V0 | ≤ E < 0 gilt r α 2 l2 α ± + Veff (rmax/min ) = E ⇒ rmax/min = − 2E 2E 2mE p α = − 1 ± 1 + E/|V0 | 2E α = − (1 ± ) . 2E Die Abhängigkeit von l ist dabei in V0 “versteckt”. Die Summe von rmax und rmin ist jedoch unabhängig von l rmax + rmin = α . |E| 18 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II Wir betrachten nun rmin (1 + ) = − α α (1 − 2 ) = = r0 2E 2|V0 | oder geometrisch (siehe Skizze der Ellipse sowie c = a, = r0 = b2 /a) rmin (1 + ) = (a − c)(1 + ) = a(1 − 2 ) = a p 1 − b2 /a2 und b2 = r0 . a2 Somit ergibt sich rmin = r0 1+ rmax = r0 . 1− und analog Die Länge a der langen Halbachse ist durch a= rmax + rmin α = 2 2|E| gegeben und somit unabhängig vom Drehimpuls l. Um den zeitlichen Durchlauf der Ellipsenbahn zu bestimmen, verwendet man die Drehimpulserhaltung. Es gilt mr2 (φ(t)) φ̇(t) = l und damit (Separation der Variablen) t − t0 m = l Z m l Z = φ φ0 φ φ0 r2 (φ0 ) dφ0 r02 dφ0 . (1 + cos φ0 )2 Das Integral läßt sich elementar ausführen, es ist jedoch nicht möglich, das Ergebnis geschlossen nach φ(t) aufzulösen. Interessiert man sich nur für die Umlaufzeit T , so kann man die in Kapitel 3.6 der Vorlesung des letzten Semesters eingeführte Flächengeschwindigkeit (siehe Seiten 170/171 des Skripts) dS l = dt 2m 2.1. DAS ZWEIKÖRPERPROBLEM 19 verwenden. Integration dieser Gleichung über die Zeit von 0 bis T liefert T = 2mS , l √ wobei S die Fläche der Ellipse ist. Es gilt S = πab = πa2 1 − 2 und damit √ wegen l = αmr0 2m 2 √ πa 1 − 2 lr √ m a2 1 − 2 = 2π √ α r0 r m 3/2 = 2π a α r m = πα . 2|E|3 T = (2.7) Die dritte Zeile enthält das dritte Keplersche Gesetz, welches uns bereits mehrfach begegnet ist. Die vierte Zeile zeigt, daß die Umlaufzeit nur von der Energie des Teilchens abhängt. Diese Einsicht hat eine historisch wichtige Rolle beim Übergang von der klassischen Mechanik zur Quantenmechanik gemäß dem so genannten “Korrespondenzprinzip” gespielt. Wir kehren nun zum eigentlichen Zweikörperproblem “Planet-Sonne” zurück. Wir müssen somit m durch die reduzierte Masse µ = m1 m2 /(m1 + m2 ) ersetzen und erhalten dann die Trajektorie der Relativbewegung ~r = ~r1 − ~r2 . Die Ortsvektoren der beiden Massen sind m2 ~r , M ~ − m1 ~r . ~r2 = R M ~+ ~r1 = R ~ =0 Wir betrachten die Bewegung zunächst im Schwerpunktsystem, für das R ~ gilt. Dieses ist ein Inertialsystem (siehe oben). Wegen R = 0 gilt m2 ~r , m1 + m2 m1 ~r2 = − ~r m1 + m2 ~r1 = und sowohl der Planet, wie auch die Sonne folgen einer Ellipsenbahn mit einem gemeinsamen Fokuspunkt im Ursprung. Für das System “Erde-Sonne” gilt mE /mS ≈ 3 · 10−6 und ≈ 0.017. Um das Verhalten besser graphisch darstellen zu können, ist in der folgenden Skizze m1 /m2 = 0.1 und = 0.3 gewählt. 20 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II 1 x2/r0 0.5 0 -0.5 -1 -1 -0.5 0 x1/r0 0.5 Eine zweite Möglichkeit besteht darin, die Bewegung im System der Sonne mit ~r(t) = ~r1 (t) = ~rE (t) zu beschreiben. Es ist wichtig festzuhalten, daß es sich bei diesem Koordinatensystem nicht um ein Inertialsystem handelt. In diesem System bewegt sich die Erde auf einer Ellipse um die Sonne, wobei diese in einem der Brennpunkte (Fokuspunkte) steht. Dies ist das erste Keplersche Gesetz (für das Zweiteilchenproblem). Aufgrund des sehr großen Verhältnisses der Massen der Sonne und der Erde, unterscheiden sich die Beschreibungen in den beiden Koordiantensystemen nur wenig. Das zweite Keplersche Gesetz haben wir bereits im vergangenen Semester kennen gelernt (siehe Seite 157 des Skripts). Es folgt aus der Konstanz der Flächengeschwindigkeit und ist somit eine Manifestation der Drehimpulserhaltung: In gleichen Zeiten werden durch ~r(t) gleiche Flächen überstrichen.1 Wir kommen nun zur Formulierung des dritten Keplerschen Gesetzes für das Zweikörperproblem. Für den Vorfaktor in Gl. (2.7) müssen wir für ein System “Planet-Sonne” die Ersetzung r r m µ 1 1 ≈√ → =p α GmP mS GmS G(mS + mP ) vornehmen, wobei G die Gravitationskonstante ist. Damit gilt 1 1 T = 2π p a3/2 ≈ 2π √ a3/2 . GmS G(mS + mP ) 1 (2.8) Es ist wichtig festzuhalten, daß das zweite Keplersche Gesetz somit für alle Zentralpotentiale gilt. Im Gegesatz dazu sind das erste und dritte Keplersche Gesetz spezifisch für das 1/rPotential. 2.1. DAS ZWEIKÖRPERPROBLEM 21 Die Quadrate der Umlaufzeiten zweier Bahnen verhalten sich somit wie die Kuben der langen Halbachsen und da mP /mS 1, ist der Vorfaktor (nahezu) unabhängig vom betrachteten Planeten. Es sollte klar sein, daß die Keplerschen Gesetze aufgrund der Anwesenheit weiterer Himmelskörper (weitere Planeten, Monde,. . . ) bei der Beschreibung der Bewegung von Planeten “um die Sonne” nur näherungweise gelten. Mit dieser Formulierung der drei Keplerschen Gesetze schließen wir die Diskussion der finiten Bewegung im Keplerproblem ab. Infinite Bewegungen im attraktiven 1/r-Potential: Positive Gesamtenergien E ≥ 0 führen im Potential Gl. (2.2) zu infiniten Bewegungen (siehe die Skizze des Potentials). Die Schritte, die auf die Gleichung (2.6) r0 = 1 + cos(φ) , r geführt haben, können völlig p analog vollzogen werden. In diesem Fall gilt jedoch für die Exzentrizität = 1 + E/|V0 | ≥ 1 und die Bahnkurve beschreibt den linken Ast einer Hyperbel. Der Spezialfall E = 0 führt auf = 1 und Gl. (2.6) beschriebt eine Parabel mit dem Ursprung als Brennpunkt der Parabel. Trägt man die Bahnkurve für E > 0, d.h. > 1 beginnend mit φ = 0 für zunehmende Werte von φ auf, so divergiert r beim Grenzwinkel φc der durch cos φc = − 1 gegeben ist. In der folgenden Skizze ist der Übergang vom Kreis mit = 0 zur Hyperbel mit > 1 dargestellt. Die Werte der Exzentrizität sind = 0, 0.5, 0.9, 1, und 1.4. x2/r0 5 0 -5 -10 -5 x1/r0 0 22 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II Infinite Bewegungen im repulsiven 1/r-Potential: Im Hinblick auf geladene Teilchen gleicher Ladung wollen wir zusätzlich die Bewegung bei abstoßender Wechselwirkung mit Potential V (r) = α/r, α > 0 untersuchen. In diesem Fall nimmt Veff (r) für wachsende r monoton von ∞ nach 0 ab. Die Energie des Teilchens kann nur positiv sein und jede Bewegung ist infinit. Wie zuvor kann man (formal) die Größen r0 = l2 /(αm) und |V0 | = α2 m/(2l2 ) definieren. Im Vergleich zur Rechnung im anziehenden Fall ergibt sich als einziger Unterschied, daß u0 = −1/r0 . Für die Bahnkurve ergibt sich also r0 = −1 + cos φ , r = p 1 + E/|V0 | . Diese Gleichung beschreibt den rechten Hyperbelast (siehe oben). Somit schließt die Trajektorie im abstoßenden Fall im Gegensatz zum anziehenden Fall das Zentrum des Potentials im linken Brennpunkt nicht ein. Es würde sich an dieser Stelle anbieten, eine allgemeine Diskussion der Streuung eines Teilchens an einem Potential anzuschließen. Aus Zeitgründen können wir uns jedoch hier nicht mit der so genannten Streutheorie beschäftigen und das, obwohl Streuexperimente in der Geschichte der Physik eine wichtige Rolle gespielt haben. Es sei daher auf die entsprechende Literatur verwiesen. 2.2 Bewegte Bezugssysteme Wir werden in diesem Kapitel untersuchen, wie sich die Form der Newtonschen Gleichungen ändert, wenn man von einem inertialen Bezugssytem k in ein relativ zu diesem bewegtes Bezugssystem K übergeht. Es sei daran erinnert, daß die bisher verwendete Form der Newtonschen Gleichung m~x¨ = F~ (~x) per Definition nur in Inertialsystemen gilt. Der Satz von Basisvektoren in K ist bezüglich dem von k verschoben und verdreht, wobei die Verschiebung und Verdrehung von der Zeit abhängen kann. Dies ist in der folgenden Skizze dargestellt (hier in einer Ebene bzw. für den zweidimensionalen Fall). k K r(t) e1 e2 e1 E2 R(t) r0(t) E1 ~ ~ i der Ortsvektor eines Punktes relativ zum bewegten SySei R(t) = i Xi (t)E P stem K. Man erhält den Ortsvektor ~r(t) = i xi (t)~ei desselben Punktes relativ P 2.2. BEWEGTE BEZUGSSYSTEME 23 P (0) zu k als Summe des (zeitabhängigen) Verschiebungsvektors ~r0 (t) = i xi (t)~ei ~ welches sich unter der der Koordinatenursprünge und dem Bild des Vektors R, (zeitabhängigen) Drehung der Koordinatenachsen von K relativ zu denen von k ergibt. In Kapitel 2.13 der Vorlesung des letzten Semesters haben wir gelernt, daß man Rotationen mit Hilfe von orthogonalen Matrizen A, mit der Eigenschaft AT = A−1 und Matrixelementen ai,j beschreibt. Anders ausgedrückt ist die Rotation eine (zeitabhängige) lineare Abbildung Bt : K → k. Das Bild der ~ i aus K unter der Rotation haben wir in Kapitel 2.13 mit ~ei0 beBasisvektoren E 0 ~ i. zeichnet – Vektoren die jetzt im Allgemeinen zeitabhängig werden: ~ei (t) = Bt E ~ Damit kann man die obigen Worte zur Beziehung von ~r und R in eine Formel fassen ~ ~r(t) = ~r0 (t) + Bt R(t) X (0) X 0 Xi (t)~ei (t) . = xi (t)~ei + i i Da2 0 ~ei (t) = X ~ej bj,i (t) , j also bi,j = ~e0j · ~ei , folgt ! ~r(t) = X (0) xi (t) + X bi,j (t)Xj (t) ~ei . j i Scheinkräfte im Lagrange-Formalismus: Wir werden nun zunächst den Lagrange-Formalismus verwenden um zu sehen, wie sich die Bewegungsgleichungen in bewegten Bezugssystemen verändern. Dazu verwenden wir die Xi (t) als neue (krummlinige) Koordinaten. Aus X 0 ~r(t) = ~r0 (t) + Xi (t)~ei (t) . i folgt ~gi = 2 ∂~r 0 = ~ei ∂Xi Die in Kapitel 2.13 der letztsemestrigen Vorlesung eingeführte, eine Rotation beschreibende Matrix A und die hier auftretende Matrix B, mit Matrixelementen bi,j , genügen der Beziehung BT = A (siehe Gl. (2.44) des Skripts des letzten Semesters). Somit sind A und B invers zueinander (da orthogonale Matrizen). 24 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II und ~r˙ = X i 0 Ẋi~ei + X 0 Xi~e˙ i + ~r˙0 . i Mit den Relationen ∂~r˙ ∂T 0 = m~r˙ · = m~r˙ · ~ei ∂ Ẋi ∂ Ẋi und ∂~r˙ ∂T 0 = m~r˙ · = m~r˙ · ~e˙ i ∂Xi ∂Xi lautet die Lagrange-Form der Newtonschen Bewegungsgleichung in Gegenwart der Kraft (in k)3 f~ (siehe Gl. (3.15) des Skripts der letztsemestrigen Vorlesung) d ˙ 0 0 m ~r · ~ei = m~r˙ · ~e˙ i + ~e0i · f~ . dt 0 Wir betrachten zunächst den Fall der zeitunabhängigen Verdrehung mit ~e˙ i (t) = 0. Damit verschwindet der erste Term auf der rechten Seite und die Gleichung läßt sich umformen zu ⇔ ⇒ ~¨ = f~ m(~r¨0 + B R) ~¨ 0 + B R) ~¨ = B F~ m(B R ~¨ = F~ (R) ~ − mR ~¨ 0 = F~tot . mR ~ in K) wirkt im Zusätzlich zur vorgegebenen Kraft am Ort P (mit Ortsvektor R ¨ ~ 0 . Sie ist die Scheinkraft, die in eibewegten System K die Trägheitskraft −mR nem relativ zum Inertialsystem k linear beschleunigtem Bezugssystem K auftritt (und dort ganz real ist). Dabei muß die relative Beschleunigung nicht zwangsläufig zeitlich konstant sein, sondern kann sich durchaus ändern. Sind die beiden Bezugssysteme gar nicht gegeneinander verdreht so ist B die identische Abbildung. Die auftretende Scheinkraft ist uns aus dem Alltag wohlbekannt. Sie wirkt z.B., wenn wir uns in einem Fahrstuhl befinden, der anfährt oder in einem Zug, der beschleunigt bzw. bremst. Weiterhin ist sie die Erklärung für das Auftreten der Gezeiten (Ebbe und Flut). Dabei ist die Beobachtung von zentraler Bedeutung, daß die Erde, von der aus wir die Gezeiten beobachten (unser Bezugssystem ist erdfest), kein Inertialsystem ist. Ein offensichtlicher Grund dafür ist die Rotation der Erde. Für die Erklärung der Gezeiten spielt jedoch die Tatsache, daß die 3 Wir schreiben die Kraft (in k) mit einem kleinen Buchstaben, da dies hier zur besseren Unterscheidung für alle Vektoren bezüglich k gemacht wird. 2.2. BEWEGTE BEZUGSSYSTEME 25 Erde zum Mond hin beschleunigt wird (Gravitationskraft) die entscheidene Rolle (siehe Übungen). ~ Bewegt sich das Bezugssystem K mit dem Teilchen mit, d.h. gilt R(t) = ¨ ~ = 0, daß die Gesamtkraft (in K) F~tot verschwindet. const., so folgt wegen R Als einfaches Beispiel wollen wir hier das Problem eines Fadenpendels mit Masse m und Fadenlänge R (siehe Kapitel 3.4 des Skripts zur Einführung in die Theoretische Physik) in einem linear beschleunigten Zug (relativ zur Erdoberfläche) betrachten. Näherungsweise können wir in diesem Problem die Erde als ein Inertialsystem betrachten. Die durch die Rotation auftretenden Abweichungen davon werden wir weiter unten diskutieren. Im erdfesten (fast-)Inertialsystem ~ und die Normalkraft N ~ (Fadenspannung). Es gilt wirken die Gravitationskraft G ~ +N ~ . Gehen wir nun in das zugfeste Bezugssystem, so tritt zusätzlich die m~r¨ = G ~ Scheinkraft −m~r¨0 (t) = −mA(t) auf. Die Bewegungsgleichung lautet in diesem ~¨ = G ~ +N ~ − mA ~=N ~ + m(~g − A) ~ =N ~ + m~geff , mR wobei wir ausgenutzt haben, daß sowohl die Gravitationskraft, als auch die Trägheitskraft proportional zur Masse sind. Damit ist die Form der Bewegungsgleichung im linear beschleunigten Bezugssystem genau dieselbe wie im Inertialsy~ In einer Übungsaufgabe werden sie dieses stem mit der Ersetzung ~g → ~g − A. Beispiel zu Ende rechnen, indem sie den Winkel der Ruhelage im beschleuingten System und die Kreisfrequenz der Bewegung in diesem berechnen. Bewegt sich K geradlinig und gleichförmig relativ zu k, so verschwindet die Trägheitskraft. In diesem Fall ist auch K ein Inertialsystem und die Newtonsche Gleichung hat in beiden Systemen die gleiche Form (siehe die Definiton des Begriffs Inertialsystem in Kapitel 3.2 der Vorlesung des letzten Semesters). Das Galileische Relativitätsprinzip und die Form von Kräften: Wir betrachten nun ein System von N Teilchen und wollen untersuchen, welche Einschränkungen das in Kapitel 3.2 der letztjährigen Vorlesung eingeführte Galileische Relativitärtsprinzip4 für die Form der Kräfte f~i (~r1 , ~r2 , . . . , ~rN ; ~r˙1 , ~r˙2 , . . . , ~r˙N ; t) mit i = 1, 2, . . . , N hat. Da es sich bei den zwei Bezugssystemen zwischen denen man hin und her transformiert um zwei Inertialsysteme k und K handeln soll, kann der Verschiebungsvektor der Ursprünge ~r0 nur die Form ~r0 (t) = ~c + ~v0 t haben und die durch die lineare Abbildung B gegebene relative Drehung ist zeitunabhängig. Weiterhin können wir die Zeit gemäß T = t + t0 verschieben, wobei ~ ist. Die Zeitverschiebung zählt ebenfalls zu den GaliT das Zeitargument von R leitransformationen. In k lautet die Bewegungsgleichung mi~r¨i = f~i (~r1 , ~r2 , . . . , ~rN ; ~r˙1 , ~r˙2 , . . . , ~r˙N ; t) 4 Kurz: Die Newtonsche Bewegungsgleichung hat in zwei Inertialsystemen zu allen Zeiten die gleiche Form. 26 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II ~¨ i ) und damit in K (wobei ~r¨i = B R ~¨ i = B −1 f~i (~r0 + B R ~ 1 , . . . , ~r0 + B R ~ N ; ~v0 + B R ~˙ 1 , . . . , ~v0 + B R ~˙ N ; T − t0 ) , mi R mit der zu B inversen Abbildung B −1 (die durch die transponierte Matrix gegeben wird). Nach dem Galileischen Relativitätsprinzip sollen nun die Kräfte F~i = B −1 f~i ~ j und R ~˙ j dieselbe Form haben wie in k. Es soll also gelten ausgedrückt durch die R ~ 1 , . . . , ~r0 + B R ~ N ; ~v0 + B R ~˙ 1 , . . . , ~v0 + B R ~˙ N ; T − t0 ) B −1 f~i (~r0 + B R ~ 1, . . . , R ~N; R ~˙ 1 , . . . , R ~˙ N ; T ) . = f~i (R Für die Situation von geschwindigkeitsunabhängigen Paarkräften X f~i,j (~ri , ~rj ; t) f~i = j6=i vereinfacht sich die Bedingung zu X X ~ i, R ~ j; T ) . ~ i , ~r0 + B R ~ j ; T − t0 ) = f~i,j (R B −1 f~i,j (~r0 + B R j6=i j6=i Wir wählen nun ein beliebiges Paar von Teilchen aus und entfernen alle weiteren Teilchen aus unserem Problem (wir betrachten also ein spezielles System mit N = 2). Dann gilt ~ i , ~r0 + B R ~ j ; T − t0 ) = f~i,j (R ~ i, R ~ j; T ) . B −1 f~i,j (~r0 + B R (2.9) Die f~i,j könnten dabei vom Teilchentyp abhängen. Die Gleichung für jeden Summanden muß aber gelten, da wir alle Teilchenpaare durchgehen können. Für diesen Fall wollen wir nun die Konsequenzen aus der Forderung der Invarianz unter den Galileitransformationen ~ i = ~r0 (t) + B R ~i , ~ri = ~c + ~v0 t + B R t = T − t0 (2.10) untersuchen. Zunächst betrachten wir die Transformation mit ~r0 (t) = 0 und bei ~ i (T ). Gleichung der B durch die Identität gegeben ist. Damit gilt ~ri (t + t0 ) = R (2.9) liefert dann ~ i, R ~ j ; T − t0 ) = f~i,j (R ~ i, R ~ j; T ) . f~i,j (R Da t0 beliebig ist folgt umgehend, daß das Galileische Relativitätsprinzip nur gelten kann, wenn die Paarkräfte nicht explizit von der Zeit abhängen. Dies impliziert, daß die Energie erhalten ist (siehe Diskussion im letzten Semester). 2.2. BEWEGTE BEZUGSSYSTEME 27 Die Invarianz unter Zeittranslation hängt also unmitellbar mit der Energieerhaltung zusammen. Als zweite spezielle Galileitransformation betrachten wir die mit ~v0 = 0, t0 = 0 und bei der B durch die Identität gegeben ist. Diese testet die Homogenität des Raumes, die besagt, daß kein Punkt des leeren Raumes vor einem anderen ausgezeichnet ist. Gleichung (2.9) impliziert für diese Transformation, daß5 ~ i , ~c + R ~ j ) = f~i,j (R ~ i, R ~ j) . f~i,j (~c + R ~ i −R ~j Da ~c beliebig wählbar ist kann f~i,j nur eine Funktion des Relativabstandes R sein6 ~ i, R ~ j ) = f~i,j (R ~i − R ~ j) . f~i,j (R Für eine nicht-tiviale Drehung B (ungleich der identischen Abbildung), ~v0 = 0, ~r0 = 0 und t0 = 0 (reine Drehung) beschreibt die Invarianz unter der Galileitransformation die Isotropie des Raumes, d.h. im leeren Raum gibt es keine ausgezeichnete Richtung. Mathematisch bedeutet die Invarianz, daß (die Homogenität des Raumes ist schon eingebaut) ~i − R ~ j ]) = f~i,j (R ~i − R ~ j) B −1 f~i,j (B[R und damit ~i − R ~ j ]) = B f~i,j (R ~i − R ~ j) . f~i,j (B[R (2.11) Dabei ist B beliebig wählbar. Legen wir speziell die Rotationsachse in die Rich~i − R ~ j , so gilt B[R ~i − R ~ j] = R ~i − R ~j = R ~ i,j . Damit folgt tung von R ~ i,j ) = B f~i,j (R ~ i,j ) . f~i,j (R ~ i,j zeigt und Diese Gleichung kann nur gelten, wenn f~i,j ebenfalls in Richtung R es folgt ~ ~ i,j ) . ~ i,j ) = Ri,j fi,j (R f~i,j (R Ri,j Wählen wir jetzt wieder ein beliebiges B und setzen in Gl. (2.11) ein, so ergibt sich ! " # ~ i,j ~ i,j R R ~ i,j ) = B ~ i,j ) . B fi,j (B R fi,j (R Ri,j Ri,j 5 6 Die Unabhängigkeit der Paarkraft von der Zeit nutzen wir dabei bereits aus. ~ j wählt. Dies sieht man formal, in dem man ~c = −R 28 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II Wir können also folgern, daß ~ i,j ) = fi,j (R ~ i,j ) fi,j (B R und damit ~ i,j ) = fi,j (Ri,j ) . fi,j (R Die im letzten Semester eingeführten Zweiteilchenkräfte (entlang der Verbindungslinie der zwei Teilchen und nur vom Abstand abhängiger Betrag) sind somit kompatibel mit dem Galileischen Relativitätsprinzip. Aufbauend auf den Überlegungen zur Erhaltung des Gesamtimpulses in Gegenwart von Paarkräften aus dem Kapitel 3.3 der Vorlesung des letzten Semesters erkennen wir, daß es einen engen Zusammenhang zwischen der Homogenität und Isotropie des Raumes auf der einen Seite und der Gesamtimpulserhaltung auf der anderen Seite gibt. Die Invarianz unter Galileitransformationen mit ~v0 6= 0 bedingt für geschwindigkeitsunabhängige Kräfte keine weiteren Einschränkungen an die Form der Kräfte. Scheinkräfte im Newtonschen Formalismus: Zur allgemeinen Diskussion der Scheinkräfte (inklusive der zeitabhängigen Drehungen) kehren wir zum Newtonschen Formalismus zurück. Da es sich bei Bt um eine lineare Abbildung handelt, folgt mit Hilfe der Produktregel ⇒ ~ ~r(t) = ~r0 (t) + Bt R(t) ~ + Bt R(t) ~˙ ~r˙ (t) = ~r˙0 (t) + Ḃt R(t) . (2.12) Wir stellen zunächst Überlegungen zu dem Term an, der sich aufgrund der Zeitabhängigkeit der Drehung ergibt ~ = Ḃt B −1 (~r − ~r0 ) = At (~r − ~r0 ) . Ḃt R t Die Abbildung At : k → k ist antisymmetrisch, d.h. es gilt At + ATt = 0 . Dabei ist die Abbildung ATt durch die Transponierte der zu At gehörenden Matrix gegeben. Die Antisymmetrie sieht man durch Einsetzen von ATt = Bt Ḃt−1 At + ATt = Ḃt Bt−1 + Bt Ḃt−1 = d d (Bt Bt−1 ) = I = 0 , dt dt (2.13) wobei I die identische Abbildung von k nach k bezeichnet. Die zu A (Zeitabhängigkeit unterdrückt) gehörende Matrix A ist damit antisymmetrisch mit ai,j = −aj,i , also 0 a1,2 a1,3 0 a2,3 . A = −a1,2 −a1,3 −a2,3 0 2.2. BEWEGTE BEZUGSSYSTEME 29 Damit hat die reelle Matrix A drei unabhängige Vektors A~q (in k) erhält man gemäß 0 a1,2 a1,3 q1 0 a2,3 q2 = A~q = −a1,2 −a1,3 −a2,3 0 q3 Matrixelemente. Das Bild des a1,2 q2 + a1,3 q3 −a1,2 q1 + a2,3 q3 . −a1,3 q1 − a23 q2 (2.14) Setzt man ω1 = −a2,3 , ω2 = a1,3 und ω3 = −a1,2 , d.h. 0 −ω3 ω2 0 −ω1 , A = ω3 −ω2 ω1 0 so ergibt sich das Ergebnis Gl. (2.14) auch als A~q = ω ~ × ~q wenn ω ~ = X ωi~ei . i Man bezeichnet diesen Vektor als die Winkelgeschwindigkeit.7 Um die Bedeutung ~˙ zu veranschaulichen, betrachten wir den Spezialfall mit R(t) = 0 und ~r0 (t) = 0. ˙ Dann gilt nach den obigen Überlegungen ~r(t) = At~r(t) = ω ~ × ~r(t). Mit einem ~ infinitesimalen ∆t geschrieben bedeutet das ∆r(t) = (~ω × ~r(t))∆t. Damit steht ~ senkrecht auf ~r und ω der Vektor ∆r ~ . Aus der folgenden Skizze wird klar, daß der Vektor ω ~ (in k) damit in Richtung der instantanen Drehachse zeigt (gemäß der Rechte-Hand-Regel). Zusätzlich erkennt man, daß der Betrag von ω ~ dem Betrag ~ der Winkelgeschwindigkeit |φ̇| entspricht, da |∆r| = ρ|∆φ| = |~r| sin θ|φ̇|∆t. ω (t) ∆φ ρ r(t) r(t+ ∆t) θ 0 7 Der Vektor ω ~ wird im Allgemeinen zeitabhängig sein. In unser Notation unterdrücken wir diese Zeitabhängigkeit. 30 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II Der betrachtete Spezialfall tritt z.B. auf, wenn ein starrer Körper im bewegten Bezugssystem K ruht und mit diesem um den stationären Punkt 0 rotiert. Die ~ = (~ω × ~r(t))∆t bedeutet dann, daß zu jedem Zeitpunkt eine inGleichung ∆r stantane Drehachse existiert und daß alle Punkte der Geraden im starren Körper, die entlang ω ~ liegt und durch 0 geht, zu diesem Zeitpunkt eine verschwindende Geschwindigkeit haben. Die Geschwindigkeit aller anderen Punkte des Körpers ist senkrecht zu ω ~ (der instantanen Drehachse) und proportional zum Abstand von der Drehachse. Wir verlassen nun den Spezialfall und kehren zu der Situation eines allgemeinen bewegten Bezugssystems K zurück. Der Vektor ω ~ ist das Bild eines Vektors ~ Ω (in K) unter der Abbildung Bt , d.h. ~ ω ~ = Bt Ω ⇔ ~ = Bt−1 ω Ω ~ . ~ als die Winkelgeschwindigkeit im Körper.8 Damit erhält man Man bezeichnet Ω ~ für Ḃt R ~ = Ḃt B T (~r − ~r0 ) = At (~r − ~r0 ) = ω Ḃt R ~ × (~r − ~r0 ) t ~ = (Bt Ω) ~ × (Bt R) ~ . = ω ~ × (Bt R) Da die lineare Abbildung (Rotation) Bt durch eine orthogonale Matrix gegeben ist, erhält sie die Längen von Vektoren sowie alle relativen Winkel eines Vektorpaares (anschaulich klar, daß das für eine Rotation gelten muß). Damit folgt ~ = Bt (Ω ~ × R) ~ . Ḃt R Zusammengefaßt ergibt sich so für ~r˙ in Gl. (2.12) ~ × R(t) ~ + R(t)] ~˙ ~r˙ (t) = ~r˙0 (t) + Bt [Ω . (2.15) Im nächsten Schritt bestimmen wir die Beschleunigung ~r¨ und verwenden dabei ~ × V~ ) wieder die für jeden Vektor V~ in K gültige Beziehung Ḃt V~ = Bt (Ω ~ × R(t) ~ + R(t)] ~˙ ~˙ × R(t) ~ +Ω ~ × R(t) ~˙ + R(t)] ~¨ ~r¨(t) = ~r¨0 (t) + Ḃt [Ω + Bt [Ω n o ~ × Ω ~ × R(t) ~ ~ × R(t) ~˙ + Ω ~˙ × R(t) ~ + R(t)] ~¨ + 2Ω . = ~r¨0 (t) + Bt [Ω Aus dieser Relation ergibt sich die Newtonsche Gleichung in K. In k gilt m~r¨(t) = f~(~r, ~r˙ ; t) und damit nach Einsetzen der obigen Relation und Anwenden von Bt−1 h i ~¨ = F~ − m Ω ~ × (Ω ~ × R) ~ + 2Ω ~ ×R ~˙ + Ω ~˙ × R ~ + Bt−1~r¨0 , mR ~ im Allgemeinen zeitabhängig. In unserer Notation unterdrücken wir diese Wie ω ~ ist Ω Zeitabhängigkeit. 8 2.2. BEWEGTE BEZUGSSYSTEME 31 wobei ~ ~r˙0 + Bt [Ω × R ~ + R]; ~˙ t) . F~ = Bt−1 f~(~r0 + Bt R, Dies ist das allgemeine Ergebnis für die Newtonsche Gleichung in einem System, welches kein Inertialsystem ist. Neben der Kraft F~ treten diverse Scheinkräfte auf der rechten Seite der Gleichung auf. Kehren wir noch einmal zu dem zuvor im Lagrange-Formalismus behandelten Fall zurück, daß die Rotation zeitunabhängig ist. Dann tritt als Scheinkraft nur ~¨ 0 auf. der uns bereits bekannte Term −mB −1~r¨0 = −mR Wir wollen nun die bei der zeitabhängigen Drehung auftretenden Scheinkräfte diskutieren. Zusätzlich nehmen wir an, daß die Kraft geschwindigkeitsunabhängig ist und nicht explizit von der Zeit abhängt. Für die reine Drehung mit ~r0 = 0 vereinfacht sich die Newtonsche Gleichung im bewegten Bezugssystem zu h i ~ −m Ω ~ × (Ω ~ × R) ~ + 2Ω ~ ×R ~˙ + Ω ~˙ × R ~ . ~¨ = Bt−1 f~(Bt R) mR Weiterhin wollen wir uns jetzt auf den Fall einer Zentralkraft mit f~(~r) = ~rˆf (r) beschränken. Für diese vereinfacht sich der erste Term auf der rechten Seite der Bewegungsgleichung im bewegten Bezugssytem wegen r = R zu ~ = Rf ~ˆ (R) . Bt−1 f~(Bt R) ~ wie es z.B. näherungsweise bei Bei gleichförmiger Rotation mit konstantem Ω, der Rotation der Erde erfüllt ist, verschwindet die letzte der Scheinkräfte. Damit erhält man für den Fall der Schwerkraft der Erde mit (Fall aus großer Höhe) 2 f (R) = −mgRE /R2 (mit dem Erdradius RE und einer Konstanten g > 0) im erdfesten Bezugssystem 2 ~ − 2mΩ ~ ×R ~˙ − mΩ ~ × (Ω ~ × R) ~ . ~¨ = −gm RE R mR 3 R Den zweiten, geschwindigkeitsabhängigen Term, nennt man die Corioliskraft und den dritten Term die Zentrifugalkraft. Betrachten wir eine Masse, die an einem Faden hängt, welcher von einer Person, die auf der Erdoberfläche steht, gehalten ~˙ = 0, so daß die Corioliskraft verschwindet. wird (ein Lot). In diesem Fall gilt R Die Zentrifugalkraft sorgt dann dafür, daß das Lot nicht genau zum Erdmittel~ × (Ω ~ × R) ~ senkrecht auf der Drehachse punkt zeigt, da die Zentrifugalkraft −mΩ steht und von ihr weg wirkt. Dies ist in der folgenden Skizze verdeutlicht. 32 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II Ω ~g ρ ~ result. Kraft θ R ~ Ω (Ω R) ~ ×R ~ senkrecht zu Ω ~ ist, gilt für den Betrag der Zentrifugalkraft Da Ω ~ Ω ~ × R| ~ = m|Ω| ~ 2 |R| ~ sin θ = mρΩ2 , |F~zentr | = m|Ω|| ~ zur Drehachse ρ = R sin θ. Die Zentrifugalmit dem senkrechten Abstand von R kraft hat somit am Äquator ihren größten Wert. In der Skizze ist ihr Beitrag zur resultierenden Kraft (und damit ihr Effekt) stark übertrieben dargestellt. Folgend betrachten wir den Wurf eines Steins. Bei diesem spielt auch die Corioliskraft eine Rolle. Die relevante Zeitskala tW beim Steinwurf sind Sekunden. Da Ω = 2π/(24 · 3600) 1/s ≈ 7.27 · 10−5 1/s, gilt ΩtW 1. Setzt man nun ~ ~ W (t) R(t) = RE P~ + R mit dem Einheitsvektor P~ , der vom Erdmittelpunkt zur Abwurfposition auf der Oberfläch zeigt, so machen wir nur einen Fehler der Größenordnung (ΩtW )2 , ~ wenn wir R(t) im Ausdruck für die Zentrifugalkraft durch RE P~ ersetzen (siehe Ausdruck für die Zentrifugalkraft). Da weiterhin RW /RE 1 (Wurfhöhe ist sehr viel kleiner als Erdraduis), nähern wir die Gravitationskraft als −mg P~ = m~g an (Fall aus kleiner Höhe). Nach Division durch m erhalten wir die genäherte Bewegungsgleichung ~¨ W (t) = ~g 0 + 2(R ~˙ W (t) × Ω) ~ , R (2.16) mit dem effektiven Beschleunigungsvektor 0 ~ × (Ω ~ × P~ ) , ~g = −g P~ − RE Ω in dem die (genäherte) Zentrifugalkraft integriert ist. Das System inhomogener, linearer Differentialgleichungen (2.16) läßt sich exakt lösen. Da wir uns jedoch nur für kurze Zeiten t mit Ωt 1 interessieren, erhält man die Modifikation der Bahn durch die Corioliskraft zur Ordnung ΩtW leichter mit Hilfe der Methode der sukzessiven Approximation. Hier betrachten wir den Fall aus geringer Höhe ~˙ W (0) = 0. Durch zweifaches Integrieren von Gl. (2.16) erhalten wir mit R Z t 1 0 2 ~ W (t0 ) − R ~ W (0)] × Ω ~ dt0 . ~ ~ RW (t) = RW (0) + ~g t + 2 [R 2 0 2.3. DER STARRE KÖRPER 33 Man nennt eine Gleichung dieses Typs, in der die Funktion und das Integral über die Funktion auftritt, eine Integralgleichung. Im Integral – dem Korrekturterm, ~ W (t0 ) − R ~ W (0) durch der aus der Corioliskraft resultiert – ersetzen wir nun R 0 02 den Ausdruck der nullten Näherung ~g t /2. Das Integral kann dann geschlossen ausgeführt werden und es ergibt sich 3 ~ + O([tΩ]2 ) . ~ W (t) = R ~ W (0) + 1 ~g 0 t2 + t (~g 0 × Ω) R 2 3 Wir stellen somit fest, daß die Komponente der Bewegung in Richtung von ~g 0 zu führender Ordnung nicht von der Corioliskraft beeinflußt wird. Weiterhin ist die Modifikation von p ~g quadratisch in Ω, so daß in führender Ordnung in Ω für die Fallzeit tW = 2h/g gilt (wie ohne die Scheinkräfte). Der Stein wird nach Osten abgelenkt und die Ablenkung hat die Größe Ωg(2h/g)3/2 sin θ/3, wobei wir erneut den O(Ω2 ) Unterschied zwischen ~g und ~g 0 vernachlässigt haben. Der Effekt der Corioliskraft verschwindet an den Polen und ist am Äquator am größten. Für eine Fallhöhe h = 100m erhält man dort die meßbare Abweichung von ≈ 2.2cm. Die Corioliskraft wirkt sich auf die horizontale Bewegung auf der Erde anders aus als auf die gerade studierte vertikale. Das wird besonders an den Polen klar, an denen die vertikale Bewegung gar nicht beeinflußt wird. Wird ein Geschoß am ~˙ × Ω und der Rechte-HandNordpol horizontal abgefeuert, so erfährt es gemäß R Regel eine Abweichung nach rechts, wenn man (von der Erde aus) längs der Bahn blickt (dem Geschoß hinterher schaut). Vom Ruhesystem aus betrachtet ist der Effekt klar: Das Teilchen fliegt geradeaus, während sich die Erde ostwärts dreht. Die Richtung der Corioliskraft F~cor im allgemeinen Fall kann man z.B. angeben, ~˙ = V~ in Kugelkoordinaten (mit normierten Basisvektoren; siehe indem man R Seite 167 des Skripts zur Vorlesung Einführung in die Theoretische Physik) ~ R + Vθ E ~ θ + Vφ E ~φ V~ = VR E ~ = ΩE3 = Ω(cos θE ~ R − sin θE ~ θ ) erhält man schreibt. Mit Ω h i ~ r + Vφ cos θE ~ θ − (VR sin θ + Vθ cos θ)E ~φ . F~cor = 2mΩ Vφ sin θE In der nördlichen Halbkugel wird somit ein nordwärts fliegendes Teilchen (Vφ = VR = 0, Vθ < 0) ostwärts abgelenkt, ein südwärtsfliegendes (Vφ = VR = 0, Vθ > 0) dagegen westwärts. Eine sehr elegante Art, die Erdrotation zu demonstrieren ist das Foucaultsche Pendel, dem sie in einer Übungsaufgabe begegnen werden. 2.3 Der starre Körper In der klassischen Mechanik definiert man den Begriff des starren Körpers als ein System von N Massepunkten (mit Massen mα ), deren Abstände |~rα − ~rβ | zeitlich 34 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II unveränderlich sind. In der Natur vorkommende “klassische” Körper erfüllen diese Bedingung natürlich nur näherungsweise, 9 jedoch ist die “Verformung” oft so klein, daß sie bei der Beschreibung der Bewegung des Körpers in guter Näherung vernachlässigt werden kann. Wir werden hier intensiven Gebrauch von den im letzten Kapitel dargestellten Ideen machen und verwenden daher die gleiche Notation. Es bietet sich an, das bewegte Bezugssytem K so zu legen, daß der starre Körper in ihm ruht, während das System k ein allgemeines Inertialsystem ist. Damit gilt (in K und für α = 1, 2, . . . , N ) ~˙ α = 0 . R Die Gl. (2.15) vereinfacht sich durch diese Wahl zu ~ ×R ~ α (t)] . ~r˙α (t) = ~r˙0 (t) + Bt [Ω (2.17) Die Lage des starren Körpers bezüglich des Inertialsystems k ist vollständig be~ α bekannt sind und die Beziehung zwischen k und K charakstimmt, wenn die R terisiert ist. Wie im letzten Kapitel diskutiert, ist die Lage von K bezüglich k bei fester Zeit t durch sechs (allgemein zeitabhängige) Zahlen charakterisiert, die drei Komponenten des Verschiebungsvektors und die drei Komponenten von ω ~. Die ersten drei Zahlen sind die Freiheitsgrade der Translation, die zweiten drei die der Rotation. Der Trägheitstensor: Als zentralen Begriff der Beschreibung der Rotation eines starren Körpers werden wir jetzt den Trägheitstensor10 einführen. Wir werden das anhand der Berechnung der kinetischen Energie der Bewegung eines starren Körpers tun. Mit Gl. (2.17) ergibt sich N 1X mα~r˙α2 T = 2 α=1 N 2 1X ~ ×R ~ α] mα ~r˙0 + Bt [Ω = 2 α=1 N 1X ~ ×R ~ α ] + [Ω ~ ×R ~ α ]2 , = mα ~r˙02 + 2~r˙0 · Bt [Ω 2 α=1 9 Ob ein ausgedehnter Körper als “starr” idealisiert werden kann, hängt vom Körper selbst (Material) und den wirkenden Kräften ab. 10 Wir haben im letzten Semester bereits häufiger den Begriff des Tensors benutzt, ohne ihn sauber zu definieren. Auch hier wollen wir davon absehen. Zuvor benötigten und jetzt benötigen wir nur Tensoren zweiter Stufe, die man mit einer Matrix (einer linearen Abbildung) identifizieren kann. 2.3. DER STARRE KÖRPER 35 wobei wir im letzten Schritte (letzter Term) erneut ausgenutzt haben, daß die Abbildung Bt alle Längen und relativen Winkel invariant läßt (orthogonale Matrix). ~ S = P mα R ~ α /M , Es ist vorteilhaft, den Ursprung von K in den Schwerpunkt R α P mit M = α mα , des starren Körpers zu legen. In diesem Fall verschwindet der P ~α = MR ~S = zweite Term auf der rechten Seite der obigen Gleichung, da α mα R 0. In dieser Wahl gilt ~r0 = ~rS und die kinetische Energie zerfällt in zwei Teile N T = 1 ˙2 1 X ~ ×R ~ α )2 M ~rS + mα (Ω 2 2 α=1 S = TS + Trot , S mit den Beiträgen TS der Schwerpunktsbewegung und Trot der Rotation um den Schwerpunkt (was den Index S erklärt). Sollte sich der Körper alternativ um einen in k festen Punkt ~rD drehen, dann legen wir den Ursprung von K in diesen Punkt. Verschieben wir zusätzlich den Ursprung von k in ~rD , so gilt ~r0 = 0 und es folgt N 1X ~ ×R ~ α )2 = T D . mα (Ω T = rot 2 α=1 In beiden Fällen gilt N Trot = 1X ~ ×R ~ α )2 mα (Ω 2 α=1 N = 1X ~ 2R ~ α2 − [Ω ~ ·R ~ α ]2 . mα Ω 2 α=1 Dieser Ausdruck läßt sich nun vereinfachen, wenn wir die 3 × 3-Matrix I mit den Matrixelementen Ii,j = N X mα ~ 2 − Rα,i Rα,j δi,j R α α=1 einführen. Dieses ist der Trägheitstensor. Es gilt dann 1X Ωi Ii,j Ωj . Trot = 2 i,j (2.18) ~ α des starren Körpers per Definition zeitunabhängig sind, gilt Da die Vektoren R gleiches für den Trägheitstensor I. Bevor wir den Trägheitstensor weiter untersuchen und exemplarisch berechnen, wollen wir auch den Gesamtdrehimpuls eines starren Körpers umschreiben. 36 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II Wir starten mit dem Ausdruck für den Gesamtdrehimpuls (bezüglich eines festen Ursprungs) in einem Inertialsystem ~ltot = N X mα~rα × ~r˙α . α=1 ~ α in K aus, so folgt Drücken wir nun ~rα und ~r˙α durch R ~ltot = N X h i ~ α × ~r˙0 + Bt Ω ~ ×R ~α mα ~r0 + Bt R . α=1 Zunächst legen wir erneut den Ursprung von K in den Schwerpunkt des star~ α linear enthalten, im obigen ren Körpers. Dann verschwinden die Terme, die R Produkt. Es gilt ! N h i X ~ltot = M~rS × ~r˙S + Bt ~α × Ω ~ ×R ~α mα R α=1 N X = M~rS × ~r˙S + Bt h ~R ~2 − R ~ α (Ω ~ ·R ~ α) mα Ω α ! i (2.19) α=1 S = ~lS + ~lrot . Dabei haben wir in der ersten Zeile die Invarianz von Längen und Relativwinkeln unter der Rotation verwendet und im letzten Schritt die Beiträge der SchwerS punktbewegung ~lS und der Rotation ~lrot zum Gesamtdrehimpuls definiert. Gibt es einen in k raumfesten Drehpunkt, so legen wir die Ursprünge von k und K in diesen. Wegen ~r0 = 0 gilt dann ! N h i X ~ltot = Bt ~R ~2 − R ~ α (Ω ~ ·R ~ α) mα Ω = ~lD . α rot α=1 In beiden Fällen gilt für den Rotationsanteil zum Drehimpuls nach Transformation nach K ~ rot = Bt−1~lrot = L N X i h 2 ~ ~ ~ ~ ~ mα ΩRα − Rα (Ω · Rα ) α=1 bzw. ~ rot = IΩ ~ L also Lrot,i = X j Ii,j Ωj . (2.20) 2.3. DER STARRE KÖRPER 37 ~ rot und die WinkelgeschwindigEs ist wichtig festzuhalten, daß der Drehimpuls L ~ keit Ω (in K) im Allgemeinen nicht parallel sind. Aus Gl. (2.18) folgt 1 ~ 1~ ~ ~ · lrot , · Lrot = ω Trot = Ω 2 2 wobei wir im zweiten Schritt ausgenutzt haben, daß Bt die Winkel und Längen invariant läßt. Der Beitrag der Rotation zur kinetischen Energie hat somit in k und K die gleiche Form. Wir wollen nun ausgehend von Gl. (2.20) den Beitrag der Rotation zum Drehimpuls in k berechnen. Es gilt ~lrot = Bt L ~ rot ~ = Bt IBt−1 Bt Ω (k) = It ω ~ , wobei wir im letzten Schritt den transformierten Trägheitstensor (k) It = Bt IBt−1 definiert haben. Dieser ist im Gegensatz zu dem Trägheitstensor in K im Allgemeinen zeitabhängig. Folgend wollen wir den Trägheitstensor genauer untersuchen und exemplarisch berechnen. Aus der Definition wird klar, daß I eine (reelle) symmetrische Matrix ist. Wir haben das Eigenwertproblem für solche Matrizen in Kapitel 2.14 der Vorlesung des letzten Semesters untersucht. Wie dort diskutiert gibt es drei paarweise senkrechte und auf eins normierte Eigenvektoren. Die zugehörigen Koordinatenachsen bezeichnet man als Hauptträgheitsachsen des starren Körpers. Die Eigenwerte Ii (Diagonalelemente des diagonalen Trägheitstensors in der Basis aus Eigenvektoren) bezeichnet man als Hauptträgheitsmomente. ~ i in K die Hauptträgheitsachsen des Nehmen wir an, daß die Basisvektoren E starren Körpers sind – was man durch eine Hauptachsentransformation immer erreichen kann – so lautet nach Gl. (2.18) der Rotationsbeitrag zur kinetischen Energie 1 I1 Ω21 + I2 Ω22 + I3 Ω23 Trot = 2 und die Komponenten des Rotationsbeitrags zum Drehimpuls Lrot,i = Ii Ωi . Damit gilt auch Trot 1 = 2 L2rot,1 L2rot,2 L2rot,3 + + I1 I2 I3 . Man unterscheidet anhand der Ii verschiedene starre Körper: 38 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II 1. Ist der Köper eindimensional, liegen also alle Massepunkte auf einer Gera~ 3 -Achse, so gilt I1 = I2 6= 0 und I3 = 0. Man nennt den den, z.B. auf der E starren Körper dann einen Rotator. 2. Man nennt den starren Körper unsymmetrisch, falls alle Ii verschieden sind. 3. Der starre Körper heißt symmetrisch, falls zwei der Hauptträgheitsmomente identisch sind I1 = I2 6= I3 . 4. Gilt I1 = I2 = I3 , so heißt der starre Körper kugelartig. Dabei können nicht nur Kugeln kugelartig sein (siehe unten). In Körpern, die eine Symmetrie aufweisen, ist es einfach die Hauptträgheitsachsen zu bestimmen. Eine liegt in diesem Fall entlang der Symmetrieachse und die beiden anderen können dazu senkrecht (und paarweise senkrecht) frei gewählt werden. Bisher haben wir den starren Körper durch die Angabe der N Massen mα und ~ α charakterisiert. In den typischen Situationen (z.B. bei die zugehörigen Orte R einem Kreisel) ist der Körper jedoch kontinuierlich – oft mit homogener Massendichte ρ = M/V , mit der Gesamtmasse M und dem Volumen V des Körpers. In diesem Fall müssen wir in der Berechnung des Trägheitstensors von einer diskreten Summe zum Integral übergehen. Für den Fall der homogenen Masseverteilung ist dies einfach, indem wir die Massen mα immer kleiner machen und die Zahl N der Massepunkte, bei konstanter Gesamtmasse, erhöhen. Im Limes N → ∞ folgt so N X Z mα . . . → ρ . . . d3 x V α=1 , wobei das V am Integralzeichen anzeigt, daß über das Volumen des starren Körpers zu integrieren ist. Für den Trägheitstensor ergibt sich Z Ii,j = ρ δi,j ~x2 − xi xj d3 x . V Ist die Verteilung der Masse in einem kontinuierlichen starren Körper nicht homogen, so müssen wir anders vorgehen. Auch wenn dieser Fall im Folgenden keine zentrale Rolle spielen wird, wollen wir ihn hier betrachten. Wir führen eine allgemeine ortsabhängige Massendichte ρ(~x) ein. Um den Trägheitstensor als Integral über diese Dichte zu schreiben definieren wir ρ(~x) = N X α=1 ~ α) . mα δ(~x − R 2.3. DER STARRE KÖRPER 39 Dabei haben wir die Diracsche Deltafunktion δ(~y ) eingeführt. Sie hat (bei hinreichend harmloser Funktion f ) die Eigenschaft Z δ(~x − ~x0 )f (~x) d3 x = f (~x0 ) . R3 Um dieses zu erreichen, muß die Deltafunktion bei ~x = ~x0 divergieren (unendlich sein) und für alle anderen Punkte verschwinden. Es handelt sich bei δ(~x) somit nicht um eine gewöhnliche Funktion, sondern eine sogenannte Distribution. Sie werden im Laufe ihres Studiums lernen mit der Deltafunktion (und Distributionen im Allgemeinen) umzugehen. Hier benötigen wir nur, daß Ii,j = = N X α=1 N X mα Z mα = R3 Z = ~ α )d x δ(~x − R 3 h R3 α=1 Z ~ 2 − Rα,i Rα,j δi,j R α " N X ~ 2 − Rα,i Rα,j δi,j R α i # ~ α) mα δ(~x − R δi,j ~x2 − xi xj d3 x α=1 ρ(~x) δi,j ~x2 − xi xj d3 x , R3 wobei wir ausgenutzt haben, daß man unter dem Integral in Anwesenheit der Deltafunktion Rα,i durch xi ersetzen kann. Ausgehend von diesem Ausdruck ist es nun leicht, den Kontinuumslimes auszuführen, indem man ρ(~x) durch eine kontinuierliche Massendichte (kontinuierliche Funktion von ~x) ersetzt. Ist die Masse homogen, so gilt ρ(~x) = ρ innerhalb des starren Körpers und ρ(~x) = 0 außerhalb. Die explizite Berechnung von Trägheitstensoren: Wir wollen als nächstes exemplarisch den Trägheitstensor (bzw. die Hauptträgheitsmomente) eines homogenen Zylinders und einer homogenen Kugel berechnen. In Matrixform lautet der allgemeine Ausdruck des Trägheitstensors für einen kontinuierlichen starren ~ i }-Basis) Körper (in der {E R R R (xR22 + x23 )ρ(~x)d3 x R− x1 x2 ρ(~x)d3 x − R x1 x3 ρ(~x)d3 x (xR21 + x23 )ρ(~x)d3 x R− x2 x3 ρ(~x)d3 x . I = − R x2 x1 ρ(~x)d3 x − x3 x1 ρ(~x)d3 x − x3 x2 ρ(~x)d3 x (x21 + x22 )ρ(~x)d3 x ~ 3 entlang der Zylinderachse und den Ursprung in den Schwerpunkt Legen wir E des Zylinders der Höhe L und des Radius r0 , so verschwinden die Außerdiagonalelemente aus Symmetriegründen (anders gesagt, wir haben die Hauptträgheitsachsen aufgrund des Symmetrie bereits identifiziert). Wie man sofort sieht gilt 40 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II allgemein I1,1 + I2,2 ≥ I3,3 , I2,2 + I3,3 ≥ I1,1 und I3,3 + I1,1 ≥ I2,2 und damit auch für die Haupträgheitsmomente I1 + I2 ≥ I3 , I2 + I3 ≥ I1 , I3 + I1 ≥ I2 . Die für den homogenen Zylinder auftretenden Integrale können nun leicht bestimmt werden (Polarkoordinaten in x1 -x2 -Ebene). Die fundamentalen Integrale sind Z L/2 Z r0 Z Z Z 1 2 2 3 2 3 2 3 r3 dr dx3 = πLr04 /4 (x1 + x2 )d x = π x1 d x = x2 d x = 2 V −L/2 0 V V und Z x23 d3 x V Z L/2 = 2π x23 r0 Z −L/2 rdr dx3 = πL3 r02 /12 . 0 Durch entsprechende Kombination dieser Integrale erhält man 2 r0 L 2 r2 + I1 = I2 = M , I3 = M 0 . 4 12 2 √ Im Spezialfall L = 3r0 ist der Zylinder kugelartig (aber keine Kugel). Für die homogene Kugel mit Radius r0 wählen wir als den Ursprung den Schwerpunkt. Die Wahl der drei paarweise orthogonalen Achsen ist aufgrund der Symmetrie frei. Alle Nebendiagonalelemente verschwinden. Das fundamentale Integral ist (in Kugelkoordinaten) Z Z 1 2 3 r2 d3 x xi d x = 3 V V Z Z Z 1 2π π r0 = sin θ r4 dr dθ dφ 3 0 0 0 4π r05 = . 3 5 Damit ergibt sich 2 I1 = I2 = I3 = ρ 3 Z V 2 r2 d3 x = M r02 . 5 In Übungsaufgaben werden sie weitere Trägheitstensoren berechnen und Situationen studieren, in denen eine Hauptachsentransformation noch explizit ausgeführt werden muß. Die Dynamik eines starren Körpers: In Kapitel 3.3 der Vorlesung des letzten Semesters haben wir die Bewegungsgleichungen und Erhaltungsgrößen des 2.3. DER STARRE KÖRPER 41 N -Teilchen-Problems behandelt. Basierend auf diesen wollen wir nun die Dynamik des starren Körpers untersuchen. Dabei werden die möglichen Bewegungstypen insbesondere für spezielle Klassen von starren Körpern charakterisiert. Die Bewegungsgleichung des Schwerpunktes ~rS (im Inertialsystem k) lautet M ~r¨S = N X ext f~αext = f~tot . (2.21) α=1 Für die Ableitung des Gesamtdrehimpulses gilt N X ~l˙tot = ~rα × f~αext = ~ntot , α=1 mit dem Gesamtdrehmoment ~ntot in k. Mit ~ α = ~r0 + ~rα0 , ~rα = ~r0 + Bt R und Gl. (2.19) folgt N N α=1 α=1 X X 0 ~l˙tot = M~rS × ~r¨S + ~l˙ S = ~rS × f~αext + ~rα × f~αext , rot falls wir (siehe oben) ~r0 = ~rS wählen. Durch Ausnutzen von Gl. (2.21) können wir daraus eine Gleichung für die Zeitableitung des Rotationsanteils des Drehimpulses ableiten (gültig für ~r0 = ~rS ) N N X X 0 ~ext = ~l˙ S = ~ α ) × f~ext = ~nS , (Bt R × f ~ r α rot α α rot α=1 (2.22) α=1 mit dem Rotationsanteil zum Drehmoment ~nSrot (bei der Wahl ~r0 = ~rS ). Für einen Kreisel mit raumfestem (in k) Drehpunkt wählt man wie zuvor ~r0 = 0 und erhält N N X X ~l˙ D = ~ α ) × f~αext = ~nD ~rα × f~αext = (Bt R rot rot . α=1 (2.23) α=1 Als Beispiel für die ein Drehmoment generierende äußere Kraft betrachten wir die Schwerkraft f~αext = mα~g . Wir wollen zunächst den Wurf eines starren Körpers (z.B. eines Diskus) beschreiben. Dazu legen wir den Ursprung von K in den Schwerpunkt des Körpers, wählen also ~r0 = ~rS . Dann gilt nach unseren allgemeinen Überlegungen N N α=1 α=1 X X ~l˙ S = ~ α ) × mα~g = ~ α )] × ~g = 0 , (B R [Bt (mα R t rot 42 da KAPITEL 2. NEWTONSCHE MECHANIK TEIL II P α ~α = MR ~ S = 0 und das Drehmoment ~nSrot verschwindet. Damit folgt mα R ~lS = const. rot und der Rotationsbeitrag zum Gesamtdrehimpuls ist eine Erhaltungsgröße. Für den Fall eines Kreisels im Schwerefeld mit festem Drehpunkt wählen wir ~r0 = 0 (Ursprung von K und k im festen Drehpunkt; siehe oben) und erhalten N X ~l˙ D = ~rα × mα~g = M~rS × ~g rot (2.24) α=1 also ein nicht verschwindendes Drehmoment. Neben der Schwerkraft wirkt im Drehpunkt des Kreisels noch eine Zwangskraft. Zwangskräfte werden wir im folgenden Kapitel über den Lagrange-Formalismus diskutieren. Hier ist es nur wichtig festzuhalten, daß die Zwangskraft aufgrund der Wahl des Ursprungs von k und K im Drehpunkt und des Faktors ~rα nicht zum Drehmoment ~nD rot beiträgt. Im nächsten Abschnitt wollen wir die Dynamik eines speziellen Kreisels, des symmetrischen schweren Kreisels mit festem Drehpunkt, untersuchen. Die Dynamik des symmetrischen schweren Kreisels: Wir diskutieren die Bewegung im Inertialsystem k, dessen Ursprung im festen Drehpunkt liegen soll. Auch der Ursprung des körperfesten Systems K liege in diesem Punkt (d.h. es D gilt ~r0 = 0). Nach Gl. (2.24) gilt mit der abkürzenden Schreibweise ~l = ~ltot ~l˙ = M~rS × ~g mit dem Ortsvektor ~rS des Schwerpunkts des Kreisels (in k). Wir legen das System ~ 3 vom Koordinatenursprung zum Schwerpunkt zeigt, also ~rS = a~e 0 = K so, daß E 3 ~ 3 gilt. Mit ~g = −g~e3 folgt aBt E ~l˙ = M ga ~e3 × ~e 0 . (2.25) 3 Wir benötigen eine zusätzliche Differentialgleichung für den zeitabhängigen Vek0 tor ~e3 . Diese folgt als Spezialfall der Beziehung ~r˙α = ω ~ × ~rα , die für alle festen ˙~ Punkte in K mit Rα = 0, d.h. für alle Massenpunkte des Kreisels gilt 0 0 ~e˙ 3 = ω ~ × ~e3 . (2.26) 0 In den Gln. (2.25) und (2.26) treten die zeitabhängigen Vektoren ~l, ~e3 und ω ~ ~ = IΩ, ~ wobei I zeitunabhängig ist. Dagegen auf. In K besteht die Beziehung L ist die Abbildung zwischen der Winkelgeschwindigkeit ω ~ und dem Drehimpuls ~l in k zeitabhängig, was eine einfache Lösung des Kreiselproblems für allgemeine Hauptträgheitsmomente Ii verhindert. Wir beschränken uns daher, wie oben 2.3. DER STARRE KÖRPER 43 schon angedeutet, auf den symmetrischen Kreisel, bei dem (mindestens) zwei Hauptträgheitsmomente identisch sind. Wählen wir I1 = I2 , dann liegt der Schwerpunkt des Kreisels auf der Figu~ 3 gegeben ist. In diesem Fall renachse, deren Richtung durch die Hauptachse E gilt ~l = l1~e1 + l2~e2 + l3~e3 = L1~e 0 + L2~e 0 + L3~e 0 1 2 3 0 0 0 0 = I1 Ω1~e1 + Ω2~e2 + I3 Ω3~e3 = I1 ω ~ + (I3 − I1 )Ω3~e3 . 0 Damit liegen die zeitabhängigen Vektoren ~l, ~e3 und ω ~ in einer Ebene, d.h. sie sind koplanar. Wir verwenden die resultierende Relation 1 ~ 0 l − (I3 − I1 )Ω3~e3 ω ~ = I1 um ω ~ aus Gl. (2.26) zu eliminieren. Man erhält so 1 ~ 0 0 ~e˙ 3 = l × ~e3 . I1 (2.27) In k dreht somit die Figurenachse eines symmetrischen Kreisels mit der Winˆ kelgeschindigkeit |~l|/I1 um die instantane Richtung des Drehimpulses ~l. Für den schweren symmetrischen Kreisel (mit a > 0) ist ~l zeitabhängig. Der kräftefreie, symmetrische Kreisel: Für speziell konstruierte Kreisel läßt sich auch der Fall a = 0 einstellen. Dann verschwindet nach Gl. (2.25) das Drehmoment und der Kreisel verhält sich wie ein kräftefreier Kreisel mit einem raumfesten Drehimpulsvektor ~l. Die Figurenachse rotiert in diesem Fall mit der Frequenz ωnut = |~l|/I1 um ~l. Diese Bewegung wird als Nutation bezeichnet. Auch im all0 gemeinen Fall mit a 6= 0 bezeichnet man die Rotation der Figurenachse ~e3 um die Drehimpulsachse als Nutation. Für a 6= 0 ist die Drehimpulsachse im Gegensatz zum vorliegenden kräftefreien Fall jedoch nicht mehr zeitunabhängig (nicht mehr raumfest). Da der Schwerpunkt im kräftefreien Fall im festen Drehpunkt liegt, ist die ~e3 -Achse im kräftefreien Kreisel nicht ausgezeichnet. Für Anfangs0 bedingungen ~e3 (t = 0) ∼ ~l bleibt auch die Figurenachse raumfest. Zusätzlich zur beschriebenen Nutation rotiert der starre Körper selbstverständlich um seine Figurenachse. Die Bewegung für a 6= 0: Für beliebige Werte von a gibt es zwei Erhaltungsgrößen. Die erste folgt aus einer skalaren Multiplikation von Gl. (2.25) mit ~e3 ⇒ ~l˙ · ~e3 = dl3 = M ga ~e3 × ~e 0 · ~e3 = 0 3 dt l3 = const. 44 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II Die zweite erhält man, indem man Gl. (2.27) skalar mit ~l und Gl. (2.25) skalar 0 mit ~e3 multipliziert. Die rechten Seiten geben jeweils Null, so daß durch Addition ~l · ~e˙ 0 + ~l˙ · ~e 0 = d ~l · ~e 0 = 0 3 3 3 dt ⇒ L3 = const. folgt. Somit sind die Projektionen des Drehimpulsvektors auf die Richtung ~e3 des 0 Schwerefeldes und die Richtung ~e3 der Figurenachse Erhaltungsgrößen. Folgend führen wir den zentralen “Trick” zur Lösung der Bewegungsgleichun~ gen des symmetrischen schweren Kreisels ein. Wir zerlegen den Drehimpuls l in 0 der Basis ~e3 , ~e3 , ~e⊥ mit 0 ~e⊥ = (~e3 × ~e3 )/ sin θ . 0 Dabei bezeichnet θ den Winkel zwischen ~e3 und ~e3 . Die drei Vektoren des Basis0 systems sind auf Eins normiert, jedoch stehen ~e3 und ~e3 nur für θ = π/2 senkrecht aufeinander (beide stehen per Konstruktion senkrecht auf ~e⊥ ). Die Basis besteht somit im Allgemeinen nicht aus orthogonalen Vektoren. Weiterhin liegt eine Basis nur dann vor, wenn θ weder 0 noch π ist. Es gilt (Index v steht für vertikal, Index s für Spin) ~l(t) = lv (t)~e3 + ls (t)~e 0 (t) + l⊥ (t)~e⊥ (t) . 3 (2.28) Die Entwicklungskoeffizienten lv und ls lassen sich durch die Erhaltungsgrößen l3 und L3 , sowie den Winkel θ ausdrücken l3 = ~e3 · ~l = lv + ls cos θ , 0 L3 = ~e3 · ~l = lv cos θ + ls . Dieses Gleichungssystem läßt sich leicht lösen und man erhält lv = l3 − L3 cos θ , sin2 θ ls = L3 − l3 cos θ . sin2 θ (2.29) Ist somit θ zeitabhängig so gilt Gleiches für lv und ls . Setzt man die Entwicklung Gl. (2.28) in Gl. (2.27) ein, so ergibt sich ˙~e 0 = lv ~e3 + l⊥ ~e⊥ × ~e 0 . 3 3 I1 I1 0 Gibt man die Orientierung von ~e3 in Kugelkoordinaten mit den Winkeln θ und φ 0 an, so beschreibt φ̇ die Winkelgeschwindigkeit von ~e3 um die ~e3 -Achse und θ̇ die um die ~e⊥ -Achse. Man kann damit ablesen, daß φ̇ = lv l3 − L3 cos θ l⊥ = , θ̇ = 2 I1 I1 I1 sin θ (2.30) 2.3. DER STARRE KÖRPER 45 gilt. Lösungen mit l⊥ = 0 entsprechen somit einer Kreiselbewegung mit festem (zeitunabhängigem) Winkel θ zwischen der Richtung des Schwerefeldes ~e3 und 0 der Figurenachse ~e3 . Um θ(t) und φ(t) zu bestimmen, verwenden wir zusätzlich die Erhaltung der Gesamtenergie. Die kinetische Energie der Rotation ist Trot = L21 + L22 L2 + 3 . 2I1 2I3 Um diese umzuschreiben betrachten wir ~l − L3~e 0 = L1~e 0 + L2~e 0 = lv~e3 + (ls − L3 )~e 0 + l⊥~e⊥ . 3 1 2 3 Quadrieren der rechten Gleichung liefert 0 2 2 = lv2 sin2 θ + l⊥ , L21 + L22 = lv2 + (ls − L3 )2 + 2lv (ls − L3 )~e3 · ~e3 + l⊥ 0 wobei wir im letzten Schritt ls −L3 = −lv cos θ (siehe Gl. (2.29)) und ~e3 ·~e3 = cos θ verwendet haben. Ersetzt man in diesem Ausdruck lv und l⊥ gemäß Gl. (2.30), so folgt für die kinetische Energie der Rotation Trot = I1 2 (l3 − L3 cos θ)2 L23 θ̇ + + . 2 2I3 2I1 sin2 θ Zu Trot müssen wir noch die potentielle Energie hinzuaddieren und erhalten für die (erhaltene) Gesamtenergie E = Trot + M ga cos θ , bzw. mit E 0 = E − L23 /(2I3 ) (ebenfalls erhalten) E0 = I1 2 (l3 − L3 cos θ)2 θ̇ + + M ga cos θ . 2 2I1 sin2 θ In dieser Gleichung sind alle auftretenden Größen außer dem Winkel θ zeitunabhängig. Differentialgleichungen dieses Typs sind uns bereits wiederholt begegnet. Identifizieren wir I1 mit der Masse eines Teilchens, so ist das verbleibende Problem äquivalent zu einer eindimensionalen Bewegung im effektiven Potential Veff (θ) = (l3 − L3 cos θ)2 + M ga cos θ . 2I1 sin2 θ (2.31) Wie wir diese Art Probleme (zumindest formal) lösen, sollte ihnen inzwischen klar sein. Die folgende Abbildung zeigt das effektive Potential für verschiedene Parameter. Das obere Kurvenpaar ist für l3 /L3 = 1.25 mit η = 0.1 (durchgezogen) und η = 0 (gestrichelt) berechnet, wobei η = 2I1 M ga/L23 . Beim unteren Kurvenpaar gilt l3 /L3 = 0.8, bei denselben η wie oben (selbe Kodierung). 46 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II 2I1Veff/L3 2 2 0 0 1 θ 2 Anhand des effektiven Potentials für die Zeitabhängigkeit von θ wird klar, daß die Bewegung in θ-Richtung finit und periodisch ist. Wir werden darauf folgend zurückkommen. Nachdem θ(t) bestimmt wurde, folgt die Zeitabhängigkeit von φ durch Integration Z t l3 − L3 cos θ(t0 ) 0 dt . φ(t) − φ(0) = I1 sin2 θ(t0 ) 0 Bei der Lösung der Bewegungsgleichung treten sechs Anfangsbedingungen auf: θ(0), θ̇(0), L3 , φ(0), φ̇(0) (oder l3 , beide hängen gemäß Gl. (2.30) zusammen) und der Anfangswinkel eines beliebigen Punktes des starren Köpers bezüglich der Drehung um die Figurenachse. Die Bewegung mit θ = const.: Wir beginnen die Diskussion der Bewegung der Figurenachse mit dem Spezialfall, daß θ zeitlich konstant ist. Diese Bewegung kann realisiert werden, wenn der Winkel den Wert θ0 annimmt, an dem das Potential Veff (θ) minimal wird. Wir benötigen also die Ableitung (l3 − L3 cos θ)(L3 − l3 cos θ) − M ga sin θ I1 sin3 θ lv ls = − M ga sin θ . I1 0 Veff (θ) = Die rechte Seite wird Null, wenn entweder θ = 0, π (kein Minimum) oder lv ls − M ga = 0 . I1 (2.32) Mit Gl. (2.29) liefert diese Gleichung eine Beziehung zwischen l3 , L3 und cos θ0 . Da θ(t) = θ0 , folgt nach Gl. (2.30) l⊥ = 0 und damit für den Drehimpuls ~l(t) = lv~e3 + ls~e 0 (t) , 3 2.3. DER STARRE KÖRPER 47 wobei lv und ls konstant und von θ0 abhängig sind. Wir legen nun zusätzlich fest, daß a = 0 gilt (kräftefreier Kreisel). Wie bereits oben diskutiert, ist dann ~l raumfest. Die Gleichung lv ls = 0 hat zwei Lösungen. 0 0 Für lv = 0 folgt φ̇ = 0 und damit ~l = ls~e3 = L3~e3 . In diesem Fall sind der Drehimpulsvektor und die Figurenachse raumfest und parallel. Sie schließen mit ~e3 den Winkel θ0 ein. Die einzige Bewegung des starre Körpers ist die Rotation um die Figurenachse. Für ls = 0 folgt ~l = lv~e3 = l3~e3 , d.h. φ̇ = l3 /I1 . Dies ist die Nutation um die ~l-Achse (welche im vorliegenden Fall der ~e3 -Achse entspricht) mit Öffnungswinkel θ0 . Zusätzlich rotiert der Kreisel um die Figurenachse. Im allgemeinen Fall a 6= 0 erhält man mit lv = (L3 − ls )/ cos θ0 (siehe Gl. (2.29)) aus Gl. (2.32) die quadratische Gleichung (in ls ) ls (L3 − ls ) = I1 M ga cos θ mit den zwei Lösungen ls,± = p L3 1 ± 1 − 2η cos θ0 , 2 wobei η = 2I1 M ga/L23 (siehe oben). Für lv ergibt sich daraus lv,± p L3 = 1 ∓ 1 − 2η cos θ0 . 2 cos θ0 Die dimensionslose Größe η ist klein, wenn die potentielle Energie des Kreisels im Schwerefeld klein gegenüber der Rotationsenergie L23 /(2I1 ) ist. Die sich dann 0 ergebene Relation zwischen ~e3 , ~e3 und ~l ist in der folgenden Skizze dargestellt. l l e3 e3 e3 e3 Für den vorliegenden Fall des schnellen schweren symmetrischen Kreisels kann man die Wurzel in den Ausdrücken für ls,± und lv,± entwickeln. Die beiden Lösungen unterscheiden sich durch Terme der Größenordnung η von der Lösung des kräftefreien Kreisels. Trotzdem unterscheiden sich die “+”-Lösung und die “φ̇ = 0”-Lösung des kräftefreien Falls qualitativ. Die Winkelgeschwindigkeit um 48 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II die ~e3 -Achse ist φ̇± = lv,± M ga = . I1 ls,± Entwickelt erhält man für die +-Lösung ergibt sich i M ga h η M ga 2 = 1 + cos θ0 + O(η ) . φ̇+ = ls,+ L3 2 Die Figurenachse rotiert, bzw. präzidiert, mit der langsamen Präzessionsfrequenz um die ~e3 -Achse, wobei für den schnellen schweren symmetrischen Kreisel 0 φ̇+ L3 /I1 gilt. Der Gesamtdrehimpuls ~l zeigt fast in die ~e3 -Richtung (siehe die obige Skizze). Das bedeutet, daß die Rotation des Kreisels um seine Figurenachse über die Präzession “dominiert” (die Präzessionsfrequenz ist “klein”). Im Gegensatz dazu unterscheidet sich die “−”-Lösung (schnelle Präzession) für η 1 qualitativ nicht von der Nutation des Grenzfalls a = 0 (Rotation des Körpers um die Figurenachse und Nutation der Figurenachse um die Drehimpulsrichtung). Der Gesamtdrehimpuls ~l zeigt näherungsweise in die ~e3 -Richtung (siehe die obige Skizze). Die generische Bewegung mit E 0 > Veff (θ0 ): Folgend betrachten wir die Bewegung mit zeitlich sich änderndem θ indem sich Nutation und Präzession überlagern (und der Kreisel um seine Figurenachse rotiert). Aus der Skizze von Veff (θ) wird klar, daß θ(t) eine periodische Funktion der Zeit ist (zwischen E 0 -abhängigen θmin und θmax ). Wir beschränken uns auf den Fall L3 > l3 > 0 und a > 0, der im Limes E 0 → Veff (θ0 ) der langsamen Präzession entspricht. Dann verschwindet der erste Term in der Definitionsgleichung (2.31) für Veff bei θa=0 = arccos (l3 /L3 )). Da das Gravitationspotential M ga cos θ monoton mit θ abnimmt, liegt das Minimum θa von Veff rechts von θa=0 . Dies ist in der folgenden Skizze illustriert. 2 2 2I1Veff/L3 a=0 a>0 E’2 E’1 0 0 1 θ 2 2.3. DER STARRE KÖRPER 49 Das Verhalten der Winkelgeschwindigkeit φ̇ versteht man leicht, wenn man die Beziehung l3 = L3 cos θa=0 in Gl. (2.29) einsetzt und das resultierende Ergebnis für lv in Gl. (2.30). Damit erhält man φ̇(t) = L3 [cos θa=0 − cos θ(t)] . I1 sin2 [θ(t)] Falls E 0 so gewählt wird, daß θmin > θa=0 , wie in der Skizze für E10 , hat φ̇ für alle Zeiten dasselbe Vorzeichen (rote Kurve in der folgenden Skizze). Dagegen wechselt für Energien mit θmin < θa=0 , wie bei E20 , φ̇ das Vorzeichen. In diesem Fall folgt 0 die Spitze von ~e3 einer Rosettenbahn (auf der Einheitskugel) zwischen θmin und θmax (blaue Kurve in der folgenden Skizze; die schwarze Kurve zeigt den Grenzfall θmin = θa=0 ). Die Bahnkurven sind im Allgemeinen nicht geschlossen. Eine quantitative Anlayse läßt sich ausführen, wenn man Veff durch eine Parabel um das Minimum approximiert. Das diskutierte Verhalten der kombinierten Nutation und Präzession ist in der folgenden Skizze für verschiedene Energien dargestellt. Sie zeigt die Projektion der Bewegung des Punktes θ(t), φ(t) auf der Einheitskugel auf die x1 -x2 -Ebene. Der projezierte Drehimpulsvektor ~l beschreibt eine Kreisbahn (Präzession) um den Ursprung (d.h. um die ~e3 -Richtung), um die herum die Nutation stattfindet (Nutationsfrequenz größer als Präzessionsfrequenz). Um die Bewegungsformen des schweren symmetrischen Kreisels besser zu verstehen, ist es sehr empfehlenswert mit dem in der Vorlesung gezeigten Java-Applet zu experimentieren, welches unter http://faculty.ifmo.ru/butikov/Applets/Gyroscope.html zu finden ist. In diesem zeigt der rote Vektor bzw. die rote Spur den Drehimpulsvektor bzw. seine Projektion. Die gelbe Spur ist die Projektion der Figurenachse, wie sie in der obigen Abbildung dargestellt ist. In der “List of Examples” des 50 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II Applets sind für das gerade Diskutierte die Punkte 2 und 3 von Interesse. Dabei empfehle ich im Punkt 2 den Kasten mit “Show Trace” wegzuklicken, da ich die violette Bahn im Hinblick auf die obige Diskussion als verwirrend empfinde. Die Eulerschen Kreiselgleichungen: In der Beschreibung der Dynamik des symmetrischen schweren Kreisels im Inertialsystem k konnten wir das Problem, daß die Beziehung zwischen Drehimplusvektor und Winkelgeschwindigkeit nur in K einfach ist (Li = Ii Ωi ), geschickt umgehen. Für einen unsymmetrischen Kreisel gelingt das nicht. Daher betrachten wir hier die Bewegungsgleichung (siehe Gln. (2.22) und (2.23)) N X ~l˙rot = ~nrot = ~ α × f~αext Bt R α=1 im körperfesten System K. Wie zuvor, wird folgend der Index “rot” unterdrückt. Mit h i ~l˙ = d (Bt L) ~ = Ḃt L ~ + Bt L ~˙ = Bt Ω ~ ×L ~ +L ~˙ dt ~ und nach Anwenden von Bt−1 folgt unter Verwendung von ~n = Bt N ~˙ + Ω ~ ×L ~ =N ~ . L ~ in K ist durch Das Drehmonent N ~ = N N X ~ α × B −1 f~ext R t α α=1 gegeben. Im Schwerefeld mit f~αext = mα~g (kleine Höhe) ergibt sich somit ~ = N N X ~ α × B −1~g = M R ~ S × G(t) ~ mα R , t (2.33) α=1 ~ mit G(t) = Bt−1~g . ˙ Es wird klar, daß die Gleichung ~l = ~n in K eine kompliziertere Form annimmt. ~ = IΩ ~ kann man L ~ aus der Gleichung eliminieren und Mit Hilfe der Beziehung L erhält ~˙ + Ω ~ × IΩ ~ =N ~ . IΩ ~ i in K als die Hauptträgheitsachsen, so folgen die Wählt man die Basisvektoren E Eulerschen Kreiselgleichungen I1 Ω̇1 + (I3 − I2 )Ω2 Ω3 = N1 , I2 Ω̇2 + (I1 − I3 )Ω1 Ω3 = N2 , I3 Ω̇3 + (I2 − I1 )Ω1 Ω2 = N3 . 2.3. DER STARRE KÖRPER 51 Folgend wollen wir die Beispiele des Wurfes eines starren Körpers (z.B. Diskus) und des Kreisels mit raumfestem Drehpunkt im Schwerefeld betrachten. Für den Wurf legen wir den Ursprung von K in den Schwerpunkt des Kreisels. Wegen ~ S = 0 verschwindet das Drehmoment Gl. (2.33) und man erhält die EulergleiR chungen des kräftefreien Kreisels I1 Ω̇1 + (I3 − I2 )Ω2 Ω3 = 0 , I2 Ω̇2 + (I1 − I3 )Ω1 Ω3 = 0 , I3 Ω̇3 + (I2 − I1 )Ω1 Ω2 = 0 . Für einen symmetrischen Körper mit I1 = I2 ist die Lösung des Gleichungssystems einfach. Aus der dritten Gleichung folgt Ω3 = const., d.h. die Erhaltung von L3 . Das übrigbleibende System von zwei linearen Differentialgleichungen mit konstanten Koeffizienten werden sie in einer Übungsaufgabe weiter untersuchen. Für einen unsymmetrischen starren Körper führt die allgemeine Lösung des Differentialgleichungssystems auf sogenannte elliptische Integrale (siehe Literatur; z.B. Landau-Lifschitz, Band I, § 37). Wir werden diesen Fall hier nicht weiter diskutieren. Für den Kreisel mit raumfestem Drehpunkt folgt für das Drehmoment ~ = MR ~S × G ~ = M aE ~3 × G ~ , N (2.34) wobei wir das Koordinatensystem wie in der obigen Diskussion des schweren sym~ 3 zeigt vom raumfesten Drehpunkt zum metrischen Kreisels gewählt haben (E Schwerpunkt). Um ein geschlossenes Differentialgleichungssystem zu erhalten, ~ schreiben wir die Zeitabhängigkeit von G(t) = Bt−1~g als Differentialgleichung ~˙ = Ḃ −1~g = B −1 Bt Ḃ −1~g = −B −1 Ḃt B −1~g = −B −1 At~g G t t t t t t −1 −1 ~ ~ = −Bt (~ω × ~g ) = −Bt Bt (Ω × G) ~ ×G ~ , = −Ω wobei wir die Notation aus den letzten Kapitel und Gl. (2.13) benutzt haben. Mit den Eulerschen Kreiselgleichungen (rechte Seite durch Gl. (2.34) gegeben) ergibt sich so ein geschlossenes System von sechs nichtlinearen Differentialgleichungen ~ und G. ~ Bei der Lösung helfen die Erhaltungsgrößen für die Komponenten von Ω ~ 2 , (ii) in k gilt ~n = M R ~ S × ~g , so daß ~l · ~g = const. = L ~ ·G ~ gilt, (i) ~g 2 = g 2 = G (iii) die Gesamtenergie ~ ·E ~3 + E = M aG 3 1 X Ωi Ii,j Ωj 2 i,j=1 ist erhalten. Ohne weitere erhaltene Größen, d.h. im allgemeinen Fall, können auch chaotische Lösungen (siehe Kapitel 3.4 der Vorlesung des letzten Semesters) auftreten. In den hier tiefer untersuchten Spezialfällen des kräftefreien und des schweren symmetrischen Kreisels ist dies jedoch nicht der Fall. 52 KAPITEL 2. NEWTONSCHE MECHANIK TEIL II Kapitel 3 Lagrangesche Mechanik Im Kapitel 3.5 der Vorlesung des letzten Semesters haben wir die Newtonschen Bewegungsgleichungen für das Problem eines Teilchens (mit drei kartesischen Koordinaten) nach Umschreiben in drei verallgemeinerte krummlinige Koordinaten qi , i = 1, 2, 3, in die Lagrangeform (siehe Gl. (3.15)) d ∂T ∂T (3.1) = ~gi · F~ + dt ∂ q̇i ∂qi gebracht. Für den Fall einer konservativen Kraft F~ folgt ∂L d ∂L = , L=T −V . dt ∂ q̇i ∂qi (3.2) Dabei sind wir in der Herleitung davon ausgegangen, daß die Beziehung xi = xi (q1 , q2 , q3 ), i = 1, 2, 3, nicht explizit von der Zeit abhängt (siehe Seiten 165 des Skripts der Vorlesung des letzten Semesters). Bevor wir in diesem Kapitel dazu kommen, die Vorteile des Lagrangeformalismus (speziell für Systeme mit “Zwangsbedingungen”) herauszuarbeiten, wollen wir die Herleitung für eine zeitabhängige Wahl der krummlinigen Koordinaten mit xi = xi (q1 , q2 , q3 ; t), i = 1, 2, 3 und N -Teilchensysteme erweitern. Für eine zeitabhängige Wahl der krummlinigen Koordinaten gilt 3 3 X ∂~r ∂~r X ∂~r ~v = q̇j + = q̇j ~gj + , ∂q ∂t ∂t j j=1 j=1 wobei wir ∂~r/∂qj = ~gj verwendet haben. Um Gl. (3.15) der Vorlesung des letzten Semesters zu beweisen, benötigen wir, daß ~gi = ∂~v /∂ q̇i und d ∂~r ∂~v = . dt ∂qi ∂qi Wie man direkt nachrechnet gelten beide Relationen auch für eine zeitabhängige Wahl der verallgemeinerten Koordinaten. Somit läßt sich die Langrangeform der Bewegungsgleichungen analog zum letzten Semester herleiten. 53 54 KAPITEL 3. LAGRANGESCHE MECHANIK Für das N -Teilchensystem haben wir 3N verallgemeinerte Koordinaten α = 1, 2, . . . , N , i = 1, 2, 3: xα,i = xα,i (q1 , q2 , . . . , q3N ; t). Wir organisieren die 3N Variablen xα,i nun neu, in dem wir einen 3N -dimensionalen Vektor x1,1 x1,2 x1,3 x2,1 ~r = · · · xN,3 einführen. Analog verfahren wir mit den anderen auftretenden Vektoren.1 Die Schritte, die zur Lagrangeform der Bewegungsgleichung für ein Teilchen geführt haben, können nun basierend auf der Vektorform der Newtonschen Gleichung (für alle Komponenten aller Orte der Massenpunkte ~rα gleichzeitig) p~˙ = F~ vollzogen werden. Im ersten Schritt bilden wir wieder das Skalarprodukt auf beiden Seiten der Newtonschen Gleichung mit dem 3N -dimensionalen Vektor ~gi = ∂~r/∂qi . Alle weiteren Schritte lassen sich in vollständiger Analogie zum Einteilchenfall ausführen. Beachtet man noch, daß sich die kinetische Energie P des 2Gesamtsystems durch Addition der einzelnen Terme ergibt, also T = α mα~vα /2 gilt, so folgt ∂T d ∂T = + Qi dt ∂ q̇i ∂qi mit Qi = N X ∂~rα F~α · . ∂qi α=1 Dabei bezeichnet F~α die Summe der externen Kräfte und Paarkräfte, die auf das Teilchen α wirken. Für konservative Kräfte mit ~ ~rα V (~r1 , . . . , ~rN ) F~α = −∇ folgt ebenfalls wie zuvor d ∂L ∂L = dt ∂ q̇i ∂qi mit der Lagrangefunktion L = T − V . Die Bewegungsgleichungen heißen Lagrangegleichungen (2. Art). Wie bereits erwähnt, nennt man ∂L/∂ q̇i den verallgemeinerten Impuls. Konsequenterweise heißt ∂L/∂qi die verallgemeinerte Kraft. 1 Bei den Vektoren ohne Teilchen- und Komponentenindex handelt es sich um diese 3N dimensionalen Vektoren. 3.1. SYSTEME MIT ZWANGSBEDINGUNGEN 55 Dabei müssen diese Größen nicht von der Dimension des gewöhnlichen Impulses bzw. der gewöhnlichen Kraft sein. Falls für die qi die kartesischen Koordinaten gewählt werden, werden diese Ableitungen zum gewöhnlichen Impuls bzw. der gewöhnlichen Kraft. Bereits im Kapitel 3.6 der Vorlesung des letzten Semesters haben wir einen der großen Vorteile der Lagrangeschen Formulierung der Bewegungsgleichungen kennen gelernt: Man kann der Symmetrie eines Problems angepaßte Variable (Koordinaten) wählen. Die Bewegungsgleichungen nehmen dann eine sehr natürliche Form an. Die Gleichungen zu Variablen die in L nicht auftauchen liefern umgehend Erhaltungsgrößen (siehe Seite 170 des Skripts des letzten Semesters). Häufig hat man es in der Mechanik mit Situationen zu tun, in denen die Bewegung der Teilchen räumlichen Einschränkungen unterliegt. So kann es z.B. vorkommen, daß sich ein Teilchen für eine gewisse Zeit auf der Oberfläche eines starren Körpers bewegen muß, z.B. auf einem Tisch oder entlang eines Drahtes (Perle mit Loch auf Draht). Idealisiert können diese Bewegungen dann als solche auf einer stückweise glatten Fläche bzw. entlang einer stückweise glatten Kurve beschrieben werden. Wir müssen also für unsere Bewegung eine Nebenbedingung in Form einer mathematischen Gleichung formulieren. Im Rahmen der Newtonschen Mechanik wird die Bewegung aufgrund von zusätzlichen Kräften eingeschränkt, die man zu den Wechselwirkungskräften hinzu addieren muß. Solche Zwangskräfte sind aber meist nicht als Funktion der Orte und Geschwindigkeiten der Teilchen bekannt. Es ist somit schwierig, sie in den Newtonschen Formalismus einzubauen. Der Vorteil des Lagrangeformalismus besteht in dieser Hinsicht darin, daß es gelingt, für eine wichtige Klasse von Zwangskräften (Nebenbedingungen), die Koordinaten so zu wählen, daß die uns nicht interessierden Zwangskräfte in der Berechnung der Teilchenbahn überhaupt nicht auftreten. In den beiden Aufgaben auf Übungsblatt 1 haben wir sie durch Anleitung bereits diesen Vorteil ausnutzen lassen. Ein weiterer Grund für die Diskussion der Lagrangeschen Formulierung der klassischen Mechanik in der Theoretischen Physik ist, daß sie den Einstieg in sehr allgemeine Prinzipien erlaubt. Wir werden weiter unten das Variationsprinzip und eine allgemeine Formulierung von Erhaltungssätzen (Noethersches Theorem) kennen lernen. Weiterhin geben wir den Einstieg in die Hamiltonsche Mechanik. 3.1 Systeme mit Zwangsbedingungen Ein System von N Massepunkten unterliegt k holonomen Zwangs-(Neben-)bedingungen, wenn die Bahnkurven ~rα , mit α = 1, 2, . . . , N , die k Gleichungen hi (~r1 , ~r2 , . . . , ~rN ; t) = 0 , i = 1, 2, . . . , k erfüllen. Hängt mindestens eine der k Gleichungen explizit von der Zeit ab, so spricht man von holonom-rheonomen Bedigungen. Hängt dagegen keine der 56 KAPITEL 3. LAGRANGESCHE MECHANIK Gleichungen explizit von der Zeit ab, so heißen die Nebenbedingungen holonomskleronom. Wir nehmen an, daß die k Gleichungen funktional unabhängig sind. Diesen Begriff wollen wir primär anhand eines Beispiels erklären. Es gelte h1 (~r) = 0 und h2 (~r) = 0, dann ist die Nebenbedingung h3 (~r) = c1 h1 (~r)+c2 h2 (~r) = 0 funktional abhängig und reduziert die Zahl der effektiven Freiheitsgrade nicht weiter. Man kann zeigen, daß die Nebenbedingungen funktional unabhängig sind, wenn ~ 1 , . . . , ∇h ~ k in (fast) allen Punkten, die die Nebenbedingung die Gradienten ∇h erfüllen linear unabhängig sind. Um den Begriff der holonomen Zwangsbedingung besser zu verstehen, diskutieren wir drei Beispiele. Im ersten bewege sich ein Teilchen auf einer zeitlich unveränderlichen Fläche, die durch die Gleichung x3 = h̃(x1 , x2 ) definiert wird. Äquivalent gilt also für alle möglichen Bahnkurven h(x1 , x2 , x3 ) = x3 − h̃(x1 , x2 ) = 0. Wir haben also N = 1 und k = 1, d.h. dem Massepunkt verbleiben zwei Freiheitsgrade der Bewegung. Das System ist holonom-skleronom. Im zweiten Beispiel bewege sich ein Teilchen entlang einer Kurve (z.B. Perle auf Draht), die sich selbst (auf vorgegebene Weise) im Raum bewegt. Die Kurve kann als Schnittpunkt zweier Flächen mit h1 (x1 , x2 , x3 ; t) und h2 (x1 , x2 , x3 ; t) aufgefaßt werden. Also gilt N = 1 und k = 2. Das holonom-rheonome System hat noch einen Freiheitsgrad der Bewegung. Im dritten Beispiel betrachten wir ein Doppelpendel mit “masselosen” Stangen der Länge l1 und l2 . Dabei hängt eine Masse m1 an einer Stange, die an der Decke befestigt ist (Aufhängepunkt ist Ursprung) und um die ~e3 -Achse frei drehbar ist (Bewegung in ~e1 -~e2 -Ebene). Die zweite Stange ist an der ersten Masse so befestigt, daß die Bewegung ebenfalls in der ~e1 -~e2 -Ebene stattfindet und an ihrem Ende befindet sich die Masse m2 . Somit müssen während der Bewegung die vier Nebenbedingungen |~r1 | = l1 , |~r2 − ~r1 | = l2 , ~r1 · ~e3 = 0 = ~r2 · ~e3 erfüllt sein. Es gilt somit N = 2 und k = 4, so daß das holonom-skleronome System noch zwei Freiheitsgrade der Bewegung hat. Holonome Zwangsbedingungen treten in der Mechanik sehr häufig auf. Nicht in diese Klasse von Nebenbedingungen fallen z.B. solche, die sich durch Ungleichungen ausdrücken lassen. Als Beispiel dafür sei ein Skispringer erwähnt, der immer oberhalb der durch die Form der Schanze und des Auslaufs vorgegebenen Fläche bleiben muß. Ebenfalls nicht in die Klasse der holonomen Zwangsbedingungen fallen solche, die beim Abrollen von Rädern entstehen. In diesem Fall treten Geschwindigkeiten, die man bestimmen möchte linear in Gleichungen für Nebenbedingungen auf. 3.2 Lagrangegleichungen 2. Art ~ α einIm Rahmen der Newtonschen Mechanik muß man explizit Zwangskräfte Z führen um Nebenbedingungen zu erzwingen. Wir wollen uns folgend klar machen, wie man vorgehen könnte und wie sich das im Lagrangeformalismus auswirkt. Für 3.2. LAGRANGEGLEICHUNGEN 2. ART 57 ein N -Teilchensystem schreiben wir (α = 1, 2, . . . , N ) ~ α = F~αtot , mα~r¨α = F~α + Z wobei wir die Zwangskräfte von den anderen Kräften getrennt haben. Die Anfangsbedingungen der Bewegung müssen so gewählt werden, daß sie mit den Nebenbedingungen vereinbar sind, d.h. die 6N Anfangsbedingungen ~rα (0) und ~r˙α (0) sind nicht mehr unabhängig voneinander wählbar. Wir wollen nun versuchen, die Nebenbedingungen durch einen Grenzübergang bei einer adäquat gewählten Zwangskraft zu erzwingen. Wir betrachten exemplarisch die Situation eines Teilchens mit N = 1 und ~ . In unsenehmen an, daß die “äußere” Kraft F~ konservativ ist, F~ = −∇V rem ersten Beispiel des letzten Kapitels war die Nebenbedingung durch h(~r) = h(x1 , x2 , x3 ) = x3 − h̃(x1 , x2 ) = 0 gegeben. Wählen wir nun Vtot (~r) = V (~r) + A [x3 − h̃(x1 , x2 )]2 = V (~r) + A h2 (~r) mit A > 0, so nimmt die potentielle Energie bei großem A weg von der “Zwangsfläche”’ x3 = h̃(x1 , x2 ) sehr schnell zu. Bei fest vorgegebener Gesamtenergie ist das Teilchen damit gezwungen, sich in der Nähe dieser Fläche aufzuhalten. Im Limes A → ∞ ist die Bewegung an die Fläche “gebunden”. Für die Kraft, die sich aus dem Zusatzterm zum Potential ergibt gilt ~ A = −2A h(~r) ∇h(~ ~ r) . Z Nähert man sich der Fläche an, so steht die Kraft senkrecht auf dieser, da sie proportional zum Gardienten von h(~r) ist. Oberhalb und unterhalb der Fläche “drückt” die Kraft das Teilchen auf die Fläche mit h(~r) = 0. Es ist nun vorteilhaft verallgemeinerte (krummlinige) Koordinaten q1 und q2 so einzuführen, daß sie die Lage des Massepunktes auf der Fläche charakterisieren und |q3 | ein Maß für den Abstand von der Fläche ist. Auf der Fläche gilt q3 = 0. Damit sind die “krummlinigen” Basisvektoren ~g1 = ∂~r ∂~r , ~g2 = ∂q1 ∂q2 tangential an der durch h(~r) = 0 bestimmten Fläche. Für den aus der Zwangskraft stammenden Teil der in den Lagrangegleichungen auftretenden Terme Qi , i = 1, 2, gilt ~ A · ~gi = 0 Z ~ A senkrecht auf der Fläche steht. Die Details der Konstruktion der Zwangsda Z kraft sind dabei irrelevant, wesentlich ist nur diese Orthogonalität. Es gilt (i = 1, 2) ∂V Qi = ~gi · F~ = − ∂qi 58 KAPITEL 3. LAGRANGESCHE MECHANIK und damit auch ∂L∗ d ∂L∗ = dt ∂ q̇i ∂qi mit L∗ = [T − V ]q3 =0=q̇3 . Die Zwangskraft ist mithin aus der Bewegungsgleichungen für die “relevanten” Variablen herausgefallen. In der Lagrangefunktion L∗ treten die irrelevante Koordinate q3 und ihre Ableitung q̇3 nicht mehr auf m L∗ = ~v 2 (q1 , q2 , 0; q̇1 , q̇2 , 0) − V (q1 , q2 , 0) . 2 Für das Teilchen auf dem Draht können wir analog vorgehen. Als verallgemeinerte Koordinate q1 wählen wir die vorzeichenbehaftete Bogenlänge ausgehend von einem willkürlichen Anfangspunkt. Die Koordinaten q2 und q3 werden senkrecht zur instantanen Drahtachse gewählt und auf dem Draht gelte q2 = q3 = 0. Zum äußeren Potential addieren wir den Zusatzterm A(q22 + q32 ), mit A > 0. Die Zwangskraft ist dann wieder senkrecht zur instantanen Lage des Drahtes und es gilt ∂L∗ d ∂L∗ = dt ∂ q̇1 ∂q1 mit m 2 ~v (q1 , 0, 0; q̇1 , 0, 0; t) − V (q1 , 0, 0; t) . 2 Aufgrund der Bewegung des Drahtes hängen ~v und V in diesem Beispiel explizit von der Zeit ab. Die Zwangskraft selbst tritt in der Lagrangegleichung für die relevante Variable nicht auf. Anhand des Beispiels des oben diskutierten Doppelpendels wollen wir zeigen, wie sich diese Überlegungen auf Mehrteilchensysteme verallgemeinern lassen. Zur Verdeutlichung ist das Doppelpendel in der folgende Skizze dargestellt. L∗ = 0 r2 r1 φ1 φ2 3.2. LAGRANGEGLEICHUNGEN 2. ART 59 Als verallgemeinerte Koordinaten wählen wir (Stangenlängen li ) q1 = φ1 , q2 = φ2 , q3 = |~r1 | − l1 , q4 = |~r2 − ~r1 | − l2 , q5 = x1,3 , q6 = x2,3 , wobei schon klar sein sollte, daß q1 und q2 die “relevanten” Koordinaten sind. Die Ortsvektoren der beiden Massepunkte können ausgedrückt durch die verallgemeinerten Koordinaten qi wie folgt geschrieben werden ~r1 = (l1 + q3 )(~e1 cos φ1 + ~e2 sin φ1 ) + q5~e3 , ~r2 = ~r1 + (l2 + q4 )(~e1 cos φ2 + ~e2 sin φ2 ) + q6~e3 . Zur Berechnung der Qi benötigen wir die Vektoren ∂~rα /∂qi . Der Vektor ∂~r1 /∂φ1 ist als dünngedruckter Vektorpfeil in der obigen Skizze eingetragen. Er ist identisch zum Vektor ∂~r2 /∂φ1 . Auch der Vektor ∂~r2 /∂φ2 ist als dünner Pfeil eingezeichnet. Die Zwangskräfte wirken in Richtung der “masselosen” Stangen, d.h. es gilt ~ 1 = a~r1 + b(~r1 − ~r2 ) , Z ~ 2 = c(~r1 − ~r2 ) . Z Für i = 1 folgt wegen ~r1 · ∂~r1 /∂φ1 = 0 Q1 = − ∂~r1 ∂V + (b + c) · (~r1 − ~r2 ) ∂q1 ∂φ1 und für i = 2 wegen ∂~r1 /∂φ2 = 0 sowie (~r1 − ~r2 ) · ∂~r2 /∂φ2 = 0 Q2 = − ∂V . ∂q2 Versucht man die Zwangskraft, die |~r2 − ~r1 | = l2 garantiert durch ein Zweiteilchenpotential, z.B. A[(~r2 − ~r1 )2 − l22 ]2 , mit A → ∞ zu implementieren, so gilt “action=reactio” und damit c = −b. Nehmen wir an, daß “action=reactio” für die Zwangskraft gilt (ohne den Versuch ein zugrungeliegendes Potential zu konstruieren), so folgt ebenfalls c = −b und der Zusatzterm im Ausdruck für Q1 verschwindet. Damit erhalten wir für i = 1, 2 d ∂L∗ ∂L∗ = dt ∂ q̇i ∂qi mit L∗ = [T − V ]q∗ =0=q̇∗ , q ∗ = {q3 , q4 , q5 , q6 } . Für q ∗ = 0 gilt x1,1 = l1 cos φ1 , x1,2 = l1 sin φ1 , x2,1 = l1 cos φ1 + l2 cos φ2 , x2,2 = l1 sin φ1 + l2 sin φ2 . 60 KAPITEL 3. LAGRANGESCHE MECHANIK Daraus können wir die kinetische Energie für q ∗ = 0 berechnen T∗ = m1 + m2 2 2 m2 2 2 l1 φ̇1 + l φ̇ + m2 l1 l2 φ̇1 φ̇2 cos (φ1 − φ2 ) . 2 2 2 2 Sollten die expliziten Kräfte F~α durch das Schwerefeld der Erde gegeben sein, so gilt weiterhin V∗ = −(m1 + m2 )gl1 cos φ1 − m2 gl2 cos φ2 . Ausgehend von diesen Beispielen versuchen wir nun eine allgemeine Formulierung der Beobachtung, daß nur die relevanten Koordinaten in den Lagrangegleichungen auftauchen und die Zwangskräfte im Lagrangeformalismus nicht explizit behandelt werden müssen. Dazu führen wir wie oben die 3N -dimensionalen Vektoren (ohne Teilchen- und Komponentenindex) ein, die sich durch “Untereinanderschreiben” der Komponenten für die einzelnen Teilchen ergibt. Damit gilt (i = 1, 2, . . . , 3N ) d ∂T ∂T = + Qi dt ∂ q̇i ∂qi mit ~ · ~gi = (F~ + Z) ~ · ∂~r . Qi = (F~ + Z) ∂qi Im Fall k funktional unabhängiger holonomer Nebenbedingungen kann sich die “Bahnkurve” ~r nicht an jedem beliebigen Punkt des R3N befinden, sondern ist auf eine (3N − k)-dimensionale Hyperfläche beschränkt. Im Fall holonom-rheonomer Nebenbedingungen ist diese Hyperfläche zeitabhängig. Analog zu den obigen Beispielen wird es immer möglich sein, eine idealisierte Zwangskraft zu konstruieren, die ~r auf die Hyperfläche zwingt. Diese Zwangskraft ist orthogonal zur instantanen Hyperfläche. Wählt man die ersten 3N − k verallgemeinerten Koordinaten q1 , q2 , . . . , q3N −k in der instantanen Hyperfläche und q ∗ = {q3N −k+1 , . . . , q3N } so, daß q ∗ = 0 auf der Hyperfläche, so sind die ~gi für i = 1, . . . , 3N − k Tangentialvektoren an die Hyperfläche und stehen senkrecht auf der Zwangskraft ~ =0, ~gi · Z i = 1, 2, . . . , 3N − k . Damit gilt für expilzite Kräfte, die konservativ sind ∂V , Qi = F~ · ~gi = − ∂qi i = 1, 2, . . . , 3N − k . Für die Lagrangeschen Bewegungsgleichungen ergibt sich dann d ∂L∗ ∂L∗ = , dt ∂ q̇i ∂qi L∗ = [T − V ]q∗ =0=q̇∗ , i = 1, 2, . . . , 3N − k . 3.2. LAGRANGEGLEICHUNGEN 2. ART 61 Dieses sind die Lagrangegleichungen 2. Art für holonome Systeme. Im folgenden werden wir den Index ∗ weglassen, wenn klar ist, was gemeint ist. Wir haben somit einen eleganten Formalismus entwickelt, der es erlaubt die Bewegungsgleichungen für Systeme mit holonomen Zwangsbedingungen aufzustellen, ohne sich Gedanken über die Zwangskräfte machen zu müssen. Historisch hat man im Zusammenhang mit Zwangskräften sogenannte virtuelle Verrückungen betrachtet. Man hat Vektoren δ~rα = ζ~α mit infinitesimalem konstruiert, wobei die ζ~α so gewählt sind, daß ~ = ζ~ · Z N X ~ α · δ~rα = 0 Z α=1 gilt. Damit leisten Zwangskräfte bei virtuellen Verrückungen keine Arbeit. Diese Aussage bezeichnet man als das d’Alembertsche Prinzip. Mit der Einsicht, daß ζ~ eine beliebige Linearkombination der ~gi ist, die Tangentialvektoren an die Hyperfläche sind (i = 1, 2, . . . , 3N − k), ist das d’Alembertsche Prinzip äquivalent zu unserer Annahme, daß die Zwangskräfte senkrecht auf der Hyperfläche stehen. Nachdem man die Lagrangeschen Bewegungsgleichungen gelöst hat, ist es möglich die Zwangskraft explizit zu berechnen (sollte sie von Interesse sein). Man kann dazu zur ursprünglichen Newtonschen Formulierung in kartesischen Koordinaten zurückkehren. In dieser gilt ~ α = mα~r¨α − F~α . Z Bei bekannter Bahnkurve läßt sich die rechte Seite berechnen und die Zwangskräfte sind bestimmt. Alternativ kann man für konservative Systeme die “restlichen” Lagrangegleichungen d ∂L ∂L ~ , i = 3N − k + 1, 3N − k + 2, . . . , 3N − ~gi · Z = dt ∂ q̇i ∂qi q∗ =0=q̇∗ verwenden. Um das Vorgehen zu illustrieren, betrachten wir das Problem eines Teilchens auf einem Ring unter Einfluß des Schwerefeldes. Dabei wählen wir das Koordinatensystem so, daß das Schwerefeld in Richtung ~e1 zeigt und der Ursprung im Mittelpunkt des Kreises liegt. Der Kreis liege in der ~e1 -~e2 -Ebene. Wir gehen zu Polarkoordinaten über, wobei die relevante Variable φ (Winkel zwischen ~e1 und ~r) ist, während r(t) durch eine Zwangskraft auf r(t) = R, mit dem Radius R des Kreises, festgelegt ist. Der ersten Strategie folgend schreiben wir ~ˆ sin φ) , ~ = m~r¨ − F~ , F~ = mg~e1 = mg(~rˆ cos φ − φ Z wobei wir für die Einheitsvektoren in r- und φ-Richtung die Notation von S. 139 des Skripts der Vorlesung des letzten Semesters verwendet haben. Für die 62 KAPITEL 3. LAGRANGESCHE MECHANIK Beschleunigung gilt ~r = R(~e1 cos φ + ~e2 sin φ) = R~rˆ , ~ˆ , ~r˙ = Rφ̇(−~e1 sin φ + ~e2 cos φ) = Rφ̇φ ~ˆ − Rφ̇2~rˆ . ~r¨ = Rφ̈φ Damit können wir die Zwangskraft berechnen h i ~ˆ − Rφ̇2 + g cos φ ~rˆ ~ = m Rφ̈ + g sin φ φ Z = −m Rφ̇2 + g cos φ ~rˆ , da der erste Summand nach der Bewegungsgleichung (siehe letzte Gleichung auf S. 141 des Skripts des letzten Semesters) Null ergibt. Setzt man nun nach der Lösung der Bewegungsgleichung φ(t) ein, so ist die Zwangskraft bestimmt. Der zweiten Strategie folgend bestimmen wir die vollständige Lagrangefunktion in den verallgemeinerten Koordinaten r und φ m 2 2 2 ṙ + r φ̇ + mgr cos φ . L= 2 Setzt man nun r = R und ṙ = 0,2 so ergibt sich L∗ = m 2 2 R φ̇ + mgR cos φ . 2 Zur Berechnung der Zwangskraft benötigen wir ∂L = mṙ , ∂ ṙ ∂L = mrφ̇2 + mg cos φ . ∂r Eingesetzt liefert das (~gr = ~rˆ) d ∂L ∂L ~ ~gr · Z = − = −mRφ̇2 − mg cos φ dt ∂ ṙ ∂r r=R,ṙ=0 also ~ = −m Rφ̇2 + g cos φ ~rˆ Z und damit das gleiche Ergebnis wie im ersten Zugang. Wir werden folgend eine alternative Art Zwangskräfte zu behandeln kennen lernen. Dieser Zugang führt auf die Lagrangegleichungen 1. Art. 2 Dem oben entwickelten allgemeinen Formalismus folgend hätten wir besser q1 = φ und q2 = R − r gewählt. In diesem Fall müßten wir, um aus L∗ aus L zu erhalten, q2 = 0 setzen. 3.3. LAGRANGEGLEICHUNGEN 1. ART 3.3 63 Lagrangegleichungen 1. Art Wir gehen davon aus, daß wir einen Satz {q1 , q2 , . . . , q3N } von beliebigen verallgemeinerten Koordianten haben, der noch nicht entsprechend der k holonomen Nebenbedingungen hi (~r; t) = 0 gewählt sein muß. Wir nehmen weiterhin an, daß die expliziten Kräfte und die Zwangskräfte aus einem Potential ableitbar sind. Dann gilt d ∂L ∂L ~, − = ~gi · Z dt ∂ q̇i ∂qi i = 1, 2, . . . , 3N . (3.3) Die ~gi = ∂~r/∂qi sind wieder die Basisvektoren im betrachteten Punkt P . Dieser liege auf der instantanen Hyperfläche. Wir betrachten einen beliebigen Tangentialvektor ζ~ an die Hyperfläche und schreiben ihn als Linearkombination der ~gi ζ~ = 3N X ci~gi = i=1 3N X δqi~gi . i=1 Aufgrund der k Nebenbedingungen können nur 3N −k der ci frei gewählt werden. Multiplizieren wir Gl. (3.3) mit δqi und summieren über alle i, so folgt mit Hilfe ~ · ζ~ = 0, daß des d’Alembertschen Prinzips Z 3N X i=1 δqi d ∂L ∂L − =0. dt ∂ q̇i ∂qi (3.4) Da die Bewegung auf der aus den (simultanen) Bedingungen hj (~r; t) = 0, j = ~ ~r hj senkrecht 1, 2, . . . , k, resultierenden Hyperfläche verläuft und der Gradient ∇ auf Flächen hj = const. steht, gilt ~ ~r hj · ζ~ = 0 ∇ auf der instantanen Hyperfläche. Das impliziert ~ ~r hj · 0=∇ 3N X i=1 3N X ∂hj ∂~r = , δqi δqi ∂qi ∂qi i=1 j = 1, 2, . . . , k . Addiert man dieses Ergebnis nach Multiplikation mit zunächst beliebigen zeitabhängigen Funktionen λj , die man Lagrangesche Multiplikatoren nennt, und Summation über j zu Gl. (3.4), so folgt " # 3N k X X d ∂L ∂L ∂hj δqi − − λj =0. dt ∂ q̇i ∂qi j=1 ∂qi i=1 Wir können nun die δqi mit i = 1, 2, . . . , 3N − k frei wählen. Die k verbleibenden δqi liegen dann fest. In den Summanden mit i = 3N −k+1, . . . , 3N wählen wir die 64 KAPITEL 3. LAGRANGESCHE MECHANIK λj , j = 1, 2, . . . , k so, daß die Ausdrücke in den eckigen Klammern verschwinden. Die übrigen 3N − k eckigen Klammern müssen ebenfalls verschwinden, da die zugehörigen δqi unabhängig sind. Damit folgt k d ∂L ∂L X ∂hj − = λj , dt ∂ q̇i ∂qi ∂q i j=1 i = 1, 2, . . . , 3N . Zusammen mit den Relationen hj (~r; t) = 0 , j = 1, 2, . . . , k sind das (3N + k) Gleichungen für (3N + k) Unbekannte q1 , . . . , q3N ; λ1 , . . . , λk (alles Funktionen der Zeit). Man nennt diese Gleichungen die Lagrangegleichungen 1. Art. Im Gegensatz zum Zugang, der auf die Lagrangegleichungen 2. Art führt, werden die 3N verallgemeinerten Koordinaten als unabhängige Variablen behandelt. Im Gegenzug ist es notwendig, die k Lagrangeschen Multiplikatoren λj einzuführen. Der Vergleich mit Gl. (3.3) zeigt, daß für festes i auf der rech~ ten Seite der (ersten) 3N Gleichungen 1. Art die Projektion der Zwangskraft Z (3N -dimensionaler Vektor) auf die Richtung ~gi (3N -dimensionaler Vektor) steht k X j=1 λj ∂hj ~, = ~gi · Z ∂qi i = 1, 2, . . . , 3N . Ein Vorteil der Lagrangegleichungen 1. Art besteht darin, daß es gelingt, sie für eine gewisse Klasse nicht-holonomer Zwangsbedingungen zu erweitern. Probleme, die so behandelbar sind, treten aber eher im Bereich der “Technischen Mechanik” auf, so daß wir sie hier nicht weiter behandeln wollen. Wir haben uns an dieser Stelle den “Ausflug” zu den Lagrangegleichungen 1. Art “geleistet”, da in ihm erstmals die Lagrangeschen Multiplikatoren auftauchen, die ihnen in späteren Vorlesungen der Theoretischen Physik (insbesondere Theoretische Physik IV–Thermodynamik und statistische Mechanik) wiederbegegnen werden. In Anwendungen werden wir hier nur die Lagrangegleichungen 2. Art verwenden. Zum Abschluß dieses Kapitels wollen wir kurz untersuchen, wie sich Zwangsbedingungen auf den Energiesatz auswirken, wobei wir uns auf den Fall konservativer (expliziter) Kräfte mit ~ ~rα V (~r1 , . . . , ~rN ) F~α = −∇ beschränken wollen. Skalare Multiplikation der Newtonschen Gleichung ~ ~rα V = Z ~α mα~r¨α + ∇ mit ~r˙α liefert d mα ˙ 2 ˙ ~ ~α . ~r + ~rα · ∇~rα V = ~r˙α · Z dt 2 α 3.3. LAGRANGEGLEICHUNGEN 1. ART 65 Nach Summation über den Teilchenindex α folgt daraus (Vektoren ohne Index sind 3N -dimensional) N X d ~ α = ~r˙ · Z ~. (T + V ) = ~r˙α · Z dt α=1 (3.5) Für k holonome Zwangsbedingungen mit hi (~r; t) = 0, für i = 1, 2, . . . , k, liefern ~ ~r hi auf den Punkten der durch die Zwangsbedie 3N -dimensionalen Gradienten ∇ dingung gegebenen instantanen Hyperfläche einen Satz von k linear unabhängi~ auf der Hyperfläche senkrecht steht, muß es k zeitabhängige gen Vektoren. Da Z Koeffizienten λ̃j (t) geben, so daß ~ r; t) = Z(~ k X ~ ~r hj (~r; t) . λ̃j (t)∇ (3.6) j=1 Skalare Multiplikation mit ~gi = ∂~r/∂qi liefert ~ r; t) = ~gi · Z(~ k k X X ∂hj (~r; t) ~ ~r hj (~r; t) · ∂~r = λ̃j (t) λ̃j (t)∇ . ∂qi ∂qi j=1 j=1 Setzt man dieses Ergebnis auf der rechten Seite der Gl. (3.3) ein, so folgen wieder die Lagrangegleichungen 1. Art (was eine alternative Herleitung dieser liefert). Man sieht also, daß die λ̃j die Lagrangeschen Multiplikatoren sind. Wir lassen somit die Schlange weg. Setzen wir nun das Ergebnis Gl. (3.6) in Gl. (3.5) ein, so folgt für holonome Zwangsbedingungen " k # X dE ~ ~r hj (~r; t) = ~r˙ · λj (t)∇ dt j=1 " k # N X X ~ ~rα hj (~r; t) = ~r˙α · λj (t)∇ α=1 = − k X j=1 j=1 λj (t) ∂hj (~r; t) . ∂t Im letzten Schritt haben wir dabei verwendet, daß dhj /dt = 0 innerhalb der Hyperfläche gilt. Hängen die hj also nicht explizit von der Zeit ab, verschwindet die rechte Seite. Für holonom-skleronome Systeme gilt somit Energieerhaltung, wenn die explizite Kraft konservativ ist. 66 3.4 KAPITEL 3. LAGRANGESCHE MECHANIK Nochmal die Lagrangegleichungen 2. Art Das Hauptwerkzeug innerhalb der Lagrangeschen Mechanik bei der Behandlung praktischer Probleme sind die Lagrangegleichungen 2. Art d ∂L ∂L = , dt ∂ q̇i ∂qi L = [T − V ]q∗ =0=q̇∗ , i = 1, 2, . . . , 3N − k . In der Herleitung dieser Gleichungen mit holonomen Zwangsbedigungen sind wir davon ausgegegangen, daß die qi für i = 1, 2, . . . , 3N − k verallgemeinerte Koordinaten in der durch die Zwangsbedingungen gegebenen Hyperfläche (innerhalb derer die Bewegung stattfindet) sind. In dieser können die Koordinaten jedoch frei gewählt werden. Wir wollen zeigen, daß eine beliebige, lokal fast überall umkehrbare Koordinatentransformation (innerhalb der Hyperfläche) q̄i = q̄i (q1 , q2 , . . . , qm ; t) = q̄i (q; t) , qi = qi (q̄1 , q̄2 , . . . , q̄m ; t) = qi (q̄; t) , mit m = 3N − k, die Lagrangegleichungen invariant läßt. Differenziert man die qi (q̄; t) nach der Zeit, so folgt q̇i = X ∂qi ∂qi . q̄˙k + ∂ q̄k ∂t k Man kann L als Funktion der q̄ und q̄˙ auffassen ˙ t); t) = L̄(q̄, q̄; ˙ t) . L(q, q̇; t) = L(q(q̄; t), q̇(q̄, q̄; Aus Gl. (3.7) folgt ∂ q̇j ∂qj = . ∂ q̄i ∂ q̄˙i Um die Forminvarianz der Lagrangegleichungen zu zeigen, betrachten wir X ∂L ∂qk ∂ L̄ ∂L ∂ q̇k = + , ∂ q̄i ∂qk ∂ q̄i ∂ q̇k ∂ q̄i k X ∂L ∂ q̇k X ∂L ∂qk ∂ L̄ = = . ∂ q̇ ∂ q̇ ∂ q̄˙i k ∂ q̄˙i k ∂ q̄i k k Damit ergibt sich d ∂ L̄ ∂ L̄ X − = dt ∂ q̄˙i ∂ q̄i k d ∂L ∂L ∂qk ∂L ∂ q̇k d ∂qk − − − . dt ∂ q̇k ∂qk ∂ q̄i ∂ q̇k ∂ q̄i dt ∂ q̄i (3.7) 3.4. NOCHMAL DIE LAGRANGEGLEICHUNGEN 2. ART 67 Der erste Term in eckigen Klammern veschwindet, da die qi (t) die Lagrangegleichungen erfüllen. Im zweiten Term in eckigen Klammern müssen wir noch wie bei der Herleitung der Lagrangegleichungen die Reihenfolge der Ableitung nach t und der partiellen Ableitung nach q̄i vertauschen. Danach ist klar, daß auch dieser Term verschwindet und wir haben die Forminvarianz der Lagrangegleichungen gezeigt. Es gilt also für i = 1, 2, . . . , m ∂ L̄ d ∂ L̄ = . ˙ dt ∂ q̄i ∂ q̄i Wir geben zum Abschluß des Kapitels über die Lagrangesche Formulierung der Mechanik ein Kochrezept zur Verwendung dieses Formalismus an und diskutieren ein (weiteres) Beispiel. Gegeben sei ein System aus N Massepunkten der Masse m1 , m2 , . . . , mN , das sich aufgrund holonomer Zwangsbedingungen auf einer m ≤ 3N -dimensionalen (im rheonomen Fall zeitabhängigen) Hyperfläche F des 3N -dimensionalen Raums bewegt. Dann geht man wie folgt vor: 1. Man wählt ein System q = (q1 , q2 , . . . , qm ) von verallgemeinerten Koordinaten so, daß der aus den ~rα (t) gebildete 3N -dimensionale Ortsvektor ~r(t) = ~r(q; t) in der Hyperfläche ist. 2. Man berechnet aus ~vα = ~r˙α = m X ∂~rα i=1 ∂qi q̇i + ∂~rα ∂t die ~vα2 . 3. Die Lagrangefunktion L erhält man dann aus L= N X mα α=1 2 ~vα2 − V (q) . 4. Man stellt die Lagrangegleichungen (i = 1, 2, . . . , m) d ∂L ∂L = dt ∂ q̇i ∂qi auf. 5. Man löst diesen Satz von gekoppelten Differentialgleichungen. Nur in den wenigsten Fällen wird dieses analytisch gelingen. An einem Beispiel wollen wir dieses Vorgehen veranschaulichen. Ein Massepunkt kann sich reibungsfrei auf einem geraden Draht bewegen, der unter festem 68 KAPITEL 3. LAGRANGESCHE MECHANIK Neigungswinkel θ < π/2 relativ zur ~e3 -Achse mit vorgegebener Winkelgeschwindigkeit ω(t) = φ̇(t) um die ~e3 -Achse rotiert. Letztere ist dadurch festgelegt, daß die Gravitationsbeschleunigung (Schwerefeld der Erde) in −~e3 -Richtung wirke. φ ist der Winkel zwischen der Projektion der Position des Teilchens für x3 > 0 auf die ~e1 -~e2 -Ebene und der ~e1 -Richtung.3 1. Die Hyperfläche ist eindimensional und zeitabhängig. Die freie Variable ist der Abstand r̃ des Teilchens vom Ursprung. Dabei gelte r̃ > 0 für x3 > 0 und r̃ < 0 für x3 < 0. Der Ortsvektor des Teilchens läßt sich damit als ~r(t) = r̃(t) [sin θ(cos φ(t)~e1 + sin φ(t)~e2 ) + cos θ~e3 ] = r̃(t)~er (t) schreiben, wobei θ zeitunabhängig ist und φ(t) die vorgegebene Zeitabhängigkeit hat. 2. Differentiation von ~r(t) liefert ˙ er (t) + r̃(t)ω(t) sin θ [− sin φ(t)~e1 + cos φ(t)~e2 ] ~r˙ (t) = r̃(t)~ ˙ er (t) + r̃(t)ω(t) sin θ~eφ (t) . = r̃(t)~ Da die Vektoren ~er (t) und ~eφ (t) für alle Zeiten orthogonal sind, folgt für das Geschwindigkeitsquadrat ~v 2 = r̃˙ 2 + r̃2 ω 2 sin2 θ . 3. Mit dem Potential V = mgr̃ cos θ folgt für die Lagrangefunktion L= m ˙2 r̃ + r̃2 ω 2 sin2 θ − mgr̃ cos θ . 2 4. Um die Lagrangegleichungen zu bestimmen, benötigt man die partiellen Ableitungen ∂L = mr̃˙ , ∂ r̃˙ ∂L = mr̃ω 2 sin2 θ − mg cos θ . ∂r̃ Dies liefert die Bewegungsgleichung r̃¨ = r̃ω 2 sin2 θ − g cos θ . 5. Für ω(t) = ω0 = const. läßt sich die Differentialgleichung mit den von uns im letzten Semester behandelten Methoden lösen. Wir wollen das hier aus Zeitgründen nicht weiter verfolgen. 3 Die Winkel sind damit wie bei Polarkoordinaten gewählt. 3.5. DAS PRINZIP DER KLEINSTEN WIRKUNG 3.5 69 Das Prinzip der kleinsten Wirkung In diesem Kapitel wollen wir eine alternative Herleitung der Lagrangegleichungen präsentieren. Es mag zunächst überflüssig erscheinen, auf einem weiteren Weg die uns schon bekannten Bewegungsgleichungen herzuleiten. Er verwendet aber mit dem Variationsprinzip eine Methode, die in vielen Bereichen der Physik und Mathematik eine wichtige Rolle spielt. Es hat sich herausgestellt, daß sich fast alle Bereiche der Physik – klassische Mechanik, Quantenmechanik, Optik, Elektromagnetismus usw. – in Form von Variationsprinzipien formulieren lassen (auch wenn das nicht die historische Sichtweise auf diese Gebiete darstellt). Wir werden daher damit beginnen, die Variationsrechnung anhand eines Beispiels aus der Mathematik einzuführen. Der kürzeste Weg zwischen zwei Punkten: Als einfaches Beispiel betrachten wir die Frage, welche Form der kürzeste Weg zwischen zwei Punkten ist. Dabei kennen wir die Antwort bereits: Eine Gerade. Mit Hilfe der Variationsrechung können wir diese allgemein bekannte Tatsache beweisen. Mathematisch läßt sich das Problem wie folgt formulieren. Wir haben zwei Punkte (die in einer Ebene liegen) (x1 , y1 ) und (x2 , y2 ) gegeben. Sie sind durch einen Pfad y(x) verbunden. Die Aufgabe ist es, den kürzesten Pfad y(x) zu finden. p Die Länge einer infinitesimalen Strecke auf dem Pfad ∆s kann als ∆s = (∆x)2 + (∆y)2 geschrieben werden. Mit dy ∆x = y 0 (x) ∆x ∆y = dx folgt p ∆s = 1 + [y 0 (x)]2 ∆x . Damit ergibt sich für die Länge L des Pfads y(x) zwischen den beiden Punkten Z x2 p L= 1 + [y 0 (x)]2 dx . x1 Wir müssen somit die (oder eine) Funktion y(x) finden, für die L unter Vorgabe des Anfangs- und Endpunkts minimal wird. Man bezeichnet L als ein Funktional, da diese Größe von der Funktion y(x) abhängt. Ein sehr ähnliches Problem ergibt sich im physikalischen Kontext in der Optik. Das Fermatsche Prinzip sagt, daß für gegebenen im Allgemeinen ortsabhängigen Brechungsindex n(~r) das Licht den Pfad zwischen zwei Punkten nimmt, für den die benötigte Zeit minimal wird. Die lokale Geschwindigkeit des Lichts in einem Medium mit Brechungsindex n(~r) ist dabei durch v = c/n(~r), mit der Vakuumlichtgeschwindigkeit c, gegeben. Für die vom Licht entlang y(x) benötigte Zeit T ergibt sich so (Anfangs- und Endpunkt liegen in einer Ebene) Z p 1 x2 n(x, y) 1 + [y 0 (x)]2 dx . T = c x1 70 KAPITEL 3. LAGRANGESCHE MECHANIK Wir müssen somit die (eine) Funktion y(x) bestimmen, die das Integral minimiert. In der Differentialrechnung einer Veränderlichen bestimmt man das Extremum einer Funktion, indem man diese differenziert und anschließend Null setzt. Dabei kann das Extremum x0 ein Sattelpunkt, ein lokales Maximum oder ein lokales Minimum sein. Man nennt diese Punkte auch stationäre Punkte, da eine infinitesimale Abweichung von x0 den Wert der Funktion nicht ändert (da die Steigung Null ist). In Analogie wollen wir jetzt einen Pfad finden, der das Integral stationär macht, d.h. daß eine kleine Abweichung vom stationären Pfad den Wert des Integrals nicht ändert. Wie in der Differentialrechnung einer Veränderlichen kann man dann jedoch noch nicht sicher sein, ob das von uns gesuchte Minimum vorliegt. Dieses muß man getrennt untersuchen. Man nennt die Methode zur Bestimmung des stationären Pfads die Variationsrechnung. Variation und die Euler-Lagrange-Gleichung: Wir wollen das Variationsproblem nun allgemein formulieren und betrachten ein Integral der Form Z x2 S= f [y(x), y 0 (x), x] dx , x1 wobei y(x) eine noch unbekannte Funktion ist, die die Punkte (x1 , y(x1 ) = y1 ) und (x2 , y(x2 ) = y2 ) verbindet. Unter allen Funktionen, die diese Bedingungen erfüllen, müssen wir diejenige(n) finden, die das Integral minimiert(en). Wenn wir die (oder eine) gesuchte Lösung mit y(x) bezeichnen, dann liefert die Kurve Y (x) = y(x) + η(x) mit η(x1 ) = η(x2 ) = 0 einen größeren Wert für das Integral S.4 Wir führen nun den Parameter α ein und betrachten den Pfad Y (x) = y(x) + αη(x) . Damit hängt das Integral von α ab und wir bezeichnen es mit S(α). Die richtige Kurve folgt für α = 0 und S(α) wird für α = 0 minimal. Wir können somit den gewöhnlichen Formalismus zum Finden eines Minimums für eine Funktion einer Veränderlichen verwenden. Es muß also dS/dα = 0 gelten. Wir betrachten somit Z x2 d dS = f [y + αη, y 0 + αη 0 , x] dx dα dα x Z 1x2 ∂f 0 ∂f = η + η 0 dx . ∂y ∂y x1 Durch partielle Integration im zweiten Term und unter Verwendung von η(x1 ) = η(x2 ) = 0 folgt Z x2 dS ∂f d ∂f = η(x) − dx . dα ∂y dx ∂y 0 x1 4 Dabei vernachlässigen wir Fälle, in denen das Integral den gleichen Wert liefert. 3.5. DAS PRINZIP DER KLEINSTEN WIRKUNG 71 Da nun am Minimum dS =0 dα für beliebige η(x) gelten muß, können wir schließen, daß ∂f d ∂f = ∂y dx ∂y 0 für alle x ∈ [x1 , x2 ] gelten muß. Man nennt diese Gleichung die Euler-LagrangeGleichung. Identifizieren wir f ↔ L, x ↔ t und y ↔ q, so ist diese identisch zur Lagrangeschen Bewegungsgleichung im Fall von einer unabhägigen verallgemeinerten Variablen. Wir werden diesen Zusammenhang sehr bald besser verstehen. Als Anwendung wollen wir uns noch einmal unserem obigen Beispiel des kürzesten Abstandes zwischen zwei Punkten widmen. Wie diskutiert gilt in diep 0 0 2 sem Fall f (y, y , x) = 1 + [y ] . Die Euler-Lagrange-Gleichung hat somit wegen ∂f =0, ∂y ∂f y0 p = ∂y 0 1 + [y 0 ]2 die Form d ∂f y0 p = 0 ⇒ =C, dx ∂y 0 1 + [y 0 ]2 mit der Konstanten C. Umgeformt folgt [y 0 (x)]2 = const. ⇒ y 0 (x) = const. ⇒ y(x) = ax + b , mit den Konstanten a und b. Damit haben wir fast bewiesen, daß eine Gerade in der Tat die kürzeste Verbindung zwischen zwei vorgegeben Punkten ist. Offen ist noch die Frage, ob es sich um ein Minimum oder Maximum des Integrals handelt. Im vorliegenden Fall ist es jedoch offensichtlich, daß die Gerade ein Minimum liefert. Glücklicherweise ist es für die Anwendung der Variationsrechnung in der Mechanik irrelevant, ob ein Minimum oder Maximum voriegt. Wichtig ist nur, daß ein bestimmtes Integral (siehe unten) stationär wird. Das zweite Problem, weshalb wir nur fast bewiesen haben, daß eine Gerade die kürzeste Verbindung zwischen zwei Punkten liefert sind Wege, die man nicht in der Form y = y(x) schreiben kann, wie z.B. einen spiralförmige Pfad. Weiterhin sind wir davon ausgegangen, daß der kürzeste Pfad in einer Ebene liegt (siehe auch das Beispiel aus der Optik). Wir können unsere Überlegungen erweitern, indem wir die Parameterdarstellung (Parameter x - später t für die Zeit) von Kurven im d-dimensionalen Raum betrachten: y1 (x), y2 (x), . . . , yd (x). Die parametrische Form erlaubt es jetzt auch 72 KAPITEL 3. LAGRANGESCHE MECHANIK spiralförmige Kurven zu beschreiben. Damit ergibt sich für das Integral, welches stationär werden soll Z x2 f [y1 (x), y10 (x), y2 (x), y20 (x), . . . , yd (x), yd0 (x), x] dx , S= x1 wobei die yi (x1 ) und yi (x2 ) mit i = 1, 2, . . . , d festgelegt sind. Wir können nun wie zuvor vorgehen und kleine Abweichungen αi ηi (x) vom stationären Pfad yi (x) betrachten. Auf diese Weise bekommen wir die Euler-Lagrange-Gleichungen ∂f d ∂f = , ∂yi dx ∂yi0 i = 1, 2, . . . , d Das Hamiltonsche Prinzip: Nach diesen Vorüberlegungen sind wir in der Lage, die auf dem Variationsprinzip beruhenden Herleitung der Lagrangeschen Bewegungsgleichungen zu geben. Wir betrachten ein System von N Massepunkten, welches konservativ sei und zunächst keinen Zwangsbedingungen unterliege. In unserer bisherigen Herangehensweise haben wir zusammen mit den Bewegungsgleichungen die Anfangsorte und die Anfangsgeschwindigkeiten vorgegeben, da sich dieses durch den Bezug zum Experiment und der Theorie der Differentialgleichungen (Eindeutigkeit der Lösung) aufdrängt. In drei Dimensionen ergeben sich so 6N Bedingungen, um die 6N freien Konstanten der allgemeinen Lösung der Bewegungsgleichung festzulegen. Wir werden folgend etwas anders vorgehen – da wir Bezug zur Variationsrechnung machen werden – und nach Bahnkurven mit festen Anfangs- und Endorten suchen. Wir definieren (konsistent mit oben) die Lagrangefunktion als die Differenz aus kinetischer und potentieller Energie L(~r, ~r˙ ; t) = T − V N 1X mα~r˙α2 − V (~r; t) , = 2 α=1 mit dem 3N -dimensionalen Vektor ~r wie oben. Neu führen wir jetzt das Wirkungsfunktional Z t2 S= L(~r(t), ~r˙ (t); t) dt t1 ein. Die Anfangs- ~r(t1 ) und Endorte ~r(t2 ) sind dabei vorgegeben. Die EulerLagrange-Gleichungen des vorliegenden Variationsproblems entsprechen den uns bekannten Lagrangeschen Bewegungsgleichungen. Wir können somit schließen, daß die eindeutige Lösung der Bewegungsgleichungen unter Berücksichtigung der Anfangsbedingungen für die ~r und ~r˙ das Wirkungsfunktional stationär werden läßt, was man als das Hamiltonsche Prinzip bezeichnet. Geht man nun andersherum vom Wirkungsfunktional und den folgenden Euler-Lagrange-Gleichungen 3.5. DAS PRINZIP DER KLEINSTEN WIRKUNG 73 aus, so kann man durch Wahl der 6N Integrationskonstanten die Randbedingungen ~r(t1 ) und ~r(t2 ) erfüllen, es kann jedoch durchaus mehrere Lösungen geben (da man nicht auf Eindeutigkeitssätze der Theorie der Differentialgleichungen zurückgreifen kann). Man bezeichnet das Hamiltonsche Prinzip auch als Prinzip der kleinsten Wirkung, da die stationären Pfade meist Minima sind. Wir können für ein System mit holonomen Nebenbedingungen völlig analog vorgehen, wobei die Lagrangefunktion nun von den “relevanten” verallgemeinerten Koordinaten abhängt (man sucht den extremalen Weg, der mit den Nebenbedingungen vereinbar ist). Die Euler-Lagrange-Gleichungen mit den “relevanten” qi und q̇i entsprechen erneut den uns bekannten Lagrangeschen Bewegungsgleichungen. Damit haben wir eine alternative Herleitung der Lagrangeschen Bewegungsgleichungen für holonome Systeme gefunden, die auf dem Variationsprinzip beruht. Diese Herleitung ist sehr elegant und gibt bereits einen ersten Eindruck davon, wie wichtig das Varitions(Extremal-)prinzip in der (theoretischen) Physik ist. Für unsere späteren Überlegungen ist es wichtig festzuhalten, daß ein gegebenes Wirkungsfunktional Z t2 S= L(q(t), q̇(t); t) dt t1 (wobei q bzw. q̇ für alle qi bzw. q̇i steht) eindeutige Euler-Lagrange-Gleichungen liefert. Die Umkehrung gilt aber nicht, d.h. unterschiedliche Wirkungsfunktionale können die gleichen Euler-Lagrange-Gleichungen liefern. Wir betrachten dazu das Beispiel Z t2 S̃ = L̃(q(t), q̇(t); t) dt t1 Z t2 d = cL(q(t), q̇(t); t) + G(q(t); t) dt . dt t1 Dabei ist c eine beliebige Konstante und G(q; t) eine beliebige differenzierbare Funktion. Integration liefert sofort S̃ = cS + G(q(t1 ); t1 ) − G(q(t2 ); t2 ) . Da von der Funktion G nur die Anfangs- und Endpunkte eingehen, ändert sich bei Variation des Weges nur der erste Summand. Für die Euler-Lagrange-Gleichungen folgt somit d ∂(cL) ∂(cL) = dt ∂ q̇i ∂qi und nach Kürzen des Faktors c 6= 0 folgt dieselbe Euler-Lagrange-Gleichung wie für S. Man kann die Aussage, daß die Lagrangefunktionen L und L̃ auf dieselben Euler-Lagrange-Gleichungen führen, auch ohne Verwendung des Hamiltonschen Prinzips durch Differentiation zeigen. 74 KAPITEL 3. LAGRANGESCHE MECHANIK 3.6 Symmetrien und Erhaltungssätze Im Kapitel 3.3 der Vorlesung des letzten Semesters haben wir eine elementare Diskussion von Erhaltungssätzen (Energie, Gesamtimpuls und Gesamtdrehimpuls) innerhalb des Newtonschen Formalismus gegeben. Im Zusammenhang mit der Bewegung eines Teilchens im zweidimensionalen Zentralpotential V (r) haben wir in Kapitel 3.6 einen ersten Kontakt mit Erhaltungssätzen innerhalb der Lagrangeschen Mechanik gehabt. Die Lagrangefunktion ist in diesem Beispiel durch m 2 ṙ + r2 φ̇2 − V (r) L(r, φ, ṙ, φ̇) = 2 gegeben. Aus der Beobachtung, daß L nicht explizit von φ abhängt – das Problem also rotationssymmetrisch ist – folgt, wie im letzten Semester diskutiert, der Flächensatz, welcher äquivalent zur Erhaltung des Drehimpulses ist. Hinter dieser Beobachtung steckt ein allgemeines Prinzip, welches wir jetzt weiter untersuchen wollen. Hängt die Lagrangefunktion L von der verallgemeinerten Koordinate qi nicht explizit ab, d.h. gilt ∂L/∂qi = 0, so nennt man diese Koordinate zyklisch. Allgemein bezeichnet man ∂L pj = ∂ q̇j als den zu qj kanonisch konjugierten Impuls.5 Ist die Koordinate qi zyklisch, so folgt nach der Lagrangegleichung ṗi = 0 und damit pi = const.. Der zu einer zyklischen Koordinate gehörende kanonisch konjugierte Impuls ist somit eine Erhaltungsgröße. Da es bei der Lösung eines Problems offensichtlich vorteilhaft ist, möglichst viele Erhaltungsgrößen zu kennen, stellt sich die Frage, ob es ein Prinzip gibt, nach welchem man die Koordinaten wählen kann, um eine möglichst große Anzahl zyklischer Koordinaten zu erreichen. Beim Problem der Bewegung im zweidimensionalen Zentralpotential hatten wir die Koordinaten der Drehsymmetrie angepaßt und so einen Erhaltungssatz gewonnen. Zusammenhänge zwischen Symmetrien und Erhaltungsgrößen haben wir ebenfalls im Kapitel 2.2 der aktuellen Vorlesung diskutiert. Den allgemeinen Zusammenhang zwischen kontinuierlichen Symmetrien und Erhaltungsgrößen liefert das Noethersche Theorem, welches wir folgend herleiten wollen. Noethersches Theorem I: Im Kapitel 3.4 haben wir diskutiert, daß die Lagrangegleichungen bei der Koordinatentransformation q̄i = q̄i (q; t) die Form behalten, d.h. mit d ∂L ∂L = , i = 1, 2, . . . , m dt ∂ q̇i ∂qi 5 Weiter oben haben wir diese Größe recht allgemein als den verallgemeinerten Impuls bezeichnet. 3.6. SYMMETRIEN UND ERHALTUNGSSÄTZE 75 gilt ebenfalls d ∂ L̄ ∂ L̄ = , dt ∂ q̄˙i ∂ q̄i i = 1, 2, . . . , m , ˙ t) = L(q(q̄; t), q̇(q̄, q̄; ˙ t); t). Da die L und L̄ im Allgemeinen verschiewobei L̄(q̄, q̄; dene funktionale Abhängigkeiten von den 2m + 1 Variablen haben, erfüllen die q̄i im Allgemeinen andere Differentialgleichungen als die qi . Folgend betrachten wir solche Koordinatentransformationen, für die die resultierenden Differentialgleichungen in den qi und q̄i dieselbe Form haben. Die Transformation soll zusätzlich differenzierbar von einem Parameter abhängen. Die wesentlichen Resultate erhält man bei “infinitesimalen” Transformationen. Daher beschränken wir uns auf solche der Form q̄i = qi + hi (q; t) , die sich durch Taylorentwicklung einer allgemeineren Form für || 1 sowieso ergeben. Damit folgt ! X ∂hi ∂hi dhi (q; t) = q̇i + q̇k + . q̄˙i = q̇i + dt ∂qk ∂t k Aus den Überlegungen am Ende des Kapitels 3.5 zu der Frage, welche Wirkungsfunktionale zu gleichen Euler-Lagrange-Gleichungen führen, folgt, daß die Differentialgleichungen in den qi und q̄i sicherlich dann identisch sind, wenn ˙ t) = L(q̄, q̄; ˙ t) + L̄(q̄, q̄; d G̃(q̄; t; ) . dt Koordinatentransformationen, die diese Bedingung erfüllen, bezeichnet man als Symmetrietransformationen. Um diese Art der Transformationen zu illustrieren, betrachten wir das einfache Beispiel eines effektiv eindimensionalen Problems mit einem Teilchen im äußeren Potential V (x). Dann ergibt sich die Lagrangefunktion L(x, ẋ) = m 2 ẋ − V (x) . 2 Als Koordinatentransformation führen wir eine Translation mit h(x; t) = a aus und bekommen x̄ = x + a sowie x̄˙ = ẋ. Für die Lagrangefunktion folgt m ˙ . ˙ = x̄˙ 2 − V (x̄ − a) = L̄(x̄, x̄) L(x, ẋ) = L(x̄ − a, x̄) 2 Um zu klären, ob es sich bei der Transformation um eine Symmetrietransformation im obigen Sinne handelt, müssen wir die Differenz von L̄ und L (beides als ˙ untersuchen. Wir betrachten Funktion von x̄ und x̄) ˙ − L(x̄, x̄) ˙ = V (x̄) − V (x̄ − a) . L̄(x̄, x̄) 76 KAPITEL 3. LAGRANGESCHE MECHANIK Physikalisch ist es offensichtlich, daß die Translation das vorliegende Problem nur dann äquivalent läßt, wenn die Kraft nicht vom Ort x abhängt, also homogen ist. Wir beschränken uns daher auf Potentiale, die linear sind, d.h. V (x) = −F x, mit F = const.. In diesem Fall gilt G̃(x̄; t; ) = −F at + const.. Damit ist unsere Erwartung, daß die Translation für ein homogenes Kraftfeld eine Symmetrietransformation darstellt, bestätigt. Im allgemeinen Fall liegt eine Symmetrietransformation vor, falls es eine Funktion G̃ mit (hier ausgedrückt durch die q und q̇) L(q, q̇; t) − L(q + h, q̇ + ḣ; t) − d G̃(q + h; t; ) = 0 dt gibt. Dabei haben wir, analog zur “Multivariablen” q, h = (h1 , h2 , . . . , hm ) eingeführt. Aus dieser Gleichung können wir eine differentielle Relation herleiten, indem wir beide Seiten nach differenzieren und anschließend = 0 setzen. Mit d d G̃(q + h; t; ) = G(q + h; t; ) dt dt folgt m X ∂L i=1 d ∂L ḣi + G(q; t; 0) = 0 . hi + ∂qi ∂ q̇i dt Wir eliminieren nun unter Verwendung der Lagrangegleichung ∂L/∂qi und erhalten so " m # d X ∂L hi + G(q; t; 0) = 0 , dt i=1 ∂ q̇i bzw. m X ∂L i=1 ∂ q̇i hi + G = m X pi hi + G(q; t; 0) = const. , i=1 Das ist die mathematische Formulierung des Noetherschen Theorems: Jede einparametrige (hier Parameter ) Schar von Symmetrietransformationen führt zu einem Erhaltungssatz (einem “Bewegungsintegral”). Für unser obiges einfaches Beispiel lautet der Erhaltungssatz (mẋ − F t)a = const.. Für den Spezialfall der verschwindenden Kraft F = 0 entspricht dies der Impulserhaltung. Wir werden später in allgemeinerem Kontext auf die Translation zurückkommen. Wir wollen nun den Zusammenhang zwischen dem Noetherschen Theorem und den uns bereits bekannten Erhaltungssätzen für ein N -Teilchen-System ohne 3.6. SYMMETRIEN UND ERHALTUNGSSÄTZE 77 Zwangsbedingungen herstellen. Dabei verwenden wir die kartesischen Koordinaten. Die Lagrangefunktion mit (im Allgemeinen zeitabhängigen) externen und Paarkräften ist durch " # N N X X m 1 i L(~r, ~r˙ ; t) = ~r˙i2 − Vi (~r; t) − vi,j (|~ri − ~rj |; t) 2 2 i6=j=1 i=1 gegeben. Dabei handelt es sich bei den Vektoren ohne Teilchen- und Komponentenindex wieder um die weiter oben eingeführten 3N -dimensionalen Vektoren. Wir werden jetzt für verschiedene Funktionen ~h überprüfen, ob es sich bei der durch sie gegebenen Transformation für unsere Lagrangefunktion um eine Symmetrietransformation handelt. Dabei verwenden wir die differentielle Form und untersuchen, ob eine Funktion G(~r; t; 0) existiert, so daß N h X i=1 i ~ ~r L · ~hi + ∇ ~ ˙ L · ~h˙ i = − d G(~r; t; 0) ∇ i ~ ri dt gilt. Wir werden folgend ~ ~r L = −∇ ~ ~r Vi − F~i = ∇ i i X ~ ~r vi,j ∇ i j6=i verwenden. Setzen wir die obige Form der Lagrangefunktion ein, so folgt N h X i=1 i d ˙ F~i · ~hi + mi~r˙i · ~hi = − G(~r; t; 0) . dt Existiert ein entsprechendes G, so ergibt sich aus den allgemeinen Überlegungen die Erhaltungsgröße N X mi~r˙i · ~hi + G = const. . i=1 1. Die räumliche Translation mit ~hi (~r; t) = ~a. Hierbei handelt es sich um eine Symmetrietransformation, falls es ein G mit ~a · N X i=1 d F~i = − G(~r; t; 0) dt gibt. Wegen “actio=reactio” tragen in der Summe über i nur die äußeren Kräfte F~iext bei. Es muß also ~a · N X i=1 d F~iext = ~a · F~ tot = − G(~r; t; 0) , dt 78 KAPITEL 3. LAGRANGESCHE MECHANIK P ~ ext mit der gesamten äußeren Kraft F~ tot = N gelten. Für den Fall ohne i=1 Fi tot äußere Kräfte mit F~ = 0 können wir G = 0 wählen und erhalten den Erhaltungssatz ~a · N X mi~r˙i = const. . i=1 Da ~a für F~ tot = 0 beliebig wählbar ist, folgt die Erhaltung des Gesamtimpulses P~ = N X mi~r˙i = const. . i=1 Für ein (in jede Richtung) translationsinvariantes System ist somit der Gesamtimpuls eine Erhaltungsgröße. Verschwinden die äußeren Potentiale nicht, aber es gilt Vi (~r + ~a; t) = Vi (~r; t) für alle i = 1, 2, . . . , N und spezielle durch ~a gegebene Richtungen, so gilt ~a · F~ tot = 0. Damit ergibt sich unter der Wahl G = 0 die Erhaltungsgröße ~a · P~ = const. , d.h. die Projektion des Gesamtimpulses in die Richtung dieser ~a ist erhalten. Ist ein System somit in bestimmte Richtungen translationsinvariant, so ist der Gesamtimpuls in diese Richtungen erhalten. Sind alle äußeren Kraftfelder F~iext räumlich homogen, d.h. F~iext (~ri ; t) = F~iext (t), so ist die Bedingung ~a · F~ tot = −dG/dt für Z t G(t) = −a · F~ tot (t0 ) dt0 t0 erfüllt. Damit folgt das “Bewegungsintegral” Z t tot 0 0 ~ ~ ~a · P (t) − F (t ) dt = const. . t0 Da ~a aufgrund der Homogenität der äußeren Kräfte beliebig ist, gilt auch Z t P~ (t) − F~ tot (t0 ) dt0 = const. . t0 Für den oben diskutierten Spezialfall mit N = 1 und d = 1 ergibt sich aus diesem Ergebnis das obige Resultat. 3.6. SYMMETRIEN UND ERHALTUNGSSÄTZE 79 2. Die räumliche Drehung mit ~hi (~ri ; t) = D~ri . Dabei ist D eine zeitunabhängige 3 × 3-Matrix, sodaß B = 1 + D eine Drehung mit BBT = 1 darstellt. Daraus folgt, daß D + DT = 0 gelten muß und D eine antisymmetrische ~D Matrix ist. Damit gibt es nach den Überlegungen von Seite 28 zu D ein φ mit ~hi (~ri ; t) = φ ~ D × ~ri . Wegen h i ˙ ~ D × ~r˙i = 0 ~r˙i · ~hi = ~r˙i · φ entfällt der entsprechende Term bei der Suche nach einer Symmetrietransformation und wir suchen ein G mit N X i=1 i h ~ D × ~ri = − d G . F~i · φ dt Aufgrund von “actio=reactio” tragen in der Summe wieder nur die äußeren Kräfte bei. Wegen ~a · (~b × ~c) = ~b · (~c × ~a) folgt dann ~D · φ N h i X d ~ ~ri × ∇~ri Vi = G . dt i=1 Eine beliebige räumliche Drehung ist somit eine Symmetrietransformation, falls Vi = Vi (|~xi |), d.h. die äußeren Kräfte Zentralkräfte sind. Dann ver~ D und die obige Gleichung ist schwindet die linke Seite für jedes beliebige φ für G = 0 erfüllt. Der Erhaltungssatz lautet dann N X i=1 ~ D × ~ri ] = φ ~D · mi~r˙i · [φ N X ~D · L ~ = const. . [~ri × p~i ] = φ i=1 ~ D beliebig ist, folgt die Erhaltung des Gesamtdrehimpulses L. ~ Liegen Da φ keine radialsymmetrischen Potentiale Vi vor, sondern solche, die nur eine ~ haben, für die also spezielle Symmterieachse φ ~ × ~ri ]) Vi (~ri ) = Vi (~ri + [φ ~·L ~ ~ auf die φgilt, so ist nur die Projektion des Gesamtdrehimpulses φ Richtung erhalten. Ein Beispiel dafür ist ein Problem mit Zylindersymmetrie. 80 KAPITEL 3. LAGRANGESCHE MECHANIK 3. Die eigentliche Galileitransformation mit ~hi (~r; t) = ~v0 t. Aufgrund von “actio=reactio” tragen wieder nur die äußeren Kräfte bei und das Kriterium für das Vorliegen einer Symmetrietransformation lautet t~v0 · F~ tot + ~v0 · N X i=1 dG . mi~r˙i = t~v0 · F~ tot + ~v0 · P~ (t) = − dt Sind die äußeren Kräfte homogen, so wird das Kriterium durch die Funktion Z t h i tot 0 0 0 ~ ~ G(t) = −~v0 · F (t ) t + P (t ) dt0 t0 erfüllt. Da aufgrund der Homogenität der Kraft ~v0 beliebig ist, ist die zugehörige Erhaltungsgröße durch Z th i tot 0 0 0 ~ ~ ~ P (t)t − F (t ) t + P (t ) dt0 = const. t0 gegeben. Sollten die Massen mi zeitunabhängig sein (was wir ja hier meist ~ angenommen haben), so gilt P~ (t) = M dR/dt, mit dem Schwerpunktsvektor ~ R(t). Damit folgt Z t ~ ~ P (t)t − F~ tot (t0 ) t0 dt0 − M R(t) = const. . t0 Man bezeichnet den Erhaltungssatz als den Schwerpunktsatz. Für F~ tot = 0 (was P~ (t) = P~ = const. impliziert) folgt P~ ~ t + const. = V~0 t + const. , R(t) = M also die Schwerpunktsbewegung im Fall ohne äußere Kräfte. Diese folgt auch sofort durch Integration der Gesamtimpulserhaltung, so daß man aus der Invarianz unter der eigentlichen Galileitransformation für F~ tot = 0 keine zusätzliche Information gewinnt. Mit diesen Überlegungen haben wir bis auf die Energieerhaltung alle früher diskutierten Erhaltungssätze aus der durch das Noethersche Theorem gegebenen Beziehung zwischen den Symmetrien (genauer den Symmetrietransformationen) eines Systems und Erhaltungsgrößen hergeleitet. Von den bereits oben eingeführten Galileitransformationen haben wir die Translation der Zeit noch nicht betrachtet. Das liegt daran, daß wir bisher nur Symmetrietransformationen der Form q̄i = qi + hi (q; t) betrachtet haben, bei der die verallgemeinerten Koordinaten transformiert werden, jedoch nicht die Zeitvariable. Wir werden später auch diese Situation betrachtet – was uns dann auch auf die Energieerhaltung 3.6. SYMMETRIEN UND ERHALTUNGSSÄTZE 81 führt–, wollen aber zunächst einen Weg diskutieren, auf dem sich die Energieerhaltung im Rahmen der Lagrangeschen Formulierung der Mechanik sehr schnell ergibt. Er führt uns auf das Konzept der Hamiltonschen Funktion. Die Hamiltonfunktion: Wir betrachten eine Lagrangefunktion für ein N -Teilchensystem der Form L(q(t), q̇(t); t) = T (q(t), q̇(t); t) − V (q(t); t). Differentiation nach der Zeit liefert X ∂L ∂L ∂L dL = q̇i + q̈i + dt ∂qi ∂ q̇i ∂t i X d ∂L ∂L ∂L = q̇i + q̈i + dt ∂ q̇i ∂ q̇i ∂t i d X ∂L ∂L , (3.8) = q̇i + dt i ∂ q̇i ∂t wobei wir beim Übergang zur zweiten Zeile die Lagrangegleichung verwendet haben. Wir definieren nun die Hamiltonfunktion H als H= X pi q̇i − L = i X ∂L i ∂ q̇i q̇i − L . Damit folgt aus Gl. (3.8) ∂L dH =− . dt ∂t Hängt L nicht explizit von der Zeit ab, so ist damit H eine Erhaltungsgröße ∂L = 0 ⇒ H = const. . ∂t In den beiden obigen Beispielen – Doppelpendel (Seiten 56-58) und Perle auf dem rotierendem Draht (Seite 66) – hängt L nicht explizit von der Zeit ab und H ist eine Erhaltungsgröße. Wir nehmen nun an, daß die kinetische Energie die Form T = 1X q̇i Ai,j (q)q̇j , 2 i,j mit Ai,j = Aj,i hat. Wie wir schon anhand diverser Beispiele gesehen haben, ist dieses die generische Form für die kinetische Energie bei holonom-skleronomen Zwangsbedingungen. Genauer kann man sich überlegen, daß die kinetische Energie diese Form hat, wenn die Transformation ~ri (q1 , . . . , qm ; t) nicht explizit von der Zeit abhängt. Das Doppelpendel von Seiten 56-58 fällt in diese Klasse, die 82 KAPITEL 3. LAGRANGESCHE MECHANIK Perle auf dem rotierendem Draht von Seite 66 nicht. Ist die kinetische Energie eine quadratische Form in den q̇i , so folgt für den konjugierten Impuls pl = X ∂T = Al,j q̇j . ∂ q̇l j P Es gilt also i pi q̇i = 2T . Für die angenommene Form der kinetischen Energie ergibt sich so H =T +V , d.h. die Hamiltonfunktion ist durch die Gesamtenergie gegeben. Somit haben wir für eine nicht explizit zeitabhängige Lagrangefunktion, deren kinetischer Teil die obige Form hat (holonom-skleronome Zwangsbedingungen), die Energieerhaltung gezeigt (z.B. für das Doppelpendel). Im Beispiel der Perle auf dem Draht ist H zwar erhalten, aber H ist nicht gleich der Energie, die ja offensichtlich nicht erhalten ist. Liegt eine Transformation ~ri (q1 , . . . , qm ; t) vor, die nicht explizit von der Zeit abhängt, so ist H die Energie. Sollte jedoch das Potential explizit von der Zeit abhängen, so ist H (d.h. die Energie) nicht erhalten. Noethersches Theorem II: Die Überlegungen über Erhaltungsgrößen und Symmetrietransformationen abschließend, diskutieren wir noch Transformationen, in denen auch die Zeit transformiert wird. Wie oben betrachten wir infinitesimale Transformationen τ = t + h0 (t) , q̄i (τ ) = qi (t) + hi (q; t) = qi (t(τ )) + hi (q(t(τ )); t(τ )) . Wir werden im Folgenden die Ableitung nach τ mit einem Strich bezeichnen. Wie man durch Verallgemeinerung der Rechnung von Seite 64 sieht, erfüllen die q̄i (τ ) die Lagrangegleichung ∂ L̄ d ∂ L̄ = , 0 dτ ∂ q̄i ∂ q̄i mit L̄(q̄, q̄ 0 ; τ ) = (dt/dτ ) L(q(t), q̇(t); t). Die Differentialgleichungen für die q̄i (τ ) haben sicher wieder dieselbe Form wie die für die qi (t), falls L̄(q̄(τ ), q̄ 0 (τ ); τ ) = L(q̄(τ ), q̄ 0 (τ ); τ ) + d G̃(q̄(τ ); τ ) . dτ Also muß dt d L(q(t), q̇(t); t) = L(q̄(τ ), q̄ 0 (τ ); τ ) + G̃(q̄(τ ); τ ) dτ dτ 3.6. SYMMETRIEN UND ERHALTUNGSSÄTZE 83 gelten. Differentiation nach und anschließendes Nullsetzen von liefert mit G̃ = G und dt dτ = 1 + ḣ0 ⇒ = 1 − ḣ0 + O(2 ) dt dτ sowie dt + h0i dτ h i = q̇i (t) 1 − ḣ0 + ḣi + O(2 ) q̄i0 (τ ) = q̇i das differentielle Kriterium −Lḣ0 = X ∂L i ∂L ∂L dG hi + (ḣi − ḣ0 q̇i ) + h0 + . ∂qi ∂ q̇i ∂t dt Dabei haben wir beim Übergang zur zweiten Zeile angenommen, daß das Kriterium erfüllt ist und haben die Lagrangegleichung sowie ∂L/∂t = −dH/dt verwendet. Die Terme, in denen h0 und ḣ0 auftreten, lassen sich als Zeitableitung von Hh0 schreiben und man erhält schließlich X ∂L i ∂ q̇i hi − Hh0 + G = const. als Verallgemeinerung des Noetherschen Theorems. Als Anwendung betrachten wir die Zeittranslation mit h0 (t) = t0 und hi = 0 für alle anderen i. Das differentielle Kriterium lautet dann t0 ∂L dG =− . ∂t dt Diese Relation ist offensichtlich erfüllt, falls ∂L/∂t die zeitliche Ableitung einer Funktion von q und t ist. Sei z.B. X mi L= ~r˙i2 − V (~r1 , . . . , ~rN ) + L0 (t) 2 i mit zeitunabhängigen mi und zeitunbabhängigem V , soPist ∂L/∂t = L̇0 (t) und das Kriterium ist für G(t) = −t0 [L0 (t) + c] erfüllt. Mit i p~i · ~r˙i = 2T folgt H = T + V + L0 (t) und der Erhaltungssatz Ht0 − G = const. lautet bei T + V = const. , 84 KAPITEL 3. LAGRANGESCHE MECHANIK d.h. die Gesamtenergie ist (im Gegensatz zu H) erhalten. Für L0 = 0 ergibt sich das Ergebnis aus dem letzten Abschnitt. Bevor wir uns mit der hamiltonschen Formulierung der Mechanik beschäftigen wollen, werden wir uns im nächsten Kapitel kurz Gedanken über (kleine) gekoppelte Schwingungen machen. Wir werden dabei (erneut) beleuchten, warum die Dynamik gekoppelter harmonischer Oszillatoren eine zentrale Rolle in der klassischen Mechanik spielt. Weiterhin wollen wir anhand des Beispiels der transversen Schwingungen einer Saite die Kontinuumsmechanik kennen lernen. Neben der Mechanik von Punktteilchen und der von starren Körpern spielt sie eine sehr wichtige Rolle. So fällt z.B. die Dynamik strömender Flüssigkeiten und Gase, aber auch die Verformungsdynamik von Festkörpern (z.B. Metallen), in diesen Bereich.6 6 Diese Aussage gilt, wenn den Längenskalen auf denen man die Dynamik der Flüssigkeiten, Gase und Festkörper betrachtet, nicht erlaubt, die mikroskopischen Konstituenten (die Moleküle und Atome) aufzulösen. Kapitel 4 Gekoppelte Schwingungen und schwingende Saiten 4.1 Kleine gekoppelte Schwingungen von mehreren Freiheitsgraden Wir betrachten ein System mit m Freiheitsgraden, welches durch die verallgemeinerten Koordinaten q = q1 , q2 , . . . , qm beschrieben wird. Das zugrundeliegende System von N Massepunkten sei durch den 3N -dimensionalen Ortsvektor ~r = ~r(q) beschrieben, wobei keine explizite Zeitabhängigkeit in der Transformation von q nach ~r auftritt. Weiterhin seien die Kräfte durch ein zeitunabhängiges Potential gegeben. Die Lagrangefunktion für diese Problem lautet m 1X L(q, q̇) = q̇i Ai,j (q)q̇j − V (q) = T (q, q̇) − V (q) , 2 i,j=1 wobei Ai,j (q) = N X α=1 mα ∂~rα ∂~rα · . ∂qi ∂qj Die Matrix A ist symmetrisch, d.h.P Ai,j = Aj,i . Wie auf Seite 80 gezeigt, folgt für den zu qi konjugierten Impuls pi = j Ai,j q̇j und damit für die Lagrangegleichung d X ∂T ∂V Ai,j (q)q̇j − =− , dt j ∂qi ∂qi i = 1, 2, . . . , m (4.1) Für allgemeine Potentiale ist dieses ein System von m gekoppelten, nicht-linearen Differentialgleichungen zweiter Ordnung, das in dieser Allgemeinheit meist nur numerisch gelöst werden kann. Wir wollen nun untersuchen, ob es trotzdem Situationen gibt, die man geschlossen analytisch lösen kann. 85 86 KAPITEL 4. SCHWINGUNGEN UND SAITEN Die einfachste Möglichkeit ist dabei das Auftreten von Situationen, in denen ein statisches Gleichgewicht vorliegt und alle qi zeitunabhängig sind. Insbesondere gilt dann für alle Zeiten q̇i = 0 = q̈i , i = 1, 2, . . . , m. In Gl. (4.1) verschwindet damit die linke Seite und Gleiches muß für die rechte Seite gelten. Damit kann ein statisches Gleichgewicht nur in Punkten q 0 mit ∂V = 0 , i = 1, 2, . . . , m ∂qi 0 q vorliegen, d.h. in Punkten, in denen die verallgemeinerte Kraft verschwindet und das Potential stationär wird. Wir betrachten nun das Potential in der Nähe eines dieser Punkte. In jede der m durch qi gegebenen Richtungen (d.h. als Funktion von qi bei festgehaltenen übrigen Variablen) kann ein lokales Minimum, ein Sattelpunkt, oder ein lokales Maximum vorliegen. Hat V (q) in q 0 ein lokales Minimum, so liegt ein lokales Minimum in jede der Richtungen vor und der Gleichgewichtspunkt heißt stabil. Andernfalls ist der Gleichgewichtspunkt instabil. Wir betrachten nun das Verhalten der Bewegung in der Nähe eines Gleichgewichtspunktes q 0 . Ähnliche Betrachtungen haben wir bereits mehrfach im Laufe der letztsemestrigen und der aktuellen Vorlesung angestellt. Um die Notation zu vereinfachen, wählen wir die Koordinaten so, daß q 0 = 0 gilt. Mit dieser Wahl des Ursprungs betrachten wir den Fall, daß die qi kleine “Auslenkungen” sind. Wir linearisieren dann die Bewegungsgleichungen oder äquivalent dazu betrachten wir in L nur Terme, die höchstens quadratisch in den Auslenkungen und den Geschwindigkeiten q̇i sind (Talyorentwicklung).1 Da T bereits bilinear in den q̇i ist, können wir in Ai,j (q) die Variable q durch ihren Wert am Gleichgewichtspunkt ersetzen Ai,j = Ai,j (0). Für das Potential führen wir eine (mehrdimensionale) Taylorentwicklung bis zu Termen zweiter Ordnung durch m m X 1 X ∂ 2 V ∂V qi + qi qj + O(q 3 ) . V (q) = V (0) + ∂qi q=0 2 i,j=1 ∂qi ∂qj q=0 i=1 Da q = 0 ein Gleichgewichtspunkt sein soll, verschwindet der lineare Term. Zusätzlich verschieben wir das Potential, bzw. den Energienullpunkt um den konstanten Wert V (0).2 Damit gilt V (q) = m 1X qi Bi,j qj + O(q 3 ) , 2 i,j=1 mir der symmetrischen Marix B Bi,j 1 ∂ 2 V = = Bj,i . ∂qi ∂qj q=0 Sollten die q̇i nicht “klein” sein, dann würde die Bewegung nicht “in der Nähe” von q = 0 bleiben. 2 Das Potential bzw. der Energienullpunkt ist immer nur bis auf eine Konstante eindeutig definiert, so daß solch eine Verschiebung jederzeit möglich ist. 4.1. KLEINE SCHWINGUNGEN 87 Vernachlässigen wir Terme dritter Ordnung und höher in q und q̇, so ist die Lagrangefunktion die Summe zweier quadratischer Formen m m 1X 1X q̇i Ai,j q̇j − qi Bi,j qj L = 2 i,j=1 2 i,j=1 1 ˙ 1 ~q · A~q˙ − ~q · B~q , (4.2) 2 2 P wobei wir die Vektoren ~q = i qi~ei mit orthonormalen Basisvektoren ~ei definiert haben (rein mathematisch, kein Bezug zu kartesischen Koordinaten). Die kinetische Energie ist eine positive Größe (für ~q˙ 6= 0). Daher muß die quadratische Form T positiv definit sein. Die aus dem genäherten L folgenden linearisierten Lagrangegleichungen sind = m X j=1 Ai,j q̈j = − m X Bi,j qj j=1 bzw. A~q¨ = −B~q . Diese Gleichungen folgen auch direkt durch Taylorentwickeln der ursprünglichen Lagrangegleichungen. Mathematisch betrachtet stellen die Bewegungsgleichungen jetzt ein System linearer gekoppelter Differentialgleichungen zweiter Ordnung dar. Diese Gleichungen entkoppeln ohne weitere Rechnungen (Transformationen) nur dann, wenn die beiden Matrizen A und B diagonal sind. Ein Beispiel für Differentialgleichungssysteme des vorliegenden Typs haben wir zu Beginn des Kapitels 2.15 der Vorlesung des letzten Semesters (siehe Seite 101 und folgende des Skripts) und einer zugehörigen Übungsaufgabe kennen gelernt. Dort haben wir die Bewegung zweier durch hookesche Federn (daher bereits lineare Gleichungen) gekoppelter Massen betrachtet, in dem A diagonal ist, B jedoch nicht. In diesem Beispiel haben wir exemplarisch untersucht, wie man die möglichen Bewegungsformen besser verstehen und das Gleichungssystem analytisch lösen kann (mit Hilfe eines Ansatzes mit der Zeitabhängigkeit exp (iωt)), wenn man eine Hauptachsentransformation für die Matrix B ausführt (das Eigenwertproblem löst). Wir sind dabei auf die Normalfrequenzen und die Eigenmoden der Bewegung gestoßen. Die allgemeine Lösung konnte man dann als Linearkombination der Bewegung in den Eigenmoden schreiben. Als weiteres Beispiel dient das in Kapitel 3.2 der aktuellen Vorlesung diskutierte Doppelpendel mit qi = φi , i = 1, 2 (siehe Seite 56 und folgende). Die stabile Ruhelage ist durch φ1 = 0 = φ2 gegeben. Nach Entwickeln der Ausdrücke für die kinetische und potentielle Energie (T∗ und V∗ auf Seite 58) bis zu Termen der Ordnung φ2 und Verschieben des Nullpunktes der Energie ergibt 88 KAPITEL 4. SCHWINGUNGEN UND SAITEN sich l12 (m1 + m2 ) l1 l2 m2 l1 l2 m2 l22 m2 l1 (m1 + m2 )g 0 0 l2 m2 g A= und B= und B ist (bereits) diagonal. Wir wollen nun sehen, wie man im allgemeinen Fall mit einer beliebigen symmetrischen Matrix BBasis und einer positiv definiten, symmetrischen Matrix3 A vorgehen kann. Die obigen Überlegungen sollten Motivation genug sein, zunächst das verallgemeinerte Eigenwertproblem B~v = λA~v (4.3) zu betrachten. Da A eine positiv definite symmetrische Matrix ist, gibt es m paarweise orthonormale Eigenvektoren ~ai mit A~ai = ai~ai , mit den4 Eigenwerten ai > 0 (siehe Kapitel 2.14 Pder Vorlesung des letzten Semesters). Jeder Vektor ai schreiben. Damit können wir Matrizen A±1/2 w ~ ∈ Rm läßt sich als w ~= m i=1 ci~ definieren, für die A ±1/2 w ~= m X ±1/2 c i ai ~ai i=1 gilt. Man kann leicht nachrechnen, daß A1/2 A1/2 = A und A−1/2 A1/2 = 1 gilt. Mit ~v = A−1/2 V~ folgt so für Gl. (4.3) CV~ = λ1V~ (4.4) mit C = A−1/2 BA−1/2 . Mit A und B symmetrisch, ist auch C symmetrisch und wir haben das obige verallgemeinerte Eigenwertproblem Gl. (4.3) auf ein gewöhnliches Gl. (4.4) zurückgeführt.5 Wir nehmen nun an, daß wir die paarweise orthonormalen Eigenvektoren V~i und Eigenwerte λi zu C bestimmt haben. 3 Eine symmetrische Matrix, die auf eine positiv definite quadratische Form führt. In der Basis aus Eigenvektoren ist A diagonal. Damit ist es offensichtlich, daß für w·A ~ w ~ >0 für alle Vektoren w ~ ∈ Rm /{0} alle Eigenwerte ai positiv sein müssen. 5 Es ist wichtig zu bemerken, daß das verallgemeinerte Eigenwertproblem Gl. (4.3) im Allgemeinen nicht durch Multiplikation mit A−1 von links zu einem gewöhnlichen Eigenwertproblem mit einer symmetrischen Matrix wird. Dies liegt daran, daß A−1 B im Allgemeinen nicht symmetrisch ist, selbst wenn A und B symmetrisch sind! 4 4.1. KLEINE SCHWINGUNGEN 89 Damit können wir die Eigenvektoren des verallgemeinerten Eigenwertproblems ~vi = A−1/2 V~i berechnen.6 Da A−1/2 eine lineare Abbildung mit positiven Eigenwerten darstellt, bilden die ~vi einen Satz m linear unabhängiger Vektoren, also eine Basis. Es gilt V~i · CV~j = δi,j λi A1/2~vi · A−1/2 BA−1/2 A1/2~vj = δi,j λi ⇒ und damit ~vi · B~vj = δi,j λi . (4.5) Ebenfalls gilt V~i · V~j = δi,j ⇒ A1/2~vi · A1/2~vj = ~vi · A~vj = δi,j . Entwickelt man nun einen beliebigen Vektor ~q ∈ Rm nach den ~vi , ~q = mit q̄i = ~vi · A~q = ~q · A~vi , so folgt X X ~q˙ · A~q˙ = q̄˙j ~vj · A~vi q̄˙i = q̄˙i2 , ~q · B~q = i,j i X X q̄j ~vj · B~vi q̄i = i,j (4.6) Pm vi i=1 q̄i~ λi q̄i2 . i Diese Relationen werden wir gleich zur Lösung unseres mechanischen Problems verwenden. Zur praktischen Bestimmung der λi und ~vi sucht man die Nullstellen des verallgemeinerten charakteristischen Polynoms det(B−λA) und löst anschließend das homogene Gleichungssystem (B − λi A)~vi = 0. Die Lösung legt die ~vi nur bis auf einen i-abhängigen Faktor fest.7 Diese m Faktoren können so gewählt werden, daß die obigen Gleichungen (4.5) bzw. (4.6) gelten. Wir verwenden nun das Gelernte, um unser mechanisches Problem gekoppelter Schwingungen mit kleiner Amplitude weiter zu untersuchen. Gehen wir in der Lagrangefunktion Gl. (4.2) von den qi zu den neuen verallgemeinerten Koordinaten q̄i = ~vi · A~q über, so gilt in diesen Normalkoordinaten m L= 1X 2 q̄˙i − λi q̄i2 2 i=1 und die zugehörigen Lagrangegleichungen q̄¨i = −λi q̄i , i = 1, 2, . . . , m ~i dimensionslos sind, während die Einträge Beachten sie, daß die orthonormalen Vektoren V der ~vi über A−1/2 dimensionsbehaftet sind. 7 Wir weisen noch einmal darauf hin, daß die Komponenten der ~vi im Allgemeinen dimensionsbehaftet sind. 6 90 KAPITEL 4. SCHWINGUNGEN UND SAITEN entkoppeln. Bei der Lösung der entkoppelten Bewegungsgleichungen müssen wir die Fälle λi > 0, λi = 0 und λi < 0 unterscheiden. Die allgemeinen Lösungen lauten λi = ωi2 > 0 : q̄i (t) = c1 cos (ωi t) + c2 sin (ωi t) , λi = 0 : q̄i (t) = c1 + c2 t , λi = −ki2 < 0 : q̄i (t) = c1 cosh (ki t) + c2 sinh (ki t) , mit den (i-abhängigen) Konstanten c1 und c2 . Der Fall λi > 0, für alle i = 1, 2, . . . , m, in dem alle Normalkoordinaten q̄i eine periodische Bewegung vollführen, ist von besonderem Interesse. In diesem Fall heißen die ωi die Eigenfrequenzen (oder Normalfrequenzen) der Bewegung. Die beiden oben angesprochenen Beispiele (System aus zwei Massen und drei hookeschen Federn und gekoppelte Pendel bei kleiner Auslenkung) fallen in diese Klasse. Für beliebige Anfangsbedingungen qi (0) und q̇i (0) lautet die Lösung dann ~q(t) = m X i=1 qi (t)~ei = m X i=1 1 ˙ (~q(0) · A~vi ) cos (ωi t) + ~q(0) · A~vi sin (ωi t) ~vi . ωi Die Lösung unseres mechanischen Problems kann somit als Überlagerung von Eigenschwingungen geschrieben werden. Falls die Eigenfrequenzen nicht in einem rationalen Verhältnis zueinander stehen, resultiert jedoch keine periodische Bewegung. Es bietet sich an, die Diskussion der kleinen, gekoppelten Schwingungen als Startpunkt für eine tiefere Analyse der bereits im letzten Semester eher oberflächlich behandelten nicht-linearen Systeme und der chaotischen Bewegung zu nutzen. Aus Zeitgründen können wir hier leider nicht darauf eingehen und verweisen auf die entsprechende Literatur. Ebenfalls böte es sich an, noch einmal zeitlich getriebene Systeme zu untersuchen (z.B. die parametrische Resonanz). Auch darauf müssen wir hier aus Zeitgründen verzichten. 4.2 Schwingende Saiten Als kurzen Ausflug in die Kontinuumsmechanik wollen wir hier sehr knapp die Bewegung einer gespannten Saite betrachten. Diese Überlegungen werden uns auf die Wellengleichung führen, die im Kontext der elektromagnetischen Wellen eine wichtige Rolle in der Theorievorlesung des nächsten Semesters spielen wird. Wir nehmen an, daß die Saite in der Ruhelage entlang der x-Achse liegt. Die Position der Saite zu einer festen Zeit können wir nun durch die Auslenkung u(x) von der x-Achse (also in die y-Richtung) beschreiben. Wir gehen davon aus, daß die Auslenkung klein ist (was das genau bedeutet; siehe später). Die Bedingung, daß die Saite endlich ist und an den Enden z.B. eingespannt ist, werden wir erst später in 4.2. SCHWINGENDE SAITEN 91 unsere Überlegungen einbeziehen. Eine verwandte diskrete Beschreibung würde darin bestehen, die Saite in endliche Segmente zu zerlegen und jedes durch einen Massepunkt zu beschreiben. In diesem Fall würde die kontinuierliche Auslenkfunktion u(x) in einen Satz diskreter Punkte ui , i = 1, 2, . . . , n, übergehen. Die Bewegung ui (t) würde dann gemäß der Newtonschen oder Lagrangeschen Mechanik und nach Spezifikation der Kräfte durch einen Satz gekoppelter gewöhnlicher Differentialgleichungen (siehe z.B. den letzten Abschnitt) beschrieben. Wie wir sehen werden, wird aus diesem System im Kontinuumsfall ui (t) → u(x, t) eine partielle Differentialgleichung, welche partielle Ableitungen nach t und x enthält. Um die Bewegungsgleichung für die Saitenbewegung zu bestimmen, betrachten wir ein kleines Segment der Saite, welches zwischen x und x + ∆x liegt. Zur Vereinfachung vernachlässigen wir die Gravitation und nehmen an, daß die Auslenkung für alle x und t so klein ist, daß die Saite fast parallel zur x-Achse bleibt. Damit wird die Länge der Saite fast nicht verändert und die Saitenspannung T bleibt für alle x und t die gleiche. Die Kraft F~ auf ein Segment der Saite ist damit durch die Summe der Spannungskräfte durch die benachbarten Segmente gegeben. x+∆x x x φ+∆φ φ Entsprechend der Skizze gilt für die Komponente der Kraft F1 in x-Richtung F1 = T cos (φ + ∆φ) − T cos φ , wobei φ der Winkel zwischen der x-Achse und der Saite ist. Da φ und φ+∆φ beide sehr klein sind, können wir den Cosinus entwickeln und bekommen zu führender Ordnung F1 = 0. Die Kraft in x-Richtung verschwindet also, was konsistent mit der Annahme ist, daß die Bewegung nur in y-Richtung stattfindet. Für die Kraft F2 in y-Richtung gilt F2 = T sin (φ + ∆φ) − T sin φ ≈ T ∆φ cos φ ∂φ ≈ T ∆x . ∂x Die auftretende Ableitung ist eine partielle, da φ = φ(x, t). Nutzen wir noch einmal aus, daß φ klein sein soll, so gilt φ = ∂u/∂x und es ergibt sich ∂ 2u F2 ≈ T 2 ∆x . ∂x 92 KAPITEL 4. SCHWINGUNGEN UND SAITEN Nach Newtons zweitem Gesetz gilt F2 = ma2 , mit der Beschleunigung a2 in yRichtung. Diese ist durch a2 = ∂ 2 u/∂t2 gegeben. Für die Masse m des Saitensegments gilt m = µ∆x, mit der Massedichte µ. Damit folgt die Bewegungsgleichung 2 ∂ 2u 2 ∂ u = c , ∂t2 ∂x2 mit c2 = T . µ Man nennt diese Gleichung die eindimensionale Wellengleichung , da ihre Lösung eine Welle entlang der Saite beschreibt (siehe unten). Sie ist eine partielle Differentialgleichung. Die Größe c hat die Dimension einer Geschwindigkeit und beschreibt die Geschwindigkeit, mit der sich die Welle ausbreitet (siehe unten). Die Wellengleichung und ihr dreidimensionales Analogon ∂ 2u ~ 2 u = c2 ∆u , = c2 ∇ ∂t2 beschreibt die Bewegung einer Vielzahl von Wellen, wie z.B. Schallwellen und elektromagnetische Wellen. Wir werden nun zeigen, daß es zwei fundamentale Lösungen der Wellengleichung gibt: Störungen u(x, t) , die sich forminvariant von links nach rechts oder anders herum ausbreiten. Um dieses zu sehen, führen wir die Variablen v = x − ct und w = x + ct ein. Wie sie in einer Übungsaufgabe zeigen werden, gilt dann ∂ ∂u =0 ∂v ∂w (4.7) mit u(x, t) = u(x(v, w), t(v, w)). Um diese Gleichung zu lösen, führen wir h = ∂u/∂w ein, so daß ∂h =0. ∂v Damit hängt h nicht von v (jedoch von w) ab und es folgt ∂u = h(w) . ∂w Für jedes v können wir diese integrieren und erhalten Z w u= h(w0 )dw0 + f (v) = g(w) + f (v) . w0 4.2. SCHWINGENDE SAITEN 93 Durch Einsetzen in Gl. (4.7) kann man sofort verifizieren, daß diese Form die Differentialgleichung erfüllt. Damit hat die allgemeine Lösung8 der Wellengleichung die Form u(x, t) = f (x − ct) + g(x + ct) , wobei g und f (im Sinne des Physikers) beliebige Funktionen sind. Um besser zu verstehen, welche Form die Lösung hat, betrachten wir zunächst den Fall g = 0. Dann gilt u(x, t) = f (x − ct) . Zur Zeit t = 0 ist u(x, 0) = f (x). Die Tatsache, daß u nur eine Funktion von x − ct ist, bedeutet, daß sich die Störung ausgehend von der Zeit t = 0 mit der Geschwindigkeit c nach rechts ausbreitet (jedenfalls dann, wenn c > 0, was wir so wählen können), die Form aber invariant ist. Analog ergibt sich, daß für f = 0 die Störung forminvariant nach links propagiert. Die allgemeine Lösung ist eine Superposition einer nach rechts und einer nach links laufenden Welle. Um eine spezielle Lösung zu bestimmen, müssen wir u(x, 0) und die Geschwindigkeit ∂u(x, t) ∂t t=0 vorgeben, wobei wir ohne Einschränkung der Allgemeinheit angenommen haben, daß t = 0 unserer Anfangszeit entspricht. Eine besondere Lösung ist u(x, t) = A sin [k(x − ct)] = A sin (kx − ωt) , wobei A und k beliebige relle Konstanten sind und ω = kc gilt. Diese Lösung beschreibt eine sinusförmige Welle, die sich nach rechts ausbreitet und eine Amplitude A, Wellenlänge λ = 2π/k und Kreisfrequenz ω hat. Eine analoge sich nach links ausbreitende Welle ist durch u(x, t) = A sin [k(x + ct)] = A sin (kx + ωt) beschrieben. Die Summe dieser beiden Lösungen u(x, t) = A sin (kx − ωt) + A sin (kx + ωt) = 2A sin (kx) cos (ωt) ist ebenfalls eine Lösung der Wellengleichung und hat die bemerkenswerte Eigenschaft, daß sie nicht propagiert. An jedem festen Punkt x bewegt sich die Saite gemäß cos (ωt) mit der Amplitude 2A sin (kx) auf und ab. Speziell an den 8 Wir gehen hier nicht weiter auf die recht komplexe Lösungstheorie partieller Differentialgleichungen ein. 94 KAPITEL 4. SCHWINGUNGEN UND SAITEN so genannten Knoten, den Orten, an denen sin (kx) = 0 (also bei xn = nπ/k mit n ∈ Z) , bewegt sich die Saite gar nicht. Man nennt diese Lösung eine stehende Welle. Bisher sind wir implizit davon ausgegangen, daß unsere Saite unendlich lang ist, oder zumindest so lang, daß Randeffekte keine Rolle spielen. In Gegenwart von Enden ergeben sich zusätzliche Randbedingungen. Abhängig von der Natur der Enden (z.B. eingespannt oder frei) ergeben sich unterschiedliche Randbedingungen. Hier werden wir nur den Fall betrachten, daß die Saite der Länge L an beiden Enden eingespannt ist und damit u(0, t) = 0 = u(L, t) für alle Zeiten t gelten muß. Man überzeugt sich leicht davon, daß u(x, t) = A sin (kx) cos (ωt) mit k = kn = n π , L ω = ωn = cn π , L n∈Z eine Lösung ist, die die Randbedingungen erfüllt. In einer Übungsaufgabe werden sie dieses Problem genauer analysieren. Nach diesem kurzen Exkurs in die Kontinuumsmechanik wollen wir nun auf die Hamiltonsche Beschreibung der Mechanik kommen. Kapitel 5 Hamiltonsche Mechanik Die Lagrangeschen Bewegungsgleichungen bilden für ein holonomes System mit m Freiheitsgraden einen Satz von m (gekoppelten) Differentialgleichungen zweiter Ordnung. Wie wir bereits im Mathematikteil der Vorlesung des letzten Semesters gesehen haben, ist es immer möglich aus diesem Differentialgleichungssystem eines erster Ordnung, aber mit 2m Gleichungen, zu machen, was jedoch nicht notwendigerweise ein Vorteil sein muß. Wie wir folgend sehen werden, geschieht dieser Prozess beim Übergang von den Lagrangeschen zu den Hamiltonschen Bewegungsgleichungen auf eine wohldefinierte, kanonische (also mustergültige) Art. Erst wenn wir die spezifische Form der Bewegungsgleichungen hergeleitet haben, wird klar werden, wieso die 2m Gleichungen erster Ordnung eine vorteilhafte mathematische Beschreibung darstellen. In der Hamiltonschen Mechanik steht die Hamiltonfunktion im Fokus, die wir bereits in den Überlegungen zur Energieerhaltung (bzw. Erhaltungsgrößen allgemein) im Lagrangeschen Formalismus kennen gelernt haben. Wie wir gesehen haben, entspricht die Hamiltonfunktion im Fall von holonom-skleronomer Zwangsbedingungen der Gesamtenergie des betrachteten Systems, hat also im Gegensatz zur Lagrangefunktion eine klare physikalische Bedeutung und ist für zeitunabhängige Potentiale eine Erhaltungsgröße.1 Wie die Lagrangesche Formulierung ist auch die Hamiltonsche äquivalent zum Newtonschen Zugang, jedoch ist sie noch flexibler im Hinblick auf die Wahl der Koordinaten als der Lagrangeformalismus. Zwangsbedingungen können analog zum Lagrangeformalismus eingebaut werden. Der Hamiltonsche Zugang ist ebenfalls ideal zur Behandlung weiterer Erhaltungsgrößen. Wir werden diese und weitere Vorteile der Hamiltonschen Formulierung im Laufe der Diskussion genauer kennen lernen und beleuchten. Neben den eher technischen Vorteilen ermöglicht uns die Hamiltonsche Mechanik eine andere Darstellung der Struktur der klassischen Mechanik. Von der Hamiltonschen Formulierung führt ein (direkter) Weg zur Quantenmechanik und sie liefert die Grundlage der statistischen Mechanik, was weitere Begründungen 1 Dies könnte man bereits als einen der Vorteile der Hamiltonschen Mechanik gegenüber der Lagrangeschen Mechanik bezeichnen. 95 96 KAPITEL 5. HAMILTONSCHE MECHANIK dafür liefert, daß es wichtig ist auch den Hamiltonformalismus kennen zu lernen. 5.1 Variable, Bewegungsgleichungen und zyklische Koordinaten Da wir die Hamiltonfunktion ja bereits im Rahmen des Lagrangeformalismus eingeführt haben, sollte offensichtlich sein, daß dieser einen guten Startpunkt bildet. Wir hatten die m kanonischen Impulse als pi = ∂L ∂ q̇i definiert, wobei L = L(q, q̇; t) gilt. Wir werden nun annehmen,2 daß man diese Gleichung nach den m q̇i auflösen kann und so q̇i = q̇i (q, p; t) erhält. Dann definiert man die Hamiltonfunktion – eine Funktion der m qi , der m pi und der Zeit t, als H(q, p; t) = X pi q̇i (q, p; t) − L(q, q̇(q, p; t), t) . i Man bezeichnet diese Art der Variablentransformation als Legendretransformation.3 Die Hamiltonfunktion ist eine Funktion der m verallgemeinerten Koordinaten qi und der m verallgemeinerten (kanonischen) Impulse pi (sowie eventuell der Zeit). Den Raum der 2m Variablen (q, p) bezeichnet man als den Phasenraum. Diesen Begriff haben wir bereits im letzten Semester kennen gelernt. In den dortigen eindimensionalen Beispielen haben wir die Ebene (x, ẋ) als den Phasenraum bezeichnet. Ein Punkt im Phasenraum charakterisiert den Zustand des mechanischen Systems eindeutig. Wir wollen nun die fundamentalen Bewegungsgleichungen bestimmen. Dazu 2 In der Praxis stellt dies keine starke Einschränkung dar. Im Tutorium wurde die Legendretransformation in einem allgemeineren Kontext diskutiert. Sie spielt speziell in der Thermodynamik eine sehr zentrale Rolle. 3 5.1. VARIABLE, BEWEGUNGSGLEICHUNGEN UND. . . 97 betrachten wir ∂H ∂qj X ∂ q̇i ∂L ∂ q̇i ∂L = − − pi ∂qj ∂ q̇i ∂qj ∂qj i X ∂ q̇i ∂L ∂ q̇i − pi − = pi ∂qj ∂qj ∂qj i ∂L ∂qj d ∂L = − dt ∂ q̇j d = − pj dt = −ṗj . = − Weiterhin gilt ∂H ∂pj X ∂ q̇i ∂L ∂ q̇i = q̇j + − pi ∂p ∂ q̇i ∂pj j i = q̇j . Wir haben damit die Hamiltonschen Gleichungen q̇j = ∂H ∂H , ṗj = − ∂pj ∂qj bestimmt. Sie bilden einen Satz von 2m (gekoppelten) Differentialgleichungen erster Ordnung für die Variablen qi und pi der Hamiltonfunktion. Man nennt diese Gleichungen auch die kanonischen Gleichungen. Die Lösung dieser Bewegungsgleichungen liefert die Phasenraumtrajektorie. Fassen wir die Phasenraumvariable ~ zusammen (Spaltenvektor, der qi und pi zu einem 2m dimensionalen Vektor X sich durch Untereinanderschreiben der qi und pi ergibt), so haben die Bewegungsgleichungen die einfache Form ~˙ = ~h(X; ~ t) . X ~ indiziert einen eindeutigen Punkt im Phasenraum und bezeichnet Jeder Punkt X einen eindeutigen Satz von Anfangsbedingungen unseres Systems. Das System von Differentialgleichungen, dessen Lösung direkt den Phasenraumfluß liefert, hat für nicht explizit zeitabhängige H die besonders einfache Struktur (Ableitung von ~ = (Funktion von X). ~ Dies ist eine Standardform, die in der mathematischen X) Literatur häufig untersucht wurde. Wie wir weiter unten sehen werden, erlauben die Bewegungsgleichungen Koordinatentransformationen – die sogenannten kanonischen Transformationen – 98 KAPITEL 5. HAMILTONSCHE MECHANIK die die Form der Bewegungsgleichungen invariant lassen und die nicht nur die verallgeinerten Orte involviert (wie im Lagrangeformalismus), sondern den ge~ Es wird also Transformationen der Form (siehe samten Phasenraumvektor X. unten) Q = Q(q, p; t) , P = P (q, p; t) geben. Dies ist ein großer Unterschied und entscheidener Vorteil gegenüber dem Lagrangeformalismus. Er schafft eine größtmögliche Flexibilität, welche Variable man verallgemeinerte Koordinate und welche verallgemeinerten Impuls nennt. Die beiden Begriffe verschwimmen. Als Beispiel zum Übergang vom Lagrange- zum Hamiltonformalismus betrachten wir die Lagrangefunktion (holonom-skleronome Zwangsbedingungen) L=T −V = 1X q̇i Ai,j (q)q̇j − V (q; t) , 2 i,j wobei Ai,j (q) = Aj,i (q). Der kanonischen Impuls ist somit X pi = Ai,j (q)q̇j . j Da die kinetische Energie positiv ist, gilt detA > 0, d.h. das Inverse der Matrix A−1 existiert und es folgt X q̇i = A−1 i,j (q)pj . j Wie wir bereits wissen, ist die Hamiltonfunktion in diesem Fall gleich der Energie H =T +V , wobei T aber durch die pi und qi ausgedrückt werden muß 1X 1X q̇i Ai,j (q)q̇j = pi A−1 T = i,j (q)pj . 2 i,j 2 i,j Im einfachsten Fall eines Teilchens der Masse m (d.h. A = m) in einer Dimension gilt T = p2 . 2m Ergänzen wir diese kinetische Energie durch ein harmonisches Potential (z.B. Federschwingung) 1 V = mω02 q 2 , 2 5.1. VARIABLE, BEWEGUNGSGLEICHUNGEN UND. . . 99 mit der Auslenkung q = x aus der Ruhelage, so folgt die Hamiltonfunktion des eindimensionalen harmonischen Oszillators H= p2 1 + mω02 q 2 . 2m 2 Die Hamiltonfunktion ist gleich der Gesamtenergie E und eine Erhaltungsgröße. Die Bewegungsgleichungen lauten p ∂H = ⇒ ṗ = mq̈ , ∂p m ∂H ṗ = − = −mω02 q ∂q q̇ = und führen kombiniert auf die uns bekannte Schwingungsgleichung q̈ + ω02 q = 0. Wie wir bereits wissen, ist H eine Erhaltungsgröße, falls L nicht explizit von der Zeit abhängt, da dH ∂L =− . dt ∂t Diese Beziehung läßt sich auch unter Verwendung der Hamiltonschen Gleichungen herleiten X ∂H dH ∂H ∂H = q̇i + ṗi + dt ∂qi ∂pi ∂t i X ∂L = [−ṗi q̇i + q̇i ṗi ] − ∂t i = − ∂L . ∂t Im Übergang von der ersten zur zweiten Zeile haben wir dabei neben der Bewegungsgleichung ausgenutzt, daß die Ableitung nach der expliziten t-Abhängigkeit von H durch das negative dieser von L gegeben ist. Verwenden wir nur die erste Zeile und die Bewegungsgleichung so folgt dH ∂H = . dt ∂t Einer der entscheidenen Vorteile des Hamiltonschen Formalismus gegenüber dem Lagrangeschen wird klar, wenn man zyklische Koordinaten hat. Es sei daran erinnert, daß man eine Koordinate qi als zyklisch bezeichnet, wenn sie in L nicht auftritt. In diesem Fall ist der zugehörige kanonische Impuls pi eine Erhaltungsgröße. Aufgrund der Hamiltonschen Bewegungsgleichung 0 = ṗi = − ∂H ∂qi 100 KAPITEL 5. HAMILTONSCHE MECHANIK und auch die Hamiltonfunktion ist unabhängig von der zyklichen Variablen qi . Erscheint umgekehrt eine zyklische Variable nicht in H, so ist der zugehörige kanonische Impuls erhalten. Der Vorteil des Hamiltonschen Zugangs besteht nun darin, daß man eine zyklische Kooridnate und ihren zugehörigen Impuls in gewissem Sinne ignorieren kann. In der Lagrangefunktion tritt die verallgemeinerte Geschwindigkeit q̇i zu einer zyklischen Koordinate qi im Allgemeinen noch auf und wird eine komplexe Zeitabhängigkeit haben, also keine Erhaltungsgröße sein. Dagegen kann man in der Hamiltonfunktion den Impuls pi zur zyklischen Koordinate qi auf einen konstanten Wert αi setzen und in diesem Sinne das System um einen Freiheitsgrad von m nach m − 1 reduzieren. Die Konstante αi wird dann später durch die Anfangsbedingungen festgelegt. Die Zeitabhängigkeit der zyklischen Variable bestimmt man durch Lösen der Bewegungsgleichung q̇i = ∂H . ∂αi Um dieses Vorgehen zu konkretisieren, nehmen wir an, daß wir die Koordinaten so umsortiert haben, daß die zyklische Koordinate qm ist. Es gilt also H = H(q1 , . . . , qm−1 , p1 , . . . , pm−1 , αm ; t) und man hat nur noch ein Problem mit m − 1 Freiheitsgraden.4 Wenn jetzt q1 (t), . . . , qm−1 (t), p1 (t), . . . , pm−1 (t) eine Lösung des Problems ist, ergibt sich αm aus den Anfangsbedingungen und qm (t) durch Integrieren von ∂H q̇m = (q1 , . . . , qm−1 , p1 , . . . , pm ; t) . ∂pm pm =αm Sind alle Koordinaten zyklisch, d.h. H = H(p; t), so folgt pi = αi = const. für alle i. Man gewinnt die αi aus den Anfangsbedingungen (die αi sind Integrationskonstanten) und die qi (t) durch Integrieren von ∂H q̇i = (p1 , . . . , pm ; t) = ωi (t) . ∂pi p=α Diese Gleichungen lassen sich leicht lösen Z t qi (t) = ωi (t0 ) dt0 + ci , t0 4 Im Routhschen Formalismus trägt man der Tatsache Rechnung, daß der Übergang vom Lagrangeschen zum Hamiltonschen Formalismus speziell für zyklische Koordinaten vorteilhaft ist. Man führt dabei die Legendretransformation von den q̇i zu den pi nur für die zu zyklischen Koordinaten gehörenden Indizes aus und endet somit bei einem teilweise Hamiltonschen und teilweise Lagrangeschen Zugang. Wir werden diese Überlegungen hier nicht weiter verfolgen und verweisen auf die Literatur. 5.2. DIE POISSONKLAMMERN 101 mit den Konstanten ci . Hängt H zusätzlich nicht explizit von der Zeit ab, so folgt ωi (t) = ωi = const. und damit qi (t) = ωi t + c̃i , mit einer anderen Konstanten c̃i . Man könnte geneigt sein, diese Situation (alle Koordinaten sind zyklisch) als rein akademisch anzusehen, denn es wird bei einer ersten Wahl der verallgemeinerten Koordinaten kaum der Fall sein, daß alle diese zyklisch sind. Wenn wir jedoch später die bereits angesprochenen allgemeinen Koordinatentransformationen auf dem Phasenraum einführen, so könnte es gelingen, daß alle neuen Koordinaten in der Tat zyklisch sind.5 In einem nächsten Schritt wollen wir das Konzept der Poissonklammern einführen. 5.2 Die Poissonklammern Die zeitliche Änderung einer Funktion F (q(t), p(t); t) der kanonischen Variablen6 läßt sich mit Hilfe der Hamiltonschen Gleichungen wie folgt schreiben X ∂F ∂F ∂F dF = q̇i + ṗi + dt ∂qi ∂pi ∂t i X ∂F ∂H ∂F ∂H ∂F = − + ∂qi ∂pi ∂pi ∂qi ∂t i = {F, H}q,p + ∂F , ∂t (5.1) wobei wir die sogenannten Poissonklammern X ∂F ∂G ∂F ∂G {F, G}q,p = − ∂qi ∂pi ∂pi ∂qi i für zwei Funktionen F und G der kanonischen Koordinaten definiert haben. Im Folgenden werden wir den Index, der auf den Satz der Koordinaten (q, p) hinweist meist, weglassen und auf die Abhängigkeit vom Koordinatensatz später eingehen. Gemäß dieser Definition gilt (wie man direkt nachrechnet) 1. {F, G} = −{G, F } (Antisymmetrie) 2. {c1 F1 +c2 F2 , G} = c1 {F1 , G}+c2 {F2 , G} mit beliebigen Konstanten c1 , c2 (Linearität) 5 Man verschiebt dabei die Schwierigkeit des Lösens von Systemen von Differentialgleichungen auf das algebraische Problem des Findens der richtigen Transformation. Die richtige Transformation zu finden ist dabei keineswegs trivial. 6 Dabei sollen q(t) und p(t) der Bewegungsgleichung genügen. 102 KAPITEL 5. HAMILTONSCHE MECHANIK 3. {c, F } = 0 für beliebige Konstante c 4. {F1 , {F2 , F3 }} + {F2 , {F3 , F1 }} + {F3 , {F1 , F2 }} = 0 (Jacobi-Identität) 5. {F, G1 G2 } = {F, G1 }G2 + G1 {F, G2 } Eine wichtige Rolle in der Hamiltonschen Theorie spielen die mit den kanonischen Variablen gebildeten Poissonklammern, die sogenannten fundamentalen Poissonklammern X ∂qk ∂pl ∂qk ∂pl X − = δk,i δl,i = δk,l {qk , pl } = ∂qi ∂pi ∂pi ∂qi i i und (ist gemäß der Definition trivial) {qk , ql } = 0 , {pk , pl } = 0 . Wählt man jetzt in Gl. (5.1) F = qi bzw. F = pi , so folgt q̇i = {qi , H} , ṗi = {pi , H} . Die Bewegungsgleichungen lassen sich somit elegant mit Hilfe der Poissonklammern schreiben. Ein wichtiger Punkt ist nun, daß man die fünf Rechenregeln der Poissonklammern und die fundamentalen Poissonklammern bei Rechnungen verwenden kann, ohne direkten Bezug zur Definition der Poissonklammern (also zu ihrer konkreten Realisierung) zu machen. Wir wollen das anhand des Aufstellens der Bewegungsgleichungen für den eindimensionalen harmonischen Oszillator illustrieren. Für diesen gilt H= 1 p2 + cq 2 , 2m 2 mit q = x. Damit folgt q̇ = {q, H} 1 1 1 p2 = {q, + cq 2 } = {q, p2 } + c{q, q 2 } 2m 2 2m 2 1 1 = [p{q, p} + {q, p}p] + c [q{q, q} + {q, q}q] 2m 2 p = m sowie ṗ = {p, H} p2 1 1 1 = {p, + cq 2 } = {p, p2 } + c{p, q 2 } 2m 2 2m 2 1 1 = [p{p, p} + {p, p}p] + c [q{p, q} + {p, q}q] 2m 2 = −cq . 5.2. DIE POISSONKLAMMERN 103 Dies sind natürlich die bekannten Bewegungsgleichungen für das vorliegende Problem. Bei der Ableitung haben wir aber nirgends differenziert oder von der Definition der Poissonklammern Gebrauch gemacht. Sind die fünf Rechenregeln der Poissonklammern, die fundamentalen Poissonklammern sowie dF/dt = {F, H} + ∂F also anders als hier realisiert, so würde das gleiche Ergebnis folgen. Genau dies ∂t ist in der Quantenmechanik der Fall. Dort werden die physikalischen Observablen Ort und Impuls zu linearen Operatoren auf einem Vektorraum mit speziellen Eigenschaften (einem sogenannten Hilbertraum). Das Klammersymbol (mit allen seinen obigen Eigenschaften) ist für zwei solcher Operatoren  und B̂ durch {Â, B̂} = 1 1 (ÂB̂ − B̂ Â) = [Â, B̂] i~ i~ realisiert. Man nennt [. . . , . . .] den Kommutator. Die Konstante ~ = h/(2π) ist durch das Plancksche Wirkungsquantum h = 6.626 · 10−34 Js gegeben. Die abgeleiteten Bewegungsgleichungen für den klassischen harmonischen Oszillator gelten dann völlig analog in der Quantenmechanik für den Orts- und den Impulsoperator. Ebenfalls völlig analog gilt die Bewegungsgleichung (5.1) für einen allgemeinen Operator Â(t) 1 ∂  d = [Â, Ĥ] + , dt i~ ∂t (5.2) wobei Ĥ der Hamiltonoperator ist, der sich nach einem bestimmten Konstruktionsprinzip (Korrespondenzprinzip; siehe die Theorie–III–Vorlesung) aus der Hamiltonfunktion ergibt. Aus Gl. (5.1) schließt man sofort, daß F (q(t), p(t); t) eine Erhaltungsgröße ist, wenn {F, H} + ∂F =0 ∂t bzw. für nicht explizit von der Zeit abhängige F {F, H} = 0 . Insbesondere gilt dH ∂H ∂H = {H, H} + = , dt ∂t ∂t da nach der Definition der Poissonklammern trivialerweise {H, H} = 0. Die Beobachtung, daß die totale Ableitung der Hamiltonfunktion nach der Zeit gleich der partiellen ist, ist uns schon begegnet. Wir können somit (erneut) schließen, daß H genau dann eine Erhaltungsgröße ist, wenn H nicht explizit von der Zeit abhängt. 104 KAPITEL 5. HAMILTONSCHE MECHANIK Ebenfalls ohne explizite Verwendung der Definitionsgleichung des Klammersymbols kann man zeigen, daß d {F, G} = dt lim ({F (t + ∆t), G(t + ∆t)} − {F (t), G(t)}) /∆t F (t + ∆t) − F (t) = lim , G(t + ∆t) ∆t→0 ∆t G(t + ∆t) − G(t) + F (t), ∆t dF dG = , G + F, , dt dt ∆t→0 wobei wir die Linearität der Poissonklammern verwendet haben. Aus dieser Überlegung folgt das Poissonsche Theorem, welches besagt, daß mit F und G auch {F, G} eine Erhaltungsgröße ist. Dabei ist jedoch keinesfalls klar, daß {F, G} eine neue Erhaltungsgröße (ein neues Bewegungsintegral) liefert. Es kann z.B. vorkommen, daß man {F, G} = c + f (F, G) mit einer Konstanten c und der Funktion f schreiben kann. Wenn F und G Erhaltungsgrößen sind, ist die rechte Seite trivialerweise eine Erhaltungsgröße. Wir betrachten nun zwei jeweils kanonisch konjugierte Variablensätze (q, p) und (Q, P ) = (Q(q, p), P (q, p)), d.h. für beide Variablensätze sollen jeweils die Hamiltonschen Bewegungsgleichungen gelten, wobei man bezüglich (q, p) die Funktion H(p, q; t) und bezüglich (Q, P ) die Funktion H̄(Q, P ; t) = H(q(Q, P ), p(Q, P ); t) zu nehmen hat. Die Transformation zwischen den Variablensätzen hänge an dieser Stelle nicht explizit von der Zeit ab.7 Die Variablen (q, p) erfüllen die fundamentalen Poissonklammern (bezüglich (q, p)). Wir werden nun zeigen, daß in diesem Fall auch die (Q, P ) die fundamentalen Poissonklammern (bezüglich (q, p)) erfüllen8 {Qk , Pl }q,p = δk,l , {Qk , Ql }q,p = 0 , {Pk , Pl }q,p = 0 . 7 Im nächsten Abschnitt betrachten wir die Transformationen genauer. Die kanonischen Variablen (Q, P ) erfüllen natürlich die fundamentalen Poissonklammern bezüglich (Q, P ). 8 5.3. KANONISCHE TRANSFORMATIONEN 105 Wir betrachten dazu Q̇i = = = = X m m X d ∂Qi ∂Qi ∂H ∂Qi ∂Qi ∂H Qi (q(t), p(t)) = q̇k + ṗk = − dt ∂qk ∂pk ∂qk ∂pk ∂pk ∂qk k=1 k=1 X ∂Qi ∂ H̄ ∂Ql ∂ H̄ ∂Pl ∂Qi ∂ H̄ ∂Ql ∂ H̄ ∂Pl + − + ∂q ∂Q ∂P ∂p ∂Q ∂Pl ∂qk k l ∂pk l ∂pk k l ∂qk k,l X ∂ H̄ ∂Qi ∂Ql ∂Qi ∂Ql ∂ H̄ ∂Qi ∂Pl ∂Qi ∂Pl − + − ∂Ql ∂qk ∂pk ∂pk ∂qk ∂Pl ∂qk ∂pk ∂pk ∂qk k,l X −Ṗl {Qi , Ql }p,q + Q̇l {Qi , Pl }p,q . l Ein Vergleich der beiden Seiten zeigt, daß {Qi , Pl }q,p = δi,l , {Qk , Ql }q,p = 0 . Die fehlende Gleichung folgt analog, wenn man Ṗi betrachtet. Man kann direkt nachrechnen (tun sie es!!), daß für die obigen beiden Variablenpaare alle Poissonklammern invariant sind, d.h. {F, G}Q,P = {F, G}q,p gilt. Wie oben schon angedeutet, kann man somit die Indizes an den Klammern weglassen, wenn man sich nur auf kanonische Variablen beschränkt.9 5.3 Kanonische Transformationen In diesem Abschnitt werden wir die bereits oben angesprochenen Transformationen auf dem Phasenraum betrachten, die es erlauben, die verallgemeinerten Koordinaten und kanonischen Impulse zu vermischen. Dabei sollen die Hamiltonschen Bewegungsgleichungen natürlich invariant bleiben. Wir wollen zunächst daran erinnern, daß man im Lagrangeformalismus mit Transformationen der Form qi → q̄i (q; t) zu tun hat, die die Bewegungsgleichungen invariant lassen (andere Wahl der verallgemeinerten Koordinaten). Wie wir im Abschnitt über das Hamiltonsche Prinzip weiterhin gesehen haben, sind die Lagrangeschen Bewegungsgleichungen, die sich aus L und cL + dG(q; t)/dt, mit einer beliebigen Funktion G(q; t), ergeben, identisch. Wir wollen zunächst überprüfen, in wie weit sich die zweite Invarianz auf den Hamiltonformalismus übertragen läßt und betrachten daher ein modifiziertes 9 Die Bewegungsgleichung hat also für beide Variablensätze dieselbe Form. Wir betonen noch einmal, daß wir uns bisher auf Transformationen zwischen kanonischen Variablenpaaren beschränkt haben, die nicht explizit von der Zeit abhängen. 106 KAPITEL 5. HAMILTONSCHE MECHANIK Hamiltonsches Prinzip. Wie wir oben gezeigt haben, wird das Wirkungsfunktional Z t2 L(q(t), q̇(t); t) dt S= t1 bei festgehaltenem q(t1 ) und q(t2 ) entlang der physikalischen Bahn extremal. Kurz schreibt man dafür oft δS = 0 . Formal ersetzen wir nun im Ausdruck für das Wirkungsfunktional L durch die Hamiltonfunktion # Z t2 "X m S= pj q̇j − H(q, p; t) dt . t1 j=1 Da nun die p gleichberechtigten Variablen neben den q sind, hat die Variation der Bahn in einem Extremalprinzip nun im Phasenraum zu erfolgen. Wir betrachten daher Phasenraumtrajektorien, die ein wenig von der physikalischen Trajektorie abweichen. In Verallgemeinerung der Überlegungen von Seite 68 betrachten wir qj (t; α) = qj (t) + ηj (t; α) , pj (t; α) = pj (t) + γj (t; α) mit ηj (t1 ; α) = 0 = ηj (t2 ; α) ∀α , ηj (t; α = 0) = 0 ; γj (t; α = 0) = 0 und der physikalischen Trajektorie (q(t), p(t)). Dabei sollen die ηj (t; α) und γj (t; α) für α → 0 mindestens linear verschwinden. Es ist wichtig zu beachten, daß die γj (t; α) im Gegensatz zu den ηj (t; α) bei t1 und t2 nicht verschwinden müssen. Wir betrachten # Z t2 "X m d dS = pi (t; α)q̇i (t; α) − H(q(t; α), p(t; α); t) dt =0. dα α=0 dα t1 i=1 α=0 Völlig analoge Schritte wie bei der Herleitung des Hamiltonschen Prinzips führen uns dann auf die Hamiltonschen Bewegungsgleichungen. Aus dieser Konstruktion der Hamiltonschen Bewegungsgleichungen wird damit sofort klar, daß auch diese (wie die Lagrangeschen Bewegungsgleichungen) invariant gegenüber Koordinatentransformationen qi → q̄i (q; t) sind, wenn man den verallgemeinerten Impuls pi = ∂L ∂ L̄ → p̄i = ∂ q̇i ∂ q̄˙i 5.3. KANONISCHE TRANSFORMATIONEN 107 ˙ t) = L(q(q̄; t), q̇(q̄, q̄; ˙ t); t). Wie wir sehen geeignet mit transformiert, wobei L̄(q̄, q̄; werden (und bereits mehrfach angedeutet haben), kann man im Hamiltonformalismus jedoch allgemeinere Transformation betrachten, die die Bewegungsgleichungen invariant lassen. Wir wollen als nächstes zeigen, daß auch die Hamiltonschen Bewegunsgleichungen invariant unter L → L̃ = L + dG(q; t)/dt sind. Wir definieren den zu L̃ gehörenden verallgemeinerten Impuls ∂L ∂ d ∂ L̃ = + G(q; t) ∂ q̇j ∂ q̇j ∂ q̇j dt " # m X ∂L ∂ ∂ ∂G(q; t) = + G(q; t) + q̇i ∂ q̇j ∂ q̇j ∂t ∂qi i=1 p̄j = = pj + ∂G(q; t) . ∂qj (5.3) Mit diesem konstruieren wir die neue Hamitonfunktion (q̄j = qj ) X X ∂G(q; t) dG H̄ = p̄j q̄˙j − L̃ = pj + q̇j − L − ∂qj dt j j = H+ X ∂G(q; t) j = H− ∂qj q̇j − X ∂G(q; t) i ∂qi q̇i − ∂ G(q; t) ∂t ∂ G(q; t) . ∂t Mit der neuen Hamiltonfunktion H̄ = H(q = q̄, p(q, p̄; t); t) − ∂G/∂t, mit pj = p̄j − ∂G(q; t) , ∂qj verifizieren wir jetzt die kanonischen Bewegungsgleichungen ∂ H̄ ∂ q̄j ∂ H̄ ∂H X ∂H ∂pi ∂ 2G = + − ∂qj ∂qj ∂pi ∂qj ∂qj ∂t i X ∂ 2G ∂ 2G = −ṗj − q̇i − ∂qj ∂qi ∂qj ∂t i = = −ṗj − d ∂ G(q; t) . dt ∂qj Mit Gl. (5.3) folgt also ∂ H̄ = −p̄˙j . ∂ q̄j 108 KAPITEL 5. HAMILTONSCHE MECHANIK Es gilt ebenfalls ∂ H̄ ∂ p̄j = X ∂H ∂pi ∂H = = q̇j ∂pi ∂ p̄j ∂pj i und damit ∂ H̄ = q̄˙j . ∂ p̄j Die Bewegungsgleichungen sind somit invariant. Ganz nebenbei haben wir in den letzten Überlegungen gezeigt, daß für einen gegebenen Satz von kanonischen Variablen pj , qj auch Q j = qj , P j = pj + ∂ G(q; t) ∂qj (5.4) für beliebiges G(q; t) kanonisch konjugierte Variablen sind. Die Vorgabe von qj legt somit die dazu kanonisch konjugierten Impulse nicht eindeutig fest. Da im Hamiltonformalismus neben den qj die pj eine gleichberechtigte Rolle spielen, ist die Klasse der Transformationen, die die Bewegungsgleichungen invariant, lassen sehr viel größer als im Lagrangeformalismus.10 Wir betrachten also allgemeine Transformationen Q = Q(q, p; t) , P = P (q, p; t) . Interessant für uns sind nur solche Transformationen, die die Bewegungsgleichungen invariant lassen. Wir definieren daher die Klasse der kanonischen Transformationen, für die es eine Funktion H̄ = H̄(Q, P ; t) gibt, so daß (j = 1, 2, . . . , m) Q̇j = ∂ H̄ ∂ H̄ , Ṗj = − ∂Pj ∂Qj gilt. Wie das H̄ aus dem H hervorgeht, spielt dabei keine Rolle. Gilt H̄(Q, P ; t) = H(q(Q, P ; t), p(Q, P ; t); t) , so wollen wir die Transformation kanonisch im engeren Sinn nennen. Bereits oben haben wir gezeigt, daß Transformationen des Typs L → L̃ = L + dG(q; t)/dt bzw. H → H̄ = H(q = q̄, p(q, p̄; t); t) − ∂G(q; t)/∂t, sowie die Koordinatentransformationen qi → q̄i (q; t), pi = ∂L/∂ q̇i → p̄i = ∂ L̄/∂ q̄˙i kanonisch sind. Um an einem Beispiel klar zu machen, daß man durch eine kanonische Transformation 10 Ein Unterraum dieser Transformationen ergibt sich wie zu Beginn dieses Abschnitts beschrieben direkt aus den erlaubten Transformationen im Lagrangeformalismus. 5.3. KANONISCHE TRANSFORMATIONEN 109 die Konzepte verallgemeinerte Koordinate und kanonischer Impuls vermischen kann, betrachten wir den “extremen” Fall der Transformation Qj = Qj (q, p; t) = −pj , Pj = Pj (q, p; t) = qj . Bei gegebenem H(q, p; t) folgt dann H̄(Q, P ; t) = H(P, −Q; t) und ∂ H̄ ∂Pj ∂ H̄ ∂Qj ∂H(P, −Q; t) ∂H(q, p; t) = = −ṗj = Q̇j , ∂Pj ∂qj ∂H(P, −Q; t) ∂H(q, p; t) = =− = −q̇j = −Ṗj . ∂Qj ∂pj = Damit ist die obige Transformation auf dem Phasenraum kanonisch im engeren Sinne. Wir sehen, daß die Konzepte verallgemeinerte Koordinate und kanonischer Impuls im Hamiltonformalismus ihre klare Bedeutung verlieren und die Qj und Pj völlig gleichberechtigte Variablen sind. Dieses Beispiel deutet weiterhin die große Flexibilität der Wahl der Variablen im Hamiltonformalismus an. Es macht erneut plausibel, daß es gelingen könnte, alle Qj nach einer geeigneten kanonischen Transformation zu zyklischen Koordinaten zu machen. In der Hamilton-JacobiTheorie wird diese Überlegung zu einer Lösungsmethode ausgebaut. Wir wollen als nächstes das modifizierte Hamiltonsche Prinzip dazu nutzen zu zeigen, daß eine Transformation Q = Q(q, p; t), P = P (q, p; t) kanonisch ist, falls m X pj q̇j − H = j=1 m X j=1 Pj Q̇j − H̄ + dF1 , dt (5.5) wobei F1 = F1 (q, Q; t) eine beliebige (hinreichend harmlose) Funktion ist.11 Man nennt F1 die Erzeugende der Transformation. Wir zeigen zunächst, daß F1 die Transformation und H̄ eindeutig festlegt. Dazu betrachten wir dF1 X ∂F1 ∂F1 ∂F1 = q̇j + Q̇j + . dt ∂q ∂Q ∂t j j j Auflösen von Gl. (5.5) liefert m dF1 X = pj q̇j − Pj Q̇j + H̄ − H . dt j=1 11 Es sei darauf hingewiesen, daß nicht alle kanonischen Transformationen mit Hilfe einer Erzeugenden geschrieben werden können. 110 KAPITEL 5. HAMILTONSCHE MECHANIK Ein Vergleich zeigt, daß pj = ∂F1 , ∂qj Pj = − ∂F1 ∂F1 , H̄ = H + . ∂Qj ∂t (5.6) Sind nun q, p und F1 vorgegeben, so löst man pj = ∂F1 = pj (q, Q; t) ∂qj nach den Qj auf und erhält Qj = Qj (q, p; t). Dieses Ergebnis setzen wir in Pj = − ∂F1 (q, Q; t) ∂Qj ein und erhalten so Pj = Pj (q, p; t). Aufgrund der dritten Relation in Gl. (5.6) ist auch H̄ eindeutig bestimmt. Als nächstes zeigen wir, daß die durch F1 erzeugte Transformation kanonisch ist. Dazu betrachten wir ! ! Z t2 X Z t2 X m m dF1 S = pj q̇j − H dt = Pj Q̇j − H̄ + dt dt t1 t 1 j=1 j=1 ! Z t2 X m = Pj Q̇j − H̄ dt + F1 (q(t2 ), Q(t2 ); t2 ) − F1 (q(t1 ), Q(t1 ); t1 ) . t1 j=1 In der zweiten Zeile müssen wir nun nach den Q und P variieren. Verwenden wir zusätzlich die zweite der Relationen aus Gl. (5.6), so folgen aus dem modifizierten Hamiltonschen Prinzip die Hamiltonschen Bewegungsgleichungen (nachrechnen!) für die Q und P (aus H̄). Damit ist die durch F1 erzeugte Transformation kanonisch. Mit Hilfe von Legendretransformationen können wir weitere Typen von Erzeugenden finden, die jeweils von einem alten und einem neuen Variablensatz abhängen F2 = F2 (q, P ; t) F3 = F3 (p, Q; t) F4 = F4 (p, P ; t) . Dabei entscheidet das vorliegende Problem, welche Form der Erzeugenden am günstigsten ist. Auch die drei weiteren Formen liefern dabei eindeutig eine kanonische Transformation, wie man analog zum Fall F1 zeigen kann. Wir wollen dies hier aus Zeitgründen nicht genauer beleuchten, jedoch am Rande erwähnen, daß kanonische P Transformationen des Typs L → L̃ = L + dG(q; t)/dt durch F2 (q, P ; t) = j qj Pj − G(q; t) erzeugt werden (vergleiche mit Gl. (5.4)). Stattdessen wollen wir das Beispiel einer Erzeugenden studieren. Wir betrachten F1 (q, Q; t) = − m X j=1 qj Q j . 5.3. KANONISCHE TRANSFORMATIONEN 111 und bekommen damit nach Gl. (5.6) pj = ∂F1 = −Qj , ∂qj Pj = − ∂F1 = qj , ∂Qj d.h. die bereits oben eingeführte kanonische Transformation, die die verallgemeinerten Koordinaten und kanonischen Impulse vertauscht. Wir wollen nun zeigen, wie man mit Hilfe einer kanonischen Transformation die fast vollständig algebraische Lösung eines mechanischen Problems erreichen kann. Dazu betrachten wir erneut den eindimensionalen harmonischen Oszillator mit Hamiltonfunktion H= p2 1 + mω02 q 2 . 2m 2 Wir wählen die Erzeugende 1 F1 (q, Q) = mω0 q 2 cot Q . 2 Das liefert nach Gl. (5.6) p= ∂F1 = mω0 q cot Q , ∂q bzw. nach Auflösen nach q und p r 2P sin Q , q= mω0 P =− p= ∂F1 1 1 = mω0 q 2 2 , ∂Q 2 sin Q p 2P mω0 cos Q . Wegen ∂F1 /∂t = 0 gilt für die neue Hamiltonfunktion 1 2P mω0 2P cos2 Q + mω02 sin2 Q 2m 2 mω0 = ω0 P . H̄(Q, P ) = H(q(Q, P ), p(Q, p)) = Damit ist die Koordinate Q zyklisch, was P (t) = P0 = const. bedeutet. Weiterhin gilt Q̇ = ∂ H̄ = ω0 ∂P und damit Q(t) = ω0 t + Q0 . Eingesetzt liefert das auf nahezu algebraische Art die Lösung des harmoischen Oszillators r 2P0 q(t) = sin (ω0 t + Q0 ) , mω0 p p(t) = 2P0 mω0 cos (ω0 t + Q0 ) , 112 KAPITEL 5. HAMILTONSCHE MECHANIK wobei Q0 und P0 durch die Anfangsbedingungen festgelegt sind. Es gibt verschiedene Kriterien die Kanonizität einer gegebenen Phasenraumtransformation Q = Q(q, p; t) , P = P (q, p; t) zu testen (auch wenn die Erzeugende nicht bekannt ist). Unter anderem ist die Kanonizität genau dann sichergestellt, wenn die neuen Größen die fundamentalen Poissonklammern erfüllen {Qk , Pl }p,q = δk,l , {Qk , Ql }p,q = 0 , {Pk , Pl }p,q = 0 , was wir hier aus Zeitgründen nicht beweisen wollen (siehe die Literatur). 5.4 Die Hamilton-Jacobi-Gleichung Wie bereits öfter angedeutet, lassen sich im Hamiltonformalismus aus der großen Freiheit bei der Wahl von Transformationen, die die Bewegungsgleichungen invariant lassen, Lösungsstrategien für mechanische Probleme entwickeln. Man könnte z.B. eine Transformation für ein gegebenes H(q, p; t) suchen, so daß das zugehörige H̄(Q, P ; t) gleich der Hamiltonfunktion eines bereits gelösten Problems ist. Es sollte klar sein, daß dieses nur in recht speziellen Fällen gelingen kann. Weiterhin wäre die Lösung der Bewegungsgleichungen eines Problems dann trivial, wenn nach geeigneter Transformation alle Koordinaten zyklisch sind. Diese Strategie haben wir bereits häufiger erwähnt und zur Lösung des eindimensionalen harmonischen Oszillators angewandt. Noch einfacher wäre es, wenn nach der kanonischen Transformation Qj = βj = const. , Pj = αj = const. , j = 1, 2, . . . , m gelten würde. Die Lösung der Bewegungsgleichungen ergibt sich dann einfach durch Umkehren der Transformation q = q(β, α; t) , p = p(β, α; t) , wobei die αj und βj durch die Anfangsbedingungen bestimmt sind (Integrationskonstanten). Die Q und P sind sicherlich dann konstant, wenn die neue Hamiltonfunktion H̄(Q, P ; t) verschwindet, d.h. H̄(Q, P ; t) = H(q(Q, P ; t), p(Q, P ; t); t) + ∂F1 (q(Q, P ), Q; t) =0 ∂t gilt, da in diesem Fall Q̇j = ∂ H̄ ∂ H̄ = 0 , Ṗj = − =0 ∂Pj ∂Qj (5.7) 5.4. DIE HAMILTON-JACOBI-GLEICHUNG 113 folgt. Nach Gl. (5.6) gilt pj = ∂F1 . ∂qj Setzen wir dieses und Qi = βi = const. in Gl. (5.7) ein, so folgt ∂F1 (q, β, t) ∂F1 (q, β, t) ∂F1 (q, β; t) H q1 , . . . , q m , ,..., ;t + =0. ∂q1 ∂qm ∂t Diese Hamilton-Jacobi-Gleichung ist eine partielle Differentialgleichung erster Ordnung für die Erzeugende der kanonischen Transformation F1 (q, β; t). Ist F1 bekannt, so ist das mechanische Problem (bis auf das noch nötige algebraische Auflösen von Gleichungen) gelöst. Es gibt verschiedene Strategien, die HamiltonJacobi-Gleichung zu lösen. Wir können diese jedoch aus Zeitgründen nicht diskutieren. Es empfiehlt sich, sich die Hamilton-Jacobi-Theorie anhand von Lehrbüchern zu studieren. 114 KAPITEL 5. HAMILTONSCHE MECHANIK Kapitel 6 Grundzüge der relativistischen Mechanik Die in dieser Vorlesung und der des letzten Semesters entwickelte klassische Mechanik beruht auf einigen im letzten Semester dargestellten Grundüberlegungen, die man zu Postulaten erheben kann. Diese sind experimentell motiviert und wurden in unser sich über zwei Semester erstreckenden Diskussion unter verschiedenen Blickwinkeln wiederholt betrachtet. Wie bereits zu Beginn des letzten Semesters erwähnt, verlieren die Grundüberlegungen (die Postulate) ihre experimentelle Begründung, wenn wir mit Situationen konfrontiert werden, in denen Geschwindigkeiten auftreten, die nicht mehr sehr viel kleiner als die Vakuumlichtgeschwindigkeit c ≈ 3 · 108 m/s sind. In diesem Fall müssen die Grundüberlegungen im Einklang mit den experimentellen Beobachtungen modifiziert werden, was zu einer neuen Struktur der resultierenden Theorie der Bewegung “makroskopischer”1 Teilchen führt. Im vorliegenden Fall führt das auf die relativistische Mechanik bzw. die spezielle Relativitätstheorie.2 Die bisher diskutierte klassische Mechanik folgt dann im Grenzfall, von Geschwindigkeiten die sehr viel kleiner als c sind aus der relativistischen Mechanik. Die klassische Mechanik wie von uns bisher beschrieben, ist somit eine Theorie mit eingeschränktem Gültigkeitsbereich. Wir werden hier keine detaillierte Diskussion der speziellen Relativitätstheorie führen, sondern uns primär den Fragen widmen, in welchem Zusammenhang ihre Grundprinzipien zu den von uns bisher diskutierten Grundprinzipien der klassischen Mechanik stehen und in welchem Verhältnis die resultierenden Theorien zu einander stehen. Wir werden hier insbesondere nicht im Detail auf die experimentellen Beobachtungen eingehen, die Einstein 1905 zur Formulierung der speziellen 1 Dieser nicht genau definierte Begriff soll andeuten, daß wir unsere Überlegungen nicht in den Bereich der Quantenmechanik ausdehnen wollen. 2 Die spezielle Relativitätstheorie ist “speziell” in der Hinsicht, daß sie sich primär mit Bezugsystemen beschäftigt, die nicht gegeneinander beschleunigt sind. In der allgemeinen Relativitätstheorie (1915) betrachtet man auch beschleunigte Bezugssysteme. Wie Einstein beschrieben hat, führt dies auf natürliche Weise zu einer Theorie der Gravitation. 115 116 KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK Relativitätstheorie geführt haben. Viel zu kurz kommt ebenfalls die Diskussion der scheinbaren Paradoxa, die mit unserem intuitiven Verständnis nur schwer in Einklang zu bringen sind. Letzteres liegt offensichtlich daran, daß wir im Alltag – und damit auch im Laufe der Evolution – nicht mit Phänomenen konfrontiert sind, in denen Geschwindigkeiten von der Größe der Lichtgeschwindigkeit eine offensichtliche Rolle spielen. 6.1 Die Lorentztransformation In der klassischen Mechanik spielt der Begriff des Inertialsystems eine zentrale Rolle. Bewegt sich ein weiteres Bezugssystem K geradlinig und gleichförmig, also mit konstanter Geschwindigkeit ~v0 gegenüber einem Inertialsystem k, so bildet K ebenfalls ein Inertialsystem. Dem Galileischen Relativitätsprinzip folgend sind alle Naturgesetze in allen Inertialsystemen zu allen Zeiten gleich. Wie im Kapitel 2.2 diskutiert, folgt für die Geschwindigkeitsvektoren in den beiden Sy~˙ (Notation wie in Kapitel 2.2). Als unmittelbare Konsequenz stemen ~r˙ = ~v0 + R dieser Galileitransformation ergibt sich, daß die Vakuumlichtgeschwindigkeit in zwei relativ zueinander geradlinig, gleichförmig bewegten Bezugssystemen unterschiedlich sein sollte. Nehmen wir an, daß sich im Ursprung von k eine Lichtquelle befindet, die sphärische Lichtwellen aussendet, welche sich mit Geschwindigkeit c fortpflanzen.3 Der Vektor ~r sei der Ortsvektor eines Punktes auf einer gegebe~˙ = c~rˆ − ~v0 . nen Wellenfläche. Damit gilt ~r˙ = c~rˆ. Im System K gilt dagegen R In dem System, welches sich relativ zu dem mit der Lichtquelle geradlinig und gleichförmig bewegt, wird somit der Betrag der Lichtgeschwindigkeit im Allgemeinen nicht gleich c sein und wegen der Richtungsabhängigkeit der Geschwindigkeit werden die Wellen nicht mehr sphärisch sein. Verschiedene Experimente, insbesondere das berühmte Michelson-Morley-Experiment haben jedoch gezeigt, daß die Vakuumlichtgeschwindigkeit in alle Richtungen immer gleich ist und daß sie unabhängig von der relativen geradlinig, gleichförmigen Bewegung eines Beobachters gegenüber der Lichtquelle ist. Wollen wir also ein Relativitätsprinzip (Einsteinsches Relativitätsprinzip) der Gleichheit von Naturgesetzen (jetzt auch Konstanz der Lichtgeschwindigkeit; siehe ebenfalls Vorlesung zur Elektrodynamik des kommenden Semesters) in gegeneinander geradlinig, gleichförmig bewegten Bezugssysteme aufrecht erhalten, kann die obige Galileitransformation nicht richtig sein und muß durch eine andere, die Lorentztransformation, ersetzt werden. Diese muß die Lichtgeschwindigkeit in allen geradlinig, gleichförmig bewegten Bezugssystemen erhalten. In Kapitel 2.2 dieser Vorlesung und Kapitel 3.2 der Vorlesung des letzten 3 Wir gehen davon aus, daß die aus der obigen Galileitransformation folgenden Überlegungen für Lichtwellen anwendbar sind. Mehr dazu (Welle-Teilchen-Dualismus) lernen sie in der Quantenmechanik. 6.1. DIE LORENTZTRANSFORMATION 117 Semesters haben wir diskutiert (gefordert), daß die Newtonschen Bewegungsgleichungen unter der obigen Galileitransformation forminvariant bleiben (Galileisches Relativitätsprinzip). Wollen wir nun physikalische Gesetze haben, die unter der allgemeineren (noch aufzustellenden) Lorentztransformation forminvariant bleiben, so ist davon auszugehen, daß sich andere Bewegungsgesetze ergeben, die sich nur für hinreichend kleine Geschwindigkeiten den bisher diskutierten Bewegungsgleichungen annähern. Wir müssen somit wie folgt vorgehen. Zunächst müssen wir die Transformation finden, die die Lichtgeschwindigeit erhält. Im Anschluß daran müssen wir die Gesetze der Mechanik auf ihre Transformationseigenschaften gegenüber dieser Lorentztransformation überprüfen. Gesetze, deren Form nicht invariant bleibt, müssen entsprechend verallgemeinert werden. Die sich ergebenden Folgerungen wurden in einer Vielzahl von Experimenten bestätigt, was letzen Endes die entscheidene (einzige) Rechtfertigung für das Einsteinsche Relativitätsprinzip darstellt. Um die Lorentztransformation zu entwickeln, betrachten wir zwei gegeneinander geradlinig, gleichförmig bewegte Bezugssysteme, deren Ursprünge zur Zeit t = 0 zusammenfallen. Zu diesem Zeitpunkt strahle eine im Ursprung des Systems k befestigte Lichtquelle einen Lichtblitz aus. Ein Beobachter, der sich bezüglich k in Ruhe befindet, beobachtet eine sich mit c ausbreitende Kugelwelle. Die Gleichung der Wellenfront lautet x21 + x22 + x23 = c2 t2 . Die Konstanz der Lichtgeschwindigkeit impliziert nun, daß auch ein in K ruhender Beobachter das Licht so sieht, als wenn es sich als sphärische Welle um den Ursprung seines Bezugssystems ausbreitet. Die entsprechende Gleichung für die Wellenfront lautet also (Notation wie in Kapitel 2.2) X12 + X22 + X32 = c2 T 2 . Dabei lassen wir, indem wir t durch T ersetzen, explizit die Möglichkeit zu, daß sich beim Übergang von k nach K (oder andersherum) auch die Zeitskala transformiert. Genauer gesagt lassen wir zu, daß die gesuchte Transformation, die die beiden Gleichungen ineinander überführt, es womöglich erforderlich macht, daß die Zeitdifferenz zwischen zwei Ereignissen vom Bezugssystem des Beobachters abhängt. Die beiden Gleichungen zusammenfassend muß die Transformation so sein, daß x21 + x22 + x23 − c2 t2 = X12 + X22 + X32 − c2 T 2 . Diese Bedingung erinnert an die für orthogonale Transformationen (Drehungen) geltende Invarianz der Länge von Vektoren. Führen wir also zu den drei Koordinaten xi , i = 1, 2, 3 eine vierte imaginäre Koordinate x4 = ict hinzu, so ergibt 118 KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK sich für die obige Gleichung4 4 X x2µ µ=1 = 4 X Xµ2 . µ=1 Diese Überlegung zeigt, daß die gesuchte Transformation einer Drehung in einem vierdimensionalen Raum entspricht, der aus den drei Komponenten des gewöhnlichen Raums und einer vierten, imaginären Komponente besteht, die proportional zur Zeit ist. Diesen Raum bezeichnet man als Minkowskiraum bzw. die vierdimensionale Raum-Zeit. Die Lorentztransformationen sind die orthogonalen Transformationen auf dem Minkowskiraum. Sie mischen die räumlichen und die zeitliche Komponente der Raumzeit. Die Konzepte Raum und Zeit verlieren damit ihre Unabhängigkeit. Als eine Unterklasse der Lorentztransformationen sind auch rein räumliche Drehungen zugelassen, für die t = T gilt. Wir sprechen von einer reinen Lorentztransformation (“boost”), wenn sie keine räumliche Drehung enthält, sondern gleichförmig, geradlinig bewegte Bezugsysteme ineinader überführt, deren Achsen parallel sind. Es sollte auch ohne Beweis klar sein, daß sich eine allgemeine Lorentztransformation als Produkt einer räumlichen Drehung und einer reinen Lorentztransformation schreiben läßt. Es bedeutet keine Einschränkung der Allgemeinheit (vereinfacht aber unsere Überlegungen) davon auszugehen, daß die Relativbewegung der Bezugssysteme (der “boost”) entlang einer Achsenrichtung, hier der x3 -Richtung, ist. Die Transformation von den xµ auf die Xµ ist durch eine 4 × 4-Matrix A mit Matrixelementen aµ,ν gegeben Xµ = 4 X aµ,ν xν . ν=1 Da A eine orthogonale Transformation vermittelt, müssen die aµ,ν die im Kapitel 2.13 der Vorlesung des letzten Semesters diskutierten Bedingungen 4 X aµ,ν aλ,ν = δµ,λ ν=1 erfüllen. Anders als bisher sind jedoch nicht alle Matrixelemente reell. Da die Koordinaten X1 , X2 und X3 reell bleiben müssen, ist es erforderlich, daß die Elemente ai,4 für i = 1, 2, 3 rein imaginär sind. Analog folgt daraus, daß X4 rein imaginär sein muß, daß die Elemente a4,i , i = 1, 2, 3 rein imaginär sind, während a4,4 reell sein muß. Da die Richtungen x1 und x2 bei der Relativbewegung in 4 Es ist in der Literatur zur speziellen Relativitätstheorie weit verbreitet, griechische Buchstaben für Indizes zu verwenden, die von 1 bis 4 laufen und lateinische, für solche die von 1 bis 3 laufen. 6.1. DIE LORENTZTRANSFORMATION 119 x3 -Richtung in Ruhe bleiben, bleiben sie unter der Transformation unbeeinflußt und es muß X 1 = x1 , X 2 = x2 gelten. Um die Struktur der Matrix A weiter zu analysieren, wollen wir nun noch argumentieren, daß die transformierten Koordinaten X3 und X4 nicht von x1 und x2 abhängen können. Kein Ort in der x1 -x2 -Ebene ist aus physikalischen Gründen als Ursprung des Koordinatensystems ausgezeichnet. Man kann also den Ursprung in jeden Punkt der x1 -x2 -Ebene verschieben, ohne die Werte von X3 und X4 zu beeinflussen, so daß diese unabhängig von x1 und x2 sein müssen. Die Matrix der Lorentztransformation kann somit nur die Form 1 0 0 0 0 1 0 0 A= 0 0 a3,3 a3,4 0 0 a4,3 a4,4 haben. Die Orthogonalitätsbedingungen liefern drei Gleichungen, die die vier nicht-trivialen Matrixelemente verknüpfen a23,3 + a23,4 = 1 , a24,3 + a24,4 = 1 , a3,3 a4,3 + a3,4 a4,4 = 0 . Es ist eine vierte Bedingung nötig, um die nicht-trivialen Matrixelemente eindeutig festzulegen. Sie folgt aus der Beobachtung, daß sich der Ursprung des Systems K (für den X3 = 0 gilt) gleichförmig entlang der x3 -Achse bewegt, so daß zur Zeit t seine x3 -Koordinate gleich vt ist,5 d.h. es gilt x3 = vt = −iβx4 , mit β= v . c Eingesetzt in die Transformation bedeutet das für den Ursprung von K X3 = a3,3 x3 + a3,4 x4 = x4 (a3,4 − iβa3,3 ) = 0 und damit a3,4 = iβa3,3 . 5 Wir lassen folgend den Index 0 bei der Relativgeschwindigkeit ~v = v~e3 weg. 120 KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK Die erste der Orthogonalitätsrelationen liefert damit a23,3 (1 − β 2 ) = 1 ⇒ a3,3 = p 1 1 − β2 und folglich iβ . a3,4 = p 1 − β2 Wie gefordert ist a3,3 reell und a3,4 rein imaginär solange β < 1 gilt. Dies ist konsistent mit Einsteins Überlegung, daß es keine Geschwindigkeiten größer als die Vakuumlichtgeschwindigkeit geben kann.6 Die verbleibenden Matrixelemente bestimmt man mit Hilfe der weiteren Orthogonalitätsrelationen und erhält 1 , a4,4 = p 1 − β2 −iβ a4,3 = p . 1 − β2 Die Matrix A hat somit die Form 1 0 0 0 1 0 1 √ A= 0 0 1−β 2 0 0 √−iβ 2 1−β 0 0 √ iβ 1−β 2 √1 1−β 2 . (6.1) Die 2 × 2-Untermatrix in der rechten unteren Ecke hat die Struktur wie eine Matrix cos φ sin φ , − sin φ cos φ die eine Drehung in der Ebene vermittelt. In der Tat stellt die Untermatrix eine Drehung in der x3 -x4 -Ebene dar, wobei der Drehwinkel jedoch imaginär ist, was aus 1 cos φ = p >1 1 − β2 folgt. Wir können die Gleichungen der reinen Lorentztransformation auch wie folgt schreiben X 1 = x1 , 6 X 2 = x2 , x3 − vt X3 = p , 1 − β2 t − vx3 /c2 T = p . 1 − β2 (6.2) Genaueres dazu können sie aus Büchern oder einer Vorlesung zur speziellen Relativitätstheorie erfahren. 6.1. DIE LORENTZTRANSFORMATION 121 Die Rücktransformation erhalten wir dadurch, daß wir die Transponierte der Matrix Gl. (6.1) bilden. Wie man damit leicht nachrechnet, bekommt man so explizite Ausdrücke für die “kleinen” Koordinaten als Funktion der “großen”, die bis auf den Vorzeichenwechsel v → −v identisch zu Gl. (6.2) sind. Dies war zu erwarten, da sich k relativ zu K mit Geschwindigkeit −~v bewegt. Aus der Lorentztransformation ergeben sich Konsequenzen, die unseren gewohnten Vorstellungen zuwiderlaufen. Wir werden hier nur eine grobe Diskussion solcher vermeintlicher Paradoxa geben. Wir betrachten zunächst einen starren Stab, der bezüglich k in Ruhe ist und (2) (1) entlang der x3 -Achse liegt. Er habe die Länge x3 − x3 = L. Ein bewegter Beobachter (in K) mißt die Länge des Stabes, indem er zu einer festen Zeit T (1) (2) die Lage der beiden Endpunkte X3 und X3 bestimmt. Aus den zu Gl. (6.2) inversen Relationen finden wir (1) X + vT (1) , x3 = p3 1 − β2 (2) X + vT (2) x3 = p3 1 − β2 und damit p (2) (1) X3 − X 3 = L 1 − β 2 . p Der Stab scheint dem bewegten Beobachter damit um den Faktor 1 − β 2 < 1 verkürzt. Dies ist die berühmte Längenkontraktion. Es muß betont werden, daß ein Beobachter in k dieselbe Längenkontraktion bei einem Stab beobachtet, der in K ruht. Wäre dies nicht der Fall, wäre eines der Bezugssysteme ausgezeichnet, was nach dem Relativitätsprinzip nicht erlaubt ist. Die sogenannte Zeitdilatation wollen wir auf anschaulichere Weise erklären und nicht einfach auf die Lorentztransformation zurückgreifen. Wir betrachten einen Zug (Bezugssystem K), der sich mit hoher (konstanter) Geschwindigkeit v relativ zu einem Bezugssystem k in x3 -Richtung bewegt. Ein Beobachter im Zug (in K) löst einen Blitz aus, der aus einer am Boden befindlichen Quelle kommt. Das Licht breitet sich bis zur Decke des Zugs aus und wird von dort zurück auf den Ausgangspunkt am Boden reflektiert, wo eine Photozelle steht, die ein akustisches Signal auslöst. Dieses “Gedankenexperiment” beobachtet ebenfalls ein Beobachter in k. Von K aus betrachtet ist die Zeitdifferenz zwischen dem Auslösen des Blitzes und dem Ertönen des Signals durch ∆T = 2h , c mit der Höhe h des Zugs gegeben. Von k aus betrachtet nimmt das Licht den in der Skizze dargestellten Weg. 122 KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK B A D C Die Strecke AC hat die Länge v∆t, wenn ∆t die Zeit zwischen dem Blitz und dem Signal ist. Damit hat das Dreieck ABD die Seitenlängen h, v∆t/2 und c∆t/2. An dieser Stelle fließt in die Überlegung ein, daß die Vakuumlichtgeschwindigkeit in k und K identisch ist. Weiterhin gehen wir davon aus, daß die Höhe des Zuges (senkrecht zu ~v ) in beiden Bezugssystemen identisch ist. Bereits weiter oben haben wir uns klar gemacht, daß dieses der Fall ist, da die Ortskoordinaten senkrecht zu ~v nicht transformiert werden. Damit folgt nach Pythagoras (c∆t/2)2 = h2 + (v∆t/2)2 , was ∆t = 1 2h p c 1 − β2 bedingt. Es gilt somit ∆T . ∆t = p 1 − β2 Der gemessene Zeitunterschied zwischen dem Blitz und dem Signal ist somit in k und K verschieden. Dieses Ergebnis gilt für alle Ereignisse (nicht nur Blitz und Signal), die in K am gleichen Ort stattfinden. Das Ergebnis ist somit konsistent mit der Rücktransformation T + vX3 /c2 t= p , 1 − β2 die aus Gl. (6.2) folgt, da bei der Bildung der Zeitdifferenz für gleiche Orte in K die Variable X3 herausfällt. Misst er die Zeitdifferenz zwischen zwei Ereignissen, welche am gleichen Ort in K stattfinden, so kommt der Beobachter in k zu dem Schluß, daß eine Uhr in K langsamer läuft als seine, da ∆T < ∆t. Daher der Name Zeitdilatation. Erneut erfordert das Relativitätsprinzip, daß ein Beobachter in K zu einem analogen Schluß bezüglich Ereignissen kommt, die an einem festen Ort in k stattfinden. Wie bereits oben erwähnt implizieren die Lorentztransformationen, daß es keine Geschwindigkeiten größer als c geben kann. Man könnte nun meinen, daß sich solche Geschwindigkeiten erzeugen lassen, wenn man wie folgt vorgeht. Wir nehmen an, ein Teilchen bewege sich relativ zu einem Beobachter im System k 6.2. DIE KOVARIANZ 123 mit konstanter Geschwindigkeit c/2 < w < c in x3 -Richtung, was sicherlich erlaubt ist. Ein weiterer Beobachter im System K bewege sich relativ zum ersten mit Geschwindigkeit c/2 < v < c, jedoch in −x3 -Richtung, was ebenfalls mit der speziellen Relativitätstheorie im Einklang ist. Könnte man nun die Relativgeschwindigkeit zwischen dem zweiten Beobachter und dem Teilchen durch simple Addition der beiden Relativgeschwindigkeiten zum ersten Beobachter gewinnen (wie es in der klassischen Mechanik der Fall wäre), so würde diese größer als die Vakuumlichtgeschwindigkeit sein. Diese Relativgeschwindigkeit ist identisch zur Geschwindigkeit des Teilchens aus K betrachtet, also zu der von k nach K transformierten Teilchengeschwindigkeit W . Um zu zeigen, daß diese simple Additionsrelation in der relativistischen Mechanik ihre Gültigkeit verliert, betrachten wir die Lorentztransformation. Aus k beobachtet gilt für die Teilchengeschwindigkeit ∆~r ∆t→0 ∆t w ~ = lim mit ∆~r = ~r(t + ∆t) − ~r(t). Da die Lorentztransformation linear in den xµ ist, folgt sofort ∆x3 + v∆t ∆t + v∆x3 /c2 ∆X1 = ∆x1 , ∆X2 = ∆x2 , ∆X3 = p , ∆T = p . 1 − β2 1 − β2 Dabei gilt verglichen mit Gl. (6.2) v → −v, da sich K in Bezug auf k nach Konstruktion in −x3 -Richtung bewegt. Es gilt dann ∆x3 + v∆t ∆x3 /∆t + v ∆X3 = = ∆T ∆t + v∆x3 /c2 1 + (v/c2 )(∆x3 /∆t) bzw. W = W3 = w+v . 1 + wv/c2 Alle anderen Komponenten des Geschwindigkeitsvektors sind aufgrund unserer Wahl der Richtungen der Koordinatenachsen Null. Dies ist das Einsteinsche Additionstheorem für Geschwindigkeiten. Man sieht, daß für 0 ≤ v < c und 0 ≤ w < c auch 0 ≤ W < c gilt. Gilt w = c und v < c, so folgt W = c. 6.2 Die Kovarianz Wir haben im letzten Abschnitt die Lorentztransformation konstruiert, die die inkorrekte Galileitransformation in der speziellen Relativitätstheorie ersetzt. Wir können nun den zweiten Schritt gehen und fordern, daß alle Gesetze der Mechanik (und der ganzen Physik) invariant unter der Lorentztransformation sind. Es wird sehr viel einfacher und eleganter, die Gesetze auf Forminvarianz zu untersuchen, 124 KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK wenn man sie in Ausdrücken des Minkowskiraums schreibt. Wir werden zeigen, daß es dann sehr leicht ist, die Lorentzinvarianz einer gegebenen Gleichung zu erkennen. Um unser Vorgehen bezüglich der Lorentztransformationen zu illustrieren, betrachten wir zunächst, wie wir im Fall des Nachweises der Invarianz physikalischer Gesetze unter Drehungen des Raumes, also unter orthogonalen Transformationen des R3 , vorgehen können. Eine physikalische Größe, die für sich genommen invariant unter einer Drehung des Raums ist, nennt man ein Rotationsskalar. Die Masse m eines Teilchens, die Zeit t und der Betrag des Abstandes einer Teilchenposition vom Ursprung r = |~r| sind Beispiele für solche Skalare. Physikalische Gesetze der Form a = b mit zwei Rotationsskalaren a und b sind somit trivialerweise invariant unter Rotationen des R3 . Ebenfalls invariant sind Gesetze der Form f~ = ~g (Gleichungssystem) mit zwei dreidimensionalen Vektoren, die gemäß F~ = Rf~ ~ = R~g mit der Rotationsmatrix R transformiert werden. Man spricht in und G diesem Zusammenhang auch von der Kovarianz (unter räumlichen Rotationen) der Terme der Gleichung Die Lorentztransformationen wurden weiter oben mit den orthogonalen Transformationen im vierdimensionalen Minkowskiraum identifiziert. Wir führen nun den Begriff des Lorentz- oder Viererskalars ein. Dabei handelt es sich in Analogie zu den “gewöhnlichen” Rotationen um eine Größe, die für sich genommen invariant unter den Lorentztransformationen ist. Wie wir weiter unten zeigen werden, kann man einen Massebegriff in der relativistischen Mechanik so einführen, daß das adäquat definierte m ein Viererskalar ist. Die Zeit t ist, wie wir oben gesehen haben, sicherlich kein Viererskalar. Als einen Vierervektor f bezeichnen wir einen allgemeinen Satz von vier Zahlen, der sich unter der Lorentztransformation wie der “verallgemeinerte Ortsvektor” (Ortsvektor im Minkowskiraum oder RaumZeit-Vektor)7 r = (x1 , x2 , x3 , ict)T transformiert, d.h. im Fall eines “boosts” wie F = Af mit der Matrix A aus Gl. (6.1). Die Forminvarianz eines physikalischen Gesetzes unter Lorentztransformationen ist damit dann offensichtlich, wenn es in einer kovarianten vierdimensionalen Form geschrieben werden kann. Ein Zusammenhang, der das Einsteinsche Relativitätsprinzip verletzt, kann nicht in eine kovariante Form gebracht werden. Dies ist das oben angekündigte einfache Kriterium, um festzustellen, ob ein physikalisches Gesetz mit dem Einsteinschen Relativitätsprinzip im Einklang ist. Als Beispiel dafür, wie man ein Gesetz so umschreibt, daß sofort sichtbar wird, ob es lorentzinvariant ist oder nicht, betrachten wir die dreidimensionale 7 Mit fortschreitender Zeit durchläuft der Raum-Zeit-Vektor r = (x1 , x2 , x3 , ict)T die sogenannte Weltlinie, was der Bahnkurve der klassischen Mechanik entspricht. 6.2. DIE KOVARIANZ 125 Wellengleichung (siehe Kapitel 4.2) 2 ~ 2u = 1 ∂ u . ∇ c2 ∂t2 Im Vergleich zu der allgemeinen Gleichung aus Kapitel 4.2 soll c hier die Vakuumlichtgeschwindigkeit sein. Wir führen einen Vierergradienten mit Komponenten ∂/∂x1 , ∂/∂x2 , ∂/∂x3 und ∂/∂x4 ein, den wir mit dem Symbol bezeichnen. Um zu zeigen, daß ein Vierervektor ist, betrachten wir (Kettenregel) X ∂xν ∂ ∂ = . ∂Xµ ∂X ∂x µ ν ν Die xν hängen über die inverse Transformation (vermittelt durch AT ) mit den Xµ zusammen X aµ,ν Xµ xν = µ , so daß X ∂ ∂ aµ,ν = . ∂Xµ ∂x ν ν Dies ist die Transformationsgleichung für die Komponenten eines Vierervektors. Damit ist klar, daß 2 ein Viererskalar(-Differentialoperator) ist. Mit diesem geschrieben hat die Wellengleichung die elegante Form 2 u = 0 . Unter der Annahme, daß u ein Viererskalar ist, zeigt diese kovariante Schreibweise sofort die Invarianz der Wellengleichung unter Lorentztransformationen. Ein konzeptionell wichtiges Viererskalar ist durch 4 1 X (∆τ ) = − 2 (∆xµ )2 c µ=1 2 gegeben. Da sich, wie bereits oben erwähnt, die ∆xµ wie die xµ transformieren, ist diese Größe offensichtlich ein Viererskalar. Betrachten wir ein System K, in dem das Teilchen momentan in Ruhe ist, d.h. ∆Xi = 0 für i = 1, 2, 3 gilt, so folgt (Viererskalar!!) (∆τ )2 = − 4 4 1 X 1 X 2 (∆x ) = − (∆Xµ )2 = (∆T )2 . µ 2 2 c µ=1 c µ=1 126 KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK Somit ist ∆τ ein Zeitintervall, welches auf einer Uhr gemessen wird, die sich mit dem Teilchen mitbewegt. Daher bezeichnet man ∆τ als ein Intervall der Eigenzeit. Aus der Definitionsgleichung der Eigenzeit folgt 1p −(∆x1 )2 − (∆x2 )2 − (∆x3 )2 + c2 (∆t)2 c v " u 2 2 2 # u 1 ∆x ∆x ∆x 1 2 2 = ∆tt1 − 2 + + . c ∆t ∆t ∆t ∆τ = Für hinreichend kleine ∆t entspricht die Summe in der eckigen Klammer dem Relativgeschwindigkeitsquadrat v 2 (zwischen dem in k ruhenden Beobachter und dem in K ruhenden Teilchen) und konsistent mit dem bei der Diskussion der Zeitdilatation hergeleiteten Ausdruck gilt p (6.3) ∆τ = ∆T = ∆t 1 − β 2 . Ist eine der Komponenten eines Vierervektors rein imaginär, wie es z.B. beim Ortsvektor im Minkowskiraum der Fall ist, so muß das Quadrat eines solchen Vierervektors nicht notwendig größer gleich Null sein. Man bezeichnet einen Vierervektor, dessen Quadrat größer oder gleich Null ist, als raumähnlich. Ist das Quadrat negativ, so heißt der Vierervektor zeitähnlich. Da das Quadrat eines Vierervektors als Viererskalar invariant unter einer Lorentztransformation ist, ist auch die Charakterisierung als raum- oder zeitähnlich invariant. Die Namen rühren daher, daß ein reiner Raumvektor (x4 = 0) stets positiv definit ist und ein raumähnlicher Vierervektor so transformiert werden kann, daß seine vierte Komponente verschwindet. Ein zeitähnlicher Vierervektor kann dagegen so transformiert werden, daß seine ersten drei Komponenten verschwinden. Als Beispiel für diese Begrifflichkeiten betrachten wir einen Ortsvektor im Minkowskiraum. Die Bedingung x21 + x22 + x23 = c2 t2 definiert den sogenannten Lichtkegel. Dabei unterscheidet man den Vorwärts- (t > 0) und den Rückwärtslichtkegel (t < 0). Das Innere der Lichtkegel bilden die zeitähnlichen Vierervektoren. Wie bereits gezeigt, ist der Begriff der Zeitähnlichkeit invariant unter der Lorentztransformation. Man kann leicht sehen, daß bei Zeitähnlichkeit auch die Bedingung t > 0 invariant ist, so daß ein Punkt P , der im Inneren des Vorwärtslichtkegel liegt, dies in allen Bezugssystemen tut. Dies bedeutet, daß alle Beobachter übereinstimmen, daß ein Ereignis im Raum-Zeit-Punkt P nach einem Ereignis im Ursprung der Raumzeit mit xµ = 0 für alle µ = 1, 2, 3, 4 stattfindet. Man nennt den Vorwärtslichtkegel daher auch die absolute Zukunft. Alle Punkte im Vorwärtslichtkegel sind durch ein sich mit c ausbreitendes Lichtsignal vom Ursprung aus erreichbar. Raumähnliche Punkte sind dagegen nicht durch ein Lichtsignal vom Ursprung aus erreichbar.8 8 Dies hat sehr interessante Auswirkungen auf das Konzept der Kausalität, auf die wir hier aus Zeitgründen nicht eingehen können. 6.3. MASSE, VIERERGESCHWINDIGKEIT UND -IMPULS 6.3 127 Masse, Vierergeschwindigkeit und -impuls Während wir uns bisher mit der Kinematik der relativistischen Mechanik beschäftigt haben, werden wir jetzt zur Dynamik kommen. Wir werden die relativistischen Ausdrücke für die Masse, die Geschwindigkeit und den Impuls einführen. Genauer betrachtet definieren wir diese Begriffe im Rahmen der speziellen Relativitätstheorie neu. Die Leitprinzipien bei der Definition sind dabei, daß (i) für v/c 1 sich die in der klassischen Mechanik etablierten Begriffe ergeben sollen und (ii) die Begriffe Eigenschaften mit ihren klassischen Gegenstücken gemeinsam haben, die uns für das jeweilige Konzept essentiell erscheinen. Für den Impuls bedeutet das z.B., daß wir eine relativistische Definition mit der Eigenschaft suchen, daß der Gesamtimpuls für ein isoliertes System erhalten ist. Wir wollen zunächst die relativistische Masse definieren. Die Masse m eines Objekts ist unabhängig davon, mit welcher Geschwindigkeit es sich bewegt, als seine Ruhemasse definiert. Als Beobachter in einem System k müssen wir somit bei der Massenbestimmung wie folgt vorgehen. Wir müssen die zu bestimmende Masse entweder zur Ruhe bringen oder uns selbst in ein System bringen, in dem die Masse ruht. Danach können wir die Masse mit den Methoden der klassischen Mechanik bestimmen. Die Definition ist offensichtlicherweise invariant unter einer Lorentztransformation, so daß die definierte Masse wie oben angekündigt ein Vierersaklar ist. Als nächstes wollen wir die Vierergeschwindigkeit einführen. Wie wir bereits gesehen haben, muß man die dreidimensionale Geschwindigkeit ~v gemäß einem recht komplizierten Additionstheorem transformieren. Mit unseren in der Zwischenzeit angestellten Überlegungen zur Kovarianz können wir besser verstehen, wie es dazu kommt. Die Geschwindigkeit ~v ergibt sich aus Grenzwertbildung des Quotienten eines dreidimensionalen Vektors ∆~r und der vierten Komponente ∆t eines Vierervektors. Es ist daher nicht verwunderlich, daß sich ~v auf eigenartige Weise transformiert. Nach dieser Einsicht wird es klarer, wie wir bei der Definition einer Vierergeschwindigkeit vorgehen sollten. Wie oben diskutiert, transformieren sich die ∆xµ wie die xµ selbst, so daß man einen Vierervektor ∆r = (∆x1 , . . . , ∆x4 )T konstruieren kann. Bilden wir nun den Differenzenquotienten mit dem Intervall ∆τ der Eigenzeit, welches ein Viererskalar ist, und führen den Grenzwert aus, so ergibt sich ein Vierervektor v= dr = dτ dx1 dτ dx2 dτ dx3 dτ dt ic dτ . p Dies ist die Vierergeschwindigkeit. Ersetzen wir gemäß Gl. (6.3) dτ = dt 1 − β 2 , 128 KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK so folgt 1 dr =p v=p 1 − β 2 dt 1 − β2 1 dx1 dt dx2 dt dx3 dt = p 1 1 − β2 ~v ic . ic Es ist wichtig festzuhalten, daß der räumliche Teil der Vierergeschwindigkeit nicht gleich der (gewöhnlichen) dreidimensionalen Geschwindigkeit ~v p ist. Im Limes von Geschwindigkeiten sehr viel kleiner als c geht der Vorfaktor 1/ 1 − β 2 quadratisch gegen 1 und der räumliche Teil von v nähert sich ~v an. Wie oben angedeutet, soll ein nun zu definierender relativistischer Impuls im Limes kleiner Geschwindigkeiten mit dem Impuls der klassischen Mechanik übereinstimmen und für abgeschlossene Systeme eine Erhaltungsgröße sein. Wir definieren den Viererimpuls als Produkt des Viererskalars m und des Vierervektors v 1 m~v p = mv = p . imc 1 − β2 Den p räumlichen Anteil des Viererimpulses (dreidimensionaler Vektor) p~ (r) = m~v / 1 − β 2 bezeichnet man als den relativistischen Impuls. Er stimmt für kleine Geschwindigkeiten mit dem klassischen Impuls überein. Da wir einen vierkomponentigen Impuls definiert haben, scheint es nahezuliegen, daß (wenn überhaupt; siehe unten) eine Erhaltung aller vier Komponenten - der drei Komponenten des realtivistischen Impulses und der vierten neuen Komponente - gelten sollte. Wie wir gleich sehen werden, hat die vierte Komponente etwas mit der Energie zu tun, so daß die Erhaltung des Viererimpulses bereits kombiniert die Impuls- und die Energieerhaltung liefert. Wir definieren die relativistische Energie E als (c/i) mal die vierte (zeitliche) Komponente von p mc2 E = p4 c/i = p . 1 − β2 Zunächst einmal fällt auf, daß das so definierte E zumindest die Dimension einer Energie hat. Betrachten wir die Energie für ein nicht-relativistisches Teilchen mit v/c 1, so folgt durch Talyorentwicklung mc2 1 E=p = mc2 + mv 2 + O([v/c]4 ) . 2 1 − β2 In der klassischen Mechanik wird angenommen, daß die Masse eines Punktteilchens konstant (erhalten) ist.9 Damit ist der erste Summand aus der Perspektive 9 Wenn wir in der klassischen Mechanik zeitlich veränderliche Massen betrachtet haben, 6.3. MASSE, VIERERGESCHWINDIGKEIT UND -IMPULS 129 der klassischen Mechanik eine Konstante, die wir durch Verschieben des Energienullpunktes eliminieren können. Der verbleibende Summand ist die uns bekannte klassische kinetische Energie T . Dies zeigt, daß die obige Definition der relativitischen Energie sinnvoll ist. Betrachten wir den elastischen Stoß zweier sonst freier Teilchen mit kleiner Geschwindigkeit, so können wir anhand des genäherten Ausdrucks für die relativistische Energie sehr leicht die Energieerhaltung nachweisen. Für den kinetischen Teil T gilt die Erhaltung wie in der klassischen Mechanik. Für den Term mc2 folgt ebenfalls eine Erhaltung, da die Summe der Massen der Teilchen vor und nach dem Stoß gleich ist. Betrachten wir nun einen inelastischen Stoß zweier Teilchen mit kleiner Geschwindigkeit. In diesem Fall sind die kinetischen Energien vor und nach dem Stoß nicht identisch, da es zu inneren Anregungen der Massen kommt (es wird z.B. Wärme erzeugt, die nichts anderes als eine innere Anregung der Massen ist). Wenn jetzt aber die relativistische Energie E für alle Arten von Stoßprozessen (elastisch und inelastisch) erhalten sein soll (was in der Tat der Fall ist), so bedeutet das (für v/c 1) gemäß Min c2 + Tin = Mout c2 + Tout mit den totalen Massen Min and Mout vor und nach dem Stoß wegen Tin 6= Tout , daß Min 6= Mout . Wir müssen folgern, daß sich bei der Änderung der Anregungsenergie eines Teilchens (inelastischer Prozeß) dessen Masse ändert. Sollte also die relativistische Energie erhalten sein (was, wie schon gesagt, in der Tat der Fall ist), so bedeutet das, daß die Masse nicht erhalten sein kann. Dies sieht man wie oben gezeigt bereits im Limes kleiner Geschwindigkeiten. Im Alltag fällt nicht auf, daß die Masse nicht konstant ist, da wegen Tin − Tout = −(Min − Mout )c2 selbst bei recht großen |Tin − Tout | aufgrund der Größe von c die Massenänderung |Min − Mout | sehr klein ist. In der speziellen Relativitätstheorie ist der Beitrag mc2 zur Energie somit sicherlich keine irrelevante Konstante, wie es im Rahmen der klassischen Mechanik der Fall wäre. Die Energie enthält in der relativistischen Mechanik keine freie Konstante, da der Viererimpuls p ein Vierervektor sein soll. Jedes Hinzuaddieren von i mal einer Konstanten zur vierten Komponente des Viererimpulses würde die Lorentzinvarianz zerstören. Damit bekommt die Energie des Teilchens, wenn es dann haben wir uns diese immer als aus vielen Punktteilchen zusammengestzt vorgestellt. Die Zeitabhängigekit der Masse kam dann dadurch zu stande, daß einzelne oder mehrere Punktteilchen aus der Gesamtmasse verloren gehen. 130 KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK in Ruhe ist E = mc2 eine besondere Bedeutung. Es ist die Ruheenergie. Wir definieren die relativistische kinetische Energie T (r) als die Differenz der Ruheenergie und der Energie E ! 1 T (r) = E − mc2 = p − 1 mc2 ≥ 0 . 2 1−β Zum Abschluß dieses Abschnitts wollen wir drei sich aus den oben eingeführten Größen ergebene Relationen herleiten, die bei Rechnungen oft hilfreich sind. Nach den obigen Überlegungen gilt (r) m ~v p~ p= p = . 2 ic iE/c 1−β Damit folgt ~v p~ (r) c = . c E (6.4) Man kann somit die Geschwindigkeit eines Objekts berechnen, wenn man seinen relativistischen Impuls und seine Energie kennt. Als nächstes betrachten wir das Viererskalar p2 . Im Ruhesystem des Objekts gilt p = (0, 0, 0, imc)T , also p2 = −(mc)2 . Da p2 lorentzinvariant ist, gilt in jedem Bezugssystem p2 = −(mc)2 . Es ist manchmal hilfreich, dieses Ergebnis zu E 2 = (mc2 )2 + (~p (r) c)2 (6.5) umzuschreiben. 6.4 Die Kraft in der relativistischen Mechanik Es ist sehr viel schwieriger das Konzept der Kraft in der relativistischen Mechanik einzuführen, als es in der klassischen Mechanik der Fall war. Wie für die Übertragung der anderen Größen gibt es auch hier verschiedene Möglichkeiten der Definition. Ein großes Problem ergibt sich dadurch, daß sich unter dem Einfluß einer Kraft die Ruhemasse m eines Teilchens ändern könnte. Diese Möglichkeit gibt es in der klassischen Mechanik nicht. Wir wollen unsere Betrachtungen hier auf Kräfte beschränken, die die Masse eines Objekts, auf das sie wirken, nicht ändern. Viele der in der relativistischen Mechanik wichtigen Kräfte sind von diesem Typ. In diese Klasse fällt z.B. die Lorentzkraft ~ + ~v × B) ~ , F~ = q(E 6.4. DIE KRAFT IN DER RELATIVISTISCHEN MECHANIK 131 die auf ein Teilchen mit Ladung q in einem elektromagnetischen Feld wirkt. Von den verschiedenen möglichen Definitionen der Kraft in der relativistischen Mechanik ist die nützlichste die eines dreidimensionalen Kraftvektors F~ (r) = d~p (r) . dt (6.6) Für kleine Geschwindigkeiten v/c 1 gilt p~ (r) → p~ und damit wird F~ (r) in diesem Limes gleich der Kraft in der klassischen Mechanik, was sicherlich sinnvoll ist. Für eine gegebene Kraft F~ (r) liefert Gl. (6.6) eine Bewegungsgleichung. Ein weiteres Argument für die obige Definition ergibt sich durch einen Vergleich mit Experimenten. Es zeigt sich in diesen, daß im Fall eines Teilchens mit Ladung q in einem elektromagnetischen Feld d~p (r) /dt durch die Lorentzkraft gegeben ist. Der dritte Grund dafür, daß die Definition des dreidimensionalen relativistischen Kraftvektors sinnvoll ist, folgt dadurch, daß man einen Zusammenhang zwischen der Änderung der relativistischen kinetischen Energie und der “Arbeit” F~ (r) ·∆~r, die aus dieser Kraft folgt herleiten kann. Um dieses zu sehen, betrachten wir Gl. (6.5). Differenzieren nach t auf beiden Seiten der Gleichung liefert E d~p (r) dE = p~ (r) c2 · = p~ (r) c2 · F~ dt dt (r) . Dabei haben wir verwendet, daß nach Annahme dm/dt = 0 gilt. Nach Divison durch E und unter Verwendung von Gl. (6.4) folgt dE = ~v · F~ dt (r) , (6.7) bzw. ∆E = F~ (r) · ∆~r . Beachtet man jetzt noch, daß E = mc2 + T (r) und ∆m = 0, so folgt ∆T (r) = F~ (r) · ∆~r , also der angekündigte Zusammenhang zwischen der Änderung der kinetischen Energie und der Änderung der zur Kraft gehörenden Arbeit. Betrachten wir als Beispiel die Bewegung eines Teilchens der (festen) Ruhemasse m, auf welches eine zeitlich und räumlich konstante Kraft F~ (r) wirkt. Diese Situation läßt sich z.B. für ein geladenes Teilchen in einem zeitlich und räumlich konstanten elektrischen Feld realisieren. Das Teilchen sei zur Zeit t = 0 im Ursprung in Ruhe. Nach der Definition der Kraft gilt p~ (r) = F~ (r) t. Mit Gln. (6.4) und (6.5) folgt dann ~v (t) = p~ (r) c2 F~ (r) tc2 =p E (mc2 )2 + (F (r) tc)2 = F~ (r) t p . m 1 + (F (r) t/[mc])2 132 KAPITEL 6. GRUNDZÜGE DER RELATIVISTISCHEN MECHANIK Wenn F (r) t/(mc) 1, d.h. wenn die Zeit t viel kleiner als die charakteristische Zeit tc = mc/F (r) ist, können wir den Nenner durch 1 ersetzen und erhalten das nicht-relativistische Ergebnis ~v = F~ (r) t/m. Falls jedoch t/tc 1, nähert sich v der Vakuumlichtgeschwindigkeit an, ohne sie jedoch für endliches t je zu erreichen. Um die Position des Teilchens ~r(t) zu bestimmen, müssen wir die Gleichung für die Geschwindigkeit unter Berücksichtigung von ~r(t = 0) = 0 integrieren. Es folgt s (r) 2 (r) ~ 2 mc F 1 + F t − 1 . ~r(t) = (r) m F mc Für t/tc 1 ergibt sich das klassische Ergebnis ~r(t) = 1 F~ (r) 2 t 2 m also ~at2 /2, mit ~a = F~ (r) /m. Für t → ∞ gilt r(t) → ct + const.. Dieses Beispiel zeigt, daß die Bewegung alle unsere Erwartungen erfüllt. Wenn zumindest in einem Bezugssystem k die Kraft F~ (r) als Gradient ei~ (r) , ist die Kraft ner Funktion V (~r) geschrieben werden kann, d.h. F~ (r) = −∇V konservativ. Dies ist z.B. für die Bewegung eines geladenen Teilchens in einem elektrostatischen Feld der Fall. Sollte dies der Fall sein, so ist die Arbeit, die am Teilchen verrichtet wird, wenn es sich um ∆~r im Kraftfeld, bewegt durch ~ (r) · ∆~r = −∆V (r) gegeben. Kombiniert mit dem oben diskutierF~ (r) · ∆~r = −∇V ten Zusammenhang zur Änderung der kinetischen Energie gilt ∆T (r) = −∆V (r) , bzw. ∆(T (r) +V (r) ) = 0. Dies bedeutet, daß auch in der relativistischen Mechanik für eine konservative Kraft T (r) + V (r) erhalten ist. Die relativistische Kraft F~ (r) ist nicht der räumliche Anteil eines Vierervektors. Dies liegt daran, daß zwar ∆~p (r) der räumliche Anteil eines Vierervektors ist, ∆t jedoch kein Viererskalar. In dieser Hinsicht ist F~ (r) wie der Geschwindigkeitsvektor ~v = d~r/dt und die Transformation der relativistischen Kraft F~ (r) von k nach K hat eine ähnliche Struktur wie die von ~v . In Analogie zur Geschwindigkeit ist es nun leicht zu sehen, wie man einen vierdimensionalen mit F~ (r) in Beziehung stehenden Kraftvektor definiert, der ein Vierervektor ist. F = dp , dτ (6.8) mit der Eigenzeit τ . Da ∆p ein Vierervektor ist und ∆τ ein Viererskalar, handelt es sich bei F offensichtlich um einen Vierervektor. Man nennt diese Kraft auch die Minkowskikraft. Diese Gleichung ist die lorentzinvariante Erweiterung der Newtonschen Bewegungsgleichung. Indem wir ∆τ gemäß Gl. (6.3) auf ∆t umschreiben, folgt d~p (r) ~ (r) 1 1 F dt F =p =p , 1 dE 1 − β2 1 − β 2 ~v · F~ (r) /c c dt 6.4. DIE KRAFT IN DER RELATIVISTISCHEN MECHANIK 133 wobei wir Gl. (6.7) verwendet p haben. Wir erkennen, daß der räumliche Teil von (r) 2 F gleich F~ geteilt p durch 1 − β ist, so wie der räumliche Teil von v gleich ~v geteilt durch 1 − β 2 ist. Damit ist klar, daß die räumlichen Komponenten der relativistischen Bewegungsgleichung (6.8) für v/c 1 zu den klassischen Newtonschen Gleichungen werden. Der Vorteil der Viererkraft F gegenüber der relativistischen Kraft F~ (r) ist, daß sie sich von einem zum anderen Bezugssystem mit der Lorentzstransformation transformiert. Außerdem läßt sich die Lorentzinvarianz aller mit der Viererkraft formulierten Gesetze einfach überprüfen (siehe oben). Der Nachteil besteht darin, daß sie durch die Ableitung des Impulses bezüglich der Eigenzeit gegeben ist, während F~ (r) durch die Ableitung bezüglich der Zeit irgendeines Bezugssystems (nicht nur des Ruhesystems) definiert ist. Da wir meist an der Bewegung eines Teilchens bezüglich eines bestimmten Bezugssystems (welches meist nicht das Ruhesystem sein wird) interessiert sind, ist die relativistische Kraft F~ (r) praktisch meist nützlicher als die Viererkraft F . Wir wollen im Rahmen dieser Vorlesung darauf verzichten, ausführlich eine Lagrangsche Formulierung der relativistischen Mechanik zu diskutieren. Es ist dabei für eine konservative (und geschwindigkeitsunabhängige) Kraft mit Potential V (r) leicht, eine Lagrangefunktion L anzugeben, aus der sich die für konkrete Rechnungen wichtige Bewegungsgleichung (6.6) gemäß der Lagrangeschen Gleichung (i = 1, 2, 3) ∂L d ∂L − =0 dt ∂vi ∂xi ergibt. Eine geeignet Lagrangefunktion wäre in diesem Fall z.B. p L = −mc2 1 − β 2 − V (r) . Leider hat diese Lagrangefunktion jedoch noch nicht die gewünschten Transformationseigenschaften gegenüber der Lorentztransformation, da sie kein Viererskalar ist. Somit ist die obige Überlegung, die auf ein L führt, nur der erste Schritt auf dem Weg hin zu einer relativistischen Erweiterung der Lagrangeschen Mechanik.