Grundlagen der Mechanik und Elektrodynamik Teil 1: Mechanik Vorlesung an der Ruhruniversität Bochum K.–U. Riemann Inhaltsverzeichnis 1. Mechanik freier Massenpunkte 1.1 1.10 Newtons Axiome Maßsysteme Impuls, Energie und Drehimpuls Konservative Kräfte, Zentralkräfte Mathematische Gesichtspunkte Die Bewegung im konstanten Schwerefeld Der harmonische Oszillator Bahn, Hodograph und Phasenbahn Zentralkraft– und Keplerproblem Geometrie der Ellipse Coulombwechselwirkung Die Bewegung im konstanten elektrischen und magnetischen Feld Beschleunigte Koordinatensysteme und Scheinkräfte Drehungen Rotierende Koordinatensysteme, Zentrifugal– und Corioliskraft Systeme von Massenpunkten Schwerpunkts– und Relativbewegung Zerlegung der kinetischen Energie Zerlegung der potentiellen Energie Zerlegung des Drehimpulses Das Zweikörperproblem 2. Lagrange–Mechanik 2.1 Zwangsbedingungen und Zwangskräfte Klassifikation von Zwangsbedingungen Das Selbstkonsistenzproblem Prinzip der virtuellen Arbeit und d’Alembertsches Prinzip Modell der glatten Führungen Virtuelle Verrückungen und Bewegungsablauf Prinzip der virtuellen Arbeit und d’Alembertsches Prinzip Beispiele: Zentripetalkraft und schiefe Ebene Generalisierte Koordinaten und Lagrangesche Gleichungen Generalisierte Koordinaten und Kräfte Lagrangesche Gleichungen (zweiter Art) Beispiele Spiralbewegung in der Ebene Das ebene Pendel 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.2 2.3 2.4 i 1 5 9 11 12 14 19 22 27 32 35 37 41 46 2.5 2.6 2.7 2.8 2.9 Das Zykloidenpendel Geschwindigkeitsabhängige Kräfte Generalisierte Potentiale Lagrangefunktion für elektromagnetische Kräfte Reibung und Dissipationsfunktion Die Methode der Lagrangeschen Multiplikatoren Lagrange–Multiplikatoren und Zwangskräfte Lagrangesche Gleichungen mit Nebenbedingungen Lagrangesche Gleichungen erster Art Beispiel: Die schiefe Ebene Berechnung von Zwangskräften (ohne Multiplikatoren) Zyklische Koordinaten, Symmetrien und Erhaltungssätze Generalisierte Impulse Impulserhaltung und Homogenität des Raumes Drehimpulserhaltung und Isotropie des Raumes Energieerhaltung und Homogenität des Zeit Die Hamiltonfunktion Die Hamiltonfunktion rheonomer Systeme Routhsches Verfahren und kanonische Gleichungen Eliminierung zyklischer Variablen aus den Bewegungsgleichungen Eliminierung zyklischer Variablen aus der Lagrangefunktion Legendretransformationen Kanonische Gleichungen Beispiel: Zentralkraftproblem Hamiltonfunktion und generalisierter Impuls im Magnetfeld 3. Dynamik des starren Körpers 3.1 Modell und Koordinaten des starren Körpers Orientierung des starren Körpers Richtungskosinus und orthogonale Matrizen Eulersche Winkel 70 Das Eulersche Theorem Die Drehachse als Eigenvektor Das Eigenwertproblem orthogonaler Matrizen Eulersches Theorem und Satz von Cashle Der Trägheitstensor Drehimpus und kinetische Energie des starren Körpers Das Trägheitsmoment um eine feste Drehachse Der Satz von Steiner Beispiel: Physikalisches Pendel Trägheitshauptachsen Das Eigenwertproblem selbstadjungierter Matrizen Hauptachsentransformationen 3.2 3.3 3.4 ii 48 51 54 56 62 69 74 78 82 3.9 Beispiel Trägheitsellipsoid und Poinsotsche Konstruktion Geometrische Beschreibung des kräftefreien Kreisels Die Eulerschen Kreiselgleichungen Die kräftefreie Bewegung des starren Körpers Stabile Drehachsen des starren Körpers Der kräftefreie symmetrische Kreisel Der Lagrangeformalismus für den Kreisel Lagrangefunktion und zyklische Koordinaten des symmetrischen Kreisels Der kräftefreie symmetrische Kreisel Der schwere symmetrische Kreisel Zum elementaren Verständnis des Kreisels 4. Stabilität und kleine Schwingungen 4.1 4.4 4.5 Gleichgewichte und kleine Abweichungen Quadratische Formen Eigenfrequenzen und Stabilität Transformation auf Normalkoordinaten Gleichzeitige Diagonalisierung von T und V Die formale Durchführung Gekoppelte Pendel 5. Spezielle Relativitätstheorie 5.1 Galileiisches und Einsteinsches Relativitätsprinzip Das Problem der Lichtgeschwingkeit Das Michelson–Experiment Die Lorentztransformationen Minkowskiraum und orthogonale Transformationen Spezielle und allgemeine Lorentztransformationen Elementare Herleitung aus den physikalischen Postulaten Die Zeitdilatation Symmetrie des Uhrenvergleichs und Zwillingsparadoxon Die Lorentzkontraktion Zusammenhang mit der Zeitdilatation Unsichtbarkeit der Lorentzkontraktion Die Gruppeneigenschaft der Lorentztransformation Einsteinsches Additionstheorem der Geschwindigkeiten Kovariante Formulierung einer Theorie Vierer–Vektoren und Lorentz–Skalare Raumartige und zeitartige Vektoren, der Lichtkegel Vergangenheit, Gegenwart und Zukunft; kausale Ereignisse Bahn im Minkowskiraum und Eigenzeit Vierer–Geschwindigkeit und –Impuls 3.5 3.6 3.7 3.8 4.2 4.3 5.2 5.3 5.4 5.5 5.6 5.7 iii 87 90 92 94 100 103 105 106 110 112 116 117 119 125 126 128 131 5.8 5.11 Relativistische Mechanik Die Minkowski–Kraft und Bewegungsgleichung Der Energie–Impuls–Vektor Die Einheit von Impuls– und Energiesatz Die Äquivalenz von Masse und Energie Die relativistische Bewegungsgleichung Beispiel: Elektron im konstanten elektrischen Feld Longitudinale und transversale Beschleunigung Die Transformation von Kräften Relativistischer Lagrangeformalismus Die relativistische Lagrange– und Hamiltonfunktion (nicht kovariant) Probleme: Instantane Fernwirkung, Zwangsbedingungen und Nicht–Inertial–Systeme Grundgedanken der allgemeinen Relativitätstheorie Vom Zwillingparadoxon zum Hamiltonprinzip 6. Hamilton–Jacobi–Theorie 6.1 Das Hamiltonsche Prinzip Grundaufgabe der Variationsrechnung Bahnvariationen im Konfigurationsraum Das Wirkungintegral und die Quantenmechanik Das Hamiltonsche Prinzip im Phasenraum Die erweiterte Konkurrenz der Bahnen im Phasenraum Hamiltonsches Prinzip und kanonische Gleichungen Kanonische Transformationen Tabelle: Erzeugende und Transformationsgleichungen Beispiele kanonischer Transformationen Die Hamiltonsche partielle Differentialgleichung Das Wirkungsintegral als Erzeugende Klassische Mechanik und geometrische Optik Separation und Hamiltonsche charakteristische Funktion Der harmonische Oszillator als Beispiel Ergänzende Bemerkungen Infinitesimale kanonische Transformationen Liouvillescher Satz Poissonklammern 5.9 5.10 6.2 6.3 6.4 6.5 6.6 6.7 Literaturhinweise 136 140 142 144 147 149 151 154 156 159 162 164 iv 1 Mechanik freier Massenpunkte 1.1 Newtons Axiome Die Entwicklung der Grundlagen der Mechanik in der Renaissance ist als Geburtsstunde der Naturwissenschaft im heutigen Sinn anzusehen. Sie ist durch präzise Begriffsbildungen und eine Mathematisierung gekennzeichnet. Dadurch wurden Verallgemeinerungen möglich, die durch weitere Beobachtungen bestätigt oder falsifiziert werden konnten. Diesem Umstand ist es zu verdanken, daß kontroverse Auffassungen der Begründer nicht zu widerstreitenden Schulen führten, sondern in eine allgemein akzeptierte Mechanik mündeten. Wir können den gewaltigen Umbruch des Denkens in jener Zeit nicht hier im Detail verfolgen, sondern charakterisieren den historischen Hintergrund durch wenige Meilensteine: • Nicolaus Copernicus (1473–1543) propagierte das heliozentrische System. • Tycho Brahe (1546–1601) lehnte das heliozentrische System ab und führte sehr genaue Beobachtungen durch — in der Absicht, das geozentrische System des Ptolemäus zu stützen. • Johannes Kepler (1571–1630) leitete aus den Beobachtungen T. Brahes seine Planetengesetze (1609–1618) her. Diese Gesetze sind rein kinematisch zu verstehen und nicht dynamisch begründet. • Galileo Galilei (1564–1642) ist als entschiedener Verfechter des heliozentrischen Systems bekannt. Dabei glaubte er jedoch an vollkommene Kreisbahnen und lehnte Keplers Ergebnisse ab. Er führte “Fallversuche” an der schiefen Ebene durch und kam für den Spezialfall verschwindender Neigung zu einer Vorform des Trägheitsprinzips. • Isaac Newton (1643–1727) veröffentlichte 1687 die Abhandlung “Philosophiae naturalis principia mathematica”. Darin formulierte er die “Newtonschen Gesetze” als Grundlage der Dynamik. Vor der Aufstellung dieser Gesetze formulierte Newton zwei grundlegende Vorausetzungen: • Die absolute Zeit Tempus absolutum, verum, et mathematicum, in se et natura sua sine relatione ad externum quodvis, aequabiliter fluit, alioque nomine dicitur duratio. Die absolute, wahre und mathematische Zeit verfließt an sich und vermöge ihrer Natur gleichförmig und ohne Beziehung zu irgendeinem äußeren Geschehen. Sie wird auch mit dem Namen Dauer belegt. 1 • Der absolute Raum Spatium absolutum, natura sua sine relatione ad externum quodvis, semper manet similare et immobile. Der absolute Raum bleibt vermöge seiner Natur und ohne Beziehung zu irgendeinem äußeren Geschehen stets gleich und unbeweglich. Wir verzichten hier auf eine Kritik dieser aus der intuitiver Vorstellung gewonnenen Definitionen und verweisen auf die Diskussion von Uhren und Maßstäben im 5. Kapitel. Bemerkenswert ist, daß Newton die Notwendigkeit erkannte, sich diese Voraussetzngen bewußt zu machen. LEX PRIMA (Trägheitsgesetz) Corpus omne perseverare in statu suo quiescendi vel movendi uniformiter in directum, nisi quatenus illud a viribus impressis cogitur statum suum mutare. Jeder Körper beharrt in seinem Zustand der Ruhe oder der gleichförmigen Bewegung, wenn er nicht durch einwirkende Kräfte gezwungen wird, seinen Zustand zu ändern. Die Lex prima stellt eigentlich einen Spezialfall der Lex secunda dar (vgl. Gl. (6). Wegen seiner für die damalige Zeit revolutioniernden Aussage stellt Newton dieses Gesetz aber bewußt an die Spitze seines Systems. Widerspricht es doch der alltäglichen Erfahrung, daß jede Bewegung zum Stillstand kommt. (I. Kant 1747: Es gibt zweierlei Art von Bewegungen, solche, die nach einiger Zeit aufgehört haben, und solche, welche andauern. [Gegenstände, die getragen oder geschoben werden und Geschoßkugeln.]) Die Äquivalenz von Ruhe und von gleichförmiger Bewegung (wogegen?) drängt schon fast eine Diskussion von Bezugssystemen und Relativität auf. Wir verweisen dazu auf das 5. Kapitel. Der Formulierung seiner Lex secunda stellt Newton zunächst zwei Definitionen voran: Definitio I: Quantitas materiae est mensura eiusdem orta ex illius densitate et magnitudine coniunctim. Die Menge der Materie (Masse m) wird durch ihre Dichte und ihr Volumen vereint gemessen. Definitio II: Quantitas motus est mensura eiusdem orta ex velocitate et et quantitate materiae conjunctim. Die Größe der Bewegung (Bewegungsgröße, Impuls p) wird durch die Geschwindigkeit und die Menge der Materie vereint gemessen: p = mv . 2 (1) Es ist bemerkenswert, daß Newton die Notwendigkeit erkannte, den aus der alltäglichen Erfahrung scheinbar so vertrauten Begriff der Masse (Materiemenge) zu definieren1 . Seine Definitio I ist aber offensichtlich nur eine Scheindefinition: Man kann die Grundgröße “Masse” nicht durch die abgeleitete Größe “Dichte” definieren. Im Gegensatz zur Masse m ist die Geschwindigkeit v = dr/dt nach der Einführung von Raum und Zeit eine abgeleitete Größe und benötigt keine eigene Definition. Newton nennt mv die “Bewegungsgröße”, das heute übliche Wort Impuls vertauscht im Grunde Ursache und Wirkung [vgl. Gl. (5)]. Mit der Definitio II kann die Lex prima auch als Satz der Erhaltung des Impulses formuliert werden [vgl. Gl. (6)]. Eigentlich erfordert die folgende lex secunda noch eine weitere vorbereitende Erläuterung: Sie bezieht sich auf das Modell eines Massenpunktes, eines massebehafteten Objekts ohne räumliche Ausdehnung. Da alle Körper endlich ausgedehnt sind, ist die Tragfähigkeit dieses Modells keineswegs von vornherein klar. Wir begnügen uns im Augenblick mit dem Hinweis, daß der Schwerpunkt eines ausgedehnten Körpers in vielen Aspekten dem Massenpunkt entspricht. LEX SECUNDA (Bewegungsgesetz) Mutationem motus proportionalem esse vi motrici impressae, et fieri secundum lineam rectam qua vis illa imprimitur. Die Änderung der Bewegung ist der Einwirkung der bewegenden Kraft proportional und geschieht nach der Richtung derjenigen geraden Linie, nach welcher jene Kraft wirkt: ṗ = F . (2) Dieses zentrale Gesetz der Newtonschen Mechanik wirft eine ganz fundamentale Frage auf: Handelt es sich wirklich um ein Naturgesetz oder bloß um die Definition der Kraft? Diese Frage ist typisch für grundlegende Beziehungen der Physik, die sich durch die inhaltliche Deutung eben doch von mathematische Axiomen unterscheiden. Wir können Kräfte durch die Änderung des Bewegungszustandes messen, besitzen durch unsere Muskeln aber auch eine intuitive a priori-Erfahrung. Für eine Gesetzmäßigkeit sprechen auch Experimente mit verschiedenen Massen bei gleicher Kraft und verschiedenen Kräften bei gleicher Masse (wenn man Unabhängigkeit und ggf. ungestörte Superposition veraussetzt; vgl. auch die Schwierigkeit, die (träge) Masse zu definieren.) Phänomenologisch unterscheiden wir Kräfte bei der Berührung verschiedener Körper (Druck, Zug, Reibung . . . ) und Fernwirkungen (besser: Felder) wie Gravitation oder Magnetismus. Von einem systematischen Standpunkt aus beruhen alle makroskopischen Kräfte auf elektromagnetischen Kräften oder der Gravitation. 1 Zur Problematik des Begriffs “Masse” vgl. die Diskussion um “schwere Masse” und “träge Masse” beim Aufbau der allgemeinen Relativittstheorie. 3 (Auf die starke und schwache Wechselwirkung ist das klassische Konzept nicht anwendbar.) Newtons Lex secunda ändert sich nicht, wenn man von einem Bezugssystem S zu einem gleichförmig dagegen bewegten Bezugssystem S 0 übergeht (Galileitransformation): Die Lex secunda gilt in allen Inertialsystemen. In NichtInertialsystemen (z. B. rotierende Erde) treten neben den oben diskutireten Kräften auch Scheinkräfte (z. B. Zentrifugalkraft und Corioliskraft) auf. Was aber unterscheidet “wahre” Kräfte und Scheinkräfte? Wir spüren hier wieder die Notwendigkeit, Bezugssysteme und Relativität zu diskutieren und verweisen auf das 5. Kapitel. Abschließend erwähnen wir die prophetische Sicherheit (Sommerfeld), mit der sich die Newtonsche Formulierung (2.) gegenüber der späteren Formulierung “Kraft=Masse mal Beschleunigung” in der Relativitätstheorie bewährt hat. Bei der Interpretation des Unterschiedes ist allerdings Vorsicht geboten. Zum kritischen Verständnis stellen wir die Frage, was an der folgenden Beschreibung einer Rakete falsch ist: d (mv) = F = 0, dt mv = m0 v0 , v= m0 v0 . m LEX TERTIA (Reaktionsprinzip, “actio = reactio”) Actioni contrariam semper et aequalem esse reactionem: sive corporum duorum actiones in se mutuo semper esse aequales et in partes contrarias dirigi. Die Gegenwirkung ist der Wirkung stets entgegengesetzt und gleich, oder die Wirkungen zweier Körper aufeinander sind stets gleich und von entgegengesetzter Richtung: Fij = −Fji . (3) Dieses Gesetz schafft die Grundlage zum Übergang zur Mechanik eines Systems von Massenpunkten. Die Gültigkeit ist allerdings eingeschränkt: Gl. (3) gilt bei elektromagnetischer Wechselwirkug nur, wenn die Abstrahlung vernachlässigt werden kann. (Spielt die Strahlungsdämpfung eine Rolle, läßt sich die Bewegungsgleichung nicht mehr durch die erste Ableitung v̇ formulieren!) Häufig (Zentralkräfte) läßt sich die Lex tertia durch den Zusatz “Die Kräfte liegen in der Richtung der Verbindungslinie der Körper ” verschärfen. Diese Verschärfung wird aber bereits durch die Lorentzkraft verletzt. CORROLARIUM (“Lex quarta”, Parallelogramm der Kräfte) Corpus viribus coniunctis diagonalem parallelogrammi eodem tempore describere, quo latera separatis. 4 Bei vereinten Kräften wird ein Körper durch die Diagonale des Parallelogramms beschrieben, dessen Seiten zur gleichen Zeit den getrennten Kräften entsprechen, d. h. Kräfte addieren sich wie Vektoren: F= X Fi . (4) i Dieses Gesetz ist keineswegs trivial, sondern fordert die Unabhängigkeit der einzelnen Kraftwirkungen. Newton formulierte die Aussage nicht als “Gesetz”, sondern als Corollarium (Zusatz) zu den Bewegungsgesetzen. Ergänzung: Maße und Maßsysteme Newtons Grundvoraussetzungen und die Lex secunda erforden Meßvorschriften und Maßeinheiten für die Länge, die Masse und die Zeit. Das internationale Maßsystem (SI) legt hierzu das Meter (m), das Kilogramm (kg) und die Sekunde (s) fest. (MKS–System). Daneben wird häufig auch (noch) das CGS–System mit den Grundeinheiten Zentimeter (cm), Gramm (g) und Sekunde verwendet. Grundsätzlich könnte für die Kraft eine vierte Grundeinheit — etwa das Kilopond (kp) — festgelegt werden. Mit der Verfügung der Proportionalitätskonstante 1 in der Lex secunda wird die Kraft jedoch eine abhängige Größe und erhält im SI die Maßeinheit 1N = 1 kg m s−2 (1 Newton). Die entsprechende Maßeinheit des CGS–Systems ist 1 dyn = 1 g cm s−2 = 10−5 N. Daneben sind veraltete Bezeichnungen und Maßeinheiten wie 1 Dyn = 1 N und 1 kp = 9.81 N in Gebrauch. Auf abgeleitete Größen wie 1 J = 1 Nm = 1 kg m2 s−2 (Joule) für Arbeit und Energie oder 1 W = 1 J s−1 (Watt) für Leistung weisen wir nur am Rande hin. Im folgenden wollen wir Folgerungen aus den Newtonschen Gesetzen diskutiern und einfache Anwendungsbeispiele geben. Dabei beschränken wir uns zunächst auf die Mechanik eines Massenpunktes. 1.2 Grundbegriffe: Impuls, Energie und Drehimpuls Wir integrieren die Lex secunda: ∆p = p2 − p1 = Zt2 F dt, (5) t1 also Änderung der Bewegungsgröße = Kraftstoß oder Impuls. Von hier aus ist der Begriff Impuls (eigentlich etwas ungenau!) auf die Bewegungsgröße übertragen worden. Wir schließen uns trotzdem diesem allgemeinen Sprachgebrauch an. 5 Für die kräftefreie Bewegung formulieren wir den Impulserhaltungssatz p = const (6) und erhalten so die Lex prima als Spezialfall. Zur Einführung der Begriffe Energie2 und Arbeit multiplizieren wir die Lex secunda vor der Integration skalar mit v: Zt2 t1 mv · v̇ dt = Zt2 F · ṙ dt = t1 Zr2 F· dr r1 Das Integral auf der linken Seite können wir in der Form Zt2 t1 mv · v̇ dt = Zt2 t1 d m 2 v dt = T2 − T1 dt 2 schreiben, wenn wir durch T = m 2 v 2 (7) die kinetische Energie eines Massenpunktes definieren. Durch das Integral A12 = Zr2 F· dr (8) r1 auf der rechten Seite definieren wir die Arbeit, die von der Kraft F geleistet wird, wenn unser Massenpunkt von r1 nach r2 bewegt wird. Damit erhalten wir den Satz A12 = T2 − T1 , (9) der die Änderung der kinetischen Energie mit der am Massenpunkt geleisteten Arbeit in Beziehung bringt. Das Kunstwort Energie bedeutet so etwas wie ein Arbeitsvermögen. Kinetische Energie deutet also auf ein Arbeitsvermögen, das in der Bewegung steckt. Die Begriffe Energie und Kraft wurden lange Zeit nicht sauber getrennt. Bei Leibnitz wird die kinetische Energie vis viva genannt. 2 griech. ν (en) = in, griech. ργoν (ergon) = “Werk” (gleiche indogerm. Wurzel!), Arbeit 6 Von besonderer Bedeutung sind Kraftfelder F = F(r), bei denen das Integral (8) vom Weg unabhängig ist. Solche Kraftfelder heißen konservativ. Für konservative Kraftfelder gilt also I F·dr = 0 und wir können eine bis auf eine additive Konstante eindeutige Ortsfunktion V (r) = − Zr F(r0 )· dr0 (10) definieren, die wir als Potential oder potentielle Energie bezeichnen. Für konservative Kräfte haben wir [vgl. Gl. (8)] A12 = V1 − V2 , (11) und können [vgl. Gl. (9)] den Energieerhaltungssatz (daher der Name konservativ) V1 − V 2 = T 2 − T 1 oder E = T + V = const (12) formulieren. E = T + V wird als Gesamtenergie oder kurz Energie bezeichnet. Nach Gl. (10) läßt sich eine konservative Kraft gemäß F=− dV = −grad V dr (13) aus ihrem Potential V berechnen. Aus der Vertauschbarkeit der zweiten Ableitungen von V folgt ∂2V ∂2V ∂Fj ∂Fi =− =− = . ∂xj ∂xi ∂xj ∂xj ∂xi ∂xi Damit erhalten wir die Beziehung ∂Fj ∂Fi = ∂xj ∂xi oder rot F = 0 als notwendige Bedingung dafür, daß die Kraft F ein Potential besitzt. Sie ist aber auch hinreichend, wie wir am Stokeschen Satz erkennen. Beispiel für konservative Kräfte: 7 Betrachten wir eine beliebige Zentralkraft F(r) = f (r)r, (14) also Fi = f (r)xi . Dann wird ∂xi ∂r ∂Fi = f (r) + f 0 (r) xi ∂xj ∂xj ∂xj Dazu rechnen wir ∂r/∂xj = xj /r, und für i 6= j haben wir ∂xi /∂xj = 0, also ∂Fi f 0 (r) ∂Fj = xi xj = . ∂xj r ∂xi Alle Zentralkräfte sind folglich konservativ. Für ihr Potential gilt dV = −f (r)r, dr d.h. V (r) = − Zr f (r 0 )r 0 dr 0 . (15) Als Spezialfälle erwähnen wir (i) die elastische Kraft F(r) = −kr =⇒ V (r) = k 2 r 2 und (16) (ii) die Coulomb– und Gravitationskraft F(r) = − c r r3 =⇒ c V (r) = − . r (17) Natürlich sind die Potentiale nur bis auf eine additive Konstante bestimmt. Bei (i) haben wir V (0) = 0 gewählt, d.h. wir haben bei “gespannter Feder” eine positive potentielle Energie. Im Fall (ii) haben wir dagegen V (∞) = 0 gesetzt. Für anziehende Kraftzentren wird daher die potentielle Energie negativ: Dies ist der Energiebetrag, der nötig ist, um einen Massenpunkt aus dem Einflußbereich des Kraftfeldes zu “befreien”. Beachte, daß V (∞) im Fall (i) und V (0) im Fall (ii) singulär werden. Als ein letztes triviales Beispiel erwähnen wir das Potential V = mg·r = mgz des konstanten Schwerefeldes F = −mg = −mgez . 8 (18) Auf einen weiteren fundamentalen Grundbegriff werden wir geführt, wenn wir die Lex secunda vektoriell mit r multiplizieren: r × ṗ = r × F. Zur Interpretation der linken Seite führen wir den Drall oder Drehimpuls l=r×p (19) ein. Für seine zeitliche Ableitung erhalten wir d l = r × ṗ + ṙ × p = r × ṗ, dt da ṙ × p = mv × v = 0 gilt. Mit der analogen Definition des Drehmoments M=r×F (20) erhalten wir also die grundlegende Beziehung l̇ = M (21) zwischen der Drehimpulsänderung und dem einwirkenden Drehmoment. Sie spielt in der Dynamik des starren Körpers eine ähnliche Rolle wie Newtons Lex secunda für den Massenpunkt. Hinweise: 1. Drehimpuls wie Drehmoment hängen nach ihrer Definition von der Lage des gewählten Koordinatenursprungs ab und sind keine galileiinvarianten Begriffe. (Natürlich gilt Gl. (21) jedoch in jedem Inertialsystem). Bei der physikalischen Interpretation des Drehimpulses wird man sich also stets auf ein dem Problem natürlich angepaßtes Koordinatensystem beziehen müssen. 2. Man beachte die Reihenfolge der Faktoren in den Gln. (19, 20). 3. Zum Namen Drehimpuls gilt entsprechendes wie beim Impuls. Trotz des Namens ist die Bedeutung nicht auf Drehbewegungen beschränkt. Von besonderer Wichtigkeit ist der Spezialfall eines verschwindenden Drehmoments. In diesem Fall gilt der Drehimpulserhaltungssatz l = const. (22) Wegen r × r = 0 treffen wir diesen Speziallfall für alle Zentralkräfte an, wenn wir — was ja naheliegt — das Kraftzentrum als Koordinatenursprung wählen. Als wichtige Folgerung aus Gln. (19, 22) bemerken wir, daß die Bewegung bei Drehimpulserhaltung in einer Ebene — nämlich in der Ebene r · l = 0 — abläuft. 9 1.3 Mathematische Gesichtspunkte Das Bewegungsproblem eines Massenpunktes wird durch drei gekoppelte gewöhnliche Differentialgleichungen mẍi = Fi (xj , ẋj , t) (i, j = 1, 2, 3) (23) zweiter Ordnung oder durch sechs Differentialgleichungen ẋi = pi /m, ṗi = Fi (xj , pj , t) (i, j = 1, 2, 3) (24) erster Ordnung beschrieben und stellt damit ein Problem sechster Ordnung dar. (Wir werden für allgemeine Betrachtungen die zweite Form bevorzugen). Eine vollständige Lösung xi = ξi (t, ck ), pi = πi (t, ck ) (25) hängt also von sechs Integrationskonstanten c1 , . . . c6 ab. Als Integrationskonstanten können insbesondere die Anfangsbedingungen r(t = 0) = r0 und p(t = 0) = p0 (26) (bzw. v(t = 0) = v0 ) gewählt werden. Mit diesen Differentialgleichungen (Newtons Lex secunda) und den zugehörigen Anfangsbedingungen ist die Bewegung eindeutig festgelegt. (Kausalität, physikalisches Geschehen als Uhrwerk!). Die Ordnung des Problems läßt sich reduzieren, wenn es gelingt, einzelne Variable zu eliminieren. Hierzu können Beziehungen der Form φ(xj , pj , t, C) = 0, (27) die eine Integrationskonstante C enthalten, dienen. Solche Beziehungen nennen wir Integrale. Als Beispiele erwähnen wir insbesondere den Energiesatz T + V − E = 0 (1 Integral), den Impulssatz p = p0 (3 Integrale) und den Drehimpulssatz r × p = j (3 Integrale). Mit jedem Integral wird die Ordnung um eins reduziert und durch sechs Integrale wird das Problem vollständig gelöst. Dabei ist allerdings folgendes zu beachten: 1. Die verwendeten Integrale müssen voneinander unabhängig sein. Für die kräftefreie Bewegung sind beispielsweise Impulssatz v = v0 und Energiesatz v 2 = v02 trivialerweise nicht unabhängig. 10 2. Eine Beziehung der Form φ(xj , C1 , C2 ) = 0, die zwei Integrationskonstanten enthält, zählt doppelt, da sich aus ihr durch Differentiation ein weiteres Integral gewinnen läßt. Wir werden im folgenden einige grundlegende Bewegungsprobleme explizit lösen und auf diese Gesichtspunkte zurückkommen. 1.4 Die Bewegung im konstanten Schwerefeld Mit der Kraft F = −mg lautet die Bewegungsgleichung r̈ = v̇ = −g . (28) An Integralen steht zunächst (nur) der Energie–Erhaltungssatz zur Verfügung. Es ist in diesem Fall allerdings nicht sinnvoll, mit seiner Hilfe eine Variable zu eliminieren. Denn die Bewegungsgleichungen sind ungekoppelt, und die bequemste Lösung besteht in der direkten zweifachen Integration: ṙ = v = v0 − gt, 1 r = r0 + v0 t − gt2 . 2 (29) Als Integrationskonstanten haben wir den Anfangsort r0 und die Anfangsgeschwindigkeit v0 benutzt. Damit ist das Problem bereits vollständig gelöst. Den Energieerhaltungssatz finden wir aus der Lösung, wenn wir Gl. (29) skalar mit mg multiplizieren: mg·(r − r0 ) = m 2 m v0 − (v0 − gt)2 . 2 2 Unter Beachtung von v = v0 − gt und V = mg · r [vgl. Gl. (18)] geht dies in T + V = T 0 + V0 oder v 2 − v02 = 2g·(r0 − r) über. Zur anschaulichen Beschreibung der Bewegung wählt man zweckmäßigerweise in ein kartesisches Koordinatensystem mit g in z–Richtung und vy0 = 0. Dann erhält man 11 vx = vx0 , x = x0 + vx0 t g z = z0 + vz0 t − t2 2 vz = vz0 − gt, und erkennt die Wurfparabel in der x–z–Ebene (d.h. in der durch v0 und g aufgespannten Ebene). Man beachte, daß sich wegen der Unabhängigkeit der Koordinaten neben dem vollen Energiesatz auch ein separater Energiesatz 2 vz2 − vz0 = 2g(z0 − z) formulieren läßt. Aus dem selben Grund gilt auch ein Teil–Impulssatz mvx = const. Erhaltungssätze müssen also nicht immer in der im Abschnitt 1.3 angegebenen Form auftreten, sondern können sich auch auf einzelne Koordinaten beziehen. Wir werden später sehen, daß dieser Aspekt sogar wesentlich verallgemeinert werden kann. 1.5 Der harmonische Oszillator Für das Bewegungsproblem der linearen elastischen Kraft F = −kr (30) haben wir mit dem Energie– und Drehimpuls–Erhaltungssatz vier Integrale (vgl. Abschnitte 1.3 und 1.6). Aber auch hier sind die drei Komponenten der Bewegungsgleichung r̈ + ω 2 r = 0 mit ω 2 = k m (31) ungekoppelt und man erhält die Lösung am bequemsten direkt in der Form r = a cos ωt + b sin ωt . (32) Alle drei Ortskoordinaten führen also unabhängig harmonische Schwingungen der selben Frequenz ω aus. Offensichtlich gilt a = r0 und b = 12 1 v0 , ω und die Bewegung verläuft — was wir auch aus der Drehimpulserhaltung schließen können — in der durch a und b (bzw. in der durch r0 und v0 ) aufgespannten Ebene. Diese Ebene wählen wir zweckmäßig als x–y–Ebene (z = 0) eines speziell angepaßten Koordinatensystems. Offenbar ist die Bewegung beschränkt (r 2 ≤ a2 + b2 ) und es gibt eine maximale Auslenkung rm (“Amplitude”). Wir wollen — was keine Einschränkung bedeutet — den Zeitpunkt t = 0 in eine solche maximale Auslenkung legen. Dann gilt zur Zeit t = 0 r · ṙ = 0 oder a ⊥ b. Wählen wir nun x in a– und y in b–Richtung, so erhalten wir die Lösung in der bequemen Form x = a cos ωt, y = b sin ωt (33) und erkennen als Bahnkurve eine Ellipse der Halbachsen a und b mit dem Ursprung im Zentrum. Wir benutzen die Gelegenheit, um den Begriff der Bahngleichung f (x, y) = 0 einzuführen. Wir erhalten sie, indem wir die Zeit t aus den Lösungen x = x(t), y = y(t) eliminieren. Die Bahngleichung erhält also die Information über die Bahnkurve ohne Berücksichtigung des ’Fahrplans’. Im Fall des harmonischen Oszillators folgt aus cos2 + sin2 = 1 die Bahngleichung x2 y 2 + 2 − 1 = 0. a2 b Für manche Zwecke ist es auch nützlich, die “Bahn” im Geschwindigkeits– oder Impulsraum zu betrachten. Die entsprechende “Bahngleichung” g(ẋ, ẏ) heißt Hodograph [griech. oδoς (hodos) = Weg, γραϕω (grapho) = schreiben, zeichnen]. Für den harmonischen Oszillator mit ẋ = −aω sin ωt, ẏ = bω cos ωt beschreibt also der Hodograph ẋ2 ẏ 2 + 2 − ω2 = 0 a2 b bis auf einen Maßstabsfaktor ω 2 die gleiche Ellipse wie die Bahngleichung. Als letzten Begriff dieser Art erwähnen wir die Phasenbahn hi (xi , pi ) = 0 in dem aus Koordinate (xi ) und “zugehörigem” Impuls (pi ) aufgespannten Phasenraum 13 (Bedeutung: Statistische Mechanik, Bohr–Sommerfeldsche Quantentheorie). Für den Harmonischen Oszillator erhalten wir die Ellipsen x2 + p2x = a2 m2 ω 2 und y 2 + p2y = b2 m2 ω 2 als Phasenbahnen. Ihre Gleichungen lassen sich als separate (s.o.) Energiesätze k 2 m 2 x + ẋ = const und 2 2 k 2 m 2 y + ẏ = const 2 2 deuten. 1.6 Zentralkraft– und Keplerproblem Mit dem harmonischen Oszillator haben wir schon ein spezielles Zentralkraftproblem behandelt. Im Gegensatz zu diesem Spezialfall lassen sich die (kartesischen) Bewegungsgleichungen bei allen übrigen Zentralkräften F=− dV(r) r dr r (34) jedoch nicht separieren, da über r eine Kopplung besteht. Wir behandeln das allgemeine Problem daher mit systematischen Methoden und gehen von den Erhaltungssätzen aus: • Der Drehimpulssatz l = mr × v = j liefert uns drei Integrale und gestattet die Reduktion auf ein Problem dritter Ordnung. Da die Bewegung in der Ebene r · j = 0 verläuft, kann die Koordinate z = r · j/j senkrecht zu dieser Ebene (samt ihrer Ableitung!) entfallen. In dem verbleibenden Problem vierter Ordnung behalten wir das Integral l = mr 2 ϕ̇ = j, (35) wenn wir Polarkoordinaten r, ϕ in der Bewegungsebene benutzen. Dieses Integral besagt, daß der ’Fahrstrahl’ (radius vector) die Bahnebene mit konstanter ’Flächengeschwindigkeit’ überstreicht. • Als zweites (unabhängiges) Integral notieren wir den Energiesatz T +V = m 2 m 2 2 ṙ + r ϕ̇ + V (r) = E . 2 2 14 (36) Das verbleibende Problem zweiter Ordnung besteht in der Lösung der beiden gekoppelten Differentialgleichungen (35, 36) für r(t) und ϕ(t). Da ϕ nicht explizit vorkommt, erreichen wir die Entkopplung, indem wir (35) nach ϕ̇ auflösen und in (36) einsetzen: ṙ 2 = 2 (E − V ) − r 2 ϕ̇2 , m ṙ 2 = mit ϕ̇ = j mr 2 =⇒ j2 2 (E − V ) − 2 2 . m m r (37) Damit ist das Problem im Prinzip bis auf Quadraturen gelöst. Wir bemerken außerdem, daß Gl. (37) mit dem eindimensionalen Problem übereinstimmt, bei dem das Potential V (r) durch ein zusätzliches Fliehkraftpotential (Diskussion!) Ṽ (r) = j2 2mr 2 (38) ergänzt ist. Für die weitere Diskussion wollen wir dem üblichen Weg folgen und mittels dr/dϕ = ṙ/ϕ̇ = mr 2 ṙ/j von Gl. (37) zur Differentialgleichung dr dϕ !2 mr 2 j = !2 " 2 j2 (E − V ) − 2 2 m m r # der Bahngleichung übergehen. Mit der Substitution s= 1 r entsteht daraus die Differentialgleichung ds dϕ !2 1 2m = 2 E − V ( ) − s2 , j s (39) Z1/r (40) die generell durch das Integral ϕ = ϕ0 ± 1/r0 ds n 2m j2 h E −V gelöst wird. 15 ( 1s ) i − s2 o1/2 Speziell für das Gravitations– oder Coulomb–Potential V (r) = − C = −Cs r (41) läßt sich die Integration (nach quadratischer Ergänzung des Nenners) analytisch ausführen (und führt auf die arccos–Funktion). Wir folgen jedoch der eleganteren Behandlung Sommerfelds (Bd. I, S. 37) und differenzieren Gl. (39) (mit V = −Cs) nach ϕ: ds d2 s 2mC ds ds 2 = − 2s . dϕ dϕ2 j 2 dϕ dϕ Für ds/dϕ 6= 0 ensteht daraus die einfache Differentialgleichung mC d2 s + s = dϕ2 j2 mit der allgemeinen Lösung3 s= mC + α cos ϕ + β sin ϕ. j2 Diese Lösung enthält zwei Integrationskonstanten α und β. Zur Festlegung einer Konstanten bemerken wir, daß s offenbar beschränkt ist und verfügen ϕ = 0 für das maximale s (minimale r, ’Perihel’). Dann haben wir β = 0 und α > 0. Nun ist unsere Ausgangsgleichung (39) aber erster Ordnung und läßt gar keine zwei Integrationskonstanten frei. Nach der Wahl von β muß α also durch Rückeinsetzen in (39) bestimmt werden. Dabei können wir uns allerdings auf einen speziellen Punkt beschränken. Der Bequemlichkeit halber wählen wir dazu ϕ = π/2 und erhalten ds mC und = −α. s= 2 j dϕ Setzen wir das [mit (41)] in (39) ein, erhalten wir α2 = 2mE 2mC mC m2 C 2 + 2 − , j2 j j2 j4 also 2j 2 m|C| 1+ E α= 2 j mC 2 !1/2 . Damit lautet die Gleichung der Bahngkurve 3 Auf S. 35/36 (Bd. I) gibt Sommerfeld einen noch kürzeren Weg zu dieser Lösung an. 16 2j 2 mC m|C| 1+ E s= 2 + 2 j j mC 2 !1/2 cos ϕ oder r= j2 mit p = m|C| p sgn C + ε cos ϕ (42) 2j 2 und ε = 1 + E mC 2 !1/2 . Für C > 0 und ε < 1 (also E < 0, Planetenbahnen) beschreibt Gl. (42) Ellipsen mit dem Brennpunkt F1 im Zentrum. Wir wollen das kurz an einer kleinen Skizze rekapitulieren: y r q F2 ψ e e b ϕ p F1 x a Die Ellipse ist definiert durch die Beziehung q + r = 2a, wobei r und q die Abstände zu den beiden Brennpunkten F1 und F2 sind und a die große Halbachse der Ellipse bezeichnet. Nach dem Kosinussatz gilt q 2 = r 2 + 4e2 − 4re cos ψ. Setzen wir q = 2a − r und cos ψ = − cos ϕ ein, erhalten wir 4a2 − 4ar + r 2 = r 2 + 4e2 + 4er cos ϕ r(a + e cos ϕ) = a2 − e2 17 oder a2 − e 2 . a + e cos ϕ wird als Parameter p bezeichnet, für ihn gilt also r= Der Radius für ϕ = π 2 p= a2 − e 2 . a Damit erhalten wir schließlich r= p 1 + ε cos ϕ mit ε = e . a (43) Abschließend notieren wir noch (Symmetrie, Pythagoras) die Beziehung b2 = a2 − e2 = ap (44) zur Berechnung der kleinen Halbachse b. Kehren wir nach diesem Exkurs zu unserem physikalischen Problem zurück, so folgt durch Vergleich der Gln. (42) und (43) für attraktive Potentiale (C > 0) und gebundene Bahnen (E < 0, d.h. ε < 1) 1. Keplersches Gesetz: Der Planet beschreibt eine Ellipse, in deren einem Brennpunkt die Sonne steht. Das zweite Gesetz hatten wir schon bei Gl. (35) angesprochen. Es beruht allgemein auf der Drehimpulserhaltung und ist nicht auf 1/r–Potentiale beschränkt: 2. Keplersches Gesetz: Der radius vector von der Sonne nach dem Planeten überstreicht in gleichen Zeiten gleiche Flächen. Die konstante Flächengeschwindigkeit schreiben wir nach (35) 1 j Ȧ = r 2 ϕ̇ = . 2 2m Wir wollen diese Beziehung benutzen, um mit der Fläche A = πab = πa3/2 p1/2 der Ellipse [vgl. (44)] die Umlaufzeit T zu berechnen. Setzen wir [vgl. (42)] p = j 2 /(mC) ein, so erhalten wir A j 2m m T = = πa3/2 1/2 1/2 = 2πa3/2 m C j C Ȧ 1/2 . Für die Gravitation haben wir C = γmM, 18 (45) wobei γ die Gravitationskonstante und M die Sonnenmasse bezeichnet. Das Verhältnis m/C ist daher für alle Planeten gleich; also gilt 3. Keplersches Gesetz: Die Quadrate der Umlaufszeiten der Planeten verhalten sich wie die dritten Potenzen der großen Achsen: T2 4π 2 = . a3 γM (46) Bei den gebundenen Bahnen mit E < 0 bleibt der Planet im Einflußbereich der Sonne ’eingefangen’. Für E > 0 öffnen sich die Bahnen (in unserer Darstellung auf der linken Seite) und lassen den Massenpunkt nach r = ∞ ’entweichen’: Statt der Planetenbahnen erhalten wir die Bahnen der Kometen, und das sind wieder Kegelschnitte. Wir könnten analoge Betrachtungen wie bei der Ellipse durchführen, ersparen uns jedoch die Rechnung und notieren nur kurz das Ergebnis: E < 0 ε < 1 Ellipse E = 0 ε = 1 Parabel E > 0 ε > 1 Hyperbel Betrachten wir statt der Gravitation die Coulombkraft, so wird C=− e1 e2 . 4π0 (47) Im attraktiven Fall (C > 0) erhalten wir die gleichen Bahnen wie für Planeten und Kometen. Vom Wasserstoffatom wissen wir allerdings, daß die klassischen Begriffe für ein Elektron–Proton–System nur noch sehr beschränkt und vorsichtig angewendet werden dürfen. Für gleichnamige Ladungen haben wir C < 0, und Lösungen existieren nur noch für E > 0. Als Bahnen finden wir nun Hyperbeln, bei denen das Kraftzentrum im äußeren Brennpunkt liegt (vgl. Skizze). F2 F1 − 19 Eine Übersicht über weitere Kraftgesetze, für die das Zentralkraftproblem analytisch oder mittels elliptischer Integrale lösbar ist, findet sich im Lehrbuch von Goldstein (S. 81f). Wegen der Konkurrenz zum Fliehkraftpotential Ṽ (r) [vgl. (38)] stellt das Potential V (r) = Cr −2 einen (akademisch) interessanten Sonderfall dar (→ Übungen). 1.7 Die Bewegung im konstanten elektrischen und magnetischen Feld Als letztes Beispiel der Bewegung eines Massenpunktes im vorgegebenen Kraftfeld betrachten wir Newtons Lex secunda mv̇ = e (E + v × B) (48) für ein geladenes Teilchen (e, m) unter dem Einfluß einer stationären Lorentzkraft. Obwohl sich die Lorentzkraft nicht aus einem Potential ableiten läßt, gilt hier der Energiesatz m 2 v + eVel = = const . 2 (49) Mathematisch erkennen wir dies, wenn wir Gl. (48) skalar mit v multiplizieren. Denn da sich ein statisches Feld E gemäß E = −∇Vel aus einem elektrostatischen Potential Vel herleiten läßt, erhalten wir mv· v̇ + e dVel · ṙ = 0, dr aus der Gl. (49) durch Integration folgt. Aus physikalischer Sicht gilt der Energiesatz, weil (i) die magnetische Lorentzkraft senkrecht auf der Geschwindigkeit steht und nicht zum Wegintegral (8) der Arbeit beiträgt und (ii) im stationären Fall keine Energie durch Induktion aus dem Magnetfeld zu– oder abgeführt wird. Wir wollen speziell die Bewegung in konstanten Feldern E = const und B = const untersuchen. Wie bei unseren ersten Beispielen ist es vorteilhaft, die Lex secunda direkt zu integrieren, ohne vom Energiesatz Gebrauch zu machen. Dazu spalten wir die Bewegung (z.B. durch skalare oder vektorielle Multiplikation mit B) in einen Anteil parallel und einen senkrecht zum Magnetfeld auf. Mit vk = v · B/B und Ek = E · B/B erhalten wir für den parallelen Anteil mv̇k = eEk oder vk = vk0 + 20 e Ek t . m (50) Die Bewegung parallel zum Magnetfeld (in z–Richtung) wird also (trivialerweise) gar nicht vom Magnetfeld beeinflußt und durch das Gesetz des freien Falls beschrieben. Zur Beschreibung der (interessanteren) Bewegung senkrecht zum Magnetfeld differenzieren wir Gl. (48) noch einmal nach der Zeit und erhalten e v̇ × B , m v̈⊥ = da v̈k = 0 ist. Auf der rechten Seite setzen wir das Kreuzprodukt [vgl. (48)] v̇ × B = e e (E × B − B × (v × B)) = (E × B − B 2 v⊥ ) m m ein. Mit der Zyklotronfrequenz ωc = erhalten wir dann v̈⊥ = ωc2 e B m E×B − v⊥ B2 (51) ! . Diese linear inhomogene Gleichung besitzt offenbar die spezielle konstante Lösung vD = E×B , B2 (52) bei der sich die elektrische Kraft eE⊥ und die magnetische Lorentzkraft v × B gerade die Waage halten. (Eine Galileitransformation mit vD transformiert das Feld E⊥ weg!) Die homogene Gleichung beschreibt eine harmonische Schwingung, die allgemeine Lösung der inhomogenen Gleichung lautet also v⊥ = vD + a cos ωc t + b sin ωc t . Wegen der Differentiation haben wir eine vektorielle Integrationskonstante (etwa b) zuviel. Zu ihrer Festlegung setzen wir die Lösung speziell für t = 0 noch einmal in die Ausgangsgleichung (48) ein und erhalten ωc b = e (E⊥ + vD × B + a × B) . m Aus Gl. (52) erkennen wir vD × B = −E⊥ , also muß gelten b= a×B . B 21 Die Vektoren a und b sind also betragsgleich und stehen (in der Ebene senkrecht zu B) senkrecht aufeinander. Die Geschwindigkeit v⊥ = vD + a cos ωc t + a×B sin ωc t B (53) beschreibt somit eine Kreisbewegung mit überlagerter konstanter Drift (’E × B– Drift’). Die Integrationskonstante a ergibt sich aus der Anfangsbedingung v⊥0 = vD + a. 1.8 Beschleunigte Koordinatensysteme und Scheinkräfte Gehen wir von unserem Inertialsystem K zu einem Koordinatensystem K0 über, das sich relativ zu K mit der Geschwindigkeit u bewegt, so messen wir in K0 die Geschwindigkeit v0 = v − u. Aus Newtons Lex secunda folgern wir mv̇0 = F − mu̇. (54) Für gleichförmig bewegte Koordinatensysteme u̇ = 0 haben wir damit explizit die Galileiinvarianz der Newtonschen Grundgleichung angeschrieben. In beschleunigten Koordinatensystemen glauben wir dagegen, zusätzlich zu F eine Scheinkraft Fs = −mu̇ (55) zu beobachten. Alltägliche Beispiele sind aus der persönlichen Erfahrung in Fahrzeugen hinreichend bekannt. Die grundsätzliche Unterscheidung von “wahren” und von Scheinkräften ist aber keineswegs trivial und unproblematisch. Von besonderer Bedeutung für unsere Erfahrung auf der Erde – aber auch für die spätere Behandlung des starren Körpers – sind die Scheinkräfte in rotierenden Koordinatensystemen. Um sie zu behandeln, müssen wir uns zunächst mit der Beschreibung von Drehungen befassen. Es liegt zunächst nahe, Drehungen, die ja durch die Richtung der Drehachse und durch den Betrag des Drehwinkels eindeutig festgelegt sind, als Vektoren zu beschreiben. Das macht aber nur Sinn, wenn zusammengesetzte Drehungen den Rechenregeln der Vektoraddition genügen. Das ist jedoch nicht der Fall, wie wir 22 an dem einfachen Beispiel den folgenden Skizzen erkennen (wir wollen ein Buch, das im Regal liegt, richtig aufstellen): z y Ausgangssituation x z y D1 = 90o – Drehung um die x–Achse x z y D2 = 90o – Drehung um die z–Achse x Die Hintereinanderausführung D2 D1 liefert also das gewünschte Resultat, nicht dagegen die Drehung D1 D2 mit vertauschter Reihenfolge: D2 z D1D2 z y y x x Drehungen sind also nicht kommutativ. Sie werden durch orthogonale Matrizen4 beschrieben, die Hintereinanderausführung entspricht der Matrizenmultiplikation. Wir kommen jedoch zu der viel bequemeren Beschreibung durch Vektoren, wenn wir uns zunächst auf infinitesimale Drehungen beschränken: Für kleine Drehwin4 Die 9 Koeffizienten einer orthogonalen Matrix sind durch 3 Orthogonalitätsrelationen und 3 Normierungen verknüpft, so daß 3 freie Parameter bleiben. 23 kel δ1 , δ2 schreiben wir D1 = 1 + δ1 D10 D2 = 1 + δ2 D20 und erhalten im Limes δ1 δ2 → 0 D1 D2 = 1 + δ 1 D1 + δ 2 D2 = D 2 D1 . Infinitesimale Drehungen sind also kommutativ und können mit der Vektoraddition beschrieben werden. Zur sinnvollen Definition eines geeigneten Drehvektors legen wir die z–Achse in Richtung der Drehachse und betrachten die Änderung δa eines Vektors a durch eine infinitesimale Drehung δϕ. Dazu zerlegen wir a = ak + a⊥ mit ak = az ez . Dann bleibt ak bei der Drehung invariant, und wir erhalten δa = δa⊥ = δϕ a⊥+δa = |a⊥ |δϕ eϕ = = δϕ ez × a⊥ = ϕ = δϕ ez × a . a⊥ Die Änderung δa kann also durch vektorielle Multiplikation von a mit einem infinitesimalen Drehvektor δϕ ez beschrieben werden. Für eine zeitliche Abfolge infinitesimaler Drehungen des Vektors a erhalten wir entsprechend da = ω × a, dt (56) wobei die Winkelgeschwindigkeit ω = ϕ̇ ez einen Vektor bezeichnet, dessen Richtung in die momentane Drehachse fällt und dessen Betrag durch die momentane Drehgeschwindigkeit ϕ̇ gegeben ist. Wir betrachten nun ein Koordinatensystem K0 , das mit konstanter Winkelgeschwindigkeit ω rotiert und wenden Gl. (56) auf seine Basisvektoren e0i an. Dann gilt ė0i = ω × e0i , und wir erhalten für die zeitliche Ableitung eines beliebigen Vektors x = ẋ = = = X ẋi e0i + X ẋi e0i + ω × x X ẋi e0i + 24 X X xi ė0i xi ω × e0i P xi e0i Der linke Term auf der rechten Seite beschreibt die in K0 beobachtete (scheinbare) Änderung (dx/dt)0 von x, wir haben also dx = dt dx dt !0 +ω×x oder in kurzer symbolischer Schreibweise d = dt d dt !0 +ω× . (57) Um nach diesem Exkurs über Drehungen zu Newtons Lex secunda zurückzukehren, wenden wir diese Beziehung auf den Ortsvektor eines Massenpunktes an: dr = dt dr dt !0 + ω × r oder v = v0 + ω × r . Nochmalige Anwendung von (57) führt auf !0 +ω×v = !0 + ω × v0 + ω × (v0 + ω × r) v̇ = dv dt = dv0 dt dv0 d ω × r + dt dt !0 + ω × (v0 + ω × r) oder r̈ = (r̈)0 + 2 ω × v0 + ω × (ω × r) Hier bezeichnet (r̈)0 die in K0 beobachtete (scheinbare) Beschleunigung. Mit der Grundgleichung mr̈ = F folgt m(r̈)0 = F + 2m v0 × ω + m ω × (r × ω) . (58) Neben der Kraft F treten auf der rechten Seite also zwei Scheinkräfte auf. Der Term Z = m ω × (r × ω) = mω 2 r⊥ (59) beschreibt die Zentrifugal– oder Fliehkraft. Sie beruht auf der Normalbeschleunigung eines Massenpunktes, der im rotierenden Koordinatensystem ruht. Damit der Massenpunkt in Ruhe bleiben kann, muß die Zentrifugalkraft durch die entgegengesetzt gleiche Zentripetalkraft (und das ist keine Scheinkraft!) kompensiert werden. Die Corioliskraft 25 C = 2m v0 × ω (60) beruht auf der scheinbaren seitlichen Ablenkung der Bahn eines bewegten Massenpunktes durch die Drehung des Koordinatensystems. Formal mathematisch hat sie die gleiche Struktur wie die magnetische Lorentzkraft. Auf der rotierenden Erde geht die Fliehkraft mit dem Cosinus der geographischen Breite. Am größten ist sie am Äquator und macht dort ∼ 0.3 % der Erdbeschleunigung aus. Generell ergänzt sie ggrav zu dem beobachteten g = geff (Lot!). |g| nimmt also zu den Polen hin zu, und dieser Effekt wird durch die Abplattung der Erde – die selbst hierauf beruht! – verstärkt. Unter Vernachlässigung der Erdkrümmung (aber nicht der Erddrehung!) wird der freie Fall also durch die Gleichung (r̈)0 = g(eff) + 2 v0 × ω (61) beschrieben, die in ihrer mathematischen Struktur exakt mit der im vorigen Abschnitt behandelten Bewegungsgleichung (48) im konstanten elektrischen und magnetischen Feld übereinstimmt. Dabei können in dieser ebenen Näherung die Gyrationen natürlich nicht voll ausgebildet sein, denn sie würden Fallzeiten von mehreren Tagen voraussetzen. Der Effekt der Corioliskraft hängt generell von der Flugzeit ab, denn er beschreibt, wie sich die Erde unter der geraden Bahn wegdreht5 . Bei Fallversuchen ist dieser Effekt klein, er spielt aber bereits eine Rolle bei Geschoßbahnen und kann bei langdauernden Bewegungen dominant werden. Hierzu gehört insbesondere das großräumige Wettergeschehen: Durch die Corioliskraft wird die Luft, die auf der Nordhalbkugel in ein Tiefdrucksystem einströmt, im Gegenuhrzeigersinn abgelenkt, so daß ein rotierender Wirbel, ein Zyklon, entsteht (vgl. Skizze). Ebenso bilden sich um Hochdruckgebiete Antizyklone mit entgegengesetztem Drehsinn aus. H T Im reibungsfreien stationären Zustand halten sich Corioliskraft und Druckgradient sogar die Waage und die Windrichtung verläuft parallel zu den Isobaren. 5 Ein Teil der Corioliskraft läßt sich auch als Korrektur der Zentrifugalkraft interpretieren (Zug, der längs des Äquators fährt). 26 Darauf beruht die hohe Lebensdauer großer Hoch– und Tiefdruckgebiete. (Aufgrund der Reibung weicht die Windrichtung tatsächlich um einen Winkel von etwa 20 bis 300 von den Isobaren ab.) 1.9 Systeme von Massenpunkten Wir erweitern nun die Mechanik des einzelnen Massenpunkts im vorgegebenen Krafteld und betrachten ein System von n Massenpunkten, die miteinander wechselwirken6 . Dazu gehen wir wieder von der Lex secunda ṗi = Fi = Fai + X0 Fij (i, j = 1 . . . n) (62) j aus. Fai bezeichnet dabei eine äußere Kraft und Fij die Kraft, die der j–te Massenpunkt auf den i–ten ausübt. Dabei deutet der Apostroph an der Summe an, daß wir eine Selbstwechselwirkung ausschließen, also Fii = 0 verlangen. Diese Forderung fügt sich auch zwanglos in Newtons Lex tertia Fij = −Fji (63) ein, von der wir von nun an Gebrauch machen werden. Nach den Überlegungen in Abschnitt 1.3 wird die Dynamik eines Systems aus n Massenpunkten durch eine Differentialgleichungssystem 6n-ter Ordnung beschrieben. Durch jedes Integral, also jede Erhaltungsgröße, wird die Ordnung um eins reduziert. Wir folgen daher den Ausführungen des Abschnitts 1.2, um grundlegende Erhaltungsstze zu formulieren. Zur Herleitung des Impulssatzes definieren wir den Gesamtimpuls P= X pi i und erhalten für seine Ableitung Ṗ = X Fai + i X0 Fij . i,j Da die Doppelsumme nach der Lex tertia verschwindet, verhält sich das System als Ganzes, als wirke nur die äußere Gesamtkraft Fa = X Fai . i 6 Damit tun wir auch einen ersten Schritt zur Beschreibung der Dynamik ausgedehnter Körper und kommen zur Begründung des Modells eines Massenpunktes. 27 Hierin liegt die eigentliche Begründung für das Modell des Massenpunktes. Besonders prägnant tritt dieses Modell in Erscheinung, wenn wir die Begriffe der Gesamtmasse X M= mi (64) i und des Massenzentrums oder Schwerpunkts7 P rS = mi r i M (65) einführen. Dann erhalten wir P= X mi ṙi = M ṙS i und können die Lex secunda in der Form Ṗ = Mr̈S = Fa (66) formulieren: Der Schwerpunkt eines Systems von Massenpunkten bewegt sich so, als wäre die Gesamtmasse in ihm vereinigt und als griffe die Resultierende aller äußeren Kräfte in ihm an. (Anschauliches Beispiel: Feuerwerksrakete). Verschwindet insbesondere die äußere Kraft, so ist der Gesamtimpuls des Systems konstant. Auch bei der Herleitung des Energiesatzes verfahren wir analog der Rechnungung im Abschnitt 1.2, wir multiplizieren also die Lex secunda skalar mit vi und summieren: mi v̇i = Fi =⇒ X i mi vi ·v̇i = d X mi 2 X Fi ·ṙi . v = dt i 2 i i Daraus folgt durch zeitliche Integration (2) T2 − T 1 = XZ i (1) Fi ·dri = A12 , (67) wenn wir die (gesamte) kinetische Energie T = X i 7 mi 2 v 2 i Diese übliche Bezeichnung ist offensichtlich unglücklich gewählt! 28 (68) einführen und die Summe der Wegintegrale aller Kräfte wieder als Arbeit A bezeichnen. In dieser Form ist der Energiesatz (67) noch wenig hilfreich. Eine erste Verbesserung erreichen wir, wenn wir die kinetische Energie in einen inneren und äußeren Anteil zerlegen. Dazu gehen wir wieder von der Definition (65) des Schwerpunkts aus und schreiben ri = r S + x i . Damit folgt 1X mi (ṙS + ẋi ) · (ṙS + ẋi ) 2 i X 1X 1 M ṙ2S + ṙS · mi ẋi + = mi ẋ2i . 2 2 i i T = Nun ist nach der Definition des Schwerpunkts offenbar mi xi = 0, also auch mi ẋi = 0. Damit verschwindet der mittlere Term der unteren Zeile, und die kinetische Energie zerfällt gemäß P P 1 1X T = M ṙ2S + mi ẋ2i 2 2 i (69) in die kinetische Energie “des Massenzentrums” und in den “inneren” Anteil aus der Relativbewegung. Dabei ist zu beachten, daß diese Zerlegung der kinetischen Energie nur bezüglich des Schwerpunktes möglich ist! Der entscheidende Nutzen des Energiesatzes kommt erst zum Tragen, wenn alle Kräfte aus Potentialen herleitbar sind. Denn nur dann läßt sich das Wegintegral der Arbeit ohne vorherige Lösung des Bewegungsproblems berechnen. Wir machen den Ansatz Fai = − d a ∂ Vi (ri ) und Fij = − Vij (ri − rj ) dri ∂ri (70) und stellen mit der Zusatzforderung Vij = Vji die Gültigkeit der Lex tertia sicher: Fij = − ∂ ∂ Vij = + Vij = −Fji . ∂ri ∂rj Gleichzeitig weisen wir aber darauf hin, daß dieser naheliegende Ansatz keinesfalls allgemein ist. Zunächst einmal impliziert er sofort die Verschärfung der lex tertia, nach der die Kräfte in der Verbindungslinie der Körper liegen. Darüber hinaus 29 aber setz er die Annahme(!) einer Unabhängigkeit der Zweiteilchen–Wechselwirkung Vij vom Rest der Welt, insbesondere von den äußeren Kräften, voraus. Der Ansatz ist für die Coulomb–Wechselwirkung geladener Teilchen und die Gravitation von Punktmassen richtig, versagt aber schon bei der Wechselwirkung induzierter Dipole (Nägel im Magnetfeld). Mit der Annahme der Gl. (70) zerfällt nun auch das Arbeitsintegral in Gl. (67) in zwei Anteile, nämlich den “äußeren” Anteil (2) Aa12 =− XZ i (1) X dVia [Via (1) − Via (2)] · dri = dri i und den Wechselwirkungs–Anteil (2) AW 12 = − X0 Z i,j (1) ∂Vij · dri ∂ri (2)" Z 1 X0 = − 2 i,j (1) ∂Vij ∂Vi · dri + · drj ∂ri ∂rj # (2) (2) 1 X 0 Z ∂Vij 1 X 0 Z dVij = − · (dri − drj ) = − · drij , 2 i,j ∂ri 2 i,j drij (1) (1) wobei wir die Bezeichnung rij = ri − rj für das Argument von Vij benutzt haben. Wir können nun die Integration ausführen und erhalten. 1 X0 [Vij (1) − Vij (2)] . AW 12 = 2 i,j Definieren wir also die gesamte potentielle Energie durch V (r1 , . . . , rn ) = X Via (ri ) + i 1 X0 Vij (ri − rj ) , 2 i,j (71) so erhalten wir A12 = V1 − V2 (72) und formulieren den Energiesatz T2 + V2 = T1 + V1 oder T + V = E = const. 30 (73) Anmerkungen: 1. Die potentielle Energie (71) setzt sich zusammen aus der potentiellen Energie aller Teilchen in den äußeren Feldern und aus der Wechselwirkungsenergie. Letztere trägt den Faktor 12 , da die Wechselwirkungsenergie je zweier Teilchen i, j bei der Summation doppelt gezählt wird. Eine häu benutzte alternative Anschrift lautet X 1 X0 Vij (ri − rj ) = Vij (ri − rj ) . 2 i,j i<j 2. Obwohl sowohl die kinetische als auch die potentielle Energie jeweils in einen inneren und einen äußeren Anteil zerlegt werden können, gilt i.a. kein separater Energiesatz für die innere und die äußere Gesamtenergie! Eine wichtige Ausnahme bildet der Spezialfall verschwindender äußerer Kräfte. In weiterer Anlehnung an die Darstellung in Abschnitt 1.2 wollen wir den Drehimpulssatz formulieren. Dazu multipliziern wir die Lex secunda ṗi = Fi vektoriell mit ri und summieren über i: X i ri × ṗi = X i ri × F i . Da ṙi × pi = mi vi × vi = 0 gilt, steht auf der linken Seite die zeitliche Ableitung des Drehimpulses l := X i ri × p i . (74) Die Kräfte auf der rechten Seite zerlegen wir nach Gl. (62) in äußere Kräfte und innere Wechselwirkung und erhalten X i ri × F i = X ri × Fai + X ri × Fai + i X0 i,j ri × Fij 1 X0 [ri × Fij + rj × Fji ] 2 i,j i X 1 X0 ri × Fai + = (ri −rj ) × Fij . 2 i,j i = Hierbei haben wir bereits von der Lex tertia Fij = −Fji Gebrauch gemacht. Wir setzen nun außerdem wieder die Verschärfung “Die Kräfte liegen in der Verbindungslinie der Körper” voraus. Diese Verschärfung gilt für Zentralkräfte. Dann wird (ri − rj ) × Fij = 0 31 und wir erhalten den Drehimpulssatz l̇ = M (75) mit dem Gesamt–Drehmoment M= X i ri × Fai , (76) das nur von den äußeren Kräften abhängt. Wirken insbesondere keine äußeren Kräfte, so ist der Drehimpuls konstant. Ähnlich wie die kinetische Energie läßt sich auch der gesamte Drehimpuls in einen äußeren und einen innneren Anteil zerlegen. Wir schreiben dazu wieder ri = r S + x i und rechnen l = X i mi (rS + xi ) × (ṙS + ẋi ) = M rS × ṙS + rS × X mi ẋi + i X mi xi × ṙS + X i mi xi × ẋi . Wieder verschwinden wegen der Definition des Schwerpunkts die Summen P und mi ẋi und wir erhalten die gewünschte Zerlegung l = M rS × ṙS + X i mi xi × ẋi P mi xi (77) des gesamten Drehimpulses in den Drehimpuls rs ×P der Schwerpunktsbewegung und in den inneren Drehimpuls. Dabei sind auch entsprechende Hinweise wie bei der Energie zu beachten, nämlich 1. Die Zerlegung des Drehimpulses gilt nur bezüglich des Schwerpunkts. 2. Trotz der Zerlegung gilt i.a. kein separater Erhaltungssatz für den äußeren und den inneren Drehimpuls. Eine wichtige Ausnahme bildet wieder der Spezialfall verschwindender äußerer Kräfte. Schließlich erinnern wir noch einmal an die Voraussetzung der verschärften Lex tertia. 32 1.10 Das Zweikörperproblem Wir haben gesehen, daß die Bewegung des Schwerpunkts eines Systems nur von den äußeren Kräften abhängt. Wie wir beim Energie– und Drehimpulssatz gesehen haben, gelingt eine völlige Separation des Problems in Schwerpunkts– und Relativbewegung aber nur, wenn gar keine äußeren Kräfte angreifen. In diesem Fall wird die Schwerpunktsbewegung trivial. Die Gleichung rS = rS0 + vS0 t (78) enthält sechs Integrationskonstanten und kann benutzt werden, um einen Satz der 6n Koordinaten und Impulse zu eliminieren: Das n–Körperproblem ohne äußere Kräfte ist also mathematisch einem (n − 1)–Körperproblem (Ordnung 6(n − 1)) äquivalent. Damit muß es möglich sein, das Zweikörperproblem, das durch die Gleichungen (beachte die Lex tertia) m1 v̇1 = F12 m2 v̇2 = −F12 (79) (80) definiert ist, auf das ausführlich diskutierte Problem eines Massenpunktes zurückzuführen. Die Addition der beiden Gleichungen liefert den bereits besprochenen Schwerpunktsatz. Multiplizieren wir die Gleichungen dagegen wechselseitig mit m2 und m1 und subtrahieren, so erhalten wir m1 m2 (v̇1 − v̇2 ) = (m1 + m2 )F12 , oder wenn wir die Relativkoordinaten r12 = r1 − r2 u = ṙ12 = v1 − v2 (81) (82) und die reduzierte Masse µ= m1 m2 m1 m2 = m1 + m 2 M (83) einführen, µu̇ = F12 . 33 (84) Damit ist die gesuchte Formulierung eines äquivalenten Einkörperproblems bereits gefunden. Ausgehend von diesem Einkörperproblem können wir nun auch wieder eine kinetische Energie Trel = µ 2 u 2 (85) und einen Drehimpuls lrel = µu × u̇ (86) im Relativsystem definieren und entsprechende Erhaltungssätze formulieren. Unter Ausnutzung der Beziehungen m2 r12 M m1 = rS − r12 M r1 = r S + r2 und (87) (88) rechnet man jedoch leicht nach, daß es sich hierbei um die bereits aus dem vorigen Abschnitt bekannten inneren Anteile der kinetischen Energie bzw. des Drehimpulses handelt. Nachträglich merken wir an, daß wir auf dieser Basis die Behandlung des Keplerproblems im Abschnitt 1.6 präzisieren können, indem wir die Planetenmasse durch die reduzierte Masse ersetzen. Wir weisen aber nochmals darauf hin, daß die einfache Reduktion des Zweikörperproblems nur möglich ist, wenn keine äußeren Kräfte einwirken. Die Bewegung des Mondes um die Erde im (äußeren) Schwerefeld der Sonne ist also beispielsweise kein Zweikörperproblem und und folgt nur in sehr grober Näherung den Keplerschen Gesetzen. 34 2 Lagrange–Mechanik 2.1 Zwangsbedingungen und Zwangskräfte Bei unseren bisherigen Überlegungen waren die Kräfte als Funktion von Teilchenkoordinaten, Geschwindigkeiten und eventuell der Zeit vorgegeben, und unsere Aufgabe bestand in der Lösung der Newtonschen Differentialgleichungen mi r̈i = Fi (rj , ṙj , t) (i, j = 1, . . . n) . In vielen technischen Problemen ist aber die Bewegung durch Nebenbedingungen oder Zwangsbedingungen eingeschränkt. Dabei treten Kräfte, die sogenannten Zwangskräfte, auf, die nicht vonvornherein bekannt sind. Bevor wir uns mit dem damit verbundenen Selbstkonsistenzproblem befassen, wollen wir einige Begriffe zur sprachlichen Klassifikation von Zwangsbedingungen einführen und an einfachen Beispielen erläutern. Zwangsbedingungen, die durch Beschränkungsgleichungen der Form fk (r1 , . . . rn , t) = 0 (89) formuliert werden können8 , heißen holonom [griech. oλoς (holos) = lat. integer (“Integral!”), griech. νoµoς (nomos) = Gesetz], alle andern heißen anholonom [griech. αν (an) = lat. in = dtsch. un]. Zur Erläuterung notieren wir einige Beispiele: holonom anholonom Pendel an einer Stange r2 − a 2 = 0 Pendel an einem Faden r 2 − a2 ≤ 0 Bewegung auf der Erdoberfläche r2 − a 2 = 0 Bewegung außerhalb der Erde r 2 − a2 ≥ 0 Starrer Körper (ri − rj )2 − a2ij = 0 System harter Kugeln (ri − rj )2 − a2 ≥ 0 “Breite” Rolle dx = adϕ (vgl. 5 ) “Scharfkantiges” Rad dx = a cos ϑdϕ, dy = a sin ϑdϕ Straßenbahn Autobus 8 Hierzu gehören also auch integrable differentielle Bedingungen 35 P ∂fk/∂ri · dri = 0! Abgesehen von bestimmten differentiellen Bedingungen (vgl. Abschnitt 2.5) ist man bei der Behandlung anholonomer Beschränkungen auf individuelle Ansätze für die speziellen Probleme angewiesen. So werden Bedingungen mit einem ≤– Zeichen i.a. auf eine Fallunterscheidung mit entprechender Untersuchung von Bahnstücken führen (Fadenpendel) und/oder genauere Spezifizierungen der Bedingungen im Fall des =–Zeichens verlangen (Stoß harter Kugeln). Wie werden im folgenden, wenn nicht ausdrücklich etwas anderes gesagt wird, stets holonome Zwangsbedingungen voraussetzen. Eine weitere Unterscheidung trifft man bezüglich der Zeitabhängigkeit: Enthalten Zwangsbedingungen die Zeit explizit, nennt man sie rheonom [griech. ρω (rheo) = fließen], andernfall skleronom [griech. σκληρoς (skleros) = starr]. Skleronome Bedingungen erscheinen zunächst einfacher, der Formalismus, den wir im folgenden entwickeln, läßt aber ohne nennenswerten Mehraufwand auch die Behandlung rheonomer Bedingungen zu. Wir kommen nun auf das Problem der Selbstkonsistenz zurück. Wir stehen nm̈lich vor der grundsätzlichen Schwierigket, daß wir das Bewegungsproblem mit den Newtonschen Gesetzen allein nicht lösen können, da die Zwangskräfte nicht apriori vorgegeben sind. Sie stellen vielmehr Reaktionen des Systems dar, die selbst vom Bewegungsablauf — also der Lösung des Bewegungsproblems — abhängen. Um diesen Aspekt zu verdeutlichen, betrachten wir vergleichend das Problem influenzierter Oberflächenladungen in der Elektrostatik: Elektrostatik Mechanik Grundproblem: Das Potential Φ ist mit der Poissongleichung Grundproblem: Die Bahnen ri (t) sind mit Newtons Gesetz Φ = −%/ε0 mi r̈i = Fi aus den Ladungen % zu berrechnen. aus den Kräften Fi zu berechnen. Beschränkung: Φ ist auf den Leiteroberflächen vorgegeben. Beschränkung: Die ri (t) unterliegen Zwangsbedingungen. Schwierigkeit: Die Ladungen auf den Leiteroberflächen (Reaktionen des Systems!) sind nicht apriori bekannt. Schwierigkeit: Die Zwangskräfte (Reaktionen des Systems!) sind nicht apriori bekannt. Lösungskonzept: Wir versuchen, die unbekannten Oberflächenladungen aus der Beschreibung zu eliminieren (z.B. durch die Methode der Spiegelladungen). Lösungskonzept: Wir versuchen, die unbekannten Zwangskräfte aus der Beschreibung zu eliminieren. Hierzu postulieren wir ein neues Prinzip. 36 2.2 Prinzip der virtuellen Arbeit und d’Alembertsches Prinzip Da die Zerlegung von Kräften Fi = Fei + Zi (90) in von außen angelegte oder “eingeprägte” Kräfte Fei und Zwangskräfte Zi nicht aus den Newtonschen Axiomen gefolgert werden kann, benötigen wir ein neues, zusätzliches Postulat. In Analogie zum Modell des idealen Leiters in der Elektrostatik benutzen wir hierzu das Modell der glatten Führungen. Dabei denken wir z.B. an reibungsfreie Schienen. Trotz der scheinbaren Trivialität erweist sich die korrekte Formulierung des neuen Postulats als ziemlich schwierig. Darum beschränken wir uns zunächst auf die Statik und bereiten die Aufstellung des Postulats durch die elementare Anschauung an der schiefen Ebene vor: z Z K G⊥ G|| δs G ϕ x An unseren Massenpunkt greift eine Federkraft K, eine Gewichtskraft G und die Zwangskraft Z an. Im statischen Gleichgewicht muß die Summe aller Kräfte verschwinden: F = K+G +Z = 0. Die intuitive Lösung des Problems besteht nun darin, zu postulieren, daß die Zwangskraft senkrecht auf der Führung steht. Zerlegen wir die Gewichtskraft entsprechend in die Anteile Gk und G⊥ mit Gk = mg sin ϕ und G⊥ = mg cos ϕ , so erhalten wir die beiden Beziehungen G⊥ + Z = 0 und Gk + K = 0 . 37 Die erste Gleichung interessiert uns nicht, da wir die Zwangskraft eliminieren wollen. Aus der zweiten finden wir K = −mg cos ϕ . Unsere intuitive Behandlung der Zwangsbedingung macht also Gebrauch von dem Postulat “Die Zwangskraft steht senkrecht auf der Führung”. Wir können diesen Sachverhalt mit Hilfe des Arbeitsintegrals ohne explizite Zerlegung der Kräfte ausdrücken: Prinzip der virtuellen Arbeit: Zwangskräfte leisten bei virtuellen Verrückungen δri keine Arbeit, X i Zi · δri = 0 . (91) Die Gleichgewichtsbedingungen Fi = 0 gehen damit in die Bedingungen X i Fei · δri = 0 (92) über, welche die Zwangskräfte gar nicht mehr enthalten! Hierin liegt bei komplexeren Problemen der entscheidende Vorteil gegenüber der Zerlegung nach dem Kräfteparallelogramm. Virtuelle Verrückungen sind dabei differentielle Systemänderungen δri der Massenpunkte, • die mit den Zwangsbedingungen verträglich sind und • die “im Gedankenexperiment” ohne Rücksicht auf den tatsächlichen Bewegungsablauf vorgenommen werden. Hinweise: 1. Beachte, daß aus Gl. (92) nicht Fei = 0 gefolgert werden kann, da die δri nicht unabhängig sind. 2. Warum es so wichtig ist, die virtuellen Änderungen vom tatsächlichen Bewegungsablauf zu unterscheiden, werden wir gleich sehen. 3. Wir weisen nochmals darauf hin, daß sich das Postulat nicht beweisen läßt, sondern daß damit “glatte Führungen” definiert werden. Wir werden es für holonome und einfache differentielle anholonome Zwangsbedingungen benutzen. 38 Für unser Beispiel der schiefen Ebene erhalten wir also die Gleichgewichtsbedingung (G + K) · δs = 0 , wobei zu beachten ist, daß δs mit der Zwangsbedingung verträglich ist. Das heißt, daß die Richtung von δs längs der schiefen Ebene zu wählen ist. Damit geht die Gleichgewichtsbedingung in (Gk + K)δs = 0 über, und für δs 6= 0 folgt die oben formulierte Gleichung Gk + K = 0 . Wir verlassen nun die Statik und gehen wieder zur Dynamik über, indem wir die Gleichgewichtsbedingung Fi = 0 durch Newtons Lex secunda ṗi = Fi = Fei + Zi (93) ersetzen. Dabei halten wir am Modell der glatten Führungen und damit an dem Prinzip, daß Zwangskräfte bei virtuellen Verrückungen keine Arbeit leisten, fest: X i Zi · δri = 0 . Damit erhalten wir sofort das d’ Alembertsche Prinzip X i (ṗi − Fei ) · δri = 0 . (94) Was wir hier so mühelos und scheinbar trivial erhalten haben, geht historisch auf äußerst scharfsinnige Analysen von Bernoulli und d’Alembert zurück, die auf einem dynamischen Gleichgewicht von eingeprägten Kräften, Zwangskräften und Trägheitskräften beruhen. Wie wenig trivial das Prinzip ist, zeigt sich darin, daß der präzise Charakter der virtuellen Verrückungen erst jetzt voll zum Tragen kommt: Virtuelle Verrückungen sind gedachte Systemveränderungen, die mit den (momentanen) Zwangsbedingungen verträglich sind und nichts mit dem tatsächlichen Ablauf der Bewegung zu tun haben. Ohne diesen letzteren Nachsatz wäre das Prinzip falsch! Insbesondere bei rheonomen Zwangsbedingungen können Zwangskräfte bei der tatsächlichen Bewegung nämlich sehr wohl Arbeit am System leisten. Die Zwangskräfte stehen dann im Fall holonomer Bedingungen zwar weiterhin senkrecht 39 auf den momentanen beschränkenden Flächen, aber die resultierende Bewegung verläuft eben nicht mehr in diesen Flächen. Als einfaches Beispiel dazu betrachten wir die Arbeit, die von der Zentripetalkraft geleistet wird, wenn ein Massenpunkt an einem Faden der Länge `(t) mit `˙ < 0 geführt wird: δr dr=rdt l(t0) l(t) Für die Ausführung der virtuellen Verrückung muß also in Gedanken die Zeit kurz “angehalten” werden, anschaulich: Wir führen die virtuelle Verrückung nicht am bewegten System durch, sondern an einer Momentaufnahme, an einem Foto dieses Systems. In abstrakter mathematischer Form formulieren wir diese fundamental wichtige Erklärung in der Form • Die Zeit darf bei virtuellen Verrückungen nicht variiert werden: δt = 0 . (95) Wir beenden diesen Abschnitt mit einem einfachen Beispiel zum d’Alembertschen Prinzip: Wir stellen die Bewegungsgleichung für die schiefe Ebene (nun ohne Federkraft) auf. Dabei beziehen wir uns auf die Skizze z m δs G ϕ 40 x und rechnen (mr̈ − G) · δs = 0 mit r̈ = ẍex + z̈ez , G = −mgez und δs = (cos ϕex − sin ϕez )δs =⇒ m(ẍex + z̈ez + gez )(cos ϕex − sin ϕez )δs = 0 oder ẍ cos ϕ − z̈ sin ϕ − g sin ϕ = 0 . Diese eine Bewegungsgleichung enthält noch zwei Unbekannte. Aber uns steht ja außerdem auch noch die Zwangsbedingung z = z0 − x tan ϕ zur Verfügung, mit der wir eine der Koordinaten eliminieren können. Wir setzen z̈ = −ẍ tan ϕ ein und erhalten die Bewegungsgleichung sin2 ϕ ẍ cos ϕ + cos ϕ ! = g sin ϕ oder ẍ = g sin ϕ cos ϕ mit der Lösung x = x0 + vx0 t + 2.3 g sin ϕ cos ϕ t2 . 2 Generalisierte Koordinaten und Lagrangesche Gleichungen Das Beispiel der schiefen Ebene hat einen Nachteil unserer bisherigen Formulierung deutlich gemacht, der die Rechnung noch einigermaßen unbequem gestaltet: Unser n–Teilchen–Problem wird durch 3n Koordinaten beschrieben. Wenn alle Koordinaten unabhängig wären, könnten wir alle δri unabhängig wählen — etwa immer nur eine einzige Koordinate variieren — und erhielten aus dem d’Alembertschen Prinzip 3n Bewegungsgleichungen. Tatsächlich sind die Koordinaten aber durch m Beschränkungsgleichungen verknüpft und so bleiben uns nur f = 3n − m (96) “Freiheitsgrade” für die Variation. Damit liefert das d’Alembertsche Prinzip auch nur f unabhängige Gleichungen. (Im Beispiel der schiefen Ebene war das eine Gleichung). Mit den m Beschränkungsgleichungen zusammen erhalten wir zwar die erforderliche Anzahl von 3n Gleichungen. Da wir im Fall holonomer Zwangsbedingungen, auf die wir uns hier beschränken, aber nur f unabhängige Koordinaten haben, schleppen wir einen unnötigen Ballast mit uns. Im Falle der 41 schiefen Ebene wäre es beispielsweise bequemer gewesen, statt der Koordinaten x und z, die durch eine Zwangsbedingung verknüpft sind, sofort die eine freie Koordinate s zu verwenden. Im allgemeinen wird es freilich nicht ausreichen, einfach ein gedrehtes kartesisches Koordinatensystem zu benutzen. Vielmehr müssen wir bereit sein, von den kartesischen Koordinaten, die wir nun in der Form x1 , . . . x3n durchnumerieren wollen, zu ganz allgemeinen krummlinigen und schiefwinkligen Koordinaten q1 , . . . q3n überzugehen: Wir sprechen von generalisierten Koordinaten. Dabei streben wir an, daß die Zwangsbedingungen trivial zu handhaben sind. Schreiben wir diese wieder in der Form f1 (x1 , . . . x3n , t) = 0, . . . , fm (x1 , . . . x3n , t) = 0 , so wählen wir beispielsweise qf +1 = f1 (x1 , . . . x3n , t), . . . , q3n = fm (x1 , . . . x3n , t) als neue Koordinaten und ergänzen sie durch eine geeignete Wahl von q1 (x1 , . . . x3n , t), . . . , qf (x1 , . . . , x3n , t) zu einem vollständigen Koordinatensatz. Die Zwangsbedingungen qf +1 = 0, . . . , q3n = 0 sind dann in der Tat trivial und machen die m Koordinaten qf +1 , . . . q3n überflüssig. Auf jeden Fall beschreiben wir unser System von f Freiheitsgraden so durch f generalisierte Koordinaten q1 , . . . qf , daß die m Zwangsbedingungen bereits implizit in der Rücktransformation x1 = x1 (q1 , . . . qf , t), . . . , x3n = x3n (q1 , . . . qf , t) (97) enthalten sind. Um dieses Konzept an einem einfachen Beispiel zu illustrieren, betrachten wir ein ebenes Pendel, d.h einen Massenpunkt mit den Koordinaten x1 , x2 , x3 und den Zwangsbedingungen f1 (x) = x21 + x22 + x23 − `2 = 0 und x2 − ϕ0 = 0 . f2 (x) = atn x1 42 Benutzen wir an Stelle der kartesischen Koordinaten x1 , x2 , x3 sphärische Polarkoordinaten r, ϑ, ϕ, so lauten die Zwangsbedingungen f1 (x) = r 2 − `2 = 0 und f2 (x) = ϕ − ϕ0 = 0 . Mit der Wahl der Koordinaten q3 = r − ` = 0 und q2 = ϕ − ϕ0 = 0 — die explizit gar nicht mehr benötigt werden — sind die Zwangsbedingungen trivial erfüllt und wir können mit q1 = ϑ als einziger freier Koordinate arbeiten. Die Rücktransformation x1 = ` sin ϑ cos ϕ0 x2 = ` sin ϑ sin ϕ0 x3 = ` cos ϑ stellt die Erfüllung der Zwangsbedingungen bereits sicher. Unsere Aufgabe besteht nun also darin, das d’Alembertsche Prinzip 3n X i=1 (mi v̇i − Fi )δxi = 0 (98) in generalisierten Koodinaten zu formulieren. Hierbei bezeichnet Fi die einprägte Kraft. Wir lassen also künftig den oberen Index e weg, da die Zwangskräfte Zi im d’Alembertschen Prinzip gar nicht vorkommen. Zur Umrechnung benutzen wir die differentiellen Beziehungen δxi = f X ∂xi δqk k=1 ∂qk und f X ∂ ∂ d = q̇j + . dt ∂qj ∂t j=1 (99) (100) Die Umformung des zweiten Terms in Gl. (98) ist rasch erledigt: Wir schreiben einfach X ∂xi X X Fi Fi δxi = Qk δqk δqk = ∂qk i i,k k und definieren damit generalisierte Kräfte Qk = X Fi i 43 ∂xi . ∂qk (101) [Beachte: Eine generalisierte Kraft Qk hat nur dann die Dimension einer Kraft, wenn qk die Dimension einer Länge hat. Die Produkte Qk δqk haben immer die Dimension einer Energie (virtuelle Arbeit!). Beschreibt z.B. qk einen Winkel, so ist Qk das zugehörige Drehmoment.] Die Umformung des ersten Terms in Gl. (98) kostet etwas mehr Mühe. Wir schreiben zunächst gemäß (99) v̇i δxi = v̇i X k " X d ∂xi ∂xi vi δqk = ∂qk dt ∂qk k ! # d ∂xi − vi δqk . dt ∂qk (102) Im rechten Term können wir nach Gl. (100) f ∂xi ∂xi ∂vi ∂ 2 xi ∂ 2 xi ∂ X d ∂xi X q̇j q̇j = = + = + dt ∂qk ∂qj ∂qk ∂t∂qk ∂qk j=1 ∂qj ∂t ∂qk j ersetzen, denn es gilt ja — ebenfalls nach Gl. (100) — vi = dxi X ∂xi ∂xi q̇j = + . dt ∂qj ∂t j (103) An dieser Stelle überlegen wir uns, daß wir in der neben den qk auch die q̇k als unabhängige Variable benötigen. Dabei gilt nach Gl. (103) offenbar ∂vi ∂xi = . ∂qj ∂ q̇j (104) Dies setzen wir im ersten Term auf der rechten Seite von Gl. (102) ein und erhalten v̇i δxi = X k " d ∂vi vi dt ∂ q̇k ! # ∂vi − vi δqk . ∂qk Hier ersetzen wir nun keineswegs die vi nach Gl. (103), sondern multiplizieren mit mi , summieren und drücken das Ergebnis mit Hilfe der kinetischen Energie P T = 12 mi vi2 aus: X mi v̇i δxi = i X k " # ∂T d ∂T − δqk . dt ∂ q̇k ∂qk Damit erhält das d’Alembertsche Prinzip (98) die Form X k " # ∂T d ∂T − − Qk δqk = 0 . dt ∂ q̇k ∂qk 44 (105) Und nun kommt die entscheidende Schlußfolgerung: Wenn wir die generalisierten Koordinaten bei holonomen Zwangsbedingungen “richtig” gewählt haben, dann sind die Variationen δqk nicht mehr durch Nebenbedingungen verknüpft und können frei gewählt werden9 . Damit müssen die Koefizienten der δqk in Gl. (104] einzeln verschwinden, und wir erhalten die Lagrangeschen Gleichungen ∂T d ∂T − = Qk . dt ∂ q̇k ∂qk (106) Meistens nimmt man bei der Formulierung der Lagrangeschen Gleichungen zusätzlich an, daß die Kräfte aus einem Potential hergeleitet werden können. Dann erhält man für die generalisierten Kräfte Qk = − und kann schreiben X i ∂V ∂V ∂xi =− ∂xi ∂qk ∂qk (107) d ∂T ∂T ∂V − + = 0. dt ∂ q̇k ∂qk ∂qk Da das Potential V nicht von den q̇k abhängt, können wir die Lagrangefunktion L(q1 , . . . qf , q̇1 , . . . q̇f , t) = T − V (108) einführen und erhalten die Lagrangeschen Gleichungen in der üblichen Form d ∂L ∂L − = 0. dt ∂ q̇k ∂qk (109) Beachte: Gl. (109) ist keine partielle Differentialgleichung zur Bestimmung von L. Vielmehr wird angenommen, daß die kinetische und die potentielle Energie mit Hilfe der Transformationsgleichungen durch die qk und q̇k ausgedrückt wurden und L bereits in der Form (108) vorliegt. Die Ausführung der Differentiationen in (109) liefert dann ein System von gewöhnlichen Differentialgleichungen gk (q1 , . . . qf , q̇1 , . . . q̇f , q̈1 , . . . q̈f , t) = 0 der Ordnung 2f zur Bestimmung der qk (t). Dies sind die “fertigen” Bewegungsgleichungen in den generalisierten Koordinaten, in denen bereits alle holonomen Zwangsbedingungen berücksichtigt sind. So schwierig auch im Einzelfall die Lösung dieser Bewegungsgleichungen sein mag, ihre Aufstellung ist nach diesem Standartverfahren fast mühelos. Der Rest ist Mathematik: Die (häufig numerische) Integration eines Systems gewöhnlicher Differentialgleichungen. 9 Die Gleichung (104) selbst ist nicht an diese Vorraussetzung gebunden und gilt auch bei anholonomen Zwangsbedingungen. 45 2.4 Beispiele Wir wollen uns das Verfahren, aus der Lagrangefunktion die Bewegungsgleichungen zu gewinnen, zunächst an dem allereinfachsten Spezialfall klarmachen: Wir haben keine Zwangsbedingungen und verwenden kartesische Koordinaten qi = xi . Dann wird L(xi , ẋi ) = T − V = X i und aus den Lagrangeschen Gleichungen Newtonschen Bewegungsgleichungen mi ẍi = − mi 2 ẋ − V (xi ) , 2 i d ∂L ∂L − = 0 folgen sofort die dt ∂ ẋi ∂xi ∂V = Fi . ∂xi Zur Verdeutlichung betrachten wir drei weitere einfache aber nicht mehr ganz so triviale Beispiele: 1. Spiralbewegung in der Ebene Wir greifen sogleich das Beispiel einer rheonomen Zwangsbedingung aus dem vorigen Abschnitt auf, und betrachten einen Massenpunkt in der Ebene, der durch einen Faden der vorgegebenen Länge `(t) auf eine Spirale um den Ursprung gezwungen wird. Wir gehen von ebenen Polarkoordinaten r, ϕ aus und behalten wegen der Zwangsbedingung r = `(t) den Winkel ϕ als einzige generalisierte Koordinate. Mit m m T = v 2 = (`˙2 + `2 ϕ̇2 ) und V = 0 2 2 folgt L(ϕ̇, t) = m 2 m ˙2 v = (` + `2 ϕ̇2 ) . 2 2 Da L nicht von ϕ abhängt, lautet die Lagrangegleichung d ∂L = 0, dt ∂ ϕ̇ also ∂L = m`2 ϕ̇ = j = const . ∂ ϕ̇ In dieser Bewegungsgleichung erkennen wir den Drehimpulssatz wieder. Nach Vorgabe der Funktion `(t) erhält man die Lösung ϕ(t) durch Integration. Betrachten wir etwa speziell `(t) = `0 e−νt und drücken den Drehimpuls in der Form j = m`20 ϕ̇0 durch die Anfangsbedingung aus, so folgt explizit ϕ̇ = ϕ̇0 e2νt und ϕ = ϕ0 + 46 ϕ̇0 2νt e . 2ν 2. Das ebene Pendel Wir benutzen sphärische Polarkoordinaten r, ϑ, ϕ mit der Polarachse nach unten. Wegen der beiden Zwangsbedingungen r = ` und ϕ = ϕ0 behalten wir ϑ als einzige generalisierte Koordinate. Damit formulieren wir T = m 2 m 2 2 v = ` ϑ̇ 2 2 und V = mgz = −mg` cos ϑ (+const) und erhalten die Lagrangefunktion L(ϑ, ϑ̇) = m 2 2 ` ϑ̇ 2 + mg` cos ϑ. Aus der Lagrangegleichung d ∂L ∂L = 0 mit − dt ∂ ϑ̇ ∂ϑ ∂L = ml2 ϑ̇, ∂ ϑ̇ ∂L = −mgl sin ϑ ∂ϑ folgt die Bewegungsgleichung m`2 ϑ̈ + mg` sin ϑ = 0 oder ϑ̈ + g sin ϑ = 0 . ` Für kleine Auslenkunken (sin ϑ ≈ ϑ) erhält man harmonische Schwingungen der Frequenz ω = (g/`)1/2 . Die Berücksichtigung endlicher Auslenkugen führt auf elliptische Integrale. Die Schwingungsdauer hängt dabei von der Amplitude ab, das Pendel schwingt nicht mehr isochron [griech. ισoς (isos) = gleich, χρoνoς (chronos) = Zeit]. 3. Das Zykloidenpendel Im letzten Beispiel demonstrieren wir die Leistungsfähigkeit des Verfahrens durch eine Umkehrung der Fragestellung: Wir suchen eine Führung, also eine Zwangsbedingung, welche die Anharmonizität (Anisochronie) des ebenen Pendels (in der x − z-Ebene) korrigiert. Mit einer geeigneten – noch unbekannten – dimensionslosen generalisierten Koordinate q postulieren wir also die Bewegungsgleichung g q̈ + q = 0 ` und gehen dementsprechend von einer geeigneten Lagrangefunktion L= m 2 2 1 ` q̇ − mg`q 2 2 2 aus. Die Parameterdarstellung x(q), z(q) erhalten wir, indem wir L = T − V mit der kartesischen Darstellung T = m 2 (ẋ + ż 2 ) und V = mgz 2 47 vergleichen. Daraus folgt 1 und z = q 2 `. 2 ẋ2 + ż 2 = `2 q̇ 2 Setzen wir ż = `q q̇ in die erste Gleichung ein, erhalten wir ẋ2 = `2 (1 − q 2 )q̇ 2 q oder dx = ∓` 1 − q 2 dq. Substituieren wir schließlich q = cos φ, dq = − sin φ dφ, so folgt dx = ±` sin2 φ dφ = ± 21 `(1 − cos 2φ)dφ und x = (±) 21 `(φ − 12 sin 2φ). Zusammen mit z = 21 `q 2 = Parameterdarstellung 1 ` cos2 2 ` x = (2φ − sin 2φ), 4 2.5 + cos 2φ) erhalten wir also die ` z = (1 + cos 2φ), 4 Zur Geometrie der Zykloide 0 π/3 2π/3 π Die Figur illustriert die Lage der Punkte,4π/3 die 5π/3 Rollwinkeln 2φ = nπ/3 entsprechen. 2π 4 4z/l einer Zykloide, die beim Abrollen des Kreises x2 + z 2 = (`/4)2 an der Geraden z = `/2 entsteht (siehe Skizze, Rollwinkel 2φ; die Gleichgewichtslage q = 0 entspricht 2φ = π). Im Mechaniklehrbuch vonSommerfeld (Theor. Physik. Bd. 1, S. 84) ist beschrieben, wie Huygens eine solche Führung bei der Konstruktion isochroner Pendeluhren realisiert hat. 1 `(1 4 φ = 2 2φ 0 0 2 4x/l 4 6 Geschwindigkeitsabhängige Kräfte Unter der Voraussetzung, daß sich alle generalisierten Kräfte in der Form Qk = − ∂V ∂qk aus einem Potential herleiten lassen, konnten wir die Lagrangeschen Bewegungsgleichungen aus einer Lagrangefunktion L = T − V gewinnen. Wir erhalten die selben Gleichungen etwas allgemeiner aus der Lagrangefunktion L=T −U, wenn sich die generalisierten Kräfte gemäß 48 (110) Qk = ∂U d ∂U − dt ∂ q̇k ∂qk (111) aus einem generalisierten Potential U (q1 , . . . qf , q̇1 , . . . q̇f , t) gewinnen lassen. Dieser Zusammenhang ist gleichbedeutend mit Fi = d ∂U ∂U − , dt ∂ ẋi ∂xi (112) denn dann wird X Qk = i ∂xi X d ∂U ∂xi ∂U ∂xi Fi = − ∂qk dt ∂ ẋi ∂qk ∂xi ∂qk i ! , und wegen ∂xi /∂qk = ∂ ẋi /∂ q̇k [vgl. Gl. (104)] folgt Qk = X i d ∂U ∂ ẋi ∂U ∂xi − dt ∂ ẋi ∂ q̇k ∂xi ∂qk ! = d ∂U ∂U − . dt ∂ q̇k ∂qk Diese spitzfindige Verallgemeinerung des Lagrangeschen Formalismus könnte als akademische Spielerei abgetan werden, wenn sie nicht eine fundamental wichtige Anwendung besäße: Das elektromagnetische Feld mit der geschwindigkeitsabhängigen Lorentzkraft F = e(E + v × B) . (113) Um diese Kraft in der gewünschten Form notieren zu können, müssen wir aus der Elektrodynamik die allgemeine Darstellung10 E = −∇Φ − ∂ A; ∂t B=∇×A (114) der Felder E und B durch “Potentiale” Φ und A übernehmen. Damit wird " # ∂A F = −e ∇Φ + − v × (∇ × A) . ∂t Den letzten Term formen wir nach dem Entwicklungssatz um: v × (∇ × A) = ∇(v · A) − v·∇A . 10 Zur Erinnerung: B = rotA folgt aus divB = 0. Zur induzierten Feldstärke −∂A/∂t vgl. das “Induktionsgesetz” rotE = −∂B/∂t. 49 Berücksichtigen wir außerdem dA ∂A + v·∇A = , ∂t dt so erhalten wir " # dA F = −e ∇Φ + − ∇(v · A) dt # " d d = −e ∇(Φ − v · A) + v·A dt dv " # d d = −e ∇(Φ − v · A) − (Φ − v · A) dt dv Die letzte Umformung gilt, da Φ nicht von v abhängt. Mit U (r, v, t) = eΦ(r, t) − ev · A(r, t) (115) gilt also in Übereinstimmung mit (112) Fi = ∂U d ∂U − . dt ∂vi ∂xi Damit erhalten wir die Bewegungsgleichungen im elektromagnetischen Feld aus einer Lagrangefunction L = T − eΦ + ev · A . (116) Im Gegensatz zur Behandlung im Abschnitt 1.7 ist hier die volle Zeitabhängigkeit der Felder zugelassen, es fehlt allerdings die Strahlungsdämpfung. Eine andere Gruppe von geschwindigkeitsabhängigen Kräften bilden idealisierte Reibungskräfte. Diese können im allgemeinen nicht sinnvoll durch eine verallgemeinerte Lagrangefunktion erfaßt werden. Es steht uns aber natürlich frei, solche Kräfte — wie beliebige weitere Kräfte — zusätzlich zu den Kräften, die wir aus einem generalisierten Potential ableiten, in den Lagrangeformalismus einzubringen: Schreiben wir Qk = d ∂U ∂U − + Q̃k , dt ∂ q̇k ∂qk (117) so erhalten wir die Lagrangeschen Bewegungsgleichungen ∂L d ∂L − = Q̃k . dt ∂ q̇k ∂qk 50 (118) Ein häufig benutzter Ansatz nimmt einen linearen Zusammenhang Ri = −ai vi (119) zwischen den Reibungskräften Ri und den Geschwindigkeiten vi an. In diesem Fall können wir mit einer Dissipationsfunktion11 F= 1X 2 ai vi 2 i schreiben Ri = − (120) ∂F . ∂vi Für die generalisierte Reibungskraft erhält man dann Q̃k = X i Ri X ∂F ∂ ẋi X ∂F ∂vi ∂xi =− =− , ∂qk i ∂vi ∂ q̇k i ∂vi ∂ q̇k wobei wir wieder von Gl. (104) Gebrauch gemacht haben. Wenden wir schließlich noch die Kettenregel an, so folgt Q̃k = − 2.6 ∂F . ∂ q̇k (121) Die Methode der Lagrangeschen Multiplikatoren Wir wollen eine alternative Methode zur Lösung der Bewegungsgleichungen mit Nebenbedingungen behandeln, die es auch erlaubt, eine einfache Klasse anholonomer Zwangbedingungen zu erfassen. Obwohl das bei dieser Methode grundsätzlich nicht erforderlich ist, nehmen wir an, daß unser System durch einen Satz q1 , . . . qm generalisierter Koordinaten12 beschrieben wird. Diese Koordinaten seien jedoch nicht unabhängig, sondern einer Zwangsbedingung f (q1 , . . . , qm , t) = 0 unterworfen. Die Gleichung f = 0 beschreibt eine Hyperfläche im m–dimensionalen q–Raum. Virtuelle Verrückungen müssen in dieser Hyperfläche ausgefürt werden: X ∂f δqk = 0 . δf = ∇q f · δq = k ∂qk 11 12 lat. dissipo = zerstreuen, verteilen, vergeuden Darin mag ein Teil der Zwangsbedingungen bereits berücksichtigt sein, also m ≤ 3n. 51 δq muß also senkrecht auf der Flächennormalen stehen, und die Richtung der Flächennormalen ist durch die Richtung des Gradienten ∇q f gegeben. Wir gehen nun wieder von dem Postulat aus, daß die Zwangskraft bei virtuellen Verrückungen keine Arbeit leistet oder — anders ausgedrückt — senkrecht auf der beschränkenden Hyperfläche steht. Dann ist die (generalisierte) Zwangskraft Q̂ also parallel zum Gradienten und wir können schreiben Q̂ = λ(q, t) ∇q f (q, t) oder ∂f . ∂qk Ehe wir Bewegungsgleichungen mit dieser Zwangskraft formulieren, überlegen wir zwei einfache Verallgemeinerungen: Q̂k = λ Erstens können wir sofort mehrere Beschränkungsgleichungen berücksichtigen und diese durch einen Index i, über den wir anschließend summieren, kennzeichnen. Zweitens ist es für unserer Formulierung offenbar gar nicht wichtig, daß die Hyperfläche fi = 0 als Ganzes (d.h. holonom) vorgegeben ist, denn wir haben nur von der lokalen Beschreibung der Tangentialfläche Gebrauch gemacht. Solche lokalen Tangentialflächen werden aber auch durch möglicherweise anholonome (also nicht integrable13 ) Zwangsbedingungen der Form ai (q, t) · dq + ait dt = X aik (q1 , . . . qn , t)dqk + ait dt = 0 (i = 1, . . . s) (122) k definiert. Dabei übernehmen die Koeffizienten aik die Rolle der partiellen Ableitungen ∂fi /∂qk . Wir gehen also von (122) aus und beschreiben die Zwangskraft durch den Ansatz Q̂k = s X λi aik (k = 1, . . . m) (123) i=1 mit noch unbekannten “Lagrangeschen Multiplikatoren” λi . Diese Multiplikatoren sind zunächst Funktionen von q1 , . . . qn und t. Über den Ablauf der Bewegung können sie aber auch als Funktionen von t allein aufgefaßt werden. Mit diesem Ansatz gehen wir in das d’Alembertsche Prinzip m X k=1 13 ( ) d ∂L ∂L − − Q̂k δqk = 0 dt ∂ q̇k ∂qk Die Bedingungen sind integrablel, wenn ∂aik /∂ql = ∂ail /∂qk und ∂ait /∂qk = ∂aik /∂t gilt. 52 ein. Nun dürfen die δqk zunächst eigentlich nicht frei gewählt werden. Aus physikalischer Sicht können wir jedoch argumentieren, daß wir die Zwangsbedingungen gar nicht explizit zu beachten brauchen, wenn wir von vornherein die entsprechenden Zwangskräfte berücksichtigen. Vom mathematisch formalen Standpunkt können wir die s unbekannten Koeffizienten λi so wählen, daß s Klammern im d’Alembertschen Prinzip verschwinden. Die restlichen m − s Variationen sind dann frei. In jedem Fall erhalten wir damit die m Bewegungsgleichungen s X ∂L d ∂L − = λi aik dt ∂ q̇k ∂qk i=1 (k = 1, . . . m) . (124) Zusammen mit den s Zwangsbedingungen (122) stellen sie ein System von m + s Differentialgleichungen zur Bestimmung der m + s unbekannten Funktionen q1 (t), . . . qm (t); λ1 (t), . . . λs (t) dar. Im Falle holonomer Zwangsbedingungen ist der Nachteil dieser Methode offenbar: Statt eines Problems mit f = m − s Unbekannten haben wir ein Problem mit m + s Unbekannten zu lösen. Dafür sind wir in der Lage, anholonome Bedingungen der Form (122) zu berücksichtigen. Außerdem werden die Zwangskräfte bei dieser Methode explizit mitberechnet. Benutzen wir speziell kartesische Koordinaten xk , erhalten wir die Bewegungsgleichungen mk ẍk = Fke + s X λi aik , (125) i=1 die auch als “Lagrangesche Gleichungen erster 14 Art” bezeichnet werden. Beispiel: Die schiefe Ebene (vgl. S. 40, 41) Wir benutzen kartesische Koordinaten x, z. Die äußeren Kräfte sind durch Fxe = 0 und Fze = −mg oder durch das Potential V = mgz gegeben. Die (in diesem Fall natürlich holonome) Zwangsbedingung schreiben wir in der differentiellen Form dz = −dx tan α oder dx tan α + dz = 0 . Mit der Lagrangefunktion L= m 2 (ẋ + ż 2 ) − mgz 2 14 Die Lagrangegleichungen der vorigen Abschnitte werden auch Lagrangegleichungen zweiter Art oder allgemeine Lagrangegleichungen genannt. 53 und den Gln. (124) oder äquivalent mit den Gln. (125) folgen dann die Bewegungsgleichungen mẍ = λ tan α mz̈ = −mg + λ . Wir lösen die zweite Gleichung nach λ auf und setzen dies in die erste ein: mẍ = tan α(mz̈ + mg) . Aus der Zwangsbedingung entnehmen wir außerdem z̈ = −ẍ tan α und erhalten mẍ(1 + tan2 α) = mg tan α oder nach der gleichen Umformung wie auf S. 41 ẍ = g sin α cos α . Dies ist die fertige Bewegungsgleichung für x(t) (Lösung: siehe S. 41). z(t) erhält man daraus (z.B.) über die Zwangsbedingung. Mit der ersten Bewegungsgleichung finden wir außerdem λ = mg cos2 α , und daraus ergeben sich die Zwangskräfte Zx = λ tan α = mg sin α cos α und Zz = λ = mg cos2 α . (Interpretation: Die Komponente mg cos α der Schwerkraft erscheint als Zwangskraft senkrecht zur schiefen Ebene. Zx und Zz sind wiederum die Komponenten dieser Zwangskraft.) 2.7 Berechnung von Zwangskräften Wenn es auch unser Bestreben war, Zwangskräfte aus der Formulierung der Bewegungsgleichungen zu eliminieren, so wünscht man doch gelegentlich, diese Zwangskräfte zu berechnen. Beispielsweise könnte es ratsam sein, die Zwangskräfte mit der Belastbarkeit einer Führung zu vergleichen. Mit den Lagrangeschen Multiplikatoren haben wir bereits eine Methode zur Berechnung der Zwangskräfte kennengelernt. Im Falle holonomer Zwangsbedingungen ist diese Methode jedoch viel zu schwerfällig und umständlich. Wir geben daher einen bequemeren Weg an, der von der physikalischen Interpretation ausgeht: Wir beschreiben unser System von f Freiheitsgraden mit der Lagrangefunktion L(q1 , . . . qf , q̇1 , . . . q̇f , t) und lösen die Lagrangeschen Bewegungsgleichungen 54 ∂L d ∂L − =0 dt ∂ q̇k ∂qk (k = 1, . . . f ) . (126) Hierbei treten die Zwangskräfte nicht in Erscheinung. Dann bilden wir mit zusätzlichen Koordinaten qf +1 , . . . qm (f < m ≤ 3n) eine erweiterte Lagrangefunktion L̂(q1 , . . . qm , q̇1 , . . . q̇m , t) . Wir denken uns nun wieder die Zwangsbedingungen durch die entsprechen (generalisierten) Kräfte Q̂k ersetzt. Dann gelten im erweiterten System die Lagrangegleichungen ∂ L̂ d ∂ L̂ − = Q̂k dt ∂ q̇k ∂qk (k = 1, . . . m) (127) Diese Lagrangegleichungen15 benutzen wir nicht zur Lösung des Bewegungsproblems, denn das ist ja bereits gelöst! Vielmehr setzen wir hierin die Lösung q1 , . . . qf der Bewegungsgleichungen (126) und die (m − f ) Zwangsbedingungen ein und erhalten damit explizit die interessierenden generalisierten Zwangskräfte Qk . Als Beispiel betrachten wir wieder die schiefe Ebene des vorigen Abschnitts. Wir wählen zunächst x als generalisierte Koordinate und erhalten aus der Lagrangefunktion m L(x, ẋ) = ẋ2 (1 + tan2 α) + mgx tan α 2 die Bewegungsgleichungen mẍ(1 + tan2 α) = mg tan α oder ẍ = g sin α cos α . Nun führen wir z als zusätzliche Koordinate ein und bilden die erweiterte Lagrangefunktion m L̂(x, z, ẋ, ż) = (ẋ2 + ż 2 ) − mgz . 2 Daraus erhalten wir die wir die Lagrangegleichungen mẍ = Q̂x mz̈ + mg = Q̂z . 15 Beachte, daß die Gln. (127) auch für k ≤ f von den Gln. (126) verschieden sind und Zwangskräfte enthalten! 55 Zusammen mit der Bewegungsgleichung und der Zwangsbedingung z̈ = −ẍ tan α erhalten wir daraus die Zwangskräfte Q̂x = mg sin α cos α Q̂z = −mẍ tan α + mg = mg(1 − sin2 α) = mg cos2 α . Beachte, daß wir bei der Verwendung generalisierter Koordinaten qk die Zwangskräfte Q̂k i.a. in der entsprechend generalisierten Form erhalten. Falls erwünscht, können wir daraus gemäß X ∂qk Zi = Q̂k ∂xi k die nicht generalisierten Zwangskräfte berechnen. In unserem Beispiel haben wir jedoch von vornherein kartesiche Koordinaten x und z benutzt, und daher gilt Q̂x = Zx 2.8 und Q̂z = Zz . Zyklische Koordinaten, Symmetrien und Erhaltungssätze Wenn die Lagragefunktion L(q1 , . . . qf , q̇1 , . . . q̇f , t) von einer Koordinate qk gar nicht abhängt (wohl aber von q̇k !), so heißt diese Koordinate zyklisch16 . Für eine zyklische Koordinate erhalten wir die Lagrangegleichung d ∂L = 0. dt ∂ q̇k Um den entsprechenden Erhaltungssatz prägnant formulieren zu können, führen wir allgemein (also nicht nur für zyklische Koordinaten) durch pk = ∂L ∂ q̇k (128) den “zur Koordinate qk konjugierten generalisierten Impuls” pk ein. Der Name wird für freie Teilchen ohne Magnetfeld unmittelbar verständlich, wir haben dann nämlich X mi ẋ2i − V (xj ) L=T −V = i und erhalten mit pk = ∂L = mk ẋk ∂ ẋk 16 Der Name stammt von der Winkelkordinate bei Kreisbewegungen [griech. κυκλoς (kyklos) = Kreis]. 56 den altbekannten Impuls. Wir weisen jedoch mit Nachdruck darauf hin, daß im allgemeinen pk vom Impuls, der in Newtons Lex secunda steht, verschieden ist. Betrachten wir beispielsweise ein geladenes Teilchen im elektromagnetischen Feld, so folgt aus X mX 2 ẋi Ai L= ẋi − eΦ + e 2 i i der generalisierte Impuls pk = mẋk + eAk oder p = mv + eA . Für generalisierte Koordinaten qk , die nicht die Dimension einer Länge haben, hat pk nicht einmal die Dimension eines Impulses. Der zu einer Winkelkoordinate ϕ konjugierte Impuls pϕ ist beispielsweise ein Drehimpuls (s.u.). Aus der Definition von pk folgt, daß Produkte pk qk in jedem Fall die Dimension einer Wirkung, also Energie × Zeit, haben. Wir kehren nun zu den zyklischen Variablen zurück und formulieren den allgemeinen Erhaltungssatz • Der zu einer zyklischen Koordinate qk konjugierte generalisierte Impuls pk bleibt bei der Bewegung erhalten. Diese Formulierung stellt einen engen Zusammenhang zwischen Erhaltungssätzen und Symmetrieeigenschaften her: Ist die Koordinate qk zyklisch, so ist die Lagrangefunktion invariant gegen Veränderungen von qk , und diese Invarianz begründet einen Erhaltungssatz, nämlich den des konjugierten Impulses pk . Ein kräftefreies System ist invariant gegen Translationen, und hieraus folgt der Impulserhaltungssatz. Ebenso ergibt sich der Drehimpulserhaltungssatz aus der Rotationssymmetrie eines Systems, auf das kein Drehmoment wirkt. Wir wollen diese intuitiv formulierten Zusammenhänge gleich etwas genauer darlegen. Zuvor weisen wir aber darauf hin, daß unser neuer Erhaltungssatz allgemeiner ist als die früher formulierten Sätze der Impuls– und Drehimpulserhaltung. Betrachten wir etwa die Bewegung eines geladenen Teilchens im konstanten Magnetfeld B = Bez , so ist diese Bewegung nicht kräftefrei und wir können keinen Impulserhaltungssatz in x– oder y–Richtung formulieren. Mit V = const und der speziellen Darstellung A = Bxey wird dagegen die Ortskoordinate y zyklisch, und damit folgt, daß der generalisierte Impuls py = mẏ + eAy = mẏ + eBx bei der Bewegung konstant bleibt17 . 17 Aus den Bewegungsgleichungen finden wir unabhängig von der speziellen Wahl von A die beiden Invarianten mẏ+eBx und mẋ−eBy. Dies sind jedoch nicht die generalisierten Impulse p y und px . Für A = αBxey −(1−α)Byex wird nämlich py = mẏ +αBx und px = mẋ +(1−α)By. 57 Um nun den Zusammenhang zwischen Impulserhaltung und Translationsinvarianz genauer zu fassen, betrachten wir einen Massenpunkt mit der Lagrangefunktion m L(r, ṙ) = ṙ2 − V (r) . 2 Die Aussage “L ist invariant gegen eine Translation in z–Richtung” heißt mathematisch, daß L0 = L gilt, wenn wir r durch r0 = r + δr mit δr = ez δz (δz → 0) ersetzen. Da die Geschwindigkeit durch die Translation nicht geändert wird, gilt ∂L δz . ∂z L ist also invariant gegen eine Translation in z–Richtung, wenn L0 − L = δL = ∂L ∂V =− = Fz = 0 ∂z ∂z gilt oder wenn keine Kraft in z–Richtung wirkt. Als Folge dieser Invarianz bleibt der Impuls ∂L = mż pz = ∂ ż erhalten. Die Übertragung dieser Betrachtung auf eine beliebige Richtung und auf ein System von Massenpunkten ist trivial. Besteht Translationsinvarianz für alle Richtungen, so ist der vektorielle Impuls konstant. Wir wollen eine ähnliche Betrachtung auch für den Drehimpulssatz durchführen. Dazu nehmen wir an, daß die Lagrangefunktion L = T −V eines Massenpunkts invariant gegen Drehungen um die z–Achse ist. Eine infinitesimale Drehung um den Winkel δϕ um die z–Achse erzeugt eine Änderung δr = eϕ δϕ = ez × r δϕ (vgl. S. 24). Da sich T = mv2 /2 bei einer Drehung nicht ändert, folgt dV · δr = F · (ez × r) δϕ dr = ez · (r × F) δϕ = ez · M δϕ = Mz δϕ . L0 − L = δL = −δV = − L ist also invariant gegen Drehungen um die z–Achse, wenn die z–Komponente des Drehmoments M verschwindet. Den entsprechenden Erhaltungssatz erkennen wir, wenn wir Zylinderkoordinaten (r, ϕ, z) benutzen und m L = (ṙ 2 + r 2 ϕ̇2 + ż 2 ) − V 2 schreiben. Aus ∂L/∂ϕ = 0 folgt dann die Erhaltungsgröße pϕ = ∂L = mr 2 ϕ̇ = mrvϕ = m(r × v)z = const , ∂ ϕ̇ also die Erhaltung der z–Komponente des Drehimpulses. Mit einem gewissen Pathos können wir also formulieren 58 • Die Impulserhaltung ist eine Folge der Homogenität des Raumes. • Die Drehimpulserhaltung ist eine Folge der Isotropie des Raumes. Unter diesem Gesichtspunkt fehlt uns eine Konsequenz der Homogenität der Zeit. Wir erwarten nämlich aus relativistischen Gründen eine gewisse Äquivalenz von Raum und Zeit. Allerdings ist die Zeit in unserem Formalismus keine generalisierte Koordinate, sondern ein freier Parameter. Folglich ist ihr auch kein generalisierter Impuls zugeordnet. Wir fragen trotzdem nach möglichen Folgen einer Invarianz der Lagrangefunktion gegen eine Zeitverschiebung, die durch ∂L/∂t = 0 gekennzeichnet ist. Dazu rechnen wir ! dL X ∂L ∂L ∂L = q̇k + q̈k + dt ∂qk ∂ q̇k ∂t k und setzen ∂L = pk ∂ q̇k und ∂L d ∂L = = ṗk ∂qk dt ∂ q̇k ein. Damit folgt ∂L dL dL X d X pk q̇k . = − (ṗk q̇k + pk q̈k ) = − ∂t dt dt dt k k Wir finden also in der Tat einen weiteren Erhaltungssatz: • Hängt die Lagrangefunktion nicht explizit von der Zeit ab, so bleibt die Größe X pk q̇k − L (129) H= k bei der Bewegung erhalten. H heißt die Hamiltonfunktion (s.u.) des Systems. Wenn wir wieder freie Teilchen betrachten und kartesische Koordinaten benutzen, so haben wir L=T −V = 1X mi ẋ2i − V . 2 i Also wird pk = mk ẋk und folglich H= X k mk ẋ2k − L = T + V = E . Unserer Aufzählung eherner Gesetze können wir also hinzufügen: • Die Energieerhaltung ist eine Folge der Homogenität der Zeit. 59 Wir merken jedoch an, daß in dieser markigen Formulierung nichts neues gegenüber dem altbekannten Energiesatz enthalten ist — wohl aber in der obigen Formulierung mit der Hamiltonfunktion! Wir zeigen das am Beispiel eines Massenpunktes, der reibungsfrei auf einer Stange (x) gleitet, die mit konstanter Winkelgeschwindigkeit ω um eine senkrechte Achse (z) rotiert. Die Lagrangefunktion L=T = m 2 (ẋ + x2 ω 2 ) 2 dieses Systems hängt nicht explizit von der Zeit ab. Mit px = mẋ folgt also H = mẋ2 − m m 2 (ẋ + x2 ω 2 ) = (ẋ2 − x2 ω 2 ) = T − mx2 ω 2 = const. 2 2 Erhaltungsgröße ist in diesem Fall also nicht die Energie E = T , sondern H = E − mx2 ω 2 . Und warum ist die Energie in diesem Beispiel nicht konstant? Weil Zwangskräfte bei rheonomen Zwangsbedingungen Arbeit leisten. Und was ist an H= m 2 m 2 2 ẋ − x ω 2 2 anschaulich? Die (Pseudo–)Energie des äquivalenten Problems im rotierenden Koordinatensystem mit dem “Potential” m2 x2 ω 2 der Fliehkraft18 mxω 2 . (Vgl. S. 26, g = geff auf der rotierenden Erde.) Das Beispiel läßt uns noch etwas unbefriedigt: Wann ist denn nun die Hamiltonfunktion die Energie und wann nicht? Und was ist die Hamiltonfunktion, wenn sie nicht die Energie ist? Um das zu untersuchen rechnen wir von den generalisierten Koordinaten qk in die kartesischen Koordinaten xi = hi (q1 , . . . qf , t) zurück und bilden ẋi = X hik q̇k + hit mit hik = k ∂hi ∂qk und hit = ∂hi . ∂t Damit wird T = X i 18 X mi X hik hit q̇k + h2it = T2 + T1 + T0 . hik hil q̇k q̇l + 2 2 k,l k Beachte, daß dieses effektive Potential für ω = const und l =const verschieden aussieht, vgl. Gl. (38)! 60 Dabei bezeichnet Tν den Anteil der kinetischen Energie, der homogen vom Grade ν (s.u.) in den generalisierten Geschwindigkeiten q̇k ist. Entsprechend läßt sich der “magnetische Anteil” X M= ei ẋi Ai i der Lagrangefunktion in zwei homogene zwei Anteile M1 undM0 zerlegen. Das Potential V hängt nicht von den Geschwindigkeiten ab, ist also homogen vom Grade Null in den q̇k . Nach diesen Vorüberlegungen bilden wir nun die Lagrangefunktion L = T − V + M und stellen fest, daß sie offenbar in drei Anteile L L2 L1 L0 = = = = L2 + L1 + L0 mit T2 T1 + M 1 T0 + M 0 − V , zerfällt, wobei die Lν homogen vom Grade ν in den generalisierten Geschwindigkeiten sind. Wir gehen nun etwas genauer auf den Begriff der Homogenität ein: Eine Funktion f (x) heißt homogen vom Grade ν, wenn gilt f (λx) = λν f (x) . (130) Differenziern wir diese Definitionsgleichung nach λ und setzen anschließend λ = 1, so erhalten wir die Eulersche Homogenitätsrelation X i xi ∂f = νf . ∂xi (131) Nach diesem Exkurs kehren wir zur Bedeutung der Hamiltonfunktion H= X k pk q̇k − L = X ∂L q̇k − L ∂ q̇k zurück: Setzen Wir L = L2 + L1 + L0 ein und beachten, daß nach (131) X ∂Lν q̇k = νLν ∂ q̇k gilt , so folgt H = 2L2 + 1L1 + 0L0 − (L2 + L1 + L0 ) oder (mit der obigen Spezifizierung der Lν ) H = L 2 − L 0 = T2 + V − T 0 − M 0 . 61 (132) Damit ist die obige Frage nach dem Zusammenhang und dem Unterschied von Hamiltonfunktion und Energie klar beantwortet: H ist die Gesamtenergie T +V , wenn T1 , T0 und M0 verschwinden, das heißt, wenn die generalisierten Koordinaten nicht explizit von der Zeit abhängen. Eine explizite Zeitabhängikeit der generalisierten Koordinaten kommt i.a. durch rheonome Zwangsbedingungen zustande. Als Beispiel betrachten wir noch einmal den Massenpunkt auf der rotierenden Stange. Hier haben wir19 m m L = (ẋ2 + x2 ω 2 ), also L2 = ẋ2 und L0 = x2 ω 2 . 2 2 Damit erhalten wir sofort m H = L2 − L0 = (ẋ2 − x2 ω 2 ) . 2 Wie in diesem Beispiel läßt sich −L0 häufig als Pseudopotential interpretieren. H = const ist dann die (Pseudo–)Energie in dem entsprechenden Nicht– Inertialsystem. Wir bemerken, daß die Größe H überhaupt nicht von L1 = T1 + M1 abhängt, insbesondere also im Fall skleronomer Zwangsbedingungen nicht von M . Damit folgt, daß der Energieerhaltungssatz auch in Anwesenheit zeitunabhängiger Magnetfelder gilt [vgl. Gl. (49)]. 2.9 Routhsches Verfahren und kanonische Gleichungen Wir befassen uns nun mit der Frage, wie wir zyklische Koordinaten mit ihren Erhaltungssätzen möglichst ökonomisch ausnutzen. Dazu nehmen wir an, daß unsere Lagrangefunktion die Form L(q2 , . . . qf , q̇1 , . . . q̇f , t) (133) hat, daß q1 also zyklisch ist. Zu q1 haben wir das Integral ∂L = p1 = const . ∂ q̇1 (134) Die übrigen Lagrangegleichungen d ∂L ∂L − =0 dt ∂ q̇k ∂qk 19 (k = 2, . . . , f ) (135) Beachte die wichtige Unterscheidung zwischen generalisierten Geschwingkeiten q̇ k (hier ẋ) und anderen Geschwindigkeiten (hier ωx), die auf den Zwangsbedingungen beruhen! 62 enthalten zwar noch q̇1 , wir können jedoch Gl. (134) nach q̇1 = g(q2 , . . . qf , q̇2 , . . . q̇f , p1 , t) (136) auflösen und in die Bewegungsgleichungen (135) einsetzen. Dort tritt dann weder die Koordinate q1 noch die Geschwindigkeit q̇1 explizit in Erscheinung: Wir haben das Gesamtproblem also in die separaten Probleme der Lösung der Gln. (135) (Ordnung 2(f − 1)) und der Integration der Gl. (136) (Ordnung 1) aufgespalten. Falsch wäre es, die Geschwindigkeit q̇1 gemäß Gl. (136) sofort in der Lagrangefunktion (134) zu eliminieren. Denn L ist stets als Funktion der generalisierten Koordinaten und Geschwindigkeiten und nicht der generasierten Impulse zu formulieren! Wir wollen uns das an einem Beispiel klarmachen und betrachten das Zentralkraftproblem in der Ebene. In ebenen Polarkoordinaten haben wir L= m 2 (ṙ + r 2 ϕ̇2 ) − V (r) . 2 Die Winkelkoordinate ist zyklisch und liefert den Erhaltungssatz ∂L = mr 2 ϕ̇ = pϕ = const ∂ ϕ̇ des Drehimpulses (Flächensatz, vgl. S. 14, 18). Für die radiale Koordinate erhalten wir die Bewegungsgleichung mr̈ − mr ϕ̇2 + dV = 0. dr In diese Bewegungsgleichung können wir ϕ̇ = pϕ mr 2 einsetzen und erhalten die separate Bewegungsgleichung20 mr̈ − p2ϕ dV + =0 3 mr dr für r(t) allein. Nach ihrer Lösung kann man ϕ(t) durch Integration des Flächensatzes berechnen. Wenn wir dagegen versuchen, die Geschwindigkeit q̇1 gemäß Gl. (136) sofort in der Lagrangefunktion (134) zu eliminieren, erhalten wir aus L̂ = 20 p2ϕ m 2 (ṙ + 2 2 ) − V (r) 2 mr Nach Multiplikation mit ṙ läßt sie sich zum Energiesatz (38) integrieren. 63 die offenbar falsche Bewegungsgleichung mr̈ ⊕ p2ϕ mr 3 + dV dr = 0. Es gibt jedoch eine systematische Möglichkeit, q̇1 von vornherein zu eliminieren: Das Routhsche Verfahren. Dazu geht geht man von einer modifizierten Lagrangefunktion oder Routhfunktion R1 = L − p1 q̇1 (137) aus. R1 hängt damit — so scheint es zunächst — von dem erweiterten Variablensatz q2 , . . . qf , q̇1 , . . . q̇f , p1 , t (138) ab. Tatsächlich hängt R1 aber von der Geschwindigkeit q̇1 gar nicht mehr explizit ab, denn wir haben ∂R1 /∂ q̇1 = ∂L/∂ q̇1 − p1 = 0. Gl. (137) vermittelt also eine Transformation, welche die Variable q̇1 durch die neue Variable p1 ersetzt. Diese Konstruktion beruht nicht auf einem glücklichen Zufall sondern folgt einem systematischen Weg des Variablenwechsels: Der Legendre–Transformation. Wir erläutern das am Beispiel einer Funktion f (x, y) mit dem Differential df = u dx + v dy . Wünscht man nun die Variable x durch u = ∂f /∂x zu ersetzen, so bildet man die neue Funktion g = f − ux . Ihr Differential dg = df − u dx − x du = v dy − x du zeigt, daß g in der Tat nur von den natürlichen Variablen y und u abhängt21 . Mit der Transformation (137) wird also ein systematischer Wechsel von der Variablen q̇1 zu der neuen Variablen p1 vollzogen. Setzen wir in R1 die Geschwindigkeit q̇1 = g(. . .) nach Gl. (136) ein, so erhalten wir für k = 2, . . . , f ! ∂L ∂g ∂L ∂L ∂R1 = + − p1 = ∂qk ∂qk ∂ q̇1 ∂qk ∂qk ! ∂L ∂L ∂R1 ∂L ∂g = + − p1 = . ∂ q̇k ∂ q̇k ∂ q̇1 ∂ q̇k ∂ q̇k Damit bleibt die Form der Lagrangegleichungen (mit R1 an Stelle von L) also invariant: d ∂R1 ∂R1 d ∂L ∂L − = − = 0 (k = 2, . . . , f ) . dt ∂ q̇k ∂qk dt ∂ q̇k ∂qk 21 (139) Von solchen Transformationen wird in der Thermodynamik beim Wechsel der Variablen S und T bzw. V und p reichlich Gebrauch gemacht. 64 Wir überzeugen uns davon auch wieder an unserem Beispiel der Zentralkraft und rechnen m 2 (ṙ + r 2 ϕ̇2 ) − V (r) − pϕ ϕ̇ Rϕ = 2 ! p2 p2ϕ m 2 = ṙ + 2 2 − V (r) − ϕ2 2 mr mr 2 p m 2 = ṙ ϕ 2 − V (r) . 2 2mr Aus der modifizierten Lagrangefunktion Rϕ folgt dann gemäß Gl. (139) die korrekte Bewegungsgleichung mr̈ − p2ϕ dV + = 0. 3 mr dr Wir sind damit an einem Punkt angelegt, von dem aus es nur noch zweier kleiner, fast trivialer Schritte zu einer alternativen Formulierung der Bewegungsgleichungen bedarf: (1) Wir können diesen Variablenwechsel von q̇1 nach p1 natürlich auch dann durchführen, wenn q1 nicht zyklisch ist. Statt der Gleichung p1 = const haben wir dann die Lagrangegleichung ṗ1 = ∂R1 ∂L = . ∂q1 ∂q1 Wir benutzen also für k = 2, . . . , f die Variablen qk und q̇k und erhalten die Bewegungsgleichungen (zweiter Ordnung) d ∂R1 ∂R1 − = 0 (k = 2, . . . f ) . dt ∂ q̇k ∂qk Für k = 1 dagegen ersetzen wir q̇k durch pk und haben die beiden Bewegungsgleichungen erster Ordnung q̇1 = − ∂R1 ∂p1 und ṗ1 = ∂R1 . ∂q1 (2) Was wir mit der Geschwindigkeit q̇1 gemacht haben, können wir mit jeder anderen Geschwindigkeit q̇k , und schließlich auch mit allen Geschwindigkeiten machen. Wir definieren uns also durch die f –fache Legendretransformation R1...f (q1 , . . . qf , p1 , . . . pf , t) = L(q1 , . . . qf , q̇1 , . . . q̇f , t) − 65 f X i=1 pi q̇i eine “neue Lagrangefunktion” oder Routhfunktion R1...f , in der sämtliche Geschwindigkeiten durch Impulse ersetzt sind, und erhalten alle Bewegungsgleichungen in der Form q̇k = − ∂R1...f ∂pk und ṗk = ∂R1...f . ∂qk Die “neue Lagrangefunktion” R1...f ist gar nicht so neu für uns, durch Vergleich mit Gl. (129) erkennen wir nämlich bis aufs Vorzeichen die Hamiltonfunktion H(q1 , . . . qf , p1 , . . . pf , t) = f X i=1 pi q̇i − R(q1 , . . . qf , q̇1 , . . . q̇f , t) (140) wieder. Mit der expliziten Anschrift betonen wir zugleich, daß wir die Hamiltonfunktion als Funktion der natürlichen Variablen q1 , . . . qf , p1 , . . . pf , t auffassen wollen. Generalisierte Geschwindigkeiten dürfen also in der Hamiltonfunktion nicht mehr vorkommen! Aus dieser Hamiltonfunktion erhalten wir die Hamiltonschen Gleichungen oder kanonischen Bewegungsgleichungen22 ∂H ∂pk ∂H , = − ∂qk q̇k = (141) ṗk (142) die nicht nur durch ihr hohes Maß an Symmetrie bestechen, sondern auch die Formulierung Newtons in suggestiver Weise verallgemeinern: Der erste Satz (141) stellt den Zusammenhang zwischen (generalisierten) Impulsen und Geschwindigkeiten her, der zweite Satz (142) drückt die Impulsänderung durch (generalisierte) Kräfte und Scheinkräfte ∂H/∂qk aus. Für freie Teilchen im Kraftfeld mit Potential erhält man ja tatsächlich − ∂H ∂V =− = Fk . ∂xk ∂xk Im Vergleich mit den Lagrangegleichungen bieten die kanonischen Bewegungsgleichungen also den Vorteil einer bequemeren Elimination zyklischer Koordinaten. Davon abgesehen sind die beiden Formulierungen aber völlig äquivalent und bringen im gegenseitigen Vergleich rechnerisch (s.u.) weder Vor- noch Nachteile. Wir haben ja auch physikalisch nichts Neues eingebracht, sondern nur mathematisch umgeformt. Ein essentieller Vorteil der Hamiltonschen Formulierung wird erst zum Tragen kommen, wenn wir im 6. Kapitel ihre Symmetrie ausnutzen, 22 griech. κανων (kanon) = Richtschnur, Gesetz 66 um die grundsätzliche Unterscheidung von Koordinaten und Impulsen fallen zu lassen. Selbstverständlich lassen sich aus der Hamiltonfunktion die selben Erhaltungssätze wie aus der Lagrangefunktion ablesen, denn nach Konstruktion gilt ∂H ∂L =− ∂qk ∂qk und ∂L ∂H =− . ∂t ∂t (143) Wir können also auch sagen: Eine Koordinate qk ist zyklisch, wenn die Hamiltonfunktion H nicht explizit von qk abhängt. Aus Gl. (142) lesen wir dazu ab, daß der zu einer zyklischen Variablen qk konjugierte Impuls pk konstant ist. Entsprechend gilt, daß die Hamiltonfunktion H konstant ist, wenn sie nicht explizit von der Zeit abhängt. Rechnerisch folgt das auch sofort aus den kanonischen Gleichungen: ! X ∂H X dH ∂H ∂H − = ṗk + q̇k = (q̇k ṗk − ṗk q̇k ) = 0 . dt ∂t ∂pk ∂qk k k Praktisch geht man beim Rechnen mit den Hamiltonschen Gleichungen wie folgt vor: 1. Bilde die Lagrangefunktion L und berechne die generalisierten Impulse pk = ∂L/∂ q̇k . 2. Bilde die Hamiltonfunktion gemäß H = L2 − L0 [vgl. (132)] P i pi q̇i − L [vgl. (129)] oder H = 3. Ersetze in H gemäß 1. alle q̇k durch pk . 4. Bilde die kanonischen Gleichungen. Dabei ist zu beachten, daß der erste Satz (141) keine neue Information liefert: Er löst lediglich den aus pk = ∂L/∂ q̇k bereits bekannten Zusammenhang zwischen den pk und den q̇k nach q̇k auf. Der zweite Satz (142) liefert die eigentlichen Bewegungsgleichungen23 . Wir wollen dieses Verfahren am Beispiel des Zentralkraftproblems in der Ebene (vgl. S. 63) illustrieren: 1. Aus der Lagrangefunktion L = T − V = die generalisierten Impulse pr = 23 ∂L = mṙ ∂ ṙ und m 2 (ṙ 2 pϕ = + r 2 ϕ̇2 ) − V (r) bilden wir ∂L = mr 2 ϕ̇. ∂ ϕ̇ Diese konstruktionsbedingte Unsymmetrie wird in Kapitel 6 aufgehoben. 67 2. Aus H = L2 −L0 oder aus H = T +V berechnen wir die Hamiltonfunktion zunächst in der vorläufigen Form H= m 2 (ṙ + r 2 ϕ̇2 ) ⊕ V (r). 2 3. Wir setzen anschließend ṙ = pr /r und ϕ̇ = pϕ /(mr 2 ) ein und erhalten die endgültige Hamiltonfunktion H(r, pr , pϕ ) = p2 p2r + ϕ 2 + V (r). 2m 2mr 4. Daraus folgen die kanonischen Gleichungen ṙ = pr , m ϕ̇ = pϕ , mr 2 ṗr = p2ϕ dV − , 3 mr dr ṗϕ = 0 . Die ersten beiden Gleichungen wiederholen den bereits vorher bekannten Zusammenhang zwischen Geschwindigkeiten und Impulsen. In der zweiten Zeile finden wir die radiale Bewegungsgleichung und die Konstanz des Drehimpulses. Die formale Rechnung ist wesentlich identisch mit der im Lagrangeformalismus. Der Vorteil der kanonischen Behandlung liegt allenfalls darin, daß wir uns um die Ausnutzung der zyklischen Koordinate ϕ gar nicht zu kümmern brauchen. Um die Folgen eines häufigen Fehlers zu verdeutlichen, betrachten wir noch einmal die Bewegung eines geladenen Teilchens im elektromagnetischen Feld mit L= m 2 v − eΦ(r, t) + v · A(r, t) 2 =⇒ L2 = m 2 v , L0 = −eΦ . 2 Und so ist es falsch: Die Hamiltonfunktion H = L2 − L0 = mv 2 /2 + eΦ hängt gar nicht von A und damit vom Magnetfeld B ab. Insbesondere ist die Bewegung im konstanten Magnetfeld ohne elektrische Felder kräftefrei. Richtig ist dagegen: Wir müssen die Geschwindigkeit v durch den generalisierten Impuls p = mv + eA ersetzen und erhalten die Hamiltonfunktion H= 1 (p − eA)2 + eΦ , 2m (144) die sehr wohl vom Vektorpotential A und damit vom Magnetfeld abhängt. Ein konstantes Magnetfeld trägt zwar nicht zum Zahlenwert von H, nämlich der Energie, bei (beachte F ⊥ v!), es beeinflußt aber die Abhängigkeit der Hamiltonfunktion von ihrer natürlichen Variablen p. 68 3 3.1 Dynamik des starren Körpers Modell und Koordinaten des starren Körpers Bisher haben wir nur punktförmige Massen betrachtet. Als idealisiertes Modell für ausgedehnte Massenverteilungen führen wir nun den Begriff des starren Körpers ein. Wir verstehen darunter ein System von n Massenpunkten (meistens im Limes n → ∞) mit festen Abständen, also mit den Zwangsbedingungen |ri − rj | = dij (i, j = 1, . . . n) . (145) Die Zahl f der Freiheitsgrade des starren Körpers läßt sich offenbar nicht ermitteln, indem man die Zahl der Nebenbedingungen von 3n subtrahiert. Denn die n(n − 1)/2 Bedingungen (145) können nicht unabhängig sein. Wir ermitteln f daher, indem wir das Gerüst aus Massenpunkten schrittweise aufbauen: Der erste Massenpunkt m1 hat drei Freiheitsgrade, die wir beispielsweise durch die drei Komponenten von r1 beschreiben. Fügen wir einen zweiten Massenpunkt m2 hinzu, so ist m2 durch die Zwangsbedingung |r2 − r1 | = d12 an eine Kugeloberfläche um m1 gebunden. Der zweite Massenpunkt bringt also zwei weitere Freiheitsgrade . Als entsprechende Koordinaten können wir etwa zwei Polarkoordinaten zur Angabe der Richtung der Verbindungslinie von m1 nach m2 benutzen. Ein dritter Massenpunkt m3 außerhalb dieser Verbindungslinie kann sich wegen der beiden Zwangsbedingungen |r3 − r1 | = d13 und |r3 − r2 | = d23 nur noch auf einem Kreis bewegen. Dem entspricht ein weiterer Freiheitsgrad. Als zugehörige Koordinate können wir z.B. einen Winkel wählen, der die Rotation von m3 um die Achse durch m1 und m2 beschreibt. Bei diesen 3 + 2 + 1 = 6 Freiheitgraden bleibt es beim weiteren Aufbau, denn jeder weitere Massenpunkt ist bereits durch die Festlegung seiner Abstände zu m1 , m2 und m3 fixiert. Im Prinzip könnten wir die bei der obigen Konstruktion verwendeten sechs speziellen Koordinaten zur Beschreibung der Lage des starren Körpers benutzen. Eine solche willkürliche Wahl erscheint jedoch weder rational noch ökonomisch. Wir wollen stattdessen einen bestimmten Punkt des starren Körpers (meist, aber nicht immer, seinen Schwerpunkt) als Koordinatenursprung eines körpereigenen Koordinatensystems auszeichnen und seine Lage durch drei Koordinaten beschreiben. Die restlichen drei Koordinaten dienen zur Festlegung der Orientierung des körpereigenen Koordinatensystems. Bezeichnen wir die Achsen eines raumfesten kartesischen Koordinatensystems mit e1 , e2 und e3 , die des körperfesten Systems mit e01 , e02 und e03 , so bietet es sich 69 zunächst an, die Orientierung durch die Richtungskosinus aij = e0i · ej (i, j = 1, . . . 3) zu kennzeichnen. Mit ihrer Hilfe erhält man auch sofort die Transformationsgleichungen 3 X e0i = aij ej und ek = 3 X ajk e0j (146) j=1 j=1 zwischen den raumfesten und körpereigenen Basisvektoren. Nach dem selben Schema transformieren sich die Komponenten eines Vektors x= X xj e j = Denn aus den inneren Produkten x · e0i = X j xj e0i · ej X x0j e0j . und x · ek = X j x0j e0j · ek lesen wir ab x0i = X aij xj und xk = ajk x0j . (147) j j Die Matrix X a11 a12 a13 A = a21 a22 a23 a31 a32 a33 ist also nicht nur geeignet, die Orientierung des starren Körpers zu beschreiben, sondern sie ermöglicht auch einen bequemen Übergang vom raumfesten zum körpereigenen Koordinatensystem und umgekehrt. Allerdings eignen sich die neun Richtungskosinus nicht als generalisierte Koordinaten, denn die Orientierung entspricht nur drei Freiheitsgraden. Die Elemente der Matrix A können also nicht unabhängig sein, und in der Tat finden wir, daß sie durch die drei Orthogonalitätsrelationen e0i · e0k = X aij akj = 0 (i, k = 1, . . . 3, i 6= k) j (148) und durch die drei Normierungen 2 e0i = X a2ij = 1 j 70 (i = 1, . . . 3) (149) eingeschränkt sind. Matrizen mit diesen Einschränkungen heißen orthogonal. Unsere orthogonale Matrix A muss sich also durch drei unabhängige Parameter (generalisiete Koordinaten) darstellen lassen. Für eine solche Darstellung verwendet man gern die Eulerschen Winkel φ, θ und ψ, die wir anhand einer Skizze einführen: e3 e3’ e2’ θ φ e1 e2 ψ e1’ Knotenlinie Ausgangspunkt ist die Knotenlinie, in der sich die e1 –e2 – und die e01 –e02 –Ebene schneiden. Von der Knotenlinie aus gemessen ist e1 durch den Winkel −φ und e01 durch den Winkel ψ charakterisiert. θ ist der Winkel zwischen den beiden Ebenen und damit der Winkel zwischen der e3 – und der e03 –Achse. Der Übergang vom raumfesten Koordinatensystem (e1 , e2 , e3 ) zum körpereigenen Koordinaten (e01 , e02 , e03 ) läßt sich damit in drei Schritten vollziehen: Im ersten Schritt drehen wir das Koordinatensystem (e1 , e2 , e3 ) um den Winkel φ um die e3 –Achse, so daß ẽ1 in der Knotenlinie liegt. Diese Drehung beschreiben wir mit den Transformationsgleichungen ~ e2 ẽ1 = cos φe1 + sin φe2 ẽ2 = − sin φe1 + cos φe2 ẽ3 = e3 . e2 ~ e1 φ e1 Als nächstes kippen wir das System (ẽ1 , ẽ2 , ẽ3 ) um den Winkel θ um die Knotenlinie (ẽ1 –Achse). Für diese Drehung gilt 71 (~) e3 e^ 3 ê1 = ẽ1 ê2 = cos θẽ2 + sin θẽ3 ê3 = − sin θẽ2 + cos θẽ3 . e^ 2 Θ e~2 Im letzen Schritt drehen wir (ê1 , ê2 , ê3 ) um den Winkel ψ um die ẽ3 –Achse und erhalten damit das neue Koordinatensystem e01 e02 e03 e2’ = cos ψê1 + sin ψê2 = − sin ψê1 + cos ψê2 = ê3 . e^ 2 e1’ ϕ e1 Um die drei Schritte bequemer zu notieren, benutzen wir die Matrizenschreibweise e1 ẽ1 ẽ2 = A1 e2 e3 ẽ3 ẽ1 ê1 ê2 = A2 ẽ2 ẽ3 ê3 ê1 e01 0 e2 = A3 ê2 ê3 e03 (150) (151) (152) cos φ sin φ 0 A1 = − sin φ cos φ 0 , 0 0 1 mit 1 0 0 A2 = 0 cos θ sin θ , 0 − sin θ cos θ mit mit cos ψ sin ψ 0 A3 = − sin ψ cos ψ 0 . 0 0 1 Hierbei haben wir Basisvektoren als Zeilenvektoren24 notiert. Die Matrizenmultiplikation folgt der Regel ’Zeile × Spalte’ oder genauer: Das Element in der i–ten Zeile und k– ten Spalte der Produktmatrix C=AB ist das innere Produkt cik = X aij bjk j der i–ten Zeile von A und der k–ten Spalte von B. Mit dieser Regel der Produktbildung wird auch die (nicht kommutative!) Hintereinanderausführung der Einzeltransformationen beschrieben. Für die Gesamttransformation [vgl. Gl. (146)] 24 Das entspricht gerade der Repräsentation von Vektoren x durch ihre Koordinatenspalten xi , vgl. Gln. (146,147). 72 e1 e01 0 e2 = A e2 e3 e03 bzw. e01 e1 ∗ 0 e2 = A e2 e03 e3 (153) erhält man damit nach einiger Rechnung25 A = A 3 A2 A1 = (154) cos ψ cos φ − cos θ sin φ sin ψ cos ψ sin φ + cos θ cos φ sin ψ sin θ sin ψ − sin ψ cos φ − cos θ sin φ cos ψ − sin ψ sin φ + cos θ cos φ cos ψ sin θ cos ψ . sin θ sin φ − sin θ cos φ cos θ Die Matrix A∗ der Rück transformation erhält man für orthogonale Transformationen nach (146) einfach durch Transposition, d.h. durch Vertauschung von Zeilen und Spalten oder durch Spiegelung an der Hauptdiagonalen. Wir haben damit das prinzipielle Rüstzeug bereitgestellt, die sechs Freiheitsgrade des starren Körpers durch die drei Koordinaten x0 , y0 und z0 des Ursprungs eines körpereigenen Koordinatensystems sowie die drei Eulerschen Winkel φ θ und ψ zu beschreiben. Wegen der Komplexität werden wir diesen systematischen Weg jedoch nach Möglichkeit vermeiden. Der Vollständigkeit halber notieren wir uns abschließend lediglich noch, wie sich die Winkelgeschwindigkeit ω durch die Änderung der Eulerschen Winkel ausdrücken läßt. Wenn wir uns an die Drehachsen der drei Einzeltransformationen zurückerinnern, finden wir zunächst ω = φ̇e3 + θ̇ê1 + ψ̇e03 . Diese gemischte Darstellung möchten wir auf das körpereigene Koordinatensystem umrechnen. Dazu erinnern wir daran, daß die Rück transformation durch die transponierte Matrix beschrieben wird und lesen aus (153, 154) ab e3 = sin θ sin ψe01 + sin θ cos ψe02 + cos θe03 . Ebenso folgt aus Gl. (152) ê1 = cos ψe01 − sin ψe02 . Damit erhalten wir ω = (sin θ sin ψ φ̇ + cos ψ θ̇)e01 + (sin θ cos ψ φ̇ − sin ψ θ̇)e02 + (cos θ φ̇ + ψ̇)e03 . (155) Natürlich könnten wir ω mit dem selben Rechenaufwand auch im raumfesten System (e1 , e2 , e3 ) darstellen. Dieses spielt — obwohl es im Gegensatz zu (e01 , e02 , e03 ) ein Inertialsystem ist — bei der Behandlung des starren Körpers jedoch eine untergeordnete Rolle, da die Massenverteilung nur im körpereigenen System festliegt. 25 Beachte die Reihenfolge der Faktoren! 73 3.2 Das Eulersche Theorem Wir betrachten die Bewegung eines starren Körpers und sehen zunächst einmal von der Translation des Ursprungs des körpereigenen Koordinatensystems ab. Dann wird die Orientierung durch eine orthogonale Matrix A(t) beschrieben. Zum Zeitpunkt t = 0 falle das körpereigene mit dem raumfesten Koordinatensystem zusammen, dann gilt also 1 0 0 A(0) = 1 = 0 1 0 . 0 0 1 (156) Im vorigen Abschnitt haben wir gesehen, daß die Orientierung des Körpers zur Zeit t, die durch A(t) repräsentiert wird, durch drei Drehungen aus der Anfangslage erzeugt werden kann. Wir wollen nun untersuchen, ob hierzu auch eine einzige Drehung ausreicht. Der mathematische Formalismus zur Beantwortung dieser Frage wird uns gleichzeitig elementare Anschauung zu einem wichtigen abstrakten Kapitel der Mathematik liefern. Woran erkennt man, daß eine orthogonale Transformation A einer Drehung entspricht? Daran, daß Vektoren x, die in Richtung der Drehachse zeigen, durch die Transformation nicht geändert werden: Ax = x . Diese Gleichung stellt einen Spezialfall des Eigenwertproblems (A − λ1)x = 0 (157) dar, mit dem wir uns nun befassen müssen. Dabei bezeichnet 1 die Einheitsmatrix, λ heißt Eigenwert und x Eigenvektor der Matrix A. Trivialerweise ist mit x auch jeder gestreckte Vektor αx Eigenvektor von A. Damit aber überhaupt eine nicht triviale Lösung von Gl. (157) existiert, muß die “charakteristische Gleichung” det (A − λ1) = 0 (158) erfüllt sein. Durch eine Induktion, bei der man die Determinante nach der ersten Zeile (oder Spalte) entwickelt, weist man leicht nach, daß die charakteristische Gleichung einer n×n–Matrix auf ein Polynom n–ten Grades in λ führt. Lösungen der charakteristischen Gleichung können daher i.a. komplex sein. Solche Lösungen sind für uns natürlich nicht interessant. Im Falle ungerader n, also insbesondere in unserem Fall n = 3, besitzt jede Polynomgleichung aber mindestens eine reelle 74 Lösung λ mit einem nicht trivialen Eigenvektor x. Vektoren, die in die Richtung von x zeigen, behalten also bei einer Transformation mit A ihre Richtung bei. Nun ist es eine Besonderheit der orthogonalen Transformationen, daß sie Skalarprodukte (und damit Entfernungen) invariant lassen26 . Wir können den Beweis in prägnanter Form führen, wenn wir das Skalarprodukt als Matrizenprodukt von Zeilenvektoren27 und Spaltenvektoren auffassen und uns den trivialen Zusammenhang (AB)∗ = B∗ A∗ (159) klarmachen. Aus x0 = Ax und y0 = Ay folgt dann nämlich 0 x0 · y0 = x ∗ y0 = (Ax)∗ Ay = x∗ A∗ Ay = x∗ y = x · y . (160) Hierbei haben wir in der Form A∗ A = 1 = AA∗ (161) von unserer früheren Feststellung [vgl. Gl. (153)] Gebrauch gemacht, daß die Umkehrtransformation einer orthogonalen Transformation A durch die Matrix A∗ beschrieben wird. (Die entsprechende Gleichung X aij akj = δik j in Koeffizientenschreibweise faßt unsere Gln. (148) und (149) zusammen.) Insbesondere bleibt bei orthogonalen Transformationen also die Norm jedes Vektors erhalten: x0 · x0 = x · x . Da für einen Eigenvektor x zu dem (reellen) Eigewertλ außerdem x0 = λx gilt, folgt λ2 = 1. Für orthogonale Matrizen sind also nur die reelen Eigenwerte λ = 1 und λ = −1 möglich. Für die Ausgangsmatrix A(0) = 1 ist trivialerweise jeder Vektor Eigenvektor zum Eigenwert λ = +1. Mit den Koeefizienten der Matrix A(t) sind aber auch die Eigenwerte stetige Funktionen der Zeit. Wenn sich nun λ(t) stetig aus λ(0) = 1 entwickeln soll und überhaupt nur die Werte +1 und −1 26 Wir haben hiervon bereits in naiver Unschuld implizit Gebrauch gemacht, als wir die Zwangsbedingungen (145) aufgestellt und das körpereigene Koordinatensystem eingeführt haben! 27 Die Zeilenvektoren sind mathematisch die Elemente des Dual raums zum Vektorraum der Spaltenvektoren. 75 infrage kommen, so bleibt λ = +1 als einzige Möglichkeit über28 . Zu jeder orthogonalen Transformation, die die Orientierung eines starren Körpers beschreibt, gibt es also eine ausgezeichnete Richtung, eine Drehachse, deren Vektoren bei der Transformation invariant bleiben. Gibt es noch mehrere solche Richtungen? Wenn ja, dann muß — wie man in der linearen Algebra zeigt — λ = 1 mehrfacher Eigenwert von A sein. Nun tauchen komplexe Lösungen der charakteristischen Gleichung immer nur in konjugiert komplexen Paaren auf. Unser charakteristisches Polynom hat also genau eine oder gleich drei reelle Lösungen. Ist λ = +1 dreifacher Eigenwert, dann gibt es auch drei linear unabhängige Eigenvektoren. Da auch jede Linearkombination wieder ein Eigenvektor ist, bleibt in diesem Fall jeder Vektor invariant, d.h. wir haben die identische Transformation A = 1. Zu jeder nicht identischen orthogonalen Transformation gibt es also genau eine invariante Drehachse. Wir wollen uns das an dem Beispiel der Drehungen eines Buchs von S. 23 verdeutlichen: z z z y y e01 e02 e03 e02 = e3 = A x x x Das Endresultat e01 = e2 y e03 = e1 notieren wir in der Form e1 e2 e3 mit A = 0 1 0 0 0 1 1 0 0 . Nach S. 23 können wir A durch zwei Drehungen D1 und D2 erzeugen. [Wenn wir beachten, daß D2 im körpereigen System des Buchs formuliert werden muß, erhalten wir dafür die Matrizen 1 0 0 D1 = 0 0 1 0 −1 0 und 0 0 −1 D2 = 0 1 0 1 0 0 und überzeugen uns, daß tatsächlich D2 D1 = A gilt.] Um das selbe Resultat durch eine Drehung zu erhalten, lösen wir das Eigenwertproblem von A. Zunächst erhalten wir die charakteristische Gleichung det(A − λ1) = −λ 1 0 0 −λ 1 1 0 −λ = 1 − λ3 = 0, die — was von vornherein klar war — λ = +1 als einzigen reellen Eigenwert liefert. Der zugehörige Eigenvektor muß das Gleichungssystem 28 Daneben kann auf dem Umweg über die komplexe Ebene ein doppelter Eigenwert −1 auftreten (z.B. eine Drehung um π um die z–Achse, bei der sowohl x als auch y ihr Vorzeichen wechseln). 76 −1 1 0 x1 0 −1 1 x2 1 0 −1 x3 = −x1 + x2 −x2 + x3 x1 − x 3 = 0 0 0 erfüllen. Die Gleichungen sind natürlich nicht unabhängig, man erhält beispielsweise die dritte Gleichung durch Addition der ersten beiden. Wir wählen daher eine Komponente beliebig, z.B. x3 = 1. Daraus folgt dann x1 = x2 = 1. Wir erhalten die gewünschte Transformation also durch eine Drehung um die Achse, die in Richtung der Raumdiagonalen x = e1 + e2 + e3 zeigt. Den abstrakten mathematischen Satz formulieren wir physikalisch als das Eulersche Theorem • Die allgemeinste Auslenkung eines starren Körpers, der in einem Punkt festgehalten wird, ist eine Drehung um eine wohldefinierte Achse. Wenn wir nun noch die Bewegung des Koordinatenursprungs unseres körpereigenen Koordinatensystems hinzunehmen, ergibt sich fast selbstverständlich der Satz von Cashle • Die allgemeinste Auslenkung eines starren Körpers setzt sich aus einer Translation und einer Drehung zusammen. Wegen dieses Satzes liegt es nahe, das gesamte Bewegungsproblem des starren Körpers in die separaten Probleme der Translation und der Drehung zu zerlegen. Eine solche Zerlegung ist auch häufig, aber keineswegs immer möglich. Sie ist trivialerweise möglich, wenn ein Punkt (oder gar eine ganze Drehachse) des Körpers festgehalten wird. Man wird dann den (bzw. einen) festgehalten Punkt als Ursprung des körpereigenen Koordinatensystems benutzen und braucht nur die Drehung zu beschreiben. In diese Gruppe fallen die meisten Kreiselprobleme. Die Separation ist aber auch möglich, wenn die potentielle Energie des starren Körpers nur von seiner Lage (Beispiel: homogenes Schwerefeld) oder nur von seiner Orientierung (Beispiel: Dipol im homogenen Magnetfeld) abhängt. Denn im Abschnitt 1.9 haben wir gesehen, daß die kinetische Energie [vgl. Gl. (69)] und der Drehimpuls [vgl. Gl. (77)] in einen Schwerpunkts– und einen inneren Anteil aufgespalten werden können. In diesem Fall muß man also den Ursprung des körpereigenen Koordinatensystems in den Schwerpunkt legen. Wegen der Komplexität des Gesamtproblems werden wir uns im folgenden ausschließlich mit der Behandlung separierbarer Probleme befassen. (Selbst hierbei werden wir nur einige besonders einfache Probleme auswählen). Da die Schwerpunktsbewegung als die Bewegung eines Massenpunktes beschreibbar ist, können wir uns hierbei auf die Dynamik der Drehung beschränken. 77 3.3 Der Trägheitstensor Um die Untersuchung der Dynamik des starren Körpers vorzubereiten, berechnen wir zunächst seinen Drehimpuls. Wie erwähnt wollen wir dabei von einer möglichen Translation absehen und beziehen uns auf den Ursprung des körpereigenen Koordinatensystems. Wir lassen von nun an auch den 0 zur Kennzeichnung dieses Systems weg, da wir uns im folgenden, wenn nicht ausdrücklich etwas anderes gesagt wird, immer darauf beziehen. Unter diesen Gegebenheiten erhalten wir nach Gl. (74) den Drehimpuls l= X i mi ri × ṙi = Z P r × ṙ dm . (162) Z Das Symbol Σ soll an dieser Stelle auf die verschiedenen Modelle der Massenverteilung im starren Körper hinweisen. Wir verstehen darunter insbesondere Z P . . . dm = X (. . .)i mi (163) i bzw. = Z . . . ρdV Z . . . σdA bzw. = , . . . τ ds bzw. = Z wenn der Körper als ein System von Massenpunkten mi , durch eine räumliche Verteilung der Massendichte ρ, durch eine flächenhafte Massenverteilung σ (z.B. Blech) oder durch eine linienhafte Verteilung τ (z.B. Draht) beschrieben wird. Natürlich können solche Modelle auch kombiniert auftreten (z.B. Draht mit Perlen). Wir verzichten in Zukunft auf diese explizite Erinnerung und benutzen das Integralzeichen. Wenn wir uns nun an die Beziehung29 ṙ = ω × r [vgl. (57)] erinnern, erhalten wir aus (162) l= oder in Komponenten li = 29 Z Z r 2 ωi r × (ω × r) dm = − ri X j ωj r j Z dm = (r 2 ω − r ω · r) dm X j ωj Z (r 2 δij − ri rj ) dm . Beachte, wir rechnen im körpereigenen Koordinatensystem. Die zeitliche Ableitung ṙ = dr/dt in Gl. (162) ist aber im Intertialsystem zu bilden. 78 Mit dem Trägheistensor30 Θij = Z (r 2 δij − ri rj ) dm oder Θ = Z y 2 +z 2 −xy −xz 2 2 x +z −yz dm (164) −xy 2 2 −xz −yz x +y gilt also li = X Θij ωj oder l = Θ ω , (165) j wobei an die Regel “Zeile × Spalte” für das Matrizenprodukt erinnert sei. Wir stellen also fest, daß wir bei der Berechnung des Drehimpulses l die Massenverteilung durch die symmetrische Matrix Θ repräsentieren können. Der Drehimpuls l hat im allgemeinen nicht die selbe Richtung wie die Winkelgeschwindigkeit ω, sondern hängt mit ihr über das Matrizenprodukt Θ ω zusammen. Auch bei der Berechnung der kinetischen Energie wird die Massenverteilung durch Θ repräsentiert, es gilt nämlich 1Z 2 1Z ṙ dm = ṙ · (ω × r) dm 2 2 Z 1 1 = ω · r × ṙ dm = ω · l . 2 2 T = Mit Gl. (165) erhalten wir deshalb die einprägsame Beziehung T = 1 1 1X ω · Θ ω = ω∗Θ ω = Θij ωi ωj , 2 2 2 ij (166) die T als quadratische Form in den Komponenten von ω ausweist. Wenn eine feste Drehachse n durch den Koordinatenursprung vorgegeben ist, kann der Trägheitstensor Θ durch das Trägheitsmoment Θn um diese Drehachse ersetzt werden. Mit ω = ωn folgt nämlich T = 1 Θn ω 2 2 mit Θn = n · Θn . (167) Mit der Definition des Trägheitstensors folgt Θn = n · Z [r 2 n − (n · r)r] dm = Z [r 2 − (n · r)2 ] dm . Wenn wir im Integranden [r 2 − rk2 ] schließlich noch den Satz des Pythagoras berücksichtigen, erhalten wir die vertraute Formel 30 Ein Tensor ist mathematisch durch sein Transformationsverhalten definiert. Wir verstehen darunter einfach eine Matrix. 79 Θn = Z 2 r⊥ dm , (168) die das Trägheitsmoment durch den senkrechten Abstand r⊥ der Massen von der Drehachse ausdrückt. Dieser Ausdruck ergibt sich auch aus der elementaren Anschauung über vrot = ωr⊥ . Fällt die Drehachse speziell mit einer Koordinatenachse zusammen (n = ei ), finden wir das zugehörige Trägheitsmoment Θn = Θii in der Hauptdiagonalen des Trägheitstensors. Die Elemente Θi6=j außerhalb der Hauptdiagonalen werden auch Fliehkraft– oder Deviationsmomente genannt. Sie erzeugen bei einer gleichmäßigen Rotation Drehmomente in den Lagern. Häufig ist es wünschenswert, einen Koordinatenursprung r0 außerhalb der Drehachse zu wählen. Ausgehend von der Drehachse schreiben wir dann r⊥ = r0⊥ + r0⊥ und erhalten Θ = 2 r0⊥ Z dm + 2r0⊥ · 2 = M r0⊥ + 2r0⊥ · Z Z r0⊥ dm + Z 0 r⊥2 dm r0⊥ dm + Θ0 . Links steht die gesamte Masse des Körpers multipliziert mit dem Quadrat des Abstandes des Koordinatenursprungs r0 von der Drehachse und rechts das Trägheitsmoment um eine parallele Drehachse durch den Koordinatenursprung. Im allgemeinen verhindert jedoch der Term in der Mitte eine einfache Transformationsformel. Wenn jedoch der Schwerpunkt rS als Koordinatenursprung r0 gewählt wird, verschwindet das Integral im mittleren Term und wir erhalten den Satz von Steiner 2 Θ = ΘS + M rS⊥ , (169) in Worten: • Das Trägheitsmoment um eine gegebene Achse ist gleich dem Trägheitsmoment um eine parallele Achse durch den Schwerpunkt plus dem Produkt aus der Gesamtmasse und dem Quadrat des Abstands des Schwerpunkts von der Drehachse. 80 Da der Schwerpunkt häufig auch durch eine Symmetrie desKörpers ausgezeichnet ist, bietet der Steinersche Satz eine nützliche Rechenhilfe zur Bestimmung von Tägheitsmomenten. Als weitere Rechenhilfe notieren wir für eine ebene Massenverteilung in der x–y–Ebene die Beziehungen Θzz = Θxx + Θyy und Θxz = Θyz = 0, (170) welche direkt aus Gl. (165) folgen. Beispiel: Wir betrachten ein physikalisches Pendel, also einen starren Körper, der sich frei um eine gegebene Achse drehen kann. Θ sei das Trägheitsmoment um diese Achse und a der Abstand des Schwerpunkts von der Drehachse. Mit der generalisierten Winkelkoordinate ϕ erhalten wir dann dieLagrangefunktion 1 L = T − V = Θϕ̇2 + M ga cos ϕ 2 und die Bewegungsgleichung Θϕ̈ + M ga sin ϕ = 0 . Das entspricht der Gleichung für das mathematische Pendel (vgl. S. 45) mit einer effektiven Pendellänge Θ `eff = . Ma Nach dem Steinerschen Satz können wir Θ gemäß Θ = ΘS + M a2 aus dem Trägheitsmoment ΘS um eine parallele Drehachse durch den Schwerpunkt berechnen. Die effektive Pendellänge `eff = a + ΘS Ma ist daher immer größer als der Abstand a des Schwerpunkts vom Aufhängepunkt. Hierin zeigt sich der Beitrag der Rotation des starren Körpers um den Schwerpunkt zur gesamten kinetischen Energie. Als spezielles Beispiel für die Massenverteilung wählen wir eine homogene Kreisscheibe vom Radius R um den Koordinatenursprung in der x–y–Ebene. Dann wird ZR Z R4 2 2 Θzz = (x + y ) dm = σ r 2 2πr dr = 2πσ , 4 0 2 oder wegen σ = M/(πR ) 1 Θzz = M R2 . 2 81 Mit der Symmetrie und Gl. (170) folgt daraus sofort der gesamte Trägheitstensor 1 0 0 Mr Θ= 0 1 0 . 4 0 0 2 2 Für eine Drehung um die z–Achse durch den Schwerpunkt haben wir das Trägheitsmoment ΘS = Θzz = M R2 /2. Legen wir parallel dazu eine senkrechte Drehachse durch die Peripherie (a = R), so bildet die Kreisscheibe ein physikalisches Pendel mit der effektiven Pendellänge 3 `eff = R . 2 Wählt man dagegen eine tangentiale Drehachse in der Peripherie, so müssen wir von ΘS = Θxx = M R2 /4 ausgehen und erhalten 5 `eff = R . 4 3.4 Trägheitshauptachsen Über den Drehimpuls und die kinetische Energie ist das dynamische Verhalten des starren Körpers wesentlich durch seinen Trägheitstensor bestimmt. Für eine einfache Formulierung der Dynamik stören hierbei die Nicht–Diagonal–Elemente. Darum fragen wir nach einem speziellen körpereigenen Koordinatensystem, dem Hauptachsensystem, in dem der Trägheitstensor die Diagonalgestalt I1 0 0 Θ = 0 I2 0 0 0 I3 (171) annimt. Im Hauptachsensystem gelten für den Drehimpuls und die kinetische Energie die einfachen Beziehungen li = I i ω i bzw. l = X I i ωi e i (172) i und T = 1X Ii ωi2 . 2 i (173) Gibt es nun immer so ein schönes Hauptachsensystem? Und wenn ja: Wie finde ich es? Zur Beantwortung dieser Frage gehen wir von der Beziehung (172) für den Drehimpuls aus. 82 Wenn es eine Hauptachse e gibt, so gilt bei einer Rotation ω = ωe um diese Hauptachse l = Iω , l und ω haben also dieselbe Richtung. Vergleichen wir das mit der allgemeinen Beziehung l = Θω, so sehen wir uns mit dem Eigenwertproblem (Θ − I1)ω = 0 (174) konfrontiert. Wir müssen insbesondere die Frage beantworten, ob wir drei reelle Eigenwerte I1 , I2 , I3 und zugehörige linear unabhängige Eigenvektoren finden. Die Frage nach reellen Lösungen ist im allgemeinen im Reellen viel schwieriger zu beantworten, als wenn man das Problem in eine komplexe Theorie einbettet. Wir verallgemeinern darum den Begriff der transponierten Matrix zum Begriff der adjungierten Matrix, die neben der Spiegelung an der Hauptdiagonalen durch einen Übergang zu konjugiert komplexen Koeffizienten gekennzeichnet ist: (. . . aij . . .)∗ = (. . . a∗ji . . .) . Über einspaltige Matrizen übertragen wir die Begriffsbildung auf Vektoren: Der zu einem komplexen Spaltenvektor a adjungierte Vektor a∗ ist also ein Zeilenvektor mit konjugiert komplexen Koeffizienten. Das im Sinne der Matrizenmultiplikation erklärte Skalarprodukt a · b = a∗ b = α b · a = b∗ a = α ∗ liefert eine komplexe Zahl und ist nicht mehr kommutativ. Reell ist dagegen das Skalarprodukt x · x = x∗ x = |x|2 , das man benutzen kann, um dem Vektor x eine Norm oder Länge zuzuordnen. Nach diesen Erklärungen sehen wir uns den Trägheitstensor an und stellen fest, daß er reell und symmetrisch ist. Er ist also sowohl gegen die Spiegelung an der Hauptdiagonalen als auch gegen die komplexe Konjugierung invariant und erfüllt die Relation Θ∗ = Θ . Matrizen (auch mit komplexen Koeffizienten), die diese Relation erfüllen, heißen selbstadjungiert. Mathematisch handelt es sich bei unserer Fragestellung also um das Eigenwertproblem selbstadjungierter Matrizen A. Um das zu untersuchen, gehen wir von der Eigenwertbeziehung Axi = λi xi 83 aus und multiplizieren von links mit dem Eigenvektor x∗k : x∗k Axi = λi x∗k xi . Nun nutzen wir die Voraussetzung, daß A selbstadjungiert ist, zur Umformung der linken Seite aus und erhalten x∗k Axi = (A∗ xk )∗ xi = (Axk )∗ xi = (λk xk )∗ xi = λ∗k x∗k xi . Durch Vergleich finden wir die Relation (λ∗k − λi )x∗k xi = 0 , aus der wir (für i = k bzw. i 6= k) zwei wichtige Folgerungen ablesen: 1. Alle Eigenwerte selbstadjungierter Matrizen sind reell. 2. Die Eigenvektoren zu verschieden Eigenwerten selbstadjungierter Matrizen sind orthogonal. Für eine beliebige n × n – Matrix A hat die charakteristische Gleichung [vgl. Gl. (158)]S det(A − λ1) = 0 , als Polynomgleichung n–ten Grades grundsätzlich n (möglicherweise komplexe) Lösungen λi . Bei einer selbstadjungierten Matrix sind diese n Eigenwerte sämtlich reell. Sind alle Eigenwerte zudem verschieden, so stehen die Eigenvektoren automatisch senkrecht aufeinander und definieren in natürlicher Weise ein Hauptachsensystem. Im Falle mehrfacher Eigenwerte spricht man von Entartung. Man kann nun zeigen (was anschaulich durch einen stetigen Übergang von verschiedenen zu gleichen Eigenwerten klar ist), daß die Eigenvektoren zu einem ν–fach entarteten Eigenwert einen ν–dimensionalen Unterraum aufspannen. Aus einer Basis dieses Unterraums lassen sich dann durch ein geeignetes Orthogonalisierungsverfahren stets ν orthogonale Eigenvektoren bilden. Wir können also sicher sein, daß wir zu unserem Satz von n Eigenwerten immer n orthogonale Eigenvektoren angeben können, die unser Hauptachsensystem aufspannen. Unser Ausgangsproblem, ein Hauptachsensystem zu finden, in dem der Trägheitstensor Diagonalgestalt annimmt, besitzt also immer eine Lösung, die sich nach dem folgenden Rezept gewinnen läßt: 1. Benutze ein beliebiges rechnerisch günstiges (z.B. Symmetrie) körpereigenes Koordinatensystem zur Bestimmung des Trägheitstensors Θ nach Gl. (164). 84 2. Bilde die charakteristische Gleichung Θ11 −I Θ12 Θ13 Θ12 Θ22 −I Θ23 det(Θ − I1) = Θ13 Θ23 Θ33 −I = 0. (175) Die drei (reellen) Lösungen (Eigenwerte) I1 , I2 und I3 dieser Gleichung sind die Hauptträgheitsmomente. 3. Bestimme aus den 3 Gleichungsystemen (ν = 1, 2, 3) Θ11 −Iν Θ12 Θ13 Θ Θ −I Θ23 (Θ − Iν 1)eν = eν = 0 12 22 ν Θ13 Θ23 Θ33 −Iν (176) drei Eigenvektoren eν . Wegen der verschwindenden Determinante sind die Lösungen nicht eindeutig und können durch eine Zusatzforderung (z.B. Normierung) festgelegt werden. Wenn alle Hauptträgheitsmomente verschieden sind, sind die eν automatisch orthogonal und können (ggf. nach einer Umnumerierung) als Basis des Hauptachsensystems benutzt werden. Sind zwei Hauptträgheitsmomente gleich, kann man aus der Lösungsmenge von (176) zwei zugehörige orthogonale Eigenvektoren auswählen. [Sind alle drei Eigenwerte gleich, so ist jedes orthogonale Koordinatensystem ein Hauptachsensystem.] Wir behandeln als Beispiel einen Drahthaken in der x–y–Ebene (siehe Skizze) mit der homogen Massebelegung τ = M/(4a). 1. Wir bleiben im Koordinatensystem x, y, z und finden durch einfache Rechnungen und/oder Symmetrieüberlegungen Θyy = τ Za −a 2 2 x2 dx = τ a3 = M a2 3 12 85 Θxx = Θyy + Θxy = −2τ Za 0 8 M 2 a = M a2 2 12 ax dx = −τ a3 = − 3 M a2 . 12 Aus Gl. (170) lesen wir außerdem 10 M a2 und Θxz = Θyz = 0 12 ab. Damit erhalten wir den Trägheitstensor Θzz = Θxx + Θyy = 8 −3 0 1 2 Θ = M a −3 2 0 . 12 0 0 10 2. Mit I = λM a2 /12 folgt daraus die charakteristische Gleichung 8 − λ −3 0 −3 2 − λ 0 0 0 10 − λ = [(8 − λ)(2 − λ) − 9](10 − λ) = 0 . Aus der Gleichung [. . .] = λ2 − 10λ + 7 = 0 finden wir √ √ λ1 = 5 − 3 2 und λ2 = 5 + 3 2 , und (. . .) = 0 ergibt sofort λ3 = 10. Damit haben wir die Hauptträgheitsmomente Iν = λν M a2 /12 ermittelt. 3. Da alle Eigenwerte verschieden sind, erhalten wir aus den Gleichungen eν1 8 − λν −3 0 2 − λν 0 eν2 = 0 −3 eν3 0 0 10 − λν automatisch drei orthogonale Eigenvektoren eν . Zu λ3 = 10 liest man unmittelbar e3 = (0, 0, 1) ab, die alte z–Achse ist also bereits Hauptachse. Für ν = 1 und 2 folgt sofort eν3 = 0, diese Eigenvektoren liegen also in der x–y–Ebene. Die beiden Gleichungen (8 − λν )eν1 − 3eν2 = 0 −3eν1 + (2 − λν )eν2 = 0 sind nicht linear unabhängig. Wir benutzen daher nur die erste und erhalten die Achsenneigungen eν2 8 − λν = tan αν = eν1 3 oder √ √ α1 = atn(1 + 2) = 67.5o und α2 = atn(1 − 2) = 157.5o . Die Hauptachsen mit diesen Richtungen sind in der Skizze bereits eingezeichnet. 86 3.5 Trägheitsellipsoid und Poinsotsche Konstruktion Die Eigenwerte des Trägheitstensors sind nicht nur reell, sondern sogar positiv, wie man an der Hauptachsenform (173) T = 1X Ii ωi2 2 i der kinetischen Energie erkennt. Die Fäche T = const beschreibt also ein Ellipsoid im ω–Raum31 . Das selbe Ellipsoid wird natürlich auch durch die (positiv definite!) quadratische Form [vgl. (166)] T = 1X Θij ωi ωj 2 i,j (177) in anderen Koordinatensystemen beschrieben. Die Ellipsoide zu verschiedenen Werten von T sind einander ähnlich, und es ist üblich (aber nicht notwendig), das normierte Ellipsoid (setze etwa w = ω/(2T )1/2 ) w · Θw = X Θij wi wj = 1 (178) i,j als Trägheitsellipsoid zu bezeichnen. Speziell im Hauptachsensystem erfüllt das Trägheitsellipsoid die Gleichung X ν Iν wν2 = 1 . (179) Die Halbachsen aν des Trägheitsellipsoids sind also durch 1 aν = √ Iν (180) gegeben; eine große Halbachse entspricht einem kleinen Hauptträgheitsmoment und umgekehrt. Allgemeiner folgt durch Vergleich der Gln. (167) und (178), daß der Abstand |w| = √ 1 Θw (181) eines Punkts w auf dem Trägheitsellipsoid vom Ursprung das Trägheitsmoment Θw um die durch w angebene Drehachse charakterisiert. 31 Nur wenn die Massenverteilung ausschließlich auf eine Gerade beschränkt ist, wird ein Eigenwert Null, und das Ellipsoid entartet zu einem Kreiszylinder. 87 Durch einen Vergleich der Symmetrie eines Ellipsoids mit Symmetrien des starren Körpers folgt, daß die Entartung des Eigenwertproblems des Tägheitstensors kein seltener Ausnahmefall ist. Vielmehr entartet das Trägheitsellipsoid offenbar immer zum Rotationsellipsoid, wenn der Körper invariant gegen eine Drehung um 2π/n mit n ≥ 3 um eine Symmetrieachse ist. Die Symmetrieachse wird dann selbst Hauptachse32 , und die beiden andern Hauptachsen können in der Ebene senkrecht dazu beliebig gewählt werden. Gibt es eine weitere entsprechende Symmetrieachse, so entartet das Trägheitellipsoid sogar zur Kugel. In dem Fall ist jedes beliebige Orthogonalsystem Hauptachsensystem. Wir illustrieren das an einigen Beispielen: Gls. Dreieck Vierkantstab Würfel Tetraeder Zugehöriges Trägheitsellipsoid (schematisch): Wir verzichten im folgenden auf die (triviale) Normierung und bezeichnen die Fläche T = const im ω–Raum als Trägheitsellipsoid. Wegen der fundamentalen Bedeutung des Drehimpulses bilden wir nach Gl. (177) li = X Θij ωj = j ∂T ∂ωi oder l = ∇ω T . (182) Der Gradient ∇ω T steht senkrecht auf der Fläche T = const, denn für alle dω aus der Tangentialebene gilt ja dT = ∇ω T · dω = 0 . Daraus folgt, daß der Drehimpulsvektor in die Richtung der Oberflächennormalen des Trägheitsellipsoids zeigt. Wir können also die Drehimpulsrichtung zu einer 32 Das gilt bereits für n = 2. Dabei liegt aber noch keine Entartung vor. 88 gegebenen Drehachse (ω) finden, indem wir im Punkt ω auf dem Trägheitsellipsoid die Flächennormale errichten (siehe Skizze). Diese geometrische Bestimmung heißt Poinsotsche Konstruktion. l ω [Wir wenden die Poinsotsche Konstruktion auf die Bewegung des kräftefreien Kreisels an. Darunter verstehen wir einen starren Körper, der in einem Punkt festgehalten wird, und auf den keine Kräfte wirken. Wegen V = 0 haben wir die Integrale T = const und l = const . Wir wählen die l–Richtung als raumfeste z–Achse. Dann ist ωz = 2T ω·l = |l| |l| offenbar ebenfalls konstant. Der Bewegung des Kreisels entspricht eine Drehung des Trägheitsellipsoids um den Ursprung. Diese Drehung erfolgt also so, daß das Trägheitsellipsoid in jedem Zeitpunkt die “invariable Ebene” ωz = const berührt: T=const ω ωz ωz =const z,l Bei der Bewegung wandert der Berührungspunkt weiter und beschreibt (a) auf dem Ellipsoid (also im körperfesten Koordinatensystem) die “Polhodie” und (b) auf der invariablen Ebene (also im raumfesten Koordinatensystem) die “Herpolhodie”. 89 Die beiden Wanderungen erfolgen mit der selben Geschwindigkeit, denn wegen ω × ω = 0 gilt ! ! dω dω = . dt Körper dt Raum Damit läßt sich die Bewegung des kräftefreien Kreisels wie folgt charakterisieren: • Das Trägheitsellipsoid rollt bei festgehaltenem Mittelpunkt ohne zu gleiten über die invariable Ebene. Die momentane Winkelgeschwindigkeit ist dabei durch den Abstand des Berührungspunktes vom Mittelpunkt gegeben. Mit dieser geometrischen Beschreibung ist die Bewegung des kräftefreien Kreisels vollständig beschreiben. Die analytische Formulierung (die wir nicht mehr anstreben) ist jedoch recht verwickelt und führt auf elliptische Integrale. Beim symmetrischen Kreisel entartet das Trägheitsellipsoid zum Rotationsellipsoid und Polhodie sowie Herpolhodie werden einfache Kreise. Vom Körper aus betrachtet beschreiben daher die Vektoren ω und l Kegel um die Figurenachse. Diese Bewegung wird Nutation (lat. nutare = nicken, wanken) oder auch reguläre Präzession33 genannt. Im raumfesten System bewegen sich ω und die Figurenachse auf Kegeln um den konstanten Drehimpuls l.] 3.6 Die Eulerschen Kreiselgleichungen Wir hatten im Abschnitt 3.1 gesehen, daß die Eulerschen Winkel geeignete generalisierte Koordinaten zur Beschreibung der Drehung des starren Körpers sind. Wegen der recht komplexen Transformationsgleichungen ist es jedoch häufig günstiger, direkt von der Grundgleichung d l=M dt (183) auszugehen, als denLagrangeschen Formalismus auf dieEulerschen Winkel anzuwenden. Gl. (183) bezieht sich natürlich zunächst auf ein raumfestes Koordinatensystem. Den Trägheitstensor — und damit den Zusammenhang zwischen ω und l — können wir jedoch nur in einem körpereigenen Koordinatensystem angeben. Wir benutzen also die Beziehungen d = dt d dt ! Körper +ω× und 33 dl dt ! = Θ ω̇ , Körper Um die Begriffe Nutation und Präzession herrscht eine bedauerliche Sprachverwirrung. Man muß alt/neu, deutsch/amerikanisch und physikalisch/astronomisch unterscheiden. Vgl. auch Fußnote 39, S. 97. 90 um Gl. (183) ins körpereigene System zu transformieren und erhalten Θ ω̇ + ω × Θ ω = M . Die komponentenweise Anschrift dieser Gleichung wird wesentlich vereinfacht, wenn wir das Koordinatensystem der Trägheitshauptachsen benutzen: I1 ω̇1 ω1 I 1 ω1 I ω̇ ω + × 2 2 2 I 2 ω2 = M . I3 ω̇3 ω3 I 3 ω3 Wenn wir schließlich das Kreuzprodukt noch explizit ausmultiplizieren, erhalten wir die Eulerschen Kreiselgleichungen I1 ω̇1 + (I3 − I2 )ω2 ω3 = M1 I2 ω̇2 + (I1 − I3 )ω1 ω3 = M2 I3 ω̇3 + (I2 − I1 )ω1 ω2 = M3 . (184) Wir weisen nochmals darauf hin, daß sich diese Gleichungen auf das körpereigene Hauptachsensystem bezieht. Eine dieser Gleichungen — mit unserer speziellen Festlegung der Koordinaten die dritte — erhält man auch als Lagrangegleichung zum Eulerschen Winkel ψ. Die beiden andern folgen dann durch zyklische Vertauschung der Indizes. [Um das zu zeigen, bilden wir die kinetische Energie 1 1 1 T = I1 ω12 + I2 ω22 + I3 ω32 2 2 2 und setzen die Komponenten ω1 = sin θ sin ψ φ̇ + cos ψ θ̇ ω2 = sin θ cos ψ φ̇ − sin ψ θ̇ ω3 = cos θ φ̇ + ψ̇ aus Gl. (155) ein: T = I2 I3 I1 (sin θ sin ψ φ̇+cos ψ θ̇)2 + (sin θ cos ψ φ̇−sin ψ θ̇)2 + (cos θ φ̇+ ψ̇)2 . (185) 2 2 2 Wenn wir damit die Lagrangegleichung ∂T ∂V d ∂T − =− dt ∂ ψ̇ ∂ψ ∂ψ 91 bilden, erhalten wir I3 ω̇3 − I1 ω1 ω2 + I2 ω2 ω1 = − ∂V . ∂ψ Damit bleibt nur noch zu bestätigen, daß −∂V /∂ψ die Komponente M3 des Drehmoments im körpereigenen Koordinatensystem ist. Das folgt aber aus der Figur auf S. 71, da ψ die Drehung um die körpereigene z–Achse beschreibt.] 3.7 Die kräftefreie Bewegung des starren Körpers Wir erinnern daran, daß wir annehmen, daß ein Punkt des Körpers festgehalten wird, oder daß wir die Schwerpunktsbewegung als uninteressant abspalten. Die verbleibende Drehung des kräftefrein Kreisels wird durch die Eulerschen Gleichungen I1 ω̇1 = (I2 − I3 )ω2 ω3 I2 ω̇2 = (I3 − I1 )ω1 ω3 I3 ω̇3 = (I1 − I2 )ω1 ω2 . (186) beschrieben. Die resultierende Bewegung haben wir im Abschnitt 3.5 mit der Poinsotschen Konstruktion bereits geometrisch beschrieben. Die analytische Beschreibung ist wegen der Nichtlinearität der Eulerschen Gleichungen im allgemeinen schwierig34 . Wir werden uns daher auf zwei einfache Spezialfälle beschränken, bei denen dieEulerschen Gleichungen linear werden. 1. Stabile Drehachsen des starren Körpers Wenn alle Hauptträgheitsmomente verschieden sind, ist eine gleichförmige kräftefreie Rotation ω = const des Kreisels nach Gl.(186) nur um die Hauptträgheitsachsen möglich. Wir nehmen an, daß der Körper um die z–Achse rotiert und fragen nach der Stabilität dieser Rotation. Dazu betrachten wir kleine Abweichungen ω1 , ω2 von der ausgezeichneten Rotationsrichtung. Damit meinen wir, daß wir quadratische Terme (ω12 , ω22 und hier insbesondere ω1 ω2 ) vernachlässigen können. Dadurch werden dieEulerschen Gleichungen linearisiert. Aus der letzten Gl. (186) folgt sofort die gleichförmige Rotation ω3 = const. Daher erhalten wir aus den ersten beiden Gleichungen ω̇1 = −Ω1 ω2 mit Ω1 = 34 I3 − I 2 ω3 , I1 Die Lösung läßt sich zwar generell auf Quadraturen zurückführen, führt jedoch auf nicht– elementare (elliptische) Funktionen. 92 I3 − I 1 ω3 . I2 Wenn wir eine dieser Gleichungen noch einmal nach t differenzieren und die andere einsetzen, folgt ω̈1,2 = −Ω1 Ω2 ω1,2 . ω̇2 = Ω2 ω1 mit Ω2 = Diese Gleichung entspricht einer Schwingungsgleichung ω̈1,2 + Ω2 ω1,2 = 0 mit Ω2 = Ω1 Ω2 , falls Ω1 und Ω2 das selbe Vorzeichen haben. Diese Vorraussetzung ist erfüllt, wenn I3 das größte oder das kleinste Hauptträgheitsmoment ist. In diesem Fall reagiert der Kreisel also auf eine kleine Störung mit kleinen Schwingungen um die Drehachse: • Eine Rotation um die Drehachse mit dem größten oder kleinsten Hauptträgheitsmoment ist stabil. Ist I3 dagegen das mittlere Hauptträgheitsmoment, so ist Ω1 Ω2 < 0, und wir erhalten exponentiell wachsende Störungen ω1,2 ∼ exp(|Ω1 Ω2 |1/2 t) : • Eine Rotation um die Hauptachse mit dem mittleren Hauptträgheitsmoment ist labil. 2. Der kräftefreie symmetrische Kreisel Beim symmetrischen Kreisel werden zwei Hauptträgheitsmomente, etwa I1 und I2 , gleich. Damit folgt aus der dritten Gl. (186) ω3 = const , d.h. die Projektion der Winkelgeschwindigkeit auf die Symmetrieachse ist konstant. Da ω3 nun eine Integrationskonstante darstellt, werden auch die beiden übrigenEulerschen Gleichungen linear: ω̇1 = −Ωω2 ω̇2 = Ωω1 mit Ω= I3 − I 1 ω3 . I1 Die allgemeinen Lösungen dieser Gleichungen sind Kreise ω1 = ω⊥ cos[Ω(t − t0 )] ω2 = ω⊥ sin[Ω(t − t0 )] , 93 (187) wie man z.B. durch direktes Einsetzen erkennt35 . Die Spitze des Vektors ω durchläuft also mit der Nutationsfrequenz Ω einen Kreis um die Figurenachse, die Polhodie (vgl. S. 89). Mit der selben Frequenz rotiert auch der (raumfeste!) Drehimpuls (im körpereigenen System!) um die Figurenachse. Die Nutation ist je nach dem Vorzeichen von I3 − I1 vor – oder rück läufig. Sie verschwindet, wenn (außer I2 auch noch) I3 = I1 wird, wenn also das Trägheitsellipsoid zur Kugel entartet. Für Kugel kreisel ist daher eine gleichförmige Rotation um jede Achse möglich, wie man auch sofort an Gl. (186) erkennt. Dies gilt angenähert auch für die rotierende Erde. Die Abplattung führt jedoch zu einer kleinen Abweichung I3 − I 1 1 ≈ , I1 300 die einer Nutationsfrequenz 2π 300 Tage entspricht. Tatsächlich findet man bei der Erdrotation Polschwankungen einer Amplitude von rund 5 Metern. Der Pol wandert jedoch nicht auf einem Kreis sondern beschreibt eine eher irreguläre Kurve. Und statt der erwarteten Nutationsperiode von 300 Tagen = 10 Monaten beobachtet man eine gewisse Periodizität mit der Chandlerschen Periode von etwa 14 Monaten. Die Abweichungen werden auf die Deformierbarkeit des Erdkörpers und auf größere Massenbewegungen zurückgeführt. Ω= Die Nutationsfrequenz (187) bezieht sich wohlgemerkt auf die Beobachtung im körpereigenen Koordinatensystem, das selbst rotiert. Eine Übersetzung ins raumfeste Koordinatensystem, in dem ω und die Figurenachse um den konstanten Drehimpuls l rotieren (vgl. Abschnitt 3.5), ist wegen der verschiedenen Achsrichtungen etwas unübersichtlich. Fällt die Symmetrieachse annähernd mit der Drehimpulsrichtung zusammen (ω ≈ ω3 ), sieht ein raumfester Beobachter die Nutationsfrequenz I3 ωN ≈ ω + Ω ≈ ω . (188) I1 (Eine exakte Beschreibung folgt im nächsten Abschnitt.) 3.8 Der Lagrangeformalismus für den Kreisel Wegen der Komplexität des Problems beschränken wir uns von vornherein auf den symmetrischen Kreisel mit I1 = I2 , denn die Symmetrie bewirkt erhebliche 35 Systematisch findet man das am einfachsten über die DGL für w = ω1 + iω2 . Eine andere Möglichkeit beruht auf dem Nachdifferenzieren, vgl. vorige Seite und Abschnitt 1.7. 94 Vereinfachungen. Zunächst lassen sich in den ersten beiden Termen der kinetischen Energie (185) die Beiträge mit sin ψ und cos ψ entweder zusammenfassen (Pythagoras) oder sie verschwinden: 1 1 T = I1 (sin2 θ φ̇2 + θ̇ 2 ) + I3 (cos θ φ̇ + ψ̇)2 . 2 2 Bei den Kräften, die auf den Kreisel einwirken, beschränken wir uns auf ein homogenes Schwerefeld. Auch hier erhalten wir eine wesentliche Vereinfachung durch die Symmetrie, da der Schwerpunkt auf der Symmetrieachse liegt: Das zugehörige Potential36 V = V0 cos θ mit V0 = mgzS hängt nur vom Winkel θ zwischen der raumfesten und der körpereigenen z–Achse ab. Die Symmetrievoraussetzung hat nicht nur die Anschrift 1 1 L = T − V = I1 (sin2 θ φ̇2 + θ̇ 2 ) + I3 (cos θ φ̇ + ψ̇)2 − V0 cos θ 2 2 (189) derLagrangefunktion vereinfacht, ihr ist auch zu verdanken, daß neben der Koordinate φ auch noch ψ zyklisch geworden ist. Wir lesen aus (189) daher die beiden Erhaltungsgrößen pψ = I3 (cos θ φ̇ + ψ̇) und pφ = I1 sin2 θ φ̇ + pψ cos θ (190) (191) ab. pψ und pφ sind (nicht orthogonale) Komponenten des Drehimpulses. Die Komponente [vgl. (155)] p ψ = I 3 ω3 (192) in Richtung der körpereigenen z–Achse ist konstant, da der Kraftarm der Gewichtskraft in diese Richtung weist und folglich das entsprechende Moment verschwindet. Ebenso ist die Drehimpulskomponete pφ in Richtung der raumfesten z–Achse konstant, denn die Kraft selbst zeigt in diese Richtung, und daher verschwindet das entsprechende Moment. Während also die Existenz der Erhaltungsgrößen (190) und (191) auch aus der physikalischen Anschauung nachvollziehbar ist, wird die explizite Formulierung durch denLagrangeformalismus zumindest wesentlich erleichtert. 36 Die selbe Abhängigkeit (mit V0 = µB) ergibt sich auch für einen Kreisel mit konstantem Dipolmoment µ im homogenen Magnetfeld B. 95 Die Zahlenwerte von pφ und pψ ergeben sich aus den Anfangsbedingungen. Damit lassen sich φ(t) und ψ(t) durch Integration von (190) und (191) gewinnen, wenn θ(t) bekannt ist. θ(t) läßt sich aus der Lagrangegleichung I1 θ̈ − I1 sin θ cos θ φ̇2 + pψ sin θ φ̇ − V0 sin θ = 0 (193) bestimmen, wenn man φ̇ mit Gl. (191) eliminiert. Damit läßt sich die Lösung im Prinzip auf Quadraturen zurückführen. Dieser systematische Weg ist jedoch ziemlich aufwendig und wenig instruktiv. Wir wollen daher versuchen, die Charakteristika der Bewegung mit geringerem Aufwand zu erkennen. Dazu unterscheiden wir noch einmal den kräftefreien und den schweren Kreisel. 1. Der kräftefreie symmetrische Kreisel Hier haben wir V0 =0, und im raumfesten Koordinatensystem ist keine Richtung mehr a priori ausgezeichnet. Da der Drehimpuls nun konstant wird, ist es günstig, die raumfeste z–Achse in seine Richtung zu legen. Damit gilt pφ = j und pψ = j cos θ , (194) (195) wenn j den Betrag des Drehimpulses bezeichnet. Bei der Bewegung bleibt also auch der Winkel θ zwischen Figurenachse und Drehimpuls konstant: Die Figurenachse bewegt sich auf dem Mantel des Nutationskegels (vgl. Abschnitt 3.5, S. 90). Setzen wir (194) und (195) in (191) ein37 , so erhalten wir j = I1 sin2 θ φ̇ + j cos2 θ oder φ̇ = ωN = j . I1 (196) Die Knotenlinie — und damit auch die Figurenachse — läuft also mit konstanter Winkelgeschwindigkeit φ̇ um die Drehimpulsrichtung. Damit haben wir Gl. (188) präzisiert und die Nutation im raumfesten System exakt beschrieben. Zusätzlich rotiert der der Körper mit der Winkelgeschwindigkeit ψ̇ um seine Figurenachse. Für diese Rotation erhalten wir aus Gl. (190) I3 ψ̇ = pψ − I3 cos θ φ̇ , oder mit (195) und (196) 37 Das selbe Ergebnis folgt mit θ = const 6= 0 auch aus den Gln. (193) und (191). 96 ψ̇ = 1 1 − j cos θ . I3 I1 (197) Die gesamte momentane Winkelgeschwindigkeit ω = ψ̇e3 + φ̇el setzt sich additiv aus den beiden Rotationen mit ψ̇ und φ̇ zusammen und liegt in der Ebene, die von der Figurenachse e3 und dem Drehimpuls l aufgespannt wird. ω läuft also ebenfalls mit der konstanten Winkelgeschwindigkeit φ̇ auf einem Kegelmantel um den konstanten Drehimpuls. 2. Der schwere symmetrische Kreisel Im Gegensatz zum kräftefreien Kreisel ist nun der gesamte Drehimpuls l nicht mehr konstant38 , und die z–Richtung des raumfesten Systems ist durch das Schwerefeld von außen vorgegeben. Trotzdem existieren auch beim schweren Kreisel partikuläre Lösungen mit θ = const und φ̇ = const, bei denen also die Figurenachse mit konstanter Winkelgeschwindigkeit auf einen Kegelmantel um die raumfeste z–Achse läuft. Diese Bewegung der Figurenachse des schweren Kreisels nennt man Präzession39 (lat. praecedere = vorangehen). Wenn wir θ = const in Gl. (193) einsetzen, erhalten wir für φ̇ die quadratische Gleichung −I1 cos θ φ̇2 + pψ φ̇ − V0 = 0 . (198) Ihre Lösung 1 I 3 ω3 φ̇ = 1∓ 2 I1 cos θ s 4V0 I1 cos θ 1− I32 ω32 ! (199) (bei der wir von der Gl. (192) pψ = I3 ω3 Gebrauch gemacht haben) zeigt zunächst, daß die gleichförmige Präzession einen Mindestwert ω3 für die Rotation um die Figurenachse erfordert. Diese Bedingung ist trivial erfüllt, wenn wir uns für den “schnellen” Kreisel interessieren, der so rasch um seine Symmetrieachse rotiert, daß I3 ω3 bzw. I3 ω32 groß gegen alle konkurrierenden Drehimpulse bzw. Energien ist. Für den schnellen Kreisel gilt insbesondere pψ = I3 ω3 I1 φ̇ und I3 ω32 V0 . 38 Wohl aber die Komponenten pφ und pψ , vgl. (190) und (191). Auf der mathematischen Analogie beruht die alternative Bezeichnung “reguläre Präzession” für die Nutation des kräftefreien Kreisels. Physikalisch stellt die Präzession des schweren Kreisels ein von der Nutation grundlegend verschiedenes Phänomen dar. Vgl. auch die beiden folgebden Fußnoten. 39 97 Damit scheidet das untere Vorzeichen in Gl. (199) aus. Durch Entwicklung der Wurzel oder durch direkte Vernachlässigung des quadratischen Terms in Gl. (198) erhalten wir für die Präzession eine gleichförmige Winkelgeschwindigkeit V0 V0 = , pψ I 3 ω3 φ̇ = ωP = (200) die nicht von der Neigung θ der Figureanchse gegen das Schwerefeld abhängt. Die Präzession erfolgt um so langsamer, je schneller der Kreisel rotiert. Diese gleichförmige Präzession ist nur eine partikuläre Lösung des Problems. Um die grundsätzliche Struktur der allgemeinen Lösung aufzuzeigen, nehmen wir kleine Abweichungen θ = θ0 + δ von der speziellen Lösung θ = θ0 an. Dann folgt aus (191) eine ungleichförmige Präzessionsgeschwindigkeit pφ − pψ cos θ I1 sin2 θ pψ sin θ0 pφ − pψ cos θ0 pφ − pψ cos θ0 ≈ +δ − 2δ cos θ0 2 2 I1 sin θ0 I1 sin θ0 I1 sin3 θ0 pψ = ωP + δ − 2ωP tan θ0 δ . I1 sin θ0 φ̇ = Hierbei haben wir bereits für θ = θ0 die gleichförmige Präzession ωP des schnellen Kreisels nach Gl. (200) eingesetzt. Für kleine δ können wir schließlich noch den dritten Term gegen den ersten vernachls̈sigen und erhalten φ̇ = ωP + pψ δ. I1 sin θ0 (201) Wenn wir dies in die Lagrangegleichung (193) einsetzen und gleichzeitig für den schnellen Kreisel (pψ I1 φ̇) den zweiten gegen den dritten Term vernachlässigen, erhalten wir p2 δ̈ + ψ2 δ = 0 . (202) I1 δ und damit θ oszilliert also mit der selben Frequenz40 j pψ ≈ = ωN , I1 I1 40 Man beachte die verschiedenen Koordinatensysteme bei der Beschreibung des kräftefreien und des schweren Kreisels. Daß der Eulersche Winkel φ einmal die Nutation und einmal die Präzession beschreibt, mag wesentlich zu der sprachlichen Verwirrung beigetragen haben! 98 die nach Gl. (196) die Nutation des kräftefreien Kreisels beschreibt. Mit der selben Frequenz schwankt daher nach Gl. (201) auch die Präzessionsgeschwindigkeit φ̇ um ihren Mittelwert ωP . Wir schließen daraus, daß die allgemeine Bewegung des schnellen schweren Kreisels durch eine gleichförmige Präzession mit überlagerter Nutation41 beschrieben wird. Je nach der Amplitude δmax der Nutation kann die Bewegung eines Punktes auf der Kreiselachse (etwa des sogenannten Locus mit dem Abstand 1 von der festgehaltenen Kreiselspitze) wellig verlaufen oder mit zeitweise rückläufiger Präzession Schleifen bilden (siehe Skizze). Der Grenzfall einer zykloidischen Bahn mit Spitzen entspricht den Anfangsbedingungen θ̇(0) = 0 und φ̇(0) = 0. Dies ist kein akademischer Spezialfall, sondern beschreibt die Bewegung eines schweren Kreisels, der zunächst festgehalten, und dann plötzlich dem Schwerefeld ausgesetzt wird. Bahn des Locus eines schweren symmetrischen Kreisels (nach Goldstein) Der Vollständigkeit halber erwähnen wir, daß sich der schwere symmetrische Kreisel auch ohne weitere Vorraussetzungen und Näherungen exakt beschreiben läßt. Dazu ergänzt man die beiden Integrale (190) und (191) durch den Energiesatz [vgl. (189)] T +V = 1 1 I1 (sin2 θ φ̇2 + θ̇2 ) + I3 (cos θ φ̇ + ψ̇)2 + V0 cos θ = E . 2 2 Eliminieren wir hier ψ̇ und φ̇ durch (190) und (191), so erhalten wir 1 2 I1 θ̇ + Veff (θ) = E 2 mit dem effektiven Potential Veff (θ) = p2ψ (pφ − pψ cos θ)2 + + V0 cos θ . 2I3 2I1 sin2 θ 41 Da die überlagerte Nutation bei einem hinreichend schnellen Kreisel kaum zu beobachten ist, spricht man auch von pseudoregulärer Präzession. 99 Da das effektive Potential für θ = 0 und θ = π unendlich wird, muß sich θ zwischen zwei Umkehrpunkten θ1 und θ2 bewegen. Hierin erkennen wir die Nutation wieder. Ihre exakte mathematische Beschreibung gemäß r I1 dθ p = dt 2 E − Veff (θ) führt mit der Substitution u = cos θ auf das elliptische Integral Z I1 du t=− q p2ψ 2I1 (1 − u2 )(E − 2I3 − V0 u) − (pφ − pψ u)2 mit einem Polynom dritten Grades (für V0 6= 0) in u unter der Wurzel im Nenner. Nach der Bestimmung von θ(t) lassen sich φ(t) und ψ(t) durch Integration von (190) und (191) bestimmen. 3.9 Zum elementaren Verständnis des Kreisels Der Kreisel findet nicht nur zahlreiche technische Anwendungen sondern ist auch ein zeitlos beliebtes Spielzeug. Seine scheinbar paradoxe Reaktion auf äußere Kräfte stellt dabei eine nicht ganz triviale Aufgabe an die physikalische Anschauung. Wenn wir nun elementare Betrachtungen nachtragen, so zielen wir damit auf das anschauliche Verständnis der Präzession. Denn die überlagerte Nutation ist mehr oder weniger selbsverständlich, wenn die Richtung des Drehimpulses nicht mit einer Hauptachse (der Symmetrieachse) zusammenfällt (vgl. Abschnitt 3.5). Die einfachste elementare Begründung der Präzession des schnellen Kreisels geht direkt vom Drehimpulssatz aus. Auf den Kreisel wirkt eine Kraft vom Betrag F = mg längs der raumfesten zR –Achse. Diese Kraft greift im Schwerpunkt mit dem Kraftarm zS in Richtung der körpereigenen zK –Achse an und erzeugt ein Drehmoment vom Betrag M = mgzS sin θ = V0 sin θ . Es steht senkrecht auf beiden z–Achsen, zeigt also in die Richtung der Knotenlinie (vgl. Skizze und die Figur auf S. 71). zR M θ zS 100 F zK Dieses Drehmoment verändert nun den Drehimpuls l, der für den schnellen Kreisel angenähert durch l = I3 ω3 e3 gegeben ist. Seine raumfeste zR –Komponente pφ ≈ I3 ω3 cos θ bleibt konstant, da das Drehmoment keine zR –Komponente besitzt. Die Projektion l⊥ in die raumfeste x–y–Ebene steht senkrecht auf der Knotenlinie, der Betrag l⊥ = I3 ω3 sin θ bleibt daher ebenfalls konstant. Durch das Drehmoment wird l⊥ jedoch gemäß l⊥ dφ = M dt gedreht. Damit erhalten wir in Übereinstimmung mit (200) eine Präzessionsgeschwindigkeit dφ M V0 sin θ = = = ωP , dt l⊥ I3 ω3 sin θ aus der sich die Abhängigkeit vom Neigungswinkel θ herauskürzt. Die soweit skizzierte Betrachtung ist zwar mathematisch besonders einfach, aber noch wenig hilfreich für das anschauliche Verständnis. Sie geht nämlich von dem integralen Drehimpulssatz aus und sagt nichts darüber aus, welche Kräfte an welchen Massenpunkten des Kreisels die Wirkung der Schwerkraft kompensieren und das Kippen des Kreisels verhindern. Eine in dieser Hinsicht aufschlußreichere Interpretation der Präzession ergibt sich in dem Koordinatensystem, das mit ωP um die zR –Achse rotiert, das also der Präzession (nicht aber der Rotation) der Kreiselachse folgt. In diesem System erfahren die Massenpunkte des rotierenden Kreisels eine Corioliskraft FC1 , die senkrecht zur zR –Achse gerichtet ist (siehe Skizze). ZR FC1 ωp FC1 Speziell bei den Massenpunkten am ’oberen’ Kreiselrand zeigt diese Kraft nach ’innen’, bei denen am ’unteren’ Rand nach ’außen’. Dadurch entsteht ein Drehmoment M1 , das den Kreisel aufzurichten versucht. Dieses Drehmoment kompensiert das entgegengesetzte Moment der Gewichtskraft. 101 Auch diese Interpretation kann noch nicht voll befriedigen, da sie bereits von der Präzession ausgeht statt sie zu erklären. Welche Kraft zwingt also den Kreisel senkrecht auszuweichen, wenn er dem Schwerefeld ausgesetzt wird? Gar keine! Der Kreisel beginnt zu kippen, wie jeder Körper, der in einem Punkt festgehalten wird, im Schwerefeld kippt. Dabei erlangt er eine wachsende Winkelgeschwindigkeit θ̇ um die Knotenlinie. Und diese Drehung erzeugt nun ebenfalls eine Corioliskraft FC2 (siehe Skizze). zR Fc2 Fc2 θ Sie steht senkrecht auf der Knotenlinie und ist am ’rechten’ Kreiselrand nach ’innen’, am ’linken’ nach ’außen’ gerichtet. Dadurch entsteht ein Drehmoment M2 , dem der Kreisel ebenfalls folgt: Er beginnt zu präzedieren. Die Präzession erzeugt nun ihrerseits das oben beschriebene Drehmoment M1 , das dem Moment der Schwerkraft entgegenwirkt und es schließlich kompensiert. Aufgrund der Trägheit schießt der Kreisel aber über dieses ’Ziel’ hinaus, er kippt weiter und erfährt durch FC2 bzw. M2 eine weitere Beschleunigung der Präzession, bis schließlich das wachsende Moment M1 die Kippbewegung zur Umkehr zwingt. Nun wird θ̇ < 0 und M2 wechselt das Vorzeichen. Dadurch wird die Präzession verlangsamt, bis sie schließlich ganz zum Stillstand kommt. In diesem Punkt beginnt ein neuer Nutationszyklus. Die Kreiselachse führt also insgesamt die Bewegung aus, die in der mittleren Figur von S. 99 skizziert ist. Die Nutation ist daher am Aufbau der Präzession wesentlich beteiligt, ja, wir können die Präzession als eine Folge von Versetzungen durch Nutationszyklen auffassen. Erst wenn durch Reibung (die in unserer Analyse nicht enthalten ist) die Amplitude der Nutation weggedämpft ist, erhalten wir die reine (reguläre) Präzession mit der oben skizzierten Kompensation von Schweremoment und M1 . 102 4 Stabilität und kleine Schwingungen In diesem Kapitel befassen wir uns mit einer Anwendung des Lagrangeformalismus auf die Untersuchung der Bewegung in der Nähe von “Gleichgewichtszuständen”, d.h. von Ruhelagen des Systems. Reagiert das System mit Oszillationen auf kleine Störungen der Ruhelage (z.B. Kugel in einer Potentialmulde) , so heißt der Gleichgewichtszustand stabil. Ein labiler Gleichgewichtszustand dagegen (z.B. Kugel auf einem Potentialberg) wird endgültig verlassen, wenn die Ruhelage gestört wird. Methodisch benutzen wir in diesem Kapitel das wichtige Werkzeug der Linearisierung. Wir behandeln das Problem hier im Anschluß an die Dynamik des starren Körpers, weil wir dabei von unserer mathematischen Vorarbeit bei der Hauptachsentransformation des Trägheitstensors profitieren können. Da es sich bei dem Problem – wie gesagt – um eine Anwendungen und nicht um Grundlagen handelt, kann dieses Kapitel ohne Schaden für das folgende ausgelassen werden. 4.1 Gleichgewichte und kleine Abweichungen Wir betrachten ein mechanisches System mit holonomen Zwangsbedingungen, das wir durch die generalisierten Koordinaten q1 , . . . qf beschreiben. Wenn wir uns außerdem auf skleronome42 Zwangsbedingungen beschränken, erhalten wir aus der Rücktransformation xν = hν (q) die kinetische Energie (vgl. S. 60) T = T2 = f n X 1X ∂hν ∂hν mν q̇i q̇j . 2 ν=1 i,j=1 ∂qi ∂qj Wir wollen schließlich noch annehmen, daß alle Kräfte aus einem Potential herleitbar sind. Dann erhalten wir die Lagrangefunktion f 1 X L= Tij (q)q̇i q̇j − V (q) 2 i,j=1 mit Tij (q) = n X mν ν=1 42 ∂hν ∂hν . ∂qi ∂qj Über ein effektives Potential lassen sich auch viele Systeme mit rheonomen Zwangsbedingungen nach dem gleichen Schema behandeln. Im allgemeinen erfordert jedoch ein Anteil L1 (vgl. S. 60) in der Lagrangefunktion einen größeren mathematischen Aufwand, wie man am Beispiel des Facaultschen Pendels oder des harmonischen Oszillators im Magnetfeld sieht. 103 Aus den Ableitungen X ∂L Tik q̇i , = ∂ q̇k i und X ∂Tik X d ∂L Tik q̈i + = q̇i q̇j dt ∂ q̇k i,j ∂qj i ∂L 1 X ∂Tij ∂V = q̇i q̇j − ∂qk 2 i,j ∂qk ∂qk folgen dann die Bewegungsgleichungen X i Tik q̈i + X i,j ∂Tik 1 ∂Tij − ∂qj 2 ∂qk ! q̇i q̇j + ∂V = 0. ∂qk (203) Wir interessieren uns nun speziell für Gleichgewichte q = q0 , q̇ = q̈ = 0. Hierfür muß offenbar ∂V =0 (204) ∂qk q=q0 gelten, d.h. die generalisierte Kraft im Gleichgewichtspunkt muß verschwinden. Wir nehmen o.B.d.A. (etwa, indem wir q durch q − q0 ersetzen) q0 = 0 an und betrachten kleine Abweichungen vom Gleichgewicht. Damit meinen wir, daß wir alle Glieder von höher als • linearer Ordnung in q, q̇ und q̈ in den Bewegungsgleichungen bzw. • quadratischer Ordnung in q und q̇ in der Lagrangefunktion vernachlässigen. Damit entfällt der mittlere Term in der Bewegungsgleichung (203). Außerdem können wir die kinetische Energie durch die symmetrische quadratische Form f 1 X T = Tij q̇i q̇j 2 i,j=1 mit Tij = Tji = Tij (0) (205) in q̇ repräsentieren. Entsprechend können wir V (q) = V (0) + X i ∂V 1 X ∂ 2 V qi + qi qj ∂qi 0 2 i,j ∂qi ∂qj 0 bis zur quadratischen Ordnung in q entwickeln. Die bedeutungslose Konstante V0 können wir o.B.d.A. gleich Null setzen. Im Gleichgewicht gilt nach Gl. (204) außerdem ∂V /∂qi |0 = 0. Daher wird das Potential durch die symmetrische quadratische Form 104 f 1 X V = Vij qi qj 2 i,j=1 ∂ 2 V mit Vij = Vji = ∂qi ∂qj 0 (206) in q repräsentiert. Kleine Abweichungen vom Gleichgewicht werden also durch die Lagrangefunktion L= 1X 1 1X 1 Tij q̇i q̇j − Vij qi qj = q̇∗ Tq̇ − q∗ Vq 2 i,j 2 i,j 2 2 (207) und die Bewegungsgleichungen X (Tik q̈i + Vik qi ) = 0 oder Tq̈ + Vq = 0 (208) i mit symmetrischen f×f –Matrizen T = (Tik ) und V = (Vik ) beschrieben. 4.2 Eigenfrequenzen und Stabilität Gl. (208) ist ein linear homogenes Differentialgleichungssystem mit konstanten Koeffizienten, das grundsätzlich elementar lösbar ist. Die einzige Schwierigkeit liegt darin, daß die Gleichungen gekoppelt sind. Wir streben daher an, die Gleichungen durch eine Transformation q = Aξ oder qi = X ail ξl (209) l zu entkoppeln, so daß Gl. (208) in ξ¨l + λl ξl = 0 (210) übergeht. Die entkoppelten Koordinaten ξl heißen Normalkoordinaten. Die Eigenwerte λl erhalten wir, wenn wir d2 → −λ dt2 in Gl. (208) einsetzen: f X i=1 (Vik − λTik )qk = 0 oder (V − λT)q = 0 105 Dieses linear homogene Gleichungssystem für q besitzt nur dann nicht–triviale Lösungen, wenn det(V − λT) = 0 (211) gilt. Wir werden im nächsten Abschnitt zeigen, daß dieses Polynom f –ten Grades in λ tatsächlich f reelle Lösungen besitzt. Für Eigenwerte λl > 0 erhalten wir harmonische Eigenschwingungen ξl = cl cos ωl t + dl sin ωl t mit ωl = q λl . Wir nennen ωl eine Eigenfrequenz oder Normalfrequenz des Systems. Für Eigenwerte λl < 0 erhalten wir dagegen exponentielle Lösungen ξl = cl exp(γl t) + dl exp(−γl t) mit γl = q −λl . Der Sonderfall λl = 0 führt auf eine gleichförmige Variation ξl = c l + d l t . Dieser Fall erfordert im allgemeinen eine gesonderte Untersuchung, bei der höhere Terme in den Abweichungen vom Gleichgewicht berücksichtigt werden müssen. Zur Klassifizierung des Gleichgewichts können wir daher die folgenden Fälle unterscheiden: • Alle λl > 0: Das System führt bei einer kleinen Störung kleine Schwingungen um die Gleichgewichtslage aus, das Gleichgewicht ist stabil. • Mindestens ein λl < 0: Das System läuft bei einer Störung exponentiell aus dem Gleichgewicht, das Gleichgewicht ist labil. • Alle λl ≥ 0 und mindestens ein λl = 0: Das Gleichgewicht ist zunächst indifferent. In diesem Sonderfall kommen jedoch im allgemeinen höhere Entwicklungsglieder zum Tragen und entscheiden letzendlich über die Stabilität. Die folgende Analyse wird zeigen, daß diese Klassifizierung mit der elementaren Anschauung übereinstimmt, die man aus der Beurteilung des Potentials in der Umgebung des Gleichgewichts (Minimum, Sattelpunkt, Maximum) gewinnt: 106 Quadratische Form q∗ Vq positiv definit positiv semidefinit negativ– oder indefinit 4.3 Gleichgewicht stabil indifferent labil Transformation auf Normalkoordinaten Mit der Transformation (209) erhalten wir die kinetische Energie 1 ∗ T = ξ˙ T̂ξ˙ mit T̂ = A∗ TA 2 und die potentielle Energie 1 V = ξ ∗ V̂ξ mit V̂ = A∗ VA . 2 Wenn wir angenommen haben, mit dieser Transformation entkoppelte Bewegungsgleichungen (210) zu erhalten, so ist das gleichbedeutend mit der optimistischen Erwartung, mit ein und derselben Transformation A sowohl T als auch V diagonalisieren zu können: Vl T̂kl = Tl δkl , V̂kl = Vl δkl und λl = . Tl Bei entsprechender Dehnung oder Stauchung der Achsen können wir dann sogar T̂ = 1 verlangen. Bevor wir diese überraschende Aussage beweisen, erinnern wir daran, daß T und V reell symmetrische und damit selbstadjungierte Matrizen sind, und weisen auf das im Abschnitt 3.4 zusammengestellte mathematische Rüstzeug hin. Danach ist zunächst klar, das sowohl T als auch V einzeln mit verschiedenen orthogonalen Matrizen diagonalisiert werden können. Wir werden hiervon bei unserem Existenzbeweis Gebrauch machen. Als Ergebnis werden wir eine nicht orthogonale Matrix A finden, die das Gewünschte leistet. Zum Beweis geben wir in schematischer Form Einzeltransformationen an und verdeutlichen ihr Wesen anhand kleiner Skizzen: Die Ausgangssituation sei durch 1 T = q̇Tq̇ , 2 q2 1 V = qVq 2 mit nicht diagonalen Matrizen T und V charakterisiert. (Wir skizzieren rechts die Flächen T = const und V = const schematisch für ein zweidimensionales stabiles System.) 107 q2 q1 q1 1. Schritt: Wir diagonalisieren T durch eine orthogonale Matrix A1 : q = A1 η , 1 T = η̇ ∗ T1 η̇ , 2 1 V = η ∗ V1 η , 2 η2 η2 τ1 · · · 0 . .. . T1 = A∗1 TA1 = . .. .. 0 · · · τf η1 η1 V1 = A∗1 VA1 . Da die kinetische Energie positiv definit ist, sind alle Eigenwerte τi > 0. Dies bietet die Grundlage für den zweiten Schritt. 2. Schritt: Wir dehnen oder stauchen das Ellipsoid T = const durch eine Transformation mit der Matrix A2 = −1/2 τ1 .. . 0 ··· 0 .. .. . . −1/2 · · · τf ζ2 ζ2 zur Einheitskugel: η = A2 ζ , 1 ∗ T = ζ̇ T2 ζ̇ , 2 1 V = ζ ∗ V2 ζ , 2 ζ1 ζ1 T2 = 1 , V2 = A∗2 VA2 . In dieser Stauchung liegt der nicht orthogonale Kern der Gesamttransformation. 3. Schritt: Diagonalisieren wir nun V durch eine orthogonale Matrix A3 . Da T2 = 1 gegen orthogonale Transformationen invariant ist, erhalten wir ζ = A3 ξ , 1 ∗ T = ξ˙ T3 ξ˙ , 2 ξ2 1 V = ξ ∗ V3 ξ , 2 T3 = A∗3 T2 A3 = 1 , ξ2 ξ1 λ1 · · · 0 . . ∗ . . ... V3 = A3 V2 A3 = .. . 0 · · · λf 108 ξ1 Mit A = A1 A2 A3 erhalten wir also die angestrebte Gesamttransformation q = Aξ , (212) durch welche die Matrizen T und V in T̂ = A∗ TA = 1 und (213) λ1 · · · 0 . ∗ V̂ = A VA = .. . . . ... 0 · · · λf (214) übergehen. Damit erhalten wir die einfache Lagrangefunktion 1 X ˙2 1 X ξ − λi ξi2 , 2 i i 2 i L= die zu den Bewegungsgleichungen (210) führt. Zur Berechnung der Transformationsmatrix A brauchen wir nicht von der Zerlegung des Existenzbeweises in Einzelschritte auszugehen, sondern können sogleich die Gesamttransformation in einem Schritt konstruieren. Dazu setzen wir A in der Form A = (a1 , . . . , af ) (215) aus Spaltenvektoren al zusammen und notieren die Transformation in der Form q = Aξ = X ξ l al . l Mit den Bewegungsgleichungen Tq̈ + Vq = 0 [vgl. Gl. (208)] und ξ¨l = −λl ξl [vgl. Gl. (210)] erhalten wir dann X l ξl (V − λl T)al = 0 . Da die Koordinaten ξl unabhängig sind, erhalten wir für die gesuchten al das linear homogene Gleichungssystem (V − λl T)al = 0 . 109 (216) Die Vektoren al erfüllen also eine Beziehung, die die Definition von Eigenvektoren verallgemeinert. Die Bedingung, daß nicht–triviale Lösungen existieren, führt wieder auf Gl. (211). Unser Existenzbeweis stellt sicher, daß diese Polynomgleichung tatsächlich f reelle Werte λl liefert. Natürlich ist al durch Gl. (216) nur bis auf einen konstanten Faktor bestimmt. Im Prinzip sollte dieser Faktor durch die Normierung [vgl. (213)] a∗l Tal = 1 (217) festgelegt werden. Tatsächlich kann auf die Normierung aber verzichtet werden43 , wenn die Umkehrtransformation A−1 = A∗ T (218) nach Gl. (213) nicht benötigt wird. 4.4 Die formale Durchführung Wir fassen die obigen Überlegungen in dem folgenden Rechenprogramm zusammen. Dabei setzen wir zunächst voraus, daß keine Entartung vorliegt, d.h. daß alle λl verschieden sind. 1. Suche die fragliche Gleichgewichtslage q̃0 und benutze die Abweichungen qk = q̃k − q̃k0 als generaliesierte Koordinaten. 2. Entwickle T und V in der Umgebung der Gleichgewichtslage bis zur quadratischen Ordnung und bringe sie in die Form T = 1X 1 Tij q̇i q̇j = q̇∗ Tq̇ , 2 i,j 2 V = 1X 1 Vij qi qj = q∗ Tq . 2 i,j 2 Dabei ist unbedingt darauf zu achten, daß T und V symmetrisch gewählt werden (Tij = Tji und Vij = Vji )! 3. Bilde das charakteristische Polynom [vgl. (211)] det(V − λT) = 0 . 43 Das bedeutet, daß die Achsen zum Schluß noch einmal gestaucht werden. Hierbei bleibt die Entkoppelung erhalten. Natürlich spielt auch das Vorzeichen von al keine Rolle. 110 Es besitzt f relle Lösungen λl deren Vorzeichen Auskunft über die Stabilität des Gleichgewichts geben: Sind alle λl > 0, so ist das System stabil, ist mindestens ein λl < 0, labil. Indifferentes Gleichgewicht (das aber i.a. genauer untersucht werden muß) liegt vor, wenn alle λl ≥ 0 sind und mindestens ein λl = 0 ist. Für stabile Systeme erhält man die Eigenfrequenzen ωl = q λl . 4. Bestimme für jedes λl einen Eigenvektor al aus der Beziehung [vgl. (216)] (V − λl T)al = 0 . Eine Normierung der Eigenvektoren nach Gl. (217) ist nur dann erforderlich,wenn die Umkehrtransformation (218) benötigt wird. 5. Die Normalkoordinaten erfüllen die einfachen Bewegungsgleichungen [vgl. (210)] ξ¨l + λl ξl = 0 . Ihre Lösungen lassen sich mit der Matrix [vgl. (215)] A = (a1 , . . . , af ) gemäß [vgl. (212)] q = Aξ oder qk = X alk ξl l auf die alten Koordinaten q übertragen. Nimmt man insbesondere an, daß nur eine “mode”, d.h. eine isolierte Eigenschwingung ξl , angeregt ist (ξi = 0 für i 6= l), so erhält man durch q(l) = ξl al eine Beschreibung des Bewegungsablaufs dieser isolierten Mode. 6. Ist der Bewegungsablauf durch Anfangsbedingungen q(0) und q̇(0) vorgege˙ ben, so erhält man die entsprechenden Anfangsbedingungen ξ(0) und ξ(0) aus der Umkehrtransformation ξ = A−1 q . Hat man die Eigenvektoren nach Gl. (217) normiert (vgl. Punkt 4.), so erhält man A−1 aus Gl. (218). [Abschließend müssen wir in unserem Konzept noch den Sonderfall der Entartung erörtern. Dieser stellt eher ein Problem für die theoretische Begründung als für die praktische Auswertung dar. Wenn nämlich zwei oder mehr Eigenwerte des charakteristischen Polynoms (211) gleich werden, so brauchen wir nur den Punkt 4 unseres Programms zu modifizieren: Ist λl eine m–fache Nullstelle von Gl. (211), so spannen die Lösungen von Gl. (216) einen m–dimensionalen Unterraum U m auf. 111 • Wenn die Umkehrtransformation (218) nicht benötigt wird, können wir einfach (1) (m) m beliebige linear unabhängige Vektoren al , . . . , al aus Um auswählen. • Wollen wir jedoch die Umkehrtransformation nach Gl. (218) bilden (vgl. 6.), so müssen wir m Vektoren a1l , . . . , am l konstruieren, die im Einklang mit Gl. (217) den “Orthogonalitätsrelationen” µ aν∗ l Tal = δνµ genügen. Hierzu kann man wieder von einem beliebigen linear unabhängigen Sy(1) (m) stem al , . . . , al ausgehen und etwa nach dem Schmidtschen Verfahren orthogonalisieren: Dabei setzt man (1) (1) a1l = α11 al , a2l = α21 al (2) + α22 al ... und bestimmt die α’s sukzessive so, daß 1 1∗ 2 2∗ 2 a1∗ l Tal = 1, al Tal = 0, al Tal = 1, . . . gilt.] 4.5 Gekoppelte Pendel Zur Illustration des Verfahrens betrachten wir das einfache Beispiel zweier gleicher mathematischer Pendel (Masse m, Länge `), die durch eine (schwache) Feder (k) gekoppelt sind. Die Länge der entspannten Kopplungsfeder sei gleich dem Abstand d der Aufhängepunkte (siehe Skizze), so daß die Gleichgewichtslage nicht verändert wird. y Von S. 47 übernehmen wir die Ausdrücke d ϑ2 l ϑ1 m l m x m 2 2 ` ϑ̇ und V = −mg` cos ϑ x20 x2 x10 x1 2 für die kinetische und die potentielle Energie eines Pendels. Bei unseren gekoppelten Pendeln müssen wir nun die entsprechenden Terme für beide Pendel addieren. Außerdem ist die potentielle Energie durch die Kopplungsenergie T = Vk ≈ k k (x2 − x1 − d)2 = `2 (sin ϑ1 − sin ϑ2 )2 2 2 zu ergänzen. Damit erhalten wir T = m 2 2 ` (ϑ̇1 + ϑ̇22 ) 2 112 und k V = −mg`(cos ϑ1 + cos ϑ2 ) + `2 (sin ϑ1 − sin ϑ2 )2 . 2 Wir gehen nun nach den Programmpunkten des vorigen Abschnitts vor: 1. Die Gleichgewichtslage liegt nach Konstruktion bei ϑ1 = ϑ2 = 0. (Natürlich kann man das auch aus ∂V /∂ϑi = 0 ausrechnen.) 2. Wir sehen nun ϑi (und ϑ̇i ) als klein an und entwickeln bis zur quadratischen Ordnung, d.h. wir setzen sin ϑi ≈ ϑi 1 cos ϑi ≈ 1 − ϑ2i 2 und und erhalten m 2 2 ` (ϑ̇1 + ϑ̇22 ) 2 k m V = V0 + g`(ϑ21 + ϑ22 ) + `2 (ϑ1 − ϑ2 )2 . 2 2 Dabei ist die Konstante V0 = −2mg` ohne Bedeutung und kann weggelassen werden. Wir können T und V deshalb mit den Matrizen T = T = m` 2 ! 1 0 0 1 und V = m` g ` 2 k +m k −m k −m g k +m ` ! in der Form 1 T = (ϑ̇1 , ϑ̇2 )T 2 ϑ̇1 ϑ̇2 ! 1 und V = (ϑ1 , ϑ2 )V 2 ϑ1 ϑ2 ! schreiben. 3. Das charakteristische Polynom det(V − λT) = 0 oder g ` k +m −λ k −m g ` − mk k +m −λ = k g + −λ ` m !2 − k2 = 0 m2 besitzt die beiden positiven Lösungen g g k und λ2 = + 2 . ` ` m Das Gleichgewicht ist also (natürlich) stabil. Das Pendelsystem führt bei einer Störung Schwingungen der Eigenfrequenzen λ1 = ω1 = r g ` und/oder ω2 = aus. 113 s g k +2 ` m 4. Wir bestimmen die Eigenvektoren al aus (V − λl T)al = 0 . Für l = 1, d.h. λl = g/`, erhalten wir k m 1 −1 −1 1 ! ! a11 a12 = 0, α α also a1 = ! mit beliebigem α. Entsprechend folgt für l = 2, d.h. λl = g/` + 2k/m k − m 1 1 1 1 ! ! a21 a22 = 0, also a2 = α −α ! . Da T bis auf den Vorfaktor m`2 gleich der Einheitsmatrix ist, sind a1 und a2 bereits √ orthogonal. Eine Normierung nach der formalen Vorschrift würde α = 1/ 2m`2 erfordern. Wir verzichten darauf und wählen der Einfachheit halber α = 1. 5. Die Normalkoordinaten ξl führen harmonische Schwingungen der Frequenz ωl aus. Mit der Matrix 1 1 1 −1 A = (a1 , a2 ) = ! lassen sich daraus die ursprünglichen Koordinaten ϑ1 ϑ2 ! ξ1 ξ2 =A ! = ξ1 + ξ 2 ξ1 − ξ 2 ! berechnen. Führt das System insbesondere nur die Eigenschwingung 1 aus (ξ2 = 0), so folgt ϑ1 = ϑ 2 . Beide Pendel schwingen also gleichsinnnig mit gleicher Amplitude, so daß die Koppelfeder gar nicht gedehnt wird. Daher erhalten wir die ungestörte Pendelfrequenz q ω1 = g/` . Für die Eigenschwingung 2 (ξ1 = 0) erhalten wir dagegen ϑ1 = −ϑ2 . Die Pendel schwingen also gegensinnig mit gleicher Amplitude, so daß die Koppelfeder maximal beansprucht wird. Da ihr Mittelpunkt bei dieser Mode in Ruhe bleibt, kann sie durch zwei Federn halber Länge und doppelter Federkonstante ersetzt werden. Dies erklärt die Eigenfrequenz ω2 = q g/` + 2k/m . 114 6. Unter Beachtung der Orthogonalität und der Normierung erhalten wir die Matrix ! 1 ∗ 1 1 1 −1 A = A = 2 2 1 −1 der Umkehrtransformation. Daher gilt 1 1 ξ1 = (ϑ1 + ϑ2 ) und ξ2 = (ϑ1 − ϑ2 ) . 2 2 Wenn wir die Pendel beispielsweise mit den Anfangsbedingungen ϑ1 (0) = 2c , ϑ2 (0) = ϑ̇1 (0) = ϑ̇2 (0) = 0 starten, so folgt ξ1 (0) = ξ2 (0) = c , ξ˙1 (0) = ξ˙2 (0) = 0 . Wir erhalten also die spezielle Lösung ξ1 = c cos ω1 t , ξ2 = c cos ω2 t oder nach Rücktransformation c 1 1 t cos ω2 +ω t cos ω2 −ω 2 2 2 c 1 1 = c(cos ω1 t − cos ω2 t) = t sin ω2 +ω t. sin ω2 −ω 2 2 2 ϑ1 = c(cos ω1 t + cos ω2 t) = ϑ2 Für schwache Kopplung (d.h. k/m g/` oder ω2 ≈ ω1 ) ergibt dies die bekannte Schwebung, bei der die gesamte Schwingungsenergie mit der kleinen Differenzfrequenz zwischen den beiden Pendeln ausgetauscht wird. 115 5 Spezielle Relativitätstheorie 5.1 Galileisches und Einsteinsches Relativitätsprinzip Wir betrachten ein Koordinatensystem K0 , das sich gegenüber unserem Inertialsystem K mit der konstanten Geschwindigkeit v bewegt. Der Zusammenhang44 r0 = r − vt (219) zwischen den Ortskoordinaten (x, y, z) in K und den entsprechenden Koordinaten (x0 , y 0 , z 0 ) in K0 heißt Galileitransformation. Wir hatten bereits in den Abschnitten 1.1 und 1.8 festgestellt, daß die Grundgesetze der Mechanik “Galileiinvariant”, d.h. invariant gegen Galileitransformationen, sind. Denn wegen v̇ = 0 folgt aus (219) mi r̈0i = mi r̈i = Fi . (220) Die Newtonschen Bewegungsgleichungen bieten also keine Möglichkeit, zwischen den Koordinatensystemen K und K0 zu unterscheiden, ⇒ • Galileisches Relativitätsprinzip: Alle gleichförmig gegeneinander bewegten Koordinatensysteme sind äquivalent. Es gibt keine Möglichkeit, durch mechanische Messungen ein Inertialsystem prinzipiell vor einem andern auszuzeichnen. Im Rahmen der klassischen Mechanik kann also prinzipiell nicht entschieden werden, ob sich ein System im Zustand der ‘Ruhe’ oder der ‘gleichförmigen Bewegung’ (wogegen eigentlich?) befindet45 . Es liegt nun einmal aus philosophisch–ästhetischen Gründen, mehr noch aber aufgrund der experimentellen Erfahung, die um die Wende zum 20. Jahrhundert gewonnen wurde, nahe, dieses Relativitätsprinzip auf die gesamte Physik zu übertragen. Wir postulieren daher • Einsteinsches Relativitätsprinzip: Alle gleichförmig gegeneinander bewegten Koordinatensysteme sind äquivalent. Es gibt keine Möglichkeit, durch physikalische Messungen ein Inertialsystem prinzipiell vor einem andern auszuzeichnen. Mit diesem Postulat kommen wir aber sogleich in Schwierigkeiten mit den Grundlagen der Elektrodynamik, wenn wir an der Galileitransformation festhalten. 44 Wir setzen hier und im folgenden voraus, daß die Koordinatenursprüge von K und K0 zur Zeit t = 0 zusammenfallen. 45 Man kann nicht einmal immer zwischen Scheinkräften in Nicht–Inertialsystemen und “wahren” (was ist das?) Kräften in Inertialsystemen unterscheiden! Vgl. dazu auch Abschnitt 5.11. 116 Denn nach dem Relativitätsprinzip erhalten wir in jedem Inertialsystem eine Lichtgeschwindigkeit c = (ε0 µ0 )−1/2 . Nach Gl. (219) müssen wir dagegen in K0 die anisotrope Lichtgeschwindigkeit c0 = c − v cos α (221) erwarten, wenn α den Winkel bezeichnet, der zwischen v und der Ausbreitungsrichtung des Lichts liegt. Wenn wir also am Relativitätsprinzip festhalten, müssen wir die Galileitransformation abändern. Ändern wir die aber ab, sind die Newtonschen Bewegungsgleichungen nicht mehr transformationsinvarint und müssen ebenfalls abgeändert werden. Wir stehen also vor der grundsätzlichen Frage, ob wir an den Newtonschen Bewegungsgleichungen oder (lat. ‘aut’, nicht ‘vel’ !) am Relativitätsprinzip festhalten wollen. Wegen der fundamentalen Bedeutung für die Grundlagen der gesamten Physik und Naturphilosophie soll das historische experimentum crucis (Michelson 1881, Michelson und Morley 1887, Morley und Miller 1904, Joos 1930) zu dieser Frage im folgenden in seinen Grundgedanken skizziert werden. 5.2 Das Michelson–Experiment Das Experiment zielt auf einen Vergleich der Lichtgeschwindigkeit in verschiedenen Koordinatensystemen K und K0 , und der erste Grundgedanke liegt darin, die große – und doch gegen c so kleine! – Geschwindigkeit v ≈ 30 km/s ≈ 10−4 c der Erde auf ihrer Bahn um die Sonne auszunutzen. Eine hinreichend genaue Bestimmung der Lichtgeschwindigkeit (mit den damaligen Mitteln!) durch die Messung der Laufzeit über eine bestimmte Strecke scheidet aus, weil die erforderliche Synchronisation am Start– und am Zielpunkt selbst von der Lichtgeschwindigkeit abhängt. Man muß also den Hin– und Rückweg eines Lichtstrahls verfolgen. Dabei hebt sich der Einfluß von v aber in erster Nähererung weg. Der verbleibende Einfluß der Größenordnung v 2 /c2 ∼ 10−8 ist aber so klein, daß nur ein Interferenzversuch infrage kommt. Hierzu brauchen wir noch einen zweiten Hin– und Rückweg. Nach dieser Vorklärung können wir den grundsätzlichen Aufbau des Experiments schematisch skizzieren: Das Licht einer monochromatischen Lichtquelle L wird durch einen halbdurchlässigen Spiegel S0 in zwei Strahlen (x– und y–Richtung) aufgespalten, die nach Reflexion an den Spiegeln Sx und Sy auf dem Schirm Sch interferieren. Die Wege lx und ly sind dabei etwa gleich lang (siehe Skizze). 117 Sy ly S0 lx L Sx Sch Wir nehmen nun an, daß Gl. (221) gilt und daß sich die Lichtgeschwindigkeit c auf einen ruhenden “Äther” bezieht. Die Apparatur bewege sich mit einer Geschwindigkeit v in x–Richtung gegen den Äther. Dann braucht das Licht für den Weg S0 –Sx –S0 die Laufzeit tx = lx 2lx lx + = , c−v c+v c(1 − β 2 ) wenn wir hier und im folgenden die übliche Abkürzung β = v/c (222) benutzen. Für die konkurrierende Laufzeit ty auf dem Weg S0 –Sy –S0 gilt (nach Pythagoras) die Beziehung q cty = 2 ly2 + ( 21 vty )2 = q 4ly2 + v 2 t2y . Lösen wir nach ty auf, so erhalten wir (5.2) 2ly ty = √ . c 1 − β2 Insgesamt folgt also eine Laufzeitdifferenz " lx ly 2 √ − δtk = tx − ty = c 1 − β2 1 − β2 # Und nun kommt der entscheidende Schritt: Drehen wir die Apparatur um 90o , so vertauschen x und y ihre Rollen, und wir erhalten " # l ly 2 √ x 2− . δt⊥ = c 1 − β2 1−β 118 Die Differenz # " lx + l y 2 1 2(lx + ly ) 1 ≈ −√ β ∆t = δtk − δt⊥ = 2 2 c 1−β c 1−β sollte man als Verschiebung des Interferenzmusters beobachten können. Um allerding einen Gangunterschied von c∆t ∼ 5 · 10−7 m , der der Wellenlänge von gelbem Licht entspricht, zu erzielen, benötigt man für β = 10−4 Wegstrecken lx + ly ∼ 50m , die im Sub–µm–Bereich stabil sind! Dies ist mit verschiedenen technischen Tricks tatsächlich erreicht worden. Man hat den Versuch unter verschiedenen Bedingungen und Annahmen mehrfach mit steigender Genauigkeit wiederholt und immer ein negatives Ergebnis gefunden: • Die Lichtgeschwindigkeit ist unter allen Bedingungen isotrop und gleich c. Wir müssen daraus schließen, daß die Galileitransformation und die Galileiinvarianten Newtonschen Bewegungsgleichungen für hohe Geschwindigkeiten zu korrigieren sind. 5.3 Die Lorentztransformationen Die Ausbreitung eines Lichtblitzes, der zur Zeit t = 0 im Ursprung erzeugt wurde, folgt im System K der Gleichung x2 + y 2 + z 2 = c 2 t 2 . Da wir festgestellt haben, daß auch in K0 eine isotrope Lichtausbreitung mit der Geschwindigkeit c beobachtet wird, liegt es zunächst nahe, anzunehmen, daß dort 2 2 2 x0 + y 0 + z 0 = c 2 t 2 gilt. Das heißt aber, daß K0 und K durch eine orthogonale Transformation im R3 verknüpft sind: r0 geht durch eine reine Drehung aus r hervor. Daß eine isotrope Kugelwelle bei einer reinen Drehung des Koordinatensystems invariant bleibt, ist trivial. Eine solche Drehung beschreibt aber offensichtlich nicht die gewünschte Relativbewegung der Koordinatensysteme. Das Fatale ist nun, daß die Drehung die einzige Möglichkeit ist, unseren ersten Ansatz zu befriedigen. 119 Wir stehen deshalb vor der befremdlichen Notwendigkeit, unseren Ansatz zu modifizieren und neben der Transformation r → r0 auch eine Transformation t → t0 der Zeit zuzulassen. Die Konstanz der Lichtgeschwindigkeit wird dann durch die Gleichung 2 2 2 x2 + y 2 + z 2 − c 2 t 2 = x 0 + y 0 + z 0 − c 2 t 0 2 = 0 (223) beschrieben. Die rein formale Anschrift dieser Beziehung legt es nahe, einen vierdimensionalen Raum mit den Koordinaten x1 = x , x2 = y , x3 = z , x4 = ict einzuführen. Die Konstanz der Lichtgeschwindigkeit schreibt sich dann in der Form46 4 X x2ν = 4 X 2 x0 ν = 0 . (224) ν=1 ν=1 Hierbei ist allerdings störend, daß wir eine imaginäre Koordinate x4 = ict benutzen, die zu recht seltsamen Konsequenzen führt. Beispielsweise kann die Summe von Quadraten negativ werden, und wir können rechtwinklig gleichschenklige Dreiecke mit der Hypothenuse Null bilden. Wir bewegen uns also nicht mehr in dem vertrauten euklidischen Raum, sondern in einem vierdimensionalen Raum mit einer ungewohnten Metrik, im Minkowskiraum. Es gibt nun verschiedene Argumente, eine lineare Transformation x0ν = 4 X ανµ xµ oder kurz x0 = Ax (225) µ=1 zwischen den Koordinaten in K und K0 zu fordern. Einmal soll für kleine v c die lineare Galileitransformation reproduziert werden. Gewichtiger aber ist, daß nicht–lineare Terme die Homogenität von Raum und Zeit verletzen würden. Denn wir erwarten, daß die Koeffizienten ανµ = ∂x0µ ∂xν nicht von x, also von der Lage r und der Zeit t, abhängen. Sie sollen dagegen allein von der Geschwindigkeit v zwischen K und K0 abhängen. 46 Wir folgen in diesem Kapitel dem allgemeinen Gebrauch, im vier dimensionalen Raum griechische Indizes, im dreidimensionalen Ortsraum dagegen lateinische Indizes zu verwenden. 120 Eine invertierbare lineare Transformation (225), die Gl. (224) erfüllt, ist aber notwendigerweise eine orthogonale47 Transformation im vierdimensionalen Minkowskiraum. Eine solche Transformation heißt Lorentztransformation. Orthogonale Transformationen lassen sich vorteilhaft als Drehungen veranschaulichen. Bei der Interpretation einer Lorentztransformation als Drehung sollten wir aber vorsichtig sein, weniger wegen der Schwierigkeit, unsere Anschauung auf vier Dimensionen auszudehnen, als wegen des imaginären Charakters der Koordinate x4 (oder besser: wegen der nicht–euklidischen Metrik des Minkowskiraumes). Aber selbstverständlich sind reine Drehungen im R3 (s.o.) auch Lorentztransformationen. Sie drücken die Isotropie des Raumes und speziell der Lichtausbreitung aus. Wegen der Isotropie können wir o.B.d.A. annehmen, daß v in der x3 –Richtung liegt. Wir sprechen nun von einer speziellen Lorentztransformation, wenn sie keine räumliche Drehung enthält. Da keine Drehachse vorliegt, ist x3 dabei die einzige ausgezeichnete Raumrichtung. Die Koordinaten x1 und x2 sind daher im wesentlichen an der Transformation unbeteiligt. Insbesondere wird die Zugehörigkeit eines Punktes zur x2 –x3 –Ebene (x1 = 0) oder zur x1 –x3 –Ebene (x2 = 0) nicht berührt, es gilt also x01 = ax1 und x02 = ax2 oder α11 = α22 = a und α12 = α13 = α14 = α21 = α23 = α24 = 0 . Der Koeffizient a kann nur vom Betrag der Geschwindigkeit v abhängen. Darum gilt umgekehrt nach dem Äuivalenzprinzip auch x1 = ax01 und x2 = ax02 , und wir folgern a = 1. Die Koordinaten x03 und x04 dürfen natürlich auch nicht von x1 und x2 abhängen, es gilt also α31 = α32 = α41 = α42 = 0 Die spezielle Lorentztransformation wird also durch eine Matrix der Form As = 47 1 0 0 0 0 0 0 1 0 0 0 α33 α34 0 α43 α44 (226) Wir benutzen imaginäre Zahlen nur als formales Hilfsmittel. Daher meinen wir wirklich ‘orthogonal’ und nicht ‘unitär’. 121 beschrieben. Die allgemeine Lorentztransformation erhält man durch Kombination von (226) mit räumlichen Drehungen48 . Wegen dieses Zusammenhangs interessieren wir uns nur für die speziellen Lorentztransformationen. Dabei können wir uns auf den zweidimensionalen Unterraum (x3 , x4 ) beschränken und die vereinfachte zweidimensionale(!) Anschrift x03 x04 ! =A ! x3 x4 mit A = α33 α34 α43 α44 ! (227) benutzen. Zur Bestimmung der vier Koeffizienten steht uns erstens die Aussage zur Verfügung, daß sich der Koordinatenursprung von K0 mit der Geschwindigkeit v längs der z–Achse bewegt, also x03 = 0 f ür x3 = vt = −iβx4 . Mit x03 = α33 x3 + α34 x4 [vgl. Gl. (227)] folgt daraus −α33 iβ + α34 = 0 oder α34 = iβα33 . (228) Damit ist die Herleitung schon fast abgeschlossen, denn der Rest folgt einfach aus den drei Orthogonalitätsbeziehungen 2 2 α33 + α34 = 1 2 α43 + α44 = 1 α33 α43 + α34 α44 = 0 . (229) 2 Aus Gl. (228) und der ersten Gl. (229) folgt sofort (1 − β 2 )α33 = 1, also α33 = √ 1 1 − β2 und α34 = √ iβ . 1 − β2 Nach den beiden andern Gln. (229) ist der Zeilenvektor (α43 , α44 ) zum Vektor (α33 , α34 ) orthogonal und hat den selben Betrag, bei richtiger Wahl des Vorzeichens gilt also α43 = −α34 und α44 = α33 . Damit ist die Matrix A= √1 1−β 2 −iβ √ 1−β 2 √ iβ 1−β 2 √1 1−β 2 (230) der spezielle Lorentztransformation bereits eindeutig festgelegt. 48 Die allgemeine Form ist A = D2 As D1 . Dabei bezeichnet D1 eine räumliche Drehung in K und D2 eine in K0 . 122 Die elegante mathematische Herleitung birgt die Gefahr in sich, daß der physikalische Hintergrund nicht mehr deutlich genug gesehen wird. Wir wollen deshalb zusätzlich eine elementare Herleitung der Lorentztransformation anfügen, die unmittelbar an unsere Grundprinzipien anknüpft, ohne explizit auf die lineare Algebra zurückzugreifen. Zur Stützung der Anschauung benutzen wir hierbei auch die ursprünglichen Bezeichnungen und vermeiden imaginäre Größen. Wir suchen also die Koeffizienten der Transformation z 0 = Az + Bt , t0 = Cz + Dt und benutzen dazu vier unabhängige Forderungen: 1. Wie oben spezifizieren wir die Bewegung des Koordinatenursprungs z 0 = 0 von K0 durch z = vt in K und erhalten entsprechend Gl. (228) B = −Av . 2. Die Lichtgeschwindigkeit in positiver z–Richtung ist in beiden Koordinatensystemen gleich: z = ct =⇒ z 0 = ct0 . Mit den Transformationsgleichungen erhalten wir daraus Ac + B = Cc2 + Dc . 3. Das selbe gilt für die negative z–Richtung: z = −ct =⇒ z 0 = −ct0 . Wir finden entsprechend Ac − B = −Cc2 + Dc . Wir können nun die Beziehungen aus 2. und 3. addieren und subtrahieren und erhalten B D = A und C = 2 . c Mit 1. nimmt dann unsere Transformation bereits die Gestalt z 0 = (z − vt)A , t0 = (− cv2 z + t)A an. Lediglich der Faktor A kann noch nicht festgelegt werden. Das ist auch verständlich, da ein gemeinsamer Faktor in der Transformation von Ort und Zeit die Lichtgeschwindigkeit nicht beeinflußt. Wir brauchen also noch eine vierte Bedingung, und die finden wir im 123 4. Relativitätsprinzip: K und K0 sind äquivalent, die Transformation zwischen K und K0 muß abgesehen von dem Vorzeichen von v symmetrisch sein. Lösen wir die Transformation nach z und t auf, erhalten wir z= 1 (z 0 + vt0 ) v2 (1 − c2 )A t= Das Relativitätsprinzip verlangt also 1 ( cv2 z 0 + t0 ). v2 (1 − c2 )A 1 2 (1 − vc2 )A A= oder A= q 1 1− v2 c2 . Auf diese Weise sehen wir ohne Anleihen bei der linearen Algebra, daß die grundlegenden Postulate, welche die Erfahrungen entsprechender Experimente zusammenfassen, notwendig auf die Transformationsgleichungen 0 z = z − vt q 1− v2 c2 0 , − cv2 z + t t = q 1− v2 c2 (231) mit den Umkehrungen v z 0 + vt0 z=q , 2 1 − vc2 c2 t= q z 0 + t0 1− v2 c2 (232) führen. Man überzeugt sich leicht, daß die Transformation (231) mit den Gln. (227) und (230) übereinstimmt. 5.4 Die Zeitdilatation Für unsere Anschauung bleibt es eine äußerst befremdliche Eigenschaft der Lorentztransformation, daß wir keine universelle Zeit einführen können, sondern die Zeiten t und t0 unterscheiden müssen. Gleichzeitige Ereignisse an verschiedenen Orten in K sind in K0 nicht mehr gleichzeitig, und umgekehrt. Die Uhren in K und in K0 gehen außerdem verschieden schnell. Und welche geht dabei schneller? Eine Uhr bei z = z0 in K gebe die Zeitsignale t1 und t2 . Dann erscheint das Zeitintervall t2 − t 1 t02 − t01 = √ 1 − β2 (233) √ in K0 um den Faktor 1/ 1 − β 2 gegenüber dem Zeitintervall t2 − t1 in K gedehnt. 124 Wir wollen das formale Ergebnis direkt auf die Konstanz der Lichtgeschwindigkeit zurückführen. Zur Zeit t1 = 0 werde in K am Ort z0 = 0 ein Lichtblitz in y– Richtung ausgesandt, an einem Spiegel Sy im Abstand ly reflektiert und zur Zeit t2 = 2ly /c wieder am Ort z = 0 empfangen. Ein Beobachter in K0 registriert das Aussenden des Lichtblitzes am Ort z10 = 0 zur Zeit t01 = 0. Er empfängt das reflektierte Licht aber an einem anderen Ort z20 = −vt02 (siehe Skizze). y ly 0 y K Sy ly z 0 0 K’ Sy z’ −vt’2 0 In K0 hat das Licht also nicht den Weg 2ly , sondern den längeren Weg q 2 ly2 + ( 12 vt02 )2 zurückgelegt und dafür eine längere Zeit gebraucht. Die Auswertung können wir direkt vom Lichtweg cty im Michelson–Experiment (S. 118) übernehmen, wir erhalten Gl. (233). Ein Beobachter in K0 stellt also fest, daß die Uhren in K nachgehen. Woher kommt diese Unsymmetrie? Kann ich nun doch zwischen ’ruhenden’ und ’bewegten’ Koordinatensystemen unterscheiden? Ist etwa dasjenige System absolut ruhend, in dem die Uhren am allerlangsamsten gehen? Natürlich nicht! Das Ergebnis ist inhaltlich auch gar nicht unsymmetrisch, denn ein Beobachter in K wird genauso feststellen, daß die Uhren in K0 nachgehen! Die formale Unsymmetrie wird ausschließlich durch unsymmetrische Beobachtungsbedingungen erzeugt. Wir haben oben nämlich eine Uhr an einem bestimmten Ort in K mit zwei synchronisierten Uhren an verschiedenen Orten in K0 verglichen. Langsamer geht also immer die eine Uhr, die in ihrem Koordinatensystem ruht. Eine natürliche Uhr, die das illustriert, finden wir in den Myonen, welche die kosmische Strahlung am Rand der Atmosphäre, also in etwa 10 km Höhe bildet. Während seiner typischen Lebensdauer von τµ = 2.2 · 10−6 s kann ein Myon nämlich höchstens die Strecke cτµ = 660 m zurücklegen. Wenn wir an der Erdoberfläche trotzdem solche Myonen finden, so bedeutet das, daß unsere Uhren schneller gehen als die innere Uhr des Myons. Denn zwischen der Erzeugung des 125 Myons und seinem Nachweis vergeht auf der schnellebigen Erde eine Zeit von etwa 15τµ . Man beachte hier wieder die Unsymmetrie einer Uhr (τµ ) im System des Myons und zweier räumlich getrennter Uhren (Erzeugung und Nachweis) auf der Erde. Von der ruhenden Erde aus gesehen kann ein schnelles Myon also ein biblisches Alter von mehr als 15τµ erreichen. Und von diesem Gedanken aus ist nur noch ein kurzer Schritt zum Zwillingsparadoxon. Der Zwilling, der seinen Bruder im schnellen Raumschiff ins All geschickt hat, findet nämlich, daß dessen Uhr, Herzschlag, Gedanken, Gefühle und schließlich der gesamte Alterungprozeß verlangsamt ablaufen. Ein leicht vergessener Haken hierbei ist allerding zunächst, daß der Zwilling im Raumschiff das selbe über seinen Bruder auf der Erde feststellt. Zum Paradoxon wird diese Science fiction story erst, wenn der jugendliche Raumfahrer zur Erde zurückkeht und nun im selben Bezugssystem seinem greisen Bruder gegenübersteht. Die Äquivalenz der beiden Systeme ist nun durch die Umkehr des Raumschiffes aufgehoben. 5.5 Die Lorentzkontraktion Im Bezugssystem K seien zwei Meilensteine bei z1 und z2 aufgestellt. Diese Meilensteine werden nun von K0 aus zu einer Zeit t0 vermessen. Da wir beide Meilensteine zur gleichen Zeit t0 (und nicht t !) beobachten, gehen wir von der Umkehr transformation (232) aus und erhalten den Zusammenhang z20 − z10 = q 1 − β 2 (z2 − z1 ) . (234) √ Wegstrecken und Maßstäbe in K erscheinen also in K0 um den Faktor 1 − β 2 verkürzt. Man nennt diesen Effekt Lorentzkontraktion oder Lorentz–Fitzgeraldsche Längenkontraktion. Wir brauchen kaum noch zu erläutern, daß wir wieder nur eine scheinbare Unsymmetrie zwischen K und K0 haben. Ein in K0 ruhender Maßstab erscheint von K aus gemessen genau so verkürzt, wie der in K ruhende von K0 aus. Formal haben wir eine Unsymmetrie durch die Forderung der Gleichzeitigkeit t01 = t02 in K0 erzeugt. In Wirklichkeit ist immer nur dasjenige System ausgezeichnet, in dem der Maßstab ruht. In diesem System ist der Maßstab länger als in allen anderen Systemen. Entsprechend war bei der Zeitdilatation dasjenige Koordinatensystem ausgezeichnet, in dem die beobachtete Uhr ruht: In diesem System geht die Uhr langsamer als in allen andern Koordinatensystemen. Nun sind Raum und Zeit als Komponenten einer zusammengehörigen Raum– Zeit im Minkowskiraum im wesentlichen gleichberechtigt, und auch die Lor126 entztransformation spiegelt die wesentliche Symmetrie von Raum und Zeit wider. Woher kommt denn dann die Unsymmetrie einer Zeitdehnung und einer Längenkontraktion, wenn man das durch die Versuchsbedingungen ausgezeichnete Eigensystem, in dem Uhr und Maßstab ruhen, verläßt? Diese Unsymmetrie zwischen Raum und Zeit ist in der unsymmetrischen Meßvorschrift begründet: • Bei der Zeitdilatation messen wir zwei Zeitmarken einer Uhr, die in K lokalisiert ist. Die beiden Zeitmessungen in K0 erfolgen also bei gleichen Ortskoordinaten in K. • Bei der Lorentzkontraktion führen wir dagegen die beiden Ortsmessungen in K0 gleichzeitig, d.h. bei gleichen Zeitkoordinaten in K0 aus. Tatsächlich besteht ein enger innerer Zusammenhang zwischen der Lorentzkontraktion und der Zeitdilation, wie man sofort an einer Uminterpretation der Myonenbeobachtung aus dem vorigen Abschnitt erkennt: Der Abstand zwischen dem Erzeugungsort (Atmosphärenrand) und dem Nachweisort (Erdoberfläche) definiert einen Maßstab, der im System der Erde ruht. Vom System eines schnellen Myons aus gesehen erscheint dieser Abstand (∼ 10 km) so verkürzt (< 660 m), daß es ihn während seiner kurzen Lebensdauer τµ durchlaufen kann. Aufgrund der Lorentzkontraktion erwartet man typische Verzerrungen der Gestalt schnell bewegter Objekte auf der Photoplatte oder auf der Netzhaut. Denn gerade der Verschluß des Fotoapparats demonstriert uns anschaulich die Bedingung der Gleichzeitigkeit in K0 . Natürlich ist eine experimentelle Überprüfung wegen der Kleinheit des Effekts bei realistischen Fotoobjekten nicht möglich. Darum war die Menschheit in dieser Frage auch lange einem Irrtum erlegen. In Wirklichkeit machen nämlich konkurrierende Laufzeiteffekte des Lichts die Lorentzkontraktion (lokal) unsichtbar ! Wir zeigen das beispielhaft an einem achsenparallelen Würfel (in der Skizze durch das Quadrat ABCD repräsentiert), der sich mit der Geschwindigkeit v in z– Richtung bewegt, und durch ein paralleles Lichtbündel auf eine Fotoplatte in der xy-Ebene abgebildet wird (siehe Skizze auf der folgenden Seite). Das Bild A0 B0 der Grundseite AB erscheint zwar auf der Photoplatte wegen der Lorentzkontraktion mit der verkürzten Länge q l2 = l 1 − β 2 . Wegen der Endlichkeit der Lichtgeschwindigkeit erreicht aber zum gleichen Zeitpunkt auch noch Licht die Photoplatte, das zu früheren Zeitpunkten von Punkten der Seite DA ausgesandt wurde. Das Bild D0 A0 dieser Seite hat die Länge l1 = vl = βl . c 127 D C D C C D B l α l v l A A’ l A B l A B’ l1 D’ α B l2 A’ B’ D’ l1 l2 A’ B’ Auf dem Bild sieht man folglich ein unverzerrtes Quadrat der unveränderten Seitenlänge l, das aufgrund der Lorentzkontraktion und der endlichen Laufzeit des Lichts um einen Winkel α mit sin α = β gedreht erscheint. Entsprechende Verhältnisse findet man bei parallelen Lichtbündeln (kleinen Raumwinkeln) für alle Beobachtungsrichtungen. Da der Drehwinkel jedoch von der Richtung abhängt, erscheinen größere Objekte verbogen. 5.6 Die Gruppeneigenschaft der Lorentztransformation Wir gehen mit einer Lorentztransformation x03 x04 ! x3 x4 =A ! mit A = q 1 1 − β12 1 iβ1 −iβ1 1 ! von einem Koordinatensystem K zu einem System K0 und von da aus mit einer zweiten Lorentztransformation x003 x004 ! x03 x04 =B ! mit B = q 1 1 − β22 1 iβ2 −iβ2 1 ! zu einem Kordinatensystem K00 über. Wie sieht dann die Gesamttransformation x003 x004 ! =C x3 x4 ! mit C = BA aus? Zur Beantwortung dieser Frage rechnen wir BA = AB = q 1 (1 − β12 )(1 − β22 ) 128 1 + β 1 β2 i(β1 + β2 ) −i(β1 + β2 ) 1 + β1 β2 ! 1 1 + β 1 β2 = q 1 − β12 − β22 + β12 β22 = q (1 + β1 β2 )2 − 2β1 β2 − β12 − β22 = q (1 + β1 β2 )2 − (β1 + β2 )2 = q β1 +β2 −i 1+β 1 β2 1 + β 1 β2 1 + β 1 β2 1 (1 − β 2 1 iβ −iβ 1 ! β1 +β2 i 1+β 1 β2 1 ! 1 iβ −iβ 1 1 iβ −iβ 1 mit β = ! ! β1 + β 2 . 1 + β 1 β2 Die Hintereinderausführung zweier spezieller Lorentztransformationen mit β1 = v1 /c und β2 = v2 /c ergibt also wieder eine Lorentztransformation mit β= β1 + β 2 1 + β 1 β2 oder v = βc = v1 + v 2 . 1 + v1c2v2 (235) Die Lorentztransformationen bilden also eine em Gruppe49 . Dieses Ergebnis ist nicht überraschend. Physikalisch hätten wir es eigentlich sofort aus dem Relativitätsprinzip postulieren können, und mathematisch lassen sich sich die Lorentztransformationen der x3 –x4 –Ebene eineindeutig auf die Drehungen in der Ebene abbilden, die ebenfalls eine Gruppe bilden. Wichtiger als die Feststellung, daß die Hintereinanderausführung von Lorentztransformationen wieder eine Lorentztransformation ergibt, ist für uns die Aussage, wie wir die Gesamttransformation erhalten. Die Vorschrift (235), nach der die Gesamtgeschwindigkeit v zu bilden ist, nennt man das Einsteinsche Additionstheorem der Geschwindigkeiten. Die Tatsache, daß sich Geschwindigkeiten nicht einfach additiv zusammensetzen, kann uns nach der Relativierung von Raum und Zeit kaum noch überraschen. Das additive Gesetz unserer Alltagserfahrung ergibt sich lediglich im Grenzfall v1/c, v2/c → 0, sonst gilt für v1 , v2 > 0 immer v < v1 + v2 . Eine wichtige Konsequenz von Gl. (235) ist die prinzipielle Unmöglichkeit, durch Addition von Geschwindigkeiten v1 < c und v2 < c Überlichtgeschwindigkeiten v > c zu erhalten. Denn für 0 < β1 < 1 und 0 < β2 < 1 folgt 1 + β1 β2 = (1 − β1 )(1 − β2 ) + β1 + β2 > β1 + β2 , also β < 1. 49 Hierzu muß außerdem das Assoziationsgesetz, das Einselement und die Umkehrtransformation nachgewiesen werden. Die Ausführung spezieller Lorentztransformationen ist nach der obigen Rechnung sogar kommutativ, sie bilden also eine abelsche Gruppe. 129 Für v2 = c wird v = c unabhängig von v1 . Dies zeigt noch einmal die Lorentzinvarianz der Lichtgeschwindigkeit. Wir kommen noch einmal darauf zurück, daß wir eine Transformationsmatrix A= √1 1−β 2 √−iβ 1−β 2 √ iβ 1−β 2 √1 1−β 2 als Drehung in der Ebene auffassen können. Der Drehwinkel ϕ = iϑ ist dabei allerdings imaginär. Wir können dem Rechnung tragen, indem wir die von Drehungen in der Ebene vertrauten Kreisfunktionen durch Hyperbelfunktionen ersetzen. Mit β= v = tanh ϑ c folgt dann A= cosh ϑ i sinh ϑ −i sinh ϑ cosh ϑ ! . Das Additionstheorem (235) entspricht der Additionsformel tanh (ϑ1 + ϑ2 ) = tanh ϑ1 + tanh ϑ2 1 + tanh ϑ1 tanh ϑ2 des Hyperbeltangens und zeigt, daß die Hintereinanderausführung zweier Transformationen mit ϑ1 und ϑ2 einer Gesamttransformation mit ϑ = ϑ1 +ϑ2 entspricht. Damit wird auch die Unerreichbarkeit der Lichtgeschwindigkeit noch einmal illustriert (siehe Skizze). c v ϑ v2 ϑ2 v1 ϑ1 ϑ1 c tanh ϑ 0 5.7 0 1 ϑ 2 Kovariante Formulierung einer Theorie Das Relativitätsprinzip verlangt, daß Naturgesetze Lorentz–invariant sind, daß sie also in gleicher Form in K und in K0 gelten, wenn K und K0 durch eine Lorentztransformation verknüpft sind. Wie stellen wir die Lorentzinvarianz sicher? 130 Der Vierervektor x = (xν ) = (x, y, z, ict) transformiert sich bei einer Lorentztransformation gemäß der Beziehung x0 = Ax oder x0ν = X aνµ xµ , µ wobei die Matrix A = (aνµ ) eine Drehung des Minkowskiraums beschreibt. Alle andern Vektoren y = (yν ) des Minkowskiraums transformieren sich daher nach dem selben Schema X aνµ yµ , y0 = Ay oder yν0 = µ ihre Koeffizienten yν ändern sich kovariant mit den Koeefizienten xν . Da die Lorentztransformationen A orthogonal sind, lassen sie Skalarprodukte50 zwischen den Vektoren des Minkowskiraums invariant. Wir brauchen uns um die Lorentzinvarianz eines physikalischen Gesetzes also gar nicht mehr zu kümmern, wenn wir es konsistent als Beziehung a=b zwischen Vektoren a = (aν ) und b = (bν ) oder als Beziehung a=b zwischen Skalaren a und b des Minkowskiraums formulieren. Die entsprechende Feststellung für Vektoren und Skalare im dreidimensionalen Euklidischen Raum erscheint uns so selbstverstänlich, daß wir sie nie explizit erwähnt haben. Newtons Lex secunda ṗ = F und der Energiesatz E = const beispielsweise gelten unabhängig von der Orientierung des Koordinatensystems. (Beachte dabei aber, daß eine Vektorkomponente, etwa Fz , kein Skalar ist!) Eine solche konsistente Formulierung heißt kovariant, ihre Elemente51 nennen wir Vierer–Vektoren und Vierer–Skalare oder Lorentz–Skalare. Nicht kovariant ist also z.B. eine Beziehung a3 = b zwischen einer Vektorkomponente und einem Skalar, denn der Skalar bleibt bei einer Lorentztransformation invariant, während die Vektorkomponente sich ändert. Nun ist natürlich nicht jedes Schema von vier Zahlen (z.B. [Länge, Breite, Höhe, Gewicht]) ein Vektor des Minkowskiraums, und — was für uns besonders wichtig ist — nicht jeder Vektor des R3 läßt sich zu einem Vierer–Vektor ergänzen. Vektorbeziehungen im R3 müssen vor einer vierdimensionalen Ergänzung also im allgemeinen abgeändert werden. 50 Wir erinnern an Fußnote 47, S. 121. Skalarprodukte sind also ebenfalls ohne komplexe Konjugation zu verstehen! 51 Eine Verallgemeinerung auf Vierer–Tensoren sparen wir uns hier. Neben der hier bevorzugten Terminologie werden auch die Bezeichnung Welt–Vektoren und Welt–Skalare verwendet. 131 Wie finde ich dann Vierer–Vektoren? Erstens, indem ich von bekannten Vierer–Vektoren a, b, . . . ausgehe und mich überzeuge, daß damit auch a ± b und ca Vierer–Vektoren sind, wenn nur c einen Skalar ist. Und Skalare sind neben reinen Zahlwerten und physikalischen Konstanten (Lichtgeschwindigkeit, Ladung, (Ruh–)Masse usw.) insbesondere die Skalarprodukte a·b= 4 X a ν bν ν=1 von Vierer–Vektoren. Die zweite Möglichkeit besteht darin, eine als Lorentz–invariant erkannte (oder postulierte) Größe a als Skalarprodukt mit einem bereits bekannten Vierervektor zu deuten. Hiervon wird insbesondere bei der kovarianten Formulierung der Elektrodynamik Gebrauch gemacht52 . Wir nutzen hier die erste Möglichkeit und gehen von dem Vierer–Ortsvektor x = (x, y, z, ict) aus, der uns ein Punkt–Ereignis (Ort, Zeitpunkt) im Minkowskiraum lokalisiert. Als ersten neuen Vierer–Vektor bilden wir den Differenzvektor d = x 2 − x1 , der den Abstand zweier Punktereignisse x1 und x2 im Minkowskiraum repräsentiert. Sein Abstandsquadrat 2 d = 3 X i=1 2 (x2i − x1i )2 − c2 (t2 − t1 )2 = r12 − c2 (t2 − t1 )2 kann kleiner oder größer als Null sein, je nachdem die räumliche Distanz r12 in der Zeitspanne |t2 − t1 | durch Licht überbrückt werden kann oder nicht, oder — salopp ausgedrückt — je nachdem die zeitliche oder räumliche Distanz überwiegt. Finden die Ereignisse x1 und x2 insbesondere am selben Ort statt, so wird d2 = −c2 (t2 − t1 )2 < 0, 52 Ein Beispiel: Der Vierer–Vektor (Aν ) = (Ax , Ay , Az , iϕ/c) wird eingeführt, indem man die als Lorentz–invariant postulierte Lorentzeichung div A + c−2 ∂ϕ/∂t = 0 über das SkalarproP dukt ∂Aν /∂xν mit dem Vierer–Vektor ∇4 = (d/dxν ) deutet. 132 der Abstand ist “zeitartig”. Finden sie dagegen zur gleichen Zeit statt, so ist der Abstand “raumartig” und es gilt 2 d2 = r12 > 0. Wir verallgemeinern die Begriffe und nennen • Vierervektoren mit negativem Betragsquadrat zeitartig und • Vierervektoren mit positivem Betragsquadrat raumartig. Man kann durch eine räumliche Drehung im R3 stets erreichen, daß der räumliche Anteil des Abstandes in x3 = z–Richtung fällt. Mit Gl. (231) lassen sich dann die folgenden beiden Aussagen leicht beweisen: Ist der Abstand d = x2 − x1 zweier Punktereignisse x1 und x2 • zeitartig, so läßt sich immer eine Lorentztransformation mit v < c in ein Koordinatensystem K0 angeben, in dem die beiden Ereignisse am gleichen Ort stattfinden. • raumartig, so läßt sich immer eine Lorentztransformation mit v < c in ein Koordinatensystem K0 angeben, in dem die beiden Ereignisse gleichzeitig stattfinden. Der Minkowskiraum wird durch den Lichtkegel (seine Projektion auf den R3 ist die Lichtkugel) r 2 = c 2 t2 in zeit– und raumartige Gebiete geteilt (siehe Skizze). Dabei ist wichtig, daß all diese Begriffe wegen der Definition über ein Skalarprodukt Lorentz–invariant sind. ct l Li e eg ch tk tk ch eg e l Li Zukunft zeitartig Gegenwart Gegenwart raumartig raumartig Vergangenheit zeitartig 133 z Die Gegenwart wird im Minkowskiraum durch die Hyperebene t = 0 (also durch die z–Achse in der Skizze) repräsentiert. Da sich alle raumartigen Vektoren so transformieren lassen, daß die Zeitkomponente t0 = 0 wird, ist es sinnvoll, den gesamten raumartigen Bereich als Gegenwart zu bezeichnen. Die Gegenwart teilt den zeitartigen Bereich in die Zukunft und in die Vergangenheit. Hängt das Ereignis 2 kausal von Ereignis 1 ab, so liegt x2 von x1 aus gesehen in der Zukunft. Der Abstand x2 − x1 ist also zeitartig und es gilt (in allen Koordinatensystemen) t2 > t 1 . Wir betrachten nun insbesondere Punktereignisse, die zur Bahn eines Teilchens im Minkowskiraum gehören. Ihr Abstand ist wegen v < c auf jeden Fall zeitartig, und wir benutzen ihn, um das Lorentz–invariante Differential dτ der Eigenzeit zu definieren: 2 2 c dτ = − 4 X ν=1 2 2 3 X 2 (dxν ) = c dt − oder dτ = i=1 q (dxi )2 = (c2 − v 2 )dt2 1 − β 2 dt . (236) Offenbar ist die Eigenzeit τ die Zeit, welche in einem System abläuft, in dem das Teilchen (momentan) ruht (β = 0). Sie verläuft langsamer als die Zeit in jedem andern Kordinatensystem. Wir können hier unmittelbar an die Diskussionen im Abschnitt 5.5 anknüpfen: Die Eigenzeit τ ist ein Maß für die Zahl der Herzschläge des Raumfahrers im Zwillingsparadoxon, und sie mißt die myonische Lebenserwartung τµ im System des Myons. In der Anschrift dt = √ dτ 1 − β2 sehen wir auch unmittelbar die Zeitdilatation, mit der ein äußerer (also gegenüber dem Teilchen bewegter !) Beobachter die innere Uhr des Teilchens registriert. Da das Differential dτ der Eigenzeit Lorentz–invariant ist, wäre es verlockend, hiervon ausgehend eine Weltzeit τ zu definieren. Das ist aber nicht möglich, da die im System gemessene Zeitspanne ∆τ = Z dτ Weg nach Ausweis des Zwillingparadoxonsnicht wegunabhängig ist. Aus dem Vierer–Vektor x und dem Lorentz–Skalar dτ können wir den Vektor der Vierer–Geschwindigkeit u= dx dτ oder uν = 134 dxν 1 dxν =√ dτ 1 − β 2 dt (237) bilden. Aus der expliziten Anschrift ui = √ vi (i = 1, 2, 3) 1 − β2 und u4 = √ ic 1 − β2 (238) lesen wir erstens ab, daß seine räumlichen Komponenten für β → 0 in die gewöhnlichen Geschwindigkeiten53 vi übergehen, während als vierte Komponente die Lichtgeschwindigkeit c erscheint. Zweitens finden wir, daß sein Betragsquadrat X ν u2ν = c2 v2 − = −c2 1 − β2 1 − β2 (239) konstant und negativ ist. u ist also ein zeitartiger Vierer–Vektor. Schließlich liegt es noch nahe, durch Multiplikation mit der Masse m0 den Vierer– Impuls p = m0 u oder pν = m0 uν (240) mit den expliziten Koeffizienten m0 v i pi = √ = mr vi (i = 1, 2, 3) 1 − β2 und im0 c p4 = √ = imr c 1 − β2 (241) zu bilden. Durch die Einführung der “relativistischen Masse” mr = √ m0 1 − β2 (242) wird diese Beziehung besonders suggestiv. Um Verwechslungen auszuschließen, haben wir die Lorentz-invariante Masse m0 mit dem Index 0 versehen und bezeichnen sie als Ruhmasse. Im Gegensatz zu m0 wächst mr also mit der Geschwindigkeit und hängt damit vom Bezugssystem ab. Über die Frage, ob die Ruhmasse oder die relativistische Masse54 als die eigentliche Masse m angesehen werden soll, ist gelegentlich mit Eifer gestritten worden. Während die Unabhängigkeit vom Bezugssystem für m0 spricht, liefert der folgende Abschnitt auch starke Argumente für mr . Wir sehen in dem Problem letztlich eine Geschmacksfrage und vermeiden die mißverständliche Bezeichnung m ohne Index 0 oder r. Damit haben wir die Elemente zusammengetragen, die wir für eine relativistische Korrektur der klassischen Mechanik benötigen. 53 Beachte: v selbst läßt sich für β 6= 0 nicht zu einem Vierer–Vektor ergänzen! In älteren Darstellungen findet man daneben auch noch longitudinale und transversale Massen, vgl. Gl. (258) und Fußnote 55 auf S. 141. 54 135 5.8 Relativistische Mechanik Daß die drei Komponenten der Vektoren ṗ = m0 v̇ und F aus Newtons Lex secunda dpi = Fi dt (243) sich nicht zu einem Vierer–Vektor ergänzen lassen, wissen wir bereits. Denn die Lex secunda ist Galilei– und nicht Lorentz–invariant. Wir haben aber bereits den kovarianten Vierer–Impuls p eingeführt [Gln. (240, 241)]. Seine Ableitung nach der Lorentz–invarianten Eigenzeit τ ist wieder ein Vierervektor. In Anlehnung an die Lex secunda bezeichnen wir diesen Vierer–Vektor als Minkowski– Kraft K= dp dτ oder Kν = dpν . dτ (244) Wie hängen nun die räumlichen Komponenten Ki mit den Newtonschen Kraftkomponenten Fi zusammen? Um das zu entscheiden, brauchen wir eine kovariante Formulierung der Kraft. Die steht zwar eigentlich nur für elektromagnetische Kräfte zur Verfügung, man kann jedoch argumentieren, daß andere Kräfte sich ebenso transformieren müssen wie elektromagnetische. Denn der Begriff des Gleichgewichts muß Lorentz–invariant sein. Wir verzichten hier auf diese Anleihe bei der kovarianten Elektrodynamik, verlassen uns auf die “prophetische Sicherheit” der Newtonschon Formulierung (Sommerfeld, vgl. S. 3) und definieren die Newtonsche Kraft F durch Gl. (243). Allerdings soll dabei pi nicht m0 vi , sondern im Einklang mit den Gln. (241) und (244) die räumlichen Komponenten m0 v i pi = m r vi = √ 1 − β2 √ des Viererimpulses bezeichnen. Wegen dτ = 1 − β 2 dt folgt so der Zusammenhang Ki = √ Fi (i = 1, 2, 3) , 1 − β2 (245) der natürlich mit der elektrodynamischen Formulierung übereinstimmt. Wir könnten nun an dieser Stelle das ganze Raum–Zeit–Gefüge der Speziellen Relativitätstheorie vergessen, den Minkowskiraum verlassen und als einzige relativistische Korrektur die veränderliche Masse mr in Newtons Lex secunda 136 aufnehmen: d (mr vi ) = Fi . dt (246) So werden wir im nächsten Abschnitt verfahren. Im Augenblick bleiben wir jedoch noch im Minkowskiraum und fragen nach der vierten Komponente der Minkowski–Kraft. Dazu bilden wir nach Gln. (240) und (244) du m0 d 2 K · u = m0 u · = u = 0, dτ 2 dτ denn u2 ist nach Gl. (239) konstant. Die Minkowski–Kraft steht also stets senkrecht auf der Vierer–Geschwindigkeit. Damit läßt sich die Komponente K4 aus K1 , K2 , K3 berechnen, denn aus X ν 3 X 1 √ Kν uν = Ki vi + icK4 = 0 1 − β 2 i=1 ! folgt wegen Gl. (245) i F·v K4 = √ . c 1 − β2 (247) K4 hängt also eng mit der von der Kraft F je Zeiteinheit geleisteten Arbeit F · v zusammen. Sehen wir uns dazu die vierte Komponente der “Bewegungsgleichung” (244) an [vgl. auch (241)]: dmr dp4 i F·v √ = ic . = K = 4 c 1 − β2 dτ dτ Mit dτ = √ 1 − β 2 dt folgt also d mr c 2 = F · v . dt Der Zusammenhang dA = F · vdt = dT zwischen der durch die Kraft F geleisteten Arbeit dA und der Zunahme dT der kinetischen Energie zwingt uns also, den Ausdruck m0 c 2 T = m r c2 = √ 1 − β2 (248) — abgesehen von einer zunächst bedeutungslosen additiven Konstanten — als die relativistische kinetische Energie anzusehen. Durch Entwicklung der Wurzel folgt 137 T → m0 c 2 β2 1+ 2 ! 1 = m 0 c 2 + m0 v 2 2 (β → 0) . (249) Damit ist der Zusammenhang mit der nicht-relativistischen Energie T = m0 v 2 /2 hergestellt. Die willkürlich erscheinende additive Konstante E0 = m 0 c2 , (250) die Ruhenergie des Teilchens, ziehen wir nicht ab, weil T nur mit dieser Konstanten als vierte Komponente des Vierer-Impulses [vgl. Gl. (241)] angesehen werden kann: m0 v i = mr vi (i = 1, 2, 3) pi = √ 1 − β2 und i p4 = T . c (251) Der Vierer–Vektor p wird darum auch als Energie–Impuls–Vektor bezeichnet. Wegen p = m0 u ist sein Betragsquadrat konstant und es gilt [vgl. Gl. (239)] p2 = −m20 c2 = X i p2i − T2 . c2 Daraus folgt die häufig benutzte relativistische Beziehung 2 T = m20 c4 +c 2 3 X p2i (252) i=1 zwischen kinetischer Energie und Impuls. Die Bewegungsgleichungen (244) im Minkowskiraum lassen sich mit den Gln. (245), (247) und (251) in der klassischen Form dpi = Fi dt und dT =F·v dt (253) schreiben, der man ihren relativistischen Hintergrund gar nicht mehr ansieht. Speziell für die kräftefreie Bewegung mit F = 0 folgt auch wieder, daß sowohl p als auch T konstant sind. Im Gegensatz zur nicht–relativistischen Mechanik ist nun aber T keine sekundäre, abgeleitete Größe mehr, sondern der Impuls p und die kinetische Energie T gehören nun a priori zu einem einheitlichen Ganzen zusammen. Das hat für Systeme mit inneren Freiheitsgraden Konsequenzen von fundamentaler Bedeutung: Während es in der nicht–relativistischen Mechanik — etwa bei inelastischen Stoßprozessen — sehr wohl Situationen gibt, in denen der Impuls, nicht aber die kinetische Energie erhalten bleibt, verlangt die Lorentz–invarianz nach Ausweis der 138 kovarianten Formulierung, daß bei Impulserhaltung auch die kinetische Energie T = mr c2 erhalten bleibt. Das ist in voller Allgemeinheit offenbar nur möglich, wenn die Masse m0 nicht generell konstant ist, sondern über die berühmte Einsteinsche Beziehung ∆E = ∆m0 c2 (254) mit einer eventuellen Änderung ∆E der inneren Energie verknüpft ist. Betrachten wir etwa den Zerfallsprozeß eines ruhenden Teilchens der Masse m0 , so haben wir vor bzw. nach dem Zerfall die kinetische Energien T0 = m 0 c 2 bzw. T1 = X mir c2 = X (mi0 c2 + i ), wenn mi0 die Massen und i die Bewegungsenergien der Zerfallsprodukte bezeichnet. Da wegen der Impulserhatung aber T1 = T0 gelten muß, folgt m0 = X mi0 + ∆E/c2 , wobei der “Massendefekt” ∆E/c2 der Änderung ∆E = entspricht. P i der inneren Energie Für unsere alltägliche Erfahrung ist diese Massenänderung allerdings nicht sehr groß: Das Äquivalent einer Kilowattstunde beträgt ∆m(1kWh) = 3.6 · 106 Ws = 0.4 · 10−10 kg = 4 · 10−8 g , 9 · 1016 m2 /s2 oder anders ausgedrckt: Der Preis von 16 ct für Energie aus der Steckdose entspricht einem Preis von 4 Mio. EUR für 1g Materie! Als Einstein im Jahr 1905 die Äquivalenz von Masse und Energie formulierte, war es noch nicht möglich, diese fundamentale Aussage experimentell zu überprüfen. Heute ist die Bestätigung bekanntlich keine Frage mehr. 5.9 Die relativistische Bewegungsgleichung Wie bereits angkündigt, verlassen wir nun den Minkowskiraum und wenden uns den praktischen Problemen der relativistischen Bewegungsgleichung [vgl. (246)] d m0 mr v = F mit mr = q dt 1− v2 c2 (255) zu. Der einzige Unterschied zur nicht–relativistischen Mechanik zeigt sich also darin, daß sich die zeitliche Ableitung auch auf die veränderliche Masse mr erstreckt. Die Auswirkung demonstrieren wir an einem einfachen Beispiel: 139 Wir berechnen die Bewegung z(t) eines zur Zeit t = 0 ruhenden Elektrons in einem konstanten elektrischen Feld E = Eez . Die Bewegungsgleichung d m0 v √ = eE dt 1 − β 2 läßt sich sofort einmal integrieren: √ m0 v = eEt . 1 − β2 Wenn wir nach v auflösen, erhalten wir v=q ceEt m20 c2 + e2 E 2 t2 =q cvnr mit vnr = 2 c2 + vnr e Et . m0 (256) Für kleine Zeiten eEt/m0 c folgt also wie erwartet das nicht–relativistische Ergebnis v → vnr . Im Gegensatz zu vnr bleibt v aber immer kleiner als c und strebt für große Zeiten gegen c. Wenn wir Gl. (256) in der Form c dq 2 2 dz = m 0 c + e 2 E 2 t2 dt eE dt schreiben, können wir sogleich nochmals integrieren und erhalten s m0 c 2 z= eE ! e 2 E 2 t2 1+ −1 . m20 c2 Auch hier läßt sich das Grenzverhalten z → große Zeiten wieder leicht interpretieren. 1 eE 2 t 2 m0 für kleine bzw. z → ct für Wenn wir das Ergebnis in der Form s eEz + m0 c2 = m0 c2 1 + 2 vnr c2 schreiben und Gl. (256) nach 1+ 2 vnr 1 = . 2 c 1 − v 2 /c2 umformen, sehen wir, daß die Bewegung den Energiesatz erfüllt. m c2 √ 0 2 − eEz = T + V = m0 c2 = const 1−β 140 (257) In diesem einfachen Beispiel haben wir eine eindimensionale Bewegung betrachtet. Allgemein erhalten wir aus Gl. (255) m0 v · v̇ m0 v · v̇ v= √ v v̇ + 2 F = mr v̇ + v 2 3/2 2 c (1 − β 2 ) 1−β (1 − c2 ) ! . F und v̇ haben also im allgemeinen nicht mehr die selbe Richtung55 . Für die Komponenten parallel (k) und senkrecht (⊥) zu v erhalten wir m0 v̇k = Fk (1 − β 2 )3/2 √ und m0 v̇⊥ = F⊥ . 1 − β2 (258) [Zur Vertiefung unseres Verständnisses wollen wir Gl. (258) aus der unterschiedlichen Sicht verschiedener Koordinatensysteme interpretieren. K 0 sei das Koordinatensystem, in dem das Teilchen momentan ruht. Die Beschleunigung wird in K 0 also durch Newtons Lex secunda dvk0 dv 0 m0 0 = Fk0 und m0 ⊥0 = F⊥0 dt dt beschrieben. Nach dem Additionstheorem (235) gilt v + dvk = v + dvk0 1 + vdvk0 /c2 = (v + dvk0 )(1 − vdvk0 /c2 ) = v + (1 − v 2 /c2 )dvk0 , also dvk . 1 − β2 Für die ⊥–Bewegung gilt x0 = x, also haben wir dt 0 v⊥ = 0 v⊥ . dt dvk0 = Mit dt0 = p 1 − β 2 dt folgt also m0 v̇k = Fk0 (1 − β 2 )3/2 m0 v̇⊥ = F⊥0 . 1 − β2 und (259) Zur Transformation der Kraft beziehen wir uns zunächst auf die kovariante Minkowskikraft F. Wegen v 0 = 0 in K0 erhalten wir nach (245) und (247) Ki0 = Fi0 und K40 = 0 . Ki0 transformiert sich nun mit der selben Lorentztransformation wie x 0i , also Kk = p Fk 1 (Kk0 − iβK40 ) = p 2 1−β 1 − β2 Im System K gilt schließlich nach (245) F i = Fk = Fk0 0 und K⊥ = K⊥ = F⊥0 . p und F⊥ = 1 − β 2 Ki , also q 1 − β 2 F⊥0 . (260) Damit geht die Bewegungsgleichung (259) in (258) über.] 55 Aufgrund dieser Tatsache sprach man früher der Masse einen Tensorcharakter zu und unterschied entsprechend Gl. (258) insbesondere die longitudinale und die transversale Masse. 141 5.10 Relativistischer Lagrangeformalismus Ausgehend von der Bewegungsgleichung (255) kann man wie im nicht–relativistischen Fall einen Lagrangeformalismus aufbauen: Der relativistische Impuls m0 v i pi = √ 1 − β2 läßt sich als Ableitung eines kinetischen Potentials G schreiben: ∂G pi = ∂vi mit G = −m0 c 2 s 1− v2 . c2 (261) Ist die Kraft in der Form ∂V ∂xi aus einem Potential V herleitbar, können wir daher die relativistische Lagrangefunktion Fi = − L = G − V = −m0 c 2 q 1 − β2 − V (262) einführen und erhalten die Bewegungsgleichung (255) in der Form d ∂L ∂L − = 0. dt ∂ ẋi ∂xi (263) Wir können auch wieder eine Hamiltonfunktion H= X i pi ẋi − L mit pi = ∂G ∂L = ∂ ẋi ∂ ẋi (264) bilden, deren Wert q m0 v 2 m0 c 2 2 2 √ √ H= + m0 c 1 − β + V = +V =T +V 1 − β2 1 − β2 (265) die Gesamtenergie repräsentiert. Wenn wir hier noch β durch die pi ausdrücken, erhalten wir die Bewegungsgleichungen in der kanonischen Form ṗi = − ∂H ∂xi und ẋi = 142 ∂H . ∂pi (266) Wir können auch Systeme von Massenpunkten betrachten, generalisierte Koordinaten einführen und erhalten wie im nicht–relativistischen Fall die Lagrangegleichungen d ∂L ∂L − = 0. dt ∂ q̇k ∂qk (267) Es gilt auch weiterhin, daß der zu einer zyklischen Variblen konjugierte Impuls konstant ist, und daß aus ∂L ∂H =− =0 ∂t ∂t der Energiesatz in der Form H = T + V = const (268) folgt. Schließlich können wir wie früher die elektromagnetischen Kräfte in den Formalismus einbinden, indem wir V durch ein generalisietes Potential (vgl. Abschnitt 2.4) U = eΦ − ev · A (269) ersetzen. Obwohl die Rechnung im Detail wesentlich komplizierter sein kann, läuft das Verfahren im Prinzip also wie im nicht–relativistischen Fall ab. Trotzdem sind einige kritischen Punkte zu erwähnen. • Zunächst ist aus systematischer Sicht zu bemängeln, daß der Formalismus zwar die relativistisch korrekten Bewegungsgleichungen liefert, aber nicht kovariant formuliert ist. Vielmehr bezieht er sich auf ein festes System K und benutzt die Zeit t in K als Parameter. Dies macht es schwierig, die Ergebnisse in ein anderes System zu übertragen. Nun ist es zwar grundsätzlich nicht schwierig, einen kovarianten Lagrangeformalismus aufzubauen, der direkt von der vierdimensionalen Bewegungsgleichung (244) ausgeht und mit u und τ statt mit v und t arbeitet (vgl. z.B. Goldstein Abschnitt 6-6). Es muß aber darauf hingewiesen werden, daß eine konsistente kovariante Beschreibung von Kräften nur in der Elektrodynamik zur Verfügung steht. Damit kommen wir bereits zu den wesentlichen Defiziten unserer speziellrelativistischen Theorie: • Statische Kräfte mit einer instantanen Fernwirkung (Wechselwirkungspotentiale Vij (rij ), Gravitation!) können nicht Lorentz–invariant formuliert werden, denn eine Wechselwirkung kann höchstens mit Lichtgeschwindigkeit übertragen werden. 143 • Aus dem selben Grund sind die meisten Zwangsbedingungen nicht mit der Lorentzinvarianz verträglich. Das gilt insbesondere für das gesamte Konzept des starren Körpers. • Beschleunigte Bezugssysteme, (insbesondere rotierende) Koordinatensysteme können nicht problemlos in eine speziell-relativistische Theorie integriert werden. Mit diesen Bemerkungen stehen wir bereits an der Schwelle zur allgemeinen Relativitätstheorie. Wenn wir diese umfassendere Theorie hier auch nicht mehr behandeln können, so wollen wir ihren Grundgedanken doch zur Überleitung in das letzte Kapitel dieser Vorlesung aufgreifen: 5.11 Grundgedanken zur allgemeinen Relativitätstheorie Wir hatten bereits im Zusammenhang mit dem Relativitätsprinzip (Fußnote 45 auf S. 116) die Schwierigkeit angedeutet, wahre und Scheinkräfte zu unterscheiden. Aus solchen Überlegungen heraus verallgemeinerte Einstein das Relativitätsprinzip bewegter Inertialsysteme zum allgemein relativistischen Äquivalenzprinzip beschleunigter Bezugssysteme: Mit der grundsätzlichen Äquivalenz von träger und schwerer Masse postulierte er, daß die Scheinkräfte in beschleunigten Koordinatensystem prinzipiell nicht von der Gravitation unterschieden werden können. Dieses Postulat hat die Konsequenz, daß der ohnehin schon befremdliche Minkowskiraum in der Nähe großer Massen auch noch gekrümmt ist. Damit ist beispielsweise gemeint, daß die Erdoberfläche (unmeßbar) kleiner ist als 4πrE2 . Die Krümmung betrifft aber auch die Zeit: • Uhren im Tal gehen langsamer als Uhren auf dem Berg! Darum ist es nicht gleichgültig, ob man erst eine Stunde das Tal entlang geht und dann eine Stunde lang aufsteigt oder ob man erst aufsteigt und dann einen Höhenweg benutzt. Die Differenz der Endpunkte dieser verschiedenen Wege in der Raum–Zeit deutet auf eine Krümmung der x3 –x4 –Ebene. Das Maß der Zeitdehnung findet man am leichtesten aus der Frequenzverstimmung h̄ω (1 + φ/c2 ) = h̄ω0 , welche der Energiesatz für Photonen im Gravitationspotential φ verlangt. Addieren wir versuchsweise die entsprechende Zeitverstimmung mit der Zeitdilation der speziellen Relativitätstheorie, so erhalten wir 144 q dτ = ( 1 − β 2 + φ/c2 )dt (270) als Differential der Eigenzeit. Und nun kommen wir noch einmal auf das Zwillingsparadoxon zurück: Der Bruder, der im gravitationsfreien Fall in seinem unbeschleunigten Inertialsystem bleibt, der also immer Newtons Lex prima ṗ = 0 erfüllt, altert schneller als sein Bruder, der irgendeinen andern Weg im Minkowskiraum wählt. Die gleichförmige Bewegung der Lex prima Newtons ist also im kräftefreien Fall dadurch ausgezeichnet, daß die Zeitspanne τ12 = Z(2) dτ (1) größer wird als bei jeder anderen Bewegung. Sollen nun Gravitation und Beschleunigung wirklich äquivalent sein, dann muß auch das “schwerelose” System K0 , das einem frei fallenden Körper folgt, ein kräftefreies Inertialsystem sein. Der frei fallende Körper, der nach der Lex prima in K0 ruht, muß also ebenfalls durch ein maximales τ12 ausgezeichnet sein. In dem nicht–schwerelosen “festen” System K ist dτ durch Gl. (270) gegeben. Mit der Lagrangefunktion [vgl Gl. (262] q L = −m0 c2 1 − β 2 − m0 φ finden wir den Zusammenhang dτ = − L dt . m0 c 2 Das Äquivalenzprinzip verlangt also für die Bewegung im Gravitationsfeld eine maximale Eigenzeit τ12 1 =− m0 c 2 Z(2) L dt . (271) (1) Wird diese Forderung von den Bewegungsgleichungen der Lex secunda erfüllt? Mit dieser Frage kommen wir zum Hamiltonschen Prinzip, mit dem wir nun das Schlußkapitel einleiten. 145 6 Hamilton–Jacobi–Theorie 6.1 Das Hamiltonsche Prinzip Wir haben das letzte Kapitel mit der Frage beendet, ob die Bewegung im Schwerefeld so verläuft, daß die Eigenzeit maximal wird. Wir fragen nun allgemeiner nach den Bedingungungen dafür, daß das Integral J= Z(2) F (q, q̇, t)dt (272) (1) extremal — oder genauer: stationär — wird. Mit dieser Frage soll präziser das folgende Problem charakterisiert werden: Wie muß bei • vorgebenem Startpunkt q(t1 ) = q1 zur Zeit t = t1 und bei • vorgebenem Endpunkt q(t2 ) = q2 zur Zeit t = t2 die Bahn q(t) im Konfigurationsraum gewählt werden, damit das Integral J ein Extremum annimmt? Dieses Problem stellt die Grundaufgabe der Variationsrechnung dar. Sie erinnert an das Aufsuchen von Extrema in der Differentialrechnung und läßt sich auch in der Tat darauf zurückführen. Wenn wir nämlich die (noch unbekannte) Lösung mit q(t) bezeichnen, setzen wir qk0 (t) = qk (t) + εηk (t) = qk + δqk (273) mit beliebigen Variationen ηk (t), die allein der Bedingung ηk (t1 ) = ηk (t2 ) = 0 unterworfen sind. Damit wird J eine Funktion von ε, die für ε = 0 ein Extremum annehmen soll. Das führt auf die Bedingung dJ δJ = ε = dε ε=0 Z(2) X f ( (1) k=1 ) ∂F ∂F δqk + δ q̇k dt = 0 . ∂qk ∂ q̇k (274) Ehe wir Gl. (274) auswerten, machen wir uns klar, daß wir notwendige Bedingungen für Extrema herleiten, die keineswegs hinreichend sind. Statt von extremalem 146 Verhalten sollten wir daher besser von stationärem Verhalten sprechen: δJ = 0 bedeutet, daß sich J bei einer infinitesimalen Variation der Bahn nicht ändert. Falls wirklich ein Extremum vorliegt, ist das im allgemeinen lokal zu verstehen. Außerdem können wir nicht zwischen einem Maximum und einem Minimum unterscheiden. Wegen der wichtigen Unterscheidung zu anderen Variationsprinzipien der Mechanik weisen wir auch nochmals auf unsere Variationsregeln hin: • Die Variationen δq beziehen sich ausschließlich auf die Bahn q(t) zwischen zwei festen Endpunkten q1 (t1 ) und q2 (t2 ) im Konfigurationsraum. • Die Zeit wird nicht variiert: δt = 0. Damit ist auch klar, was die Variationen δ q̇k der Geschwingkeiten in Gl. (274) bedeuten: Wenn wir Gl. (273) nach t differenzieren, erhalten wir nämlich q̇k0 (t) = q̇k (t) + εη̇k (t) = q̇k + δ q̇k oder d (δqk ) . (275) dt Die generalisierten Geschwindigkeiten können also nicht unabhängig variiert werden. Um diesen Zusammenhang einzuarbeiten, integrieren wir Gl. (274) partiell und erhalten δ q̇k = εη̇k = δJ = Z(2)X ( (1) k ∂F d ∂F − ∂qk dt ∂ q̇k ) δqk dt + X k t=t 2 ∂F δqk . ∂ q̇k t=t1 Der letzte Term dieser Gleichung verschwindet, weil wir die Randpunkte nicht variieren dürfen. Davon abgesehen sind die δqk = εηk (t) aber beliebige Bahnvariationen. Wir können deshalb insbesondere ηi = 0 f ür i 6= k und ηk (t0 ) = 0 f ür t0 6∈ (t − τ, t + τ ) (τ → 0) wählen und daraus schließen, daß die Klammern{} einzeln und in jedem Bahnpunkt verschwinden müssen: Bedingung dafür, daß das Integral (272) ein Extremum annimmt (stationär wird) ist also, daß q(t) die Euler– Lagrange–Gleichungen ∂F d ∂F − =0 dt ∂ q̇k ∂qk (276) erfüllt. Die Form dieser Gleichungen ist uns von den Lagrangeschen Gleichungen vertraut. Die Bewegung in konservativen Systemen mit holonomen Zwangsbedingungen läuft also so ab, daß die Hamiltonsche Prinzipalfunktion oder kurz das Wirkungsintegral 147 S= Z(2) Ldt (277) (1) stationär wird. Die Stationaritätsbedingung δS = δ Z(2) Ldt = 0 (278) (1) wird als Hamiltonsches Prinzip der kleinsten56 Wirkung bezeichnet. Für den Spezialfall der Gravitation sehen wir im Hamiltonschen Prinzip das relativistische Postulat (271) der maximalen Eigenzeit bestätigt. Das Prinzip gilt aber allgemeiner und besitzt dabei kein Korrelat relativistischer Äquivalenzpostulate mehr. Eine allgemeine anschauliche Interpretation gewinnt das Hamiltonsche Prinzip aber beim Übergang zur Quantenmechanik. Dort wird ein Teilchen nicht durch seine Bahn beschrieben, sondern durch eine Wellenfunktion, welche die Aufenthaltswahrscheinlichkeit repräsentiert. Man kann nun zeigen, daß S 1 = h̄ h̄ Z Ldt die Phase der Wellenfunktion beschreibt. Die Stationarität δS = 0 besagt dann, daß sich in der Nähe des klassischen Weges die Wellenamplituden nicht durch Interferenz weglöschen. Das Teilchen folgt danach nicht einfach der Bahn, sondern es “riecht” alle Wege der Nachbarschaft (Feynman Lectures, Bd. II, Kap. 19). Versperrt man die benachbarten Konkurrenzwege, so stört man die Bewegung (Beugung!). Diese Interpretation macht auch deutlich, daß die Stationarität des Wirkungsintegrals und nicht ein minimaler oder maximaler Wert entscheidend ist. 6.2 Das Hamiltonsche Prinzip im Phasenraum Das Hamiltonsche Prinzip ermöglicht einen eleganten (allerdings recht abstrakten) Aufbau der Mechanik: Wir können dieses Prinzip statt der Newtonschen Axiome an die Spitze stellen und die Lagrangegleichungen deduktiv daraus herleiten (siehe z.B. Landau–Lifshitz). Aus den Lagrangegleichungen folgen 56 Es sei nochmals ausdrücklich darauf hingewiesen, daß die Behauptung eines Minimums weder bewiesen noch allgemein gültig ist. Hier liegt offenbar noch ein Rest mittelalterlich teleologischer Denkweise verborgen. 148 weiter die völlig äquivalenten Hamiltonschen Bewegungsgleichungen oder kanonischen Gleichungen (siehe Abschnitt 2.8). Wir wollen nun versuchen, die kanonischen Gleichung ohne den Umweg über die Lagrangeschen Gleichungen direkt aus dem Hamiltonschen Prinzip herzuleiten. Dazu gehen wir von L(q, q̇, t) = X k pk q̇k − H(p, q, t) mit pk = ∂L ∂ q̇k aus und bilden δS = δ Z(2)(X (1) k ) pk q̇k − H(p, q, t) dt = 0 . (279) Wenn wir die Variation schematisch ausführen, erhalten wir Z(2)X ( (1) k ) ∂H ∂H δpk − δqk dt = 0 pk δ q̇k + q̇k δpk − ∂pk ∂qk oder nach partieller Integration des ersten Terms Z(2)X ( (1) k ! ∂H ∂H δpk − ṗk + q̇k − ∂pk ∂qk ! ) δqk dt = 0 . (280) Ehe wir voreilig versuchen, die kanonischen Gleichungen q̇k = ∂H ∂pk und ṗk = − ∂H ∂qk (281) aus dem Verschwinden der Klammern () in Gl. (280) abzulesen, müssen wir uns überlegen, was unter den Variationen δpk denn überhaupt zu verstehen ist. Im Prinzip müssen wir die δpk über δ q̇k aus den Variationen δqk im Konfigurationsraum berechnen. Diese Variationen sind also zunächst nicht unabhängig, und daher dürfen wir nicht ohne weiteres auf die Gültigkeit der Gleichungen (281) schließen. Andererseits kennen wir aber bereits die Gültigkeit der kanonischen Gleichungen und können daraus umgekehrt folgern57 : • Das Hamiltonsche Prinzip gilt sogar unter der erweiterten Konkurrenz beliebiger Variationen δqk und δpk im Phasenraum. 57 Man beachte dazu, daß die Beziehungen q̇k = ∂H/∂pk , die eine unabhängige Variation der δpk gestatten, bereits ohne die Bewegungsgleichungen aus der Konstruktion der Hamiltonfunktion folgen (vgl. S. 67 und Fußnote 23). 149 Umgekehrt können wir aus dem erweiterten Hamiltonprinzip im Phasenraum die kanonischen Gleichungen deduzieren. 6.3 Kanonische Transformationen Aus dem erweiterten Hamiltonsche Prinzip im Phasenraum folgt, daß die pk des Hamiltonformalislismus im Gegensatz zu den q̇k der Lagrangeschen Formulierung eine eigenständige, den qk gleichwertige Bedeutung haben. Die Gleichwertigkeit der pk und qk läßt es sinnvoll erscheinen, ganz auf die grundsätzliche Unterscheidung von Koordinaten und Impulsen zu verzichten. Statt generalisierte Koordinaten ausschließlich durch Punkttransformationen qk = hk (xi , t) im Konfigurationsraum zu gewinnen, kann man dann durch allgemeinere Transformationen Qk = Qk (p, q, t) und Pk = Pk (p, q, t) (282) im Phasenraum zu neuen Sätzen von verallgemeinerten Koordinaten und Impulsen übergehen. Die Transformationen (281) heißen kanonisch, wenn für die Qk und die Pk wieder kanonische Gleichungen ∂K ∂K und Ṗk = − (283) ∂Pk ∂Qk mit einer geeignet transformierten Hamiltonfunktion K(P, Q, t) gelten. Um das sicherzustellen, brauchen wir nur zu fordern, daß für die neuen Koordinaten ein Hamiltonsches Prinzip Q̇k = δ Z(2)(X (1) k ) Pk Q̇k − K(P, Q, t) dt = 0 (284) gilt. Wegen unserer Vorschrift, die Randpunkte nicht zu variieren, ist das aber sicher gewährleistet, wenn sich die Integranden von (279) und (284) nur um eine totale Zeitableitung unterscheiden, etwa X k Pk Q̇k − K(P, Q, t) = X k pk q̇k − H(p, q, t) − dΦ . dt (285) Φ kann dabei außer von der Zeit etwa von q und p abhängen. Wir können uns aber auch denken, daß (nach Ausführung der Transformation) p durch einen Halbsatz der neuen Koordinaten ersetzt wird und schreiben Φ(q, p, t) = R1 (q, Q, t) . 150 Setzen wir ! dΦ X ∂R1 ∂R1 ∂R1 Q̇k + = q̇k + dt ∂qk ∂Qk ∂t k in Gl. (285) ein, so erhalten wir X k ! ! X ∂R1 ∂R1 ∂R1 Pk + q̇k = K − H − pk − Q̇k − ∂Qk ∂qk ∂t k ! . Diese Gleichung können wir am einfachsten erfüllen, wenn wir die Transformation so ausführen, daß alle Klammern () einzeln verschwinden. Wir erhalten damit die Transformationsgleichungen und ∂R1 , ∂qk ∂R1 , = − ∂Qk pk = (286) Pk (287) K(P, Q, t) = H(p, q, t) + ∂R1 . ∂t (288) R1 (q, Q, t) heißt die Erzeugende der kanonischen Transformation (286-288). Die Gln. (286) liefern die erste Hälfte der Transformationsgleichungen. Sie legen in impliziter Form fest, wie die neuen Koordinaten Qk von den alten Koordinaten q und Impulsen p abhängen. Hat man sie nach den Qk aufgelöst, so erhält man die konjugierten Impulse Pk explizit durch die Gln. (287). Aus Gl. (288) liest man zudem die neue Hamiltonfunktion K ab, mit der die kanonischen Gleichungen (283) gelten. Sie stimmt mit der alten Hamiltonfunktion überein, wenn die Transformationsgleichungen die Zeit nicht explizit58 enthält. Die formale Sonderstellung, die wir den Koordinaten q und Q bei der Konstruktion der Erzeugenden R1 zugewiesen haben, war rein willkürlich. Tatsächlich können wir Koordinaten und Impulse völlig gleichwertig behandeln. Um zu Transformationsgleichungen zu gelangen, müssen wir nur darauf achten, daß wir von einer Erzeugenden ausgehen, die von einem Halbsatz der alten und einem Halbsatz der neuen Variablen abhängt. Um das zu sehen machen wir von einer Legendretransformation (siehe Abschnitt 2.8) Gebrauch und bilden eine neue Erzeugende R2 (p, Q, t) = R1 (q, Q, t) − X p k qk . k Aus ihrem Differential 58 Bei explizit zeitabhängigen Transformationen läßt sich die Änderung der Hamiltonfunktion durch Pseudopotentiale von Scheinkräften interpretieren. Vgl. dazu S. (62). 151 dR2 = X k ( ! ) ∂R1 ∂R1 ∂R1 − pk dqk + dQk − qk dpk + dt ∂qk ∂Qk ∂t und den Gl. (286-288) lesen wir sofort die partiellen Ableitungen ∂R2 ∂R1 = = −Pk ∂Qk ∂Qk ∂R2 = −qk , ∂pk und ∂R2 ∂R1 = =K−H ∂t ∂t ab. In voller Analogie zu Gln. (286-288) ergibt das die Transformationsgleichungen qk = − ∂R2 , ∂pk Pk = − ∂R2 ∂Qk und K = H + ∂R2 . ∂t (289) Nach dem selben Schema können wir Q durch P ersetzen, indem wir von der Erzeugenden R3 (q, P, t) = R1 (q, Q, t) + X Pk Q k k ausgehen. Wir erhalten dann entsprechend die Transformationsgleichungen pk = ∂R3 , ∂qk Qk = ∂R3 ∂Pk und K = H + ∂R3 . ∂t (290) Schließlich können wir noch beide Halbsätze von Variablen austauschen und aus der Erzeugenden R4 (p, P, t) = R1 (q, Q, t) − X k p k qk + X Pk Q k k die Transformationsgleichungen qk = − ∂R4 , ∂pk Qk = ∂R4 ∂Pk und K = H + ∂R4 . ∂t (291) gewinnen. Wir wollen die vier Fälle der besseren Übersicht wegen in einer Tabelle zusammenfassen. Dabei verzichten wir in den Transformationsgleichungen auf eine Kennzeichnung der Erzeugenden durch Indizes: 152 .. . .. . Q q R1 (q, Q, t) ∂R · · · · · · Pk = − ∂Q k p R2 (p, Q, t) P ∂R ∂qk pk = .. . R3 (q, P, t) ···+··· .. . Qk = ∂R qk = − ∂p k .. . ∂R ∂Pk ··· R4 (p, P, t) K = H + ∂R/∂t In jedem Fall gehen wir also von einer Erzeugenden R aus, die von einem alten und einem neuen Variablen–Halbsatz abhängt. Der jeweils konjugierte Halbsatz ist dann durch die partiellen Ableitungen von R gegeben. Das richtige Vorzeichen erhält man aus der Merkregel, daß Ableitungen nach neuen Variablen und Ableitungen nach Impulsen jeweils ein Minuszeichen bringen. 6.4 Beispiele für kanonische Transformationen Wir beginnen mit einem trivialen Beispiel: Die Erzeugende R1 (q, Q) = X qi Q i (292) i führt auf die Transformationsgleichungen pk = ∂R1 = Qk ∂qk und Pk = − ∂R1 = −qk . ∂Qk (293) Abgesehen von einer Vorzeichenänderung, die zur unveränderten Anschrift der kanonischen Gleichungen nötig ist, werden durch diese Transformation also Koordinaten und Impulse vertauscht. So trivial und nutzlos diese Operation auch ist, so führt sie uns doch die Gleichwertigkeit von Koordinaten und Impulsen deutlich vor Augen. Die selbe Vertauschung Qk = pk und Pk = −qk von Koordinaten und Impulsen erhalten wir auch aus der Erzeugenden R4 (p, P) = X p i Pi . (294) i Es ist also nicht möglich, einer vorgebenen Transformation eindeutig eine Erzeugende zuzuordnen. 153 Ebenfalls einfach, aber bereits nützlicher ist die Erzeugende R2 (p, Q) = − X pi fi (Q). (295) i Sie erzeugt Punkttransformationen qk = − ∂R2 = fk (Q) ∂pk (296) zwischen einem alten (q) und einem neuen (Q) Satz generalisierter Koordinaten. Die zweite Hälfte X ∂R2 ∂fi Pk = − pi = (297) ∂Qk ∂Qk i liefert die zugehörigen neuen Impulse Pk . Auch die Erzeugende R3 (q, P) = X Pi gi (q) . (298) i mit den Transformationsgleichungen Qk = ∂R3 X ∂gi ∂R3 Pi = gk (q) und pk = = ∂Pk ∂qk ∂qk i (299) liefert Punkttransformationen. Im Gegensatz zur Darstellung durch R2 erhält man hierbei die neuen Koordinaten Qk jedoch explizit, dafür aber die neuen Impulse Pk nur noch implizit. Eine triviale Punkttransformation stellt die identische Transformation Qk = q k und Pk = pk (300) dar. Wir können sie gleichwertig aus den aus den Erzeugenden R2 id = − X pi Qi oder R3 id = i X Pi q i (301) i gewinnen. Trotz der Trivialität sind diese Darstellungen ein nützlicher Ausgangspunkt zur Erzeugung infinitesimaler kanonischer Transformationen (siehe Abschnitt 6.6). Nach diesen mehr oder weniger trivialen Beispielen wollen wir die Lösung eines konkreten Problems durch eine nicht–triviale kanonischen Transformation demonstrieren: Zur Behandlung des harmonischen Oszillators bildet man gern die Erzeugende k 2 x cot ωQ mit ω 2 = k/m . (302) R1 (x, Q) = 2ω Sie generiert die Transformationsgleichungen p= k ∂R1 = x cot ωQ und ∂x ω 154 sin ωQ cos2 ωQ k ∂R1 = x2 + P =− ∂Q 2 sin ωQ sin2 ωQ ! = kx2 . 2 sin2 ωQ Lösen wir die zweite Gleichung nach x auf und setzen sie anschließend in die erste Gleichung ein, so erhalten wir s √ 2 1/2 2k 1/2 x= P sin ωQ und p= P cos ωQ . (303) k ω Mit dieser Transformation geht die Hamiltonfunktion H(p, x) = p2 k + x2 2m 2 des harmonischen Oszillators in K(P, Q) = H = ! k cos2 ωQ + sin2 ωQ P 2 mω über. Mit ω 2 = k/m erhalten wir also die besonders einfache Hamiltonfunktion K = P, (304) und die einzige Variable Q wird zyklisch. Darum ist P konstant, und es gilt offenbar P =K =H =E. Die kanonische Gleichung Q̇ = ∂K =1 ∂P zeigt, daß die neue Koordinate Q = t − t0 (305) die Zeit beschreibt. Mit P = E und Q = t − t0 liefern die Transformationsgleichungen (303) explizit den Bewegungsablauf. Die kanonische Transformation gestattet also in der Tat eine überaus elegante Problemlösung — vorausgesetzt man hat Glück, und der Himmel verrät eine geeignete Erzeugende. Was aber macht man, wenn man kein Glück hat und der Himmel schweigt? 6.5 Die Hamiltonsche partielle Differentialgleichung Wie bereits angedeutet, ist es nicht sehr befriedigend, bei der Suche nach einer geeigneten kanonischen Transformation auf den Zufall oder die Intuition angewiesen zu sein. Wir suchen daher nach einem systematischen Weg, besonders 155 vorteilhafte Erzeugende zu finden. Der günstigste Fall liegt sicher vor, wenn die neue Hamiltonfunktion K überhaupt nicht mehr von den neuen Variablen Pk und Qk abhängt. Dann folgt nämlich ∂K = 0, ∂Qk ∂K Q̇k = = 0, ∂Pk Ṗk = − also P k = αk also Q k = βk und (306) (307) mit geigneten Integrationskonstanten αk und βk . Die neue Hamiltonfunktion ist selbst konstant und kann gleich Null gewählt werden. Diese ’ideale’ Transformation auf einen vollständigen Satz von 2f Integrationskonstanten wollen wir dem allgemeinen Brauch folgend aus einer Erzeugenden vom Typ R3 gewinnen, die wir mit S bezeichnen und Wirkungsfunktion nennen. Mit (306) und (307) gelten dann die Transformationsgleichungen ∂ S(q, α, t) und ∂qk ∂ = S(q, α, t) . ∂αk pk = (308) βk (309) In diesen Transformationsgleichungen ist bereits die gesamte Problemlösung enthalten (Satz von Jacobi): Bei vorgegebenen Integrationskonstanten αk , βk sind die Koordinaten qk (t) implizit durch Gl. (309) bestimmt. Gl. (308) liefert die zugehörigen Impulse pk (t). Die 2f Integrationskonstanten αk und βk folgen mit den selben Gleichungen aus den Anfangsbedingungen qk (0) und pk (0). Existiert eine so wunderbare Erzeugende denn wirklich? Wenn ja: Hat sie eine physikalische Bedeutung? Wie finde ich sie? Wir hatten verlangt, daß S die neue Hamiltonfunktion zum Verschwinden bringt: K = H(p, q, t) + Setzen wir hierin ∂S = 0. ∂t (310) dS X ∂S ∂S = − q̇k ∂t dt ∂qk k ein, so erhalten wir mit Gl. (308) X dS = pk q̇k − H = L . dt k 156 (311) Die Wirkungsfunktion S ist also identisch mit dem im Abschnitt 6.1 [Gl. (277)] definierten Wirkungsintegral. Bei der Diskussion des Hamiltonschen Prinzips hatten wir erwähnt, daß S/h̄ die Phase der quantenmechanischen Wellenfunktion beschreibt. Die Gleichung S = const beschreibt also Wellenflächen gleicher Phase. Auf diesen Wellenflächen steht der generalisierte Impuls nach Gl. (308) senkrecht. Betrachten wir speziell ein Teilchen in kartesischen Koordinaten, so sind die Wellenflächen S(x, α, t) = const also die orthogonalen Trajektorien aller mit den Integrationskonstanten α verträglichen Teilchenbahnen. Oder umgekehrt: Man erhält die möglichen Teilchenbahnen als orthogonale Trajektorien der Wellenflächen. Damit läßt sich ein Bündel möglicher Teilchenbahnen mit einem Bündel von Lichtstrahlen in der geometrischen Optik vergleichen, und man kann tatsächlich zeigen, daß die Gleichungen der Wellenmechanik in der Näherung der geometrischen Optik (λ → 0) auf die Hamilton–Jacobi–Theorie führen: Die klassische Mechanik unterscheidet sich von der Quantenmechanik genau durch das Fehlen von Interferenz– und Beugungseffekten. So ästhetisch schön und inhaltsschwanger die Beziehung (311) auch sein mag, so wenig ist sie allerdings zur Berechnung von S geeignet. Denn die Integration von Gl. (311) setzt ja bereits die Kenntnis der Teilchenbahnen, also die Lösung des Problems, voraus. Zu einer Bestimmungsgleichung für S kommen wir aber, wenn wir die Transformationsgleichungen (308) in Gl. (310) einsetzen. Wir erhalten dann die Hamiltonsche partielle Differentialgleichung H ! ∂S ∂S , q, t + =0 ∂q ∂t (312) und sehen, welch hohen Preis wir für die wunderbare Erzeugende zu zahlen haben: Während uns das Bewegungsproblem selbst ’nur’ mit einem System gewöhnlicher Differentialgleichungen der Ordnung 2f konfrontiert, müssen wir zur Bestimmung von S ein vollständiges Integral der partiellen Differentialgleichung finden, das 2f freie Integrationskonstanten59 αk enthält. Für diesen hohen Preis wird allerdings auch eine adäquat hohe Leistung geboten. Denn die eine Funktion S enthält bereits die vollständige und fertig ausintegrierte Information über sämtliche Lösungen des Bewegungsproblems für beliebige Anfangsbedingungen. Der hohe Preis – und hier wird es wieder unbefriedigend – ist jedoch nur selten bezahlbar. Praktisch kommt man nur in den Fällen zu der erwünschten Wirkungs59 Wegen der f + 1 partiellen Ableitungen gehören zur allgemeinen Lösung von Gl. (312) eigentlich f +1 Integrationskonstanten. Eine davon ist jedoch die triviale additive Konstante, die in den Transformationsgleichungen nicht auftaucht. 157 funktion S, in denen die Hamiltonsche partielle Differentialgleichung durch Separation gelöst werden kann. Damit meinen wir, daß S in eine Summe S= X Sk (qk , α) + St (t, α) (313) k zerfällt. Dieser glückliche Umstand beschränkt sich aber auch wieder auf diejenigen Fälle, in denen das Bewegungsproblem auch ohne Hamilton–Jacobi– Theorie in allgemeiner Form lösbar ist60 . Der zeitliche Anteil St läßt sich immer abseparieren, wenn die Hamiltonfunktion nicht explizit von t abhängt. Dann gilt nämlich H = Ê = const61 und aus Gl. (312) folgt ∂S = −Ê , ∂t also S = S0 (q, α) − Êt . (314) Die Hamiltonsche charakteristische Funktion (oder ’verkürzte Wikungsfunktion’) S0 ist nun aus der (“verkürzten”) Hamiltonschen partiellen Differentialgleichung H ! ∂S0 , q = Ê ∂q (315) zu bestimmen. Dabei ist zu beachten, daß Ê selbst eine Integrationskonstante ist, die von den αk abhängt oder mit einem der α’s identisch ist. Es ist üblich, α1 = Ê (316) zu verfügen. Damit zerfällt Gl. (309) in die beiden Gleichungen βk = ∂ S0 (q, Ê, α) (k ≥ 2) ∂αk und β1 = ∂S0 − t, ∂ Ê (317) welche die Bahn und den “Fahrplan” getrennt beschreiben. 6.6 Der harmonische Oszillator als Beispiel Aus der Hamiltonfunktion H= p2 k + x2 2m 2 60 Ob die Hamiltonsche partielle Differentialgleichung separierbar ist, hängt außerdem von den verwendeten Koordinaten ab. 61 Zur Frage, wann Ê die Gesamtenergie des Systems ist, siehe Abschnitt 2.7 158 des harmonischen Oszillators erhalten wir die Hamiltonsche partielle Differentialgleichung [vgl. Gl. (312)] ∂S ∂x 1 2m !2 k ∂S + x2 + = 0. 2 ∂t (318) Da die Hamiltonfunktion die Zeit nicht explizit enthält und H = E = α gilt, können wir die Zeitabhängigkeit abseparieren und setzen gemäß (314) S(x, E, t) = S0 (x, E) − Et . Die charakteristische Funktion S0 genügt dann der Gleichung [vgl. Gl. (315)] 1 2m ∂S0 ∂x !2 k + x2 = E . 2 (319) Daraus erhalten wir durch Integration S0 (x, E) = Z s k 2m(E − x2 ) dx . 2 Die Integration ist elementar (siehe unten), wir brauchen sie aber gar nicht auszuführen, da die Transformationsgleichungen nur Ableitungen von S0 enthalten: ∂S0 ∂S = = p= ∂x ∂x s k 2m(E − x2 ) , 2 Z ∂S ∂S0 m dx −t. β= = −t= q ∂α ∂E 2m(E − k2 x2 ) Die erste Gleichung liefert uns (in der Form des Energiesatzes) die Gleichung der Bahn des harmonischen Oszillators. Die zweite Gleichung, die den “Fahrplan” liefern soll, müssen wir weiter auswerten: t+β = r m 2E Z dx q 1− k 2 x 2E = r m k Z √ du , 1 − u2 u= q k 2E x. Mit einer Formelsammlung oder einer zweiten Substitution u = sin v finden wir die Lösung r q m 1 k arcsin u = arcsin 2E t+β = x k ω oder s 2E x= sin[ω(t + β)] . (320) k [Obwohl das Problem damit vollständig gelöst ist, wollen wir zur Vertiefung die charakteristische Funktion S0 (x, E) selbst noch einmal als Erzeugende einer kanonischen 159 Transformation betrachten. Um diesen Aspekt zu verdeutlichen, benutzen wir auch die Bezeichnungen E → P und S0 (x, E) → R3 (x, P ) und schreiben R3 (x, P ) = Z q 2m(P − k2 x2 ) dx . Die formale Rechnung ist natürlich identisch mit der oben und liefert die Transformationsgleichungen ∂R3 q p= = 2m(P − k2 x2 ) ∂x und q 1 ∂R3 k = arcsin Q= 2P x . ∂P ω Wegen K=H=P folgt die Beziehung Q = t + β nun aus der kanonischen Gleichung Q̇ = ∂K = 1. ∂P Die Erzeugende R3 (x, P ) = S0 (x, P ) liefert also die selben neuen Variablen P = E und Q = t+ const wie die Erzeugende R1 (x, Q) nach Gl. (302). Um den Zusammenhang zwischen R3 und R1 zu untersuchen, rechnen wir R3 nun doch explizit aus: R3 (x, P ) = Z q √ 2mP 1− = 2 = r m P k Z p k 2P x2 dx 1 − u2 du P p (u 1 − u2 + arcsin u) ω (u = q k 2P x) . Nun führen wir eine Legendretransformation R1 (x, Q) = R3 (x, P ) − P Q aus. Mit den Beziehungen P = kx2 , 2u2 arcsin u = ωQ und u = sin ωQ erhalten wir R1 (x, Q) = = P (sin ωQ cos ωQ + ωQ) − P Q ω kx2 kx2 sin ωQ cos ωQ cot ωQ . = 2ω 2ω sin2 ωQ Damit verliert die Erzeugende R1 (x, Q) aus Gl. (302) den magischen Zauber eines gnädigen Himmelsgeschenks und entpuppt sich als biederes Produkt zielstrebigen Fleißes.] 160 6.7 Ergänzende Bemerkungen Wir beenden an dieser Stelle die Einführung in die Hamilton–Jacobi–Theorie und weisen nur noch andeutungsweise auf die folgenden wichtigen Ergänzungen hin: 1. Zur Verdeutlichung der Zusammenhänge ist es nützlich, infinitesimale kanonische Transformationen Qk = qk + δqk () , Pk = pk + δpk () mit δqk , δpk = O() , (321) →0 zu betrachten. Ausgehend von der identischen Transformation (300,301) kann man sie zum Beispiel durch R3 (q, P) = X qk Pk + G(q, P) = k X qk Pk + G(q, p) + O(2 ) (322) k erzeugen und findet gemäß Qk = ∂R3 /∂Pk und pk = ∂R3 /∂qk in erster Ordnung in δqk = ∂ ∂ G(q, p) und δpk = − G(q, p) . ∂pk ∂qk (323) Man nennt G(q, p) die Erzeugende der infinitesimalen kanonischen Transformation (323). Wählt man speziell die Hamiltonfunktion H als Erzeugende, so folgt mit den kanonischen Gleichungen δqk = q̇k und δpk = ṗk . Die Hamiltonfunktion ist also die Erzeugende einer infinitesimalen Zeitverschiebung = δt. Daraus folgt die wichtige Feststellung, daß der Bewegungsablauf selbst als Folge infinitesimaler kanonischer Transformationen oder als kanonische Transformation aufgefaßt werden kann62 . Auf ähnliche Weise sieht man, daß der Impuls und der Drehimpuls die Erzeugenden infinitesimaler Translationen bzw. Drehungen sind. Man kann dies zum Ausgangspunkt der Diskussion von Symmetrien und Erhaltungssätzen machen, die wir im Abschnitt 2.7 geführt haben. 62 Diese Folgerung kann man auch aus der Transformation auf die Konstanten αk und βk im Abschnitt 6.5 ziehen. 161 2. Kanonische Transformationen bilden Gebiete des Phasenraums volumentreu ab. Da auch der Bewegungsablauf durch kanonische Transformationen beschrieben werden kann, folgt daraus, daß das Phasenraum–Volumen, das ein Ensemble von gleichartigen mechanischen Systemen im Phasenraum einnimmt, im Lauf der Zeit erhalten bleibt (Satz von Liouville). Das Phasenraumvolumen kann allerdings durch die Bewegung wie Zuckerwatte in feine Fäden gezogen und zu hochkomplexen, scheinbar voluminöseren Strukturen verwickelt werden. Der Satz von Liouville spielt eine wichtige Rolle in der Statistischen Mechanik. Es besteht ein enger Zusammenhang zwischen dem Phasenraumvolumen und der Entropie. 3. Neben dem Phasenraumvolumen und den kanonischen Gleichungen gibt es zahlreiche weitere Invarianten kanonischer Transformationen. Wir erwähnen hier noch die Invarianz der Poissonklammern63 {A, B} = X k ∂A ∂B ∂A ∂B − ∂qk ∂pk ∂pk ∂qk ! = X k ∂A ∂B ∂A ∂B − ∂Qk ∂Pk ∂Pk ∂Qk ! . (324) Mit Hilfe der Poissonklammern und der kanonischen Gleichungen erhält man die zeitliche Variation einer dynamischen Größe A(q, p, t) in der knappen Form ! X ∂A dA ∂A ∂A ∂A = q̇k + ṗk + = {A, H} + . dt ∂qk ∂pk ∂t ∂t k (325) Die tiefere Bedeutung dieser Notation liegt im Korrespondenzprinzip, nach dem die Poissonklammern beim Übergang zur Quantenmechanik in die Kommutatorklammern übergehen: {A, B} → 1 [A, B] . ih̄ (326) Aus der klassischen Gleichung (325) ensteht so die quantenmechanische Heisenberggleichung dA 1 ∂A = [A, H] + . dt ih̄ ∂t 63 (327) Das Vorzeichen wird gelegentlich (z. B. im Lehrbuch der Quantenmechanik von E. Fick) umgekehrt definiert. 162 Literaturhinweise Alle üblichen Lehrbücher gehen im Umfang wesentlich über den Inhalt dieser Vorlesung hinaus, eignen sich aber, einzelne Probleme nachzulesen und zu vertiefen. Dabei richtet sich die optimale Wahl nicht zuletzt nach dem persönlichen Geschmack. Die folgende Aufstellung ist deshalb nicht als Empfehlung zu verstehen, sondern gibt die Quellen an, die ich bei der Ausarbeitung der Vorlesung vornehmlich benutzt habe. a) H. Goldstein: Klassische Mechanik, Akademische Verlagsgesellschaft, Frankfurt Ein älteres Standardlehrbuch, das an Vollständigkeit unübertroffen ist. Leider vermittelt es ein wenig den falschen Eindruck, als wären die meisten Probleme mit den Mitteln der analytischen Mechanik analytisch lösbar. b) W. Greiner: Theoretische Physik, Band 1 Mechanik I und Band II Mechanik II Verlag Harri Deutsch, Thun und Frankfurt Stark didaktisch ausgerichtete, für meinen Geschmack etwas langatmige Einführung in die Mechanik, die erst im letzten Drittel des zweiten Bandes den Lagrange- und Hamiltonformalismus behandelt. c) A. Sommerfeld: Mechanik (Bd. I der Vorlesungen über Theoretische Physik), VAG Leipzig bzw. Teubner. Eine ausgezeichnete Darstellung, die tiefsinnig und spielerisch (Exkurse über das Billardspiel und das Radfahren) die physikalischen Grundideen herausarbeitet und verständlich und elegant mit der Mathematik umgeht. Leider ist Sommerfelds Darstellung viel zu unsystematisch, um die Vorlesung zu begleiten. Das Lehrbuch eignet aber hervorragend, um den Stoff zu vertiefen. d) Feynman/Leighton/Sands: Vorlesungen über Physik, Bd. 1 und 2, R. Oldenbourg Verlag München Diese ausgezeichnete Darstellung der gesamten Physik weicht stark von der üblichen Gliederung in Teilgebiete ab. Sie legt großen Wert auf die Didaktik und vermittelt ein tiefes Verständnis der Grundlagen. Wegen der Gliederung ist das Werk zur direkten Begleitung der Vorlesung weniger geeignet, ich empfehle aber einzelne Kapitel daraus zur Ergänzung und Vertiefung. 163