Einführung in die Theoretische Physik Skript zur Vorlesung von Prof. Dr. Peter van Dongen SS 2009 Institut für Physik Staudingerweg 7, 55128 Mainz c Copyright 2003 Peter van Dongen, Mainz, Germany letzte Aktualisierung: 26. Oktober 2009 Inhaltsverzeichnis Vorwort 1 1 Einführung 2 2 Postulate und Gesetze der Klassischen Mechanik 2.1 Der Massenpunkt als Baustein der Mechanik . . . . . . . . . 2.2 Raum und Zeit . . . . . . . . . . . . . . . . . . . . . 2.3 Abgeschlossene mechanische Systeme und Teilsysteme . . . . 2.4 Galileos Relativitätsprinzip . . . . . . . . . . . . . . . . 2.5 Galilei-Transformationen . . . . . . . . . . . . . . . . . 2.5.1 Zeittranslationen . . . . . . . . . . . . . . . . . 2.5.2 Geschwindigkeitstransformationen . . . . . . . . . . 2.5.3 Translationen im Ortsraum . . . . . . . . . . . . . 2.5.4 Drehungen . . . . . . . . . . . . . . . . . . . . 2.5.5 Raumspiegelungen . . . . . . . . . . . . . . . . 2.5.6 Allgemeine Galilei-Transformationen . . . . . . . . . 2.5.7 Die Galilei-Gruppe . . . . . . . . . . . . . . . . 2.6 Das deterministische Prinzip der Klassischen Mechanik . . . . 2.7 Konsequenzen der Galilei-Invarianz für die Bewegungsgleichung 2.8 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . 6 6 7 9 12 13 13 14 15 15 16 17 18 19 21 23 3 Abgeschlossene mechanische Systeme 3.1 Allgemeine Eigenschaften abgeschlossener Systeme . . . . . . 3.1.1 Das Virialtheorem . . . . . . . . . . . . . . . . . 3.2 Galilei-Transformationen . . . . . . . . . . . . . . . . . 3.3 Das Zweiteilchenproblem - allgemeine Eigenschaften . . . . . 3.4 Das Zweiteilchenproblem - Beispiele . . . . . . . . . . . . 3.4.1 Kreisbahnen . . . . . . . . . . . . . . . . . . . . 3.4.2 Kleine Schwingungen . . . . . . . . . . . . . . . 3.4.3 Der harmonische Oszillator . . . . . . . . . . . . . 3.4.4 Ellipsen, Hyperbeln, Parabeln . . . . . . . . . . . 3.4.5 Das Kepler-Problem . . . . . . . . . . . . . . . . 3.4.6 Geschlossene Bahnen und Gleichförmigkeit . . . . . . 3.4.7 Die Bahn des Merkur . . . . . . . . . . . . . . . . 26 27 31 33 37 41 41 41 43 45 46 53 54 ------------------------------------------------------------------------------------------------------------------ INHALTSVERZEICHNIS 4 Teilsysteme 4.1 Allgemeine Eigenschaften von Teilsystemen . . . . . . . . . 4.1.1 Einteilchen-Teilsysteme . . . . . . . . . . . . . . . 4.1.2 Mehrteilchen-Teilsysteme . . . . . . . . . . . . . 4.2 Die Lorentz-Kraft . . . . . . . . . . . . . . . . . . . . 4.2.1 Galilei-Kovarianz der Lorentz’schen Bewegungsgleichung 4.2.2 Beispiel: konstante Felder . . . . . . . . . . . . . . 57 57 57 59 61 62 64 5 Spezielle Relativitätstheorie 5.1 Erste Konsequenzen der Postulate . . . . . . . . . . . . . 5.2 Der Abstand und die Eigenzeit . . . . . . . . . . . . . . . 5.3 4-Schreibweise und Lorentz-Transformationen . . . . . . . . 5.3.1 Poincaré- und Lorentz-Transformationen . . . . . . . 5.4 Physikalische Konsequenzen der Lorentz-Invarianz . . . . . . 5.5 4-Vektoren . . . . . . . . . . . . . . . . . . . . . . . 5.6 Masse und Energie . . . . . . . . . . . . . . . . . . . 5.7 Die Lorentz-Kraft und elektromagnetische Felder . . . . . . . 67 69 71 75 77 78 81 86 88 Literaturverzeichnis 90 ii Vorwort Dieses Theorie-1-Skript ist die aktualisierte und an den neuen Bachelorstudiengang angepasste Version des Skriptes, das ich im Laufe des WS 2003/2004 zur Vorbereitung der Kursvorlesung Theorie I: Einführung in die Theoretische Physik vor Mainzer Studierenden geschrieben habe. Für die Fertigstellung dieses „Compuskripts“ möchte ich mich ganz herzlich bei meinen zwei Stützen, Elvira Helf und Albrecht Seelmann, bedanken. Frau Helf hat sich um den Text gekümmert, Herr Seelmann um die Formeln, die Grafiken und die Verzeichnisse. Die Verantwortung für den Inhalt liegt natürlich bei mir. Sollte der Leserin oder dem Leser eine Unstimmigkeit auffallen, bitte ich um eine Mitteilung ([email protected]). Die aktuelle Version dieses Skripts findet man auf der Homepage meiner Gruppe: http://komet337.physik.uni-mainz.de/Group/ . Bei der Themenwahl habe ich mich sowohl am Mainzer Theoriekanon als auch an den Inhalten der Vorlesungen, die die Studierenden bereits gehört hatten, orientiert. Als Hintergrundinformation zur Theorie 1 seien die Referenzen [1]-[9] sowie die weiterführende Literatur [10] - [12] des beigefügten Literaturverzeichnisses empfohlen, wobei allerdings keines dieser Bücher sehr eng bei der von mir gewählten Darstellung anschließt. Von den aufgeführten Büchern eignen sich die Klassiker [4] und [10] vielleicht noch am besten zu einem vertiefenden Selbststudium. Außerdem muss angemerkt werden, dass die Darstellungen in [10] oft sehr „physikalisch“ (d. h. intuitiv plausibel, aber mathematisch nicht immer präzise), diejenigen in [11] für Studierende im zweiten oder dritten Semester dagegen vielleicht allzu „mathematisch“ sind; Referenz [12] ist eine Fundgrube voller Ideen und Ergebnisse für den eher mathematisch interessierten Leser, mutet jedoch manchmal etwas altmodisch an. Für konkrete Rechnungen liefern die mathematischen Handbücher [13] und [14] wertvolle Hilfestellungen. Ich hoffe, dass dieses Skript sich zumindest für Mainzer Studierende als nützlich erweist, und wünsche ihnen viel Erfolg und auch Spaß bei ihren ersten Schritten in der wunderbaren Welt der Theoretischen Physik. Mainz, im April 2009 P. G. J. van Dongen Kapitel 1 Einführung Die Lehrbuchdefinition der Klassischen Mechanik, etwa als „Zweig der Physik, der sich mit der Bewegung physikalischer Körper befasst“ [2], wird der enormen historischen, kulturellen und philosophischen Bedeutung der Mechanik und ihrem Anwendungspotential in Wissenschaft und Technik wohl kaum gerecht. Die Mechanik hat ihre Wurzeln in der Himmelsmechanik und somit in der Astronomie: Bereits vor Jahrtausenden versuchte der Mensch, seine Existenz auf der Erde und die Bewegung der Himmelskörper über ihm zu ergründen. Dies hatte sicherlich zum Teil religiöse und zum Teil äußerst praktische Gründe, denn es war selbstverständlich wichtig, einerseits „bedrohliche“ Phänomene (Sonnen- und Mondfinsternisse) vorhersagen zu können und andererseits über einen gut funktionierenden Kalender zu verfügen. Frühe astronomische Beobachtungen wurden nachweislich in China (angeblich bereits im 25. Jahrhundert v. Chr.) und in Ägypten, Indien und Chaldäa durchgeführt. Neben diesen Anfängen können Höhepunkte der Beobachtung in Griechenland (Hipparchos, 2. Jahrhundert v. Chr.), Arabien (Albategnius, 10. Jahrhundert), Khorasan (Nassir Eddin, 13. Jahrhundert) und Turkestan (Ulugh Begh, 14. Jahrhundert) erwähnt werden. Das technische Können der beiden letztgenannten Astronomen wurde in Europa erst im 16. Jahrhundert von Tycho Brahe übertroffen. Die weiterführenden Arbeiten von Brahes Schüler Johannes Kepler (1571-1630) und insbesondere auch von Galileo Galilei (1564-1642) ermöglichten schließlich die Formulierung einfacher Gesetze, die ein halbes Jahrhundert später in der Newton’schen Mechanik einschließlich der Gravitationstheorie kulminierten. Theoretische Ideen über den Aufbau des Weltalls, die allerdings eher spekulativen Charakter hatten, gab es bereits vor Newton: Pythagoras (6. Jahrhundert v. Chr.) lehrte, dass die Erde kugelförmig ist; Philolaos (5. Jahrhundert v. Chr.) spekulierte über eine mögliche Rotation der Erde um die eigene Achse und über die Bewegung der Erde, der Sonne, des Mondes und der Planeten um ein gemeinsames Zentrum; Aristoteles (4. Jahrhundert v. Chr.) erklärte die Sonnen- und Mondfinsternisse aufgrund der spärischen Form dieser Körper und der Erde; Eratosthenes (3. Jahrhundert v. Chr.) bestimmte den Erddurchmesser; Ptolemäos (2. Jahrhundert) formulierte aufgrund der Messdaten von Hipparchos ein geozentrisches Weltbild; Nicolaus Copernicus (1473-1543) zweifelte dieses geozentrische Weltbild an und zeigte, dass die Messdaten in einfacherer Weise mit Hilfe eines heliozentrischen Weltbildes beschrieben werden können. ---------------------------------------------------------------------------------------------------------------------------------- 1. EINFÜHRUNG Die Geschichte der Astronomie demonstriert übrigens wunderschön, dass in den Naturwissenschaften Experiment und Theorie Hand in Hand gehen und außerdem die Unterstützung von Mathematik und Technik benötigen: Ohne die Entwicklung der Geometrie (Archimedes, Euklid, Apollonius) und die Erfindung des Teleskops (Lippershey, 1608) wären Galileos astronomische Untersuchungen und Newtons Formulierung der Grundlagen der Mechanik nicht ohne Weiteres möglich gewesen. Isaac Newton fasste 1666 die theoretische Erklärung aller bis zu diesem Zeitpunkt gemachten astronomischen Beobachtungen und auch vieler späterer in einer einzigen Formel zusammen [1], seinem universellen Gravitationsgesetz: mi ẍi = X Gmi mj xji j6=i |xji |3 (i, j = 1, 2, . . . , N ) . (1.1) Hierbei ist mi (i = 1, 2, . . . , N ) die Masse des i-ten Teilchens und stellt G = 6, 6732 · 10−11 Nm2 /kg2 die Newton’sche Gravitationskonstante dar. Außerdem wurde der Relativvektor xji ≡ xj − xi eingeführt. Das Gesetz (1.1) besagt, dass sich alle Massenpunkte im Weltall umgekehrt proportional zum Quadrat ihres Relativabstandes anziehen. Die Gesamtkraft, die in einem N -Teilchen-System auf das Teilchen mit dem Index i ausgeübt wird, ist somit die Summe von N − 1 Zweiteilchenkräften, die jeweils entlang der Verbindungslinie der Teilchenpaare gerichtet sind. Die wichtigste Anwendung des Gravitationsgesetzes (1.1) ist die Beschreibung unseres Sonnensystems. Generationen von Mathematikern (Euler, Clairaut, d’Alembert, Lagrange, Laplace, Legendre, Gauß, Bessel, Poisson, Poincaré, . . . ) haben sich angestrengt, die Konsequenzen von (1.1) für unser Sonnensystem zu berechnen. Einige mathematisch rigorose Aussagen wurden erst in unserer Zeit durch die Arbeiten von Kolmogorov, Arnold und Moser möglich. Die intensive Untersuchung mechanischer Vielteilchensysteme hat im 20. Jahrhundert zu einem neuen Zweig der Theoretischen Physik, zur Theorie dynamischer Systeme und somit zur Chaostheorie geführt. Bei der Untersuchung der Dynamik des Sonnensystems wird auch die Numerik immer wichtiger: Neue numerische Berechnungen deuten z. B. darauf hin, dass die Bahnen der äußeren Planeten des Sonnensystems stabil, diejenigen der inneren Planeten jedoch chaotisch (d. h. etwa: nur ungenau vorhersagbar) sind. Bemerkenswert am Gravitationsgesetz (1.1) ist, dass die physikalische Größe „Masse“ im linken und im rechten Glied gänzlich unterschiedliche Rollen spielt. Im linken Glied tritt die „träge“ Masse mi auf, die in jeder Bewegungsgleichung der Form mi ẍi = Fi vorkommt und bewirkt, dass das i-te Teilchen unter der Einwirkung der Kraft Fi umgekehrt proportional zu mi beschleunigt wird. Im rechten Glied von (1.1) treten mi und mj als Proportionalitätskonstanten in der Gravitationskraft auf, die die Teilchen i und j aufeinander ausüben, d. h. als Teilcheneigenschaften („schwere“ Massen), die nur für die Gravitationswechselwirkung relevant sind. Es ist erstaunlich, dass das Verhältnis der trägen und schweren Massen für alle Teilchen gleich ist und durch eine geeignete Definition der Gravitationskonstante G gleich Eins gewählt werden kann. Diese Äquivalenz der trägen und schweren Massen wurde experimentell bereits von Newton gezeigt und später von Bessel und - mit viel größerer Genauigkeit - von Eötvös (1890, 1909) nachgewiesen. Sie stellt eine der Grundlagen der allgemeinen Relativitätstheorie (Einstein, 1916) dar. Die Schwerkraft, die von Gleichung (1.1) beschrieben wird, ist natürlich nicht 3 ---------------------------------------------------------------------------------------------------------------------------------- 1. EINFÜHRUNG die einzige relevante Kraft in der Natur: Neben der Gravitation erzeugen auch die elektromagnetische, die schwache und die starke Wechselwirkung weitere fundamentale Kräfte. Hierbei sind die schwache Wechselwirkung, die z. B. den β-Zerfall hervorruft, und die starke Wechselwirkung, d. h. die Kraft zwischen Hadronen (z. B. Quarks, Baryonen, Mesonen), nur im Rahmen der Quantentheorie sinnvoll beschreibbar. Elektromagnetische Kräfte zwischen makroskopischen Ladungen können jedoch durchaus im Rahmen der Klassischen Mechanik beschrieben werden. Analog zum Gravitationsgesetz für Punktmassen gilt z. B. das Coulomb’sche Gesetz (Charles-Augustin de Coulomb, 1785) für die Wechselwirkung N geladener Punktteilchen: mi ẍi = X j6=i qi qj xji − 4πε0 |xji |3 (i, j = 1, 2, . . . , N ) . (1.2) Hierbei stellt qi die elektrische Ladung des i-ten Punktteilchens dar, und ε0 ≃ 8, 854 · 10−12 F/m ist die Dielektrizitätskonstante des Vakuums.1 Wiederum ist die Kraft auf ein Teilchen die Summe von Zweiteilchenkräften, die entlang der jeweiligen Verbindungslinien gerichtet sind. Das Coulomb-Gesetz (1.2), wie übrigens auch das Newton’sche Gesetz (1.1), gilt nur für „nicht-relativistische“ Geschwindigkeiten (|ẋ1 | ≪ c, |ẋ2 | ≪ c, usw., wobei c die Lichtgeschwindigkeit darstellt). Dies sieht man sofort daran, dass die Wechselwirkung zwischen den Ladungen oder Massen des i-ten und j-ten Teilchens in (1.2) bzw. (1.1) instantan erfolgt: In einer relativistischen Theorie wäre die Ausbreitungsgeschwindigkeit der Wechselwirkung von oben durch die Lichtgeschwindigkeit beschränkt. Außerdem verliert das Coulomb-Gesetz (1.2) seine Gültigkeit, falls für N ≫ 1 makroskopische Ströme auftreten und somit Magnetfelder erzeugt werden. Hiermit kommen wir auf das Anwendungspotential der Klassischen Mechanik bzw. auf die Einschränkungen ihrer Gültigkeit zu sprechen: Die nichtrelativistische Theorie verliert ihre Gültigkeit, sobald die auftretenden Geschwindigkeiten nicht mehr vernachlässigbar sind im Vergleich zur Lichtgeschwindigkeit. Die Newton’sche Mechanik muss daher im Bereich hoher Geschwindigkeiten modifiziert und durch eine genauere Beschreibung (in diesem Fall die spezielle oder allgemeine Relativitätstheorie) ersetzt werden. Ähnliches gilt in der Mikrowelt: Obwohl die Klassische Mechanik oft durchaus noch imstande ist, die Dynamik größerer Moleküle adäquat zu beschreiben, versagt sie bei der Erklärung des Atom- oder Kernaufbaus. In der Welt des Kleinen wird die Klassische Mechanik durch die Quantentheorie ersetzt. Es ist übrigens nicht einfach, eine klare Trennlinie anzugeben zwischen Systemen, die klassisch beschrieben werden können, und Systemen, die unbedingt quantenmechanisch zu beschreiben sind. Manchmal äußert sich die Quantenmechanik nämlich auch im Großen, wie bei den „makroskopischen Quantenphänomenen“ (Supraleitung, Suprafluidität, Magnetismus, Bose-Einstein-Kondensation, Quanten-Hall-Effekt), für die in den letzten Jahren mehrere Nobelpreise vergeben wurden. Trotz dieser Einschränkungen ist das Anwendungspotential der Klassischen Mechanik sehr groß: Fast alle Objekte des täglichen Lebens können grundsätzlich durch die Klassische Mechanik beschrieben werden. Ob man nun Fahrrad oder Auto fährt oder sich mit einem Segelboot, einem Flugzeug oder einer Rake1 Der exakte numerische Wert der Dielektrizitätskonstante ε ist 107 /4πc2 , wobei c den 0 numerischen Wert der Lichtgeschwindigkeit in m/s darstellt. 4 ---------------------------------------------------------------------------------------------------------------------------------- 1. EINFÜHRUNG te fortbewegt, ob man sich als Meteorologe für die Dynamik der Regentropfen in der Luft oder als Astronom für diejenige der Planeten in unserem Sonnensystem interessiert: Um die Mechanik kommt man nicht herum. Sie ist von wesentlicher Bedeutung für Industrie und Technik. Sogar unter Umständen, unter denen die Klassische Mechanik streng genommen nicht gültig ist, z. B. in der Quantenwelt oder im relativistischen Bereich, ist das „neue“ Wissen oft noch eine Erweiterung des „klassischen“ und hat der „neue“ Effekt oft ein „klassisches“ Pendant. Aus diesen Gründen werden wir uns im Folgenden mit klassischen Phänomenen befassen, d. h. mit klassischen Teilchen, eventuell mittels ihrer „schweren“ Masse angekoppelt an ein Gravitationspotential oder mittels ihrer Ladung an ein klassisches elektromagnetisches Feld. 5 Kapitel 2 Postulate und Gesetze der Klassischen Mechanik In diesem Kapitel werden die wichtigsten Begriffe der klassischen Mechanik und ihre Postulate erklärt, und es wird auch ausführlich auf die Konsequenzen dieser Postulate für die mögliche Form physikalischer Gesetze eingegangen. Wir werden sehen, dass es im Wesentlichen drei grundlegende Annahmen der Klassischen Mechanik gibt, nämlich 1. das Galilei’sche Relativitätsprinzip, das die Existenz überabzählbar vieler Inertialsysteme postuliert (s. Abschnitt [2.4]). 2. die Existenz absoluter (d. h. beobachterunabhängiger) Abstände sowohl im Raum als auch in der Zeit (s. die Abschnitte [2.2] und [2.5]). 3. das deterministische Prinzip der Klassischen Mechanik, das besagt, dass die Bewegung eines mechanischen Systems für alle Zeiten durch die Vorgabe der Koordinaten und Geschwindigkeiten aller Teilchen zu einem einzelnen Zeitpunkt vollständig festgelegt ist (s. Abschnitt [2.6]). Hierüber hinaus gibt es weitere, meist implizite Annahmen bezüglich der Homogenität des Ortsraums und der Zeit und der Isotropie des Ortsraums. Neben den bereits genannten Begriffen werden einige weitere eingeführt, wie das Konzept eines Massenpunktes (s. Abschnitt [2.1]) und die zentralen Begriffe „abgeschlossenes System“ und “Teilsystem“ (s. Abschnitt [2.3]); diese letzten Begriffe sind deshalb so wichtig, weil die Postulate der Klassischen Mechanik uneingeschränkt nur für „abgeschlossene Systeme“ gelten und man für „Teilsysteme“ Zusatzinformation benötigt. Als Konsequenz der Postulate wird die Invarianz (oder genauer: die „Kovarianz“) physikalischer Gesetze unter Galilei-Transformationen diskutiert (s. Abschnitt [2.6]); auch werden einige Spezialfälle und Beispiele behandelt (in den Abschnitten [2.7] und [2.8]). 2.1 Der Massenpunkt als Baustein der Mechanik Es ist bequem, sich bei der Untersuchung der Dynamik von Körpern zunächst auf Massenpunkte (d. h. auf massebehaftete Körper, deren Abmessungen deut- ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK lich kleiner sind als alle anderen relevanten Längenskalen im Problem) zu beschränken. Man verliert in dieser Weise keine Information, da ein beliebiger Körper aus miteinander wechselwirkenden Massenpunkten aufgebaut werden kann. Die Beschreibung einzelner Massenpunkte ist andererseits einfacher als diejenige kompletter Körper, da die Rotationsenergie von Massenpunkten im Vergleich zu ihrer kinetischen Energie vernachlässigt werden kann und sie - im Gegensatz zu Körpern - unter der Einwirkung von Kräften auch nicht deformiert werden. Wir werden einen Körper also als System wechselwirkender Punktteilchen beschreiben: dpi = Fi dt (i = 1, 2, . . . , N ) , wobei Fi die Kraft auf das i-te Teilchen und pi ≡ mi ẋi der entsprechende Impuls ist. Als weitere Motivation für die Untersuchung von Massenpunkten sei hinzugefügt, dass ein Massenpunkt oft eine gute Näherung für einen realen, ausgedehnten Körper darstellt. Man denke z. B. an das Kepler-Problem der Beschreibung der Bewegung eines Planeten um die Sonne, bei dem diese Himmelskörper in guter Näherung durch Massenpunkte approximiert werden können. Auch die Dynamik des Sonnensystems als Ganzes kann theoretisch in guter Näherung als die Zeitentwicklung eines Systems von Massenpunkten angesehen werden. 2.2 Raum und Zeit Die Physik, also insbesondere auch die Mechanik, spielt sich in einer vierdimensionalen Raum-Zeit ab. Wir nehmen an, dass ein kartesisches Koordinatensystem gegeben ist und betrachten die Welt durch die Augen eines Beobachters, der über einen Zollstock und eine Uhr verfügt, um gegebenenfalls Längen- und Zeitmessungen durchführen zu können. Hierbei ist die Zeit eine eindimensionale physikalische Größe und wird die Länge des Zeitintervalls ∆t zwischen den Zeitpunkten t1 und t2 durch die Zeitdifferenz ∆t = t2 − t1 gegeben. Ein positiver Wert (∆t > 0) würde bedeuten, dass t2 für t1 in der Zukunft, ein negativer Wert (∆t < 0), dass t2 für t1 in der Vergangenheit liegt. Analog ist der Abstand zweier Punkte x und x′ im dreidimensionalen Ortsraum durch |x − x′ | = È (x1 − x′1 )2 + (x2 − x′2 )2 + (x3 − x′3 )2 (2.1) gegeben. Der so definierte euklidische Abstand im Ortsraum ist allerdings für alle möglichen Kombinationen von Punkten x und x′ nicht-negativ. Aufgrund dieser Definitionen von zeitlichen und räumlichen Abständen können nun einige weitere Begriffe und Eigenschaften eingeführt werden: Falls die physikalische Bahn eines Teilchens als Funktion der Zeit durch x(t) gegeben ist, wird die Geschwindigkeit dieses Teilchens durch ẋ(t) ≡ lim ∆t→0 dx x(t + ∆t) − x(t) = (t) ∆t dt , 7 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK die Beschleunigung durch d2 x ẋ(t + ∆t) − ẋ(t) = 2 (t) ∆t→0 ∆t dt ẍ(t) ≡ lim und der Impuls durch p(t) ≡ mẋ(t) definiert, wobei die Masse m übrigens durchaus zeitabhängig sein darf. Der Geschwindigkeitsbetrag ist durch |x(t + ∆t) − x(t)| ∆t→0 ∆t |ẋ(t)| ≡ lim definiert, und der Impulsbetrag ist |p(t)| = m|ẋ(t)|. Im Sinne der Linearen Algebra ist der Ortsraum der Klassischen Mechanik ein Vektorraum, und zwar der Vektorraum R3 der geordneten reellen Tripel x = (x1 , x2 , x3 ). Die Rechenregel (∀ x, x′ ∈ R3 )(∃! x + x′ ∈ R3 ) besagt, dass die Summe zweier Vektoren x und x′ wiederum zum Vektorraum gehört. Diese Eigenschaft, zusammen mit den üblichen Regeln der Addition, ist sicherlich erforderlich, um z. B. die „stroboskopische“ Variante der physikalischen Bahn, xn = x0 + n X i=1 ∆xi , ∆xi ≡ x(ti ) − x(ti−1 ) , ti ≡ t 0 + i (tN − t0 ) N mit n ≤ N zu beschreiben. Auch die Regeln der Multiplikation, wie z. B. (∀ x ∈ R3 , α ∈ R)(∃! αx ∈ R3 ) werden dringend benötigt, um z. B. die geradlinig-gleichförmige Bewegung x(t) = x(0) + vt sinnvoll beschreiben zu können. Da der Vektorraum außerdem mit einem Skalarprodukt x · x′ ≡ x1 x′1 + x2 x′2 + x3 x′3 und also mit der bereits in (2.1) eingeführten euklidischen Metrik |x − x′ | ≡ È (x − x′ ) · (x − x′ ) = È (x1 − x′1 )2 + (x2 − x′2 )2 + (x3 − x′3 )2 versehen wird, liegt im Falle des Ortsraums der Klassischen Mechanik - mathematisch gesprochen - insgesamt also ein dreidimensionaler euklidischer Vektorraum vor. Von den bisher eingeführten Größen spielen sowohl die Länge eines Zeitintervalls als auch der räumliche Abstand zweier gleichzeitiger Ereignisse in der Klassischen Mechanik eine besondere Rolle: Beide sind absolute (d. h. beobachterunabhängige) Größen, und diese Beobachterunabhängigkeit hat – wie wir sehen werden – weitreichende Konsequenzen bei der Formulierung möglicher 8 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK physikalischer Gesetze. Die Beobachterunabhängigkeit der Länge eines Zeitintervalls und des räumlichen Abstands hat in der nicht-relativistischen Klassischen Mechanik den Status eines Postulats. Wir werden später sehen, dass die Zeitdauer und der räumliche Abstand ihren absoluten Charakter in der Relativitätstheorie verlieren; das entsprechende Postulat wird dann durch ein anderes (über die Beobachterunabhängigkeit des „differentiellen Raum-Zeit-Intervalls“) ersetzt. Für die Zeitvariable bedeutet ihre absolute Natur in der nicht-relativistischen Mechanik konkret Folgendes: Wenn man einen Satz identischer Uhren, die alle gleich schnell laufen, aber möglicherweise zu unterschiedlichen Zeitpunkten gestartet wurden, über die Beobachter in den verschiedenen Koordinatensystemen verteilt, dann (i) bedeutet Gleichzeitigkeit für alle Beobachter dasselbe. Wenn der Beobachter B zur Zeit t die Ereignisse {Eα (t)} sieht, so dass diese für B alle gleichzeitig stattfinden, dann gibt es für den Beobachter B ′ eine Zeit t′ , so dass die zu diesem Zeitpunkt von ihm gesehenen Ereignisse {Eβ′ (t′ )} mit den {Eα (t)} identisch sind. (ii) ist die Zeitdauer zwischen zwei nicht-gleichzeitigen Ereignissen für alle Beobachter gleich. Da B und B ′ mit Hilfe ihrer Uhren für jedes Zeitintervall beide das gleiche Ergebnis erhalten: ∆t = ∆t′ , müssen ihre Uhrzeiten gemäß t = t′ + τ für irgendein τ ∈ R miteinander verknüpft sein. Neben der Zeit ist in der Klassischen Mechanik auch der Abstand |x1 − x2 | zweier gleichzeitiger Ereignisse (x1 , t) und (x2 , t) eine absolute Größe. Wir wissen bereits, dass die Gleichzeitigkeit zweier Ereignisse aufgrund des absoluten Charakters der Zeit für alle Beobachter dasselbe bedeutet. Auch der Abstand gleichzeitiger Ereignisse ist somit von fundamentaler Bedeutung in der Mechanik. Es braucht wohl kaum darauf hingewiesen zu werden, dass der Abstand zweier nicht -gleichzeitiger Ereignisse im Allgemeinen beobachterabhängig ist und insbesondere (bei geeigneter Wahl des Koordinatensystems) gleich Null gewählt werden kann. 2.3 Abgeschlossene mechanische Systeme und Teilsysteme Es gibt einen wesentlichen Unterschied zwischen abgeschlossenen mechanischen Systemen, die als vom Rest des Weltalls entkoppelt angesehen werden können, und Teil systemen, die explizit an die Außenwelt gekoppelt sind; in der Bewegungsgleichung eines Teilsystems wird die Außenwelt dann mittels äußerer Felder (z. B. Schwerkraftfelder, elektrischer oder magnetischer Felder) dargestellt. Der wesentliche Unterschied zwischen abgeschlossenen Systemen und Teilsystemen ist, dass die ersteren echten physikalischen Gesetzen gehorchen, die universell (im Sinne von beobachterunabhängig) sind, während dies für die letzteren im Allgemeinen nicht gilt: Bei Teilsystemen muss man zusätzlich stets auch angeben, wie die Außenwelt mittransformiert wird, wenn man das Koordinatensystem wechselt. Betrachten wir ein paar Beispiele: Mit Hilfe des Newton’schen Gravitationsgesetzes kann man z. B. das Sonnensystem beschreiben, welches in guter 9 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK Näherung ein abgeschlossenes System darstellt. Das Gravitationsgesetz ist in der Tat ein Gesetz, da es beobachterunabhängig ist. Falls der Beobachter B im Koordinatensystem K die Bewegungsgleichung mi ẍi = X Gmi mj xji (i, j = 1, . . . , N ) |xji |3 j6=i findet, so findet B ′ im Koordinatensystem K ′ , dessen Achsen gegenüber denjenigen von K gedreht sind, so dass 0′ = 0 und ê′i = Rêi gilt, die Bewegungsgleichung mi ẍ′i = X Gmi mj x′ji (x′ = R−1 x; i, j = 1, 2 . . . , N ) . |x′ji |3 j6=i Hierbei ist R die Drehmatrix mit den Matrixelementen Rij ≡ êT i Rêj und somit eine orthogonale Matrix mit det(R) = 1. Für B und B ′ gilt somit das gleiche physikalische Gesetz.1 Man kommt zum selben Schluss, wenn K ′ im Ortsraum oder in der Zeit relativ zu K verschoben wird (Translation) oder eine Geschwindigkeitstransformation oder Raumspiegelung durchgeführt wird. Unter allen diesen Transformationen ist das Gravitationsgesetz forminvariant und somit insgesamt – wie man sagt – kovariant. Nun kann man alternativ Teilchen 1 auch als Teilsystem betrachten und seine Dynamik im Schwerkraftfeld der übrigen N − 1 Teilchen untersuchen. Man erhält dann eine Bewegungsgleichung der Gestalt m1 ẍ1 = m1 g(x1 , t) , g= X Gmj xj1 j6=1 (2.2) , |xj1 |3 die natürlich nur dann hilfreich ist, falls g(x1 , t) eine einfache Form hat. Formen die übrigen N − 1 Teilchen beispielsweise ein kondensiertes Medium, das durch eine Massendichte ρ(x, t) charakterisiert werden kann, so erhält man die Darstellung g(x1 , t) = X j6=1 Gρ(xj , t)∆xj xj − x1 =G |xj − x1 |3 Z dx′ ρ(x′ , t) x′ − x1 |x′ − x1 |3 (2.3) für die Beschleunigung der Schwerkraft, wobei das Volumenelement ∆xj nur den j-ten Massenpunkt enthalten soll. Eine typische Anwendung der Beschreibung (2.2) und (2.3) wäre ein Teilchen im Schwerkraftfeld der Erde, wobei die Gravitationswirkung anderer Himmelskörper vernachlässigt wird. Im Falle des Schwerkraftfelds der Erde kann man die Zeitabhängigkeit der Massendichte, die z. B. durch die Rotation der Erde oder durch Vulkanismus oder Gezeitenwirkung verursacht wird, meist vernachlässigen: ρ(x, t) = ρ(x). Man erhält somit 1 Die Transformationsregel x′ = R−1 x für die Koordinaten unter Drehungen folgt aus der Invarianz des von x (oder x′ ) beschriebenen Vektors: X j xj êj ≡ X i x′i ê′i = X x′i êj ij die x = Rx′ bzw. x′ = R−1 x impliziert. êT j Rêi = X j X i Rji x′i êj , 10 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK den einfacheren Ausdruck Z dx′ ρ(x′ ) g = g(x1 ) = G x′ − x1 |x′ − x1 |3 (2.4) . Wenn wir als Ursprung des Koordinatensystems den Erdmittelpunkt wählen und annehmen, dass die Massendichte ρ(x′ ) nur vom Abstand |x′ | zum Erdmittelpunkt abhängig ist, so kann (2.3) auch in der einfacheren Form g(x1 ) = −GME x1 |x1 |3 (2.5) dargestellt werden, wobei ME die Gesamtmasse der Erde ist. Falls wir nur an der Wirkung der Schwerkraft nahe dem Punkte x = RE ê an der Erdoberfläche interessiert sind, wobei RE also den Erdradius und ê einen Einheitsvektor darstellt, der im Ursprung (d. h. im Erdmittelpunkt) angreift, können wir approximieren: g(x1 ) = − GME x1 GME = − 2 ê ≡ −gê . 2 |x1 | |x1 | RE Hierbei drückt g ≃ 9, 81 m/s2 die Beschleunigung der Schwerkraft an der Erdoberfläche aus. Mit der Definition x1 · ê ≡ RE + z findet man also die einfache Bewegungsgleichung m1 z̈ = −m1 g (2.6) . Während das Gesetz (1.1) im abgeschlossenen System invariant ist unter Translationen, Rotationen, Geschwindigkeitstransformationen usw., muss im Teilsystem (2.2) das Transformationsverhalten des äußeren Feldes g(x, t) stets explizit angegeben werden. In (2.5) wird die Translationsinvarianz der Bewegungsgleichung durch die Fixierung des Erdmittelpunktes gebrochen, während in (2.6) zusätzlich auch die Rotationsinvarianz und die Invarianz unter Raumspiegelungen gebrochen werden. Bewegungsgleichungen für Teilsysteme sind also gewissermaßen beobachterabhängig und haben in diesem Sinne nur eine eingeschränkte Gültigkeit. Vollkommen analog zum Newton’schen Gravitationsgesetz beschreibt auch das Coulomb-Gesetz (1.2) ein abgeschlossenes mechanisches System, und die entsprechende Bewegungsgleichung mi ẍi = X j6=i qi qj xji − 4πε0 |xji |3 (i, j = 1, 2, . . . , N ) ist invariant unter Translationen, Drehungen, Geschwindigkeitstransformationen und Raumspiegelungen. Wiederum können wir Teilchen 1 als Teilsystem betrachten und die von den anderen Teilchen herrührenden Kräfte als äußeres Feld subsumieren: m1 ẍ1 = q1 E(x1 , t) , E= X j6=1 − qj xj1 4πε0 |xj1 |3 . (2.7) Das äußere Feld E(x1 , t) kann nun als das auf Teilchen 1 einwirkende elektrische Feld interpretiert werden. Wiederum kann man den Spezialfall betrachten, dass 11 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK die Teilchen 2, 3, . . . , N einen makroskopischen Körper bilden, der nun durch die Ladungsdichte ρ(x′ ) beschrieben werden kann: E = E(x1 ) = − 1 4πε0 Z dx′ ρ(x′ ) x′ − x1 |x′ − x1 |3 , und wiederum muss in (2.7) das Transformationsverhalten des äußeren Feldes E bei einem Wechsel des Koordinatensystems explizit angegeben werden. Bisher haben wir angenommen, dass im von den Teilchen 2, 3, . . . , N gebildeten System keine signifikanten makroskopischen Ströme auftreten. In Anwesenheit solcher Ströme erhält man zusätzliche Beiträge zum elektrischen Feld, und es treten auch Magnetfelder auf. Statt (2.7) gilt nun die allgemeinere Bewegungsgleichung m1 ẍ1 = q1 [E(x1 , t) + ẋ1 × B(x1 , t)] , (2.8) wobei B(x, t) das Magnetfeld darstellt und das rechte Glied insgesamt als die Lorentz-Kraft bezeichnet wird. Es ist bemerkenswert, dass die Lorentz-Kraft FLor (x, ẋ, t) ≡ q[E(x, t) + ẋ × B(x, t)] nicht nur von den Raum-Zeit-Koordinaten (x, t), sondern auch von der Geschwindigkeit ẋ abhängig ist. Aufgrund der bisherigen Diskussion ist klar, dass die Lorentz’sche Bewegungsgleichung (2.8) kein abgeschlossenes mechanisches System, sondern im Allgemeinen nur ein Teilsystem beschreibt. 2.4 Galileos Relativitätsprinzip Aufgrund des vorher Gesagten ist klar, dass physikalische Gesetze nur dann ohne Weiteres beobachterunabhängig sein können, wenn sie Systeme, die nicht an die Außenwelt gekoppelt sind, im Falle der Mechanik also abgeschlossene mechanische Systeme beschreiben. Für solche Systeme (und nur für solche Systeme) gilt das Relativitätsprinzip, das besagt, dass es gewisse Koordinatensysteme gibt, die wir im Folgenden als Inertialsysteme bezeichnen werden und die durch die folgenden zwei Eigenschaften gekennzeichnet sind: 1. Alle physikalischen Gesetze sind in allen Inertialsystemen zu jedem Zeitpunkt gleich. 2. Alle Koordinatensysteme, die sich relativ zu einem Inertialsystem in geradlinig-gleichförmiger Bewegung befinden, sind selbst Inertialsysteme. Auch die Existenz von Inertialsystemen hat in der Klassischen Mechanik den Status eines Postulats. Die erstgenannte Eigenschaft von Inertialsystemen drückt die Beobachterunabhängigkeit aus, die man von einer grundlegenden physikalischen Theorie erwartet, und die zweite Eigenschaft macht klar, dass es überabzählbar unendlich viele Inertialsysteme gibt.2 Es sei (vielleicht unnötigerweise) 2 Das Relativitätsprinzip tritt z. B. in Galileos Buch „Dialogo sopra i due massimi sistemi del mondo, tolemaico e copernicano“ auf (1632 publiziert, aber die Ideen dürften deutlich älter sein), wenn Salviati, der den kopernikanischen Standpunkt vertritt, behauptet, dass ein 12 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK darauf hingewiesen, dass natürlich nicht jedes Koordinatensystem ein Inertialsystem ist: Koordinatensysteme, die relativ zu einem Inertialsystem beschleunigt werden (man denke z. B. an die um ihre Achse rotierende und sich um die Sonne drehende Erde) stellen selbst keine Inertialsysteme dar. Falls die Effekte solcher Beschleunigungen jedoch gering sind, kann man sogar Nicht-Inertialsysteme manchmal approximativ als Inertialsysteme behandeln. Außerdem ist klar, dass streng abgeschlossene mechanische Systeme wohl kaum realisierbar sein dürften, da es immer irgendwelche Restwechselwirkungen zwischen dem System und dem Rest des Universums gibt. Auch der Begriff „abgeschlossenes System“ stellt daher eine (oft sehr gute) Approximation dar. 2.5 Galilei-Transformationen Um die physikalischen Gesetze von der „Sprache“ des einen Inertialsystems in diejenige eines anderen Inertialystems „übersetzen“ und somit u. a. ihre Forminvarianz (oder alternativ: Kovarianz ) überprüfen zu können, muss man die möglichen Koordinatentransformationen zwischen Inertialsystemen genau kennen. Solche Koordinatentransformationen zwischen Inertialsystemen, die die physikalischen Gesetze forminvariant lassen, werden als Galilei-Transformationen bezeichnet. Die mögliche Form der Galilei-Transformationen wird durch die zwei fundamentalen, in Abschnitt [2.4] genannten Eigenschaften von Inertialsystemen festgelegt; insbesondere impliziert die erste Eigenschaft, dass Galilei-Transformationen die Raum-Zeit-Struktur und daher insbesondere die Zeitdauer zwischen zwei Ereignissen und den räumlichen Abstand zweier gleichzeitiger Ereignisse invariant lassen. Bezeichnen wir die Raum-Zeit-Koordinaten im Inertialsystem K als (x, t) und diejenigen in einem anderen Inertialsystem K ′ als (x′ , t′ ), dann muss für beliebige Ereignisse (x1 , t1 ) und (x2 , t2 ) gelten: ∆t′ ≡ t′2 − t′1 = t2 − t1 ≡ ∆t , (2.9) und für beliebige gleichzeitige Ereignisse (x1 , t) und (x2 , t): |x′2 − x′1 | = |x2 − x1 | . (2.10) Wir untersuchen nun die Konsequenzen der Invarianzen (2.9) und (2.10) unter Koordinationstransformationen zwischen zwei Inertialsystemen. 2.5.1 Zeittranslationen Die funktionale Beziehung t′ (t) zwischen den Zeitvariablen in K und K ′ wird durch (2.9) bereits weitgehend festgelegt. Mit der Notation t2 − t1 ≡ ∆t folgt nämlich für alle t1 ∈ R: t′ (t1 + ∆t) − t′ (t1 ) dt′ (t1 ) = lim = lim 1 = 1 ∆t→0 ∆t→0 dt ∆t , Stein, der auf einem Schiff von der Spitze des Mastes herunterfällt, am Fuß des Mastes landet (und nicht z. B. dahinter, wie viele damals offenbar meinten). Dieses Faktum war relevant bei der Diskussion über die mögliche Bewegung der Erde im Weltall und die hieraus folgenden Konsequenzen für die physikalischen Gesetze auf der Erde. Mit Galileos Werk findet gewissermaßen die Geburt der Theoretischen Physik statt, da hier erstmals systematisch mathematische Berechnungen mit dem Experiment (von ihm als „cimento“ ≃ Bewährungsprobe bezeichnet) verglichen werden. 13 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK und daher gilt für irgendein τ ∈ R: t′ = t − τ (2.11) . Die einzigen „erlaubten“ Transformationen der Zeitvariablen sind also Zeittranslationen. 2.5.2 Geschwindigkeitstransformationen Es gibt mehrere Möglichkeiten, die Ortskoordinaten zu transformieren, so dass die Metrik im Ortsraum invariant bleibt, wie in (2.10). Eine mögliche Beziehung der Koordinatensysteme K und K ′ ist die gleichförmige Relativbewegung:3 x′ (x, t) = x − vt , (2.12) wobei v die Relativgeschwindigkeit des Inertialsystems K ′ in Bezug auf K darstellt: vrel (K ′ , K) = v . Eine Bahnbewegung xφ (t) mit der Geschwindigkeit ẋφ (t) in K, wobei der Index „φ“ für die „physikalische Bahn“ eines Teilchens steht, wird in K ′ also als Bahn x′ (xφ (t), t) = xφ (t) − vt mit der modifizierten Geschwindigkeit ẋ′φ = ẋφ − v wahrgenommen: ẋ′φ ≡ dx′φ dx′ (xφ (t), t) dt ∂x′ dxφ ∂x′ = = · + = 11ẋφ −v = ẋφ −v dt′ dt dt′ ∂x dt ∂t . (2.13) Hierbei wurde die Notation ∂a ∂x ij ≡ ∂ai ∂xj für die partielle Ableitung des Vektorfeldes a(x, t) nach dem Vektor x eingeführt. Gleichung (2.13) zeigt also, dass sich nach Galileos Relativitätsprinzip zu jeder Geschwindigkeit ẋφ in K immer ein Inertialsystem K ′ mit einer beliebigen transformierten Geschwindigkeit ẋφ − v finden lässt. Jede Geschwindigkeit ist daher möglich und keine Geschwindigkeit ist besonders ausgezeichnet. Heute wissen wir, dass dieses Ergebnis in deutlichem Widerspruch zur Relativitätstheorie steht, denn es würde für eine elektromagnetische Welle, die sich im System K mit der Lichtgeschwindigkeit c in der Richtung ĉ ausbreitet, bedeuten: c′ = c − v , c ≡ c ĉ , und daher im Allgemeinen c′ = |c′ | = 6 c. Generell erlaubt (2.13) durch eine geeignete Wahl von K ′ auch Geschwindigkeiten größer als c, im Widerspruch zur Relativitätstheorie und zum Experiment. Wir folgern hieraus, dass Galileos Relativitätsprinzip auf Relativgeschwindigkeiten |v| ≪ c beschränkt ist und für höhere Relativgeschwindigkeiten modifiziert werden muss. 3 Es ist bemerkenswert, dass bei der Relativbewegung die Orts- und Zeitkoordinaten (x, t) auch in der nicht-relativistischen Mechanik linear kombiniert und somit gemischt werden. 14 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK 2.5.3 Translationen im Ortsraum Eine andere Gruppe von Transformationen der Ortskoordinaten, die die Metrik (2.10) invariant lassen, sind die Translationen: x′ (x, t) = x − ξ (ξ ∈ R3 ) , (2.14) denn offensichtlich gilt für alle ξ: |x′2 − x′1 | = |x′ (x2 , t) − x′ (x1 , t)| = |(x2 − ξ) − (x1 − ξ)| = |x2 − x1 | . Die Translation (2.14) im Ortsraum ist das räumliche Pendant der Zeittranslation (2.11). Während (2.11) die Äquivalenz zeitverschobener Inertialsysteme und daher die Homogenität der Zeit ausdrückt, bringt (2.14) die Homogenität des Raums zum Ausdruck. 2.5.4 Drehungen Außerdem ist es möglich, die Inertialsysteme K und K ′ durch eine Drehung um eine Achse durch die beiden Ursprünge 0 = 0′ zu verknüpfen: x′ (x, t) = R−1 x , (2.15) denn auch dann gilt: |x′2 − x′1 | = |R−1 x2 − R−1 x1 | = |R−1 (x2 − x1 )| = |x2 − x1 | . Die Invarianz der physikalischen Gesetze unter Drehungen drückt die Isotropie des Ortsraums, d. h. die Äquivalenz der verschiedenen Raumrichtungen, aus. Wie wir bereits vorher bei der Untersuchung des Newton’schen Gravitationsgesetzes gesehen haben, bedeutet (2.15), dass die Basisvektoren {êi } und {ê′i } von K und K ′ gemäß ê′i = Rêi mit Rij = êT i Rêj miteinander zusammenhängen. Ein kurzes Wort zum Thema „Drehungen“: Eine Drehung R(α) ist eine lineare homogene orthogonale Transformation mit der Determinante Eins: RT R = 11 , det(R) = 1 , die durch einen Drehwinkel α ≡ |α| und eine Drehrichtung α̂ ≡ α/α definiert wird. Da die Drehrichtung α̂ durch zwei Winkel festgelegt werden kann: α̂ = cos(ϕ) sin(ϑ) sin(ϕ) sin(ϑ) cos(ϑ) , 0≤ϑ≤π , 0 ≤ ϕ < 2π , (2.16) ist der Drehvektor α = αα̂ mit −π < α ≤ π also insgesamt durch drei Winkel (α, ϑ, ϕ) bestimmt. Die Drehungen {R(α)} bilden bekanntlich eine Gruppe, da (i) das Produkt zweier Drehungen wiederum eine Drehung darstellt: (R1 R2 )T R1 R2 = R2T R1T R1 R2 = R2T R2 = 11 , det(R1 R2 ) = 1 . (ii) Matrixmultiplikation (und somit auch das Multiplizieren von Drehungen) assoziativ ist. 15 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK α̂ x α̂×x | α̂×x| α̂×x) − α̂×( | α̂×x| Abbildung 2.1: Parametrisierung von Drehungen (iii) auch die Identität 11 eine Drehung darstellt, und (iv) auch die Inverse R(α)−1 = RT (α) = R(−α) einer Drehung eine Drehung ist. Die Multiplikation von Drehungen ist im Allgemeinen nicht kommutativ: R(α1 )R(α2 ) 6= R(α2 )R(α1 ) , denn es gilt z. B. ê3 = R π2 ê1 R π2 ê3 ê1 6= R π2 ê3 R π2 ê1 ê1 = ê2 . Ein einfaches Beispiel einer Drehung um einen variablen Winkel ist die Rotation um einen Winkel α um die x3 -Achse: R(αê3 ) = − sin(α) cos(α) 0 cos(α) sin(α) 0 0 0 1 . Eine Matrixdarstellung von R(α), die für beliebige Drehvektoren α gültig ist, erhält man wie folgt: Für alle Ortsvektoren x und alle Drehrichtungen α̂ gilt: x = α̂(α̂ · x) − α̂ × (α̂ × x) (2.17) , wie auch aus Abbildung 2.1 ersichtlich ist. Daher gilt bei Drehung von x um einen Winkel α um die α̂-Richtung: R(α)x = α̂(α̂ · x) − α̂ × (α̂ × x) cos(α) + (α̂ × x) sin(α) . (2.18) Eine Matrixdarstellung für R(α) folgt nun, wenn die explizite Winkelabhängigkeit (2.16) von α̂ in (2.18) eingesetzt wird. 2.5.5 Raumspiegelungen Die bisher diskutierten Koordinatentransformationen lassen die Orientierung (oder auch „Händigkeit“) und daher das Vorzeichen der Determinante |ê1 ê2 ê3 | der Basisvektoren invariant: |ê′1 ê′2 ê′3 | = |ê1 ê2 ê3 | . 16 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK Eine weitere Transformation, die die Metrik invariant lässt, dafür aber die „Händigkeit“ ändert, ist die Raumspiegelung oder Inversion: x′ (x, t) = −x , t′ = t , denn wiederum gilt |x′2 − x′1 | = |x2 − x1 |. Im Spiegelbild der Mechanik sollen also nach dem Relativitätsprinzip dieselben Gesetze gelten wie auf unserer Seite des Spiegels. Um die Händigkeit einer allgemeinen Galilei-Transformation beschreiben zu können, führen wir einen Parameter σ≡ |ê′1 ê′2 ê′3 | |ê1 ê2 ê3 | ein, der also den Wert −1 oder +1 hat, abhängig davon, ob in der allgemeinen Galilei-Transformation eine Raumspiegelung enthalten ist oder nicht. 2.5.6 Allgemeine Galilei-Transformationen Man kann nun leicht zeigen, dass jede Galilei-Transformation mit Hilfe von Geschwindigkeitstransformationen, Translationen, Drehungen und möglicherweise einer Raumspiegelung aufgebaut werden kann, so dass die allgemeine Transformation die Form x′ (x, t) = σR−1 x − vt − ξ , t′ = t − τ (2.19) mit σ = ±1 hat. Um die Allgemeingültigkeit von (2.19) zu zeigen, stellen wir zuerst fest, dass wegen der zweiten Eigenschaft von Inertialsystemen (siehe S. 12) für bestimmte v und ξ: x′ (0, t) = −vt − ξ gelten muss. Wir definieren nun x′′ (x, t) ≡ x′ (x, t) + vt + ξ und untersuchen die (x, t)-Abhängigkeit von x′′ . Auf jeden Fall gilt: x′′ (0, t) = 0 , |x′′ (x2 , t) − x′′ (x1 , t)| = |x2 − x1 | (∀ x1 , x2 ) . (2.20) Wir zeigen nun, dass x′′ (x, t) linear von x abhängt und t-unabhängig ist.4 Indem man entweder x1 = 0 oder x2 = 0 wählt in (2.20), erhält man |x′′ (x2 , t)| = |x2 | , |x′′ (x1 , t)| = |x1 | . Daher gilt: 0 = |x′′ (x2 , t) − x′′ (x1 , t)|2 − |x2 − x1 |2 = (x′′2 − x′′1 ) · (x′′2 − x′′1 ) − (x2 − x1 ) · (x2 − x1 ) = |x′′2 |2 + |x′′1 |2 − 2x′′1 · x′′2 − |x2 |2 − |x1 |2 + 2x1 · x2 = 2 [x1 · x2 − x′′ (x1 , t) · x′′ (x2 , t)] und somit: x′′ (x, t) · x′′ (y, t) = x · y (∀ x, y ∈ R3 ) . (2.21) 4 Intuitiv ist dies klar, da x′′ Geraden in K in Geraden in K ′ überführen muss, damit K und K ′ sich relativ zu einander in geradlinig-gleichförmiger Bewegung befinden. 17 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK Man findet insbesondere für y = λ1 y1 + λ2 y2 mit λ1,2 ∈ R : x′′ (x, t) · x′′ (λ1 y1 + λ2 y2 , t) = x · (λ1 y1 + λ2 y2 ) = λ1 x · y1 + λ2 x · y2 = x′′ (x, t) · [λ1 x′′ (y1 , t) + λ2 x′′ (y2 , t)] . Da dies für alle x ∈ R3 und daher für alle x′′ (x, t) ∈ R3 gilt, folgt die Linearität von x′′ (y, t): x′′ (λ1 y1 + λ2 y2 , t) = λ1 x′′ (y1 , t) + λ2 x′′ (y2 , t) , die auch als x′′ (y, t) = Ot y geschrieben werden kann. Hierbei ist Ot eine lineare Transformation, die außerdem zeitunabhängig sein muss, Ot = O, damit K ′ sich tatsächlich geradlinig-gleichförmig relativ zu K bewegt, denn die Relativgeschwindigkeit der zwei Koordinatensysteme, d dOt dx′ (y, t) = (Ot y − vt − ξ) = y−v dt dt dt ist nur dann y-unabhängig, wenn somit zu dOt dt Ox · Oy = x · OT Oy = x · y , = 0 gilt. Gleichung (2.21) vereinfacht sich (∀ x, y ∈ R3 ) , und diese Identität kann nur dann für alle x, y ∈ R gelten, falls O orthogonal ist: OT O = 11. Dies ist schließlich gleichbedeutend mit O = σR−1 und daher mit (2.19). 2.5.7 Die Galilei-Gruppe Die allgemeinen Galilei-Transformationen (2.19) bilden eine 10-Parameter-Gruppe, wobei die 10 (kontinuierlich variierbaren) Parameter durch (τ, ξ, α, v) gegeben sind; durch die Wahlmöglichkeit σ = ±1 wird der Satz der möglichen Parameterwerte noch einmal verdoppelt. Dass die Galilei-Transformationen (2.19) tatsächlich auch im mathematischen Sinne eine Gruppe bilden, sieht man wie folgt ein: Führen wir die zwei Galilei-Transformationen G1 (x, t) ≡ (G1 (x, t), t − τ1 ) ≡ (σ1 R1−1 x − v1 t − ξ 1 , t − τ1 ) und G2 (x, t) ≡ (G2 (x, t), t − τ2 ) ≡ (σ2 R2−1 x − v2 t − ξ 2 , t − τ2 ) nacheinander aus, so erhalten wir wiederum eine Galilei-Transformation: (x′ , t′ ) = (G2 ◦ G1 )(x, t) = (G2 (G1 (x, t), t − τ1 ), t − (τ1 + τ2 )) mit t′ = t − (τ1 + τ2 ) und x′ = σ2 R2−1 (σ1 R1−1 x − v1 t − ξ 1 ) − v2 (t − τ1 ) − ξ 2 = (σ1 σ2 )(R1 R2 )−1 x − (v2 + σ2 R2−1 v1 )t − (ξ 2 + σ2 R2−1 ξ 1 − v2 τ1 ) . 18 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK Außerdem sind Galilei-Transformationen assoziativ, und es gibt eine Identität (τ, ξ, α, v, σ) = (0, 0, 0, 0, 1) und zu jeder Transformation (τ, ξ, α, v, σ) auch eine Inverse, die durch (−τ, −σR(α)(ξ + vτ ), −α, −σR(α)v, σ) parametrisiert wird. Alle Gruppenaxiome sind daher erfüllt. Es ist übrigens bemerkenswert, dass die allgemeine Galilei-Transformation (2.19) insofern unsymmetrisch in den Raum-Zeit-Koordinaten ist, als x′ von x und t gemeinsam und die transformierte Zeit t′ nur von t abhängt. Diese Asymmetrie ist typisch für die nicht-relativistische Klassische Mechanik und wird von der Relativitätstheorie behoben. Eine weitere Bemerkung ist, dass die hier untersuchten Inertialsysteme (per definitionem) alle durch dieselbe Metrik im Ortsraum („Längeneinheit“) und durch das gleiche Zeitmaß in der Zeit („Zeiteinheit“) bestimmt sind. Eine andere Definition des Einheitensystems, d. h. eine andere Wahl der Längen- oder Zeiteinheit, würde einem anderen aber äquivalenten Satz von Inertialsystemen entsprechen. 2.6 Das deterministische Prinzip der Klassischen Mechanik Während Galileo sich mit den Gesetzmäßigkeiten der Bewegung an sich, d. h. mit der Kinematik befasste, ohne sich explizit mit den Kraftgesetzen auseinanderzusetzen, hat Isaac Newton die enorme Leistung erbracht, die Dynamik zu begründen, d. h. etliche wichtige Kraftgesetze explizit zu formulieren und die dazugehörigen Bewegungsgleichungen zu lösen. Newtons Kraftgesetze basieren alle auf dem Prinzip, dass die physikalische Bahn x(t) eines Systems für alle Zeiten t > 0 vollständig festgelegt ist, sobald die Anfangswerte x(0) ≡ x0 des Aufenthaltsortes und ẋ(0) ≡ ẋ0 der Geschwindigkeit vorgegeben sind. Mutatis mutandis gilt für Systeme, die aus mehreren Teilchen bestehen, dass die Zukunft {xi (t)} eines Systems für alle t > 0 vollständig festgelegt ist, wenn die Anfangswerte der Koordinaten und Geschwindigkeiten zur Zeit t = 0 bekannt sind. Die Klassische Mechanik ist somit eine rein deterministische Theorie. Aus dem deterministischen Prinzip der Mechanik folgt sofort, dass die Bewegungsgleichung für ein System mit nur einem Teilchen die Form dp = F(x, ẋ, t) , p = mẋ (2.22) dt haben muss, wobei F(x, ẋ, t) die auf das Teilchen einwirkende Kraft darstellt und die Masse m unter Umständen zeitabhängig sein kann; in fast allen Anwendungen werden wir jedoch zeitunabhängige Massen betrachten. Gleichung (2.22) ist die zentrale Gleichung in der Klassischen Mechanik und wird als die Newton’sche Bewegungsgleichung bezeichnet. Für Systeme mehrerer Teilchen gilt analog dpi = Fi (X, Ẋ, t) dt , pi = mi ẋi , (2.23) wobei Fi nun die auf das i-te Teilchen einwirkende Kraft ist und X und Ẋ die Koordinaten bzw. Geschwindigkeiten aller Teilchen zusammenfassen: X ≡ (x1 , x2 , . . . , xN ) , Ẋ = (ẋ1 , ẋ2 . . . , xN ) . 19 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK Die Gleichungen (2.22) und (2.23) sind auch als das zweite Newton’sche Gesetz bekannt. Aus dem vorigen Abschnitt ist klar, dass die von Newton formulierten beobachterunabhängigen physikalischen Gesetze im Allgemeinen nur in Inertialsystemen gelten. Wir überprüfen zunächst, dass die durch (2.22) bestimmte physikalische Bahn x(t) das deterministische Prinzip erfüllt, d. h. tatsächlich vollständig durch die Anfangswerte x0 und ẋ0 bestimmt ist. Hierbei nehmen wir an, dass die Masse m zeitunabhängig ist: mẍ = F(x, ẋ, t) , x(0) = x0 , . (2.24) x(0) = x0 (2.25) ẋ(0) = ẋ0 Integration dieser Gleichung liefert: ẋ(t) = ẋ0 + 1 m Z t dt′ F(x(t′ ), ẋ(t′ ), t′ ) , 0 und nochmalige Integration liefert: x(t) = x0 + ẋ0 t + 1 m Z t 0 Z t′ dt′ dt′′ F(x(t′′ ), ẋ(t′′ ), t′′ ) . (2.26) 0 Grundsätzlich sind die Gleichungen (2.25) und (2.26) genauso einfach oder schwierig wie die Newton’sche Bewegungsgleichung (2.22); sie haben jedoch den Vorteil der iterativen Lösbarkeit. Definieren wir F(x0 , ẋ0 , 0) ≡ F0 , so gilt für kurze Zeiten, d. h. für t ↓ 0 : Rt 1 ′ ẋ(t) ∼ ẋ0 + m 0 dt F0 = ẋ0 + t2 x(t) ∼ x0 + ẋ0 t + 2m F0 t m F0 (t ↓ 0) (t ↓ 0) . Setzen wir diese Ergebnisse wieder in (2.25) und (2.26) ein und definieren wir 1 ∂F ∂F ∂F (x0 , ẋ0 , 0)ẋ0 + (x0 , ẋ0 , 0)F0 + (x0 , ẋ0 , 0) ≡ F1 ∂x m ∂ ẋ ∂t so erhalten wir im nächsten Iterationsschritt , 2 t t F0 + 2m F1 + . . . (t ↓ 0) ẋ(t) ∼ ẋ0 + m t2 t3 x(t) ∼ x0 + ẋ0 t + 2m F0 + 6m F1 + . . . (t ↓ 0) . Man kann offensichtlich beliebig oft weiter iterieren, und das rechte Glied wird immer nur von x0 und ẋ0 abhängig sein. Das deterministische Prinzip ist daher für Bewegungsgleichungen der Form (2.22) erfüllt. Vollkommen analog kann man zeigen, dass die Newton’sche Bewegungsgleichung (2.23) für Systeme mehrerer Teilchen das deterministische Prinzip (zumindest für genügend kurze Zeiten) erfüllt. Die vollständige und eindeutige Lösung gewöhnlicher Differentialgleichungen zweiter Ordnung, wie (2.22) oder (2.23), erfordert generell zwei Integrationskonstanten {x(0), ẋ(0)} bzw. {X(0), Ẋ(0)}. Die Existenz von Lösungen dieses Anfangswertproblems, die hier nur illustriert wurde, kann in der Theorie gewöhnlicher Differentialgleichungen unter relativ schwachen Voraussetzungen rigoros bewiesen werden (Satz von Cauchy-Peano). Um die Eindeutigkeit der Lösung zu beweisen, fordert man typischerweise zusätzlich, dass das Kraftgesetz F(x, ẋ, t) eine Lipschitz-Bedingung bezüglich der Variablen x und ẋ erfüllt. 20 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK 2.7 Konsequenzen der Galilei-Invarianz für die Bewegungsgleichung Wir untersuchen nun die Konsequenzen der zu fordernden Galilei-Invarianz für die mögliche Form der Kraft F in der Newton’schen Bewegungsgleichung. Hierzu betrachten wir zunächst abgeschlossene mechanische Systeme, die nur aus einem einzelnen Teilchen bestehen. Um Zweideutigkeiten in der Notation zu vermeiden, führen wir neben den allgemeinen Koordinaten x ∈ R3 auch die spezielle (eindimensionale) physikalische Bahn xφ (t) ein, die eine Lösung der Newton’schen Bewegungsgleichung zu fest vorgegebenen Anfangsbedingungen darstellt. Der Impuls des Teilchens in der physikalischen Bahn ist entsprechend durch pφ (t) = mẋφ (t) gegeben. Die Bewegungsgleichung (2.22) soll aufgrund des Galilei’schen Relativitätsprinzips forminvariant (oder äquivalent: „kovariant“) sein unter den folgenden Transformationen: (i) Zeittranslationen: x′ (x, t) = x mit t′ = t − τ . Falls xφ (t) eine Lösung in K ist, stellt x′φ (t′ ) = x′ (xφ (t), t) = xφ (t) = xφ (t′ + τ ) mit dx′φ ′ dxφ (t ) = (t) = ẋφ (t′ + τ ) dt′ dt p′φ (t′ ) ≡ mẋ′φ (t′ ) = mẋφ (t′ + τ ) ≡ pφ (t′ + τ ) ẋ′φ (t′ ) ≡ eine Lösung in K ′ dar. Forminvarianz der Bewegungsgleichung bedeutet: F(xφ (t), ẋφ (t), t − τ ) = dp′φ ′ dpφ (t ) = (t) = F(xφ (t), ẋφ (t), t) dt′ dt . Dies kann jedoch nur dann für alle τ gelten, falls die Kraft zeitunabhängig ist: ∂F ∂t = 0. (ii) Translationen im Ortsraum: x′ (x, t) = x − ξ , t′ = t. Falls xφ (t) eine Lösung in K darstellt, ist x′φ (t′ ) = x′ (xφ (t), t) = xφ (t) − ξ = xφ (t′ ) − ξ eine Lösung in K ′ . Die Forminvarianz der Bewegungsgleichung impliziert nun: F(xφ (t) − ξ, ẋφ (t)) = dp′φ ′ dpφ (t ) = (t) = F(xφ (t), ẋφ (t)) , dt′ dt und diese Gleichung kann nur dann für alle ξ gelten, falls F ortsunabhängig ist: ∂F ∂x = ∅. (iii) Geschwindigkeitstransformationen: x′ (x, t) = x − vt , t′ = t. Falls xφ (t) eine Lösung in K ist, ist x′φ (t′ ) = xφ (t′ ) − vt′ eine Lösung in K ′ . Die Forminvarianz der Bewegungsgleichung bedeutet nun: F(ẋφ (t) − v) = dp′φ ′ dpφ (t ) = (t) = F(ẋφ (t)) dt′ dt , 21 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK und dies kann nur dann für alle v gelten, wenn die Kraft geschwindigkeitsunabhängig ist: ∂F ∂ ẋ = ∅, so dass sie insgesamt also (x, ẋ, t)-unabhängig und somit konstant ist: F(x, ẋ, t) = F. (iv) Inversion: x′ (x, t) = −x , t′ = t. Falls xφ (t) eine Bahn in K beschreibt, ist x′φ (t′ ) = −xφ (t) = −xφ (t′ ) eine Bahn in K ′ . Forminvarianz der Bewegungsgleichung impliziert: F= dp′φ ′ dpφ (t ) = − (t) = −F ′ dt dt und daher F = 0. Man erhält dasselbe Ergebnis, wenn man Forminvarianz unter Drehungen fordert. Rein aufgrund der zu fordernden Galilei-Kovarianz muss ein isolierter Massenpunkt („frei von äußeren Einflüssen“) also unbedingt die Bewegungsgleichung dpφ =0 dt (2.27) erfüllen; seine Bewegung erfolgt geradlinig-gleichförmig in jedem Inertialsystem. Das Resultat (2.27), das hier hergeleitet und nicht angenommen wurde, ist als das erste Newton’sche Gesetz bekannt. Wir untersuchen nun die Konsequenzen der Galilei-Invarianz für die Bewegungsgleichung (2.23), die die Verallgemeinerung von (2.22) auf Systeme mit mehreren Teilchen darstellt. Die Invarianz unter Zeittranslationen impliziert auch nun wieder ∂F ∂t = 0, so dass (2.23) durch dpi = Fi ({xj }, {ẋj }) dt (i, j = 1, . . . , N ) ersetzt werden kann. Die Forminvarianz der Bewegungsgleichung unter Translationen im Ortsraum impliziert Fi ({xj − ξ}, {ẋj }) = Fi ({xj }, {ẋj }) (∀ ξ ∈ R3 ) , so dass sich die Bewegungsgleichung auf dpi = Fi ({xji }, {ẋj }) dt (i, j = 1, . . . , N ) reduziert. Analog folgt aus der Forderung nach Forminvarianz unter Geschwindigkeitstransformationen: Fi ({xji }, {ẋj − v}) = Fi ({xji }, {ẋj }) (∀ v ∈ R3 ) , so dass in jedem Inertialsystem ein physikalisches Gesetz der Form dpi = Fi ({xji }, {ẋji }) dt (i, j = 1, . . . , N ) (2.28) gelten muss. Unter Drehungen bzw. Inversionen gehen Lösungen xi (t) in K in Lösungen σR−1 xi (t) in K ′ über. Es folgt d dpi dp′i = σR−1 pi = σR−1 ′ dt dt dt = σR−1 Fi ({xji }, {ẋji }) Fi ({σR−1 xji }, {σR−1 ẋji }) = 22 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK oder kurz: F′i = σR−1 Fi (2.29) . Kräfte werden unter Drehungen und Inversionen also genauso wie Ortsvektoren oder Impulse transformiert und können aufgrund von (2.28) auch genauso wie Impulse (oder Ortsvektoren) addiert werden. Größen mit dieser Eigenschaft werden in der Physik als echte Vektoren bezeichnet. Die Tatsache, dass Kräfte in diesem Sinne echte Vektoren sind, wird üblicherweise als Newtons viertes Gesetz bezeichnet. Hier wurde das Gesetz hergeleitet, nicht angenommen. Neben dem zweiten Newton’schen Gesetz, das eine zentrale Rolle in der Klassischen Mechanik spielt, und dem ersten und vierten Gesetz, die beide aus dem zweiten Gesetz und der Galilei-Invarianz hergeleitet werden können, gibt es – nicht erstaunlicherweise – noch ein drittes Newton’sches Gesetz , das weniger fundamental ist: Es postuliert, dass die Kräfte, die zwei Teilchen aufeinander ausüben, entlang der Verbindungslinie dieser Teilchen gerichtet sind und dass ihre Summe Null ist (actio = − reactio): dp1 = f (|x21 |)x̂21 dt , dp2 = f (|x12 |)x̂12 dt , d (p1 + p2 ) = 0 . dt Außerdem wird hierbei angenommen, dass die Kräfte geschwindigkeitsunabhängig sind, da geschwindigkeitsabhängige, generell entlang der Verbindungslinie zweier Teilchen gerichtete Kräfte unrealistisch sind. Das dritte „Gesetz“ ist sicherlich zutreffend für die Schwerkraft und auch für die Coulomb-Wechselwirkung zwischen geladenen Teilchen, aber es gilt nicht für die geschwindigkeitsabhängigen magnetischen Kräfte, die bewegliche Ladungen aufeinander ausüben. Für solche Kräfte sind die Schlüsse, die im Folgenden aus dem Prinzip „actio = − reactio“ gezogen werden, im Allgemeinen nicht richtig. 2.8 Beispiele Wir zeigen schließlich, dass man rein aufgrund von Symmetrieüberlegungen, also ohne die relevanten Kraftgesetze explizit zu kennen, nicht-triviale Aussagen über die Dynamik von Zwei- und Dreikörpersystemen machen kann. Beispiel 1 Betrachten wir zunächst ein abgeschlossenes System, das aus lediglich zwei Teilchen besteht, die sich zur Zeit t = 0 in irgendeinem Inertialsystem in Ruhe befinden. Die Bewegungsgleichung hat allgemein die folgende Form: m1 ẍ1 = F1 (x12 , ẋ12 ) , m2 ẍ2 = F2 (x12 , ẋ12 ) , ẋ1 (0) = ẋ2 (0) = 0 . (2.30) Mit Hilfe von Symmetrieüberlegungen zeigt man nun leicht, dass die beiden Massenpunkte immer auf der Verbindungslinie x2 (0) + λx12 (0) (λ ∈ R) der beiden Anfangsorte bleiben werden: Da die Lösung vollständig durch die Anfangsorte und Anfangsgeschwindigkeiten bestimmt ist und diese Anfangswerte invariant unter Drehungen um die Achse x2 (0) + λx12 (0) sind, muss auch die Lösung {x1 (t), x2 (t)} unter Drehungen um diese Achse invariant sein. Dies ist nur dann möglich, wenn x1 (t) und x2 (t) auf dieser Verbindungslinie liegen. 23 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK Beispiel 2 Betrachten wir nun zwei Teilchen mit beliebigen Anfangsbedingungen: m2 ẍ2 = F2 (x12 , ẋ12 ) . m1 ẍ1 = F1 (x12 , ẋ12 ) , In diesem Fall kann man mit Hilfe von Symmetrieüberlegungen zeigen, dass es ein Inertialsystem gibt, in dem die Bewegung der Teilchen in einer Ebene stattfindet: Hierzu wähle man den Translationsvektor ξ und die Geschwindigkeit v in der Galilei-Transformation so, dass die Anfangswerte des Schwerpunkts und der Schwerpunktsgeschwindigkeit nach der Transformation beide Null sind: m1 x1 (0) + m2 x2 (0) =0 m1 + m2 , m1 ẋ1 (0) + m2 ẋ2 (0) =0 m1 + m2 . In diesem Inertialsystem, das wir als K (S) bezeichnen, gilt 1 x2 (0) = − m m2 x1 (0) k x1 (0) 1 und ẋ2 (0) = − m m2 ẋ1 (0) k ẋ1 (0) . Im Spezialfall ẋ1 (0) k x1 (0) ist die physikalische Situation wiederum invariant unter Drehungen um die Achse x2 (0) + λx12 (0), und die Argumente des ersten Beispiels zeigen, dass x1 (t) und x2 (t) auch nun für alle t ≥ 0 auf dieser Achse liegen. Falls x1 (0) und ẋ1 (0) jedoch linear unabhängig sind, können wir definieren: ê1 ≡ x1 (0) |x1 (0)| , ê2 ≡ x1 (0) × (x1 (0) × ẋ1 (0)) |x1 (0) × (x1 (0) × ẋ1 (0))| , ê3 ≡ ê1 × ê2 , und in diesem Fall ist die physikalische Situation invariant unter einer Spiegelung an der ê1 -ê2 -Ebene (oder anders formuliert: unter einer Galilei-Transformation −R(πê3 )). Deshalb muss auch die Lösung {x1 (t), x2 (t)} unter einer solchen Spiegelung invariant sein, und dies ist nur dann möglich, wenn die Bewegung der beiden Teilchen in der ê1 -ê2 -Ebene stattfindet. Da die Bewegung in diesem speziellen Inertialsystem in einer Ebene stattfindet, wird sie in jedem Inertialsystem K ′ mit vrel (K ′ , K (S) ) ⊥ R(α)−1 ê3 in einer Ebene stattfinden. Beispiel 3 Betrachten wir schließlich drei Teilchen mit Anfangsgeschwindigkeiten, die in irgendeinem Inertialsystem Null sind: ẋ1 (0) = ẋ2 (0) = ẋ3 (0) = 0. Wir führen eine Translation durch, so dass auch der Massenschwerpunkt zur Zeit t = 0 Null ist: m1 x1 (0) + m2 x2 (0) + m3 x3 (0) =0 . m1 + m2 + m3 Falls die Anfangskoordinaten x1 (0), x2 (0) und x3 (0) alle auf einer Linie liegen, zeigt die Argumentation unseres ersten Beispiels, dass die Massenpunkte sich für alle t > 0 entlang dieser Verbindungslinie bewegen werden. Falls x1 (0) und x2 (0) jedoch linear unabhängig sind, kann man definieren: ê1 ≡ x1 (0) |x1 (0)| , ê2 ≡ x1 (0) × (x1 (0) × x2 (0)) |x1 (0) × (x1 (0) × x2 (0))| , ê3 ≡ ê1 × ê2 . 24 ------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK Da die physikalische Situation invariant ist unter einer Spiegelung an der ê1 -ê2 Ebene, muss dies auch für die zeitabhängige Lösung {x1 (t), x2 (t), x3 (t)} gelten, und dies impliziert, dass die Bewegung in der ê1 -ê2 -Ebene stattfindet. Wiederum wird die mögliche Dynamik eines Systems durch elementare physikalische Argumente stark eingeschränkt. 25 Kapitel 3 Abgeschlossene mechanische Systeme Wir konzentrieren uns in diesem Kapitel auf abgeschlossene mechanische Systeme, d. h. auf Systeme, die (in genügend guter Näherung) frei von äußeren Einflüssen sind und Galilei-invarianten, d. h. beobachterunabhängigen physikalischen Gesetzen gehorchen. Wir werden zuerst die allgemeinen Eigenschaften solcher Systeme untersuchen und anschließend einige wichtige Anwendungen behandeln. Speziell hervorzuheben sind hierbei das Zweiteilchenproblem und das Problem der kleinen Schwingungen Das abgeschlossene Einteilchensystem ist - wie wir aus dem vorigen Kapitel wissen - besonders einfach. Das einzige Kraftgesetz, das in diesem Fall mit der Galilei-Invarianz vereinbar ist, ist F = 0, und die Bewegungsgleichung lautet dp =0 dt , p = mẋ . In jedem Inertial system erfolgt die Bewegung des Teilchens daher geradliniggleichförmig. Für abgeschlossene Mehrteilchensysteme lautet die Bewegungsgleichung ṗi = Fi ({xji }, {ẋji }) , pi = mi ẋi (i, j = 1, 2, . . . , N ) , (3.1) wobei Fi gemäß dem vierten Newton’schen Gesetz unter Drehungen der Koordinatenachsen oder Raumspiegelungen wie ein echter Vektor transformiert wird: F′i = σR−1 Fi . Einige wichtige Kraftgesetze, insbesondere das universelle Gravitationsgesetz und das Coulomb-Gesetz, erfüllen außerdem das dritte Newton’sche Gesetz Fi = X j6=i fji , fji = fji (|xji |)x̂ji , fji = fij (3.2) das besagt, dass allgemeine Kräfte aus Zweiteilchenkräften aufgebaut sind, die geschwindigkeitsunabhängig und entlang der Verbindungslinien der Teilchenpaare gerichtet sind und das Prinzip „actio = − reactio“ erfüllen. Da das abgeschlossene Einteilchensystem für uns wegen seiner Einfachheit wenig Überraschendes in petto hat, betrachten wir im Folgenden ausschließlich Mehrteilchensysteme. --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME 3.1 Allgemeine Eigenschaften abgeschlossener Systeme Die Bewegungsgleichung abgeschlossener Mehrteilchensysteme wird durch (3.1) gegeben. Um die allgemeinen Eigenschaften von Mehrteilchensystemen formulieren zu können, definieren wir zuerst die Gesamtmasse M≡ N X mi , i=1 den Massenschwerpunkt xM ≡ 1 M N X mi xi i=1 und den Gesamtimpuls P ≡ M ẋM = N X i=1 mi ẋi = N X pi . i=1 Summieren wir nun die Bewegungsgleichung (3.1) über i = 1, . . . , N , so erhalten wir die Gleichung dP X = Fi ({xji }, {ẋji }) dt i=1 N (3.3) für den Gesamtimpuls. Im wichtigen Spezialfall, in dem die Kraft Fi das dritte Newton’sche Gesetz (3.2) erfüllt, erhält man: X dP X fji = = (fji + fij ) = 0 , dt i,j i<j (3.4) i6=j und wir schließen, dass der Gesamtimpuls in diesem Fall erhalten ist. Dieses Erhaltungsgesetz ist eine sehr wichtige Eigenschaft abgeschlossener Systeme, die die Untersuchung oder gar die Lösung der Bewegungsgleichung (3.1) unter Umständen stark vereinfacht. Es sei noch einmal daran erinnert, dass allgemeine elektromagnetische Kräfte das dritte Newton’sche „Gesetz“ nicht erfüllen. Für solche Kräfte ist der Gesamtimpuls der Teilchen im Allgemeinen nicht erhalten. Dies ist physikalisch auch gut verständlich, denn es wird ständig Impuls und Energie zwischen den Teilchen und dem elektromagnetischen Feld ausgetauscht, und nur der Gesamtimpuls bzw. die Gesamtenergie der Teilchen und des Feldes zusammen stellen Erhaltungsgrößen dar. Die Lösung der Bewegungsgleichung (3.4) ist elementar; sie lautet P(t) = P0 , xM (t) = xM0 + 1 M P0 t und wird also durch zwei Integrationskonstanten xM0 und P0 charakterisiert. Dementsprechend gibt es zwei Erhaltungsgrößen, nämlich den Gesamtimpuls 1 P(t) und die Linearkombination xM (t) − M P(t)t, die Information über den Anfangsort (zur Zeit t = 0) enthält. 27 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME Um weitere Erhaltungsgrößen in abgeschlossenen Mehrteilchensystemen identifizieren zu können, führen wir den Gesamtdrehimpuls X L= i xi × pi und das Gesamtdrehmoment N≡ X i xi × Fi ein. Die einzelnen Terme xi × pi bzw. xi × Fi in diesen Summen stellen den Drehimpuls des i-ten Teilchens bzw. das auf das i-te Teilchen wirkende Drehmoment dar. Es ist zu beachten, dass der Drehimpuls und das Drehmoment explizit vom Ortsvektor xi und somit von der Wahl des Ursprungs abhängig sind. Wir werden die Abhängigkeit dieser Größen von der Wahl des Koordinatensystems unten genauer untersuchen. Für den Gesamtdrehimpuls erhält man allgemein die folgende Bewegungsgleichung: X dL X = (ẋi × pi + xi × ṗi ) = xi × Fi = N , dt i i (3.5) wobei die Beziehungen ẋi × pi = mi ẋi × ẋi = 0 und ṗi = Fi verwendet wurden. Wir stellen fest, dass ein Drehmoment generell eine zeitliche Änderung des Drehimpulses hervorruft. Die Bewegungsgleichung (3.5) erhält eine besonders einfache Form, falls die Kräfte Fi das dritte Newton’sche Gesetz erfüllen. In diesem Fall vereinfacht sich (3.5) zu X dL X xi × fji = xi × Fi = dt i,j i = X i<j i6=j (xi × fji + xj × fij ) = X i<j (xi − xj ) × fji = 0 wegen xij × fji = −fji (|xji |)xji × x̂ji = 0. Wir stellen also fest, dass der Gesamtdrehimpuls in diesem wichtigen Spezialfall eine Erhaltungsgröße ist: L(t) = L(0) ≡ L0 . Wiederum gilt für elektromagnetische Kräfte im Allgemeinen dL dt 6= 0, da die Teilchen und das Feld untereinander Drehimpuls austauschen können. Wir befassen uns weiterhin mit Kräften, die das dritte Newton’sche Gesetz (3.2) erfüllen und betrachten nun speziell die Energie des abgeschlossenen Systems. Hierzu definieren wir die Größe Z Vji (x) ≡ Vji (x0 ) + x dx′ fji (x′ ) , x0 die wir als das Potential oder die potentielle Energie der Zweiteilchenkraft fji bezeichnen. Das Potential hat in der Tat die Dimension [Kraft × Weg] und somit [Energie]. Es ist zu beachten, dass das Potential Vji (x) lediglich bis auf 28 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME eine Integrationskonstante Vji (x0 ) bestimmt ist; der Relativabstand x0 und auch der numerische Wert der Konstanten Vji (x0 ) sind hierbei grundsätzlich beliebig und werden meistens aufgrund von Bequemlichkeitsargumenten festgelegt. Des Weiteren betrachten wir die Arbeit W1→2 , die von den (1) © Kräften {Fi } verrichtet zur Zeit t1 zu den neuen wird, wenn die Teilchen sich von den Positionen xi (2) © zur Zeit t2 oder kurz: von 1 nach 2 bewegen; diese Arbeit Positionen xi wird definiert durch W1→2 ≡ XZ 2 dxi · Fi 1 i (3.6) . Für Kräfte, die das Gesetz „actio = − reactio“ erfüllen, vereinfacht sich (3.6) zu W1→2 XZ = 2 1 i,j i6=j XZ = XZ t2 t1 i,j i6=j dt ẋi · fji t2 t1 i<j = − dxi · fji = XZ dt (ẋi · fji + ẋj · fij ) = i<j t2 dt ẋji · x̂ji fji (|xji |) = − t1 i<j XZ t2 t1 XZ i<j t2 X − Vji (|xji (t)|) = V (1) − V (2) = i<j dt ẋij · fji , t2 dt t1 d Vji (|xji |) dt (3.7) t1 wobei wir allgemein mit X = (x1 , x2 , . . . , xN ): V (X) ≡ X i<j Vji (|xji |) und insbesondere V (1) ≡ V (X(1) ) , V (2) ≡ V (X(2) ) definierten. Die Kraft Fk , die auf das k-te Teilchen wirkt, ist in einfacher Weise mit dem Gesamtpotential V (X) verknüpft: 2 X −∇k V = −∇k 4 =− = X i<k X j6=k i<k Vki (|xki |) + fki (|xki |)x̂ki − fjk (|xjk |)x̂jk = X k<j X k<j X 3 Vjk (|xjk |)5 fjk (|xjk |)(−x̂jk ) fjk = Fk , j6=k d. h. es gilt Fi = −∇i V (i = 1, 2, . . . , N ) . Es ist wichtig, zu beachten, dass im Falle „actio = − reactio“ keine Arbeit verrichtet wird, wenn die Teilchen sich entlang einer geschlossenen Schleife von 29 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME 1 nach 2 und dann nach 1′ (d. h. zu den Positionen bewegen: (1) xi © zur Zeit t′1 > t2 ) W1→2 + W2→1′ = V (1) − V (2) + V (2) − V (1) = 0 . Man bezeichnet rein ortsabhängige Kräfte, die bei einer Bewegung der Teilchen entlang einer geschlossenen Schleife keine Arbeit verrichten, als konservativ . Da für alle Zweiteilchenkräfte einzeln gilt: fji (x) = fji (x)êx = (∇Vji )(x) , sind alle Einzelbeiträge in der Summe W1→2 + W2→1′ = XZ t1 i<j =− t′1 XI dt ẋij · fji = − (ij) i<j XI i<j (ij) X dx · (∇Vji ) = i<j dx · fji (1) (1) Vji (|xji |) − Vji (|xji |) = 0 gleich Null, so dass alle Zweiteilchenkräfte einzeln ebenfalls konservativ sind. Dieses Argument zeigt außerdem, dass das allgemeine Kriterium dafür, dass eine Zweiteilchenkraft F(x) konservativ ist, für beliebige Integrationsschleifen x(1) → x(2) → x(1) durch I dx · F(x) = 0 gegeben ist. Der Stokes’sche Satz I Z ∂F dx · F(x) = F dS · (∇ × F) , in dem die Integrationsfläche F nun ebenfalls beliebig ist, zeigt, dass eine Kraft in einem topologisch einfach zusammenhängenden Raumbereich dann und nur dann konservativ ist, wenn F in diesem Raumbereich differenzierbar ist und in jedem Raumpunkt ∇×F=0 gilt. Wir betrachten noch einmal die Beziehung (3.7), d. h. W1→2 = XZ i 2 1 dxi · Fi = V (1) − V (2) . Einsetzen des zweiten Newton’schen Gesetzes (3.1) liefert: V (1) − V (2) = = = XZ 1 i X 2 dxi · ṗi = Z t2 mi i Z t2 mi t1 dt ẋi · ẍi t2 d 1 2 X 1 dt mi ẋ2i ẋi = 2 2 dt i i t1 (2) Ekin (1) Ekin − X t1 . 30 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME Hierbei wurde die kinetische Energie des Mehrteilchensystems eingeführt: Ekin (t) ≡ X 2 1 2 mi ẋi (t) . i Definieren wir nun die Gesamtenergie durch E ≡ Ekin + V , so erhalten wir das extrem wichtige Ergebnis, dass die Gesamtenergie abgeschlossener mechanischer Systeme, die das dritte Newton’sche Gesetz erfüllen, eine weitere Erhaltungsgröße darstellt: E (1) = E (2) . Wählen wir nun speziell (1) (1) © (2) (2) © xi , ẋi , t1 = xi (t), ẋi (t), t © xi , ẋi , t2 = xi (t + dt), ẋi (t + dt), t + dt © , so reduziert sich die Beziehung E (1) = E (2) auf das übliche Erhaltungsgesetz dE =0 dt (3.8) für die Gesamtenergie. 3.1.1 Das Virialtheorem Wir leiten noch eine weitere Bewegungsgleichung her, die es uns ermöglichen wird, eine Verbindung P zwischen den Zeitmittelwerten der kinetischen Energie undPder Größe i xi · Fi herzustellen. Hierzu betrachten wir die Größe G(t) ≡ i xi · pi und leiten sie nach der Zeit ab: X X d X xi · pi = (ẋi · pi + xi · ṗi ) = mi ẋ2i + xi · Fi dt i i i . (3.9) Definieren wir nun den Zeitmittelwert einer Funktion g(t), deren Funktionswerte beschränkt sind: |g(t)| ≤ gmax < ∞ für alle t ≥ 0, durch 1 T →∞ T g(t) ≡ lim Z T dt g(t) , 0 so folgt nach einer Zeitmittelung aus (3.9): X d X xi · pi = 2Ekin + xi · Fi dt i i . (3.10) Nehmen wir nun an, dass die Bewegung der Teilchen des Systems auf einen endlichen Raumbereich beschränkt ist, so dass die Funktionen xi (t), pi (t) und somit auch G(t) und dG dt (t) für alle t ≥ 0 beschränkt sind. In diesem Fall spielt 31 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME die Funktion dG dt (t), an deren Zeitmittelwert wir interessiert sind, also die Rolle von g(t), und es folgt g(t) = Z 1 dG (t) = lim T →∞ T dt T dt 0 dG G(T ) − G(0) (t) = lim =0 , T →∞ dt T da die Funktionswerte von G zeitlich beschränkt sind. Gleichung (3.10) vereinfacht sich daher auf Ekin = − 12 X i xi · Fi (3.11) . Das rechte Glied wird als das Virial (oder Clausius-Virial ) und die Beziehung (3.11) entsprechend als das Virialtheorem bezeichnet. Das Virialtheorem ist außerordentlich nützlich z. B. bei der Bestimmung der Zustandsgleichung realer Gase, aber auch für uns in der Mechanik: In vielen Modellrechnungen geht man davon aus, dass die Kräfte das dritte Newton’sche Gesetz erfüllen und dass das Wechselwirkungspotential Vji (x) eine sehr einfache homogene Form als Funktion des Relativabstands hat: Vji (x) = vji xα (x ≡ |x| , α ∈ R, vji = konstant) . (3.12) In solchen Fällen reduziert sich (3.11) auf eine einfache Beziehung zwischen der kinetischen und der potentiellen Energie . Dies sieht man wie folgt: X i xi · Fi = X ij i6=j xi · fji = X i<j (xi − xj ) · fji = − X i<j xji · (∇Vji )(xji ) . (3.13) Für homogene Potentiale der Form (3.12) gilt nun: x · (∇Vji )(x) = x · (αvji xα−1 êx ) = αvji xα = αVji (x) , so dass sich (3.13) auf X i xi · Fi = −α X i<j Vji (|xji |) = −αV (X) und (3.11) auf Ekin = 12 αV (X) = 21 αEpot reduziert. Wichtige Beispiele sind: α = −1 : Ekin α =1: Ekin α =2: Ekin = − 21 Epot (Kepler-/Coulomb-Problem) = Epot (harmonischer Oszillator) , = 1 2 Epot („quarks“) wobei das lineare Potential (α = 1) das confinement echter quantenmechanischer quarks bzw. antiquarks natürlich nicht wirklich beschreiben kann und lediglich als klassisches Pendant anzusehen ist. 32 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME 3.2 Galilei-Transformationen Wir untersuchen nun das Verhalten der Erhaltungsgrößen Gesamtimpuls, Gesamtdrehimpuls, Gesamtenergie usw. unter Galilei-Transformationen der Form x′ (x, t) = σR(α)−1 x − vt − ξ (3.14) . Da wir insbesondere an der Abhängigkeit dieser physikalischen Größen von der Wahl des Koordinatensystems interessiert sind, nehmen wir der Einfachheit halber an, dass die Zeit invariant ist: t′ = t. Außerdem definieren wir die Größen vα ≡ σR(α)v , ξ α ≡ σR(α)ξ , die es uns ermöglichen, die Galilei-Transformation auf die für manche Zwecke bequemere Form x′ (x, t) = σR(α)−1 (x − vα t − ξ α ) zu bringen. Wir nehmen generell an, dass das dritte Newton’sche Gesetz gilt. Als Spezialfall der allgemeinen Galilei-Transformation (3.14) werden wir die orthogonalen Transformationen x′ (x, t) = σR(α)−1 x und das Verhalten physikalischer Größen unter solchen Transformationen betrachten. Der Grund dafür, orthogonale Transformationen gesondert zu untersuchen, ist, dass sie den Tensorcharakter physikalischer Größen bestimmen: Falls eine Größe V unter orthogonalen Transformationen genauso transformiert wird wie der Ortsvektor, V′ = σR(α)−1 V, wird sie als echter Vektor bezeichnet. Wird eine Größe V bis auf das Vorzeichen wie der Ortsvektor transformiert, x′ = σR(α)−1 x, jedoch V′ = R(α)−1 V, so wird V als Pseudovektor bezeichnet. Ist eine Größe W invariant unter orthogonalen Transformationen, W ′ = W , so heißt sie ein Skalar . Ist eine Größe W bis auf das Vorzeichen invariant, W ′ = σW , so wird sie als Pseudoskalar bezeichnet. P Als erste physikalische Größe untersuchen wir den Gesamtimpuls P = i pi . Das Transformationsverhalten des Impulses pi des i-ten Teilchens ist durch p′i = mi σR(α)−1 (ẋi − vα ) = σR(α)−1 (pi − mi vα ) (3.15) und dasjenige des Gesamtimpulses somit durch P′ = σR(α)−1 (P − M vα ) (3.16) gegeben. Es folgt, dass sowohl Einzelimpulse als auch der Gesamtimpuls unter orthogonalen Transformationen (d. h. für vα = 0 und ξ α = 0) gemäß p′i = σR(α)−1 pi , P′ = σR(α)−1 P transformiert werden und daher echte Vektoren sind. Außerdem folgt durch Zeitableitung, F′i = ṗ′i = σR(α)−1 ṗi = σR(α)−1 Fi , 33 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME dass auch Kräfte echte Vektoren im Sinne der Tensorrechnung sind. Das Gleiche gilt wegen der Beziehung ẋi = m1i pi natürlich auch für Geschwindigkeiten. Dass Kräfte wie echte Vektoren transformiert werden, im Einklang mit dem vierten Newton’schen Gesetz, ist bereits aus Gleichung (2.29) bekannt. Betrachten wir nun das Verhalten des Gesamtdrehimpulses unter GalileiTransformationen. Nach der Transformation (d. h. im Inertialsystem K ′ ) ist der Gesamtdrehimpuls durch L′ = X i = x′i × p′i X σR(α)−1 (xi − vα t − ξ α ) × σR(α)−1 (pi − mi vα ) i = R(α)−1 X i (xi − vα t − ξ α ) × (pi − mi vα ) gegeben, wobei die Rechenregel R(α)−1 a × R(α)−1 b = R(α)−1 (a × b) 1 P0 t verwendet wurde. Mit Hilfe der expliziten Zeitabhängigkeit xM (t) = xM0 + M ′ des Massenschwerpunkts lässt sich der Ausdruck für L noch auf " L′ = R(α)−1 X i # xi × pi − vα t × P − ξα × (P − M vα ) − M xM (t) × vα = R(α)−1 [L − ξ α × (P0 − M vα ) − M xM0 × vα ] (3.17) vereinfachen. Es folgt L̇′ = R(α)−1 L̇, so dass die Gesamtdrehimpulserhaltung im Inertialsystem K die Gesamtdrehimpulserhaltung in K ′ impliziert (und umgekehrt). Für rein orthogonale Transformationen gilt L′ = R(α)−1 L, und wir stellen wegen des fehlenden Faktors σ in diesem Transformationsgesetz fest, dass der Gesamtdrehimpuls einen Pseudovektor darstellt. Das Transformationsverhalten der physikalischen Größe Arbeit folgt aus ẋ′i = σR(α)−1 (ẋi − vα ) und Gleichung (2.29) als: ′ W1→2 = XZ i = t′1 XZ i t′2 dt′ ẋ′i · F′i = XZ i t2 t1 dt σR(α)−1 (ẋi − vα ) · σR(α)−1 Fi "Z t2 t1 dt (ẋi − vα ) · Fi = W1→2 − vα · t2 dt t1 X # Fi = W1→2 . i Arbeit ist daher ein Skalar unter Galilei-Transformationen und insbesondere auch unter orthogonalen Transformationen. Analog ist auch die potentielle Energie V ′ = V (X′ ) = = X i<j X i<j Vji (|x′ji |) = X i<j Vji (|xji |) = V (X) = V Vji |σR(α)−1 xji | 34 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME ein Skalar. Die kinetische Energie Ekin wird unter Galilei-Transformationen wie folgt transformiert: ′ Ekin = X 2 X 2 σR(α)−1 (ẋi − vα ) (ẋ′i ) = 1 2 mi 2 (ẋi − vα ) = Ekin − M ẋM · vα + 12 M vα i = X 1 2 mi i 1 2 mi i 2 2 = Ekin − P · vα + 21 M vα (3.18) . Unter rein orthogonalen Transformationen (mit vα = 0 und ξα = 0) verhält Ekin sich somit ebenfalls wie ein Skalar. Nehmen wir nun an, dass die Voraussetzungen des Virialtheorems im Inertialsystem K erfüllt sind, so dass die Bewegung der Teilchen räumlich beschränkt ist und neben Ekin = − 12 X i (3.19) xi · Fi zum Beispiel auch P = 0 gilt. Führen wir nun eine beliebige Galilei-Transformation durch, so wissen wir bereits aufgrund von (3.18), dass die kinetische Energie Ekin in K gemäß 2 ′ ′ Ekin = Ekin − 12 M vα − 12 M v2 = Ekin ′ in K ′ verknüpft ist. Außerdem mit der zeitgemittelten kinetischen Energie Ekin P folgt wegen i Fi = 0 aus X i x′i · F′i = = X i X i σR(α)−1 (xi − vα t − ξ α ) · σR(α)−1 Fi (xi − vα t − ξ α ) · Fi = X i xi · Fi , dass das Virial ein Skalar unter Galilei-Transformationen und daher insbesondere unter orthogonalen Transformationen ist. Einsetzen der beiden letzten Gleichungen in (3.19) liefert: 1X ′ (P′ ) − x · F′ 2M 2 i i i 2 ′ Ekin = P′ = M v , (3.20) . Gleichung (3.20) ist die Verallgemeinerung des üblichen Virialtheorems (3.19) auf Systeme mit einem Schwerpunktsimpuls P′ 6= 0. Bisher konnten wir noch keine physikalische Größe als Pseudoskalar identifizieren. Ein typisches Beispiel eines Pseudoskalars ist das durch drei Vektoren x1 , x2 und x3 aufgespannte Volumen. Dieses Volumen wird unter orthogonalen Transformationen wie Vol(x′1 , x′2 , x′3 ) = x′1 · (x′2 × x′3 ) = σR(α)−1 x1 · σR(α)−1 x2 × σR(α)−1 x3 © = σ R(α)−1 x1 · R(α)−1 (x2 × x3 ) = σx1 · (x2 × x3 ) = σVol(x1 , x2 , x3 ) transformiert und ist somit tatsächlich ein Pseudoskalar. 35 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME Das Schwerpunktsystem Als Spezialfall der allgemeinen Galilei-Transformation betrachten wir Transformationen mit vα = 1 P0 M , ξ α = xM0 (3.21) , so dass der Massenschwerpunkt im neuen Inertialsystem K (S) im Ursprung ruht: (S) xM (t) = x′ (xM (t), t) = σR(α)−1 [xM (t) − vα t − ξα ] 1 P0 t − xM0 = 0 . = σR(α)−1 xM (t) − M Die Parameter (σ, α) in der Galilei-Transformation sind nach wie vor beliebig. Wir fassen die Resultate für relevante physikalische Größen im Schwerpunktsystem kurz zusammen. Der Gesamtimpuls im Schwerpunktsystem K (S) folgt sofort aus (3.16) und (3.21) als P(S) = 0 . Da der Massenschwerpunkt in K (S) ruht, kann dieses Ergebnis nicht erstaunen. Für den Gesamtdrehimpuls folgt aus (3.17) und (3.21): L(S) = R(α)−1 (L − xM0 × P0 ) , oder alternativ: L = xM0 × P0 + R(α)L(S) . (3.22) Diese Gleichung besagt, dass der Gesamtdrehimpuls in einem beliebigen Inertialsystem K aus dem Drehimpuls im Schwerpunktsystem und dem im Massenschwerpunkt konzentrierten Drehimpuls zusammengesetzt ist. Gleichung (3.22) zeigt klar, dass der Drehimpuls im Allgemeinen von der Wahl des Ursprungs abhängt; nur wenn der Massenschwerpunkt in K ruht oder der Gesamtimpuls P0 entlang xM0 ausgerichtet ist, ist der Beitrag xM0 × P0 in (3.22) im Allgemeinen gleich Null. Die Arbeit und die potentielle Energie sind Skalare und haben somit in K (S) und K (S) den gleichen Wert. Die kinetische Energie Ekin in K (S) folgt aus (3.18) und (3.21). Das Ergebnis zeigt, dass sich die kinetische Energie in K aus der kinetischen Energie im Schwerpunktsystem und der im Massenschwerpunkt konzentriert gedachten kinetischen Energie zusammensetzt: Ekin = P20 (S) + Ekin 2M , Das Virialtheorem hat im Schwerpunktsystem selbstverständlich die übliche Form (3.19). Nach diesen Ausführungen ist klar, dass es oft vorteilhaft ist, physikalische Größen im Schwerpunktsystem zu untersuchen: Einerseits sind die mathematischen Zusammenhänge meist etwas einfacher als in einem beliebigen Inertialsystem. Andererseits verliert man keine Information, indem man sich auf 36 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME das Schwerpunktsystem beschränkt, da man die Ergebnisse immer mittels einer geeigneten Galilei-Transformation in die „Sprache“ eines beliebigen anderen Inertialsystems übersetzen kann. 3.3 Das Zweiteilchenproblem - allgemeine Eigenschaften Wir wenden das in Abschnitt [3.1] Gelernte nun an auf abgeschlossene mechanische Systeme, die aus zwei miteinander wechselwirkenden Teilchen bestehen. Das Zweiteilchenproblem ist offensichtlich relevant für die Beschreibung zweier sich gegenseitig anziehender Himmelskörper (man kann hierbei z. B. an das Erde-Sonne- oder das Erde-Mond-System denken); andere naheliegende Anwendungen wären die klassische Beschreibung der Schwingungs- und Rotationsbewegung zweiatomiger Moleküle oder die Beschreibung des Proton-ElektronZweiteilchensystems eines Wasserstoffatoms. Außerdem erfordert die Berechnung von Wirkungsquerschnitten für Zweiteilchenstreuung detaillierte Kenntnisse über die mögliche Bahnbewegung im Zweiteilchenproblem. Zwar spielen normalerweise bei den letztgenannten Anwendungen auch Quanteneffekte eine wichtige Rolle, aber dennoch ist das klassische Pendant oft eine gute Näherung und ein erster Schritt auf dem Wege zum Verständnis der quantenmechanischen Realität. Beispielsweise hat das klassische Zweiteilchen-Coulomb-Problem zum Bohr’schen Atommodell und somit zu einem Durchbruch bei der Entwicklung der Quantentheorie geführt. In diesem Abschnitt fassen wir zuerst die bereits aus Abschnitt [3.1] bekannten allgemeinen Eigenschaften abgeschlossener Systeme für das Zweiteilchenproblem zusammen. In Abschnitt [3.4] werden dann einige exakt lösbare Modelle (insbesondere der harmonische Oszillator und das Kepler-Problem) behandelt; außerdem diskutieren wir hier die möglichen physikalischen Bahnen für allgemeine Potentiale der Form V (x) = V0 xα . Wir betrachten also die Dynamik zweier Teilchen der Massen m1 bzw. m2 , die Kräfte aufeinander ausüben, die das dritte Newton’sche Gesetz erfüllen. Die Bewegungsgleichungen der Teilchen lauten: ṗ1 = F1 = f21 = f (|x21 |) x̂21 ṗ2 = F2 = f12 = f (|x12 |) x̂12 , , p1 = m1 ẋ1 p2 = m2 ẋ2 , wobei die Amplitude f (x) der Kraft mit einem Potential in Verbindung gebracht werden kann: f (x) = V ′ (x). Aus Abschnitt [3.1] wissen wir, dass der Gesamtimpuls des Zweiteilchensystems erhalten ist, P ≡ p1 + p2 = P0 , und dass sich der Massenschwerpunkt geradlinig-gleichförmig bewegt: xM (t) ≡ 1 m1 x1 + m2 x2 = xM0 + P0 t . m1 + m2 M Auch der Gesamtdrehimpuls L = x1 × p1 + x2 × p2 und die Gesamtenergie E = 21 m1 ẋ21 + 21 m2 ẋ22 + V (|x12 |) 37 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME sind erhalten. Außerdem gilt (zumindest für gebundene und daher räumlich beschränkte Zweiteilchenbahnen) der Virialsatz in der Form (3.20). Es lohnt sich sehr, das Zweiteilchenproblem im Schwerpunktsystem zu untersuchen. Dementsprechend wenden wir eine Galilei-Transformation der Form (3.21) mit σ = +1 und α = 0 an und definieren den Relativvektor x ≡ x21 = x′21 : m2 m1 x1 + m2 x2 =− x m1 + m2 m1 + m2 m1 m1 x1 + m2 x2 = x x′2 ≡ x2 − xM (t) = x2 − m1 + m2 m1 + m2 x′1 ≡ x1 − xM (t) = x1 − . Man überprüft leicht, dass der Massenschwerpunkt im neuen Inertialsystem tat(S) (S) m x′ +m x′ sächlich im Ursprung ruht: xM ≡ 1m11 +m22 2 = 0 und daher P(S) ≡ M ẋM = 0. Der Gesamtdrehimpuls im Schwerpunktsystem, m1 m2 (−x × ẋ′1 + x × ẋ′2 ) L(S) = x′1 × p′1 + x′2 × p′2 = m1 + m2 = µx × ẋ′21 = µx × ẋ , ist selbstverständlich wiederum eine Erhaltungsgröße, da der Gesamtdrehimpuls in jedem Inertialsystem erhalten ist. Der Parameter µ ist durch µ= m1 m2 = m1 + m2 1 1 + m1 m2 −1 definiert und wird als die reduzierte Masse des Zweiteilchenproblems bezeichnet. Natürlich ist auch die Gesamtenergie im Schwerpunktsystem, 1 m m2 + m2 m21 2 1 2 2 ẋ + V (|x|) m1 (ẋ′1 ) + m2 (ẋ′2 ) + V (|x′21 |) = 1 2 2 2 2(m1 + m2 )2 1 m1 m2 1 = ẋ2 + V (x) = µẋ2 + V (x) , x ≡ |x| , 2 m1 + m2 2 E (S) = eine Erhaltungsgröße. Die Bewegungsgleichung im Schwerpunktsystem lautet ẍ = ẍ′21 = − 1 1 1 f (x)êx − f (x)êx = − f (x)êx m2 m1 µ oder auch µẍ = −f (x)êx = −V ′ (x)êx (3.23) . Mit Hilfe dieser Bewegungsgleichung überprüft man leicht, dass der Gesamtdrehimpuls und die Gesamtenergie tatsächlich erhalten sind: dL(S) = µ (ẋ × ẋ + x × ẍ) = −V ′ (x)x × êx = 0 dt dE (S) = µẋ · ẍ + V ′ (x)êx · ẋ = ẋ · (µẍ + V ′ (x)êx ) = 0 dt . Das Virialtheorem im Schwerpunktsystem folgt aus (3.11) als 1 2 2 µẋ = = (S) Ekin = − 12 (x′1 · f21 + x′2 · f12 ) 1 ′ 2 x21 · f21 = 21 x · f (x)êx = 21 xf (x) = 21 xV ′ (x) , (3.24) 38 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME so dass für homogene Potentiale der Form V (x) = V0 xα die einfache Beziehung 1 1 2 2 µẋ = 2 αV (x) gilt. Wir diskutieren nun die allgemeine Lösung der Bewegungsgleichung (3.23) im Schwerpunktsystem. Da der Gesamtdrehimpuls L(S) = µx × ẋ erhalten ist, d (S) = 0, findet die Bewegung in der Ebene statt, die orthogonal auf dem dt L Vektor L(S) steht. Es ist nun bequem, die ê3 -Richtung entlang des Vektors L(S) zu wählen, L(S) = Lê3 mit L ≥ 0, so dass die Bewegung in der ê1 -ê2 -Ebene stattfindet, wobei man z. B. ê1 ≡ êx (0) und ê2 ≡ ê3 × ê1 wählen kann. Es sollte vielleicht betont werden, dass die Erhaltung des Gesamtdrehimpulses eine Konsequenz des dritten Newton’schen Gesetzes ist, die Bewegung in der Ebene jedoch nicht : Wie wir in Abschnitt [2.8] (Beispiel 1 und 2) gesehen haben, folgt dies ganz allgemein für abgeschlossene Zweiteilchensysteme aus der GalileiInvarianz der Theorie. Für den Spezialfall L = 0, d. h. für x(0) k ẋ(0), findet die Bewegung im Schwerpunktsystem entlang der Geraden λx(0) mit λ ∈ R statt und reduziert sich (3.23) zu einem eindimensionalen Problem. Zur Beschreibung der Bewegung in der ê1 -ê2 -Ebene ist es zweckmäßig, Polarkoordinaten einzuführen: x = x [cos(ϕ)ê1 + sin(ϕ)ê2 ] = xêx , so dass die entsprechende Geschwindigkeit durch ẋ = ẋêx + xϕ̇ [− sin(ϕ)ê1 + cos(ϕ)ê2 ] gegeben ist. Der Gesamtdrehimpuls folgt als Lê3 = L(S) = µx × ẋ = µx2 ϕ̇ [cos(ϕ)ê1 + sin(ϕ)ê2 ] × [− sin(ϕ)ê1 + cos(ϕ)ê2 ] = µx2 ϕ̇ (ê1 × ê2 ) cos2 (ϕ) + sin2 (ϕ) = µx2 ϕ̇ ê3 , so dass seine (konstante) Amplitude L durch L = µx2 ϕ̇ (3.25) gegeben ist. Da die Gesamtenergie E (S) = 2 1 2 µẋ + V (x) = 12 µ ẋ2 + x2 ϕ̇2 + V (x) = 2 1 2 µẋ + 21 µx2 L µx2 = 2 1 2 µẋ + Vf (x) , 2 + V (x) L2 2µx2 , (3.26) 2 (S) E − Vf (x) µ (3.27) Vf (x) ≡ V (x) + zeitlich konstant ist, erhält man aus 2 (S) ẋ = E − Vf (x) µ 2 r bzw. ẋ = ± eine leicht lösbare (separable) Differentialgleichung für die Zeit t(x) als Funktion des Relativabstandes der zwei Teilchen: § 2 (S) dt (x) = ± E − Vf (x) dx µ ª−1/2 . 39 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME Nachdem durch Integration dieser Gleichung t(x) und somit – nach Invertierung – auch x(t) bekannt ist, kann die Zeitabhängigkeit ϕ(t) der Winkelvariablen aus (3.25) berechnet werden: Z t ϕ(t) = ϕ(0) + 0 dt′ L µ [x(t′ )] 2 (3.28) . Hiermit ist das Zweiteilchenproblem für ein Zentralpotential (d. h. für den Fall des dritten Newton’schen Gesetzes) im Prinzip vollständig gelöst. Wir fügen einige Bemerkungen hinzu: Differentiation von (3.26) liefert wegen der Energieerhaltung: 0 = µẋẍ + Vf′ (x)ẋ oder auch µẍ = −Vf′ (x) (3.29) . Diese Gleichung hat die Form einer eindimensionalen Bewegungsgleichung für ein Teilchen der Masse µ im effektiven Potential Vf (x). In ihre Herleitung geht die Drehimpulserhaltung, Gleichung (3.25), entscheidend ein. Das effektive PoL2 tential Vf (x) enthält zwei Terme: das Zentralpotential V (x) und den Term 2µx 2 , der als Zentrifugalbarriere oder einfach Zentrifugalpotential bezeichnet wird. Definieren wir die Fläche, die vom Relativvektor x(t) zwischen t = 0 und der Zeit t überstrichen wird als A(t), dann gilt 1 1 (S) L dA = |x × ẋ| = |L | = dt 2 2µ 2µ , und wir stellen daher fest, dass aufgrund der Gesamtdrehimpulserhaltung auch die Flächengeschwindigkeit konstant ist. Dieses Resultat, das als „Flächensatz“ bekannt ist, stellt eine Verallgemeinerung des zweiten Kepler’schen Gesetzes dar, das sich streng genommen nur auf die Planetenbewegung, d. h. auf den Spezialfall von Gravitationskräften bezieht. x(t) x(t + dt) 1111 0000 ẋdt 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 0 dA Abbildung 3.1: Flächengeschwindigkeit 40 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME 3.4 Das Zweiteilchenproblem - Beispiele Wir diskutieren einige exakte und approximative Eigenschaften von Zweiteilchensystemen mit attraktiver Paarwechselwirkung und behandeln anschließend zwei exakt lösbare Potentialmodelle, nämlich den harmonischen Oszillator und das Kepler-Problem. 3.4.1 Kreisbahnen Ein Zweiteilchensystem mit attraktiver Paarwechselwirkung wird typischerweise durch eine stark abstoßende Zentrifugalbarriere (nahe x = 0) und einen attraktiven „Schwanz“ (für x → ∞) charakterisiert. Hierbei wird die AmplituL2 de des Zentrifugalpotentials 2µx 2 weitgehend durch den Gesamtdrehimpuls L bestimmt. Aufgrund von Gleichung (3.29) ist offensichtlich, dass Kreisbahnen (ẍ = 0) als Lösung der Bewegungsgleichung nur für x = xmin möglich sind, wobei xmin durch 0 = Vf′ (xmin ) = V ′ (xmin ) − L2 µ(xmin )3 oder, anders formuliert, L durch L= È µx3min V ′ (xmin ) . bestimmt wird. Die Zeitabhängigkeit der Winkelvariablen ϕ(t) folgt nun aus (3.28) als Lt = ϕ(0) + t ϕ(t) = ϕ(0) + µ(xmin )2 Ê V ′ (xmin ) µxmin , so dass die Umlaufzeit auf der Kreisbahn durch r T = 2π µxmin V ′ (xmin ) gegeben ist. Für einfache Potentiale der Form V (x) = V0 xα erhält man: É T = 2π µ 1 (xmin )1− 2 α αV0 . Für den harmonischen Oszillator (α = 2) findet man beispielsweise, dass die Umlaufzeit unabhängig vom Radius der Kreisbahn ist, und für das Kepler-Problem (α = −1), dass sich die Quadrate der Umlaufzeiten wie die Kuben der Radien verhalten. Das letztere Ergebnis ist ein Spezialfall des dritten Kepler’schen Gesetzes. 3.4.2 Kleine Schwingungen Wir betrachten nun kleine Schwingungen um die Kreisbahn x = xmin . Hierbei bedeutet „klein“, dass die maximal erlaubte Amplitude umax der Schwingung noch so klein ist, dass das effektive Potential Vf (x) für alle |x − xmin | ≤ umax adäquat durch eine Parabel ersetzt werden kann: Vf (x) ≃ Vf (xmin ) + 21 Vf′′ (xmin )(x − xmin )2 . (3.30) 41 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME Vf (x) xmin x Abbildung 3.2: Effektives Potential mit Zentrifugalbarriere Die Bewegungsgleichung lautet daher ẍ = − µ1 Vf′′ (xmin )(x − xmin ) , 1 ′′ µ Vf (xmin ) oder mit den Definitionen ≡ ω 2 und x − xmin ≡ u: ü + ω 2 u = 0 . (3.31) Der Relativabstand x(t) oszilliert also harmonisch mit der Frequenz ω um den Mittelwert xmin : u(t) = u(0) cos(ωt) + 1 du (0) sin(ωt) , ω dt wobei Ê 2 1 du (0) [u(0)] + ω dt 2 ≤ umax gelten muss, damit die harmonische Näherung (3.30) zutrifft. Normalerweise gilt umax ≪ xmin , so dass auch die Berechnung von ϕ(t) in (3.28) sehr einfach wird: Z −2 Z t t L L u(t′ ) u(t′ ) ′ ′ ∼ 1 + 1 − 2 dt dt µ(xmin )2 0 xmin µ(xmin )2 0 xmin § ª u̇(0) u(0) 1 2L sin(ωt) − [1 − cos(ωt)] ωt − ∼ . µω(xmin )2 2 xmin ωxmin ϕ(t) − ϕ(0) = Die Winkelvariable steigt also grundsätzlich linear an, wie bei der Kreisbewegung, führt aber zusätzlich kleine Oszillationen mit der Frequenz ω aus. Dieses Verhalten ist auch klar aufgrund von (3.25): ϕ(t) variiert am schnellsten, wenn x(t) klein und u(t) negativ ist, und am langsamsten, wenn x(t) groß und u(t) positiv ist. 42 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME 3.4.3 Der harmonische Oszillator Der isotrope dreidimensionale harmonische Oszillator wird durch das Potential V (|x|) = 21 µω 2 x2 definiert. Die entsprechende Bewegungsgleichung folgt aus (3.23) als ẍ = −ω 2 x . Da die Bewegung orthogonal auf dem Gesamtdrehimpulsvektor L(S) = Lê3 erfolgt, gilt x3 = 0. Aufgrund der Diskussion des eindimensionalen harmonischen Oszillators (3.31) ist klar, dass für gewisse Amplituden (a1 , a2 ) und Phasen (ϕ1 , ϕ2 ) gilt: x1 (t) = a1 cos(ωt + ϕ1 ) , x2 (t) = a2 cos(ωt + ϕ2 ) . Man sieht sofort, dass die möglichen Bahnen des harmonischen Oszillators alle 2π ω -periodisch und somit geschlossen sind. Es ist bemerkenswert, dass die Periode 2π ω weder von der Form noch von der Amplitude der Bahn abhängig ist. Die Unabhängigkeit der Periode von der Amplitude hatten wir bereits vorher für den Spezialfall kreisförmiger Bahnen festgestellt. Durch explizite Berechnung erhält man Ausdrücke für den Bahndrehimpuls, L = µx × ẋ = µωa1 a2 sin(ϕ1 − ϕ2 )ê3 , und für die Energie, E (S) = 21 µẋ2 + 12 µω 2 x2 = 21 µω 2 (a21 + a22 ) . Die Energie ist daher gleich der Summe der Beiträge der Schwingungen in x1 bzw. x2 -Richtung. Definieren wir nun ϕ(t) ≡ ωt + ϕ1 und δ ≡ ϕ2 − ϕ1 , so folgt x1 (t) = a1 cos[ϕ(t)] und x2 (t) = a2 cos [ϕ(t) + δ] = a2 [cos(ϕ) cos(δ) − sin(ϕ) sin(δ)] . Aus diesen Gleichungen kann man cos(ϕ) und sin(ϕ) bestimmen: x1 x1 x2 cos(ϕ) = , sin(δ) sin(ϕ) = cos(δ) − . a1 a1 a2 Wegen sin2 (δ) = = = sin2 (δ) cos2 (ϕ) + sin2 (ϕ) x1 2 2 x2 sin (δ) + cos2 (δ) + a1 a2 2 2 x1 x2 x1 x2 cos(δ) + −2 a1 a2 a1 a2 2 −2 x1 x2 cos(δ) a1 a2 (3.32) ist klar, dass sich der Vektor x(t) entlang einer Ellipse in der ê1 -ê2 -Ebene bewegt. Um diese Ellipse auf ihre Normalform zu bringen, schreiben wir die Ellipsengleichung (3.32) als x1 sin (δ) = x2 2 T x A 1 x2 , A= 1 (a1 )2 − cos(δ) a1 a2 − cos(δ) a1 a2 1 (a2 )2 ! 43 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME und beachten, dass A eine reelle, symmetrische Matrix ist, die daher mit Hilfe einer orthogonalen Transformation O diagonalisiert werden kann: A = OT AD O , AD = λ+ 0 0 λ− . Hierbei sind λ± die Eigenwerte von A. Wir nehmen (o. B. d. A.) an, dass λ+ ≥ λ− gilt. Aus der expliziten Form von A folgt: 1 λ± = 2 ( 1 1 + ± 2 (a1 ) (a2 )2 Ê 1 1 + 2 (a1 ) (a2 )2 2 4 sin2 (δ) − (a1 a2 )2 ) , so dass diese beiden Eigenwerte reell und nicht-negativ sind. Mit der Definition ξ1 x =O 1 ξ2 x2 , erhält man: x1 x2 sin2 (δ) = T OT AD O = λ+ ξ12 + λ− ξ22 T x1 ξ = 1 x2 ξ2 λ+ 0 0 λ− ξ1 ξ2 . Die Normalform der Ellipse ist nun durch 1= ξ1 α1 2 + ξ2 α2 ¨ 2 mit α1 ≡ | sin(δ)|/ α2 ≡ | sin(δ)|/ p λ+ p λ− gegeben. Für δ = 0 oder δ = π vereinfacht sich die Ellipsengleichung (3.32) auf die Gleichungen x2 = aa21 x1 bzw. x2 = − aa12 x1 für zwei Geraden, und für 2 2 = 1 in der δ = π2 erhält man eine Ellipse mit der Normalform xa11 + xa22 ê1 -ê2 -Ebene. Das Virialtheorem lässt sich für den harmonischen Oszillator leicht überprüfen, und ein Vergleich der beiden Ergebnisse 1 2 2 µẋ © = 21 µω 2 a21 sin2 [ϕ(t)] + a22 sin2 [ϕ(t) + δ] = 41 µω 2 a21 + a22 1 ′ 2 xV (x) © = V (x) = 12 µω 2 a21 cos2 [ϕ(t)] + a22 cos2 [ϕ(t) + δ] = 41 µω 2 a21 + a22 zeigt, dass die Identität (3.24) tatsächlich erfüllt ist. Es ist übrigens interessant, dass die Wirkung S einer Umlaufbahn vollständig durch die Energie E (S) [und nicht z. B. zusätzlich durch den Bahndrehimpuls] bestimmt wird: I S≡ Z dx · p = Z T 0 dt ẋ · p = 2 2π (S) = T (Ekin + Epot ) = E ω T dt 0 p2 = 2T Ekin 2µ (3.33) . Umgekehrt wird die Energie des harmonischen Oszillators also vollständig durch ω S. die Wirkung einer Umlaufbahn festgelegt: E (S) = 2π 44 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME 3.4.4 Ellipsen, Hyperbeln, Parabeln Die Standardform einer Ellipse mit den Halbachsen a1 und a2 lautet 2 x1 a1 + x2 a2 2 =1 . Wir nehmen (o. B. d. A.) an, dass a2 ≤ a1 gilt, und definieren1 Ê 1− ε≡ a2 a1 2 p≡ <1 , (a2 )2 = a1 (1 − ε2 ) a1 . Eine Parametrisierung der Ellipse mit Hilfe einer Winkelvariablen ϕ ist √ 1 − ε2 sin(ϕ) x1 (ϕ) ε + cos(ϕ) x2 (ϕ) = = , , (3.34) a1 1 + ε cos(ϕ) a2 1 + ε cos(ϕ) denn es gilt x1 a1 2 + 2 x2 a2 = ε2 + 2ε cos(ϕ) + cos2 (ϕ) + 1 − ε2 2 [1 + ε cos(ϕ)] 2 1 + 2ε cos(ϕ) + ε cos2 (ϕ) =1 . = 2 [1 + ε cos(ϕ)] 1 − cos2 (ϕ) Alternativ kann man (3.34) als a1 (1 − ε2 ) cos(ϕ) p cos(ϕ) x1 = a1 ε + = a1 ε + 1 + ε cos(ϕ) 1 + ε cos(ϕ) √ a1 (1 − ε2 ) sin(ϕ) p sin(ϕ) a2 1 − ε2 sin(ϕ) = = x2 = 1 + ε cos(ϕ) 1 + ε cos(ϕ) 1 + ε cos(ϕ) oder mit (x1 , x2 ) ≡ x und (a1 ε, 0) ≡ b auch kurz als x − b = r(ϕ) cos(ϕ) sin(ϕ) , r(ϕ) ≡ p 1 + ε cos(ϕ) (3.35) darstellen. Gleichung (3.35) besagt, dass der Relativvektor x − b einen Winkel ϕ mit der ê1 -Achse macht und die Länge r(ϕ) hat. Offensichtlich ist (ϕ, r(ϕ)) eine mögliche und bequeme alternative Parametrisierung der Ellipse. Der Referenzpunkt b wird als Brennpunkt der Ellipse bezeichnet. Die Standardform einer Hyperbel lautet x1 a1 2 − x2 a2 2 =1 mit a1 > 0 und a2 > 0. Wir definieren nun: Ê ε≡ 1+ a2 a1 2 >1 , p≡ (a2 )2 = a1 (ε2 − 1) a1 1 Der Parameter ε wird als Exzentrizität und p als semilatus rectum oder schlichtweg als „Parameter“ bezeichnet. 45 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME und erhalten die Parametrisierung ε + cos(ϕ) x1 (ϕ) =± a1 1 + ε cos(ϕ) √ ε2 − 1 sin(ϕ) x2 (ϕ) = a2 1 + ε cos(ϕ) , der zwei Zweige der Hyperbel. Wiederum gibt es eine alternative Kurzform: x − b′± = r(ϕ) ∓ cos(ϕ) sin(ϕ) b′± = , ±a1 ε 0 , r(ϕ) = p 1 + ε cos(ϕ) , die zeigt, dass die zwei Zweige der Hyperbel mittels (ϕ, r(ϕ)) parametrisiert werden können. Die Parabel kann im Grenzfall ε ↑ 1, wobei p = a1 (1 − ε2) festgehalten wird, aus der Ellipse erhalten werden. Aus (3.35) folgt nämlich im Limes ε ↑ 1: xr ≡ (x − b) = r(ϕ) cos(ϕ) sin(ϕ) , r(ϕ) = p 1 + cos(ϕ) (3.36) . Man überprüft leicht, dass cos(ϕ) 1 x1r cos(ϕ) − 1 = = 1+ = p 1 + cos(ϕ) 2 1 + cos(ϕ) x2r sin(ϕ) = = tan( 21 ϕ) p 1 + cos(ϕ) 1 2 1 − tan2 ( 21 ϕ) gilt, so dass xr tatsächlich eine Parabel darstellt: x1r = 12 p 1 − x2r p 2 . Beim Grenzwertprozess (3.36) ist übrigens zu beachten, dass sowohl b1 = a1 ε → ∞ als auch x1 → ∞ gilt, die Relativkoordinate x1r = x1 − b1 jedoch endlich bleibt. Zusammenfassend gilt also in allen drei Fällen die Polardarstellung r(ϕ) = p 1 + ε cos(ϕ) (3.37) , wobei 0 ≤ ε < 1 der Ellipse entspricht, ε = 1 der Parabel und ε > 1 der Hyperbel. 3.4.5 Das Kepler-Problem Das Kepler-Problem, d. h. das Zweiteilchenproblem mit dem Gravitationspotential V (x) = − Gm1 m2 GµM =− x x , ist wegen seiner großen Bedeutung für die Astronomie wohl das wichtigste Einzelproblem der elementaren Theoretischen Mechanik. Das Kepler-Problem ist in der Klasse der Zentralpotentiale insofern ungewöhnlich, als es neben dem Gesamtdrehimpuls L(S) und der Gesamtenergie E (S) , die für alle Zentralpotentiale 46 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME erhalten sind, noch eine weitere nicht-triviale Erhaltungsgröße aufweist, den sogenannten „Lenz’schen Vektor“ 2 a ≡ ẋ × L(S) + V (x)x . Wegen L̇(S) = 0 und ẍ = − µ1 V ′ (x)êx , s. Gleichung (3.23), gilt nämlich da = ẍ × L(S) + V ′ (x)(êx · ẋ)x + V (x)ẋ dt = xV ′ (x) [êx (êx · ẋ) − êx × (êx × ẋ)] + V (x)ẋ d = [xV ′ (x) + V (x)]ẋ = ẋ [xV (x)] = 0 , dx wobei im zweiten Schritt die Identität (2.17) mit (ẋ, êx ) statt (x, α̂) verwendet wurde. Die Existenz einer weiteren Erhaltungsgröße deutet darauf hin, dass das Kepler-Problem eine größere Symmetrie als das generische Zentralpotential hat; diese größere Symmetrie wird insbesondere bei der Behandlung des Wasserstoffproblems in der nicht-relativistischen Quantenmechanik sehr wichtig. Auf die geometrische Bedeutung des Lenz’schen Vektors gehen wir am Ende dieses Abschnitts näher ein. Kepler-Bahnen Um das Kepler-Problem zu lösen, rufen wir zuerst die Gleichungen (3.25) und (3.27) für die Zeitableitungen der Variablen (ϕ, x) in Erinnerung: ϕ̇ = L µx2 , ẋ2 = 2 (S) E − Vf (x) µ , Vf (x) = V (x) + L2 2µx2 . Dividiert man die Gleichung für ẋ2 durch ϕ̇2 , so folgt d(x−1 ) dϕ 2 −4 =x dx dϕ 2 −4 =x GµM 2µ L2 ẋ2 (S) E + = − ϕ̇2 L2 x 2µx2 µ2 GM −1 2µE (S) + 2 x − x−2 L2 L2 2 2µE (S) −2 + p = − x−1 − p−1 2 L = , 2 wobei der Parameter p−1 ≡ µ LGM definiert wurde. Führt man nun eine neue 2 Variable u ≡ x−1 − p−1 ein, erhält man die Differentialgleichung du dϕ 2 = 2µE (S) + p−2 L2 − u2 , (3.38) 2 d u die nach Ableiten bezüglich ϕ in dϕ 2 = −u übergeht. Die allgemeine Lösung dieser Gleichung ist offensichtlich in der Form u(ϕ) = A cos(ϕ + ϕ0 ) darstellbar, 2 Der „Lenz’sche Vektor“ wurde allerdings keineswegs erstmals von Wilhelm Lenz (1924), sondern bereits 1710 von Jakob Hermann und Johann I. Bernoulli entdeckt. Da auch Laplace und C. Runge den „Vektor“ diskutierten, wird er manchmal mit einem Hauch von Ironie auch als Hermann-Bernoulli-Laplace-Runge-Lenz-Vektor bezeichnet. Die Bezeichnung „Lenz’scher Vektor“ geht auf Pauli (1926) zurück. 47 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME wobei wir o. B. d. A. annehmen können, dass die Amplitude A positiv ist: A > 0. Mit der Definition Ap ≡ ε folgt noch −1 p p = = , (3.39) x(ϕ) = u(ϕ) + p−1 1 + p u(ϕ) 1 + ε cos(ϕ + ϕ0 ) und ein Vergleich mit (3.37) zeigt sofort, dass die möglichen Lösungen des Kepler-Problems die Form von Ellipsen (0 ≤ ε < 1), Parabeln (ε = 1) oder Hyperbeln (ε > 1) besitzen. Eine Beziehung zwischen dem Parameter ε und der Energie der Bahn folgt durch Einsetzen der Lösung u(ϕ) in (3.38): 2µp2 (S) E = p2 L2 du dϕ 2 +u 2 −1 = (Ap)2 [sin2 (ϕ + ϕ0 ) + cos2 (ϕ + ϕ0 )] − 1 = ε2 − 1 und das Resultat ist: E (S) = L2 2µ µ2 GM L2 2 (ε2 − 1) = − 12 µ GµM L 2 (1 − ε2 ) . (3.40) Man sieht, dass die Ellipsenform (0 ≤ ε < 1) einer negativen Energie (d. h. einem gebundenen Zustand) entspricht, dass parabelförmige Bahnen (ε = 1) nur für E (S) = 0 auftreten und dass eine positive Bahnenergie (d. h. ein Streuzustand) zu Hyperbeln führt. Die Ellipsenform der Planetenbahnen wurde zuerst von Kepler am Mars beobachtet und ist als das erste Kepler’sche Gesetz bekannt. Es ist äußerst bemerkenswert, dass alle gebundenen Zustände (E (S) < 0) des Kepler-Potentials durch geschlossene Bahnen beschrieben werden. Es sei daran erinnert, dass alle möglichen Bahnen des harmonischen Oszillators ebenfalls geschlossen sind. Das Kepler-Problem ist insofern „aufgeschlossener“ als der harmonische Oszillator, als für das Kepler-Potential auch offene Bahnen möglich sind (nämlich für E (S) = 0 bzw. für E (S) > 0). Die Beziehung (3.40) zwischen den Erhaltungsgrößen E (S) und L und der Exzentrizität ε kann auch anders (und einfacher) dargestellt werden. Aus der 2 Definition p−1 = µ LGM des Parameters p folgt nämlich 2 E (S) = − GµM GµM = 21 V (a1 ) (1 − ε2 ) = − 2p 2a1 (3.41) für ellipsenförmige Bahnen [E (S) < 0] und E (S) = − GµM GµM = − 12 V (a1 ) (1 − ε2 ) = 2p 2a1 (3.42) für Hyperbeln [E (S) > 0]. Beide Formeln sind korrekt für parabelförmige Bahnen [E (S) = 0], da in diesem Fall a1 = ∞ gilt. Das Interessante an der Darstellung (3.41), (3.42) ist, dass die Energie E (S) lediglich durch den Bahnparameter a1 (oder umgekehrt: die große Halbachse a1 lediglich durch die Energie) bestimmt wird.3 Die Energie hängt also nicht zusätzlich von a2 (oder äquivalent: von ε oder p) ab. In diesem Sinne liegt im Kepler-Problem eine ungewöhnliche Energieentartung vor. Auf diese Entartung kommen wir im Folgenden ausführlich zurück. 3 Kombination mit dem Virialtheorem E (S) = Ekin + Epot = 1 E 2 pot = 1 V 2 (x(t)) zeigt für geschlossene (d. h. ellipsenförmige) Bahnen außerdem, dass V (x(t)) = V (a1 ) gilt, so dass auch die mittlere potentielle und die mittlere kinetische Energie lediglich durch a1 bestimmt sind. 48 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME Die Zeitabhängigkeit Es ist nun auch durchaus möglich, die Zeitabhängigkeit ϕ(t) der Winkelvariablen oder äquivalent die Winkelabhängigkeit t(ϕ) der Zeitvariablen zu bestimmen. Wir wählen ϕ0 = 0 in (3.39), damit die Variable ϕ geometrisch als Winkel zwischen dem Radiusvektor (d. h. x − b, xr oder x − b′± ) und der ê1 -Achse interpretiert werden kann. Außerdem ist es bequem, den Zeitnullpunkt durch t(0) = 0 festzulegen, so dass die Zeit ab dem Durchlaufen des Perizentrums4 gemessen wird. Durch Integration von (3.25) erhält man dann t(ϕ) = µ L Z ϕ dϕ′ [x(ϕ′ )]2 = 0 Z µp2 τ (ϕ) L , τ (ϕ) ≡ 0 ϕ dϕ′ 1 [1 + ε cos(ϕ′ )]2 . Das Integral τ (ϕ) kann nun mit Hilfe von geeigneten Handbüchern [14], Formeln (2.554.3) und (2.553.3), berechnet werden. Für eine Ellipse (0 ≤ ε < 1) lautet das Ergebnis: ¨ √ « 1 − ε2 tan( 12 ϕ) −1 2 ε sin(ϕ) arctan τ (ϕ) = −√ , (3.43) 1 − ε2 1 + ε cos(ϕ) 1+ε 1 − ε2 und man überprüft leicht die Korrektheit dieses Resultats durch Differentiation. In (3.43) ist zu beachten, dass arctan(z) nur bis auf ein ganzzahliges Vielfaches von π definiert ist; diese zusätzlichen Konstanten sind so zu wählen, dass τ (ϕ) eine kontinuierliche Funktion mit τ (0) = 0 ist. Für Hyperbelbahnen (ε > 1) erhält man ¨ √ « ε2 − 1 tan( 12 ϕ) ε sin(ϕ) 2 1 artanh . (3.44) −√ τ (ϕ) = 2 ε − 1 1 + ε cos(ϕ) 1+ε ε2 − 1 √ √ Dies sieht man noch am einfachsten, indem man in (3.43) 1 − ε2 durch i ε2 − 1 ersetzt und die Beziehung arctan(iz) = i artanh(z) verwendet. Da für die Hyperbel [1 + ε cos(ϕ)] > 0 und somit |ϕ| < ϕ∞ ≡ π − arccos 1ε gilt, folgt aus (3.44): τ (ϕ) ∼ ∼ 1 (1+ε)2 ϕ 1 ε2 −1 (ϕ∞ − ϕ)−1 (ϕ → 0) (ϕ ↑ ϕ∞ ) . Es folgt, dass die zwei Massenpunkte (nicht erstaunlicherweise) eine unendlich lange Zeit benötigen, um sich unendlich weit voneinander zu entfernen: ϕ(t) ∼ ϕ∞ − 1 1 2 ε −1τ t= µp2 τ →∞ L . Für parabelförmige Bahnen folgt durch explizite Berechnung oder Verwendung von Handbüchern: τ (ϕ) = 1 2 tan 1 2ϕ 1+ 1 3 tan2 1 2ϕ . 4 Bei der Ellipse wird ϕ = π entsprechend als Apozentrum bezeichnet. In konkreten Anwendungen hat man also einerseits ein Perihel, Perigäum, Perijovum, usw., und andererseits ein Aphel, Apogäum, Apojovum, usw. 49 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME Es gilt τ (ϕ) ∼ 41 ϕ für ϕ → 0 und τ (ϕ) ∼ 34 (π − ϕ)−3 für ϕ ↑ π oder äquivalent 1/3 4 ϕ(t) ∼ π − 3τ für t → ∞. Für elliptische Kepler-Bahnen ist die Zeitabhängigkeit der Winkelvariablen 2 periodisch mit der Periode T ≡ µp L τ (2π) mit 2 arctan τ (2π) = (1 − ε2 )3/2 √ 1 − ε2 tan(π) 1+ε a1 2π = 2π = p (1 − ε2 )3/2 3/2 . Die Umlaufzeit T der elliptischen Bahn ist daher durch (a1 )3/2 p3/2 µp2 a1 3/2 = 2π √ τ (2π) = 2π √ L GM p GM √ gegeben, wobei L = µ GM p verwendet wurde. Wir stellen fest, dass sich die Quadrate der Umlaufzeiten für alle elliptischen Bahnen (d. h. nicht nur für Kreisbahnen, wie vorher gezeigt wurde) wie die Kuben der großen Halbachsen verhalten (drittes Kepler’sches Gesetz). Es sollte übrigens darauf hingewiesen werden, dass die Umlaufzeit auch viel einfacher berechnet werden kann: Sie folgt sofort aus dem zweiten Kepler-Gesetz dA L dt = 2µ und der bekannten Gesamtfläche AE = πa1 a2 einer Ellipse: T = Z Z T AE dt = T = 0 0 dA 2µ = dA/dt L Z AE dA = 0 (a1 )3/2 µa1 a2 a1 a2 = 2π √ = 2π = 2π √ L GM p GM 2µAE L , 2 wobei im letzten Schritt die Beziehung p = (aa21) verwendet wurde. Da aufgrund von (3.41) bekannt ist, dass die große Halbachse a1 der Ellipsenbahn vollständig durch die Energie E (S) festgelegt wird, können wir schließen, dass auch die Umlaufzeit, −3/2 (a1 )3/2 T = 2π √ = 2πGM − µ2 E (S) GM , lediglich von der Energie abhängig ist. Eine weitere physikalische Größe, die lediglich durch die im Schwerpunktsystem gemessene Energie E (S) bestimmt wird, ist die Wirkung einer Umlaufbahn, die wir bereits vorher [s. (3.33)] bei der Behandlung des harmonischen Oszillators kennengelernt haben. Für das Kepler-Problem erhält man: I S= dx·p = 2T Ekin = −2T E (S) = µT − µ2 E (S) = 2πGµM − µ2 E (S) −1/2 , wobei wiederum das Virialtheorem verwendet wurde: Epot = −2Ekin und daher E (S) = Ekin + Epot = −Ekin . Es folgt umgekehrt für Ellipsenbahnen: 2 − E (S) = µ GµM S/2π 2 , (3.45) so dass die Energie vollständig durch die Wirkung der Bahn festgelegt ist. 50 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME Ausblick: Das Wasserstoffproblem in der Quantenmechanik An dieser Stelle gibt es eine sehr wichtige Querverbindung zur Quantenmechanik, in der das Kepler-Problem durch das Wasserstoff- oder Coulomb-Problem e2 ersetzt wird. In Bohrs semiklassischer Beund Gµm entsprechend durch 4πε 0 handlung des Wasserstoffproblems (1913) wird die Wirkung S gemäß S = nh quantisiert, wobei h das Planck’sche Wirkungsquantum darstellt und n = h ≡ ~ findet 1, 2, . . . als Hauptquantenzahl bezeichnet wird. Mit der Definition 2π man also: E (S) 1 = − 2 ry , n µ ry ≡ Ry me Ry ≡ , 1 2 me e2 4πε0 ~ 2 . Die für das Wasserstoffspektrum charakteristische Energie ry hängt also in einfacher Weise mit der sogenannten Rydberg-Energie Ry zusammen. Da das Proton viel schwerer als das Elektron ist, mp /me ≃ 2000, ist die reduzierte Masse −1 des Wasserstoffproblems im Wesentlichen gleich der Elektroµ = m1e + m1p nenmasse me , so dass ry ≃ Ry gilt. Wichtig am quantenmechanischen Resultat E (S) = − n12 ry ist vor allem die hohe Entartung, wobei die Energie lediglich von der Hauptquantenzahl n und nicht z. B. zusätzlich von der Bahndrehimpulsquantenzahl l abhängig ist. Dies ist vollkommen analog zu den klassischen Ergebnissen (3.41) und (3.45), die zeigen, dass die Energie der Bahnbewegung lediglich durch a1 oder S und nicht z. B. zusätzlich durch L bestimmt wird. Wir werden im Folgenden sehen, dass diese Entartung eng mit der Existenz einer zusätzlichen Erhaltungsgröße im Kepler- oder Coulomb-Problem, des Lenz’schen Vektors, zusammenhängt. Wegen der zentralen Rolle des „Vektors“ gehen wir nun kurz auf seine geometrische Interpretation ein. Interpretation des Lenz’schen Vektors Da wir nun wissen, dass alle Kepler-Bahnen Ellipsen, Parabeln oder Hyperbeln sind, kann auch die zusätzliche Erhaltungsgröße des Kepler-Problems, der Lenz’sche Vektor, leicht geometrisch interpretiert werden: Da wir bereits wissen, dass dieser Vektor zeitunabhängig ist, können wir ihn o. B. d. A. für ϕ = 0 auswerten. In diesem Fall gilt jedoch ẋ = xϕ̇(ê3 × êx ), so dass a = ẋ × L(S) + V (x)x = Lxϕ̇(ê3 × êx ) × ê3 + xV (x)êx = [Lxϕ̇ + xV (x)] êx in der êx (ϕ = 0)-Richtung und somit vom Referenzpunkt (Brennpunkt) zum Perizentrum zeigt. Die Amplitude des Lenz’schen Vektors folgt aus ϕ̇ = L µx2 , als x(ϕ = 0) = [Lxϕ̇ + xV (x)]ϕ=0 p 1+ε L2 = − GµM µx , = ϕ=0 p= L2 Gµ2 M L2 (1 + ε) − GµM µp = GµM (1 + ε) − GµM = GµM ε ≥ 0 . Es ist zu beachten, dass der Lenz’sche Vektor sowohl für Ellipsenbahnen als auch für parabel- und hyperbelförmige Bahnen existiert und relevant ist. 51 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME ẋ x 0 Abbildung 3.3: Zur Bestimmung des Lenz’schen Vektors Das Virialtheorem Wir haben in diesem Abschnitt bereits mehrmals das Virialtheorem Ekin = − 21 Epot verwendet, das aufgrund der Energieerhaltung, Ekin + Epot = E (S) , auch als Epot = V (x) = 2E (S) geschrieben werden kann. Zum Abschluss dieses Abschnitts überprüfen wir das Virialtheorem nun explizit mit Hilfe der exakten Lösung des Kepler-Problems. Selbstverständlich ist diese Aussage des Virialtheorems nur für gebundene Zustände (d. h. für 0 ≤ ε < 1) relevant, da die Bahnen nur in diesem Fall räumlich L beschränkt sind. Mit Hilfe der Beziehung ϕ̇ = µx 2 kann die Zeitmittelung über eine Periode T der Kepler-Bewegung auch durch eine Mittelung über den Winkel ϕ ersetzt werden: 1 V (x) = − T Z T 0 GµM 1 dt =− x(ϕ(t)) T Z 2π 0 GµM Gµ2 M dϕ =− ϕ̇x(ϕ) TL Z 2π dϕ x(ϕ) . 0 Mit Hilfe von 3/2 p3/2 a = 2π √ (1 − ε2 )−3/2 T = 2π √ 1 GM GM und x(ϕ) = p 1+ε cos(ϕ) erhält man: µ2 (GM )3/2 (1 − ε2 )3/2 V (x) = − √ 2πL p Z 2π dϕ 0 1 1 + ε cos(ϕ) . Das Integral lässt sich wiederum mit Hilfe von Handbüchern berechnen (siehe z. B. [14], Formel (2.553.3)): √ 2π Z 2π 1 − ε2 tan( 12 ϕ) 1 2 dϕ arctan =√ 1 + ε cos(ϕ) 1+ε 1 − ε2 0 0 und es folgt in der Tat: µ2 (GM )3/2 V (x) = − L 2 2π =√ (π − 0) = √ 2 1−ε 1 − ε2 r Gµ2 M GµM (1 − ε2) = −µ 2 L L wobei noch einmal die Beziehung p = L2 Gµ2 M , 2 (1 − ε2 ) = 2E (S) verwendet wurde. , 52 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME 3.4.6 Geschlossene Bahnen und Gleichförmigkeit In Abschnitt [3.4.3] konnten wir feststellen, dass alle möglichen Bahnen der Lösung des dreidimensionalen harmonischen Oszillators ellipsenförmig und somit geschlossen sind. Aus Abschnitt [3.4.5] ist bekannt, dass alle räumlich beschränkten Bahnen des Kepler-Problems ebenfalls geschlossen sind. Des Weiteren wissen wir aus Abschnitt [3.4.1], dass für recht allgemeine Zweiteilchenprobleme mit attraktiver Wechselwirkung Kreisbahnen möglich sind, so dass zumindest einige mögliche Lösungen geschlossen sind. Man kann sich nun fragen, ob bzw. inwiefern die Geschlossenheit der möglichen Bahnen eine allgemeine Eigenschaft von Zentralpotentialen ist. Mit relativ geringem Aufwand kann man zeigen (s. Anhang A), dass innerhalb der großen Klasse der Zentralpotentiale nur für den harmonischen Oszillator und das Kepler-Problem, V (x) = V0 x2 bzw. V (x) = −V0 x−1 (V0 > 0) , alle räumlich beschränkten Lösungen auch tatsächlich geschlossen sind. Für alle anderen Zentralpotentiale haben die möglichen räumlich beschränkten Bahnen im Allgemeinen die Form von Rosetten, die überall im ringförmigen Streifen x− ≤ x ≤ x+ dicht liegen. Hierbei entspricht x− dem Relativabstand der beiden Teilchen beim Durchlaufen des Perizentrums, und analog entspricht x+ dem Apozentrum. Nehmen wir nun an, ein Zentralpotential habe die Form V (x) = V0 xα und besitze somit die Eigenschaft V (λx) = λα V (x) für alle λ > 0. Nehmen wir des Weiteren an, für dieses Zentralpotential existiere eine Bahn x(t). Man kann dann leicht zeigen, dass neben x(t) auch x′ (t′ ) ≡ λx(λ−β t′ ) , t = λ−β t′ (3.46) für entsprechend gewähltes β und alle λ > 0 eine mögliche Bahn darstellt. Dies folgt aus der Beziehung V ′ (λx) = λα−1 V ′ (x) und µ d2 x(λ−β t′ ) d2 x′ ′ (t ) + V ′ (x′ )ê′x = µλ + V ′ (λx)êx ′ 2 (dt ) (dt′ )2 = µλ1−2β ẍ(t) + λα−1 V ′ (x)êx = − λ1−2β − λα−1 V ′ (x)êx , wobei im letzten Schritt die Bewegungsgleichung µẍ = −V ′ (x)êx für x(t) eingesetzt wurde. Man sieht, dass x′ (t′ ) dann und nur dann eine Lösung der Bewegungsgleichung darstellt, wenn der Exponent β den Wert β =1− α 2 (3.47) hat. Man bezeichnet die Lösungen (3.46) mit β wie in (3.47) und λ > 0 als eine Klasse von Gleichförmigkeitslösungen für das Potential V (x). Nehmen wir schließlich an, dass die Bahn x(t) räumlich begrenzt und geschlossen (und somit periodisch) ist; ihre Periode sei T und ihre Amplitude beim Durchlaufen des Apozentrums x+ . Die durch λ charakterisierte Gleichförmigkeitslösung hat dann die maximale Amplitude x′+ = λx+ und die Periode T ′ = λβ T . Es folgt T′ = T x′+ x+ β = x′+ x+ 1− α2 . (3.48) 53 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME Für den harmonischen Oszillator gilt also, dass die Schwingungszeit unabhängig von der Amplitude ist. Für α = −1 findet man das dritte Kepler-Gesetz, und auch für alle anderen möglichen räumlich begrenzten, geschlossenen Bahnen zeigt (3.48), dass das Skalierungsverhalten der Umlaufzeit mit der Bahngröße in einfacher Weise durch den Exponenten α bestimmt wird. 3.4.7 Die Bahn des Merkur Seit den sehr genauen Beobachtungen der Merkurbahn durch Urbain Jean Joseph le Verrier (1859) ist bekannt, dass diese recht exzentrische Bahn nahe der Sonne (ε = 0, 2056 , a1 = 57, 91 · 106 km) nur auf der Basis unrealistischer Annahmen, die nicht mit den astronomischen Beobachtungen im Einklang sind, mit den Gesetzen der Newton’schen Mechanik erklärt werden kann: Die Präzession des Perihels des Merkur ist stärker als es aufgrund von Störungen durch andere Planeten mit Hilfe der nicht-relativistischen Klassischen Mechanik theoretisch erklärbar ist. Die beobachtete Präzession des Perihels ist ∆ϕexp = 5600, 73 ± 0, 41′′ /Jahrhundert. Hiervon sind etwa 5025′′ durch eine zeitliche Änderung des Koordinatensystems (d. h. durch eine Drehung der Erdbahn) erklärbar. Störungen durch andere Planeten tragen weitere 532′′ /Jahrhundert zur Präzessionsgeschwindigkeit bei. Insgesamt kann man aufgrund der Newton’schen Mechanik also eine Präzessionsgeschwindigkeit von ∆ϕN = 5557, 62 ± 0, 20′′ /Jahrhundert verstehen. Unerklärt bleiben: ∆ϕ ≡ ∆ϕexp − ∆ϕN = 43, 11 ± 0, 45′′ /Jahrhundert . Der Merkur ist nicht der einzige Himmelskörper, dessen Bahn ungewöhnliches Präzessionsverhalten aufweist: Analog findet man ∆ϕ = 8, 4 ± 4, 8′′ /Jh. für Venus, ∆ϕ = 5, 0 ± 1, 2′′ /Jh. für die Erde und ∆ϕ = 9, 8 ± 0, 8′′ /Jh. für Icarus, einen Planetoiden mit einer stark exzentrischen Bahn (ε = 0, 827), der die Bahnen von Merkur, Venus, Erde und Mars kreuzt. Die größere Ungenauigkeit des ∆ϕ-Werts für Venus entsteht u.a. dadurch, dass die Venusbahn nahezu kreisförmig ist (ε = 0, 007), so dass genaue Beobachtungen des Periheldurchgangs schwieriger sind. Die theoretische Erklärung für die anomale Präzession des Merkur wurde 1915 geliefert, als A. Einstein am 18. November eine seiner Arbeiten über die allgemeine Relativitätstheorie bei der Preußischen Akademie der Wissenschaften zur Publikation einreichte. Die korrekte Erklärung dieses schon mehr als 50 Jahre alten Problems war sicherlich ein großer Triumph für die allgemeine Relativitätstheorie, deren definitive Formulierung übrigens erst eine Woche später (am 25. November) von Einstein zur Publikation eingereicht wurde. Betrachten wir zuerst noch einmal die Kepler’sche Bewegungsgleichung, die auf der nicht-relativistischen Newton’schen Mechanik beruht: Gµ2 M d2 (x−1 ) −1 + x = ≡ p−1 dϕ2 L2 . Einstein hat gezeigt, dass aufgrund allgemein relativistischer Effekte in der Bewegungsgleichung ein weiterer Term auftritt: 3GM d2 (x−1 ) + x−1 = p−1 + 2 x−2 dϕ2 c . (3.49) 54 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME Bei der Behandlung der Kepler-Bahnen (ohne relativistische Korrekturen) wurde bereits die neue Variable u = x−1 − p−1 eingeführt. Um die Effekte der relativistischen Korrektur in (3.49) besser einschätzen zu können, ist es zweckmäßig, die dimensionslose Größe p v ≡ pu = p(x−1 − p−1 ) = − 1 x und den dimensionslosen Parameter α≡ 3GM 3 3GM Gµ2 M = 2 = 2 2 2 c p c L c GµM L 2 einzuführen. Mit diesen Definitionen erhält man: d2 v 3GM p 2 = α(1 + v)2 + v = dϕ2 c2 p x (3.50) . Hierbei ist der Parameter α sehr klein (typischerweise von Ordnung 10−7 ), so dass es naheliegt, die relativistischen Korrekturen in Störungstheorie zu behandeln. Die Lösung von (3.50) in „nullter“ Ordnung, d. h. für α = 0, hat die bereits bekannte Form v(ϕ) = pA cos(ϕ + ϕ0 ) = ε cos(ϕ + ϕ0 ) ≡ v0 (ϕ) . Für α 6= 0 erwartet man Korrekturterme, die nach Potenzen von α geordnet werden können: v(ϕ) = ∞ X αn vn (ϕ) , (3.51) n=0 wobei vn (ϕ) nicht von α abhängen soll. Einsetzen des Ansatzes (3.51) in (3.50) liefert bis zur ersten Ordnung in α: d2 v + v = α(1 + v)2 = α[1 + v0 (ϕ)]2 + O(α2 ) dϕ2 = α[1 + ε cos(ϕ + ϕ0 )]2 + O(α2 ) . Die Lösung dieser Gleichung hat die Form v(ϕ) = v0 (ϕ) + α v1 (ϕ) + O(α2 ) , (3.52) wobei v0 (ϕ) die homogene Gleichung (für α = 0) erfüllt und v1 (ϕ) eine partikuläre Lösung von d2 v1 + v1 = 1 + 2ε cos(ϕ + ϕ0 ) + 21 ε2 {1 + cos[2(ϕ + ϕ0 )]} dϕ2 darstellt. Wie man leicht überprüft, wird eine solche partikuläre Lösung durch v1 (ϕ) = (1 + 12 ε2 ) + εϕ sin(ϕ + ϕ0 ) − 61 ε2 cos[2(ϕ + ϕ0 )] (3.53) gegeben. Um die Bahn als Funktion des Winkels zu erhalten, setze man (3.52) p ein. Die verschiedenen Terme in v1 (ϕ) in (3.53) haund (3.53) in x(ϕ) = 1+v(ϕ) ben sehr unterschiedliche Auswirkungen: Der erste Term im rechten Glied, multipliziert mit α, ist klein und ϕ-unabhängig und modifiziert die Bahnparameter 55 --------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME p und ε daher nur geringfügig; in der Praxis wird dieser Effekt unbeobachtbar sein. Der letzte Term im rechten Glied, multipliziert mit α, ist klein und periodisch; folglich werden die Effekte dieses Terms ebenfalls nahezu unbeobachtbar sein. Der zweite Term im rechten Glied wächst linear als Funktion des Winkels ϕ (und daher auch als Funktion der Zeit) an; dieser Term wird daher nach genügend langer Zeit zu beträchtlichen Abweichungen von der nicht-relativistischen Kepler-Bahn führen. Aus diesen Gründen ist es sinnvoll, im Folgenden nur die Effekte des zweiten Terms im rechten Glied von (3.53) mitzuberücksichtigen: v(ϕ) ≃ v0 (ϕ) + αεϕ sin(ϕ + ϕ0 ) = ε[cos(ϕ + ϕ0 ) + αϕ sin(ϕ + ϕ0 )] (3.54) 2 = ε cos(ϕ + ϕ0 − αϕ) + O(α ) . Das Resultat (3.54) bedeutet, dass ein voller Umlauf (d. h. eine vollständige Bewegung des Himmelskörpers vom Perihel zum Aphel und zurück) erst nach dem 2π ≃ 2π(1+α) abgeschlossen ist. Anders formuliert Durchlaufen eines Winkels 1−α könnte man sagen, dass sich der Perihelwinkel ϕP im Laufe der Zeit nach vorne bewegt: ϕP = −ϕ0 + αϕ, so dass Präzession der Bahn des Himmelskörpers auftritt. Die Präzessionsgeschwindigkeit ist ∆ϕ = 2πα/Umlauf , und für den Merkur entspricht dies dem Wert 43, 03′′ /Jahrhundert, in hervorragender Übereinstimmung mit le Verriers Messergebnis. Andere Vorhersagen der allgemeinen Relativitätstheorie sind ∆ϕ ≃ 8, 6′′ /Jh. für Venus, ∆ϕ ≃ 3, 8′′ /Jh. für die Erde und ∆ϕ ≃ 10, 3′′ /Jh. für Icarus, alle in guter Übereinstimmung mit der astronomischen Beobachtung. 56 Kapitel 4 Teilsysteme Häufig können mechanische Systeme nicht als abgeschlossen angesehen werden. In solchen Fällen sind die auf das System einwirkenden äußeren Kräfte mit zu berücksichtigen. In diesem Kapitel erörtern wir zunächst die allgemeinen Eigenschaften solcher Teilsysteme, und anschließend wird ein wichtiges (und für die Elektrodynamik sehr relevantes) Beispiel diskutiert, nämlich das geladene Teilchen im elektromagnetischen Feld. Im Allgemeinen schenkt man in der Theorie der Teilsysteme dem Verhalten der Bewegungsgleichungen unter GalileiTransformationen weitaus weniger Aufmerksamkeit als wir dies im vorigen Kapitel getan haben. Der Grund hierfür ist, wie bereits in Kapitel 2 erklärt, dass viele Bewegungsgleichungen für Teilsysteme durch die Wahl spezieller Bezugssysteme oder durch vorgenommene Näherungen nicht manifest Galilei-kovariant sind bzw. erst durch zusätzliche Transformationsregeln für die äußeren Kräfte Galilei-kovariant gemacht werden können. Speziell bei der Behandlung geladener Teilchen im elektromagnetischen Feld wird jedoch etwas näher auf die Frage nach der Galilei-Kovarianz der Theorie eingegangen. 4.1 Allgemeine Eigenschaften von Teilsystemen Während abgeschlossene Einteilchensysteme sehr einfach zu behandeln sind, da das einzige mögliche Kraftgesetz für solche Systeme durch F = 0 gegeben ist, sind Teil systeme, die nur ein einzelnes Teilchen enthalten, weitaus weniger trivial. Da sie in der Physik außerdem eine prominente Rolle spielen, werden im Folgenden Einteilchensysteme unter der Einwirkung äußerer Kräfte gesondert diskutiert. Anschließend wird die Verallgemeinerung auf Teilsysteme mit beliebiger Teilchenzahl behandelt. 4.1.1 Einteilchen-Teilsysteme Aus dem deterministischen Prinzip der Klassischen Mechanik folgt, dass die allgemeine Form der Bewegungsgleichung eines Einteilchensystems durch ṗ = F(ex) (x, ẋ, t) , p = mẋ gegeben ist, wobei F(ex) die äußere Kraft darstellt, die nur von den Variablen (x, ẋ, t) abhängig sein kann. Offensichtlich ist der Impuls in einem solchen Teil- -------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME system im Allgemeinen nicht erhalten, und das Gleiche gilt natürlich auch für den Drehimpuls L = x × p: dL = x × ṗ = x × F(ex) (x, ẋ, t) ≡ N(ex) (x, ẋ, t) . dt Es ist wichtig, zu beachten, dass die Bewegungsgleichungen für p und L Vektoridentitäten sind: Falls eine Komponente der Kraft F(ex) oder des Drehmoments N(ex) Null ist, ist die entsprechende Komponente von p bzw. L erhalten, auch wenn die übrigen Komponenten von F(ex) und N(ex) von Null verschieden sind. Die durch die Kraft F(ex) bei einer Teilchenbewegung von x(1) zur Zeit t1 nach x(2) zur Zeit t2 verrichtete Arbeit W1→2 wird allgemein durch Z W1→2 ≡ 1 2 Z dx · F(ex) = t2 t1 (ex) dt ẋ · F(ex) (x, ẋ, t) ≡ W1→2 definiert und ist wie folgt mit der Änderung der kinetischen Energie Ekin verknüpft: Z (ex) dt ẋ · F W1→2 = = Z t2 t1 2 t2 1 2 mẋ t1 = Z t2 dt ẋ · ẍ = =m (2) Ekin − t1 (1) Ekin t2 dt t1 d 1 mẋ2 2 dt . Für den wichtigen Spezialfall einer rein ortsabhängigen und konservativen äußeren Kraft, F(ex) = F(ex) (x) mit I dx · F(ex) (x) = 0 (4.1) für jeden geschlossenen Integrationsweg, können wir das Potential (bzw. die potentielle Energie) mittels Z Vex (x) = Vex (x0 ) − x x0 dx′ · F(ex) (x′ ) einführen, und es gilt dVex = −F(ex) · dx bzw. F(ex) = −∇Vex . Aufgrund des Stokes’schen Satzes, angewandt auf (4.1), oder direkt aus der Darstellung F(ex) = −∇Vex folgt wiederum ∇ × F(ex) = 0 . Für konservative Kräfte können wir schreiben: (2) (1) Ekin − Ekin = (1) Z 2 1 Z dx · F(ex) = − (2) 1 2 (1) (2) dx · ∇Vex = Vex − Vex mit Vex ≡ Vex (x(1) ) und Vex ≡ Vex (x(2) ). Mit der Definition E ≡ Ekin + Vex für die Gesamtenergie des Einteilchensystems folgt die Identität E (1) = E (2) , die die Energieerhaltung des Systems ausdrückt: dE dt = 0. Schließlich ist noch 58 -------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME hinzuzufügen, dass das Virialtheorem für Einteilchensysteme mit konservativen Kräften, Ekin = − 12 x · F(ex) = 12 x · ∇Vex , deutlich einfacher wird für homogene Potentiale mit Vex (λx) = λβ Vex (x) und daher x · ∇Vex = βVex : Ekin = 12 βVex . Als Beispiel sei ein Teilchen in einer harmonischen Falle (β = 2) erwähnt: In diesem Fall gilt Ekin = Epot . 4.1.2 Mehrteilchen-Teilsysteme Die Verallgemeinerung fast aller Eigenschaften von Einteilchensystemen auf Systeme mehrerer Teilchen ist recht einfach. Die Bewegungsgleichungen enthalten nun innere und äußere Kräfte: ṗi = Fi , pi = mi ẋi (i = 1, 2, . . . , N ) mit (in) Fi ≡ Fi (ex) ({xji }, {ẋji }) + Fi (X, Ẋ, t) , X = (x1 , . . . , xN ) , wobei wir annehmen, dass die inneren Kräfte mit den in Kapitel 3 betrachte(in) ten Kräften identisch sind. Insbesondere nehmen wir an, dass Fi das dritte Newton’sche Gesetz erfüllt: (in) Fi = X , fji j6=i fji = fji (|xji |)x̂ji . Da die inneren Kräfte - wie wir wissen - keinen Beitrag zu den Bewegungsgleichungen für den Gesamtimpuls und -drehimpuls liefern, folgt: dP X (ex) = Fi (X, Ẋ, t) ≡ F(ex) (X, Ẋ, t) dt i=1 N bzw. dL X (ex) = xi × Fi ≡ N(ex) (X, Ẋ, t) , dt i=1 N wobei N(ex) das Gesamtdrehmoment darstellt. Außerdem ist die von den Kräften bei einer Teilchenbewegung verrichtete Arbeit durch W1→2 = XZ 2 i (in) (ex) dxi · Fi = W1→2 + W1→2 1 (in) (1) (2) gegeben, wobei W1→2 = Vin − Vin die in (3.7) berechnete potentielle Energie (ex) der inneren Kräfte ist und W1→2 durch (ex) W1→2 ≡ XZ i 2 1 (ex) dxi · Fi 59 -------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME definiert wird. Es gilt der Zusammenhang: W1→2 = XZ 2 1 i dxi · Fi = t2 X 2 1 2 mi ẋi t1 i (2) (1) = Ekin − Ekin . Falls die äußeren Kräfte rein ortsabhängig und konservativ sind, d. h. falls für jede Teilchenbewegung entlang einer geschlossenen Schleife X(1) , t1 → X(2) , t2 → X(1) , t′1 (t′1 > t2 > t1 ) für die durch äußere Kräfte verrichtete Arbeit (ex) W1→2→1′ = 0 gilt, können diese äußeren Kräfte, wie für Einteilchensysteme, aus einem Potential Vex (X) hergeleitet werden. Wir definieren hierzu (ex) F (ex) ≡ F1 (ex) , . . . , FN und schreiben Z t′1 0 = W1→2→1′ = t1 I dX · F (ex) dt Ẋ · F (ex) = . Das Potential lässt sich offensichtlich wieder durch Z Vex (X) = Vex (X0 ) − X X0 dX′ · F (ex) (X′ ) definieren; wiederum ist dVex ein exaktes Differential: dVex = −F (ex) · dX = − N X (ex) Fi i=1 · dxi , und es folgt (ex) Fi = −∇i Vex . Für konservative äußere Kräfte gilt, dass die Gesamtenergie des Systems erhalten ist: (2) (1) (2) (ex) (1) Ekin + Vin − Ekin − Vin = W1→2 = =− XZ dxi · ∇i Vex = − 1 i Z 2 1 2 XZ i 2 (ex) dxi · Fi 1 ∂Vex (1) (2) dX · = Vex − Vex ∂X d. h. E (1) = E (2) und daher: dE dt , E ≡ Ekin + Vin + Vex = 0. Das Virialtheorem für Mehrteilchensysteme lautet: Ekin = − 12 X i xi · Fi = − 21 X i (in) xi · Fi − 1 2 X i (ex) xi · Fi , 60 -------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME wobei der erste Term im rechten Glied für homogene Zweiteilchenpotentiale der Form (3.12) als 21 αVin (X) geschrieben werden kann. Falls auch die äußeren Kräfte konservativ sind und aus einem homogenen Potential Vex (λx1 , λx2 , . . . , λxN ) = λβ V (x1 , x2 , . . . , xN ) abgeleitet werden können, so dass X i xi · ∇i Vex = βVex gilt, folgt insgesamt Ekin = 12 αVin + 21 βVex . Als Anwendung könnte man z. B. an zwei geladene Teilchen in einer harmonischen Falle (β = 2) denken, die sich durch Coulomb-Kräfte (α = −1) anziehen. 4.2 Die Lorentz-Kraft Als Anwendung der Theorie der Teilsysteme betrachten wir nun die auf geladene Teilchen im elektromagnetischen Feld einwirkende Lorentz-Kraft. Diese Anwendung ist besonders interessant im Hinblick auf die in Kapitel 2 der „Rechenmethoden 2“ zu behandelnde Maxwell-Theorie des Elektromagnetismus. Die Lorentz-Kraft ist einer der zwei Pfeiler der Elektrodynamik . Die Elektrodynamik befasst sich im Allgemeinen mit der Wechselwirkung elektromagnetischer Felder und geladener materieller Teilchen. Es liegen daher zwei miteinander gekoppelte Probleme vor: Einerseits ist man an der Zeitentwicklung der elektromagnetischen Felder in Anwesenheit von Ladungen und Strömen interessiert; diese Zeitentwicklung wird durch die Maxwell-Gleichungen beschrieben. Andererseits möchte man die Dynamik der Ladungen und Ströme in Anwesenheit der Felder bestimmen; die Dynamik solcher geladener materieller Teilchen folgt aus dem Lorentz’schen Kraftgesetz. Durch Kombination der Maxwell-Gleichungen mit dem Lorentz’schen Kraftgesetz erhält man eine vollständige und in sich geschlossene Beschreibung der Teilchen und Felder gemeinsam. Die Dynamik eines geladenen, nicht-relativistischen Teilchens der Masse m und Ladung q in einem elektromagnetischen Feld wird durch die Lorentz’sche Bewegungsgleichung mẍ = FLor , FLor = q(E + ẋ × B) (4.2) beschrieben, wobei FLor die Lorentz-Kraft darstellt und das elektrische Feld E und das Magnetfeld B im Allgemeinen orts- und zeitabhängig sind: E = E(x, t) und B = B(x, t). Die Lorentz-Kraft wurde bereits 1895 von Hendrik Antoon Lorentz postuliert. Lorentz’ Vermutung basierte auf dem Transformationsverhalten der E- und B-Felder unter „Lorentz-Transformationen“ bis zur linearen Ordnung in β ≡ v/c, wobei v = vrel (K ′ , K) die Relativgeschwindigkeit des Inertialsystems K ′ in Bezug auf K bezeichnet: E′ = E + v × B + . . . = E + β × (cB) + O(β 2 ) 1 cB′ = cB − v × E + . . . = cB − β × E + O(β 2 ) c (4.3) 61 -------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME Die Felder im Inertialsystem K werden hierbei durch (E, B), diejenigen in K ′ durch (E′ , B′ ) dargestellt. Betrachten wir nun ein nicht-relativistisches geladenes Teilchen, das zur Zeit t in K die Geschwindigkeit ẋ hat, und definieren wir K ′ durch die Wahl vrel (K ′ , K) = ẋ (und außerdem α = 0, ξ = 0, σ = ±1, τ = 0). Da das Teilchen zur Zeit t in K ′ ruht, spürt es in diesem Inertialsystem lediglich ein elektrisches Feld E′ , und es folgt: mẍ = mẍ′ = qE′ = q(E + ẋ × B) = FLor , so dass im ursprünglichen Inertialsystem K auf das Teilchen die geschwindigkeitsabhängige Lorentz-Kraft wirkt. Das Lorentz’sche Kraftgesetz in der Form (4.2) folgt somit - wie angekündigt - aus der Invarianz der Maxwell-Gleichungen unter Lorentz-Transformationen (bis zur linearen Ordnung in β). Bemerkenswert in (4.3) ist, dass die physikalischen Größen E und cB im SIEinheitensystem dieselbe physikalische Dimension haben und auch ein gleichartiges Verhalten unter Lorentz-Transformationen zeigen. Wir werden später sehen, dass der echte Vektor E und der Pseudovektor cB in der Relativitätstheorie untrennbar miteinander verflochten sind und zusammen den elektromagnetischen Feldtensor bilden. Ein Wort noch zu Größenordnungen: Die Stärke elektrischer Felder ist im Labor auf 107 − 108 V/m beschränkt. Starke Magnetfelder sind etwa im Bereich 3-30 T angesiedelt, so dass die Größe cB auf etwa 109 − 1010 Tm/s beschränkt ist. Hierbei gilt: 1 Tm/s = 1 V/m. In diesem Sinne sind starke Magnetfelder im Labor etwa um einen Faktor 102 stärker als starke elektrische Felder. Bei diesem Vergleich ist allerdings zu beachten, dass cB in der Lorentz-Kraft mit β ≡ |β| multipliziert wird, so dass die Kraft q ẋ × B unter den meisten irdischen Umständen eher klein ist im Vergleich zu qE. 4.2.1 Galilei-Kovarianz der Lorentz’schen Bewegungsgleichung Aus der Sicht der Klassischen Mechanik beschreibt die Lorentz’sche Bewegungsgleichung ein Teilsystem, nämlich das geladene Teilchen der Masse m und Ladung q, das durch die Kopplung der Ladung an die Felder E und B mit der Außenwelt verbunden ist. Die Frage nach der Galilei-Kovarianz der Bewegungsgleichung (4.2) ist also gleichbedeutend mit der Frage nach einer Transformationsregel für die E- und B-Felder, die Gleichung (4.2) insgesamt forminvariant lässt unter beliebigen Galilei-Transformationen. Betrachten wir also eine allgemeine Galilei-Transformation x′ = σR(α)−1 x − vt − ξ = σR(α)−1 (x − vα t − ξ α ) t′ = t − τ und fordern wir, dass neben mẍ = q [E(x, t) + ẋ × B(x, t)] im Inertialsystem K auch mẍ′ = q [E′ (x′ , t′ ) + ẋ′ × B′ (x′ , t′ )] im Inertialsystem K ′ mit vrel (K ′ , K) = v gilt. Gesucht ist die Transformation, die die Felder (E′ , B′ ) in K ′ mit den Feldern (E, B) in K verknüpft. 62 -------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME Mit Hilfe der Lorentz’schen Bewegungsgleichung und der Definition der GalileiTransformation findet man: d2 σR(α)−1 (x − vα t − ξ α ) dt2 = σR(α)−1 mẍ = σR(α)−1 q E + ẋ × B q(E′ + ẋ′ × B′ ) = mẍ′ = m = qσR(α)−1 {E + [σR(α)ẋ′ + vα ] × B} = q σR(α)−1 E + vα × B + R(α)−1 R(α)ẋ′ × B = q σR(α)−1 E + vα × B + ẋ′ × R(α)−1 B © © . Ein Vergleich der geschwindigkeitsabhängigen und -unabhängigen Terme im linken und rechten Glied liefert sofort: E′ (x′ , t′ ) = σR(α)−1 [E(x, t) + vα × B(x, t)] B′ (x′ , t′ ) = R(α)−1 B(x, t) (4.4) , wobei x und t durch die entsprechenden Ausdrücke mit x′ und t′ zu ersetzen sind: x = σR(α)x′ + vα (t′ + τ ) + ξ α t = t′ + τ , . Für eine rein orthogonale Transformation (mit vα = 0, ξα = 0 und τ = 0) vereinfacht sich (4.4) auf die Form E′ = σR(α)−1 E B′ = R(α)−1 B , , die zeigt, dass das elektrische Feld E einen echten Vektor und das Magnetfeld B einen Pseudovektor darstellt. Insbesondere gilt bei einer Raumspiegelung am Ursprung: E′ = −E und B′ = B. Aus den allgemeinen Transformationsregeln (4.4) für die elektrischen und magnetischen Felder geht interessanterweise noch hervor, dass das Skalarprodukt E · B bis auf einen Faktor σ invariant unter Galilei-Transformationen ist: E′ · B′ = σR(α)−1 E + vα × B · R(α)−1 B = σ E + vα × B · B = σE · B und somit einen Pseudoskalar darstellt. Diese Eigenschaft, dass E·B ein Pseudoskalar ist, gilt auch in der relativistischen Theorie, in der die Galilei-Transformationen durch Poincaré-Transformationen ersetzt werden. Genau genommen gibt es in der relativistischen Theorie zwei physikalische Größen, die invariant sind, falls sich die Orientierung des Koordinatensystems bei der Poincaré-Transformation nicht ändert (σ = +1), nämlich E · B und E2 − c2 B2 . Eine einfache Rechnung zeigt jedoch, dass die Größe E2 − c2 B2 in der nicht-relativistischen Theorie nicht invariant ist: E′ 2 − c2 (B′ )2 = E2 − c2 B2 + 2vα · B × E + vα × B 2 6= E2 − c2 B2 . Offensichtlich sind die Transformationsregeln (4.4) mit Vorsicht zu genießen, falls die Relativgeschwindigkeit der Inertialsysteme sehr hoch wird: |vα |/c = 63 -------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME O(1). Wir lernen somit, dass die Konsistenz der Lorentz’schen Bewegungsgleichung in ihrer nicht-relativistischen Form (4.2), die ja durch (4.4) gewährleistet wird, oder allgemeiner: die innere Konsistenz einer beliebigen Theorie, noch keineswegs ihre Richtigkeit impliziert. Die relativistische Theorie zeigt, dass sowohl die Form der Bewegungsgleichung als auch die Transformationsregeln für die E- und B-Felder zu modifizieren sind, bevor sie erfolgreich im Bereich |vα |/c = O(1) angewandt werden können. 4.2.2 Beispiel: konstante Felder Als einfaches Beispiel für die Wirkung der Lorentz-Kraft auf geladene, materielle Teilchen betrachten wir den Spezialfall orts- und zeitunabhängiger elektromagnetischer Felder. Die Lorentz’sche Bewegungsgleichung für ein Teilchen in einem konstanten elektrischen Feld (mit B = 0) lautet: mẍ = qE . Dieses Problem ist formal identisch mit der Bewegungsgleichung für ein massives Teilchen in einem konstanten Schwerkraftfeld (z. B. nahe der Erdoberfläche), und die Lösung hat dementsprechend dieselbe Form: x(t) = x(0) + ẋ(0)t + qt2 E 2m . Betrachten wir nun die Lorentz’sche Bewegungsgleichung für ein geladenes Teilchen in einem konstanten Magnetfeld (mit E = 0): mẍ = q ẋ × B . Wir wählen das Koordinatensystem gemäß B̂ ≡ ê3 B × ẋ(0) ≡ ê2 |B × ẋ(0)| , , ê2 × ê3 ≡ ê1 , (4.5) so dass die Bewegungsgleichung sich auf d dt ẋ1 ẋ2 ẋ3 =ω ẋ2 −ẋ1 0 , ω≡ qB m vereinfacht. In ê3 -Richtung findet geradlinig-gleichförmige Bewegung statt: x3 (t) = x3 (0) + ẋ3 (0)t, während das geladene Teilchen in den ê1 - und ê2 Richtungen um die Magnetfeldrichtung präzediert: ẋ1 (t) = ẋ1 (0) cos(ωt) , ẋ2 (t) = −ẋ1 (0) sin(ωt) und daher: x1 (t) = x1 (0) + ẋ1 (0) sin(ωt) , ω x2 (t) = x2 (0) + x˙1 (0) [cos(ωt) − 1] . (4.6) ω Hierbei ist zu beachten, dass die allgemeine Lösung (4.6) nur von drei Integrationskonstanten x1 (0), x2 (0) und ẋ1 (0) abhängig ist; die vierte Integrationskonstante ẋ2 (0) wurde durch die Wahl des Koordinatensystems gleich Null gesetzt. 64 -------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME Außerdem ist für den Spezialfall B × ẋ(0) = 0 darauf hinzuweisen, dass in diesem Fall ê2 ⊥ ê3 beliebig gewählt werden kann; unabhängig von der Wahl von ê2 gilt dann ẋ1 (0) = ẋ2 (0) = 0, und es folgt x1 (t) = x1 (0) und x2 (t) = x2 (0). Hiermit ist auch die Dynamik im konstanten Magnetfeld vollständig bekannt. Betrachten wir schließlich das allgemeine Problem der Dynamik eines geladenen Teilchens in konstanten elektrischen und magnetischen Feldern: mẍ = q E + ẋ × B . Wir wählen das Koordinatensystem nun gemäß B̂ = ê3 B×E ≡ ê2 |B × E| , ê2 × ê3 ≡ ê1 , und erhalten die Bewegungsgleichung d dt ẋ1 ẋ2 ẋ3 = ε1 + ω ẋ2 −ω ẋ1 ε2 ε≡ , ε1 0 ε3 ≡ q E , m ω= qB m . Die Bewegung in ê3 -Richtung ist nun im Allgemeinen gleichmäßig beschleunigt: x3 (t) = x3 (0) + ẋ3 (0)t + 21 ε3 t2 . Für die Bewegung in ê1 -Richtung erhalten wir zunächst ... x 1 = ω ẍ2 = −ω 2 ẋ1 und daher ẍ1 (0) sin(ωt) h εω i 1 = ẋ1 (0) cos(ωt) + + ẋ2 (0) sin(ωt) ω ẋ1 (t) = ẋ1 (0) cos(ωt) + (4.7) und somit x1 (t) = x1 (0) + i ẋ1 (0) 1 h ε1 sin(ωt) + + ẋ2 (0) [1 − cos(ωt)] ω ω ω . Die Bewegung in ê2 -Richtung folgt aus ẍ2 (t) = −ω ẋ1 = −ω ẋ1 (0) cos(ωt) − ω als ẋ2 = ẋ2 (0) − ẋ1 (0) sin(ωt) − hε 1 ω hε 1 ω i + ẋ2 (0) sin(ωt) i (4.8) + ẋ2 (0) [1 − cos(ωt)] und somit x2 (t) = x2 (0) + ẋ2 (0)t − hε i sin(ωt) ẋ1 (0) 1 [1 − cos(ωt)] − + ẋ2 (0) t − ω ω ω . Für den Spezialfall B × E = 0 kann ê2 wie in (4.5) gewählt werden, und es folgt sofort (4.6). Hiermit ist nun auch die allgemeine Dynamik in konstanten 65 -------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME E- und B-Feldern vollständig bekannt. Interessant an der allgemeinen Lösung (4.7) und (4.8) für die Geschwindigkeiten ẋ1 und ẋ2 ist, dass eine Zeitmittelung zeigt, dass die Bewegung gleichförmig in ê2 -Richtung erfolgt, während die Geschwindigkeitskomponente in ê1 -Richtung nach der Zeitmittelung Null ist: ẋ1 = 0 , ẋ2 = − ε1 E1 =− ω B . Dieses Ergebnis ist bemerkenswert, weil das elektrische Feld gerade eine Komponente in ê1 -Richtung aber keine Komponente in ê2 -Richtung hat. 66 Kapitel 5 Spezielle Relativitätstheorie Die Struktur der speziellen Relativitätstheorie ist derjenigen der nicht-relativistischen Klassischen Mechanik sehr ähnlich: In beiden Fällen beschreibt man die Dynamik von Körpern mit Hilfe einer (nicht-gekrümmten) vierdimensionalen Raum-Zeit. In beiden Fällen ist es sehr hilfreich, sich bei der Beschreibung dieser Dynamik zunächst auf Punkt teilchen zu konzentrieren. In beiden Fällen gilt das Relativitätsprinzip, das die Existenz von Inertialsystemen postuliert. Genau wie in der nicht-relativistischen Mechanik sind Inertialsysteme auch in der Relativitätstheorie durch die zwei Eigenschaften charakterisiert, dass alle physikalischen Gesetze in allen Inertialsystemen zu jedem Zeitpunkt gleich sind und dass alle Koordinatensysteme, die sich relativ zu einem Inertialsystem in geradlinig-gleichförmiger Bewegung befinden, selbst ebenfalls Inertialsysteme sind. Die Äquivalenz aller Inertialsysteme impliziert insbesondere auch die Homogenität und die Isotropie des Raums und der Zeit. Schließlich gilt sowohl für die Relativitätstheorie als auch für die nicht-relativistische Klassische Mechanik das deterministische Prinzip, das besagt, dass die auf ein Teilchen einwirkenden Kräfte nur vom Ortsvektor und von der Geschwindigkeit dieses Teilchens sowie von der Zeit abhängig sein können. Neben diesen Gemeinsamkeiten, von denen das Relativitätspostulat besonders wichtig ist, gibt es zwischen der relativistischen (R) und der nicht-relativistischen (NR) Mechanik auch einen wesentlichen Unterschied, der durch ein zweites Postulat zum Ausdruck gebracht wird: (R): Die Lichtgeschwindigkeit im Vakuum hat in allen Inertialsystemen denselben Wert c = 2, 997925 · 108 m/s. (NR): Die Lichtgeschwindigkeit ist effektiv unendlich groß im Vergleich zu allen anderen in der Theorie auftretenden Geschwindigkeiten. Das zweite Postulat bedeutet physikalisch, dass die Wechselwirkung zwischen Teilchen (z. B. durch Austausch von Strahlungsenergie oder Einwirkung von elektromagnetischen Kräften) in der nicht-relativistischen Theorie instantan erfolgt, während die Ausbreitungsgeschwindigkeit c der Wechselwirkung in der relativistischen Theorie eine endliche universelle Konstante (gültig in jedem Inertialsystem) ist. Das zweite Postulat der NR-Mechanik kann bekanntlich auch in der folgenden Weise formuliert werden: ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE (NR): Die Länge eines Zeitintervalls und der Abstand zweier gleichzeitiger Ereignisse sind in der nicht-relativistischen klassischen Mechanik absolute (d. h. beobachterunabhängige) Größen. Mathematisch bedeutet das zweite Postulat, dass die Newton’sche nicht-relativistische Mechanik kovariant unter Galilei-Transformationen und die Einstein’sche relativistische Mechanik kovariant unter Lorentz-Transformationen ist. Das relativistische Pendant der absoluten Größen „Zeit“ und „Abstand“ in der Newton’schen Mechanik ist der beobachterunabhängige „infinitesimale Abstand “ ds = [c2 (dt)2 − (dx)2 ]1/2 infinitesimal benachbarter Ereignisse, der somit eine der zentralen Größen der Relativitätstheorie darstellt. Eine Bemerkung noch zum Anwendungsbereich der speziellen Relativitätstheorie: Die nicht-relativistische Klassische Mechanik beschreibt die Dynamik physikalischer Objekte unter der Einwirkung von Kräften, die mikroskopisch auf Gravitationswechselwirkung oder elektromagnetische Wechselwirkung zurückgeführt werden können. Da die spezielle Relativitätstheorie Gravitationskräfte bekanntlich nicht beschreiben kann (hierfür benötigt man die allgemeine Relativitätstheorie), bleiben als ihr Anwendungsbereich nur elektromagnetische Kräfte übrig. Im Rahmen der speziellen Relativitätstheorie beschreibt man also typischerweise die Dynamik elektromagnetischer Felder bei vorgegebenen Ladungen und Strömen oder die Dynamik von Ladungen und Strömen bei vorgegebenen elektromagnetischen Feldern. Die zentralen Gleichungen der speziellen Relativitätstheorie sind daher die Maxwell-Gleichungen und die Lorentz’sche Bewegungsgleichung. Da diese beiden Pfeiler der Elektrodynamik Teilsysteme beschreiben und das Relativitätsprinzip für Teilsysteme - wie wir wissen - nur dann Sinn macht, wenn zusätzlich angegeben wird, wie die „Außenwelt“ mittransformiert wird, ist klar, dass die Bestimmung des Transformationsverhaltens von Ladungen, Strömen und Feldern unter Lorentz-Transformationen im Folgenden von großer Bedeutung sein wird. Etliche Ergebnisse der speziellen Relativitätstheorie waren bereits vor Einsteins Arbeit (1905) bekannt. Erwähnt seien insbesondere die Lorentz-Transformation in linearer (Lorentz, 1895) und in beliebiger Ordnung (Larmor, 1898; Lorentz 1899; Poincaré, 1905), die Lorentz- (oder Fitzgerald-Lorentz-)Kontraktion (Fitzgerald, 1889; Lorentz, 1892), die Lorentz-Kraft (Lorentz, 1895), die Gruppenstruktur der Lorentz-Transformationen, das Relativitätsprinzip, die Invarianz der Eigenzeit und das Additionsgesetz für Geschwindigkeiten (Poincaré, 1905). Das Großartige von Einsteins Beitrag (1905) ist die Reduktion der Theorie auf zwei Postulate und die Herleitung von alten und auch neuen Ergebnissen aus diesen Postulaten.1 Interessant ist noch, dass neben Lorentz’ Arbeit (1895) das Fizeau’sche Experiment (1851) und die Aberration von Sternenlicht (Bradley, 1729) Einsteins Denken beeinflusst haben, das oft zitierte MichelsonMorley-Experiment jedoch kaum. Für mehr Details sei auf die ausgezeichnete Einstein-Biografie „Subtle is the Lord“ von Abraham Pais (Oxford University Press, 1982) verwiesen. 1 Neu sind z. B. der transversale Doppler-Effekt , die Fresnel-Formel c′ = und das sogenannte „Zwillingsparadoxon“. c n +v 1− 1 n2 68 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE 5.1 Erste Konsequenzen der Postulate Eine sofortige Konsequenz aus den Postulaten der speziellen Relativitätstheorie ist, dass die Zeit (anders als in der Newton’schen Mechanik) keine absolute Größe ist. Betrachten wir nämlich zwei Bezugssysteme K ′ und K, wobei K ′ die Geschwindigkeit vrel (K ′ , K) = v relativ zu K hat, und nehmen wir an, dass in K ′ entlang der x′ · v̂-Achse ein Sender S und (in gleichem Abstand von S) zwei Empfänger E1 und E2 ruhen (siehe Abbildung 5.1). Zur Zeit t = 0 sendet S zwei Lichtsignale aus, eins zu E1 und eins zu E2 . Beide Empfänger werden ihre Signale (wegen der Isotropie des Raums) in K ′ gleichzeitig erhalten. Für einen Beobachter in K jedoch wird der Empfänger E1 sein Signal zuerst erhalten, da E1 sich auf das Licht, das sich auch in K mit der Geschwindigkeit c ausbreitet, zubewegt. Ereignisse, die also gleichzeitig sind in K ′ , müssen nicht gleichzeitig sein in K, und Zeitintervalle, die gleich sind in K ′ , sind im Allgemeinen ungleich in K. S E1 K E2 0 x v ^ v 0 K xv ^ Abbildung 5.1: Gleichzeitigkeit von Ereignissen in zwei Inertialsystemen Betrachten wir das Transformationsverhalten von Längen im Ortsraum und von Zeitintervallen etwas genauer. Abstände senkrecht zur Geschwindigkeitsrichtung werden in beiden Systemen K und K ′ als gleich groß empfunden. Nehmen wir z. B. an, im Ursprung 0 von K und im Ursprung 0′ von K ′ stehen zwei parallel zueinander (und senkrecht zur x · v̂-Achse) ausgerichteten Latten, beide mit einer Länge ℓ in ihrem Ruhesystem und beide mit einer Kreissäge an ihrem oberen Ende (siehe Abbildung 6.2). Wir nehmen des Weiteren an, dass 0 und 0′ für t = t′ = 0 zusammenfallen. Nun kann L′ aus der Sicht eines Beobachters im System K nicht kürzer als L selbst sein, da sonst (im Widerspruch zum Relativitätsprinzip) L durchgesägt wird und L′ unversehrt bleibt. Umgekehrt kann L′ aus der Sicht des Beobachters in K auch nicht länger sein. Also sind beide (aus der Sicht von Beobachtern in K oder K ′ ) gleich lang. L 0 K 0 K 00 L 0 Abbildung 5.2: Invarianz einer Länge senkrecht zur Geschwindigkeitsrichtung Befestigen wir nun statt der Kreissäge jeweils zwei Spiegel an den beiden 69 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE Latten, einen am oberen und einen am unteren Ende, und senden wir einen Lichtstrahl hin und her zwischen beiden Spiegeln (siehe Abbildung 6.3). Wir haben in dieser Weise zwei identische Uhren konstruiert, die in ihrem jeweiligen Ruhesystem durch die Periode T = 2ℓ/c charakterisiert werden. Berechnen wir nun die Periode T ′ der bewegten Uhr in K ′ aus der Sicht eines Beobachters in K. In einer Periode legt der Lichtstrahl in der an L′ befestigten Uhr – wie inqAbbildung 6.4 dargestellt – aus der Sicht des Beobachters in K einen Weg 2 2 ℓ2 + 12 vT ′ zurück. Da das Licht in K aufgrund des zweiten Postulats die Geschwindigkeit c hat, muss T′ = 2 c É ℓ2 + 1 ′ 2 vT 2 d. h. T ≡ γT 1 − β2 2ℓ/c T′ = q 1− 2 = p v c gelten. Aus der Sicht des Beobachters in K dauert die Periode einer bewegten Uhr also länger als diejenige einer identischen Uhr in K, laufen bewegte Uhren demnach generell langsamer. Diese Konsequenz der Postulate der Relativitätstheorie wird als Zeitdilatation bezeichnet. L 0 K 0 00 L K 0 Abbildung 5.3: Zwei identische Uhren in den Inertialsystemen K und K ′ x? ` 0 0 1 0 vT 2 vT 0 xk Abbildung 5.4: Berechnung der Periode einer sich relativ zum Beobachter mit der Geschwindigkeit v bewegenden Uhr Kippen wir nun die Uhr in K ′ , so dass die Latte L′ in Geschwindigkeitsrichtung zeigt (siehe Abbildung 6.5). Die Länge und die Periode der Uhr in K ′ sind 70 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE nach wie vor ℓ bzw. T , und die Periode aus der Sicht eines Beobachters in K ist T ′ . Bestimmen wir nun die Länge ℓ′ der bewegten Uhr in K ′ aus der Sicht des Beobachters in K. Diese Uhr bewegt sich (aus der Sicht von K) mit einer Geschwindigkeit v nach rechts. Nehmen wir an, dass ein Lichtstrahl eine Zeit t′LR bzw. t′RL benötigt, um sich von links nach rechts oder rechts nach links zu bewegen. Aus der Sicht von K gilt: t′LR = ℓ′ + vt′LR c , t′LR = ℓ′ /c 1−β t′RL = t′RL = ℓ′ − vt′RL c d. h. und daher , γT = T ′ = t′LR + t′RL = Es folgt also: ℓ′ = ℓ′ /c 1+β ℓ′ c 1 1 + 1−β 1+β = 2ℓ′ /c 2γ 2 ℓ′ = . 1 − β2 c ℓ Tc = , 2γ γ so dass die Länge eines bewegten Körpers in der Geschwindigkeitsrichtung verkürzt ist (im Vergleich zur Ruhelänge). Diese Konsequenz der Relativitätstheorie wird Lorentz- (oder Fitzgerald-Lorentz-)Kontraktion genannt. L 0 K 0 v K Abbildung 5.5: Zur Lorentz- bzw. Längenkontraktion 5.2 Der Abstand und die Eigenzeit In der Einführung wurde bereits darauf hingewiesen, dass die nicht-relativistischen absoluten Größen „Zeit“ und „Abstand“ in der Relativitätstheorie durch den beobachterunabhängigen „infinitesimalen Abstand“ ersetzt werden. Der infinitesimale Abstand ist in der Relativitätstheorie von zentraler Bedeutung, da seine Invarianz unter Koordinatentransformationen zwischen Inertialsystemen zeigt, dass die physikalischen Gesetze Lorentz-kovariant sind. Im Folgenden führen wir die Begriffe „Abstand“ und „Eigenzeit“ ein und leiten ein Theorem (Einstein, 1905) über die Eigenzeit bewegter Bezugssysteme ab. Betrachten wir die Emission eines Lichtsignals am Ort x1 zur Zeit t1 im Bezugssystem K und seine Absorption am Ort x2 zur späteren Zeit t2 , ebenfalls in K. Da das Signal sich in K gemäß dem zweiten Postulat mit der Geschwindigkeit c ausbreitet, gilt offensichtlich c2 (t2 − t1 )2 − (x2 − x1 )2 = 0 . 71 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE Seien die entsprechenden Koordinaten im Inertialsystem K ′ mit vrel (K ′ , K) = v durch (x′1 , t′1 ) und (x′2 , t′2 ) gegeben, dann gilt analog: c2 (t′2 − t′1 )2 − (x′2 − x′1 )2 = 0 , da das Lichtsignal in K ′ nach dem zweiten Postulat ebenfalls die Geschwindigkeit c hat. Die Größe 1 s ≡ [c2 (t2 − t1 )2 − (x2 − x1 )2 ] 2 wird als Abstand zwischen den Ereignissen bei (x1 , t1 ) und (x2 , t2 ) bezeichnet. Das obige Argument zeigt, dass die Aussage s = 0 in allen Inertialsystemen gilt, falls sie in irgendeinem Inertialsystem zutrifft. Der Abstand infinitesimal benachbarter Ereignisse (x, t) und (x + dx, t + dt) in K ist durch ds = È (5.1) c2 (dt)2 − (dx)2 gegeben. Analog gilt in einem beliebigen Inertialsystem K ′ für den Abstand È ′ infinitesimal benachbarter Ereignisse: ds = c2 (dt′ )2 − (dx′ )2 , und wiederum impliziert ds = 0 in K die Identität ds′ = 0 für alle K ′ . Das negative Vorzeichen von (dx)2 in (5.1) zeigt, dass der Abstand hier nicht gemäß der euklidischen, sondern nach einer (von Hermann Minkowski eingeführten) pseudoeuklidischen Geometrie definiert wird. Der Abstand infinitesimal benachbarter Ereignisse ds wird alternativ auch als Linienelement oder als differentielles (Raum-Zeit-) Intervall bezeichnet. Es ist übrigens zu beachten, dass die infinitesimale Größe ds kein H exaktes Differential darstellt, so dass die Auswertung von Integralen der Form ds entlang einer geschlossenen Schleife im Allgemeinen nicht Null ergibt. Die Invarianz der Aussage ds = 0 unter Koordinatentransformationen, d. h. die Äquivalenz der Aussagen ds = 0 im Inertialsystem K und ds′ = 0 in K ′ , hat weitreichende Konsequenzen. Um dies zu sehen, versuchen wir, diese Gleichunu gen geometrisch zu interpretieren. Mit den Notationen dx dt ≡ u und c ≡ β u gilt in K: u2 ) = c2 (dt)2 (1 − β 2u ) . c2 Die geometrische Interpretation von ds = 0 in K ist daher, dass der dimensionslose Geschwindigkeitsvektor βu auf einer Kugel mit Radius 1 und Mittelpunkt 0 liegt, so dass |u| = c gilt. Da die Gleichung ds = 0 die Ausbreitung von Lichtsignalen beschreibt, kann dieses Ergebnis nicht erstaunen. Wir betrachten nun die Interpretation von ds′ = 0 in K ′ : Hierzu nehmen wir an, dass die Orts- und Zeitkoordinaten (x′ , t′ ) in K ′ gemäß x′ = x′ (x, t; v) und t′ = t′ (x, t; v) mit den Koordinaten (x, t) in K verknüpft sind. In diesem Fall gilt die lineare Beziehung 0 = (ds)2 = c2 (dt)2 − (dx)2 = c2 (dt)2 (1 − c dt′ c dt =Λ dx′ dx , Λ(x, t; v) ≡ ∂t′ ∂t 1 ∂x′ c ∂t c ∂t′ ∂x T ∂x′ ∂x , wobei die Matrix Λ offensichtlich reell ist.2 Die Gleichung 0 = (ds′ )2 = c2 (dt′ )2 − (dx′ )2 2 Die Transformationsmatrix Λ, die (c dt, dx) in K mit (c dt′ , dx′ ) in K ′ verknüpft, wird als Lorentz-Transformation bezeichnet. Wir werden später sehen, dass Λ(x, t; v) zwar explizit von v abhängt, aber unabhängig von (x, t) ist. 72 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE in K ′ kann daher in der Form c dt′ 0= dx′ T 1 0 mit ∼ 0T −11 B(x, t; v) ≡ Λ 1 0 c dt′ c dt = dx′ dx T c dt 1 B = c2 (dt)2 dx βu T 1 B βu 0T Λ −11 (5.2) geschrieben werden, wobei die Matrix B reell und symmetrisch ist. Diese Gleichung für β u in K ′ stellt nur dann eine Kugel mit Radius 1 und Mittelpunkt 0 dar, wenn die Matrix B die Form 1 1 ε 0 B= 0T −11 , (5.3) ε = ε(x, t; v) hat, wobei ε reellwertig (mit ε 6= 0) ist. Es folgt: (ds′ )2 = 1 2 1 c (dt)2 (1 − β 2u ) = (ds)2 ε ε und daher: ds ds′ 2 = ε(x, t; v) . Hierbei kann ε jedoch wegen der Homogenität des Raums und der Zeit nicht von (x, t) oder (x′ , t′ ) und wegen der Isotropie des Raums nicht von v̂ abhängen. Somit ist nur eine Abhängigkeit vom Geschwindigkeitsbetrag v möglich: (ds)2 = ε(v)(ds′ )2 . Betrachten wir nun umgekehrt eine Koordinatentransformation vom Inertialsystem K ′ zum Inertialsystem K, so dass vrel (K, K ′ ) = −v gilt, dann erhält man analog (ds′ )2 = ε(v)(ds)2 . Kombination der beiden Transformationen liefert (ds)2 = ε(v)(ds′ )2 = [ε(v)]2 (ds)2 bzw. [ε(v)]2 = 1 . Wegen ε(0) = 1 und der Kontinuität von ε(v) als Funktion der Relativgeschwindigkeit v kommt nur die Wurzel ε(v) = ε(0) = 1 in Betracht. Wir erhalten somit: (ds)2 = (ds′ )2 (5.4) und nach einer Integration auch: s = s′ . Der Abstand ist also invariant unter Koordinatentransformation von einem Inertialsystem in ein anderes: (s21 )2 = c2 (t21 )2 − (x21 )2 = c2 (t′21 )2 − (x′21 )2 = (s′21 )2 , (5.5) wobei t21 ≡ t2 − t1 definiert wurde, usw. Durch Einsetzen des Ergebnisses ε = 1 in (5.2) und (5.3) können wir außerdem schließen, dass die LorentzTransformation Λ die Matrixgleichung 1 0 ∼ 1 0T =Λ −11 0 0T Λ −11 (5.6) 73 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE erfüllen muss. Diese Konsistenzgleichung schränkt die mögliche Form der Transformationsmatrix Λ stark ein. Aus (5.5) wird klar, dass man nur dann zu zwei Ereignissen im System K ein anderes Bezugssystem K ′ finden kann, in dem diese Ereignisse am selben Ort auftreten (x′21 = 0), wenn (s21 )2 = c2 (t′21 )2 > 0 ist. Man bezeichnet reelle Abstände, (s21 )2 > 0, als zeit artig. Analog kann man nur dann zu zwei Ereignissen in K ein Bezugssystem K ′ finden, in dem diese Ereignisse gleichzeitig auftreten (t′21 = 0), falls (s21 )2 = −(x′21 )2 < 0 gilt. Imaginäre Abstände, (s21 )2 < 0, heißen raumartig. Nullabstände, (s21 )2 = 0, werden als licht artig bezeichnet. Diese Einteilung ist invariant unter Koordinatentransformationen und daher absolut. Sie wird häufig mit Hilfe eines einfachen „Weltbilds“ (oder auch „Minkowski-Diagramm“) dargestellt. Neben dem Lichtkegel (s21 )2 = 0, der lichtartige Abstände zwischen Ereignissen repräsentiert, unterscheidet man die absolute Zukunft, (s21 )2 > 0 mit t21 > 0, die absolute Vergangenheit, (s21 )2 > 0 mit t21 < 0, und das absolut Entfernte, (s21 )2 < 0. Eine kausale Beziehung zwischen zwei Ereignissen ist nur dann möglich, wenn ihr Abstand zeit- oder eventuell lichtartig ist, d. h. wenn (s21 )2 ≥ 0 gilt. t21 Zukunft entfernt entfernt x21 Vergangenheit Abbildung 5.6: Weltbild mit Lichtkegel Mit dem invarianten infinitesimalen Abstand ds ist offensichtlich eine invariante infinitesimale Zeit dτ verknüpft: Ê ds dτ ≡ = c 1 1− 2 c dx dt r 2 dt = 1− u 2 c dt = È 1 − βu2 dt = dt . (5.7) γu Diese Gleichung besagt, dass in einem bewegten Bezugssystem (z. B. für ein Teilchen), das sich mit der Geschwindigkeit u(t) relativ zum Inertialsystem K 74 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE bewegt, die Zeit dτ = γdtu vergeht, wenn die unbewegte Uhr in K die Zeitdauer dt anzeigt. Nur wenn das bewegte Bezugssystem und das Inertialsystem K identisch sind, so dass ihre Relativgeschwindigkeit verschwindet: u(t) = 0, gilt dτ = dt; aus diesem Grund wird τ als die „Eigenzeit“ des bewegten Bezugssystems bezeichnet. Integration von (5.7) liefert: Zt2 τ2 − τ1 = dt Zt2 È 1 − βu (t)2 = t1 dt t1 1 . γu (t) (5.8) Man sieht wiederum, dass bewegte Uhren langsamer laufen als ruhende. Wenn also zwei Uhren U1 und U2 anfangs im Inertialsystem K zusammen sind, U1 auch weiterhin in K verbleibt und U2 sich entlang einer geschlossenen Schleife bewegt, so dass beide Uhren schließlich wieder zusammen sind, dann ist U2 aufgrund von (5.7) und (5.8) im Vergleich zu U1 zurückgeblieben. Dieses Resultat geht auf Einstein (1905) zurück, der es als „Theorem“ bezeichnete. Die Fehlbezeichnung Uhren- oder Zwillingsparadoxon ist jüngeren Datums (Langevin, 1911). 5.3 4-Schreibweise und Lorentz-Transformationen Aufgrund der fundamentalen Bedeutung des invarianten Abstands infinitesimal benachbarter Ereignisse: d(ct) (ds) = c (dt) − (dx) = dx 2 2 2 T 2 1 0 0T −11 d(ct) d(ct) d(ct) = · dx d(−x) dx ist klar, dass es vorteilhaft ist, einen kontravarianten 4-Vektor xµ ≡ (ct, x) (µ = 0, 1, 2, 3) , den metrischen Tensor gµν = g µν ≡ 1 0 0T −11 und den mit xµ assoziierten kovarianten 4-Vektor xµ ≡ gµν xν = (ct, −x) einzuführen.3 Generell kann man den metrischen Tensor dazu verwenden, Indizes herunter- oder heraufzuziehen. Es gilt z. B.: gµν g νρ = gµρ ≡ δµρ , g µν gνρ = g µρ = δ µρ , wobei δµρ oder δ µρ das übliche Kronecker-δ bezeichnet. Hierbei wird implizit über zweimal (einmal unten und einmal oben) auftretende Indizes summiert (Einstein-Konvention). Wir führen die ko- bzw. kontravarianten Ableitungen 3 Hierbei sollte man den Namen „kontravariant“ und „kovariant“ nicht zu viel Gewicht beimessen: In seiner „Theory of Relativity“ plädiert Pauli dafür, diese Bezeichnungen zu vertauschen, bzw. sie durch die älteren Namen „kogredient“ und „kontragredient“ zu ersetzen. Wie man sieht: That which we call a rose by any other name would smell as sweet. 75 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE nach den Raum-Zeit-Koordinaten wie folgt ein: ∂µ ≡ ∂ ∂xµ ; ∂ µ = g µν ∂ν = ∂ . ∂xµ Der d’Alembert-Operator kann dementsprechend als Skalarprodukt ∂µ ∂ µ geschrieben werden: = 1 ∂2 − ∆ = g µν ∂µ ∂ν = ∂µ ∂ µ . c2 ∂t2 Das Quadrat der infinitesimalen Eigenzeit bzw. des Raum-Zeit-Intervalls ds ist ebenfalls als Skalarprodukt darstellbar: c2 (dτ )2 = (ds)2 = c2 (dt)2 − (dx)2 = gµν dxµ dxν = dxµ dxµ . Die linearen Transformationen des 4-Vektors xµ , die die Eigenzeit dτ invariant lassen, werden als Poincaré-Transformationen oder als inhomogene LorentzTransformationen bezeichnet: xµ → (x′ )µ = Λµν xν + aµ . (5.9) Hierbei gilt ΛT gΛ = g, denn die Invarianz der Eigenzeit erfordert: c2 (dτ )2 = gµν dxµ dxν = gµν d(x′ )µ d(x′ )ν = gµν Λµρ Λν σ dxρ dxσ d. h. gρσ = (ΛT )ρ µ gµν Λν σ oder kurz: g = ΛT gΛ . Die Inverse der Lorentz-Transformation folgt als Λ−1 = gΛT g, oder explizit: (Λ−1 )µν = (gΛT g)µν = g µρ (ΛT )ρσ g σν = (ΛT )µν = Λν µ . Hierbei ist zu beachten, dass die transponierte Lorentz-Transformation (ΛT )µν ≡ Λν µ = gνρ g µσ Λρ σ nicht (wie im Falle einer dreidimensionalen Drehung) der gespiegelten Matrix (Λ̃)µν ≡ Λν µ entspricht; die gemischt räumlich-zeitlichen Matrixelemente erhalten ein zusätzliches Minuszeichen. Aufgrund der Identität ∼ gµν = (ΛT gΛ)µν = (ΛT )µρ gρσ Λσν = Λρµ gρσ Λσν = (Λ)µρ gρσ Λσν ist klar, dass die Bestimmungsgleichung g = ΛT gΛ für Lorentz-Transformationen in 4-Schreibweise genau dem Resultat (5.6) in konventioneller Matrixnotation entspricht. Wir haben bisher zwar gezeigt, dass das Skalarprodukt (5.1) invariant ist unter linearen Transformationen, die dann unbedingt die Form einer PoincaréTransformation haben müssen, aber man kann umgekehrt auch leicht zeigen, dass nicht-lineare Transformationen das Skalarprodukt nicht invariant lassen. Hierzu gibt es ein physikalisches und ein mathematisches Argument. Das physikalische Argument ist, dass eine nicht-lineare Transformation eine geradliniggleichförmige Bewegung in einem Inertialsystem in eine nicht-geradlinige oder nicht-gleichförmige Bewegung in einem anderen Koordinatensystem transformiert, das daher kein Inertialsystem sein kann. Das mathematische Argument basiert auf der Invarianz der Eigenzeit, gµν dxµ dxν = c2 (dτ )2 = c2 (dτ ′ )2 = = gαβ dx′α dx′β gαβ ∂µ (x′α )∂ν (x′β )dxµ dxν . 76 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE Da diese Gleichung für alle dxµ gelten soll, gilt die Identität gµν = gαβ ∂µ (x′α )∂ν (x′β ) , die Gleichung (5.6) in 4-Schreibweise darstellt, und daher, nach der Differentiation bezüglich xγ : 0 = ≡ gαβ [∂γ ∂µ (x′α )∂ν (x′β ) + ∂µ (x′α )∂γ ∂ν (x′β )] gαβ Γαβ γµν . 0 = αβ αβ gαβ (Γαβ γµν + Γµγν − Γνµγ ) Folglich ist auch: = = gαβ [2∂γ ∂µ (x′α )∂ν (x′β ) + ∂µ (x′α )∂γ ∂ν (x′β ) + ∂γ (x′α )∂µ ∂ν (x′β ) −∂ν ∂µ (x′α )∂γ (x′β ) − ∂µ (x′α )∂ν ∂γ (x′β )] 2gαβ ∂γ ∂µ (x′α )∂ν (x′β ) . Da die Matrizen gαβ und ∂ν (x′β ) beide nicht-singulär sind, folgt sofort ∂γ ∂µ (x′α ) = 0 , so dass x′α notwendigerweise eine lineare Funktion der Koordinaten xµ ist, d. h.: x′α = Λαµ xµ +aµ . Einsetzen in (5.4) ergibt die Relation ΛT gΛ = g in (5.9). Hiermit ist auch bewiesen, dass die Matrix Λ in (5.6) tatsächlich (x, t)-unabhängig ist, wie angekündigt. 5.3.1 Poincaré- und Lorentz-Transformationen Poincaré-Transformationen bestehen - wie gesagt - aus einem homogenen Anteil, der als Lorentz-Transformation Λ bezeichnet wird, und einem inhomogenen Anteil (d.h. einer Translation). Die Gesamtheit aller Lorentz-Transformationen Λ|ΛT gΛ = g bildet eine Gruppe, die Lorentz-Gruppe L. Die Gruppenstruktur der Lorentz-Gruppe folgt direkt aus der Relation ΛT gΛ = g, denn wenn Λ1 und Λ2 zur Lorentz-Gruppe gehören, gilt dasselbe für das Produkt Λ1 Λ2 : T T T T (ΛT 2 Λ1 )g(Λ1 Λ2 ) = Λ2 (Λ1 gΛ1 )Λ2 = Λ2 gΛ2 = g . 2 Außerdem folgt aus ΛT gΛ = g, dass [det(Λ)] = 1 und daher det(Λ) = ±1 gilt. Innerhalb der Lorentz-Gruppe L ist die eigentliche orthochrone LorentzGruppe L↑+ , deren Elemente die Bedingungen Λ00 ≥ 1 und det(Λ) = 1 erfüllen, am wichtigsten. Zu dieser Untergruppe L↑+ von L gehören die gewöhnlichen Drehungen ΛR (α) um eine feste Achse α̂: ΛR (α) = 1 0 0T R(α) mit R(α)x = α̂(α̂ · x) − α̂ × (α̂ × x) cos(α) + (α̂ × x) sin(α) und die Geschwindigkeitstransformationen ΛB (φ, β̂) im Orts-Zeit-Raum, die auch als „boosts“, bezeichnet werden: ΛB (φ, β̂) = 11 + [cosh(φ) − 1] − sinh(φ)β̂ − sinh(φ)β̂ ! T [cosh(φ) − 1]β̂β̂ T . (5.10) 77 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE Hierbei hängen der Einheitsvektor β̂ und der Parameter φ über die Beziehung v = c tanh(φ)β̂ mit der Relativgeschwindigkeit v der Bezugssysteme zusammen. T Das Produkt β̂ β̂ ist als Dyade aufzufassen. Im Falle der Geschwindigkeitstransformation lautet die Beziehung zwischen x′ und x also explizit: ct′ = x′ −1/2 Mit der Relation cosh(φ) = 1 − tanh2 (φ) ′ ct x′ = cosh(φ)ct − sinh(φ)(x · β̂) − sinh(φ)ctβ̂ + [x − (x · β̂)β̂] + cosh(φ)(x · β̂)β̂ ct − βxk 0 +γ x⊥ (xk − vt)β̂ = 1 − β2 −1/2 . = γ folgt: wobei xk ≡ x · β̂ die Projektion von x auf die β̂-Richtung und x⊥ ≡ x − xk β̂ den senkrechten Anteil darstellt. Bei fester Geschwindigkeit v erhält man im Limes c → ∞ offensichtlich die Galilei-Transformation zurück: t′ = t , x′ = x − vt. Die Untergruppe L↑+ der Lorentz-Gruppe ist eine kontinuierliche Gruppe (Lie-Gruppe) und hat dann auch die entsprechende Struktur: Aufgrund der expliziten Darstellung von Drehungen und Boosts, s. Gleichung (5.10), zeigt man leicht, dass mehrmalige Anwendung kleiner Drehungen eine große Drehung ergibt: h ΛR (α) = ΛR α in , n ΛB (φ, β̂) = ΛB φ , β̂ n n (n ∈ N) . (5.11) Da der Definitionsbereich von φ = artanh(v/c) unbegrenzt ist, ist die LorentzGruppe nicht kompakt. Außerdem folgt aus (5.10) und (5.11), dass man allgemeine eigentliche, orthochrone Lorentz-Transformationen als Λ = e−iα·L−φ·M , φ ≡ φβ̂ , Lk = 0 0 0T ℓk , Mk = êTk ∅3 0 êk (5.12) darstellen kann, wobei ∅3 die 3 × 3-Nullmatrix ist und ℓ = (ℓ1 , ℓ2 , ℓ3 ) die Drehmatrizen sind: ℓ1 = 0 0 0 0 0 0 −i i 0 , ℓ2 = 0 0 0 0 −i 0 i 0 0 , ℓ3 = 0 i 0 −i 0 0 0 0 0 . Die Erzeuger L und M der Lie-Gruppe L↑+ erfüllen die Vertauschungsrelationen [Li , Lj ] = iεijk Lk , [Mi , Mj ] = iεijk Lk , [Li , Mj ] = iεijk Mk . Aus der Darstellung (5.12) folgt sofort Λ† 6= Λ−1 , so dass die (nicht-kompakte!) Lie-Gruppe L↑+ offensichtlich nicht-unitär ist. 5.4 Physikalische Konsequenzen der Lorentz-Invarianz Wir haben oben festgestellt, dass das zweite Einstein’sche Postulat (in Kombination mit weiteren Annahmen über die Homogenität und Isotropie von Raum und Zeit) die Lorentz-Invarianz des Skalarprodukts c2 (dτ )2 = (ds)2 = c2 (dt)2 − (dx)2 = dxµ dxµ (5.13) 78 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE bedingt. Umgekehrt impliziert die Invarianz dieses Skalarprodukts das zweite Postulat, also kann (5.13) als die zentrale Gleichung der Relativitätstheorie angesehen werden. Die Invarianz von (5.13) unter Lorentz-Transformationen bedeutet, dass alle physikalisch messbaren Größen entweder gemäß der LorentzGruppe oder zumindest einer geeigneten Darstellung dieser Gruppe transformiert werden. Da Rotationen in der Relativitätstheorie meist unwesentlich sind, konzentrieren wir uns im Folgenden überwiegend auf Geschwindigkeitstransformationen, so dass die Koordinaten zweier Inertialsysteme K und K ′ mit vrel (K ′ , K) = v, deren Ursprünge zur Zeit t = t′ = 0 zusammenfallen, durch ct′ x′ − sinh(φ) cosh(φ)β̂ cosh(φ) 0 + x⊥ − sinh(φ)β̂ = 1 0 +γ x⊥ −β = −β β̂ ct xk ct xk (5.14) verknüpft sind. Da die x⊥ -Komponenten invariant sind unter Lorentz-Transformationen, ist es oft sinnvoll, die zweidimensionale Darstellung ct′ x′k =γ −β 1 1 −β ct xk (5.15) einzuführen. Explizit lautet (5.15): ′ t ′ x k γ(t − cv2 xk ) γ(xk − vt) = = t xk bzw. = = γ(t′ + cv2 x′k ) . γ(x′k + vt′ ) (5.16) Gleichung (5.14) zeigt, dass ein Maßstab, der im Inertialsystem K senkrecht zu β̂ aufgestellt ist und dort die Länge ℓ hat, in K ′ genauso lang ist. Andererseits hat ein Maßstab, parallel zu β̂ in K, aus der Sicht von K ′ eine kleinere Länge: (1) ℓ′ < ℓ. Nehmen wir nämlich an, der Stab befinde sich in Ruhe zwischen xk und (1) (2) (2) xk , so dass xk − xk = ℓ gilt. Eine Messung der Länge des Stabs zur Zeit t′ in K ′ ergibt dann: ′(2) ℓ′ = xk ′(1) − xk = 1 (2) x − vt′ − γ k 1 (1) ℓ xk − vt′ = . γ γ (5.17) Dies ist die bereits bekannte Lorentz-Kontraktion. In der Herleitung geht also entscheidend ein, dass die Koordinaten x′(1) und x′(2) der Endpunkte bei dieser Längenmessung in K ′ gleichzeitig (zur selben Zeit t′ ) bestimmt werden. Aus (5.17) folgt noch, dass das Volumen V eines p beliebigen Körpers, der in K ruht, aus der Sicht von K ′ um einen Faktor γ1 = 1 − β 2 kleiner ist, da es sich bei der Geschwindigkeitstransformation in der β̂-Richtung um diesen Faktor verringert. Auch die Zeitdilatation lässt sich mit Hilfe der Lorentz-Transformation leicht nachweisen. Betrachten wir z. B. eine Uhr, die in K ′ ruht und anzeigt, dass zwischen zwei Ereignissen, die beide am Ort (x′k , x′⊥ ) in K ′ stattfanden, die Zeit ∆t′ = t′2 − t′1 vergangen ist. Für einen Beobachter in K ist zwischen beiden Ereignissen sogar ∆t = t2 − t1 = γ(t′2 + v ′ v x ) − γ(t′1 + 2 x′k ) = γ∆t′ c2 k c 79 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE vergangen, so dass er zum Schluss kommt, dass die Uhr in K ′ nachgeht: Bewegte Uhren laufen langsamer. Lorentz-Transformationen sind im Allgemeinen nicht-kommutativ, und das Gleiche gilt für Geschwindigkeitstransformationen. Man überprüft zum Beispiel leicht, dass ΛB (φ1 , ê1 )ΛB (φ2 , ê2 ) 6= ΛB (φ2 , ê2 )ΛB (φ1 , ê1 ) gilt. Eine Ausnahme sind Boosts in derselben Richtung: ΛB (φ2 , β̂)ΛB (φ1 , β̂) = ΛB (φ1 + φ2 , β̂) , denn Matrixmultiplikation zeigt: cosh(φ2 ) − sinh(φ2 ) − sinh(φ2 ) cosh(φ2 ) cosh(φ1 ) − sinh(φ1 ) − sinh(φ1 ) cosh(φ1 ) = cosh(φ1 +φ2 ) − sinh(φ1 +φ2 ) − sinh(φ1 +φ2 ) cosh(φ1 +φ2 ) . Die entsprechenden Geschwindigkeiten β1 , β2 und β1+2 sind also durch β1+2 = tanh(φ1 + φ2 ) = tanh[artanh(β1 ) + artanh(β2 )] β1 + β 2 = 1 + β 1 β2 (5.18) miteinander verknüpft. Hiermit haben wir das Additionsgesetz für (parallel ausgerichtete) Geschwindigkeiten erhalten. Wir betrachten - etwas allgemeiner und aus einem anderen Blickwinkel zwei Inertialsysteme K und K ′ mit vrel (K ′ , K) = v, deren Koordinaten durch eine Lorentz-Transformation verbunden sind: 1 ct 0 = +γ x x′⊥ β β β̂ ct′ x′k (5.19) . Führen wir noch die Geschwindigkeiten u≡ dx dt dx′ dt′ u′ ≡ , mit den Geschwindigkeitskomponenten uk = u· β̂ und u⊥ = u−uk β̂ und analog für u′ ein. Aus der ersten Zeile in (5.19) folgt: dt =γ dt′ ′ β dxk 1+ c dt′ dt′ 1 , = dt γ 1 + c12 vu′k bzw. und die zweite Zeile impliziert: dx dx′⊥ +γ = u= dt dt′ βc + dx′k β̂ dt′ u′⊥ + γ(v + u′k )β̂ dt′ . = dt γ 1 + c12 vu′k (5.20) Komponentenweise erhält man also: uk = u′k + v 1+ 1 ′ c2 vuk , u⊥ = u′⊥ γ 1+ 1 ′ c2 vuk . (5.21) Die Nichtkommutativität der Lorentz-Transformationen ist auch in (5.20) klar ersichtlich, denn u hängt nicht-symmetrisch von u′ und v ab. 80 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE Aus (5.21) kann auch das Transformationsverhalten von Winkeln bestimmt werden. Nehmen wir an, ein Teilchen bewegt sich in K mit der Geschwindigkeit u, die einen Winkel ϑ mit der β̂-Richtung einschließt: uk = u cos(ϑ) , u⊥ = u sin(ϑ)û⊥ ; analog gilt dann u′k = u′ cos(ϑ′ ) und u′⊥ = u′ sin(ϑ′ )û⊥ . Einsetzen in (5.21) liefert: u cos(ϑ) = u′ cos(ϑ′ ) + v 1 + c12 vu′ cos(ϑ′ ) , u sin(ϑ) = u′ sin(ϑ′ ) γ 1+ 1 ′ c2 vu , cos(ϑ′ ) und daher: tan(ϑ) = u′ sin(ϑ′ ) . γ[u′ cos(ϑ′ ) + v] Falls das „Teilchen“ ein Photon, oder klassisch: ein Lichtstrahl, ist und sich mit der Geschwindigkeit c bewegt, vereinfacht sich diese Formel auf tan(ϑ) = sin(ϑ′ ) . γ[cos(ϑ′ ) + β] (5.22) Diese Richtungsänderung des Lichts beim Übergang auf ein anderes Inertialsystem ist als Aberration bekannt und wurde erstmals 1725 von dem britischen Astronomen James Bradley beobachtet. Bradley entdeckte, dass die Position der Sterne sich ändert aufgrund der Bewegung der Erde in ihrer Umlaufbahn um die Sonne. Für kleine β-Werte erhält man aus (5.22): ϑ − ϑ′ ∼ [tan(ϑ) − tan(ϑ′ )] ∼ tan(ϑ′ ) cos2 (ϑ′ ) 1− β cos(ϑ′ ) −1 , und daher: ∆ϑ ≡ ϑ′ − ϑ ∼ β sin(ϑ′ ) + O(β 2 ) , in Übereinstimmung mit Bradleys Ergebnissen. 5.5 4-Vektoren Jede physikalische Größe aµ = (a0 , a1 , a2 , a3 ), die unter Lorentz-Transformationen genauso transformiert wird wie der 4-Ortsvektor xµ , (a′ )µ = Λµν aν , heisst kontravarianter 4-Vektor, jede Größe aµ , die wie xµ transformiert wird, (a′ )µ = Λµν aν , Λµν = gµρ g νσ Λρσ , ein kovarianter 4-Vektor. Mit Hilfe des metrischen Tensors kann man aus einem kovarianten 4-Vektor immer einen kontravarianten 4-Vektor machen, aµ = g µν aν , und umgekehrt. Das Quadrat eines 4-Vektors ist als a2 ≡ aµ aµ 81 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE definiert; es ist offensichtlich invariant unter Lorentz-Transformationen. Vektoren mit a2 > 0, a2 = 0 oder a2 < 0 werden zeit-, licht- oder raumartig genannt. Eine Größe, die invariant ist unter Lorentz-Transformationen, wird allgemein ein (Lorentz-)Skalar genannt. Auch das Skalarprodukt zweier unterschiedlicher 4-Vektoren, a · b ≡ aµ b µ = aµ b µ ist Lorentz-invariant und daher ein Skalar: (a′ )µ (b′ )µ = gµν (a′ )ν (b′ )µ = Λµσ gµν Λν ρ bσ aρ = (ΛT gΛ)σρ bσ aρ = gσρ bσ aρ = aσ bσ . Falls ϕ(x) ein Skalar ist, dann ist der 4-Gradient ∂ϕ = ∂µ ϕ = ∂xµ 1 ∂ϕ , ∇ϕ c ∂t ein kovarianter 4-Vektor. Dies folgt aus der Form der Poincaré-Transformation: (x′ )µ = Λµν xν + aµ bzw. xµ = (Λ−1 )µν [(x′ )ν − aν ] , die das Transformationsverhalten der Ableitungen: ∂ν′ = ∂xµ ∂µ = (Λ−1 )µν ∂µ = Λν µ ∂µ ∂(x′ )ν impliziert. Analog ist ∂ µ ϕ wegen (∂ ′ )ν = Λν µ ∂ µ ein kontravarianter 4-Vektor. Das Skalarprodukt ∂aµ = ∂µ aµ = ∂ µ aµ ≡ ∂ · a ∂xµ wird als 4-Divergenz bezeichnet; die 4-Divergenz ist also invariant unter LorentzTransformationen. Ein weiterer 4-Vektor ist die 4-Geschwindigkeit uµ eines Teilchens, das sich mit der 3-Geschwindigkeit u(t) im Inertialsystem K bewegt, dxµ u ≡ ds µ r , ds = cdt 1− u 2 c . Es ist zu beachten, dass die so definierte 4-Geschwindigkeit dimensionslos ist,4 da sowohl xµ als auch s die Dimension einer Länge besitzen. Da uµ also als Ableitung von xµ (einem 4-Vektor) nach dem Abstand s des Teilchens (einem Skalar) definiert ist, wird uµ selbst ebenfalls wie ein 4-Vektor transformiert. Die explizite Form von uµ ist: d u (ct, x) 1 uµ = qdt 2 = q 2 1, c ≡ γu (1, β u ) . 1 − uc c 1 − uc 4 Wir übernehmen hiermit die Notation von Landau und Lifschitz, Band II. Auch die Konµ ist üblich. In vielen Büchern sind beide Konventionen sowieso ununtervention uµ = dx dτ scheidbar, da c = 1 gesetzt wird. 82 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE Entweder aus dieser expliziten Form oder direkt aus dxµ dxµ = (ds)2 kann man nun u2 = uµ uµ = 1 folgern. Das Quadrat der 4-Geschwindigkeit ist also auf Eins normiert; ihre Komponenten sind daher nicht unabhängig. µ Analog definiert man die 4-Beschleunigung du ds , die ebenfalls ein 4-Vektor ist und die physikalische Dimension [Länge−1 ] hat. Durch Ableiten von uµ uµ = 1 findet man, dass die 4-Beschleunigung stets senkrecht auf der 4-Geschwindigkeit µ steht: du ds uµ = 0. Wir untersuchen nun das Transformationsverhalten einiger Größen, die in der Elektrodynamik relevant sind. Als erste Größe betrachten wir die elektrische Ladung von Elementarteilchen oder ganzen Körpern. Es ist ein experimentelles Faktum, dass die elektrische Ladung ein Lorentz-Skalar ist. Alles andere würde unserer Alltagserfahrung widersprechen: Obwohl die Ionen und Elektronen in Festkörpern sehr unterschiedliche Geschwindigkeiten haben und diese außerdem temperatur- und materialabhängig sind, sind Alltagsgegenstände - wie wir wissen - elektrisch neutral. Es folgt, dass die Ladungsdichte wie ρ′ = γv ρ0 transformiert wird, wenn ρ0 die Ladungsdichte im Ruhesystem K darstellt und ρ′ die Ladungsdichte in einem Inertialsystem K ′ mit vrel (K ′ , K) = v. Dies folgt sofort daraus, dass die Gesamtladung in einem Volumenelement erhalten ist, ρ0 dV = ρ′ dV ′ , und das Volumenelement gemäß dV ′ = dV γv transformiert wird. Nehmen wir nun an, die Ladungsdichte ruht nicht in K, sondern bewegt sich mit der Geschwindigkeit u in diesem Inertialsystem. Sie befindet sich somit offensichtlich in Ruhe im Inertialsystem K ′ mit vrel (K ′ , K) = u. Die in K 2 gemessene Ladungsdichte ist daher ρ = γu ρ0 mit γu ≡ (1 − uc2 )−1/2 . Neben der Ladungsdichte misst K auch eine Stromdichte j = ρu = γu ρ0 u. Insgesamt verhält j µ ≡ (cρ, j) = ρ0 cγu 1, u = ρ0 cγu (1, βu ) = ρ0 cuµ c sich also wie ein 4-Vektor und wird dementsprechend als 4-Stromdichte bezeichnet. Folglich wird j µ gemäß der Lorentz-Gruppe transformiert. In diesem Argument wurde vorausgesetzt, dass alle an ρ beteiligten Einzelladungen die gleiche Geschwindigkeit u haben. Im allgemeinen Fall, in dem die Ladungsdichte aus Ladungen unterschiedlicher Geschwindigkeit aufgebaut ist, erreicht man denselben Schluss, dass j µ = (cρ, j) wie ein kontravarianter 4-Vektor transformiert wird, indem man sich die Gesamtladungsdichte aus Teilladungsdichten uniformer Geschwindigkeit aufgebaut denkt. Das Erhaltungsgesetz für die Gesamtladung, das in differentieller Form als Kontinuitätsgleichung darstellbar ist, lautet in der 4-Schreibweise 0= ∂ 0 ∂ ∂(cρ) ∂ ∂ρ j + i j i = ∂µ j µ . +∇·j = + i ji = ∂t ∂(ct) ∂x ∂x0 ∂x Die manifeste Lorentz-Invarianz dieser Gleichung zeigt, dass die Gesamtladung in allen Inertialsystemen erhalten ist, falls sie in irgendeinem Inertialsystem erhalten ist. Wir zeigen nun, dass auch das skalare Potential Φ und das Vektorpotential A zu einem 4-Vektor, dem 4-Potential Aµ = (Φ, cA), kombiniert werden können. Aus den homogenen Maxwell-Gleichungen ∇ · B = 0 und ∇ × E + ∂B ∂t = 0 folgt 83 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE bekanntlich: E = −∇Φ − ∂A ∂t , B=∇×A. Die inhomogenen Maxwell-Gleichungen liefern daher: 1 (cρ) ε0 c ∂ 1 ρ = ∇ · E = −∆Φ − ∇ · A ε0 ∂t 1 ∂2 ∂ 1 ∂Φ = − ∆ Φ − ∇ · A + c2 ∂t2 ∂t c2 ∂t ∂ ∂Φ ∂ = Φ − ∇ · (cA) + = Φ − (∂ν Aν ) ∂(ct) ∂(ct) ∂(ct) = und 1 j ε0 c = µ0 cj = c ∇ × B − ε0 µ0 ∂E ∂t ∂Φ ∂ 2 A −∇ − ∂t ∂t2 2 1 ∂ A 1 ∂Φ = c ∇(∇ · A) − ∆A + 2 2 + 2 ∇ c ∂t c ∂t ∂Φ ∂ = ∇ ∇ · (cA) + + (cA) = (cA) − (∂ν Aν ) . ∂(ct) ∂(−x) 1 = c ∇ × (∇ × A) − 2 c Die Kombination dieser beiden Gleichungen liefert in 4-Schreibweise: 1 µ j = Aµ − ∂ µ (∂ν Aν ) . ε0 c (5.23) Die linke Seite dieser Gleichung ist ein 4-Vektor, also muss auch die rechte Seite wie ein 4-Vektor transformiert werden. Wegen der Eichfreiheit bei der Wahl von Aµ bedeutet dies noch keineswegs, dass die einzelnen Terme Aµ und ∂ µ (∂ν Aν ) in (5.23) wie 4-Vektoren transformiert werden; um dies zu erreichen, muss man die Eichung festlegen. Die Eichtransformation hat in 4-Schreibweise die Form Aµ −→ õ ≡ Aµ + ∂ µ Λ , wobei Λ eine zunächst beliebige Funktion des 4-Ortsvektors xν ist. Um diese Eichfreiheit zu eliminieren, wird häufig die Lorenz-Eichung, ∂ν Aν = 0 , (5.24) auferlegt. Die Bestimmungsgleichung für das 4-Potential reduziert sich in dieser Eichung auf: Aµ = 1 µ j . ε0 c (5.25) Die Lorenz-Eichung läßt sich immer realisieren, denn wenn ∂ν Āν 6= 0 gilt, kann man immer eine Funktion χ und ein neues 4-Potential Aµ einführen: χ ≡ −∂µ Āµ 84 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE Aµ ≡ Āµ + ∂ µ χ , so dass Aµ dieselben physikalischen Felder wie Āµ beschreibt und außerdem die Lorenz-Bedingung ∂µ Aµ = 0 erfüllt. Die Lorenz-Bedingung (5.24) legt das 4-Potential nicht eindeutig fest, da auch das alternative Potential õ = Aµ + ∂ µ Λ , (5.26) Λ = 0 die gleichen physikalischen Felder beschreibt und die Lorenz-Bedingung erfüllt. Das 4-Potential ist in der Lorenz-Eichung also bis auf eine Lösung der Wellengleichung bestimmt. Für alle möglichen Lorentz-Skalare Λ in (5.26) sind sowohl Aµ als auch õ physikalisch äquivalente 4-Vektoren. Gleichung (5.25) zeigt, dass das 4-Potential in der Lorenz-Eichung eine inhomogene Wellengleichung erfüllt. Genau wie bei der alternativen (und äquivalenten) Formulierung mit Hilfe der Coulomb-Eichung stellen wir fest, dass die Maxwell-Theorie elektromagnetische Wellen vorhersagt. Falls keine Quellen des elektromagnetischen Feldes vorhanden sind, also für j µ = 0, genügt Aµ (x) der homogenen Wellengleichung Aµ = 0 und kann somit als Überlagerung ebener Wellen der Form Aµ (x) = = ω (A0 )µ ei(k·x−ωt) = (A0 )µ e−i( c ct−k·x) ν (A0 )µ e−ikν x = (A0 )µ e−iϕ(x) (5.27) geschrieben werden, wobei die Phase ϕ(x) = kν xν und der 4-Wellenvektor k ν = ω c,k mit der Frequenz ω = c|k| eingeführt wurden. Nehmen wir an, (5.27) gilt im Inertialsystem K. Im Inertialsystem K ′ mit vrel (K ′ , K) = v gilt dann: ′ ′ (A′ )µ (x′ ) = Λµν Aν (x) = Λµν (A0 )ν e−iϕ(x) = (A′0 )µ e−iϕ (x ) mit (A′0 )µ ≡ Λµν (A0 )ν und ϕ′ (x′ ) ≡ ϕ(x) = kν xν = kν (Λ−1 )ν µ (x′ )µ = kν Λµν (x′ )µ ≡ (k ′ )µ (x′ )µ . Wir stellen also fest, dass die Amplitude des 4-Potentials wie ein 4-Vektor und die Phase wie ein Lorentz-Skalar transformiert werden. Außerdem haben wir die wichtige Entdeckung gemacht, dass auch der 4-Wellenvektor k ν ein echter 4-Vektor ist, d. h. gemäß der Lorentz-Gruppe transformiert wird: (k ′ )µ = Λµν kν bzw. (k ′ )µ = Λµν k ν . Im Falle von Wellenpaketen, d. h. von Überlagerungen ebener Wellen, gelten diese Schlussfolgerungen auch für jede einzelne FourierKomponente. Aus der Quantenmechanik ist bekannt, dass ein Photon mit dem Wellenvektor k und der Frequenz ω einen Impuls p = ~k und eine Energie E = ~ω besitzt. Für den Spezialfall des Photons stellen wir hier also erstmals fest, dass Impuls und Energie in der Relativitätstheorie zu einem 4-Vektor vereint wer den: pµ ≡ Ec , p = ~ ωc , k = ~k µ . Wir werden später sehen, dass diese enge Verflechtung von Energie und Impuls auch allgemeiner gilt. 85 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE Die Lorentz-Transformation für den 4-Wellenvektor k µ = ω c,k k · β̂ ≡ k cos(ϑ) und k⊥ ≡ k − kk β̂ ≡ k sin(ϑ)k̂⊥ : 1 ω ′ /c 0 = +γ ′ k k⊥ −β −β β̂ mit kk ≡ ω/c kk zeigt, dass die Frequenz ω der Welle abhängig vom Einfallswinkel ϑ wie folgt transformiert wird: ω ′ = γ(ω − βckk ) = γω 1 − β kk k = γω[1 − β cos(ϑ)] . (5.28) Hierbei ist das Transformationsgesetz für den Winkel, |k′⊥ | |k⊥ |/k sin(ϑ) |k⊥ | = k = = ω k kk′ γ[cos(ϑ) − β] γ kk − β c γ k −β tan(ϑ′ ) = oder umgekehrt tan(ϑ) = sin(ϑ′ ) , γ[cos(ϑ′ ) + β] natürlich gleich dem Gesetz (5.22) für die Transformation von Winkeln, das wir im Rahmen unserer Untersuchung von Aberration von Sternenlicht erhielten. Gleichung (5.28) beschreibt den relativistischen Doppler-Effekt : Die Frequenz ω wird nicht nur mit dem winkelabhängigen Faktor 1 − βv cos(ϑ) multipliziert, der bereits vom nicht-relativistischen Doppler-Effekt bekannt ist, sondern auch mit dem Faktor γv , der also eine relativistische Korrektur darstellt und sogar für transversal einfallendes Licht (ϑ = π2 ) einen Doppler-Effekt hervorruft („transversaler Doppler-Effekt“). Beim longitudinalen Doppler-Effekt (ϑ = 0 bzw. ϑ = π) wird die Frequenz ω wie folgt transformiert: Ê ′ ω = 1−β ω 1+β Ê (ϑ = 0) , ′ ω = 1+β ω 1−β (ϑ = π) . Beim transversalen Doppler-Effekt (ϑ = π2 ) tritt offensichtlich eine Rotverschiebung auf: ω = γ1v ω ′ < ω ′ . Als typische Anwendung des transversalen DopplerEffekts betrachten wir einen Stern, der im Inertialsystem K ′ ruht und dort Licht mit der Frequenz ω ′ ausstrahlt. Ein Beobachter auf der Erde („Inertialsystem K“), für den dieses Licht unter dem Winkel ϑ = π2 relativ zur v-Richtung einfällt, wird die kleinere Frequenz ω = ω ′ /γv messen. Der transversale Doppler-Effekt ist eine Konsequenz der Zeitdilatation, denn für den Beobachter auf der Erde wird eine in K ′ ruhende Uhr (in diesem Fall also der Licht ausstrahlende Stern) um einen Faktor γ1v langsamer laufen als eine Uhr, die im Inertialsystem K ruht. 5.6 Masse und Energie Wegen der einfachen quantenmechanischen Relation E = ~ω für die Energie eines Photons mit der Frequenz ω kann man aufgrund des Doppler-Effekts, Gleichung (5.28), sofort das Transformationsgesetz für die Energie elektromagnetischer Strahlung angeben: Sendet ein Körper in seinem Ruhesystem K insgesamt N Photonen der Frequenz ω unter einem Winkel ϑ zur β̂-Achse aus, 86 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE so misst ein Beobachter im Inertialsystem K ′ mit vrel (K ′ , K) = v = v β̂ die ausgestrahlte Energie E ′ = N ~ω ′ = γN ~ω[1 − β cos(ϑ)] = γE[1 − β cos(ϑ)] . (5.29) Betrachten wir nun einen Körper der Masse m0 in seinem Ruhesystem K, der in den Richtungen ϑ und ϑ − π jeweils N Photonen der Frequenz ω ausstrahlt, stets zwei Photonen (eins in jeder Richtung) zur gleichen Zeit. Die Energie des Körpers vor und nach dem Ausstrahlen sei E(0) bzw. E (0) (0). Schreiben wir noch: 2N ~ω = ε, dann lautet das Gesetz der Energieerhaltung in K: E(0) = E (0) (0) + 21 ε + 21 ε = E (0) (0) + ε . ! N h m0 ! N h # (# ) ^ Abbildung 5.7: Ausstrahlung von Photonen in zwei entgegengesetzte Richtungen Auch in K ′ gilt Energieerhaltung, nun für die Energien des bewegten Körpers und der Strahlung: E(v) = E (0) (v) + 21 εγ[1 − β cos(ϑ)] + 21 εγ[1 − β cos(ϑ − π)] = E (0) (v) + εγ . Zieht man die Energieerhaltungsgesetze in K und K ′ unter Verwendung von (0) Ekin (v) ≡ E (0) (v) − E (0) (0) Ekin (v) ≡ E(v) − E(0) , voneinander ab, so folgt für β = v c ≪ 1: (0) 2 2 1 1 2 m0 v − 2 εβ 2 ε 1 2 m0 − c 2 v Ekin (v) = Ekin (v) − ε(γ − 1) ∼ = (0) Das Massendefizit µ0 ≡ m0 − m0 = ε c2 (0) = 21 m0 v 2 . entspricht also einer Energie ε: ε = µ0 c2 . Da man prinzipiell die ganze Ruhemasse eines Körpers in Strahlung umwandeln kann (z. B. durch Annihilation von Materie und Antimaterie), folgt für E (0) (0) = E (0) (v) = 0 aus den beiden Energieerhaltungsgesetzen: E(0) = ε = m0 c2 , E(v) = εγ = γm0 c2 = mc2 . Hierbei wurde die relativistische Masse m ≡ γm0 eingeführt. Masse und Energie sind demnach äquivalent. Außerdem folgt nun auch für Teilchen, dass der 4Impulsvektor pµ ≡ u E = m0 cγu (1, β u ) = m0 cuµ , mu = mc 1, c c 87 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE ein 4-Vektor ist, der die physikalischen Größen Energie E und Impuls p = mu = γu m0 u untrennbar miteinander verknüpft. Das hier dargestellte Argument stammt aus einer Arbeit von A. Einstein (Annalen der Physik, 17, 639 (1905)), in der er übrigens interessanterweise eine klassische (d. h. nicht-quantenmechanische) Herleitung des Transformationsgesetzes (5.29) für die Strahlungsenergie gab. Das Konzept des Photons, das er ja selbst wenige Monate zuvor in seiner Arbeit über den photoelektrischen Effekt vorgeschlagen hatte, muss ihm wohl noch zu spekulativ erschienen sein. 5.7 Die Lorentz-Kraft und elektromagnetische Felder Bevor wir uns der Formulierung des relativistischen Kraftgesetzes, d.h. der Lorentz’schen Bewegungsgleichung widmen, betrachten wir die folgenden Ableitungen des 4-Potentials nach dem 4-Ortsvektor: F µν ≡ ∂ µ Aν − ∂ ν Aµ . Diese Ableitungen sind physikalisch äußerst relevant, da sie die Komponenten der elektrischen und magnetischen Felder bilden. Wir werden sie daher bei der relativistischen Formulierung der Lorentz-Kraft benötigen. Aus der Definition folgt sofort, dass F µν antisymmetrisch unter Vertauschung der Indizes (µν) ist; insbesondere gilt also F µµ = 0. Die explizite Form von F µν folgt aus F µµ = 0 und F i0 F ij = = ∂A ∂ A − ∂ A = −∇Φ − ∂t εijk (−cBk ) = −cεijk Bk i 0 0 i = Ei i als F µν = 0 E1 E2 E3 −E1 0 cB3 −cB2 −E2 −cB3 0 cB1 −E3 cB2 −cB1 0 . (5.30) Da die Elemente von F µν vollständig durch (E, B) bestimmt werden, heißt F µν auch elektromagnetischer Feldtensor. Die relativistische Variante der Lorentz-Kraft ist nun durch K µ ≡ qF µν uν = quν (∂ µ Aν − ∂ ν Aµ ) definiert. Da die 4-Geschwindigkeit uµ , das 4-Potential Aµ und die Ableitungen ∂ µ alle 4-Vektoren sind, werden sowohl uν Aν als auch der Differentialoperator uν ∂ ν unter Lorentz-Transformationen als Skalare und K µ selbst daher als kontravarianter 4-Vektor transformiert. Durch explizite Berechnung sieht man außerdem, dass K µ in der Tat eine relativistische Verallgemeinerung der Lorentz-Kraft darstellt: Kµ = q(F µ0 u0 + F µj uj ) = qγu [F µ0 + F µj (−βj )] = qγu (E · β , E + u × B) , (5.31) 88 ------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE wobei benutzt wurde: F ij (−βj ) = (−εijk cBk )(−βj ) = c(β × B)i = (u × B)i . Der Zeitanteil von K µ in (5.31) ist genau die Leistung, die das elektromagnetische Feld am Teilchen verrichtet. Betrachten wir nun die Gleichung m 0 c2 d2 xµ d2 xµ = m = Kµ 0 ds2 dτ 2 , dτ = dt γu , (5.32) die K µ mit einem anderen 4-Vektor, der 4-Beschleunigung, in Verbindung bringt. Gleichung (5.32) ist sicherlich korrekt im momentanen Ruhesystem des Teilchens, denn dann lautet sie: d2 x 0 , m0 2 dt = (0 , qE) . Da das Gesetz (5.32) in diesem speziellen Inertialsystem gilt und Lorentzkovariant formuliert wurde, muss es nach dem Relativitätsprinzip in jedem Inertialsystem gelten. Wir haben somit in der Form von Gleichung (5.32) die relativistische Formulierung der Lorentz’schen Bewegungsgleichung gefunden. Es ist klar, dass das Kraftgesetz (5.32) in der Speziellen Relativitätstheorie von zentraler Bedeutung ist, da es die Dynamik geladener Teilchen in beliebigen elektromagnetischen Feldern vollständig festlegt. Es sei schließlich noch daran erinnert, dass die 4-Beschleunigung stets senkrecht auf der 4-Geschwindigkeit stehen muss. Das Gleiche muss gemäß (5.32) dann natürlich auch für die 4-Kraft K µ gelten. Aufgrund der Antisymmetrie von F µν folgt tatsächlich: uµ duµ = uµ dτ 1 q Kµ = uµ F µν uν = 0 , m0 c m0 c so dass diese Konsistenzbedingung automatisch erfüllt ist. 89 Literaturverzeichnis [1] Is. Newton, Eq. Aur., Philosophiae naturalis principia mathematica, editio tertia, Guil. & Joh. Innys (Londini, MDCCXXVI). [2] Murray R. Spiegel, Allgemeine Mechanik, Theorie und Anwendung, McGraw-Hill (Hamburg, 1989). [3] J. Honerkamp, H. Roemer, Klassische Theoretische Physik, Springer Verlag (Berlin, 1993). [4] Herbert Goldstein, Classical Mechanics, Addison-Wesley (Reading, 1978). [5] F. Scheck, Mechanik - Von den Newton’schen Gleichungen zum deterministischen Chaos, Springer Verlag (7. Auflage, 2002). [6] A. Sommerfeld, E. Fues, Vorlesungen über Theoretische Physik, Bd.1, Mechanik, Harri Deutsch Verlag (Frankfurt am Main, 1994). [7] A. P. French, Special Relativity, Nelson (Sunbury-on-Thames, 1977). [8] J. D. Jackson, Classical Electrodynamics, John Wiley (New York, 3. Auflage 1999). [9] M. Schwartz, Principles of Electrodynamics, Dover Publications (New York, 1987). [10] L. D. Landau, E. M. Lifschitz, Lehrbuch der Theoretischen Physik, Band I, Akademie-Verlag (Berlin, 1981). [11] V. I. Arnold, Mathematical Methods of Classical Mechanics, SpringerVerlag (New York, 1978). [12] E. T. Whittaker, A treatise on the analytical dynamics of particles and rigid bodies, Cambridge Univ. Press (Cambridge, 1965). Mathematische Handbücher: [13] M. Abramowitz, I. A. Stegun, Handbook of Mathematical Functions, Dover (New York, 1970) [14] I. S. Gradshteyn, I. M. Ryzhik, Table of Integrals, Series and Products, Academic Press (New York, 1980)