Einführung in die Theoretische Physik - komet 337

Werbung
Einführung in die
Theoretische Physik
Skript zur Vorlesung von Prof. Dr. Peter van Dongen
SS 2009
Institut für Physik
Staudingerweg 7, 55128 Mainz
c
Copyright 2003
Peter van Dongen, Mainz, Germany
letzte Aktualisierung: 26. Oktober 2009
Inhaltsverzeichnis
Vorwort
1
1 Einführung
2
2 Postulate und Gesetze der Klassischen Mechanik
2.1 Der Massenpunkt als Baustein der Mechanik . . . . . . . . .
2.2 Raum und Zeit . . . . . . . . . . . . . . . . . . . . .
2.3 Abgeschlossene mechanische Systeme und Teilsysteme . . . .
2.4 Galileos Relativitätsprinzip . . . . . . . . . . . . . . . .
2.5 Galilei-Transformationen . . . . . . . . . . . . . . . . .
2.5.1 Zeittranslationen . . . . . . . . . . . . . . . . .
2.5.2 Geschwindigkeitstransformationen . . . . . . . . . .
2.5.3 Translationen im Ortsraum . . . . . . . . . . . . .
2.5.4 Drehungen . . . . . . . . . . . . . . . . . . . .
2.5.5 Raumspiegelungen . . . . . . . . . . . . . . . .
2.5.6 Allgemeine Galilei-Transformationen . . . . . . . . .
2.5.7 Die Galilei-Gruppe . . . . . . . . . . . . . . . .
2.6 Das deterministische Prinzip der Klassischen Mechanik . . . .
2.7 Konsequenzen der Galilei-Invarianz für die Bewegungsgleichung
2.8 Beispiele . . . . . . . . . . . . . . . . . . . . . . . .
6
6
7
9
12
13
13
14
15
15
16
17
18
19
21
23
3 Abgeschlossene mechanische Systeme
3.1 Allgemeine Eigenschaften abgeschlossener Systeme . . . . . .
3.1.1 Das Virialtheorem . . . . . . . . . . . . . . . . .
3.2 Galilei-Transformationen . . . . . . . . . . . . . . . . .
3.3 Das Zweiteilchenproblem - allgemeine Eigenschaften . . . . .
3.4 Das Zweiteilchenproblem - Beispiele . . . . . . . . . . . .
3.4.1 Kreisbahnen . . . . . . . . . . . . . . . . . . . .
3.4.2 Kleine Schwingungen . . . . . . . . . . . . . . .
3.4.3 Der harmonische Oszillator . . . . . . . . . . . . .
3.4.4 Ellipsen, Hyperbeln, Parabeln . . . . . . . . . . .
3.4.5 Das Kepler-Problem . . . . . . . . . . . . . . . .
3.4.6 Geschlossene Bahnen und Gleichförmigkeit . . . . . .
3.4.7 Die Bahn des Merkur . . . . . . . . . . . . . . . .
26
27
31
33
37
41
41
41
43
45
46
53
54
------------------------------------------------------------------------------------------------------------------ INHALTSVERZEICHNIS
4 Teilsysteme
4.1 Allgemeine Eigenschaften von Teilsystemen . . . . . . . . .
4.1.1 Einteilchen-Teilsysteme . . . . . . . . . . . . . . .
4.1.2 Mehrteilchen-Teilsysteme . . . . . . . . . . . . .
4.2 Die Lorentz-Kraft . . . . . . . . . . . . . . . . . . . .
4.2.1 Galilei-Kovarianz der Lorentz’schen Bewegungsgleichung
4.2.2 Beispiel: konstante Felder . . . . . . . . . . . . . .
57
57
57
59
61
62
64
5 Spezielle Relativitätstheorie
5.1 Erste Konsequenzen der Postulate . . . . . . . . . . . . .
5.2 Der Abstand und die Eigenzeit . . . . . . . . . . . . . . .
5.3 4-Schreibweise und Lorentz-Transformationen . . . . . . . .
5.3.1 Poincaré- und Lorentz-Transformationen . . . . . . .
5.4 Physikalische Konsequenzen der Lorentz-Invarianz . . . . . .
5.5 4-Vektoren . . . . . . . . . . . . . . . . . . . . . . .
5.6 Masse und Energie . . . . . . . . . . . . . . . . . . .
5.7 Die Lorentz-Kraft und elektromagnetische Felder . . . . . . .
67
69
71
75
77
78
81
86
88
Literaturverzeichnis
90
ii
Vorwort
Dieses Theorie-1-Skript ist die aktualisierte und an den neuen Bachelorstudiengang angepasste Version des Skriptes, das ich im Laufe des WS 2003/2004 zur
Vorbereitung der Kursvorlesung Theorie I: Einführung in die Theoretische Physik vor Mainzer Studierenden geschrieben habe. Für die Fertigstellung dieses
„Compuskripts“ möchte ich mich ganz herzlich bei meinen zwei Stützen, Elvira Helf und Albrecht Seelmann, bedanken. Frau Helf hat sich um den Text
gekümmert, Herr Seelmann um die Formeln, die Grafiken und die Verzeichnisse. Die Verantwortung für den Inhalt liegt natürlich bei mir. Sollte der Leserin oder dem Leser eine Unstimmigkeit auffallen, bitte ich um eine Mitteilung
([email protected]). Die aktuelle Version dieses Skripts findet
man auf der Homepage meiner Gruppe:
http://komet337.physik.uni-mainz.de/Group/ .
Bei der Themenwahl habe ich mich sowohl am Mainzer Theoriekanon als
auch an den Inhalten der Vorlesungen, die die Studierenden bereits gehört hatten, orientiert. Als Hintergrundinformation zur Theorie 1 seien die Referenzen
[1]-[9] sowie die weiterführende Literatur [10] - [12] des beigefügten Literaturverzeichnisses empfohlen, wobei allerdings keines dieser Bücher sehr eng bei der
von mir gewählten Darstellung anschließt. Von den aufgeführten Büchern eignen
sich die Klassiker [4] und [10] vielleicht noch am besten zu einem vertiefenden
Selbststudium. Außerdem muss angemerkt werden, dass die Darstellungen in
[10] oft sehr „physikalisch“ (d. h. intuitiv plausibel, aber mathematisch nicht immer präzise), diejenigen in [11] für Studierende im zweiten oder dritten Semester
dagegen vielleicht allzu „mathematisch“ sind; Referenz [12] ist eine Fundgrube
voller Ideen und Ergebnisse für den eher mathematisch interessierten Leser, mutet jedoch manchmal etwas altmodisch an. Für konkrete Rechnungen liefern die
mathematischen Handbücher [13] und [14] wertvolle Hilfestellungen.
Ich hoffe, dass dieses Skript sich zumindest für Mainzer Studierende als nützlich erweist, und wünsche ihnen viel Erfolg und auch Spaß bei ihren ersten
Schritten in der wunderbaren Welt der Theoretischen Physik.
Mainz, im April 2009
P. G. J. van Dongen
Kapitel
1
Einführung
Die Lehrbuchdefinition der Klassischen Mechanik, etwa als „Zweig der Physik,
der sich mit der Bewegung physikalischer Körper befasst“ [2], wird der enormen
historischen, kulturellen und philosophischen Bedeutung der Mechanik und ihrem Anwendungspotential in Wissenschaft und Technik wohl kaum gerecht.
Die Mechanik hat ihre Wurzeln in der Himmelsmechanik und somit in der
Astronomie: Bereits vor Jahrtausenden versuchte der Mensch, seine Existenz
auf der Erde und die Bewegung der Himmelskörper über ihm zu ergründen.
Dies hatte sicherlich zum Teil religiöse und zum Teil äußerst praktische Gründe, denn es war selbstverständlich wichtig, einerseits „bedrohliche“ Phänomene
(Sonnen- und Mondfinsternisse) vorhersagen zu können und andererseits über
einen gut funktionierenden Kalender zu verfügen. Frühe astronomische Beobachtungen wurden nachweislich in China (angeblich bereits im 25. Jahrhundert
v. Chr.) und in Ägypten, Indien und Chaldäa durchgeführt. Neben diesen Anfängen können Höhepunkte der Beobachtung in Griechenland (Hipparchos, 2.
Jahrhundert v. Chr.), Arabien (Albategnius, 10. Jahrhundert), Khorasan (Nassir Eddin, 13. Jahrhundert) und Turkestan (Ulugh Begh, 14. Jahrhundert) erwähnt werden. Das technische Können der beiden letztgenannten Astronomen
wurde in Europa erst im 16. Jahrhundert von Tycho Brahe übertroffen. Die
weiterführenden Arbeiten von Brahes Schüler Johannes Kepler (1571-1630) und
insbesondere auch von Galileo Galilei (1564-1642) ermöglichten schließlich die
Formulierung einfacher Gesetze, die ein halbes Jahrhundert später in der Newton’schen Mechanik einschließlich der Gravitationstheorie kulminierten.
Theoretische Ideen über den Aufbau des Weltalls, die allerdings eher spekulativen Charakter hatten, gab es bereits vor Newton: Pythagoras (6. Jahrhundert
v. Chr.) lehrte, dass die Erde kugelförmig ist; Philolaos (5. Jahrhundert v. Chr.)
spekulierte über eine mögliche Rotation der Erde um die eigene Achse und über
die Bewegung der Erde, der Sonne, des Mondes und der Planeten um ein gemeinsames Zentrum; Aristoteles (4. Jahrhundert v. Chr.) erklärte die Sonnen- und
Mondfinsternisse aufgrund der spärischen Form dieser Körper und der Erde;
Eratosthenes (3. Jahrhundert v. Chr.) bestimmte den Erddurchmesser; Ptolemäos (2. Jahrhundert) formulierte aufgrund der Messdaten von Hipparchos ein
geozentrisches Weltbild; Nicolaus Copernicus (1473-1543) zweifelte dieses geozentrische Weltbild an und zeigte, dass die Messdaten in einfacherer Weise mit
Hilfe eines heliozentrischen Weltbildes beschrieben werden können.
---------------------------------------------------------------------------------------------------------------------------------- 1. EINFÜHRUNG
Die Geschichte der Astronomie demonstriert übrigens wunderschön, dass in
den Naturwissenschaften Experiment und Theorie Hand in Hand gehen und
außerdem die Unterstützung von Mathematik und Technik benötigen: Ohne die
Entwicklung der Geometrie (Archimedes, Euklid, Apollonius) und die Erfindung
des Teleskops (Lippershey, 1608) wären Galileos astronomische Untersuchungen
und Newtons Formulierung der Grundlagen der Mechanik nicht ohne Weiteres
möglich gewesen.
Isaac Newton fasste 1666 die theoretische Erklärung aller bis zu diesem Zeitpunkt gemachten astronomischen Beobachtungen und auch vieler späterer in
einer einzigen Formel zusammen [1], seinem universellen Gravitationsgesetz:
mi ẍi =
X Gmi mj xji
j6=i
|xji |3
(i, j = 1, 2, . . . , N ) .
(1.1)
Hierbei ist mi (i = 1, 2, . . . , N ) die Masse des i-ten Teilchens und stellt G =
6, 6732 · 10−11 Nm2 /kg2 die Newton’sche Gravitationskonstante dar. Außerdem
wurde der Relativvektor xji ≡ xj − xi eingeführt. Das Gesetz (1.1) besagt, dass
sich alle Massenpunkte im Weltall umgekehrt proportional zum Quadrat ihres
Relativabstandes anziehen. Die Gesamtkraft, die in einem N -Teilchen-System
auf das Teilchen mit dem Index i ausgeübt wird, ist somit die Summe von N − 1
Zweiteilchenkräften, die jeweils entlang der Verbindungslinie der Teilchenpaare
gerichtet sind. Die wichtigste Anwendung des Gravitationsgesetzes (1.1) ist die
Beschreibung unseres Sonnensystems. Generationen von Mathematikern (Euler, Clairaut, d’Alembert, Lagrange, Laplace, Legendre, Gauß, Bessel, Poisson,
Poincaré, . . . ) haben sich angestrengt, die Konsequenzen von (1.1) für unser Sonnensystem zu berechnen. Einige mathematisch rigorose Aussagen wurden erst
in unserer Zeit durch die Arbeiten von Kolmogorov, Arnold und Moser möglich. Die intensive Untersuchung mechanischer Vielteilchensysteme hat im 20.
Jahrhundert zu einem neuen Zweig der Theoretischen Physik, zur Theorie dynamischer Systeme und somit zur Chaostheorie geführt. Bei der Untersuchung
der Dynamik des Sonnensystems wird auch die Numerik immer wichtiger: Neue
numerische Berechnungen deuten z. B. darauf hin, dass die Bahnen der äußeren Planeten des Sonnensystems stabil, diejenigen der inneren Planeten jedoch
chaotisch (d. h. etwa: nur ungenau vorhersagbar) sind.
Bemerkenswert am Gravitationsgesetz (1.1) ist, dass die physikalische Größe
„Masse“ im linken und im rechten Glied gänzlich unterschiedliche Rollen spielt.
Im linken Glied tritt die „träge“ Masse mi auf, die in jeder Bewegungsgleichung
der Form mi ẍi = Fi vorkommt und bewirkt, dass das i-te Teilchen unter der
Einwirkung der Kraft Fi umgekehrt proportional zu mi beschleunigt wird. Im
rechten Glied von (1.1) treten mi und mj als Proportionalitätskonstanten in
der Gravitationskraft auf, die die Teilchen i und j aufeinander ausüben, d. h.
als Teilcheneigenschaften („schwere“ Massen), die nur für die Gravitationswechselwirkung relevant sind. Es ist erstaunlich, dass das Verhältnis der trägen und
schweren Massen für alle Teilchen gleich ist und durch eine geeignete Definition
der Gravitationskonstante G gleich Eins gewählt werden kann. Diese Äquivalenz der trägen und schweren Massen wurde experimentell bereits von Newton
gezeigt und später von Bessel und - mit viel größerer Genauigkeit - von Eötvös (1890, 1909) nachgewiesen. Sie stellt eine der Grundlagen der allgemeinen
Relativitätstheorie (Einstein, 1916) dar.
Die Schwerkraft, die von Gleichung (1.1) beschrieben wird, ist natürlich nicht
3
---------------------------------------------------------------------------------------------------------------------------------- 1. EINFÜHRUNG
die einzige relevante Kraft in der Natur: Neben der Gravitation erzeugen auch
die elektromagnetische, die schwache und die starke Wechselwirkung weitere
fundamentale Kräfte. Hierbei sind die schwache Wechselwirkung, die z. B. den
β-Zerfall hervorruft, und die starke Wechselwirkung, d. h. die Kraft zwischen
Hadronen (z. B. Quarks, Baryonen, Mesonen), nur im Rahmen der Quantentheorie sinnvoll beschreibbar. Elektromagnetische Kräfte zwischen makroskopischen Ladungen können jedoch durchaus im Rahmen der Klassischen Mechanik
beschrieben werden. Analog zum Gravitationsgesetz für Punktmassen gilt z. B.
das Coulomb’sche Gesetz (Charles-Augustin de Coulomb, 1785) für die Wechselwirkung N geladener Punktteilchen:
mi ẍi =
X
j6=i
qi qj xji
−
4πε0 |xji |3
(i, j = 1, 2, . . . , N ) .
(1.2)
Hierbei stellt qi die elektrische Ladung des i-ten Punktteilchens dar, und ε0 ≃
8, 854 · 10−12 F/m ist die Dielektrizitätskonstante des Vakuums.1 Wiederum ist
die Kraft auf ein Teilchen die Summe von Zweiteilchenkräften, die entlang der
jeweiligen Verbindungslinien gerichtet sind. Das Coulomb-Gesetz (1.2), wie übrigens auch das Newton’sche Gesetz (1.1), gilt nur für „nicht-relativistische“
Geschwindigkeiten (|ẋ1 | ≪ c, |ẋ2 | ≪ c, usw., wobei c die Lichtgeschwindigkeit
darstellt). Dies sieht man sofort daran, dass die Wechselwirkung zwischen den
Ladungen oder Massen des i-ten und j-ten Teilchens in (1.2) bzw. (1.1) instantan erfolgt: In einer relativistischen Theorie wäre die Ausbreitungsgeschwindigkeit der Wechselwirkung von oben durch die Lichtgeschwindigkeit beschränkt.
Außerdem verliert das Coulomb-Gesetz (1.2) seine Gültigkeit, falls für N ≫ 1
makroskopische Ströme auftreten und somit Magnetfelder erzeugt werden.
Hiermit kommen wir auf das Anwendungspotential der Klassischen Mechanik bzw. auf die Einschränkungen ihrer Gültigkeit zu sprechen: Die nichtrelativistische Theorie verliert ihre Gültigkeit, sobald die auftretenden Geschwindigkeiten nicht mehr vernachlässigbar sind im Vergleich zur Lichtgeschwindigkeit. Die Newton’sche Mechanik muss daher im Bereich hoher Geschwindigkeiten
modifiziert und durch eine genauere Beschreibung (in diesem Fall die spezielle
oder allgemeine Relativitätstheorie) ersetzt werden. Ähnliches gilt in der Mikrowelt: Obwohl die Klassische Mechanik oft durchaus noch imstande ist, die
Dynamik größerer Moleküle adäquat zu beschreiben, versagt sie bei der Erklärung des Atom- oder Kernaufbaus. In der Welt des Kleinen wird die Klassische
Mechanik durch die Quantentheorie ersetzt. Es ist übrigens nicht einfach, eine
klare Trennlinie anzugeben zwischen Systemen, die klassisch beschrieben werden können, und Systemen, die unbedingt quantenmechanisch zu beschreiben
sind. Manchmal äußert sich die Quantenmechanik nämlich auch im Großen, wie
bei den „makroskopischen Quantenphänomenen“ (Supraleitung, Suprafluidität,
Magnetismus, Bose-Einstein-Kondensation, Quanten-Hall-Effekt), für die in den
letzten Jahren mehrere Nobelpreise vergeben wurden.
Trotz dieser Einschränkungen ist das Anwendungspotential der Klassischen
Mechanik sehr groß: Fast alle Objekte des täglichen Lebens können grundsätzlich durch die Klassische Mechanik beschrieben werden. Ob man nun Fahrrad
oder Auto fährt oder sich mit einem Segelboot, einem Flugzeug oder einer Rake1 Der exakte numerische Wert der Dielektrizitätskonstante ε ist 107 /4πc2 , wobei c den
0
numerischen Wert der Lichtgeschwindigkeit in m/s darstellt.
4
---------------------------------------------------------------------------------------------------------------------------------- 1. EINFÜHRUNG
te fortbewegt, ob man sich als Meteorologe für die Dynamik der Regentropfen in
der Luft oder als Astronom für diejenige der Planeten in unserem Sonnensystem
interessiert: Um die Mechanik kommt man nicht herum. Sie ist von wesentlicher
Bedeutung für Industrie und Technik. Sogar unter Umständen, unter denen die
Klassische Mechanik streng genommen nicht gültig ist, z. B. in der Quantenwelt
oder im relativistischen Bereich, ist das „neue“ Wissen oft noch eine Erweiterung
des „klassischen“ und hat der „neue“ Effekt oft ein „klassisches“ Pendant.
Aus diesen Gründen werden wir uns im Folgenden mit klassischen Phänomenen befassen, d. h. mit klassischen Teilchen, eventuell mittels ihrer „schweren“
Masse angekoppelt an ein Gravitationspotential oder mittels ihrer Ladung an
ein klassisches elektromagnetisches Feld.
5
Kapitel
2
Postulate und Gesetze der
Klassischen Mechanik
In diesem Kapitel werden die wichtigsten Begriffe der klassischen Mechanik und
ihre Postulate erklärt, und es wird auch ausführlich auf die Konsequenzen dieser
Postulate für die mögliche Form physikalischer Gesetze eingegangen. Wir werden
sehen, dass es im Wesentlichen drei grundlegende Annahmen der Klassischen
Mechanik gibt, nämlich
1. das Galilei’sche Relativitätsprinzip, das die Existenz überabzählbar vieler
Inertialsysteme postuliert (s. Abschnitt [2.4]).
2. die Existenz absoluter (d. h. beobachterunabhängiger) Abstände sowohl im
Raum als auch in der Zeit (s. die Abschnitte [2.2] und [2.5]).
3. das deterministische Prinzip der Klassischen Mechanik, das besagt, dass
die Bewegung eines mechanischen Systems für alle Zeiten durch die Vorgabe der Koordinaten und Geschwindigkeiten aller Teilchen zu einem einzelnen Zeitpunkt vollständig festgelegt ist (s. Abschnitt [2.6]).
Hierüber hinaus gibt es weitere, meist implizite Annahmen bezüglich der Homogenität des Ortsraums und der Zeit und der Isotropie des Ortsraums. Neben den
bereits genannten Begriffen werden einige weitere eingeführt, wie das Konzept
eines Massenpunktes (s. Abschnitt [2.1]) und die zentralen Begriffe „abgeschlossenes System“ und “Teilsystem“ (s. Abschnitt [2.3]); diese letzten Begriffe sind
deshalb so wichtig, weil die Postulate der Klassischen Mechanik uneingeschränkt
nur für „abgeschlossene Systeme“ gelten und man für „Teilsysteme“ Zusatzinformation benötigt. Als Konsequenz der Postulate wird die Invarianz (oder genauer: die „Kovarianz“) physikalischer Gesetze unter Galilei-Transformationen
diskutiert (s. Abschnitt [2.6]); auch werden einige Spezialfälle und Beispiele behandelt (in den Abschnitten [2.7] und [2.8]).
2.1
Der Massenpunkt als Baustein der Mechanik
Es ist bequem, sich bei der Untersuchung der Dynamik von Körpern zunächst
auf Massenpunkte (d. h. auf massebehaftete Körper, deren Abmessungen deut-
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
lich kleiner sind als alle anderen relevanten Längenskalen im Problem) zu beschränken. Man verliert in dieser Weise keine Information, da ein beliebiger Körper aus miteinander wechselwirkenden Massenpunkten aufgebaut werden kann.
Die Beschreibung einzelner Massenpunkte ist andererseits einfacher als diejenige
kompletter Körper, da die Rotationsenergie von Massenpunkten im Vergleich zu
ihrer kinetischen Energie vernachlässigt werden kann und sie - im Gegensatz zu
Körpern - unter der Einwirkung von Kräften auch nicht deformiert werden. Wir
werden einen Körper also als System wechselwirkender Punktteilchen beschreiben:
dpi
= Fi
dt
(i = 1, 2, . . . , N ) ,
wobei Fi die Kraft auf das i-te Teilchen und pi ≡ mi ẋi der entsprechende
Impuls ist.
Als weitere Motivation für die Untersuchung von Massenpunkten sei hinzugefügt, dass ein Massenpunkt oft eine gute Näherung für einen realen, ausgedehnten Körper darstellt. Man denke z. B. an das Kepler-Problem der Beschreibung
der Bewegung eines Planeten um die Sonne, bei dem diese Himmelskörper in
guter Näherung durch Massenpunkte approximiert werden können. Auch die
Dynamik des Sonnensystems als Ganzes kann theoretisch in guter Näherung als
die Zeitentwicklung eines Systems von Massenpunkten angesehen werden.
2.2
Raum und Zeit
Die Physik, also insbesondere auch die Mechanik, spielt sich in einer vierdimensionalen Raum-Zeit ab. Wir nehmen an, dass ein kartesisches Koordinatensystem gegeben ist und betrachten die Welt durch die Augen eines Beobachters,
der über einen Zollstock und eine Uhr verfügt, um gegebenenfalls Längen- und
Zeitmessungen durchführen zu können. Hierbei ist die Zeit eine eindimensionale
physikalische Größe und wird die Länge des Zeitintervalls ∆t zwischen den Zeitpunkten t1 und t2 durch die Zeitdifferenz
∆t = t2 − t1
gegeben. Ein positiver Wert (∆t > 0) würde bedeuten, dass t2 für t1 in der
Zukunft, ein negativer Wert (∆t < 0), dass t2 für t1 in der Vergangenheit liegt.
Analog ist der Abstand zweier Punkte x und x′ im dreidimensionalen Ortsraum
durch
|x − x′ | =
È
(x1 − x′1 )2 + (x2 − x′2 )2 + (x3 − x′3 )2
(2.1)
gegeben. Der so definierte euklidische Abstand im Ortsraum ist allerdings für
alle möglichen Kombinationen von Punkten x und x′ nicht-negativ.
Aufgrund dieser Definitionen von zeitlichen und räumlichen Abständen können nun einige weitere Begriffe und Eigenschaften eingeführt werden: Falls die
physikalische Bahn eines Teilchens als Funktion der Zeit durch x(t) gegeben ist,
wird die Geschwindigkeit dieses Teilchens durch
ẋ(t) ≡ lim
∆t→0
dx
x(t + ∆t) − x(t)
=
(t)
∆t
dt
,
7
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
die Beschleunigung durch
d2 x
ẋ(t + ∆t) − ẋ(t)
= 2 (t)
∆t→0
∆t
dt
ẍ(t) ≡ lim
und der Impuls durch
p(t) ≡ mẋ(t)
definiert, wobei die Masse m übrigens durchaus zeitabhängig sein darf. Der
Geschwindigkeitsbetrag ist durch
|x(t + ∆t) − x(t)|
∆t→0
∆t
|ẋ(t)| ≡ lim
definiert, und der Impulsbetrag ist |p(t)| = m|ẋ(t)|.
Im Sinne der Linearen Algebra ist der Ortsraum der Klassischen Mechanik
ein Vektorraum, und zwar der Vektorraum R3 der geordneten reellen Tripel
x = (x1 , x2 , x3 ). Die Rechenregel
(∀ x, x′ ∈ R3 )(∃! x + x′ ∈ R3 )
besagt, dass die Summe zweier Vektoren x und x′ wiederum zum Vektorraum
gehört. Diese Eigenschaft, zusammen mit den üblichen Regeln der Addition, ist
sicherlich erforderlich, um z. B. die „stroboskopische“ Variante der physikalischen
Bahn,
xn = x0 +
n
X
i=1
∆xi
,
∆xi ≡ x(ti ) − x(ti−1 ) ,
ti ≡ t 0 +
i
(tN − t0 )
N
mit n ≤ N zu beschreiben. Auch die Regeln der Multiplikation, wie z. B.
(∀ x ∈ R3 , α ∈ R)(∃! αx ∈ R3 )
werden dringend benötigt, um z. B. die geradlinig-gleichförmige Bewegung x(t) =
x(0) + vt sinnvoll beschreiben zu können. Da der Vektorraum außerdem mit einem Skalarprodukt
x · x′ ≡ x1 x′1 + x2 x′2 + x3 x′3
und also mit der bereits in (2.1) eingeführten euklidischen Metrik
|x − x′ | ≡
È
(x − x′ ) · (x − x′ ) =
È
(x1 − x′1 )2 + (x2 − x′2 )2 + (x3 − x′3 )2
versehen wird, liegt im Falle des Ortsraums der Klassischen Mechanik - mathematisch gesprochen - insgesamt also ein dreidimensionaler euklidischer Vektorraum vor.
Von den bisher eingeführten Größen spielen sowohl die Länge eines Zeitintervalls als auch der räumliche Abstand zweier gleichzeitiger Ereignisse in der
Klassischen Mechanik eine besondere Rolle: Beide sind absolute (d. h. beobachterunabhängige) Größen, und diese Beobachterunabhängigkeit hat – wie wir
sehen werden – weitreichende Konsequenzen bei der Formulierung möglicher
8
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
physikalischer Gesetze. Die Beobachterunabhängigkeit der Länge eines Zeitintervalls und des räumlichen Abstands hat in der nicht-relativistischen Klassischen Mechanik den Status eines Postulats. Wir werden später sehen, dass die
Zeitdauer und der räumliche Abstand ihren absoluten Charakter in der Relativitätstheorie verlieren; das entsprechende Postulat wird dann durch ein anderes
(über die Beobachterunabhängigkeit des „differentiellen Raum-Zeit-Intervalls“)
ersetzt.
Für die Zeitvariable bedeutet ihre absolute Natur in der nicht-relativistischen
Mechanik konkret Folgendes: Wenn man einen Satz identischer Uhren, die alle
gleich schnell laufen, aber möglicherweise zu unterschiedlichen Zeitpunkten gestartet wurden, über die Beobachter in den verschiedenen Koordinatensystemen
verteilt, dann
(i) bedeutet Gleichzeitigkeit für alle Beobachter dasselbe. Wenn der Beobachter B zur Zeit t die Ereignisse {Eα (t)} sieht, so dass diese für B alle
gleichzeitig stattfinden, dann gibt es für den Beobachter B ′ eine Zeit t′ , so
dass die zu diesem Zeitpunkt von ihm gesehenen Ereignisse {Eβ′ (t′ )} mit
den {Eα (t)} identisch sind.
(ii) ist die Zeitdauer zwischen zwei nicht-gleichzeitigen Ereignissen für alle
Beobachter gleich. Da B und B ′ mit Hilfe ihrer Uhren für jedes Zeitintervall beide das gleiche Ergebnis erhalten: ∆t = ∆t′ , müssen ihre Uhrzeiten
gemäß t = t′ + τ für irgendein τ ∈ R miteinander verknüpft sein.
Neben der Zeit ist in der Klassischen Mechanik auch der Abstand |x1 − x2 |
zweier gleichzeitiger Ereignisse (x1 , t) und (x2 , t) eine absolute Größe. Wir wissen bereits, dass die Gleichzeitigkeit zweier Ereignisse aufgrund des absoluten
Charakters der Zeit für alle Beobachter dasselbe bedeutet. Auch der Abstand
gleichzeitiger Ereignisse ist somit von fundamentaler Bedeutung in der Mechanik. Es braucht wohl kaum darauf hingewiesen zu werden, dass der Abstand
zweier nicht -gleichzeitiger Ereignisse im Allgemeinen beobachterabhängig ist
und insbesondere (bei geeigneter Wahl des Koordinatensystems) gleich Null gewählt werden kann.
2.3
Abgeschlossene mechanische Systeme und
Teilsysteme
Es gibt einen wesentlichen Unterschied zwischen abgeschlossenen mechanischen
Systemen, die als vom Rest des Weltalls entkoppelt angesehen werden können, und Teil systemen, die explizit an die Außenwelt gekoppelt sind; in der
Bewegungsgleichung eines Teilsystems wird die Außenwelt dann mittels äußerer Felder (z. B. Schwerkraftfelder, elektrischer oder magnetischer Felder) dargestellt. Der wesentliche Unterschied zwischen abgeschlossenen Systemen und
Teilsystemen ist, dass die ersteren echten physikalischen Gesetzen gehorchen,
die universell (im Sinne von beobachterunabhängig) sind, während dies für die
letzteren im Allgemeinen nicht gilt: Bei Teilsystemen muss man zusätzlich stets
auch angeben, wie die Außenwelt mittransformiert wird, wenn man das Koordinatensystem wechselt.
Betrachten wir ein paar Beispiele: Mit Hilfe des Newton’schen Gravitationsgesetzes kann man z. B. das Sonnensystem beschreiben, welches in guter
9
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
Näherung ein abgeschlossenes System darstellt. Das Gravitationsgesetz ist in
der Tat ein Gesetz, da es beobachterunabhängig ist. Falls der Beobachter B im
Koordinatensystem K die Bewegungsgleichung
mi ẍi =
X Gmi mj xji
(i, j = 1, . . . , N )
|xji |3
j6=i
findet, so findet B ′ im Koordinatensystem K ′ , dessen Achsen gegenüber denjenigen von K gedreht sind, so dass 0′ = 0 und ê′i = Rêi gilt, die Bewegungsgleichung
mi ẍ′i =
X Gmi mj x′ji
(x′ = R−1 x; i, j = 1, 2 . . . , N ) .
|x′ji |3
j6=i
Hierbei ist R die Drehmatrix mit den Matrixelementen Rij ≡ êT
i Rêj und somit eine orthogonale Matrix mit det(R) = 1. Für B und B ′ gilt somit das
gleiche physikalische Gesetz.1 Man kommt zum selben Schluss, wenn K ′ im
Ortsraum oder in der Zeit relativ zu K verschoben wird (Translation) oder eine
Geschwindigkeitstransformation oder Raumspiegelung durchgeführt wird. Unter allen diesen Transformationen ist das Gravitationsgesetz forminvariant und
somit insgesamt – wie man sagt – kovariant.
Nun kann man alternativ Teilchen 1 auch als Teilsystem betrachten und
seine Dynamik im Schwerkraftfeld der übrigen N − 1 Teilchen untersuchen.
Man erhält dann eine Bewegungsgleichung der Gestalt
m1 ẍ1 = m1 g(x1 , t) ,
g=
X Gmj xj1
j6=1
(2.2)
,
|xj1 |3
die natürlich nur dann hilfreich ist, falls g(x1 , t) eine einfache Form hat. Formen die übrigen N − 1 Teilchen beispielsweise ein kondensiertes Medium, das
durch eine Massendichte ρ(x, t) charakterisiert werden kann, so erhält man die
Darstellung
g(x1 , t) =
X
j6=1
Gρ(xj , t)∆xj
xj − x1
=G
|xj − x1 |3
Z
dx′ ρ(x′ , t)
x′ − x1
|x′ − x1 |3
(2.3)
für die Beschleunigung der Schwerkraft, wobei das Volumenelement ∆xj nur
den j-ten Massenpunkt enthalten soll. Eine typische Anwendung der Beschreibung (2.2) und (2.3) wäre ein Teilchen im Schwerkraftfeld der Erde, wobei die
Gravitationswirkung anderer Himmelskörper vernachlässigt wird. Im Falle des
Schwerkraftfelds der Erde kann man die Zeitabhängigkeit der Massendichte, die
z. B. durch die Rotation der Erde oder durch Vulkanismus oder Gezeitenwirkung verursacht wird, meist vernachlässigen: ρ(x, t) = ρ(x). Man erhält somit
1 Die Transformationsregel x′ = R−1 x für die Koordinaten unter Drehungen folgt aus der
Invarianz des von x (oder x′ ) beschriebenen Vektors:
X
j
xj êj ≡
X
i
x′i ê′i
=
X
x′i êj
ij
die x = Rx′ bzw. x′ = R−1 x impliziert.
êT
j Rêi
=
X
j
‚
X
i
Œ
Rji x′i
êj
,
10
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
den einfacheren Ausdruck
Z
dx′ ρ(x′ )
g = g(x1 ) = G
x′ − x1
|x′ − x1 |3
(2.4)
.
Wenn wir als Ursprung des Koordinatensystems den Erdmittelpunkt wählen
und annehmen, dass die Massendichte ρ(x′ ) nur vom Abstand |x′ | zum Erdmittelpunkt abhängig ist, so kann (2.3) auch in der einfacheren Form
g(x1 ) = −GME
x1
|x1 |3
(2.5)
dargestellt werden, wobei ME die Gesamtmasse der Erde ist. Falls wir nur an der
Wirkung der Schwerkraft nahe dem Punkte x = RE ê an der Erdoberfläche interessiert sind, wobei RE also den Erdradius und ê einen Einheitsvektor darstellt,
der im Ursprung (d. h. im Erdmittelpunkt) angreift, können wir approximieren:
g(x1 ) = −
GME x1
GME
= − 2 ê ≡ −gê .
2
|x1 | |x1 |
RE
Hierbei drückt g ≃ 9, 81 m/s2 die Beschleunigung der Schwerkraft an der Erdoberfläche aus. Mit der Definition x1 · ê ≡ RE + z findet man also die einfache
Bewegungsgleichung
m1 z̈ = −m1 g
(2.6)
.
Während das Gesetz (1.1) im abgeschlossenen System invariant ist unter Translationen, Rotationen, Geschwindigkeitstransformationen usw., muss im Teilsystem (2.2) das Transformationsverhalten des äußeren Feldes g(x, t) stets explizit
angegeben werden. In (2.5) wird die Translationsinvarianz der Bewegungsgleichung durch die Fixierung des Erdmittelpunktes gebrochen, während in (2.6) zusätzlich auch die Rotationsinvarianz und die Invarianz unter Raumspiegelungen
gebrochen werden. Bewegungsgleichungen für Teilsysteme sind also gewissermaßen beobachterabhängig und haben in diesem Sinne nur eine eingeschränkte
Gültigkeit.
Vollkommen analog zum Newton’schen Gravitationsgesetz beschreibt auch
das Coulomb-Gesetz (1.2) ein abgeschlossenes mechanisches System, und die
entsprechende Bewegungsgleichung
mi ẍi =
X
j6=i
qi qj xji
−
4πε0 |xji |3
(i, j = 1, 2, . . . , N )
ist invariant unter Translationen, Drehungen, Geschwindigkeitstransformationen und Raumspiegelungen. Wiederum können wir Teilchen 1 als Teilsystem
betrachten und die von den anderen Teilchen herrührenden Kräfte als äußeres
Feld subsumieren:
m1 ẍ1 = q1 E(x1 , t) ,
E=
X
j6=1
−
qj xj1
4πε0 |xj1 |3
.
(2.7)
Das äußere Feld E(x1 , t) kann nun als das auf Teilchen 1 einwirkende elektrische
Feld interpretiert werden. Wiederum kann man den Spezialfall betrachten, dass
11
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
die Teilchen 2, 3, . . . , N einen makroskopischen Körper bilden, der nun durch
die Ladungsdichte ρ(x′ ) beschrieben werden kann:
E = E(x1 ) = −
1
4πε0
Z
dx′ ρ(x′ )
x′ − x1
|x′ − x1 |3
,
und wiederum muss in (2.7) das Transformationsverhalten des äußeren Feldes
E bei einem Wechsel des Koordinatensystems explizit angegeben werden.
Bisher haben wir angenommen, dass im von den Teilchen 2, 3, . . . , N gebildeten System keine signifikanten makroskopischen Ströme auftreten. In Anwesenheit solcher Ströme erhält man zusätzliche Beiträge zum elektrischen Feld,
und es treten auch Magnetfelder auf. Statt (2.7) gilt nun die allgemeinere Bewegungsgleichung
m1 ẍ1 = q1 [E(x1 , t) + ẋ1 × B(x1 , t)] ,
(2.8)
wobei B(x, t) das Magnetfeld darstellt und das rechte Glied insgesamt als die
Lorentz-Kraft bezeichnet wird. Es ist bemerkenswert, dass die Lorentz-Kraft
FLor (x, ẋ, t) ≡ q[E(x, t) + ẋ × B(x, t)]
nicht nur von den Raum-Zeit-Koordinaten (x, t), sondern auch von der Geschwindigkeit ẋ abhängig ist. Aufgrund der bisherigen Diskussion ist klar, dass
die Lorentz’sche Bewegungsgleichung (2.8) kein abgeschlossenes mechanisches
System, sondern im Allgemeinen nur ein Teilsystem beschreibt.
2.4
Galileos Relativitätsprinzip
Aufgrund des vorher Gesagten ist klar, dass physikalische Gesetze nur dann ohne Weiteres beobachterunabhängig sein können, wenn sie Systeme, die nicht an
die Außenwelt gekoppelt sind, im Falle der Mechanik also abgeschlossene mechanische Systeme beschreiben. Für solche Systeme (und nur für solche Systeme)
gilt das Relativitätsprinzip, das besagt, dass es gewisse Koordinatensysteme gibt,
die wir im Folgenden als Inertialsysteme bezeichnen werden und die durch die
folgenden zwei Eigenschaften gekennzeichnet sind:
1. Alle physikalischen Gesetze sind in allen Inertialsystemen zu jedem Zeitpunkt gleich.
2. Alle Koordinatensysteme, die sich relativ zu einem Inertialsystem in geradlinig-gleichförmiger Bewegung befinden, sind selbst Inertialsysteme.
Auch die Existenz von Inertialsystemen hat in der Klassischen Mechanik den
Status eines Postulats. Die erstgenannte Eigenschaft von Inertialsystemen drückt
die Beobachterunabhängigkeit aus, die man von einer grundlegenden physikalischen Theorie erwartet, und die zweite Eigenschaft macht klar, dass es überabzählbar unendlich viele Inertialsysteme gibt.2 Es sei (vielleicht unnötigerweise)
2 Das Relativitätsprinzip tritt z. B. in Galileos Buch „Dialogo sopra i due massimi sistemi
del mondo, tolemaico e copernicano“ auf (1632 publiziert, aber die Ideen dürften deutlich
älter sein), wenn Salviati, der den kopernikanischen Standpunkt vertritt, behauptet, dass ein
12
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
darauf hingewiesen, dass natürlich nicht jedes Koordinatensystem ein Inertialsystem ist: Koordinatensysteme, die relativ zu einem Inertialsystem beschleunigt
werden (man denke z. B. an die um ihre Achse rotierende und sich um die Sonne drehende Erde) stellen selbst keine Inertialsysteme dar. Falls die Effekte solcher Beschleunigungen jedoch gering sind, kann man sogar Nicht-Inertialsysteme
manchmal approximativ als Inertialsysteme behandeln. Außerdem ist klar, dass
streng abgeschlossene mechanische Systeme wohl kaum realisierbar sein dürften,
da es immer irgendwelche Restwechselwirkungen zwischen dem System und dem
Rest des Universums gibt. Auch der Begriff „abgeschlossenes System“ stellt daher eine (oft sehr gute) Approximation dar.
2.5
Galilei-Transformationen
Um die physikalischen Gesetze von der „Sprache“ des einen Inertialsystems in
diejenige eines anderen Inertialystems „übersetzen“ und somit u. a. ihre Forminvarianz (oder alternativ: Kovarianz ) überprüfen zu können, muss man die
möglichen Koordinatentransformationen zwischen Inertialsystemen genau kennen. Solche Koordinatentransformationen zwischen Inertialsystemen, die die
physikalischen Gesetze forminvariant lassen, werden als Galilei-Transformationen
bezeichnet. Die mögliche Form der Galilei-Transformationen wird durch die zwei
fundamentalen, in Abschnitt [2.4] genannten Eigenschaften von Inertialsystemen
festgelegt; insbesondere impliziert die erste Eigenschaft, dass Galilei-Transformationen die Raum-Zeit-Struktur und daher insbesondere die Zeitdauer zwischen zwei Ereignissen und den räumlichen Abstand zweier gleichzeitiger Ereignisse invariant lassen. Bezeichnen wir die Raum-Zeit-Koordinaten im Inertialsystem K als (x, t) und diejenigen in einem anderen Inertialsystem K ′ als (x′ , t′ ),
dann muss für beliebige Ereignisse (x1 , t1 ) und (x2 , t2 ) gelten:
∆t′ ≡ t′2 − t′1 = t2 − t1 ≡ ∆t ,
(2.9)
und für beliebige gleichzeitige Ereignisse (x1 , t) und (x2 , t):
|x′2 − x′1 | = |x2 − x1 | .
(2.10)
Wir untersuchen nun die Konsequenzen der Invarianzen (2.9) und (2.10) unter
Koordinationstransformationen zwischen zwei Inertialsystemen.
2.5.1
Zeittranslationen
Die funktionale Beziehung t′ (t) zwischen den Zeitvariablen in K und K ′ wird
durch (2.9) bereits weitgehend festgelegt. Mit der Notation t2 − t1 ≡ ∆t folgt
nämlich für alle t1 ∈ R:
t′ (t1 + ∆t) − t′ (t1 )
dt′
(t1 ) = lim
= lim 1 = 1
∆t→0
∆t→0
dt
∆t
,
Stein, der auf einem Schiff von der Spitze des Mastes herunterfällt, am Fuß des Mastes landet
(und nicht z. B. dahinter, wie viele damals offenbar meinten). Dieses Faktum war relevant bei
der Diskussion über die mögliche Bewegung der Erde im Weltall und die hieraus folgenden
Konsequenzen für die physikalischen Gesetze auf der Erde.
Mit Galileos Werk findet gewissermaßen die Geburt der Theoretischen Physik statt, da
hier erstmals systematisch mathematische Berechnungen mit dem Experiment (von ihm als
„cimento“ ≃ Bewährungsprobe bezeichnet) verglichen werden.
13
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
und daher gilt für irgendein τ ∈ R:
t′ = t − τ
(2.11)
.
Die einzigen „erlaubten“ Transformationen der Zeitvariablen sind also Zeittranslationen.
2.5.2
Geschwindigkeitstransformationen
Es gibt mehrere Möglichkeiten, die Ortskoordinaten zu transformieren, so dass
die Metrik im Ortsraum invariant bleibt, wie in (2.10). Eine mögliche Beziehung
der Koordinatensysteme K und K ′ ist die gleichförmige Relativbewegung:3
x′ (x, t) = x − vt ,
(2.12)
wobei v die Relativgeschwindigkeit des Inertialsystems K ′ in Bezug auf K darstellt:
vrel (K ′ , K) = v
.
Eine Bahnbewegung xφ (t) mit der Geschwindigkeit ẋφ (t) in K, wobei der Index
„φ“ für die „physikalische Bahn“ eines Teilchens steht, wird in K ′ also als Bahn
x′ (xφ (t), t) = xφ (t) − vt mit der modifizierten Geschwindigkeit ẋ′φ = ẋφ − v
wahrgenommen:
ẋ′φ ≡
dx′φ
dx′ (xφ (t), t) dt
∂x′ dxφ ∂x′
=
=
·
+
= 11ẋφ −v = ẋφ −v
dt′
dt
dt′
∂x dt
∂t
. (2.13)
Hierbei wurde die Notation

∂a
∂x
‹
ij
≡
∂ai
∂xj
für die partielle Ableitung des Vektorfeldes a(x, t) nach dem Vektor x eingeführt. Gleichung (2.13) zeigt also, dass sich nach Galileos Relativitätsprinzip zu
jeder Geschwindigkeit ẋφ in K immer ein Inertialsystem K ′ mit einer beliebigen transformierten Geschwindigkeit ẋφ − v finden lässt. Jede Geschwindigkeit
ist daher möglich und keine Geschwindigkeit ist besonders ausgezeichnet. Heute
wissen wir, dass dieses Ergebnis in deutlichem Widerspruch zur Relativitätstheorie steht, denn es würde für eine elektromagnetische Welle, die sich im System
K mit der Lichtgeschwindigkeit c in der Richtung ĉ ausbreitet, bedeuten:
c′ = c − v
,
c ≡ c ĉ ,
und daher im Allgemeinen c′ = |c′ | =
6 c. Generell erlaubt (2.13) durch eine
geeignete Wahl von K ′ auch Geschwindigkeiten größer als c, im Widerspruch
zur Relativitätstheorie und zum Experiment. Wir folgern hieraus, dass Galileos
Relativitätsprinzip auf Relativgeschwindigkeiten |v| ≪ c beschränkt ist und für
höhere Relativgeschwindigkeiten modifiziert werden muss.
3 Es
ist bemerkenswert, dass bei der Relativbewegung die Orts- und Zeitkoordinaten (x, t)
auch in der nicht-relativistischen Mechanik linear kombiniert und somit gemischt werden.
14
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
2.5.3
Translationen im Ortsraum
Eine andere Gruppe von Transformationen der Ortskoordinaten, die die Metrik
(2.10) invariant lassen, sind die Translationen:
x′ (x, t) = x − ξ
(ξ ∈ R3 ) ,
(2.14)
denn offensichtlich gilt für alle ξ:
|x′2 − x′1 | = |x′ (x2 , t) − x′ (x1 , t)| = |(x2 − ξ) − (x1 − ξ)| = |x2 − x1 | .
Die Translation (2.14) im Ortsraum ist das räumliche Pendant der Zeittranslation (2.11). Während (2.11) die Äquivalenz zeitverschobener Inertialsysteme
und daher die Homogenität der Zeit ausdrückt, bringt (2.14) die Homogenität
des Raums zum Ausdruck.
2.5.4
Drehungen
Außerdem ist es möglich, die Inertialsysteme K und K ′ durch eine Drehung um
eine Achse durch die beiden Ursprünge 0 = 0′ zu verknüpfen:
x′ (x, t) = R−1 x ,
(2.15)
denn auch dann gilt:
|x′2 − x′1 | = |R−1 x2 − R−1 x1 | = |R−1 (x2 − x1 )| = |x2 − x1 | .
Die Invarianz der physikalischen Gesetze unter Drehungen drückt die Isotropie
des Ortsraums, d. h. die Äquivalenz der verschiedenen Raumrichtungen, aus.
Wie wir bereits vorher bei der Untersuchung des Newton’schen Gravitationsgesetzes gesehen haben, bedeutet (2.15), dass die Basisvektoren {êi } und {ê′i } von
K und K ′ gemäß ê′i = Rêi mit Rij = êT
i Rêj miteinander zusammenhängen.
Ein kurzes Wort zum Thema „Drehungen“: Eine Drehung R(α) ist eine lineare homogene orthogonale Transformation mit der Determinante Eins:
RT R = 11
,
det(R) = 1 ,
die durch einen Drehwinkel α ≡ |α| und eine Drehrichtung α̂ ≡ α/α definiert
wird. Da die Drehrichtung α̂ durch zwei Winkel festgelegt werden kann:
„
α̂ =
cos(ϕ) sin(ϑ)
sin(ϕ) sin(ϑ)
cos(ϑ)
Ž
,
0≤ϑ≤π
,
0 ≤ ϕ < 2π
,
(2.16)
ist der Drehvektor α = αα̂ mit −π < α ≤ π also insgesamt durch drei Winkel
(α, ϑ, ϕ) bestimmt. Die Drehungen {R(α)} bilden bekanntlich eine Gruppe, da
(i) das Produkt zweier Drehungen wiederum eine Drehung darstellt:
(R1 R2 )T R1 R2 = R2T R1T R1 R2 = R2T R2 = 11 ,
det(R1 R2 ) = 1 .
(ii) Matrixmultiplikation (und somit auch das Multiplizieren von Drehungen)
assoziativ ist.
15
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
α̂
x
α̂×x
| α̂×x|
α̂×x)
− α̂×(
| α̂×x|
Abbildung 2.1: Parametrisierung von Drehungen
(iii) auch die Identität 11 eine Drehung darstellt, und
(iv) auch die Inverse R(α)−1 = RT (α) = R(−α) einer Drehung eine Drehung
ist.
Die Multiplikation von Drehungen ist im Allgemeinen nicht kommutativ:
R(α1 )R(α2 ) 6= R(α2 )R(α1 ) ,
€
Š
€
Š
€
Š
€
Š
denn es gilt z. B. ê3 = R π2 ê1 R π2 ê3 ê1 6= R π2 ê3 R π2 ê1 ê1 = ê2 . Ein
einfaches Beispiel einer Drehung um einen variablen Winkel ist die Rotation um
einen Winkel α um die x3 -Achse:
„
R(αê3 ) =
− sin(α)
cos(α)
0
cos(α)
sin(α)
0
0
0
1
Ž
.
Eine Matrixdarstellung von R(α), die für beliebige Drehvektoren α gültig ist,
erhält man wie folgt: Für alle Ortsvektoren x und alle Drehrichtungen α̂ gilt:
x = α̂(α̂ · x) − α̂ × (α̂ × x)
(2.17)
,
wie auch aus Abbildung 2.1 ersichtlich ist. Daher gilt bei Drehung von x um
einen Winkel α um die α̂-Richtung:
R(α)x = α̂(α̂ · x) − α̂ × (α̂ × x) cos(α) + (α̂ × x) sin(α)
.
(2.18)
Eine Matrixdarstellung für R(α) folgt nun, wenn die explizite Winkelabhängigkeit (2.16) von α̂ in (2.18) eingesetzt wird.
2.5.5
Raumspiegelungen
Die bisher diskutierten Koordinatentransformationen lassen die Orientierung
(oder auch „Händigkeit“) und daher das Vorzeichen der Determinante |ê1 ê2 ê3 |
der Basisvektoren invariant:
|ê′1 ê′2 ê′3 | = |ê1 ê2 ê3 |
.
16
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
Eine weitere Transformation, die die Metrik invariant lässt, dafür aber die „Händigkeit“ ändert, ist die Raumspiegelung oder Inversion:
x′ (x, t) = −x ,
t′ = t ,
denn wiederum gilt |x′2 − x′1 | = |x2 − x1 |. Im Spiegelbild der Mechanik sollen
also nach dem Relativitätsprinzip dieselben Gesetze gelten wie auf unserer Seite
des Spiegels. Um die Händigkeit einer allgemeinen Galilei-Transformation beschreiben zu können, führen wir einen Parameter
σ≡
|ê′1 ê′2 ê′3 |
|ê1 ê2 ê3 |
ein, der also den Wert −1 oder +1 hat, abhängig davon, ob in der allgemeinen
Galilei-Transformation eine Raumspiegelung enthalten ist oder nicht.
2.5.6
Allgemeine Galilei-Transformationen
Man kann nun leicht zeigen, dass jede Galilei-Transformation mit Hilfe von Geschwindigkeitstransformationen, Translationen, Drehungen und möglicherweise
einer Raumspiegelung aufgebaut werden kann, so dass die allgemeine Transformation die Form
x′ (x, t) = σR−1 x − vt − ξ
, t′ = t − τ
(2.19)
mit σ = ±1 hat. Um die Allgemeingültigkeit von (2.19) zu zeigen, stellen wir
zuerst fest, dass wegen der zweiten Eigenschaft von Inertialsystemen (siehe
S. 12) für bestimmte v und ξ:
x′ (0, t) = −vt − ξ
gelten muss. Wir definieren nun x′′ (x, t) ≡ x′ (x, t) + vt + ξ und untersuchen die
(x, t)-Abhängigkeit von x′′ . Auf jeden Fall gilt:
x′′ (0, t) = 0
,
|x′′ (x2 , t) − x′′ (x1 , t)| = |x2 − x1 | (∀ x1 , x2 )
. (2.20)
Wir zeigen nun, dass x′′ (x, t) linear von x abhängt und t-unabhängig ist.4 Indem
man entweder x1 = 0 oder x2 = 0 wählt in (2.20), erhält man
|x′′ (x2 , t)| = |x2 | ,
|x′′ (x1 , t)| = |x1 | .
Daher gilt:
0 = |x′′ (x2 , t) − x′′ (x1 , t)|2 − |x2 − x1 |2
= (x′′2 − x′′1 ) · (x′′2 − x′′1 ) − (x2 − x1 ) · (x2 − x1 )
= |x′′2 |2 + |x′′1 |2 − 2x′′1 · x′′2 − |x2 |2 − |x1 |2 + 2x1 · x2
= 2 [x1 · x2 − x′′ (x1 , t) · x′′ (x2 , t)]
und somit:
x′′ (x, t) · x′′ (y, t) = x · y
(∀ x, y ∈ R3 ) .
(2.21)
4 Intuitiv ist dies klar, da x′′ Geraden in K in Geraden in K ′ überführen muss, damit K
und K ′ sich relativ zu einander in geradlinig-gleichförmiger Bewegung befinden.
17
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
Man findet insbesondere für y = λ1 y1 + λ2 y2 mit λ1,2 ∈ R :
x′′ (x, t) · x′′ (λ1 y1 + λ2 y2 , t) = x · (λ1 y1 + λ2 y2 ) = λ1 x · y1 + λ2 x · y2
= x′′ (x, t) · [λ1 x′′ (y1 , t) + λ2 x′′ (y2 , t)]
.
Da dies für alle x ∈ R3 und daher für alle x′′ (x, t) ∈ R3 gilt, folgt die Linearität
von x′′ (y, t):
x′′ (λ1 y1 + λ2 y2 , t) = λ1 x′′ (y1 , t) + λ2 x′′ (y2 , t) ,
die auch als x′′ (y, t) = Ot y geschrieben werden kann. Hierbei ist Ot eine lineare Transformation, die außerdem zeitunabhängig sein muss, Ot = O, damit K ′
sich tatsächlich geradlinig-gleichförmig relativ zu K bewegt, denn die Relativgeschwindigkeit der zwei Koordinatensysteme,
d
dOt
dx′ (y, t)
= (Ot y − vt − ξ) =
y−v
dt
dt
dt
ist nur dann y-unabhängig, wenn
somit zu
dOt
dt
Ox · Oy = x · OT Oy = x · y
,
= 0 gilt. Gleichung (2.21) vereinfacht sich
(∀ x, y ∈ R3 )
,
und diese Identität kann nur dann für alle x, y ∈ R gelten, falls O orthogonal
ist: OT O = 11. Dies ist schließlich gleichbedeutend mit O = σR−1 und daher
mit (2.19).
2.5.7
Die Galilei-Gruppe
Die allgemeinen Galilei-Transformationen (2.19) bilden eine 10-Parameter-Gruppe, wobei die 10 (kontinuierlich variierbaren) Parameter durch (τ, ξ, α, v) gegeben sind; durch die Wahlmöglichkeit σ = ±1 wird der Satz der möglichen Parameterwerte noch einmal verdoppelt. Dass die Galilei-Transformationen
(2.19) tatsächlich auch im mathematischen Sinne eine Gruppe bilden, sieht man
wie folgt ein: Führen wir die zwei Galilei-Transformationen
G1 (x, t) ≡ (G1 (x, t), t − τ1 ) ≡ (σ1 R1−1 x − v1 t − ξ 1 , t − τ1 )
und
G2 (x, t) ≡ (G2 (x, t), t − τ2 ) ≡ (σ2 R2−1 x − v2 t − ξ 2 , t − τ2 )
nacheinander aus, so erhalten wir wiederum eine Galilei-Transformation:
(x′ , t′ ) = (G2 ◦ G1 )(x, t) = (G2 (G1 (x, t), t − τ1 ), t − (τ1 + τ2 ))
mit
t′ = t − (τ1 + τ2 )
und
x′ = σ2 R2−1 (σ1 R1−1 x − v1 t − ξ 1 ) − v2 (t − τ1 ) − ξ 2
= (σ1 σ2 )(R1 R2 )−1 x − (v2 + σ2 R2−1 v1 )t − (ξ 2 + σ2 R2−1 ξ 1 − v2 τ1 ) .
18
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
Außerdem sind Galilei-Transformationen assoziativ, und es gibt eine Identität
(τ, ξ, α, v, σ) = (0, 0, 0, 0, 1) und zu jeder Transformation (τ, ξ, α, v, σ) auch
eine Inverse, die durch
(−τ, −σR(α)(ξ + vτ ), −α, −σR(α)v, σ)
parametrisiert wird. Alle Gruppenaxiome sind daher erfüllt. Es ist übrigens bemerkenswert, dass die allgemeine Galilei-Transformation (2.19) insofern unsymmetrisch in den Raum-Zeit-Koordinaten ist, als x′ von x und t gemeinsam und
die transformierte Zeit t′ nur von t abhängt. Diese Asymmetrie ist typisch für die
nicht-relativistische Klassische Mechanik und wird von der Relativitätstheorie
behoben. Eine weitere Bemerkung ist, dass die hier untersuchten Inertialsysteme (per definitionem) alle durch dieselbe Metrik im Ortsraum („Längeneinheit“)
und durch das gleiche Zeitmaß in der Zeit („Zeiteinheit“) bestimmt sind. Eine
andere Definition des Einheitensystems, d. h. eine andere Wahl der Längen- oder
Zeiteinheit, würde einem anderen aber äquivalenten Satz von Inertialsystemen
entsprechen.
2.6
Das deterministische Prinzip der Klassischen
Mechanik
Während Galileo sich mit den Gesetzmäßigkeiten der Bewegung an sich, d. h.
mit der Kinematik befasste, ohne sich explizit mit den Kraftgesetzen auseinanderzusetzen, hat Isaac Newton die enorme Leistung erbracht, die Dynamik zu
begründen, d. h. etliche wichtige Kraftgesetze explizit zu formulieren und die
dazugehörigen Bewegungsgleichungen zu lösen. Newtons Kraftgesetze basieren
alle auf dem Prinzip, dass die physikalische Bahn x(t) eines Systems für alle
Zeiten t > 0 vollständig festgelegt ist, sobald die Anfangswerte x(0) ≡ x0 des
Aufenthaltsortes und ẋ(0) ≡ ẋ0 der Geschwindigkeit vorgegeben sind. Mutatis
mutandis gilt für Systeme, die aus mehreren Teilchen bestehen, dass die Zukunft
{xi (t)} eines Systems für alle t > 0 vollständig festgelegt ist, wenn die Anfangswerte der Koordinaten und Geschwindigkeiten zur Zeit t = 0 bekannt sind. Die
Klassische Mechanik ist somit eine rein deterministische Theorie. Aus dem deterministischen Prinzip der Mechanik folgt sofort, dass die Bewegungsgleichung
für ein System mit nur einem Teilchen die Form
dp
= F(x, ẋ, t) , p = mẋ
(2.22)
dt
haben muss, wobei F(x, ẋ, t) die auf das Teilchen einwirkende Kraft darstellt
und die Masse m unter Umständen zeitabhängig sein kann; in fast allen Anwendungen werden wir jedoch zeitunabhängige Massen betrachten. Gleichung
(2.22) ist die zentrale Gleichung in der Klassischen Mechanik und wird als die
Newton’sche Bewegungsgleichung bezeichnet. Für Systeme mehrerer Teilchen
gilt analog
dpi
= Fi (X, Ẋ, t)
dt
,
pi = mi ẋi
,
(2.23)
wobei Fi nun die auf das i-te Teilchen einwirkende Kraft ist und X und Ẋ die
Koordinaten bzw. Geschwindigkeiten aller Teilchen zusammenfassen:
X ≡ (x1 , x2 , . . . , xN ) ,
Ẋ = (ẋ1 , ẋ2 . . . , xN ) .
19
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
Die Gleichungen (2.22) und (2.23) sind auch als das zweite Newton’sche Gesetz
bekannt. Aus dem vorigen Abschnitt ist klar, dass die von Newton formulierten
beobachterunabhängigen physikalischen Gesetze im Allgemeinen nur in Inertialsystemen gelten.
Wir überprüfen zunächst, dass die durch (2.22) bestimmte physikalische
Bahn x(t) das deterministische Prinzip erfüllt, d. h. tatsächlich vollständig durch
die Anfangswerte x0 und ẋ0 bestimmt ist. Hierbei nehmen wir an, dass die Masse
m zeitunabhängig ist:
mẍ = F(x, ẋ, t) ,
x(0) = x0
,
.
(2.24)
x(0) = x0
(2.25)
ẋ(0) = ẋ0
Integration dieser Gleichung liefert:
ẋ(t) = ẋ0 +
1
m
Z
t
dt′ F(x(t′ ), ẋ(t′ ), t′ ) ,
0
und nochmalige Integration liefert:
x(t) = x0 + ẋ0 t +
1
m
Z
t
0
Z
t′
dt′
dt′′ F(x(t′′ ), ẋ(t′′ ), t′′ ) .
(2.26)
0
Grundsätzlich sind die Gleichungen (2.25) und (2.26) genauso einfach oder
schwierig wie die Newton’sche Bewegungsgleichung (2.22); sie haben jedoch den
Vorteil der iterativen Lösbarkeit. Definieren wir
F(x0 , ẋ0 , 0) ≡ F0
,
so gilt für kurze Zeiten, d. h. für t ↓ 0 :
Rt
1
′
ẋ(t) ∼ ẋ0 + m
0 dt F0 = ẋ0 +
t2
x(t) ∼ x0 + ẋ0 t + 2m F0
t
m F0
(t ↓ 0)
(t ↓ 0) .
Setzen wir diese Ergebnisse wieder in (2.25) und (2.26) ein und definieren wir
1 ∂F
∂F
∂F
(x0 , ẋ0 , 0)ẋ0 +
(x0 , ẋ0 , 0)F0 +
(x0 , ẋ0 , 0) ≡ F1
∂x
m ∂ ẋ
∂t
so erhalten wir im nächsten Iterationsschritt
,
2
t
t
F0 + 2m
F1 + . . .
(t ↓ 0)
ẋ(t) ∼ ẋ0 + m
t2
t3
x(t) ∼ x0 + ẋ0 t + 2m F0 + 6m
F1 + . . . (t ↓ 0) .
Man kann offensichtlich beliebig oft weiter iterieren, und das rechte Glied wird
immer nur von x0 und ẋ0 abhängig sein. Das deterministische Prinzip ist daher
für Bewegungsgleichungen der Form (2.22) erfüllt.
Vollkommen analog kann man zeigen, dass die Newton’sche Bewegungsgleichung (2.23) für Systeme mehrerer Teilchen das deterministische Prinzip
(zumindest für genügend kurze Zeiten) erfüllt. Die vollständige und eindeutige Lösung gewöhnlicher Differentialgleichungen zweiter Ordnung, wie (2.22)
oder (2.23), erfordert generell zwei Integrationskonstanten {x(0), ẋ(0)} bzw.
{X(0), Ẋ(0)}. Die Existenz von Lösungen dieses Anfangswertproblems, die hier
nur illustriert wurde, kann in der Theorie gewöhnlicher Differentialgleichungen
unter relativ schwachen Voraussetzungen rigoros bewiesen werden (Satz von
Cauchy-Peano). Um die Eindeutigkeit der Lösung zu beweisen, fordert man typischerweise zusätzlich, dass das Kraftgesetz F(x, ẋ, t) eine Lipschitz-Bedingung
bezüglich der Variablen x und ẋ erfüllt.
20
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
2.7
Konsequenzen der Galilei-Invarianz für die
Bewegungsgleichung
Wir untersuchen nun die Konsequenzen der zu fordernden Galilei-Invarianz für
die mögliche Form der Kraft F in der Newton’schen Bewegungsgleichung. Hierzu betrachten wir zunächst abgeschlossene mechanische Systeme, die nur aus
einem einzelnen Teilchen bestehen. Um Zweideutigkeiten in der Notation zu
vermeiden, führen wir neben den allgemeinen Koordinaten x ∈ R3 auch die
spezielle (eindimensionale) physikalische Bahn xφ (t) ein, die eine Lösung der
Newton’schen Bewegungsgleichung zu fest vorgegebenen Anfangsbedingungen
darstellt. Der Impuls des Teilchens in der physikalischen Bahn ist entsprechend
durch pφ (t) = mẋφ (t) gegeben.
Die Bewegungsgleichung (2.22) soll aufgrund des Galilei’schen Relativitätsprinzips forminvariant (oder äquivalent: „kovariant“) sein unter den folgenden
Transformationen:
(i) Zeittranslationen: x′ (x, t) = x mit t′ = t − τ . Falls xφ (t) eine Lösung in
K ist, stellt
x′φ (t′ ) = x′ (xφ (t), t) = xφ (t) = xφ (t′ + τ )
mit
dx′φ ′
dxφ
(t ) =
(t) = ẋφ (t′ + τ )
dt′
dt
p′φ (t′ ) ≡ mẋ′φ (t′ ) = mẋφ (t′ + τ ) ≡ pφ (t′ + τ )
ẋ′φ (t′ ) ≡
eine Lösung in K ′ dar. Forminvarianz der Bewegungsgleichung bedeutet:
F(xφ (t), ẋφ (t), t − τ ) =
dp′φ ′
dpφ
(t ) =
(t) = F(xφ (t), ẋφ (t), t)
dt′
dt
.
Dies kann jedoch nur dann für alle τ gelten, falls die Kraft zeitunabhängig
ist: ∂F
∂t = 0.
(ii) Translationen im Ortsraum: x′ (x, t) = x − ξ , t′ = t. Falls xφ (t) eine
Lösung in K darstellt, ist
x′φ (t′ ) = x′ (xφ (t), t) = xφ (t) − ξ = xφ (t′ ) − ξ
eine Lösung in K ′ . Die Forminvarianz der Bewegungsgleichung impliziert
nun:
F(xφ (t) − ξ, ẋφ (t)) =
dp′φ ′
dpφ
(t ) =
(t) = F(xφ (t), ẋφ (t)) ,
dt′
dt
und diese Gleichung kann nur dann für alle ξ gelten, falls F ortsunabhängig
ist: ∂F
∂x = ∅.
(iii) Geschwindigkeitstransformationen: x′ (x, t) = x − vt , t′ = t. Falls xφ (t)
eine Lösung in K ist, ist x′φ (t′ ) = xφ (t′ ) − vt′ eine Lösung in K ′ . Die
Forminvarianz der Bewegungsgleichung bedeutet nun:
F(ẋφ (t) − v) =
dp′φ ′
dpφ
(t ) =
(t) = F(ẋφ (t))
dt′
dt
,
21
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
und dies kann nur dann für alle v gelten, wenn die Kraft geschwindigkeitsunabhängig ist: ∂F
∂ ẋ = ∅, so dass sie insgesamt also (x, ẋ, t)-unabhängig und
somit konstant ist: F(x, ẋ, t) = F.
(iv) Inversion: x′ (x, t) = −x , t′ = t. Falls xφ (t) eine Bahn in K beschreibt,
ist x′φ (t′ ) = −xφ (t) = −xφ (t′ ) eine Bahn in K ′ . Forminvarianz der Bewegungsgleichung impliziert:
F=
dp′φ ′
dpφ
(t ) = −
(t) = −F
′
dt
dt
und daher F = 0. Man erhält dasselbe Ergebnis, wenn man Forminvarianz
unter Drehungen fordert.
Rein aufgrund der zu fordernden Galilei-Kovarianz muss ein isolierter Massenpunkt („frei von äußeren Einflüssen“) also unbedingt die Bewegungsgleichung
dpφ
=0
dt
(2.27)
erfüllen; seine Bewegung erfolgt geradlinig-gleichförmig in jedem Inertialsystem.
Das Resultat (2.27), das hier hergeleitet und nicht angenommen wurde, ist als
das erste Newton’sche Gesetz bekannt.
Wir untersuchen nun die Konsequenzen der Galilei-Invarianz für die Bewegungsgleichung (2.23), die die Verallgemeinerung von (2.22) auf Systeme mit
mehreren Teilchen darstellt. Die Invarianz unter Zeittranslationen impliziert
auch nun wieder ∂F
∂t = 0, so dass (2.23) durch
dpi
= Fi ({xj }, {ẋj })
dt
(i, j = 1, . . . , N )
ersetzt werden kann. Die Forminvarianz der Bewegungsgleichung unter Translationen im Ortsraum impliziert
Fi ({xj − ξ}, {ẋj }) = Fi ({xj }, {ẋj })
(∀ ξ ∈ R3 ) ,
so dass sich die Bewegungsgleichung auf
dpi
= Fi ({xji }, {ẋj })
dt
(i, j = 1, . . . , N )
reduziert. Analog folgt aus der Forderung nach Forminvarianz unter Geschwindigkeitstransformationen:
Fi ({xji }, {ẋj − v}) = Fi ({xji }, {ẋj })
(∀ v ∈ R3 ) ,
so dass in jedem Inertialsystem ein physikalisches Gesetz der Form
dpi
= Fi ({xji }, {ẋji })
dt
(i, j = 1, . . . , N )
(2.28)
gelten muss. Unter Drehungen bzw. Inversionen gehen Lösungen xi (t) in K in
Lösungen σR−1 xi (t) in K ′ über. Es folgt
d
dpi
dp′i
=
σR−1 pi = σR−1
′
dt
dt
dt
= σR−1 Fi ({xji }, {ẋji })
Fi ({σR−1 xji }, {σR−1 ẋji }) =
22
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
oder kurz:
F′i = σR−1 Fi
(2.29)
.
Kräfte werden unter Drehungen und Inversionen also genauso wie Ortsvektoren
oder Impulse transformiert und können aufgrund von (2.28) auch genauso wie
Impulse (oder Ortsvektoren) addiert werden. Größen mit dieser Eigenschaft
werden in der Physik als echte Vektoren bezeichnet. Die Tatsache, dass Kräfte in
diesem Sinne echte Vektoren sind, wird üblicherweise als Newtons viertes Gesetz
bezeichnet. Hier wurde das Gesetz hergeleitet, nicht angenommen.
Neben dem zweiten Newton’schen Gesetz, das eine zentrale Rolle in der
Klassischen Mechanik spielt, und dem ersten und vierten Gesetz, die beide aus
dem zweiten Gesetz und der Galilei-Invarianz hergeleitet werden können, gibt es
– nicht erstaunlicherweise – noch ein drittes Newton’sches Gesetz , das weniger
fundamental ist: Es postuliert, dass die Kräfte, die zwei Teilchen aufeinander
ausüben, entlang der Verbindungslinie dieser Teilchen gerichtet sind und dass
ihre Summe Null ist (actio = − reactio):
dp1
= f (|x21 |)x̂21
dt
,
dp2
= f (|x12 |)x̂12
dt
,
d
(p1 + p2 ) = 0 .
dt
Außerdem wird hierbei angenommen, dass die Kräfte geschwindigkeitsunabhängig sind, da geschwindigkeitsabhängige, generell entlang der Verbindungslinie zweier Teilchen gerichtete Kräfte unrealistisch sind. Das dritte „Gesetz“ ist
sicherlich zutreffend für die Schwerkraft und auch für die Coulomb-Wechselwirkung zwischen geladenen Teilchen, aber es gilt nicht für die geschwindigkeitsabhängigen magnetischen Kräfte, die bewegliche Ladungen aufeinander ausüben.
Für solche Kräfte sind die Schlüsse, die im Folgenden aus dem Prinzip „actio =
− reactio“ gezogen werden, im Allgemeinen nicht richtig.
2.8
Beispiele
Wir zeigen schließlich, dass man rein aufgrund von Symmetrieüberlegungen, also
ohne die relevanten Kraftgesetze explizit zu kennen, nicht-triviale Aussagen über
die Dynamik von Zwei- und Dreikörpersystemen machen kann.
Beispiel 1
Betrachten wir zunächst ein abgeschlossenes System, das aus lediglich zwei Teilchen besteht, die sich zur Zeit t = 0 in irgendeinem Inertialsystem in Ruhe
befinden. Die Bewegungsgleichung hat allgemein die folgende Form:
m1 ẍ1 = F1 (x12 , ẋ12 ) , m2 ẍ2 = F2 (x12 , ẋ12 ) , ẋ1 (0) = ẋ2 (0) = 0 . (2.30)
Mit Hilfe von Symmetrieüberlegungen zeigt man nun leicht, dass die beiden
Massenpunkte immer auf der Verbindungslinie x2 (0) + λx12 (0) (λ ∈ R) der
beiden Anfangsorte bleiben werden: Da die Lösung vollständig durch die Anfangsorte und Anfangsgeschwindigkeiten bestimmt ist und diese Anfangswerte
invariant unter Drehungen um die Achse x2 (0) + λx12 (0) sind, muss auch die
Lösung {x1 (t), x2 (t)} unter Drehungen um diese Achse invariant sein. Dies ist
nur dann möglich, wenn x1 (t) und x2 (t) auf dieser Verbindungslinie liegen.
23
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
Beispiel 2
Betrachten wir nun zwei Teilchen mit beliebigen Anfangsbedingungen:
m2 ẍ2 = F2 (x12 , ẋ12 ) .
m1 ẍ1 = F1 (x12 , ẋ12 ) ,
In diesem Fall kann man mit Hilfe von Symmetrieüberlegungen zeigen, dass
es ein Inertialsystem gibt, in dem die Bewegung der Teilchen in einer Ebene
stattfindet: Hierzu wähle man den Translationsvektor ξ und die Geschwindigkeit
v in der Galilei-Transformation so, dass die Anfangswerte des Schwerpunkts und
der Schwerpunktsgeschwindigkeit nach der Transformation beide Null sind:
m1 x1 (0) + m2 x2 (0)
=0
m1 + m2
,
m1 ẋ1 (0) + m2 ẋ2 (0)
=0
m1 + m2
.
In diesem Inertialsystem, das wir als K (S) bezeichnen, gilt
1
x2 (0) = − m
m2 x1 (0) k x1 (0)
1
und ẋ2 (0) = − m
m2 ẋ1 (0) k ẋ1 (0) .
Im Spezialfall ẋ1 (0) k x1 (0) ist die physikalische Situation wiederum invariant
unter Drehungen um die Achse x2 (0) + λx12 (0), und die Argumente des ersten Beispiels zeigen, dass x1 (t) und x2 (t) auch nun für alle t ≥ 0 auf dieser
Achse liegen. Falls x1 (0) und ẋ1 (0) jedoch linear unabhängig sind, können wir
definieren:
ê1 ≡
x1 (0)
|x1 (0)|
,
ê2 ≡
x1 (0) × (x1 (0) × ẋ1 (0))
|x1 (0) × (x1 (0) × ẋ1 (0))|
,
ê3 ≡ ê1 × ê2
,
und in diesem Fall ist die physikalische Situation invariant unter einer Spiegelung
an der ê1 -ê2 -Ebene (oder anders formuliert: unter einer Galilei-Transformation
−R(πê3 )). Deshalb muss auch die Lösung {x1 (t), x2 (t)} unter einer solchen Spiegelung invariant sein, und dies ist nur dann möglich, wenn die Bewegung der
beiden Teilchen in der ê1 -ê2 -Ebene stattfindet. Da die Bewegung in diesem speziellen Inertialsystem in einer Ebene stattfindet, wird sie in jedem Inertialsystem
K ′ mit vrel (K ′ , K (S) ) ⊥ R(α)−1 ê3 in einer Ebene stattfinden.
Beispiel 3
Betrachten wir schließlich drei Teilchen mit Anfangsgeschwindigkeiten, die in
irgendeinem Inertialsystem Null sind: ẋ1 (0) = ẋ2 (0) = ẋ3 (0) = 0. Wir führen
eine Translation durch, so dass auch der Massenschwerpunkt zur Zeit t = 0 Null
ist:
m1 x1 (0) + m2 x2 (0) + m3 x3 (0)
=0 .
m1 + m2 + m3
Falls die Anfangskoordinaten x1 (0), x2 (0) und x3 (0) alle auf einer Linie liegen,
zeigt die Argumentation unseres ersten Beispiels, dass die Massenpunkte sich
für alle t > 0 entlang dieser Verbindungslinie bewegen werden. Falls x1 (0) und
x2 (0) jedoch linear unabhängig sind, kann man definieren:
ê1 ≡
x1 (0)
|x1 (0)|
,
ê2 ≡
x1 (0) × (x1 (0) × x2 (0))
|x1 (0) × (x1 (0) × x2 (0))|
,
ê3 ≡ ê1 × ê2
.
24
------------------------ 2. POSTULATE UND GESETZE DER KLASSISCHEN MECHANIK
Da die physikalische Situation invariant ist unter einer Spiegelung an der ê1 -ê2 Ebene, muss dies auch für die zeitabhängige Lösung {x1 (t), x2 (t), x3 (t)} gelten,
und dies impliziert, dass die Bewegung in der ê1 -ê2 -Ebene stattfindet. Wiederum wird die mögliche Dynamik eines Systems durch elementare physikalische
Argumente stark eingeschränkt.
25
Kapitel
3
Abgeschlossene mechanische
Systeme
Wir konzentrieren uns in diesem Kapitel auf abgeschlossene mechanische Systeme, d. h. auf Systeme, die (in genügend guter Näherung) frei von äußeren
Einflüssen sind und Galilei-invarianten, d. h. beobachterunabhängigen physikalischen Gesetzen gehorchen. Wir werden zuerst die allgemeinen Eigenschaften
solcher Systeme untersuchen und anschließend einige wichtige Anwendungen behandeln. Speziell hervorzuheben sind hierbei das Zweiteilchenproblem und das
Problem der kleinen Schwingungen
Das abgeschlossene Einteilchensystem ist - wie wir aus dem vorigen Kapitel
wissen - besonders einfach. Das einzige Kraftgesetz, das in diesem Fall mit der
Galilei-Invarianz vereinbar ist, ist F = 0, und die Bewegungsgleichung lautet
dp
=0
dt
,
p = mẋ .
In jedem Inertial system erfolgt die Bewegung des Teilchens daher geradliniggleichförmig. Für abgeschlossene Mehrteilchensysteme lautet die Bewegungsgleichung
ṗi = Fi ({xji }, {ẋji }) ,
pi = mi ẋi
(i, j = 1, 2, . . . , N ) ,
(3.1)
wobei Fi gemäß dem vierten Newton’schen Gesetz unter Drehungen der Koordinatenachsen oder Raumspiegelungen wie ein echter Vektor transformiert
wird: F′i = σR−1 Fi . Einige wichtige Kraftgesetze, insbesondere das universelle Gravitationsgesetz und das Coulomb-Gesetz, erfüllen außerdem das dritte
Newton’sche Gesetz
Fi =
X
j6=i
fji
,
fji = fji (|xji |)x̂ji
,
fji = fij
(3.2)
das besagt, dass allgemeine Kräfte aus Zweiteilchenkräften aufgebaut sind, die
geschwindigkeitsunabhängig und entlang der Verbindungslinien der Teilchenpaare gerichtet sind und das Prinzip „actio = − reactio“ erfüllen.
Da das abgeschlossene Einteilchensystem für uns wegen seiner Einfachheit
wenig Überraschendes in petto hat, betrachten wir im Folgenden ausschließlich
Mehrteilchensysteme.
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
3.1
Allgemeine Eigenschaften abgeschlossener
Systeme
Die Bewegungsgleichung abgeschlossener Mehrteilchensysteme wird durch (3.1)
gegeben. Um die allgemeinen Eigenschaften von Mehrteilchensystemen formulieren zu können, definieren wir zuerst die Gesamtmasse
M≡
N
X
mi
,
i=1
den Massenschwerpunkt
xM ≡
1
M
N
X
mi xi
i=1
und den Gesamtimpuls
P ≡ M ẋM =
N
X
i=1
mi ẋi =
N
X
pi
.
i=1
Summieren wir nun die Bewegungsgleichung (3.1) über i = 1, . . . , N , so erhalten
wir die Gleichung
dP X
=
Fi ({xji }, {ẋji })
dt
i=1
N
(3.3)
für den Gesamtimpuls. Im wichtigen Spezialfall, in dem die Kraft Fi das dritte
Newton’sche Gesetz (3.2) erfüllt, erhält man:
X
dP X
fji =
=
(fji + fij ) = 0 ,
dt
i,j
i<j
(3.4)
i6=j
und wir schließen, dass der Gesamtimpuls in diesem Fall erhalten ist. Dieses
Erhaltungsgesetz ist eine sehr wichtige Eigenschaft abgeschlossener Systeme,
die die Untersuchung oder gar die Lösung der Bewegungsgleichung (3.1) unter
Umständen stark vereinfacht. Es sei noch einmal daran erinnert, dass allgemeine
elektromagnetische Kräfte das dritte Newton’sche „Gesetz“ nicht erfüllen. Für
solche Kräfte ist der Gesamtimpuls der Teilchen im Allgemeinen nicht erhalten.
Dies ist physikalisch auch gut verständlich, denn es wird ständig Impuls und
Energie zwischen den Teilchen und dem elektromagnetischen Feld ausgetauscht,
und nur der Gesamtimpuls bzw. die Gesamtenergie der Teilchen und des Feldes
zusammen stellen Erhaltungsgrößen dar.
Die Lösung der Bewegungsgleichung (3.4) ist elementar; sie lautet
P(t) = P0
,
xM (t) = xM0 +
1
M P0 t
und wird also durch zwei Integrationskonstanten xM0 und P0 charakterisiert.
Dementsprechend gibt es zwei Erhaltungsgrößen, nämlich den Gesamtimpuls
1
P(t) und die Linearkombination xM (t) − M
P(t)t, die Information über den
Anfangsort (zur Zeit t = 0) enthält.
27
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
Um weitere Erhaltungsgrößen in abgeschlossenen Mehrteilchensystemen identifizieren zu können, führen wir den Gesamtdrehimpuls
X
L=
i
xi × pi
und das Gesamtdrehmoment
N≡
X
i
xi × Fi
ein. Die einzelnen Terme xi × pi bzw. xi × Fi in diesen Summen stellen den
Drehimpuls des i-ten Teilchens bzw. das auf das i-te Teilchen wirkende Drehmoment dar. Es ist zu beachten, dass der Drehimpuls und das Drehmoment explizit
vom Ortsvektor xi und somit von der Wahl des Ursprungs abhängig sind. Wir
werden die Abhängigkeit dieser Größen von der Wahl des Koordinatensystems
unten genauer untersuchen.
Für den Gesamtdrehimpuls erhält man allgemein die folgende Bewegungsgleichung:
X
dL X
=
(ẋi × pi + xi × ṗi ) =
xi × Fi = N ,
dt
i
i
(3.5)
wobei die Beziehungen ẋi × pi = mi ẋi × ẋi = 0 und ṗi = Fi verwendet wurden. Wir stellen fest, dass ein Drehmoment generell eine zeitliche Änderung des
Drehimpulses hervorruft. Die Bewegungsgleichung (3.5) erhält eine besonders
einfache Form, falls die Kräfte Fi das dritte Newton’sche Gesetz erfüllen. In
diesem Fall vereinfacht sich (3.5) zu
X
dL X
xi × fji
=
xi × Fi =
dt
i,j
i
=
X
i<j
i6=j
(xi × fji + xj × fij ) =
X
i<j
(xi − xj ) × fji = 0
wegen xij × fji = −fji (|xji |)xji × x̂ji = 0. Wir stellen also fest, dass der Gesamtdrehimpuls in diesem wichtigen Spezialfall eine Erhaltungsgröße ist:
L(t) = L(0) ≡ L0
.
Wiederum gilt für elektromagnetische Kräfte im Allgemeinen dL
dt 6= 0, da die
Teilchen und das Feld untereinander Drehimpuls austauschen können.
Wir befassen uns weiterhin mit Kräften, die das dritte Newton’sche Gesetz
(3.2) erfüllen und betrachten nun speziell die Energie des abgeschlossenen Systems. Hierzu definieren wir die Größe
Z
Vji (x) ≡ Vji (x0 ) +
x
dx′ fji (x′ ) ,
x0
die wir als das Potential oder die potentielle Energie der Zweiteilchenkraft fji
bezeichnen. Das Potential hat in der Tat die Dimension [Kraft × Weg] und
somit [Energie]. Es ist zu beachten, dass das Potential Vji (x) lediglich bis auf
28
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
eine Integrationskonstante Vji (x0 ) bestimmt ist; der Relativabstand x0 und auch
der numerische Wert der Konstanten Vji (x0 ) sind hierbei grundsätzlich beliebig
und werden meistens aufgrund von Bequemlichkeitsargumenten festgelegt. Des
Weiteren betrachten wir die Arbeit W1→2 , die von
den
(1)
© Kräften {Fi } verrichtet
zur Zeit t1 zu den neuen
wird, wenn die Teilchen sich von den Positionen xi
(2)
©
zur Zeit t2 oder kurz: von 1 nach 2 bewegen; diese Arbeit
Positionen xi
wird definiert durch
W1→2 ≡
XZ
2
dxi · Fi
1
i
(3.6)
.
Für Kräfte, die das Gesetz „actio = − reactio“ erfüllen, vereinfacht sich (3.6) zu
W1→2
XZ
=
2
1
i,j
i6=j
XZ
=
XZ
t2
t1
i,j
i6=j
dt ẋi · fji
t2
t1
i<j
= −
dxi · fji =
XZ
dt (ẋi · fji + ẋj · fij ) =
i<j
t2
dt ẋji · x̂ji fji (|xji |) = −
t1
i<j
XZ
t2
t1
XZ
i<j
t2
X
−
Vji (|xji (t)|) = V (1) − V (2)
=
i<j
dt ẋij · fji
,
t2
dt
t1
d
Vji (|xji |)
dt
(3.7)
t1
wobei wir allgemein mit X = (x1 , x2 , . . . , xN ):
V (X) ≡
X
i<j
Vji (|xji |)
und insbesondere
V (1) ≡ V (X(1) ) ,
V (2) ≡ V (X(2) )
definierten. Die Kraft Fk , die auf das k-te Teilchen wirkt, ist in einfacher Weise
mit dem Gesamtpotential V (X) verknüpft:
2
X
−∇k V = −∇k 4
=−
=
X
i<k
X
j6=k
i<k
Vki (|xki |) +
fki (|xki |)x̂ki −
fjk (|xjk |)x̂jk =
X
k<j
X
k<j
X
3
Vjk (|xjk |)5
fjk (|xjk |)(−x̂jk )
fjk = Fk
,
j6=k
d. h. es gilt
Fi = −∇i V
(i = 1, 2, . . . , N ) .
Es ist wichtig, zu beachten, dass im Falle „actio = − reactio“ keine Arbeit
verrichtet wird, wenn die Teilchen sich entlang einer geschlossenen Schleife von
29
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
1 nach 2 und dann nach 1′ (d. h. zu den Positionen
bewegen:
”
—
”
(1)
xi
©
zur Zeit t′1 > t2 )
—
W1→2 + W2→1′ = V (1) − V (2) + V (2) − V (1) = 0 .
Man bezeichnet rein ortsabhängige Kräfte, die bei einer Bewegung der Teilchen
entlang einer geschlossenen Schleife keine Arbeit verrichten, als konservativ . Da
für alle Zweiteilchenkräfte einzeln gilt:
fji (x) = fji (x)êx = (∇Vji )(x)
,
sind alle Einzelbeiträge in der Summe
W1→2 + W2→1′ =
XZ
t1
i<j
=−
t′1
XI
dt ẋij · fji = −
(ij)
i<j
XI
i<j
(ij)
X”
dx · (∇Vji ) =
i<j
dx · fji
(1)
(1)
—
Vji (|xji |) − Vji (|xji |) = 0
gleich Null, so dass alle Zweiteilchenkräfte einzeln ebenfalls konservativ sind.
Dieses Argument zeigt außerdem, dass das allgemeine Kriterium dafür, dass
eine Zweiteilchenkraft F(x) konservativ ist, für beliebige Integrationsschleifen
x(1) → x(2) → x(1) durch
I
dx · F(x) = 0
gegeben ist. Der Stokes’sche Satz
I
Z
∂F
dx · F(x) =
F
dS · (∇ × F)
,
in dem die Integrationsfläche F nun ebenfalls beliebig ist, zeigt, dass eine Kraft
in einem topologisch einfach zusammenhängenden Raumbereich dann und nur
dann konservativ ist, wenn F in diesem Raumbereich differenzierbar ist und in
jedem Raumpunkt
∇×F=0
gilt.
Wir betrachten noch einmal die Beziehung (3.7), d. h.
W1→2 =
XZ
i
2
1
dxi · Fi = V (1) − V (2)
.
Einsetzen des zweiten Newton’schen Gesetzes (3.1) liefert:
V (1) − V (2) =
=
=
XZ
1
i
X
2
dxi · ṗi =
Z
t2
mi
i
Z
t2
mi
t1
dt ẋi · ẍi
t2
d € 1 2Š X 1
dt
mi ẋ2i ẋi =
2
2
dt
i
i
t1
(2)
Ekin
(1)
Ekin
−
X
t1
.
30
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
Hierbei wurde die kinetische Energie des Mehrteilchensystems eingeführt:
Ekin (t) ≡
X
2
1
2 mi ẋi (t)
.
i
Definieren wir nun die Gesamtenergie durch
E ≡ Ekin + V
,
so erhalten wir das extrem wichtige Ergebnis, dass die Gesamtenergie abgeschlossener mechanischer Systeme, die das dritte Newton’sche Gesetz erfüllen,
eine weitere Erhaltungsgröße darstellt:
E (1) = E (2)
.
Wählen wir nun speziell
(1)
(1)
©
(2)
(2)
©
xi , ẋi , t1 = xi (t), ẋi (t), t
©
xi , ẋi , t2 = xi (t + dt), ẋi (t + dt), t + dt
©
,
so reduziert sich die Beziehung E (1) = E (2) auf das übliche Erhaltungsgesetz
dE
=0
dt
(3.8)
für die Gesamtenergie.
3.1.1
Das Virialtheorem
Wir leiten noch eine weitere Bewegungsgleichung her, die es uns ermöglichen
wird, eine Verbindung
P zwischen den Zeitmittelwerten der kinetischen Energie undPder Größe
i xi · Fi herzustellen. Hierzu betrachten wir die Größe
G(t) ≡ i xi · pi und leiten sie nach der Zeit ab:
Š
X
X€
d X
xi · pi =
(ẋi · pi + xi · ṗi ) =
mi ẋ2i + xi · Fi
dt i
i
i
.
(3.9)
Definieren wir nun den Zeitmittelwert einer Funktion g(t), deren Funktionswerte
beschränkt sind: |g(t)| ≤ gmax < ∞ für alle t ≥ 0, durch
1
T →∞ T
g(t) ≡ lim
Z
T
dt g(t) ,
0
so folgt nach einer Zeitmittelung aus (3.9):
X
d X
xi · pi = 2Ekin +
xi · Fi
dt i
i
.
(3.10)
Nehmen wir nun an, dass die Bewegung der Teilchen des Systems auf einen
endlichen Raumbereich beschränkt ist, so dass die Funktionen xi (t), pi (t) und
somit auch G(t) und dG
dt (t) für alle t ≥ 0 beschränkt sind. In diesem Fall spielt
31
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
die Funktion dG
dt (t), an deren Zeitmittelwert wir interessiert sind, also die Rolle
von g(t), und es folgt
g(t) =
Z
1
dG
(t) = lim
T →∞ T
dt
T
dt
0
dG
G(T ) − G(0)
(t) = lim
=0 ,
T →∞
dt
T
da die Funktionswerte von G zeitlich beschränkt sind. Gleichung (3.10) vereinfacht sich daher auf
Ekin = − 12
X
i
xi · Fi
(3.11)
.
Das rechte Glied wird als das Virial (oder Clausius-Virial ) und die Beziehung
(3.11) entsprechend als das Virialtheorem bezeichnet. Das Virialtheorem ist außerordentlich nützlich z. B. bei der Bestimmung der Zustandsgleichung realer
Gase, aber auch für uns in der Mechanik: In vielen Modellrechnungen geht man
davon aus, dass die Kräfte das dritte Newton’sche Gesetz erfüllen und dass das
Wechselwirkungspotential Vji (x) eine sehr einfache homogene Form als Funktion
des Relativabstands hat:
Vji (x) = vji xα
(x ≡ |x| , α ∈ R, vji = konstant) .
(3.12)
In solchen Fällen reduziert sich (3.11) auf eine einfache Beziehung zwischen der
kinetischen und der potentiellen Energie . Dies sieht man wie folgt:
X
i
xi · Fi =
X
ij
i6=j
xi · fji =
X
i<j
(xi − xj ) · fji = −
X
i<j
xji · (∇Vji )(xji )
. (3.13)
Für homogene Potentiale der Form (3.12) gilt nun:
x · (∇Vji )(x) = x · (αvji xα−1 êx ) = αvji xα = αVji (x)
,
so dass sich (3.13) auf
X
i
xi · Fi = −α
X
i<j
Vji (|xji |) = −αV (X)
und (3.11) auf
Ekin = 12 αV (X) = 21 αEpot
reduziert. Wichtige Beispiele sind:
α
= −1 : Ekin
α
=1:
Ekin
α
=2:
Ekin
= − 21 Epot
(Kepler-/Coulomb-Problem)
= Epot
(harmonischer Oszillator) ,
=
1
2 Epot
(„quarks“)
wobei das lineare Potential (α = 1) das confinement echter quantenmechanischer quarks bzw. antiquarks natürlich nicht wirklich beschreiben kann und
lediglich als klassisches Pendant anzusehen ist.
32
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
3.2
Galilei-Transformationen
Wir untersuchen nun das Verhalten der Erhaltungsgrößen Gesamtimpuls, Gesamtdrehimpuls, Gesamtenergie usw. unter Galilei-Transformationen der Form
x′ (x, t) = σR(α)−1 x − vt − ξ
(3.14)
.
Da wir insbesondere an der Abhängigkeit dieser physikalischen Größen von der
Wahl des Koordinatensystems interessiert sind, nehmen wir der Einfachheit halber an, dass die Zeit invariant ist: t′ = t. Außerdem definieren wir die Größen
vα ≡ σR(α)v
,
ξ α ≡ σR(α)ξ
,
die es uns ermöglichen, die Galilei-Transformation auf die für manche Zwecke
bequemere Form
x′ (x, t) = σR(α)−1 (x − vα t − ξ α )
zu bringen. Wir nehmen generell an, dass das dritte Newton’sche Gesetz gilt.
Als Spezialfall der allgemeinen Galilei-Transformation (3.14) werden wir die
orthogonalen Transformationen
x′ (x, t) = σR(α)−1 x
und das Verhalten physikalischer Größen unter solchen Transformationen betrachten. Der Grund dafür, orthogonale Transformationen gesondert zu untersuchen, ist, dass sie den Tensorcharakter physikalischer Größen bestimmen: Falls
eine Größe V unter orthogonalen Transformationen genauso transformiert wird
wie der Ortsvektor, V′ = σR(α)−1 V, wird sie als echter Vektor bezeichnet.
Wird eine Größe V bis auf das Vorzeichen wie der Ortsvektor transformiert,
x′ = σR(α)−1 x, jedoch V′ = R(α)−1 V, so wird V als Pseudovektor bezeichnet. Ist eine Größe W invariant unter orthogonalen Transformationen, W ′ = W ,
so heißt sie ein Skalar . Ist eine Größe W bis auf das Vorzeichen invariant,
W ′ = σW , so wird sie als Pseudoskalar bezeichnet.
P
Als erste physikalische Größe untersuchen wir den Gesamtimpuls P = i pi .
Das Transformationsverhalten des Impulses pi des i-ten Teilchens ist durch
p′i = mi σR(α)−1 (ẋi − vα ) = σR(α)−1 (pi − mi vα )
(3.15)
und dasjenige des Gesamtimpulses somit durch
P′ = σR(α)−1 (P − M vα )
(3.16)
gegeben. Es folgt, dass sowohl Einzelimpulse als auch der Gesamtimpuls unter
orthogonalen Transformationen (d. h. für vα = 0 und ξ α = 0) gemäß
p′i = σR(α)−1 pi
,
P′ = σR(α)−1 P
transformiert werden und daher echte Vektoren sind. Außerdem folgt durch
Zeitableitung,
F′i = ṗ′i = σR(α)−1 ṗi = σR(α)−1 Fi
,
33
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
dass auch Kräfte echte Vektoren im Sinne der Tensorrechnung sind. Das Gleiche
gilt wegen der Beziehung ẋi = m1i pi natürlich auch für Geschwindigkeiten. Dass
Kräfte wie echte Vektoren transformiert werden, im Einklang mit dem vierten
Newton’schen Gesetz, ist bereits aus Gleichung (2.29) bekannt.
Betrachten wir nun das Verhalten des Gesamtdrehimpulses unter GalileiTransformationen. Nach der Transformation (d. h. im Inertialsystem K ′ ) ist der
Gesamtdrehimpuls durch
L′ =
X
i
=
x′i × p′i
X”
—
”
σR(α)−1 (xi − vα t − ξ α ) × σR(α)−1 (pi − mi vα )
i
= R(α)−1
X
i
—
(xi − vα t − ξ α ) × (pi − mi vα )
gegeben, wobei die Rechenregel
”
—
”
—
R(α)−1 a × R(α)−1 b = R(α)−1 (a × b)
1
P0 t
verwendet wurde. Mit Hilfe der expliziten Zeitabhängigkeit xM (t) = xM0 + M
′
des Massenschwerpunkts lässt sich der Ausdruck für L noch auf
"
L′ = R(α)−1
X
i
#
xi × pi − vα t × P − ξα × (P − M vα ) − M xM (t) × vα
= R(α)−1 [L − ξ α × (P0 − M vα ) − M xM0 × vα ]
(3.17)
vereinfachen. Es folgt L̇′ = R(α)−1 L̇, so dass die Gesamtdrehimpulserhaltung
im Inertialsystem K die Gesamtdrehimpulserhaltung in K ′ impliziert (und umgekehrt). Für rein orthogonale Transformationen gilt L′ = R(α)−1 L, und wir
stellen wegen des fehlenden Faktors σ in diesem Transformationsgesetz fest, dass
der Gesamtdrehimpuls einen Pseudovektor darstellt.
Das Transformationsverhalten der physikalischen Größe Arbeit folgt aus
ẋ′i = σR(α)−1 (ẋi − vα )
und Gleichung (2.29) als:
′
W1→2
=
XZ
i
=
t′1
XZ
i
t′2
dt′ ẋ′i · F′i =
XZ
i
t2
t1
”
— ”
dt σR(α)−1 (ẋi − vα ) · σR(α)−1 Fi
"Z
t2
t1
dt (ẋi − vα ) · Fi = W1→2 − vα ·
t2
dt
t1
X
—
#
Fi = W1→2
.
i
Arbeit ist daher ein Skalar unter Galilei-Transformationen und insbesondere
auch unter orthogonalen Transformationen. Analog ist auch die potentielle Energie
V ′ = V (X′ ) =
=
X
i<j
X
i<j
Vji (|x′ji |) =
X
i<j
Vji (|xji |) = V (X) = V
€
Š
Vji |σR(α)−1 xji |
34
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
ein Skalar. Die kinetische Energie Ekin wird unter Galilei-Transformationen wie
folgt transformiert:
′
Ekin
=
X
2
X
”
—2
σR(α)−1 (ẋi − vα )
(ẋ′i ) =
1
2 mi
2
(ẋi − vα ) = Ekin − M ẋM · vα + 12 M vα
i
=
X
1
2 mi
i
1
2 mi
i
2
2
= Ekin − P · vα + 21 M vα
(3.18)
.
Unter rein orthogonalen Transformationen (mit vα = 0 und ξα = 0) verhält
Ekin sich somit ebenfalls wie ein Skalar.
Nehmen wir nun an, dass die Voraussetzungen des Virialtheorems im Inertialsystem K erfüllt sind, so dass die Bewegung der Teilchen räumlich beschränkt
ist und neben
Ekin = − 12
X
i
(3.19)
xi · Fi
zum Beispiel auch P = 0 gilt. Führen wir nun eine beliebige Galilei-Transformation durch, so wissen wir bereits aufgrund von (3.18), dass die kinetische
Energie Ekin in K gemäß
2
′
′
Ekin = Ekin
− 12 M vα
− 12 M v2
= Ekin
′
in K ′ verknüpft ist. Außerdem
mit der zeitgemittelten
kinetischen Energie Ekin
P
folgt wegen i Fi = 0 aus
X
i
x′i · F′i =
=
X”
i
X
i
— ”
σR(α)−1 (xi − vα t − ξ α ) · σR(α)−1 Fi
(xi − vα t − ξ α ) · Fi =
X
i
xi · Fi
—
,
dass das Virial ein Skalar unter Galilei-Transformationen und daher insbesondere unter orthogonalen Transformationen ist. Einsetzen der beiden letzten Gleichungen in (3.19) liefert:
1X ′
(P′ )
−
x · F′
2M
2 i i i
2
′
Ekin
=
P′ = M v
,
(3.20)
.
Gleichung (3.20) ist die Verallgemeinerung des üblichen Virialtheorems (3.19)
auf Systeme mit einem Schwerpunktsimpuls P′ 6= 0.
Bisher konnten wir noch keine physikalische Größe als Pseudoskalar identifizieren. Ein typisches Beispiel eines Pseudoskalars ist das durch drei Vektoren
x1 , x2 und x3 aufgespannte Volumen. Dieses Volumen wird unter orthogonalen
Transformationen wie
Vol(x′1 , x′2 , x′3 ) = x′1 · (x′2 × x′3 )
”
— ”
= σR(α)−1 x1 ·
”
— ”
—
”
σR(α)−1 x2 × σR(α)−1 x3
—
—©
= σ R(α)−1 x1 · R(α)−1 (x2 × x3 ) = σx1 · (x2 × x3 )
= σVol(x1 , x2 , x3 )
transformiert und ist somit tatsächlich ein Pseudoskalar.
35
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
Das Schwerpunktsystem
Als Spezialfall der allgemeinen Galilei-Transformation betrachten wir Transformationen mit
vα =
1
P0
M
,
ξ α = xM0
(3.21)
,
so dass der Massenschwerpunkt im neuen Inertialsystem K (S) im Ursprung ruht:
(S)
xM (t) = x′ (xM (t), t) = σR(α)−1 [xM (t) − vα t − ξα ]
•
˜
1
P0 t − xM0 = 0 .
= σR(α)−1 xM (t) −
M
Die Parameter (σ, α) in der Galilei-Transformation sind nach wie vor beliebig.
Wir fassen die Resultate für relevante physikalische Größen im Schwerpunktsystem kurz zusammen.
Der Gesamtimpuls im Schwerpunktsystem K (S) folgt sofort aus (3.16) und
(3.21) als
P(S) = 0
.
Da der Massenschwerpunkt in K (S) ruht, kann dieses Ergebnis nicht erstaunen.
Für den Gesamtdrehimpuls folgt aus (3.17) und (3.21):
L(S) = R(α)−1 (L − xM0 × P0 )
,
oder alternativ:
L = xM0 × P0 + R(α)L(S)
.
(3.22)
Diese Gleichung besagt, dass der Gesamtdrehimpuls in einem beliebigen Inertialsystem K aus dem Drehimpuls im Schwerpunktsystem und dem im Massenschwerpunkt konzentrierten Drehimpuls zusammengesetzt ist. Gleichung (3.22)
zeigt klar, dass der Drehimpuls im Allgemeinen von der Wahl des Ursprungs abhängt; nur wenn der Massenschwerpunkt in K ruht oder der Gesamtimpuls P0
entlang xM0 ausgerichtet ist, ist der Beitrag xM0 × P0 in (3.22) im Allgemeinen
gleich Null.
Die Arbeit und die potentielle Energie sind Skalare und haben somit in K
(S)
und K (S) den gleichen Wert. Die kinetische Energie Ekin in K (S) folgt aus (3.18)
und (3.21). Das Ergebnis zeigt, dass sich die kinetische Energie in K aus der
kinetischen Energie im Schwerpunktsystem und der im Massenschwerpunkt konzentriert gedachten kinetischen Energie zusammensetzt:
Ekin =
P20
(S)
+ Ekin
2M
,
Das Virialtheorem hat im Schwerpunktsystem selbstverständlich die übliche
Form (3.19).
Nach diesen Ausführungen ist klar, dass es oft vorteilhaft ist, physikalische
Größen im Schwerpunktsystem zu untersuchen: Einerseits sind die mathematischen Zusammenhänge meist etwas einfacher als in einem beliebigen Inertialsystem. Andererseits verliert man keine Information, indem man sich auf
36
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
das Schwerpunktsystem beschränkt, da man die Ergebnisse immer mittels einer geeigneten Galilei-Transformation in die „Sprache“ eines beliebigen anderen
Inertialsystems übersetzen kann.
3.3
Das Zweiteilchenproblem - allgemeine Eigenschaften
Wir wenden das in Abschnitt [3.1] Gelernte nun an auf abgeschlossene mechanische Systeme, die aus zwei miteinander wechselwirkenden Teilchen bestehen.
Das Zweiteilchenproblem ist offensichtlich relevant für die Beschreibung zweier sich gegenseitig anziehender Himmelskörper (man kann hierbei z. B. an das
Erde-Sonne- oder das Erde-Mond-System denken); andere naheliegende Anwendungen wären die klassische Beschreibung der Schwingungs- und Rotationsbewegung zweiatomiger Moleküle oder die Beschreibung des Proton-ElektronZweiteilchensystems eines Wasserstoffatoms. Außerdem erfordert die Berechnung von Wirkungsquerschnitten für Zweiteilchenstreuung detaillierte Kenntnisse über die mögliche Bahnbewegung im Zweiteilchenproblem. Zwar spielen
normalerweise bei den letztgenannten Anwendungen auch Quanteneffekte eine
wichtige Rolle, aber dennoch ist das klassische Pendant oft eine gute Näherung
und ein erster Schritt auf dem Wege zum Verständnis der quantenmechanischen
Realität. Beispielsweise hat das klassische Zweiteilchen-Coulomb-Problem zum
Bohr’schen Atommodell und somit zu einem Durchbruch bei der Entwicklung
der Quantentheorie geführt.
In diesem Abschnitt fassen wir zuerst die bereits aus Abschnitt [3.1] bekannten allgemeinen Eigenschaften abgeschlossener Systeme für das Zweiteilchenproblem zusammen. In Abschnitt [3.4] werden dann einige exakt lösbare
Modelle (insbesondere der harmonische Oszillator und das Kepler-Problem) behandelt; außerdem diskutieren wir hier die möglichen physikalischen Bahnen für
allgemeine Potentiale der Form V (x) = V0 xα .
Wir betrachten also die Dynamik zweier Teilchen der Massen m1 bzw. m2 ,
die Kräfte aufeinander ausüben, die das dritte Newton’sche Gesetz erfüllen. Die
Bewegungsgleichungen der Teilchen lauten:
ṗ1 = F1 = f21 = f (|x21 |) x̂21
ṗ2 = F2 = f12 = f (|x12 |) x̂12
,
,
p1 = m1 ẋ1
p2 = m2 ẋ2
,
wobei die Amplitude f (x) der Kraft mit einem Potential in Verbindung gebracht
werden kann: f (x) = V ′ (x). Aus Abschnitt [3.1] wissen wir, dass der Gesamtimpuls des Zweiteilchensystems erhalten ist, P ≡ p1 + p2 = P0 , und dass sich
der Massenschwerpunkt geradlinig-gleichförmig bewegt:
xM (t) ≡
1
m1 x1 + m2 x2
= xM0 +
P0 t .
m1 + m2
M
Auch der Gesamtdrehimpuls
L = x1 × p1 + x2 × p2
und die Gesamtenergie
E = 21 m1 ẋ21 + 21 m2 ẋ22 + V (|x12 |)
37
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
sind erhalten. Außerdem gilt (zumindest für gebundene und daher räumlich
beschränkte Zweiteilchenbahnen) der Virialsatz in der Form (3.20).
Es lohnt sich sehr, das Zweiteilchenproblem im Schwerpunktsystem zu untersuchen. Dementsprechend wenden wir eine Galilei-Transformation der Form
(3.21) mit σ = +1 und α = 0 an und definieren den Relativvektor x ≡ x21 =
x′21 :
m2
m1 x1 + m2 x2
=−
x
m1 + m2
m1 + m2
m1
m1 x1 + m2 x2
=
x
x′2 ≡ x2 − xM (t) = x2 −
m1 + m2
m1 + m2
x′1 ≡ x1 − xM (t) = x1 −
.
Man überprüft leicht, dass der Massenschwerpunkt im neuen Inertialsystem tat(S)
(S)
m x′ +m x′
sächlich im Ursprung ruht: xM ≡ 1m11 +m22 2 = 0 und daher P(S) ≡ M ẋM = 0.
Der Gesamtdrehimpuls im Schwerpunktsystem,
m1 m2
(−x × ẋ′1 + x × ẋ′2 )
L(S) = x′1 × p′1 + x′2 × p′2 =
m1 + m2
= µx × ẋ′21 = µx × ẋ ,
ist selbstverständlich wiederum eine Erhaltungsgröße, da der Gesamtdrehimpuls
in jedem Inertialsystem erhalten ist. Der Parameter µ ist durch
µ=
m1 m2
=
m1 + m2

1
1
+
m1
m2
‹−1
definiert und wird als die reduzierte Masse des Zweiteilchenproblems bezeichnet.
Natürlich ist auch die Gesamtenergie im Schwerpunktsystem,
1
m m2 + m2 m21 2
1
2
2
ẋ + V (|x|)
m1 (ẋ′1 ) + m2 (ẋ′2 ) + V (|x′21 |) = 1 2
2
2
2(m1 + m2 )2
1 m1 m2
1
=
ẋ2 + V (x) = µẋ2 + V (x) , x ≡ |x| ,
2 m1 + m2
2
E (S) =
eine Erhaltungsgröße. Die Bewegungsgleichung im Schwerpunktsystem lautet
ẍ = ẍ′21 = −
1
1
1
f (x)êx −
f (x)êx = − f (x)êx
m2
m1
µ
oder auch
µẍ = −f (x)êx = −V ′ (x)êx
(3.23)
.
Mit Hilfe dieser Bewegungsgleichung überprüft man leicht, dass der Gesamtdrehimpuls und die Gesamtenergie tatsächlich erhalten sind:
dL(S)
= µ (ẋ × ẋ + x × ẍ) = −V ′ (x)x × êx = 0
dt
dE (S)
= µẋ · ẍ + V ′ (x)êx · ẋ = ẋ · (µẍ + V ′ (x)êx ) = 0
dt
.
Das Virialtheorem im Schwerpunktsystem folgt aus (3.11) als
1
2
2 µẋ
=
=
(S)
Ekin = − 12 (x′1 · f21 + x′2 · f12 )
1 ′
2 x21
· f21 = 21 x · f (x)êx = 21 xf (x) = 21 xV ′ (x)
,
(3.24)
38
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
so dass für homogene Potentiale der Form V (x) = V0 xα die einfache Beziehung
1
1
2
2 µẋ = 2 αV (x) gilt.
Wir diskutieren nun die allgemeine Lösung der Bewegungsgleichung (3.23)
im Schwerpunktsystem. Da der Gesamtdrehimpuls L(S) = µx × ẋ erhalten ist,
d (S)
= 0, findet die Bewegung in der Ebene statt, die orthogonal auf dem
dt L
Vektor L(S) steht. Es ist nun bequem, die ê3 -Richtung entlang des Vektors L(S)
zu wählen, L(S) = Lê3 mit L ≥ 0, so dass die Bewegung in der ê1 -ê2 -Ebene
stattfindet, wobei man z. B. ê1 ≡ êx (0) und ê2 ≡ ê3 × ê1 wählen kann. Es
sollte vielleicht betont werden, dass die Erhaltung des Gesamtdrehimpulses eine
Konsequenz des dritten Newton’schen Gesetzes ist, die Bewegung in der Ebene
jedoch nicht : Wie wir in Abschnitt [2.8] (Beispiel 1 und 2) gesehen haben,
folgt dies ganz allgemein für abgeschlossene Zweiteilchensysteme aus der GalileiInvarianz der Theorie. Für den Spezialfall L = 0, d. h. für x(0) k ẋ(0), findet die
Bewegung im Schwerpunktsystem entlang der Geraden λx(0) mit λ ∈ R statt
und reduziert sich (3.23) zu einem eindimensionalen Problem.
Zur Beschreibung der Bewegung in der ê1 -ê2 -Ebene ist es zweckmäßig, Polarkoordinaten einzuführen:
x = x [cos(ϕ)ê1 + sin(ϕ)ê2 ] = xêx
,
so dass die entsprechende Geschwindigkeit durch
ẋ = ẋêx + xϕ̇ [− sin(ϕ)ê1 + cos(ϕ)ê2 ]
gegeben ist. Der Gesamtdrehimpuls folgt als
Lê3 = L(S) = µx × ẋ
= µx2 ϕ̇ [cos(ϕ)ê1 + sin(ϕ)ê2 ] × [− sin(ϕ)ê1 + cos(ϕ)ê2 ]
”
—
= µx2 ϕ̇ (ê1 × ê2 ) cos2 (ϕ) + sin2 (ϕ) = µx2 ϕ̇ ê3
,
so dass seine (konstante) Amplitude L durch
L = µx2 ϕ̇
(3.25)
gegeben ist. Da die Gesamtenergie
E (S)
€
Š
=
2
1
2 µẋ
+ V (x) = 12 µ ẋ2 + x2 ϕ̇2 + V (x)
=
2
1
2 µẋ
+ 21 µx2
L
µx2
=
2
1
2 µẋ
+ Vf (x)
,

‹2
+ V (x)
L2
2µx2
,
(3.26)
2 (S)
E − Vf (x)
µ
(3.27)
Vf (x) ≡ V (x) +
zeitlich konstant ist, erhält man aus
—
2 ” (S)
ẋ =
E − Vf (x)
µ
2
r
bzw. ẋ = ±
eine leicht lösbare (separable) Differentialgleichung für die Zeit t(x) als Funktion
des Relativabstandes der zwei Teilchen:
§
—
2 ” (S)
dt
(x) = ±
E − Vf (x)
dx
µ
ª−1/2
.
39
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
Nachdem durch Integration dieser Gleichung t(x) und somit – nach Invertierung
– auch x(t) bekannt ist, kann die Zeitabhängigkeit ϕ(t) der Winkelvariablen aus
(3.25) berechnet werden:
Z
t
ϕ(t) = ϕ(0) +
0
dt′
L
µ [x(t′ )]
2
(3.28)
.
Hiermit ist das Zweiteilchenproblem für ein Zentralpotential (d. h. für den Fall
des dritten Newton’schen Gesetzes) im Prinzip vollständig gelöst.
Wir fügen einige Bemerkungen hinzu: Differentiation von (3.26) liefert wegen
der Energieerhaltung:
0 = µẋẍ + Vf′ (x)ẋ
oder auch
µẍ = −Vf′ (x)
(3.29)
.
Diese Gleichung hat die Form einer eindimensionalen Bewegungsgleichung für
ein Teilchen der Masse µ im effektiven Potential Vf (x). In ihre Herleitung geht
die Drehimpulserhaltung, Gleichung (3.25), entscheidend ein. Das effektive PoL2
tential Vf (x) enthält zwei Terme: das Zentralpotential V (x) und den Term 2µx
2 ,
der als Zentrifugalbarriere oder einfach Zentrifugalpotential bezeichnet wird.
Definieren wir die Fläche, die vom Relativvektor x(t) zwischen t = 0 und
der Zeit t überstrichen wird als A(t), dann gilt
1
1 (S)
L
dA
= |x × ẋ| =
|L | =
dt
2
2µ
2µ
,
und wir stellen daher fest, dass aufgrund der Gesamtdrehimpulserhaltung auch
die Flächengeschwindigkeit konstant ist. Dieses Resultat, das als „Flächensatz“
bekannt ist, stellt eine Verallgemeinerung des zweiten Kepler’schen Gesetzes
dar, das sich streng genommen nur auf die Planetenbewegung, d. h. auf den
Spezialfall von Gravitationskräften bezieht.
x(t)
x(t + dt)
1111
0000
ẋdt
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
0
dA
Abbildung 3.1: Flächengeschwindigkeit
40
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
3.4
Das Zweiteilchenproblem - Beispiele
Wir diskutieren einige exakte und approximative Eigenschaften von Zweiteilchensystemen mit attraktiver Paarwechselwirkung und behandeln anschließend
zwei exakt lösbare Potentialmodelle, nämlich den harmonischen Oszillator und
das Kepler-Problem.
3.4.1
Kreisbahnen
Ein Zweiteilchensystem mit attraktiver Paarwechselwirkung wird typischerweise durch eine stark abstoßende Zentrifugalbarriere (nahe x = 0) und einen attraktiven „Schwanz“ (für x → ∞) charakterisiert. Hierbei wird die AmplituL2
de des Zentrifugalpotentials 2µx
2 weitgehend durch den Gesamtdrehimpuls L
bestimmt. Aufgrund von Gleichung (3.29) ist offensichtlich, dass Kreisbahnen
(ẍ = 0) als Lösung der Bewegungsgleichung nur für x = xmin möglich sind,
wobei xmin durch
0 = Vf′ (xmin ) = V ′ (xmin ) −
L2
µ(xmin )3
oder, anders formuliert, L durch
L=
È
µx3min V ′ (xmin )
.
bestimmt wird. Die Zeitabhängigkeit der Winkelvariablen ϕ(t) folgt nun aus
(3.28) als
Lt
= ϕ(0) + t
ϕ(t) = ϕ(0) +
µ(xmin )2
Ê
V ′ (xmin )
µxmin
,
so dass die Umlaufzeit auf der Kreisbahn durch
r
T = 2π
µxmin
V ′ (xmin )
gegeben ist. Für einfache Potentiale der Form V (x) = V0 xα erhält man:
É
T = 2π
µ
1
(xmin )1− 2 α
αV0
.
Für den harmonischen Oszillator (α = 2) findet man beispielsweise, dass die Umlaufzeit unabhängig vom Radius der Kreisbahn ist, und für das Kepler-Problem
(α = −1), dass sich die Quadrate der Umlaufzeiten wie die Kuben der Radien verhalten. Das letztere Ergebnis ist ein Spezialfall des dritten Kepler’schen
Gesetzes.
3.4.2
Kleine Schwingungen
Wir betrachten nun kleine Schwingungen um die Kreisbahn x = xmin . Hierbei
bedeutet „klein“, dass die maximal erlaubte Amplitude umax der Schwingung
noch so klein ist, dass das effektive Potential Vf (x) für alle |x − xmin | ≤ umax
adäquat durch eine Parabel ersetzt werden kann:
Vf (x) ≃ Vf (xmin ) + 21 Vf′′ (xmin )(x − xmin )2
.
(3.30)
41
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
Vf (x)
xmin
x
Abbildung 3.2: Effektives Potential mit Zentrifugalbarriere
Die Bewegungsgleichung lautet daher
ẍ = − µ1 Vf′′ (xmin )(x − xmin ) ,
1 ′′
µ Vf (xmin )
oder mit den Definitionen
≡ ω 2 und x − xmin ≡ u:
ü + ω 2 u = 0 .
(3.31)
Der Relativabstand x(t) oszilliert also harmonisch mit der Frequenz ω um den
Mittelwert xmin :
u(t) = u(0) cos(ωt) +
1 du
(0) sin(ωt) ,
ω dt
wobei
Ê
•
˜2
1 du
(0)
[u(0)] +
ω dt
2
≤ umax
gelten muss, damit die harmonische Näherung (3.30) zutrifft. Normalerweise gilt
umax ≪ xmin , so dass auch die Berechnung von ϕ(t) in (3.28) sehr einfach wird:
Z
•
˜−2
Z
•
t
t
L
L
u(t′ )
u(t′ )
′
′
∼
1
+
1
−
2
dt
dt
µ(xmin )2 0
xmin
µ(xmin )2 0
xmin
§
ª
u̇(0)
u(0)
1
2L
sin(ωt) −
[1 − cos(ωt)]
ωt −
∼
.
µω(xmin )2 2
xmin
ωxmin
˜
ϕ(t) − ϕ(0) =
Die Winkelvariable steigt also grundsätzlich linear an, wie bei der Kreisbewegung, führt aber zusätzlich kleine Oszillationen mit der Frequenz ω aus. Dieses
Verhalten ist auch klar aufgrund von (3.25): ϕ(t) variiert am schnellsten, wenn
x(t) klein und u(t) negativ ist, und am langsamsten, wenn x(t) groß und u(t)
positiv ist.
42
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
3.4.3
Der harmonische Oszillator
Der isotrope dreidimensionale harmonische Oszillator wird durch das Potential
V (|x|) = 21 µω 2 x2 definiert. Die entsprechende Bewegungsgleichung folgt aus
(3.23) als
ẍ = −ω 2 x
.
Da die Bewegung orthogonal auf dem Gesamtdrehimpulsvektor L(S) = Lê3 erfolgt, gilt x3 = 0. Aufgrund der Diskussion des eindimensionalen harmonischen
Oszillators (3.31) ist klar, dass für gewisse Amplituden (a1 , a2 ) und Phasen
(ϕ1 , ϕ2 ) gilt:
x1 (t) = a1 cos(ωt + ϕ1 ) ,
x2 (t) = a2 cos(ωt + ϕ2 ) .
Man sieht sofort, dass die möglichen Bahnen des harmonischen Oszillators alle
2π
ω -periodisch und somit geschlossen sind. Es ist bemerkenswert, dass die Periode 2π
ω weder von der Form noch von der Amplitude der Bahn abhängig ist. Die
Unabhängigkeit der Periode von der Amplitude hatten wir bereits vorher für
den Spezialfall kreisförmiger Bahnen festgestellt. Durch explizite Berechnung
erhält man Ausdrücke für den Bahndrehimpuls,
L = µx × ẋ = µωa1 a2 sin(ϕ1 − ϕ2 )ê3
,
und für die Energie,
E (S) = 21 µẋ2 + 12 µω 2 x2 = 21 µω 2 (a21 + a22 )
.
Die Energie ist daher gleich der Summe der Beiträge der Schwingungen in x1 bzw. x2 -Richtung.
Definieren wir nun ϕ(t) ≡ ωt + ϕ1 und δ ≡ ϕ2 − ϕ1 , so folgt
x1 (t) = a1 cos[ϕ(t)]
und
x2 (t) = a2 cos [ϕ(t) + δ] = a2 [cos(ϕ) cos(δ) − sin(ϕ) sin(δ)]
.
Aus diesen Gleichungen kann man cos(ϕ) und sin(ϕ) bestimmen:
x1
x1
x2
cos(ϕ) =
, sin(δ) sin(ϕ) =
cos(δ) −
.
a1
a1
a2
Wegen
sin2 (δ) =
”

=
=
—
sin2 (δ) cos2 (ϕ) + sin2 (ϕ)
‹

—
x1 2 ” 2
x2
sin (δ) + cos2 (δ) +
a1
a2
 ‹2  ‹2
x1
x2
x1 x2
cos(δ)
+
−2
a1
a2
a1 a2
‹2
−2
x1 x2
cos(δ)
a1 a2
(3.32)
ist klar, dass sich der Vektor x(t) entlang einer Ellipse in der ê1 -ê2 -Ebene bewegt. Um diese Ellipse auf ihre Normalform zu bringen, schreiben wir die Ellipsengleichung (3.32) als

x1
sin (δ) =
x2
2
‹T

x
A 1
x2
‹
,
A=
1
(a1 )2
− cos(δ)
a1 a2
− cos(δ)
a1 a2
1
(a2 )2
!
43
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
und beachten, dass A eine reelle, symmetrische Matrix ist, die daher mit Hilfe
einer orthogonalen Transformation O diagonalisiert werden kann:

A = OT AD O
,
AD =
λ+
0
0
λ−
‹
.
Hierbei sind λ± die Eigenwerte von A. Wir nehmen (o. B. d. A.) an, dass
λ+ ≥ λ− gilt. Aus der expliziten Form von A folgt:
1
λ± =
2
(
1
1
+
±
2
(a1 )
(a2 )2
ʕ
1
1
+
2
(a1 )
(a2 )2
˜2
4 sin2 (δ)
−
(a1 a2 )2
)
,
so dass diese beiden Eigenwerte reell und nicht-negativ sind. Mit der Definition
 ‹

ξ1
x
=O 1
ξ2
x2
‹
,
erhält man:

x1
x2
sin2 (δ) =
‹T

OT AD O
= λ+ ξ12 + λ− ξ22
‹
 ‹T 
x1
ξ
= 1
x2
ξ2
λ+
0
0
λ−
‹ ‹
ξ1
ξ2
.
Die Normalform der Ellipse ist nun durch

1=
ξ1
α1
‹2

+
ξ2
α2
¨
‹2
mit
α1 ≡ | sin(δ)|/
α2 ≡ | sin(δ)|/
p
λ+
p
λ−
gegeben. Für δ = 0 oder δ = π vereinfacht sich die Ellipsengleichung (3.32)
auf die Gleichungen x2 = aa21 x1 bzw. x2 = − aa12 x1 für zwei Geraden, und für
€
Š2
€
Š2
= 1 in der
δ = π2 erhält man eine Ellipse mit der Normalform xa11 + xa22
ê1 -ê2 -Ebene.
Das Virialtheorem lässt sich für den harmonischen Oszillator leicht überprüfen, und ein Vergleich der beiden Ergebnisse
1
2
2 µẋ
©
€
= 21 µω 2 a21 sin2 [ϕ(t)] + a22 sin2 [ϕ(t) + δ] = 41 µω 2 a21 + a22
1
′
2 xV (x)
©
Š
€
= V (x) = 12 µω 2 a21 cos2 [ϕ(t)] + a22 cos2 [ϕ(t) + δ] = 41 µω 2 a21 + a22
Š
zeigt, dass die Identität (3.24) tatsächlich erfüllt ist. Es ist übrigens interessant,
dass die Wirkung S einer Umlaufbahn vollständig durch die Energie E (S) [und
nicht z. B. zusätzlich durch den Bahndrehimpuls] bestimmt wird:
I
S≡
Z
dx · p =
Z
T
0
dt ẋ · p = 2
2π (S)
= T (Ekin + Epot ) =
E
ω
T
dt
0
p2
= 2T Ekin
2µ
(3.33)
.
Umgekehrt wird die Energie des harmonischen Oszillators also vollständig durch
ω
S.
die Wirkung einer Umlaufbahn festgelegt: E (S) = 2π
44
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
3.4.4
Ellipsen, Hyperbeln, Parabeln
Die Standardform einer Ellipse mit den Halbachsen a1 und a2 lautet

‹2
x1
a1

+
x2
a2
‹2
=1 .
Wir nehmen (o. B. d. A.) an, dass a2 ≤ a1 gilt, und definieren1
Ê

1−
ε≡
a2
a1
‹2
p≡
<1 ,
(a2 )2
= a1 (1 − ε2 )
a1
.
Eine Parametrisierung der Ellipse mit Hilfe einer Winkelvariablen ϕ ist
√
1 − ε2 sin(ϕ)
x1 (ϕ)
ε + cos(ϕ)
x2 (ϕ)
=
=
,
,
(3.34)
a1
1 + ε cos(ϕ)
a2
1 + ε cos(ϕ)
denn es gilt

x1
a1
‹2

+
‹2
x2
a2
=
ε2 + 2ε cos(ϕ) + cos2 (ϕ) + 1 − ε2
2
[1 + ε cos(ϕ)]
2
1 + 2ε cos(ϕ) + ε cos2 (ϕ)
=1 .
=
2
[1 + ε cos(ϕ)]
1 − cos2 (ϕ)
Alternativ kann man (3.34) als
a1 (1 − ε2 ) cos(ϕ)
p cos(ϕ)
x1 = a1 ε +
= a1 ε +
1 + ε cos(ϕ)
1 + ε cos(ϕ)
√
a1 (1 − ε2 ) sin(ϕ)
p sin(ϕ)
a2 1 − ε2 sin(ϕ)
=
=
x2 =
1 + ε cos(ϕ)
1 + ε cos(ϕ)
1 + ε cos(ϕ)
oder mit (x1 , x2 ) ≡ x und (a1 ε, 0) ≡ b auch kurz als

x − b = r(ϕ)
cos(ϕ)
sin(ϕ)
‹
,
r(ϕ) ≡
p
1 + ε cos(ϕ)
(3.35)
darstellen. Gleichung (3.35) besagt, dass der Relativvektor x − b einen Winkel
ϕ mit der ê1 -Achse macht und die Länge r(ϕ) hat. Offensichtlich ist (ϕ, r(ϕ))
eine mögliche und bequeme alternative Parametrisierung der Ellipse. Der Referenzpunkt b wird als Brennpunkt der Ellipse bezeichnet.
Die Standardform einer Hyperbel lautet

x1
a1
‹2

−
x2
a2
‹2
=1
mit a1 > 0 und a2 > 0. Wir definieren nun:
Ê
ε≡

1+
a2
a1
‹2
>1 ,
p≡
(a2 )2
= a1 (ε2 − 1)
a1
1 Der Parameter ε wird als Exzentrizität und p als semilatus rectum oder schlichtweg als
„Parameter“ bezeichnet.
45
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
und erhalten die Parametrisierung
ε + cos(ϕ)
x1 (ϕ)
=±
a1
1 + ε cos(ϕ)
√
ε2 − 1 sin(ϕ)
x2 (ϕ)
=
a2
1 + ε cos(ϕ)
,
der zwei Zweige der Hyperbel. Wiederum gibt es eine alternative Kurzform:

x − b′± = r(ϕ)
∓ cos(ϕ)
sin(ϕ)
‹

b′± =
,
‹
±a1 ε
0
,
r(ϕ) =
p
1 + ε cos(ϕ)
,
die zeigt, dass die zwei Zweige der Hyperbel mittels (ϕ, r(ϕ)) parametrisiert
werden können.
Die Parabel kann im Grenzfall ε ↑ 1, wobei p = a1 (1 − ε2) festgehalten wird,
aus der Ellipse erhalten werden. Aus (3.35) folgt nämlich im Limes ε ↑ 1:

xr ≡ (x − b) = r(ϕ)
cos(ϕ)
sin(ϕ)
‹
,
r(ϕ) =
p
1 + cos(ϕ)
(3.36)
.
Man überprüft leicht, dass
•
˜
cos(ϕ)
1
x1r
cos(ϕ) − 1
=
=
1+
=
p
1 + cos(ϕ)
2
1 + cos(ϕ)
x2r
sin(ϕ)
=
= tan( 21 ϕ)
p
1 + cos(ϕ)
1
2
”
—
1 − tan2 ( 21 ϕ)
gilt, so dass xr tatsächlich eine Parabel darstellt:
x1r = 12 p 1 −

x2r
p
‹2 .
Beim Grenzwertprozess (3.36) ist übrigens zu beachten, dass sowohl b1 = a1 ε →
∞ als auch x1 → ∞ gilt, die Relativkoordinate x1r = x1 − b1 jedoch endlich
bleibt.
Zusammenfassend gilt also in allen drei Fällen die Polardarstellung
r(ϕ) =
p
1 + ε cos(ϕ)
(3.37)
,
wobei 0 ≤ ε < 1 der Ellipse entspricht, ε = 1 der Parabel und ε > 1 der
Hyperbel.
3.4.5
Das Kepler-Problem
Das Kepler-Problem, d. h. das Zweiteilchenproblem mit dem Gravitationspotential
V (x) = −
Gm1 m2
GµM
=−
x
x
,
ist wegen seiner großen Bedeutung für die Astronomie wohl das wichtigste Einzelproblem der elementaren Theoretischen Mechanik. Das Kepler-Problem ist in
der Klasse der Zentralpotentiale insofern ungewöhnlich, als es neben dem Gesamtdrehimpuls L(S) und der Gesamtenergie E (S) , die für alle Zentralpotentiale
46
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
erhalten sind, noch eine weitere nicht-triviale Erhaltungsgröße aufweist, den sogenannten „Lenz’schen Vektor“ 2
a ≡ ẋ × L(S) + V (x)x
.
Wegen L̇(S) = 0 und ẍ = − µ1 V ′ (x)êx , s. Gleichung (3.23), gilt nämlich
da
= ẍ × L(S) + V ′ (x)(êx · ẋ)x + V (x)ẋ
dt
= xV ′ (x) [êx (êx · ẋ) − êx × (êx × ẋ)] + V (x)ẋ
d
= [xV ′ (x) + V (x)]ẋ = ẋ [xV (x)] = 0 ,
dx
wobei im zweiten Schritt die Identität (2.17) mit (ẋ, êx ) statt (x, α̂) verwendet wurde. Die Existenz einer weiteren Erhaltungsgröße deutet darauf hin, dass
das Kepler-Problem eine größere Symmetrie als das generische Zentralpotential
hat; diese größere Symmetrie wird insbesondere bei der Behandlung des Wasserstoffproblems in der nicht-relativistischen Quantenmechanik sehr wichtig. Auf
die geometrische Bedeutung des Lenz’schen Vektors gehen wir am Ende dieses
Abschnitts näher ein.
Kepler-Bahnen
Um das Kepler-Problem zu lösen, rufen wir zuerst die Gleichungen (3.25) und
(3.27) für die Zeitableitungen der Variablen (ϕ, x) in Erinnerung:
ϕ̇ =
L
µx2
,
ẋ2 =
—
2 ” (S)
E − Vf (x)
µ
,
Vf (x) = V (x) +
L2
2µx2
.
Dividiert man die Gleichung für ẋ2 durch ϕ̇2 , so folgt
d(x−1 )
dϕ
2

−4
=x
dx
dϕ
‹2
−4
=x
GµM
2µ
L2
ẋ2
(S)
E
+
=
−
ϕ̇2
L2
x
2µx2
µ2 GM −1
2µE (S)
+
2
x − x−2
L2
L2
€
Š2
2µE (S)
−2
+
p
=
− x−1 − p−1
2
L
=
,
2
wobei der Parameter p−1 ≡ µ LGM
definiert wurde. Führt man nun eine neue
2
Variable u ≡ x−1 − p−1 ein, erhält man die Differentialgleichung

du
dϕ
‹2
=
2µE (S)
+ p−2
L2
− u2
,
(3.38)
2
d u
die nach Ableiten bezüglich ϕ in dϕ
2 = −u übergeht. Die allgemeine Lösung
dieser Gleichung ist offensichtlich in der Form u(ϕ) = A cos(ϕ + ϕ0 ) darstellbar,
2 Der
„Lenz’sche Vektor“ wurde allerdings keineswegs erstmals von Wilhelm Lenz (1924),
sondern bereits 1710 von Jakob Hermann und Johann I. Bernoulli entdeckt. Da auch Laplace
und C. Runge den „Vektor“ diskutierten, wird er manchmal mit einem Hauch von Ironie auch
als Hermann-Bernoulli-Laplace-Runge-Lenz-Vektor bezeichnet. Die Bezeichnung „Lenz’scher
Vektor“ geht auf Pauli (1926) zurück.
47
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
wobei wir o. B. d. A. annehmen können, dass die Amplitude A positiv ist: A > 0.
Mit der Definition Ap ≡ ε folgt noch
”
—−1
p
p
=
=
,
(3.39)
x(ϕ) = u(ϕ) + p−1
1 + p u(ϕ)
1 + ε cos(ϕ + ϕ0 )
und ein Vergleich mit (3.37) zeigt sofort, dass die möglichen Lösungen des
Kepler-Problems die Form von Ellipsen (0 ≤ ε < 1), Parabeln (ε = 1) oder
Hyperbeln (ε > 1) besitzen. Eine Beziehung zwischen dem Parameter ε und der
Energie der Bahn folgt durch Einsetzen der Lösung u(ϕ) in (3.38):
2µp2 (S)
E = p2
L2
•
du
dϕ
‹2
˜
+u
2
−1
= (Ap)2 [sin2 (ϕ + ϕ0 ) + cos2 (ϕ + ϕ0 )] − 1 = ε2 − 1
und das Resultat ist:
E (S) =
L2
2µ
µ2 GM
L2
2

(ε2 − 1) = − 12 µ
GµM
L
‹2
(1 − ε2 )
.
(3.40)
Man sieht, dass die Ellipsenform (0 ≤ ε < 1) einer negativen Energie (d. h. einem
gebundenen Zustand) entspricht, dass parabelförmige Bahnen (ε = 1) nur für
E (S) = 0 auftreten und dass eine positive Bahnenergie (d. h. ein Streuzustand)
zu Hyperbeln führt. Die Ellipsenform der Planetenbahnen wurde zuerst von
Kepler am Mars beobachtet und ist als das erste Kepler’sche Gesetz bekannt.
Es ist äußerst bemerkenswert, dass alle gebundenen Zustände (E (S) < 0) des
Kepler-Potentials durch geschlossene Bahnen beschrieben werden. Es sei daran erinnert, dass alle möglichen Bahnen des harmonischen Oszillators ebenfalls
geschlossen sind. Das Kepler-Problem ist insofern „aufgeschlossener“ als der harmonische Oszillator, als für das Kepler-Potential auch offene Bahnen möglich
sind (nämlich für E (S) = 0 bzw. für E (S) > 0).
Die Beziehung (3.40) zwischen den Erhaltungsgrößen E (S) und L und der
Exzentrizität ε kann auch anders (und einfacher) dargestellt werden. Aus der
2
Definition p−1 = µ LGM
des Parameters p folgt nämlich
2
E (S) = −
GµM
GµM
= 21 V (a1 )
(1 − ε2 ) = −
2p
2a1
(3.41)
für ellipsenförmige Bahnen [E (S) < 0] und
E (S) = −
GµM
GµM
= − 12 V (a1 )
(1 − ε2 ) =
2p
2a1
(3.42)
für Hyperbeln [E (S) > 0]. Beide Formeln sind korrekt für parabelförmige Bahnen
[E (S) = 0], da in diesem Fall a1 = ∞ gilt. Das Interessante an der Darstellung
(3.41), (3.42) ist, dass die Energie E (S) lediglich durch den Bahnparameter a1
(oder umgekehrt: die große Halbachse a1 lediglich durch die Energie) bestimmt
wird.3 Die Energie hängt also nicht zusätzlich von a2 (oder äquivalent: von ε
oder p) ab. In diesem Sinne liegt im Kepler-Problem eine ungewöhnliche Energieentartung vor. Auf diese Entartung kommen wir im Folgenden ausführlich
zurück.
3 Kombination
mit dem Virialtheorem E (S) = Ekin + Epot =
1
E
2 pot
=
1
V
2
(x(t)) zeigt für
geschlossene (d. h. ellipsenförmige) Bahnen außerdem, dass V (x(t)) = V (a1 ) gilt, so dass auch
die mittlere potentielle und die mittlere kinetische Energie lediglich durch a1 bestimmt sind.
48
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
Die Zeitabhängigkeit
Es ist nun auch durchaus möglich, die Zeitabhängigkeit ϕ(t) der Winkelvariablen
oder äquivalent die Winkelabhängigkeit t(ϕ) der Zeitvariablen zu bestimmen.
Wir wählen ϕ0 = 0 in (3.39), damit die Variable ϕ geometrisch als Winkel
zwischen dem Radiusvektor (d. h. x − b, xr oder x − b′± ) und der ê1 -Achse
interpretiert werden kann. Außerdem ist es bequem, den Zeitnullpunkt durch
t(0) = 0 festzulegen, so dass die Zeit ab dem Durchlaufen des Perizentrums4
gemessen wird. Durch Integration von (3.25) erhält man dann
t(ϕ) =
µ
L
Z
ϕ
dϕ′ [x(ϕ′ )]2 =
0
Z
µp2
τ (ϕ)
L
,
τ (ϕ) ≡
0
ϕ
dϕ′
1
[1 + ε cos(ϕ′ )]2
.
Das Integral τ (ϕ) kann nun mit Hilfe von geeigneten Handbüchern [14], Formeln
(2.554.3) und (2.553.3), berechnet werden. Für eine Ellipse (0 ≤ ε < 1) lautet
das Ergebnis:
¨
–√
™«
1 − ε2 tan( 12 ϕ)
−1
2
ε sin(ϕ)
arctan
τ (ϕ) =
−√
, (3.43)
1 − ε2 1 + ε cos(ϕ)
1+ε
1 − ε2
und man überprüft leicht die Korrektheit dieses Resultats durch Differentiation.
In (3.43) ist zu beachten, dass arctan(z) nur bis auf ein ganzzahliges Vielfaches
von π definiert ist; diese zusätzlichen Konstanten sind so zu wählen, dass τ (ϕ)
eine kontinuierliche Funktion mit τ (0) = 0 ist. Für Hyperbelbahnen (ε > 1)
erhält man
¨
–√
™«
ε2 − 1 tan( 12 ϕ)
ε sin(ϕ)
2
1
artanh
. (3.44)
−√
τ (ϕ) = 2
ε − 1 1 + ε cos(ϕ)
1+ε
ε2 − 1
√
√
Dies sieht man noch am einfachsten, indem man in (3.43) 1 − ε2 durch i ε2 − 1
ersetzt und die Beziehung arctan(iz) = i artanh(z) verwendet.
€ ŠDa für die Hyperbel [1 + ε cos(ϕ)] > 0 und somit |ϕ| < ϕ∞ ≡ π − arccos 1ε gilt, folgt aus
(3.44):
τ (ϕ)
∼
∼
1
(1+ε)2 ϕ
1
ε2 −1 (ϕ∞
− ϕ)−1
(ϕ → 0)
(ϕ ↑ ϕ∞ ) .
Es folgt, dass die zwei Massenpunkte (nicht erstaunlicherweise) eine unendlich
lange Zeit benötigen, um sich unendlich weit voneinander zu entfernen:
ϕ(t) ∼ ϕ∞ −
1 1
2
ε −1τ
t=
µp2
τ →∞
L
.
Für parabelförmige Bahnen folgt durch explizite Berechnung oder Verwendung
von Handbüchern:
τ (ϕ) =
1
2
tan
€
Š”
1
2ϕ
1+
1
3
tan2
€
Š—
1
2ϕ
.
4 Bei der Ellipse wird ϕ = π entsprechend als Apozentrum bezeichnet. In konkreten Anwendungen hat man also einerseits ein Perihel, Perigäum, Perijovum, usw., und andererseits
ein Aphel, Apogäum, Apojovum, usw.
49
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
Es gilt τ (ϕ) ∼ 41 ϕ für ϕ → 0 und τ (ϕ) ∼ 34 (π − ϕ)−3 für ϕ ↑ π oder äquivalent
€
Š1/3
4
ϕ(t) ∼ π − 3τ
für t → ∞.
Für elliptische Kepler-Bahnen ist die Zeitabhängigkeit der Winkelvariablen
2
periodisch mit der Periode T ≡ µp
L τ (2π) mit
2
arctan
τ (2π) =
(1 − ε2 )3/2
‚√
1 − ε2 tan(π)
1+ε
Œ

a1
2π
= 2π
=
p
(1 − ε2 )3/2
‹3/2
.
Die Umlaufzeit T der elliptischen Bahn ist daher durch

‹
(a1 )3/2
p3/2
µp2
a1 3/2
= 2π √
τ (2π) = 2π √
L
GM p
GM
√
gegeben, wobei L = µ GM p verwendet wurde. Wir stellen fest, dass sich die
Quadrate der Umlaufzeiten für alle elliptischen Bahnen (d. h. nicht nur für
Kreisbahnen, wie vorher gezeigt wurde) wie die Kuben der großen Halbachsen
verhalten (drittes Kepler’sches Gesetz).
Es sollte übrigens darauf hingewiesen werden, dass die Umlaufzeit auch viel
einfacher berechnet werden kann: Sie folgt sofort aus dem zweiten Kepler-Gesetz
dA
L
dt = 2µ und der bekannten Gesamtfläche AE = πa1 a2 einer Ellipse:
T =
Z
Z
T
AE
dt =
T =
0
0
dA
2µ
=
dA/dt
L
Z
AE
dA =
0
(a1 )3/2
µa1 a2
a1 a2
= 2π √
= 2π
= 2π √
L
GM p
GM
2µAE
L
,
2
wobei im letzten Schritt die Beziehung p = (aa21) verwendet wurde. Da aufgrund
von (3.41) bekannt ist, dass die große Halbachse a1 der Ellipsenbahn vollständig
durch die Energie E (S) festgelegt wird, können wir schließen, dass auch die
Umlaufzeit,
”
—−3/2
(a1 )3/2
T = 2π √
= 2πGM − µ2 E (S)
GM
,
lediglich von der Energie abhängig ist.
Eine weitere physikalische Größe, die lediglich durch die im Schwerpunktsystem gemessene Energie E (S) bestimmt wird, ist die Wirkung einer Umlaufbahn,
die wir bereits vorher [s. (3.33)] bei der Behandlung des harmonischen Oszillators kennengelernt haben. Für das Kepler-Problem erhält man:
I
S=
”
—
”
dx·p = 2T Ekin = −2T E (S) = µT − µ2 E (S) = 2πGµM − µ2 E (S)
—−1/2
,
wobei wiederum das Virialtheorem verwendet wurde: Epot = −2Ekin und daher
E (S) = Ekin + Epot = −Ekin . Es folgt umgekehrt für Ellipsenbahnen:
2
− E (S) =
µ

GµM
S/2π
‹2
,
(3.45)
so dass die Energie vollständig durch die Wirkung der Bahn festgelegt ist.
50
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
Ausblick: Das Wasserstoffproblem in der Quantenmechanik
An dieser Stelle gibt es eine sehr wichtige Querverbindung zur Quantenmechanik, in der das Kepler-Problem durch das Wasserstoff- oder Coulomb-Problem
e2
ersetzt wird. In Bohrs semiklassischer Beund Gµm entsprechend durch 4πε
0
handlung des Wasserstoffproblems (1913) wird die Wirkung S gemäß S =
nh quantisiert, wobei h das Planck’sche Wirkungsquantum darstellt und n =
h
≡ ~ findet
1, 2, . . . als Hauptquantenzahl bezeichnet wird. Mit der Definition 2π
man also:
E
(S)
1
= − 2 ry ,
n
µ
ry ≡
Ry
me
Ry ≡
,
1
2 me
e2
4πε0 ~
2
.
Die für das Wasserstoffspektrum charakteristische Energie ry hängt also in einfacher Weise mit der sogenannten Rydberg-Energie Ry zusammen. Da das Proton viel schwerer als das Elektron ist, mp /me ≃ 2000, ist die reduzierte Masse
€
Š−1
des Wasserstoffproblems im Wesentlichen gleich der Elektroµ = m1e + m1p
nenmasse me , so dass ry ≃ Ry gilt. Wichtig am quantenmechanischen Resultat
E (S) = − n12 ry ist vor allem die hohe Entartung, wobei die Energie lediglich
von der Hauptquantenzahl n und nicht z. B. zusätzlich von der Bahndrehimpulsquantenzahl l abhängig ist. Dies ist vollkommen analog zu den klassischen
Ergebnissen (3.41) und (3.45), die zeigen, dass die Energie der Bahnbewegung
lediglich durch a1 oder S und nicht z. B. zusätzlich durch L bestimmt wird. Wir
werden im Folgenden sehen, dass diese Entartung eng mit der Existenz einer zusätzlichen Erhaltungsgröße im Kepler- oder Coulomb-Problem, des Lenz’schen
Vektors, zusammenhängt. Wegen der zentralen Rolle des „Vektors“ gehen wir
nun kurz auf seine geometrische Interpretation ein.
Interpretation des Lenz’schen Vektors
Da wir nun wissen, dass alle Kepler-Bahnen Ellipsen, Parabeln oder Hyperbeln sind, kann auch die zusätzliche Erhaltungsgröße des Kepler-Problems, der
Lenz’sche Vektor, leicht geometrisch interpretiert werden: Da wir bereits wissen, dass dieser Vektor zeitunabhängig ist, können wir ihn o. B. d. A. für ϕ = 0
auswerten. In diesem Fall gilt jedoch ẋ = xϕ̇(ê3 × êx ), so dass
a = ẋ × L(S) + V (x)x
= Lxϕ̇(ê3 × êx ) × ê3 + xV (x)êx
= [Lxϕ̇ + xV (x)] êx
in der êx (ϕ = 0)-Richtung und somit vom Referenzpunkt (Brennpunkt) zum
Perizentrum zeigt. Die Amplitude des Lenz’schen Vektors folgt aus
ϕ̇ =
L
µx2
,
als
x(ϕ = 0) =
[Lxϕ̇ + xV (x)]ϕ=0
p
1+ε
L2
=
− GµM
µx
,
=
ϕ=0
p=
L2
Gµ2 M
L2
(1 + ε) − GµM
µp
= GµM (1 + ε) − GµM = GµM ε ≥ 0 .
Es ist zu beachten, dass der Lenz’sche Vektor sowohl für Ellipsenbahnen als
auch für parabel- und hyperbelförmige Bahnen existiert und relevant ist.
51
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
ẋ
x
0
Abbildung 3.3: Zur Bestimmung des Lenz’schen Vektors
Das Virialtheorem
Wir haben in diesem Abschnitt bereits mehrmals das Virialtheorem Ekin =
− 21 Epot verwendet, das aufgrund der Energieerhaltung, Ekin + Epot = E (S) ,
auch als
Epot = V (x) = 2E (S)
geschrieben werden kann. Zum Abschluss dieses Abschnitts überprüfen wir das
Virialtheorem nun explizit mit Hilfe der exakten Lösung des Kepler-Problems.
Selbstverständlich ist diese Aussage des Virialtheorems nur für gebundene Zustände (d. h. für 0 ≤ ε < 1) relevant, da die Bahnen nur in diesem Fall räumlich
L
beschränkt sind. Mit Hilfe der Beziehung ϕ̇ = µx
2 kann die Zeitmittelung über
eine Periode T der Kepler-Bewegung auch durch eine Mittelung über den Winkel
ϕ ersetzt werden:
1
V (x) = −
T
Z
T
0
GµM
1
dt
=−
x(ϕ(t))
T
Z
2π
0
GµM
Gµ2 M
dϕ
=−
ϕ̇x(ϕ)
TL
Z
2π
dϕ x(ϕ)
.
0
Mit Hilfe von
3/2
p3/2
a
= 2π √
(1 − ε2 )−3/2
T = 2π √ 1
GM
GM
und x(ϕ) =
p
1+ε cos(ϕ)
erhält man:
µ2 (GM )3/2
(1 − ε2 )3/2
V (x) = −
√
2πL p
Z
2π
dϕ
0
1
1 + ε cos(ϕ)
.
Das Integral lässt sich wiederum mit Hilfe von Handbüchern berechnen (siehe
z. B. [14], Formel (2.553.3)):
–√
™ 2π
Z 2π
1 − ε2 tan( 12 ϕ) 1
2
dϕ
arctan
=√
1 + ε cos(ϕ)
1+ε
1 − ε2
0
0
und es folgt in der Tat:
µ2 (GM )3/2
V (x) = −
L
2
2π
=√
(π − 0) = √
2
1−ε
1 − ε2
r

Gµ2 M
GµM
(1 − ε2) = −µ
2
L
L
wobei noch einmal die Beziehung p =
L2
Gµ2 M
,
‹2
(1 − ε2 ) = 2E (S)
verwendet wurde.
,
52
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
3.4.6
Geschlossene Bahnen und Gleichförmigkeit
In Abschnitt [3.4.3] konnten wir feststellen, dass alle möglichen Bahnen der Lösung des dreidimensionalen harmonischen Oszillators ellipsenförmig und somit
geschlossen sind. Aus Abschnitt [3.4.5] ist bekannt, dass alle räumlich beschränkten Bahnen des Kepler-Problems ebenfalls geschlossen sind. Des Weiteren wissen wir aus Abschnitt [3.4.1], dass für recht allgemeine Zweiteilchenprobleme
mit attraktiver Wechselwirkung Kreisbahnen möglich sind, so dass zumindest
einige mögliche Lösungen geschlossen sind. Man kann sich nun fragen, ob bzw.
inwiefern die Geschlossenheit der möglichen Bahnen eine allgemeine Eigenschaft
von Zentralpotentialen ist. Mit relativ geringem Aufwand kann man zeigen (s.
Anhang A), dass innerhalb der großen Klasse der Zentralpotentiale nur für den
harmonischen Oszillator und das Kepler-Problem,
V (x) = V0 x2
bzw. V (x) = −V0 x−1
(V0 > 0) ,
alle räumlich beschränkten Lösungen auch tatsächlich geschlossen sind. Für alle
anderen Zentralpotentiale haben die möglichen räumlich beschränkten Bahnen
im Allgemeinen die Form von Rosetten, die überall im ringförmigen Streifen
x− ≤ x ≤ x+ dicht liegen. Hierbei entspricht x− dem Relativabstand der beiden
Teilchen beim Durchlaufen des Perizentrums, und analog entspricht x+ dem
Apozentrum.
Nehmen wir nun an, ein Zentralpotential habe die Form V (x) = V0 xα und
besitze somit die Eigenschaft V (λx) = λα V (x) für alle λ > 0. Nehmen wir
des Weiteren an, für dieses Zentralpotential existiere eine Bahn x(t). Man kann
dann leicht zeigen, dass neben x(t) auch
x′ (t′ ) ≡ λx(λ−β t′ )
,
t = λ−β t′
(3.46)
für entsprechend gewähltes β und alle λ > 0 eine mögliche Bahn darstellt. Dies
folgt aus der Beziehung V ′ (λx) = λα−1 V ′ (x) und
µ
d2 x(λ−β t′ )
d2 x′ ′
(t ) + V ′ (x′ )ê′x = µλ
+ V ′ (λx)êx
′
2
(dt )
(dt′ )2
€
Š
= µλ1−2β ẍ(t) + λα−1 V ′ (x)êx = − λ1−2β − λα−1 V ′ (x)êx
,
wobei im letzten Schritt die Bewegungsgleichung µẍ = −V ′ (x)êx für x(t) eingesetzt wurde. Man sieht, dass x′ (t′ ) dann und nur dann eine Lösung der Bewegungsgleichung darstellt, wenn der Exponent β den Wert
β =1−
α
2
(3.47)
hat. Man bezeichnet die Lösungen (3.46) mit β wie in (3.47) und λ > 0 als
eine Klasse von Gleichförmigkeitslösungen für das Potential V (x). Nehmen wir
schließlich an, dass die Bahn x(t) räumlich begrenzt und geschlossen (und somit
periodisch) ist; ihre Periode sei T und ihre Amplitude beim Durchlaufen des
Apozentrums x+ . Die durch λ charakterisierte Gleichförmigkeitslösung hat dann
die maximale Amplitude x′+ = λx+ und die Periode T ′ = λβ T . Es folgt
T′
=
T
x′+
x+
β
=
x′+
x+
1− α2
.
(3.48)
53
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
Für den harmonischen Oszillator gilt also, dass die Schwingungszeit unabhängig
von der Amplitude ist. Für α = −1 findet man das dritte Kepler-Gesetz, und
auch für alle anderen möglichen räumlich begrenzten, geschlossenen Bahnen
zeigt (3.48), dass das Skalierungsverhalten der Umlaufzeit mit der Bahngröße
in einfacher Weise durch den Exponenten α bestimmt wird.
3.4.7
Die Bahn des Merkur
Seit den sehr genauen Beobachtungen der Merkurbahn durch Urbain Jean Joseph le Verrier (1859) ist bekannt, dass diese recht exzentrische Bahn nahe der
Sonne (ε = 0, 2056 , a1 = 57, 91 · 106 km) nur auf der Basis unrealistischer Annahmen, die nicht mit den astronomischen Beobachtungen im Einklang sind, mit
den Gesetzen der Newton’schen Mechanik erklärt werden kann: Die Präzession
des Perihels des Merkur ist stärker als es aufgrund von Störungen durch andere
Planeten mit Hilfe der nicht-relativistischen Klassischen Mechanik theoretisch
erklärbar ist. Die beobachtete Präzession des Perihels ist ∆ϕexp = 5600, 73 ±
0, 41′′ /Jahrhundert. Hiervon sind etwa 5025′′ durch eine zeitliche Änderung des
Koordinatensystems (d. h. durch eine Drehung der Erdbahn) erklärbar. Störungen durch andere Planeten tragen weitere 532′′ /Jahrhundert zur Präzessionsgeschwindigkeit bei. Insgesamt kann man aufgrund der Newton’schen Mechanik
also eine Präzessionsgeschwindigkeit von ∆ϕN = 5557, 62 ± 0, 20′′ /Jahrhundert
verstehen. Unerklärt bleiben:
∆ϕ ≡ ∆ϕexp − ∆ϕN = 43, 11 ± 0, 45′′ /Jahrhundert .
Der Merkur ist nicht der einzige Himmelskörper, dessen Bahn ungewöhnliches
Präzessionsverhalten aufweist: Analog findet man ∆ϕ = 8, 4 ± 4, 8′′ /Jh. für Venus, ∆ϕ = 5, 0 ± 1, 2′′ /Jh. für die Erde und ∆ϕ = 9, 8 ± 0, 8′′ /Jh. für Icarus,
einen Planetoiden mit einer stark exzentrischen Bahn (ε = 0, 827), der die Bahnen von Merkur, Venus, Erde und Mars kreuzt. Die größere Ungenauigkeit des
∆ϕ-Werts für Venus entsteht u.a. dadurch, dass die Venusbahn nahezu kreisförmig ist (ε = 0, 007), so dass genaue Beobachtungen des Periheldurchgangs
schwieriger sind.
Die theoretische Erklärung für die anomale Präzession des Merkur wurde
1915 geliefert, als A. Einstein am 18. November eine seiner Arbeiten über die
allgemeine Relativitätstheorie bei der Preußischen Akademie der Wissenschaften zur Publikation einreichte. Die korrekte Erklärung dieses schon mehr als 50
Jahre alten Problems war sicherlich ein großer Triumph für die allgemeine Relativitätstheorie, deren definitive Formulierung übrigens erst eine Woche später
(am 25. November) von Einstein zur Publikation eingereicht wurde.
Betrachten wir zuerst noch einmal die Kepler’sche Bewegungsgleichung, die
auf der nicht-relativistischen Newton’schen Mechanik beruht:
Gµ2 M
d2 (x−1 )
−1
+
x
=
≡ p−1
dϕ2
L2
.
Einstein hat gezeigt, dass aufgrund allgemein relativistischer Effekte in der Bewegungsgleichung ein weiterer Term auftritt:
3GM
d2 (x−1 )
+ x−1 = p−1 + 2 x−2
dϕ2
c
.
(3.49)
54
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
Bei der Behandlung der Kepler-Bahnen (ohne relativistische Korrekturen) wurde bereits die neue Variable u = x−1 − p−1 eingeführt. Um die Effekte der
relativistischen Korrektur in (3.49) besser einschätzen zu können, ist es zweckmäßig, die dimensionslose Größe
p
v ≡ pu = p(x−1 − p−1 ) = − 1
x
und den dimensionslosen Parameter
α≡
3GM
3
3GM Gµ2 M
= 2
=
2
2
2
c p
c
L
c

GµM
L
‹2
einzuführen. Mit diesen Definitionen erhält man:
d2 v
3GM p 2
= α(1 + v)2
+
v
=
dϕ2
c2 p x
(3.50)
.
Hierbei ist der Parameter α sehr klein (typischerweise von Ordnung 10−7 ), so
dass es naheliegt, die relativistischen Korrekturen in Störungstheorie zu behandeln.
Die Lösung von (3.50) in „nullter“ Ordnung, d. h. für α = 0, hat die bereits
bekannte Form
v(ϕ) = pA cos(ϕ + ϕ0 ) = ε cos(ϕ + ϕ0 ) ≡ v0 (ϕ)
.
Für α 6= 0 erwartet man Korrekturterme, die nach Potenzen von α geordnet
werden können:
v(ϕ) =
∞
X
αn vn (ϕ)
,
(3.51)
n=0
wobei vn (ϕ) nicht von α abhängen soll. Einsetzen des Ansatzes (3.51) in (3.50)
liefert bis zur ersten Ordnung in α:
d2 v
+ v = α(1 + v)2 = α[1 + v0 (ϕ)]2 + O(α2 )
dϕ2
= α[1 + ε cos(ϕ + ϕ0 )]2 + O(α2 ) .
Die Lösung dieser Gleichung hat die Form
v(ϕ) = v0 (ϕ) + α v1 (ϕ) + O(α2 ) ,
(3.52)
wobei v0 (ϕ) die homogene Gleichung (für α = 0) erfüllt und v1 (ϕ) eine partikuläre Lösung von
d2 v1
+ v1 = 1 + 2ε cos(ϕ + ϕ0 ) + 21 ε2 {1 + cos[2(ϕ + ϕ0 )]}
dϕ2
darstellt. Wie man leicht überprüft, wird eine solche partikuläre Lösung durch
v1 (ϕ) = (1 + 12 ε2 ) + εϕ sin(ϕ + ϕ0 ) − 61 ε2 cos[2(ϕ + ϕ0 )]
(3.53)
gegeben. Um die Bahn als Funktion des Winkels zu erhalten, setze man (3.52)
p
ein. Die verschiedenen Terme in v1 (ϕ) in (3.53) haund (3.53) in x(ϕ) = 1+v(ϕ)
ben sehr unterschiedliche Auswirkungen: Der erste Term im rechten Glied, multipliziert mit α, ist klein und ϕ-unabhängig und modifiziert die Bahnparameter
55
--------------------------------------------------------- 3. ABGESCHLOSSENE MECHANISCHE SYSTEME
p und ε daher nur geringfügig; in der Praxis wird dieser Effekt unbeobachtbar
sein. Der letzte Term im rechten Glied, multipliziert mit α, ist klein und periodisch; folglich werden die Effekte dieses Terms ebenfalls nahezu unbeobachtbar
sein. Der zweite Term im rechten Glied wächst linear als Funktion des Winkels
ϕ (und daher auch als Funktion der Zeit) an; dieser Term wird daher nach genügend langer Zeit zu beträchtlichen Abweichungen von der nicht-relativistischen
Kepler-Bahn führen.
Aus diesen Gründen ist es sinnvoll, im Folgenden nur die Effekte des zweiten
Terms im rechten Glied von (3.53) mitzuberücksichtigen:
v(ϕ) ≃ v0 (ϕ) + αεϕ sin(ϕ + ϕ0 )
= ε[cos(ϕ + ϕ0 ) + αϕ sin(ϕ + ϕ0 )]
(3.54)
2
= ε cos(ϕ + ϕ0 − αϕ) + O(α ) .
Das Resultat (3.54) bedeutet, dass ein voller Umlauf (d. h. eine vollständige Bewegung des Himmelskörpers vom Perihel zum Aphel und zurück) erst nach dem
2π
≃ 2π(1+α) abgeschlossen ist. Anders formuliert
Durchlaufen eines Winkels 1−α
könnte man sagen, dass sich der Perihelwinkel ϕP im Laufe der Zeit nach vorne bewegt: ϕP = −ϕ0 + αϕ, so dass Präzession der Bahn des Himmelskörpers
auftritt. Die Präzessionsgeschwindigkeit ist
∆ϕ = 2πα/Umlauf ,
und für den Merkur entspricht dies dem Wert 43, 03′′ /Jahrhundert, in hervorragender Übereinstimmung mit le Verriers Messergebnis. Andere Vorhersagen der
allgemeinen Relativitätstheorie sind ∆ϕ ≃ 8, 6′′ /Jh. für Venus, ∆ϕ ≃ 3, 8′′ /Jh.
für die Erde und ∆ϕ ≃ 10, 3′′ /Jh. für Icarus, alle in guter Übereinstimmung mit
der astronomischen Beobachtung.
56
Kapitel
4
Teilsysteme
Häufig können mechanische Systeme nicht als abgeschlossen angesehen werden.
In solchen Fällen sind die auf das System einwirkenden äußeren Kräfte mit zu
berücksichtigen. In diesem Kapitel erörtern wir zunächst die allgemeinen Eigenschaften solcher Teilsysteme, und anschließend wird ein wichtiges (und für
die Elektrodynamik sehr relevantes) Beispiel diskutiert, nämlich das geladene Teilchen im elektromagnetischen Feld. Im Allgemeinen schenkt man in der
Theorie der Teilsysteme dem Verhalten der Bewegungsgleichungen unter GalileiTransformationen weitaus weniger Aufmerksamkeit als wir dies im vorigen Kapitel getan haben. Der Grund hierfür ist, wie bereits in Kapitel 2 erklärt, dass
viele Bewegungsgleichungen für Teilsysteme durch die Wahl spezieller Bezugssysteme oder durch vorgenommene Näherungen nicht manifest Galilei-kovariant
sind bzw. erst durch zusätzliche Transformationsregeln für die äußeren Kräfte
Galilei-kovariant gemacht werden können. Speziell bei der Behandlung geladener Teilchen im elektromagnetischen Feld wird jedoch etwas näher auf die Frage
nach der Galilei-Kovarianz der Theorie eingegangen.
4.1
Allgemeine Eigenschaften von Teilsystemen
Während abgeschlossene Einteilchensysteme sehr einfach zu behandeln sind, da
das einzige mögliche Kraftgesetz für solche Systeme durch F = 0 gegeben ist,
sind Teil systeme, die nur ein einzelnes Teilchen enthalten, weitaus weniger trivial. Da sie in der Physik außerdem eine prominente Rolle spielen, werden im
Folgenden Einteilchensysteme unter der Einwirkung äußerer Kräfte gesondert
diskutiert. Anschließend wird die Verallgemeinerung auf Teilsysteme mit beliebiger Teilchenzahl behandelt.
4.1.1
Einteilchen-Teilsysteme
Aus dem deterministischen Prinzip der Klassischen Mechanik folgt, dass die
allgemeine Form der Bewegungsgleichung eines Einteilchensystems durch
ṗ = F(ex) (x, ẋ, t) ,
p = mẋ
gegeben ist, wobei F(ex) die äußere Kraft darstellt, die nur von den Variablen
(x, ẋ, t) abhängig sein kann. Offensichtlich ist der Impuls in einem solchen Teil-
-------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME
system im Allgemeinen nicht erhalten, und das Gleiche gilt natürlich auch für
den Drehimpuls L = x × p:
dL
= x × ṗ = x × F(ex) (x, ẋ, t) ≡ N(ex) (x, ẋ, t) .
dt
Es ist wichtig, zu beachten, dass die Bewegungsgleichungen für p und L Vektoridentitäten sind: Falls eine Komponente der Kraft F(ex) oder des Drehmoments
N(ex) Null ist, ist die entsprechende Komponente von p bzw. L erhalten, auch
wenn die übrigen Komponenten von F(ex) und N(ex) von Null verschieden sind.
Die durch die Kraft F(ex) bei einer Teilchenbewegung von x(1) zur Zeit t1
nach x(2) zur Zeit t2 verrichtete Arbeit W1→2 wird allgemein durch
Z
W1→2 ≡
1
2
Z
dx · F(ex) =
t2
t1
(ex)
dt ẋ · F(ex) (x, ẋ, t) ≡ W1→2
definiert und ist wie folgt mit der Änderung der kinetischen Energie Ekin verknüpft:
Z
(ex)
dt ẋ · F
W1→2 =
=
Z
t2
t1
2 t2
1
2 mẋ t1
=
Z
t2
dt ẋ · ẍ =
=m
(2)
Ekin
−
t1
(1)
Ekin
t2
dt
t1
Š
d €1
mẋ2
2
dt
.
Für den wichtigen Spezialfall einer rein ortsabhängigen und konservativen äußeren Kraft, F(ex) = F(ex) (x) mit
I
dx · F(ex) (x) = 0
(4.1)
für jeden geschlossenen Integrationsweg, können wir das Potential (bzw. die
potentielle Energie) mittels
Z
Vex (x) = Vex (x0 ) −
x
x0
dx′ · F(ex) (x′ )
einführen, und es gilt dVex = −F(ex) · dx bzw.
F(ex) = −∇Vex
.
Aufgrund des Stokes’schen Satzes, angewandt auf (4.1), oder direkt aus der
Darstellung F(ex) = −∇Vex folgt wiederum
∇ × F(ex) = 0
.
Für konservative Kräfte können wir schreiben:
(2)
(1)
Ekin − Ekin =
(1)
Z
2
1
Z
dx · F(ex) = −
(2)
1
2
(1)
(2)
dx · ∇Vex = Vex
− Vex
mit Vex ≡ Vex (x(1) ) und Vex ≡ Vex (x(2) ). Mit der Definition E ≡ Ekin + Vex
für die Gesamtenergie des Einteilchensystems folgt die Identität E (1) = E (2) ,
die die Energieerhaltung des Systems ausdrückt: dE
dt = 0. Schließlich ist noch
58
-------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME
hinzuzufügen, dass das Virialtheorem für Einteilchensysteme mit konservativen
Kräften,
Ekin = − 12 x · F(ex) = 12 x · ∇Vex
,
deutlich einfacher wird für homogene Potentiale mit Vex (λx) = λβ Vex (x) und
daher x · ∇Vex = βVex :
Ekin = 12 βVex
.
Als Beispiel sei ein Teilchen in einer harmonischen Falle (β = 2) erwähnt: In
diesem Fall gilt Ekin = Epot .
4.1.2
Mehrteilchen-Teilsysteme
Die Verallgemeinerung fast aller Eigenschaften von Einteilchensystemen auf Systeme mehrerer Teilchen ist recht einfach. Die Bewegungsgleichungen enthalten
nun innere und äußere Kräfte:
ṗi = Fi
,
pi = mi ẋi
(i = 1, 2, . . . , N )
mit
(in)
Fi ≡ Fi
(ex)
({xji }, {ẋji }) + Fi
(X, Ẋ, t)
,
X = (x1 , . . . , xN ) ,
wobei wir annehmen, dass die inneren Kräfte mit den in Kapitel 3 betrachte(in)
ten Kräften identisch sind. Insbesondere nehmen wir an, dass Fi das dritte
Newton’sche Gesetz erfüllt:
(in)
Fi
=
X
,
fji
j6=i
fji = fji (|xji |)x̂ji
.
Da die inneren Kräfte - wie wir wissen - keinen Beitrag zu den Bewegungsgleichungen für den Gesamtimpuls und -drehimpuls liefern, folgt:
dP X (ex)
=
Fi (X, Ẋ, t) ≡ F(ex) (X, Ẋ, t)
dt
i=1
N
bzw.
dL X
(ex)
=
xi × Fi ≡ N(ex) (X, Ẋ, t) ,
dt
i=1
N
wobei N(ex) das Gesamtdrehmoment darstellt. Außerdem ist die von den Kräften
bei einer Teilchenbewegung verrichtete Arbeit durch
W1→2 =
XZ
2
i
(in)
(ex)
dxi · Fi = W1→2 + W1→2
1
(in)
(1)
(2)
gegeben, wobei W1→2 = Vin − Vin die in (3.7) berechnete potentielle Energie
(ex)
der inneren Kräfte ist und W1→2 durch
(ex)
W1→2
≡
XZ
i
2
1
(ex)
dxi · Fi
59
-------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME
definiert wird. Es gilt der Zusammenhang:
W1→2 =
XZ
2
1
i
dxi · Fi =
t2
X
2
1
2 mi ẋi t1
i
(2)
(1)
= Ekin − Ekin
.
Falls die äußeren Kräfte rein ortsabhängig und konservativ sind, d. h. falls für
jede Teilchenbewegung entlang einer geschlossenen Schleife
€
Š
€
Š
€
X(1) , t1 → X(2) , t2 → X(1) , t′1
Š
(t′1 > t2 > t1 )
für die durch äußere Kräfte verrichtete Arbeit
(ex)
W1→2→1′ = 0
gilt, können diese äußeren Kräfte, wie für Einteilchensysteme, aus einem Potential Vex (X) hergeleitet werden. Wir definieren hierzu
€
(ex)
F (ex) ≡ F1
(ex)
, . . . , FN
Š
und schreiben
Z
t′1
0 = W1→2→1′ =
t1
I
dX · F (ex)
dt Ẋ · F (ex) =
.
Das Potential lässt sich offensichtlich wieder durch
Z
Vex (X) = Vex (X0 ) −
X
X0
dX′ · F (ex) (X′ )
definieren; wiederum ist dVex ein exaktes Differential:
dVex = −F (ex) · dX = −
N
X
(ex)
Fi
i=1
· dxi
,
und es folgt
(ex)
Fi
= −∇i Vex
.
Für konservative äußere Kräfte gilt, dass die Gesamtenergie des Systems erhalten ist:
(2)
(1)
(2)
(ex)
(1)
Ekin + Vin − Ekin − Vin = W1→2 =
=−
XZ
dxi · ∇i Vex = −
1
i
Z
2
1
2
XZ
i
2
(ex)
dxi · Fi
1
∂Vex
(1)
(2)
dX ·
= Vex
− Vex
∂X
d. h.
E (1) = E (2)
und daher:
dE
dt
,
E ≡ Ekin + Vin + Vex
= 0. Das Virialtheorem für Mehrteilchensysteme lautet:
Ekin = − 12
X
i
xi · Fi = − 21
X
i
(in)
xi · Fi
−
1
2
X
i
(ex)
xi · Fi
,
60
-------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME
wobei der erste Term im rechten Glied für homogene Zweiteilchenpotentiale
der Form (3.12) als 21 αVin (X) geschrieben werden kann. Falls auch die äußeren
Kräfte konservativ sind und aus einem homogenen Potential
Vex (λx1 , λx2 , . . . , λxN ) = λβ V (x1 , x2 , . . . , xN )
abgeleitet werden können, so dass
X
i
xi · ∇i Vex = βVex
gilt, folgt insgesamt
Ekin = 12 αVin + 21 βVex
.
Als Anwendung könnte man z. B. an zwei geladene Teilchen in einer harmonischen Falle (β = 2) denken, die sich durch Coulomb-Kräfte (α = −1) anziehen.
4.2
Die Lorentz-Kraft
Als Anwendung der Theorie der Teilsysteme betrachten wir nun die auf geladene Teilchen im elektromagnetischen Feld einwirkende Lorentz-Kraft. Diese
Anwendung ist besonders interessant im Hinblick auf die in Kapitel 2 der „Rechenmethoden 2“ zu behandelnde Maxwell-Theorie des Elektromagnetismus.
Die Lorentz-Kraft ist einer der zwei Pfeiler der Elektrodynamik . Die Elektrodynamik befasst sich im Allgemeinen mit der Wechselwirkung elektromagnetischer Felder und geladener materieller Teilchen. Es liegen daher zwei miteinander gekoppelte Probleme vor: Einerseits ist man an der Zeitentwicklung der elektromagnetischen Felder in Anwesenheit von Ladungen und Strömen interessiert;
diese Zeitentwicklung wird durch die Maxwell-Gleichungen beschrieben. Andererseits möchte man die Dynamik der Ladungen und Ströme in Anwesenheit der
Felder bestimmen; die Dynamik solcher geladener materieller Teilchen folgt aus
dem Lorentz’schen Kraftgesetz. Durch Kombination der Maxwell-Gleichungen
mit dem Lorentz’schen Kraftgesetz erhält man eine vollständige und in sich
geschlossene Beschreibung der Teilchen und Felder gemeinsam.
Die Dynamik eines geladenen, nicht-relativistischen Teilchens der Masse m
und Ladung q in einem elektromagnetischen Feld wird durch die Lorentz’sche
Bewegungsgleichung
mẍ = FLor
,
FLor = q(E + ẋ × B)
(4.2)
beschrieben, wobei FLor die Lorentz-Kraft darstellt und das elektrische Feld E
und das Magnetfeld B im Allgemeinen orts- und zeitabhängig sind: E = E(x, t)
und B = B(x, t). Die Lorentz-Kraft wurde bereits 1895 von Hendrik Antoon
Lorentz postuliert. Lorentz’ Vermutung basierte auf dem Transformationsverhalten der E- und B-Felder unter „Lorentz-Transformationen“ bis zur linearen
Ordnung in β ≡ v/c, wobei v = vrel (K ′ , K) die Relativgeschwindigkeit des
Inertialsystems K ′ in Bezug auf K bezeichnet:
E′ = E + v × B + . . . = E + β × (cB) + O(β 2 )
1
cB′ = cB − v × E + . . . = cB − β × E + O(β 2 )
c
(4.3)
61
-------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME
Die Felder im Inertialsystem K werden hierbei durch (E, B), diejenigen in K ′
durch (E′ , B′ ) dargestellt. Betrachten wir nun ein nicht-relativistisches geladenes
Teilchen, das zur Zeit t in K die Geschwindigkeit ẋ hat, und definieren wir K ′
durch die Wahl vrel (K ′ , K) = ẋ (und außerdem α = 0, ξ = 0, σ = ±1, τ = 0).
Da das Teilchen zur Zeit t in K ′ ruht, spürt es in diesem Inertialsystem lediglich
ein elektrisches Feld E′ , und es folgt:
mẍ = mẍ′ = qE′ = q(E + ẋ × B) = FLor
,
so dass im ursprünglichen Inertialsystem K auf das Teilchen die geschwindigkeitsabhängige Lorentz-Kraft wirkt. Das Lorentz’sche Kraftgesetz in der Form
(4.2) folgt somit - wie angekündigt - aus der Invarianz der Maxwell-Gleichungen
unter Lorentz-Transformationen (bis zur linearen Ordnung in β).
Bemerkenswert in (4.3) ist, dass die physikalischen Größen E und cB im SIEinheitensystem dieselbe physikalische Dimension haben und auch ein gleichartiges Verhalten unter Lorentz-Transformationen zeigen. Wir werden später
sehen, dass der echte Vektor E und der Pseudovektor cB in der Relativitätstheorie untrennbar miteinander verflochten sind und zusammen den elektromagnetischen Feldtensor bilden. Ein Wort noch zu Größenordnungen: Die Stärke
elektrischer Felder ist im Labor auf 107 − 108 V/m beschränkt. Starke Magnetfelder sind etwa im Bereich 3-30 T angesiedelt, so dass die Größe cB auf etwa
109 − 1010 Tm/s beschränkt ist. Hierbei gilt: 1 Tm/s = 1 V/m. In diesem Sinne
sind starke Magnetfelder im Labor etwa um einen Faktor 102 stärker als starke
elektrische Felder. Bei diesem Vergleich ist allerdings zu beachten, dass cB in
der Lorentz-Kraft mit β ≡ |β| multipliziert wird, so dass die Kraft q ẋ × B unter
den meisten irdischen Umständen eher klein ist im Vergleich zu qE.
4.2.1
Galilei-Kovarianz der Lorentz’schen Bewegungsgleichung
Aus der Sicht der Klassischen Mechanik beschreibt die Lorentz’sche Bewegungsgleichung ein Teilsystem, nämlich das geladene Teilchen der Masse m und Ladung q, das durch die Kopplung der Ladung an die Felder E und B mit der
Außenwelt verbunden ist. Die Frage nach der Galilei-Kovarianz der Bewegungsgleichung (4.2) ist also gleichbedeutend mit der Frage nach einer Transformationsregel für die E- und B-Felder, die Gleichung (4.2) insgesamt forminvariant
lässt unter beliebigen Galilei-Transformationen.
Betrachten wir also eine allgemeine Galilei-Transformation
x′ = σR(α)−1 x − vt − ξ = σR(α)−1 (x − vα t − ξ α )
t′ = t − τ
und fordern wir, dass neben
mẍ = q [E(x, t) + ẋ × B(x, t)]
im Inertialsystem K auch
mẍ′ = q [E′ (x′ , t′ ) + ẋ′ × B′ (x′ , t′ )]
im Inertialsystem K ′ mit vrel (K ′ , K) = v gilt. Gesucht ist die Transformation, die die Felder (E′ , B′ ) in K ′ mit den Feldern (E, B) in K verknüpft.
62
-------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME
Mit Hilfe der Lorentz’schen Bewegungsgleichung und der Definition der GalileiTransformation findet man:
d2
σR(α)−1 (x − vα t − ξ α )
dt2 €
Š
= σR(α)−1 mẍ = σR(α)−1 q E + ẋ × B
q(E′ + ẋ′ × B′ ) = mẍ′ = m
= qσR(α)−1 {E + [σR(α)ẋ′ + vα ] × B}
€
Š
€
Š
”
—
= q σR(α)−1 E + vα × B + R(α)−1 R(α)ẋ′ × B
”
= q σR(α)−1 E + vα × B + ẋ′ × R(α)−1 B
—©
©
.
Ein Vergleich der geschwindigkeitsabhängigen und -unabhängigen Terme im linken und rechten Glied liefert sofort:
E′ (x′ , t′ ) = σR(α)−1 [E(x, t) + vα × B(x, t)]
B′ (x′ , t′ ) = R(α)−1 B(x, t)
(4.4)
,
wobei x und t durch die entsprechenden Ausdrücke mit x′ und t′ zu ersetzen
sind:
x = σR(α)x′ + vα (t′ + τ ) + ξ α
t = t′ + τ
,
.
Für eine rein orthogonale Transformation (mit vα = 0, ξα = 0 und τ = 0)
vereinfacht sich (4.4) auf die Form
E′ = σR(α)−1 E
B′ = R(α)−1 B
,
,
die zeigt, dass das elektrische Feld E einen echten Vektor und das Magnetfeld
B einen Pseudovektor darstellt. Insbesondere gilt bei einer Raumspiegelung am
Ursprung: E′ = −E und B′ = B.
Aus den allgemeinen Transformationsregeln (4.4) für die elektrischen und
magnetischen Felder geht interessanterweise noch hervor, dass das Skalarprodukt E · B bis auf einen Faktor σ invariant unter Galilei-Transformationen ist:
”
€
E′ · B′ = σR(α)−1 E + vα × B
€
Š
Š— ”
· R(α)−1 B
—
= σ E + vα × B · B = σE · B
und somit einen Pseudoskalar darstellt. Diese Eigenschaft, dass E·B ein Pseudoskalar ist, gilt auch in der relativistischen Theorie, in der die Galilei-Transformationen durch Poincaré-Transformationen ersetzt werden. Genau genommen gibt
es in der relativistischen Theorie zwei physikalische Größen, die invariant sind,
falls sich die Orientierung des Koordinatensystems bei der Poincaré-Transformation nicht ändert (σ = +1), nämlich E · B und E2 − c2 B2 . Eine einfache
Rechnung zeigt jedoch, dass die Größe E2 − c2 B2 in der nicht-relativistischen
Theorie nicht invariant ist:
€
E′
Š2
€
Š
€
− c2 (B′ )2 = E2 − c2 B2 + 2vα · B × E + vα × B
Š2
6= E2 − c2 B2
.
Offensichtlich sind die Transformationsregeln (4.4) mit Vorsicht zu genießen,
falls die Relativgeschwindigkeit der Inertialsysteme sehr hoch wird: |vα |/c =
63
-------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME
O(1). Wir lernen somit, dass die Konsistenz der Lorentz’schen Bewegungsgleichung in ihrer nicht-relativistischen Form (4.2), die ja durch (4.4) gewährleistet
wird, oder allgemeiner: die innere Konsistenz einer beliebigen Theorie, noch
keineswegs ihre Richtigkeit impliziert. Die relativistische Theorie zeigt, dass
sowohl die Form der Bewegungsgleichung als auch die Transformationsregeln
für die E- und B-Felder zu modifizieren sind, bevor sie erfolgreich im Bereich
|vα |/c = O(1) angewandt werden können.
4.2.2
Beispiel: konstante Felder
Als einfaches Beispiel für die Wirkung der Lorentz-Kraft auf geladene, materielle
Teilchen betrachten wir den Spezialfall orts- und zeitunabhängiger elektromagnetischer Felder.
Die Lorentz’sche Bewegungsgleichung für ein Teilchen in einem konstanten
elektrischen Feld (mit B = 0) lautet:
mẍ = qE .
Dieses Problem ist formal identisch mit der Bewegungsgleichung für ein massives
Teilchen in einem konstanten Schwerkraftfeld (z. B. nahe der Erdoberfläche),
und die Lösung hat dementsprechend dieselbe Form:
x(t) = x(0) + ẋ(0)t +
qt2
E
2m
.
Betrachten wir nun die Lorentz’sche Bewegungsgleichung für ein geladenes Teilchen in einem konstanten Magnetfeld (mit E = 0):
mẍ = q ẋ × B
.
Wir wählen das Koordinatensystem gemäß
B̂ ≡ ê3
B × ẋ(0)
≡ ê2
|B × ẋ(0)|
,
,
ê2 × ê3 ≡ ê1
,
(4.5)
so dass die Bewegungsgleichung sich auf
„
d
dt
ẋ1
ẋ2
ẋ3
Ž
„
=ω
ẋ2
−ẋ1
0
Ž
,
ω≡
qB
m
vereinfacht. In ê3 -Richtung findet geradlinig-gleichförmige Bewegung statt:
x3 (t) = x3 (0) + ẋ3 (0)t, während das geladene Teilchen in den ê1 - und ê2 Richtungen um die Magnetfeldrichtung präzediert:
ẋ1 (t) = ẋ1 (0) cos(ωt) ,
ẋ2 (t) = −ẋ1 (0) sin(ωt)
und daher:
x1 (t) = x1 (0) +
ẋ1 (0)
sin(ωt) ,
ω
x2 (t) = x2 (0) +
x˙1 (0)
[cos(ωt) − 1] . (4.6)
ω
Hierbei ist zu beachten, dass die allgemeine Lösung (4.6) nur von drei Integrationskonstanten x1 (0), x2 (0) und ẋ1 (0) abhängig ist; die vierte Integrationskonstante ẋ2 (0) wurde durch die Wahl des Koordinatensystems gleich Null gesetzt.
64
-------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME
Außerdem ist für den Spezialfall B × ẋ(0) = 0 darauf hinzuweisen, dass in diesem Fall ê2 ⊥ ê3 beliebig gewählt werden kann; unabhängig von der Wahl von
ê2 gilt dann ẋ1 (0) = ẋ2 (0) = 0, und es folgt x1 (t) = x1 (0) und x2 (t) = x2 (0).
Hiermit ist auch die Dynamik im konstanten Magnetfeld vollständig bekannt.
Betrachten wir schließlich das allgemeine Problem der Dynamik eines geladenen Teilchens in konstanten elektrischen und magnetischen Feldern:
€
mẍ = q E + ẋ × B
Š
.
Wir wählen das Koordinatensystem nun gemäß
B̂ = ê3
B×E
≡ ê2
|B × E|
,
ê2 × ê3 ≡ ê1
,
und erhalten die Bewegungsgleichung
„
d
dt
ẋ1
ẋ2
ẋ3
Ž
„
=
ε1 + ω ẋ2
−ω ẋ1
ε2
Ž
„
ε≡
,
ε1
0
ε3
Ž
≡
q
E ,
m
ω=
qB
m
.
Die Bewegung in ê3 -Richtung ist nun im Allgemeinen gleichmäßig beschleunigt:
x3 (t) = x3 (0) + ẋ3 (0)t + 21 ε3 t2
.
Für die Bewegung in ê1 -Richtung erhalten wir zunächst
...
x 1 = ω ẍ2 = −ω 2 ẋ1
und daher
ẍ1 (0)
sin(ωt)
h εω
i
1
= ẋ1 (0) cos(ωt) +
+ ẋ2 (0) sin(ωt)
ω
ẋ1 (t) = ẋ1 (0) cos(ωt) +
(4.7)
und somit
x1 (t) = x1 (0) +
i
ẋ1 (0)
1 h ε1
sin(ωt) +
+ ẋ2 (0) [1 − cos(ωt)]
ω
ω ω
.
Die Bewegung in ê2 -Richtung folgt aus
ẍ2 (t) = −ω ẋ1 = −ω ẋ1 (0) cos(ωt) − ω
als
ẋ2 = ẋ2 (0) − ẋ1 (0) sin(ωt) −
hε
1
ω
hε
1
ω
i
+ ẋ2 (0) sin(ωt)
i
(4.8)
+ ẋ2 (0) [1 − cos(ωt)]
und somit
•
x2 (t) = x2 (0) + ẋ2 (0)t −
hε
i
sin(ωt)
ẋ1 (0)
1
[1 − cos(ωt)] −
+ ẋ2 (0) t −
ω
ω
ω
˜
.
Für den Spezialfall B × E = 0 kann ê2 wie in (4.5) gewählt werden, und es
folgt sofort (4.6). Hiermit ist nun auch die allgemeine Dynamik in konstanten
65
-------------------------------------------------------------------------------------------------------------------------------- 4. TEILSYSTEME
E- und B-Feldern vollständig bekannt. Interessant an der allgemeinen Lösung
(4.7) und (4.8) für die Geschwindigkeiten ẋ1 und ẋ2 ist, dass eine Zeitmittelung zeigt, dass die Bewegung gleichförmig in ê2 -Richtung erfolgt, während die
Geschwindigkeitskomponente in ê1 -Richtung nach der Zeitmittelung Null ist:
ẋ1 = 0 ,
ẋ2 = −
ε1
E1
=−
ω
B
.
Dieses Ergebnis ist bemerkenswert, weil das elektrische Feld gerade eine Komponente in ê1 -Richtung aber keine Komponente in ê2 -Richtung hat.
66
Kapitel
5
Spezielle Relativitätstheorie
Die Struktur der speziellen Relativitätstheorie ist derjenigen der nicht-relativistischen Klassischen Mechanik sehr ähnlich: In beiden Fällen beschreibt man
die Dynamik von Körpern mit Hilfe einer (nicht-gekrümmten) vierdimensionalen Raum-Zeit. In beiden Fällen ist es sehr hilfreich, sich bei der Beschreibung
dieser Dynamik zunächst auf Punkt teilchen zu konzentrieren. In beiden Fällen
gilt das Relativitätsprinzip, das die Existenz von Inertialsystemen postuliert.
Genau wie in der nicht-relativistischen Mechanik sind Inertialsysteme auch in
der Relativitätstheorie durch die zwei Eigenschaften charakterisiert, dass alle physikalischen Gesetze in allen Inertialsystemen zu jedem Zeitpunkt gleich
sind und dass alle Koordinatensysteme, die sich relativ zu einem Inertialsystem
in geradlinig-gleichförmiger Bewegung befinden, selbst ebenfalls Inertialsysteme
sind. Die Äquivalenz aller Inertialsysteme impliziert insbesondere auch die Homogenität und die Isotropie des Raums und der Zeit. Schließlich gilt sowohl für
die Relativitätstheorie als auch für die nicht-relativistische Klassische Mechanik
das deterministische Prinzip, das besagt, dass die auf ein Teilchen einwirkenden
Kräfte nur vom Ortsvektor und von der Geschwindigkeit dieses Teilchens sowie
von der Zeit abhängig sein können.
Neben diesen Gemeinsamkeiten, von denen das Relativitätspostulat besonders wichtig ist, gibt es zwischen der relativistischen (R) und der nicht-relativistischen (NR) Mechanik auch einen wesentlichen Unterschied, der durch ein zweites Postulat zum Ausdruck gebracht wird:
(R): Die Lichtgeschwindigkeit im Vakuum hat in allen Inertialsystemen denselben Wert c = 2, 997925 · 108 m/s.
(NR): Die Lichtgeschwindigkeit ist effektiv unendlich groß im Vergleich zu allen
anderen in der Theorie auftretenden Geschwindigkeiten.
Das zweite Postulat bedeutet physikalisch, dass die Wechselwirkung zwischen
Teilchen (z. B. durch Austausch von Strahlungsenergie oder Einwirkung von
elektromagnetischen Kräften) in der nicht-relativistischen Theorie instantan erfolgt, während die Ausbreitungsgeschwindigkeit c der Wechselwirkung in der
relativistischen Theorie eine endliche universelle Konstante (gültig in jedem Inertialsystem) ist. Das zweite Postulat der NR-Mechanik kann bekanntlich auch
in der folgenden Weise formuliert werden:
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
(NR): Die Länge eines Zeitintervalls und der Abstand zweier gleichzeitiger
Ereignisse sind in der nicht-relativistischen klassischen Mechanik absolute
(d. h. beobachterunabhängige) Größen.
Mathematisch bedeutet das zweite Postulat, dass die Newton’sche nicht-relativistische Mechanik kovariant unter Galilei-Transformationen und die Einstein’sche
relativistische Mechanik kovariant unter Lorentz-Transformationen ist. Das relativistische Pendant der absoluten Größen „Zeit“ und „Abstand“ in der Newton’schen Mechanik ist der beobachterunabhängige „infinitesimale Abstand “
ds = [c2 (dt)2 − (dx)2 ]1/2 infinitesimal benachbarter Ereignisse, der somit eine der zentralen Größen der Relativitätstheorie darstellt.
Eine Bemerkung noch zum Anwendungsbereich der speziellen Relativitätstheorie: Die nicht-relativistische Klassische Mechanik beschreibt die Dynamik
physikalischer Objekte unter der Einwirkung von Kräften, die mikroskopisch
auf Gravitationswechselwirkung oder elektromagnetische Wechselwirkung zurückgeführt werden können. Da die spezielle Relativitätstheorie Gravitationskräfte bekanntlich nicht beschreiben kann (hierfür benötigt man die allgemeine
Relativitätstheorie), bleiben als ihr Anwendungsbereich nur elektromagnetische
Kräfte übrig. Im Rahmen der speziellen Relativitätstheorie beschreibt man also
typischerweise die Dynamik elektromagnetischer Felder bei vorgegebenen Ladungen und Strömen oder die Dynamik von Ladungen und Strömen bei vorgegebenen elektromagnetischen Feldern. Die zentralen Gleichungen der speziellen
Relativitätstheorie sind daher die Maxwell-Gleichungen und die Lorentz’sche
Bewegungsgleichung. Da diese beiden Pfeiler der Elektrodynamik Teilsysteme
beschreiben und das Relativitätsprinzip für Teilsysteme - wie wir wissen - nur
dann Sinn macht, wenn zusätzlich angegeben wird, wie die „Außenwelt“ mittransformiert wird, ist klar, dass die Bestimmung des Transformationsverhaltens von Ladungen, Strömen und Feldern unter Lorentz-Transformationen im
Folgenden von großer Bedeutung sein wird.
Etliche Ergebnisse der speziellen Relativitätstheorie waren bereits vor Einsteins Arbeit (1905) bekannt. Erwähnt seien insbesondere die Lorentz-Transformation in linearer (Lorentz, 1895) und in beliebiger Ordnung (Larmor, 1898;
Lorentz 1899; Poincaré, 1905), die Lorentz- (oder Fitzgerald-Lorentz-)Kontraktion (Fitzgerald, 1889; Lorentz, 1892), die Lorentz-Kraft (Lorentz, 1895), die
Gruppenstruktur der Lorentz-Transformationen, das Relativitätsprinzip, die Invarianz der Eigenzeit und das Additionsgesetz für Geschwindigkeiten (Poincaré,
1905). Das Großartige von Einsteins Beitrag (1905) ist die Reduktion der Theorie auf zwei Postulate und die Herleitung von alten und auch neuen Ergebnissen aus diesen Postulaten.1 Interessant ist noch, dass neben Lorentz’ Arbeit
(1895) das Fizeau’sche Experiment (1851) und die Aberration von Sternenlicht
(Bradley, 1729) Einsteins Denken beeinflusst haben, das oft zitierte MichelsonMorley-Experiment jedoch kaum. Für mehr Details sei auf die ausgezeichnete
Einstein-Biografie „Subtle is the Lord“ von Abraham Pais (Oxford University
Press, 1982) verwiesen.
1 Neu
sind z. B. der transversale Doppler-Effekt , die Fresnel-Formel c′ =
und das sogenannte „Zwillingsparadoxon“.
c
n
+v 1−
1
n2
68
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
5.1
Erste Konsequenzen der Postulate
Eine sofortige Konsequenz aus den Postulaten der speziellen Relativitätstheorie
ist, dass die Zeit (anders als in der Newton’schen Mechanik) keine absolute
Größe ist. Betrachten wir nämlich zwei Bezugssysteme K ′ und K, wobei K ′ die
Geschwindigkeit vrel (K ′ , K) = v relativ zu K hat, und nehmen wir an, dass in
K ′ entlang der x′ · v̂-Achse ein Sender S und (in gleichem Abstand von S) zwei
Empfänger E1 und E2 ruhen (siehe Abbildung 5.1). Zur Zeit t = 0 sendet S
zwei Lichtsignale aus, eins zu E1 und eins zu E2 . Beide Empfänger werden ihre
Signale (wegen der Isotropie des Raums) in K ′ gleichzeitig erhalten. Für einen
Beobachter in K jedoch wird der Empfänger E1 sein Signal zuerst erhalten, da
E1 sich auf das Licht, das sich auch in K mit der Geschwindigkeit c ausbreitet,
zubewegt. Ereignisse, die also gleichzeitig sind in K ′ , müssen nicht gleichzeitig
sein in K, und Zeitintervalle, die gleich sind in K ′ , sind im Allgemeinen ungleich
in K.
S
E1
K
E2
0
x v
^
v
0
K
xv
^
Abbildung 5.1: Gleichzeitigkeit von Ereignissen in zwei Inertialsystemen
Betrachten wir das Transformationsverhalten von Längen im Ortsraum und
von Zeitintervallen etwas genauer. Abstände senkrecht zur Geschwindigkeitsrichtung werden in beiden Systemen K und K ′ als gleich groß empfunden. Nehmen
wir z. B. an, im Ursprung 0 von K und im Ursprung 0′ von K ′ stehen zwei
parallel zueinander (und senkrecht zur x · v̂-Achse) ausgerichteten Latten, beide
mit einer Länge ℓ in ihrem Ruhesystem und beide mit einer Kreissäge an ihrem
oberen Ende (siehe Abbildung 6.2). Wir nehmen des Weiteren an, dass 0 und
0′ für t = t′ = 0 zusammenfallen. Nun kann L′ aus der Sicht eines Beobachters
im System K nicht kürzer als L selbst sein, da sonst (im Widerspruch zum
Relativitätsprinzip) L durchgesägt wird und L′ unversehrt bleibt. Umgekehrt
kann L′ aus der Sicht des Beobachters in K auch nicht länger sein. Also sind
beide (aus der Sicht von Beobachtern in K oder K ′ ) gleich lang.
L
0
K
0
K
00
L
0
Abbildung 5.2: Invarianz einer Länge senkrecht zur Geschwindigkeitsrichtung
Befestigen wir nun statt der Kreissäge jeweils zwei Spiegel an den beiden
69
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
Latten, einen am oberen und einen am unteren Ende, und senden wir einen
Lichtstrahl hin und her zwischen beiden Spiegeln (siehe Abbildung 6.3). Wir
haben in dieser Weise zwei identische Uhren konstruiert, die in ihrem jeweiligen
Ruhesystem durch die Periode T = 2ℓ/c charakterisiert werden. Berechnen wir
nun die Periode T ′ der bewegten Uhr in K ′ aus der Sicht eines Beobachters
in K. In einer Periode legt der Lichtstrahl in der an L′ befestigten Uhr – wie
inqAbbildung 6.4 dargestellt – aus der Sicht des Beobachters in K einen Weg
€
Š2
2 ℓ2 + 12 vT ′ zurück. Da das Licht in K aufgrund des zweiten Postulats die
Geschwindigkeit c hat, muss
T′ =
2
c
É
ℓ2 +
€
1
′
2 vT
Š2
d. h.
T
≡ γT
1 − β2
2ℓ/c
T′ = q
1−
€ Š2 = p
v
c
gelten. Aus der Sicht des Beobachters in K dauert die Periode einer bewegten
Uhr also länger als diejenige einer identischen Uhr in K, laufen bewegte Uhren
demnach generell langsamer. Diese Konsequenz der Postulate der Relativitätstheorie wird als Zeitdilatation bezeichnet.
L
0
K
0
00
L
K
0
Abbildung 5.3: Zwei identische Uhren in den Inertialsystemen K und K ′
x?
`
0
0
1 0
vT
2
vT
0
xk
Abbildung 5.4: Berechnung der Periode einer sich relativ zum Beobachter mit
der Geschwindigkeit v bewegenden Uhr
Kippen wir nun die Uhr in K ′ , so dass die Latte L′ in Geschwindigkeitsrichtung zeigt (siehe Abbildung 6.5). Die Länge und die Periode der Uhr in K ′ sind
70
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
nach wie vor ℓ bzw. T , und die Periode aus der Sicht eines Beobachters in K
ist T ′ . Bestimmen wir nun die Länge ℓ′ der bewegten Uhr in K ′ aus der Sicht
des Beobachters in K. Diese Uhr bewegt sich (aus der Sicht von K) mit einer
Geschwindigkeit v nach rechts. Nehmen wir an, dass ein Lichtstrahl eine Zeit
t′LR bzw. t′RL benötigt, um sich von links nach rechts oder rechts nach links zu
bewegen. Aus der Sicht von K gilt:
t′LR =
ℓ′ + vt′LR
c
,
t′LR =
ℓ′ /c
1−β
t′RL =
t′RL =
ℓ′ − vt′RL
c
d. h.
und daher
,
γT = T ′ = t′LR + t′RL =
Es folgt also:
ℓ′ =
ℓ′ /c
1+β
ℓ′
c

1
1
+
1−β
1+β
‹
=
2ℓ′ /c
2γ 2 ℓ′
=
.
1 − β2
c
ℓ
Tc
= ,
2γ
γ
so dass die Länge eines bewegten Körpers in der Geschwindigkeitsrichtung verkürzt ist (im Vergleich zur Ruhelänge). Diese Konsequenz der Relativitätstheorie
wird Lorentz- (oder Fitzgerald-Lorentz-)Kontraktion genannt.
L
0
K
0
v
K
Abbildung 5.5: Zur Lorentz- bzw. Längenkontraktion
5.2
Der Abstand und die Eigenzeit
In der Einführung wurde bereits darauf hingewiesen, dass die nicht-relativistischen absoluten Größen „Zeit“ und „Abstand“ in der Relativitätstheorie durch
den beobachterunabhängigen „infinitesimalen Abstand“ ersetzt werden. Der infinitesimale Abstand ist in der Relativitätstheorie von zentraler Bedeutung, da
seine Invarianz unter Koordinatentransformationen zwischen Inertialsystemen
zeigt, dass die physikalischen Gesetze Lorentz-kovariant sind. Im Folgenden führen wir die Begriffe „Abstand“ und „Eigenzeit“ ein und leiten ein Theorem (Einstein, 1905) über die Eigenzeit bewegter Bezugssysteme ab.
Betrachten wir die Emission eines Lichtsignals am Ort x1 zur Zeit t1 im Bezugssystem K und seine Absorption am Ort x2 zur späteren Zeit t2 , ebenfalls in
K. Da das Signal sich in K gemäß dem zweiten Postulat mit der Geschwindigkeit
c ausbreitet, gilt offensichtlich
c2 (t2 − t1 )2 − (x2 − x1 )2 = 0 .
71
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
Seien die entsprechenden Koordinaten im Inertialsystem K ′ mit vrel (K ′ , K) = v
durch (x′1 , t′1 ) und (x′2 , t′2 ) gegeben, dann gilt analog:
c2 (t′2 − t′1 )2 − (x′2 − x′1 )2 = 0 ,
da das Lichtsignal in K ′ nach dem zweiten Postulat ebenfalls die Geschwindigkeit c hat. Die Größe
1
s ≡ [c2 (t2 − t1 )2 − (x2 − x1 )2 ] 2
wird als Abstand zwischen den Ereignissen bei (x1 , t1 ) und (x2 , t2 ) bezeichnet.
Das obige Argument zeigt, dass die Aussage s = 0 in allen Inertialsystemen
gilt, falls sie in irgendeinem Inertialsystem zutrifft. Der Abstand infinitesimal
benachbarter Ereignisse (x, t) und (x + dx, t + dt) in K ist durch
ds =
È
(5.1)
c2 (dt)2 − (dx)2
gegeben. Analog gilt in einem beliebigen Inertialsystem
K ′ für den Abstand
È
′
infinitesimal benachbarter Ereignisse: ds = c2 (dt′ )2 − (dx′ )2 , und wiederum
impliziert ds = 0 in K die Identität ds′ = 0 für alle K ′ . Das negative Vorzeichen
von (dx)2 in (5.1) zeigt, dass der Abstand hier nicht gemäß der euklidischen,
sondern nach einer (von Hermann Minkowski eingeführten) pseudoeuklidischen
Geometrie definiert wird. Der Abstand infinitesimal benachbarter Ereignisse
ds wird alternativ auch als Linienelement oder als differentielles (Raum-Zeit-)
Intervall bezeichnet. Es ist übrigens zu beachten, dass die infinitesimale Größe
ds kein
H exaktes Differential darstellt, so dass die Auswertung von Integralen der
Form ds entlang einer geschlossenen Schleife im Allgemeinen nicht Null ergibt.
Die Invarianz der Aussage ds = 0 unter Koordinatentransformationen, d. h.
die Äquivalenz der Aussagen ds = 0 im Inertialsystem K und ds′ = 0 in K ′ , hat
weitreichende Konsequenzen. Um dies zu sehen, versuchen wir, diese Gleichunu
gen geometrisch zu interpretieren. Mit den Notationen dx
dt ≡ u und c ≡ β u gilt
in K:
u2
) = c2 (dt)2 (1 − β 2u ) .
c2
Die geometrische Interpretation von ds = 0 in K ist daher, dass der dimensionslose Geschwindigkeitsvektor βu auf einer Kugel mit Radius 1 und Mittelpunkt
0 liegt, so dass |u| = c gilt. Da die Gleichung ds = 0 die Ausbreitung von Lichtsignalen beschreibt, kann dieses Ergebnis nicht erstaunen. Wir betrachten nun
die Interpretation von ds′ = 0 in K ′ : Hierzu nehmen wir an, dass die Orts- und
Zeitkoordinaten (x′ , t′ ) in K ′ gemäß x′ = x′ (x, t; v) und t′ = t′ (x, t; v) mit den
Koordinaten (x, t) in K verknüpft sind. In diesem Fall gilt die lineare Beziehung
0 = (ds)2 = c2 (dt)2 − (dx)2 = c2 (dt)2 (1 −

‹

c dt′
c dt
=Λ
dx′
dx
„
‹
,
Λ(x, t; v) ≡
∂t′
∂t
1 ∂x′
c ∂t
c
€
∂t′
∂x
ŠT Ž
∂x′
∂x
,
wobei die Matrix Λ offensichtlich reell ist.2 Die Gleichung
0 = (ds′ )2 = c2 (dt′ )2 − (dx′ )2
2 Die Transformationsmatrix Λ, die (c dt, dx) in K mit (c dt′ , dx′ ) in K ′ verknüpft, wird
als Lorentz-Transformation bezeichnet. Wir werden später sehen, dass Λ(x, t; v) zwar explizit
von v abhängt, aber unabhängig von (x, t) ist.
72
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
in K ′ kann daher in der Form

c dt′
0=
dx′
‹T 
1
0
mit
∼
‹
0T
−11

B(x, t; v) ≡ Λ
1
0
‹

c dt′
c dt
=
dx′
dx
‹T

‹

c dt
1
B
= c2 (dt)2
dx
βu
‹T

1
B
βu
‹
‹
0T
Λ
−11
(5.2)
geschrieben werden, wobei die Matrix B reell und symmetrisch ist. Diese Gleichung für β u in K ′ stellt nur dann eine Kugel mit Radius 1 und Mittelpunkt 0
dar, wenn die Matrix B die Form

1 1
ε 0
B=
‹
0T
−11
,
(5.3)
ε = ε(x, t; v)
hat, wobei ε reellwertig (mit ε 6= 0) ist. Es folgt:
(ds′ )2 =
1 2
1
c (dt)2 (1 − β 2u ) = (ds)2
ε
ε
und daher:

ds
ds′
‹2
= ε(x, t; v)
.
Hierbei kann ε jedoch wegen der Homogenität des Raums und der Zeit nicht von
(x, t) oder (x′ , t′ ) und wegen der Isotropie des Raums nicht von v̂ abhängen.
Somit ist nur eine Abhängigkeit vom Geschwindigkeitsbetrag v möglich:
(ds)2 = ε(v)(ds′ )2 .
Betrachten wir nun umgekehrt eine Koordinatentransformation vom Inertialsystem K ′ zum Inertialsystem K, so dass vrel (K, K ′ ) = −v gilt, dann erhält man
analog
(ds′ )2 = ε(v)(ds)2
.
Kombination der beiden Transformationen liefert
(ds)2 = ε(v)(ds′ )2 = [ε(v)]2 (ds)2
bzw. [ε(v)]2 = 1
.
Wegen ε(0) = 1 und der Kontinuität von ε(v) als Funktion der Relativgeschwindigkeit v kommt nur die Wurzel ε(v) = ε(0) = 1 in Betracht. Wir erhalten somit:
(ds)2 = (ds′ )2
(5.4)
und nach einer Integration auch: s = s′ . Der Abstand ist also invariant unter
Koordinatentransformation von einem Inertialsystem in ein anderes:
(s21 )2 = c2 (t21 )2 − (x21 )2 = c2 (t′21 )2 − (x′21 )2 = (s′21 )2 ,
(5.5)
wobei t21 ≡ t2 − t1 definiert wurde, usw. Durch Einsetzen des Ergebnisses
ε = 1 in (5.2) und (5.3) können wir außerdem schließen, dass die LorentzTransformation Λ die Matrixgleichung

1
0
‹

∼ 1
0T
=Λ
−11
0
‹
0T
Λ
−11
(5.6)
73
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
erfüllen muss. Diese Konsistenzgleichung schränkt die mögliche Form der Transformationsmatrix Λ stark ein.
Aus (5.5) wird klar, dass man nur dann zu zwei Ereignissen im System K
ein anderes Bezugssystem K ′ finden kann, in dem diese Ereignisse am selben
Ort auftreten (x′21 = 0), wenn
(s21 )2 = c2 (t′21 )2 > 0
ist. Man bezeichnet reelle Abstände, (s21 )2 > 0, als zeit artig. Analog kann man
nur dann zu zwei Ereignissen in K ein Bezugssystem K ′ finden, in dem diese
Ereignisse gleichzeitig auftreten (t′21 = 0), falls
(s21 )2 = −(x′21 )2 < 0
gilt. Imaginäre Abstände, (s21 )2 < 0, heißen raumartig. Nullabstände, (s21 )2 =
0, werden als licht artig bezeichnet. Diese Einteilung ist invariant unter Koordinatentransformationen und daher absolut. Sie wird häufig mit Hilfe eines einfachen „Weltbilds“ (oder auch „Minkowski-Diagramm“) dargestellt. Neben dem
Lichtkegel (s21 )2 = 0, der lichtartige Abstände zwischen Ereignissen repräsentiert, unterscheidet man die absolute Zukunft, (s21 )2 > 0 mit t21 > 0, die
absolute Vergangenheit, (s21 )2 > 0 mit t21 < 0, und das absolut Entfernte,
(s21 )2 < 0. Eine kausale Beziehung zwischen zwei Ereignissen ist nur dann möglich, wenn ihr Abstand zeit- oder eventuell lichtartig ist, d. h. wenn (s21 )2 ≥ 0
gilt.
t21
Zukunft
entfernt
entfernt
x21
Vergangenheit
Abbildung 5.6: Weltbild mit Lichtkegel
Mit dem invarianten infinitesimalen Abstand ds ist offensichtlich eine invariante infinitesimale Zeit dτ verknüpft:
Ê
ds
dτ ≡
=
c
1
1− 2
c

dx
dt
r
‹2
dt =
1−
u 2
c
dt =
È
1 − βu2 dt =
dt
. (5.7)
γu
Diese Gleichung besagt, dass in einem bewegten Bezugssystem (z. B. für ein
Teilchen), das sich mit der Geschwindigkeit u(t) relativ zum Inertialsystem K
74
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
bewegt, die Zeit dτ = γdtu vergeht, wenn die unbewegte Uhr in K die Zeitdauer dt anzeigt. Nur wenn das bewegte Bezugssystem und das Inertialsystem K
identisch sind, so dass ihre Relativgeschwindigkeit verschwindet: u(t) = 0, gilt
dτ = dt; aus diesem Grund wird τ als die „Eigenzeit“ des bewegten Bezugssystems bezeichnet. Integration von (5.7) liefert:
Zt2
τ2 − τ1 =
dt
Zt2
È
1 − βu (t)2 =
t1
dt
t1
1
.
γu (t)
(5.8)
Man sieht wiederum, dass bewegte Uhren langsamer laufen als ruhende. Wenn
also zwei Uhren U1 und U2 anfangs im Inertialsystem K zusammen sind, U1 auch
weiterhin in K verbleibt und U2 sich entlang einer geschlossenen Schleife bewegt,
so dass beide Uhren schließlich wieder zusammen sind, dann ist U2 aufgrund von
(5.7) und (5.8) im Vergleich zu U1 zurückgeblieben. Dieses Resultat geht auf
Einstein (1905) zurück, der es als „Theorem“ bezeichnete. Die Fehlbezeichnung
Uhren- oder Zwillingsparadoxon ist jüngeren Datums (Langevin, 1911).
5.3
4-Schreibweise und Lorentz-Transformationen
Aufgrund der fundamentalen Bedeutung des invarianten Abstands infinitesimal
benachbarter Ereignisse:

d(ct)
(ds) = c (dt) − (dx) =
dx
2
2
2
‹T 
2
1
0
‹
0T
−11
‹

‹ 
d(ct)
d(ct)
d(ct)
=
·
dx
d(−x)
dx
‹
ist klar, dass es vorteilhaft ist, einen kontravarianten 4-Vektor
xµ ≡ (ct, x)
(µ = 0, 1, 2, 3) ,
den metrischen Tensor

gµν = g µν ≡
1
0
‹
0T
−11
und den mit xµ assoziierten kovarianten 4-Vektor
xµ ≡ gµν xν = (ct, −x)
einzuführen.3 Generell kann man den metrischen Tensor dazu verwenden, Indizes herunter- oder heraufzuziehen. Es gilt z. B.:
gµν g νρ = gµρ ≡ δµρ
,
g µν gνρ = g µρ = δ µρ ,
wobei δµρ oder δ µρ das übliche Kronecker-δ bezeichnet. Hierbei wird implizit
über zweimal (einmal unten und einmal oben) auftretende Indizes summiert
(Einstein-Konvention). Wir führen die ko- bzw. kontravarianten Ableitungen
3 Hierbei sollte man den Namen „kontravariant“ und „kovariant“ nicht zu viel Gewicht beimessen: In seiner „Theory of Relativity“ plädiert Pauli dafür, diese Bezeichnungen zu vertauschen, bzw. sie durch die älteren Namen „kogredient“ und „kontragredient“ zu ersetzen. Wie
man sieht: That which we call a rose by any other name would smell as sweet.
75
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
nach den Raum-Zeit-Koordinaten wie folgt ein:
∂µ ≡
∂
∂xµ
;
∂ µ = g µν ∂ν =
∂
.
∂xµ
Der d’Alembert-Operator kann dementsprechend als Skalarprodukt ∂µ ∂ µ geschrieben werden:
=
1 ∂2
− ∆ = g µν ∂µ ∂ν = ∂µ ∂ µ .
c2 ∂t2
Das Quadrat der infinitesimalen Eigenzeit bzw. des Raum-Zeit-Intervalls ds ist
ebenfalls als Skalarprodukt darstellbar:
c2 (dτ )2 = (ds)2 = c2 (dt)2 − (dx)2 = gµν dxµ dxν = dxµ dxµ .
Die linearen Transformationen des 4-Vektors xµ , die die Eigenzeit dτ invariant
lassen, werden als Poincaré-Transformationen oder als inhomogene LorentzTransformationen bezeichnet:
xµ → (x′ )µ = Λµν xν + aµ .
(5.9)
Hierbei gilt ΛT gΛ = g, denn die Invarianz der Eigenzeit erfordert:
c2 (dτ )2 = gµν dxµ dxν = gµν d(x′ )µ d(x′ )ν = gµν Λµρ Λν σ dxρ dxσ
d. h. gρσ = (ΛT )ρ µ gµν Λν σ oder kurz: g = ΛT gΛ . Die Inverse der Lorentz-Transformation folgt als Λ−1 = gΛT g, oder explizit:
(Λ−1 )µν = (gΛT g)µν = g µρ (ΛT )ρσ g σν = (ΛT )µν = Λν µ .
Hierbei ist zu beachten, dass die transponierte Lorentz-Transformation (ΛT )µν ≡
Λν µ = gνρ g µσ Λρ σ nicht (wie im Falle einer dreidimensionalen Drehung) der
gespiegelten Matrix (Λ̃)µν ≡ Λν µ entspricht; die gemischt räumlich-zeitlichen
Matrixelemente erhalten ein zusätzliches Minuszeichen. Aufgrund der Identität
∼
gµν = (ΛT gΛ)µν = (ΛT )µρ gρσ Λσν = Λρµ gρσ Λσν = (Λ)µρ gρσ Λσν
ist klar, dass die Bestimmungsgleichung g = ΛT gΛ für Lorentz-Transformationen
in 4-Schreibweise genau dem Resultat (5.6) in konventioneller Matrixnotation
entspricht.
Wir haben bisher zwar gezeigt, dass das Skalarprodukt (5.1) invariant ist
unter linearen Transformationen, die dann unbedingt die Form einer PoincaréTransformation haben müssen, aber man kann umgekehrt auch leicht zeigen,
dass nicht-lineare Transformationen das Skalarprodukt nicht invariant lassen.
Hierzu gibt es ein physikalisches und ein mathematisches Argument. Das physikalische Argument ist, dass eine nicht-lineare Transformation eine geradliniggleichförmige Bewegung in einem Inertialsystem in eine nicht-geradlinige oder
nicht-gleichförmige Bewegung in einem anderen Koordinatensystem transformiert, das daher kein Inertialsystem sein kann. Das mathematische Argument
basiert auf der Invarianz der Eigenzeit,
gµν dxµ dxν = c2 (dτ )2 = c2 (dτ ′ )2
=
=
gαβ dx′α dx′β
gαβ ∂µ (x′α )∂ν (x′β )dxµ dxν .
76
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
Da diese Gleichung für alle dxµ gelten soll, gilt die Identität
gµν = gαβ ∂µ (x′α )∂ν (x′β ) ,
die Gleichung (5.6) in 4-Schreibweise darstellt, und daher, nach der Differentiation bezüglich xγ :
0 =
≡
gαβ [∂γ ∂µ (x′α )∂ν (x′β ) + ∂µ (x′α )∂γ ∂ν (x′β )]
gαβ Γαβ
γµν .
0 =
αβ
αβ
gαβ (Γαβ
γµν + Γµγν − Γνµγ )
Folglich ist auch:
=
=
gαβ [2∂γ ∂µ (x′α )∂ν (x′β ) + ∂µ (x′α )∂γ ∂ν (x′β ) + ∂γ (x′α )∂µ ∂ν (x′β )
−∂ν ∂µ (x′α )∂γ (x′β ) − ∂µ (x′α )∂ν ∂γ (x′β )]
2gαβ ∂γ ∂µ (x′α )∂ν (x′β ) .
Da die Matrizen gαβ und ∂ν (x′β ) beide nicht-singulär sind, folgt sofort
∂γ ∂µ (x′α ) = 0 ,
so dass x′α notwendigerweise eine lineare Funktion der Koordinaten xµ ist, d. h.:
x′α = Λαµ xµ +aµ . Einsetzen in (5.4) ergibt die Relation ΛT gΛ = g in (5.9). Hiermit ist auch bewiesen, dass die Matrix Λ in (5.6) tatsächlich (x, t)-unabhängig
ist, wie angekündigt.
5.3.1
Poincaré- und Lorentz-Transformationen
Poincaré-Transformationen bestehen - wie gesagt - aus einem homogenen Anteil, der als Lorentz-Transformation Λ bezeichnet wird, und einem inhomogenen
Anteil
(d.h. einer
Translation). Die Gesamtheit aller Lorentz-Transformationen
Λ|ΛT gΛ = g bildet eine Gruppe, die Lorentz-Gruppe L. Die Gruppenstruktur
der Lorentz-Gruppe folgt direkt aus der Relation ΛT gΛ = g, denn wenn Λ1 und
Λ2 zur Lorentz-Gruppe gehören, gilt dasselbe für das Produkt Λ1 Λ2 :
T
T
T
T
(ΛT
2 Λ1 )g(Λ1 Λ2 ) = Λ2 (Λ1 gΛ1 )Λ2 = Λ2 gΛ2 = g .
2
Außerdem folgt aus ΛT gΛ = g, dass [det(Λ)] = 1 und daher det(Λ) = ±1
gilt. Innerhalb der Lorentz-Gruppe L ist die eigentliche orthochrone LorentzGruppe L↑+ , deren Elemente die Bedingungen Λ00 ≥ 1 und det(Λ) = 1 erfüllen,
am wichtigsten. Zu dieser Untergruppe L↑+ von L gehören die gewöhnlichen
Drehungen ΛR (α) um eine feste Achse α̂:

ΛR (α) =
1
0
0T
R(α)
‹
mit
R(α)x = α̂(α̂ · x) − α̂ × (α̂ × x) cos(α) + (α̂ × x) sin(α)
und die Geschwindigkeitstransformationen ΛB (φ, β̂) im Orts-Zeit-Raum, die
auch als „boosts“, bezeichnet werden:
ΛB (φ, β̂) = 11 +
[cosh(φ) − 1]
− sinh(φ)β̂
− sinh(φ)β̂
!
T
[cosh(φ) − 1]β̂β̂
T
.
(5.10)
77
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
Hierbei hängen der Einheitsvektor β̂ und der Parameter φ über die Beziehung
v = c tanh(φ)β̂ mit der Relativgeschwindigkeit v der Bezugssysteme zusammen.
T
Das Produkt β̂ β̂ ist als Dyade aufzufassen. Im Falle der Geschwindigkeitstransformation lautet die Beziehung zwischen x′ und x also explizit:

‹
ct′
=
x′
”
—−1/2
Mit der Relation cosh(φ) = 1 − tanh2 (φ)

′‹
ct
x′

=
cosh(φ)ct − sinh(φ)(x · β̂)
− sinh(φ)ctβ̂ + [x − (x · β̂)β̂] + cosh(φ)(x · β̂)β̂
‹
ct − βxk
0
+γ
x⊥
(xk − vt)β̂
= 1 − β2
−1/2
.
= γ folgt:
wobei xk ≡ x · β̂ die Projektion von x auf die β̂-Richtung und x⊥ ≡ x − xk β̂ den
senkrechten Anteil darstellt. Bei fester Geschwindigkeit v erhält man im Limes
c → ∞ offensichtlich die Galilei-Transformation zurück: t′ = t , x′ = x − vt.
Die Untergruppe L↑+ der Lorentz-Gruppe ist eine kontinuierliche Gruppe
(Lie-Gruppe) und hat dann auch die entsprechende Struktur: Aufgrund der
expliziten Darstellung von Drehungen und Boosts, s. Gleichung (5.10), zeigt
man leicht, dass mehrmalige Anwendung kleiner Drehungen eine große Drehung
ergibt:
h
ΛR (α) = ΛR
•
α in
,
n

ΛB (φ, β̂) = ΛB
φ
, β̂
n
‹˜n
(n ∈ N) . (5.11)
Da der Definitionsbereich von φ = artanh(v/c) unbegrenzt ist, ist die LorentzGruppe nicht kompakt. Außerdem folgt aus (5.10) und (5.11), dass man allgemeine eigentliche, orthochrone Lorentz-Transformationen als

Λ = e−iα·L−φ·M , φ ≡ φβ̂ , Lk =
0
0
0T
ℓk
‹

, Mk =
êTk
∅3
0
êk
‹
(5.12)
darstellen kann, wobei ∅3 die 3 × 3-Nullmatrix ist und ℓ = (ℓ1 , ℓ2 , ℓ3 ) die Drehmatrizen sind:
„
ℓ1 =
0
0
0
0 0
0 −i
i 0
Ž
„
,
ℓ2 =
0 0
0 0
−i 0
Ž
i
0
0
„
,
ℓ3 =
0
i
0
Ž
−i 0
0 0
0 0
.
Die Erzeuger L und M der Lie-Gruppe L↑+ erfüllen die Vertauschungsrelationen
[Li , Lj ] = iεijk Lk
,
[Mi , Mj ] = iεijk Lk
,
[Li , Mj ] = iεijk Mk .
Aus der Darstellung (5.12) folgt sofort Λ† 6= Λ−1 , so dass die (nicht-kompakte!)
Lie-Gruppe L↑+ offensichtlich nicht-unitär ist.
5.4
Physikalische Konsequenzen der
Lorentz-Invarianz
Wir haben oben festgestellt, dass das zweite Einstein’sche Postulat (in Kombination mit weiteren Annahmen über die Homogenität und Isotropie von Raum
und Zeit) die Lorentz-Invarianz des Skalarprodukts
c2 (dτ )2 = (ds)2 = c2 (dt)2 − (dx)2 = dxµ dxµ
(5.13)
78
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
bedingt. Umgekehrt impliziert die Invarianz dieses Skalarprodukts das zweite Postulat, also kann (5.13) als die zentrale Gleichung der Relativitätstheorie
angesehen werden. Die Invarianz von (5.13) unter Lorentz-Transformationen bedeutet, dass alle physikalisch messbaren Größen entweder gemäß der LorentzGruppe oder zumindest einer geeigneten Darstellung dieser Gruppe transformiert werden. Da Rotationen in der Relativitätstheorie meist unwesentlich sind,
konzentrieren wir uns im Folgenden überwiegend auf Geschwindigkeitstransformationen, so dass die Koordinaten zweier Inertialsysteme K und K ′ mit
vrel (K ′ , K) = v, deren Ursprünge zur Zeit t = t′ = 0 zusammenfallen, durch

ct′
x′
‹

‹

‹
− sinh(φ)
cosh(φ)β̂
cosh(φ)
0
+
x⊥
− sinh(φ)β̂
=
1
0
+γ
x⊥
−β
=
−β
β̂

ct
xk
‹

ct
xk
‹
(5.14)
verknüpft sind. Da die x⊥ -Komponenten invariant sind unter Lorentz-Transformationen, ist es oft sinnvoll, die zweidimensionale Darstellung
ct′
x′k

=γ
−β
1
1
−β
‹
ct
xk
‹
(5.15)
einzuführen. Explizit lautet (5.15):
′
t
′
x
k
γ(t − cv2 xk )
γ(xk − vt)
=
=
t
xk
bzw.
=
=
γ(t′ + cv2 x′k )
.
γ(x′k + vt′ )
(5.16)
Gleichung (5.14) zeigt, dass ein Maßstab, der im Inertialsystem K senkrecht
zu β̂ aufgestellt ist und dort die Länge ℓ hat, in K ′ genauso lang ist. Andererseits
hat ein Maßstab, parallel zu β̂ in K, aus der Sicht von K ′ eine kleinere Länge:
(1)
ℓ′ < ℓ. Nehmen wir nämlich an, der Stab befinde sich in Ruhe zwischen xk und
(1)
(2)
(2)
xk , so dass xk − xk = ℓ gilt. Eine Messung der Länge des Stabs zur Zeit t′
in K ′ ergibt dann:
′(2)
ℓ′ = xk
′(1)
− xk

=
‹
1 (2)
x − vt′ −
γ k

‹
1 (1)
ℓ
xk − vt′ = .
γ
γ
(5.17)
Dies ist die bereits bekannte Lorentz-Kontraktion. In der Herleitung geht also
entscheidend ein, dass die Koordinaten x′(1) und x′(2) der Endpunkte bei dieser
Längenmessung in K ′ gleichzeitig (zur selben Zeit t′ ) bestimmt werden. Aus
(5.17) folgt noch, dass das Volumen V eines
p beliebigen Körpers, der in K ruht,
aus der Sicht von K ′ um einen Faktor γ1 = 1 − β 2 kleiner ist, da es sich bei der
Geschwindigkeitstransformation in der β̂-Richtung um diesen Faktor verringert.
Auch die Zeitdilatation lässt sich mit Hilfe der Lorentz-Transformation leicht
nachweisen. Betrachten wir z. B. eine Uhr, die in K ′ ruht und anzeigt, dass
zwischen zwei Ereignissen, die beide am Ort (x′k , x′⊥ ) in K ′ stattfanden, die
Zeit ∆t′ = t′2 − t′1 vergangen ist. Für einen Beobachter in K ist zwischen beiden
Ereignissen sogar
∆t = t2 − t1 = γ(t′2 +
v ′
v
x ) − γ(t′1 + 2 x′k ) = γ∆t′
c2 k
c
79
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
vergangen, so dass er zum Schluss kommt, dass die Uhr in K ′ nachgeht: Bewegte
Uhren laufen langsamer.
Lorentz-Transformationen sind im Allgemeinen nicht-kommutativ, und das
Gleiche gilt für Geschwindigkeitstransformationen. Man überprüft zum Beispiel
leicht, dass
ΛB (φ1 , ê1 )ΛB (φ2 , ê2 ) 6= ΛB (φ2 , ê2 )ΛB (φ1 , ê1 )
gilt. Eine Ausnahme sind Boosts in derselben Richtung:
ΛB (φ2 , β̂)ΛB (φ1 , β̂) = ΛB (φ1 + φ2 , β̂) ,
denn Matrixmultiplikation zeigt:
cosh(φ2 ) − sinh(φ2 )
− sinh(φ2 ) cosh(φ2 )
cosh(φ1 ) − sinh(φ1 )
− sinh(φ1 ) cosh(φ1 )
=
cosh(φ1 +φ2 ) − sinh(φ1 +φ2 )
− sinh(φ1 +φ2 ) cosh(φ1 +φ2 )
.
Die entsprechenden Geschwindigkeiten β1 , β2 und β1+2 sind also durch
β1+2
= tanh(φ1 + φ2 ) = tanh[artanh(β1 ) + artanh(β2 )]
β1 + β 2
=
1 + β 1 β2
(5.18)
miteinander verknüpft. Hiermit haben wir das Additionsgesetz für (parallel ausgerichtete) Geschwindigkeiten erhalten.
Wir betrachten - etwas allgemeiner und aus einem anderen Blickwinkel zwei Inertialsysteme K und K ′ mit vrel (K ′ , K) = v, deren Koordinaten durch
eine Lorentz-Transformation verbunden sind:
 ‹

‹
1
ct
0
=
+γ
x
x′⊥
β
β
β̂
ct′
x′k
(5.19)
.
Führen wir noch die Geschwindigkeiten
u≡
dx
dt
dx′
dt′
u′ ≡
,
mit den Geschwindigkeitskomponenten uk = u· β̂ und u⊥ = u−uk β̂ und analog
für u′ ein. Aus der ersten Zeile in (5.19) folgt:
dt
=γ
dt′
‚
′
β dxk
1+
c dt′
Œ
dt′
1
Š ,
= €
dt
γ 1 + c12 vu′k
bzw.
und die zweite Zeile impliziert:
–
dx
dx′⊥
+γ
=
u=
dt
dt′
‚
βc +
dx′k
Œ ™
β̂
dt′
u′⊥ + γ(v + u′k )β̂
dt′
€
Š .
=
dt
γ 1 + c12 vu′k
(5.20)
Komponentenweise erhält man also:
uk =
u′k + v
1+
1
′
c2 vuk
,
u⊥ =
€
u′⊥
γ 1+
1
′
c2 vuk
Š .
(5.21)
Die Nichtkommutativität der Lorentz-Transformationen ist auch in (5.20) klar
ersichtlich, denn u hängt nicht-symmetrisch von u′ und v ab.
80
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
Aus (5.21) kann auch das Transformationsverhalten von Winkeln bestimmt
werden. Nehmen wir an, ein Teilchen bewegt sich in K mit der Geschwindigkeit
u, die einen Winkel ϑ mit der β̂-Richtung einschließt: uk = u cos(ϑ) , u⊥ =
u sin(ϑ)û⊥ ; analog gilt dann u′k = u′ cos(ϑ′ ) und u′⊥ = u′ sin(ϑ′ )û⊥ . Einsetzen
in (5.21) liefert:
u cos(ϑ) =
u′ cos(ϑ′ ) + v
1 + c12 vu′ cos(ϑ′ )
,
u sin(ϑ) =
”
u′ sin(ϑ′ )
γ 1+
1
′
c2 vu
— ,
cos(ϑ′ )
und daher:
tan(ϑ) =
u′ sin(ϑ′ )
.
γ[u′ cos(ϑ′ ) + v]
Falls das „Teilchen“ ein Photon, oder klassisch: ein Lichtstrahl, ist und sich mit
der Geschwindigkeit c bewegt, vereinfacht sich diese Formel auf
tan(ϑ) =
sin(ϑ′ )
.
γ[cos(ϑ′ ) + β]
(5.22)
Diese Richtungsänderung des Lichts beim Übergang auf ein anderes Inertialsystem ist als Aberration bekannt und wurde erstmals 1725 von dem britischen
Astronomen James Bradley beobachtet. Bradley entdeckte, dass die Position
der Sterne sich ändert aufgrund der Bewegung der Erde in ihrer Umlaufbahn
um die Sonne. Für kleine β-Werte erhält man aus (5.22):
ϑ − ϑ′
∼ [tan(ϑ) − tan(ϑ′ )] ∼ tan(ϑ′ )
cos2 (ϑ′ )
•
1−
β
cos(ϑ′ )
‹
˜
−1 ,
und daher:
∆ϑ ≡ ϑ′ − ϑ ∼ β sin(ϑ′ ) + O(β 2 ) ,
in Übereinstimmung mit Bradleys Ergebnissen.
5.5
4-Vektoren
Jede physikalische Größe aµ = (a0 , a1 , a2 , a3 ), die unter Lorentz-Transformationen genauso transformiert wird wie der 4-Ortsvektor xµ ,
(a′ )µ = Λµν aν ,
heisst kontravarianter 4-Vektor, jede Größe aµ , die wie xµ transformiert wird,
(a′ )µ = Λµν aν
,
Λµν = gµρ g νσ Λρσ
,
ein kovarianter 4-Vektor. Mit Hilfe des metrischen Tensors kann man aus einem kovarianten 4-Vektor immer einen kontravarianten 4-Vektor machen, aµ =
g µν aν , und umgekehrt. Das Quadrat eines 4-Vektors ist als
a2 ≡ aµ aµ
81
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
definiert; es ist offensichtlich invariant unter Lorentz-Transformationen. Vektoren mit a2 > 0, a2 = 0 oder a2 < 0 werden zeit-, licht- oder raumartig genannt.
Eine Größe, die invariant ist unter Lorentz-Transformationen, wird allgemein
ein (Lorentz-)Skalar genannt. Auch das Skalarprodukt zweier unterschiedlicher
4-Vektoren,
a · b ≡ aµ b µ = aµ b µ
ist Lorentz-invariant und daher ein Skalar:
(a′ )µ (b′ )µ = gµν (a′ )ν (b′ )µ = Λµσ gµν Λν ρ bσ aρ
= (ΛT gΛ)σρ bσ aρ = gσρ bσ aρ = aσ bσ
.
Falls ϕ(x) ein Skalar ist, dann ist der 4-Gradient
∂ϕ
=
∂µ ϕ =
∂xµ

‹
1 ∂ϕ
, ∇ϕ
c ∂t
ein kovarianter 4-Vektor. Dies folgt aus der Form der Poincaré-Transformation:
(x′ )µ = Λµν xν + aµ
bzw. xµ = (Λ−1 )µν [(x′ )ν − aν ] ,
die das Transformationsverhalten der Ableitungen:
∂ν′ =
∂xµ
∂µ = (Λ−1 )µν ∂µ = Λν µ ∂µ
∂(x′ )ν
impliziert. Analog ist ∂ µ ϕ wegen (∂ ′ )ν = Λν µ ∂ µ ein kontravarianter 4-Vektor.
Das Skalarprodukt
∂aµ
= ∂µ aµ = ∂ µ aµ ≡ ∂ · a
∂xµ
wird als 4-Divergenz bezeichnet; die 4-Divergenz ist also invariant unter LorentzTransformationen.
Ein weiterer 4-Vektor ist die 4-Geschwindigkeit uµ eines Teilchens, das sich
mit der 3-Geschwindigkeit u(t) im Inertialsystem K bewegt,
dxµ
u ≡
ds
µ
r
,
ds = cdt
1−
u 2
c
.
Es ist zu beachten, dass die so definierte 4-Geschwindigkeit dimensionslos ist,4
da sowohl xµ als auch s die Dimension einer Länge besitzen. Da uµ also als
Ableitung von xµ (einem 4-Vektor) nach dem Abstand s des Teilchens (einem
Skalar) definiert ist, wird uµ selbst ebenfalls wie ein 4-Vektor transformiert. Die
explizite Form von uµ ist:
d
u
(ct, x)
1
uµ = qdt € Š2 = q
€ Š2 1, c ≡ γu (1, β u ) .
1 − uc
c 1 − uc
4 Wir übernehmen hiermit die Notation von Landau und Lifschitz, Band II. Auch die Konµ
ist üblich. In vielen Büchern sind beide Konventionen sowieso ununtervention uµ = dx
dτ
scheidbar, da c = 1 gesetzt wird.
82
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
Entweder aus dieser expliziten Form oder direkt aus dxµ dxµ = (ds)2 kann man
nun u2 = uµ uµ = 1 folgern. Das Quadrat der 4-Geschwindigkeit ist also auf
Eins normiert; ihre Komponenten sind daher nicht unabhängig.
µ
Analog definiert man die 4-Beschleunigung du
ds , die ebenfalls ein 4-Vektor ist
und die physikalische Dimension [Länge−1 ] hat. Durch Ableiten von uµ uµ = 1
findet man, dass die 4-Beschleunigung stets senkrecht auf der 4-Geschwindigkeit
µ
steht: du
ds uµ = 0.
Wir untersuchen nun das Transformationsverhalten einiger Größen, die in
der Elektrodynamik relevant sind. Als erste Größe betrachten wir die elektrische
Ladung von Elementarteilchen oder ganzen Körpern. Es ist ein experimentelles
Faktum, dass die elektrische Ladung ein Lorentz-Skalar ist. Alles andere würde unserer Alltagserfahrung widersprechen: Obwohl die Ionen und Elektronen
in Festkörpern sehr unterschiedliche Geschwindigkeiten haben und diese außerdem temperatur- und materialabhängig sind, sind Alltagsgegenstände - wie wir
wissen - elektrisch neutral.
Es folgt, dass die Ladungsdichte wie ρ′ = γv ρ0 transformiert wird, wenn
ρ0 die Ladungsdichte im Ruhesystem K darstellt und ρ′ die Ladungsdichte in
einem Inertialsystem K ′ mit vrel (K ′ , K) = v. Dies folgt sofort daraus, dass die
Gesamtladung in einem Volumenelement erhalten ist, ρ0 dV = ρ′ dV ′ , und das
Volumenelement gemäß dV ′ = dV
γv transformiert wird.
Nehmen wir nun an, die Ladungsdichte ruht nicht in K, sondern bewegt
sich mit der Geschwindigkeit u in diesem Inertialsystem. Sie befindet sich somit offensichtlich in Ruhe im Inertialsystem K ′ mit vrel (K ′ , K) = u. Die in K
2
gemessene Ladungsdichte ist daher ρ = γu ρ0 mit γu ≡ (1 − uc2 )−1/2 . Neben
der Ladungsdichte misst K auch eine Stromdichte j = ρu = γu ρ0 u. Insgesamt
verhält
j µ ≡ (cρ, j) = ρ0 cγu 1,
u
= ρ0 cγu (1, βu ) = ρ0 cuµ
c
sich also wie ein 4-Vektor und wird dementsprechend als 4-Stromdichte bezeichnet. Folglich wird j µ gemäß der Lorentz-Gruppe transformiert.
In diesem Argument wurde vorausgesetzt, dass alle an ρ beteiligten Einzelladungen die gleiche Geschwindigkeit u haben. Im allgemeinen Fall, in dem
die Ladungsdichte aus Ladungen unterschiedlicher Geschwindigkeit aufgebaut
ist, erreicht man denselben Schluss, dass j µ = (cρ, j) wie ein kontravarianter
4-Vektor transformiert wird, indem man sich die Gesamtladungsdichte aus Teilladungsdichten uniformer Geschwindigkeit aufgebaut denkt. Das Erhaltungsgesetz für die Gesamtladung, das in differentieller Form als Kontinuitätsgleichung
darstellbar ist, lautet in der 4-Schreibweise
0=
∂ 0
∂
∂(cρ)
∂
∂ρ
j + i j i = ∂µ j µ .
+∇·j =
+ i ji =
∂t
∂(ct)
∂x
∂x0
∂x
Die manifeste Lorentz-Invarianz dieser Gleichung zeigt, dass die Gesamtladung
in allen Inertialsystemen erhalten ist, falls sie in irgendeinem Inertialsystem
erhalten ist.
Wir zeigen nun, dass auch das skalare Potential Φ und das Vektorpotential A
zu einem 4-Vektor, dem 4-Potential Aµ = (Φ, cA), kombiniert werden können.
Aus den homogenen Maxwell-Gleichungen ∇ · B = 0 und ∇ × E + ∂B
∂t = 0 folgt
83
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
bekanntlich:
E = −∇Φ −
∂A
∂t
,
B=∇×A.
Die inhomogenen Maxwell-Gleichungen liefern daher:
1
(cρ)
ε0 c
∂
1
ρ = ∇ · E = −∆Φ − ∇ · A
ε0
∂t

‹
1 ∂2
∂
1 ∂Φ
=
−
∆
Φ
−
∇
·
A
+
c2 ∂t2
∂t
c2 ∂t
•
˜
∂
∂Φ
∂
= Φ −
∇ · (cA) +
= Φ −
(∂ν Aν )
∂(ct)
∂(ct)
∂(ct)
=
und
1
j
ε0 c

= µ0 cj = c ∇ × B − ε0 µ0
∂E
∂t
‹
∂Φ ∂ 2 A
−∇
−
∂t
∂t2
2
1 ∂ A
1 ∂Φ
= c ∇(∇ · A) − ∆A + 2 2 + 2 ∇
c ∂t
c
∂t
•
˜
∂Φ
∂
= ∇ ∇ · (cA) +
+ (cA) = (cA) −
(∂ν Aν ) .
∂(ct)
∂(−x)
1
= c ∇ × (∇ × A) − 2
c
Die Kombination dieser beiden Gleichungen liefert in 4-Schreibweise:
1 µ
j = Aµ − ∂ µ (∂ν Aν ) .
ε0 c
(5.23)
Die linke Seite dieser Gleichung ist ein 4-Vektor, also muss auch die rechte Seite
wie ein 4-Vektor transformiert werden. Wegen der Eichfreiheit bei der Wahl von
Aµ bedeutet dies noch keineswegs, dass die einzelnen Terme Aµ und ∂ µ (∂ν Aν )
in (5.23) wie 4-Vektoren transformiert werden; um dies zu erreichen, muss man
die Eichung festlegen. Die Eichtransformation hat in 4-Schreibweise die Form
Aµ −→ õ ≡ Aµ + ∂ µ Λ ,
wobei Λ eine zunächst beliebige Funktion des 4-Ortsvektors xν ist. Um diese
Eichfreiheit zu eliminieren, wird häufig die Lorenz-Eichung,
∂ν Aν = 0 ,
(5.24)
auferlegt. Die Bestimmungsgleichung für das 4-Potential reduziert sich in dieser
Eichung auf:
Aµ =
1 µ
j .
ε0 c
(5.25)
Die Lorenz-Eichung läßt sich immer realisieren, denn wenn ∂ν Āν 6= 0 gilt, kann
man immer eine Funktion χ und ein neues 4-Potential Aµ einführen:
χ ≡ −∂µ Āµ
84
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
Aµ ≡ Āµ + ∂ µ χ ,
so dass Aµ dieselben physikalischen Felder wie Āµ beschreibt und außerdem
die Lorenz-Bedingung ∂µ Aµ = 0 erfüllt. Die Lorenz-Bedingung (5.24) legt das
4-Potential nicht eindeutig fest, da auch das alternative Potential
õ = Aµ + ∂ µ Λ ,
(5.26)
Λ = 0
die gleichen physikalischen Felder beschreibt und die Lorenz-Bedingung erfüllt.
Das 4-Potential ist in der Lorenz-Eichung also bis auf eine Lösung der Wellengleichung bestimmt. Für alle möglichen Lorentz-Skalare Λ in (5.26) sind sowohl
Aµ als auch õ physikalisch äquivalente 4-Vektoren.
Gleichung (5.25) zeigt, dass das 4-Potential in der Lorenz-Eichung eine inhomogene Wellengleichung erfüllt. Genau wie bei der alternativen (und äquivalenten) Formulierung mit Hilfe der Coulomb-Eichung stellen wir fest, dass die
Maxwell-Theorie elektromagnetische Wellen vorhersagt. Falls keine Quellen des
elektromagnetischen Feldes vorhanden sind, also für j µ = 0, genügt Aµ (x) der
homogenen Wellengleichung Aµ = 0 und kann somit als Überlagerung ebener
Wellen der Form
Aµ (x)
=
=
ω
(A0 )µ ei(k·x−ωt) = (A0 )µ e−i( c ct−k·x)
ν
(A0 )µ e−ikν x = (A0 )µ e−iϕ(x)
(5.27)
geschrieben
werden, wobei die Phase ϕ(x) = kν xν und der 4-Wellenvektor k ν =
€
Š
ω
c,k
mit der Frequenz ω = c|k| eingeführt wurden. Nehmen wir an, (5.27)
gilt im Inertialsystem K. Im Inertialsystem K ′ mit vrel (K ′ , K) = v gilt dann:
′
′
(A′ )µ (x′ ) = Λµν Aν (x) = Λµν (A0 )ν e−iϕ(x) = (A′0 )µ e−iϕ (x )
mit
(A′0 )µ ≡ Λµν (A0 )ν
und
ϕ′ (x′ ) ≡ ϕ(x) = kν xν = kν (Λ−1 )ν µ (x′ )µ = kν Λµν (x′ )µ ≡ (k ′ )µ (x′ )µ .
Wir stellen also fest, dass die Amplitude des 4-Potentials wie ein 4-Vektor und
die Phase wie ein Lorentz-Skalar transformiert werden. Außerdem haben wir
die wichtige Entdeckung gemacht, dass auch der 4-Wellenvektor k ν ein echter
4-Vektor ist, d. h. gemäß der Lorentz-Gruppe transformiert wird: (k ′ )µ = Λµν kν
bzw. (k ′ )µ = Λµν k ν . Im Falle von Wellenpaketen, d. h. von Überlagerungen
ebener Wellen, gelten diese Schlussfolgerungen auch für jede einzelne FourierKomponente.
Aus der Quantenmechanik ist bekannt, dass ein Photon mit dem Wellenvektor k und der Frequenz ω einen Impuls p = ~k und eine Energie E = ~ω
besitzt. Für den Spezialfall des Photons stellen wir hier also erstmals fest, dass
Impuls und€ Energie
in€ der ŠRelativitätstheorie zu einem 4-Vektor vereint werŠ
den: pµ ≡ Ec , p = ~ ωc , k = ~k µ . Wir werden später sehen, dass diese enge
Verflechtung von Energie und Impuls auch allgemeiner gilt.
85
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
Die Lorentz-Transformation für den 4-Wellenvektor k µ =
€
Š
ω
c,k
k · β̂ ≡ k cos(ϑ) und k⊥ ≡ k − kk β̂ ≡ k sin(ϑ)k̂⊥ :

‹

‹
1
ω ′ /c
0
=
+γ
′
k
k⊥
−β
−β
β̂

mit kk ≡
‹
ω/c
kk
zeigt, dass die Frequenz ω der Welle abhängig vom Einfallswinkel ϑ wie folgt
transformiert wird:

ω ′ = γ(ω − βckk ) = γω 1 − β
kk
k
‹
= γω[1 − β cos(ϑ)] .
(5.28)
Hierbei ist das Transformationsgesetz für den Winkel,
|k′⊥ |
|k⊥ |/k
sin(ϑ)
|k⊥ |
Š = €k
Š =
= €
ω
k
kk′
γ[cos(ϑ)
− β]
γ kk − β c
γ k −β
tan(ϑ′ ) =
oder umgekehrt
tan(ϑ) =
sin(ϑ′ )
,
γ[cos(ϑ′ ) + β]
natürlich gleich dem Gesetz (5.22) für die Transformation von Winkeln, das wir
im Rahmen unserer Untersuchung von Aberration von Sternenlicht erhielten.
Gleichung (5.28) beschreibt den relativistischen Doppler-Effekt : Die Frequenz ω
wird nicht nur mit dem winkelabhängigen Faktor 1 − βv cos(ϑ) multipliziert, der
bereits vom nicht-relativistischen Doppler-Effekt bekannt ist, sondern auch mit
dem Faktor γv , der also eine relativistische Korrektur darstellt und sogar für
transversal einfallendes Licht (ϑ = π2 ) einen Doppler-Effekt hervorruft („transversaler Doppler-Effekt“). Beim longitudinalen Doppler-Effekt (ϑ = 0 bzw. ϑ =
π) wird die Frequenz ω wie folgt transformiert:
Ê
′
ω =
1−β
ω
1+β
Ê
(ϑ = 0)
,
′
ω =
1+β
ω
1−β
(ϑ = π) .
Beim transversalen Doppler-Effekt (ϑ = π2 ) tritt offensichtlich eine Rotverschiebung auf: ω = γ1v ω ′ < ω ′ . Als typische Anwendung des transversalen DopplerEffekts betrachten wir einen Stern, der im Inertialsystem K ′ ruht und dort Licht
mit der Frequenz ω ′ ausstrahlt. Ein Beobachter auf der Erde („Inertialsystem
K“), für den dieses Licht unter dem Winkel ϑ = π2 relativ zur v-Richtung einfällt,
wird die kleinere Frequenz ω = ω ′ /γv messen. Der transversale Doppler-Effekt
ist eine Konsequenz der Zeitdilatation, denn für den Beobachter auf der Erde
wird eine in K ′ ruhende Uhr (in diesem Fall also der Licht ausstrahlende Stern)
um einen Faktor γ1v langsamer laufen als eine Uhr, die im Inertialsystem K ruht.
5.6
Masse und Energie
Wegen der einfachen quantenmechanischen Relation E = ~ω für die Energie
eines Photons mit der Frequenz ω kann man aufgrund des Doppler-Effekts,
Gleichung (5.28), sofort das Transformationsgesetz für die Energie elektromagnetischer Strahlung angeben: Sendet ein Körper in seinem Ruhesystem K insgesamt N Photonen der Frequenz ω unter einem Winkel ϑ zur β̂-Achse aus,
86
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
so misst ein Beobachter im Inertialsystem K ′ mit vrel (K ′ , K) = v = v β̂ die
ausgestrahlte Energie
E ′ = N ~ω ′ = γN ~ω[1 − β cos(ϑ)] = γE[1 − β cos(ϑ)] .
(5.29)
Betrachten wir nun einen Körper der Masse m0 in seinem Ruhesystem K, der
in den Richtungen ϑ und ϑ − π jeweils N Photonen der Frequenz ω ausstrahlt,
stets zwei Photonen (eins in jeder Richtung) zur gleichen Zeit. Die Energie des
Körpers vor und nach dem Ausstrahlen sei E(0) bzw. E (0) (0). Schreiben wir
noch: 2N ~ω = ε, dann lautet das Gesetz der Energieerhaltung in K:
E(0) = E (0) (0) + 21 ε + 21 ε = E (0) (0) + ε .
!
N h
m0
!
N h
#
(#
)
^
Abbildung 5.7: Ausstrahlung von Photonen in zwei entgegengesetzte Richtungen
Auch in K ′ gilt Energieerhaltung, nun für die Energien des bewegten Körpers
und der Strahlung:
E(v)
= E (0) (v) + 21 εγ[1 − β cos(ϑ)] + 21 εγ[1 − β cos(ϑ − π)]
= E (0) (v) + εγ .
Zieht man die Energieerhaltungsgesetze in K und K ′ unter Verwendung von
(0)
Ekin (v) ≡ E (0) (v) − E (0) (0)
Ekin (v) ≡ E(v) − E(0) ,
voneinander ab, so folgt für β =
v
c
≪ 1:
(0)
2
2
1
1
2 m0 v − 2 εβ
€
Š
2
ε
1
2 m0 − c 2 v
Ekin (v) = Ekin (v) − ε(γ − 1) ∼
=
(0)
Das Massendefizit µ0 ≡ m0 − m0 =
ε
c2
(0)
= 21 m0 v 2 .
entspricht also einer Energie ε:
ε = µ0 c2 .
Da man prinzipiell die ganze Ruhemasse eines Körpers in Strahlung umwandeln
kann (z. B. durch Annihilation von Materie und Antimaterie), folgt für E (0) (0) =
E (0) (v) = 0 aus den beiden Energieerhaltungsgesetzen:
E(0) = ε = m0 c2
,
E(v) = εγ = γm0 c2 = mc2 .
Hierbei wurde die relativistische Masse m ≡ γm0 eingeführt. Masse und Energie
sind demnach äquivalent. Außerdem folgt nun auch für Teilchen, dass der 4Impulsvektor

pµ ≡
‹
u
E
= m0 cγu (1, β u ) = m0 cuµ
, mu = mc 1,
c
c
87
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
ein 4-Vektor ist, der die physikalischen Größen Energie E und Impuls p = mu =
γu m0 u untrennbar miteinander verknüpft.
Das hier dargestellte Argument stammt aus einer Arbeit von A. Einstein
(Annalen der Physik, 17, 639 (1905)), in der er übrigens interessanterweise eine
klassische (d. h. nicht-quantenmechanische) Herleitung des Transformationsgesetzes (5.29) für die Strahlungsenergie gab. Das Konzept des Photons, das er ja
selbst wenige Monate zuvor in seiner Arbeit über den photoelektrischen Effekt
vorgeschlagen hatte, muss ihm wohl noch zu spekulativ erschienen sein.
5.7
Die Lorentz-Kraft und elektromagnetische
Felder
Bevor wir uns der Formulierung des relativistischen Kraftgesetzes, d.h. der Lorentz’schen Bewegungsgleichung widmen, betrachten wir die folgenden Ableitungen des 4-Potentials nach dem 4-Ortsvektor:
F µν ≡ ∂ µ Aν − ∂ ν Aµ
.
Diese Ableitungen sind physikalisch äußerst relevant, da sie die Komponenten
der elektrischen und magnetischen Felder bilden. Wir werden sie daher bei der
relativistischen Formulierung der Lorentz-Kraft benötigen. Aus der Definition
folgt sofort, dass F µν antisymmetrisch unter Vertauschung der Indizes (µν) ist;
insbesondere gilt also F µµ = 0. Die explizite Form von F µν folgt aus F µµ = 0
und
•
F
i0
F ij
=
=
∂A
∂ A − ∂ A = −∇Φ −
∂t
εijk (−cBk ) = −cεijk Bk
i
0
0
˜
i
= Ei
i
als
†
F µν =
0
E1
E2
E3
−E1
0
cB3
−cB2
−E2
−cB3
0
cB1
−E3
cB2
−cB1
0

.
(5.30)
Da die Elemente von F µν vollständig durch (E, B) bestimmt werden, heißt F µν
auch elektromagnetischer Feldtensor.
Die relativistische Variante der Lorentz-Kraft ist nun durch
K µ ≡ qF µν uν = quν (∂ µ Aν − ∂ ν Aµ )
definiert. Da die 4-Geschwindigkeit uµ , das 4-Potential Aµ und die Ableitungen ∂ µ alle 4-Vektoren sind, werden sowohl uν Aν als auch der Differentialoperator uν ∂ ν unter Lorentz-Transformationen als Skalare und K µ selbst daher
als kontravarianter 4-Vektor transformiert. Durch explizite Berechnung sieht
man außerdem, dass K µ in der Tat eine relativistische Verallgemeinerung der
Lorentz-Kraft darstellt:
Kµ
= q(F µ0 u0 + F µj uj ) = qγu [F µ0 + F µj (−βj )]
= qγu (E · β , E + u × B) ,
(5.31)
88
------------------------------------------------------------------------------- 5. SPEZIELLE RELATIVITÄTSTHEORIE
wobei benutzt wurde:
F ij (−βj ) = (−εijk cBk )(−βj ) = c(β × B)i = (u × B)i
.
Der Zeitanteil von K µ in (5.31) ist genau die Leistung, die das elektromagnetische Feld am Teilchen verrichtet. Betrachten wir nun die Gleichung
m 0 c2
d2 xµ
d2 xµ
=
m
= Kµ
0
ds2
dτ 2
,
dτ =
dt
γu
,
(5.32)
die K µ mit einem anderen 4-Vektor, der 4-Beschleunigung, in Verbindung bringt.
Gleichung (5.32) ist sicherlich korrekt im momentanen Ruhesystem des Teilchens, denn dann lautet sie:
d2 x
0 , m0 2
dt
= (0 , qE)
.
Da das Gesetz (5.32) in diesem speziellen Inertialsystem gilt und Lorentzkovariant formuliert wurde, muss es nach dem Relativitätsprinzip in jedem Inertialsystem gelten. Wir haben somit in der Form von Gleichung (5.32) die
relativistische Formulierung der Lorentz’schen Bewegungsgleichung gefunden.
Es ist klar, dass das Kraftgesetz (5.32) in der Speziellen Relativitätstheorie von
zentraler Bedeutung ist, da es die Dynamik geladener Teilchen in beliebigen
elektromagnetischen Feldern vollständig festlegt.
Es sei schließlich noch daran erinnert, dass die 4-Beschleunigung stets senkrecht auf der 4-Geschwindigkeit stehen muss. Das Gleiche muss gemäß (5.32)
dann natürlich auch für die 4-Kraft K µ gelten. Aufgrund der Antisymmetrie
von F µν folgt tatsächlich:
uµ
duµ
= uµ
dτ

‹
1
q
Kµ =
uµ F µν uν = 0 ,
m0 c
m0 c
so dass diese Konsistenzbedingung automatisch erfüllt ist.
89
Literaturverzeichnis
[1] Is. Newton, Eq. Aur., Philosophiae naturalis principia mathematica, editio
tertia, Guil. & Joh. Innys (Londini, MDCCXXVI).
[2] Murray R. Spiegel, Allgemeine Mechanik, Theorie und Anwendung,
McGraw-Hill (Hamburg, 1989).
[3] J. Honerkamp, H. Roemer, Klassische Theoretische Physik, Springer Verlag
(Berlin, 1993).
[4] Herbert Goldstein, Classical Mechanics, Addison-Wesley (Reading, 1978).
[5] F. Scheck, Mechanik - Von den Newton’schen Gleichungen zum deterministischen Chaos, Springer Verlag (7. Auflage, 2002).
[6] A. Sommerfeld, E. Fues, Vorlesungen über Theoretische Physik, Bd.1, Mechanik, Harri Deutsch Verlag (Frankfurt am Main, 1994).
[7] A. P. French, Special Relativity, Nelson (Sunbury-on-Thames, 1977).
[8] J. D. Jackson, Classical Electrodynamics, John Wiley (New York, 3. Auflage
1999).
[9] M. Schwartz, Principles of Electrodynamics, Dover Publications (New York,
1987).
[10] L. D. Landau, E. M. Lifschitz, Lehrbuch der Theoretischen Physik, Band I,
Akademie-Verlag (Berlin, 1981).
[11] V. I. Arnold, Mathematical Methods of Classical Mechanics, SpringerVerlag (New York, 1978).
[12] E. T. Whittaker, A treatise on the analytical dynamics of particles and
rigid bodies, Cambridge Univ. Press (Cambridge, 1965).
Mathematische Handbücher:
[13] M. Abramowitz, I. A. Stegun, Handbook of Mathematical Functions, Dover
(New York, 1970)
[14] I. S. Gradshteyn, I. M. Ryzhik, Table of Integrals, Series and Products,
Academic Press (New York, 1980)
Herunterladen