Theoretische Physik I Nicolas Borghini Version vom 15. Februar 2016 Nicolas Borghini Universität Bielefeld, Fakultät für Physik Homepage: http://www.physik.uni-bielefeld.de/~borghini/ Email: borghini at physik.uni-bielefeld.de Vorwort Inhaltsverzeichnis Einleitung • • • • • • • • • • • • • • • • • • • • • • • • • • • • 1 • • • • • • • • • • • • • • • • • • • • • • • • • • • • 5 Newton’sche Mechanik • • • • • • • • • • • • • • • • • • • • • • • • • • 5 • • • • • Klassische Mechanik I I.1 Grundbegriffe der Newton’schen Mechanik 5 I.1.1 Raumzeit der Newton’schen Mechanik 6 I.1.2 Beschreibung von mechanischen Systemen und ihrer Bewegung 7 I.1.3 Mechanische Kräfte 9 I.2 Newton’sche Gesetze 12 I.2.1 I.2.2 I.2.3 I.2.4 I.2.5 Erstes Newton’sches Gesetz 12 Zweites Newton’sches Gesetz 13 Drittes Newton’sches Gesetz 15 „Viertes Newton’sches Gesetz“ 15 Energieerhaltung 16 I.3 Inertialsysteme. Galilei-Transformationen 17 I.3.1 I.3.2 I.3.3 I.3.4 I.3.5 Translationen 17 Eigentliche Galilei-Transformationen 18 Drehungen 19 Allgemeine Galilei-Transformationen 20 Kräfte und Galilei-Transformation 20 I.4 Beschleunigte Bezugssysteme. Scheinkräfte 21 I.4.1 Linear beschleunigte Bezugssysteme 22 I.4.2 Rotierende Bezugssysteme 23 I.5 Mehrteilchensysteme 27 I.5.1 I.5.2 I.5.3 I.5.4 I.5.5 Grundlagen 28 Bewegung des Schwerpunkts 30 Drehimpuls 30 Energie 31 Schwerpunktsystem 35 I.6 Zwei-Körper-Systeme 36 I.6.1 I.6.2 I.6.3 I.6.4 Separation der Bewegungsgleichungen 36 Gekoppelte Punktmassen 38 Kepler-Problem 38 Streuung 44 Appendix zum Kapitel I • • • • • • • • • • • • • • • • • • • • • • • • • • • 49 • • • • • • • • • • • • • • • • 50 I.A Alternative Herleitung der Kepler’schen Bahnkurven 49 II Lagrange-Formalismus: Grundlagen II.1 Ein Resultat aus der Variationsrechnung 50 II.1.1 Funktional 50 II.1.2 Extremierung eines Funktionals 51 • • • • v II.2 Hamilton-Prinzip 54 II.2.1 II.2.2 II.2.3 II.2.4 Definitionen 54 Hamilton-Prinzip. Euler–Lagrange-Gleichungen 55 Erste Beispiele 56 Systeme mit Zwangsbedingungen 59 II.3 Symmetrien und Erhaltungsgrößen 62 II.3.1 Invarianz unter Raumzeit-Transformationen 62 II.3.2 Noether-Theorem 66 III Lagrange-Formalismus: Anwendungen • • • • • • • • • • • • • • • • • • 69 • • • • • • • • • • • • • • • • • • 85 Grundlagen der Speziellen Relativitätstheorie • • • • • • • • • • • • • • • • 101 Mathematischer Apparat der Speziellen Relativitätstheorie • • • • • • • • • 101 • • • • • • • • 116 III.1 Starre Körper 69 III.1.1 Beschreibung des starren Körpers 69 III.1.2 Bewegungsgleichungen 71 III.2 Kleine Schwingungen 78 III.2.1 Eindimensionales Problem 78 III.2.2 Multidimensionales Problem 81 III.2.3 Gedämpfte Schwingungen 83 IV Hamilton-Formalismus • • • • • • • • IV.1 Hamilton’sche Bewegungsgleichungen 85 IV.1.1 IV.1.2 IV.1.3 IV.1.4 Kanonisch konjugierter Impuls 85 Hamilton-Funktion 86 Kanonische Bewegungsgleichungen 87 Beispiele 88 IV.2 Kanonische Transformationen 90 IV.2.1 IV.2.2 IV.2.3 IV.2.4 Phasenraum-Funktionen 90 Poisson-Klammer 90 Poisson-Klammer und Zeitentwicklung 92 Kanonische Transformationen 93 IV.3 Phasenraum 97 V V.1 Einstein’sche Postulate 101 V.1.1 Motivation 101 V.1.2 Einstein’sche Postulate 101 V.2 Lorentz-Transformationen 102 V.2.1 V.2.2 V.2.3 V.2.4 Linienelement 102 Lorentz-Transformationen 103 Folgerungen 106 Minkowski-Raum 106 V.3 Vierervektoren und Vierertensoren 108 V.3.1 V.3.2 V.3.3 V.3.4 VI Lorentz-Skalare 108 Vierervektoren 108 Vierertensoren 112 Kovariante Formulierung eines physikalischen Gesetzes 114 Relativistische Mechanik • • • • • • • • • • • • VI.1 Bewegung eines freien relativistischen Teilchens 116 VI.1.1 Lagrange-Funktion und Wirkung eines freien Teilchens 116 VI.1.2 Impuls und Energie eines freien Teilchens 117 VI.2 Kovariante Formulierung des Grundgesetzes der Mechanik 119 • • • • vi Klassische Elektrodynamik • • • • • • • • • • • • • • • • • • • • • • • • • 123 VII • • • • • • • • • • • • • • • • • • • • • • • • 123 • • • • • • • • • • • • • • • • • • • • • • 129 • • • • • • • • • • 148 • • • • • • • • • • 162 Einleitung • • • • • • VII.1 Grundbegriffe und Definitionen 123 VII.2 Einheiten 126 VIII Elektrostatik • • • • • • • VIII.1 Elektrisches Potential 129 VIII.1.1 VIII.1.2 VIII.1.3 VIII.1.4 Skalarpotential 129 Poisson-Gleichung 129 Elektrisches Feld und Potential von Ladungen 130 Elektrostatische potentielle Energie 132 VIII.2 Bestimmung des Skalarpotentials aus der Poisson-Gleichung 135 VIII.2.1 Green’sche Funktionen 135 VIII.2.2 Lösung der Poisson-Gleichung auf R3 135 VIII.2.3 Lösung der Poisson-Gleichung auf einem endlichen Gebiet von R3 137 VIII.3 Multipolentwicklung 140 VIII.3.1 VIII.3.2 VIII.3.3 VIII.3.4 IX Kartesische Multipolmomente 140 Beispiele von Multipolmomenten 141 Wechselwirkung zwischen zwei Ladungsverteilungen 143 Multipolentwicklung in Kugelkoordinaten 146 Magnetostatik • • • • • • • • • • • • • • • • • • • IX.1 Grundbegriffe und -ergebnisse der Magnetostatik 148 IX.1.1 IX.1.2 IX.1.3 IX.1.4 IX.1.5 Vektorpotential 148 Poisson-Gleichungen der Magnetostatik 149 Integrale Formulierung der Grundgleichungen der Magnetostatik 152 Magnetisches Feld induziert durch einfache Ladungsströme 153 Kraft zwischen zwei Stromkreisen 156 IX.2 Multipolentwicklung 157 IX.2.1 Multipolmomente einer Ladungsstromverteilung 157 IX.2.2 Magnetisches Dipolmoment einer Leiterschleife 159 IX.2.3 Magnetischer Dipol in einem äußeren magnetischen Feld 160 X Zeitabhängige elektromagnetische Felder • • • • • • X.1 Grundgesetze 162 X.1.1 Maxwell-Gleichungen 162 X.1.2 Bewegungsgleichungen für die elektrischen und magnetischen Felder 165 X.2 Elektrodynamische Potentiale 166 X.2.1 Definition 166 X.2.2 Eichinvarianz 167 X.2.3 Bewegungsgleichungen für die elektrodynamischen Potentiale 168 X.3 Energie und Impuls des elektromagnetischen Feldes 169 X.3.1 Energiedichte und -stromdichte des elektromagnetischen Feldes 169 X.3.2 Impulsdichte und -stromdichte des elektromagnetischen Feldes 171 X.4 Elektromagnetische Wellen im Vakuum 173 X.4.1 Klassische Wellengleichung 173 X.4.2 Elektromagnetische Wellen 176 X.5 Klassische Theorie der Strahlung 179 X.5.1 X.5.2 X.5.3 X.5.4 Green’sche Funktion der klassischen Wellengleichung 179 Retardierte Potentiale 182 Multipolentwicklung 183 Potentiale und Felder einer bewegten Punktladung 185 vii XI Relativistisch kovariante Formulierung der Elektrodynamik • • • • • • • • 193 • • • • • • • • • 201 XI.1 Lorentz-kovariante elektromagnetische Größen 193 XI.1.1 XI.1.2 XI.1.3 XI.1.4 Elektromagnetischer Feldstärketensor 193 Viererpotential 195 Elektrischer Viererstrom 196 Energieimpulstensor 196 XI.2 Relativistisch kovariante Formulierung der Grundgesetze 197 XI.2.1 XI.2.2 XI.2.3 XI.2.4 Maxwell-Gleichungen 197 Kontinuitätsgleichung 197 Lorentz-Kraft und -Kraftdichte 198 Energie- und Impulsbilanzgleichungen 198 XI.3 Weitere Resultate in relativistisch kovarianter Form 199 XI.3.1 Bewegungsgleichung für das Viererpotential 199 XI.3.2 Klassische Wellengleichung und ebene Wellen 199 XI.3.3 Retardiertes Viererpotential 200 XII Lagrange-Formulierung der Elektrodynamik • • • • • • XII.1 Ladungen und Ströme in einem elektromagnetischen Feld 201 XII.1.1 Wiederholung: Lagrange-Funktion einer freien Punktladung 201 XII.1.2 Punktladung in einem äußeren elektromagnetischen Feld 202 XII.1.3 Ladungs- und Stromverteilungen in einem elektromagnetischen Feld 204 XII.2 Elektromagnetisches Feld mit Quellen 205 XII.2.1 Einführung in die klassische Feldtheorie 205 XII.2.2 Elektromagnetisches Feld in Anwesenheit fester Quellen 206 XII.2.3 Energieimpulstensor 207 Anhang • A • • • • • • • • • • • • • • • • • • • • • 213 Tensoren auf einem Vektorraum • • • • • • • • • • • • • • • • • • • • • 213 • • • • • • • • • • • • • • • • • • • • • 220 • • • • • • • • • • • • • • • • • • • • • 224 • • • • • • • • • • • • 226 • • • • • • • • • • • • A.1 Vektoren, Linearformen und Tensoren 213 A.1.1 A.1.2 A.1.3 A.1.4 A.1.5 Vektoren 213 Linearformen 214 Tensoren 214 Metrischer Tensor 216 Warum Tensoren? 218 A.2 Basistransformation 218 B Drehungen • • • • • • • • • B.1 Isometrien im euklidischen Raum 220 B.2 Infinitesimale Drehungen 222 C Legendre-Transformation • • • C.1 Legendre-Transformation einer Funktion einer Variablen 224 C.2 Legendre-Transformation einer Funktion mehrerer Variablen 224 D Die δ -Distribution • • • • • • D.1 Definition und erste Ergebnisse 226 D.1.1 D.1.2 D.1.3 D.1.4 Definition 226 Erste Eigenschaften 227 Darstellungen der δ -Distribution 227 Heaviside-Funktion 228 • • • • • • • • • viii D.2 Rechenregeln 229 D.2.1 Skalierung 229 D.2.2 Ableitung 230 D.2.3 Substitution der Integrationsvariablen 230 D.3 Mehrdimensionale δ -Distributionen 231 E Kugelflächenfunktionen Literaturverzeichnis • • • • • • • • • • • • • • • • • • • • • • • • • • • • 233 • • • • • • • • • • • • • • • • • • • • • • • • 235 Einleitung Allgemeine Einleitung. Notationen, Konventionen, usw. Allgemeine Literaturhinweise (in alphabetischer Ordnung) • Arnold, Mathematical methods of classical mechanics [1] (mehr mathematisch); • Fließbach, Lehrbuch zur theoretischen Physik I. Mechanik [2] & II. Elektrodynamik [3]; • Goldstein, Klassische Mechanik [4] = Classical Mechanics [5] • Greiner, Klassische Mechanik I & II [6, 7]; Klassische Elektrodynamik [8]; • Griffiths, Elektrodynamik [9] = Introduction to Electrodynamics [10]; • Jackson, Klassische Elektrodynamik [11] = Classical Electrodynamics [12] • Landau & Lifschitz, Lehrbuch der theoretischen Physik. Band I: Mechanik [13] & Band II: Klassische Feldtheorie [14] • Nolting, Grundkurs Theoretische Physik. Band 1: Klassische Mechanik [15], Band 2: Analytische Mechanik [16] & Band 3: Elektrodynamik [17]. • Scheck, Theoretische Physik 1: Mechanik [18] & 3: Klassiche Feldtheorie [19]. 2 Erster Teil Klassische Mechanik K APITEL I Newton’sche Mechanik Die am meisten intuitive, und historisch die erste, Formulierung der Mechanik ist diejenige von Isaac Newton.(a) Die nach ihm genannten Beschreibung beruht einerseits auf in Abschn. I.1 eingeführten Grundbegriffen, die als vom Anfang an gegeben betrachtet werden: Somit bilden Raum und Zeit den Rahmen, in welchen physikalische Systeme sich befinden und entwickeln, ohne dadurch beeinflusst zu werden. Dazu werden Änderungen des Bewegungszustands eines Systems, charakterisiert durch kinematische Größen, durch mechanische Kräfte verursacht. Andererseits wird der Einfluss der letzteren auf physikalische Systeme durch Beziehungen zwischen diesen Kräften und kinematischen Größen bestimmt, und zwar hier durch die auf Newton zurückgehenden Gesetze, die in Abschn. I.2 dargelegt werden. Insbesondere führt laut dem zweiten Newton’schen Gesetz eine Kraft zur instantanen Beschleunigung des Systems, auf welchem sie ausgeübt wird. In der (modernen) Formulierung der Newton’schen Gesetze spielen bestimmte Bezugssysteme zur Beschreibung der Bewegung eine besondere Rolle, und zwar die Inertialsysteme. Nach Angabe eines solchen Systems ist jedes weitere Bezugssystem, das sich relativ zum ersten in gleichförmiger geradliniger Bewegung befindet, ebenfalls ein Inertialsystem. Genauer nehmen die Newton’schen Gesetze die gleiche Form in allen Koordinatensystemen an, die sich über eine Galilei-Transformation aus kartesischen Koordinaten in einem Inertialsystem erhalten lassen (Abschn. I.3). In einem relativ zu Inertialsystemen beschleunigten Bezugssystem ist die Situation unterschiedlich. Das zweite Newton’sche Gesetz lässt zwar noch in der gleichen Form ausdrücken, jedoch auf Kosten der Einführung von Scheinkräften auf den bewegten Körper, die in der Beschreibung der Bewegung in einem Inertialsystem nicht auftreten (Abschn. I.4). Die genauere Formulierung der Bewegungsgleichungen für ein mechanisches System bestehend aus mehreren Massenpunkten unter Berücksichtigung der Newton’schen Gesetze wird in Abschn. I.5 dargelegt. Dabei lässt sich die Bewegung in zwei Anteile zerlegen, und zwar einerseits die globale Bewegung des Systems — oder genauer seines Schwerpunkts —, andererseits die Bewegung der Teile des Systems relativ zueinander. Schließlich wird der besondere Fall von Zwei-Körper-Systemen in Abschn. I.6 betrachtet, wobei der entwickelte Formalismus auf einige wichtige Beispiele angewandt wird. I.1 Grundbegriffe der Newton’schen Mechanik Die Mechanik beschäftigt sich mit der Bewegung von physikalischen Systemen, d.h. mit der zeitlichen Änderung ihrer Position (und ihrer Richtung) im Raum. Zur genaueren Beschreibung der Bewegung müssen deshalb Modelle für „unsere“ Raum und Zeit spezifiziert werden (§ I.1.1). In § I.1.2 werden einige zusätzliche Basisdefinitionen und -Begriffe eingeführt, welche für die Formulierung der Gesetze der Newton’schen Dynamik vorausgesetzt sind oder zur Beschreibung von Systemen bzw. von deren Bewegung benutzt werden. Schließlich werden Kräfte, die Ursache für die Bewegung sind, und ihre mathematische Modellierung in § I.1.3 eingeführt. (a) I. Newton, 1643–1727 6 Newton’sche Mechanik Die in diesem Abschnitt diskutierten Begriffe sind nicht auf den Rahmen der Newton’schen Mechanik beschränkt, sondern bleiben noch relevant in den anderen Formulierungen der Mechanik nach Lagrange (Kap. II) oder Hamilton (Kap. IV) ohne Änderung, solange nicht-relativistische Mechanik gültig bleibt. Es sei hier schon erwähnt, dass manche Grundannahmen jenseits des nichtrelativistischen Rahmens nicht mehr erfüllt sind — wie z.B. die Absolutheit von Raum und Zeit in der relativistischen Mechanik —, während einige Begriffe an Bedeutung verlieren — beispielsweise wird die Bahnkurve in der Quantenmechanik nur als klassisches Analogon gesehen. I.1.1 Raumzeit der Newton’schen Mechanik Nach Newton sind der Raum, in welchem physikalische Systeme sich befinden, und die Zeit, deren Vergehen die Entwicklung der Systeme erlaubt, absolute Größen. Das heißt, sie stellen einen allgemeinen Rahmen dar, in welchem physikalische Prozesse stattfinden, ohne durch diese Prozesse bzw. die daran beteiligten Systeme beeinflusst zu werden. I.1.1 a Der Raum der Newton’schen Mechanik :::::::::::::::::::::::::::::::::::::::::::::: Der räumliche Rahmen der Newton’schen Mechanik — und allgemeiner der nicht-relativistischen Mechanik — ist ein dreidimensionaler euklidischer PunktraumE 3 , hiernach oft Ortsraum genannt, dessen Punkte alle äquivalent sind. Dieser Raum ist statisch, er ändert sich also nicht mit der Zeit. Dem Ort eines (als punktförmig modellierten) Systems zu einer gegebenen Zeit wird ein Punkt P ∈ E 3 zugeordnet. Zur Kennzeichnung dieses Orts werden einerseits Bezugssysteme eingeführt, entsprechend Beobachtern, die sich möglicherweise bewegen. Andererseits können in jedem Bezugssystem Koordinatensysteme gefunden werden, mit insbesondere einem Ursprungspunkt, der in diesem Skript oft mit O bezeichnet wird. Eine wichtige Eigenschaft von euklidischen Räumen ist die Existenz von überall im Raum geltenden kartesischen Koordinatensystemen, bestehend aus dem Nullpunkt O und drei zueinander orthogonalen Achsen mit festen Richtungen. Gegeben der Nullpunkt eines Bezugssystems, man kann die (Orts)Vektoren zwischen diesem Ursprung und jedem Punkt P ∈ E 3 betrachten. Diese Vektoren — die im Folgenden mit Pfeilen gekennzeichnet werden, z.B. ~r — bilden einen dreidimensionalen Vektorraum, auf welchem eine euklidische Struktur definiert werden kann. Somit entspricht der Betrag |~r| ≡ r des Vektors ~r dem Abstand zwischen seinen Endpunkten im Punktraum. Hiernach wird mehrmals der Einheitsvektor ~er in Richtung von ~r benutzt, d.h. der auf 1 normierter Vektor, für welchen ~r ≡ r~er gilt (falls ~r 6= ~0). Wiederum ist der euklidische Vektorraum nach Angabe eines kartesischen Koordinatensystems isomorph zum Koordinatenraum R3 aller möglichen 3-Tupel (x1 , x2 , x3 ) von Koordinaten. Dies wird günstig als 1 x (I.1a) ~r = x2 3 x geschrieben, was eigentlich ~r = 3 X xi ~ei ≡ xi ~ei (I.1b) i=1 mit (~e1 ,~e2 ,~e3 ) den Basisvektoren des Koordinatensystems bedeutet, wobei in der zweiten Gleichung die Einstein’sche Summenkonvention benutzt wird. Im Fall kartesischer Koordinaten wird auch die Notation (x, y, z) bzw. (~ex ,~ey ,~ez ) statt (x1 , x2 , x3 ) bzw. (~e1 ,~e2 ,~e3 ) verwendet. Hiernach wird der Vektorraum der Ortsvektoren entweder mitE 3 — um seine euklidische Struktur zu betonen —oder mit R3 — wegen der Isomorphie mit dem Koordinatenraum — bezeichnet. Bemerkung: Die Struktur der Menge der Ortsvektoren als euklidischer Vektorraum bedarf weiterer Diskussion, vgl. ???. 7 I.1 Grundbegriffe der Newton’schen Mechanik I.1.1 b Die Zeit in der Newton’schen Mechanik :::::::::::::::::::::::::::::::::::::::::::::: Die Zeit der nicht-relativistischen Mechanik ist ein eindimensionaler Parameter — so dass Zeitpunkte als Elemente von R modelliert werden —, der universal ist; das heißt, die Zeit ist die gleiche für alle Beobachter, unabhängig von ihrer Position und Bewegung. Insbesondere können zumindest prinzipiell alle Beobachter ihre jeweiligen Uhren zu einem bestimmten Zeitpunkt t0 synchronisieren; dann bleiben diese Uhren auch in der Zukunft synchronisiert, d.h. wenn zwei Beobachter sich wieder treffen, zeigen ihre beide Uhren die gleiche Zeit t1 > t0 , egal was ihre Bewegungen in der Zwischenzeit waren. Bemerkung: Wie wir später sehen werden, gilt diese Synchronisierungseigenschaft nicht mehr im relativistischen Kontext. I.1.2 Beschreibung von mechanischen Systemen und ihrer Bewegung I.1.2 a Idealisierte Systeme ::::::::::::::::::::::::::: Die Mechanik befasst sich nicht nur mit realistischen physikalischen Systemen, sondern auch mit Idealisierungen, deren Bewegung viel einfacher zu beschreiben und bestimmen ist. Das einfachste solche Modell ist der Massenpunkt oder Punktmasse: dabei handelt es sich um einen punktförmigen Gegenstand, ohne innere Struktur, der nur eine Eigenschaft besitzt, und zwar seine Masse m. Die Bewegung eines physikalischen Körpers lässt sich mit diesem Modell gut beschreiben, wenn die Ausdehnung des Körpers für das betrachtete Problem irrelevant ist. Ist der Massenpunkt neben seiner Masse m noch mit einer elektrischen Ladung q versehen, so dass es in einem elektromagnetischen Feld einer entsprechenden Kraft unterliegt, dann spricht man von einer Punktladung Bemerkung: Wie in § I.2.2 weiter diskutiert wird, handelt es sich bei der hier mit m bezeichneten Größe um die träge Masse des Massenpunkts bzw. der Punktladung. Ein weiteres idealisiertes Modell, für ein System dessen Ausdehnung eine Rolle spielt, ist das des starren Körpers, der Thema des Abschn. III.1 ist. I.1.2 b Kinematische Größen Die zeitliche Reihenfolge der sukzessiven Positionen eines (Massen)Punktes im Ortsraum ist seine Bahnkurve oder Trajektorie. Unter Betrachtung der Vektorraum-Struktur des Ortsraums kann diese Bahnkurve als eine Funktion ~x(t) : R → E 3 angesehen werden — oder äquivalent, nach Angabe eines Koordinatensystems, als eine Abbildung von R nach R3 . ::::::::::::::::::::::::::::: Bemerkung: Mathematisch genauer sollte man zwischen der Trajektorie — was im engeren Sinne die geometrische Kurve in E 3 oder R3 bezeichnet — und der Orts-Zeit-Beziehung ~x(t) unterscheiden, wobei die letztere die Parametrisierung der Kurve — mathematisch ein Weg — durch die Zeit t ist. Somit kann jede Bahnkurve auch anders als durch die Zeit parametrisiert werden, wie es in den Beispielen des § I.1.3 b gemacht wird. Gegeben die (durch die Zeit parametrisierte) Bahnkurve ~x(t) eines Massenpunktes, ist dessen instantane Geschwindigkeit zur Zeit t die Rate der Änderung des Ortsvektors zu diesem Zeitpunkt, d.h. ~v (t) ≡ d~x(t) ≡ ~x˙ (t), dt (I.2) wobei hier und im Folgenden der Überpunkt eine zeitliche Ableitung darstellt. Die physikalische 8 Newton’sche Mechanik Dimension (vgl. § I.1.2 c unten) der Geschwindigkeit ist [v] = L T−1 , wobei L für Länge und T für Zeit (time) steht; dementsprechend ist die Einheit im SI-System der m s−1 . Wiederum ist die Beschleunigung des Massenpunktes die zweite Ableitung des Ortsvektors nach der Zeit ~a(t) ≡ d2 ~x(t) ¨(t) = ~v(t), ˙ ≡ ~x dt2 (I.3) mit physikalischer Dimension bzw. SI-Einheit [a] = L T−2 bzw. m s−2 . Schließlich wird der (kinetische) Impuls des Massenpunktes als das Produkt aus seiner Masse und Geschwindigkeit definiert ~p(t) ≡ m~v (t), (I.4) während sein Drehimpuls bezüglich des Nullpunkts ~r = ~0 des Bezugssystems das Kreuzprodukt aus Ortsvektor und Impuls ist ~ (I.5) L(t) ≡ ~x(t) × p~(t). Die jeweiligen physikalischen Dimensionen und SI-Einheiten sind [p] = M L T−1 , in kg m s−1 , und [L] = M L2 T−1 mit Einheit kg m2 s−1 , wobei M für Masse steht. I.1.2 c Physikalische Dimension, Einheiten ::::::::::::::::::::::::::::::::::::::::::: Entsprechend ihrer qualitativ verschiedenartiger Natur — z.B. ist eine Länge keine Masse — haben unterschiedliche physikalische Größen verschiedene Dimensionen, und dementsprechend unterschiedliche Einheiten. Dabei stellt sich aber heraus, dass einige Größen mit einander verknüpft ist: eine Fläche ist eine Länge zum Quadrat; eine Geschwindigkeit ist eine Länge pro Zeiteinheit, also eine Länge geteilt durch eine Zeit; usw. Somit kann man eine Handvoll Basisgrößen finden, aus welchen die anderen abgeleitet werden können. Äquivalent gibt es in einem gegebenen Einheitensystem ein paar Basiseinheiten und die daraus abgeleiteten Einheiten. Ein mögliches System von Basisgrößen ist das des sog. internationalen Größensystems, das dem SI-System von Einheiten entspricht. Dabei sind die Basisgrößen, welche für die Mechanik relevant sind, die Länge, die Zeit und die Masse, deren jeweilige Dimensionen mit L, T und M bezeichnet werden. Dann lässt sich die Dimension jeder mechanischen Größe als Produkt von Potenzen der Basisgrößen ausdrücken, wie im vorigen Paragraphen schon gesehen wurde. Bemerkung: In der Elektrodynamik wird auch die Stromstärke, mit Dimension I, dazukommen. Und in der Thermodynamik sollen noch thermodynamische Temperatur Θ und Stoffmenge N betrachtet werden. Wichtig ist, dass man nur Größen derselben Dimension addieren oder gleichsetzen kann. Somit kann eine Gleichung wie „Masse + Länge = Geschwindigkeit“ nie richtig sein.(1) Dagegen dürfen Größen unterschiedlicher Dimensionen miteinander multipliziert werden, so dass z.B. die Gleichung „Beschleunigung mal Zeit = Geschwindigkeit“, entsprechend L T−2 · T = L T−1 , sinnvoll ist.(1) Entsprechend den unterschiedlichen Dimensionen von Ort, Geschwindigkeiten, Beschleunigung, Impuls, usw. sind die zugehörigen Vektoren (~r, ~v , ~a, ~p, . . . ) Elemente unterschiedlicher Vektorräume, auch wenn diese alle reell und dreidimensional sind, und somit isomorph zu R3 . Dieser Unterschied ist zwar nicht erkennbar, wenn man auf dem gleichen Bild den Ortsvektor (im Ortsraum) eines Körpers, seine Geschwindigkeit (im Geschwindigkeitsraum) und die darauf wirkenden Kräfte (im ‚Kraftraum“) darstellt, man darf aber die jeweiligen Pfeile nicht miteinander addieren. (1) Dementsprechend sollte die Leserin immer prüfen, dass ihre Gleichung „die richtige Dimension“ hat. 9 I.1 Grundbegriffe der Newton’schen Mechanik I.1.3 Mechanische Kräfte Erfahrung hat gezeigt, dass Änderungen des Bewegungszustands eines physikalischen Körpers das Resultat der Wirkung von äußeren Ursachen widerspiegeln, welche (mechanische) Kräfte heißen. Diese werden hiernach allgemein mit dem Zeichen F bezeichnet. Die physikalische Dimension einer Kraft ist [F ] = M L T−2 und die zugehörige SI-Einheit ist das Newton, wobei 1 N = 1 kg m s−2 . Nach der Darstellung der mathematischen Modellierung von mechanischen Kräften (§ I.1.3 a) wird die Arbeit einer Kraft eingeführt (§ I.1.3 b). In vielen Situationen hängt die letztere nur von den Endpunkten der zurückgelegten Strecke ab; in solchen Fällen entspricht die durch die Kraft verrichtete Arbeit (dem Negativen) der Variation der potentiellen Energie des Systems (§ I.1.3 c). Bemerkung: Neben den „wirksamen“ Kräften, die zu einer Bewegung führen — wie z.B. die für den freien Fall eines Körpers verantwortliche Schwerkraft —, gibt es auch Kräfte, deren „Rolle“ darin besteht, die möglichen Bewegungen einzuschränken. Ein Beispiel davon ist die durch einen Tisch auf einen Körper ausgeübte Kraft, die zusammen mit der Schwerkraft dazu führt, dass die Bewegung des Körpers unter dem Einfluss anderer Kräfte in der Tischebene bleibt. Solche Kräfte werden oft als Zwangskräfte bezeichnet. I.1.3 a Mathematische Modellierung :::::::::::::::::::::::::::::::::::: Neben ihrem Betrag hat eine Kraft erfahrungsgemäß auch eine Richtung: somit ist die Schwerkraft auf einen Körper auf der Erdoberfläche „nach unten“, Reibungskräfte sind „entgegengesetzt zur Bewegungsrichtung“, usw. Dementsprechend werden Kräfte mathematisch durch dreidimensionale Vektoren F~ dargestellt. Diese Modellierung durch Vektoren geht mit einer wichtigen Eigenschaft einher, und zwar mit einem Superpositionsprinzip. Laut dem letzteren sind Kräfte in der Newton’schen Mechanik additiv, d.h. wenn zwei unterschiedliche Kräfte F~1 , F~2 auf einen Körper wirken, dann ist ihre Resultierende durch die Summe F~1 + F~2 gegeben. Dank der Vektorraum-Struktur ist diese Summe wieder ein Vektor, d.h. kann eine Kraft darstellen. Dieses Superpositionsprinzip gilt nicht mehr im Rahmen der Allgemeinen Relativitätstheorie. Wie wir unten weiter sehen werden — vgl. der dritten Bemerkung nach Gl. (I.14b) —, kann die mathematische Form der Kraft auf einen bewegten Körper in den üblichen Fällen eine Funktion der Zeit t, der Position ~x(t) und der Geschwindigkeit ~x˙ (t) des Körpers sein, d.h. F~ = F~ t, ~x(t), ~x˙ (t) . Falls F~ nicht von der Geschwindigkeit abhängt, sondern nur vom Ort (und von der Zeit), wird F~ (t,~r) Kraftfeld genannt. Gegeben eine Kraft F~ ist das zugehörige Drehmoment bezüglich eines Bezugspunkts O als ~ ≡ ~r × F~ M (I.6) definiert, mit ~r dem Abstandsvektor von O des Drehmoments zum Angriffspunkt der Kraft. I.1.3 b Arbeit einer Kraft Wird die Wirkung einer Kraft über ein Zeitintervall — oder genauer über die Strecke, welche das mechanische System in diesem Zeitintervall zurücklegt — passend integriert, so ergibt sich die Arbeit der Kraft. :::::::::::::::::::::::: ~ geleistete Arbeit in der Verschiebung eines Körpers um das Definition: Die durch eine Kraft F infinitesimale Wegelement d~x entlang seiner Bahnkurve ist dW = F~ · d~x. Die hier verwendete Notation dW ist relativ standard, bedeutet aber nicht, dass dW das totale Differential einer Funktion W ist — was nur gilt, wenn F~ konservativ ist, s. § I.1.3 c. Eine bessere Notation wäre δW , wie in der Thermodynamik oder der Statistischen Mechanik üblich ist. (I.7a) 10 Newton’sche Mechanik Aus Gl. (I.7a) folgt die Arbeit einer Kraft entlang einem endlichen Weg C , indem die elementaren Beiträge entlang infinitesimaler Wegelemente summiert werden. Daraus ergibt sich ein Kurvenintegral entlang des Wegs C : Z (I.7b) W = F~ · d~x. C Die physikalische Dimension der Arbeit einer Kraft ist [W ] = M L2 T−2 . Zur Berechnung des Kurvenintegral in Gl. (I.7b) muss man in der Praxis eine Parametrisierung des Wegs C einführen. Oft, aber nicht unbedingt, kann die Zeit t als Parameter benutzt werden. Dann lässt sich C genau durch die Bahnkurve ~x(t) für t ∈ [t1 , t2 ] beschreiben, und das infinitesimale Wegelement im Kurvenintegral ist d~x = ~v (t) dt. Somit lautet die Arbeit entlang dem Weg C Z Z Z t2 ~ W = dW = F · d~x = F~ · ~v (t) dt (I.8) C C t1 und das Kurvenintegral wird zu einem gewöhnlichen Integral. Dabei ist das Produkt F~ · ~v (t) die (instantane) Leistung der Kraft. Beispiel 1: Betrachte man die 2-dimensionale Bewegung (unter irgendeinem nichtspezifizierten Einfluss) eines Massenpunkts, welcher der Kraft Fx (x, y) ay ~ ≡ F (x, y) = Fy (x, y) b unterliegt, mit a, b Konstanten. Der Massenpunkt bewegt sich von einem Ausgangspunkt O mit Koordinaten (x = 0, y = 0) zu einem Endpunkt P mit (x = 1, y = 1). Wir wollen die Arbeit von F~ entlang zwei unterschiedlicher Wege C1 , C2 von O nach P berechnen. y6 1 C1 - •P C 61 C2 • O 1 - x Abbildung I.1 Die Kurve C1 besteht aus zwei geraden Linienelementen mit x = 0, 0 ≤ y ≤ 1 bzw. y = 1, 0 ≤ x ≤ 1. Somit lässt sich das Kurvenintegral entlang C1 als Summe von zwei einfachen Integralen schreiben: Z Z Z I Z P ~ ~ W1 = dW = F (x, y) · d~x = F (x = 0, y) · d~x + F~ (x, y = 1) · d~x, C1 C1 O I mit I dem Punkt mit Koordinaten (x = 0, y = 1). Entlang des Linienelements von O nach I bzw. von I nach P kann man für C1 einfach y bzw. x als Parameter benutzen, was zu Z 1 Z 1 W1 = Fy (x = 0, y) dy + Fx (x, y = 1) dx 0 0 führt. Ersetzt man die Komponenten Fx , Fy durch ihre Ausdrücke, so kommt Z 1 Z 1 W1 = b dy + a dx = b + a. 0 0 Wiederum lässt sich die Kurve C2 als x(s) = s ~x(s) = y(s) = s d~x 1 mit s ∈ [0, 1] parametrisieren; dann gilt d~x = ds = ds. 1 ds Dies gibt für die Arbeit von F~ entlang C2 Z Z 1 d~x W2 = dW = F~ x(s), y(s) · ds. ds C2 0 11 I.1 Grundbegriffe der Newton’schen Mechanik Indem man das Skalarprodukt explizit schreibt, kommt 2 1 Z 1 as a W2 = (as + b) ds = + bs = + b. 2 2 0 0 Somit ist W2 6= W1 : die Arbeit der Kraft F~ zwischen zwei Punkten hängt vom gewählten Weg ab. Beispiel 2: Lorentz-Kraft ~ — in Abwesenheit von elektrischem Feld — Eine bewegte Punktladung in einem Magnetfeld B (b) unterliegt der Lorentz-Kraft ~ F~ = q~v × B. (I.9) Diese Kraft ist immer senkrecht zur Geschwindigkeit ~v der Punktladung. Setzt man diese Kraft in Gl. (I.8) ein, Z t2 Z t2 ~ · ~v (t) dt, ~ q~v (t) × B W = F · ~v (t) dt = t1 t1 so findet man sofort, dass die Lorentz-Kraft keine Arbeit verrichtet, denn das Integrand ist null. I.1.3 c Konservative Kräfte ::::::::::::::::::::::::::: ~ (~r) wird konservativ genannt, wenn es ein Potential Definition: Ein zeitunabhängiges Kraftfeld F V (~r) gibt, das ~ (~r) F~ (~r) = −∇V (I.10) erfüllt. ~ angewandt auf eine skalare Funktion auf R3 , den Dabei bezeichnet der Nabla-Operator ∇, Gradienten dieser Funktion. Für konservative Kraftfelder hängt die durch die Kraft zwischen zwei Punkten verrichtete Arbeit nicht vom Weg ab. Beweis: Das Resultat folgt aus Z ~r2 Z W = F~ (~x) · d~x = − ~r 1 ~r 2 ~ (~x) · d~x = − V (~r2 ) − V (~r1 ) ∇V (I.11) ~r 1 ~ (~r) ist. unter Verwendung der Tatsache, dass V (~r) eine Stammfunktion von ∇V 2 Bemerkungen: ∗ Offensichtlich ist V (~r) nur bis auf eine additive Konstante eindeutig. Die Letztere wird oft so gewählt, dass das Potential im Unendlichen verschwindet. ∗ V (~r) wird auch als potentielle Energie bezeichnet. ~ (~r), definiert auf einem einfach zusammenhängenden Gebiet von Behauptung: Sei ein Kraftfeld F R3 .(2) Dann ist F~ (~r) genau dann konservativ, wenn seine Rotation verschwindet: ~ (~r) F~ (~r) = −∇V ⇔ ~ × F~ (~r) = ~0. ∇ (I.12) Dass die Rotation eines konservativen Kraftfeldes null ist, folgt direkt aus der Identität ~ × ∇V ~ (~r) = ~0, ∇ (2) Ein Gebiet wird als einfach zusammenhängend bezeichnet, wenn sich jeder geschlossene Weg im Gebiet stetig zu einem Punkt zusammenziehen lässt, ohne das Gebiet zu verlassen. Zum Beipiel ist eine Ebene (R2 ) einfach zusammenhängend, während R2 ohne einen Punkt nicht mehr einfach zusammenhängend ist. (b) H. A. Lorentz, 1853–1926 12 Newton’sche Mechanik die sich z.B. komponentenweise beweisen lässt: die i-te Komponente (in einem kartesischen Koordinatensystem) des Terms auf der linken Seite ist ijk ∂j ∂k V (~r), mit ijk dem Levi-Civita-Symbol und ∂` die Ableitung nach dem Komponenten x` des Ortsvektors. Dabei ist ijk antisymmetrisch unter dem Austausch von j und k, während die zweite Ableitung ∂j ∂k symmetrisch ist, so dass die Summe über alle Werte dieser Indizes Null ergibt. Zum Beweis, dass ein rotationsfreies Kraftfeld F~ (~r) sich als (Negative des) Gradienten eines skalaren Potentials V (~r) schreiben lässt, soll man zunächst einen beliebigen Punkt ~r0 wählen und V durch Z ~r V (~r) = − F~ (~r 0 ) · d~r 0 ~r 0 definieren. Das R Integral auf der rechten Seite der obigen Formel ist eindeutig definiert, wenn Wegintegrale F~ · d~x von ~r0 nach ~r unabhängig vom gewählten Weg sind. Betrachte man zwei unterschiedliche Wege C1 , C2 in R3 , die von ~r0 nach ~r führen. Dann definiert C2 trivial einen Weg −C2 (mit gleicher Kurve und umgekehrter Parametrisierung) von ~r nach ~r0 , und somit einen geschlossenen Weg C1 − C2 mit Anfangs- und Endpunkt in ~r0 . Aus dem Stokes’schen Satz folgt für das Wegintegral der Kraft entlang C1 − C2 I Z ~ × F~ (~r 0 ) · d2 S ~ = 0, F~ (~r 0 ) · d~r 0 = ∇ C1 −C2 S wobei S die durch die Kurve C1 − C2 abgeschlossene Fläche bezeichnet, während die letzte ~ × F~ = ~0 folgt, die in jedem Punkt von S gilt (dank der Annahme Gleichung aus der Annahme ∇ eines einfach zusammenhängenden Gebiets). Andererseits gilt I I I 0 0 0 0 ~ ~ F~ (~r 0 ) · d~r 0 , F (~r ) · d~r − F (~r ) · d~r = C1 −C2 C1 C2 woraus die gesuchte Unabhängigkeit des Wegintegrals vom Weg folgt. 2 I.2 Newton’sche Gesetze Basierend auf den in Abschn. I.1 eingeführten Begriffen, insbesondere auf der Existenz absoluter Raum und Zeit, können die dynamischen Gesetze, welche die Wirkung von Kräften auf mechanische Systeme bestimmen, angegeben werden. Dabei besagen diese Gesetze aber nichts über die mathematische Form der Kräfte: diese hängen von der Situation ab und sollen durch zusätzliche Theorien oder Modelle präzisiert werden. I.2.1 Erstes Newton’sches Gesetz Das erste newtonsche Gesetz — das auch erstes Axiom, lex prima oder Trägheitsgesetz genannt wird — besagt die Existenz von bevorzugten Bezugssystemen, in denen der Bewegungszustand eines Körpers sich nicht ändert, so lange keine Kraft auf ihn ausgeübt wird: Erstes Newton’sches Gesetz Es gibt besondere Bezugssysteme, sog. Inertialsysteme, in denen ein Massenpunkt, der keiner Kraft unterliegt, in seinem Zustand der Ruhe oder gleichförmigen geradlinigen (I.13) Bewegung beharrt. Anders gesagt bleibt in Inertialsystemen die Geschwindigkeit ~x˙ (t) eines kräftefreien Massenpunktes ¨(t) verschwindet. konstant, d.h. seine Beschleunigung ~x Bemerkungen: ∗ Eigentlich wurde dieses Prinzip schon durch Galilei(c) formuliert, weshalb es auch seinen Namen trägt. Dazu ist der obige Ausdruck des Gesetzes in der Tat nicht die ursprüngliche Formulierung, denn es gab bei Newton keinen Bezug auf Inertialsysteme. (c) G. Galilei, 1564–1642 13 I.2 Newton’sche Gesetze ∗ Das Gesetz setzt die Existenz eines kräftefreien Zustands implizit voraus. In der Praxis ist dies eine Idealisierung, denn kein Körper kann von der (anziehenden) Schwerkraft der anderen Körper im Universum isoliert werden. Was aber praktisch realisierbar ist — zumindest in sehr guter Näherung —, ist dass die Resultierende der auf ein System wirkenden Kräfte verschwindet, was sich dann als äquivalent zur Abwesenheit von Kräfte herausstellt. ∗ Auf Inertialsysteme wird in Abschn. I.3 genauer eingegangen; als solches gilt für Experimente auf der Erde ein Bezugssystem, das sich relativ zu „Fixsternen“, oder besser weit entfernten Galaxien oder Quasars, nicht bewegt. I.2.2 Zweites Newton’sches Gesetz Das zweite newtonsche Gesetz — auch zweites Axiom, lex secunda oder Bewegungsgesetz genannt — beschreibt die Änderung der Bewegung eines Körpers mit Impuls ~p(t) unter dem Einfluss einer Gesamtkraft F~ : Zweites Newton’sches Gesetz In Inertialsystemen gilt d~p(t) ~ ≡ ~p˙(t) = F. dt (I.14a) In dieser Bewegungsgleichung kann der Impuls ~p(t) durch die Masse m und die Geschwindigkeit ~v (t) des Körpers ausgedrückt werden. Wenn die Masse in der Bewegung konstant bleibt, so kann sie aus der Ableitung herausgezogen werden. Dann wird Gl. (I.14a) zu m d~v d2 ~x ~ =m = m~a = F. 2 dt dt (I.14b) Das heißt, die Beschleunigung des Körpers ist proportional zur Kraft, welche die Bewegung beeinflusst, und antiproportional zur Masse m. Bemerkungen: ∗ Das erste Gesetz ist ein Spezialfall des zweiten mit F~ = ~0. ∗ Die Masse m in der Bewegungsgleichung (I.14b) ist die sog. träge Masse des Massenpunktes, die ein Maß für die Trägheit des letzteren gegenüber Änderungen seines Bewegungszustands darstellt. Bei der trägen Masse handelt es sich um eine universale Eigenschaft des Körpers, welche die gleiche bleibt, egal welchen Kräften er unterliegt. ∗ Im zweiten Gesetz wird implizit vorausgesetzt, dass die Kraft F~ möglicherweise von ~x und ~x˙ abhängt, sowie von der Zeit t, nicht aber von höheren Ableitungen. Dank der letzteren Bemerkung stellt die vektorielle Bewegungsgleichung (I.14b) ein System gewöhnlicher Differentialgleichungen zweiter Ordnung dar. Wenn die mathematische Form der Kraft F~ = F~ t, ~x, ~x˙ sowie die Anfangsbedingungen ~x(t0 ), ~x˙ (t0 ) gegeben sind, mit t0 irgend eine Referenzzeit, dann hat dieses System eine eindeutige Lösung. Beispiel: Massenpunkt im homogenen Schwerefeld mit Luftreibung Betrachtet sei die Bewegung eines Massenpunktes mit Masse m unter dem Einfluss der Schwerkraft und einer Reibungskraft. Die Resultierende der auf ihn wirkenden Kraft lautet F~ = F~S + F~R , (I.15a) 14 Newton’sche Mechanik wobei das Superpositionsprinzip für Kräfte (I.20) benutzt wurde. Dabei ist die Schwerkraft F~S = mS~g , (I.15b) wobei ~g prinzipiell nach unten gerichtet ist — obwohl das im Folgenden keine Rolle spielt —, während mS die schwere Masse des Körpers bezeichnet. Experimentell ist die letztere proportional zur trägen Masse, mS ∝ m, wie sich im berühmten Ergebnis „im Vakuum fallen alle Körper gleich“ widerspiegelt. Mit der Wahl mS = m gilt |~g | ' 9, 8 m s−2 auf der Erdoberfläche. Hier werden zwei Annahmen gemacht, und zwar dass träge und schwere Masse erstens die gleiche Dimension M haben, und sich somit mit der gleichen Einheit quantifizieren lassen, und zweitens denselben numerischen Wert haben, was wiederum den Wert der Schwerkraftbeschleunigung g festlegt. Andererseits wird für die Reibungskraft die Form der Stokes’schen(d) Reibung F~R = −α~v (I.15c) angenommen, mit α einer positiven Konstanten. Unter diesen Bedingungen lautet die Bewegungsgleichung (I.14b) m d2 ~x(t) = m~g − α~v (t), dt2 d.h., mit γR ≡ α/m d~v (t) + γR~v (t) = ~g . (I.16) dt Somit ergibt sich eine lineare inhomogene gewöhnliche Differentialgleichung erster Ordnung. Ihre Lösung erfolgt wie üblich. Zuerst wird die allgemeine Lösung ~vh der assoziierten homogenen Differentialgleichung d~vh (t) + γR~vh (t) = 0 dt gesucht, und zwar ~ e−γR t ~vh (t) = C ~ ∈ R3 beliebig. mit C Zweitens ist eine spezielle Lösung ~vs der homogenen Differentialgleichung gebraucht: d~vs (t) + γR~vs (t) = ~g . dt Zum Beispiel kann die stationäre Lösung ~vs (t) = 1 ~g γR genommen werden. Mit deren Hilfe kann als dritter Schritt die allgemeine Lösung der inhomogenen Differentialgleichung als Summe aus ~vh (t) und ~vs (t) geschrieben werden: ~ e−γR t + ~v (t) = ~vh (t) + ~vs (t) = C 1 ~g . γR ~ festgestellt werden, was unter Berücksichtigung der Dabei soll noch die Integrationskonstante C Anfangsbedingung (hier bei t = 0) (d) G. G. Stokes, 1819–1903 15 I.2 Newton’sche Gesetze ~+ ~v0 ≡ ~v (t = 0) = C 1 ~g γR erfolgt. Aus der letzteren Gleichung folgt ~ = ~v0 − 1 ~g , C γR was schließlich zur Lösung ~v (t) = ~v0 e−γR t + 1 − e−γR t ~g γR (I.17) führt. Physikalisch findet man, dass der Einfluss der Anfangsgeschwindigkeit ~v0 wegen der Reibungs−1 kraft auf einer Zeitskala τR ≡ γR verschwindet. Dies führt zu einem stationären Endzustand, der unabhängig von der Anfangsbedingung ist. Wenn nötig kann man auch die Bahnkurve des Massenpunktes über Z t ~x(t) = ~x0 + ~v (t0 ) dt0 0 bestimmen, und zwar ~x(t) = ~x0 + 1 − e−γR t γR t + e−γR t − 1 ~v0 + ~g . 2 γR γR (I.18) I.2.3 Drittes Newton’sches Gesetz Das dritte newtonsche Gesetz — auch bekannt als drittes Axiom, lex tertia, Reaktionsprinzip oder actio und reactio — verknüpft die Kräfte, die zwei Körper aufeinander ausüben: Drittes Newton’sches Gesetz Die von zwei Massenpunkten aufeinander ausgeübten Kräfte haben den gleichen Betrag aber entgegengesetzte Richtungen. (I.19a) Wenn die zwei Körper jeweils durch 1 und 2 gekennzeichnet werden, mit F~2→1 bzw. F~1→2 der auf den ersten durch den zweiten bzw. auf 2 durch 1 ausgeübten Kraft, dann gilt F~2→1 = −F~1→2 . (I.19b) Bemerkungen: ∗ Wie in der Bemerkung in § I.5.1 a weiter diskutiert wird, schließt dieses Gesetz implizit die Existenz von Drei-Körper-Kräften aus. ∗ Laut dem dritten Gesetz ist die Reaktion von Körper 2 auf Körper 1 instantan, wenn Körper 1 eine Kraft auf Körper 2 ausübt. Dies wird in der Relativitätstheorie nicht mehr möglich sein, wenn die Körper sich nicht berühren. I.2.4 „Viertes Newton’sches Gesetz“ Als viertes newtonsches Gesetz, oder lex quarta, wird oft das Superpositionsprinzip für Kräfte hinzugefügt, das in § I.1.3 schon dargelegt wurde: Viertes Newton’sches Gesetz Wirken auf einen Massenpunkt mehrere Kräfte F~1 , . . . , F~k , so addieren sich diese vektoriell. (I.20a) 16 Newton’sche Mechanik Das heißt, die resultierende Kraft auf den Massenpunkt ist F~ = k X F~k . (I.20b) i=1 Es ist dann diese resultierende Kraft, die in der mathematischen Formulierung des zweiten Gesetzes (I.14) auftritt. I.2.5 Energieerhaltung Eine erste Folgerung der Newton’schen Gesetze ist der Zusammenhang zwischen der Änderung der kinetischen Energie eines Massenpunkts und der Arbeit der auf ihn ausgeübten Kräfte. Definition: Die kinetische Energie eines Massenpunktes mit Masse m und Impuls ~p bzw. Geschwin- digkeit ~v wird definiert als ~p 2 1 = m~v 2 . 2m 2 T ≡ (I.21) Bemerkungen: ∗ Offensichtlich hängt der Zahlenwert der kinetische Energie vom Bezugssystem ab. Dies ist in der Praxis aber kein Problem, denn nur Energiedifferenzen sind in der klassischen Mechanik von Bedeutung, wie z.B. in Gl. (I.23) unten. ∗ Die physikalische Dimension bzw. die SI-Einheit einer Energie ist — wie für eine mechanische Arbeit! — [E] = M L2 T−2 bzw. das Joule(e) (1 J = 1 kg m2 s−2 ). Für einen Massenpunkt, der nur konservativen Kräften unterliegt, gilt der Theorem (Energieerhaltungssatz): Wenn alle Kräfte konservativ sind, ist die Summe T + V ≡ E aus kinetischer und potentieller Energie eines Massenpunktes, entsprechend seiner Gesamtenergie, erhalten. (I.22) Die Erweiterung dieses Ergebnisses auf Systeme aus mehreren Massenpunkten wird in § I.5.4 a dargelegt. Der Satz lässt sich beweisen, indem das Integral Z ~r2 F~ (~x) · d~x ~r 1 auf zwei unterschiedliche Weisen geschrieben wird. Da die Kraft konservativ ist, ist das Integral einerseits laut Gl. (I.11) gleich V (~r1 ) − V (~r2 ). Andererseits gilt, unter Verwendung der Newton’schen Bewegungsgleichung (I.14b) und der Identität d~x = ~v (t) dt Z t2 Z ~r2 Z t2 d~v (t) d 1 2 ~ F (~x) · d~x = m · ~v (t) dt = m~v (t) dt = T (t2 ) − T (t1 ). (I.23) dt ~r 1 t1 t1 dt 2 Somit gilt V (~r1 ) − V (~r2 ) = T (t2 ) − T (t1 ), d.h. T (t1 ) + V (~r1 ) = T (t2 ) + V (~r2 ), wobei die Zeitpunkten t1 , t2 beliebig sind. 2 Dabei bedeutet Gl. (I.23), dass die Arbeit der auf das System wirkenden Kräften gleich der Änderung der kinetischen Energie des Systems ist. (e) J. P. Joule, 1818–1889 17 I.3 Inertialsysteme. Galilei-Transformationen I.3 Inertialsysteme. Galilei-Transformationen Das erste und das zweite Newton’sche Gesetz beruhen auf der Existenz von besonderen Bezugssystemen, nämlich von den Inertialsystemen. Sei angenommen, dass ein solches Inertialsystem BI existiert. Dann gibt es noch eine ganze Klasse anderer Inertialsysteme B 0 , in denen die Gesetze der Newton’schen Mechanik die gleiche Form annehmen, und zwar alle Bezugssysteme, die mit BI durch eine Galilei-Transformation verknüpft sind. In diesem ganzen Abschnitt werden Ortsvektoren bezüglich eines festen Koordinatensystems in BI bzw. B 0 mit ~r bzw. ~r 0 bezeichnet. Dementsprechend steht ~x(t) bzw. ~x 0(t) für die Trajektorie eines Massenpunktes bezüglich BI bzw. B 0 . Für jede Klasse von „einfachen“ Galilei-Transformationen — und zwar Translationen (§ I.3.1), Galilei-Boosts (§ I.3.2) und Drehungen (§ I.3.3) — werden wir zeigen, dass die Beschleunigungen d2 ~x(t)/dt2 im Inertialsystem BI und d2 ~x 0(t)/dt2 im Bezugssystem B 0 gleichzeitig verschwinden. Schließlich wird das Verhalten von Kräften unter GalileiTransformationen diskutiert (§ I.3.5). I.3.1 Translationen Eine erste Klasse von einfachen Transformationen zwischen Inertialsystemen — oder genauer gesagt, zwischen Systemen von kartesischen Koordinaten, in deren Nullpunkte Inertialbeobachter ruhen — besteht aus den Translationen, entweder im Raum oder in der Zeit. I.3.1 a Räumliche Translationen :::::::::::::::::::::::::::::::: Betrachten wir zunächst den Fall eines Bezugssystem B 0 bzw. eines Koordinatensystems in B 0 , das sich aus dem Inertialsystem BI bzw. aus dem Koordinatensystem in BI durch eine räumliche Translation um einen festen Vektor ~a ableiten lässt. Dann sind die Koordinaten ~r bzw. ~r 0 eines Punkts P bezüglich BI bzw. B 0 über die Beziehung ~r 0 = ~r − ~a (I.24) verknüpft (vgl. Abb. I.2). Der gleiche Zusammenhang gilt für die Bahnkurven ~x(t) bzw. ~x 0(t) eines bewegten Massenpunkts. Somit gilt trivial nach Zeitableitung d~x 0(t) d~x(t) d2 ~x 0(t) d2 ~x(t) = , = . dt dt dt2 dt2 ¨(t) = ~0, dann ist auch ~x ¨ 0(t) = ~0. Wenn keine Kräfte auf den Massenpunkt wirken, so dass ~x ¨ 0(t) = ~0 zu ~x ¨(t) = ~0, d.h. das erste Newton’sche Gesetz (I.13) gilt genau dann in Umgekehrt führt ~x 0 B , wenn es im Inertialsystem BI gilt. x3 P • BI 0 x3 ~r O ~r 0 x2 B0 ~a 0 x2 x1 O0 0 x1 Abbildung I.2 18 Newton’sche Mechanik Bemerkung: Führt man zwei Translationen (um Vektoren ~a und ~b) hintereinander aus, so ist die resultierende Transformation ebenfalls eine Translation, und zwar um den Vektor ~a + ~b. I.3.1 b Translationen in der Zeit Sei jetzt angenommen, dass das Bezugssystem B 0 bezüglich des Inertialsystems BI ruht, und dass die gleichen Raumkoordinaten in B 0 als in BI verwendet werden, d.h. ~r = ~r 0 für Ortsvektoren. Dagegen unterscheidet sich der in B 0 gewählte Nullpunkt der Zeit t0 = 0 von dem Nullpunkt t = 0 in BI : t0 = t − τ. (I.25) ::::::::::::::::::::::::::::::: Dies entspricht einer zeitlichen Translation, so wie Gl. (I.24) eine räumliche Translation darstellt. Unter Verwendung der Kettenregel gilt dann für die Zeitableitungen in jedem Bezugssystem(3) d dt d d = 0 = , dt0 dt dt dt und eine ähnliche Gleichung für die zweite Ableitungen. Insbesondere ist d2 ~x(t)/dt2 = ~0 genau äquivalent zu d2 ~x(t0 )/dt02 = ~0. Bemerkung: Gleichung (I.25) bedeutet nicht nur, dass die Beobachter in BI und B 0 unterschied- liche Nullpunkte der Zeit genommen haben, sondern auch, dass die Zeit gleich schnell in beiden Bezugssystemen vergeht. Das heißt, hier wird t0 = αt − τ mit α = 1 betrachtet. I.3.2 Eigentliche Galilei-Transformationen Ein Bezugssystem B 0 bewege sich gegenüber dem Inertialsystem BI mit konstanter Geschwindigkeit. Der Einfachheit halber wird angenommen, dass die an BI und B 0 gebundenen Beobachter Koordinatensysteme verwenden, deren Ursprungspunkte zur Zeit t = 0 übereinstimmen, während deren Achsen parallel sind, wie in Abb. I.3 dargestellt wird. Dann gilt für die Koordinaten eines bestimmten Punkts P in den beiden Bezugssystemen ~r 0 = ~r − ~u t. (I.26) Eine solche Transformation zwischen Bezugssystemen wird eigentliche Galilei-Transformation oder auch Galilei-Boost genannt. x3 P • BI 0 x3 ~r O ~r 0 x2 B0 ~u t 0 x2 x1 O0 0 x1 Abbildung I.3 (3) Die hier benutzte Notation bedeutet, dass für jede Funktion f (t0 ) = ϕ t(t0 ) die Gleichung df (t0 )/dt0 = dϕ/dt gilt. 19 I.3 Inertialsysteme. Galilei-Transformationen Die Beziehung (I.26) führt für die Bahnkurven ~x(t) bzw. ~x 0(t) eines bewegten Massenpunkts P sofort zu d~x(t) d~x 0(t) d d2 ~x 0(t) d2 ~x(t) = ~x(t) − ~u t = − ~u und = . dt dt dt dt2 dt2 Die erstere Gleichung bedeutet, dass die Beobachter in BI und B 0 einem bewegten physikalischen System unterschiedliche Geschwindigkeiten zuordnen. Dagegen sind die durch die beiden Beobachter gemessenen Beschleunigungen gleich. ¨(t) = ~0 in BI , dann gilt ebenfalls ~x ¨ 0(t) = ~0 in B 0 , Falls keine Kräfte auf P wirken, so dass ~x d.h. was in einem der Bezugssystem als kräftefrei aussieht, wird auch im anderen Bezugssystem als kräftefrei gesehen. Bemerkung: Genau wie bei Translationen führt die Hintereinanderausführung zweier Galilei-Boosts zu einem neuen Galilei-Boost. I.3.3 Drehungen Die letzte Klasse “einfacher“ Galilei-Transformationen besteht aus den Drehungen, um jede beliebige Achse im Raum. Sei somit angenommen, dass die Beobachter in BI und B 0 Koordinatensysteme benutzen, deren Achsen gegenüber einander um einen konstanten Winkel θ gedreht sind. Dagegen stimmen die Ursprungspunkte der Koordinatensysteme miteinander überein. BI ~r B0 θ ~eR Abbildung I.4 In diesem Fall lassen sich Ortsvektoren bezüglich B 0 bzw. ihre Koordinaten aus denen bezüglich BI durch eine konstante 3 × 3-Drehmatrix R erhalten:(4) ~r 0 = R ~r. (I.27a) Äquivalent lässt sich diese Beziehung komponentenweise schreiben: 0 0 xi = R i j xj , (I.27b) 0 mit R ij für i0 , j ∈ {1, 2, 3} den Matrixelementen von R. Bemerkung: Bei der hier betrachteten Drehung — sowie bei den Translationen in § I.3.1 oder den Galilei-Boosts in § I.3.2 — handelt es sich um eine sog. passive Transformation. Im Gegensatz zu einer aktiven Drehung wird der betrachtete Massenpunkt nicht gegenüber anderen Objekten gedreht; hier wird der Beobachter oder äquivalent das Bezugs- bzw. Koordinatensystem, in dem der Massenpunkt beschrieben wird, gedreht. (4) Vgl. Anhang B über Drehmatrizen. 20 Newton’sche Mechanik Beziehung (I.27a) bzw. (I.27b) gilt auch für die Bahnkurve eines Massenpunkts bezüglich jedes der Bezugssysteme bzw. für die Komponenten der Bahnkurve. Da die Beziehung zwischen Bahnkurven linear und zeitunabhängig ist, gibt sie nach zweifachen Zeitableitung d2 ~x 0(t) d2 ~x(t) = R dt2 dt2 bzw. 0 2 j d2 xi (t) i0 d x (t) = R . j dt2 dt2 ¨(t) = ~0 zu ~x ¨ 0(t) = ~0. Da jede Drehmatrix invertierbar ist, gilt die Implikation auch in Somit führt ~x der umgekehrten Richtung. Bemerkung: Wie bei Translationen oder Galilei-Boosts ist das Produkt zweier Drehmatrizen, ent- sprechend der Verkettung der assoziierten Drehungen, wieder eine Drehmatrix. Dabei ist aber das Produkt zweier Drehmatrizen im Allgemeinen nicht-kommutativ, d.h. die Reihenfolge, in der die Drehungen aufeinander folgen, ist wichtig. I.3.4 Allgemeine Galilei-Transformationen Generell sind die Galilei-Transformationen G die linearen Abbildungen (t, ~x) → G(t, ~x) = (t0 , ~x 0 ) zwischen den Zeiten und Positionen gemessen in zwei unterschiedlichen Inertialsystemen. In § I.3.1–I.3.3 wurde gezeigt, dass räumliche oder zeitliche Translationen, Galilei-Boosts und Drehungen Beispiele solcher Galilei-Transformationen sind. Allgemeiner definiert jedes „Produkt“ — d.h. Hintereinanderausführung — von Translationen im Raum oder in der Zeit, Galilei-Boosts und Drehungen eine allgemeine Galilei-Transformation. Dabei hängt die resultierende Transformation von der Reihenfolge der Transformationen ab, genau wie es schon bei Drehungen der Fall ist. Umgekehrt kann man zeigen, dass jede Galilei-Transformation zwischen Inertialsystemen sich als Verkettung von Translationen, Drehungen und Galilei-Boosts zerlegen lässt. Schließlich ist das Produkt zweier Galilei-Transformationen wieder eine Galilei-Transformation. Somit bilden diese Transformationen mit diesem Produkt mathematisch eine sog. Gruppe.(5) Dabei benutzt man auch, dass es ein „neutrales Element“ für das Produkt gibt, und zwar die Identitätstransformation, dass jeder Galilei-Transformation eine inverse Transformation zugeordnet werden kann, und schließlich dass das Produkt assoziativ ist. Da das Ergebnis eines Produkts von der Reihenfolge der „Multiplikanden“ abhängt, wird die Gruppe als nicht-kommutativ oder äquivalent nicht-abelsch (f) bezeichnet. Bemerkung: Die Translationen — im Raum oder in der Zeit —, die Drehungen und die Galilei-Boosts bilden jeweils Untergruppen der Galilei-Gruppe. I.3.5 Kräfte und Galilei-Transformation In den vorigen Paragraphen wurde nur das Verhalten des Ortsvektors und seiner Ableitungen unter Galilei-Transformationen von einem Inertialsystem zu einem anderen betrachtet. Daraus folgt, ¨(t) eines Massenpunktes in einem Inertialsystem BI verschwindet, dass wenn die Beschleunigung ~x 0 ¨ (t) = ~0 für einen Beobachter, dessen Koordinatensystem mit dem in BI über eine Galileidann gilt ~x Transformation zusammenhängt. Um zu zeigen, dass das zweite Newton’sche Gesetz (I.14) ebenfalls in beiden Bezugssystemen BI und B 0 gleichzeitig gilt, soll noch das Transformationsgesetz für Kräfte präzisiert werden. Dafür soll man die Form der Kraft genauer berücksichtigen. (5) (f) Diese Gruppe wird manchmal mit Gal(3) bezeichnet. N. H. Abel, 1802–1829 I.4 Beschleunigte Bezugssysteme. Scheinkräfte 21 • Kräfte der Form F~ = F ~eF relativ zu BI , mit konstantem Betrag F und einer festen Richtung ~eF im Raum, transformieren sich unter Drehungen genau wie Ortsvektoren — indem ~eF für einen Inertialbeobachter in B 0 gedreht aussieht —, während sie unter Translationen oder ¨(t) = F~ sowohl in BI als (mit Lorentz-Boosts invariant bleiben. Somit gilt die Gleichung m~x 0 „gestrichenen“, transformierten Vektoren) in B . Ein Beispiel für eine solche Kraft ist die Schwerkraft m~g in einem homogenen Schwerefeld. • Realistische ortsabhängige Kräfte hängen nicht vom Ortsvektor des Körpers ab, auf den sie ausgeübt werden, sondern nur von seinem Abstandsvektor von einem anderen Körper. Dies ist z.B. der Fall der Newton’schen Gravitationskraft zwischen zwei Massenpunkten. Dieser Abstandsvektor, und somit die Kraft, bleibt unverändert unter Translationen oder LorentzBoosts, während es sich unter Drehungen genau wie ein Ortsvektor bzw. eine Beschleunigung ¨(t) = F~ sowohl in BI als in B 0 . verhält. Wieder gilt m~x • Bei geschwindigkeitsabhängigen Kräften ist eine zusätzliche Fallunterscheidung nötig. – Bei Reibungskräften, wie z.B. der Stokes’schen Reibung (I.15c), ist die relevante Geschwindigkeit diejenige relativ zum Ruhesystem eines Mediums — z.B. der Luft oder Flüssigkeit, durch welche der Körper sich bewegt. Diese Relativgeschwindigkeit ändert sich nicht, bis auf Änderungen der beobachteten Richtung, unter den Transformationen ¨(t) = F~ die gleiche Form in BI und in B 0 der § I.3.1–I.3.3, so dass die Gleichung m~x annimmt. – Der Fall der Lorentz-Kraft ist mehr problematisch. ~ lautet sie F~ = q~v × B, ~ mit B ~ einem statischen In Abwesenheit eines elektrischen Feldes E magnetischen Feld. Dabei ist ~v die Geschwindigkeit der bewegten Punktladung relativ ~ = ~0 und B ~ stationär ist. In Bezugssystemen, die sich zum Bezugssystem, in dem E ~ und B ~ relativ zu diesem Bezugssystem mit einer Geschwindigkeit ~u bewegen, nehmen E unterschiedliche Forme an, wie man im Rahmen der Elektrodynamik nachprüfen kann. Die Felder ändern sich dabei so, dass die Lorentz-Kraft, einschließlich des Terms mit ~ (in Betrag) invariant bleibt. Dies gilt zumindest annähernd, solange |~u| „klein“ ist, E, und zwar gegenüber dem Vakuumlichtgeschwindigkeit. Für entsprechende Galilei-Boosts ¨(t) = F~ die gleiche im gleichförmig bewegten Bezugssystem als erhält die Gleichung m~x in einem Inertialsystem. Eigentlich transformieren sich die Gleichungen der Elektrodynamik unter Galilei-Boosts nicht, wie sie sollten, damit Galilei-Transformationen die richtigen Transformationen zwischen Inertialsystemen darstellen. Auf dieses Thema wird in Kap. V weiter eingegangen. Abgesehen vom oben erwähnten Problem mit der Lorentz-Kraft nimmt die mathematische Formulierung (I.14) des zweiten Newton’schen Gesetzes die gleiche Form in allen Bezugssystemen an, die sich aus einem Inertialsystem über eine Galilei-Transformation ableiten lassen. Deshalb sind diese Bezugssysteme auch Inertialsysteme. I.4 Beschleunigte Bezugssysteme. Scheinkräfte Im vorigen Abschnitt wurde gesehen, dass ein Bezugssystem B 0 , das sich relativ zu einem Inertialsystem BI gleichförmig und geradlinig bewegt, oder dessen Koordinaten konstant verschoben oder gedreht gegenüber solchen von BI sind, ebenfalls ein Inertialsystem ist. In diesem Abschnitt wird wieder ein Inertialsystem BI betrachtet, in denen die Newton’schen Gesetze des Abschn. I.2 gelten. Dann bezeichnet B 0 ein zweites Bezugssystem in beschleunigter Bewegung gegenüber BI . Wie wir sehen werden ist ein solches Bezugssystem kein Inertialsystem. 22 Newton’sche Mechanik Ortsvektoren bezüglich eines festen Koordinatensystems in BI bzw. B 0 werden mit ~r bzw. ~r 0 bezeichnet. Wiederum steht ~x(t) bzw. ~x 0(t) für Bahnkurven bezüglich BI bzw. B 0 . Sei Σ ein physikalisches System, modelliert durch einen Massenpunkt mit träger Masse m. Laut dem zweiten Newton’schen Gesetz (I.14) gilt im Inertialsystem BI d2 ~x(t) ~ = F, (I.28) dt2 mit F~ der (möglicherweise zeitabhängigen) Resultierenden der physikalischen Kräfte auf Σ. Im Folgenden wird die in B 0 beobachtete Beschleunigung d2 ~x 0(t)/dt2 für unterschiedliche Bewegungen von B 0 berechnet, und zwar erstens für den Fall eines linear beschleunigten Bezugssystems (§ I.4.1), dann für ein rotierendes Bezugssystem (§ I.4.2). In beiden Fällen weicht d2 ~x 0(t)/dt2 von der im Inertialsystem beobachteten Beschleunigung d2 ~x(t)/dt2 ab: die zusätzlichen Terme, multipliziert mit m, lassen sich als auf Σ wirkende Scheinkräfte interpretieren. m I.4.1 Linear beschleunigte Bezugssysteme Betrachten wir zunächst den Fall eines Bezugssystems B 0 , das sich relativ zum Inertialsystem BI mit einer zeitabhängigen Geschwindigkeit ~u(t) bewegt, wobei die Richtung von ~u(t) konstant bleibt, so dass die Bewegung linear ist. Der Einfachheit halber wird angenommen, dass die an BI und B 0 gebundenen Beobachter Koordinatensysteme verwenden, deren Ursprungspunkte zur Zeit t = 0 übereinstimmen, und deren Achsen parallel sind (Abb. I.5). Dann gilt für die Positionen eines bestimmten Punkts P bezüglich der beiden Bezugssysteme Z t 0 ~r = ~r − ~u(t0 ) dt0 , (I.29) 0 wobei der zweite Term (ohne das Minus-Zeichen) die Verschiebung zur Zeit t des Ursprungspunkts O0 vom Koordinatensystem in B 0 darstellt. x3 P • BI 0 x3 ~r O ~r 0 x2 B0 Z x1 t 0 x2 ~u(t0 ) dt0 O0 0 0 x1 Abbildung I.5 Falls B 0 konstant beschleunigt ist, so gilt ~u(t) = ~a t + ~u(0) und somit 1 2 0 ~r = ~r − ~at + ~u(0)t . 2 Beziehung (I.29) gilt auch zwischen den in BI und B 0 gemessenen Bahnkurven ~x(t) und ~x 0(t) eines Massenpunkts. Eine erste Zeitableitung liefert dann d~x 0(t) d~x(t) = − ~u(t), dt dt (I.30) 23 I.4 Beschleunigte Bezugssysteme. Scheinkräfte entsprechend einem Additionstheorem für Geschwindigkeiten. Dann gibt eine zweite Ableitung d2 ~x 0(t) d2 ~x(t) d~u(t) = − . dt2 dt2 dt (I.31) In Abwesenheit von physikalischen Kräften, d.h. wenn F~ = ~0, gilt im Inertialsystem BI laut den ersten zwei Newton’schen Gesetzen d2 ~x(t)/dt2 = ~0. Dagegen ist d2 ~x 0(t)/dt2 im Allgemeinen gemäß Gl. (I.31) ungleich Null: für einen Beobachter im Bezugssystem B 0 ist die Beschleunigung ¨ 0(t) = −~u˙ (t), was der eines bezüglich BI ruhenden, d.h. eigentlich kräftefreien, Massenpunkts ~x Beobachter als Antwort des Massenpunkts zur Anwendung einer Scheinkraft −m~u˙ (t) interpretiert. Da ein kräftefreier Massenpunkt relativ zu B 0 nicht ruht, sondern sich bewegt, ist jenes Bezugssystem kein Inertialsystem. I.4.2 Rotierende Bezugssysteme Jetzt wird angenommen, dass das Bezugssystem B 0 gegenüber dem Inertialsystem BI rotiert. Dabei können sowohl die (momentane) Achse der Rotation als auch die Rotationsgeschwindigkeit von B 0 bezüglich BI von der Zeit abhängen. Der Einfachheit halber wird angenommen, dass die Koordinatensysteme in B 0 und BI den gleichen Ursprungspunkt haben. Somit lassen sich Vektoren in B 0 aus denen bezüglich BI durch eine zeitabhängige Drehmatrix RB0/BI(t) ∈ SO(3) erhalten [vgl. Gl. (I.27a)]; z.B. gilt für den Ortsvektor eines Punkts ~r 0 = RB0/BI(t)~r. (I.32a) Im Folgenden wird es günstiger sein, die Bahnkurve eines Massenpunkts bezüglich BI durch jene relativ zu B 0 auszudrücken. Da die Drehmatrix RB0/BI(t) eine orthogonale Matrix ist, ist sie automatisch invertierbar, woraus ~r = [RB0/BI(t)]−1 ~r 0 ≡ R(t)~r 0 (I.32b) folgt, wobei die kürzere Notation R(t) für die inverse Drehmatrix eingeführt wurde.(6) Diese Beziehung gilt nicht nur für den Ortsvektor, sondern für jeden Vektor. Somit gilt für die in BI und B 0 beobachteten Bahnkurven ~x(t) = R(t)~x 0(t) (6) (I.33a) Es wird der Leserin empfohlen, sich die etwa abstrakten Berechnungen dieses Paragraphen anhand eines Beispiels klarer zu machen. Z.B. kann man annehmen, dass B0 mit konstanter Rotationsgeschwindigkeit ω0 um die x3 -Achse des Koordinatensystems von BI rotiert. Die Beziehung zwischen den Basisvektoren der beiden Koordinatensysteme lautet dann ~e10 cos(ω0 t) sin(ω0 t) 0 ~e1 ~e20 = −sin(ω0 t) cos(ω0 t) 0~e2 0 0 1 ~e3 ~e30 oder äquivalent, nach Transposition cos(ω0 t) −sin(ω0 t) 0 ~e10 ~e20 ~e30 = ~e1 ~e2 ~e3 sin(ω0 t) cos(ω0 t) 0 . 0 0 1 Für die Koordinaten eines Vektors in B0 und BI gilt [vgl. Gl. (I.32a)] 0 1 1 x1 cos(ω0 t) sin(ω0 t) 0 x x 20 2 2 x = −sin(ω0 t) cos(ω0 t) 0x ≡ RB0/BI(t)x . 3 30 0 0 1 x x3 x Daraus folgt 1 x cos(ω0 t) x2 = sin(ω0 t) x3 0 −sin(ω0 t) cos(ω0 t) 0 mit R(t) der in Gl. (I.32b) eingeführten Drehmatrix. 0 10 x x1 0 0 0 0x2 ≡ R(t)x2 0 0 1 x3 x3 24 Newton’sche Mechanik und gleichfalls für die Kräfte F~ (t) = R(t) F~ 0(t), (I.33b) vgl. die Diskussion in § I.3.5. I.4.2 a Bewegungsgleichung in einem rotierenden Bezugssystem :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Leitet man zunächst die Beziehung (I.33a) nach der Zeit ab, so ergibt sich unter Verwendung der Produktregel d~x(t) dR(t) 0 d~x 0(t) = ~x (t) + R(t) . (I.34) dt dt dt Dabei ist dR(t)/dt die Zeitableitung dR(t) R(t+δt) − R(t) 1 R(t+δt)R(t)−1 − 13 R(t) (I.35) = lim = lim δt→0 δt→0 δt dt δt mit 13 der 3 × 3-Einheitsmatrix, wobei das Produkt zweier Drehmatrizen R(t + δt)R(t)−1 ≡ D selbst eine Drehmatrix ist. Im Limes δt = 0 gilt D = 13 . Somit lässt sich D bei „kleinem“ δt als D = 13 + Ω(t)δt + O (δt)2 (I.36) schreiben, mit Ω(t) einer 3×3-Matrix. Genauer muss der Betrag des Produkts aus δt mit irgendeinem der Matrixelemente von Ω(t) klein gegenüber 1 sein. Bei Gl. (I.36) handelt es sich eigentlich um eine Taylor-Entwicklung, wobei Ω(t) die Zeitableitung von D ist. Diese Näherung kann in Gl. (I.35) eingesetzt werden, woraus sich dR(t) = Ω(t)R(t) dt (I.37) ergibt. Da D eine Drehmatrix ist, gilt DDT = DT D = 13 . Die Transposition der Gl. (I.36) gibt DT = 13 + Ω(t)T δt + O (δt)2 , woraus DDT = 13 + Ω(t) + Ω(t)T δt + O (δt)2 folgt. Dies ist gleich 13 bis auf Terme der Ordnung (δt)2 oder höher vorausgesetzt Ω(t)T = −Ω(t), d.h. wenn Ω(t) eine antisymmetrische Matrix ist. Diese lässt sich dann parametrisieren als 0 −ω 3 (t) ω 2 (t) 0 −ω 1 (t) Ω(t) = ω 3 (t) (I.38) 2 1 −ω (t) ω (t) 0 oder äquivalent [Ω(t)]ij = −ijk ω k (t) für jede Zeit t, mit ω 1 (t), ω 2 (t), ω 3 (t) drei reellen Zahlen.(7) Mit dieser Parametrisierung gilt für jeden Vektor ~a mit Komponenten (a1 , a2 , a3 ) 1 2 0 −ω 3 (t) ω 2 (t) a ω (t)a3 − ω 3 (t)a2 0 −ω 1 (t)a2 = ω 3 (t)a1 − ω 1 (t)a3 , Ω(t)~a = Ω(t) = ω 3 (t) 2 1 −ω (t) ω (t) 0 a3 ω 1 (t)a2 − ω 2 (t)a1 (7) Für das in Fußnote (6) eingeführte Beispiel gilt cos(ω0 δt) −1 D ≡ R(t+δt)R(t) = sin(ω0 δt) 0 Somit ist in diesem Fall [vgl. Gl. (I.36)] −sin(ω0 δt) cos(ω0 δt) 0 0 Ω(t) = ω0 0 −ω0 0 0 0 1 0 ∼ ω0 δt δt→0 1 0 0 0 0 und der über die Parametrisierung (I.38) assoziierte Vektor ist ω ~ (t) = ω0~e3 . −ω0 δt 1 0 0 0 . 1 25 I.4 Beschleunigte Bezugssysteme. Scheinkräfte d.h. Ω(t)~a = ω ~ (t) × ~a (I.39) mit ω ~ (t) dem Vektor mit Komponenten ω 1 (t), ω 2 (t), ω 3 (t) . Die physikalische Bedeutung dieses Vektors wird am Ende dieses Paragraphen diskutiert. Wie wir dort sehen wird, macht ω ~ (t) Sinn, wenn er als Vektor im Inertialsystem BI angesehen wird. Ersetzt man die Ableitung dR(t)/dt in Gl. (I.34) mit Hilfe von Gl. (I.37), so kommt d~x(t) d~x 0(t) d~x 0(t) = Ω(t)R(t)~x 0(t) + R(t) =ω ~ (t) × R(t)~x 0(t) + R(t) , dt dt dt wobei die zweite Gleichung aus Beziehung (I.39) folgt. Sei jetzt ω ~ 0 (t) ≡ R(t)−1 ω ~ (t). Unter Verwendung der Identität R~a × R~b = R ~a × ~b , die für jede Drehmatrix R und jedes Paar von Vektoren ~a, ~b gilt, kann man dann d~x 0(t) d~x(t) 0 0 = R(t) ω ~ (t) × ~x (t) + dt dt (I.40) (I.41) (I.42) schreiben. Beweis der Identität (I.41): es seien {ai } bzw. {bi } die kartesischen Koordinaten von ~a bzw. ~b 0 und R ij die Matrixelemente von R. Dann gilt i0 0 0 R~a × R~b = i0j 0k0 R jj aj R kk bk . Andererseits ist die Determinante der Drehmatrix R durch 0 0 0 det R = `0j 0k0 R `1 R j2 R k3 gegeben, wobei eigentlich det R = 1. Äquivalent gilt nach einer Permutation 1 → `, 2 → j, 3 → k der Matrixspalten 0 0 0 `jk det R = `0j 0k0 R `` R jj R kk , 0 wobei `jk das Signum der Permutation ist. Multipliziert man diese Gleichung mit R i` und 0 0 0 0 0 0 summiert man über `, so kommt `jk R i` = `0j 0k0 R i` R `` R jj R kk . Dabei ist R `` das `0 `-Element 0 0 der Matrix R, d.h. auch das ``0 -Element der transponierten Matrix R T , so dass R i` R `` , mit Summe über `, das i0`0 -Element des Produkts RR T = 13 ist. Somit gilt 0 0 0 0 0 0 0 `jk R i` = `0j 0k0 δ i ` R jj R kk = i0j 0k0 R jj R kk . Schließlich findet man i0 i0 0 0 0 R~a × R~b = i0j 0k0 R jj aj R kk bk = `jk R i` aj bk = R ~a × ~b , entsprechend dem gesuchten Ergebnis. Das wiederholte Ableiten von Gl. (I.42) nach der Zeit liefert dann 0 d~x 0(t) d~ ω (t) d~x 0(t) d2 ~x 0(t) dR(t) 0 d2 ~x(t) 0 0 0 = ω ~ (t) × ~x (t) + + R(t) × ~x (t) + ω ~ (t) × + . dt2 dt dt dt dt dt2 Für den ersten Term im rechten Glied können Gl. (I.37), (I.39) und (I.41) wieder benutzt werden: dR(t) 0 d~x 0(t) d~x 0(t) 0 0 0 ω ~ (t) × ~x (t) + = Ω(t)R(t) ω ~ (t) × ~x (t) + dt dt dt d~x 0(t) 0 0 =ω ~ (t) × R(t) ω ~ (t) × ~x (t) + dt d~x 0(t) 0 0 0 = R(t)~ ω (t) × R(t) ω ~ (t) × ~x (t) + dt 0 d~x (t) = R(t) ω ~ 0 (t) × ω ~ 0 (t) × ~x 0(t) + . dt 26 Newton’sche Mechanik Somit ergibt sich insgesamt 2 0 0 d2 ~x(t) d ~x (t) d~x 0(t) d~ ω 0 (t) 0 0 0 0 = R(t) +ω ~ (t) × ω ~ (t) × ~x (t) + 2~ ω (t) × + × ~x (t) . dt2 dt2 dt dt (I.43) Unter Berücksichtigung des zweiten Newton’schen Gesetzes (I.28) lässt sich der Term auf der ~ linken Seite als F/m umschreiben. Dabei kann man F~ mithilfe der Gl. (I.33b) ersetzen. Nach −1 Anwendung von R auf die daraus folgende Gleichung erhält man schließlich m 0 d2 ~x 0(t) d~x 0(t) d~ ω 0 (t) 0 0 0 ~ 0 − m~ = F ω (t) × ω ~ (t) × ~ x (t) − 2m~ ω (t) × − m × ~x 0(t). dt2 dt dt (I.44) Die drei letzten Terme auf der rechten Seite sind wieder Scheinkräfte, die zur im Bezugssystem B 0 gemessenen Beschleunigung beitragen. Bemerkung: Alle drei neuen Scheinkräfte in Gl. (I.44) sind proportional zur trägen Masse m, so wie die in § I.4.1 gefundene Scheinkraft in einem linear beschleunigten System. Aus diesem Grund werden Scheinkräfte auch manchmal Trägheitskräfte genannt. Wegen der nach heutigem (Herbst 2015) Wissenstand gültigen Proportionalität zwischen schwerer und träger Masse ist auch die Schwerkraft proportional zu m. Daher kann die Schwerkraft zumindest mathematisch als eine Scheinkraft betrachtet werden, die sich über eine passende Wahl von Bezugssystem annullieren lässt — was die grobe Grundidee von der Allgemeinen Relativitätstheorie darstellt. Bevor wir die drei Scheinkräfte in Gl. (I.44) weiter diskutieren, sollte die Bedeutung des darin auftretenden Vektors ω ~ 0(t) bzw. von ω ~ (t) festgestellt werden. Zu diesem Zweck kann Gl. (I.40) für den Fall eines bezüglich B 0 ruhenden Massenpunkts geschrieben werden. Für d~x 0(t)/dt = ~0 gilt nämlich d~x(t) =ω ~ (t) × R(t)~x 0(t) = ω ~ (t) × ~x(t). (I.45) dt Das heißt, die (Rate der) Änderung der in BI gemessenen Position ~x(t) ist senkrecht auf ~x(t) und auf den Vektor ω ~ (t). Diese Gleichung beschreibt eine (instantane) Rotationsbewegung bezüglich BI um eine Achse, die durch den Ursprungspunkt des Koordinatensystems geht und entlang der Richtung von ω ~ (t) liegt. Dazu kann man anhand eines Beispiels(8) sehen, dass die zugehörige Rotationsgeschwindigkeit — d.h. die Rate der Änderung des Winkels von ~x(t) bezüglich einer festen Richtung — genau durch den Betrag |~ ω (t)| gegeben wird. Entsprechend diesen Eigenschaften heißt der Vektor ω ~ (t) Winkelgeschwindigkeit. I.4.2 b Zentrifugalkraft :::::::::::::::::::::: Der zweite Term auf der rechten Seite von Gl. (I.44) ist die Zentrifugalkraft 0 F~zentrifugal ≡ −m~ ω 0 (t) × ω ~ (t) × ~x 0(t) . (I.46) Zerlegt man den Ortsvektor ~x 0(t) in die Summe aus einem Vektor ~xk0 (t) parallel zur Winkelgeschwindigkeit ω ~ 0(t) und einem Vektor ~x⊥0 (t) senkrecht darauf, so trägt nur ~x⊥0 (t) zum geklammerten Kreuzprodukt bei, und man findet 0 2 0 F~zentrifugal = −m ω ~ (t) ~x⊥(t). Somit ist die Zentrifugal kraft orthogonal zur Richtung der instantanen Achse der Rotationsbewegung, wie in Abb. I.6 dargestellt wird. (8) ... wie jenes aus der Fußnote (6)! Vgl. den entsprechenden Ausdruck von ω ~ (t) in Fußnote (7). 27 I.5 Mehrteilchensysteme ω ~0 F~zentrifugal ~xk0 ω ~ 0×~x 0 ~x 0 ~x⊥0 Abbildung I.6 – Zentrifugalkraft Diese Scheinkraft wird auch durch Körper gespürt, die bezüglich des beschleunigten Bezugssystems B 0 ruhen, falls sie nicht auf der Achse der Rotationsbewegung sitzen — d.h. für ~x⊥0 (t) 6= ~0. I.4.2 c Coriolis-Kraft Die zweite in Gl. (I.44) auftretende Scheinkraft ist die Coriolis (g) -Kraft :::::::::::::::::::: F~Coriolis ≡ −2m~ ω 0 (t) × ~v 0(t) (I.47) mit ~v 0(t) ≡ d~x 0(t)/dt der Geschwindigkeit im nicht-Inertialsystem B 0 . Diese Scheinkraft ist offensichtlich senkrecht sowohl auf ~v 0(t) als auf ω ~ 0(t), und wirkt nicht auf Körper, die sich parallel zur instantanen Achse der Drehbewegung bewegen. Ein an die Erde gebundenes Bezugssystem B 0 ist wegen der Erdrotation in Drehbewegung relativ zu entfernten Galaxien. Somit erfahren Körper, die auf der Erde sich bewegen, eine Coriolis-Kraft. Diese dafür sorgt, dass horizontale Bewegungen, wie von z.B. Strömen in Ozeanen oder von Wolken, auf der Nord- bzw. Südhalbkugel nach rechts bzw. links abgelenkt werden. I.4.2 d Euler-Kraft :::::::::::::::::: Der letzte Term in Gl. (I.44) ist die Euler (h) -Kraft 0 d~ ω (t) × ~x 0(t). F~Euler ≡ −m dt (I.48) Diese Scheinkraft tritt nur auf, wenn die Winkelgeschwindigkeit sich zeitlich entsprechend 0 ändert, einer Änderung entweder der Rotationsgeschwindigkeit — d.h. des Betrags ω ~ (t) — oder der Drehachse, oder natürlich von beiden. Dabei spielt der Bewegungszustand — bewegt oder ruhend — des Körpers relativ zum beschleunigten Bezugssystem keine Rolle. ˙ 0(t) parallel zu ω Falls die Rotationsachse konstant bleibt, so dass ~ω ~ 0(t) ist, findet man sofort, dass die Euler-Kraft tangential zur Bahnkurve des Körpers ist. I.5 Mehrteilchensysteme Die in Abschn. I.2 eingeführten Newton’schen Gesetze bzw. der in § I.2.5 betrachtete Energiesatz beziehen sich auf der Bewegung eines einzigen Massenpunkts unter dem Einfluss äußerer Kräfte bzw. in einem äußeren Potential — obwohl das dritte Gesetz eigentlich schon Aufschluss über die Kräfte zwischen zwei Körpern gibt. Im Gegensatz befasst sich dieser Abschnitt mit der Bewegung eines Systems Σ aus N Massenpunkten — die hiernach auch als „Teilchen“ bezeichnet werden — mit N ≥ 2. Ein solches System wird dann Mehrteilchensystem genannt. Im Folgenden werden die unterschiedlichen Massenpunkte (g) G. Coriolis, 1792–1843 (h) L. Euler, 1707–1783 28 Newton’sche Mechanik mit Indizes a, b = 1, 2, . . . , N gekennzeichnet: ihre Ortsvektoren relativ zu einem festen Bezugssystem werden mit ~r1 ,~r2 , . . . ,~rN ≡ {~ra }1≤a≤N bezeichnet; ihre Bahnkurven mit {~xa (t)}1≤a≤N ; ihre Massen mit {ma }1≤a≤N ; ihre Impulse mit {~pa (t)}1≤a≤N ; usw. Als einfache Beispiele eines solchen Systems kann man entweder die Erde um die Sonne oder zwei durch eine Feder gekoppelte Massen betrachten, entsprechend N = 2. Der Fall N = 3 kann z.B. mit dem System {Sonne + Erde + Mond} illustriert werden. Unter Vernachlässigung des interstellaren Mediums sind Galaxien Systeme aus N ≈ 109 –1012 Sternen. Schließlich stellen die Moleküle in einem Kubikmeter von Gas ein Beispiel mit N ≈ 1024 dar. Die üblichen Größen zur Beschreibung eines Mehrteilchensystems, sowie die in der klassischen Mechanik üblichen Modellierung der für ein solches System relevanten Kräfte, werden in § I.5.1 dargelegt. In § I.5.2–I.5.4 werden Aussagen über die Zeitentwicklung einiger charakteristischen Größen — Impuls, Drehimpuls und Energie — hergeleitet. Insbesondere wird sich herausstellen, dass diese Größen bei Mehrteilchensystem, die mit ihrer Umgebung nicht wechselwirken, erhalten sind, d.h. sie bleiben konstant in der Zeit. Schließlich befasst sich § I.5.5 mit dem „geeigneten“ Bezugssystem, in welchem die Teilchenbewegungen entkoppelt von der globalen Bewegung des Systems sind. I.5.1 Grundlagen I.5.1 a Modellierung des Systems. Bewegungsgleichungen :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Um die Bewegung eines der Massenpunkte des Systems Σ beschreiben zu können, soll man zunächst die Kraft auf ein solches Teilchen formulieren. Der Einfachheit halber wird die Bewegung des Mehrteilchensystems in einem Inertialsystem B untersucht wird, so dass keine Scheinkräfte vorhanden sind. Somit wird angenommen, dass die Kraft auf Teilchen a sich als F~a = F~a,ext + N X F~b→a (I.49) b=1 b6=a schreiben lässt, wobei eine mögliche Zeit- oder Ortsabhängigkeit nicht geschrieben wurde. Dabei stellt F~a,ext die Resultierende aus den auf a wirkenden externen Kräften dar, die auch äußere Kräfte genannt werden. Dieser Term beschreibt den Einfluss von Ursachen, die nicht teil vom betrachteten Mehrteilchensystem sind, wie z.B. eines Schwerefeldes, in dem die Teilchen sind. Dagegen steht F~b→a für eine innere Kraft, und zwar für diejenige, die das b-te Teilchen von Σ auf das Teilchen a übt. Damit die Massenpunkte des Mehrteilchensystems sich gegenseitig beeinflussen, sollten diese inneren Kräfte nicht identisch Null sein. Um Gleichungen kürzer zu machen, kann man eine innere Kraft F~a→a = ~0 definieren. Mit diesem Trick läuft z.B. die Summe in Gl. (I.49) über alle Werte von b von 1 bis N , ohne a auszuschließen. Bemerkung: Die Zerlegung (I.49) enthält eigentlich eine wichtige Annahme, und zwar dass es keine Drei-Körper-Kräfte im System gibt. Das heißt, Teilchen a unterliegt keiner Kraft, die durch Teilchen b und b0 gemeinsam verursacht wird: der ganze Einfluss dieser beiden Teilchen auf a lässt sich als Summe von Zwei-Körper-Kräften F~b→a + F~b0 →a beschreiben. A fortiori gibt es keine Vier-, Fünfusw. Körper-Kräfte. Diese Annahme liegt eigentlich der ganzen Newton’schen Mechanik zu Grunde, denn sie ist für das dritte Gesetz (I.19) nötig. Laut dem zweiten Newton’schen Gesetz (I.14) lautet die Bewegungsgleichung für jedes Teilchen a = 1, . . . , N N X d~pa (t) d2 ~xa (t) ~a = F~a,ext + = ma = F F~b→a dt dt2 b=1 für jedes a ∈ {1, 2, . . . , N }. (I.50) 29 I.5 Mehrteilchensysteme Die N vektoriellen Gleichungen (I.50) bzw. die 3N entsprechenden skalaren Gleichungen, die sich aus Projektion auf drei Koordinatenachsen ergeben, bilden ein System aus gekoppelten Differentialgleichungen, welche die Bewegung des Mehrteilchensystems beschreiben. I.5.1 b Grundbegriffe und Definitionen Die Gesamtmasse des Mehrteilchensystems Σ wird definiert als ::::::::::::::::::::::::::::::::::::::: M≡ N X ma . (I.51) a=1 Diese Definition sieht trivial aus, sie gilt aber nur als Newton’sche, nicht-relativistische Näherung. Eigentlich ist die Masse eines gebundenen Systems kleiner als die Summe seiner Bestandteile — z.B. ist die Masse eines Atomkerns kleiner als die Summe der Massen dessen Protonen und Neutronen —, wobei die Differenz, der „Massendefekt“, mit der Bindungsenergie des Systems zusammenhängt. Zur Charakterisierung der Bewegung von Σ lohnt es sich, den Schwerpunkt des Mehrteilchensystems einzuführen. Dabei handelt es sich erstens um den Punkt mit Ortsvektor N 1 X ~ ma~ra . R≡ M (I.52) a=1 Entsprechend dieser Definition spricht man auch von dem Massenmittelpunkt. In ähnlicher Weise lautet die Bahnkurve des Schwerpunkts N 1 X ~ X(t) ≡ ma ~xa (t). M (I.53) a=1 In einem zweiten Schritt kann man diesem geometrischen Schwerpunkt die Masse M des Mehrteil~ chensystems zuordnen, so dass als Schwerpunkt jetzt einen fiktiven Massenpunkt mit Ortsvektor R ~ bzw. Trajektorie X(t) bezeichnet wird. Summiert man die Impulse bzw. Drehimpulse aller Teilchen von Σ, so erhält man den Gesamtimpuls N X P~ ≡ ~pa (I.54) a=1 bzw. den Gesamtdrehimpuls ~ ≡ L N X ~ra × ~pa (I.55) a=1 des Mehrteilchensystems. Dabei findet man einfach, dass der Gesamtimpuls P~ (t) mit der Gesamt~ masse M und der Geschwindigkeit dX(t)/dt des Schwerpunkts zusammenhängt, und zwar über ~ dX(t) P~ (t) = M . dt Diese Beziehung folgt sofort aus P~ (t) = N X a=1 ma N d~xa (t) d 1 X =M ma ~xa (t) dt dt M a=1 (I.56) 2 Definition: Eine Funktion f t, {~r a }, {~ va } der Ortsvektoren und Geschwindigkeiten der N Teilchen heißt Erhaltungsgröße oder Konstante der Bewegung, wenn sie für alle Lösungen {~ra = ~xa (t)}, {~va = ~x˙ a (t)} der Bewegungsgleichungen (I.50) konstant in der Zeit bleibt: d f t, {~xa (t)}, {~x˙ a (t)} = 0. (I.57) dt Bemerkung: Der Wert der Konstanten hängt im Allgemeinen von der Lösung ab! 30 Newton’sche Mechanik I.5.2 Bewegung des Schwerpunkts Summiert man die individuellen Bewegungsgleichungen (I.50) über alle Teilchen bzw. alle Werte von a, so ergibt sich N N X dP~ (t) X ~ = Fa,ext + F~b→a . (I.58) dt a=1 a,b=1 Unter Verwendung der Gl. (I.56) ist der linke Term dieser Gleichung einfach gleich dem Produkt 2. ~ aus der Gesamtmasse und der Beschleunigung des Schwerpunkts, M d2X(t)/dt Für den zweiten Term im rechten Glied von Gl. (I.58) kann man schreiben N X N N 1 X 1 X ~ Fb→a + F~b→a = F~b→a + F~a→b = ~0 F~b→a = 2 2 a,b=1 a,b=1 (I.59) a,b=1 wobei die erste Gleichung trivial ist, während die zweite aus eine Umbennenung der Indizes im zweiten Summanden in den Klammern, und die dritte aus dem dritten Newton’schen Axiom (I.19) folgt. Somit führt Gl. (I.58) insgesamt zur Bewegungsgleichung N X ~ dP~ (t) d2X(t) =M = F~a,ext . dt dt2 (I.60a) a=1 Diese Gleichung stellt die mathematische Formulierung des Schwerpunktsatzes dar: Der Schwerpunkt eines N -Teilchensystems bewegt sich nur unter dem Einfluss der Summe der äußeren Kräfte auf die Teilchen, und zwar wie ein Massenpunkt mit der Masse M , an dem diese Summe angreift. (I.60b) Falls keine äußere Kräfte vorliegen — d.h. für ein sog. abgeschlossenes System, ohne Wechselwirkung mit seiner Umgebung —, oder wenn ihre Resultierende verschwindet, dann gilt einfach dP~ (t)/dt = ~0, d.h. der Gesamtimpuls P~ (t) ist erhalten: Wenn die Resultierende aller äußeren Kräfte auf einem Mehrteilchensystem Σ verschwindet, dann ist der Gesamtimpuls von Σ eine Erhaltungsgröße. (I.60c) I.5.3 Drehimpuls Als nächstes können wir jetzt die Zeitentwicklung des durch Gl. (I.55) definierten Gesamtdrehimpulses untersuchen. Leitet man dessen Ausdruck nach der Zeit ab, so ergibt sich nach Anwendung der Produktregel N N X X ~ dL(t) d~xa (t) d~p (t) = × ~pa (t) + ~xa (t) × a . dt dt dt a=1 a=1 Da die Geschwindigkeit d~xa (t)/dt parallel zum Impuls ist, verschwindet der erste Term auf der rechten Seite. Unter Verwendung der Bewegungsgleichung (I.50) für Teilchen a erhält man dann N N N X X X ~ dL(t) = ~xa (t) × F~a = ~xa (t) × F~a,ext + ~xa (t) × F~b→a , dt a=1 a=1 (I.61) a,b=1 wobei die zweite Gleichung aus der Aufspaltung (I.49) der Kraft auf a folgt. Jeder Beitrag ~xa (t) × F~a,ext für a ∈ {1, . . . , N } ist das Drehmoment der äußeren Kraft F~a,ext , d.h. der erste Term auf der rechten Seite von Gl. (I.61) ist die Resultierende dieser Drehmomente. 31 I.5 Mehrteilchensysteme Ähnlich wie in Gl.(I.59) kann man den zweiten Term im Ausdruck ganz rechts von Gl. (I.61) umschreiben, und zwar als N N N X 1X 1 X ~xa (t) × F~b→a = ~xa (t) × F~b→a + ~xa (t) × F~b→a = ~xa (t) × F~b→a + ~xb (t) × F~a→b . 2 2 a,b=1 a,b=1 a,b=1 Laut dem dritten Newton’schen-Gesetz kann F~a→b durch −F~b→a ersetzt werden, woraus sich N X a,b=1 N 1 X ~ ~xa (t) − ~xb (t) × F~b→a ~xa (t) × Fb→a = 2 a,b=1 ergibt. Falls die Kraft F~b→a entlang des Vektors ~xb (t) − ~xa (t) von Teilchen a nach Teilchen b liegt — was z.B. der Fall für die Coulomb-Kraft zwischen zwei Punktladungen oder für die Newton’schen Schwerkraft zwischen zwei Punktmassen ist —, wird F~b→a Zentralkraft genannt. In diesem Fall verschwindet das Kreuzprodukt auf der rechten Seite der oberen Gleichung, und die Gl. (I.61) vereinfacht sich zu N X ~ dL(t) = ~xa (t) × F~a,ext . (I.62a) dt a=1 Dieses Ergebnis stellt den Drehimpulssatz für ein Mehrteilchensystem dar, und zwar Für ein System aus N Teilchen, zwischen denen nur Zentralkräfte wirken, ist die Rate der Änderung des Gesamtdrehimpulses gleich der Resultierenden von den äußeren Drehmomenten. (I.62b) Falls keine äußere Kräfte vorliegen, oder wenn die Resultierende ihrer Drehmomente verschwin~ ~ det, gilt dL(t)/dt = ~0, d.h. der Gesamtdrehimpuls L(t) ist erhalten: Wenn die Resultierende aller äußeren Drehmomente auf einem Mehrteilchensystem mit nur zentralen inneren Kräften verschwindet, dann ist der Gesamtdrehimpuls des Systems eine Erhaltungsgröße. (I.62c) Bemerkungen: ∗ Zentralkräfte werden oft definiert als Kräfte, die immer entlang der Richtung bis zu einem festen Punkt — dem Kraftzentrum — liegen. Die hier adoptierte Definition, laut der die Zweikörperkraft F~b→a immer in Richtung des Abstandsvektors zwischen Teilchen a und b zeigt, lässt sich ähnlich betrachten: wird die Position vom Massenpunkt b als fest angenommen, ist die durch Teilchen b auf jedes andere Teilchen a ausgeübte Kraft eine Zentralkraft bezüglich der Position von b. ∗ Hier wurde in der Herleitung der Ergebnisse (I.61)–(I.62c) angenommen, dass die ineren Kräfte zentral sind. Eigentlich ist die Erhaltung des Gesamtdrehimpulses in abgeschlossenen Systemen viel allgemeiner — wie wir in § II.3.1 c sehen werden, spiegelt diese Erhaltung die Isotropie des Raums wider — und gilt auch für Systeme mit nicht-zentralen Kräften. I.5.4 Energie I.5.4 a Energiesatz :::::::::::::::::: Die kinetische Energie des a-ten Teilchens eines Systems ist Ta = ~pa2 /2ma , vgl. Definition (I.21). Damit lässt sich die gesamte kinetische Energie eines Mehrteilchensystems als T ≡ N X ~pa2 2ma a=1 definieren. (I.63) 32 Newton’sche Mechanik Sei jetzt angenommen, dass sowohl die äußeren als die inneren Kräfte, die auf die Körper des Mehrteilchensystems wirken, konservativ sind. Das heißt einerseits, dass es Potentiale Va,ext (~ra ) existieren, die ~ a Va,ext (~ra ) für a ∈ {1, . . . , N } F~a,ext = −∇ (I.64) ~ a den Gradienten bezüglich dem Ortsvektor ~ra bezeichnet.(9) Andererseits gibt es erfüllen, wobei ∇ paarweise Wechselwirkungspotentiale Vab , die nur von Abstand |~ra − ~rb | abhängen, aus denen die inneren Kräfte abgeleitet werden können, und zwar über ~ a Vab |~ra − ~rb | für a, b ∈ {1, . . . , N }. F~b→a = −∇ (I.65) In diesem Fall ist die Zweikörperkraft der Form F~b→a = fba |~ra − ~rb | ~eab mit fba einer Funktion einer reellen Variablen und ~eab ≡ (~rb − ~ra )/|~rb − ~ra | dem Einheitsvektor entlang des Abstandsvektors der beiden Teilchen. Somit ist die Kraft zentral. Damit das dritte Newton’sche Axiom erfüllt wird, muss Vab = Vba für jedes Paar a, b gelten. ~ a Vab |~ra − ~rb | = ∇ ~ b Vab |~ra − ~rb | . Die Kettenregel gibt nämlich −∇ Die gesamte potentielle Energie V des Mehrteilchensystems ist dann V ≡ N X Va,ext (~ra ) + a=1 X Vab |~ra − ~rb | . (I.66) 1≤a<b≤N Dabei muss die Wechselwirkungsenergie jedes Teilchenpaars nur einmal mitgezählt werden, weshalb die Summe über Paare mit a < b eingeschränkt wurde. Äquivalent kann man die Summe im zweiten Term auf der rechten Seite noch anders umschreiben, und zwar entweder als die Hälfte der Summe über alle Werte von a und b mit der Einschränkung a 6= b, oder als die halbe Summe über alle Werte von a und b ohne Einschränkung, jedoch mit der Konvention Vaa ≡ 0: X Vab = N N N 1 XX 1X Vab = Vab mit Vaa = 0. 2 2 a=1 b=1 b6=a 1≤a<b≤N a,b=1 ~a auf das a-te Teilchen kann noch durch das Gesamtpotential V Bemerkung: Die Gesamtkraft F [Gl. (I.66)] ausgedrückt werden: ~ a V, F~a = −∇ (I.67) wobei V als Funktion der N Ortsvektoren ~r1 , . . . ,~rN zu betrachten ist. Unter den obigen Annahmen über die Kräfte ist die Summe " N # N X X X T +V ≡ Ta + Va,ext + Vab |~ra − ~rb | a=1 a=1 (I.68) 1≤a<b≤N aus allen kinetischen und potentiellen Energien eine Konstante der Bewegung, die Gesamtenergie des Systems. Dieses Ergebnis stellt den Energieerhaltungssatz für ein Mehrteilchensystem dar, und zwar Die Gesamtenergie eines Systems aus N Teilchen mit nur konservativen inneren und äußeren Kräften ist eine Erhaltungsgröße. (9) (I.69) Hier ist diese Notation noch überflüssig, denn Va,ext ist nur Funktion der Ortskoordinaten des a-ten Körpers. Dagegen hängt Vab von ~ra und ~rb ab, oder das in Gl. (I.66) definierte Potential V ist Funktion der Positionen aller Bestandteile des Systems, so dass die Präzisierung der Variablen, nach denen abgeleitet wird, dann nötig wird. 33 I.5 Mehrteilchensysteme Beweis: Einerseits gilt unter Verwendung der Bewegungsgleichung (I.50) N N N X dTa X ~p (t) d~p (t) X dT a = = · a = ~va (t) · F~a , dt dt m dt a=1 a=1 a=1 (I.70) mit ~va der Geschwindigkeit von Teilchen a. Andererseits gibt die Kettenregel i X h dV d ~ a V ~x1 (t), . . . , ~xN (t) · d~xa (t) . ∇ = V ~x1 (t), . . . , ~xN (t) = dt dt dt a=1 Der Term in eckigen Klammern ist genau das Negative der Kraft auf Teilchen a, vgl. Gl. (I.67), so dass N X dV =− F~a · ~va (t) (I.71) dt a=1 Insgesamt liefern Gl. (I.70) und (I.71) das gesuchte Ergebnis d(T +V )/dt = 0. 2 Bemerkung: Wenn einige der Kräfte nicht-konservativ sind, gilt Gl. (I.70) immer noch. Dagegen gilt Gl. (I.71) nicht mehr, denn nicht jede Kraft F~a sich aus einem Potential ableiten lässt. Spaltet man die Kräfte in einen konservativen und einen nicht-konservativen Anteil auf, und definiert man die gesamte potentielle Energie der ersteren, so findet man einfach, dass die Rate d(T +V )/dt der Änderung der Gesamtenergie gleich der gesamten Leistung der nicht-konservativen Kräfte ist: N X d F~a,diss. · ~va (t), (T + V ) = dt (I.72) a=1 wobei das hier verwendete Kürzel „diss.“ für dissipative Kraft steht, weil diese Kräfte zur nichtErhaltung der Energie, zu ihrer Dissipation, führen. In der Praxis wird die dissipierte Energie nicht vernichtet, sondern in eine andere „nichtmechanische“ Form umgewandelt, und zwar Wärme. Unter Berücksichtigung der letzteren bleibt die Gesamtenergie erhalten, entsprechend dem ersten Hauptsatz der Thermodynamik. I.5.4 b Virialsatz :::::::::::::::: Wie kurz gesehen wurde bleibt die Gesamtenergie T + V eines Mehrkörpersystems mit nur konservativen Kräfte erhalten. Dagegen sind die kinetische und potentielle Energien im allgemeinen nicht getrennt konstant, sondern wandeln sich ständig in einander um. Man kann aber noch eine Aussage über die zeitlichen Mittelwerte von T und V — oder genauer, im allgemeinen Fall, dem Gradienten von V — machen. Sei f eine Funktion einer reellen Variablen, und zwar der Zeit. Der zeitliche Mittelwert von f (t) wird als Z 1 τ hf it ≡ lim f (t) dt (I.73) τ →∞ τ 0 definiert, wobei es angenommen wird, dass der Limes des Integrals existiert. Unter Verwendung dieser Definition gilt den Virialsatz *N + X ~ a V · ~xa (t) . 2 hT i = ∇ (I.74) t a=1 t Beweis: Die Bewegungsgleichungen (I.50) geben N X a=1 ¨a (t) · ~xa (t) = ma ~x N X a=1 F~a · ~xa (t) = − N X ~ a V · ~xa (t) ∇ a=1 wobei die linke Seite noch als " N # N N X X X d ¨a (t) · ~xa (t) = ma ~x ma~x˙ a (t) · ~xa (t) − ma~x˙ a (t)2 dt a=1 a=1 a=1 geschrieben werden kann. Somit sind die zeitlichen Mittelwerte der rechten Seiten dieser Glei- 34 Newton’sche Mechanik chungen gleich. Dabei gilt unter Nutzung der Definition (I.73) * " N #+ " N # Z 1 τ d X d X ˙ ˙ ma~xa (t) · ~xa (t) = lim ma~xa (t) · ~xa (t) dt τ →∞ τ 0 dt dt a=1 a=1 t τ N 1X ˙ = lim ma~xa (t) · ~xa (t) . τ →∞ τ 0 a=1 Wenn die Produkte ~x˙ a (t) · ~xa (t) immer abgegrenzt bleiben, nimmt die Summe im letzten Term einen endlichen Werte an, so dass der Grenzwert Null ist. Somit ergibt sich * N + * N + X X 2 ˙ ~ − ∇a V · ~xa (t) = − ma~xa (t) . a=1 t a=1 t Nach trivialen Umschreibung ist dies genau das gesuchte Ergebnis (I.74). 2 Für abgeschlossene Systeme — d.h. Va,ext = 0 für alle Teilchen a — mit Wechselwirkungspotentialen der Form Vab |~rb − ~ra | = αab |~ra − ~rb |n (I.75) mit n ∈ Z und αab ∈ R für alle a, b ∈ {1, . . . , N } nimmt der Virialsatz eine einfachere Form an. In der Tat gelten ~ a |~rb − ~rc | = (δab − δac ) ~rb − ~rc ∇ |~rb − ~rc | und dVbc Vbc =n , d|~rb − ~rc | |~rb − ~rc | woraus unter Anwendung der Kettenregel " N # N N X X X dVbc ~ Vbc ~ ~ ∇a V = ∇a Vbc = ∇a |~rb − ~rc | = n (~rb − ~rc )(δab − δac ) d|~rb − ~rc | |~rb − ~rc |2 b,c=1 b,c=1 b,c=1 folgt. Beim Durchführen des (Skalar)Produkts mit ~ra und der Summe über a führen die Terme (δab − δac )~ra zu ~rb − ~rc , und daher zu N X N X ~ a V · ~ra = n Vbc = 2nV. ∇ a=1 b,c=1 Insgesamt vereinfacht sich der Virialsatz (I.74) zu 2 hT it = n hV it . (I.76a) Daraus folgt dann für die Gesamtenergie — die wegen ihrer Konstanz natürlich gleich ihrem zeitlichen Mittelwert ist n 2 E = hEit = hT it + hV it = + 1 hV it = + 1 hT it . (I.76b) 2 n Ein erstes wichtiges Anwendungsbeispiel ist das von Massenpunkten, die unter einander über das Newton’sche Gravitationspotential Vab ∝ 1/|~ra −~rb | wechselwirken, entsprechend Gl. (I.75) mit n = −1. Diese Massenpunkte können z.B. die Sterne eines Kugelsternhaufens oder die Mitglieder eines Galaxienhaufens darstellen.(10) In diesem Fall lautet der Virialsatz 2 hT it = − hV it (I.77a) und die Gesamtenergie 1 hV it = − hT it . (I.77b) 2 Da hT it genau wie T positiv ist, gilt E < 0 — wie wir im Fall N = 2 in § I.6.3 wieder finden werden. E= (10) . . . unter der Annahme, dass relativistische Effekte keine Rolle spielen. 35 I.5 Mehrteilchensysteme Ein zweites Beispiel ist das von gekoppelten harmonischen Oszillatoren, d.h. mit quadratischen Potentialen Vab ∝ (~ra − ~rb )2 , entsprechend dem Fall n = 2. Dann kommen hT it = hV it und E = 2 hT it . (I.78) Da dieses Problem (zumindest prinzipiell) analytisch lösbar ist, indem die Oszillatoren entkoppelt werden können (vgl. § III.2.2), kann dieses Ergebnis direkt wiedergefunden werden. Eigentlich gelten nämlich die zwei Gleichungen schon für einen einzelnen harmonischen Oszillator. I.5.5 Schwerpunktsystem ∗ bezeichnet, Sei Σ ein Mehrteilchensystem. Als Schwerpunktsystem wird ein Bezugssystem BΣ in welchem der Schwerpunkt von Σ ruht, und welches gegenüber eines Inertialsystems BI nicht ∗ mit dem rotiert. Um beide Bedingungen zu erfüllen, nimmt man oft ein Koordinatensystem in BΣ Schwerpunkt von Σ als Ursprungspunkt und den Achsen parallel zu denen eines Koordinatensystems von BI . ∗ gemessenen Größen mit Sternchen gekennzeichnet: Ortsvektor Hiernach werden die bezüglich BΣ ∗ ∗ ~r , Teilchenbahnkurven ~xa (t), Impulse ~pa∗ (t), usw. Bemerkung: Das Schwerpunktsystem ist nicht unbedingt ein Inertialsystem! Dies gilt nur bei abge- schlossenen Mehrteilchensystemen, die keiner resultierenden äußeren Kraft unterliegen. In solchen Fällen wird der Schwerpunkt laut der Bewegungsgleichung (I.60a) bzw. dem Schwerpunktsatz (I.60b) nicht beschleunigt. ∗ Aus Gl. (I.53), abgeleitet nach der Zeit, und der Tatsache, dass der Schwerpunkt bezüglich BΣ ruht, folgt sofort für den Gesamtimpuls des Mehrteilchensystems P~ ∗ (t) ≡ N X ~pa∗ (t) = ~0. (I.79) a=1 Diese Beziehung kann auch als Definition des Schwerpunktsystems — das auf Englisch öfter centerof-momentum frame genannt wird, wobei „momentum“ = Impuls — angesehen werden. ∗ so gewählt, dass der Schwerpunkt von Σ im Nullpunkt Wird das Koordinatensystem von BΣ ~ ∗ (t) = 0 zu jeder Zeit t. sitzt, so gilt automatisch X ~ ∗ eines Mehrteilchensystems Σ bezüglich des zugehörigen SchwerpunktDer Gesamtdrehimpuls L systems(11) N X ∗ ~ L (t) ≡ ~xa∗ (t) × ~pa∗ (t) (I.80) a=1 wird Eigendrehimpuls des Systems Σ genannt. Wiederum wird die gesamte kinetische Energie be∗ züglich BΣ N X ~pa∗2 ∗ T ≡ (I.81) 2ma a=1 als innere kinetische Energie des Systems bezeichnet. Sei jetzt B ein beliebiges Bezugssystem mit der einzigen Einschränkung, dass es gegenüber dem Schwerpunktsystem BΣ∗ nicht rotiert. Es gelten dann zwei nach König(i) genannte Ergebnisse, und zwar (11) (i) . . . noch besser, relativ zum eigenen Schwerpunkt, indem der letztere als Ursprungspunkt genommen wird. J. S. König, 1712–1757 36 Newton’sche Mechanik ~ des Systems Σ relativ zu einem festen Punkt Theorem (1. Satz von König): Der Gesamtdrehimpuls L ~ ∗ des Systems und dem in B, z.B. dem Nullpunkt, ist die Summe aus dem Eigendrehimpuls L Drehimpuls bezüglich B des Schwerpunkts von Σ, versehen mit der Gesamtmasse M : ~ dX(t) ~ ~ ∗ (t) + X(t) ~ L(t) =L × P~ (t) mit P~ (t) = M dt (I.82) ~ und X(t) der Bahnkurve des Schwerpunkts von Σ relativ zu B. Theorem (2. Satz von König): Die gesamte kinetische Energie T des Systems Σ relativ zu B ist die Summe aus der inneren kinetischen Energie T ∗ des Systems und der kinetischen Energie bezüglich B des Schwerpunkts von Σ, versehen mit der Gesamtmasse M : T (t) = T ∗ (t) + P~ (t)2 . 2M (I.83) Der Beweis dieser zwei Resultate wird der Leserin gelassen. Diese Sätze bedeuten, dass die Bewegung eines System aus N Körpern in zwei unabhängige Anteile zerlegt werden kann, und zwar in die „innere“ Bewegung der Teilchen relativ zum Schwerpunkt des Systems und die „globale“ (Translations-)Bewegung des Schwerpunkts durch den Raum. Dementsprechend finden theoretische Untersuchungen des Systems meistens in seinem Schwerpunktsystem statt. I.6 Zwei-Körper-Systeme Der Formalismus des vorigen Abschnitts kann natürlich auf den Fall eines Systems aus zwei Körpern angewandt werden. In diesem Fall treten aber einige wichtigen Vereinfachungen aus, beginnend bei den Bewegungsgleichungen, die sich oft entkoppeln (§ I.6.1). Somit lassen sich verschiedene Probleme ziemlich ausführlich behandeln: harmonisch gekoppelte Punktmassen (§ I.6.2), Körper in Newton’scher Gravitationswechselwirkung (§ I.6.3), oder die Streuung zweier Teilchen (§ I.6.4). I.6.1 Separation der Bewegungsgleichungen I.6.1 a Variablen Genau wie in § I.5.1 b wird die Schwerpunktkoordinate definiert durch :::::::::::::::: m1 ~x1 (t) + m2 ~x2 (t) ~ X(t) ≡ . m1 + m2 (I.84a) Da es nur zwei Körper gibt, kann man auch eine Relativkoordinate einführen: ~x(t) ≡ ~x1 (t) − ~x2 (t). (I.84b) ~ Bei dem Übergang von den Variablen ~x1 (t), ~x2 (t) zu den neuen Variablen X(t), ~x(t) handelt es sich um eine lineare Transformation. Die entsprechende Rücktransformation lautet m1 m2 ~ ~ ~x1 (t) = X(t) + ~x(t), ~x2 (t) = X(t) − ~x(t), (I.84c) m1 +m2 m1 +m2 wie sich leicht nachprüfen lässt. Für die Beschreibung der Bewegung wird es sich lohnen, die reduzierte Masse µ≡ einzuführen. m1 m2 m1 +m2 (I.85) 37 I.6 Zwei-Körper-Systeme I.6.1 b Bewegungsgleichungen ::::::::::::::::::::::::::::::: Aus den allgemeinen Bewegungsgleichungen [vgl. Gl. (I.50)] d2 ~x1 (t) = F~1,ext + F~2→1 , dt2 d2 ~x2 (t) = F~2,ext + F~1→2 m2 dt2 m1 ~ lassen sich Entwicklungsgleichungen für X(t) und ~x(t) herleiten. Erstens liefert eine Summe die Bewegungsgleichung des Schwerpunkts, und zwar (m1 +m2 ) ~ d2X(t) = F~1,ext + F~2,ext dt2 (I.86a) unabhängig von den inneren Kräften, in Übereinstimmung mit dem allgemeinen Ergebnis (I.60). Andererseits ergibt sich nach Division jeder Gleichung durch die darin auftretende Masse und anschließender Subtraktion F~1,ext F~2,ext F~2→1 F~1→2 d2 ~x(t) − + − , = 2 dt m1 m2 m1 m2 d.h. unter Verwendung des dritten Newton’schen Axioms F~1→2 = −F~2→1 und der reduzierten Masse (I.85) F~1,ext F~2,ext F~2→1 d2 ~x(t) = . (I.86b) − + dt2 m1 m2 µ Im Allgemeinen hängt diese Gleichung noch von den äußeren Kräften ab. Sei jetzt angenommen, dass das Zwei-Körper-System abgeschlossen ist, F~a,ext = ~0 für a = 1, 2. Dann vereinfachen sich die Bewegungsgleichungen (I.86) zu ~ d2X(t) = ~0, (I.87a) dt2 entsprechend der Erhaltung des Gesamtimpulses (I.60c) für ein System ohne äußere Kräfte, und d2 ~x(t) = F~2→1 . (I.87b) dt2 Dabei hängt die Kraft auf der rechten Seite a priori noch von den Positionen ~x1 (t), ~x2 (t) der beiden ~ Körper — d.h. äquivalent von X(t) und ~x(t) — und von ihren Geschwindigkeiten ab. Falls die Zweikörperkraft F~2→1 nur Funktion von der Relativkoordinate ~x(t) und von ihrer Zeitableitung ist, dann ist Gl. (I.87b) die Bewegungsgleichung eines einzelnen fiktiven Massenpunktes mit der reduzierten Masse µ. Somit wird das ursprüngliche Zwei-Körper-Problem in zwei entkoppelte einfachere Ein-Körper-Probleme transformiert, und zwar einerseits für den Schwerpunkt, andererseits für den fiktiven Massenpunkt. Ist die Kraft F~2→1 nun zentral, d.h. parallel zu ~x1 (t)−~x2 (t), dann bewegt sich dieser Massenpunkt in einem Zentralkraftfeld mit Kraftzentrum in ~x2 (t). In diesem Fall ist der Drehimpuls des fiktiven Teilchens ~` = ~x(t) × µ d~x(t) dt eine Erhaltungsgröße, und man spricht von einem Zentralkraftproblem. In den folgenden § I.6.2–I.6.4 werden wir Beispiele solcher Zentralkraftprobleme sehen, im Fall ~ (r). konservativer Kraftfelder, F~2→1 (~r1 −~r2 ) ≡ F~ (~r) = −∇V µ Bemerkung: Wenn eine der Massen viel größer als die andere ist, z.B. m2 m1 , dann gelten ~ X(t) ' ~x2 (t) — d.h. die Position des Schwerpunkts stimmt fast mit jener des schweren Partners ~ überein —, ~x1 (t) ' X(t) + ~x(t) und µ ' m1 — d.h. die Eigenschaften des fiktiven Teilchens sind ähnlich denen des leichten Körpers. 38 Newton’sche Mechanik I.6.2 Gekoppelte Punktmassen Betrachten wir als erstes Beispiel zwei Massen m1 , m2 , die über eine Feder gekoppelt sind. Es wird angenommen, dass die Bewegung der Massen eindimensional entlang der horizontalen x-Achse bleibt, und dass es keine äußere Kraft gibt. m1 k QPPPPPPR m2 - x Abbildung I.7 – Gekoppelte Massen Die Feder wird als ein harmonischer Oszillator modelliert, d.h. die dadurch verursachte Kraft ist proportional zur Auslenkung aus einer Ruhelänge. Somit lautet die Kraft auf Masse 1 F~2→1 = k (x2 − x1 − `0 )~ex (I.88) mit k der Federkonstante und `0 der Ruhelänge der Feder, und x1 , x2 den Positionen der Massen — die als Punktmassen zu betrachten sind. Die Bewegungsgleichungen für x1 (t), x2 (t) lauten d2 x2 (t) = −k x2 (t) − x1 (t) − `0 , (I.89) 2 dt wobei das dritte Newton’sche Gesetz benutzt wurde, um die Kraft F~1→2 auszudrücken. Das Addieren der beiden Gleichungen führt zur Zeitunabhängigkeit der Schwerpunktkoordinate X(t) — wie zu erwarten war! Aus den Gl. (I.89) folgt noch m1 d2 x1 (t) = k x2 (t) − x1 (t) − `0 , 2 dt m2 d2 [x1 (t)−x2 (t)] = k x2 (t) − x1 (t) − `0 , 2 dt d.h., für die Relativkoordinate x(t) ≡ x1 (t)−x2 (t) µ d2 x(t) = −k x(t) + ` . (I.90) 0 dt2 Das ist die Bewegungsgleichung für einen einzelnen Massenpunkt mit der reduzierten Masse µ, der an einem Kraftzentrum harmonisch gebunden ist. p Die Lösung ist dann der Form x(t) = −`0 + A cos(ωt + ϕ) mit ω ≡ k/µ und A, ϕ zwei Konstanten, die durch Anfangsbedingungen festgestellt sind. Daraus erhält man über die Rücktransformation (I.84c) die Abhängigkeiten x1 (t) und x2 (t). µ I.6.3 Kepler-Problem Die Newton’sche Gravitationskraft zwischen zwei Massenpunkten mit Massen m1 , m2 ist eine konservative Zentralkraft, gegeben durch GN m1 m2 ~x ~ (|~x|) F~ (|~x|) = − = −∇V |~x|2 |~x| mit dem Potential V (|~x|) = − GN m1 m2 . |~x| (I.91a) (I.91b) Dabei bezeichnet ~x der Abstandsvektor zwischen den Massen und GN die Newton’sche Gravitationskonstante, GN ' 6, 674 · 10−11 m3 kg−1 s−2 . 39 I.6 Zwei-Körper-Systeme Das Ziel in diesem Abschnitt ist die Untersuchung der einfachsten möglichen Bewegungen, zu denen dieses Potential führen kann, und insbesondere die Herleitung der drei durch Kepler(j) experimentell ermittelten Gesetze. Zu diesem Zweck wird die Bewegung zweier Massenpunkte betrachtet, die über das Potential (I.91b) miteinander wechselwirken, während sie keiner äußeren Kraft unterliegen. Dieses Fragestellung wird als Kepler-Problem bezeichnet. I.6.3 a Vorbereitungen :::::::::::::::::::::: In Übereinstimmung mit den allgemeinen Ergebnissen des § I.6.1 kann man die triviale Bewegung des Schwerpunkts von der mehr interessanten Relativbewegung separieren, wobei die letztere die Zeitänderung der Relativkoordinate ~x für ein fiktives Teilchen mit der reduzierten Masse µ ist. Da es sich bei dem Newton’schen Potential (I.91b) um ein Zentralpotential handelt, ist der Drehimpuls ~` für die Relativbewegung erhalten. Da sowohl ~x(t) als ~x˙ (t) senkrecht auf ~` sind, bleibt die Bahnkurve in einer Ebene senkrecht auf ~` — der sog. Ekliptik. Dementsprechend lohnt es sich, ein Koordinatensystem zu wählen, in dem die Richtung von ~` entlang einer der Achse ist, z.B. der z-Achse. Die Wahl der Koordinaten in der Bewegungsebene bleibt noch offen. Man kann zunächst feste kartesische Basisvektoren ~ex , ~ey einführen, und dementsprechend die Bahnkurve durch x(t), y(t) parametrisieren. Da das Wechselwirkungspotential (I.91b) nur vom Abstand r(t) = |~x(t)| zum Kraftzentrum abhängt, ist es sinnvoll, ein Koordinatensystem — genauer eine Parametrisierung der Bahnkurve — zu wählen, in dem dieser Abstand eine direkte Rolle spielt. Dazu dient noch der Winkel ϕ(t) der Relativkoordinate relativ zu einer festen Richtung, z.B. zur x-Achse, zur Charakterisierung von ~x(t). Somit lautet die Relativkoordinate ~x(t) = r(t)~er (t), (I.92) wobei die instantane Richtung des Einheitsvektors ~er (t) in Radialrichtung von der Position des (fiktiven) bewegten Körpers und damit indirekt von der Zeit abhängt: bezüglich der Basisvektoren eines festen kartesischen Koordinatensystems gilt ~er (t) = cos ϕ(t)~ex + sin ϕ(t)~ey . (I.93) Man bezeichnet mit ~eϕ (t) einen orthogonal auf ~er (t) stehenden Einheitsvektor in der Bewegungsebene ~eϕ (t) = − sin ϕ(t)~ex + cos ϕ(t)~ey , (I.94) so dass ~er (t), ~eϕ (t) und ~ez (t) ≡ ~er (t)×~eϕ (t) die Basisvektoren eines mitbewegten Koordinatensystems bilden, wobei ~ez (t) hier eigentlich zeitunabhängig ist. Die Ableitung der Gl. (I.93) nach der Zeit gibt d~er (t) dϕ(t) dϕ(t) =− sin ϕ(t)~ex + cos ϕ(t)~ey = ϕ̇(t)~eϕ (t). dt dt dt (I.95) Somit lautet die Relativgeschwindigkeit, unter Verwendung der Kettenregel beim Ableiten der Gl. (I.92) d~x(t) dr(t) d~er (t) = ~er + r(t) = ṙ(t)~er + r(t) ϕ̇(t)~eϕ (t). (I.96) dt dt dt Schließlich ist der Drehimpuls der Relativbewegung gegeben durch ~`(t) ≡ ~x(t) × µ~x˙ (t) = µr(t)2 ϕ̇(t)~ez mit konstanter Richtung und konstantem Betrag ` ≡ ~`(t) = µr(t)2 ϕ̇(t). (j) J. Kepler, 1571–1630 (I.97) (I.98) 40 Newton’sche Mechanik I.6.3 b Zweites Kepler’sches Gesetz :::::::::::::::::::::::::::::::::::: In dem Intervall zwischen zwei sukzessiven Zeitpunkten t und t + dt ändert sich der Polarwinkel ϕ(t) der Bahnkurve um dϕ ' ϕ̇(t) dt. Die Ortsvektoren ~x(t) und ~x(t+dt) und die Bahnkurve grenzen ein Flächenelement ab, dessen Flächeninhalt annähernd durch dS = 1 r(t) r(t) dϕ = 2 t + dt r(t) dϕ t dϕ r(t)2 dϕ(t) dt 2 dt r(t) Abbildung I.8 gegeben ist. Ersetzt man die Zeitableitung ϕ̇(t) mithilfe der Gl. (I.98), so kommt der „Flächensatz“ ` dS = = Konstante. dt 2µ (I.99) d.h. (zweites Kepler’sches Gesetz ) Der Ortsvektor (von dem Stern zum Planeten) überstreicht in gleichen Zeiten gleich große Flächen. (I.100) Dabei beziehen sich die Worte zwischen Klammern auf den historischen durch Kepler betrachteten Fall eines Planeten um einen viel schwereren Stern, m2 m1 . Im Fall zweier (ungefähr) gleich schweren Körper, wie z.B. die zwei Sterne eines Doppelsternsystems, geht die Relativkoordinate von einem Stern zum anderen. Bemerkung: In der Herleitung dieses Ergebnisses wurde die Form des Potentials V (r) nicht benutzt, d.h. der Flächensatz gilt für jedes Zentralkraftproblem. I.6.3 c Bahnkurve. Erstes und drittes Kepler’sches Gesetz Die Gesamtenergie der Relativbewegung ist 1 d~x(t) 2 E = T (t) + V (t) = µ + V r(t) , 2 dt ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: d.h. unter Verwendung der expliziten Form (I.96) der Geschwindigkeit µ E= ṙ(t)2 + r(t)2 ϕ̇(t)2 + V r(t) . 2 Da die Newton’sche Gravitationskraft konservativ ist, ist diese Gesamtenergie erhalten. Mithilfe der Gl. (I.98) kann man die Zeitableitung ϕ̇(t) durch `/µr(t)2 ersetzen, so dass die totale Energie sich noch als µ `2 E = ṙ(t)2 + + V (r) (I.101) 2 2µr(t)2 umschreiben lässt, unabhängig von der Winkelvariablen ϕ. Dabei ist ṙ(t) die radiale Geschwindigkeit. Betrachtet man dementsprechend die rechte Seite von Gl. (I.101) als totale Energie für die eindimensionale Bewegung in Radialrichtung, so ist der erste Term die zugehörige kinetische Energie, während die zwei letzten ein effektives Potential Veff (r) ≡ V (r) + darstellen. Dann gilt ṙ(t)2 = `2 2µr2 2 E − Veff (r) . µ (I.102) (I.103) Je nach den relativen Werten von der Gesamtenergie E und dem minimalen Wert Veff,min < 0 des effektiven Potentials kommen drei verschiedene Möglichkeiten vor (vgl. auch Abb. I.9): 41 I.6 Zwei-Körper-Systeme `2 2µr2 E>0 • rmin r Veff (r) rmax • rmin Veff,min < E < 0 • E < Veff,min V (r) Abbildung I.9 – Effektives Potential Veff (r) für das Kepler-Problem. • Für E < Veff,min ist die rechte Seite von Gl. (I.103) immer negativ, so dass keine Lösung der Gleichung mit reeller Radialgeschwindigkeit existieren kann: diesen mathematischen Werten von E und ` entspricht keine physikalisch erlaubte Lösung des Kepler-Problems. • Für Veff,min < E < 0 kann die rechte Seite von Gl. (I.103) nicht-negativ sein, und zwar für Werte rmin ≤ r ≤ rmax , wobei rmin , rmax die zwei Lösungen der Gleichung Veff (r) = E sind. Da rmax endlich ist, bleibt das fiktive Teilchen immer in endlichem Abstand vom Kraftzentrum, und ist somit daran „gebunden“. Bei den Abständen rmin und rmax verschwindet die Radialgeschwindigkeit ṙ — die eigentlich ihr Vorzeichen ändern wird: dabei handelt es sich um Umkehrpunkte. Im Spezialfall E = Veff,min ist V (r) = E für einen einzigen Wert von r. Dazu gibt Gl. (I.103) ṙ(t) = 0, d.h. r bleibt konstant: die entsprechende Bahnkurve ist ein Kreis. • Für E ≥ 0 hat die Gleichung Veff (r) = E eine einzige Lösung rmin , und die rechte Seite von Gl. (I.103) bleibt positiv für r > rmin . Somit geht die Bahnkurve des fiktiven Teilchens unendlich weit weg vom Kraftzentrum: das Teilchen ist „ungebunden“. Für die obige Fallunterscheidung war die genaue Form des effektiven Potentials, und daher von V (r), nicht nötig, um die Existenz oder nicht-Existenz von Lösungen festzustellen. Die exakten Bahnkurven entsprechend den verschiedenen Fällen hängen aber natürlich von V (r) ab. Ausgehend aus Gl. (I.103) kann man den Verlauf der Bahnkurve bestimmen.(12) Einerseits gilt unter Verwendung der Kettenregel dr(t) dr(ϕ) dϕ(t) dr(ϕ) ` = = , dt dϕ dt dϕ µr2 wobei Gl. (I.98) benutzt wurde. Andererseits ist ṙ(t) auch durch Gl. (I.103) gegeben. Betrachtet man eine Lösung mit positiver Radialgeschwindigkeit, so kann man schreiben dr(ϕ) µr2 r2 p = ṙ(t) = 2µ[E − Veff (r)] . dϕ ` ` (12) Eine alternative Herleitung wird im Anhang I.A zu diesem Kapitel vorgestellt. 42 Newton’sche Mechanik Das heißt, ` dr ` dr p = p 2 2µ[E − Veff (r)] r 2µ[E − V (r)] − `/r2 und nach formeller Integration beider Seiten dieser Gleichung Z r ` dr0 p ϕ − ϕ0 = , 02 2µ[E − V (r 0 )] − `2 /r 02 r0 r dϕ = r2 (I.104) wobei r0 > rmin und r < rmax sein müssen. Im Fall des Newton’schen Potentials V (r) = −α/r mit α = GN m1 m2 kann die Integration explizit durchgeführt werden. Dabei ist Z r ` dr0 p ϕ − ϕ0 = . 02 2µ(E + α/r 0 ) − `2 /r 02 r0 r Eine erste Substitution u0 = 1/r0 , d.h. du0 = −dr0 /r02 , gibt zunächst Z u Z u du0 ` du0 p p =− . ϕ − ϕ0 = − 2µ(E + αu0 ) − `2 u02 2µE/`2 + (2µα/`2 )u0 − u02 u0 u0 Der Term unter der Wurzel im Nenner ist der Form a + bu0 − u02 = ap+ b2/4 − (u0 − b/2)2 , mit a = 2µE/`2 und b = 2µα/`2 . Eine weitere Substitution v 0 = (u0 − b/2)/ a + b2/4 liefert dann Z u Z v du0 dv 0 u − b/2 p √ = = − arccos(v) = − arccos p . 1 − v 02 a + b2 /4 − (u0 − b/2)2 a + b2/4 Somit erhält man " 2/r − 2µα/`2 ϕ − ϕ0 = arccos p 8µE/`2 + 4µ2 α2 /`4 #r . r0 Mit der Wahl der Anfangsbedingung ϕ = ϕ0 bei r = r0 ergibt sich 1/r − µα/`2 1/r − µα/`2 p cos ϕ = p = . 2µE/`2 + µ2 α2 /`4 (µα/`2 ) 2E`2 /µα2 + 1 Mit den Definitionen s ≡ 1+ 2E`2 µα2 und p ≡ `2 µα (I.105a) wird die φ-r-Abhängigkeit zu cos ϕ = p/r − 1, d.h. r= p . 1 + cos ϕ (I.105b) Das ist die Gleichung in Polarkoordinaten eines Kegelschnitts mit Exzentrizität und Parameter p. Genau wie in der Diskussion der Abb. I.9 gibt es unterschiedliche Fälle je nach dem Wert der Energie E. Dafür kann man schon bemerken, dass das effektive Potential −α/r + `2 /2µr2 minimal für r0 = `2 /µα ist, wo Veff den Wert −µα2 /2`2 ≡ Veff,min annimmt. • Für Veff,min ≤ E < 0 gilt laut Gl. (I.105a) 0 ≤ < 1; d.h., die Bahnkurve ist eine Ellipse — ein Kreis falls = 0, entsprechend E = Veff,min . Dies bildet das erste Kepler’sche Gesetz : Die Planeten bewegen sich auf elliptischen Bahnen (mit der Sonne in einem gemeinsamen Brennpunkt). (I.106) 43 I.6 Zwei-Körper-Systeme In einem Doppelsternsystem folgt jeder Stern einer elliptischen Bahnkurve mit dem anderen Stern in einem Brennpunkt, während die Position ihres Schwerpunkts unverändert bleibt. b • a ϕ • Abbildung I.10 – Ellipse mit Exzentrizität = 0, 6; die Punkte sind die Brennpunkte. √ Die große Halbachse der Ellipse ist a = p/(1 − 2 ), die kleine Halbachse b = p/ 1 − 2 . Die durch die Ellipse abgeschlossene Oberfläche ist S = πab. Andererseits ist diese Fläche über den Flächensatz (I.99) mit der Umlaufzeit T verknüpft: S = (`/2µ)T . Somit gilt T2= 4µ2 2 4π 2 µ2 2 2 4π 2 µ2 p 3 4π 2 µ 3 S = a b = a = a . `2 `2 `2 α Mit den Ausdrücken der reduzierten Masse und der Konstante α = GN m1 m2 ergibt sich schließlich 4π 2 T2= a3 . GN (m1 +m2 ) Dies entspricht dem dritten Kepler-Gesetz : Die Quadrate der Umlaufbahnen der Planeten sind proportional zur dritten Potenz der großen Bahnhalbachse. (I.107) Auf der Parametrisierung (I.105b) kann sofort den bei ϕ = 0 bzw. ϕ = π stattfindenden minimalen bzw. maximalen Abstand rmin = p/(1+) bzw. rmax = p/(1−) zwischen Planeten und Stern lesen. • Für E = 0 ist die Exzentrizität der Bahnkurve gleich 1, so dass diese eine Parabel ist. • Für E > 0 ist gemäß Gl. (I.105a) die Exzentrizität größer als 1, > 1, d.h. die Bahnkurve ist eine Hyperbel (Abb. I.11). Wie aus der Diskussion des effektiven Potentials erwartet war, ist die Bewegung räumlich unbegrenzt, und r(ϕ) wächst unendlich groß wenn cos ϕ von oben gegen −1/ geht. Dagegen wird für ϕ = 0 der minimale Abstand zum Brennpunkt rmin = p/(1 + ) erreicht. Bemerkung: In § I.5.4 b wurde argumentiert, dass die Gesamtenergie eines Systems aus Teilchen, die über die Newton’sche Gravitationskraft unter einander wechselwirken, negativ ist, s. Gl. (I.77). Dies wird durch die obigen Ergebnisse nicht versprochen, denn die Lösungen mit nicht-negativer Energie sind ungebunden, und somit eine Annahme des Virialsatzes nicht erfüllen. Bisher wurde nur das anziehende Newton’sche Potential (I.91b) betrachtet, entsprechend einem positiven Wert von α = GN m1 m2 . Man kann auch die Bahnkurven mit dem abstoßenden Potential 44 Newton’sche Mechanik • ϕ Abbildung I.11 – Hyperbel mit Exzentrizität = 1, 6 für ein anziehendes Potential. V (r) = −α/r mit α < 0 betrachten, was insbesondere dem elektrostatischen Coulomb-Potential zwischen zwei positiven oder zwei negativen Punktladungen entspricht. Wiederholt man die Herleitung zwischen Gl. (I.104) und (I.105) für den Fall α < 0, so findet man, dass die möglichen Bahnkurven wieder Kegelschnitte sind. Dabei treten die abgeschlossenen Trajektorien (Ellipse, Kreis) aber nicht mehr auf, da es keine gebundene Zustände des Zwei-KörperSystems gibt — das effektive Potential Veff (r) ist immer positiv und nimmt monoton mit r ab —, sondern nur ungebundene. Da Veff (r) > 0 für alle Abstände r, gibt es auch keine Bahnkurve mit E = 0, d.h. keine Parabel. Dagegen gibt es Hyperbeln ( > 1), wobei man aufpassen soll, das der Parameter p jetzt negativ ist. Der minimale Abstand ist somit rmin = |p|/( − 1) und wird für ϕ = π erreicht (Abb. I.12). Wiederum wird r unendlich groß für cos ϕ → (−1/) von unten. ϕ • Abbildung I.12 – Hyperbel mit Exzentrizität = 1, 6 für ein abstoßendes Potential. 45 I.6 Zwei-Körper-Systeme I.6.4 Streuung Die am Ende des § I.6.3 gefundenen unbegrenzten Bahnkurven entsprechen (fiktiven) Massenpunkten, die zur Zeit t → −∞ unendlich weit weg vom Kraftzentrum sind, sich daran annähern, und dann weg fliegen, so dass sie für t → ∞ wieder unendlich entfernt vom Kraftzentrum sind. Ein solcher Prozess heißt auch Stoß oder Streuung. Hiernach wird die Streuung eines Massenpunktes mit reduzierten Masse µ an einem Streuzentrum betrachtet, entsprechend den Bewegungsgleichungen, die aus der in § I.6.1 b dargestellten Separation folgen — und die in der Tat den Stoß eines physikalischen Massenpunktes an einem anderen modellieren. Der Prozess wird in einem Bezugssystem beschrieben, in welchem das Streuzentrum ruht. Dazu wird ein Koordinatensystem gewählt, in dessen Nullpunkt O sich das Streuzentrum befindet. In § I.6.4 a werden zunächst ein paar Größen eingeführt, die zur Kennzeichnung einer Streuung dienen. Der Zusammenhang zwischen einigen dieser Größen wird durch die Dynamik des Stoßes bestimmt, d.h. durch die für die Streuung relevante Wechselwirkung, wie in § I.6.4 b erklärt und an einem Beispiel illustriert wird. Falls der Streuprozess mehrmals stattfindet, jedoch mit (leicht) unterschiedlichen Anfangsbedingungen, werden die Wahrscheinlichkeiten für die möglichen Endzuständen durch Wirkungsquerschnitte charakterisiert (§ I.6.4 c). I.6.4 a Geometrische Grundbegriffe der klassischen Streutheorie :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Es wird angenommen, dass der Einfluss des Streuzentrums auf den gestreuten Massenpunkt vernachlässigbar für t → ∓∞ ist, d.h. lange vor oder nach dem Stoß. Das heißt wiederum, dass die Kraft zwischen den zwei physikalischen Massenpunkten für unendliche große Abstände verschwinden muss. Mathematisch muss das zugehörige Potential(13) V (~r) ebenfalls für große Abstände Null werden: lim V (~r) = 0. (I.108) |~r|→∞ ~p au s Lange vor oder nach dem Stoß ist der gestreute Massenpunkt annähernd frei, so dass er sich dann geradlinig bewegt: sei ~pein bzw. ~paus sein Impuls für t → −∞ bzw. t → +∞, wobei das Kürzel ein bzw. aus für „einfallendes“ bzw. „auslaufendes“ Teilchen steht. Wegen der Wechselwirkung mit dem Streuzentrum wird sich die Flugrichtung des gestreuten Massenpunktes im Allgemeinen ändern. Der Winkel zwischen den asymptotischen Flugrichtungen heißt Streuwinkel und wird hiernach mit θ bezeichnet, wie in Abb. I.13 zu sehen ist. ~pein θ φ b Abbildung I.13 – Charakteristische Größen zur Beschreibung einer Streuung. Eine weitere geometrische Größe, die in klassischer Streutheorie einen bestimmten Streuprozess charakterisiert, ist der Stoßparameter b. Dabei handelt es sich um den minimalen Abstand des einfallenden Massenpunktes zum Streuzentrum für den fiktiven Fall, wo es sich geradlinig bewegen würden, statt abgelenkt zu werden, d.h. bei ausgeschalteter Wechselwirkung, wie in Abb. I.13 zu sehen ist. (13) ... unter der versteckten Annahme, dass die Kraft konservativ ist! 46 Newton’sche Mechanik Sei angenommen, dass die Flugrichtung des einfallenden Teilchens bekannt ist — was in einem Streuexperiment der Fall ist. In der transversalen Ebene senkrecht zu dieser Richtung kann man eine Referenzrichtung festlegen, womit sich Winkel φ relativ dazu definieren lassen. Somit wird die auslaufende Flugrichtung neben θ auch durch einen Azimutwinkel φaus charakterisiert. Wiederum kann der einfallenden Flugrichtung einen Winkel φein assoziiert werden; stattdessen wird der entsprechende Azimutwinkel dem Stoßparameter zugeordnet, der somit zu einem (zweidimensionalen) Vektor ~b, mit Betrag b und Winkel φein , in der transversalen Ebene wird. Bezeichnet man dann den Azimutwinkel der auslaufenden Flugrichtung mit φ anstatt φaus , so besteht der Zweck der klassischen Streutheorie darin, die Beziehung zwischen den Winkeln (θ, φ) und dem Stoßparameter ~b festzulegen. Dabei charakterisieren die ersteren bzw. der letztere das auslaufende Teilchen, d.h. den Endzustand, bzw. den Anfangszustand, und zwar das einlaufende ~ ~ Teilchen. Somit werden im Allgemeinen Funktionen θ(b), φ(b) gesucht. Bemerkung: In einem quantenmechanischen Rahmen verliert der Begriff des Stoßparameters, genau wie jener der Bahnkurve, an Bedeutung. I.6.4 b Streuung an einem Zentralpotential ::::::::::::::::::::::::::::::::::::::::::: Im Fall der Streuung an einem Zentralpotential — d.h. falls die Kraft zwischen den zwei wechselwirkenden Massenpunkten zentral ist — liegt die Bahnkurve des gestreuten Massenpunkts in einer Ebene, der Streuebene. Dann ist der Azimutwinkel des auslaufenden Flugrichtung automatisch gleich jenem des Stoßparameters, und die einzige festzulegende Abhängigkeit ist die des Streuwinkels θ, der eigentlich nur vom Betrag b abhängt.(14) Die Winkelhalbierende der zwei Asymptoten zur Bahnkurve des gestreuten Massenpunkts ist eine Symmetrieachse der Bahnkurve. Sei α der Winkel zwischen dieser Winkelhalbierenden und einer der Asymptoten. Dann gilt automatisch 2α + θ = π, (I.109a) vgl. Abb. I.14 α α θ ~rmin ϕθ Abbildung I.14 – Definition einiger Winkel. Wiederum ist der Schnittpunkt zwischen Trajektorie und der Winkelhalbierenden genau der Punkt des minimalen Abstands rmin zwischen Bahnkurve und Streuzentrum. Unter Verwendung der gleichen Parametrisierung r(ϕ) der Bahnkurve wie in § I.6.3 c wird dieser Punkt für ϕ = π erreicht, während die Asymptote für t → +∞ dem Winkel ϕ = ϕθ entspricht, wobei (Abb. I.14) ϕθ = π − α. (14) (I.109b) Dies folgt aus der Kugelsymmetrie des Zentralpotentials, das nur von der Abstand r = |~r| vom Streuzentrum abhängt. 47 I.6 Zwei-Körper-Systeme Für diesen Wert des Winkels ist der gestreute Massenpunkt unendlich weit vom Streuzentrum. Somit liefert Gl. (I.104)(15) Z r ` dr0 p π − ϕθ = , (I.110) 02 2µ[E − V (r 0 )] − `2 /r 02 rmin r woher sich ϕθ und somit θ herleiten lässt, denn aus Gl. (I.109a) und (I.109b) folgt nach Eliminierung von α die einfache Beziehung θ = 2ϕθ − π. Die Werte der Gesamtenergie E und des Bahndrehimpulses ` in Gl. (I.110) können durch die charakteristischen Größen des Anfangszustands ausgedrückt werden. Somit ist das Potential für t → −∞, d.h. r → ∞, Null, woraus ~p 2 µv 2 E = ein = ∞ , 2µ 2 wobei v∞ = |~pein |/µ die Geschwindigkeit des gestreuten Massenpunkts im Unendlichen ist. Wiederum gilt ` = ~ L = µbv∞ . Mit diesen Werten wird Gl. (I.110) zu Z π − ϕθ = ∞ b q rmin 1− (r0 ) 2V 2 µv∞ − b2 r02 dr0 . r02 (I.111a) Schließlich ist der dabei auftretende minimale Abstand rmin Lösung der impliziten Gleichung b2 2V (rmin ) + = 1, 2 2 µv∞ rmin (I.111b) d.h. bei rmin wird der Nenner des Integranden in Gl. (I.111a) gleich Null. Beweis der Beziehung (I.111b): Für ϕ = π, d.h. r = rmin , ist die Geschwindigkeit ~v (~rmin ), mit Betrag vmin , senkrecht zum Abstandsvektor ~rmin . Demzufolge ist der Betrag des Drehimpulses dort µvmin rmin . Wegen der Drehimpulserhaltung ist dies auch gleich `, d.h. vmin = b v∞ . rmin Die gesamte Energie im Punkt der minimalen Abstand lautet dann E= 1 2 1 b2 2 µvmin + V (rmin ) = µ 2 v∞ + V (rmin ). 2 2 rmin Nach Division durch E und unter Verwendung der Beziehung zwischen E, µ und v∞ ergibt sich genau Gl. (I.111b). 2 Beispiel: Streuung harter Kugel Zur Illustration kann man die Streuung eines Massenpunktes mit Masse µ am Zentralpotential ( ∞ für r < R V (r) = (I.112) 0 für r ≥ R betrachten, wobei R eine positive Zahl ist. Dieses Modell entspricht dem Stoß zweier undurchdringbaren, nicht-deformierbaren Kugeln mit Masse m = 2µ und Radius a = R/2, d.h. deren Zentren sich minimal um R annähern können. (15) ... mit einem kleinen Dreh: Gleichung (I.104) wurde für eine Lösung mit dr/dϕ > 0 hergeleitet, vgl. ein paar Zeilen oben, während hier dr/dϕ < 0 gilt, weshalb das Negative der linken Seite betrachtet wird. 48 Newton’sche Mechanik Für b > R gibt es offensichtlich keine Streuung, so dass wir b < R annehmen können, um einen nicht-trivialen Prozess zu erhalten. Physikalische Intuition sagt, dass rmin = R gilt; dies lässt sich 2 aber auch aus der Gleichung (I.111b) beweisen. Für rmin > R lautet diese nämlich b2 /rmin = 1, was mit rmin > R > b unmöglich ist; für rmin > R gibt Gl. (I.111b) mit dem Potential (I.112) 2∞ b2 = 1, + 2 2 µv∞ rmin was wieder unmöglich ist. Somit bleibt nur die Möglichkeit rmin = R übrig. Dabei ist Gl. (I.111b) noch nicht erfüllt, was auf erster Sicht problematisch aussehen kann. Eigentlich ist die Geschwindigkeit des gestreuten Massenpunktes unstetig für r = R: dort ist sie, und mit ihr der Drehimpuls, nicht wohldefiniert, so dass der Beweis der Beziehung (I.111b), der auf dem Wert des Drehimpulses in ~rmin basiert, nicht mehr gilt. Gemäß der Gl. (I.111a) ist der Streuwinkel θ durch Z ∞ b dr0 p θ = 2ϕθ − π = π − 2 1 − b2 /r02 r02 R gegeben, wobei V (r0 ) = 0 für r0 ≥ R benutzt wurde. Mit der Substitution u = b/r0 , entsprechend du = −b dr0 /r02 , kommt Z 0 h i0 du b √ θ =π+2 = π + 2 arccos u = 2 arccos , 2 R b/R 1−u b/R d.h. b(θ) = R cos 2θ . Dieses Ergebnis kann auch geometrisch gefunden werden: mit dem in Abb. I.15 definierten Winkel α gilt nämlich b = R sin α (Trigonometrie!). Dann ist θ = π − 2α, woraus das Resultat folgt. α α b θ α Abbildung I.15 – Streuung harter Kugel. I.6.4 c Wirkungsquerschnitt :::::::::::::::::::::::::::: Literatur zum Kapitel I • Fließbach, Mechanik [2] Teil I, Kap. 1–6. • Greiner, Klassische Mechanik I [6] Kap. II und Klassische Mechanik II [7] Kap. I & II. • Nolting, Klassische Mechanik [15] Kap. 2 & 3. • Scheck, Mechanik [18] Kap. 1. Appendix zum Kapitel I I.A Alternative Herleitung der Kepler’schen Bahnkurven ... ist das Thema einer Aufgabe der Probeklausur! K APITEL II Lagrange-Formalismus: Grundlagen Die im vorigen Kapitel dargelegte Formulierung der Mechanik nach Newton ist zwar sehr intuitiv: man zählt alle auf das zu studierende System wirkenden Kräfte auf, schreibt ihre Resultierende auf die rechte Seite des zweiten Newton’schen Gesetzes (I.14) auf, und löst die sich daraus ergebende Differentialgleichung — möglicherweise anhand eines numerischen Verfahrens. In der Praxis kann der hier skizzierte Vorgang sich als nicht so direkt herausstellen. Zum einen können die Kräfte nicht einfach formulierbar sein, insbesondere wenn es sich um eine Zwangskraft handelt, welche die Bewegung des Systems einschränkt, von dem Bewegungszustand aber abhängt. Dies passiert z.B. im Fall eines Pendels, in welchem die Stange eine Zwangskraft auf die Masse am Ende des Pendels übt, die von der Position und Geschwindigkeit der Masse abhängt. Zum anderen können die „natürlichen“ Variablen der Newton’schen Beschreibung, d.h. die zeitabhängigen Koordinaten von Ortsvektoren, nicht die geeignetsten sein. Zur Beseitigung der besagten Schwierigkeiten kann man zunächst die Newton’schen Bewegungsgleichungen (I.14) verallgemeinern, um Zwangskräfte in einer geeigneten Form zu berücksichtigen: diese erste Erweiterung des Formalismus führt zu den sog. Lagrange (k) -Gleichungen erster Art. In einem zweiten Schritt werden verallgemeinerte Koordinaten eingeführt und die Lagrange-Gleichungen erster Art so manipulieren, dass die Zwangskräfte in den resultierenden Gleichungen nicht mehr auftreten. Somit erhält man die Lagrange-Gleichungen zweiter Art. Anstatt dieser Vorgehensweise zu folgen,(16) kann man die Lagrange-Gleichungen zweiter Art aus einem neu postulierten Prinzip folgern, dem Hamilton (l) -Prinzip. Letzteres lässt sich sowohl in Systemen mit als ohne Zwangskräfte anwenden, und stellt sich oft als einfacher heraus, wenn das Interesse an den Bewegungsgleichungen, nicht an den Kräften, liegt. Um dieses Prinzip mathematisch formulieren zu können, ist es notwendig, ein Ergebnis aus der Variationsrechnung einzuführen (Abschn. II.1). Danach werden die Definitionen einiger Größen — insbesondere verallgemeinerter Koordinaten, Lagrange-Funktion oder Wirkung — vorgestellt, die eine zentrale Rolle im Hamilton-Prinzip spielen. Das letztere wird dann formuliert und die daraus folgenden Lagrange-Gleichungen zweiter Art hergeleitet, die in diesem Rahmen öfter als Euler– Lagrange-Gleichungen bezeichnet werden (Abschn. II.2). Ein Nebenprodukt des entwickelten Formalismus ist einerseits die genauere Definition des intuitiven Begriffs einer physikalischen Symmetrietransformation, andererseits die Entdeckung eines tiefen Zusammenhangs zwischen Symmetrien und Erhaltungsgrößen (II.3). II.1 Ein Resultat aus der Variationsrechnung In diesem Abschnitt wird zunächst die Definition eines Funktionals, d.h. einer Funktion von Funktionen, gegeben (§ II.1.1). Dann wird ein nützliches Ergebnis dargelegt, um die Funktionen, die eine bestimmte Funktional extremal machen, zu charakterisieren (§ II.1.2). (16) (k) Die interessierte Leserin kann diesen Zugang z.B. in Fließbach [2], Kap. 7–9 finden. J.-L. Lagrange, 1736–1813 (l) W. R. Hamilton, 1805–1865 51 II.1 Ein Resultat aus der Variationsrechnung II.1.1 Funktional Im mathematischen Sinne ist eine Funktion oder Abbildung f eine Beziehung, die jedem Element x einer (Definitions-)Menge genau ein Element f (x) einer anderen Menge (Zielmenge) zuordnet. Im physikalischen Kontext ist die Definitionsmenge oft eine Untermenge — ein Gebiet — eines endlichdimensionalen (Vektor)Raums V , insbesondere R, C, Rn , oder Cn , wobei n ∈ N. Das gleiche gilt für die Zielmenge V 0 . Als Funktional bezeichnen Physiker eine Abbildung F , deren Definitionsmenge V ein unendlichdimensionaler Funktionenraum ist, während die Zielmenge V 0 entweder R oder C ist. Der Wert eines Funktionals F für eine Funktion f ∈ V wird mit F [f ], oder manchmal mit F [f (x)], bezeichnet. Im Folgenden wird die Zielmenge von Funktionalen immer R sein. Wiederum werden die Funktionen f der Definitionsmenge bestimmte Eigenschaften besitzen: meistens sind das (mindestens einmal) stetig differenzierbare Funktionen. Beispiel 1: In diesem und den folgenden Beispielen ist die Definitionsmenge der jeweiligen Funk- tionale der Raum der stetig differenzierbaren Funktionen f : R → R, die automatisch stetig und integrierbar auf jedem endlichen Intervall sind. Seien zwei reelle Zahlen x1 < x2 ; die Integration über das Intervall [x1 , x2 ] definiert ein FunktioZ x2 nal:(17) f (x) dx. F [f ] ≡ x1 Beispiel 2: Sei x0 ∈ R. Die Abbildung, die jeder Funktion f ihren Wert im Punkt x0 zuordnet, ist ein Funktional: Z ∞ δ(x − x0 )f (x) dx, F [f ] = f (x0 ) = −∞ wobei in der zweiten Gleichung das Dirac(m) -Delta eingeführt wurde. Beispiel 3: Eine reelle Funktion x 7→ y(x) lässt sich günstig als Kurve in der (x, y)-Ebene darstellen. Wenn x1 < x2 zwei reelle Zahlen sind, dann ist die Länge `[y] der Kurve y(x) zwischen den Punkten P1 = x1 , y(x1 ) und P2 = x2 , y(x2 ) ein Funktional Z P2 Z P2 p Z x2q 2 2 2 `[y] = d` = (dx) + (dy) = 1 + y 0 (x) dx (II.1) P1 P1 x1 wobei y 0 die Ableitung von y nach x bezeichnet. Beispiel 4: Sei Φ eine reelle Funktion von drei reellen Argumenten und x1 < x2 zwei reelle Zahlen. Dann definiert die Formel Z x2 F [f ] = Φ x, f (x), f 0 (x) dx x1 ein Funktional, das wir im nächsten Paragraphen wieder diskutieren werden. II.1.2 Extremierung eines Funktionals II.1.2 a Euler-Gleichung :::::::::::::::::::::::: Sei Φ eine stetig differenzierbare Funktion von drei reellen Variablen und x1 < x2 gegebene reelle Zahlen. Wir betrachten das Funktional Z x2 F [f ] = Φ x, f (x), f 0 (x) dx x1 (17) (m) Mathematisch wird eher das Integral als Funktional mit bestimmten Eigenschaften (wie Linearität) definiert. . . P. A. M. Dirac, 1902–1984 52 Lagrange-Formalismus: Grundlagen mit f einer stetig differenzierbaren reellen Funktion auf dem Intervall [x1 , x2 ] und f 0 deren Ableitung, wobei die Werte an den Grenzen gegeben sind: f (x1 ) = y1 und f (x2 ) = y2 . Hiernach werden die partiellen Ableitungen von Φ mit ∂Φ/∂x , ∂Φ/∂f und ∂Φ/∂f 0 bezeichnet. Wir wollen eine notwendige Bedingung dafür herleiten, dass das Funktional ein Extremum — Minimum oder Maximum — für eine Funktion f0 hat. Das heißt, für alle Funktionen f (x), die f (x1 ) = y1 und f (x2 ) = y2 erfüllen, gilt F [f ] ≥ F [f0 ] (falls F minimal für f0 ) bzw. F [f ] ≤ F [f0 ] (Maximum für f0 ). Sei δf eine beliebige stetig differenzierbare Funktion [x1 , x2 ] → R, mit δf (x1 ) = δf (x2 ) = 0. Dann ist λ 7→ F [f0 + λ δf ] eine Funktion von R nach R. Damit F extremal in f0 sei, muss die Ableitung dieser Funktion nach λ Null für λ = 0 sein: dF [f0 +λ δf ] = 0. dλ λ=0 Mit dem Einsetzen des Ausdrucks von F [f0+λ δf ] als Integral und dem Austausch von der Ableitung nach λ und der Integration über x ergibt sich Z x2 Z x2 ∂Φ d ∂Φ dF [f0 +λ δf ] Φ x, f0 (x)+λ δf (x), f00 (x)+λ δf 0 (x) dx = = δf (x) + 0 δf 0 (x) dx, dλ dλ x1 ∂f ∂f x1 wobei die partiellen Ableitungen im Punkt x, f0 (x)+λ δf (x), f00 (x)+λ δf 0 (x) zu berechnen sind. Der zweite Summand im Integranden des letzten Terms lässt sich mithilfe einer partiellen Integration umschreiben: x2 Z x2 Z x2 ∂Φ 0 ∂Φ d ∂Φ δf (x) dx = δf (x) − δf (x) dx. 0 0 ∂f 0 x1 ∂f x1 dx ∂f x1 Dank der Bedingung δf (x1 ) = δf (x2 ) = 0 verschwindet der integrierte Term auf der rechten Seite. Somit gilt Z x2 dF [f0 +λ δf ] ∂Φ d ∂Φ = − δf (x) dx. dλ ∂f dx ∂f 0 x1 Dies muss für λ = 0 verschwinden, d.h. wenn die partiellen Ableitungen im Punkt f0 (x), f00 (x), x genommen sind. Da die Wahl der „Variation“ δf bis auf ihren Werten an den Rändern beliebig ist, findet man einfach, dass die Differenz in den eckigen Klammern selbst identisch verschwinden muss,(18) d.h. ∂Φ x, f0 (x), f00 (x) d ∂Φ x, f0 (x), f00 (x) − = 0 ∀x ∈ [x1 , x2 ]. ∂f dx ∂f 0 Somit haben wir bewiesen das Theorem: Sei Φ eine in allen ihren drei reellen Variablen stetig differenzierbare Funktion und x1 , x2 , y1 , y2 gegebene reelle Zahlen mit x1 < x2 . Für stetig differenzierbare Funktionen f : [x1 , x2 ] → R, die f (x1 ) = y1 und f (x2 ) = y2 erfüllen, wird das Funktional Z x2 F [f ] = Φ x, f (x), f 0 (x) dx (II.2a) x1 definiert. Wenn F ein Extremum für eine Funktion f0 hat, dann erfüllt f0 die Euler-Gleichung ∂Φ x, f (x), f 0 (x) d ∂Φ x, f (x), f 0 (x) = ∀x ∈ [x1 , x2 ]. (II.2b) ∂f dx ∂f 0 Bemerkungen: ∗ Bei gegebener Φ ist die zugehörige Euler-Gleichung eine gewöhnliche Differentialgleichung zweiter Ordnung in f . (18) Dies bildet das Fundamentallemma der Variationsrechnung. 53 II.1 Ein Resultat aus der Variationsrechnung ∗ Wenn die Funktion Φ bestimmte Bedingungen erfüllt, kann man auch zeigen, dass eine Lösung der Euler-Gleichung (II.2b) auch Lösung des Extremierunsproblems für F ist. ∗ Die Anwesenheit eines Extremum für das Funktional F wird (durch Physiker) oft mit der kurzen Schreibweise δF [f ] = 0 bezeichnet. Das obige Theorem lässt sich auf den Fall eines Funktionals Z x2 0 Φ x, f1 (x), f10 (x), . . . , fN (x), fN (x) dx F [f1 , . . . , fN ] = (II.3a) x1 von N Funktionen fa , a = 1, . . . , N verallgemeinern, wobei Φ jetzt eine stetig differenzierbare Funktion von 2N + 1 reellen Variablen ist. Wenn ein Satz (f1 , . . . , fN ) das Funktional F minimiert oder maximiert, dann genügen die zugehörigen Funktionen den N Euler-Gleichungen ∂Φ d ∂Φ = ∀x ∈ [x1 , x2 ] (II.3b) ∂fa dx ∂fa0 für jedes a ∈ {1, . . . , N }. Das Theorem kann auch verallgemeinert werden, um den Fall eines Funktionals zu berücksichtigen, dessen Argumente Funktionen mehrerer Variablen x1 , . . . , xp sind: Z ∂f (x1 , . . . , xp ) ∂f (x1 , . . . , xp ) F [f ] = Φ x1 , . . . , xp , f (x1 , . . . , xp ), ,..., dx1 . . . dxp , (II.4a) ∂x1 ∂xp D mit D einem p-dimensionalen Integrationsgebiet. Dabei ist Φ jetzt eine stetig differenzierbare Funktion von 2p+1 reellen Variablen. Wenn eine Funktion f das Funktional F minimiert oder maximiert, dann erfüllt sie die Euler-Gleichung p ∂Φ X ∂ ∂Φ = ∀x ∈ D (II.4b) ∂f ∂xj ∂(∂f /∂xj ) j=1 Schließlich lässt sich auch die Extremierung von Funktionalen von N Funktionen von p Variablen behandeln, indem die zwei obigen Verallgemeinerungen kombiniert werden. II.1.2 b Beispiel ::::::::::::::: Als Anwendung der Euler-Gleichung können wir den (bekannten!) kürzesten Weg zwischen zwei Punkten (x1 , y1 ) und (x2 , y2 ) in der Ebene suchen. Das heißt, wir möchten die Kurve f (x) finden, die f (x1 ) = y1 und f (x2 ) = y2 erfüllt und das Funktional Z x2 q 2 `[f ] = 1 + f 0 (x) dx (II.1) x1 p minimiert. Dieses Funktional ist der Form (II.2a) mit Φ x, f (x), f 0 (x) = 1 + [f 0 (x)]2 . Die zugehörigen partiellen Ableitungen sind ∂Φ = 0, ∂x ∂Φ = 0, ∂f ∂Φ f 0 (x) p = . ∂f 0 1 + [f 0 (x)]2 Leitet man die letztere nach x ab, so ergibt sich d ∂Φ f 00 (x) = 3/2 dx ∂f 0 1 + [f 0 (x)]2 mit f 00 der zweiten Ableitung von f . Die Euler-Gleichung (II.2b) lautet dann d ∂Φ ∂Φ f 00 (x) = ⇔ 0 = 3/2 . ∂f dx ∂f 0 1 + [f 0 (x)]2 54 Lagrange-Formalismus: Grundlagen Dies gibt sofort f 00 (x) = 0: nach doppelter Integration unter Berücksichtigung der Randbedingungen in x1 und x2 kommt y2 − y1 f (x) = y1 + (x − x1 ), x2 − x1 d.h. die Gleichung der Gerade zwischen den zwei Endpunkten, was zu erwarten war. Bemerkung: Zur Berechnung der totalen Ableitung nach x von ∂Φ/∂f 0 kann man entweder den Ausdruck der partiellen Ableitung direkt ableiten, oder die Kettenregel anwenden und dafür die drei zweiten Ableitungen ∂ 2 Φ/∂x ∂f 0 , ∂ 2 Φ/∂f ∂f 0 und ∂ 2 Φ/∂f 02 berechnen und mit jeweils x0 = 1, f 0 (x) und f 00 (x) multiplizieren. Natürlich führen beide Wege zum gleichen Ergebnis. II.2 Hamilton-Prinzip Was machen wir schönes in diesem Abschnitt? Definition (§ II.2.1) Euler–Lagrange-Gleichungen (§ II.2.2) Beispiele (§ II.2.3) Zwangsbedingungen (§ II.2.4) II.2.1 Definitionen II.2.1 a Verallgemeinerte Koordinaten :::::::::::::::::::::::::::::::::::::: Sei ein System Σ aus N Massenpunkten. Die N Ortsvektoren ~xa (t) mit a ∈ {1, . . . , N } sind äquivalent zu 3N Koordinaten. Wenn die Massenpunkte sich unabhängig voneinander bewegen können, dann besitzt das System genau s = 3N Freiheitsgrade. In der Praxis untersucht man oft aber Probleme, in denen es (feste) Zusammenhänge zwischen den 3N Koordinaten gibt: z.B. ist der Abstand zwischen zwei Massenpunkten festgelegt, oder die Massenpunkte müssen auf irgendeiner Fläche bleiben. In solchen Fällen sind die 3N Koordinaten der Positionen nicht unabhängig von einander, d.h. die Anzahl s der Freiheitsgrade des Systems ist kleiner als 3N . Es ist daher sinnvoll, mit nur s Größen zu arbeiten, anstatt mit N . Somit führt man zur Charakterisierung eines mechanischen Systems s verallgemeinerte bzw. generalisierte Koordinaten q1 (t), q2 (t), . . . , qs (t) ein, welche die folgenden Bedingungen erfüllen: i. Sie legen den Zustand des Systems eindeutig fest, d.h. jede Position ~xa (t) mit a ∈ {1, . . . , N } lässt sich als eine bestimmte Funktion — die auch mit ~xa bezeichnet wird — der Zeit und der s verallgemeinerten Koordinaten schreiben: ~xa (t) = ~xa t, q1 (t), . . . , qs (t) ∀a ∈ {1, . . . , N } (II.5) ii. Sie sind alle voneinander unabhängig, d.h. es existiert keine Funktion f von s+1 Argumenten, für die f t, q1 (t), . . . , qs (t) = 0 für jede Zeit t gilt. Die Newton’schen Bewegungsgleichungen sind Differentialgleichungen zweiter Ordnung, so dass man neben den Positionen ~xa (t) noch die N Geschwindigkeiten ~x˙ a (t) betrachten muss, um die Zeitentwicklung für t0 > t zu bestimmen. Laut Gl. (II.5) sind diese Geschwindigkeiten Funktion von der Zeit t, den verallgemeinerten Koordinaten qi (t) für i ∈ {1, . . . , s}, und von deren Zeitableitungen. Dementsprechend muss man auch die verallgemeinerten Geschwindigkeiten q̇i (t) in Betracht ziehen. Genau wie die Geschwindigkeiten ~x˙ a (t) im Allgemeinen unabhängig von den Positionen ~xa (t), gilt dies auch für die verallgemeinerten Geschwindigkeiten und Koordinaten. Der Kürze halber werden die s generalisierten Koordinaten qi (t) bzw. Geschwindigkeiten q̇i (t) kollektiv als ein s-dimensionaler Vektor q(t) bzw. q̇(t) bezeichnet. 55 II.2 Hamilton-Prinzip Bemerkungen: ∗ Während die Anzahl s der Freiheitsgrade für ein bestimmtes Problem eindeutig festgelegt ist, gilt das im Allgemeinen nicht für die verallgemeinerten Koordinaten qi (t), entsprechend z.B. der Freiheit bei der Wahl von Koordinaten. ∗ Genau wie es schon der Fall bei „üblichen“ Koordinaten ist, haben verallgemeinerte Koordinaten nicht unbedingt die Dimension einer Länge. II.2.1 b Lagrange-Funktion. Wirkung :::::::::::::::::::::::::::::::::::: Jedem System aus s Freiheitsgraden kann eine reelle Funktion von 2s + 1 (reellen) Variablen zugeordnet werden, die Lagrange-Funktion L, welche die Bewegung des Systems völlig bestimmt, und die (physikalische) Dimension einer Energie hat. Dabei nimmt die Funktion als Argumente die Zeit t, die s verallgemeinerten Koordinaten qi (t) und s verallgemeinerten Geschwindigkeiten q̇i (t): L t, q(t), q̇(t) . (II.6) Somit ergibt sich eigentlich eine Funktion der Zeit t alleine. Die Form der Lagrange-Funktion wird später angegeben, nachdem ihre Rolle in der Bestimmung der Bewegungsgleichungen eines Systems genauer präzisiert worden ist (vgl. § II.2.3). Es sei aber schon hier erwähnt, dass diese Form nicht eindeutig festgelegt ist, auch wenn die verallgemeinerten Koordinaten gewählt wurden. Seien jetzt zwei Zeitpunkte t1 < t2 . Das Integral der Funktion (II.6) über das Zeitintervall [t1 , t2 ] definiert die Wirkung, die auch Wirkungsintegral genannt wird: Z t2 S[q] ≡ L t, q(t), q̇(t) dt. (II.7) t1 In der Schreibweise wurde schon berücksichtigt, dass die Wirkung von den verallgemeinerten Koordinaten und Geschwindigkeiten qi (t), q̇i (t) abhängt, so dass es sich um ein Funktional handelt — weshalb S[q] auch als Wirkungsfunktional bezeichnet wird. Die Wirkung hat die Dimension des Produkts von Energie und Zeit, d.h. die zugehörige Einheit im SI-System ist das J s = kg m2 s−1 . II.2.2 Hamilton-Prinzip. Euler–Lagrange-Gleichungen Es seien t1 < t2 . Bei dem Hamilton-Prinzip handelt es sich um ein Extremalprinzip, laut dem die Zeitentwicklung eines Systems im Intervall [t1 , t2 ] so erfolgt, dass die physikalisch realisierten verallgemeinerten Koordinaten q(t) und Geschwindigkeiten q̇(t) das Wirkungsfunktional (II.7) extremal (oder „stationär“) machen. Dies wird oft kurz als Hamilton-Prinzip: δS[q] = 0 (II.8) ausgedrückt. Gemäß dem in § II.1.2 a angegebenen Theorem genügt dann das Integrand des Wirkungsintegrals, d.h. die Lagrange-Funktion L, den Euler-Gleichungen (II.3b), die in diesem Kontext als Euler– Lagrange-Gleichungen bezeichnet werden: ∂L t, q(t), q̇(t) d ∂L t, q(t), q̇(t) = ∀i ∈ {1, . . . , s}. (II.9) ∂qi dt ∂ q̇i Diese s Differentialgleichungen zweiter Ordnung für die s verallgemeinerten Koordinaten stellen die Bewegungsgleichungen des Systems dar. 56 Lagrange-Formalismus: Grundlagen Bemerkungen: ∗ Das Hamilton-Prinzip wird auch als das Wirkungsprinzip, das Prinzip der stationären Wirkung oder, fehlerhaft, das Prinzip der kleinsten Wirkung bezeichnet. Wiederum werden die Euler–Lagrange-Gleichungen (II.9) noch Lagrange-Gleichungen zweiter Art genannt. ∗ Die Lagrange-Funktion für ein gegebenes System ist nicht eindeutig: wenn L t, q(t), q̇(t) eine mögliche Lagrange-Funktion bezeichnet, dann ist d L0 t, q(t), q̇(t) ≡ L t, q(t), q̇(t) + M t, q(t) dt (II.10) eine äquivalente Lagrange-Funktion, die zu denselben Euler–Lagrange-Gleichungen führt, wobei M eine beliebige stetig differenzierbare Funktion der Zeit und der generalisierten Koordinaten ist. Beweis: das mit L0 berechnete Wirkungsintegral lautet Z t2 Z t2 dM t, q(t) 0 0 S [q] ≡ dt = S[q] + M t2 , q(t2 ) − M t1 , q(t1 ) . L t, q(t), q̇(t) dt = S[q] + dt t1 t1 Unter Variationen q → q + δq, mit δq(t1 ) = δq(t2 ) = 0 bleiben die zwei letzten Terme unverändert, d.h. sie haben keinen Einfluss auf die Position des Extremums bzw. auf die Euler–LagrangeGleichungen. 2 Alternativ kann man die totale Ableitung nach der Zeit dM t, q(t) /dt durch die partiellen Ableitungen (nach t und nach den qi ) ausdrücken. Dann findet man, dass der zusätzliche Term in der Lagrange-Funktion Beiträge zu den beiden Seiten der Euler–Lagrange-Gleichungen liefert, die sich gegenseitig kompensieren. Die Invarianz der Bewegungsgleichungen unter Transformationen (II.10) wird manchmal als Eichinvarianz bezeichnet, und eine derartige Transformation als Eichtransformation. ∗ Die Euler–Lagrange-Gleichungen (II.9) sind Form-invariant oder kovariant unter den gleichzeitigen Transformationen qa (t) → qa0 (t) = qa0 t, q(t) (II.11a) (II.11b) L t, q(t), q̇(t) → L0 t, q0(t), q̇0(t) ≡ L t, q t, q0(t) , q̇ t, q0(t) , entsprechend einem Koordinatenwechsel. Beweis: ohne Schwierigkeit. Definition: Der verallgemeinerte Impuls oder kanonisch konjugierte Impuls wird definiert als ∂L t, q(t), q̇(t) pi t, q(t), q̇(t) ≡ ∂ q̇i (II.12) Falls die Lagrange-Funktion nicht explizit von einer verallgemeinerten Koordinaten qi abhängt, dann folgt sofort aus der entsprechenden Euler–Lagrange-Gleichung, dass der zugehörige generalisierte Impuls pi eine Erhaltungsgröße ist (vgl. auch § II.3.1 b). II.2.3 Erste Beispiele II.2.3 a Freier Massenpunkt ::::::::::::::::::::::::::: 57 II.2 Hamilton-Prinzip Als mögliche Lagrange-Funktion für einen freien Massenpunkt mit Masse m und Position ~x(t) kann man folgende Funktion annehmen: m L t, ~x(t), ~x˙ (t) = ~x˙ (t)2 . 2 (II.13) Dabei sind die verallgemeinerten Koordinaten qi die kartesischen Koordinaten xi , so dass q̇i = ẋi . Wegen der Gleichung ∂L t, ~x(t), ~x˙ (t) = mẋi ∂ ẋi ist der mit ~x(t) assoziierte verallgemeinerte Impuls einfach der (kinetische) Impuls ~p = m~x˙ . Wiederum ist ∂L/∂xi = 0. Dann drücken die assoziierten Euler–Lagrange-Gleichungen ∂L t, ~x(t), ~x˙ (t) d ∂L t, ~x(t), ~x˙ (t) i = mẍ = 0 = dt ∂ ẋi ∂xi die Erhaltung dieses Impulses in der Bewegung, d.h. das erste Newton’sche Gesetz, aus. II.2.3 b System aus Massenpunkten mit konservativen Kräften ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Für ein System aus N Massenpunkten, die miteinander über konservative Kräfte wechselwirken, kann man als generalisierte Koordinaten einfach die Ortsvektoren betrachten, d.h. qi = xja , mit xja der j-Koordinaten der Position vom Massenpunkt a. Dann lautet eine mögliche Lagrange-Funktion N X m˙ ˙ L t, {~xa (t)}, {~xa (t)} = ~xa (t)2 − V {~xa (t)} = T − V 2 (II.14) a=1 mit T der kinetischen Energie. Schreibt man nämlich die entsprechenden Euler–Lagrange-Gleichungen d ∂L ∂L = , dt ∂ ẋja ∂xja so gilt einerseits, genau wie im obigen Fall des freien Massenpunkts, ∂L/∂ ẋja = mẋja . Daraus ergibt sich sofort d ∂L = mẍja (t). dt ∂ ẋja Andererseits beträgt die Ableitung nach xja auf der linken Seite der Euler–Lagrange-Gleichung ∂L ∂xja =− ∂V = Faj , ∂xia wobei Faj die j-Komponente der Kraft auf den a-ten Massenpunkt bezeichnet. Insgesamt findet man somit mẍia = Fai , (II.15) d.h. genau die j-Komponente der aus dem zweiten Newton’schen Gesetz bekannten Bewegungsgleichung für den a-ten Massenpunkt. II.2.3 c System aus Massenpunkten mit nicht-konservativen Kräften Falls die Massenpunkte eines System miteinander über nicht-konservative Kräfte wechselwirken, kann man generell keine allgemein geltende zugehörige Lagrange-Funktion schreiben. In zwei Fällen sind jedoch Erweiterungen der Lagrange-Funktion (II.14) möglich, und zwar einerseits für Kräfte, die aus einem verallgemeinerten, Zeit- und Geschwindigkeitsabhängigen Potential abgeleitet werden können, andererseits für Reibungskräfte proportional zur Geschwindigkeit. ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: 58 Lagrange-Formalismus: Grundlagen Kräfte aus einem generalisierten Potential Betrachten wir eine nicht-konservative Kraft F~n.-k. auf einen Massenpunkt derart, dass ihre kartesischen Komponenten sich in der Form ∂U t, ~x(t), ~x˙ (t) d ∂U t, ~x(t), ~x˙ (t) j Fn.-k. = − + für j = 1, 2, 3 (II.16a) ∂xj dt ∂ ẋj schreiben lassen, mit U einem verallgemeinerten Potential und xj (t) bzw. ẋj (t) der j-Komponente der Position bzw. der Geschwindigkeit des Massenpunkts. Vektoriell kann man schreiben ~ ~v U t, ~x(t), ~x˙ (t) , ~ ~r U t, ~x(t), ~x˙ (t) + d ∇ F~n.-k. = −∇ dt (II.16b) ~ ~r bzw. ∇ ~ ~v den Gradienten bezüglich der Orts- bzw. Geschwindigkeitskoordinaten bewobei ∇ zeichnet. Sei zudem V das Potential, aus dem die konservativen Kräften F~ auf den Massenpunkt folgen. Dann stellt m L t, ~x(t), ~x˙ (t) = T − V − U = ~x˙ (t)2 − V ~x(t) − U t, ~x(t), ~x˙ (t) (II.17) 2 eine geeignete Lagrange-Funktion für den Massenpunkt dar. Man prüft nämlich einfach nach, dass die zugehörigen Euler–Lagrange-Gleichungen j mẍj = F j + Fn.-k. für j = 1, 2, 3 sind. ~ eine reelle bzw. vektorielle Funktion von Zeit und Ort. Man kann eine Beispiel: Sei Φ bzw. A Lagrange-Funktion für einen Massenpunkt mit Position ~x(t) und Geschwindigkeit ~x˙ (t) durch ~ t, ~x(t) U t, ~x(t), ~x˙ (t) = qΦ t, ~x(t) − q ~x˙ (t) · A (II.18a) definieren, mit q eine für den Massenpunkt charakteristische Zahl. Über die Beziehung (II.16b) führt dieses verallgemeinerte Potential zur Kraft h ~ t, ~x(t) ∂A i ˙ ~ ~ ~ ~ F = q − ∇Φ t, ~x(t) − . (II.18b) + ~x(t) × ∇ × A t, ~x(t) ∂t ~ ≡ −∇Φ ~ − ∂ A/∂t ~ ~ ≡∇ ~ × A, ~ dann ist dies genau die Lorentz-Kraft, die eine Definiert man E und B ~ B) ~ erfährt. Punktladung q in einem elektromagnetischen Feld (E, ~ der Bemerkung: Wie in § I.1.3 b schon bemerkt wurde leistet der „magnetische Anteil“ q~ x˙ (t) × B Lorentz-Kraft keine Arbeit. Diese Aussage entspricht genau der Tatsache, dass die Lorentz-Kraft sich aus einem verallgemeinerten Potential über Gl. (II.16a) ableiten lässt. Reibungskräfte Im Gegensatz zu konservativen Kräften oder zur Lorentz-Kraft hängt die Arbeit von Reibungskräften zwischen zwei Punkten von der genauen Trajektorie ab. Dementsprechend kann man kein generalisiertes Potential finden, mit dessen Hilfe Reibungskräfte über Gl. (II.16a) abgeleitet werden können. Für die Stokes’schen-Reibungskraft, die proportional zur Geschwindigkeit ist, kann man eine Funktion einführen, deren Ableitung die Kraft ist. Im Fall der Kraft auf einen Massenpunkt mit Position bzw. Geschwindigkeit ~x(t) bzw. ~x˙ (t) definiert man die Rayleigh (n) -Dissipationsfunktion (n) J. W. Strutt, Lord Rayleigh, 1842–1919 59 II.2 Hamilton-Prinzip 3 X ˙ D ~x(t) ≡ γj ẋj(t)2 (II.19) j=1 mit positiven Koeffizienten γj . Nach Ableitung nach der Komponente ẋj der Geschwindigkeit folgt − ∂D = −γj ẋj(t), ∂ ẋj (II.20) d.h. eine Stokes’sche Reibungskraft mit unterschiedlichen Reibungskoeffizienten in drei Richtungen. Führt man dann generalisierte Koordinaten q(t) ein, so lässt sich die Dissipationsfunktion durch diese über D t, q(t), q̇(t) = D {~x˙ (t, q, q̇)} ausdrücken. Um die Bewegungsgleichungen zu erhalten werden dann „modifizierte Lagrange-Gleichungen“ postuliert: ∂L t, q(t), q̇(t) ∂D t, q(t), q̇(t) d ∂L t, q(t), q̇(t) = + , (II.21) ∂qi dt ∂ q̇i ∂ q̇i die das richtige Ergebnis liefern. Es muss aber betont werden, dass die Gleichungen (II.21), im Gegensatz zu den üblichen Euler–Lagrange-Gleichungen, sich nicht aus einem Extremalprinzip herleiten lassen. In diesem Sinne ist die obige Konstruktion ziemlich künstlich. Bemerkung: Das Interessante bei der Rayleigh-Dissipationsfunktion liegt daran, dass die instantane Leistung, welche der Massenpunkt gegen die Reibungskraft verrichten muss, gleich 2D ist. II.2.4 Systeme mit Zwangsbedingungen Die individuellen Punkte eines Systems können sich oft nicht uneingeschränkt unabhängig voneinander bewegen. Stattdessen müssen die Koordinaten oder die Geschwindigkeiten der Punkte gewisse Bedingungen genügen (§ II.2.4 a): beispielsweise müssen Abstände konstant bleiben, oder die Punkte müssen auf einer gegebenen Fläche, oder innerhalb eines gegebenen Volumens bleiben. Diese Einschränkungen der Bewegung werden durch Zwangskräfte erzwungen, deren Form nicht immer einfach auszudrücken ist. Im Rahmen des Lagrange-Formalismus kann man die Bewegungsgleichungen formulieren, ohne die Zwangskräfte genau zu kennen, indem man geeignete verallgemeinerte Koordinaten verwendet (§ II.2.4 b). II.2.4 a Zwangsbedingungen ::::::::::::::::::::::::::::: A priori besetzt ein System aus N Massenpunkten 3N Freiheitsgrade für seine Bewegung, und zwar Lagrange-Formalismus drei (orthogonal zueinander) Bewegungsrichtungen, die sich als die insgesamt 3N Komponenten xja (t), a ∈ {1, . . . , N }, j = 1, 2, 3 der Ortsvektoren visualisieren lassen. Sei angenommen, dass diese Massenpunkte Zwangskräften unterliegen. Diese einschränken die Entwicklung des Systems, was sich mathematisch durch Gleichungen der Form (II.22) fi t, ~x1 (t), . . . , ~xN (t), ~x˙ 1 (t), . . . , ~x˙ N (t) = 0 mit fi einer genügend regulären Funktion von 6N + 1 Variablen. Wir werden annehmen, dass es r unabhängige solche Beziehungen gibt, d.h. i ∈ {1, . . . , r}. Definition: Eine Gleichungen der Form (II.22), in welcher nur die Zeit und die Positionen der Mas- senpunkte auftreten, heißt holonome Zwangsbedingung (oder holonome Nebenbedingung): fi t, ~x1 (t), . . . , ~xN (t) = 0, (II.23) wobei fi jetzt Funktion von 3N + 1 Variablen ist. Dank jeder holonomen Zwangsbedingung lässt sich eine Koordinate durch alle anderen (und die Zeit) ausdrücken, zumindest implizit. Ein System aus N Massenpunkten mit r Nebenbedingungen hat somit nur noch s = 3N − r unabhängige Freiheitsgrade. 60 Lagrange-Formalismus: Grundlagen Bemerkungen: ∗ Einschränkungen der Bewegung können auch durch Ungleichungen ausgedrückt werden. Zum Beispiel lässt das Einsperren von Teilchen in einem gegebenen Volumen, entsprechend einem Behälter, mit Ungleichungen formulieren. Dabei handelt es sich um eine nichtholonome Zwangsbedingung. ∗ Man unterscheidet noch zwischen skleronomen, d.h. zeitunabhängigen, und rheonomen, d.h. zeitabhängigen, Zwangsbedingungen. Beispiel 1: Einfaches Pendel Wir betrachten ein ebenes Pendel bestehend aus einer Masse m am Ende eines masselosen Stabs mit Länge l. Sei x(t), y(t), z(t) die Trajektorie der Masse, wobei der Nullpunkt des Koordinatensystem im Aufhängepunkt des Pendels genommen. Das Pendel schwingt in der (x, y)-Ebene, d.h. z(t) = 0: dies lässt sich durch eine erste Zwangsbedingung f1 t, ~x(t) ≡ z(t) = 0 ausdrücken. Wiederum entspricht die Forderung einer festen Länge l einer zweiten 2 Zwangsbedingung f2 t, ~x(t) ≡ x(t) + y(t)2 − l2 = 0. y 6 • x J J 3J ϕ l J J JJ •m Abbildung II.1 Da es r = 2 Zwangsbedingungen gibt, bleibt nach deren Berücksichtigung nur s = 3N − r = 1 Freiheitsgrad übrig. Beispiel 2: Gleitende Masse auf einer schiefen Ebene − −− y6 PP P x PP • P P PP PP m P P P q P PP q P P φ PPP − Sei jetzt ein durch einen Massenpunkt modellierte Körper mit Masse m, der reibungslos auf einer Ebene gleitet. Wegen einer ersten Zwangsbedingung f1 t, ~x(t) ≡ z(t) = 0 bleibt der Körper in der (x, y)-Ebene. Dazu bewegt er sich in der schiefen Ebene mit Neigungswinkel φ, so dass seine Koordinaten y(t) = x(t) tan φ (bis auf einer unwesentlichen additiven Konstante) erfüllen. Dementsprechend gibt es eine zweite Zwangsbedingung f2 t, ~x(t) ≡ y(t) − x(t) tan φ = 0. Abbildung II.2 Wie beim einfachen Pendel bleibt somit nur ein Freiheitsgrad übrig, d.h. ein einziger Parameter soll reichen, um die Bewegung des Körpers völlig zu charakterisieren. II.2.4 b Lagrange-Formalismus für Systeme mit Zwangsbedingungen Einer der Vorteile des Lagrange-Formalismus besteht darin, dass man Kräfte und insbesondere Zwangskräfte nicht explizit ausdrücken soll, um die Bewegungsgleichungen zu erhalten. Zu diesem Zweck kann man einem relativ einfachen Rezept folgen:(19) :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: • Als erster Schritt muss man s = 3N −r verallgemeinerte Koordinaten q1 , . . . , qs einführen. Diese sollen so gewählt werden, dass sie die Konfigurationen des Systems parametrisieren, welche die Zwangsbedingungen erfüllen. Dementsprechend sollen die qi durch die Nebenbedingungen uneingeschränkt sein. • Danach soll man die Lagrange-Funktion L = T − V , die man als Funktion der kartesischen Ortskoordinaten kennt, durch die verallgemeinerten Koordinaten q(t) und Geschwindigkeiten q̇(t) ausdrücken. In diesem Falle enthält das Potential V eigentlich nur die Beiträge, die nicht Zwangskräfte verursachen. • Schließlich kann man die Euler–Lagrange-Gleichungen aufstellen und lösen — möglicherweise numerisch. (19) Die „Begründung“ des Rezepts wird später hinzugefügt. 61 II.2 Hamilton-Prinzip Beispiel 1: Einfaches Pendel Wir betrachten wieder das in Abb. II.1 dargestellte ebene Pendel. Die zwei Zwangsbedingungen schränken die (kartesische) z-Komponente und den Abstand vom Aushängepunkt ein. Dagegen ist der Ablenkwinkel ϕ noch uneingeschränkt, und jede Konfiguration des System, welche die Nebenbedingungen erfüllt, kann mit diesem Winkel ϕ alleine charakterisiert werden. Somit ist q = ϕ eine gute Wahl für die (hier ist s = 1) verallgemeinerte Koordinate. Dann lassen sich die kartesischen Koordinaten der Position x(t), y(t), z(t) einfach durch ϕ(t) ausdrücken: x(t) = l sin ϕ(t), y(t) = −l cos ϕ(t), z(t) = 0, woraus ẋ(t) = l ϕ̇(t) cos ϕ(t), ẏ(t) = l ϕ̇(t) sin ϕ(t), ż(t) = 0 folgt. Ersetzt man diese kartesischen Koordinaten im Ausdruck der kinetischen Energie m ml2 m ˙ 2 m ~x(t) = ẋ(t)2 + ẏ(t)2 + ż(t)2 = l2 ϕ̇(t)2 cos2 ϕ(t) + sin2 ϕ(t) = ϕ̇(t)2 2 2 2 2 und des Potentials V = mgy(t) = −mgl cos ϕ(t), T = so ergibt sich für die Lagrange-Funktion: ml2 ϕ̇(t)2 + mgl cos ϕ(t). 2 Die partiellen Ableitungen der Lagrange-Funktion lauten dann L=T −V = ∂L = −mgl sin ϕ(t) und ∂ϕ ∂L = ml2 ϕ̇(t). ∂ ϕ̇ Aus der zweiten folgt d(∂L/∂ ϕ̇)/dt = ml2 ϕ̈(t), so dass die Euler–Lagrange-Gleichung (II.9) zur Bewegungsgleichung g ϕ̈(t) = − sin ϕ(t) (II.24) l führt, wie der Leserin wahrscheinlich schon aus einer früheren Vorlesung bekannt ist. Der Vollständigkeit halber: Lösung... (mehr später) Schwingungen kleiner Amplitude: sin ϕ(t) ∼ ϕ(t)... trivial Schwingungen beliebiger Amplitude: Multipliziere Gl. (II.24) mit ϕ̇(t) und integriere: Z t Z 1 g t g 0 0 0 2 2 ϕ̈(t )ϕ̇(t ) dt = ϕ̇(t) − ϕ̇(t0 ) = − sin ϕ(t0 ) ϕ̇(t0 ) dt0 = cos ϕ(t) − cos ϕ(t0 ) . 2 l l t0 t0 Mit Anfangsbedingung ϕ(t0 ) ≡ ϕ0 , ϕ̇(t0 ) = 0 und Separation der Variablen: s dϕ 2l √ dt = ± g cos ϕ − cos ϕ0 führt zu einem elliptischen Integral erster Art. Beispiel 2: Gleitende Masse auf einer schiefen Ebene Für den gleitenden Körper der Abb. II.2, die Bewegung ist eingeschränkt in die Richtung senkrecht zur schiefen Ebene und die z-Richtung, jedoch ist noch frei entlang der Neigung der Ebene. Daher stellt die dargestellte Entfernung (aus einem beliebigen Referenzpunkt) q eine geeignete generalisierte Koordinate dar. Dann gelten x(t) = q(t) cos φ, y(t) = −q(t) sin φ, z(t) = 0, bis auf additiven Konstanten, die von der genauen Position des Nullpunkts abhängen, und zu den Bewegungsgleichungen nicht beitragen. Die Zeitableitungen sind trivial und führen zur kinetischen Energie 62 Lagrange-Formalismus: Grundlagen m m ẋ(t)2 + ẏ(t)2 + ż(t)2 = q̇(t)2 . 2 2 Wiederum lautet das Potential (noch einmal bis auf einer Konstante) T = V = mgy(t) = −mgq(t) sin φ. Dies gibt die Lagrange-Funktion L=T −V = m q̇(t)2 + mgq(t) sin φ 2 mit partiellen Ableitungen ∂L ∂L = mg sin φ und = m q̇(t), ∂q ∂ q̇ so dass die Euler–Lagrange-Gleichung (II.9) zur Bewegungsgleichung q̈(t) = g sin φ führt. II.3 Symmetrien und Erhaltungsgrößen Im Rahmen des Newton’schen Formalismus sind Erhaltungsgrößen bzw. Erhaltungssätze schöne Konstrukte, deren Ursprung aber unklar bleibt: Gleichungen werden manipuliert, Größen werden eingeführt, auf erster Sicht gibt es aber keine tiefere unterliegende, gemeinsame Begründung für die Existenz der verschiedenen Konstanten der Bewegung. Eine solche globale Erklärung für die Erhaltungssätze lässt sich im Lagrange-Formalismus einfacher erkennen. Somit spiegelt eine Erhaltungsgröße die Invarianz der theoretischen Beschreibung, und der Physik, unter bestimmten Transformationen der Koordinaten wider, entsprechend einer Symmetrie des physikalischen Systems. Dieser Zusammenhang zwischen Invarianz der Physik unter einigen Transformationen und Erhaltungsgrößen wird zunächst am Beispiel verschiedener Arten von Transformationen der RaumzeitKoordinaten — Translationen in der Zeit oder im Raum und Drehungen — illustriert (§ II.3.1). Die Verallgemeinerung auf den Fall mehr abstrakter Transformationen wird dann in § II.3.2 skizziert, wobei der Begriff von Symmetrien im physikalischen Sinne genauer definiert wird. II.3.1 Invarianz unter Raumzeit-Transformationen Per Annahme ist die Raumzeit der klassischen Mechanik zeitlich und räumlich homogen und räumlich isotrop. Betrachtet man ein idealisiertes Experiment — einschließlich der ganzen Umgebung, die dabei einen Einfluss hat —, das man beliebig verschieben, sowohl im Raum als in der Zeit, oder drehen kann, dann soll das Ergebnis des Experiments weder von der Anfangszeit, noch von der Position oder der Orientierung im Raum abhängen. Die Modellierung dieses Experiments soll dann invariant unter zeitlichen und räumlichen Translationen und unter Drehungen sein. Daraus ergibt sich die Konstanz in der Bewegung der drei „klassischen“ Erhaltungsgrößen der Newton’schen Mechanik, und zwar Energie, Impuls und Drehimpuls. II.3.1 a Homogenität der Zeit und Energieerhaltung ::::::::::::::::::::::::::::::::::::::::::::::::::: Als erstes können wir die Folgerung der Invarianz unter Zeittranslationen untersuchen. Betrachten wir dementsprechend eine Theorie mit einer Lagrange-Funktion L, die nicht explizit von der Zeit abhängt: L q(t), q̇(t) , wobei die qi (t) verallgemeinerte Koordinaten sind. Definiert man dann eine Größe, die Energie des Systems, durch 63 II.3 Symmetrien und Erhaltungsgrößen s X ∂L q(t), q̇(t) q̇i (t) − L q(t), q̇(t) , E≡ ∂ q̇i (II.25a) i=1 so ist diese eine Erhaltungsgröße dE = 0. dt (II.25b) Anders gesagt folgt Energieerhaltung in einem physikalischen System aus der Invarianz des Systems unter Zeitverschiebungen. Beweis: das einfache Ableiten der Definition (II.25a) nach der Zeit gibt ! s s dE d X ∂L dL X d ∂L dL = q̇i − = q̇i − . dt dt i=1 ∂ q̇i dt dt ∂ q̇ dt i i=1 Der erste Term auf der rechten Seite kann mithilfe der Produktregel und der Euler–LagrangeGleichung (II.9) transformiert werden: d ∂L d ∂L ∂L dq̇i ∂L ∂L q̇i = q̇i + = q̇i + q̈i . dt ∂ q̇i dt ∂ q̇i ∂ q̇i dt ∂qi ∂ q̇i Der zweite Term lässt sich auch mit der Produktregel umschreiben: X s s ∂L dq̇i ∂L ∂L dL X ∂L dqi = + q̇i + q̈i . = dt ∂qi dt ∂ q̇i dt ∂qi ∂ q̇i i=1 i=1 2 Somit ist die Differenz der beiden Terme genau Null. Bemerkung: Unter Verwendung der verallgemeinerten Impulse (II.12) lässt sich die Energie noch als E≡ s X pi q(t), q̇(t) q̇i (t) − L q(t), q̇(t) (II.25c) i=1 schreiben. Beispiel: Sei ein System mit der Lagrange-Funktion s 1X λj,k q(t) q̇j (t) q̇k (t) − V q(t) , L=T −V = 2 j,k=1 d.h. mit einer kinetischen Energie, die quadratisch in den verallgemeinerten Geschwindigkeiten ist. Dabei soll λj,k symmetrisch unter dem Austausch von j und k sein. Wie die Leserin sofort erkennen kann, gibt λj,k = 21 mj δjk den üblichen kinetischen Term 21 mj q̇j2 , die folgende Herleitung ist aber für beliebige λj,k gültig. Das Einsetzen dieser Form der Lagrange-Funktion in die Definition (II.25a) gibt ! s s s X ∂ 1X 1X E= q̇i λj,k q̇j q̇k − V − λj,k q̇j q̇k + V. ∂ q̇i 2 2 i=1 j,k=1 j,k=1 Einerseits hängt das Potential nicht von der generalisierten Geschwindigkeiten ab, ∂V /∂ q̇i = 0, so dass der zweite Term in den Klammern nicht beiträgt. Andererseits gilt unter Verwendung der Produktregel ! s s s s s X 1X ∂ 1X 1X X q̇i λj,k q̇j q̇k = q̇i λj,k δij q̇k + q̇j δik = λj,k q̇j q̇k + q̇j q̇k = 2T. ∂ q̇i 2 2 2 i=1 j,k=1 i=1 j,k=1 j,k=1 64 Lagrange-Formalismus: Grundlagen Insgesamt ergibt sich daher E= s 1X λj,k q̇j q̇k + V = T + V, 2 j,k=1 entsprechend der üblichen Definition der Gesamtenergie. II.3.1 b Homogenität des Raums und Impulserhaltung :::::::::::::::::::::::::::::::::::::::::::::::::::::: Dieses Paragraph wird dem Zusammenhang zwischen Invarianz unter räumlichen Translationen und Impulserhaltung gewidmet. Definition: Eine verallgemeinerte Koordinate qj heißt zyklische Koordinate, wenn die Lagrange- Funktion nicht explizit davon abhängt, d.h. ∂L t, q(t), q̇(t) = 0. ∂qj (II.26) Falls eine generalisierte Koordinate qj zyklisch ist, dann ist die Lagrange-Funktion invariant unter den Translationen qj → qj + a mit a ∈ R. Dann ist der dazu kanonisch konjugierte Impuls ∂L t, q(t), q̇(t) pj ≡ ∂ q̇j (II.12) eine Konstante der Bewegung, d.h. dpj = 0. dt (II.27) Beispiel: Sei ein System aus N Massenpunkten mit nur inneren Zentralkräften, die aus dem Potential V ~x1 (t), . . . , ~xN (t) = X Vab |~xa (t)−~xb (t)| 1≤a<b≤N abgeleitet werden können [vgl. Gl. (I.66)]. Wählt man als verallgemeinerte Koordinaten zum einen (die drei Koordinaten von) ~x1 (t), und zum anderen die Relativkoordinaten ~xa1 (t) ≡ ~xa (t) − ~x1 (t), so lautet die Lagrange-Funktion des Systems L=T −V = N X X 2 m1 ˙ ma ˙ ~xa1 (t) + ~x˙ 1 (t) − Vab |~xa1 (t)−~xb1 (t)| . ~x1 (t)2 + 2 2 a=2 1≤a<b≤N Diese Lagrange-Funktion ist unabhängig von jeder der drei Komponenten xj1 (t) von ~x1 (t), die somit zyklische Koordinaten sind, so dass die zugehörigen verallgemeinerten Impulse pj , j = 1, 2, 3 Erhaltungsgrößen sind: pj (t) = ∂L ∂ ẋj1 = m1 ẋj1 (t) + N X a=2 N X ma ẋja1 (t) + ẋj1 (t) = m1 ẋj1 (t) + ma ẋja (t), a=2 wobei die Unabhängigkeit der Variablen ẋj1 und ẋja1 benutzt wurde. Das heißt, die Erhaltungsgröße ist hier die j-te Komponente des Gesamtimpulses des Systems. II.3.1 c Isotropie des Raums und Drehimpulserhaltung ::::::::::::::::::::::::::::::::::::::::::::::::::::::: Wir betrachten jetzt ein System aus Massenpunkten mit Positionen ~xa (t), dessen LagrangeFunktion L invariant unter Drehungen ist. Eine solche Invarianz folgt aus der Isotropie des Raums in Abwesenheit von einem externen Feld — z.B. Magnetfeld —, das eine bevorzugte Richtung auswählen würde. 65 II.3 Symmetrien und Erhaltungsgrößen Sei ~pa (t) der zu ~xa (t) kanonisch konjugierte Impuls. Dann ist der Gesamtdrehimpuls ~ ≡ L X ~xa (t) × ~pa (t) (II.28) a eine Erhaltungsgröße, d.h. ~ dL = 0. dt (II.29) Zum Beweis dieses Ergebnis, betrachte man eine beliebige (aktive) infinitesimale Drehung mit − → Winkel δϕ um eine Achse mit Einheitsvektor ~eδϕ . Sei δϕ ≡ δϕ~eδϕ . Die Änderung der Position eines Massenpunkts, die aus der Anwendung der Drehung resultiert, lautet dann − → δ~xa = δϕ × ~xa . (II.30) Unter Nutzung der Kettenregel lautet die Änderung der Lagrange-Funktion für eine Variation δ~xa , δ~x˙ a = d(δ~xa )/dt der Variablen δL = 3 XX ∂L a j=1 δxja ∂xja + ∂L δ ẋja ∂ ẋja . Der erste Term in den Klammern kann mithilfe der Euler–Lagrange-Gleichung (II.9) umschrieben werden: XX 3 3 XX dpa,j j ∂L j d ∂L j j δxa + j δ ẋa = δL = δxa + pa,j δ ẋa , dt ∂ ẋja dt ∂ ẋa a j=1 a j=1 wobei in der zweiten Gleichung die verallgemeinerten Impulse (II.12) eingeführt wurden. Dabei erkennt man in den Klammern die Zeitableitung des Produkts pa,j δxja , so dass die Summe über j einfach einem Skalarprodukt entspricht: Xd d X δL = ~pa · δ~xa = ~pa · δ~xa . dt dt a a Fordert man dann, dass die Lagrange-Funktion invariant unter Drehungen bleibt, so ist dieser Variation δL Null für Variationen δ~xa der Form (II.30), d.h. − d X − → → d X ~p · δϕ × ~xa = δϕ · ~xa × ~pa = 0. dt a a dt a − → Da die Drehung zeitunabhängig ist, kann δϕ aus der Ableitung herausgezogen werden. Daher soll die Gleichung − → d X δϕ · ~xa × ~pa = 0 dt a − → für eine beliebige infinitesimale Drehung, d.h. ein beliebiges δϕ, gelten: Dies ist nur dann möglich, wenn das zweite Multiplikand des Skalarprodukts verschwindet, was genau Gl. (II.30) entspricht. Bemerkung: Falls ein System nicht invariant unter allen Drehungen ist, sondern nur unter den Drehungen um eine gegebene Achse, dann ist nur die Komponente des Drehimpulses entlang dieser Richtung erhalten. 66 Lagrange-Formalismus: Grundlagen II.3.2 Noether-Theorem Die oben gefundenen Zusammenhänge zwischen Invarianz unter Zeittranslationen und Energieerhaltung, Invarianz unter räumlichen Translationen und Impulserhaltung, oder Invarianz unter Drehungen und Drehimpulserhaltung, sind alle Beispiele eines allgemeineren Theorems, die durch Emmy Noether(o) erfunden wurde. Hiernach wird eine mathematisch nicht-rigorose Version des Satzes dargestellt, ohne genaue Angabe der Annahmen und ohne Beweis. II.3.2 a Symmetrien ::::::::::::::::::: Definition: Sei ein physikalisches System, beschrieben durch Koordinaten q(t). Ist seine Wirkung S[q] invariant unter einer bestimmten Koordinatentransformation t → t0 t, q, q̇ , q → q0 t, q, q̇ , (II.31) so heißt die letztere Symmetrietransformation. Dann wird gesagt, dass das System die entsprechende Symmetrie besitzt. Bemerkung: Dabei wird die Invarianz der Wirkung erfordert, nicht jene der Lagrange-Funktion, die eine stärkere Forderung bildet. Beispielsweise wurden in § II.3.1 schon verschiedene Symmetrietransformationen erwähnt, welche die Wirkung physikalischer Systeme oft invariant lassen: Zeit- und Raumtranslationen, oder Drehungen. Dabei handelt es sich um sog. kontinuierliche Symmetrien, denn jede davon lässt sich durch einen Parameter beschreiben — Translationsparameter, Winkel der Drehung —, der seine Werte in einer „kontinuierlichen Menge“ (20) annehmen kann. Im Gegensatz dazu ist eine Punktspiegelung — wie z.B. die Zeitumkehr t → t0 ≡ −t oder die Raumspiegelung ~r → ~r0 ≡ −~r — keine kontinuierliche, sondern eine diskrete Symmetrie(-Transformation). Im Fall einer kontinuierlichen Symmetrie kann man infinitesimale Transformationen der Koordinaten qi → qi0 = qi + εQi t, q, q̇ mit |ε| 1 (II.32) betrachten, die um den kleinen Parameter ε von der Identität abweichen. Dabei heißen die Funktionen Qi die Generatoren der Koordinatentransformationen. II.3.2 b Noether-Theorem ::::::::::::::::::::::::: Ausgehend von kontinuierlichen Symmetrietransformationen kann man einen wichtigen Satz der mathematischen Physik beweisen, dessen Inhalt wir jetzt nur relativ informell formulieren. Theorem (Noether-Theorem): Mit jeder kontinuierlichen Symmetrie eines physikalischen Systems kann eine Erhaltungsgröße, die Noether-Ladung, assoziiert werden. (II.33) Dazu erklärt noch der genauere Satz, wie die Erhaltungsgröße für eine bestimmte Symmetrie aussieht bzw. wie sie sich berechnen lässt. Die zugehörige Form werden wir jetzt finden, indem wir plausible Elemente eines Beweises darstellen.(21) Dafür soll man eine infinitesimale Symmetrietransformation betrachten, hier der Einfachheit halber mit t0 = t. Neben Gl. (II.32) gilt noch für die generalisierten Geschwindigkeiten (20) (21) (o) D.h. eine Menge, die homöomorph zu einem zusammenhängenden Intervall bzw. Gebiet von R bzw. Rn ist. Ein ausführlicher Beweis „für Physiker“ befindet sich in (fast) jedem Lehrbuch zur theoretischen Mechanik. Wer mathematische Genauigkeit sehen möchte, kann sie z.B. in Kap. 4 von Arnold, Mathematical methods of classical mechanics [1] finden. E. Noether, 1882–1935 67 II.3 Symmetrien und Erhaltungsgrößen q̇i → q̇i0 = q̇i + εQ̇i t, q, q̇ . (II.34) Die Variation der Lagrange-Funktion δL ≡ L t, q0 (t), q̇0 (t) − L t, q(t), q̇(t) entsprechend den Transformationen (II.32), (II.34) kann auf zwei alternative Weisen geschrieben werden. Einerseits gilt df t, q(t), q̇(t) δL = ε (II.35) dt mit f einer Funktion, deren Form von jener der Lagrange-Funktion und von der Symmetrie abhängt. Der Faktor ε — es könnte theoretisch eine ganzzahlige Potenz davon sein — folgt daraus, dass die Variation δL verschwinden muss, wenn ε gegen Null geht. Dann multipliziert dieser Faktor eine Funktion von den verallgemeinerten Koordinaten und Geschwindigkeiten, die sich in der Form einer totalen Zeitableitung schreiben lässt, denn ein solcher Ansatz ist erlaubt, weil er die Wirkung invariant lässt: S[q] = S[q0 ], entsprechend der Forderung einer Symmetrietransformation. Andererseits liefert die Kettenregel für die Variation von L unter Variationen {δqi (t)}, {δ q̇i (t)} ihrer Argumente die Gleichung s s X X ∂L ∂L ∂L ∂L δL = δqi + δ q̇i = ε Qi + Q̇i , ∂qi ∂ q̇i ∂qi ∂ q̇i i=1 i=1 wobei in der zweiten Gleichung die aus den Transformationen (II.32), (II.34) folgenden Variationen δqi , δ q̇i benutzt wurden. Die Euler–Lagrange-Gleichungen (II.9) und eine wiederholte Anwendung der („inversen“) Kettenregel geben dann s s X X ∂L d ∂L d ∂L Qi + Q̇i = ε Qi , δL = ε dt ∂ q̇i ∂ q̇i dt ∂ q̇i i=1 i=1 d.h. noch ! s d X ∂L δL = ε Qi . dt ∂ q̇i (II.36) i=1 Subtrahiert man schließlich Gl. (II.35) von Gl. (II.36), so ergibt sich s ε X ∂L dQ = 0 mit Q ≡ Qi − f. dt ∂ q̇i (II.37) i=1 Da die linke Gleichung für jede infinitesimale Transformation, d.h. für ein beliebiges ε, gilt, muss die hier definierte Noether-Ladung Q eine Konstante der Bewegung sein. 2 Beispiel 1: Räumliche Translation Sei qj eine zyklische Koordinate (vgl. § II.3.1 b). Die Lagrange-Funktion des Systems ist dann invariant unter Translationen qj → qj0 = qj + a dieser Koordinate, wobei a = ε für eine infinitesimale Transformation. Für die anderen Koordinaten qi mit i 6= j betrachten wir die Identitätstransformation qi → qi0 = qi . Identifiziert man diese Transformationen mit Gl. (II.32), so ist der Generator in diesem Fall einfach Qi = δij , woraus nach Ableitung Q̇i = 0 folgt. Wegen der angenommenen Zyklizität der Koordinate ist die Lagrange-Funktion L invariant unter einer (infinitesimalen) Transformation, d.h. f = 0 in Gl. (II.35). Laut Gl. (II.37) lautet die zugehörige Erhaltungsgröße s X ∂L Q= δij = pj , ∂ q̇i i=1 68 Lagrange-Formalismus: Grundlagen d.h. wir finden noch einmal, dass die Invarianz unter räumlichen Transformationen die Erhaltung des Impulses impliziert. Beispiel 2: Zeitliche Translation Als zweites Beispiel betrachten wir ein System, dessen Wirkung invariant unter den gleichzeitigen Transformationen t → t0 = t + a , qi → qi0 (t0 ) = qi (t0 ) ist. Dank Taylor-Entwicklung gilt qi0 (t0 ) = qi (t + ε) = qi + εq̇i + O(ε2 ), so dass die Generatoren der (infintesimalen) Transformationen [Gl. (II.32)] durch Qi = q̇i gegeben sind. Da t0 = t + ε gibt eine zweite Taylor-Entwicklung dL t, q(t), q̇(t) 0 0 0 δL = L t , q (t), q̇ (t) − L t, q(t), q̇(t) = ε + O(ε2 ), dt d.h. f = L in Gl. (II.36). Insgesamt ist die erhaltene Noether-Ladung gegeben durch s X ∂L Q= δij q̇i − L = E. ∂ q̇i i=1 Somit wird das Ergebnis des § II.3.1 a wieder gefunden. Literatur zum Kapitel II • Arnold, Mathematical methods of classical mechanics [1] Teil II. • Feynman, Vorlesungen über Physik. Band 2 [20] = Lectures on Physics. Vol. II [21], Kap. 19. • Fließbach, Mechanik [2] Teil II, Kap. 7–10 & Teil III, Kap. 12–14. • Goldstein, Klassische Mechanik [4] = Classical Mechanics [5], Kap. 1.3–1.6, 2.1–2.3 & 2.5. • Greiner, Klassische Mechanik II [7] Kap. V. • Landau & Lifschitz, Mechanik [13], Kap. I. • Nolting, Analytische Mechanik [16] Kap. 1. • Scheck, Mechanik [18] Kap. 2.1–2.10. K APITEL III Lagrange-Formalismus: Anwendungen In diesem Kapitel werden einige längeren Anwendungen des in Kap II vorgestellten LagrangeFormalismus diskutiert. III.1 Starre Körper Ein physikalischer Festkörper ist ein System aus vielen Atomen — für ein Stück auf menschlicher Skala, etwa 1023 –1026 Atomen. Dementsprechend ist die Beschreibung als ein Mehrteilchensystem wie in Abschn. I.5 unrealistisch. Stattdessen werden idealisierte Modelle des Festkörpers benutzt. Eines davon ist das Modell eines starren Körpers. Dabei handelt es sich um ein System aus (vielen) Massenpunkten ma mit konstanten Abständen zueinander. Diese Zwangsbedingungen über die Abstände folgen aus inneren Kräften. Dank den letzteren bleibt die Anzahl der eigentlichen Freiheitsgrade trotz der hohen Teilchenzahl immer klein im Modell (§ III.1.1). Für die Beschreibung der globalen Bewegung des Körpers ist eine Kenntnis der inneren Zwangskräfte nicht nötig. Deshalb eignet sich die Lagrange’sche Vorgehensweise besser als der Newton’sche Formalismus, um die Bewegungsgleichungen für den starren Körper herzuleiten (§ III.1.2). In der Idealisierung eines starren Körpers ist das System definitionsgemäß nicht deformierbar. Dementsprechend können im Rahmen des Modells Eigenschaften wie Elastizität, Plastizität. . . nicht untersucht werden. Für solche Phänomene würde man den Körper eher als ein verformbares Kontinuum beschreiben. Dieser Kontinuum-Limes ist auch günstiger als die Beschreibung als eine Menge von diskreten punktförmigen Teilchen, um einige Größen zu berechnen, die in der Bewegung von Relevanz sind. Deshalb wird der Limes auch diskutiert. III.1.1 Beschreibung des starren Körpers III.1.1 a Anzahl der Freiheitsgrade :::::::::::::::::::::::::::::::::: Das Modell des starren Körpers reduziert die a priori große (3N ) Anzahl der Freiheitsgrade eines N -Teilchen-Systems zu einer kleinen Anzahl, und zwar meistens nur 6 für die Fälle, wo die Vereinfachung von Nutze ist. Im Fall von zwei Massenpunkten 1 und 2 mit der Zwangsbedingung eines zeitlich konstanten Abstands |~x2 (t) − ~x1 (t)| besitzt das System insgesamt s = 3N − 1 = 5 Freiheitsgrade. Diese können z.B. die drei Koordinaten des Schwerpunkts und zwei Winkel für die Orientierung des Verbindungsvektors zwischen 1 und 2 sein. Falls es drei Massenpunkte 1, 2 und 3 mit drei entsprechenden Zwangsbedingungen über die Abstände |~x2 (t) − ~x1 (t)|, |~x3 (t) − ~x1 (t)| und |~x3 (t) − ~x1 (t)| gibt, bleiben nach Berücksichtigung der letzteren s = 3N − 3 = 6 Freiheitsgrade übrig. Beispielsweise kann man drei Schwerpunktskoordinaten betrachten, zusammen mit drei Winkeln für die Orientierung im Raum der Ebene, in welcher die drei Massenpunkte liegen.(22) Addiert man einen vierten Massenpunkt, so ist seine Position durch 3 Zwangsbedingungen |~x4 (t)−~x1 (t)|, |~x4 (t)−~x2 (t)| und |~x4 (t)−~x3 (t)| völlig bestimmt — bis auf einer Spiegelung bezüglich (22) ... im allgemeinen Fall, wo die drei Punkte nicht auf einer Gerade sitzen. 70 Lagrange-Formalismus: Anwendungen der durch die drei ersten Punkte definierten Ebene. Somit gibt es immer noch 6 Freiheitsgrade. Das gleiche gibt für eine beliebige Anzahl N ≥ 4. Wenn man einen N -ten Massenpunkt zu N −1 schon anwesenden Punkten addiert, dann bestimmen drei Zwangsbedingungen |~xN (t)−~x1 (t)|, |~xN (t) − ~x2 (t)| und |~xN (t) − ~x3 (t)| seine Position: die weiteren Abstände sind dadurch automatisch festgelegt bzw. sind nicht unabhängig davon. Deshalb werden die drei möglichen Freiheitsgrade dieses zusätzlichen Massenpunkts durch genau drei Bedingungen annulliert, d.h. die Anzahl der Freiheitsgrade ändert sich nicht, und bleibt gleich 6. Kontinuumlimes Dank der Unabhängigkeit der Anzahl von Freiheitsgraden von der Anzahl N von Massenpunkten für N ≥ 3 kann man problemlos den Limes N → ∞ betrachten, und danach zum Modell eines Kontinuums übergehen. Im letzteren Fall entspricht der starre Körper einem endlichen kontinuierlichen Volumen, wie z.B. eine Vollkugel, das sich nicht verformen kann. Dementsprechend werden einige Eigenschaften des Körpers durch (teilweise) stetige Funktionen vom Ort — insbesondere eine Massendichte ρ(~r) —, die genau da ungleich Null sind, wo der Körper sich befindet. Um den Grenzfall genauer zu definieren kann man zuerst das nicht-deformierbare kontinuierliche Medium als Zusammensetzung aus endlich vielen (N ) kleinen Massenstücken ma beschreiben, die sich relativ zu einander nicht bewegen; seien ~xa ihre Ortsvektoren. Ersetzt man die P Massenstückchen durch Massenpunkte, so hat man einen starren Vielteilchen-Körper. Sei M = a ma die Gesamtmasse des Körpers. Im Kontinuumlimes wird die Anzahl der Massenpunkte unendlich groß, N → ∞, und ihre Massen werden unendlich klein , ma → 0, bei festgehaltener Gesamtmasse M . Im Grenzfall werden Summen über a, d.h. über alle Massenpunkte, durch Integrale über das durch den Körper besetzte Volumen V ersetzt. Genauer schreibt man für jede Funktion f der Position Z X ma f ~xa → ρ(t,~r)f (~r) d3~r (III.1) V a mit ρ der Massendichte. Bemerkung: Schreibt man ρ(~r) = X ma δ (3) ~r − ~xa a δ (3)( mit ) der 3-dimensionalen Dirac-Distribution,(23) so kann man ein System aus diskreten Massenpunkten in der Sprache des Kontinuumlimes beschreiben. III.1.1 b Kinematik des starren Körpers ::::::::::::::::::::::::::::::::::::::: Zur Untersuchung der Bewegung eines starren Körpers ist es sinnvoll, zwei unterschiedliche Bezugssysteme mit zugehörigen Koordinatensystemen einzuführen. Somit betrachtet man einerseits ein raumfestes Inertialsystem BI , entsprechend z.B. einem inertialen Beobachter, der die Bewegung des Körpers misst, ohne sich damit zu bewegen. Ortsvektoren relativ zu diesem System werden ~ a (t) für die Positionen der Massenpunkte des starren hiernach mit Großbuchstaben bezeichnet, wie X Körpers. Andererseits wird auch ein körperfestes Bezugssystem B definiert, das sich zusammen mit dem starren Körper bewegt. Insbesondere ist B nicht unbedingt Inertial, denn die Bewegung vom Körper kann beschleunigt sein. In B wird dann ein Koordinatensystem gewählt, insbesondere ein Ursprungs~ punkt O, dessen Position bezüglich BI mit X(t) bezeichnet wird. In der Praxis wird es günstig sein, diesen Nullpunkt im Schwerpunkt des starren Körpers zu nehmen, obwohl dies nicht erforderlich ist. Ortsvektoren relativ zu B werden mit Kleinbuchstaben denotiert, z.B. ~xa für die Positionen der Massenpunkte des starren Körpers, die definitionsgemäß zeitunabhängig sind. (23) (3) δ (~r) = δ(x)δ(y)δ(z) mit (x, y, z) den kartesischen Koordinaten von ~r. III.1 Starre Körper 71 Drei der für die Beschreibung des starren Körpers nötigen 6 Freiheitsgrade beschreiben die Translationsbewegung des Ursprungspunkts O von B relativ zu BI , die drei anderen entsprechen z.B. den Winkeln der Drehungen, die von den Achsen des Koordinatensystems in BI zu den Koordinatenachsen von B führen (vgl. § III.1.1 c). Die Position eines Massenpunkts a des starren Körpers bezüglich des Inertialsystems kann jetzt als ~ a (t) = X(t) ~ X + R(t)~xa (III.2) geschrieben werden, mit R der zeitabhängigen Drehmatrix, welche die Koordinatenachsen von B in jene von BI transformiert. Eine Ableitung nach der Zeit gibt für die Geschwindigkeit relativ zu BI [vgl. Gl. (I.42)] ~˙ a (t) = X(t) ~˙ X + R(t) ω ~ (t) × ~xa (III.3) ˙ mit ω ~ (t) der Winkelgeschwindigkeit der Rotationsbewegung des starren Körpers, wobei ~xa = ~0 benutzt wurde. III.1.1 c Euler-Winkel ::::::::::::::::::::: der Vollständigkeit(?) halber.... weniger wichtig / dringend als andere Paragraphen! III.1.2 Bewegungsgleichungen III.1.2 a Kinetische Energie ::::::::::::::::::::::::::: Die kinetische Energie des starren Körpers bezüglich des Inertialsystems BI ist die Summe aus der kinetischen Energien der individuellen Massenpunkten, d.h. X ma ˙ ~ a (t)2 . X T = 2 a ~˙ a (t) substituiert werden Dabei kann der Ausdruck (III.3) der Geschwindigkeit X X ma ˙ 2 ~ T = X(t) + R(t) ω ~ (t) × ~xa . 2 a Die Berechnung des (Betrags)Quadrats liefert dann X X ma 2 1X ~˙ ~˙ 2 + X(t) · R(t) ω ~ (t) × ma ~xa + T = ma X(t) R(t) ω ~ (t) × ~xa . 2 a 2 a a (III.4) ~˙ 2 umschreiben, entspreDer erste Term lässt sich mithilfe der Gesamtmasse einfach als 12 M X(t) chend der kinetischen Energie eines Massenpunkts der Masse M , der sich im Ursprungspunkt O des körperfesten Bezugssystems befindet. Bei dem zweiten Beitrag handelt es sich um einen Mischterm, der sowohl von der Translationsbewegung des starren Körpers als von seiner Rotationsbewegung abhängt. Dieser Term verschwindet ~˙ in zwei Fällen, und zwar entweder wenn der Nullpunkt O in BIPruht, d.h. falls X(t) = ~0, oder ~ wenn O genau im Schwerpunkt des starren Körpers liegt, so dass a ma ~xa = 0 gilt. Hiernach wird meistens angenommen, dass einer dieser beiden Möglichkeit erfüllt ist. Den dritte Term in Gl. (III.4) lässt sich zuerst vereinfachen, indem man die Invarianz des Skalarprodukts zweier Vektoren, und daher des Betragsquadrats eines Vektors, unter Drehungen benutzt: X ma 2 1 X 2 = ~ (t) × ~xa . R(t) ω ~ (t) × ~xa ma ω 2 2 a a Der Betragsquadrat kann noch mithilfe einiger Manipulationen umgeschrieben werden. Führt man z.B. die kartesischen Koordinaten ω i (t), xia der Vektoren ω ~ (t) und ~xa ein, so gilt 2 k k ω ~ (t) × ~xa = ω ~ (t) × ~xa ω ~ (t) × ~xa = kij ω i (t)xja klm ω l (t)xm a , 72 Lagrange-Formalismus: Anwendungen wobei Summen über k, i, j, l und m von 1 bis 3 nicht geschrieben wurden. Fängt man mit der Summe über k an, so gibt die Identität kij klm = δ il δ jm − δ im δ jl 2 ω ~ (t) × ~xa = δ il δ jm − δ im δ jl ω i (t)ω l (t)xja xm a . Die Summen über l und m liefern dann h i 2 2 ω ~ (t) × ~xa = ω i (t) ~xa δ ij − xia xja ω j (t), (III.5) wobei im ersten Term ω i (t)ω i (t) = ω i (t)δ ij ω j (t) benutzt wurde. Dieses Resultat kann im dritten Term des Ausdrucks (III.4) der kinetischen Energie eingesetzt werden. Dann lautet dieser dritte Term 21 ω i (t)I ij ω j (t) mit I ij ≡ X h i 2 ma ~xa δ ij − xia xja für i, j = 1, 2, 3, (III.6a) a wobei die Summe über alle Massenpunkte des starren Körpers läuft. Gemäß des Rezepts (III.1) gilt im Grenzfall eines kontinuierlichen Körpers I ij Z ≡ ρ(~r) ~r 2 δ ij − xi xj d3~r für i, j = 1, 2, 3 (III.6b) mit {xi }i=1,2,3 den Komponenten des Vektors ~r. Der Integrationsbereich ist entweder das durch den starren Körper besetzte Volumen V , oder kann den ganzen Raum R3 sein, unter der Konvention, dass ρ(~r) = 0 für ~r außerhalb V . Alternative Herleitung der Gl. (III.5): Der Betragsquadrat auf der linken Seite kann als Spatprodukt interpretiert werden und in der Form 2 ω ~ × ~xa = ω ~ × ~xa · ω ~ × ~xa = ~xa × ω ~ × ~xa · ω ~ = ~xa · ~xa ω ~ − ~xa · ω ~ ·ω ~ umgeschrieben werden, wobei die Zeitabhängigkeit von ω ~ der Kurze halber nicht geschrieben wurde. Dies vereinfacht sich noch zu 2 2 ω ~ × ~xa = ~xa2 ω ~ 2 − ~xa · ω ~ , was äquivalent zu Gl. (III.5) ist. 2 Insgesamt lautet die kinetische Energie des starren Körpers bezüglich des Inertialsystems BI 1 ~˙ 2 1 i T = M X(t) + ω (t)I ij ω j (t) 2 2 (III.7) ~ mit X(t) der Position in BI des Schwerpunkts des starren Körpers. Dabei stellt der zweite Beitrag die Rotationsenergie des Körpers dar. Im Gegensatz zur Gesamtmasse, deren Wert unabhängig vom Koordinatensystem ist, hängen die Zahlen I ij von der Wahl des körperfesten Koordinatensystems ab, insbesondere von dessen Nullpunkt. Wie in § III.1.2 c unten argumentiert wird, sind die I ij die (kartesischen) Komponenten eines Tensors zweiter Stufe I , der Trägheitstensor genannt wird. ~˙ Bemerkung: Die Form (III.7) gilt auch — mit X(t) = ~0 — für starren Körper, der einen Punkt ~ besitzt, der sich nicht bewegt, vorausgesetzt X(t) die Position dieses Punkts bezeichnet. III.1.2 b Bewegungsgleichungen Entsprechend den 6 Freiheitsgraden eines starren Körpers wählt man als verallgemeinerte Koordinaten für die Beschreibung seiner Bewegung einerseits die 3 Koordinaten X i (t) der Ortsvektors ~ X(t) seines Schwerpunkts, und andererseits drei Winkel ϕi (t); die letzteren beschreiben Drehun:::::::::::::::::::::::::::::::: 73 III.1 Starre Körper gen des festen Körpers um drei unabhängige Achsen, die bezüglich des Körpers fest bleiben. Die zugehörigen verallgemeinerten Geschwindigkeiten sind Ẋ i (t) und ϕ̇i (t). Die Lagrange-Funktion des starren Körpers lautet dann 3 3 MX 2 1 X L {X i }, {ϕi }, {Ẋ i }, {ϕ̇i } = Ẋ i + ϕ̇i I ij ϕ̇j − V {X i }, {ϕi } 2 2 i=1 (III.8) i,j=1 mit I ij den Komponenten des Trägheitstensors bezüglich der körperfesten Drehachsen entsprechend den drei Winkeln ϕi . Ausgehend von dieser Lagrange-Funktion liefern die Euler–LagrangeGleichungen (II.9) die Bewegungsgleichungen des festen Körpers. Translationsbewegung des starren Körpers Betrachten wir zuerst die Bewegungsgleichung für die Koordinaten X i (t). Laut Definition (II.12) ist der zu X i kanonisch konjugierte Impuls durch pi ≡ ∂L = M Ẋ i i ∂ Ẋ (III.9a) ~˙ Dann lautet gegeben. Dabei handelt es sich um die i-te Komponente des Gesamtimpulses ~p = M X. die damit assoziierte Euler–Lagrange-Gleichung dpi ∂L ∂V = M Ẍ i = =− . i dt ∂X ∂X i (III.9b) Auf der rechten Seite ist −∂V /∂X i die i-te Komponente der Gesamtkraft auf den starren Körper. ~ Falls X(t) die Position im Inertialsystem BI des Schwerpunkts ist, entspricht Gl. (III.9b) dem üblichen Schwerpunktsatz (I.60) für ein Mehrteilchensystem. Rotationsbewegung des starren Körpers Benutzt man die auf Gl. (III.6) offensichtlich Symmetrie I ij = I ji für jedes mögliches Paar (i, j), so findet man für den zu X i kanonisch konjugierten verallgemeinerten Impuls 3 Li = X ∂L = I ij ϕ̇j . ∂ ϕ̇i (III.10a) j=1 Dies ist die i-te Komponente des Eigendrehimpulses des starren Körpers Die Zeitentwicklung dieses generalisierten Impulses wird durch die Euler–Lagrange-Gleichung 3 ∂L ∂V dLi X ij j = I ϕ̈ = =− i i dt ∂ϕ ∂ϕ (III.10b) j=1 gegeben, wobei die „verallgemeinerte Kraft“ auf der rechten Seite der Gleichung das Drehmoment ist. III.1.2 c Trägheitstensor :::::::::::::::::::::::: Um zu zeigen, dass die I ij die Komponenten eines Tensors bilden, soll man ihr Verhalten unter Drehungen untersuchen. Sei R eine Drehmatrix. Unter ihrer Wirkung transformieren sich die Komponenten eines Ortsvektors bezüglich B gemäß 0 0 xi → xi = R i i xi . 0 0 0 0 Dementsprechend transformiert sich das Produkt xi xj in xi xj = R jj R ii xi xj . Andererseits gilt 0 0 0 0 0 0 0 0 R ii R jj δ ij = R ii δ ij (R T )jj = R ii (R T )ij = δ i j , 74 Lagrange-Formalismus: Anwendungen wobei R T die zu R transponierte Matrix bezeichnet, die gleichzeitig die inverse Drehmatrix R −1 ist, wie in der letzten Gleichung benutzt wurde. Somit transformieren sich beide Terme mit Indizes in der Definition (III.6) der I ij gleich unter Drehungen, und zwar derart, dass I ij sich insgesamt gemäß 0 0 0 0 0 0 I ij → I i j = R ii R jj I ij = R ii (R T )jj I ij (III.11) transformiert, d.h. wie die Komponenten eines Tensors zweiter Stufe. Identifiziert man der Tensor I mit einer 3 × 3-Matrix, die ebenfalls mit I bezeichnet wird, so kann die letzte Gleichung noch in Matrixform als I → I0 = R I R T (III.12) geschrieben werden. Gleichermaßen gilt für die Rotationsenergie in Gl. (III.7) 1 i 1 ω (t)I ij ω j (t) = ω ~ (t)T I ω ~ (t) 2 2 (III.13) mit ω ~ (t)T dem zu ω ~ (t) transponierten Zeilenvektor, und für den Eigendrehimpuls (III.10a) ~ =Iω L ~ (III.14) mit ω ~ =ϕ ~˙ der Winkelgeschwindigkeit. Entsprechend der tensoriellen Natur von I können Rotationsenergie und Drehimpuls noch in „geometrischer“ Form geschrieben werden: 1 1 i ω (t)I ij ω j (t) = ω ~ (t) · I · ω ~ (t), 2 2 wobei · die Kontraktion zweier Tensoren bezeichnet. ~ = I·ω L ~ Trägheitsmoment Sei ~e der Einheitsvektor entlang einer beliebigen Richtung. Das Trägheitsmoment des starren Körpers bezüglich der (Dreh)Achse parallel zu dieser Richtung, die durch den Ursprungspunkt des körperfesten Bezugssystem geht, wird durch I = ei I ij ej = ~eT I ~e = ~e · I · ~e (III.15) definiert, wobei {ei }i=1,2,3 die Koordinaten von ~e bezeichnen. Beispielsweise ist das relevante Trägheitsmoment für eine Rotationsbewegung um eine Achse in Richtung des Basisvektors ~e3 einfach die Komponente I 33 = ~eT e3 . Dabei gilt 3 I~ h i X h X 2 i 2 2 I 33 = ma ~xa δ 33 − x3a x3a = ma x1a + x2a a a d.h. unter Einführung der Projektion ~xa,⊥ von ~xa auf der (x1 , x2 )-Ebene orthogonal zur Drehachse I 33 = X ma ~xa,⊥ 2 (III.16a) a 2 mit ~xa,⊥ dem Quadrat des Abstands des Massenpunkts a von der Drehachse. Im Kontinuumlimes wird dieses Trägheitsmoment zu Z 33 I = ρ(~r)~r⊥2 d3~r. (III.16b) Für eine Rotationsbewegung mit Winkelgeschwindigkeit ω ~ = ω~e3 um diese Richtung ist die Rotationsenergie T = 12 I 33 ω ~ 2 . Da I 33 automatisch positiv ist, gilt das auch für diese kinetische Energie. III.1 Starre Körper 75 Beispiel: homogener Zylinder x3 Sei ein homogener Vollzylinder mit Massendichte ρ, Radius R und Höhe h. Dementsprechend ist seine Gesamtmasse M = πR2 hρ. Der Zylinder dreht sich um seine eigene Achse, welche die Richtung x3 h definiert. 3 In Zylinderkoordinaten (r, ϕ, z ≡ x ) ist der Abstand eines Punkts R von der Drehachse genau gleich der Radialkoordinate r. Somit lautet das durch Gl. (III.16b) gegebene Trägheitsmoment des Zylinders um Abbildung III.1 diese Achse Z h Z 2πZ R 4 2 πR h MR ρ r2 r dr dϕ dz = ρ I 33 = = , (III.17) 2 2 0 0 0 wobei das letztere Ergebnis auch im Grenzfall einer unendlich dünnen Scheibe h → 0 gilt. Eigenschaften des Trägheitstensors Wie schon erwähnt wurde ist der Trägheitstensor ein symmetrischer Tensor, d.h. T ij = T ji für alle i, j = 1, 2, 3. Dies bedeutet zuerst, dass nur 6 seiner Komponenten unabhängig voneinander sind. Ähnlich einer symmetrischen reellwertigen Matrix ist ein symmetrischer reellwertiger Tensor zweiter Stufe diagonalisierbar. Das heißt, man kann eine Orthonormalbasis {~e1̄ ,~e2̄ ,~e3̄ } finden, in welcher der Tensor, oder genauer seine Matrixdarstellung, die Diagonalform I1 0 0 I = 0 I2 0 (III.18) 0 0 I3 annimmt, mit I1 , I2 , I3 den Eigenwerten der Matrix, die wie oben schon bemerkt alle positiv sind. Diese Eigenwerte werden Hauptträgheitsmomente des starren Körpers genannt, während die zugehörigen Eigenvektoren {~eı̄ }ı̄=1̄,2̄,3̄ Einheitsvektoren entlang der Hauptträgheitsachsen sind. Im Hauptachsensystem — d.h. im Koordinatensystem, dessen Achsen die Hauptträgheitsachsen des starren Körpers sind — nimmt die Rotationsenergie des Körpers die einfache Form 2 2 2 i 1h T = I1 ω 1̄ + I2 ω 2̄ + I3 ω 3̄ 2 an. Besitzt ein starrer Körper Symmetrien, wie z.B. Invarianz unter der Spiegelung bezüglich einer Ebene oder Rotationssymmetrie, so sind die entsprechenden Symmetrieelemente, insbesondere Symmetrieachsen, einfach mit den Hauptträgheitsachsen verknüpft. Um dieses Ergebnis zu illustrieren, betrachten wir die nichtdiagonale Elemente des Trägheitstensors, z.B. I 12 . Die Definition (III.6b) gibt Z Z 3 2 12 12 1 2 I = ρ(~r) ~r δ − x x d ~r = ρ(x1, x2, x3 )(−x1 x2 ) dx1 dx2 dx3 Z 1 ρ(x1, x2, x3 )(−x1 x2 − x1 x2 ) dx1 dx2 dx3 . = 2 Wie unter Gl. (III.6b) schon diskutiert wurde, kann der Integrationsbereich mit einer geeigneten Definition von ρ auf R3 erweitert werden, was wir hier annehmen. Führt man die Substitution x1 → y ≡ −x1 für den zweiten Summanden in den Klammern, so ergibt sich Z Z 1 2 3 1 2 1 2 3 1 12 2 3 2 2 3 I = − ρ(x , x , x )x x dx dx dx − ρ(−y, x , x )(−y)x dy dx dx 2 Z 1 = −ρ(x1, x2, x3 ) + ρ(−x1, x2, x3 ) x1 x2 dx1 dx2 dx3 , 2 76 Lagrange-Formalismus: Anwendungen wobei die Integrationsvariable y des zweiten Terms x1 in der zweiten Zeile umbenannt wurde. Falls der starre Körper symmetrisch unter Spiegelungen bezüglich der Ebene x1 = 0 ist, so dass ρ(−x1 , x2 , x3 ) = ρ(x1 , x2 , x3 ) für alle Werte von x2 , x3 , dann ist I 12 = 0. Allgemeiner findet man, dass die Symmetrieachsen des starren Körpers, falls einige vorhanden sind, auch seine Hauptträgheitsachsen sind. Klassifikation von Trägheitstensoren Je nach den Werten der Hauptträgheitsmomente lassen sich drei verschiedene Fälle unterscheiden: • Für I1 6= I2 6= I3 6= I1 sind die Eigenvektoren {~e1̄ ,~e2̄ ,~e3̄ } und somit die Hauptträgheitsachsen eindeutig(24) definiert. Dann spricht man um einen „unsymmetrischen Kreisel“. Ein einfaches Beispiel ist ein homogener Quader, dessen Seiten unterschiedliche Längen a 6= b 6= c 6= a haben: die Symmetrieachsen des Quaders sind seine Hauptträgheitsachsen, die zugehörigen Trägheitsmomente sind unterschiedlich. • Für I1 = I2 6= I3 ist der Eigenvektor ~e3̄ bzw. die entsprechende Hauptachse eindeutig definiert. Dagegen gibt es Entartung in der (x1, x2 )-Ebene, in welcher jedes Paar von orthogonalen Achsen als Hauptträgheitsachsen betrachtet werden kann. Dies entspricht dem Modell des symmetrischen Kreisels. Beispiele sind ein eindimensionaler Stab parallel zur 3-Richtung: x1 = x2 = 0 geben sofort I 33 = 0 und I 11 = I 22 6= 0; oder ein homogener Zylinder (im allgemeinen Fall), insbesondere eine zweidimensionale Scheibe in der Ebene x3 = 0, für die man einfach I 11 = I 22 = 21 I 33 nachprüft. • Für I1 = I2 = I3 sind die Achsen jedes Koordinatensystems Hauptträgheitsachsen, entsprechend einem Kugelkreisel . Dies ist z.B. der triviale Fall des Trägheitstensors einer homogenen Kugel um drei Achsen, die durch ihren Schwerpunkt verläuft. Falls der Radius der Kugel verschwindet, d.h. die Kugel wird zu einem Punkt, ist I = 0 . Offensichtlich sind die (Haupt)Trägheitsmomente eines homogenen Würfels um seine drei Symmetrieachsen auch gleich, und damit gilt es noch für die Momente um jedes Triplett von Achsen, die durch seinen Schwerpunkt gehen. Während die Unabhängigkeit des Trägheitsmoments von der Richtung einer durch den Schwerpunkt durchlaufenden Drehachse intuitiv im Fall der Kugel ist, wirkt sie bei dem Würfel überraschend. Dabei ist unsere(25) Intuition falsch, denn wir stellen uns die ganzen Massenverteilungen ρ(~r) vor — die offensichtlich unterschiedlich für eine Kugel und einen Würfel sind —, während das Trägheitsmoment bzw. der Trägheitstensor nur einem sehr geringen Anteil der in dieser Massenverteilungen enthaltenen Information entspricht. Für die Rotationsbewegung der Körper reicht aber diese Information aus. Steiner’scher Satz Trägheitsmomente um die Symmetrieachsen eines starren Körpers sind meistens einfacher zu berechnen, entsprechend dem Fall, wo der Ursprungspunkt des Koordinatensystems in der Definition (III.6) im Schwerpunkt des Körpers liegt. Oft dreht sich der starre Körper aber um eine Achse, die nicht durch seinen Schwerpunkt durchläuft. Anstatt das Trägheitsmoment um die verschobene Drehachse explizit aus Definition (III.6) zu berechnen, ist es dann einfacher, das folgende Resultat zu benutzen. (24) (25) ... bis auf einem Minus Zeichen für die Einheitseigenvektoren. ... oder zumindest die des Autors! 77 III.1 Starre Körper Theorem (Satz von Steiner(p) ): Das Trägheitsmoment eines starren Körpers mit Masse M um eine beliebige Achse im Abstand L von seinem Schwerpunkt ist gegeben durch die Summe aus M L2 und dem Trägheitsmoment des Körpers um die parallele Drehachse, die durch den Schwerpunkt geht. (III.19a) Bezeichnet man mit I bzw. I 0 das Drehmoment um eine durch den Schwerpunkt durchlaufende Drehachse bzw. um eine dazu parallele Achse im Abstand L vom Schwerpunkt, so lautet der Steiner’sche Satz I 0 = I + M L2 . (III.19b) Zum Beweis dieses Satzes betrachte man neben dem körperfesten Bezugssystem B mit Ursprung im Schwerpunkt des starren Körpers ein zweites körperfestes Bezugssystem B 0 , dessen Nullpunkt um ~b relativ zu B verschoben ist, während die Koordinatenachsen von B 0 parallel zu denen von B bleiben. Dann gilt für die Position jedes (Massen)Punkts des starren Körpers relativ zu beiden Bezugssystemen ~xa0 = ~xa − ~b. Dies gibt für den Trägheitstensor relativ zu B 0 h i X h i X 2 2 I 0 ij = ma ~xa0 δ ij − x0ia x0j ma ~xa − ~b δ ij − (xia − bi )(xja − bj ) a = a ij a ij ~ = I − 2δ b · X i ma ~xa + b a X ma xja + bj a X ma xia + a X ma ~b 2 δ ij − bi bj . a Dabei verschwinden der zweite, der dritte und der vierte Beiträge der zweiten Zeile, während die Summe der Massen im fünften Term durch die Gesamtmasse ersetzt werden kann. Somit ergibt sich die tensorielle Form des Steiner’schen Satzes: I 0 ij = I ij + M ~b 2 δ ij − bi bj . (III.19c) Um das Drehmoment um eine gegebene Achse zu erhalten, multipliziert man diese Gleichung mit den Komponenten des Einheitsvektors in Richtung der Achse, vgl. Gl. (III.15), woraus sich Gl. (III.19b) ergibt. Beispiel: homogener Zylinder (2) Wir betrachten nochmals den homogenen Vollzylinder (Masse M , Radius R) der Abb. (III.1), der sich jetzt um eine Achse drehen soll, die parallel zu seiner Symmetrieachse ist, um den Abstand L aber verschoben ist. Dann ist gemäß dem Steiner’schen Satz (III.19) das Trägheitsmoment des Zylinders um diese Achse I 0 33 = I 33 + M L2 = M R2 + M L2 , 2 x3 x03 L h R Abbildung III.2 wobei der Ausdruck (III.17) des Trägheitsmoments um die Symmetrieachse benutzt wurde. (p) J. Steiner, 1796–1863 78 Lagrange-Formalismus: Anwendungen III.2 Kleine Schwingungen In der Physik, oder in der mathematischen Modellierung eines physikalischen Systems, kommt oft das folgende Problem vor. Gegeben ein mechanisches System, beschrieben durch eine LagrangeFunktion L t, q(t), q̇(t) , ist die Lösung der entsprechenden Bewegungsgleichungen für bestimmte Anfangsbedingungen bekannt. Sei q0 (t) diese Lösung. Das System — in der Praxis entweder das gleiche oder eine Kopie davon, wobei alle relevanten Bedingungen gleich bleiben — wird irgendwie leicht „gestört“, entsprechend z.B. einer kleiner Änderung der Anfangsbedingungen. Die Frage ist dann, was ist die neue Lösung q(t) der Bewegungsgleichungen für das gestörte System? Intuitiv kann man sich vorstellen, dass in manchen Fällen q(t) „in der Nähe“ (26) der ungestörten Lösung q0 (t) bleibt. Andererseits kann eine kleine Störung auch manchmal zu einer großen Änderung führen, wie z.B. wenn eine Kugel auf dem schmalen Gipfel eines Hügels ein wenig verschoben ist, und damit anfängt, hinabzurollen. Dieser Abschnitt befasst sich mit diesem Problem der kleinen Auslenkungen aus einer Bezugslösung, erstens für ein System mit einem einzigen Freiheitsgrad (§ III.2.1), dann für Systeme mit mehreren Freiheitsgraden (§ III.2.2). Dabei werden die beiden oben diskutierten Verhalten gefunden. Im letzteren Fall mit s > 1 Freiheitsgraden wird auch gezeigt, dass auch wenn diese unter einander gekoppelt sind, jedoch kann man immer s Linearkombinationen ihrer kleinen Variationen finden, die sich unabhängig von einander bewegen. Der Einfachheit halber beschränken sich die Diskussionen auf zeitunabhängige Systeme mit konservativen Kräften — der Fall mit dissipativen Kräften, die sich im Rahmen des LagrangeFormalismus nicht natürlich behandeln lassen, wird in § III.2.3 kurz erwähnt. Darüber hinaus wird angenommen, dass die Referenzlösung eine „Gleichgewichtslösung“ der Euler–Lagrange-Gleichungen darstellt, d.h. sie ist stationär (q0 ist zeitunabhängig), woraus sofort q̇0 (t) = 0 folgt. III.2.1 Eindimensionales Problem Wir betrachten zuerst ein physikalisches System mit einem einzigen Freiheitsgrad q(t). Dies kann z.B. die eindimensionale Bewegung eines Massenpunkts sein, oder die mehrdimensionale Bewegung mit genug Zwangsbedingungen damit am Ende nur s = 1 Freiheitsgrad übrig bleibt. Wie in der Einleitung angekündigt wurde, ist das System zeitunabhängig, d.h. seine LagrangeFunktion L hängt nicht von der Zeit ab. Für diese wird die Form f q(t) L q(t), q̇(t) = q̇(t)2 − V q(t) (III.20) 2 angenommen, mit einer kinetischen Energie die quadratisch von der generalisierten Geschwindigkeit abhängt. Dabei sind f und V genug reguläre Funktionen einer Variable. Sei q0 eine stationäre Lösung der assoziierten Euler–Lagrange-Gleichung, d.h. q̇0 (t) = 0. Damit q0 wirklich eine Gleichgewichtslösung ist, soll das Potential hat ein Extremum bei q0 haben V 0 (q0 ) = 0, (III.21) entsprechend einer verschwindenden generalisierten Kraft. Hier und danach bezeichnet der Strich die Ableitung nach der verallgemeinerten Kraft. Die Euler–Lagrange-Gleichung (II.9) lautet hier f 0 q(t) f q(t) q̈(t) + f q(t) q̇(t) = q̇(t)2 − V 0 q(t) , 2 0 2 so dass q̇0 (t) = 0 und damit q̈0 (t) = 0 automatisch zur Bedingung (III.21) führen. (26) Um diese qualitative Redensart mehr quantitativ auszudrücken, sollte man einen Abstand in einem Funktionenraum einführen, was hier nicht gemacht wird. 79 III.2 Kleine Schwingungen Wir betrachten nun eine kleine, zeitabhängige Variation der generalisierten Koordinate um den Gleichgewichtswert q(t) = q0 + δq(t), (III.22) wobei δq(t) „klein“ sein soll, d.h. höhere Potenzen [δq(t)]n sollen viel kleiner als die niedrigeren Ordnungen sein. Die Zeitableitung δ q̇(t) wird als kleine Größe der gleichen Ordnung wie δq(t) betrachtet. Die Taylor-Entwicklung der Lagrange-Funktion (III.20) zur zweiten Ordnung in δq, δ q̇ lautet f (q0 ) V 00 (q0 ) L q(t), q̇(t) = [δ q̇(t)]2 − V (q0 ) − V 0 (q0 )δq(t) − [δq(t)]2 + O [δq(t)]3 , 2 2 wobei im ersten Term auf der rechten Seite die höheren Terme in der Taylor-Entwicklung von f q0 +δq(t) nicht beitragen, weil [δ q̇(t)]2 schon zweiter Ordnung ist. Dank der Bedingung (III.21) verschwindet der dritte Term, während der zweite konstant ist, und daher zu den Bewegungsgleichungen nicht beiträgt. Somit bleibt f (q0 ) V 00 (q0 ) L q(t), q̇(t) ' [δ q̇(t)]2 − [δq(t)]2 − V (q0 ), 2 2 (III.23) d.h. die Lagrange-Funktion ist quadratisch in der verallgemeinerten Koordinate und der zugehörigen Geschwindigkeit, ohne Mischterm. Die Erklärung „δq(t) soll klein sein“ ist in der Tat sehr schlampig: da q(t), und somit δq(t), im Allgemeinen eine physikalische Dimension besitzen kann, hängt sein Zahlenwert von der gewählten Einheit ab, so dass δq(t) nicht „klein“ sein kann, sondern nur klein gegenüber einem Referenzwert. Ein mathematisch mehr präziser Weg von Gl. (III.22) nach Gl. (III.23) lautet wie folgt. Sei q1 (t) beliebig und δq(t) ≡ εq 1 (t), wobei |ε| 1 ist; dann gilt δ q̇(t) = εq̇1 (t). Betrachtet man L q0 (t)+εq1 (t), q̇0 (t)+εq̇1 (t) als eine Funktion von ε, so kann man ihre Taylor-Entwicklung um ε = 0 schreiben. Zur Ordnung ε2 gilt f (q0 ) V 00 (q0 ) [εq̇1 (t)]2 − V (q0 ) − V 0 (q0 )εq1 (t) − [εq1 (t)]2 . L q0 (t)+εq1 (t), q̇0 (t)+εq̇1 (t) ∼ 2 2 Mit εq1 (t) = δq(t) und εq̇1 (t) = δ q̇(t) ist dies genau Gl. (III.23). Ausgehend von der Lagrange-Funktion (III.23) und unter Verwendung von ∂/∂q = ∂/∂(δq) und ∂/∂ q̇ = ∂/∂(δ q̇) lauten die partiellen Ableitungen auf beiden Seiten der Euler–LagrangeGleichung (II.9) ∂L ∂L = −V 00 (q0 )δq(t), = f (q0 )δ q̇(t). ∂q ∂ q̇ Nach einer Zeitableitung des letzteren Terms lautet die Bewegungsgleichung schließlich δ q̈(t) = − V 00 (q0 ) δq(t). f (q0 ) (III.24) Je nach dem Zahlenwert des konstanten Verhältnisses V 00 (q0 )/f (q0 ) > 0 — oder eigentlich von V 0 ), weil f (q0 ) in physikalischen Problemen immer nicht-negativ ist, wie hiernach angenommen wird — lassen sich drei Fälle unterscheiden. 00 (q • Für V 00 (q0 ) > 0 kann man ω 2 ≡ V 00 (q0 )/f (q0 ) definieren. Dann ist Gl. (III.24) die Bewegungsgleichung eines harmonischen Oszillators mit Kreisfrequenz ω. Die allgemeine Lösung der Gleichung δq(t) = A cos(ωt) + B sin(ωt) mit Konstanten A und B, die von den Anfangsbedingungen abhängen, bleibt begrenzt: das System führt kleine Schwingungen um die Gleichgewichtslage q0 durch, die somit stabil ist. 80 Lagrange-Formalismus: Anwendungen • Für V 00 (q0 ) < 0 kann man κ2 ≡ −V 00 (q0 )/f (q0 ) einführen. Dann ist die allgemeine Lösung der Bewegungsgleichung δq(t) = Aeκt + Be−κt . Einer der beiden Terme — der erste falls κ > 0 ist — wächst exponentiell schnell mit der Zeit und ist daher unbegrenzt, d.h. bleibt nicht in der Nähe der Gleichgewichtslösung, die instabil ist. Wegen des Wachstums wird δq(t) nicht mehr „klein“, so dass die Näherungen, die zur Bewegungsgleichung führen, nicht mehr gelten. Anstatt unendlich zu wachsen, wird wahrscheinlich eine andere (Gleichgewichts)Lösung in endlichem Abstand von q0 gefunden. • Für V 00 (q0 ) = 0 führt die approximative Bewegungsgleichung (III.24) zu einer Bewegung mit konstanter Geschwindigkeit, d.h. wieder unbegrenzt. Jedoch die höheren Terme in der TaylorEntwicklung könnten dieses Verhalten ändern. 81 III.2 Kleine Schwingungen III.2.2 Multidimensionales Problem Sei jetzt ein physikalisches System mit s > 1 Freiheitsgraden, denen verallgemeinerte Koordinaten q1 (t), . . . , qs (t) — kollektiv mit q(t) bezeichnet — zugeordnet sind. Für die Lagrange-Funktion wird die Form s 1X L q(t), q̇(t) = fab q(t) q̇a (t) q̇b (t) − V q(t) (III.25) 2 a,b=1 angenommen, wobei fab symmetrisch unter dem Austausch von a und b ist. Falls fab nicht symmetrisch ist, trägt eigentlich nur der symmetrische Anteil 21 (fab + fba ) zur kinetischen Energie bei, während der antisymmetrische Anteil 21 (fab − fba ) sich in der Summe über alle Werte von a und b kürzt. Sei q0 = {q0,a }a=1,...,s eine Gleichgewichtslösung. Dann hat das Potential V automatisch ein Extremum bei q0 , d.h. ∂V q(t) = 0, (III.26) ∂qa q0 so dass die verallgemeinerte Kraft für die Gleichgewichtslösung Null ist. Betrachtet man jetzt eine kleine Variation qa (t) = q0,a + δqa (t) (III.27) der Trajektorie — im abstrakten s-dimensionalen Raum aufgespannt durch die verallgemeinerten Koordinaten —, so gibt eine Taylor-Entwicklung der Lagrange-Funktion bis zur zweiten Ordnung in den δqa und δ q̇a s 1X L q(t), q̇(t) = fab q0 δ q̇a (t)δ q̇b (t) 2 a,b=1 s s X X ∂V q(t) 1 ∂ 2 V q(t) − V (q0 ) − δqa (t)δqb (t). δqa (t) − ∂qa q0 2 ∂qa ∂qb q0 a=1 a,b=1 Unter Verwendung der Bedingungen (III.26) und nach Einführung der kurzen Notationen ∂ 2 V q(t) (III.28a) mab ≡ fab q0 , kab ≡ ∂qa ∂qb q0 bleibt s s X X mab kab L q(t), q̇(t) ' δ q̇a (t)δ q̇b (t) − δqa (t)δqb (t) − V (q0 ). 2 2 a,b=1 (III.28b) a,b=1 Wie in § III.2.1 ist die Lagrange-Funktion quadratisch in den verallgemeinerten Koordinaten und den zugehörigen Geschwindigkeiten ohne Mischterm zwischen den beiden. Dafür sind die verschiedenen Koordinaten miteinander gekoppelt und das gleiche gilt für die Geschwindigkeiten. Die Lagrange-Funktion (III.28b) kann noch in Matrixschreibweise geschrieben werden. Sei m bzw. k die quadratische s×s-Matrix mit Elementen mab bzw. kab . Beide Matrizen sind symmetrisch, d.h. m = mT und k = kT : einerseits wurde oben schon erwähnt, dass die fab symmetrisch sind, woraus die Symmetrie von m folgt. Andererseits sind die kab die zweiten Ableitungen einer Funktion — die wir implizit als mindestens zweimal kontinuierlich differenzierbar annehmen —, und somit auch symmetrisch. Sieht man dann q(t) und q̇(t) als s-dimensionale Spaltenvektoren, und dementsprechend δq(t)T und δ q̇(t)T als Zeilenvektoren, so lässt sich Gl. (III.28b) in der Form L q(t), q̇(t) ' δ q̇(t)T m δ q̇(t) + δq(t)T k δq(t) − V (q0 ) (III.28c) schreiben. 82 Lagrange-Formalismus: Anwendungen Als symmetrische reelle Matrizen sind m und k diagonalisierbar. Im Folgenden wird gezeigt, dass sie eigentlich gleichzeitig diagonalisierbar sind, auf Kosten einer geeigneten Wahl von verallgemeinerten Koordinaten. Zunächst kann man die Matrix m diagonalisieren: da m symmetrisch ist, existieren eine Drehmatrix R und eine diagonale Matrix m1 0 . . . . . . . . . 0 .. 0 m2 0 ··· . .. .. .. .. .. . . . . mD ≡ .. ≡ diag(m1 , . . . , ms ) .. · · · 0 ms−1 0 0 ........ 0 ms derart, dass sie mD = R m R T erfüllen. Da R eine Drehmatrix ist, gilt für seine Inverse R −1 = R T , und man hat äquivalent m = R T mD R, so dass nach Einsetzen in Gl. (III.28c) 1 1 L q(t), q̇(t) = δ q̇(t)T R T mD R δ q̇(t) + δq(t)T k δq(t) 2 2 Sei δq0 (t) ≡ R δq(t), entsprechend einer Drehung im Raum der verallgemeinerten Koordinaten. Da die Matrix m, wie ihre Elemente, nicht von der Zeit abhängt, ist es auch der Fall der Drehmatrix R. Somit gilt δ q̇0 (t) = R δ q̇(t). Dann erhält man für die Lagrange-Funktion in den neuen Variablen 1 1 L δq0 (t), δ q̇0 (t) = δ q̇0 (t)T mD δ q̇0 (t) + δq0 (t)T R k R T δq0 (t). 2 2 Drückt man den kinetischen Term durch die (Zeitableitungen der) Komponenten {δqa0 (t)} aus, die Linearkombinationen der ursprünglichen verallgemeinerten Koordinaten {δqb (t)} sind, so sieht man explizit, dass die kinetische Energie jetzt keinen Mischterm enthält: 0 0 L δq (t), δ q̇ (t) = s X ma a=1 2 δ q̇a0 (t) 2 1 + δq0 (t)T R k R T δq0 (t). 2 Dagegen wird der Potential-Term im Allgemeinen noch nicht-diagonal sein. Um den letzteren zu diagonalisieren, ohne die Diagonalform der kinetischen Energie zu zerstören, kann man nicht direkt eine Drehung durchführen. Stattdessen soll man neue verallgemeinerte √ Koordinaten Q0a (t) ≡ ma δqa0 (t) einführen, entsprechend einer Reskalierung der δqa0 (t), wobei der Skalierungsfaktor unterschiedlich für jede Koordinate ist. Das ist ja möglich, denn die generalisierten Koordinaten keine „absolute“ Zahlenwerte von Vektorkomponenten sind, sondern Parametrisierungen von Freiheitsgraden. Führt man die zeitunabhängigen diagonalen Matrizen √ √ √ √ 1/2 −1/2 mD ≡ diag( m1 , . . . , ms ) und mD ≡ diag(1/ m1 , . . . , 1/ ms ) ein, wobei die Exponenten 1/2, −1/2 als eine Notation ohne Bedeutung zu sehen sind, so gelten 1/2 −1/2 Q0 (t) = mD δq0 (t) und δq0 (t) = mD Q0 (t) mit Q0 (t) dem Spaltenvektor mit Komponenten {Q0a (t)}. Die Lagrange-Funktion lässt sich dann als Funktion der {Q0a (t)} und deren Zeitableitungen schreiben 1 1 −1/2 −1/2 L Q0 (t), Q̇0 (t) = Q̇0 (t)T Q̇0 (t) − Q0 (t)T mD R k R T mD Q0 (t). 2 2 83 III.2 Kleine Schwingungen −1/2 −1/2 Wie sich einfach nachprüfen lässt, ist die Matrix mD R k R T mD symmetrisch: −1/2 −1/2 T −1/2 T −1/2 T mD R k R T mD = mD R k R T mD . Deshalb kann sie diagonalisiert werden, d.h. es existiert eine zeitunabhängige diagonale Matrix KD ≡ diag(K1 , . . . , Ks ) und eine s-dimensionale Drehmatrix R 0 , die −1/2 mD −1/2 R k R T mD = R 0T KD R 0 erfüllen. Sei ein neuer Satz von s verallgemeinerten Koordinaten {Qa (t)}, Linearkombinationen der {Q0b (t)}, definiert durch Q(t) ≡ R 0 Q0 (t), woraus Q0 (t) = R 0T Q(t) folgt. Diese neuen Koordinaten bringen natürlich den Potential-Term der Lagrange-Funktion in Diagonalform. Andererseits gilt 0 0 0 0T Q̇ (t) Q̇ (t) = Q̇(t) R R Q̇(t) = Q̇(t) Q̇(t) = T T T s X 2 Q̇a (t) a=1 für den kinetischen Anteil der Lagrange-Funktion, die insgesamt durch s 1 2 1 1 X T T L Q(t), Q̇(t) = Q̇(t) Q̇(t) − Q(t) KD Q(t) = Q̇a (t) − Ka Qa (t)2 2 2 2 (III.29) a=1 gegeben ist. Das heißt, die neuen verallgemeinerten Koordinaten {Qa (t)}, deren Zeitentwicklungen nach Anwendung der Euler–Lagrange-Gleichungen Q̈a (t) = −Ka Qa (t) für a = 1, . . . , s lauten, sind jetzt entkoppelt von einander. Diese Variablen {Qa (t)} mit einer einfachen Bewegungsgleichung werden Normalkoordinaten oder auch Normalmoden genannt. Für jede dieser Normallkoordinaten kann dann die Fallunterscheidung am Ende des § III.2.1 wiederholt werden. √ Somit entspricht der Fall Ka > 0 einem harmonischen Oszillator mit Kreisfrequenz Ka , und das System ist stabil unter kleinen Variationen entlang der Richtung von Qa . Dagegen ist das System instabil falls Ka < 0, denn eine kleine Auslenkung kann zu einer großen Änderung führen. Schließlich ist das Potential „flach“ entlang einer Richtung mit Ka = 0, und die zugehörige verallgemeinerte Koordinate Qa ist zyklisch — zumindest in der Näherung, in der Gl. (III.29) gilt. III.2.3 Gedämpfte Schwingungen Später! Literatur zum Abschnitt III.2 • Fließbach, Mechanik [2] Teil VI, Kap. 24–26. • Goldstein, Klassische Mechanik [4] = Classical Mechanics [5], Kap. 6.1–6.3. • Greiner, Klassische Mechanik II [7] Kap. IV. Literatur zum Kapitel III • Feynman, Vorlesungen über Physik. Band 1 [22] = Lectures on Physics. Vol. I [23], Kap. 18–20 & Band 2 [20] = Vol. II [21], Kap. 31.4; 84 Lagrange-Formalismus: Anwendungen • Fließbach, Mechanik [2] Teil V, Kap. 19–23 & Teil VI, Kap. 24–26. • Goldstein, Klassische Mechanik [4] = Classical Mechanics [5], Kap. 4.1–4.4, 5, & 6.1–6.3. • Greiner, Klassische Mechanik II [7] Kap. III & IV. • Nolting, Klassische Mechanik [15] Kap. 4. • Scheck, Mechanik [18] Kap. 3. K APITEL IV Hamilton-Formalismus Einleitung! IV.1 Hamilton’sche Bewegungsgleichungen IV.1.1 Kanonisch konjugierter Impuls Sei ein mechanisches System mit s Freiheitsgraden. Im Rahmen des in Kap. II eingeführten Lagrange-Formalismus benutzt man zur Beschreibung dieses Systems und dessen Zeitentwicklung einerseits s verallgemeinerte Koordinaten q = qa a=1,...,s und andererseits die zugehörigen verallgemeinerten Geschwindigkeiten q̇ = q̇a a=1,...,s . (IV.1a) (IV.1b) Zusammen mit der Zeit bilden die generalisierten Koordinaten und Geschwindigkeiten die Argu mente der Lagrange-Funktion L t, q, q̇ , welche die ganze Information über das System enthält. Mithilfe der Lagrange-Funktion werden noch die verallgemeinerten Impulse definiert; somit ist ∂L t, q, q̇ pa ≡ (IV.1c) ∂ q̇a der zur Koordinate qa (t) konjugierte Impuls. Im Folgenden werden diese Impulse kollektiv mit p = pa a=1,...,s (IV.1d) bezeichnet. Die Grundidee des Hamilton-Formalismus besteht darin, den Bewegungszustand eines mechanischen Systems zur Zeit t durch die verallgemeinerten Koordinaten qa (t) und die dazu konjugierten Impulse pa (t) zu charakterisieren, statt durch die Variablen {qa (t)}, {q̇a (t)}. Definition: Der von den 2s Variablen {qa } und {pa } aufgespannte Raum Γ heißt Phasenraum des Systems. Dementsprechend werden die {qa } und {pa } für a ∈ {1, . . . , s} gemeinsam Phasenraumkoordinaten genannt. Jedem möglichen Bewegungszustand eines gegebenen Systems wird ein Punkt in dessen Phasenraum Γ zugeordnet, und die Bewegung entspricht einer Phasenraumtrajektorie. Dieses Thema wird in Abschn. IV.3 ausführlicher diskutiert werden. Bemerkung: Der Phasenraum ist im Allgemeinen kein Vektorraum, weil einige Variablen — wie z.B. Winkel — ihre Werte nur in einem endlichen Intervall annehmen können. Mathematisch ist der Phasenraum eine Mannigfaltigkeit der Dimension 2s. 86 Hamilton-Formalismus IV.1.2 Hamilton-Funktion Um die Variablen {qa }, {q̇a } des Lagrange-Formalismus durch die Koordinaten {qa } und die konjugierten Impulse {pa } zu ersetzen, muss eine Funktion der neuen Variablen definiert werden, welche die gesamte Information über das System enthält, um die Rolle der Lagrange-Funktion zu übernehmen. Definition: Gegeben die Lagrange-Funktion eines System wird seine Hamilton-Funktion definiert durch s X H t, q, p ≡ pa q̇a − L t, q, q̇ . (IV.2) a=1 Auf der rechten Seite dieser Definition sollen die q̇a als Funktionen der Zeit t und der Phasenraumkoordinaten {qb } und {pb } betrachtet werden: q̇a = q̇a t, q, p . Das heißt, dass die definierende Beziehung des konjugierten Impulses (IV.1c) invertiert werden soll. Wenn dies möglich ist, gilt bei festen pb b=1,...,s ! s X ∂H ∂ ∂L = pb q̇b − L = pa − = 0, ∂ q̇a ∂ q̇a ∂ q̇a a=1 d.h. H hängt nicht explizit von q̇a ab. Laut dem Satz von der Umkehrabbildung sollen die zweiten Ableitungen ∂ 2 L/∂ q̇a ∂ q̇b positiv sein, damit Gl. (IV.1c) lokal invertierbar sei; vgl. auch Anhang C. Wie oben erwähnt muss die Hamilton-Funktion H die gleiche Information wie die LagrangeFunktion L enthalten. Dass dies der Fall ist, lässt sich beweisen, indem man L aus H rekonstruieren kann. Sei somit angenommen, dass die Hamilton-Funktion H t, q, p bekannt ist. Definiert man zunächst ∂H t, q, p Q̇a ≡ , ∂pa so folgt aus Gl. (IV.2) und der Kettenregel ! s s s X X ∂ q̇b X ∂L ∂ q̇b ∂ pb q̇b − L = q̇a + pb − Q̇a = ∂pa ∂pa ∂ q̇b ∂pa b=1 b=1 b=1 wobei ∂qb /∂pa = 0 benutzt wurde, entsprechend der Unabhängigkeit der Variablen qb und pa . Unter Verwendung der Beziehung (IV.1c) im letzten Term kommt dann Q̇a = q̇a . Somit lassen sich die verallgemeinerten Geschwindigkeiten aus der Hamilton-Funktion über ∂H t, q, p q̇a t, q, p = ∂pa (IV.3a) wiederfinden. Dann liefert eine einfache Berechnung s X a=1 s s X a=1 a=1 X ∂H pa −H= pa q̇a − ∂pa ! pa q̇a − L = L. Das heißt, die Lagrange-Funktion kann aus der Hamilton-Funktion gemäß s X L t, q, q̇ ≡ pa q̇a t, q, p − H t, q, p a=1 rekonstruiert werden, wobei q̇a durch Gl. (IV.3a) gegeben ist. (IV.3b) 87 IV.1 Hamilton’sche Bewegungsgleichungen Mathematisch ist der Übergang von L zu H ein Beispiel von Legendre (q) -Transformation, und der Übergang von H zu L ist die Rücktransformation (inverse Legendre-Transformation). Bemerkung: Vergleicht man Gl. (IV.2) mit Gl. (II.25c), so stimmt die Definition der HamiltonFunktion mit jener der Noether-Ladung assoziiert mit Invarianz unter Zeittranslationen überein, die als Energie des Systems interpretiert wurde. IV.1.3 Kanonische Bewegungsgleichungen Die Position eine Systems im Phasenraum zu einer gegebenen Zeit t gibt seine verallgemeinerten Koordinaten und konjugierten Impulse zu diesem Zeitpunkt, die ganz natürlich mit {qa (t)} und {pa (t)} bezeichnet werden. Zur Charakterisierung der Bewegung des Systems sind noch Bewegungsgleichungen erforderlich, welche die Zeitentwicklung von den {qa (t)} und {pa (t)} bestimmen. Im vorigen Paragraphen wurde schon Gl. (IV.3a) gefunden, welche die Zeitableitung der verallgemeinerten Koordinate qa (t) durch Größen des Hamilton-Formalismus ausdrückt. Betrachtet man jetzt die Ableitung der Hamilton-Funktion (IV.2) nach der verallgemeinerten Koordinate qa , so ergibt sich ! s s s X X ∂H dH d ∂L X ∂L ∂ q̇b ∂ q̇b = = − − . pb q̇b − L = pb ∂qa dqa dqa ∂qa ∂qa ∂ q̇b ∂qa b=1 b=1 b=1 Im letzten Summanden kann ∂L/∂ q̇b durch pb ersetzt werden, so dass dieser Term sich mit dem ersten herauskürzt. Dann ist der zweite Term ∂L/∂qa , berechnet entlang der Trajektorie des Systems, laut der Euler–Lagrange-Gleichung (II.9) gleich der Zeitableitung von ∂L/∂ q̇a . Nach Gl. (IV.1c) ist dies auch gleich der Zeitableitung des konjugierten Impulses pa . Somit ergibt sich ∂H t, q(t), p(t) dpa (t) =− . ∂qa dt Insgesamt gelten die (kanonischen) Hamilton’schen Gleichungen ∂H t, q(t), p(t) dqa (t) = dt ∂pa ∂H t, q(t), p(t) dpa (t) =− dt ∂qa für a = 1, . . . , s. (IV.4) Ein wichtiger Gegensatz zum zweiten Newton’schen Gesetz (I.14) oder zu den Euler–LagrangeGleichungen (II.9), die zweiter Ordnung sind, besteht darin, dass die 2s Hamilton’schen Bewegungsgleichungen Differentialgleichungen erster Ordnung sind. Deshalb ist für jede Phasenraumkoordinate eine einzige Anfangsbedingung nötig, um die Lösung der Bewegungsgleichungen, d.h. die Phasenraumtrajektorie, zu bestimmen. Bemerkungen: ∗ Die Ableitung der Definition (IV.2) nach der Zeit mithilfe der Produktregel gibt unter Verwendung der Euler–Lagrange-Gleichungen (II.9) und der Kettenregel s s dH X dpa dq̇a dL X ∂L dqa ∂L dq̇a dL ∂L = q̇a + pa − = + − =− . dt dt dt dt ∂qa dt ∂ q̇a dt dt ∂t a=1 a=1 Andererseits liefern die Hamilton’schen Gleichungen (IV.4) s s s a=1 a=1 a=1 X ∂H ∂H dH ∂H X ∂H ∂H X = + q̇a + ṗa = + − ṗa q̇a + q̇a ṗa = . dt ∂t ∂qa ∂pa ∂t ∂t (q) A.-M. Legendre, 1752–1833 88 Hamilton-Formalismus Falls die Hamilton-Funktion nicht explizit von der Zeit abhängt (∂H/∂t = 0), ist sie somit eine Konstante der Bewegung, entsprechend Energieerhaltung im System. ∗ Die Hamilton’schen Bewegungsgleichungen (IV.4) können aus einem Extremalprinzip, dem schon angetroffenen Hamilton(!)-Prinzip (II.8), hergeleitet werden. Demgemäß ist die Wirkung Z t2 X s S[q, p] ≡ pa (t) q̇a t, q(t), p(t) − H t, q(t), p(t) dt (IV.5) t1 a=1 unter allen Phasenraumtrajektorien mit festen Endpunkten extremal für die physikalisch realisierte Bewegung. IV.1.4 Beispiele IV.1.4 a Eindimensionales System :::::::::::::::::::::::::::::::::: Das einfachste Beispiel ist das eines zeitunabhängigen Systems mit einem einzigen Freiheitsgrad, parametrisiert durch eine verallgemeinerte Koordinate q. Sei m L(q, q̇) = q̇ 2 − V (q) (IV.6a) 2 die zugehörige Lagrange-Funktion, mit V dem Potential für die generalisierte Koordinate. Der zu q konjugierte Impuls ist ∂L(q, q̇) = m q̇, (IV.6b) p= ∂ q̇ woraus q̇(t, q, p) = p/m folgt. Die Hamilton-Funktion (IV.2) für dieses System lautet m m H(q, p) = p q̇ − L(q, q̇) = m q̇ 2 − q̇ 2 + V (q) = q̇ 2 + V (q). 2 2 Ersetzt man q̇ durch p/m, so ergibt sich schließlich H(q, p) = p2 + V (q). 2m (IV.6c) Ausgehend von dieser Hamilton-Funktion lauten die Hamilton’schen Gleichungen (IV.4) ∂H q(t), p(t) dq(t) p(t) = = (IV.6d) dt ∂p m und ∂H q(t), p(t) ∂V q(t) dp(t) =− =− . (IV.6e) dt ∂q ∂q Wird die zweite in der Ableitung der ersten nach der Zeit eingesetzt, so findet man die übliche Bewegungsgleichung wieder. Schließlich prüft man schnell nach, dass die Lagrange-Funktion aus der Hamilton-Funktion rekonstruiert werden kann: p ∂H(q, p) p p2 p2 − H(q, p) = p − − V (q) = − V (q). ∂p m 2m 2m IV.1.4 b Harmonischer Oszillator ::::::::::::::::::::::::::::::::: Ein wichtiger Sonderfall der im letzten Paragraphen gefundenen Ergebnisse ist der des eindimensionalen harmonischen Oszillators mit Potential V (q) = 12 mω 2 q 2 . Die Hamilton-Funktion ist H(q, p) = p2 1 + mω 2 q 2 , 2m 2 (IV.7) 89 IV.1 Hamilton’sche Bewegungsgleichungen entsprechend den Hamilton’schen Bewegungsgleichungen dq(t) p(t) = dt m (IV.8a) und dp(t) = −mω 2 q(t). (IV.8b) dt Diese zwei gekoppelten Differentialgleichungen können natürlich kombiniert werden, um die übliche Differentialgleichung zweiter Ordnung mq̈(t) + mω 2 q(t) = 0 zu geben. Stattdessen wird hiernach eine geeignete Linearkombination von q(t) und p(t) eingeführt, um eine einfach lösbare Gleichung erster Ordnung zu erhalten. Sei r p(t) mω α(t) ≡ q(t) + i √ . (IV.9a) 2 2mω Die Phasenraumtrajektorie lässt sich durch α(t) und die komplexe konjugierte Funktion α(t)∗ ausdrücken: r 1 1 mω ∗ q(t) = √ α(t) + α(t) , p(t) = α(t) − α(t)∗ . (IV.9b) i 2 2mω p √ Die Summe aus Gl. (IV.8a), multipliziert mit mω/2, und Gl. (IV.8b) multipliziert mit i/ 2mω gibt dα(t) = −iω α(t). (IV.10) dt Diese gewöhnliche Differentialgleichung erster Ordnung lässt sich sofort lösen: wenn α0 die Anfangsbedingung bei t = 0 bezeichnet, gilt α(t) = α0 e−iωt , (IV.11) woraus q(t) und p(t) über Gl. (IV.9b) folgen. Insbesondere ergibt sich das der Leserin schon bekannte oszillatorische Verhalten von q(t). 90 Hamilton-Formalismus IV.2 Kanonische Transformationen IV.2.1 Phasenraum-Funktionen Die verallgemeinerten Koordinaten {qa (t)} und die dazu konjugierten Impulse {pa (t)} bestimmen den Bewegungszustand eines mechanischen Systems zur Zeit t vollständig. Das heißt, jede mögliche Größe, um diesen Zustand zu charakterisieren — wie z.B. die Position, der Drehimpuls oder die gesamte Energie —, kann durch die Phasenraumkoordinaten des Systems ausgedrückt werden. Dementsprechend ist es sinnvoll, Funktionen von der Zeit t und den 2s Phasenraumkoordinaten {qa }, {pa } mit a = 1, . . . , s zu betrachten. Im Rest dieses Kapitels werden solche Funktionen der Kürze halber als „Phasenraum-Funktionen“ oder „Funktionen auf dem Phasenraum“ bezeichnet, auch wenn die Zeit auch Argument der Funktion ist. Dazu wird angenommen, dass sie beliebig differenzierbar sind, ohne dass das jedes Mal erwähnt wird. Bemerkung: Wenn die Funktion einer messbaren physikalischen Größe entspricht, anstatt ein ma- thematisches Konstrukt zu sein, wird sie auch Observable genannt. IV.2.2 Poisson-Klammer IV.2.2 a Definition :::::::::::::::::: Definition: Seien f und g zwei Funktionen von der Zeit t und den 2s Phasenraumkoordinaten {qa }, {pa } mit a = 1, . . . , s. Ihre Poisson (27) -Klammer ist ebenfalls eine Phasenraum-Funktion derselben Variablen, definiert durch s X ∂f ∂g ∂f ∂g f, g ≡ − , ∂qa ∂pa ∂pa ∂qa (IV.12) a=1 wobei die (t, q, p)-Abhängigkeit aller Funktionen nicht geschrieben wurde. Bemerkungen: ∗ In der Literatur sind Poisson-Klammern manchmal mit einem globale Vorzeichen vor der rechten Seite definiert. Um nur internationale Standardreferenzen zu nennen ist die hier verwendete Konvention die gleiche wie bei Arnold [1] oder Goldstein [4, 5], während Landau & Lifschitz [13, 24] die alternative Konvention benutzen. Auf ähnlicher Weise ist die Notation nicht universell: somit benutzen viele Autoren rechteckige Klammern [ · , · ] — z.B. Arnold, Goldstein oder Landau & Lifschitz — um die formelle Analogie mit dem Kommutator der Quantenmechanik zu betonen. ∗ Hiernach wird die Poisson-Klammer (IV.12) manchmal auch mit f, g q,p bezeichnet, d.h. mit expliziter Angabe der relevanten Phasenraumkoordinaten. Für die spätere Diskussion über kanonische Transformationen in § IV.2.4 ist es günstig, die Poisson-Klammer in einer Matrixform zu schreiben. Dafür führt man die s-dimensionalen Spaltenvektoren ∂f /∂q1 ∂f /∂p1 ∇q f ≡ ... und ∇p f ≡ ... (IV.13) ∂f /∂qs ∂f /∂ps ein. Diese können dann wiederum in einen Spaltenvektor mit insgesamt 2s Komponenten kombiniert (27) S. Poisson, 1781–1740 91 IV.2 Kanonische Transformationen werden. Dann ist die Poisson-Klammer von f und g durch f, g = (∇q f )T (∇p f )T 0 1s −1s 0 ! ∇q g ! ∇p g (IV.14) gegeben, mit (∇q f )T und (∇p f )T den Zeilenvektoren transponiert zu den Spaltenvektoren (IV.13) und 1s der s × s-Einheitsmatrix. IV.2.2 b Eigenschaften :::::::::::::::::::::: Die Poisson-Klammer besitzt einige mathematische Eigenschaften, die sich generell problemlos beweisen lassen und deshalb hiernach nur aufgelistet werden. Der Kürze halber werden die Abhängigkeit der verschiedener Funktion von ihren Variablen (t, q, p) nicht geschrieben. Bilinearität Seien f, g1 , g2 bzw. f1 , f2 , g drei Funktionen auf dem Phasenraum und λ1 , λ2 ∈ C. Dann gelten λ1 f1 + λ2 f2 , g = λ1 f1 , g + λ2 f2 , g , (IV.15) f, λ1 g1 + λ2 g2 = λ1 f, g1 + λ2 f, g2 . Antisymmetrie / Antikommutativität Für jedes Paar (f, g) von Funktionen auf dem Phasenraum gilt f, g = − g, f . (IV.16) Daraus folgt trivial f, f = 0. Nullelemente Sei K eine Zahl; die Funktion auf dem Phasenraum, die identisch konstant gleich K ist, ist ein Nullelement, d.h. ihre Poisson-Klammer mit jeder Funktion f auf dem Phasenraum verschwindet f, K = 0. (IV.17) Produktregel Für jedes Triplett (f, g, h) von Funktionen auf dem Phasenraum gelten f, gh = f, g h + g f, h (IV.18) sowie die Jacobi(28) -Identität {f, g}, h + {g, h}, f + {h, f }, g = 0. (IV.19) Im Gegensatz zu den anderen Eigenschaften, die sich in einer Zeile nachprüfen lassen, ist der Beweis dieser Identität mühsam. Jeder der drei Terme ist eine Summe über zwei Freiheitsgrade-Indizes von 8 Beiträgen, die selbst Produkte von zwei Ableitungen und einer doppelten Ableitung sind. Das Spiel besteht darin, Indizes zu umbenennen und die Vertauschung der Ordnung der Ableitungen zu benutzen, um das gesuchte Ergebnis zu finden. Bemerkungen: ∗ Für die dritte Eigenschaft ist eigentlich nur die Unabhängigkeit der Funktion K von den Phasenraumkoordinaten nötig: die „Konstante“ kann noch von der Zeit abhängen, entsprechend einer auf dem Phasenraum gleichförmigen Funktion, ohne den Nullwert deren Poisson-Klammer mit jeder anderen Funktion zu ändern. ∗ Versehen mit der Addition und der Poisson-Klammer bildet die Menge der Funktionen auf dem Phasenraum eines Systems eine Algebra. 92 Hamilton-Formalismus IV.2.3 Poisson-Klammer und Zeitentwicklung Mit Hilfe der Poisson-Klammer lässt sich die Zeitentwicklung einer Phasenraumfunktion elegant umschreiben. IV.2.3 a Zeitentwicklung einer Phasenraumfunktion :::::::::::::::::::::::::::::::::::::::::::::::::::: Sei jetzt f eine beliebige Funktion auf dem Phasenraum eines physikalischen Systems, dessen Hamilton-Funktion H als bekannt angenommen wird. Die Anwendung der Kettenregel gibt für die totale Ableitung von f nach der Zeit s s X X ∂f t, q(t), p(t) df t, q(t), p(t) ∂f t, q(t), p(t) ∂f t, q(t), p(t) q̇a (t) + ṗa (t). = + dt ∂t ∂qa ∂pa a=1 a=1 Dabei können die Zeitableitungen q̇a (t), q̇a (t) der Koordinatenfunktionen mithilfe der Hamilton’schen Bewegungsgleichungen (IV.4) umgeschrieben werden: s s df ∂f X ∂f ∂H X ∂f ∂H − , = + dt ∂t ∂qa ∂pa ∂pa ∂qa a=1 a=1 wobei alle Funktionen im gleichen Punkt t, q(t), p(t) zu betrachten sind. Unter Verwendung der Poisson-Klammer (IV.12) lautet diese Zeitableitung df ∂f = + f, H . dt ∂t (IV.20) Insbesondere werden die Hamilton’schen Bewegungsgleichungen (IV.4) zu dqa = qa , H dt für a = 1, . . . , s, (IV.21) dpa = pa , H dt weil die Projektionen qa t, q(t), p(t) = qa , pa t, q(t), p(t) = pa auf die Koordinatenachsen der Position im Phasenraum trotz ihrer Notation keine explizite Funktion der Zeit sind. Bemerkung: Wegen der Bilinearität (IV.15) der Poisson-Klammer ist die Abbildung f 7→ f, H bei gegebener Hamilton-Funktion H eine lineare Abbildung. IV.2.3 b Integrale der Bewegung :::::::::::::::::::::::::::::::: In Übereinstimmung mit Definition (I.57) ist eine Funktion K der Zeit t und der Phasenraumkoordinaten eine Konstante der Bewegung, auch Integral der Bewegung genannt, wenn sie konstant entlang der Trajektorie eines System im Phasenraum bleibt, d.h. wenn dK/dt = 0. Laut Gl. (IV.21) ist diese Anforderung äquivalent zu ∂K + K, H = 0, ∂t d.h. unter Verwendung der Antikommutativität (IV.16) der Poisson-Klammer K t, q, p Integral der Bewegung ⇔ ∂K = H, K . ∂t (IV.22) Dank der Poisson-Klammer können auch — zumindest prinzipiell — neue Integrale der Bewegung gefunden werden, dank dem Theorem (Satz vonPoisson): Seien K1 , K2 zwei Konstanten der Bewegung. Dann ist ihre Poisson Klammer K1 , K2 auch eine Erhaltungsgröße. 93 IV.2 Kanonische Transformationen Beweis: die Jacobi-Identität (IV.19) mit f = K1 , g = K2 , h = H1 gibt H, {K1 , K2 } = {K2 , H}, K1 + {H, K1 }, K2 d.h. nach Verwendung der Beziehung (IV.22) für beide Konstanten der Bewegung o ∂ n ∂K2 o n ∂K1 + H, {K1 , K2 } = K1 , , K2 = K1 , K2 , ∂t ∂t ∂t wobei die letzte Gleichung aus dem Austauschen vonpartiellen Ableitung nach der Zeit und nach Phasenraumkoordinaten folgt. Somit ist K1 , K2 laut Gl. (IV.22) erhalten. 2 Bemerkung: In der Praxis ist dieser Satz nicht so nützlich, denn seine Anwendung führt schnell entweder zur Nullfunktion, oder zu einem Integral der Bewegung, das abhängig von den schon bekannten Integralen ist, und somit nicht „neu“ ist. Eigentlich kann ein System mit s Freiheitsgraden maximal 2s − 1 unabhängige Konstanten der Bewegung haben. IV.2.4 Kanonische Transformationen Es kann günstig sein, Koordinatentransformationen im Phasenraum durchzuführen. IV.2.4 a Fundamentale Poisson-Klammern :::::::::::::::::::::::::::::::::::::::::: Seien {qa }a=1,...,s verallgemeinerte Koordinaten und {pa }a=1,...,s die zugehörigen konjugierten Impulse. Aus der Definition der Poisson-Klammer zweier Funktionen (IV.12) und der Tatsache, dass die Phasenraumkoordinaten unabhängig voneinander sind, folgen die fundamentalen PoissonKlammern qa , qb = pa , pb = 0 (IV.23) qa , pb = δab Bemerkung: Da die Poisson-Klammer zweier Funktionen selbst eine Funktion von der Zeit und der Phasenraumkoordinaten ist, bedeutet δab hier die Funktion, die identisch Null für a 6= b, identisch 1 für a = b ist. Der Beweis der Beziehungen (IV.23) ist trivial. Beispielsweise gilt s s X X ∂qa ∂pb ∂qa ∂pb qa , pb = − = δac δbc , ∂qc ∂pc ∂pc ∂qc c=1 c=1 wobei die zweite Gleichung die Unabhängigkeit der Koordinaten ausdrückt und zu qa , pb = δab führt. Definition: Wenn Phasenraumkoordinaten {qa }, {pa } die Gleichungen (IV.23) erfüllen, so heißen sie kanonische Variablen. IV.2.4 b Koordinatentransformation im Phasenraum :::::::::::::::::::::::::::::::::::::::::::::::::::: Wir betrachten eine allgemeine Koordinatentransformation im Phasenraum Qa = Qa (t, q, p) {qa }, {pa } → {Qa }, {pa } mit für a = 1, . . . , s. Pa = Pa (t, q, p) (IV.24) Unter diese Transformation der Koordinaten ändert sich im Allgemeinen auch die funktionale Form der Phasenraum-Funktion, welche eine gewisse physikalische Größe ausdrückt. Das heißt, eine Funktion f der alten Koordinaten q ≡ {qa }, p ≡ {pa } soll durch eine Funktion F der neuen Koordinaten 94 Hamilton-Formalismus Q ≡ {Qa }, P ≡ {Pa } ersetzt werden. Die beiden Funktion stehen in Zusammenhang zu einander, weil sie die Beziehung F t, Q(t, q, p), P(t, q, p) = f (t, q, p) erfüllen müssen. Beispiel: Sei ein System mit einem einzigen Freiheitsgrad, beschrieben durch kanonisch konjugierte Variablen q, p, mit der Hamilton-Funktion h(q, p) = a 1 b + p2 q 4 , 2 q2 2 (IV.25) wobei a und b positiv sind. Die Hamilton’schen Bewegungsgleichungen lauten q̇ = ∂h = bpq 4 , ∂p ṗ = − ∂h a = 3 − 2bp2 q 3 . ∂q q Wird die erste Gleichung nach der Zeit abgeleitet bzw. nach p umgestellt, so ergibt sich q̈ = b ṗq 4 + 4bpq 3 q̇, p= bzw. Daraus folgt die Bewegungsgleichung q̈ = abq + 2 q̇ . bq 4 q̇ 2 , q deren Lösung auf erster Sicht nicht trivial aussieht. Führt man aber die Koordinatentransformation Q = pq 2 , P = 1 q (IV.26) durch, so nimmt die Hamilton-Funktion die bekannte Form a 2 b 2 P + Q , 2 2 entsprechend einem harmonischen Oszillator mit Masse m = 1/a und natürlicher Kreisfrequenz ω 2 = ab. Was aber noch nicht klar ist, ist ob die Bewegungsgleichungen in den neuen Koordinaten (Q, P ) die gleiche Form wie in den alten erhält, mit Hamilton-Funktion H(Q, P ) statt h(q, p). H(Q, P ) = IV.2.4 c Kanonische Transformationen ::::::::::::::::::::::::::::::::::::::: Sei nun g eine neue Funktion der alten Koordinaten q, p und G die damit assoziierte Funktion der neuen Koordinaten Q, P: G t, Q(t, q, p), P(t, q, p) = g(t, q, p). Definition: Eine Koordinatentransformation (IV.24) im Phasenraum heißt kanonische Transforma- tion, wenn sie die Poisson-Klammer zweier beliebigen Funktionen unverändert lässt, d.h. f, g q,p = F, G Q,P . (IV.27) Insbesondere sollen die fundamentalen Poisson-Klammern in den neuen Koordinaten Qa , Qb Q,P = Pa , Pb Q,P = 0 , Qa , Pb Q,P = δab (IV.28) sein. Reziprok kann man zeigen, dass wenn die fundamentalen Poisson-Klammern in den neuen Phasenraumvariablen die kanonische Form (IV.28) annehmen, dann ist die Koordinatentransformation kanonisch. IV.2 Kanonische Transformationen 95 Bemerkung: Anstatt der mathematisch korrekten Notation F , G für die Funktionen der neuen Variablen Q, P einzuführen, benutzen Physiker oft die gleiche Notation f und g, auch wenn die mathematische Form nicht die gleiche wie in den alten Variablen q, p ist. Dementsprechend wird f, g q,p = f, g Q,P (IV.29) statt Gl. (IV.27) geschrieben. Transformation der Phasenraumkoordinaten für s = 1 Seien f , g zwei Funktionen der Phasenraumkoordinaten q, p eines Systems mit einem einzigen Freiheitsgrad. Unter einer Koordinatentransformation (q, p) → (Q, P ) werden sie durch neue Funktionen F , G ersetzt mit f (t, q, p) = F t, Q(t, q, p), P(t, q, p) , g(t, q, p) = G t, Q(t, q, p), P(t, q, p) . Die Ableitung der ersten dieser Gleichungen nach einer der Phasenraumvariablen, zB q, gibt ∂f dF = ∂q dq d.h. unter Verwendung der Kettenregel ∂f ∂F ∂Q ∂F ∂P = + . ∂q ∂Q ∂q ∂P ∂q Ähnliche Gleichungen gelten für die Ableitung nach p oder für die Ableitungen von g, so dass die Poisson-Klammer von f und g sich als ∂f ∂g ∂f ∂g f, g q,p = − ∂q ∂p ∂p ∂q ∂G ∂Q ∂G ∂P ∂F ∂Q ∂F ∂P ∂G ∂Q ∂G ∂P ∂F ∂Q ∂F ∂P + + − + + = ∂Q ∂q ∂P ∂q ∂Q ∂p ∂P ∂p ∂Q ∂p ∂P ∂p ∂Q ∂q ∂P ∂q schreiben lässt. Beim Ausmultiplizieren des Terms auf der rechten Seite kommen acht Beiträge, wovon vier sich kürzen, während die vier übrigen Terme faktorisiert werden können. Insgesamt ergibt sich ∂F ∂G ∂F ∂G ∂Q ∂P ∂Q ∂P f, g q,p = − − , ∂Q ∂P ∂P ∂Q ∂q ∂p ∂p ∂q d.h. ∂(Q, P ) f, g q,p = F, G Q,P (IV.30a) ∂(q, p) mit ∂Q ∂Q ∂q ∂p ∂(Q, P ) ∂Q ∂P ∂Q ∂P ≡ − = det (IV.30b) ∂P ∂P ∂(q, p) ∂q ∂p ∂p ∂q ∂q ∂p Gleichung (IV.30a) zeigt, dass die Transformation (q, p) → (Q, P ) kanonisch ist, wenn die Determinante (IV.30b) gleich 1 ist. Beispiel: Kommt man zurück zum Beispiel des § IV.2.4 b, man prüft einfach nach, dass die Trans- formation (IV.26) eigentlich kanonisch ist. Transformation der Phasenraumkoordinaten für s > 1 Wie betrachten nur eine Transformation (q, p) → (Q, P) der Phasenraumkoordinaten für ein System mit s Freiheitsgraden, wobei s > 1 ist — eigentlich kann auch s = 1 sein. Laut Gl. (IV.14) lässt sich die Poisson-Klammer zweier Funktionen der Variablen (q, p) als ! ! ! 0 1s ∇q g ∇q g f, g q,p = (∇q f )T (∇p f )T ≡ (∇q f )T (∇p f )T J 2s (IV.31) −1s 0 ∇p g ∇p g 96 Hamilton-Formalismus schreiben, wobei die zweite Gleichung die 2s × 2s-Matrix J 2s definiert. Wie im Fall des Problems mit s = 1 Freiheitsgrad lassen sich die partiellen Ableitungen von f , g nach den Variablen qa , pa durch die Ableitungen von F , G nach den zugehörigen Variablen Qa , Pa ausdrücken; z.B. gelten s X ∂g dG ∂G ∂Qb ∂G ∂Pb = = + ∂qa dqa ∂Qb ∂qa ∂Pb ∂qa b=1 und s X dG ∂G ∂Qb ∂G ∂Pb ∂g = = + ∂pa dpa ∂Qb ∂pa ∂Pb ∂pa b=1 sowie ähnliche Gleichungen mit g bzw. G ersetzt durch f bzw. F . Führt man die vier folgenden s × s-Matrizen definiert durch ihre Elemente ∂Qb ∂Pb ∂Qb ∂Pb ∇q Q ab = , ∇q P ab = , ∇p Q ab = , ∇p P ab = , ∂qa ∂qa ∂pa ∂pa ein, so lassen sich die Beziehungen zwischen den partielle Ableitungen von g und denen von G in der kürzeren Matrix-Schreibweise ! ! ! ! ∇q g ∇q Q ∇q P ∇Q G ∇Q G = ≡Λ ∇p g ∇p Q ∇p P ∇P G ∇P G schreiben. Dabei stellt die 2s × 2s-Matrix Λ die Transformationsmatrix für die Koordinatentransformation unter Betrachtung dar. Die Transposition dieser Beziehung, mit g bzw. G ersetzt durch f bzw. F , lautet (∇q f )T (∇p f )T = (∇Q F )T (∇P F )T ΛT . Dies kann im Ausdruck (IV.31) der Poisson-Klammer von f und g eingesetzt werden. Somit ergibt sich ! ∇ G Q . f, g q,p = (∇Q F )T (∇P F )T ΛTJ 2s Λ ∇P G Andererseits gilt in den neuen Phasenraumkoordinaten F, G Q,P = (∇Q F )T (∇P F )T J 2s ! ∇Q G ∇P G . Vergleicht man beide Ausdrücke, man sieht dass die Transformation (q, p) → (Q, P) kanonisch ist, wenn die Anforderung ΛTJ 2s Λ = J 2s (IV.32) an die Transformationsmatrix Λ erfüllt ist. Bemerkung: Man prüft einfach nach, dass wenn zwei Transformationsmatrizen Λ 1 , Λ 2 der obigen Gleichung genügen, dann erfüllt sie auch das Produkt Λ 1 Λ 2 : anders gesagt ist das Hintereinanderausführen zweier kanonischer Transformation wieder eine kanonische Transformation. Die Matrizen, welche die Beziehung (IV.32) erfüllen, bilden die symplektische Gruppe Sp(2s). IV.3 Phasenraum IV.3 Phasenraum Literatur zum Kapitel IV • Fließbach, Mechanik [2] Teil V, Kap. 19–23 & Teil VI, Kap. 24–26. • Goldstein, Klassische Mechanik [4] = Classical Mechanics [5], Kap. 4.1–4.4, 5, & 6.1–6.3. • Greiner, Klassische Mechanik II [7] Kap. III & IV. • Nolting, Klassische Mechanik [15] Kap. 4. • Scheck, Mechanik [18] Kap. 3. 97 98 Hamilton-Formalismus Zweiter Teil Grundlagen der Speziellen Relativitätstheorie K APITEL V Mathematischer Apparat der Speziellen Relativitätstheorie Einleitung V.1 Einstein’sche Postulate V.1.1 Motivation Trotz der vielen Erfolge der klassischen Newton’schen Mechanik tritt ein wichtiges Problem auf, wenn man Effekte aus dem Elektromagnetismus betrachtet. Aus den Maxwell(r) -Gleichungen folgert man leicht, dass die Ausbreitungsgeschwindigkeit im Vakuum von elektromagnetischen Wellen — insbesondere von Licht, das laut Arbeiten von Hertz(s) ein elektromagnetisches Phänomen ist — denselben Wert (c) in allen Inertialsystemen annimmt. In der Tat zeigten die InterferenzExperimente von Michelson(t) und Morley(u) , dass die Lichtgeschwindigkeit parallel oder senkrecht zur (instantanen) Bewegungsrichtung der Erde um die Sonne gleich bleibt. Die theoretische Vorhersage sowie ihre experimentelle Bestätigung(29) lassen sich aber offensichtlich nicht mit dem Additionstheorem für Geschwindigkeiten in der Newton’schen Raumzeit vereinbaren. V.1.2 Einstein’sche Postulate Um die theoretisch und experimentell gefundene Konstanz der Vakuumlichtgeschwindigkeit zu berücksichtigen hat Einstein seine Postulate eingeführt [25], welche die durch Newton postulierten Gesetze ersetzen müssen. V.1.2 a Erstes Postulat ::::::::::::::::::::::: Das erste dieser Postulate ist das (Einstein’sche) Relativitätsprinzip Die Gesetze der Physik nehmen in allen Inertialsystemen die gleiche Form an. (V.1) Dabei handelt es sich um eine Erweiterung des sog. Galilei-Relativitätsprinzip — das eigentlich durch Newton formuliert wurde —, das aber nur für mechanische System galt. Mit seiner Verallgemeinerung meinte insbesondere Einstein, dass auch elektromagnetische Phänomene diesem Prinzip genügen sollen. V.1.2 b Zweites Postulat Mit seinem zweiten Postulat entschied sich Einstein gegen die Newton’schen Gesetze mit ihren Invarianz unter Galilei-Transformationen, und legte mehr Wert auf die Maxwell-Gleichungen und :::::::::::::::::::::::: (29) (r) ... vorausgesetzt, die Michelson–Morley-Experimente wirklich das Fortpflanzen von Licht im Vakuum messen, nicht in irgendeinem hypothetischen Medium — dem Äther —, wie damals vorgeschlagen wurde, um die NewtonMechanik zu retten. J. C. Maxwell, 1831–1879 (s) H. Hertz, 1857–1894 (t) A. Michelson, 1852–1931 (u) E. Morley, 1838–1923 102 Mathematischer Apparat der Speziellen Relativitätstheorie deren experimentellen Bestätigungen, indem er die Konstanz der Lichtgeschwindigkeit als grundsätzlich erklärte: Die Lichtgeschwindigkeit im Vakuum ist in allen Inertialsystemen gleich. (V.2) Demzufolge kann das klassische Additionsgesetz für Geschwindigkeiten nicht mehr gelten. Dies bedeutet wiederum, dass Galilei-Transformationen, insbesondere Galilei-Boosts, nicht die richtigen Transformationen zwischen Inertialsystemen sind. Wegen dieses Prinzip muss also die ganze Kinematik neu geschrieben werden. V.2 Lorentz-Transformationen In diesem Abschnitt sind B und B 0 zwei Inertialsysteme, wobei das letztere sich relativ zum ersteren mit der Geschwindigkeit ~u bewegt. t und ~r bzw. t0 und ~r 0 bezeichnen die Zeit und den Ortsvektor gemessen durch einen in B bzw. B 0 ruhenden Beobachter. V.2.1 Linienelement Seien P1 und P2 zwei Punkte, zwischen denen Vakuum herrscht. Zu einem ersten Zeitpunkt wird Licht in P1 emittiert. Für den Beobachter in B geschieht dies zur Zeit t1 bei der Position ~r1 ; für den Beobachter in B 0 , zur Zeit t01 bei der Position ~r01 . Das Licht wird zu einem späteren Zeitpunkt in P2 detektiert, und zwar für den Beobachter in B bzw. B 0 zur Zeit t2 bzw. t02 bei der Position ~r2 bzw. ~r20 . Laut dem zweiten Einstein’schen Postulat muss die Vakuumlichtgeschwindigkeit gleich c für beide Beobachter sein, d.h. 0 0 ~r2 − ~r1 ~r − ~r 0 ∆~r ∆~r 2 1 = c und =c ≡ ≡ t2 − t1 ∆t t02 − t01 ∆t0 oder äquivalent ∆~r = c∆t und ∆~r 0 = c∆t0 , oder noch 2 2 ∆~r = c2 ∆t2 und ∆~r 0 = c2 ∆t02 . Betrachtet man infinitesimal benachbarte Punkte P1 und P2 , und dementsprechend ein infinitesimales Zeitintervall für die Lichtpropagation, so kann man die Änderungen ∆~r, ∆t, usw. durch kleine Variationen d~r, dt, usw. ersetzen. Dann lässt sich die obige Beziehung als d~r 2 − c2 dt2 = d~r 02 − c2 dt 02 = 0. umschreiben. Sei ds2 ≡ −c2 dt2 + d~r 2 . (V.3a) Gemäß der obigen Diskussion muss dieses infinitesimale Linienelement dasselbe — und hier gleich Null — für beide Beobachter sein, damit beide dieselbe Lichtgeschwindigkeit im Vakuum messen. Seien jetzt P1 , P2 zwei beliebige Punkte derart, dass in beiden Orten zu gegebenen Zeitpunkten etwas passiert. Für den Beobachter in B bzw. B 0 findet das „erste“ Ereignis zur Zeit t1 bzw. t01 statt, als sich der Punkt P1 bei der Position ~r1 bzw. ~r10 befindet. Wiederum sind die jeweiligen Zeit- und Ortskoordinaten des „zweiten“ Ereignisses t2 ≡ t1 + dt und ~r2 ≡ ~r1 + d~r bzw. t02 ≡ t01 + dt0 und ~r20 ≡ ~r10 + d~r 0 . Dabei wird nichts über die Vorzeichen von dt und dt0 angenommen. Das Linienelement ds2 bzw. ds02 zwischen den beiden Ereignissen für den Beobachter in B bzw. 0 B kann wieder über Gl. (V.3a) definiert werden. Wenn B und B 0 beide Inertialsysteme sind, dann müssen ds2 und ds02 gleich sein. 103 V.2 Lorentz-Transformationen Diese Anforderung, die hier postuliert wird, wurde oben heuristisch hergeleitet für den Fall zweier Ereignisse, welche den aufeinanderfolgenden Emission und Detektion von Licht entsprechen. V.2.2 Lorentz-Transformationen In der Transformation der Zeit- und Ortskoordinaten zwischen zwei Inertialsystemen muss das oben definierte Linienelement ds2 invariant bleiben. Definition: Die linearen Transformationen c dt0 c dt =Λ d~r 0 d~r (V.4) mit Λ einer 4 × 4-Matrix, die das Linienelement ds2 ≡ −c2 dt2 + d~r 2 invariant lassen, heißen Lorentz-Transformationen. Es gibt zwei Haupttypen solcher Transformationen, und zwar einerseits Drehungen (§ V.2.2 a) — unter welchen das Zeitintervall dt sich nicht ändert — und Lorentz-Boosts (§ V.2.2 b). V.2.2 a Drehungen :::::::::::::::::: Einfache Lorentz-Transformationen sind die Drehungen der Raumkoordinaten, welche die Zeit invariant lassen, und somit den Drehungen im dreidimensionalen Ortsraum der nicht-relativistischen Mechanik entsprechen. Solche Transformationen gelten für zwei Koordinatensysteme, die sich relativ zueinander nicht bewegen, deren Achsen aber nicht parallel sind. Die assoziierte Transformationsmatrix lautet 1 0 (V.5) Λ= 0 R mit R einer 3 × 3-Drehmatrix. In der Tat führt c dt c dt0 = R d~r d~r 0 (V.6) mit der Bedingung R T R = 13 sofort zu d~r 02 − c2 dt 02 = d~rT R TR d~r − c2 dt2 = d~r 2 − c2 dt2 . V.2.2 b Lorentz-Boosts ::::::::::::::::::::::: Sei jetzt angenommen, dass die Achsen des Koordinatensystems von B 0 parallel zu den Achsen von B sind. Jetzt bewegt sich B 0 relativ zu B mit Geschwindigkeit ~u. Der Einfachheit halber wird angenommen, dass die x = x0 -Richtung der Koordinaten entlang der Bewegungsrichtung liegt, d.h. ~u = u~ex . y B t y0 B0 t0 x O ~r z • P ~u z0 Abbildung V.1 x0 O0 ~r 0 104 Mathematischer Apparat der Speziellen Relativitätstheorie Da nichts in den Richtungen y = y 0 und z = z 0 senkrecht zur Bewegung passiert, bleiben die Koordinaten eines Punkts entlang dieser Achsen unverändert in der Transformation von B nach B 0 . Demzufolge gelten dy 0 = dy und dz 0 = dz für das Intervall zwischen benachbarten Punkten. Diese senkrechten Richtungen sollen sich auch nicht mit den anderen Koordinaten mischen, d.h. dt0 , dx0 sind unabhängig von dy, dz. Daher ist die gesuchte Matrix der Transformation der Art c dt0 A B 0 0 c dt dx0 C D 0 0 dx dy 0 = 0 0 1 0 dy dz 0 0 0 0 1 dz mit A, B, C, D drei reellen Zahlen. Dann lautet das Linienelement in B 0 ds02 = −(Ac dt + B dx)2 + (Cc dt + D dx)2 + dy 2 + dz 2 = −(A2 − C 2 )c2 dt2 + (D2 − B 2 ) dx2 + 2(CD − AB)c dt dx + dy 2 + dz 2 , was gleich ds2 = −c2 dt2 + dx2 + dy 2 + dz 2 sein muss. Beliebige dt und d~r genügen dieser Gleichung nur genau dann, wenn das System 2 2 A − C = 1 D2 − B 2 = 1 CD − AB = 0 erfüllt wird. Seien A ≡ γ und B ≡ −βγ. p Dann stellen sie mit C =B = −βγ und D = A = γ eine Lösung des 2 Systems dar, wenn γ = 1/ 1 − β ist. Dazu soll β = ~u /c, um den richtigen nicht-relativistischen Limes u = ~u c wiederzufinden (s. unten). Schließlich lautet die Matrix für ein Lorentz-Boost, auch spezielle Lorentz-Transformation genannt, γ −βγ 0 0 −βγ γ 0 0 Λ= (V.7a) 0 0 1 0 0 0 0 1 mit 1 γ=p 1 − β2 , β≡ u . c (V.7b) γ heißt Lorentz-Faktor des Boosts. Im nicht-relativistischen Limes u c, d.h. β 1, gibt eine Taylor-Entwicklung 1 β2 p ∼ 1+ + O(β 4 ), 2 2 1 − β β1 (V.8) so dass βγ ∼ β + O(β 3 ) ist. Aus Gl. (V.4) und der Form (V.7a) des Lorentz-Boosts folgen dann c dt0 = c dt + O(β) und dx0 = −βc dt0 + dx + O(β 2 ). Die erste Gleichung gibt t0 = t + Konstante, während die zweite mit β = u/c zu dx0 = dx − u dt oder äquivalent x0 = x − ut führt, entsprechend dem bekannten nicht-relativistischen Ergebnis für ein Galilei-Boost entlang der x-Achse. Bemerkung: Rapidität des Lorentz-Boosts... später! ξu ≡ artanh u 1 c+u = ln . c 2 c−u (V.9) 105 V.2 Lorentz-Transformationen V.2.2 c Lorentz-Gruppe ::::::::::::::::::::::: Allgemeiner bilden die linearen Transformationen (ct,~r) → (ct0 ,~r 0 ), die das Linienelement ds2 [Gl. (V.3a)] invariant lassen, eine Gruppe, die Lorentz-Gruppe. Wie wir unten (§ V.2.4 b) sehen werden, lassen sich diese Transformationen noch äquivalent dadurch charakterisieren, dass ihre Matrixdarstellung Λ die Gleichung η = ΛT ηΛ (V.10) erfüllen, wobei η in Gl. (V.18) definiert ist. Dass die Menge solcher Matrizen versehen mit der üblichen Matrixmultiplikation eine Gruppe bilden ist dann schnell bewiesen: • Die 4 × 4-Einheitsmatrix 14 — entsprechend der Identitätstransformation — genügt die Beziehung (V.10). • Wenn Λ1 , Λ2 die Gl. (V.10) erfüllen, dann gilt das noch für ihr Produkt Λ1 Λ2 . • Aus Gl. (V.10) folgt |det Λ| = 1, d.h. Λ ist invertierbar; die inverse Matrix Λ−1 erfüllt trivial die definierende Beziehung. Die Lorentz-Gruppe wird oft mit O(1,3) bezeichnet. Sowohl die Drehungen des § V.2.2 a als die Lorentz-Boosts des § V.2.2 b, die je eine Untergruppe der Lorentz-Gruppe bilden, sind sog. eigentliche orthochrone Lorentz-Transformationen, Elemente der eigentlichen orthochronen Lorentz-Gruppe SO+ (1,3).(30) Bei den eigentlichen LorentzTransformationen handelt es sich um solche mit Determinante +1; diese bilden die eigentliche Lorentz-Gruppe, die mit SO(1,3) bezeichnet wird. Wiederum sind die orthochronen Lorentz-Transformationen diejenigen, welche die Richtung der Zeitkomponente nicht ändern. Das heißt, das Matrixelement oben links in der Matrixdarstellung 0 Λ — das in Abschn. V.3 mit Λ0 0 bezeichnet wird — muss positiv, und in der Tat größer gleich 1, sein. Diese Transformationen bilden die orthochrone Lorentz-Gruppe O+ (1,3).(30) Beispiele von uneigentlichen (det Λ = −1) Lorentz-Transformationen sind einerseits die Raumspiegelung (ct,~r) → (ct0 = ct,~r 0 = −~r) mit der Matrixdarstellung 1 0 0 0 0 −1 0 0 ΛP = (V.11) 0 0 −1 0 0 0 0 −1 und andererseits die Zeitumkehr (ct,~r) → (ct0 = −ct,~r 0 =~r) mit Matrixdarstellung −1 0 0 0 0 1 0 0 ΛT = 0 0 1 0 , 0 0 0 1 (V.12) die offensichtlich auch nicht orthochron ist. Dann ist die (kommutierende) Verknüpfung beider Transformationen, mit Matrixdarstellung ΛP ΛT = −14 , eine nicht-orthochrone eigentliche LorentzTransformation. Mathematisch stellen die eigentliche orthochrone Lorentz-Gruppe SO+ (1,3) und die drei Mengen SO− (1,3) ≡ {ΛP ΛT Λ, Λ ∈ SO+ (1,3)}, {ΛP Λ, Λ ∈ SO+ (1,3)} und {ΛT Λ, Λ ∈ SO+ (1,3)} die vier Zusammenhangskomponenten der Lorentz-Gruppe O(1,3) dar, entsprechend jeweils den vier Möglichkeiten ++, +−, +−, −+ für die Vorzeichen der Determinante det Λ und des Matrix0 elements Λ0 0 . (30) Statt O+ (1,3) bzw. SO+ (1,3) wird auch die Notation SO↑ (1,3) bzw. SO↑ (1,3) benutzt. 106 Mathematischer Apparat der Speziellen Relativitätstheorie V.2.3 Folgerungen V.2.3 a Zeitdilatation :::::::::::::::::::: V.2.3 b Längenkontraktion :::::::::::::::::::::::::: → Aufgabe 30 V.2.3 c Additionstheorem für Geschwindigkeiten ::::::::::::::::::::::::::::::::::::::::::::::::: → Aufgabe 34 V.2.4 Minkowski-Raum Wegen der Absolutheit von Zeit und Raum in der Newton’schen Mechanik faktorisiert sich die zugehörige nicht-relativistische Raumzeit in das Produkt einer eindimensionalen Zeit-Geraden mit dem dreidimensionalen euklidischen OrtsraumE 3 . Dagegen mischen die Lorentz-Boosts die Zeit und die Ortskomponenten eines Beobachters miteinander. Demzufolge lohnt es sich, die Zeit und die drei Ortskoordinaten als Komponenten eines Vektors in einer vierdimensionalen reellen Raumzeit M 4 . V.2.4 a Viererortsvektor :::::::::::::::::::::::: Ein Punkt in M 4 , entsprechend einem Zeitpunkt und einem Ort, wird Ereignis genannt. Sei B ein Bezugssystem, versehen mit einem Koordinatensystem, wobei die räumliche Koordinaten kartesisch sind. Nach deren Angabe lässt sich ein Ereignis durch seinen Viererortsvektor x mit Komponenten xµ mit µ = 0, 1, 2, 3 charakterisieren, wobei x0 = ct, während die xi mit i = 1, 2, 3 die Koordinaten des Ortsvektors ~r sind. Der Kurze halber wird hiernach für die Zerlegung in Zeit- und Ortskoordinaten die Notation 0 x x1 ct (V.13) x≡ x2 = ~r x3 benutzt. Definition: Die Trajektorie eines Massenpunktes in der Raumzeit heißt Weltlinie. Betrachte man einen bewegten Massenpunkt und B0 ein Inertialsystem, das momentan mit dem Ruhesystem des Massenpunktes übereinstimmt. Das heißt, dass der Massenpunkt relativ zu B0 momentan ruht. Sei τ die Zeit in B0 ; τ heißt Eigenzeit des Massenpunktes, und das Linienelement entlang der Weltlinie des Massenpunktes lässt sich momentan als ds2 = −c2 dτ 2 schreiben. Sei t die Zeit in einem Inertialsystem B, relativ zu welchem der Massenpunkt (oder äquivalent das Inertialsystem B0 ) sich mit Geschwindigkeit ~v bewegt. Das Eigenzeitelement dτ hängt mit dem infinitesimalen Zeitintervall dt in B über r ~v 2 dτ = 1 − 2 dt (V.14) c zusammen, wie sich mithilfe der Lorentz-Transformation von B0 nach B finden lässt. V.2.4 b Metrischer Tensor :::::::::::::::::::::::::: Bezeichnet man dann mit dx die Verschiebung zwischen zwei benachbarten Ereignissen in M 4 , dann lässt sich das Linienelement (V.3a) als ds2 = − dx0 2 + dx1 2 + dx2 schreiben, mit dxµ , µ = 0, 1, 2, 3 den Koordinaten von dx. 2 + dx3 2 (V.15) 107 V.2 Lorentz-Transformationen Für µ, ν = 0, 1, 2, 3 definiert man ηµν durch η00 = −1 ηii = +1 für i = 1, 2, 3 ηµν = 0 für µ 6= ν. (V.16) Mithilfe dieser Zahlen lautet das Linienelement (V.15) noch ds2 = ηµν dxµ dxν , (V.17) wobei die Summe über alle Werte von µ und ν von 0 bis 3 nicht geschrieben wurde. In Matrixdarstellung wird ηµν zum Element der (µ+ 1)-ten Zeile und (ν +1)-ten Spalte einer 4×4-Matrix: −1 0 0 0 0 1 0 0 η= (V.18) 0 0 1 0 0 0 0 1 und das Linienelement wird zu ds2 = dxT η dx (V.19) mit dxT dem Zeilenvektor mit Elementen dxµ . Die 16 Zahlen ηµν sind die Komponenten des metrischen Tensors (31) η . Dieser dient dazu, ein (pseudo-)skalares Produkt zu definieren, vgl. § V.3.2 c, welches unter Lorentz-Transformationen der Koordinaten invariant bleibt. Wiederum bedeutet dies, dass der metrische Tensor unter solchen Koordinatentransformationen x → x0 = Λx bzw. dx → dx0 = Λdx invariant bleibt, d.h. dass seine Komponenten gleich bleiben. nach Einsatz von dx0 und dx0T in Beziehung (V.19) ergibt sich die Matrixgleichung ΛT ηΛ = η. (V.20) Die Raumzeit M 4 versehen mit dem metrischen Tensor η heißt Minkowski (v) -Raum. Wiederum ist ein System von Minkowski-Koordinaten ein Koordinatensystem in M 4 , in welchem die Komponenten des metrischen Tensors die einfache Form (V.16) annehmen(32) — was im Folgenden immer der Fall sein wird. Bemerkungen: ∗ Ein Merkmal des Minkowski-Raums M 4 der Speziellen Relativitätstheorie ist die Existenz von globalen Minkowski-Koordinatensystemen, deren Koordinaten überall und zu jeder Zeit gelten — obwohl M 4 mathematisch kein Vektorraum, sondern eine vierdimensionale Mannigfaltigkeit ist. ∗ In diesem Skript wurde der metrische Tensor nach den Lorentz-Transformationen eingeführt; jedoch die logische Herangehensweise, die oben nur implizit benutzt wurde, geht eher in die andere Richtung: der metrische Tensor wird zunächst postuliert, dann sind die Lorentz-Transformationen die zugehörigen Isometrien, d.h. die linearen Koordinaten, die das entsprechende Skalarprodukt invariant lassen. Dementsprechend kann die Matrixgleichung (V.20) eigentlich als die definierende Beziehung der Lorentz-Transformationen betrachtet werden. ∗ Hier wurden für den metrischen Tensor und seine natürliche Matrixdarstellung unterschiedliche Notationen η bzw. η verwendet, um den Unterschied zwischen den beiden mathematischen Objekten zu betonen. (31) (32) (v) Oder kurz Metrik . Das heißt, dass die zugehörigen Basisvektoren ein orthonormiertes System bilden. H. Minkowski, 1864–1909 108 Mathematischer Apparat der Speziellen Relativitätstheorie V.3 Vierervektoren und Vierertensoren Die in Abschn. V.2 eingeführten Lorentz-Transformationen geben die Beziehungen zwischen den Minkowski-Koordinaten eines gegebenen Ereignisses bezüglich zwei verschiedener Inertialsysteme B und B 0 . In diesem Übergang von B nach B 0 können sich die mathematischen Darstellungen physikalischer Größen nicht nur wie der Viererortsvektor x, sondern auch anders transformieren. Der Kürze halber wird hiernach die Redensart „unter Lorentz-Transformationen“ statt „im Übergang von einem Inertialsystem zu einem anderen“ verwendet, wobei die besagte Transformation diejenige für die Viererortsvektoren [Gl. (V.22)] ist. V.3.1 Lorentz-Skalare Definition: Ein Lorentz-Skalar oder Viererskalar ist eine Größe, die invariant unter Transformationen von einem Inertialsystem zu einem anderen ist. Ein erstes Beispiel davon ist (definitionsgemäß!) das Linienelement (V.3a) bzw. (V.17). Demzufolge ist das Eigenzeitelement dτ ebenfalls ein Lorentz-Skalar. Ein weiteres Beispiel ist das Vierervolumenelement d4 x, definiert durch d4 x ≡ dx0 dx1 dx2 dx3 . (V.21) Wenn der 4-Ortsvektor sich gemäß x → x0 = Λx transformiert, entsprechend Gl. (V.22b) für die Koordinaten, dann transformiert sich das 4-Volumenelement gemäß d4 x → d4 x0 = |det Λ| d4 x, woraus das Ergebnis dank |det Λ| = 1 folgt. Bemerkung: Man definiert auch Lorentz-Pseudoskalare, die invariant unter der eigentlichen Lorentz- Gruppe sind, jedoch unter uneigentlichen Transformationen wie Raumspiegelung oder Zeitumkehr ihr Vorzeichen ändern. V.3.2 Vierervektoren Der Viererortsvektor x mit Komponenten xµ [Gl. (V.13)] ist ein erstes Beispiel von Vierervektor, der sich im Übergang von einem Inertialsystem B nach einem zweiten Inertialsystem B 0 gemäß x → x0 = Λx (V.22a) mit Λ einer Lorentz-Transformation transformiert, entsprechend für die Koordinaten 0 0 xµ → xµ = Λµν xν für µ0 = 00 , 10 , 20 , 30 . (V.22b) Wie es sich herausstellt, gibt es zwei unterschiedliche Arten von Vierervektoren, die sich entweder wie x oder wie der damit assoziierte Vierergradient transformieren. Bemerkungen: ∗ Aus Gl. (V.22b) folgt die Beziehung 0 0 Λµν ∂xµ = ∂xν ∀µ0 , ν. (V.23) ∗ In der Tat sind die Lorentz-Transformationen nicht die einzigen linearen Transformationen, die das Linienelement (V.3a) invariant lassen. Daneben gibt es noch die affinen Transformationen der Poincaré (w) -Gruppe (oder inhomogenen Lorentz-Gruppe) ISO(1,3), der Form x → x0 = Λx + a (w) H. Poincaré, 1854–1912 (V.24a) 109 V.3 Vierervektoren und Vierertensoren mit a einem Vierervektor; komponentenweise lautet diese Transformation 0 0 0 xµ → xµ = Λµν xν + aµ . (V.24b) Die Poincaré-Transformationen mit Λ = 14 und beliebigem a sind offensichtlich die RaumzeitTranslationen. V.3.2 a Kontravariante Vierervektoren :::::::::::::::::::::::::::::::::::::: Definition: Ein sog. kontravarianter Vierervektor V ist eine Menge aus vier Zahlen V µ , die sich unter Lorentz-Transformationen wie die Koordinaten xµ des Viererortsvektors transformieren, d.h. 0 0 V µ → V µ = Λµν V ν , (V.25a) V → V0 = ΛV. (V.25b) oder in Matrixform Ein Beispiel ist die Vierergeschwindigkeit u, eines massiven Teilchens (Massenpunktes) entlang seiner Weltlinie x(s), die als dx(s) u≡ (V.26a) dτ definiert ist, mit s einer Parametrisierung der Weltlinie und τ der Eigenzeit des Teilchens. Komponentenweise lautet diese Definition dX µ (s) uµ ≡ (V.26b) dτ mit uµ bzw. xµ (s) den Koordinaten der Vierergeschwindigkeit bzw. der Weltlinie. Dass u ein kontravarianter Vierervektor ist, folgt aus der Tatsache, dass das Eigenzeitelement dτ im Zähler ein Lorentz-Skalar ist. Wenn v i , i = 1, 2, 3 die Komponenten der dreidimensionalen Geschwindigkeit ~v des Teilchens und γ den damit assoziierten Lorentz-Faktor bezeichnen, dann lauten die Koordinaten der Vierergeschwindigkeit u0 = γc und ui = γv i für i = 1, 2, 3, d.h. γc u= . (V.27) γ~v Bemerkung: Für ein masseloses Teilchen, z.B. ein Photon, wird die Vierergeschwindigkeit nicht definiert, da solche Teilchen kein Ruhesystem haben, in welchem die Eigenzeit definiert werden kann: sie bewegen sich entlang lichtartige Weltlinien (s. unten). V.3.2 b Kovariante Vierervektoren :::::::::::::::::::::::::::::::::: Seien ∂µ ≡ ∂ /∂xµ die Komponenten des Vierergradient-Operators: ∂ 1∂ ∂ , ∂i ≡ = für i = 1, 2, 3, (V.28) 0 ∂x c ∂t ∂xi wobei die drei räumlichen Komponenten genau die Koordinaten des dreidimensionalen Gradienten sind. Mithilfe der Kettenregel gilt unter der Transformation (V.22) ∂0 ≡ 0 ∂ν ≡ ∂xρ ∂ ∂ ρ0 ∂ ρ0 = 0 = Λ ν 0 = Λ ν ∂ρ0 . ν ν ρ ρ ∂x ∂x ∂x ∂x (V.29) Sei Λµρ0 das (µ, ρ0 )-Element der inversen Matrix Λ−1 , d.h. 0 Λµρ0 Λρ ν = δνµ 0 0 und Λµρ Λρ ν 0 = δνµ0 . (V.30) Multipliziert man Gl. (V.29), die für jedes ν ∈ {0, 1, 2, 3} gilt, mit Λν µ0 und summiert man über ν, 110 Mathematischer Apparat der Speziellen Relativitätstheorie so ergibt sich 0 0 Λν µ0 ∂ν = Λν µ0 Λρ ν ∂ρ0 = δµρ 0 ∂ρ0 , d.h. ∂µ0 = Λν µ0 ∂ν . (V.31) Somit transformiert sich der Vierergradient mit Λ−1 , wenn der Ortsvektor sich mit Λ transformiert. Definition: Ein kovarianter Vierervektor ist eine Menge aus vier Größen Wµ , die sich unter Lorentz- Transformationen wie die Komponenten ∂µ des Vierergradienten verhalten, d.h. Wµ → Wµ0 = Λν µ0 Wν . (V.32) Jedem kontravarianten Vierervektor mit Koordinaten V µ kann man einen kovarianten Vierervektor mit Komponenten Vµ gemäß Vµ = ηµν V ν (V.33) zuordnen. In einer Basistransformation ändern sich V ν bzw. ηµν gemäß 0 0 V ν → V ν = Λν ρ V ρ bzw. ηµν → ηµ0 ν 0 = Λµµ0 Λν ν 0 ηµν vgl. Gl. (V.25a) bzw. (V.42). Dann kommt 0 0 Vµ → Vµ0 = ηµ0 ν 0 V ν = Λµµ0 Λν ν 0 ηµν Λν ρ V ρ = Λµµ0 ηµν δρν V ρ , wobei die letzte Gleichung aus Gl. (V.30) folgt. Schreibt man dann ηµν δρν V ρ = ηµν V ν = Vµ , so ergibt sich Vµ → Vµ0 = Λµµ0 Vµ , 2 was zu beweisen war. Umgekehrt kann mit jedem kovarianten Vierervektor mit Komponenten Vµ der kontravariante Vierervektor mit Komponenten V µ = η µν Vν (V.34) assoziiert werden, mit η µν den Komponenten des inversen metrischen Tensors η−1 , die numerisch gleich den ηµν sind, vgl. § V.3.3 b. Unter Verwendung des metrischen Tensors (V.16) findet man V0 = −V 0 , V1 = V 1 , V2 = V 2 , V3 = V 3 . (V.35) Bemerkungen: ∗ Bezeichnet man den 4-komponentigen Zeilenvektor mit Koordinaten Wµ mit W, so lässt sich die e Transformation (V.32) noch in Matrixdarstellung als W → W0 = W Λ−1 e e e schreiben. Dann lautet Gl. (V.33) bzw. (V.34) (V.36) V = VT ηT bzw. V = η−1 VT , (V.37) e e T wobei η in der ersten Gleichung durch η ersetzt werden kann, weil der metrische Tensor — und damit seine Matrixdarstellung — symmetrisch ist. Mit dieser Änderung ist die zweite Gleichung die transponierte der ersten. ∗ Kontravariante und kovariante Vierervektoren sind Elemente unterschiedlicher Vektorräume, auch wenn sie die gleiche physikalische Dimension haben — wie z.B. kontravariante und kovariante Vierergeschwindigkeiten. Der metrische Tensor η und sein Inverse η−1 bilden zwar eine Bijektion zwischen diesen Vektorräumen, so dass man kurz nur von „Vierervektoren“ sprechen kann, ohne kontra- oder kovariant zu präzisieren. Man darf aber kontra- und kovariante Vektoren nicht miteinander addieren oder gleich setzen: Ausdrücke wie aµ + bµ oder aµ = bµ sind sinnlos — wenn es sich dabei nicht um numerische Gleichungen handelt, die nur in einem Bezugssystem gelten. V.3 Vierervektoren und Vierertensoren 111 V.3.2 c Viererprodukt ::::::::::::::::::::: Seien V µ bzw. Wµ die Komponenten eines kontravarianten bzw. kovarianten Vierervektors. Die Transformationsgesetze (V.25a) und (V.32) zeigen, dass die Kombination Wµ V µ , mit Summe über µ = 0, 1, 2, 3, ein Lorentz-Skalar ist. Dieses Skalar wird Viererprodukt der beiden Vierervektoren genannt, oder auch Lorentz-Skalarprodukt — etwa uneigentlich, da es sich eher um ein PseudoSkalarprodukt handelt. Da Wµ V µ = W µ ηµν V ν = W ν Vν = W µ Vµ ist, spielt es hier keine Rolle, welcher Index oben und welcher unten ist, so lange es einen oben und einen unten gibt. Komponentenweise gilt Wµ V µ = −W 0 V 0 + W 1 V 1 + W 2 V 2 + W 3 V 3 = W µ Vµ . (V.38a) Unter Verwendung der Matrixdarstellungen W bzw. V für den kovarianten bzw. kontravarianten e als W V µ = W V schreiben. Ein Nachteil dieser Vierervektor, lässt sich das Viererprodukt noch µ e Schreibweise ist, dass die Multiplikation zweier Matrizen nicht-kommutativ ist: W V ist eine Zahl, µ V W eine 4 × 4-Matrix. Das heißt, der Gleichung Wµ V = W µ Vµ entspricht WeV = V W, wobei e führt e man eine diee Symmetrie bezüglich des Austauschs der Vierervektoren verloren wird. Somit weitere Notation, ähnlich dem Skalarprodukt von zwei Dreiervektoren im euklidischen Raum: Wµ V µ = W V ≡ W · V. (V.38b) e Dann gilt problemlos W · V = V · W. Man sollte aber dabei nicht vergessen, dass es sich trotz der Notation um das Lorentz -Skalarprodukt handelt, nicht um das euklidische, d.h. dass es ein Minus-Zeichen vor dem Produkt der zeitlichen Komponenten gibt. Bemerkung: Im Gegensatz zum Viererprodukt Wµ V µ sind die Kombinationen W µ V µ und Wµ Vµ keine Skalare unter Lorentz-Transformation, d.h. sie nehmen unterschiedliche Werte in unterschiedlichen Inertialsystemen an. Ein erstes Beispiel von Viererprodukt ist die Kombination ∂µ j µ (x), mit ∂µ den Komponenten des Vierergradienten und j µ (x) die Koordinaten eines Feldes, das in jedem Punkt x eines Gebiets der Raumzeit M 4 definiert ist: ∂µ j µ (x) = ∂j µ (x) ∂j 0 (x) ∂j 1 (x) ∂j 2 (x) ∂j 3 (x) 1 ∂j 0 (t,~r) ~ = + + + = + ∇ · ~(t,~r), ∂xµ ∂x0 ∂x1 ∂x2 ∂x3 c ∂t (V.39) wobei der Dreiervektor ~ die räumlichen Komponenten j i des Vierervektors j zusammenfasst, wäh~ die (Dreier-)Divergenz dieses Vektorfeldes darstellt. In Analogie mit dem dreidimensionalen rend ∇· Fall heißt ∂µ j µ (x) ≡ 6 · j(x) Viererdivergenz des Vierervektorfeldes j. Lorentz-Quadrat Ein weiteres, wichtiges Beispiel von Viererprodukt ist der skalare Lorentz-Quadrat eines Vierervektors: 2 2 2 2 V 2 ≡ Vµ V µ = − V 0 + V 1 + V 2 + V 3 , (V.40) der denselben Wert in allen Inertialsystemen annimmt. Beispielsweise beträgt der Lorentz-Quadrat einer Vierergeschwindigkeit (V.26) immer u2 = uµ uµ = −c2 . Das Linienelement ds2 ist ebenfalls ein Lorentz-Quadrat. Definition: Je nach dem Vorzeichen des Lorentz-Quadrats unterscheidet man zwischen drei Arten von Vierervektoren: • zeitartige Vierervektoren, mit negativem Lorentz-Quadrat V2 < 0; • lichtartige Vierervektoren, auch Nullvektoren genannt, mit Lorentz-Quadrat V2 = 0; • raumartige Vierervektoren, mit positivem Lorentz-Quadrat V2 > 0. 112 Mathematischer Apparat der Speziellen Relativitätstheorie Zum Beispiel ist die Vierergeschwindigkeit eines Massenpunktes ein zeitartiger Vierervektor. Der Unterschied zwischen den drei Arten ist insbesondere wichtig wenn der Vierervektor dem Abstandsvektor zwischen zwei Ereignissen P1 und P2 entspricht. Im Fall einer zeitartigen Separation kann man immer ein Inertialsystem B derart finden, dass die Weltlinie seines Ursprungspunkts durch P1 und P2 geht. Somit ist das eine Ereignis in der Zukunft des anderen, z.B. t2 > t1 : die zwei Ereignisse sind miteinander kausal verknüpft, d.h. was im einen passiert kann das andere beeinflussen. Falls der Abstandsvektor raumartig ist, kann ein solches Inertialsystem nicht gefunden werden. Angenommen, dass das Vakuumlichtgeschwindigkeit die maximale Ausbreitungsgeschwindigkeit von Signalen ist, kann kein aus P1 ausgesandte Signal P2 erreichen, und umgekehrt. Eigentlich gibt es in diesem Fall Inertialsystemen, in denen t1 < t2 , während in anderen Inertialsystemen t2 < t1 gilt: keines der Ereignisse liegt auf absoluter Weise in der Zukunft des anderen. Dementsprechend darf nicht mehr von der Gleichzeitigkeit zweier Ereignisse geredet werden, denn t1 = t2 in einem ersten Inertialsystem wird in einem anderen Bezugssystem zu t01 < t02 oder t001 > t002 . Schließlich kann im Fall eines lichtartigen Abstandsvektors zwischen Ereignissen Licht von dem einen zum anderen propagieren, so dass die Ereignisse noch im kausalen Zusammenhang stehen. Vom Standpunkt eines Ereignisses P0 kann somit die Raumzeit in unterschiedlichen Bereichen zerlegt werden (vgl. Abb. V.2) Die Ereignisse, die in lichtartigem Abstand von P0 sind, bilden die Lichtkegel .(33) Innerhalb der letzteren, d.h. in zeitartigem Abstand von P0 , befinden sich die Ereignisse, die im kausalen Zusammenhang mit P0 sind, und zwar entweder in seiner Zukunft — wie P1 in Abb. V.2 — oder in der Vergangenheit, wie P2 . Dagegen sind die Ereignisse außerhalb der Lichtkegel — d.h. in raumartigem Abstand von P0 , wie P3 — kausal entkoppelt von P0 . Li Zukunft ch tk eg el x0 • P1 „anderswo“ • ~r P0 • P3 • P2 Vergangenheit Abbildung V.2 – Kausalitätsstruktur der Raumzeit: die horizontale Achse steht für die drei räumlichen Dimensionen, die vertikale Achse für die Zeit im Ruhesystem von P0 . Bemerkung: Entsprechend dieser Kausalitätsstruktur hängt die Physik in P0 nur von den Ereignissen innerhalb der „vergangenen Lichtkegel“ ab: instantane Fernwirkung wird somit ausgeschlossen. (33) Um die Kegel zu erkennen, muss sich die Leserin erstens eine Raumzeit mit einer zeitlichen Richtung — die der Achse der Kegel entspricht — und nur zwei räumlichen Richtungen vorstellen; dann kann sie die dritte Raumdimension hinzufügen. 113 V.3 Vierervektoren und Vierertensoren V.3.3 Vierertensoren Auf dem euklidischen Raum E 3 der nicht-relativistischen Mechanik gibt es „Dreier-“Tensoren höherer Stufe, die sich unter Drehungen alle gleich transformieren. Ähnlich existieren auf der Minkowski-Raumzeit M 4 Vierertensoren bzw. Lorentz-Tensoren mit bestimmten Transformationsgesetzen unter Lorentz-Transformationen. Diese Vierertensoren können vom Typ m n , oder „m-fach kontravariant und n-fach kovariant“, sein, d.h. ihre Komponenten besitzen m ≥ 0 kontravariante und n ≥ 0 kovariante Indizes, wobei jeder Index sich wie ein entsprechender Vierervektor transformiert.(34) Beispielsweise transformiert sich der Vierertensor dritter Stufe mit Komponenten T µνρ wie V µ V ν Vρ . Insbesondere lautet das Transformationsgesetz für einen Lorentz-Tensor vom Typ 02 , unter Verwendung der Gl. (V.32), Tµν → Tµ0 ν 0 = Λµµ0 Λν ν 0 Tµν . (V.41a) In Matrixform kann ein solcher Vierertensor zweiter Stufe durch eine quadratische 4×4-Matrix T mit Elementen Tµν dargestellt werden; dann lautet die Transformation T → T0 = ΛT TΛ, (V.41b) wie aus der Gleichung Λµµ0 Λν ν 0 Tµν = Λµµ0 Tµν Λν ν 0 = (ΛT )µµ0 Tµν Λν ν 0 sofort folgt. V.3.3 a Metrischer Tensor :::::::::::::::::::::::::: Der metrische Tensor η wurde schon in Gl. (V.16) über die Angabe seiner Komponenten ηµν in einem bestimmten System von Minkowski-Koordinaten definiert. Jede dieser Komponenten nimmt in allen solchen Systemen denselben Wert an, d.h. der metrische Tensor ist invariant unter LorentzTransformationen. Unter Verwendung des Transformationsgesetzes (V.41a) transformieren sich die Komponenten von η gemäß (V.42a) ηµν → ηµ0 ν 0 = Λµµ0 Λν ν 0 ηµν , entsprechend in Matrixdarstellung η → η0 = ΛT ηΛ. (V.42b) Fördert man die Invarianz des metrischen Tensors unter Lorentz-Transformationen, so sollen die Matrizen η und η0 gleich sein, woraus sich Bedingung (V.20) ergibt. V.3.3 b Inverser metrischer Tensor ::::::::::::::::::::::::::::::::::: Dem metrischen Tensor wird der inverse metrische Tensor η−1 zugeordnet, dessen Komponenten η µν bzw. Matrixdarstellung η−1 derart sind, dass ηµρ η ρν = η νρ ηρµ = δµν ∀µ, ν = 0, 1, 2, 3 bzw. ηη−1 = η−1 η = 14 (V.43) gelten, mit δµν dem üblichen Kronecker-Symbol und 14 der 4×4-Einheitsmatrix. Dabei ist eigentlich η−1 = η, d.h. numerisch gilt η µν = ηµν für alle möglichen Werte von µ und ν. Wie in § V.3.2 b schon gesehen wurde lassen sich mithilfe des metrischen bzw. des inversen metrischen Tensors mit Komponenten ηµν bzw. η µν kontra- bzw. kovariante Lorentz-Indizes heraufbzw. herabziehen, ähnlich den Gleichungen (V.33) und (V.34). Zum Beispiel kann man aus einem Tensor vom Typ 02 mit Komponenten Tµν verwandte Tensoren von den Typen 11 und 20 erhalten: Tµ σ ≡ η σν Tµν , T ρν ≡ η ρµ Tµν und T ρσ ≡ η ρµ η σν Tµν = η ρµ Tµ σ = η σν T ρν . (V.44) Wenn Tµν nicht symmetrisch ist, sind die Tensoren mit Komponenten Tµ σ und T ρν a priori unterschiedlich.(35) (34) (35) Vgl. Anhang A. Bezeichnet T die Matrixdarstellung des Tensors mit Komponenten Tµν , so sind die drei anderen Tensoren jeweils durch Tη, ηT und ηTη dargestellt, wie die Leserin einfach nachprüfen kann. 114 Mathematischer Apparat der Speziellen Relativitätstheorie Angewandt auf η µν selber lautet die zweite der Gleichungen (V.44) η ρν ≡ η ρµ ηµν . (V.45) Der Vergleich mit Gl. (V.43) gibt dann η ρν = δµρ . V.3.3 c Levi-Civita-Tensor :::::::::::::::::::::::::: Ein anderer invarianter Vierertensor — genauer Pseudotensor , da sein Vorzeichen sich unter uneigentlichen Lorentz-Transformationen ändert — ist der vollständig antisymmetrische Levi-CivitaTensor 4. Stufe(36) +1 falls (µ, ν, ρ, σ) eine gerade Permutation von (0,1,2,3) ist µνρσ = −1 falls (µ, ν, ρ, σ) eine ungerade Permutation von (0,1,2,3) ist (V.46) 0 sonst. Hier sollte beachtet werden, dass 0123 = −0123 , während für den dreidimensionalen Levi–Civita Tensor 123 = 123 gilt. Unter einer Lorentz-Transformation Λ transformiert sich dieser Tensor gemäß 0 0 0 0 0 0 0 0 µνρσ → µ ν ρ σ ≡ Λµµ Λν ν Λρ ρ Λσσ µνρσ = (det Λ)µνρσ , (V.47) wobei die letzte Gleichung aus der Definition der Determinante folgt. V.3.3 d Kontraktion zweier Tensoren ::::::::::::::::::::::::::::::::::::: Das Herauf- oder Herabziehen von Indizes mithilfe des metrischen Tensors oder seines Inversen sind Beispiele von Tensorverjüngungen (vgl. § A.1.3 b). Allgemeiner können zwei Tensoren T und T0 kontrahiert werden, vorausgesetzt der eine (mindestens) einen kovarianten und der andere einen 0 (einfache kontravarianten Index hat. Dann wird über solche Indizes kontrahiert, wie z.B. T µν Tµρ µν Kontraktion) oder µνρσ T (doppelte Kontraktion). V.3.4 Kovariante Formulierung eines physikalischen Gesetzes Laut dem ersten Einstein’schen Postulat (V.1) sollen die Naturgesetze mathematisch so formuliert werden, dass die entsprechenden Gleichungen in allen Inertialsystemen die gleiche Form annehmen. Theorien, die diesem Prinzip genügen, werden als Lorentz- oder relativistisch kovariant bezeichnet. Infolgedessen können solche Gleichungen nur Identitäten zwischen Lorentz-Tensoren gleicher Stufe sein, nachdem alle möglichen Kontraktionen von Indizes berücksichtigt wurden. Solche Gleichungen können entweder „geometrisch“, in Matrixdarstellung (für Vierertensoren der Stufe 1 oder 2) oder komponentenweise geschrieben werden. Beispiele kovarianter Gleichungen sind somit V = W oder äquivalent V µ = W µ ; oder TV = W bzw. T µν V ν = W µ . Unter einer Lorentz-Transformation transformieren sie sich in V0 = W0 bzw. 0 0 0 0 µ0 µ µ 0 0 0 ν µ V = W oder T V = W bzw. T ν 0 V = W , d.h. sie nehmen die gleiche Form an. Dagegen sind Identitäten wie V µ = T µ ν oder V µ = Wµ keine gültige relativistisch kovariante Gleichungen, sondern können einen (Tipp-?)Fehler signalisieren. . . Bemerkung: Manchmal wird statt Lorentz-kovariant die Redensart „Lorentz-invariant“ verwendet. Streng genommen bedeutet aber die Letztere, dass die Gleichungen unverändert unter den LorentzTransformationen bleiben: dies stellt eine stärkere Bedingung dar, als die Invarianz der Form der Gleichungen, die nur im Fall einer Gleichung zwischen zwei skalaren Größen erfüllt ist, wie z.B. u2 = −c2 (für den Lorentz-Quadrat einer Vierergeschwindigkeit). (36) Einige Autoren benutzen die Konvention 0123 = +1, entsprechend 0123 = −1. . . V.3 Vierervektoren und Vierertensoren 115 Literatur zum Kapitel V • Feynman, Vorlesungen über Physik. Band 1 [22] = Lectures on Physics. Vol. I [23], Kap. 15–17. • Fließbach, Mechanik [2], Kap. IX. • Greiner, Klassische Mechanik I [6] Kap. III. • Landau & Lifschitz, Band II: Klassische Feldtheorie [14] = The classical theory of fields [26], Kap. I. • Nolting, Spezielle Relativitätstheorie, Thermodynamik [27], 1. Teil. • Scheck, Mechanik [18] Kap. 4. K APITEL VI Relativistische Mechanik Der Formalismus des vorigen Kapitels wird nun angewandt, um die charakteristischen Größen und Funktionen zur Beschreibung der Bewegung eines freien relativistischen Massenpunktes auszudrücken (Abschn. VI.1). Dann wird die relativistische Verallgemeinerung des zweiten Newton’schen Gesetzes vorgestellt (Abschn. VI.2). VI.1 Bewegung eines freien relativistischen Teilchens VI.1.1 Lagrange-Funktion und Wirkung eines freien Teilchens Die Wirkung S eines physikalischen Systems, insbesondere eines freien Teilchens, ist eine reelle Zahl. Sie hängt von Größen — Positionen, Geschwindigkeiten — ab, die vom Bezugssystem abhängen. Die einfachste Möglichkeit um sicherzustellen, dass die Extrema der Wirkung immer für die gleichen physikalischen Trajektorien erreicht werden, entsprechend den physikalisch realisierten Bewegungen, ist, dass die Wirkung ein Lorentz-Skalar ist, d.h. den gleichen Zahlenwert in allen Inertialsystemen annimmt. Betrachte nun einen einzelnen, wechselwirkungsfreien Massenpunkt mit Masse m. Wegen der Homogenität der Raumzeit — d.h. die Invarianz der Physik unter zeitlichen und räumlichen Translationen — kann seine Lagrange-Funktion L(t, ~x, ~x˙ ) weder von der Zeit noch vom seiner Position abhängen; d.h. sie ist nur Funktion von seiner Geschwindigkeit ~v = ~x˙ . Die letztere ist zwar nicht Lorentz-invariant, jedoch die Lagrange-Funktion L selbst ist auch nicht Lorentz-invariant: nur das Produkt L dt, das zwischen zwei Zeitpunkten integriert wird, soll Lorentz-invariant sein, damit S ein Lorentz-Skalar ist. Aus dem vorigen Kapitel kennen wir eine „einfache“ Größe, proportional zum Zeitintervallelement dt und dazu Funktion der p Geschwindigkeit, die Lorentz-invariant ist, und zwar das infinitesimal Eigenzeitintervall dτ = 1 − ~v 2/c2 dt, vgl. Gl. (V.14). Somit ist ein möglicher Ansatz Z B S=α dτ (VI.1) A mit α einer reellen Zahl und A, B zwei Ereignissen der Raumzeit. Diese Wirkung lässt sich noch als Z tB r ~v 2 S=α 1 − 2 dt c tA umschreiben; daher entspricht der Ansatz einer Lagrange-Funktion r ~v 2 L=α 1− 2. c (VI.2) Wird eine Taylor-Entwicklung dieser Abhängigkeit für den nicht-relativistischen Limes |~v |/c 1 durchgeführt, so ergibt sich 4 ~v 2 ~v L=α 1− 2 +O 4 . 2c c 117 VI.1 Bewegung eines freien relativistischen Teilchens Nach Ausmultiplizieren der Klammer kommt zuerst eine Konstante (α), die keine Rolle bei den Bewegungsgleichungen spielt. Der nächste Term ist −α~v 2 /2c2 : damit er mit der Lagrange-Funktion eines nicht-relativistischen freien Teilchens 21 m~v 2 übereinstimmt, soll α gleich −mc2 sein. Somit lautet die Lagrange-Funktion bzw. die Wirkung eines freien relativistischen Massenpunktes r 2 L = −mc ~v 2 c2 (VI.3a) dτ. (VI.3b) 1− bzw. S = −mc 2 Z B A Erfahrung zeigt, dass der Ansatz (VI.3a) die richtige Physik wiedergibt, insbesondere den richtigen Impuls und die richtige Energie, wie sie im nächsten Paragraphen eingeführt werden. VI.1.2 Impuls und Energie eines freien Teilchens VI.1.2 a Impuls ::::::::::::::: Gemäß der Definition(II.12) ist die i-te Komponente des konjugierten Impulses des Massenpunktes mit Lagrange-Funktion (VI.3a) durch ∂L ∂ ẋi gegeben, wobei hier die Komponente mit einem kovarianten Index geschrieben wurde, im Einklang mit der Division durch eine kontravariante Komponente im rechten Glied. Eine einfache Berechnung gibt dann pi ≡ m~v = γm~v ~p = q 2 1 − ~vc2 (VI.4) mit γ dem Lorentz-Faktor entsprechend der Geschwindigkeit ~v . VI.1.2 b Energie :::::::::::::::: Benutzt man nun die Definition (II.25a), so lässt sich die Energie des freien relativistischen Massenpunktes als 3 X E= pi ẋi − L i=1 bestimmen, d.h. E=q mc2 1− ~v 2 c2 = γmc2 . (VI.5) In Fall eines ruhenden Massenpunktes ergibt sich E0 = mc2 , entsprechend der Massenenergie. Wiederum ist die Differenz (γ − 1)mc2 die kinetische Energie eines bewegten Massenpunktes. VI.1.2 c Viererimpuls ::::::::::::::::::::: Definiert man p0 ≡ E/c, so bilden p0 , p1 , p2 , p3 ein 4-Tupel von Zahlen, die laut den Gl. (VI.4) und (VI.5) gleich m mal den Komponenten u0 , u1 , u2 , u3 der Vierergeschwindigkeit (V.27) sind. Da die Masse m ein Lorentz-Skalar ist, sind die pµ die Komponenten eines Vierervektors p: pµ = muµ (VI.6a) 118 Relativistische Mechanik bzw. p = mu mit p= ! E/c ~p (VI.6b) . (VI.7) Dieser Vierervektor heißt Viererimpuls. Vergleicht man die Gl. (VI.4) und (VI.5), so findet man, dass sich die Geschwindigkeit als ~v = ~p c2 E (VI.8) schreiben lässt. Somit ist der nicht-relativistische Limes |~v | c äquivalent zu |~p|c E. Unter Verwendung der Definition (V.40) und der Gl. (VI.4) und (VI.5) beträgt der LorentzQuadrat p2 des Viererimpulses (VI.7) p2 ≡ − E2 + ~p 2 = −m2 c2 . c2 (VI.9) Dies folgt auch sofort aus der Beziehung (VI.6b), die zu p2 = m2 u2 führt, oder aus einer Berechnung im Ruhesystem des Massenpunktes. Dieses Ergebnis wird auch oft in der Form E 2 = ~p 2 c2 + m2 c4 (VI.10) geschrieben. Ist der erste Term auf der rechten Seite viel kleiner als der zweite, d.h. |~p| mc — was wiederum äquivalent zu |~p| E/c ist, entsprechend dem nicht-relativistischen Limes —, folgt aus einer Taylor-Entwicklung r p ~p 2 1 ~p 2 1 ~p 2 2 2 2 2 4 2 2 E = m c + ~p c = mc 1 + 2 2 = mc 1 + − + ··· m c 2 m2 c2 8 m2 c2 d.h. ~p 2 (~p 2 )2 − + ··· (VI.11) 2m 8m3 c2 Dabei erkennt man als ersten, führenden Term die Massenenergie, dann als nächsten Term die nichtrelativistische kinetische Energie, während der dritte Term (und die nächsten) eine relativistische Korrektur darstellt. Insbesondere ist im nicht-relativistischen Fall die kinetische Energie viel kleiner als die Massenenergie — die im nicht-relativistischen Rahmen aber nie ins Betracht gezogen wird, weil sie nur eine additive Konstante darstellt! E = mc2 + Schließlich folgt aus der Invarianz der Wirkung (VI.3b) unter zeitlichen und räumlichen Translationen, dass die Energie und der Impuls Konstanten der Bewegung sind, vgl. § II.3.1 a–II.3.1 b. Folglich ist der Viererimpuls erhalten, wie man auch direkt aus der Invarianz der Wirkung (VI.3b) unter den Raumzeittranslationen xµ → xµ + aµ herleiten kann. Mathematisch lässt sich diese Viererimpulserhaltung als dp =0 dτ bzw. dpµ =0 dτ (VI.12) ausdrücken: dabei wird die Ableitung nach der Eigenzeit betrachtet, um auf der linken Seite einen Lorentz-Vektor zu erhalten. Somit ergibt sich eine Gleichung, die in jedem Inertialsystem die gleiche Form annimmt, wie gemäß dem ersten Einstein’schen Postulat (V.1) der Fall sein soll. 119 VI.2 Kovariante Formulierung des Grundgesetzes der Mechanik VI.2 Kovariante Formulierung des Grundgesetzes der Mechanik Wir haben gerade gesehen, dass der Viererimpuls eines freien Massenpunktes erhalten ist, was sich „relativistisch kovariant“ als Gl. (VI.12) schreiben lässt. Unterliegt der Massenpunkt Kräften, so sollte sich dieses Ergebnis ändern, denn es ändert sich im nicht-relativistischen Fall, der als Grenzwert in den relativistischen Gleichungen erhalten ist. Um die Newton’sche Mechanik zu verallgemeinern, wird ein Vierervektor F eingeführt, die Viererkraft, mit Komponenten F µ . Im Einklang mit dem nicht-relativistischen Fall sollte eine solche Viererkraft nur von der Raumzeit-Position x und der Vierergeschwindigkeit u des Massenpunktes abhängen: F(x, u) bzw. F µ (xν , uν ). (VI.13) Insbesondere wird in Kap. XI die Form der relativistisch kovarianten Formulierung der Lorentz-Kraft angegeben. Gegeben eine solche Viererkraft — oder die Resultierende solcher Viererkräfte —, die natürliche relativistisch kovariante Verallgemeinerung des zweiten Newton’schen Gesetzes, die auch in Abwesenheit von Kraft zur Viererimpulserhaltung (VI.12) führen wird, ist dp =F dτ (VI.14a) dpµ = F µ. dτ (VI.14b) oder äquivalent, komponentenweise Unter Einführung der Viererbeschleunigung des Massenpunktes a≡ du dτ bzw. aµ ≡ duµ dτ (VI.15) lässt sich Gl. (VI.14a) bzw. (VI.14b) als ma = m du = F bzw. dτ maµ = m duµ = F µ. dτ (VI.16) Bemerkung: Damit die Beziehungen (VI.14), (VI.16) erfüllt werden können, dürfen die Komponen- ten einer Viererkraft nicht beliebig sein. In der Tat folgt aus der Konstanz des Lorentz-Quadrats u2 der Vierergeschwindigkeit, dass diese senkrecht auf die Viererbeschleunigung ist: u · a = uµ aµ = 0. Somit soll u · F = uµ F µ = 0 gelten, d.h. nur drei Komponenten der Viererkraft sind unabhängig voneinander — z.B. die drei räumlichen Komponenten, die im nicht-relativistischen Limes die Dreierkraft wiedergeben müssen. Literatur zum Kapitel VI • Fließbach, Mechanik [2], Kap. IX. • Greiner, Klassische Mechanik I [6] Kap. III. • Landau & Lifschitz, Band II: Klassische Feldtheorie [14] = The classical theory of fields [26], Kap. II. • Nolting, Spezielle Relativitätstheorie, Thermodynamik [27], 1. Teil. • Scheck, Mechanik [18] Kap. 4. 120 Relativistische Mechanik Dritter Teil Klassische Elektrodynamik K APITEL VII Einleitung Die Elektrodynamik beruht auf ein paar gekoppelten Gleichungen, die das Wechselspiel von elektri~ B ~ mit elektrischen Ladungen und Strömen ρel. , ~el. beschreiben. schen und magnetischen Feldern E, Somit können die Maxwell-Gleichungen ~ · E(t,~ ~ r) = 1 ρel.(t,~r) ∇ 0 ~ · B(t,~ ~ r) = 0 ∇ ~ ~ × E(t,~ ~ r) + ∂ B(t,~r) = ~0 ∇ ∂t ~ ~ × B(t,~ ~ r) − 0 µ0 ∂ E(t,~r) = µ0~el.(t,~r). ∇ ∂t (VII.1a) (VII.1b) (VII.1c) (VII.1d) als die Gleichungen angesehen werden, welche die „Antwort“ vom elektromagnetischen Feld auf die Wirkung dessen Quellen modellieren. Jede der Maxwell-Gleichungen trägt einen eigenen Namen, der sich meistens auf die davon abgeleitete — jedoch historisch früher gefundene — integrale Formulierung der Gleichung. Somit ist Gl. (VII.1a) die Maxwell–Gauß (x) -Gleichung — entsprechend dem in § VIII.1.2 diskutierten Gauß’schen Gesetz. Dann wird Gl. (VII.1b) (relativ selten) Maxwell–Thomson (y) -Gleichung genannt. Gleichung (VII.1c) heißt Maxwell–Faraday-Gleichung, denn sie stellt die differentiale Formulierung des Faraday(z) -Induktionsgesetzes (§ X.1.1 a) dar. Schließlich ist Gl. (VII.1d) die Maxwell–Ampère (aa) -Gleichung, welche das Ampère-Gesetz (§ IX.1.3 b) verallgemeinert. Wiederum erfahren Ladungen und Strömen in einem elektromagnetischen Feld eine Kraft. Die zugehörige Kraftdichte, d.h. Kraft pro Volumeneinheit, ist die Lorentz-Kraftdichte ~ r) + ~el.(t,~r) × B(t,~ ~ r). f~L (t,~r) = ρel.E(t,~ (VII.2) In diesem Einführungskapitel werden die verschiedenen Größen und Faktoren, die in den Gleichungen (VII.1)–(VII.2) auftreten, erläutert (Abschn. VII.1). Dann befasst sich Kapitel VII.2 mit dem Problem der „Einheiten“ in der Elektrodynamik. VII.1 Grundbegriffe und Definitionen ~ r) und B(t,~ ~ r) sind mathematische Vektorfelder, die jeweils das elektrische und das Die Größen E(t,~ magnetische Feld beschreiben. Beide Felder — genau wie jedes Feld, das in der Elektrodynamik eingeführt wird — sind im Prinzip in jedem Punkt ~r des Raums und zu jeder Zeit t definiert, sind also Felder auf der Raumzeit oder auf einem Gebiet davon. (x) C. F. Gauß, 1777–1855 A.-M. Ampère, 1775–1836 (aa) (y) W. Thomson, Lord Kelvin, 1824–1907 (z) M. Faraday, 1791–1867 124 Einleitung ~ elektrische Feldstärke, mit physikalischer Dimension M L I−1 T−3 Genauer heißt das Vektorfeld E ~ als magnetische Flussdichte und SI-Einheit V m−1 , wobei V für das Volt steht. Wiederum wird B oder magnetische Induktion bezeichnet; die zugehörige Dimension bzw. SI-Einheit ist M I−1 T−2 bzw. das Tesla T. Zur Beschreibung der elektrischen und magnetischen Felder in einem Medium werden weitere Vektorfelder eingeführt, und zwar die elektrische Flussdichte (oder dielektrische Verschiebung) ~ und die magnetische Feldstärke H, ~ weshalb die genaueren Bezeichnungen manchmal nötig D sind. Im Vakuum, wie es im Rahmen dieses Skripts der Fall sein wird, sind die Ausdrücke „elektrisches Feld“ und „magnetisches Feld“ eindeutig. Die materiellen „Quellen“ des elektromagnetischen Feldes auf der rechten Seite der MaxwellGleichungen (VII.1) sind die elektrischen Ladungsdichte und -stromdichte ρel. und ~el. . Die erstere ist natürlich die elektrische Ladung pro Volumeneinheit, so dass deren Integral über ein Gebiet V Z QV (t) ≡ ρel. (t,~r) d3~r (VII.3) V die gesamte elektrische Ladung im Volumen V zur Zeit t darstellt. Wiederum ist die elektrische Stromdichte derart definiert, dass deren Oberflächenintegral Z I(t) ≡ ~el. (t,~r) · d2 S~ (VII.4) S die elektrische Stromstärke durch die Fläche S zur Zeit t ist, wobei die Stromstärke die Gesamtladung ist, die pro Zeiteinheit durch S strömt. Dementsprechend stellt die elektrische Stromdichte jel. die Ladung dar, die pro Zeiteinheit durch eine Einheitsfläche fließt. Eine elektrische Ladung Q bzw. Stromstärke I hat im SI-System die physikalische Dimension [Q] = I T bzw. [I] = I — die elektrische Stromstärke ist eine Basisgröße des Internationalen Größensystems —, entsprechend der Einheit Coulomb(ab) (C) bzw. Ampere (A), wobei 1 C = 1 A s. Daraus folgt, dass die elektrische Ladungsdichte bzw. Stromdichte die Dimension [ρel. ] = I T L−3 , gemessen in C m−3 bzw. [~el. ] = I L−2 (Einheit A m−2 ) hat. Man sieht also, dass die elektrische Stromdichte die Dimension des Produkt aus Ladungsdichte und Geschwindigkeit hat. Dies lässt sich an einem einfachen Beispiel gut nachvollziehen: betrachte man Punktladungen, die sich alle mit der gleichen Geschwindigkeit ~v bewegen. Diejenigen, die im Zeitintervall [t, t + δt] durch eine ebene Fläche S strömen, sind solche, die sich zur Zeit t innerhalb eines Zylinders mit Basis S und den Seiten parallel zu ~v befinden (Abb. VII.1). Dabei ist die Höhe ~v δ t 1111 0000 S 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 Abbildung VII.1 (ab) C. A. Coulomb, 1736–1806 125 VII.1 Grundbegriffe und Definitionen des Zylinders ~v · ~en δt mit ~en dem Normaleinheitsvektor zur Fläche S. Diese Punktladungen im Zylinder entsprechen einer Gesamtladung ρel.(t,~r) S ~v · ~en δt, denn S ~v · ~en δt das Volumen des Zylinders ist. Laut der Gl. (VII.4) soll diese elektrische Ladung auch gleich I(t) δt = ~el. (t,~r) · S ~en δt sein, weil S ~en der mit der Fläche assoziierte Vektor ist. Somit gilt in diesem Fall ~el. (t,~r) = ρel.(t,~r) ~v . (VII.5) Das Ergebnis lässt sich direkt verallgemeinern: für eine Menge aus N Punktladungen {qa } mit jeweiligen Ortsvektoren {~xa (t)} und Geschwindigkeiten {~va (t)} zur Zeit t lautet die elektrische Ladungsdichte ρel.(t,~r) = N X qa δ (3) ~r − ~xa (t) (VII.6a) a=1 mit δ (3) der dreidimensionalen Dirac-Distribution, die hier dafür sorgt, dass nur die Punkte im Raum beitragen, wo sich eine Punktladung gerade befindet. Integriert über irgendein Volumen ergibt diese Ladungsdichte die Summe der Ladungen, die innerhalb des Volumens sind, wie in Gl. (VII.3). Andererseits ist die elektrische Stromdichte der Punktladungen ~el.(t,~r) = N X qa~va (t) δ (3) ~r − ~xa (t) . (VII.6b) a=1 Falls alle Geschwindigkeiten den gleichen Wert ~v haben, findet man die Beziehung (VII.5) wieder. Betrachtet man eine einzige Punktladung, so führen die Gl. (VII.6), eingesetzt in die LorentzKraftdichte (VII.2), zu ~ r) + ~v (t) × B(t,~ ~ r) f~L (t,~r) = qδ (3) ~r − ~x(t) E(t,~ mit ~x(t) bzw. ~v (t) der Position bzw. Geschwindigkeit der Punktladung zur Zeit t. Integriert man über irgendein Volumen, das die Punktladung enthält, ergibt sich ~ t, ~x(t) + ~v (t) × B ~ t, ~x(t) , F~L (t) = q E (VII.7) d.h. die Lorentz-Kraft auf die Punktladung. In den Maxwell-Gleichungen treten (im SI-System, vgl. Abschn. VII.2) zwei Konstanten auf: • die elektrische Feldkonstante 0 , die früher Permittivität des Vakuums genannt wurde; • die magnetische Feldkonstante µ0 , früher Permeabilität des Vakuums. Im SI-System beträgt die erstere 0 ' 8, 854 · 10−12 F m−1 mit F dem Farad (1 F = 1 C/V), und die letztere ist definitionsgemäß µ0 ≡ 4π · 10−7 N A−2 . Die jeweiligen physikalischen Dimensionen im internationalen Größensystem sind [0 ] = M−1 L−3 T4 I2 und [µ0 ] = L M T−2 I−2 . Beispiele von Ladungs- und Stromverteilungen :::::::::::::::::::::::::::::::::::::::::::::::: Ein erstes Beispiel von elektrischer Ladungs- und Stromdichte ist das von Punktladungen, das oben diskutiert wurde. 126 Einleitung Betrachte man eine Metallkugel mit auf deren Oberfläche einer homogen verteilten Ladung Q. In einem sphärischen Koordinatensystem mit dem Nullpunkt im Zentrum der Kugel soll die zugehörige Ladungsdichte der Form ρel.(~r) ∝ δ(r − R) mit R dem Radius der Kugel und r ≡ |~r|; sei K der Proportionalitätsfaktor. Laut Beziehung (VII.3) soll Z ρel.(~r) d3~r = Q gelten. Das Integral lässt sich als Z Z 2 ρel.(~r) 4πr dr = Kδ(r − R) 4πr2 dr = 4πR2 K umschreiben, woraus K = Q/4πR2 folgt. Bemerkung: Zur Beschreibung einer solchen Ladungsverteilung, die auf einer Ober- oder Grenz- fläche eingeschränkt ist, wird manchmal eine Flächenladungsdichte eingeführt, die die elektrische Ladung pro Einheitsfläche darstellt. Dabei handelt es sich um eine Funktion von nur zwei Ortskoordinaten, welche die Fläche parametrisieren, statt drei: im obigen Beispiel könnte man zwei Winkel (Polar- und Azimutwinkel θ, ϕ) wählen. Auf ähnlicher Weise definiert man auch elektrische Flächenstromdichten. Als nächstes Beispiel sei ein elektrischer Strom mit Stärke I durch einen unendlich dünnen geradlinigen Draht lokalisiert auf der z-Achse eines Systems kartesischer Koordinaten. Die zugehörige Ladungsstromdichte ist der Form ~el.(~r) = Kδ(x) δ(y)~ez mit K einer festzustellenden Konstanten. Sei S eine durch den Draht durchlaufene Fläche parallel zur (x, y)-Ebene. Beziehung (VII.4) lautet Z Z I = ~el.(~r) · d2 S~ = Kδ(x) δ(y)~ez · d2 S~ez = K, S und legt somit ~el. fest. Bemerkung: Hier handelt es sich um eine Linienstromdichte, die nur von z abhängt. Ähnlich gibt es Linienladungsdichten. VII.2 Einheiten In diesem Skript werden die SI-Einheiten und dementsprechend die physikalischen Größen des Internationalen Größensystems verwendet. Manche Referenzen benutzen aber andere Systeme, insbesondere um die Feldkonstanten 0 und µ0 loszuwerden. Dabei handelt es sich(37) nicht um eine Wahl von Einheiten, wie der Einfachheit halber oft gesagt wird, sondern wirklich um eine Neudefinition der elektromagnetischen Größen (Ladung, elektrisches und magnetisches Feld, usw.). Dementsprechend nehmen die Gleichungen eine andere Form an. Um die Gleichungen aus dem Internationalen Größensystem in ein anderes System zu übersetzen, braucht man nur einige Konversionsfaktoren zwischen den Größen in beiden Systemen. Hiernach beziehen sich die physikalischen Größen mit einem Sternchen auf ein alternatives System. Somit schreibt man für die elektrische Ladung p q = 0 ψ q ∗ , (VII.8a) was für die Ladungsdichte und -stromdichte zu den Skalierungen p p ∗ ρel. = 0 ψ ρ∗el. , ~el. = 0 ψ ~el. (VII.8b) führt. Das elektrische Feld wird gewöhnlich derart umdefiniert, dass dessen Produkt mit der Ladung (37) ... trotz des Titels dieses Abschnitts! 127 VII.2 Einheiten die gleiche Form erhält: mit ~ = √1 E ~∗ E 0 ψ (VII.8c) ~ = q∗E ~ ∗ . Wiederum transformiert sich die magnetische Induktion gemäß gilt q E r ~ ∗. ~ = µ0 B B ψ0 In der „Übersetzung“ der Gleichungen sollen schließlich alle auftretenden Produkte ersetzt werden. Mit diesen Rezepten wird die Lorentz-Kraftdichte (VII.2) zu s ∗ ∗ ∗ ~ + ψ 1 ~v × B ~∗ , f~L = q E ψ0 c (VII.8d) √ 0 µ0 durch 1/c (VII.9a) mit dem charakteristischen Faktor 1/c vor dem magnetischen Feld. Im neuen Größensystem lauten die Maxwell-Gleichungen nach einiger trivialen Umschreibung ~ ·E ~ ∗ = ψρ∗ ∇ el. ∗ ~ ·B ~ =0 ∇ s ~∗ ∗ ~ ×E ~ + ψ 1 ∂ B = ~0 ∇ ψ 0 c ∂t s √ 0 ~∗ ψ0 1 ∂ E ψψ ∗ ∗ ~ ~ ∇×B − = ~el. . ψ c ∂t c (VII.9b) (VII.9c) (VII.9d) (VII.9e) Dazu werden natürlich auch weitere Gleichungen geändert, wie z.B. der Ausdruck des CoulombPotentials (VIII.14b) zwischen zwei statischen Punktladungen q1 , q2 im Abstand r12 voneinander, das zu ψq1∗ q2∗ V = (VII.10) 4πr12 wird. Die Konversionsfaktoren und die Konventionen für 0 , µ0 und c für die am meisten benutzten Systeme werden in der Tabelle (VII.1) zusammengefasst. Tabelle VII.1 – Konversionsfaktoren zwischen Größensystemen. „SI-System“ Gauß-System Heaviside(ac) –Lorentz-System ψ0 0 µ0 c ψ 1 µ0 c2 1 µ0 ≡ 4π·10−7 N A−2 c = 299792458 m s−1 µ0 c2 1 c 4π µ0 c2 4π 1 1 c 1 1 ~ ∗ und B ~ ∗ die gleiche Bemerkung: In den Gauß- und Heaviside–Lorentz-Systemen haben die Felder E physikalische Dimension, weshalb sie hoch beliebt sind. Dementsprechend nehmen die linken Seiten der Gl. (VII.9d) und (VII.9e) eine ähnliche Form an — bis auf das Minus-Zeichen —, was auch sehr angenehm ist. Dagegen gilt die Beziehung 0 µ0 c2 = 1 [vgl. Gl. (X.29c)] nicht mehr — was der Autor dieser Zeilen Schade findet —, es sei denn, man wählt ein System von (sog. „natürlichen“) Einheiten mit c = 1. (ac) O. Heaviside, 1850–1925 128 Einleitung Literatur zum Kapitel VII • Fließbach, Elektrodynamik [2] Teil II. • Greiner, Klassische Elektrodynamik II [8] Kap. I. • Griffiths, Elektrodynamik [9] = Introduction to Electrodynamics [10] Kap 2.1–2.4 & 3. • Jackson, Klassische Elektrodynamik [11] = Classical Electrodynamics [12] Kap. 1.1–1.5, 1.7– 1.11, 2.1, 3.5–3.6 & 4.1–4.2. • Nolting, Elektrodynamik [17] Kap. 2.1–2.3. • Scheck, Klassiche Feldtheorie [19] Kap. 1.5 & 1.7. K APITEL VIII Elektrostatik Hier fehlt die obligatorische Einleitung. . . Im stationären Fall vereinfachen sich die Maxwell–Gauß und die Maxwell–Faraday-Gleichungen ~ r) — die jetzt zeitunabhängig ist — zu für die elektrische Feldstärke E(~ ~ · E(~ ~ r) = ρel.(~r) ∇ 0 ~ ~ ~ ∇ × E(~r) = 0. (VIII.1a) (VIII.1b) VIII.1 Elektrisches Potential VIII.1.1 Skalarpotential Betrachte ein einfach zusammenhängendes Gebiet(2) des Raums. Aus der stationären Maxwell– Faraday-Gleichung (VIII.1b) folgt die Existenz einer differenzierbaren skalaren Funktion Φ(~r) derart, dass die Beziehung ~ r) = −∇Φ(~ ~ r) (VIII.2) E(~ in jedem Punkt ~r des Gebiets erfüllt wird. Nach Angabe eines beliebigen Punktes ~r0 kann man nämlich Φ durch Z ~r ~ r 0 ) · d~r 0 Φ(~r) = Φ(~r0 ) − E(~ (VIII.3) ~r0 definieren, wobei das Wegintegral dank dem Stokes’schen Satz unabhängig vom Weg ist, so dass Φ(~r) eindeutig festgelegt ist, abgesehen von der beliebigen Wahl des Zahlenwerts für Φ(~r0 ). Φ wird als elektrostatisches Potential oder Skalarpotential bezeichnet. Die zugehörige SI-Einheit ist das Volt (V) mit physikalischer Dimension [Φ] = M L2 T−3 I−1 . VIII.1.2 Poisson-Gleichung Das Ausdrücken des elektrostatischen Feldes in der Maxwell–Gauß-Gleichung (VIII.1a) durch das Skalarpotential gemäß Gl. (VIII.2) führt zur Poisson-Gleichung 4Φ(~r) = − ρel.(~r) 0 (VIII.4) mit 4 dem Laplace-Operator. Insbesondere ergibt sich im Vakuum, d.h. in Abwesenheit von Ladungen, die Laplace-Gleichung 4Φ(~r) = 0, deren Lösungen die sog. harmonischen Funktionen sind. (VIII.5) 130 Elektrostatik Gauß’sches Gesetz :::::::::::::::::::: Sei ∂ V eine geschlossene Fläche, die ein zusammenhängendes Raumvolumen V einschließt. Der elektrische Fluss durch die Oberfläche ∂ V wird durch I ~ r) · d2 S~ ΦE ≡ E(~ (VIII.6) ∂V gegeben, mit d2 S~ = d2 S ~en dem vektoriellen Oberflächenelement, wobei ~en den Normaleinheitsvektor zu d2 S bezeichnet. Unter Verwendung des Integralsatzes von Gauß ist das Oberflächenintegral auf der rechten Seite gleich dem Volumenintegral der Divergenz des Integranden, d.h. Z I 2~ ~ · E(~ ~ r) d3~r. ~ E(~r) · d S = ∇ V ∂V ~ · E(~ ~ r) ersetzen Unter Betrachtung der Maxwell–Gauß-Gleichung (VIII.1a) lässt sich ∇ Z ρel.(~r) 3 ΦE = d ~r. V 0 Schließlich ergibt sich somit das Gauß’sche Gesetz ΦE = Qin 0 (VIII.7) mit Qin der Gesamtladung im Volumen V . Dieses Resultat stellt die globale Formulierung der lokalen Maxwell–Gauß-Gleichung (VIII.1a) dar. VIII.1.3 Elektrisches Feld und Potential von Ladungen VIII.1.3 a Elektrisches Feld und Potential einer Punktladung :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Eine Punktladung q befinde sich im Punkt ~r0 , während im ganzen Rest des Raums Vakuum herrscht. Die Situation ist dann kugelsymmetrisch um ~r0 . Insbesondere sollte das elektrische Feld ~ r) in konstantem Abstand |~r − ~r0 | von der Punktladung einen konstanten Betrag E |~r −~r0 | E(~ haben. Für die Richtung des elektrischen Feldes, die am meistens symmetrische Möglichkeit ist, das es in jedem Punkt entlang der Radialrichtung mit Einheitsvektor (~r−~r0 )/|~r−~r0 | zeigt. Somit ist ein vernünftiger Ansatz ~ r) = E |~r−~r0 | ~r − ~r0 . E(~ (VIII.8) |~r − ~r0 | Betrachte man jetzt eine Kugel mit Radius R und Zentrum in ~r0 . In jedem Punkt der Kugelfläche ∂ V ist das elektrische Feld normal, so dass I I 2~ ~ ~ r) d2 S E(~ E(~r) · d S = ∂V ∂V ~ r) im gilt. Dabei ist ∂ V definitionsgemäß die Menge der Punkte mit |~r −~r0 | = R, so dass E(~ Integral durch E(R) ersetzt werden kann. Da dieser Betrag konstant über ∂V bleibt, kann er aus dem Integral herausgezogen werden: I I 2~ ~ E(~r) · d S = E(R) d2 S = 4πR2 E(R), ∂V ∂V wobei benutzt wurde, dass das Oberflächenintegral im mittleren Glied einfach die Oberfläche der Kugel mit Radius R ist. 131 VIII.1 Elektrisches Potential Dank dem Gauß’schen Gesetz (VIII.7) ist die linke Seite auch mit der Gesamtladung innerhalb des durch ∂ V abgeschlossenen Volumens verknüpft. Hier ist diese Gesamtladung einfach gleich der Ladung q, die im Zentrum der Kugel liegt: I ~ r) · d2~S = q . E(~ 0 ∂V Somit ergibt sich insgesamt q = 4πR2 E(R) bzw. 0 E(R) = q . 4π0 R2 Nach Einsetzen dieses Betrags in den Ansatz (VIII.8) ergibt sich schließlich für das elektrische Feld einer Punktladung ~ r) = E(~ q ~r − ~r0 . 4π0 |~r − ~r0 |3 (VIII.9a) Man prüft problemlos nach, dass das zugehörige Skalarpotential Φ(~r) = q 4π0 |~r − ~r0 | (VIII.9b) ist, hier mit der Wahl Φ(~r) = 0 im Unendlichen. VIII.1.3 b Elektrisches Feld und Potential mehrerer Punktladungen ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Betrachte man jetzt N Punktladungen q1 , . . . , qN , die sich jeweils in ~r1 , . . . , ~rN befinden, in Abwesenheit weiterer Ladungen im ganzen Raum. Zur Bestimmung des entsprechenden elektrischen Feldes bzw. Skalarpotentials soll man nur ~ B) ~ und in den Quellen darauf beachten, dass die Maxwell-Gleichungen linear in den Feldern (E, (ρel. , ~el. ) sind. Demzufolge gilt ein Superpositionsprinzip für deren Lösungen, das natürlich auch für ~ ~ 2 (~r), Φ2 (~r) die stationären Gleichungen (VIII.1) gilt: wenn ρel.,1 (~r), E1 (~r), Φ1 (~r) und ρel.,2 (~r), E ~ 1 (~r)+E ~ 1 (~r), Φ1 (~r)+Φ2 (~r) zwei Lösungen der Gleichungen auf R3 sind, dann ist ρel.,1 (~r)+ρel.,2 (~r), E ebenfalls eine Lösung auf R3 . Dementsprechend lautet das Skalarpotential für die N Punktladungen Φ(~r) = N X a=1 qa , 4π0 |~r − ~ra | (VIII.10a) wieder mit der Wahl Φ(~r) = 0 für |~r| → ∞; das zugehörige elektrische Feld ist ~ r) = E(~ N X qa ~r − ~ra . 4π0 |~r − ~ra |3 (VIII.10b) a=1 VIII.1.3 c Elektrisches Feld und Potential einer Ladungsverteilung ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Ähnlich dem Übergang (III.1) von einer diskreten Massenverteilung ma , d.h. einer endlichen Anzahl von Massenpunkten, zu einer durch eine Massendichte ρ(~r) beschriebenen kontinuierlichen Verteilung, kann man von einer endlichen Anzahl von Punktladungen qa zu einer kontinuierlichen Ladungsverteilung ρel. übergehen, indem man das Rezept Z X qa f (~ra ) → f (~r)ρel.(~r) d3~r (VIII.11) a V anwendet, wobei V das durch die Ladungsverteilung besetzte Raumvolumen bezeichnet. 132 Elektrostatik Dementsprechend lautet das elektrostatische Potential bzw. Feld für eine Ladungsverteilung ρel. ρel.(~r 0 ) d3~r 0 , 4π0 |~r − ~r 0 | (VIII.12a) ρel.(~r 0 ) ~r − ~r 0 3 0 d ~r . 4π0 |~r − ~r 0 |3 (VIII.12b) Z Φ(~r) = V bzw. ~ r) = E(~ Z V Bemerkungen: ∗ Der Vorsicht halber sollte der Punkt ~r außerhalb des Volumens V sein, um unangenehme Divisionen durch 0 zu vermeiden. ∗ Hiernach wird das Potential (VIII.12a) auf eine alternative Weise hergeleitet (§ VIII.2.2). ∗ Setzt man in die Gl. (VIII.12a)–(VIII.12b) die Ladungsverteilung (VII.6a) für eine Menge von Punktladungen ein, so findet man natürlich Gl. (VIII.10a) und (VIII.10b) wieder. VIII.1.4 Elektrostatische potentielle Energie VIII.1.4 a Coulomb-Kraft :::::::::::::::::::::::: In Abwesenheit von magnetischen Feld oder für ruhende Ladungen lautet die Lorentz-Kraft auf eine Punktladung a ~ a (~ra ) F~a (~ra ) = qa E (VIII.13a) ~ a dem Feld, das die anderen Ladungen b 6= a im Punkt ~ra erzeugen, d.h. mit E F~a (~ra ) = N X qa ~ra − ~rb , 4π0 |~ra − ~rb |3 (VIII.13b) b=1 b6=a wobei Gl. (VIII.10b) verwendet wurde. Falls es nur eine andere Ladung gibt, die hiernach mit q2 bezeichnet wird und sich in ~r2 befindet, ist das dadurch erzeugte elektrische Feld durch Gl. (VIII.9a) gegeben. Dann lautet die Kraft auf die Punktladung qa ≡ q1 q1 q2 ~r1 − ~r2 . F~ (~r1 ) = 4π0 |~r1 − ~r2 |3 (VIII.14a) Somit findet man die Coulomb-Kraft wieder, sowie das zugehörige Potential V (~r1 ) = q1 q2 , 4π0 |~r1 − ~r2 | (VIII.14b) ~ 1 V (~r1 ) ableiten lässt. aus dem die Kraft sich gemäß F~ (~r1 ) = −∇ VIII.1.4 b Potentielle Energie :::::::::::::::::::::::::::: ~ a×E ~ a = ~0 ist die Kraft F~a [Gl. (VIII.13b)] auch im Wegen der Maxwell–Thomson-Gleichung ∇ allgemeinen Fall konservativ. Genauer gilt ~ a V {~rb } F~a (~ra ) = −∇ (VIII.15a) ~ a dem Gradient bezüglich des Ortsvektors ~ra und V einer potentiellen Energie, die durch mit ∇ 133 VIII.1 Elektrisches Potential N qa qb 1 X V {~rb } = 2 4π0 |~ra − ~rb | (VIII.15b) N 1X V {~rb } = qa Φa (~ra ), 2 (VIII.15c) a,b=1 a6=b gegeben ist. Alternativ gilt a=1 wobei Φa durch Gl. (VIII.10a) mit Summierung über die Punktladungen b 6= a gegeben wird. Beweis: Mit dem Potential (VIII.15b) gilt unter Verwendung der Kettenregel N N X ~rc − ~rd qc qd ~ 1 1 X qc qd ~rc − ~rd ~ aV = − 1 −∇ + δ ∇a =− −δca da 2 4π0 |~ra − ~rb | 2 4π0 |~rc − ~rd |3 |~rc − ~rd |3 c,d=1 c6=d = c,d=1 c6=d 1 X qa qc ~rc − ~ra 1 X qa qd ~ra − ~rd − . 3 2 4π0 |~ra − ~rd | 2 4π0 |~rc − ~ra |3 d6=a c6=a Ersetzt man d bzw. c durch b in der ersten bzw. zweiten Summe der zweiten Zeile, so sind beide Summanden gleich und man findet genau das gesuchte Ergebnis (VIII.13b). 2 Im Limes einer kontinuierlichen Ladungsverteilung ρel. wird die potentielle Energie (VIII.15c) zu V = 1 2 Z Φ(~r)ρel.(~r) d3~r (VIII.16) V mit V dem Raumvolumen, das die Ladungsverteilung besetzt; eigentlich kann V durch R3 ersetzt werden Bemerkung: Die letztere Gleichung könnte auf erster Sicht verwirrend sein, denn das elektrostatische Potential Φ im Integral wird in einem Punkt betrachtet, wo sich Ladungen befinden. Das heißt, dass dies nicht dem Gültigkeitsbereich der Gl. (VIII.12a) entspricht, für die der Punkt ~r außerhalb der Ladungsverteilung sein soll. Dies bedeutet nur, dass Φ(~r) nicht durch Gl. (VIII.12a) gegeben ist. VIII.1.4 c Energie des elektrostatischen Feldes ::::::::::::::::::::::::::::::::::::::::::::::: Die potentielle Energie (VIII.16) einer Ladungsverteilung ρel. kann auch durch das elektrostati~ r) ausgedrückt werden, erzeugt durch die Verteilung. sche Feld E(~ In der Tat gilt Z ~ 2 E(~r) 3 V = d ~r, (VIII.17) R3 20 wobei sich das Integrand als die elektrische Energiedichte ee (~r) des Feldes im Punkt ~r interpretieren lässt. Zum Beweis dieses Ergebnisses kann das Integral auf der rechten Seite der Gl. (VIII.16) zuerst über das Volumen einer Kugel mit Radius R berechnen, dann am Ende den Grenzwert R → ∞ betrachten. Dank der Maxwell–Gauß-Gleichung (VIII.1a) gilt Z Z 1 0 3 ~ · E(~ ~ r) d3~r. Φ(~r)ρel.(~r) d ~r = Φ(~r) ∇ 2 |~r|≤R 2 |~r|≤R Dabei lässt sich das Integrand mithilfe der Identität 134 Elektrostatik ~ · E(~ ~ r) = ∇ ~ · Φ(~r) E(~ ~ r) − E(~ ~ r) · ∇Φ(~ ~ r) = ∇ ~ · Φ(~r) E(~ ~ r) + E(~ ~ r)2 Φ(~r) ∇ umschreiben: 1 2 Z 0 Φ(~r)ρel.(~r) d ~r = 2 |~r|≤R 3 Z ~ · Φ(~r) E(~ ~ r) d3~r + ∇ |~r|≤R ~ r)2 E(~ d3~r. 2 0 |~r|≤R Z Der zweite Term auf der rechten Seite gibt das gesuchte Ergebnis im Limes R → ∞, so dass man nur beweisen soll, dass der erste in diesem Limes verschwindet. Tatsächlich kann das erste Volumenintegral auf der rechten Seite mit dem Gauß’schen Integralsatz in ein Oberflächenintegral über die Kugelfläche transformiert werden Z I 3 ~ ~ ~ r) · d2~S . ∇ · Φ(~r) E(~r) d ~r = Φ(~r) E(~ |~r|≤R |~r|=R Wenn R groß genug ist, befinden sich alle Ladungen innerhalb der Kugel |~r| ≤ R. Dann nehmen das elektrostatische Potential und das Feld mit R ab, gemäß(38) Φ(R) ∝ 1 , R ~ |E(R)| ∝ 1 . R2 Dagegen gilt d2 S = R2 d2 Ω mit d2 Ω dem Raumwinkelelement. Insgesamt kommt I ~ r) · d2~S ∝ 4πR2 1 1 ∝ 1 , Φ(~r) E(~ R R2 R |~r|=R so dass dieser Term im Grenzwert R → ∞ Null wird. (38) Dies folgt aus dem Gauß’schen Gesetz (VIII.7), unter Verwendung des gleichen Arguments wie in § VIII.1.3 a. 2 135 VIII.2 Bestimmung des Skalarpotentials aus der Poisson-Gleichung VIII.2 Bestimmung des Skalarpotentials aus der Poisson-Gleichung Im § VIII.1.3 wurde das elektrostatische Potential erzeugt durch eine Ladungsverteilung (VIII.12a) mithilfe des Gauß’schen Gesetzes hergeleitet. Eine alternative Vorgehensweise zur Bestimmung von Φ(~r) besteht darin, die Poisson-Gleichung 4Φ(~r) = − ρel.(~r) 0 (VIII.4) direkt zu lösen. In diesem Abschnitt werden einige allgemeinen(39) mathematischen Rezepte und Ergebnisse zur Lösung dieser Differentialgleichung vorgestellt. VIII.2.1 Green’sche Funktionen Die Poisson-Gleichung (VIII.4) ist ein Beispiel von partieller Differentialgleichung, hier zweiter Ordnung. Definition: Eine Funktion G(~r,~r 0 ) zweier vektoriellen Variablen ~r,~r 0 heißt Green’sche (ad) Funktion zur Poisson-Gleichung, wenn sie eine Lösung der partiellen Differentialgleichung 4~r G(~r,~r 0 ) = δ (3)(~r − ~r 0 ) (VIII.18) ist, mit 4~r dem Laplace-Operator bezüglich der Variablen ~r. Aus einer solchen Lösung der Gl. (VIII.18) folgt eine Lösung der Poisson-Gleichung (VIII.4) mit fast jedem beliebigen rechten Glied, und zwar Z −1 Φ(~r) = G(~r,~r 0 )ρel.(~r 0 ) d3~r 0 , (VIII.19) 0 unter der offensichtlichen Beschränkung, dass das Integral existieren soll. Wendet man nämlich den Laplace-Operator 4~r auf das so definierten Potential an, so kann der Differentialoperator in das Integral über ~r 0 eingezogen werden: Z −1 4~r G(~r,~r 0 ) ρel.(~r 0 ) d3~r 0 , 4~r Φ(~r) = 0 Unter Verwendung der definierenden Gleichung (VIII.18) wird das Integral zur Faltung von der δ (3) -Distribution mit der Ladungsdichte ρel., so dass sich die rechte Seite zu −ρel.(~r)/0 vereinfacht. 2 Bemerkung: Im obigen Beweis wurde die spezifische Form des Laplace-Operators nirgendwo benutzt. Somit können Green’sche Funktionen auch für andere Differentialoperatoren, d.h. andere Differentialgleichungen, eingeführt werden, als „Antwort“ zur lokalisierten „Anregung“ modelliert durch eine δ-Distribution. VIII.2.2 Lösung der Poisson-Gleichung auf R3 Die Poisson- (VIII.4) und Laplace-Gleichung (VIII.5) wurden durch Mathematiker aufwändig untersucht, woraus eine Menge Resultate zur Existenz und Eindeutigkeit ihrer Lösungen resultiert. In diesem und im nächsten Paragraphen werden einige dieser Ergebnisse kurz dargestellt. Betrachte man zuerst die Poisson-Gleichung, und daher die assoziierte partielle Differentialgleichung (VIII.18), auf dem ganzen dreidimensionalen Raum R3 . Dann lautet eine Green’sche Funktion zur Poisson-Gleichung −1 . (VIII.20) G(~r,~r 0 ) = 4π|~r − ~r 0 | (39) Das heißt, dass sie auch auf andere Differentialgleichungen anwendbar sind. (ad) G. Green, 1793–1841 136 Elektrostatik ~ ≡ ~r − ~r 0 und R ≡ |R ~ |; dann gilt dank der Kettenregel 4~r = 4 ~ . Da die Beweis: Sei R R 0 ~ = ~0 hat, wird erstens eine „regularisierte“ Version Funktion (VIII.20) ein Pol für ~r = ~r bzw. R ~ ≡ Gε R −1 4π R2 + ε2 √ ohne Divergenz im Ursprungspunkt eingeführt, wobei ε am Ende der Berechnung gegen Null zu nehmen ist. Die Funktion Gε hängt nur vom Betrag R abhängt, so dass im Raum der Variablen ~ kugelsymmetrisch um den Nullpunkt ist. Demzufolge ist es interessant, in Kugelkoordinaten R (R, θR~ , ϕR~ ) zu arbeiten, wobei das Problem unabhängig von den zwei Winkeln θR~ , ϕR~ ist. Daher vereinfacht sich der Laplace-Operator 4R~ zu ∂2 2 ∂ + ∂R2 R ∂R ohne den üblichen winkelabhängigen Anteil. Wendet man diesen Operator auf Gε an, so ergibt sich dank einfacher Ableitungen 2 1 ~ = 3ε . 4R~ Gε R 2 4π (R + ε2 )5/2 (3) ~ (3) Die Funktion im rechten Glied sei mit δε R bezeichnet. Für festes ε besitzt δε die folgenden Eigenschaften: ~ | ≥ |ε|; ~ ≤ 3ε für |R • δε(3) R 4π 3 • δε(3) ~0 = ; 4π|ε| Z Z a Z a 3R2 ε2 ~ d3 R ~ = ~ 4πR2 dR = • sei a > 0; dann gilt δε(3) R dR, d.h. δε(3) R 2 2 5/2 ~ |R|≤a 0 0 (R + ε ) a Z 3 R3 a3 (3) ~ ~ δε R d R = = . (R2 + ε2 )3/2 0 (a2 + ε2 )3/2 ~ |R|≤a Betrachte man jetzt den Grenzwert ε → 0. Laut der ersten Eigenschaft gilt in diesem Limes (3) ~ ~ 6= ~0. Somit wird der Peak bei R ~ = ~0 (zweite Eigenschaft) unendlich = 0 für R lim δε R (3) schmal und hoch. Schließlich geht das Integral von δε über eine Kugel mit Radius a gegen 1, (3) unabhängig von der Wahl von a. Diese Eigenschaften zeigen, dass δε eine Darstellung der dreidimensionalen δ-Distribution ist, entsprechend dem nachzuprüfenden Ergebnis.(40) 2 Setzt man jetzt die Green’sche Funktion (VIII.20) in die Beziehung (VIII.19) ein, so ergibt sich genau das elektrostatische Skalarpotential (VIII.12a) Z ρel.(~r 0 ) Φ(~r) = d3~r 0 . (VIII.21) 0| 4π |~ r − ~ r 3 0 R Dabei wird die vorsichtige Beschränkung des § VIII.1.3 c auf Punkten ~r, die nicht zum durch die Ladungsverteilung besetzten Raumvolumen V gehören, jetzt automatisch aufgehoben. Ein Problem bei der Konstruktion des elektrischen Potentials aus der Poisson-Gleichung besteht darin, dass die Funktion (VIII.20) nicht die einzige Green’sche Funktion zur Poisson-Gleichung auf R3 ist. Betrachtet man nämlich eine Lösung F der Laplace-Gleichung — eine harmonische Funktion — auf R3 , so ist G2 (~r,~r 0 ) ≡ G(~r,~r 0 ) + F (~r − ~r 0 ) auch eine mögliche Green’sche Funktion. In der Tat gilt 4~r G2 (~r,~r 0 ) = 4~r G(~r,~r 0 ) + 4~r F (~r − ~r 0 ) = δ (3)(~r − ~r 0 ) + 0. (40) 2 Die Funktion (VIII.20) kann auch direkt gefunden werden, indem die definierende Differentialgleichung (VIII.18) im Fourier-Raum aufgestellt wird. VIII.2 Bestimmung des Skalarpotentials aus der Poisson-Gleichung 137 Da es unendlich viele harmonische Funktionen auf R3 , beispielsweise jede lineare Funktion der Form F (~r) = ax1 + bx2 + cx3 , gibt es auch unendlich viele Green’sche Funktionen. Einzigartig bei der Funktion (VIII.20) unter den Green’schen Funktionen zur Poisson-Gleichung ist aber, dass sie im Unendlichen |~r − ~r 0 | → ∞ Null wird. Dementsprechend verschwindet das Potential (VIII.21) weit von der Ladungsverteilung (wenn die letztere nur ein endliches Raumgebiet besetzt). Genauer kann man zeigen, dass die einzigen harmonischen Funktionen auf R3 — und allgemeiner auf Rn für jede n ∈ N∗ —, die überall endlich bleiben, die identisch konstanten Funktion sind. Bemerkung: Addiert man zur Funktion (VIII.20) eine Konstante K ∈ R, so unterscheidet sich das aus Gl. (VIII.19) resultierende Potential von dem Wert (VIII.21) um eine additive Konstante — das Produkt aus K und der Gesamtladung der Verteilung geteilt durch 0 —, die nichts am elektrischen Feld ändert. VIII.2.3 Lösung der Poisson-Gleichung auf einem endlichen Gebiet von R3 VIII.2.3 a Mathematische Fragestellung und Ergebnisse :::::::::::::::::::::::::::::::::::::::::::::::::::::::: Anstatt einer Lösung der Poisson-Gleichung auf dem ganzen Raum kann man auch eine Lösung auf einem endlichen Gebiet V von R3 suchen — entsprechend z.B. dem elektrostatischen Potential in einem leeren Hohlraum im Inneren von Materie. Ist die letztere irgendein Metall, in welchem frei bewegliche elektrische Ladungsträger vorhanden sind, so können sich solche Ladungen möglicherweise auf der Oberfläche ∂ V des Bereichs V befinden: dann dienen diese Ladungen als Quellen für das elektrische Skalarpotential im Hohlraum. 11111111 00000000 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 ∂V 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 V 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 Abbildung VIII.1 Meistens wird die entsprechende (Oberflächen)Ladungsdichte nicht explizit präzisiert. Stattdessen werden in der mathematischen Formulierung Randbedingungen für das zu festzustellende Potential Φ(~r) vorgegeben, entsprechend seinem Verhalten auf der Oberfläche ∂ V , das physikalisch „von außen“ gesteuert wird. Dazu wird oft angenommen, dass im Hohlraum Vakuum herrscht, so dass sich die Poisson-Gleichung auf die Laplace-Gleichung 4Φ(~r) = 0 vereinfacht. Bei der Fragestellung handelt es sich dann um ein sog. Randwertproblem. Ein solches mathematisches Randwertproblem ist für physikalische Anwendungen nur dann nützlich, wenn es wohlgestellt ist. Dies bedeutet, dass das Problem eine Lösung hat, die eindeutig ist — möglicherweise bis auf eine additive Konstante — und stetig von den vorgegebenen Randbedingungen abhängt. Bei der Poisson-Gleichung ist es insbesondere der Fall für zwei einfache Arten von Randbedingungen: 138 Elektrostatik • bei Dirichlet (ae) -Randbedingungen (oder Randbedingungen erster Art) werden die Werte des Potentials Φ(~r) — oder allgemeiner der zu bestimmenden Funktion — an der Oberfläche ∂ V vorgeschrieben; • bei Neumann (af) -Randbedingungen (oder Randbedingungen zweiter Art) wird die Normalenableitung ∂n Φ(~r) vorgegeben, wobei die letztere die Änderungsrate in der Richtung senkrecht ~ r) schreiben, mit ~en (~r) den zur Oberfläche ist. Diese Ableitung lässt sich auch als ~en (~r) · ∇Φ(~ Normaleinheitsvektor zur Oberfläche im Punkt ~r ∈ ∂ V . Stimmt die Oberfläche ∂ V lokal mit der (x1 , x2 )-Ebene überein, so ist der lokale Normal~ ist gleich ∂Φ/∂x3 , was auch mit ∂3 Φ bezeichnet wird. einheitsvektor ~e3 , d.h. ~en · ∇Φ Bemerkung: Im Fall von Neumann-Bedingungen ist die Vorschrift von ∂n Φ(~r) auf ∂ V äquivalent ~ r) = −∇Φ(~ ~ r) in jedem Punkt der zur Angabe der normalen Komponente des elektrischen Feldes E(~ Oberfläche. Die Existenz einer Lösung der Poisson-Gleichung auf V und ihre stetige Abhängigkeit von den Randbedingungen sind im allgemeinen Fall nicht trivial zu zeigen. Dagegen ist der Beweis der Eindeutigkeit bis auf eine additive Konstante ziemlich einfach. Dieser Beweis macht die sog. erste Green’sche Identität, gültig für zwei (zweimal differenzierbare) reellwertige Funktionen f1 , f2 Z I 3 ~ ~ f1 (~r) ∂n f2 (~r) d2 S (VIII.22) ∇f1 (~r) · ∇f2 (~r) + f1 (~r)4f2 (~r) d ~r = V ∂V zu Nutze. ~ · (f1 ∇f ~ 2 ) = ∇f ~ 1 · ∇f ~ 2 + f1 4f2 , d.h. nach Integration und Beweis: Die Kettenregel gibt ∇ Anwendung des Gauß’schen Integralsatzes Z Z I ~ 1 · ∇f ~ 2 + f1 4f2 d3~r = ∇ ~ · (f1 ∇f ~ 2 ) d3~r = ~ 2 · d2~S . ∇f f1 ∇f V V ∂V 2~ 2 Dabei ist das vektorielle Oberflächenelement d S gleich d S ~en , woraus die Identität folgt. 2 Sind Φ1 , Φ2 nämlich zwei Lösungen der Poisson-Gleichung auf V mit beliebiger rechter Seite und gegebenen Dirichlet- bzw. Neumann-Randbedingungen, dann ist ihre Differenz U ≡ Φ2 − Φ1 eine Lösung der Laplace-Gleichung 4U (~r) = 0 für ~r ∈ V , mit verschwindenden Dirichlet- bzw. Neumann-Randbedingungen U (~r) = 0 bzw. ∂n U (~r) = 0 für ~r ∈ ∂ V . Die erste Green’sche Identität mit f1 = f2 = U lautet dann Z I 3 ~ ~ ∇U (~r) · ∇U (~r) + U (~r)4U (~r) d ~r = U (~r) ∂n U (~r) d2 S . V ∂V Das Integrand auf der rechten Seite, und daher das Integral, verschwindet wegen der Randbedingungen. Wiederum ist der zweite Term in den eckigen Klammern auf der linken Seite ebenfalls Null, denn U erfüllt die Laplace-Gleichung. Deshalb bleibt nur Z ~ (~r) 2 d3~r = 0 ∇U V ~ (~r) identisch auf V verschwindet, d.h. wenn U (~r) konstant übrig, was nur dann möglich ist, wenn ∇U auf V ist: U (~r) = K, wobei K = 0 falls Dirichlet-Bedingungen vorgegeben sind. Somit unterscheiden sich Φ1 und Φ2 nur um eine additive Konstante. (ae) P. G. Lejeune Dirichlet, 1805–1859 (af) C. Neumann, 1832–1925 VIII.2 Bestimmung des Skalarpotentials aus der Poisson-Gleichung 139 VIII.2.3 b Physikalische Anwendungen ::::::::::::::::::::::::::::::::::::::: Faraday Käfig Als erste Anwendung der obigen mathematischen Ergebnisse kann man das elektrische Feld in einem leeren Hohlraum innerhalb einer metallischen Oberfläche ∂ V bestimmen. Da ∂ V metallisch ist, können sich darauf freie Ladungsträger befinden. Im statischen Fall dürfen sie diese Ladungen definitionsgemäß nicht bewegen. Demzufolge darf kein elektrisches Feld in der ~ = −∇Φ ~ = ~0 auf ∂ V , so dass das Skalarpotential Φ dort konstant ist: Metallfläche vorhanden sein, E Φ(~r) = Φ0 für ~r ∈ ∂ V . Dies stellt eine Dirichlet-Randbedingung für das elektrostatische Potential im Hohlraum dar. Dort soll Φ wegen der Abwesenheit von Ladungen Lösung der Laplace-Gleichung 4Φ(~r) = 0 sein. Eine Lösung, die auch die Randbedingung erfüllt, ist einfach die konstante Funktion Φ(~r) = Φ0 für ~r ∈ V . Wegen der Eindeutigkeit ist dies in der Tat die einzige Lösung. Daraus folgt dann ~ = −∇Φ ~ = ~0 im Hohlraum, der als Faraday-Käfig bezeichnet wird. E Spiegelladungsmethode Basierend auf die Eindeutigkeit der Lösung der Poisson-Gleichung für vorgegebene DirichletRandbedingungen lässt sich eine andere Methode zur Lösung der Poisson-Gleichung in einem Gebiet von R3 formulieren. Sei ein zu lösendes Problem P1 , bei dem eine Fläche ∂ V ein Raumgebiet V abgrenzt, in welP (3)(~ q δ r − ~xa ) befinden, mit chem sich Ladungen entsprechend einer Ladungsdichte ρel.(~r) = a a ~xa den Positionen der Ladungen. Als (Dirichlet)-Randbedingung wird angenommen, dass ∂ V eine Äquipotentialfläche ist, d.h. Φ(~r) ist konstant auf ∂ V . Sei dann ein anderes Problem P2 ohne Fläche jedoch mit denselben Ladungen an den gleichen Positionen ~xa sowie zusätzlichen Ladungen – sog. „Spiegelladungen“ — außerhalb V . Wenn das (lösbare!) Problem P2 zu einem Potential Φ führt, wovon eine Äquipotentialfläche mit der Fläche ∂ V vom Problem P1 übereinstimmt, dann ist das Potential von P2 im Volumen V genau gleich dem gesuchten Potential von P1 . Als Beispiel dieser Methode kann man das folgende Problem (P1 ) betrachten: im Halbraum x < 0 befindet sich ein elektrischer Leiter, q0 q dessen Oberfläche bei x = 0 eine Äquipotentialfläche ist;(41) im Punkt • a - a -• ~xq = (a, 0, 0) außerhalb des Leiters sitzt eine Punktladung q. x Im Bereich x > 0 soll das Skalarpotential Lösung der Poisson-Gleichung (3) 4Φ(~r) = −qδ (~r − ~xq )/0 sein, mit der Randbedingung Φ = Φ0 für Abbildung VIII.2 x = 0. Ein passendes, einfach lösbares Problem P2 besteht aus zwei Punktladungen in einem sonst leeren Raum: q ist immer noch in ~xq , während eine zweite (Spiegel-)Punktladung q 0 im Punkt −~xq = (−a, 0, 0) sitzt. Diese Ladungen erzeugen das Skalarpotential Φ(~r) = Lösung von 4Φ(~r) = q q0 + , 4π0 |~r − ~xq | 4π0 |~r + ~xq | −q (3) q0 δ (~r − ~xq ) − δ (3)(~r + ~xq ) im ganzen Raum. 0 0 Dieses Potential stellt auch eine spezielle Lösung der Gleichung 4Φ(~r) = −qδ (3)(~r −~xq )/0 für x ≥ 0 dar, die für q 0 = −q konstant (und Null) bei x = 0 ist. Das Potential Φ ist also auch Lösung für x ≥ 0 des ursprünglichen Problems P1 . (41) Dies ist immer der Fall bei elektrischen Leitern im Gleichgewicht, d.h. ohne Bewegung von Ladungen, wie schon bei der Beschreibung des Faraday-Käfigs argumentiert wurde. 140 Elektrostatik VIII.3 Multipolentwicklung Eine oft auftretende Fragestellung ist die Bestimmung des Einflusses einer gegebenen Ladungsverteilung ρel. mit typischer Größe R auf eine Punktladung — oder eine zweite Ladungsverteilung — in einem weit entfernten Punkt. Wie wir schon gesehen haben, erzeugt die Ladungsverteilung das elektrische Skalarpotential in einem Punkt ~r Z ρel.(~r 0 ) Φ(~r) = d3~r 0 . (VIII.12a) r − ~r 0 | V 4π0 |~ mit V dem durch die Verteilung besetzten Raumgebiet, woraus das elektrische Feld sich ableiten lässt. Um die Berechnungen zu vereinfachen wird hiernach angenommen, dass die Ladungsverteilung um den Ursprung des Bezugssystems sitzt, d.h. |~r 0 | . R für ~r 0 ∈ V . Dagegen soll der Punkt ~r „weit weg“ sein, entsprechend |~r − ~r 0 | R für ~r 0 ∈ V oder äquivalent |~r| R. VIII.3.1 Kartesische Multipolmomente Aus den Ungleichungen |~r| − |~r 0 | ≤ |~r − ~r 0 | ≤ |~r| + |~r 0 | und |~r 0 | . R |~r| folgt, dass der Abstand |~r − ~r 0 | im Nenner des Integranden in Gl. (VIII.12a) ungefähr gleich r ≡ |~r| ist. Dabei kann die genaue Abweichung mithilfe einer Taylor-Entwicklung angenähert werden, wobei −~r 0 die Rolle der „kleinen“ Verschiebung um den Bezugspunkt ~r spielt. Demgemäß lautet eine Taylor-Entwicklung bis zur zweiten Ordnung 3 3 1 1 X 0i ∂ 1 1 X 0i 0j ∂ ∂ 1 = − x + x x + ··· , |~r − ~r 0 | r ∂xi r 2 ∂xi ∂xj r i=1 i,j=1 mit bzw. p den kartesischen Komponenten von ~r bzw. ~r 0 in einem Koordinatensystem. Dabei folgt aus r = (x1 )2 + (x2 )2 + (x3 )2 die erste Ableitung 1 xi ∂ = − , ∂xi r r3 xi x0i und nach erneutem Ableiten unter Berücksichtigung der Produktregel ∂ ∂ 1 δ ij 3xi xj = − + . ∂xj ∂xi r r3 r5 Somit gilt 3 3 1 1 X xi 0i X 3xi xj − δ ij r2 0i 0j = + x + x x + ··· |~r − ~r 0 | r r3 2r5 i=1 i,j=1 3xi xj −δ ij r2 Die Kombination ist spurlos, d.h. deren Multiplikation mit δ ij gefolgt von einer Summe über i, j = 1, 2, 3 ergibt Null.(42) Daher kann der quadratische Term in den x0i gemäß 3 3 X X 3xi xj − δ ij r2 0i 0j 3xi xj − δ ij r2 δ ij 0 2 0i 0j x x = x x − |~r | 2r5 2r5 3 i,j=1 i,j=1 erweitert werden. Dies führt zur Entwicklung 3 3 1 1 X xi 0i X 3xi xj − δ ij r2 δ ij 0 2 0i 0j = + x + x x − |~r | + · · · . |~r − ~r 0 | r r3 2r5 3 i=1 i,j=1 Da die Komponente xi bzw. x0i typischerweise der Größenordnung O(r) bzw. O(R) ist, ist der erste Term der Ordnung (gleich!) 1/r, der zweite der Ordnung O(R/r2 ) und der dritte der Ordnung (42) i j ij 2 Betrachtet man die Matrix P A mit Elementen aij ≡ 3x x − δ r , so ist die betrachtete Operation genau das Bilden der Spur Tr A ≡ i aii der Matrix, daher die Bezeichnung. 141 VIII.3 Multipolentwicklung O(R2 /r3 ). Somit ist jeder neue Term in der Entwicklung um einen Faktor der Ordnung R/r 1 kleiner als der vorige. Nach Einsetzen in den Ausdruck (VIII.12a) des Skalarpotentials ergibt sich 3 X Q ~r · P~ 3xi xj − δ ij r2 ij Φ(~r) = + + Q + ··· , 4π0 r 4π0 r3 8π0 r5 (VIII.23a) i,j=1 wobei die ersten kartesischen elektrischen Multipolmomente durch Z Q≡ ρel.(~r 0 ) d3~r 0 ~r 0 ρel.(~r 0 ) d3~r 0 Z δ ij 0 2 x0i x0j − Qij ≡ |~r | ρel.(~r 0 ) d3~r 0 3 V P~ ≡ (VIII.23b) ZV (VIII.23c) V (VIII.23d) definiert sind. Dabei ist Q die Gesamtladung und P~ das elektrische Dipolmoment der Ladungsverteilung ρel. . Die Zahlen Qij (Quadrupolmomente) sind die Komponenten eines Tensors zweiter Stufe Q, des elektrischen Quadrupoltensors. Man sieht sofort, der Quadrupoltensor symmetrisch — d.h. Qij = Qji für alle i, j — und P dass ii spurlos — d.h. i Q = 0 —, wobei die letztere Eigenschaft schon beim Integranden auftritt. Demzufolge sind nur 5 der 9 Komponenten unabhängig. Bemerkungen: ∗ Der erste Term im Skalarpotential (VIII.23a) ist proportional zu 1/r, der zweite proportional zu 1/r2 , der dritte proportional zu (oder zumindest der Ordnung) 1/r3 , usw. Somit tragen die niedrigeren Momente am meisten zu Φ(~r) bei. . . wenn sie nicht Null sind. ∗ Das elektrische Dipolmoment bzw. Quadrupolmoment hat physikalische Dimension [P~ ] = L T I bzw. [Qij ] = L2 T I, entsprechend der SI-Einheit C m bzw. C m2 . VIII.3.2 Beispiele von Multipolmomenten VIII.3.2 a Kugelsymmetrische Ladungsverteilung ::::::::::::::::::::::::::::::::::::::::::::::::: Ein einfaches Beispiel von Ladungsverteilung ist jenes einer Verteilung ρel. (~r 0 ) Funktion von |~r 0 | alleine. Dementsprechend ist ρel. eine gerade Funktion von ~r 0 — d.h. ρel. (~r 0 ) = ρel. (−~r 0 ) — bzw. von jeder der Komponenten x0i . Abhängig von der Form von ρel. (~r 0 ) wird sich über Gl. (VIII.23b) eine bestimmte Gesamtladung Q ergeben, die ohne zusätzliche Information nicht präzisiert werden kann. Bezüglich des Dipolmoments kann man bemerken, dass das Integrand ~r 0 ρel.(~r 0 ) der definierenden Gleichung (VIII.23c) jetzt eine ungerade Funktion von ~r 0 , die über ein symmetrisches Gebiet integriert wird, woraus sich automatisch Null ergibt, unabhängig von der genauen Form von ρel. . Ein detaillierterer Beweis besteht in das Ersetzen von ~r 0 durch −~r 0 im zweiten Integral von Z Z 1 0 0 3 0 0 0 3 0 ~ P = ~r ρel.(~r ) d ~r + ~r ρel.(~r ) d ~r . 2 Diese Substitution gibt dann genau das Negative des ersten Integrals, voraus P~ = ~0 folgt. 2 142 Elektrostatik Mithilfe einer ähnlichen Argumentation findet man, dass die Quadrupolmomente Qij für i 6= j verschwinden. In der Tat lauten sie [Gl. (VIII.23d)] Z ij Q = x0i x0j ρel.(~r 0 ) d3~r 0 für i 6= j. V Dabei ist das Integrand eine ungerade Funktion von x0i , die über ein symmetrisches Intervall integriert wird, was zu Qij = 0 führt. Somit ist Qij diagonal. Schließlich sind die drei Koordinatenachsen wegen der angenommenen Kugelsymmetrie äquivalent, so dass Q11 = Q22 = Q33 . Da der Quadrupoltensor spurlos sein soll, ergibt sich Qii = 0 für jedes i = 1, 2, 3, d.h. insgesamt Q = 0 . Bemerkung: Einige der obigen Ergebnisse lassen sich auch „geometrisch“ finden. Die angenommene Symmetrie bedeutet, dass keine Richtung bzw. kein Vektor von R3 eine besondere Rolle spielt, sondern dass sie alle äquivalent sind. Dementsprechend gibt es keine bevorzugte Richtung für das Dipolmoment P~ , das deshalb verschwinden muss. Auf ähnlicher Weise darf der Tensor Q keine eindeutig (bis auf einen multiplikativen Faktor) definierte Eigenvektoren haben, sondern müssen alle Vektoren von R3 Eigenvektoren sein: somit muss Q proportional zur Identität sein, d.h. Qij ∝ δ ij . Dann liefert die Spurlosigkeit den Proportionalitätsfaktor. Da kugelsymmetrische Ladungsverteilungen keine elektrische Dipol- oder Quadrupolmomente haben — und eigentlich auch keine höhere Momente —, kann man reziprok folgern, dass solche Multipolmomente Abweichungen von der Kugelsymmetrie signalisieren. VIII.3.2 b Einfacher Dipol ::::::::::::::::::::::::: Der einfachste mögliche elektrische Dipol besteht aus zwei um einen Abstandsvektor ~a getrennten Punktladungen q und −q. Bezeichnet man mit ~r0 den Ortsvektor des Mittelpunkts, so lautet die zugehörige Ladungsdichte ~a ~a 0 (3) 0 (3) 0 ρel.(~r ) = qδ ~r − ~r0 − − qδ ~r − ~r0 + . 2 2 q• 6 ~a −q • Abbildung VIII.3 Eingesetzt in die Gl. (VIII.23b)–(VIII.23d) führt diese Verteilung zur Gesamtladung Q = 0, zum elektrischen Dipolmoment P~ = q~a (VIII.24) und zu einem verschwindenden Quadrupoltensor Q = 0 . VIII.3.2 c Beispiel eines Quadrupols :::::::::::::::::::::::::::::::::::: Ein einfaches Beispiel von einer Ladungsverteilung mit nicht-trivialem elektrischem Quadrupoltensor besteht aus zwei Punktladungen q in den Punkten ~r0 ± ~a und einer dritten Punktladung −2q im Mittelpunkt ~r0 . Die zugehörige Ladungsdichte ist h i ρel.(~r 0 ) = q δ (3) ~r 0 − ~r0 − ~a + δ (3) ~r 0 − ~r0 + ~a − 2δ (3) ~r 0 − ~r0 , q• 6 ~a −2q • 6 ~a q• was sofort Q = 0 und P~ = ~0 für die ersten zwei Multipolmomente ergibt. Abbildung VIII.4 Die x3 -Achse sei entlang ~a. Die Ladungsdichte ist eine gerade Funktion von x01 und x02 . Für i 6= j muss entweder i oder j gleich 1 oder 2 sein, z.B. i = 1: dann ist das Integrand x01 x0j ρel.(~r 0 ) von Q1j ungerade in x01 , was nach Integration über R Q1j = 0 ergibt. Wegen der Symmetrie um die x3 -Achse sind die x1 - und x2 -Richtungen äquivalent, so dass 11 Q = Q22 . Aus der Spurlosigkeit von Q folgt dann Q11 = Q22 = − Q33 . 2 143 VIII.3 Multipolentwicklung Schließlich kann man Q33 direkt berechnen: Z Z 1 2(x03 )2 (x01 )2 + (x02 )2 (x03 )2 − |~r 0 |2 ρel.(~r 0 ) d3~r 0 = Q33 = ρel.(~r 0 ) d3~r 0 − 3 3 3 und nach Einsetzen der Ladungsdichte kommt 2 2 4 2 33 3 3 3 2 Q = q x0 − a + q x0 + a − 2q x0 = qa2 3 3 mit x30 der relevanten Komponente von ~r0 . Bemerkung: Eine andere geometrische Anordnung, die zu einem nicht-verschwindenden Quadrupoltensor bei Q = 0 und P~ = ~0 führt, besteht aus 4 Punktladungen q, −q, q, −q an den Ecken eines Quadrats. In diesem Fall ist Q aber nicht diagonal. −q • •q 6 a a -• −q q •? Abbildung VIII.5 VIII.3.3 Wechselwirkung zwischen zwei Ladungsverteilungen Die Wechselwirkung zwischen zwei elektrischen Punktladungen ist durch die bekannte CoulombKraft (VIII.14a) gegeben: sie ist proportional zum Produkt der Ladungen und lässt sich aus der Potentialenergie (VIII.14b) ableiten. In diesem Paragraphen wird die Wechselwirkung zwischen zwei beliebigen statischen Ladungsverteilungen ρel.,a , ρel.,b untersucht, insbesondere für den Fall, wenn diese weit von einander sind — d.h. falls deren Abstand viel größer als ihre typische Größe ist. VIII.3.3 a Wechselwirkungsenergie zweier Ladungsverteilungen :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Sei Φa bzw. Φb das elektrische Skalarpotential erzeugt durch die Verteilung ρel.,a bzw. ρel.,b gemäß der Poisson-Gleichung (VIII.4). Laut dem schon in § VIII.1.3 b benutzten Superpositionsprinzip erzeugt die Ladungsverteilung ρel.,a +ρel.,b das Potential Φa +Φb . Unter Verwendung der Gl. (VIII.16) lautet dann die gesamte Potentialenergie des Systems aus den zwei Verteilungen Z 1 V = ρel.,a (~r) + ρel.,b (~r) Φa (~r) + Φb (~r) d3~r. (VIII.25) 2 Nach einfachem Ausmultiplizieren des Integranden wird diese Energie zu Z Z Z 1 1 1 3 3 V = ρel.,a (~r)Φa (~r) d ~r + ρel.,b (~r)Φb (~r) d ~r + ρel.,a (~r)Φb (~r) + ρel.,b (~r)Φa (~r) d3~r 2 2 2 (VIII.26) ≡ Va + Vb + VW Die zwei ersten Terme Va , Vb sind der Art (VIII.16) mit im Integranden dem Produkt aus einer Ladungsdichte und dem dadurch verursachten Skalarpotential. Diese Terme stehen für die jeweiligen „Selbstenergien“ der Verteilungen a und b, entsprechend deren Potentialenergie in Abwesenheit der anderen Verteilung. Dagegen koppelt der dritte Term VW jede Ladungsdichte mit dem Potential erzeugt durch die andere Verteilung. Dieser Beitrag stellt die Wechselwirkungsenergie der Ladungsverteilungen dar. Er lässt sich mithilfe eines Tricks umschreiben. Aus der Kettenregel folgen nämlich (die Variablen werden nicht geschrieben) ~ · Φa ∇Φ ~ b = ∇Φ ~ a · ∇Φ ~ b + Φa 4Φb und ∇ ~ · Φb ∇Φ ~ a = ∇Φ ~ b · ∇Φ ~ a + Φb 4Φa , ∇ 144 Elektrostatik wobei die Skalarprodukte auf der rechten Seite beider Gleichungen gleich sind. Daraus ergibt sich ~ · Φa ∇Φ ~ b − Φb ∇Φ ~ a . Φa 4Φb = Φb 4Φa + ∇ Integriert man diese Gleichung über ein Volumen, so lässt sich das Integral des letzten Terms dank dem Gauß’schen Integralsatz in ein Oberflächenintegral transformieren, und zwar I ~ b − Φb ∇Φ ~ a · d2~S . Φa ∇Φ ∂V Sei V eine um den Nullpunkt zentrierte Kugel mit Radius L, welche die zwei Ladungsverteilungen einschließt. Ist die Kugelfläche ∂ V weit entfernt von den Verteilungen, d.h. für L groß genug, so wird das Potential Φi mit i = a oder b in einem Punkt von ∂ V durch die Multipolentwicklung (VIII.23a) gegeben. Insbesondere nimmt Φi in einem solchen Punkt wie 1/L ab, möglicherweise noch schneller ~ i | proportional zu 1/L2 oder kleiner, und |Φj ∇Φ ~ i | profalls Qi = 0. Dementsprechend ist |∇Φ 3 2 2 2 2 portional zu 1/L . Da das Flächenelement d S sich als L d Ω mit d Ω dem Raumwinkelelement schreiben lässt, findet man, dass das obige Oberflächenintegral proportional zu 1/L3 · L2 = 1/L ist: es verschwindet im Grenzwert L → ∞, entsprechend V → R3 .(43) Somit gilt Z Z Φb (~r)4Φa (~r) d3~r. Φa (~r)4Φb (~r) d3~r = R3 R3 Multipliziert mit −0 und unter Verwendung von −0 4Φi (~r) = ρel.,i (~r) wird dies zu Z Z Φa (~r)ρel.,b (~r) d3~r + Φb (~r)ρel.,a (~r) d3~r, so dass die in Gl. (VIII.26) definierte Wechselwirkungsenergie als Z Z VW = ρel.,a (~r)Φb (~r) d3~r = ρel.,b (~r)Φa (~r) d3~r (VIII.27) geschrieben werden kann. VIII.3.3 b Wechselwirkungsenergie zweier entfernter Ladungsverteilungen ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Sei jetzt angenommen, dass die zwei Ladungsverteilungen a, b weit entfernt von einander sind, wobei die Verteilung a in einer Umgebung des Koordinatennullpunkts lokalisiert ist. ρel.,a O ρel.,b Abbildung VIII.6 Die Taylor-Entwicklung bis zur zweiten Ordnung um den Wert ~r = ~0 von dem Skalarpotential Φb (~r) erzeugt durch die Verteilung b lautet Φb (~r) = Φb (~0) + 3 X i=1 xi 3 ∂Φb (~0) 1 X i j ∂ 2 Φb (~0) + xx + ··· . ∂xi 2 ∂xi ∂xj i,j=1 Im linearen Term sind die Ableitungen von Φb genau die Komponenten dessen Gradienten; dann erkennt man das Skalarprodukt aus dem letzteren mit dem Vektor ~r. Dazu kann der quadratische (43) Die hier verwendete Argumentation ist genau die gleiche wie für den Beweis von Gl. (VIII.17) in § VIII.1.4 c. 145 VIII.3 Multipolentwicklung Term erweitert werden, um xi xj als die Summe eines spurlosen und eines diagonalen Beitrags zu schreiben: 2 3 3 2 X 1 ~ r ∂ Φb (~0) ~r 2 X ij ∂ 2 Φb (~0) i j ij ~ Φb (~r) = Φb (~0) + ~r · ∇Φb (~0) + xx − δ + + ··· . δ 2 3 ∂xi ∂xj 6 ∂xi ∂xj i,j=1 i,j=1 Im letzten Term ist die Summe genau gleich dem Laplace-Operator 4Φb (~0): über die PoissonGleichung ist dieser aber proportional zur Ladungsdichte ρel.,b (~0), die per Annahme Null ist, denn ~ b durch −E ~ b , und drückt man dementdie Verteilung b ist anderswo lokalisiert. Ersetzt man dazu ∇Φ ~ b aus, so ergibt sich sprechend die zweiten Ableitungen von Φb durch erste Ableitungen von E i 3 X ∂Eb (~0) ~r 2 ~ b (~0) − 1 Φb (~r) = Φb (~0) − ~r · E xi xj − δ ij + ··· . 2 3 ∂xj i,j=1 Dieses Skalarpotential kann dann in die Wechselwirkungsenergie (VIII.27) — in der Form mit ~ b (~0) und ∂E i (~0)/∂xj und dem Integranden ρel.,a (~r)Φb (~r) — eingesetzt werden. Dabei sind Φb (~0), E b unabhängig von der Integrationsvariablen ~r, und können deshalb aus den jeweiligen Integralen herausgezogen werden. Unter Verwendung der kartesischen elektrischen Multipolmomente (VIII.23b)– (VIII.23d) der Verteilung a ergibt sich dann 3 X ∂Ebi (~0) ~ b (~0) − 1 VW = Qa Φb (~0) − P~a · E + ··· . Qij a 2 ∂xj (VIII.28) i,j=1 Bemerkungen: ∗ Wegen der Symmetrie der Wechselwirkungsenergie (VIII.27) gegenüber dem Austausch der beiden Systeme kann VW auch durch die elektrischen Multipolmomente der Verteilung b und das ~ a (~r0 ), ∂E i (~r0 )/∂xj , . . . ) in einem Punkt ~r0 des Skalarpotential Φa (~r0 ) und dessen Ableitungen (E a durch die Verteilung b besetzten Raumgebiets: 3 X ∂Eai (~r0 ) ~ a (~r0 ) − 1 VW = Qb Φa (~r0 ) − P~b · E + ··· . (VIII.29) Qij b 2 ∂xj i,j=1 Dabei sollen die Multipolmomente relativ zum Punkt ~r0 berechnet werden, d.h. mit ~r 0 − ~r0 bzw. x0i − xi0 statt ~r 0 bzw. x0i in den Vorfaktoren von ρel.(~r 0 ) in Gl. (VIII.23c)–(VIII.23d). ∗ Die sukzessiven Terme in der Formel (VIII.28) werden im Prinzip — d.h. wenn das zugehörige Multipolmoment nicht Null ist — immer kleiner mit wachsender Ordnung der darin auftretenden Ableitung von Φ. Somit ist der führende Beitrag jener der Gesamtladung, der genau gleich der Potentialenergie einer Punktladung Qa in einem äußeren (d.h. durch andere Ladungen erzeugten) Skalarpotential Φb ist. ∗ Wenn die Verteilung a sich drehen kann, dann wird sie es so machen, dass die Wechswelwirkungsenergie minimiert wird, entsprechend einem stabilen Gleichgewicht. Falls P~a 6= ~0 ist, wird ~ b (~0) ist. man deshalb zu einer Situation tendieren, in welcher P~a parallel zum elektrischen Feld E VIII.3.3 c Dipol-Dipol-Wechselwirkung :::::::::::::::::::::::::::::::::::::: Sei jetzt angenommen, dass beide Verteilungen “reine Dipole“ sind, d.h. nur deren elektrische Dipolmomente sind nicht Null, während alle anderen Momente, einschließlich der Gesamtladung, verschwinden. Der elektrische Dipol a befindet sich im Nullpunkt, der Dipol b in einem Punkt ~r. Unter einem „reinen Dipol“ versteht man eigentlich ein punktförmiges Objekt, versehen mit einem elektrischen Dipolmoment, jedoch ohne Gesamtladung oder höhere Multipolmomente. Wegen der verschwindenden Ausdehnung gilt das Skalarpotential (VIII.30a) überall im Raum (bis auf ~r = ~0, wo der Dipol sitzt), anstatt nur in großem Abstand vom Dipol, wie es beim einfachen „physikalischen“ Dipol des § VIII.3.2 b der Fall ist. 146 Elektrostatik BM P~aB ~r : P~b B Abbildung VIII.7 – Wechselwirkung zweier Dipole. Dann ist das durch den Dipol a erzeugte Skalarpotential Φa (~r) laut Gl. (VIII.23a) durch Φa (~r) = ~r · P~a 4π0 r3 (VIII.30a) gegeben, mit r ≡ |~r| = 6 0. Dieser Ausdruck führt nach Ableitung zum elektrischen Dipolfeld ~a ~r ~a 3 ~ r · P P ~ a (~r) = −∇Φ ~ a (~r) = − + E 4π0 r3 4π0 r5 d.h. ~a ~r − ~r 2 P~a 3 ~ r · P ~ a (~r) = . E 4π0 r5 (VIII.30b) Das Einsetzen dieses Feldes in die Wechselwirkungsenergie (VIII.29), in der nur der Dipolterm betrachtet wird, ergibt P~a · P~b − 3 ~er · P~a ~er · P~b VW = (VIII.31) 4π0 r3 mit ~er ≡ ~r/|~r| dem Einheitsvektor in Richtung ~r. Dies stellt die Potentialenergie der Dipol-DipolWechselwirkung dar. Bemerkung: Das elektrische Skalarpotential (VIII.30a) bzw. Dipolfeld (VIII.30b) nimmt mit dem Abstand r zur Quelle wie 1/r2 bzw. 1/r3 ab, d.h. schneller als das Potential bzw. Feld erzeugt durch eine Punktladung (1/r bzw. 1/r2 , § VIII.1.3 a). VIII.3.4 Multipolentwicklung in Kugelkoordinaten Die Multipolentwicklung kann auch in Kugelkoordinaten (r, θ, ϕ) formuliert werden, wobei die Ladungsverteilung, die das Skalarpotential verursacht, im Nullpunkt des Bezugssystems sitzt. Diese Entwicklung basiert auf die folgende Formel, die für beliebige Vektoren ~r, ~r 0 gilt, mit den Bezeichnungen r< ≡ min(r, r0 ) und r> ≡ max(r, r0 ) für r ≡ |~r|, r0 ≡ |~r 0 |: ∞ X ` ` X 4π r< 1 = Y ∗ (θ, ϕ)Y`m (θ, ϕ), `+1 `m |~r − ~r 0 | 2` + 1 r> (VIII.32) `=0 m=−` wobei die Y`m die Kugelflächenfunktionen (44) sind. Setzt man diese Identität in den Ausdruck für das Skalarpotential (VIII.12a) in einem Punkt ~r ein, mit |~r| ≥ |~r 0 | für jeden ~r 0 in der Verteilung, so ergibt sich r ∞ X ` X 4π Y`m (θ, ϕ) Φ(~r) = q`m , (VIII.33a) 2` + 1 4π0 r`+1 `=0 m=−` mit den elektrischen Multipolmomenten r Z 4π ∗ (r0 )` Y`m q`m ≡ (θ0 , ϕ0 )ρel.(~r 0 ) d3~r 0 . 2` + 1 (44) Vgl. Anhang E. (VIII.33b) VIII.3 Multipolentwicklung 147 Jeder ganzen Zahl ` ∈ N sind genau 2` + 1 mögliche Werte √ von m zugeordnet, d.h. 2` + 1 Multipolmomente q`m . Für ` = 0 prüft man mit Y00 (θ, ϕ) = 1/ 4π einfach nach, dass q00 gleich der Gesamtladung Q ist. Dann sind die 3 bzw. 5 Multipolmomente q1m bzw. q2m Linearkombinationen der 3 bzw. 5 unabhängigen Komponenten des Dipolmoments P~ bzw. des Quadrupoltensors Q . Allgemeiner entsprechen die 2` + 1 Momente q`m den 2` + 1 unabhängigen Komponenten des symmetrischen, spurlosen elektrischen 2` -poltensors, wobei der letztere `-ter Stufe ist. Bemerkungen: ∗ Für eine kugelsymmetrische Verteilung ist die Ladungsdichte ρel.(~r0 ) winkelunabhängig, d.h. der Form Y00 (θ0 , ϕ0 )f (r0 ). Aus der Orthogonalität der Kugelflächenfunktionen folgt dann, dass jedes Moment q`m mit ` 6= 0 Null ist, was sich hier viel schneller als in § VIII.3.2 a beweisen lässt. ∗ Die Entwicklung in Kugelflächenfunktionen (VIII.33a) ist zwar eine exakte Gleichung, während die kartesische Multipolentwicklung (VIII.23a) eine Näherung für große Abstände darstellt. Die erstere ist in der Praxis aber nur nützlich, falls die Anzahl der signifikanten Multipolmomente endlich (und klein) ist, wodurch die Näherung eines großen Abstands wieder auftaucht. Literatur zum Kapitel VIII • Fließbach, Elektrodynamik [3] Teil II. • Greiner, Klassische Elektrodynamik [8] Teil I. • Griffiths, Elektrodynamik [9] = Introduction to Electrodynamics [10] Kap 2.1–2.4 & 3. • Jackson, Klassische Elektrodynamik [11] = Classical Electrodynamics [12] Kap. 1.1–1.5, 1.7– 1.11, 2.1, 3.5–3.6 & 4.1–4.2. • Landau & Lifschitz, Klassische Feldtheorie [14] = The classical theory of fields [26] Kap. 5 § 36–38 & 41–42 • Nolting, Elektrodynamik [17] Kap. 2.1–2.3. • Scheck, Klassiche Feldtheorie [19] Kap. 1.5 & 1.7. K APITEL IX Magnetostatik Hier fehlt die obligatorische Einleitung. . . Im stationären Fall vereinfachen sich die Maxwell–Thomson- und die Maxwell–Ampère-Gleichungen ~ r) — die jetzt zeitunabhängig ist — zu für die magnetische Flussdichte B(~ ~ · B(~ ~ r) = 0 ∇ ~ × B(~ ~ r) = µ0~el.(~r). ∇ (IX.1a) (IX.1b) IX.1 Grundbegriffe und -ergebnisse der Magnetostatik Dieser Abschnitt befasst sich mit einigen elementaren Folgerungen der Grundgleichungen (IX.1) der Magnetostatik. IX.1.1 Vektorpotential Aus der (stationären) Maxwell–Thomson-Gleichung (IX.1a) folgt die Existenz eines differenzier~ r) derart, dass die Beziehung baren Vektorfeldes A(~ ~ r) = ∇ ~ × A(~ ~ r) B(~ (IX.2) ~ r) heißt (magnetisches) Vektorpotential , mit der physiin jedem Punkt ~r erfüllt wird. Das Feld A(~ −2 −1 (45) kalischen Dimension [A] = M L T I . ~ auf R3 definiert ist, wird die Existenz von A(~ ~ r) unten bewiesen, Falls das magnetische Feld B indem es explizit konstruiert wird [Gl. (IX.11)]. ~ r) und einer elektrischen Ladung q hat die Bemerkung: Das Produkt aus dem Vektorpotential A(~ physikalische Dimension M L T−1 eines Impulses. Eichfreiheit :::::::::::: ~ r) entsprechend einem gegebenen magnetischen Feld B(~ ~ r) wird durch Das Vektorpotential A(~ 0 ~ über Gl. (IX.2) nicht eindeutig festgestellt. Definiert man nämlich ein Vektorfeld A ~ 0 (~r) ≡ A(~ ~ r) + ∇χ(~ ~ r) A (IX.3a) ~0 mit χ einer beliebigen kontinuierlich differenzierbaren skalaren Funktion, so ist die Rotation von A ~ 0 (~r) ≡ ∇ ~ ×A ~ 0 (~r) = ∇ ~ × A(~ ~ r) + ∇ ~ × ∇χ(~ ~ r) = B(~ ~ r), B (IX.3b) ~ 0 ist auch ein geeignetes Vektorpotential für das Feld B. ~ Die Mehrdeutigkeit in der Wahl des d.h. A Vektorpotentials wird als Eichfreiheit bezeichnet, und eine bestimmte Wahl als Eichung. (45) Die zugehörige SI-Einheit wird nie benutzt. 149 IX.1 Grundbegriffe und -ergebnisse der Magnetostatik Um das Vektorpotential eindeutig — möglicherweise bis auf einen konstanten additiven Vektor — ~ r) fordern. Dabei soll diese Eichbedingung festzulegen, kann man eine zusätzliche Bedingung über A(~ so gewählt sein, dass einige Gleichungen damit einfacher werden, wie es in § IX.1.2 c der Fall sein wird. In der Magnetostatik wird meistens die Coulomb-Eichung gewählt, entsprechend der CoulombEichbedingung ~ · A(~ ~ r) = 0. ∇ (IX.4) ~ 0 (~r) ein Vektorpotential für die magnetische Induktion B(~ ~ r). Falls die Divergenz von A ~0 Sei A ~ ~ Null ist, dann erfüllt es schon die Coulomb-Eichbedingung. Wenn ∇ · A0 (~r) nicht identisch verschwindet, dann hat die Poisson-Gleichung ~ ·A ~ 0 (~r) 4χ(~r) = −∇ ~ ≡ A ~ 0 + ∇χ, ~ eine nicht-konstante Lösung χ(~r) auf R3 . Definiert man dann A so findet man ~ sofort, dass A die Bedingung (IX.4) erfüllt. IX.1.2 Poisson-Gleichungen der Magnetostatik Aus den Grundgleichungen (IX.1) können Poisson-Gleichungen für die magnetische Induktion ~ r) oder das Vektorpotential A(~ ~ r) abgeleitet werden, wobei sich diese Vektorfelder durch die B(~ elektrische Stromdichte ~el.(~r) ausdrücken lassen. IX.1.2 a Poisson-Gleichung für die magnetische Induktion ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Die Rotationsbildung der stationären Maxwell–Ampère-Gleichung (IX.1b) lautet ~ × ∇ ~ × B(~ ~ r) = 1 ∇ ~ × ~el.(~r). ∇ 0 c2 Dabei kann auf der linken Seite die Identität ~ × ∇ ~ × B(~ ~ r)] = ∇ ~ ∇ ~ · B(~ ~ r)] − 4B(~ ~ r) ∇ benutzt werden, wobei der erste Term im rechten Glied wegen der Maxwell–Thomson-Gleichung Null ist. Insgesamt ergibt sich somit ~ r) = −µ0 ∇ ~ × ~el.(~r) 4B(~ (IX.5) d.h. jede (kartesische) Komponente der magnetischen Induktion genügt der Poisson-Gleichung. Die Lösung dieser Gleichung wurde in Abschn. VIII.2 schon studiert. Ist die elektrische Ladungsstromdichte ~el. bekannt auf R3 — und wenn deren Rotation schnell genug im Unendlichen nach Null geht, damit das untere Integral definiert ist —, so gilt ~ r) = µ0 B(~ 4π Z ~ ∇ × ~el.(~r 0 ) 3 0 d ~r . |~r − ~r 0 | (IX.6) In der Praxis kann das Integral auf ein Raumgebiet V beschränkt werden, wenn es keine Stromdichte im Unendlichen gibt. IX.1.2 b Biot–Savart-Gesetz :::::::::::::::::::::::::::: Unter Einführung eines kartesischen Koordinatensystems mit Basis {~ei } lässt sich die i-te Komponente der Beziehung (IX.6) als Z k (~ r 0) 3 0 µ0 ijk ∂jel. i B (~r) = d ~r 4π V |~r − ~r 0 | ∂x0j umschreiben. Die rechte Seite kann mithilfe einer partiellen Integration transformiert werden. Dabei 150 Magnetostatik wird angenommen, dass das Integrationsvolumen V groß genug ist, damit die Stromdichte ~el. am Rand ∂ V verschwindet. Dann ist der integrierte Term aus der partiellen Integration Null, und es bleibt Z µ0 1 i ijk k 0 ∂ B (~r) = − jel.(~r ) 0j d3~r 0 . 4π V ∂x |~r − ~r 0 | Das Ersetzen von −ijk durch ikj und die Berechnung der Ableitung liefern Z µ0 xj − x0j 3 0 i k B (~r) = ikj jel. (~r 0 ) d ~r , 4π V |~r − ~r 0 |3 d.h. ~ r) = µ0 B(~ 4π ~el.(~r 0 ) × (~r−~r 0 ) 3 0 d ~r . |~r − ~r 0 |3 V Z (IX.7) Diese Beziehung heißt Biot (ag) –Savart (ah) -Gesetz . IX.1.2 c Poisson-Gleichung für das Vektorpotential ::::::::::::::::::::::::::::::::::::::::::::::::::: ~ r) = ∇ ~ × A(~ ~ r) in die stationäre Maxwell–Ampère-Gleichung (IX.1b) Setzt man die Beziehung B(~ ein, so ergibt sich ~ × ∇ ~ × A(~ ~ r)] = µ0~el.(~r), ∇ d.h. unter Berücksichtigung der Formel für die Rotation einer Rotation ~ r) = −µ0~el.(~r) + ∇ ~ ∇ ~ · A(~ ~ r) . 4A(~ (IX.8) Unter Verwendung der Coulomb-Eichbedingung (IX.4) vereinfacht sich diese Gleichung erneut zu einer Poisson-Gleichung ~ r) = −µ0~el.(~r) in der Coulomb-Eichung. 4A(~ (IX.9) Wie oben kann man die Lösung dieser Gleichung direkt schreiben: ~ r) = µ0 A(~ 4π ~el.(~r 0 ) 3 0 d ~r . r − ~r 0 | V |~ Z (IX.10) Falls ~el. am Rand des Integrationsgebiets V verschwindet — was der Fall ist, wenn V nicht der ganze Raum R3 ist —, so erfüllt das Vektorpotential (IX.10) die Coulomb-Eichbedingung (IX.4). ~ ~r bzw. ∇ ~ ~r 0 den Nabla-Operator bezüglich der Koordinaten des Beweis: Bezeichnet man mit ∇ Vektors ~r bzw. ~r 0 , so gilt Z Z 0 1 ~ · A(~ ~ r) = µ0 ∇ ~ ~r · ~el.(~r ) d3~r 0 = µ0 ~el.(~r 0 ) · ∇ ~ ~r d3~r 0 . ∇ 4π V |~r − ~r 0 | 4π V |~r − ~r 0 | ~ ~r (1/|~r−~r 0 |) = −∇ ~ ~r 0 (1/|~r−~r 0 |) schreiben. Dann lässt sich das daraus Im Integranden kann man ∇ folgende Integral über partielle Integration berechnen, wobei der integrierte Term, proportional zur Ladungsstromdichte ausgewertet am Rand des Integrationsgebiets, Null ist: Z Z 1 µ0 1 ~ 3 0 ~ · A(~ ~ r) = − µ0 ~el.(~r 0 ) · ∇ ~ ~r 0 ∇ d ~ r = ∇~r 0 · ~el.(~r 0 ) d3~r 0 . 4π V |~r − ~r 0 | 4π V |~r − ~r 0 | (ag) ~ ~r 0 · ~el.(~r 0 ) = 0, was zu Aus der stationären Maxwell–Ampère-Gleichung (IX.1b) folgt sofort ∇ ~ · A(~ ~ r) = 0 führt. ∇ 2 J.-B. Biot, 1774–1862 (ah) F. Savart, 1791–1841 151 IX.1 Grundbegriffe und -ergebnisse der Magnetostatik Das Biot–Savart-Gesetz (IX.7) kann auch aus der Beziehung (IX.10) wiedergefunden werden. Bildet man deren Rotation, so ergibt sich ~ × A(~ ~ r) = µ0 ∇ 4π 0 ~ ~r × ~el.(~r ) d3~r 0 . ∇ |~r − ~r 0 | V Z In einem kartesischen Koordinatensystems lautet die i-te Komponente dieser Gleichung µ0 B (~r) = 4π i Z ijk V k (~ r 0) 3 0 ∂ jel. µ0 d ~r = j 0 ∂x |~r − ~r | 4π Z V k ijk jel. (~r 0 ) ∂ ∂xj 1 d3~r 0 . |~r − ~r 0 | Dabei gibt die Ableitung −(xj − x0j )/|~r − ~r 0 |3 . Mit −ijk = ikj ergibt sich µ0 B (~r) = 4π i Z V k ikj jel. (~r 0 ) xj − x0j 3 0 d ~r , |~r − ~r 0 | entsprechend genau der i-ten Komponente der Gl. (IX.7). Bemerkung: Unter Verwendung der stationären Maxwell–Ampère-Gleichung wird die Gl. (IX.10) zu einem Zusammenhang zwischen dem Vektorpotential (in Coulomb-Eichung) und der magnetischen Induktion: Z ~ ~ r 0) ∇ × B(~ 1 ~ d3~r 0 . (IX.11) A(~r) = 4π V |~r − ~r 0 | Dabei handelt es sich um einen Sonderfall der Helmholtz (ai) -Zerlegung, laut welcher jedes Vektorfeld ~ (~r) auf R3 , das sich im Unendlichen „gut verhält“ — d.h. derart, dass die Integrale (IX.12b)– V ~k (~r) und eines Rotationsfeldes V ~⊥ (~r) (IX.12c) existieren(46) —, als Summe eines Gradientenfeldes V schreiben lässt: ~ (~r) = V ~k (~r) + V ~⊥ (~r), wobei V Z ~ ~ (~r 0 ) ∇~r 0 · V ~ ~ Vk (~r) = −∇Φ(~r) mit Φ(~r) ≡ d3~r 0 0| 4π|~ r − ~ r V Z ~ ~ 0 ~⊥ (~r) = ∇ ~ × A(~ ~ r) mit A(~ ~ r) ≡ ∇~r 0 × V (~r ) d3~r 0 . V r − ~r 0 | V 4π|~ (IX.12a) (IX.12b) (IX.12c) Dabei gelten ~ ·V ~⊥ (~r) = 0 und ∇ ~ ×V ~k (~r) = ~0, ∇ (IX.12d) ~ ·V ~ (~r) = ∇ ~ ·V ~k (~r) und ∇ ~ ×V ~ (~r) = ∇ ~ ×V ~⊥ (~r). ∇ (IX.12e) d.h. ~ (~r) = B(~ ~ r) mit ∇ ~ · B(~ ~ r) bzw. ∇ ~ × B(~ ~ r) gegeben durch Gl. (IX.1a) bzw. In der Magnetostatik ist V ~ ~ ~ · E(~ ~ r) bzw. ∇ ~ × E(~ ~ r) (IX.1b). Für die Elektrostatik soll man V (~r) = E(~r) betrachten, während ∇ durch Gl. (VIII.1a) bzw. (VIII.1b) gegeben sind. (46) (ai) ~ (~r)| schneller als 1/r für r → ∞ abnehmen soll. In Lehrbüchern findet man oft die Forderung, dass der Betrag |V ~ , vgl. z.B. Ref. [28] für eine Diskussion. Mathematisch gilt das Ergebnis auch mit schwächeren Annahmen über V H. von Helmholtz, 1821–1894 152 Magnetostatik IX.1.3 Integrale Formulierung der Grundgleichungen der Magnetostatik In diesem Paragraphen werden die integralen Formulierungen dargestellt, die den lokalen Grundgleichungen (IX.1) der Magnetostatik entsprechen. IX.1.3 a Fluss der magnetischen Induktion ::::::::::::::::::::::::::::::::::::::::::: Sei ∂ V eine geschlossene Fläche, die ein Gebiet V einschließt. Der magnetische Fluss durch die I Oberfläche ∂ V wird durch ~ r) · d2 S~ ΦB ≡ B(~ (IX.13) ∂V d2 S~ d2 S ~en definiert, mit = dem vektoriellen Oberflächenelement, wobei ~en den nach außen ausgerichteten Normaleinheitsvektor zu d2 S bezeichnet. Unter Verwendung des Integralsatzes von Gauß ist das Oberflächenintegral auf der rechten Seite gleich dem Volumenintegral der Divergenz des Integranden, d.h. I Z 2~ ~ ~ · B(~ ~ r) d3~r. B(~r) · d S = ∇ V ∂V Wegen der Maxwell–Thomson-Gleichung (IX.1a) ist die rechte Seite dieser Gleichung immer Null, unabhängig von V ΦB = 0. (IX.14) Das heißt, der magnetische Fluss durch jede geschlossene Fläche ist immer Null. IX.1.3 b Ampère-Gesetz Sei S eine Fläche und ∂S deren Rand. Das Oberflächenintegral über S der stationären Maxwell– Ampère-Gleichung (IX.1b) lautet Z Z 2~ ~ ~ ~ ∇ × B(~r) · d S = µ0 ~el.(~r) · d2 S. :::::::::::::::::::::::: S S Dabei ist das Integral auf der rechten Seite genau gleich der Stärke I des elektrischen Stroms durch S. Wiederum lässt sich auf der linken Seite das Oberflächenintegral einer Rotation über S mit dem Integralsatz von Stokes in ein Kurvenintegral entlang des geschlossenen Rands ∂S transformieren. Somit ergibt sich das Ampère-Gesetz I Z ~ ~ B(~r) · d` = µ0 ~el.(~r) · d2 S~ = µ0 I. (IX.15) S ∂S ~ (~r) entlang einer geschlossene Kurve C wird Bemerkung: Das Kurvenintegral eines Vektorfeldes V Zirkulation des Feldes längs C genannt. Somit tritt auf der linken Seite des Ampère-Gesetzes (IX.15) die Zirkulation der magnetischen Induktion längs des Rands ∂S. Dementsprechend besagt das Ampère-Gesetz, dass die Zirkulation der magnetischen Induktion längs einer geschlossenen Kurve ∂S gleich µ0 mal dem elektrischen Strom durch eine von ∂S aufgespannte Fläche ist. IX.1.3 c Erhaltung des elektrischen Stroms ::::::::::::::::::::::::::::::::::::::::::: Die Divergenzbildung der stationären Maxwell–Ampère-Gleichung (IX.1b) gibt ~ · ~el.(~r) = 0. ∇ Unter Verwendung des Integralsatzes von Gauß ergibt sich dann Z I ~ · ~el.(~r) d3~r = 0= ∇ ~el.(~r) · d2 S~ V (IX.16) (IX.17) ∂V d.h. der resultierende Ladungsstrom durch die Oberfläche ∂ V eines Volumens V verschwindet: der 153 IX.1 Grundbegriffe und -ergebnisse der Magnetostatik einströmende Ladungsstrom muss wieder herausströmen, entsprechend der Abwesenheit von Quellen des elektrischen Stroms. ~ (~r), dessen Divergenz überall verBemerkung: Dementsprechend wird ein allgemeines Vektorfeld V schwindet, als quellfrei bezeichnet. Aus dieser Erhaltung des Ladungsstroms folgt die Kirchhoff ’sche (aj) Knotenregel ,(47) laut der die Summe der an einem Leiterknoten zufließenden elektrischen Ströme gleich der Summe der daraus abfließenden Ströme ist. Beweis: Betrachtet man ein Volumen V um den Knoten, so ist der nach außen gerichtete Fluss der Stromdichte ~el. durch die Fläche ∂ V gleich der algebraischen Summe der Stromstärken in den Leitern, wobei aus- bzw. einfließende Ströme positiv bzw. negativ gezählt werden. Für das Beispiel der Abb. IX.1 I ~el.(~r) · d2 S~ = I1 − I2 − I3 − I4 + I5 = 0. ∂V ∂V I2 I1 • I5 I3 I4 Abbildung IX.1 – Knotenregel IX.1.4 Magnetisches Feld induziert durch einfache Ladungsströme Im Fall eines Ladungsstroms durch einen dünnen Draht vereinfacht sich das Integral im Biot– Savart-Gesetz (IX.7) oder in den äquivalenten Formeln (IX.6) und (IX.10). Betrachtet man nämlich ein infinitesimales Volumenelement d3~r 0 um einen Teil des Drahts, so lässt sich dieses als d2 S 0 d`0 d2 S 0 d2 S d`0 Abbildung IX.2 (47) (aj) d.h. auch bekannt als erstes Kirchhoff ’sches Gesetz . G. Kirchhoff, 1824–1887 154 Magnetostatik schreiben, mit d`0 der Länge von d3~r 0 entlang des Drahts und d2 S 0 die Fläche des Querschnitts von d3~r 0 senkrecht dazu. Sei ~ek der Einheitsvektor in Drahtrichtung — d.h. kollinear zur Stromdichte ~el.(~r 0 ) —, sowie Vektoren d~` 0 ≡ d`0 ~ek und d2 S~ 0 ≡ d2 S 0 ~ek , im Einklang mit der üblichen Definition des vektoriellen Flächenelements. Dann gilt ~el.(~r 0 ) d3~r 0 = ~el.(~r 0 ) d2 S 0 d`0 = ~el.(~r 0 ) · d2 S~ 0 d~` 0 . Daraus folgt Z ~el.(~r 0 ) d3~r 0 = Z Z ~el.(~r 0 ) · d2 S~ 0 d~` 0 . Zum Oberflächenintegral trägt nur der in Abb. (IX.2) Querschnitt d2 S bei, was die Stromstärke I des Ladungsstroms ergibt. Insgesamt können Volumenintegrale durch Kurvenintegrale entlang des Drahts ersetzt werden, mit der Substitution ~el.(~r 0 ) d3~r 0 = I d~` 0 . IX.1.4 a Magnetisches Feld eines dünnen geradlinigen Draht Durch einen unendlich langen dünnen geradlinigen elektrischen Leiter fließt ein (stationärer) Ladungsstrom I. Dieser erzeugt in jedem Punkt ~r ~ r). außerhalb des Drahts eine magnetische Induktion B(~ Wegen der Zylindersymmetrie um den Draht hängt der Betrag des Feldes in ~r nur vom Abstand R zur Achse des Leiters ab, sei B(R). Sei C ein Kreis mit Radius R in einer Ebene senkrecht zum Draht, wo- ~ r) bei der letztere durch das Zentrum des Kreises durchläuft; dann ist B(~ (IX.18) ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: I C ~ B konstant entlang C . Wegen der Symmetrie der Geometrie in Spiegelungen ~ r) in einem Punkt ~r des Kreises in der bezüglich der Ebene von C muss B(~ ~ Ebene liegen; genauer ist B(~r) tangential zum Kreis, denn es orthogonal zum Abstandsvektor zur Drahtachse ist. Die genaue Richtung folgt aus Abbildung IX.3 der Rechte-Hand-Regel. ~ r) in jedem Punkt ~r des Kreises tangential dazu ist, lautet die Zirkulation der magnetischen Da B(~ Induktion entlang C I I ~ ~ ~ r) d` = 2πRB(R), B(~r) · d` = B(~ C C ~ r) auf C berücksichtigt. Laut dem Ampèrewobei die zweite Gleichung den konstanten Wert von B(~ Gesetz ist diese Zirkulation gleich µ0 I, woraus sich B(R) = µ0 I 2πR (IX.19) ergibt. IX.1.4 b Magnetisches Feld einer Leiterschleife ::::::::::::::::::::::::::::::::::::::::::::::: Als Ladungsstrom wird jetzt ein stationärer Strom I durch eine kreisförmige Leiterschleife C ~ r) in einem Punkt P auf der mit Radius R betrachtet. Gesucht ist die magnetische Induktion B(~ Achse des Kreises. Sei O das Zentrum von C und x der Abstand zwischen O und P . Laut dem Biot–Savart-Gesetz (IX.7) mit der Substitution (IX.18) ist das Feld erzeugt durch die Leiterschleife durch I I d~` 0 × (~r − ~r 0 ) ~ r) = µ0 (IX.20) B(~ 4π C |~r − ~r 0 |3 gegeben. Dabei ist ~r 0 der Ortsvektor des Linienelements d~` 0 entlang des Leiters. 155 IX.1 Grundbegriffe und -ergebnisse der Magnetostatik d~` d I ~ dB ϕ α x O C • P R x2 x1 x3 Abbildung IX.4 ~ gegeben durch Ein solches Leiterelement erzeugt eine infinitesimale magnetische Induktion dB das Integrand des Kurvenintegrals. Dieses Feld ist senkrecht zum Abstandsvektor ~r −~r 0 von d`0 bis zum Punkt P , wie in Abb. IX.4 dargestellt wird. Das Problem besitzt aber Zylindersymmetrie um ~ die Achse des Kreises, so dass das durch den ganzen Stromkreis erzeugte Feld B(x) parallel dazu sein muss. Dementsprechend wird hiernach nur die Komponente der Gl. (IX.20) entlang der Achse betrachtet. Unabhängig von der Position des Linienelements d~` 0 entlang C bleibt dessen Abstand |~r − ~r 0 | zum Punkt P konstant, sei d, während der Abstandsvektor ~r − ~r 0 und d~` 0 immer orthogonal zu einander sind. Somit ist der Betrag des Integranden von Gl. (IX.20) konstant gleich I d`0 /d2 . Gleichfalls ist der Winkel zwischen dem durch den durch d~` 0 fließenden Strom erzeugten Feld ~ und der Achse auch konstant, und zwar gleich π/2 − α, wobei α in Abb. IX.4 definiert ist. dB ~ Daraus folgert man für den Betrag von B I I I d`0 π µ0 I π µ0 I π 0 ~ = µ0 B(x) cos −α = cos −α d` = cos − α 2πR. 4π C d2 2 4π d2 2 4π d2 2 C √ Dabei gilt cos(π/2 − α) = sin α = R/d, mit d = R2 + x2 . Insgesamt kommt R2 ~ = µ0 I B(x) 2 (R2 + x2 )3/2 ~ ist gerichtet nach rechts in Abb. IX.4. und B Alternativ kann man ein kartesisches Koordinatensystem einführen (vgl. Abb. IX.4) und damit arbeiten. Parametrisiert man die Position eines Punkts von C mit einem Winkel ϕ, so gelten 0 R cos ϕ −R cos ϕ ~r = 0 und ~r 0 = R sin ϕ d.h. ~r − ~r 0 = −R sin ϕ . x 0 x Dazu kann man bemerken, dass das Linienelement d~` 0 tangential zum Kreis genau die infinitesimale Variation von ~r 0 darstellt; daher ist −R sin ϕ 0 0 d~r d~r d~` 0 = dϕ mit = R cos ϕ dϕ dϕ 0 und das Kurvenintegral entlang C wird zu einem Integral über ϕ ∈ [0, 2π]. Daraus folgt xR cos ϕ dϕ. xR sin ϕ d~` 0 × (~r − ~r 0 ) = R2 (cos2 ϕ + sin2 ϕ) 156 Magnetostatik Das Einsetzen in die Biot–Savart-Formel (IX.20) unter Berücksichtigung von |~r−~r 0 | = ergibt schließlich Z 2π xR cos ϕ 0 2 µ I µ I R 0 0 ~ r) = xR sin ϕ dϕ = 0 B(~ 4π 0 (R2 + x2 )3/2 2 (R2 + x2 )3/2 R2 1 √ R 2 + x2 im Einklang mit dem schon oben gefundenen Ergebnis. IX.1.5 Kraft zwischen zwei Stromkreisen In Abwesenheit eines elektrischen Feldes lautet die Lorentz-Kraftdichte auf eine Ladungsstromdichte ~el. in einem magnetischen Feld ~ r). f~L (~r) = ~el.(~r) × B(~ (IX.21) Ausgehend aus dieser Formel kann man die Kraft F~a→b , die ein erster Stromkreis a mit Stromdichte ~el.,a auf einem zweiten Stromkreis b mit Stromdichte ~el.,b ausübt. Sei V a bzw. V b ein Gebiet, das den Stromkreis a bzw. b beinhaltet, wobei ~el.,i in jedem Punkt ~ a im des Rands von V i verschwindet. Die Stromdichte ~el.,a erzeugt eine magnetische Induktion B Raum, insbesondere in jedem Punkt ~rb ∈ V b . Dadurch erfährt der Stromkreis b eine Kraft Z ~ a (~rb ) d3~rb . F~a→b = ~el.,b (~rb ) × B Vb ~ a (~rb ) mithilfe des Biot–Savart-Gesetzes geschrieben werden: Dabei kann B Z Z ~el.,a (~ra ) × (~rb − ~ra ) 3 µ0 ~ Fa→b = ~el.,b (~rb ) × d ~ra d3~rb . 4π Vb |~rb − ~ra |3 Va Diese Formel lässt sich mit Hilfe der Identität ~rb − ~ra 1 ~ = −∇b |~rb − ~ra |3 |~rb − ~ra | umschreiben ~b ~el.,b (~rb ) × ∇ 1 × ~el.,a (~ra ) d3~rb d3~ra |~rb − ~ra | Va Vb Unter Verwendung des doppelten Kreuzprodukts ~a × ~b × ~c = ~a · ~c ~b − ~a · ~b ~c kommt Z Z 1 µ0 ~ ~ ~el.,a (~ra ) · ~el.,b (~rb ) ∇b d3~rb d3~ra Fa→b = 4π Va Vb |~rb − ~ra | Z Z µ0 1 ~ − ~el.,b (~rb ) · ∇b ~el.,a (~ra ) d3~rb d3~ra . 4π Va Vb |~rb − ~ra | µ0 F~a→b = 4π Z Z (IX.22) Wie wir jetzt beweisen werden, ist der Term in der zweiten Zeile Null, denn das darin enthaltene Integral über ~rb verschwindet. In der Tat gilt unter Einführung der Koordinaten {xkb } von ~rb Z Z X 3 ∂ 1 1 3 k ~ ~el.,b (~r) · ∇~rb d ~rb = jel.,b (~rb ) k d3~rb |~rb − ~ra | ∂xb |~rb − ~ra | Vb Vb k=1 k Z X Z 3 3 k (~ X jel.,b (~rb ) 3 ∂jel.,b rb ) 3 ∂ 1 d ~rb . = d ~ r − k k rb − ~ra | ∂xb |~rb − ~ra | ∂xb Vb Vb |~ k=1 k=1 Dabei erkennt man die Divergenz zweier Vektorfelder: Z Z Z ~ (~ r ) 1 1 el.,b b 3 3 ~ ~r ~ ~ b · ~el.,b (~rb ) d3~rb . ~el.,b (~rb ) · ∇ d ~ r = ∇ · d ~ r − ∇ b b b b |~ r − ~ r | |~ r − ~ r | |~ r − ~ r | a a a b b Vb Vb Vb b 157 IX.2 Multipolentwicklung Das zweite Integral auf der rechten Seite verschwindet wegen der Quellfreiheit (IX.16) der Stromdichte. Wiederum lässt sich das erste Integral mit dem Satz von Gauß transformieren: daraus kommt das Oberflächenintegral von ~el.,b (~rb )/|~rb − ~ra | über den Rand ∂ V b , wo ~el.,b Null ist, so dass auch dieses Term verschwindet. Insgesamt bleibt somit die Kraft Z Z µ0 1 ~ ~ Fa→b = ~el.,a (~ra ) · ~el.,b (~rb ) ∇b d3~rb d3~ra . (IX.23) 4π Va Vb |~rb − ~ra | Da der Gradient von 1/|~rb − ~ra | bezüglich ~ra das Negative des Gradienten bezüglich ~rb ist, kommt ein globales Minus-Zeichen im Austausch der Rollen von a und b, und zwar F~b→a = −F~a→b . Dies ist genau das dritte Newton’sche Gesetz (I.19). IX.2 Multipolentwicklung Ähnlich der in Abschn. VIII.3 studierten Entwicklung des elektrostatischen Skalarpotentials Φ(~r) einer Ladungsverteilung ρel. als Summe der Potentiale erzeugt durch sukzessive Multipolmomente, wobei das 2` -te Moment einen Beitrag proportional zu 1/r`+1 liefert, kann das Vektorpotential ~ r) einer Ladungsstromverteilung ~el. ebenfalls als Summe der Effekte von Multipolmomenten A(~ geschrieben werden. IX.2.1 Multipolmomente einer Ladungsstromverteilung Es wird angenommen, dass die Stromverteilung innerhalb eines Volumens V in der Umgebung des Ursprungs des Bezugssystems lokalisiert ist, wobei ~el. in jedem Punkt des Rands ∂ V von V Null ist. Das magnetische Feld wird in einem weit entfernten Punkt ~r gesucht, d.h. |~r −~r 0 | R für jeden ~r 0 ∈ V . Gemäß der Gl. (IX.9) lautet das Vektorpotential (in Coulomb-Eichung) Z µ0 ~el.(~r 0 ) 3 0 ~ A(~r) = d ~r . 4π V |~r − ~r 0 | Dank den Annahmen ist der Abstand |~r − ~r 0 | im Nenner des Integranden ungefähr gleich r ≡ |~r|. Somit kann der Bruch 1/|~r − ~r 0 | mithilfe einer Taylor-Entwicklung angenähert werden. Zur ersten Ordnung in ~r0 gilt 3 1 1 ~r · ~r 0 1 1 X xk 0k 1 = + 3 +O 3 = + x +O 3 0 3 |~r − ~r | r r r r r r i=k mit xk bzw. x0k den kartesischen Koordinaten von ~r bzw. ~r 0 . Das Einsetzen dieser Entwicklung in der Formel für das Vektorpotential ergibt ~ r) = µ0 A(~ 4πr Z ~el.(~r 0 ) d3~r 0 + V Z 3 µ0 X k x x0k~el.(~r 0 ) d3~r 0 + · · · . 4πr3 V (IX.24) k=1 Die Integrale in dieser Entwicklung des Vektorpotentials in Potenzen von 1/r sind die (kartesischen) magnetischen Multipolmomente der Stromverteilung. Wie wir jetzt sehen werden ist der erste Term in der Tat Null, so dass der führende ist jener des Dipolmoments. Lemma: Sei f bzw. J~ eine kontinuierlich differenzierbare skalare Funktion bzw. ein quellfreies Vektorfeld auf einem Gebiet V , wobei J~ in jedem Punkt des Rands ∂ V von V verschwindet. Dann gilt Z ~ r 0 ) · ∇f ~ (~r 0 ) d3~r 0 = 0. J(~ (IX.25) V 158 Magnetostatik ~ r 0 ) = ~0 in jedem Punkt ~r 0 ∈ ∂ V gilt Beweis: Dank der Annahme J(~ I ~ r 0 ) · d2 S~ = 0. f (~r 0 )J(~ ∂V Transformiert man das Oberflächenintegral auf der linken Seite mit dem Satz von Gauß, so ergibt sich unter Verwendung der Produktregel Z Z ~ · f (~r 0 )J(~ ~ r 0 ) d3~r 0 = ~ · J(~ ~ r 0 ) + J(~ ~ r 0 ) · ∇f ~ (~r 0 ) d3~r 0 . 0= ∇ f (~r 0 ) ∇ V V ~ woraus Der erste Term in den eckigen Klammern verschwindet dank der Quellfreiheit von J, das gesuchte Ergebnis folgt. 2 Wendet man dieses Lemma mit J~ = ~el. und f (~r 0 ) = x0k an, wobei eine triviale Berechnung ~ ∇f (~r 0 ) = ~ek ergibt, so kommt für jedes k = 1, 2, 3 Z Z k 0 0 3 0 ~ (~r 0 ) d3~r 0 = 0, ~el.(~r ) · ∇f (~r ) d ~r = jel. V V d.h. insgesamt Z ~el.(~r 0 ) d3~r 0 = ~0. (IX.26) V Somit ist der erste Term auf der rechten Seite der Multipolentwicklung (IX.24) Null. Das heißt, es gibt keine magnetische Monopole — entsprechend der Abwesenheit eines Quellterms auf der rechten Seite der Maxwell–Thomson-Gleichung (IX.1a). ~ (~r 0 ) = x0l ~ek + x0k ~el und das Lemma (IX.25) gibt Sei jetzt f (~r 0 ) = x0k x0l ; dann ist ∇f Z 0l k 0 l (~r 0 ) d3~r 0 = 0 x jel.(~r ) + x0k jel. V für alle k, l ∈ {1, 2, 3}. Diese Gleichung kann verwendet werden, um das Integral des zweiten Terms in Gl. (IX.24) umzuschreiben: Z Z 3 X l 0k 0 3 0 (~r 0 ) d3~r 0 ~el x0k jel. x ~el.(~r ) d ~r = V l=1 3 X V Z Z 3 0 1 0k l 0 3 0 1 0k l 0 0 0 0l k 0l k x jel.(~r ) + x jel.(~r ) d ~r + x jel.(~r ) − x jel.(~r ) d ~r = ~el 2 V 2 V l=1 Z 3 X ~el 0k l 0 k = (~r 0 ) d3~r 0 . (IX.27) x jel.(~r ) − x0l jel. 2 V l=1 Als nächstes kann das Integrand der dritten Zeile als 3 3 X X 0k l 0 0l k 0 km ln lm kn 0m n 0 n x jel.(~r ) − x jel.(~r ) = δ δ − δ δ x jel.(~r ) = ikl imn x0m jel. (~r 0 ) m,n=1 m,n=1 geschrieben werden. Definiert man das magnetische Dipolmoment der Stromverteilung durch Z 1 (IX.28a) µ ~≡ ~r 0 × ~el.(~r 0 ) d3~r 0 2 V mit kartesischen Komponenten Z 3 X imn n µ = x0m jel. (~r 0 ) d3~r 0 , 2 V i m,n=1 so gilt Z V x0k~el.(~r 0 ) d3~r 0 = 3 X i,l=1 ikl µi ~el . (IX.28b) 159 IX.2 Multipolentwicklung Nach Multiplikation mit xk und Summe über k = 1, 2, 3 ergibt sich Z 3 3 X X k x0k~el.(~r 0 ) d3~r 0 = x ikl µi xk ~el = µ ~ × ~r. k=1 V i,k,l=1 Somit wird die Entwicklung (IX.24) zu ~ × ~r ~ r) = µ0 µ A(~ + ··· 4π r3 (IX.28c) ~ r) ergibt sich dann aus der Rotation dieses VektorpotenDie zugehörige magnetische Induktion B(~ tials. Insbesondere gilt für das magnetische Feld eines reinen magnetischen Dipols µ ~ 3 ~ r · µ ~ ~r − ~r 2 µ ~ µ 0 ~ r) = B(~ . 4π r5 (IX.29) Wie erwartet nimmt der Betrag des Vektorpotentials (IX.28c) wie 1/r2 ab, und dementsprechend sie Stärke des magnetischen Feldes wie 1/r3 . Bemerkungen: ∗ Die SI-Einheit des magnetischen Dipolmoments ist das A m2 , entsprechend der physikalischen Dimension [µ] = I L2 . ∗ Die Gleichungen (IX.28c) und (IX.29) für das Potential und das Feld eines magnetischen Dipols sind analog den Gl. (VIII.30a) und (VIII.30b) für einen elektrostatischen Dipol. IX.2.2 Magnetisches Dipolmoment einer Leiterschleife Durch eine Leiterschleife C fließt ein elektrischer Strom I, entsprechend einer Ladungsstromdichte ~el. . Laut der Substitution (IX.18) lautet das zugehörige magnetische Dipolmoment Z I 1 1 3 µ ~= ~r × ~el.(~r) d ~r = I ~r × d~` 2 2 C mit d~` dem gerichteten Linienelement längs der Schleife. Im Integranden ist 21~r × d~` ein Vektor senkrecht zur Ebene der Schleife, dessen Betrag gleich dem Flächeninhalt dS des durch ~r und d~` aufgespannten Dreiecks ist. In der Integration entlang der Schleife ergibt sich die gesamte Fläche S aufgespannt durch den Leiter, und somit µ ~ = I S~ I dS d~` ~r C Abbildung IX.5 (IX.30) wobei der orthogonale Flächenvektor S~ in Richtung des Daumens der rechten Hand zeigt, wenn die anderen Finger die Richtung des Stroms anzeigen. Bemerkungen: ∗ Das Ergebnis ist unabhängig von der Wahl des Ursprungspunktes ~r = ~0, der auch außer der Schleife gewählt werden kann. ∗ Betrachtet man die bewegten Ladungsträger in der Leiterschleife, die für die Stromdichte ~el. verantwortlich sind, so ist das magnetische Dipolmoment µ ~ proportional zu deren Bahndrehimpuls ~ L. 160 Magnetostatik IX.2.3 Magnetischer Dipol in einem äußeren magnetischen Feld Der Einfluss eines magnetischen Feldes auf eine Stromverteilung kann durch die magnetischen Multipolmomente der letzeren ausgedrückt werden. IX.2.3 a Kraft auf einen magnetischen Dipol in einem magnetischen Feld ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Sei angenommen, dass sich die Stromverteilung ~el. innerhalb eines Gebiets V in der Umgebung des Nullpunkts des Koordinatensystems befindet, wo eine nicht-spezifizierte Quelle eine magneti~ erzeugt. Ausgehend aus der Lorentz-Kraftdichte (IX.21) lautet die Kraft auf die sche Induktion B Stromverteilung Z ~ r) d3~r, ~ F = ~el.(~r) × B(~ V entsprechend der i-ten Komponente F i = ikl Z V k jel. (~r)B l (~r) d3~r. In diesem Ausdruck kann das magnetische Feld als Taylor-Entwicklung um den Nullpunkt geschrieben werden: ~ l (~0) + · · · . B l (~r) = B l (~0) + ~r · ∇B Somit gilt Z Z 3 X i ikl k l~ 3 k l~ 3 ~ F = jel.(~r)B (0) d ~r + jel.(~r)~r · ∇B (0) d ~r + · · · . k,l=1 V V Im ersten Term auf der rechten Seite kann B l (~0) aus dem Integral herausgezogen werden: dieser k , das gemäß Gl. (IX.26) Null ist. konstante Faktor multipliziert dann das Volumenintegral von jel. Somit bleibt Z Z 3 3 X X ∂B l (~0) 3 ikl k l~ 3 ikl k i ~ (~r) xj jel. jel.(~r)~r · ∇B (0) d ~r + · · · = F = d ~r + · · · . ∂xj V V j,k,l=1 k,l=1 Die Ableitung im Integranden ist eine Konstante, die sich aus dem Integral herausziehen lässt. Dann k , das laut der Formel unten Gl. (IX.28b) als erkennt man das Integral von xj jel. Z 3 X k (~r 0 ) d3~r 0 = mjk µm xj jel. V umgeschrieben werden kann, mit Stromverteilung. Dies gibt Fi = 3 X ikl mjk µm j,k,l,m=1 µm m=1 der m-ten Komponenten des magnetischen Dipolmoments der 3 X ~ ~0) m ∂B l (~0) ∂B l (~0) ∂ B( im jl ij lm ~ · B( ~ ~0) + µ = −δ δ + δ δ µ = −µi ∇ ~· . j j ∂x ∂x ∂xj j,l,m=1 Der erste Term im rechten Glied der Gleichung verschwindet dank der Maxwell–Thomson-Gleichung. Dazu ist das magnetische Dipolmoment für eine gegebene Stromverteilung eine Konstante, die in der Ableitung des zweiten Terms mitgenommen werden kann: ∂ ~~ Fi = µ ~ · B(0) . ∂xj Somit ergibt sich schließlich für die Kraft auf ein magnetisches Dipolmoment, das sich im Punkt ~r befindet (~r = ~0 in der obigen Herleitung) ~ µ ~ r) . F~ = ∇ ~ · B(~ (IX.31) Bemerkung: Laut dieser Formel erfährt ein magnetischer Dipol eine Kraft, wenn er sich in einem inhomogenen Feld befindet. 161 IX.2 Multipolentwicklung IX.2.3 b Energie eines magnetischen Dipols in einem magnetischen Feld :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Die Kraft (IX.31) lässt sich trivial als das Negative eines Gradienten schreiben, und zwar ~ W, F~ = −∇V (IX.32a) wobei die Wechselwirkungsenergie zwischen dem Dipol und der magnetischen Induktion, aus der die Kraft abgeleitet wird, durch ~ r) VW = −~ µ · B(~ (IX.32b) gegeben ist. Diese Wechselwirkungsenergie hat genau die gleiche Form wie jene eines elektrischen Dipols in einem elektrostatischen Feld, entsprechend dem zweiten Term in Gl. (VIII.27). Ebenfalls analog zum elektrostatischen Fall ist die Wechselwirkungsenergie zweier magnetischer Dipole µ ~ a und µ ~ b : unter Verwendung des magnetischen Dipolfeldes (IX.29) und der Gl. (IX.32b) ergibt sich ~a · µ ~ b − 3 ~er · µ ~ a ~er · µ ~b µ0 µ VW = (IX.33) 4π r3 mit ~r dem Abstandsvektor zwischen den beiden Dipole und ~er ≡ ~r/|~r| dem zugehörigen Einheitsvektor. Diese Gleichung ist das genaue Pendant der Gl. (VIII.31). Literatur zum Kapitel IX • Fließbach, Elektrodynamik [3] Teil III. • Greiner, Klassische Elektrodynamik [8] Teil III. • Griffiths, Elektrodynamik [9] = Introduction to Electrodynamics [10] Kap. 5. • Jackson, Klassische Elektrodynamik [11] = Classical Electrodynamics [12] Kap. 5.1–5.7. • Landau & Lifschitz, Klassische Feldtheorie [14] = The classical theory of fields [26] Kap. 5 § 43–44 • Nolting, Elektrodynamik [17] Kap. 3.1–3.3. • Scheck, Klassiche Feldtheorie [19] Kap. 1.8. K APITEL X Zeitabhängige elektromagnetische Felder Im Gegensatz zu den stationären Fällen der Elektro- und Magnetostatik sind das elektrische und das magnetische Feld im allgemeineren zeitabhängigen Fall miteinander gekoppelt. Diese Kopplung wird durch zusätzliche Terme in den Grundgleichungen berücksichtigt, die zu neuen Phänomenen führen (Abschn. X.1). In Abschn. X.2 wird gezeigt, dass sich das elektrische und das magnetische Feld aus elektromagnetischen Potentialen ableiten lassen, die nicht eindeutig bestimmt sind. Darüber hinaus werden Bewegungsgleichungen für diese Potentiale hergeleitet. Dem elektromagnetischen Feld können noch eine Energie und ein Impuls zugeordnet werden, oder genauer, entsprechende Dichten und Stromdichten (Abschn. X.3), die ziemlich anschaulichen Bilanzgleichungen genügen. Der zweite Teil des Kapitels befasst sich mit Anwendungen der zuvor eingeführten Begriffe und Ergebnisse. Zunächst werden Lösungen zu den Bewegungsgleichungen für die Felder oder Potentiale im Vakuum in Abwesenheit von Quellen untersucht, entsprechend elektromagnetischen Wellen (Abschn. X.4). Dann wird eine allgemeine Lösung der Maxwell-Gleichungen mit Hilfe sogenannter retardierter Potentiale dargelegt, die das elektromagnetische Feld erzeugt durch beliebige Ladungsund Stromverteilungen angibt (Abschn. X.5). X.1 Grundgesetze In diesem Abschnitt werden zuerst die nicht-stationären Maxwell-Gleichungen dargelegt und die Deutung der zeitabhängigen Terme diskutiert (§ X.1.1). Dann werden Bewegungsgleichungen zweiter Ordnung hergeleitet (§ X.1.2), deren Lösung oft einfacher ist. X.1.1 Maxwell-Gleichungen Die schon in Kapitel VII eingeführten zeitabhängigen Maxwell-Gleichungen lauten ~ · E(t,~ ~ r) = 1 ρel.(t,~r) ∇ 0 ~ · B(t,~ ~ r) = 0 ∇ ~ ~ × E(t,~ ~ r) + ∂ B(t,~r) = ~0 ∇ ∂t ~ ~ × B(t,~ ~ r) − 0 µ0 ∂ E(t,~r) = µ0~el.(t,~r). ∇ ∂t (X.1a) (X.1b) (X.1c) (X.1d) Relativ zu den stationären Gleichungen (VIII.1) und (IX.1) der Elektro- und Magnetostatik treten zwei neue Terme auf, und zwar die Zeitableitungen in den zwei letzten Gleichungen. Natürlich sind diese Zeitableitungen nötig, um eine mögliche Zeitentwicklung der Felder zu beschreiben. 163 X.1 Grundgesetze X.1.1 a Faraday-Induktionsgesetz :::::::::::::::::::::::::::::::::: Schreibt man die Maxwell–Faraday-Gleichung (X.1c) in der Form ~ ~ × E(t,~ ~ r) = − ∂ B(t,~r) , ∇ ∂t (X.2) so kann die Änderung der magnetischen Flussdichte auf der rechten Seite als Quellterm für die Rotation des elektrischen Feldes gesehen werden. Zur Interpretation dieser Gleichung kann man eine feste ruhende Fläche S betrachten und Gl. (X.2) darüber integrieren: Z Z ~ 2 ∂ B(t,~r) 2 ~ ~ ~ ~ (X.3) ∇ × E(t,~r) · d S = − · d S. ∂t S S Da die Fläche zeitunabhängig ist, dann die Zeitableitung auf der rechten Seite aus dem Integral herausgezogen werden: Z ~ Z ∂ B(t,~r) 2 ~ d ~ r) · d2 S~ = d ΦB (t), B(t,~ ·d S = ∂t dt dt S S mit ΦB dem Fluss der magnetischen Induktion durch die Fläche S. Wiederum kann die linke Seite der Gl. (X.3) mit dem Integralsatz von Stokes transformiert werden: wenn ∂S den Rand der Fläche S bezeichnet, gilt I Z 2 ~ ~ r) · d~`, ~ ~ E(t,~ ∇ × E(t,~r) · d S = S ∂S wobei die orthogonalen elementaren Flächenvektoren d2 S~ in Richtung des Daumens der rechten Hand zeigen, wenn die anderen Finger entlang der Richtung von d~` sind. Schließlich ergibt sich I Z d ~ ~ r) · d` = − ~ r) · d2 S~ = − dΦB (t) . E(t,~ B(t,~ (X.4) dt S dt ∂S Wendet man nun dieses Ergebnis auf den Fall an, wo die Fläche S durch einen ruhenden geschlossenen Kreisleiter C aufspannt wird (Abb. X.1), so ist das Kurvenintegral entlang C die sog. elektromotorische Kraft U — die trotz ihrer Bezeichnung keine Kraft ist, sondern eine elektrische Spannung: I ~ r) · d~`. U = E(t,~ C S U C Abbildung X.1 164 Zeitabhängige elektromagnetische Felder Dies entspricht der Energie erhalten durch eine Einheitsladung, wenn sie den Kreis einmal umläuft. (Wird der Kreis irgendwo leicht getrennt, so ist U die elektrische Spannung zwischen den Enden, wie in Abb. X.1 dargestellt wird.) Dann ergibt sich das Faraday-Induktionsgesetz U =− dΦB (t) . dt (X.5) Bemerkungen: ∗ Wenn die Fläche S, durch welche der magnetische Fluss zeitlich variiert, nicht fest ist, müssen zusätzliche Terme in der obigen Argumentation berücksichtigt werden. Physikalisch bleibt das Ergebnis das gleiche. ∗ In einem geschlossenen Kreisleiter wird das induzierte elektrische Feld die Ladungsträger in Bewegung bringen, d.h. es entsteht ein elektrischer Strom. Wiederum wird dieser Strom über die ~ ind. erzeugen, das nach der Lenz’schen (ak) Regel Maxwell–Ampère-Gleichung ein magnetisches Feld B der Änderung des magnetischen Flusses durch die Leiterschleife entgegenwirkt. ∗ Das Prinzip des Induktionsgesetzes wird zu Nutze gemacht, um elektrische Ströme zu erzeugen. X.1.1 b Maxwell’scher Verschiebungsstrom :::::::::::::::::::::::::::::::::::::::::::: Die zweite Modifikation relativ zum stationären Fall ist die Zeitableitung in der Maxwell– Ampère-Gleichung (X.1d), die sich auch als ~ r) ∂ E(t,~ ~ × B(t,~ ~ r) = µ0 ~el.(t,~r) + 0 ∇ (X.6) ∂t schreiben lässt. In dieser Form kann der zweite Term in den eckigen Klammern als eine Ladungsstromdichte interpretiert werden: dieser Term ist der sog. Maxwell’sche Verschiebungsstrom. Dank diesem Term enthalten die Maxwell-Gleichungen (X.1) automatisch die Ladungserhaltung für die Quellen. Leitet man nämlich die Maxwell–Gauß-Gleichung (X.1a) nach der Zeit ab, so ergibt sich ∂ρel.(t,~r) ∂ ~ ~ = 0 ∇ · E(t,~r) . ∂t ∂t Andererseits lautet die Divergenz der Maxwell–Ampère-Gleichung (X.1d) ~ ~ · ~el.(t,~r) = 1 ∇ ~ · ∇ ~ × B(t,~ ~ r) − 0 ∇ ~ · ∂ E(t,~r) = −0 ∂ ∇ ~ · E(t,~ ~ r) , ∇ µ0 ∂t ∂t ~ nach der Zeit und nach den wobei in der zweiten Gleichung die partiellen Ableitungen von E ~ ~ ~ Ortskoordinaten ausgetauscht wurden, während ∇ · ∇ × B = 0 benutzt wurde. Die Summe der zwei letzten Gleichungen lautet dann ∂ρel.(t,~r) ~ + ∇ · ~el.(t,~r) = 0. ∂t (X.7) Diese Differentialgleichung wird als Kontinuitätsgleichung bezeichnet. Sie stellt die lokale Formulierung der Erhaltung der elektrischen Ladung dar. Um die entsprechende Integralform zu finden kann man ein festes Raumgebiet V mit Rand ∂ V betrachten und die Gl. (X.7) über das Volumen V integrieren: Z Z ∂ρel.(t,~r) 3 ~ · ~el.(t,~r) d3~r. d ~r = − ∇ ∂t V V (ak) E. Lenz, 1804–1865 165 X.1 Grundgesetze Da das Volumen V zeitunabhängig ist, kann die Zeitableitung im linken Glied aus dem Integral herausgezogen werden. Währenddessen kann das rechte Glied mit dem Integralsatz von Gauß transformiert werden: Z Z ∂ ~ (X.8) ρel.(t,~r) d3~r = − ~el.(t,~r) · d2 S. ∂t V ∂V Jetzt ist der Term auf der linken Seite die (totale) Zeitableitung der Gesamtladung Qin (t) innerhalb des Volumens V . Das Oberflächenintegral auf der rechten Seite ist der nach außen gerichtete Fluss der Ladungsstromdichte durch Oberfläche ∂ V . Der physikalische Inhalt der Gl. (X.8) ist, dass die Änderung der Gesamtladung Qin pro Zeiteinheit gleich der durch die Oberfläche ∂ V „verlorene“ Ladung pro Zeiteinheit ist — entsprechend genau der Bilanzgleichung für eine erhaltene Größe, nämlich hier die elektrische Ladung. X.1.2 Bewegungsgleichungen für die elektrischen und magnetischen Felder Die Maxwell-Gleichungen (X.1) sind gekoppelte partielle Differentialgleichungen erster Ordnung ~ r) und B(t,~ ~ r). Mit einigen Umrechnungen lassen sich entkoppelte Bewegungsgleichungen für E(t,~ erhalten. ~ r) unabhängig von B(t,~ ~ r), und umgekehrt Somit ist die Differentialgleichung (X.9) für E(t,~ ~ ~ tritt E(t,~r) nicht in der Bewegungsgleichung (X.11) für B(t,~r) auf. Die beiden Felder bleiben aber miteinander gekoppelt, beispielsweise über die Maxwell–Faraday-Gleichung (X.1c). Das heißt, man kann zwar entkoppelte Bewegungsgleichungen finden, die aber nicht unabhängig voneinander sind: physikalisch wird die Kopplung nicht aufgehoben. X.1.2 a Bewegungsgleichung für das elektrische Feld :::::::::::::::::::::::::::::::::::::::::::::::::::::: Die Rotationsbildung der Maxwell–Faraday-Gleichung (X.1c) ergibt ~ ~ × E(t,~ ~ r) + ∇ ~ × ∂ B(t,~r) = ~0. ~ × ∇ ∇ ∂t ~ × ∇ ~ ×V ~ =∇ ~ ∇ ~ ·V ~ − 4V ~ transformiert werden. Im Der erste Term kann mit der Identität ∇ zweiten Term können partielle Zeit- und Raumableitung ausgetauscht werden, was zu ~ ∇ ~ · E(t,~ ~ r) − 4E(t,~ ~ r) + ∂ ∇ ~ × B(t,~ ~ r) = ~0 ∇ ∂t ~ ·E ~ unter Verwendung der Maxwell–Gauß-Gleichung (X.1a) durch die Laführt. Dabei kann ∇ ~ ×B ~ mithilfe der Maxwell–Ampèredungsdichte ausgedrückt werden. Währenddessen lässt sich ∇ Gleichung (X.1d) umschreiben. Dies ergibt ~ r) 1~ ∂ ∂ E(t,~ ~ ∇ρel.(t,~r) − 4E(t,~r) + µ0~el.(t,~r) + 0 µ0 = ~0. 0 ∂t ∂t Äquivalent gilt ~ r) ≡ −0 µ0 E(t,~ ~ r) ∂ 2E(t,~ ~ el.(t,~r). ~ r) = µ0 ∂~el.(t,~r) + 1 ∇ρ + 4E(t,~ ∂t2 ∂t 0 (X.9) Dabei ist der d’Alembert (al) -Operator gemäß ≡ −0 µ0 ∂2 +4 ∂t2 definiert.(48) (48) (al) Oft wird der d’Alembert-Operator als das Negative des hier betrachteten Differentialoperators definiert. J. le Rond D’Alembert, 1717–1783 (X.10) 166 Zeitabhängige elektromagnetische Felder X.1.2 b Bewegungsgleichung für das magnetische Feld :::::::::::::::::::::::::::::::::::::::::::::::::::::::: Betrachtet man als Anfangspunkt die Maxwell–Ampère-Gleichung (X.1d) und bildet man deren Rotation, so ergibt sich ~ ~ × ∂ E(t,~r) = µ0 ∇ ~ × B(t,~ ~ r) − 0 µ0 ∇ ~ × ~el.(t,~r). ~ × ∇ ∇ ∂t ~ ×B ~ wegen der Maxwell–Thomson-Gleichung ∇ ~ ·B ~ einfach gleich −4B. ~ Dann ~ × ∇ Dabei ist ∇ können Ableitungen bezüglich der Zeit- und Ortsvariablen im zweiten Term ausgetauscht werden, ~ E ~ mithilfe der Maxwell–Faraday-Gleichung (X.1c) umgeschrieben und die resultierende Rotation ∇× werden. Insgesamt ergibt sich 2~ ~ r) + 0 µ0 ∂ B(t,~r) = µ0 ∇ ~ × ~el.(t,~r), −4B(t,~ ∂t2 d.h. 2~ ~ r) ≡ −0 µ0 ∂ B(t,~r) + 4B(t,~ ~ r) = µ0 ∇ ~ × ~el.(t,~r). (X.11) B(t,~ ∂t2 ~ und (X.11) für die magnetische Induktion B ~ sind Die Gleichungen (X.9) für das elektrische Feld E anscheinend entkoppelte (inhomogene) lineare partielle Differentialgleichungen zweiter Ordnung. Die Felder sollen aber noch der Maxwell–Faraday-Gleichung (X.1c) genügen, so dass sie nicht unabhängig voneinander sind: die Bewegungsgleichungen (X.9) und (X.11) sind also eigentlich redundant. X.2 Elektrodynamische Potentiale Wie im stationären Fall können ein Skalar- und ein Vektorpotential eingeführt werden, aus denen sich das elektrische und das magnetische Feld ableiten lassen (§ X.2.1). Im Gegensatz zu den stationären ~ und B ~ vom Vektorpotential ab. Dementsprechend sind Potentialen hängen aber jetzt beide Felder E die Eichtransformationen der Potentiale, welche die elektromagnetischen Felder invariant lassen, nicht unabhängig voneinander, sondern beide Potentiale müssen gleichzeitig transformiert werden (§ X.2.2). Schließlich werden in § X.2.3 Bewegungsgleichungen für die Potentiale dargelegt, die aus den Maxwell-Gleichungen folgen. X.2.1 Definition X.2.1 a Vektorpotential ::::::::::::::::::::::: Die Maxwell–Thomson-Gleichung (X.1b) hat die gleiche Form, wie im stationären Fall der Ma~ r) gnetostatik. Daher kann man wie in § IX.1.1 die Existenz eines differenzierbaren Vektorfeldes A(~ folgern, mit dem die Beziehung ~ r) = ∇ ~ × A(t,~ ~ r) B(t,~ (X.12) ~ r) ist das (elektrodynamische) Vektorpotential . in jedem Punkt ~r und zu jeder Zeit t erfüllt wird: A(t,~ ~ r). Ist Ähnlich wie in der Magnetostatik existiert eine (Eich)Freiheit in der Auswahl von A(t,~ ~ ~ ein erstes Vektorpotential A für eine bestimmte magnetische Induktion B geeignet, dann so ist das ~ 0 (t,~r) ≡ A(t,~ ~ r) + ∇χ(t,~ ~ Vektorfeld A r), wobei χ(t,~r) eine beliebige skalare Funktion von Zeit und Ort ist. X.2.1 b Skalarpotential ::::::::::::::::::::::: Setzt man die Beziehung (X.12) in die Maxwell–Faraday-Gleichung (X.1c) ein, so kommt ~ × E(t,~ ~ r) + ∂ ∇ ~ × A(t,~ ~ r) = ~0. ∇ ∂t 167 X.2 Elektrodynamische Potentiale Nach Austauschen der Zeit- und Ortsableitungen im zweiten Term kann man einfacher ~ r) ∂ A(t,~ ~ ~ ∇ × E(t,~r) + = ~0. ∂t schreiben. Daraus folgt, dass es ein skalares Feld Φ(t,~r) existiert, das (elektrodynamische) Skalarpotential , das die Beziehung ~ r) ∂ A(t,~ ~ r) = −∇Φ(t,~ ~ E(t,~ r) − ∂t (X.13) zu jeder Zeit t und in jedem Punkt ~r erfüllt. Im stationären Fall findet man die Beziehung (VIII.3) zwischen elektrostatischem Potential und Feld wieder. X.2.2 Eichinvarianz X.2.2 a Eichtransformationen ::::::::::::::::::::::::::::: ~ und A ~0 ≡ A ~ + ∇χ ~ führen zwar über die Beziehung (X.12) zum gleichen Zwei Vektorpotentiale A ~ ~ E ~0 magnetischen Feld B; laut der Gl. (X.13) würden sie zu unterschiedlichen elektrischen Felder E, führen. Führt man aber eine gleichzeitige Transformation des Vektor- und des Skalarpotentials, und zwar die Eichtransformation ∂χ(t,~r) , ∂t ~ r) → A ~ 0 (t,~r) ≡ A(t,~ ~ r) + ∇χ(t,~ ~ A(t,~ r), Φ(t,~r) → Φ0 (t,~r) ≡ Φ(t,~r) − (X.14a) (X.14b) ~ r) und wobei die skalare Funktion χ(t,~r) beliebig ist, so bleiben die zwei abgeleiteten Felder E(t,~ ~ r) unverändert. B(t,~ Beispiel: Dem elektromagnetischen Feld bestehend aus einem stationären und gleichförmigen elek~ r) = E ~ 0 und einer verschwindenden magnetischen Induktion B(t,~ ~ r) = ~0 kann trischen Feld E(t,~ man z.B. die einfachen Potentiale ~ 0, Φ(t,~r) = −~r · E ~ r) = ~0, A(t,~ oder Φ0 (t,~r) = 0, ~ 0 (t,~r) = −E ~0 t A ~ 0 t (dazu zuordnen. Eine Funktion χ, die von den ersten zu den zweiten führt, ist χ(t,~r) = −~r · E darf man natürlich eine additive Konstante hinzufügen). X.2.2 b Spezielle Eichungen :::::::::::::::::::::::::::: Die Eichfreiheit kann benutzt werden, um eine Eichung zu benutzen, in welcher einige Gleichungen eine einfachere Form annehmen. Eine erste oft auftretende Wahl ist die Coulomb-Eichung, die durch die Bedingung ~ · A(t,~ ~ r) = 0. ∇ (X.15) ~ und B-Feldern ~ [vgl. Gl. (IX.4)] definiert ist. Bei festen Eist es immer möglich, Potentiale zu finden, die der Coulomb-Eichbedingung (X.15) genügen. 168 Zeitabhängige elektromagnetische Felder ~ Potentiale für ein gegebenes elektromagnetisches Feld. Wenn A ~ die Bedingung (X.15) Seien Φ, A erfüllt, ist der Fall erledigt. Sonst sucht man eine Funktion χ(t,~r) derart, dass die über Gl. (X.14) ~ 0 die Coulomb-Eichbedingung erfüllen. Die Divergenzbildung eichtransformierten Potentiale Φ0 , A ~ ~ lautet der Beziehung (X.14b) zwischen A0 und A ~ ·A ~ 0 (t,~r) = ∇ ~ · A(t,~ ~ r) + ∇ ~ · ∇χ(t,~ ~ ~ · A(t,~ ~ r) + 4χ(t,~r). ∇ r) = ∇ ~ ·A ~ 0 (t,~r) = 0 gilt. Dafür soll man eine Funktion χ finden, die die inhomogene Das Ziel ist, dass ∇ Poisson-Gleichung ~ · A(t,~ ~ r) 4χ(t,~r) = −∇ löst, wobei die rechte Seite eine vorgegebene ist. Laut den Ergebnissen des Abschn. VIII.2 existiert eine solche Lösung immer. 2 Eine andere günstige Eichung ist die Lorenz (am) -Eichung, entsprechend der Bedingung 0 µ0 ∂Φ(t,~r) ~ ~ + ∇ · A(t,~r) = 0. ∂t (X.16) Wir werden in § X.2.3 c sehen, dass sich die Bewegungsgleichung für die Potentiale in der LorenzEichung stark vereinfachen. Ein zweiter Vorteil der Eichung wird auch in § XI.1.2 diskutiert. ~ Die Coulomb- und Lorenz-Eichbedingungen legen die elektromagnetischen Potentiale Φ und A ~ nicht vollständig fest, sondern man kann in beiden Fällen unterschiedliche Paare (Φ, A) finden, welche die zugehörige Bedingung erfüllen. Dies ist trivial der Fall der Coulomb-Eichung, deren Bedingung (X.15) das Skalarpotential frei ~ lässt. Dass auch die Lorenz-Eichung „unvollständig“ ist, lässt sich einfach beweisen. Seien (Φ, A) 0 0 ~ und (Φ , A ) Paare von Potentialen, die der Gl. (X.16) genügen, wobei die gestrichenen Potentiale mit den nicht-gestrichenen über die Beziehungen (X.14) zusammenhängen. Dann gilt ∂Φ0 (t,~r) ~ ~ 0 ∂Φ(t,~r) ~ ~ 0 µ0 + ∇ · A (t,~r) − 0 µ0 + ∇ · A(t,~r) = 0, ∂t ∂t d.h. nach einer einfachen Berechnung ∂ 2 χ(t,~r) + 4χ(t,~r) = χ(t,~r) = 0. (X.17) ∂t2 Diese Differentialgleichung hat nicht-triviale Lösungen — die in § X.4.1 unten diskutiert werden —, so dass die gestrichenen und nicht-gestrichenen Potentiale ungleich sind. − 0 µ0 X.2.3 Bewegungsgleichungen für die elektrodynamischen Potentiale X.2.3 a Bewegungsgleichung für das Vektorpotential Das Einsetzen der Beziehungen (X.12) und (X.13) in die Maxwell–Ampère-Gleichung ergibt unter Berücksichtigung der Formel für die Rotation einer Rotation ~ r) ∂ ∂ A(t,~ ~ × ∇ ~ × A(t,~ ~ r) − 0 µ0 ~ µ0~el.(t,~r) = ∇ − ∇Φ(t,~ r) − ∂t ∂t 2~ ~ ∇ ~ · A(t,~ ~ r) − 4A(t,~ ~ r) + 0 µ0 ∇ ~ ∂Φ(t,~r) + 0 µ0 ∂ A(t,~r) . =∇ ∂t ∂t2 ::::::::::::::::::::::::::::::::::::::::::::::::::::: Nach trivialer Umschreibung lautet dies ~ r) ∂ 2 A(t,~ ∂Φ(t,~r) ~ ~ ~ ~ ~ A(t,~r) ≡ −0 µ0 + 4A(t,~r) = −µ0~el.(t,~r) + ∇ 0 µ0 + ∇ · A(t,~r) . ∂t2 ∂t (am) L. Lorenz, 1829–1891 (X.18) X.3 Energie und Impuls des elektromagnetischen Feldes 169 Diese lineare partielle Differentialgleichung zweiter Ordnung stellt die Bewegungsgleichung für das ~ r) dar. Vektorpotential A(t,~ Bemerkung: Im zeitunabhängigen Fall vereinfacht sich Gl. (X.18) zur Gleichung (IX.8). X.2.3 b Bewegungsgleichung für das Skalarpotential Setzt man in die Maxwell–Gauß-Gleichung (X.1a) die Beziehung (X.13) ein, so kommt ~ r) ρel.(t,~r) ~ ∂ A(t,~ ∂ ~ ~ ~ = ∇ · − ∇Φ(t,~r) − = −4Φ(t,~r) − ∇ · A(t,~r) 0 ∂t ∂t ::::::::::::::::::::::::::::::::::::::::::::::::::::: oder äquivalent 4Φ(t,~r) = − ρel.(t,~r) ∂ ~ ~ − ∇ · A(t,~r) . 0 ∂t (X.19) Man kann noch 0 µ0 ∂ 2 Φ(t,~r)/∂t2 von beiden Seiten dieser Gleichung abziehen, um die Bewegungsgleichung in eine Form ähnlich der Gl. (X.18) zu bringen: ∂ 2 Φ(t,~r) ∂Φ(t,~r) ~ ~ ρel.(t,~r) ∂ Φ(t,~r) ≡ −0 µ0 − 0 µ0 + 4Φ(t,~r) = − + ∇ · A(t,~r) . ∂t2 0 ∂t ∂t (X.20) Bemerkung: Im stationären Fall vereinfacht sich Gl. (X.20), oder noch einfacher Gl. (X.19), zur Poisson-Gleichung (VIII.4) der Elektrostatik. X.2.3 c Bewegungsgleichungen in speziellen Eichungen ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Arbeitet man in der durch die Bedingung (X.16) definierten Lorenz-Eichung, so vereinfachen sich die Bewegungsgleichungen (X.18) und (X.20) erheblich, und zwar zu ρ (t,~r) Φ(t,~r) = − el. 0 in Lorenz-Eichung ~ A(t,~r) = −µ0~el.(t,~r). (X.21a) (X.21b) Somit nehmen die Bewegungsgleichungen für die Potentiale die gleiche Form wie solche (X.9), (X.11) ~ und B-Felder ~ für die daraus abgeleiteten Ean. X.3 Energie und Impuls des elektromagnetischen Feldes Genau wie mechanische Systeme trägt das elektromagnetische Feld Energie (§ X.3.1) und Impuls (§ X.3.2). Lokal lassen sich diese Größen durch entsprechende Dichten und Stromdichten charakterisieren, die dann Bilanzgleichungen genügen. X.3.1 Energiedichte und -stromdichte des elektromagnetischen Feldes X.3.1 a Bilanzgleichung für die Energie ::::::::::::::::::::::::::::::::::::::: Bildet man das Skalarprodukt von der Maxwell–Faraday-Gleichung (X.1c) und der magnetischen ~ r), so kommt Induktion B(t,~ ~ ~ r) · ∇ ~ × E(t,~ ~ r) + B(t,~ ~ r) · ∂ B(t,~r) = 0. B(t,~ ∂t Wiederum lautet das Skalarprodukt aus Maxwell–Ampère-Gleichung (X.1d) und elektrischem Feld ~ r) E(t,~ ~ ~ r) · ∇ ~ × B(t,~ ~ r) − 0 µ0 E(t,~ ~ r) · ∂ E(t,~r) = µ0~el. (t,~r) · E(t,~ ~ r). E(t,~ ∂t 170 Zeitabhängige elektromagnetische Felder Die letztere Gleichung kann dann von Dabei kann man auf der der ersteren abgezogen werden. ~ ~ ~ ~ ~ ~ ~ ~ ~ linken Seite die Identität B · ∇ × E − E · ∇ × B = ∇ · E × B verwenden. Es ergibt sich dann ~ 2 2 ~ ~ · E(t,~ ~ r) × B(t,~ ~ r) + µ0 ∂ 0 E(t,~r) + B(t,~r) = −µ0~el. (t,~r) · E(t,~ ~ r). ∇ (X.22) ∂t 2 2µ0 Die Struktur der linken Seite dieser Gleichung, mit der Summe der Zeitableitung einer skalaren Größe mit dem Gradienten eines Vektorfeldes, ist ähnlich jener der Kontinuitätsgleichung (X.7), d.h. allgemeiner einer lokalen Bilanzgleichung. Dies weist darauf hin, dass ee.m.(t,~r) ≡ ~ r)2 B(t,~ ~ r)2 0 E(t,~ + 2 2µ0 (X.23a) der Dichte einer Größe entspricht, während der Poynting (an) -Vektor ~ ~ ~e.m.(t,~r) ≡ E(t,~r) × B(t,~r) S µ0 (X.23b) die assoziierte Stromdichte ist. Da die Dichte ee.m.(t,~r) im stationären Fall ohne magnetisches Feld mit der elektrostatischen Energiedichte [vgl. Gl. (VIII.17)] übereinstimmt, möchte man sie gerne als ~e.m.(t,~r) die Energiedichte des elektromagnetischen Feldes interpretieren. Dementsprechend wäre S zugehörige Energiestromdichte und die aus Gl. (X.22) folgende Gleichung ∂ee.m.(t,~r) ~ ~ ~ r). + ∇ · Se.m.(t,~r) = −~el. (t,~r) · E(t,~ ∂t (X.23c) sollte eine (lokale) Bilanzgleichung für die Energie darstellen. Bemerkungen: ∗ Die Gleichung (X.23c) wird auch (differentielle Form von dem) Satz von Poynting genannt — wobei die Integralform die Gl. (X.24) unten ist. ~ r)2 /2µ0 , kann als die im magnetischen Feld gespei∗ Der zweite Term in der Energiedichte, B(t,~ cherte Energiedichte betrachtet werden. X.3.1 b Interpretation der Energiebilanzgleichung :::::::::::::::::::::::::::::::::::::::::::::::::: Sei ein Volumen V des Raums mit Oberfläche ∂ V . Das Integrieren der Bilanzgleichung (X.23c) über dieses Volumen ergibt Z I Z d ~e.m.(t,~r) · d2 S~ = − ~el. (t,~r) · E(t,~ ~ r) d3~r, ee.m.(t,~r) d3~r + S (X.24) dt V ∂V V wobei der Integralsatz von Gauß benutzt wurde, um den zweiten Term umzuschreiben. Zur Deutung dieser Gleichung, insbesondere des Terms auf deren rechten Seite, kann man einen elektrischen Strom bestehend aus bewegten Punktladungen betrachten, entsprechend der LadungsP stromdichte a qa~va (t)δ (3)(~r − ~ra ). Mit dieser Stromdichte gilt Z X0 ~ r) d3~r = − ~ ra ), − ~el. (t,~r) · E(t,~ qa~va (t) · E(t,~ V a wobei der Strich neben dem Summenzeichen bedeutet, dass die Summe nur über die Punktladungen läuft, die sich im Volumen V befinden. (an) J. H. Poynting, 1852–1914 X.3 Energie und Impuls des elektromagnetischen Feldes 171 Die gesamte Energie dieser Punktladungen zur Zeit t ist X0 ma~va (t)2 Emat.(t) = 2 a entsprechend der Summe deren kinetischen Energien. Daraus folgt d~va (t) dEmat.(t) X0 ~va (t) · ma . = dt dt a Laut dem zweiten Newton’schen Gesetz (I.14) ist der Term in eckigen Klammern genau gleich der Kraft auf die Punktladung a. Bei der letzteren handelt es sich um die durch das elektromagnetische Feld verursachte Lorentz-Kraft, d.h. io n h dEmat.(t) X0 ~ ra ) + ~va (t) × B(t,~ ~ ra ) . ~va (t) · qa E(t,~ = dt a ~ auf der rechten Seite verschwindet, so dass Das Spatprodukt ~va · ~va × B dEmat.(t) X0 ~ ra ) qa~va (t) · E(t,~ = dt a übrig bleibt. Definiert man dann Z Ee.m.(t) ≡ ee.m.(t,~r) d3~r, (X.25a) V die sich als Energie des elektromagnetischen Feldes in V zur Zeit t interpretieren lässt, im Einklang mit der Deutung von ee.m. , so wird die Gleichung (X.24) zu I dEe.m.(t) ~e.m.(t,~r) · d2 S~ − dEmat.(t) . =− S (X.25b) dt dt ∂V Die Interpretation dieser Gleichung ist ziemlich klar: die (Rate der) Änderung der Feldenergie im Volumen V — Term auf der linken Seite — besteht aus der durch die Oberfläche ∂ V — erster Term im rechten Glied — und der Energie, die auf die Ladungen übertragen wird. Somit stellt wirklich Gl. (X.23c) eine lokale Bilanzgleichung für die Energie dar, in welcher ~e.m. die Energiedichte und -stromdichte des die in Gl. (X.23a) und (X.23b) definierten ee.m. und S elektromagnetischen Feldes sind. X.3.2 Impulsdichte und -stromdichte des elektromagnetischen Feldes Ausgehend aus den Maxwell-Gleichungen lässt sich eine weitere Bilanzgleichung herleiten, wobei die „erhaltene“ Größe jetzt vektoriell ist, und kann als Impuls des elektromagnetischen Feldes interpretiert werden. Man definiert das Vektorfeld ~ r) × B(t,~ ~ r), ~ge.m.(t,~r) ≡ 0 E(t,~ (X.26a) das hiernach als Impulsdichte interpretiert wird, und den Maxwell’schen Spannungstensor σ e.m. mit kartesischen Komponenten(49) ij σe.m. (t,~r) (49) i 1 ij h ~ i j 2 i j 2 2~ 2 ≡ 0 E (t,~r)E (t,~r) + c B (t,~r)B (t,~r) − δ E(t,~r) + c B(t,~r) . 2 (X.26b) Der Maxwell’sche Spannungstensor wird manchmal mit der umgekehrten Zeichenkonvention, also wie der Tensor T e.m. , definiert, z.B. in den frühen Auflagen (vor etwa 1985) von Landau & Lifschitz [14, 26]. Die hier verwendete Konvention ist also die der späteren Auflagen von Refs. [14, 26] sowie von Jackson [11, 12, Gl. (6.120)]. 172 Zeitabhängige elektromagnetische Felder σe.m. , mit Komponenten Dazu kann man noch den Tensor T e.m. = −σ ij ij Te.m. (t,~r) ≡ −σe.m. (t,~r), (X.26c) einführen: die Komponente ij dieses Tensors wird die Dichte des Stroms in Richtung i von der j-ten Komponenten des Impulses vom elektromagnetischen Feld modellieren. Dann gilt die Bilanzgleichung 3 j ij ∂ge.m. (t,~r) X ∂Te.m. (t,~r) + = −fLj (t,~r) für j = 1, 2, 3, ∂t ∂xi (X.26d) i=1 ~ el.× B ~ auf die Ladungen und mit fLj (t,~r) der j-ten Komponente der Lorentz-Kraftdichte f~L = ρel. E+~ Ströme, die das elektromagnetische Feld verursachen. Da diese Kraftdichte die Dichte des Impulses, der pro Zeiteinheit auf die Ladungen übertragen wird, darstellt — laut dem zweiten Newton’schen Gesetz ist nämlich die Kraft gleich der Rate der Impulsänderung —, hat die Gleichung (X.26d) genau die gleiche Form wie die Energiebilanzgleichung (X.23c): auf der linken Seite steht die Summe aus der Zeitableitung von Dichte und der Divergenz der Stromdichte, die nur das elektromagnetische Feld betreffen; auf der rechten liegt ein Term, der die Wechselwirkung zwischen dem Felde und den Quellen berücksichtigt. Herleitung der Gl. (X.26d): der Kürze halber werden die Variablen (t,~r) durchaus weggelassen. Unter Verwendung der Maxwell–Gauß und der Maxwell–Ampère-Gleichungen (X.1a), (X.1d) lässt sich die Lorentz-Kraftdichte als ~ 1 ~ ∂E ~ ~ ~ ~ ~ ~ ~ ~ fL = ρel. E + ~el. × B = 0 ∇ · E E + ∇ × B − 0 ×B µ0 ∂t umschreiben. Dabei kann der letzte Term gemäß ~ ~ ∂E ~ = ∂ E ~ ×B ~ −E ~ × ∂B = ∂ E ~ ×B ~ +E ~× ∇ ~ ×E ~ ×B ∂t ∂t ∂t ∂t transformiert werden, wobei die letzte Gleichung aus der Maxwell–Faraday (X.1c) folgt. Somit gilt h i ~ ·E ~ E ~ −E ~× ∇ ~ ×E ~ − 1B ~× ∇ ~ ×B ~ − ∂~ge.m. , f~L = 0 ∇ µ0 ∂t wobei Definition (X.26a) benutzt wurde. Mithilfe der Maxwell–Thomson-Gleichung (X.1b) kann ~ und B ~ Feldern erhöhen: man die Symmetrie der Terme mit den E h i h i ~ ×B ~ − ∂~ge.m. . ~ −B ~× ∇ ~ ·E ~ E ~ −E ~× ∇ ~ ×E ~ + 1 ∇ ~ ·B ~ B f~L = 0 ∇ µ0 ∂t ~ × ∇× ~ V ~ Betrachte man die i-te Komponente dieser Gleichung. Für die zwei Terme der Form V gilt(50) 3 3 3 h m X X X i i j ∂V m ijk j klm ∂V il jm im jl ~ ~ ~ V × ∇×V = V = δ δ − δ δ V ∂xl ∂xl j,k=1 3 X l,m=1 j,l,m=1 ~ 2 X 3 i ∂ V j ∂V = V = − V . ∂xi 2 ∂xj j=1 j=1 ~ ·V ~ V ~ kommt Nach Abziehen der i-ten Komponente von ∇ ~ 2 X 3 3 h i j X ii ∂ V j ∂V i ∂V ~ ~ ~ ~ ~ ~ V × ∇×V − ∇·V V = − V − V ∂xi 2 ∂xj j=1 ∂xj j=1 j j i ∂V ∂V − ∂xi ∂xj ∂ = ∂xi (50) ~ 2 X 3 ∂ V − V iV j . j 2 ∂x j=1 2 ~ ~ × ∇ ~ ×V ~ =∇ ~ V ~ ·∇ ~ V ~. In vektorieller Form lautet diese Gleichung V − V 2 173 X.4 Elektromagnetische Wellen im Vakuum Daher lautet die i-te Komponente der Lorentz-Kraftdichte " 3 " 3 ~ 2 # ~ 2 # X ∂ E B ∂ 1 X ∂ ∂ ∂ge.m. i i j i j f L = 0 EE − + BB − − j i j i ∂x ∂x 2 µ ∂x ∂x 2 ∂t 0 j=1 j=1 = 0 3 3 X ~2 ~ 2 ∂ge.m. 1 X ∂ ∂ i j ij E i j ij B E B E − δ + B − δ − . ∂xj 2 µ0 j=1 ∂xj 2 ∂t j=1 Unter Berücksichtigung der Identität 0 µ0 c2 = 1 erkennt man den Maxwell’schen Spannungstensor 3 3 ij X X ∂ge.m. ∂ge.m. ∂ ij ∂Te.m. i fL = σ − − = − . e.m. j j ∂x ∂t ∂x ∂t j=1 j=1 ij Wegen der Symmetrie von Te.m. unter dem Austausch der beiden Indizes ist diese Gleichung, nach Umbenennung der Indizes i ↔ j, genau die Bilanzgleichung (X.26d). 2 Bemerkungen: ∗ Offensichtlich hängt die Impulsdichte (X.26b) mit dem Poynting-Vektor (X.23b) einfach über ~ge.m.(t,~r) = 1 ~ Se.m.(t,~r). c2 (X.27) zusammen. ∗ Die Spur des Maxwell’schen Spannungstensor bzw. des Tensors Te.m. und die Energiedichte (X.23a) genügen der einfachen Beziehung 11 22 33 Tr T e.m.(t,~r) = Te.m. (t,~r) + Te.m. (t,~r) + Te.m. (t,~r) = ee.m.(t,~r). (X.28) X.4 Elektromagnetische Wellen im Vakuum In Abwesenheit von Quellen, ρel. = 0 und ~el. = ~0, nehmen die Bewegungsgleichungen (X.9) und (X.11) für die elektromagnetischen Felder oder (X.21) für die Potentiale in Lorenz-Eichung die gleiche Form an, und zwar im Vakuum ~ r) = ~0 und B(t,~ ~ r) = ~0; E(t,~ ~ r) = ~0 (in Lorenz-Eichung). Φ(t,~r) = 0 und A(t,~ (X.29a) (X.29b) Zur Umschreibung einiger Gleichungen führt man eine positive Zahl c gemäß c2 ≡ 1 0 µ0 (X.29c) ein. Dann wird der d’Alembert-Operator (X.10) zu ≡− 1 ∂2 +4 . c2 ∂t2 (X.29d) Die Bewegungsgleichungen (X.29) sind alle der gleichen Form f (t,~r) = 0, mit f einer skalaren oder vektoriellen Funktion. Die Lösungen dieser Differentialgleichung — die auch in anderen Bereichen der Physik auftritt — werden zunächst in § X.4.1 vorgestellt. Dann werden die Ergebnisse auf den Fall des elektromagnetischen Feldes im Vakuum angewandt, wobei die Eigenschaften des Feldes einer Welle präzisiert werden (§ X.4.2). 174 Zeitabhängige elektromagnetische Felder X.4.1 Klassische Wellengleichung Dieses Paragraph befasst sich mit der Herleitung der (genügend regulären) reellen Lösungen der (klassischen) Wellengleichung (51) f (t,~r) = 0 (X.30) für skalare Funktionen f , wobei der d’Alembert-Operator durch Gl. (X.29d) definiert ist. X.4.1 a Ebene Wellen ::::::::::::::::::::: Als einfaches aber wichtiges Beispiel kann man zunächst eine Lösung betrachten, die nur von z = x3 abhängt: f (t, z). Diese ist somit unabhängig von x1 , x2 und daher konstant in der transversalen (x1 , x2 ) Ebene, weshalb sie als ebene Welle bezeichnet wird. Unter dieser Annahme wird die klassische Wellengleichung (X.30) zur (1 + 1)-dimensionalen Differentialgleichung 1 ∂ 2f (t, z) ∂ 2f (t, z) + = 0. (X.31) − 2 c ∂t2 ∂z 2 Der Differentialoperator dieser Gleichung kann faktorisiert werden: ∂ ∂ 1∂ 1∂ f (t, z) = 0. (X.32) − + ∂z c ∂t ∂z c ∂t Zur Lösung dieser partiellen Differentialgleichung lohnt es sich, die Variablenänderung x+ ≡ z + ct , x− ≡ z − ct (X.33a) durchzuführen. Die entsprechende Rücktransformation zu den ursprünglichen Variablen lautet t= x+ − x− 2c , x= x+ + x− 2 (X.33b) Die partiellen Ableitungen nach den neuen Variablen lassen sich mit Hilfe der Kettenregel durch die Ableitungen nach den alten Variablen ausdrücken, und zwar ∂t ∂ ∂z ∂ 1 1∂ ∂ ∂ = + = + (X.34a) ∂x+ ∂x+ ∂t ∂x+ ∂z 2 c ∂t ∂z und 1∂ ∂ ∂t ∂ ∂z ∂ 1 ∂ − . = + = + ∂x− ∂x− ∂t ∂x− ∂z 2 c ∂t ∂z (X.34b) Dank diesen Ergebnissen lautet die Bewegungsgleichung (X.32) in den neuen Variablen 1 ∂ ∂ f (x+ , x− ) = 0, 4 ∂x− ∂x+ d.h. ∂ 2f (x+ , x− ) = 0. (X.35) ∂x− ∂x+ Die allgemeine Lösung dieser partiellen Differentialgleichung zweiter Ordnung ist der Form f (x+ , x− ) = f− (x+ ) + f+ (x− ) mit f− und f+ zwei beliebigen Funktionen einer einzigen reellen Variablen. Kommt man zu den ursprünglichen Variablen t, z zurück, so lautet die allgemeine Lösung der Gl. (X.31) f (t, z) = f− (z + ct) + f+ (z − ct). (51) (X.36) Gleichung (X.30) wird oft als die Wellengleichung bezeichnet. Man findet aber auch andere partielle Differentialgleichungen mit zeit- und ortsabhängigen Lösungen, die als Wellen bezeichnet werden — z.B. für Schwerewellen in Flüssigkeiten, Stoßwellen in Fluiden, oder Wellenfunktionen in der Quantenmechanik. Deshalb wird hier die Bezeichnung „klassische Wellengleichung“ verwendet. 175 X.4 Elektromagnetische Wellen im Vakuum Dieses mathematische Ergebnis lässt sich einfach interpretieren. Betrachte man beispielsweise die Funktion f+ (z − ct): sie nimmt den gleichen Wert für alle Raumzeitpunkte (t, z) an, für welche z − ct einen konstanten Wert hat. Somit bleibt das Profil entlang der z-Achse des durch f modellierten Signals zur Zeit t = t0 global unverändert zu einem späteren Zeitpunkt t1 ; es wird jedoch in positive z-Richtung um ∆z = c(t1 − t0 ) verschoben, entsprechend einer Ausbreitung des Signals mit Geschwindigkeit +c. Wiederum modelliert der Term f− ein Signal, das sich in negative z-Richtung mit Ausbreitungsgeschwindigkeit c — will man die Richtung auch in der Geschwindigkeit berücksichtigen, −c — fortpflanzt. Solche sich ausbreitenden Signale werden als Wellen bezeichnet.(51) Dann ist die allgemeine Lösung (X.36) eine Superposition von rechts- und linkslaufenden ebenen Wellen. Bemerkung: Genauer handelt es sich bei den durch f− oder f+ beschriebenen Signalen um fort- schreitende Wellen. Betrachtet man aber den Fall mit f− = f+ , so breitet sich die resultierende Welle f nicht mehr aus: es handelt sich um eine stehende Welle. X.4.1 b Allgemeine Lösung ::::::::::::::::::::::::::: Um die allgemeine Lösung der klassischen Wellengleichung (X.30) herzuleiten, ist es günstig, die Fourier-Darstellung der räumlichen Abhängigkeit von f (t,~r) einzuführen. Somit kann man Z d3~k ~ f (t,~r) = f˜(t, ~k) ei k·~r (X.37a) (2π)3 R3 schreiben, wobei die räumlich Fourier-transformierte Funktion f˜(t, ~k) durch Z ~ ˜ ~ f (t, k) = f (t,~r) e−i k·~r d3~r (X.37b) R3 gegeben ist. ~ i~k·~r ) = i~k ei~k·~r wird die klassische Wellengleichung (X.30) Unter Verwendung der Identität ∇(e angewandt auf die Darstellung (X.37a) zu Z 1 ∂ 2f˜(t, ~k) ~ 2 ˜ ~ i~k·~r d3~k − 2 − k f (t, k) e = 0, c ∂t2 (2π)3 wobei Integration über ~k und Ableitung nach der Zeit t oder nach den Ortskoordinaten ~r ausgetauscht wurden. Nach inverser Fourier-Transformation soll der Term in den eckigen Klammern verschwinden. Definiert man ω~k ≡ c ~k , (X.38) so ergibt sich für jeden Wellenvektor ~k die Differentialgleichung ∂ 2f˜(t, ~k) + ω~k2 f˜(t, ~k) = 0. (X.39a) ∂t2 Man erkennt die Bewegungsgleichung eines harmonischen Oszillators mit Kreisfrequenz ω~k , deren allgemeinen Lösung f˜(t, ~k) = f˜+ (~k) e−iω~k t + f˜− (~k) eiω~k t (X.39b) ist, mit f˜+ (~k) und f˜− (~k) zwei beliebigen Funktionen. Wenn die gesuchte Lösung f (t,~r) reell sein soll, stehen f˜+ (~k) und f˜− (~k) in Zusammenhang miteinander. Die komplexe Konjugation der Beziehung (X.37a) lautet Z Z 3~ ∗ ~ d3~k ˜(t, −~k) ∗ ei~k·~r d k , f (t,~r)∗ = f˜(t, ~k) e−i k·~r = f (2π)3 (2π)3 R3 R3 wobei die zweite Gleichung aus der Substitution ~k → −~k folgt. f (t,~r) is reellwertig, wenn f (t,~r) = 176 Zeitabhängige elektromagnetische Felder f (t,~r)∗ , d.h. nach Vergleich des letzten Terms in der obigen Gleichung mit der rechten Seite von Gl. (X.37a), wenn f˜(t, ~k) = f˜(t, −~k)∗ für alle t und ~k. Angewandt auf die Lösung (X.39b) lautet diese Bedingung ∗ ∗ f˜+ (~k) e−iω~k t + f˜− (~k) eiω~k t = f˜+ (−~k) eiω~k t + f˜− (−~k) e−iω~k t , d.h. nach Identifizierung der Terme in eiω~k t ∗ f˜− (~k) = f˜+ (−~k) ∀~k. (X.40) Die Terme in e−iω~k t führen zur gleichen Bedingung. Setzt man schließlich die Lösung (X.39b) der Gl. (X.39a) in die Fourier-Darstellung (X.37a), so lautet die letztere Z h Z h i 3~ i d3~k ~ ˜+ (~k) e−i(ω~k t−~k·~r) + f˜− (−~k) ei(ω~k t−~k·~r) d k , = f f (t,~r) = f˜+ (~k) e−iω~k t + f˜− (~k) eiω~k t ei k·~r (2π)3 (2π)3 R3 R3 wobei die Substitution ~k → −~k unter Berücksichtigung von ω−~k = ω~k im zweiten Summanden des des letzten Integrals gemacht wurde. Ersetzt man in jenem Term f˜− (−~k) durch Integranden ∗ f˜+ (~k) , wie aus Bedingung (X.40) folgt, so sieht man, dass der Term genau komplex konjugiert zum ersten Summanden ist. Unter Einführung der Notation a(~k) ≡ 2f˜+ (~k) ergibt sich somit für die allgemeine reelle Lösung der klassischen Wellengleichung (X.30) Z 3~ −i(ω~k t−~k·~r) d k ~ f (t,~r) = Re a(k) e . (X.41) (2π)3 R3 Somit lässt sich die allgemeine Lösung als Superposition von (unendlich vielen) ebenen Wellen ~ a(~k) e−i(ω~k t−k·~r) schreiben. Dabei heißt die Beziehung (X.38) zwischen Kreisfrequenz ω~k und Wellenvektor ~k dieser ebenen Wellen Dispersionsrelation. Das Verhältnis cϕ (~k) ≡ ω~k /|~k| ist die Phasengeschwindigkeit der Welle mit Wellenvektor ~k — wobei im Fall der klassischen Wellengleichung (X.30) cϕ (~k) = c für alle ~k. Bemerkung: Die komplexe Amplitude a(~k) ∈ C lässt sich prinzipiell durch die Angabe von Anfangs- bedingungen f (t = 0,~r) und ∂f (t = 0,~r)/∂t festlegen. X.4.2 Elektromagnetische Wellen X.4.2 a Elektromagnetische Potentiale :::::::::::::::::::::::::::::::::::::: Gemäß den Ergebnissen des vorigen § X.4.1 lauten die allgemeinen Lösungen der Bewegungsgleichungen (X.29b) für die elektromagnetischen Potentiale im Vakuum Z 3~ −i(ω~k t−~k·~r) d k ~ Φ(t,~r) = Re a(k) e (X.42a) (2π)3 und Z 3~ −i(ω~k t−~k·~r) d k ~ ~ ~ A(t,~r) = Re b(k) e (2π)3 mit beliebigen a(~k) ∈ C und ~b(~k) ∈ C3 und mit der Dispersionsrelation ω~k ≡ c ~k . ~ die Lorenz-Eichbedingung (X.16) erfüllen: Dabei sollen Φ und A Z 3~ iω~k ~ 1 ∂Φ(t,~r) ~ ~ −i(ω~k t−~k·~r) d k ~ ~ ~ + ∇ · A(t,~r) = Re − 2 a(k) + i k · b(k) e = 0. c2 ∂t c (2π)3 (X.42b) (X.42c) 177 X.4 Elektromagnetische Wellen im Vakuum ~ können noch über die Eichtransformation (X.14) Die elektromagnetischen Potentiale Φ und A 0 0 ~ durch äquivalente Potentiale Φ und A ersetzt werden, die ebenfalls der Lorenz-Bedingung genügen, solange die Funktion χ der Transformation die Gleichung (X.17) — d.h. die klassische Wellengleichung — erfüllt. Mit Z 3~ d k ~ t− k·~ r) −i(ω ~ k χ(t,~r) = Re d(~k) e (2π)3 gelten Z h i 3~ ∂χ(t,~r) 0 −i(ω~k t−~k·~r) d k ~ ~ Φ (t,~r) = Φ(t,~r) − = Re a(k) + iω~k d(k) e ∂t (2π)3 und Z h i 3~ d k ~ 0 t− k·~ r) −i(ω ~ ~b(~k) + i~kd(~k) e ~ (t,~r) = A(t,~ ~ r) + ∇χ(t,~ ~ k . A r) = Re (2π)3 Eine besonders geeignete Wahl ist d(~k) = ia(~k)/ω~ für jeden ~k, die zum einfachen Skalarpotential k 0 Φ (t,~r) = 0 (X.43a) führt. Wiederum lautet das entsprechende Vektorpotential Z 3~ 0 −i(ω~k t−~k·~r) d k ~ ~ A (t,~r) = Re ~ε(k) e , (2π)3 (X.43b) wobei der Polarisationsvektor ~ε(~k) durch ~ε(~k) ≡ ~b(~k) + i~kd(~k) = ~b(~k) − a(~k) ~ k ω~k gegeben ist. Dabei kann noch ~ε(~k) reell oder komplex sein. Eine Einschränkung über den Polarisationsvektor folgt aus der Eichbedingung. Mit Φ0 (t,~r) = 0 wird die Lorenz-Eichbedingung automatisch zur Coulomb-Eichbedingung (X.15) Z d3~k ~ ~ ·A ~ 0 (t,~r) = Re ∇ i ~ε(~k) · ~k e−i(ω~k t−k·~r) = 0. (2π)3 Diese Bedingung ist nur dann erfüllt, wenn ~ε(~k) · ~k = 0 (X.44) für jeden Wellenvektor ~k, d.h. wenn der Polarisationsvektor senkrecht auf die Ausbreitungsrichtung der entsprechenden ebenen Welle ist. Somit sind elektromagnetische Wellen im Vakuum transversal polarisiert. X.4.2 b Elektrisches und magnetisches Feld ::::::::::::::::::::::::::::::::::::::::::::: Setzt man die elektromagnetischen Potentiale (X.43) in die Beziehungen (X.12) und (X.13), so lauten die entsprechenden elektrischen und magnetischen Felder Z 3~ ~ 0 (t,~r) ∂A −i(ω~k t−~k·~r) d k ~ ~ E(t,~r) = − = Re iω~k ~ε(k) e (X.45a) ∂t (2π)3 und Z 3~ 0 −i(ω~k t−~k·~r) d k ~ ~ ~ ~ ~ i k × ~ε(k) e B(t,~r) = ∇ × A (t,~r) = Re . (2π)3 (X.45b) Betrachte man eine monochromatische ebene Welle, d.h. eine Lösung mit nur einem einzigen Wellenvektor: ~ε(~k) = N ~ε(~k0 ) (2π)3 δ (3) ~k − ~k0 mit N einer unwesentlichen Normierungskonstanten. Dann gelten 178 Zeitabhängige elektromagnetische Felder i i h h ~ r) = Re iω~ ~ε(~k0 ) e−i(ω~k0t−~k0 ·~r) ~ r) = Re i~k0 × ~ε(~k0 ) e−i(ω~k0t−~k0 ·~r) . und B(t,~ E(t,~ k0 ~ r) und B(t,~ ~ r) autoAuf diesen Felder erkennt man die folgenden Eigenschaften. Erstens sind E(t,~ matisch senkrecht aufeinander ~ r) · B(t,~ ~ r) = 0. E(t,~ (X.46) ~ r) und B(t,~ ~ r) beide senkrecht zur Bewegungsrichtung ~k0 Dann sind E(t,~ ~k0 · E(t,~ ~ r) = ~k0 · B(t,~ ~ r) = 0. (X.47) ~ r) E(t,~ ~ r) = B(t,~ . c (X.48) Schließlich gilt dank |~k0 | = ω~k0 /c X.4.2 c Energie des elektromagnetischen Feldes ::::::::::::::::::::::::::::::::::::::::::::::::: Betrachte man der Einfachheit halber die Felder (X.45) für den Fall einer monochromatischen ~ 0 /(iω0 ) mit E ~ 0 ∈ R3 und ω0 ≡ ω~ : ebenen Welle mit Polarisationsvektor ~ε ~k = (2π)3 δ (3) ~k − ~k0 E k0 da die Richtung des elektrischen Feldes — und daher auch der magnetischen Induktion — konstant bleibt, handelt es sich um eine linear polarisierte Welle. Es gelten dann ~ r) = E ~ 0 cos ω0 t − ~k0 · ~r E(t,~ (X.49a) und ~0 ~e~k0 × E ~0 ~k0 × E cos ω0 t − ~k0 · ~r = cos ω0 t − ~k0 · ~r . (X.49b) c ω0 ~ 0 folgt ~e~ × E ~ 0 = ~e~ E ~ 0 = E ~ 0 , womit sich die GleiAus der Orthogonalität von ~k0 und E k0 k0 chung (X.48) wiederfinden lässt. Setzt man diese Felder in die Energiedichte (X.23a) ein, so ergibt sich ~2 ~2 E 0 E0 2 0 ~k0 · ~r + cos ω t − ee.m.(t,~r) = 0 2 2µ0 c2 ~ r) = B(t,~ d.h. unter Verwendung der Beziehung 0 µ0 c2 = 1 ~ 2 cos2 ω0 t − ~k0 · ~r . ee.m.(t,~r) = 0 E 0 (X.50) Interessant ist auch der über die Zeit gemittelte Wert — definiert für eine beliebige periodische Funktion f durch Z 1 T hf i ≡ f (t) dt (X.51) T 0 mit T der Periode der Funktion — von der Energiedichte. Im Fall der letzteren ist die Periodendauer T = 2π/ω0 : da der Mittelwert von cos2 über eine Periode 12 ist, gilt ~2 0 E 0 . 2 Diese zeitgemittelte Energiedichte ist auch unabhängig vom Ort. hee.m.(~r)i = Mit den Feldern?(X.49) wird der Poynting-Vektor (X.23b) zu ~0 ~ 0 × ~e~ × E E k0 ~e.m.(t,~r) = S cos2 ω0 t − ~k0 · ~r . µ0 c (X.52) 179 X.5 Klassische Theorie der Strahlung ~ 0 verschwindet der zweite ~ 0 · ~e~ E ~ 0 2 ~e~ − E ~0 = E ~ 0 × ~e~ × E Im doppelten Kreuzprodukt E k0 k0 k0 Term wegen der Transversalität der elektromagnetischen Welle im Vakuum. Somit gilt ~2 ~e.m.(t,~r) = E0 cos2 ω0 t − ~k0 · ~r ~e~ . S k0 µ0 c (X.53) gerichtet entlang der Ausbreitungsrichtung ~e~k0 , wie es intuitiv der Fall sein soll. Gemittelt über die Zeit ergibt sich D E ~2 ~2 ~e.m.(~r) = E0 ~e~ = 0 E0 c~e~ , S k k0 2µ0 c 0 2 d.h. nach Vergleich mit der zeitgemittelten Energiedichte (X.52) D E ~e.m.(~r) = hee.m.(~r)i c~e~ . S k0 (X.54) Dies entspricht der Stromdichte assoziierte mit einer Dichte hee.m.(~r)i, die sich mit der (gerichteten) Geschwindigkeit c~e~k0 ausbreitet. X.5 Klassische Theorie der Strahlung In diesem Abschnitt werden die Maxwell-Gleichungen in Anwesenheit fester äußerer Quellen mithilfe von retardierten Potentialen gelöst. Dafür wird zunächst die retardierte Green’sche Funktion des elektromagnetischen Feldes eingeführt (§ X.5.1). Mit deren Hilfe können für jede beliebige Ladungsund Stromverteilung die dadurch verursachten Potentiale ausgedrückt werden (§ X.5.2). In § X.5.3 wird eine Näherung der Potentiale hergeleitet, die sich weit von den Quellen ergibt. Schließlich wird das durch ein bewegtes geladenes Punktteilchen erzeugte elektromagnetische Feld bestimmt (§ X.5.4). Dabei wird insbesondere die durch eine beschleunigte Punktladung abgestrahlte Leistung berechnet. X.5.1 Green’sche Funktion der klassischen Wellengleichung Die Bewegungsgleichungen (X.21) für die elektromagnetischen Potentiale in der Lorenz-Eichung sind lineare partielle Differentialgleichungen der Form f (t,~r) = J(t,~r) (X.55) mit vorgegebenem rechtem Glied J, d.h. eine inhomogene klassische Wellengleichung. Die Lösung ist gleich der Summe aus der allgemeinen Lösung der assoziierten homogenen Differentialgleichung — die in § X.4.1 b berechnet wurde — und aus einer speziellen Lösung, die hiernach bestimmt wird. Sei G(t,~r) eine Green’sche Funktion der Gleichung (X.55), d.h. G soll der Differentialgleichung G(t,~r; t0 ,~r 0 ) = δ(t − t0 ) δ (3) (~r − ~r 0 ) genügen. Dann ist die Faltung von G und J eine spezielle Lösung der Gl. (X.55): Z f (t,~r) = G(t,~r; t0 ,~r 0 ) J(t0 ,~r 0 ) dt0 d3~r 0 . (X.56a) (X.56b) Wenn den d’Alembert-Operator bezüglich der nicht-gestrichenen Variablen t,~r bezeichnet, gilt tatsächlich Z Z f (t,~r) = G(t,~r; t0 ,~r 0 ) J(t0 ,~r 0 ) dt0 d3~r 0 = G(t,~r; t0 ,~r 0 ) J(t0 ,~r 0 ) dt0 d3~r 0 Z = δ(t − t0 ) δ (3) (~r − ~r 0 ) J(t0 ,~r 0 ) dt0 d3~r 0 = J(t,~r). 180 Zeitabhängige elektromagnetische Felder Hiernach wird gezeigt, dass die Differentialgleichung (X.56a) zwei unabhängige Lösungen hat, die im Unendlichen verschwinden, und zwar −1 |~r − ~r 0 | 0 δ − (t − t ) , 4π|~r − ~r 0 | c |~r − ~r 0 | −1 0 0 0 Gadv.(t,~r; t ,~r ) ≡ δ + (t − t ) . 4π|~r − ~r 0 | c Gret.(t,~r; t0 ,~r 0 ) ≡ (X.57a) (X.57b) • Gret.(t,~r; t0 ,~r 0 ) ist die retardierte Green’sche Funktion: liegt der „Beobachtungspunkt“ — wo die Lösung f von Gl. (X.55) gemessen wird — im Raumzeitpunkt P = (t,~r), dann ist der Träger von Gret. lokalisiert auf der Menge der Punkte (t0 ,~r 0 ) mit |~r −~r 0 | = c(t − t0 ) und somit t0 ≤ t, entsprechend dem Rückwärtslichtkegel des Punkts P . • Gadv.(t,~r; t0 ,~r 0 ) ist die avancierte Green’sche Funktion: Gadv. ist lokalisiert auf dem Vorwärtslichtkegel |~r − ~r 0 | = −c(t − t0 ), woraus t0 ≥ t folgt, des Beobachtungspunktes in (t,~r). Allgemeiner ist jede Funktion der Form G(t,~r; t0 ,~r 0 ) = AGret.(t,~r; t0 ,~r 0 ) + BGadv.(t,~r; t0 ,~r 0 ) mit A + B = 1 ebenfalls eine im Unendlichen verschwindende Green’sche Funktion der inhomogenen klassischen Wellengleichung (X.55). Bemerkung: Bezeichnet man die retardierte bzw. avancierte Green’sche Funktion Gret. bzw. Gadv. mit G− bzw. G+ , so gilt G∓ (t,~r; t0 ,~r 0 ) = −c Θ ±(t − t0 ) δ −c2 (t−t0 )2 + |~r−~r 0 |2 , 2π wobei die einzige Rolle der Heaviside-Funktion Θ darin besteht, den Rückwärts- bzw. Vorwärtslichtkegel des Punkts (t,~r) auszuwählen. P Sei τ ≡ t − t0 und % ≡ |~r − ~r 0 |. Aus δ(f (x)) = i δ(x − xi )/|f 0 (xi )|, wobei die Summe über die Nullstellen xi der Funktion f läuft [Gl. (D.22)], folgt [vgl. auch Gl. (D.23)] −c −c δ(% − cτ ) δ(% + cτ ) −c −1 % Θ(±τ ) δ(−c2 t2 + %2 ) = Θ(±τ ) + = δ(% ∓ cτ ) = δ ∓τ , 2π 2π |2cτ | |2cτ | 4π% 4π% c wobei % ≥ 0 und die Skalierungseigenschaft (D.17a) der δ-Distribution benutzt wurden. 2 Bestimmung der Green’schen Funktionen zur inhomogenen Wellengleichung ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Um eine Lösung der Gleichung (X.56) zu finden, ist es günstig, die Fourier-Darstellungen Z Z d3~k 0 ~ 0 −iω(t−t0 ) dω (3) 0 δ(t − t ) = e , δ (~r − ~r ) = ei k·(~r−~r ) 2π (2π)3 und G(t,~r; t0 ,~r 0 ) = Z 0 ~ G̃(ω, ~k) e−i[ω(t−t )−k·(~r−~r 0 )] dω d3~k 2π (2π)3 der δ-Distributionen und der gesuchten Green’schen Funktion einzuführen. Somit gilt Z 3~ 1 ∂2 0 0 −i[ω(t−t0 )−~k·(~r−~r 0 )] dω d k ~ G(t,~r; t ,~r ) = G̃(ω, k) − 2 2 + 4 e c ∂t 2π (2π)3 Z 2 3~ ω ~k 2 G̃(ω, ~k) e−i[ω(t−t0 )−~k·(~r−~r 0 )] dω d k . = − c2 2π (2π)3 (X.58) 181 X.5 Klassische Theorie der Strahlung Dies muss gleich 0 δ(t − t ) δ (3) 0 Z (~r − ~r ) = 0 ~ e−i[ω(t−t )−k·(~r−~r 0 )] dω d3~k 2π (2π)3 sein, woraus ω2 ~ 2 − k G̃(ω, ~k) = 1 bzw. c2 G̃(ω, ~k) = −1 ~k 2 − ω 2 /c2 folgt. Nach Einsetzen in die Fourier-Darstellung (X.58) ergibt sich dann Z −i[ω(t−t0 )−~k·(~r−~r 0 )] e dω d3~k 0 0 G(t,~r; t ,~r ) = − . ~k 2 − ω 2 /c2 2π (2π)3 (X.59) Dieser Ausdruck ist aber mehrdeutig, weil der Nenner des Integranden verschwindet. Z i~k·R~ e ~ ergibt sich ~ ≡ d3~k. Unter Einführung des Winkels θ zwischen ~k und R Sei g(k0 , R) ~k 2 − k 2 0 Z ∞ Z 1 ikR cos θ Z e 2π ∞ k 2 ~ = 2π k g(k0 , R) d(cos θ) dk = eikR − e−ikR dk, 2 2 2 2 iR 0 k − k0 −1 k − k0 0 ~ und k = |~k|. Dies lautet noch wobei R = |R| Z ∞ Z ∞ −ikR Z 2π k eiR ke 2π ∞ k eikR ~ g(k0 , R) = dk − 2 dk = iR 2 dk, 2 2 iR 0 k 2 − k02 0 k − k0 −∞ k − k0 wobei die letzte Gleichung aus der Substitution k → −k im zweiten Integral folgt. Für k0 ∈ C mit Im k0 6= 0 ist die Funktion g(k0 , ~r) wohldefiniert. Wenn Γ(Λ) die in Abb. X.2 Im k 6 Γ(Λ) I k• 0 - −Λ • −k0 - - Λ Re k Abbildung X.2 – Integrationskontour für die Berechnung von ∞ k eikR 2 dk mit R > 0. 2 −∞ k − k0 Z dargestellte Integrationskontour bezeichnet, dann ist für R > 0 Z Z ∞ k eikR k eikR dk = lim dk 2 2 Λ→∞ Γ(Λ) k 2 − k02 −∞ k − k0 laut dem Residuensatz gleich 2πi multipliziert mit dem Residuum von k eikR /(k 2 − k02 ) am Pol in der Halbebene Im k > 0. Für Im k0 > 0 liegt dieser Pol bei k = k0 und das Residuum ist eik0 R /2. Für Im k0 < 0 liegt der Pol bei k = −k0 , mit Residuum e−ik0 R /2. Somit gilt 2 2π ik0 |R| ~ e wenn Im k0 > 0, ~ | R| ~ g(k0 , R) = 2π 2 −ik0 |R| ~ e wenn Im k0 < 0. ~ |R| Um den Fall k0 ∈ R zu behandeln, werden die Funktionen ~ ≡ lim g(k0 ± i, R) ~ = g± (k0 , R) →0+ 2π 2 ±ik0 |R| ~ e ~ |R| 182 Zeitabhängige elektromagnetische Felder definiert. Mit deren Hilfe lassen sich aus Gl. (X.59) zwei Green’schen Funktionen herleiten, und zwar Z ∞ Z ∞ 1 ω dω −1 0 0 0 0 −iω(t−t0 ) dω 0 G± (t,~r; t ,~r ) = − e−iω(t−t ∓|~r−~r |/c) g± ,~r − ~r e = , 3 0 (2π) −∞ c 2π 4π|~r − ~r | −∞ 2π d.h. −1 |~r − ~r 0 | 0 G± (t,~r; t ,~r ) = δ ∓ (t − t ) , 4π|~r − ~r 0 | c 0 0 (X.60) entsprechend der retardierten (G+ ) und avancierten (G− ) Green’schen Funktionen (X.57). X.5.2 Retardierte Potentiale Mit Hilfe der im vorigen Paragraphen eingeführten Green’schen Funktionen können nur spezielle Lösungen der Bewegungsgleichungen (X.21) für die elektromagnetischen Potentiale geschrieben werden. Somit liefert das Einsetzen der retardierten Green’schen Funktion (X.57a) in die allgemeine Formel (X.56b) mit Quellterm −ρel.(t0 ,~r 0 )/0 bzw. −µ0~el.(t0 ,~r 0 ) Z 1 Φret.(t,~r) = − (X.61a) Gret.(t,~r; t0 ,~r 0 ) ρel.(t0 ,~r 0 ) dt0 d3~r 0 0 bzw. ~ ret.(t,~r) = −µ0 A Z Gret.(t,~r; t0 ,~r 0 ) ~el.(t0 ,~r 0 ) dt0 d3~r 0 . (X.61b) Diese Ausdrücke sehen offensichtlich sehr ähnlich aus. Daher werden im Folgenden detaillierte Her~ ret. durchgeführt. leitung nur am Beispiel des Vektorpotentials A Mit dem expliziten Ausdruck (X.57a) der retardierten Green’schen Funktion gelten Z −1 |~r − ~r 0 | 0 ~ Aret. (t,~r) = −µ0 δ − (t − t ) ~el.(t0 ,~r 0 ) dt0 d3~r 0 4π|~r − ~r 0 | c Z Z µ0 1 |~r − ~r 0 | 0 0 0 0 = δ t−t − ~el.(t ,~r ) dt d3~r 0 4π |~r − ~r 0 | c (X.62a) und für das Skalarpotential 1 Φret. (t,~r) = 4π0 Z 1 |~r − ~r 0 | Z |~r − ~r 0 | 0 0 0 0 δ t−t − ρel.(t ,~r ) dt d3~r 0 . c (X.62b) Nach Durchführen des Integrals über die Zeit kommen Z 1 1 |~r − ~r 0 | 0 3 0 Φret. (t,~r) = ρel. t − ,~r d ~r 4π0 |~r − ~r 0 | c Z 1 |~r − ~r 0 | 0 3 0 ~ ret. (t,~r) = µ0 A ~ t − ,~ r d ~r el. 4π |~r − ~r 0 | c (X.63a) (X.63b) ~ ret. heißen retardierte Potentiale. Dabei hängt das Skalar bzw. Vektorpotential am Ort Φret und A ~r zur Zeit t von der Ladungsdichte ρel. bzw. Stromdichte ~el. am Ort ~r 0 zur früheren, retardierten Zeit t − |~r − ~r 0 |/c ab. Die Verzögerung entspricht genau der Reisezeit des Lichts von ~r 0 bis zu ~r. Bemerkungen: ∗ Die retardierten Potentiale genügen automatisch der Lorenz-Eichbedingung X.16. X.5 Klassische Theorie der Strahlung 183 Das Einsetzen der Gl. (X.61) in die letztere gibt nämlich 0 µ0 ∂Φret.(t,~r) ~ ~ + ∇ · Aret.(t,~r) = ∂t Z ∂Gret.(t,~r; t0 ,~r 0 ) ~ ret.(t,~r; t0 ,~r 0 ) · ~el.(t0 ,~r 0 ) dt0 d3~r 0 . − µ0 ρel.(t0 ,~r 0 ) + ∇G ∂t Die Ableitung der retardierten Green’schen Funktion nach t bzw. nach den Komponenten von ~r kann durch das Negative der Ableitung nach t0 bzw. nach den Komponenten von ~r 0 ersetzt werden: 0 µ0 ∂Φret.(t,~r) ~ ~ + ∇ · Aret.(t,~r) = ∂t Z ∂Gret.(t,~r; t0 ,~r 0 ) 0 0 0 0 0 0 ~ ρel.(t ,~r ) + ∇~r 0 Gret.(t,~r; t ,~r ) · ~el.(t ,~r ) dt0 d3~r 0 . µ0 ∂t0 Jetzt können partielle Integrationen über die Zeit t0 (für den ersten Summanden im Integral) oder die Ortskoordinaten ~r 0 (für den zweiten Summanden) durchgeführt werden. Unter der Annahme, dass die integrierten Terme verschwinden — entsprechend der Abwesenheit von Ladungen und Strömen im Unendlichen —, kommt Z ∂Φret.(t,~r) ~ ~ ∂ρel.(t0 ,~r 0 ) ~ 0 0 0 + ∇ · ~ (t ,~ r ) dt0 d3~r 0 . + ∇ · Aret.(t,~r) = −µ0 Gret.(t,~r; t0 ,~r 0 ) 0 µ0 el. ~r ∂t ∂t0 Der Term in eckigen Klammern stellt genau die linke Seite der Kontinuitätsgleichung (X.7) dar, d.h. er verschwindet. 2 ∗ Wenn die Quellen ρel. (t0 ,~r 0 ), ~el. (t0 ,~r 0 ) des elektromagnetischen Feldes vor einem Zeitpunkt t0 ~ ret.(t,~r) für t ≤ t0 ebenfalls Null. identisch verschwinden, dann sind die Potentiale Φret.(t,~r), A ∗ Mithilfe der avancierten Green’schen Funktion Gadv. lassen sich auch avancierte Potentiale bestimmen. Physikalisch werden solche Potentiale üblicherweise im Namen vom Prinzip der Kausalität nicht angenommen: das Effekt — Potential am Punkt (t,~r) — könne nicht vor der Ursache — Quelle am Punkt (t + |~r −~r 0 |/c,~r 0 ) — kommen. Diese Wahl der Lösung mit retardiertem Potential schließt also einen Unterschied zwischen Vergangenheit und Zukunft („elektromagnetischer Zeitpfeil“) ein, der in den Maxwell-Gleichungen nicht existiert. Referenz [29] legt eine „Begründung“ dieser Wahl dar, die aber nicht zwangsläufig ist: beispielsweise haben Wheeler und Feynman [30] lineare Kombinationen von retardierten und avancierten Potentialen benutzt, um Probleme der klassischen Elektrodynamik von Punktladungen — insbesondere deren Selbstwechselwirkung — zu lösen. Stationäre Quellen ::::::::::::::::::: Falls die Quellen —Ladungs- und Stromverteilungen — des elektromagnetischen Feldes stationär sind, lauten die retardierten Potentiale (X.63) Z 1 ρel. (~r 0 ) 3 0 Φret.(~r) = d ~r , (X.64a) 4π0 |~r − ~r 0 | Z µ0 ~el. (~r 0 ) 3 0 ~ Aret.(~r) = d ~r . (X.64b) 4π |~r − ~r 0 | Man findet also genau die Lösungen (VIII.21) bzw. (IX.10) der Poisson-Gleichungen der Elektrostatik (VIII.4) bzw. der Magnetostatik (IX.9) wieder. X.5.3 Multipolentwicklung Die Ergebnisse des vorigen Paragraphen können zuerst auf den Fall von periodisch oszillierenden Quellen angewandt werden zwar 184 Zeitabhängige elektromagnetische Felder h i ρel.(t,~r) = Re ρ0 (~r) e−iωt , h i ~el.(t,~r) = Re ~0 (~r) e−iωt (X.65) mit ρ0 , ~0 gegebenen Amplituden. Dann gilt ∂ρel.(t,~r) ~ ~ · ~0 (~r) e−iωt . + ∇ · ~el.(t,~r) = Re −iωρ0 (~r) + ∇ ∂t Laut der Kontinuitätsgleichung (X.7) ist die linke Seite dieser Gleichung gleich Null, was nur dann möglich ist, wenn der Term in rechteckigen Klammern verschwindet, d.h. ~ · ~0 (~r) = 0. − iωρ0 (~r) + ∇ (X.66) Mit der Ladungsstromdichte ~el. der Gl. (X.65) wird das retardierte Vektorpotential (X.63b) zu Z iω|~r−~r 0 |/c µ0 e−iωt 0 e 3 0 ~ Aret.(t,~r) = Re ~0 (~r ) (X.67) d ~r . 4π |~r − ~r 0 | Sei angenommen, dass die Ladungsstromdichte ~el. innerhalb eines Gebiets V in der Umgebung des Nullpunkts ~r 0 = ~0 lokalisiert ist, und dass sie am Rand ∂ V des Gebiets verschwindet. Das elektromagnetische Feld wird in einem „weit entfernten“ Punkt ~r untersucht, d.h. |~r| |~r 0 | gilt für jeden Punkt ~r 0 ∈ V . Dementsprechend darf man in erster Näherung |~r − ~r 0 | durch r ≡ |~r| in Gl. (X.67) ersetzen; daraus folgt Z µ0 e−iω(t−r/c) 0 3 0 ~ Aret.(t,~r) ' Re ~0 (~r ) d ~r . (X.68) 4πr V Zur Berechnung des Terms in eckigen Klammern kann man das Integral Z X 3 ∂ 0l k 0 3 0 x j0 (~r ) d ~r ∂x0k V k=1 betrachten. Es lässt sich einerseits direkt integrieren, denn der Integrand eine Ableitung ist: da j0 (~r 0 ) = 0 für ~r 0 ∈ ∂ V ist das Integral gleich Null. Andererseits kann man die Produktregel verwenden, woraus sich Z X Z X Z 3 3 k r 0) l 0 ∂ 0l k 0 3 0 kl k 0 0l ∂j0 (~ 0 3 0 0l ~ 0 x j (~ r ) d ~ r = δ j (~ r ) + x d ~ r = j (~ r ) + x ∇ · ~ (~ r ) d3~r 0 0 ~r 0 0 0 0k 0k ∂x ∂x V V V k=1 k=1 ~ ~r 0 dem Gradient bezüglich der Komponenten von ~r 0 . Daher gilt ergibt, mit ∇ Z Z 0 3 0 ~ ~r 0 · ~0 (~r 0 ) d3~r 0 . ~0 (~r ) d ~r = − ~r 0 ∇ V V Aus der Beziehung (X.66) folgt dann Z Z 0 3 0 ~0 (~r ) d ~r = −iω ~r 0 ρ0 (~r) d3~r 0 . V V Somit wird das retardierte Potential (X.68) zu Z µ0 e−iω(t−r/c) 0 0 3 0 ~ Aret.(t,~r) ' Re −iω ~r ρ0 (~r ) d ~r . 4πr V Dabei ist das Integral genau das in Gl. (VIII.23c) definierte elektrische Dipolmoment P~0 von der Ladungsverteilung, die das Potential verursacht. Insgesamt lautet das retardierte Vektorpotential µ0 ~ r ~ Aret.(t,~r) ' − ω P0 sin ω t − . (X.69) 4πr c 185 X.5 Klassische Theorie der Strahlung Dabei handelt es sich um Dipolstrahlung Aus diesem Vektorpotential leitet man für r c/ω die elektromagnetischen Felder µ0 2 r ~ ~ B(t,~r) ' ω ~er × P0 cos ω t − 4πcr c (X.70a) und ~ r) ' µ0 ω 2~er × ~er × P~0 cos ω t − r E(t,~ 4πr c ab, wobei ~er den Einheitsvektor entlang ~r bezeichnet. (X.70b) X.5.4 Potentiale und Felder einer bewegten Punktladung Dieser Paragraph beginnt mit der Berechnung der Potentiale und Felder, die durch eine bewegte Punktladung mit der Bahnkurve ~x(t) erzeugt werden, entsprechend einer Ladungsdichte bzw. Stromdichte [vgl. Gl. (VII.6)] ρel.(t,~r) = qδ (3) ~r − ~x(t) bzw. ~el.(t,~r) = q~v (t) δ (3) ~r − ~x(t) . Danach wird die Leistung, die durch die abgestrahlte Felder transportiert wird, bestimmt. X.5.4 a Liénard–Wiechert-Potentiale :::::::::::::::::::::::::::::::::::: Mit dieser Form für die Quellterme lauten die retardierten Potentiale (X.62) Z 1 |~r − ~r 0 | 0 ~ ret.(t,~r) = − µ0 q δ t − t − ~v (t0 ) δ (3) ~r 0 − ~x(t0 ) dt0 d3~r 0 A 0 4π |~r − ~r | c Z ∞ µ0 q 1 |~r − ~x(t0 )| 0 0 = ~v (t ) δ t−t − dt0 , 4π −∞ |~r − ~x(t0 )| c wobei das Integral über ~r 0 durchgeführt wurde, und ähnlich Z ∞ q 1 |~r − ~x(t0 )| 0 Φret.(t,~r) = δ t−t − dt0 4π0 −∞ |~r − ~x(t0 )| c (X.71a) (X.71b) Wie im § X.5.2 werden die Herleitungen hiernach nur im Fall des Vektorpotentials detailliert. Das Argument f (t0 ) = t − t0 − |~r − ~x(t0 )|/c der δ-Distribution im Integranden verschwindet für einen einzigen Wert von t0 , der als tret. bezeichnet wird und retardierte Zeit heißt. tret. ist die Zeit, zu der die Raumzeitlinie — d.h. die Trajektorie in der Raumzeit — t0 , ~x(t0 ) der Punktladung den Rückwärtslichtkegel des Punkts (t,~r) durchschneidet (Abb. X.3). t0 ~x(t0 ) 6 • (t,~r) @ @ @ @ • x2 @ @ x1 @ @ Abbildung X.3 – Retardierte Zeit. Somit genügt die retardierte Zeit der impliziten Gleichung tret. = t − |~r − ~x(tret. )| . c (X.72) 186 Zeitabhängige elektromagnetische Felder Die Integration nach t0 in Gl. (X.71a) folgt aus der Formel δ f (t0 ) = δ(t0 − tret. )/|f 0 (tret. )|, wobei hier 1 ~r − ~x(t0 ) f 0 (t0 ) = −1 + · ~v (t0 ). c |~r − ~x(t0 )| Daher gilt f 0 (tret. ) = −1 + ~eret. · β~ret. , mit ~eret. ≡ ~ ret. ~r − ~x(tret. ) X ≡ ~ ret. | |~r − ~x(tret. )| |X (X.73a) ~ ret. ≡ ~r − ~x(tret. ), d.h. von der Quelle des Potentials bis zu dem Einheitsvektor in Richtung von X dessen Beobachtungspunkt, während ~vret. ~v (tret. ) β~ret. = ≡ c c (X.73b) die Geschwindigkeit der Punktladung zur retardierten Zeit bezeichnet. Da der Betrag von β~ret. streng kleiner als 1 ist, bleibt f 0 (tret. ) immer negativ. Somit ergeben sich die Liénard (ao) –Wiechert (ap) -Potentiale ~ r) = µ0 A(t,~ 4π und Φ(t,~r) = q~vret. |~r − ~x(tret. )| − [~r − ~x(tret. )] · 1 4π0 Dabei hängt die Geschwindigkeit ~vret. implizit von t und ~r ab. ~vret. c , (X.73c) q . (X.73d) ~vret. c der Punktladung zur retardierten Zeit von tret. und somit |~r − ~x(tret. )| − [~r − ~x(tret. )] · Bemerkung: Der Nenner dieser Potentiale ist immer positiv. X.5.4 b Elektrisches und magnetisches Feld ::::::::::::::::::::::::::::::::::::::::::::: Das elektrische und das magnetische Feld können aus den Gl. (X.13) und (X.12) hergeleitet werden. Die Liénard–Wiechert-Potentiale (X.73) hängen aber nicht nur explizit von der Raumzeitvariablen t und ~r ab, sondern auch implizit über die retardierte Zeit (X.72). Dementsprechend ist die Berechnung der Felder etwa mühsam. Letztendlich findet man die retardierten Feldern: ! ~ret. × ~aret. ~ret. ~ e × ~ e − β q ~ e − β ret. ret. ret. ~ r) = E(t,~ , (X.74a) + 2 X ~ ret. ~ ret. 2 c2 X 4π0 (1 − ~eret. · β~ret. )3 γret. ~ r) = 1 ~eret. × E(t,~ ~ r), B(t,~ (X.74b) c mit β~ret. bzw. ~aret. der auf c normierten Geschwindigkeit bzw. der Beschleunigung der Punktladung 2 )−1/2 dem entsprechenden Lorentz-Faktor. zur retardierten Zeit und γret. = (1 − β~ret. Beweis: Um die retardierten Felder herzuleiten, lohnt es sich, die Potentiale (X.73c)–(X.73d) umzuschreiben [vgl. Gl. (X.71)] Z ∞ q 1 |~r − ~x(t0 )| 0 Φ(t,~r) = δ t−t − dt0 (X.75a) 4π0 −∞ |~r − ~x(t0 )| c Z ∞ ~v (t0 ) |~r − ~x(t0 )| 0 ~ r) = µ0 q A(t,~ δ t − t − dt0 . (X.75b) 4π −∞ |~r − ~x(t0 )| c (ao) A.-M. Liénard, 1869–1958 (ap) E. Wiechert, 1861–1928 187 X.5 Klassische Theorie der Strahlung ~ 0 ) ≡ ~r − ~x(t0 ) mit ~e(t0 ) ≡ X(t ~ 0 )/|X(t ~ 0 )| dem entsprechenden Einheitsvektor. Aus Sei jetzt X(t diesen Gleichungen folgen # Z ∞" ~ 0 ) ~ 0 ) X(t X(t 1 q 1 0 0 0 ~ − ∇Φ(t,~ r) = − ~e(t0 ) dt0 , δ t−t − δ t−t − ~ 0 ) 4π0 −∞ c c ~ 0 )2 X(t cX(t Z ~ 0 ) X(t ~ r) ∂ A(t,~ µ0 q ∞ ~v (t0 ) 0 0 = dt0 . δ t−t − ~ 0 ) ∂t 4π −∞ X(t c ~ 0 )/c gibt ds/dt0 = −1 + ~e · β~ und dadurch Die Substitution s = f (t0 ) = t − t0 − X(t # " Z ∞ ~ q 1 ~ e − β ~ e 0 ~ ~r) = E(t, (X.76) 2 δ(s) + δ (s) ds, ~ ~ X 4π0 −∞ 1 − ~e · β ~ cX ~ ~v und β~ ≡ ~v /c zur Zeit t0 = f −1 (s) zu betrachten sind. Der Term mit der Ableitung wobei ~e, X, der δ-Distribution kann mithilfe partieller Integration berechnet werden: " # Z ∞ Z ∞ ~ ~e − β~ ~e − β d 0 δ(s) δ (s) ds = − ds ~ ~ ds c 1 − ~e · β~ X e · β~ X −∞ c 1 − ~ −∞ # " Z ∞ d ~e − β~ 1 = δ(s) ds. ~ X ~ 1 − ~e · β~ dt0 c 1 − ~e · β −∞ Die Ableitung nach t0 im Integranden folgt aus den Ableitungen d 1 ~e · ~v = 2 , ~ dt0 X ~ X d~e (~e · ~v )~e − ~v , = ~ X dt0 d 1 1 ~e · ~a (~e · ~v )2 − ~v 2 , = + 2 ~ dt0 1 − ~e · β~ c c X 1 − ~e · β~ mit ~a = d~v /dt0 der Beschleunigung der Punktladung. Dies führt zu # " " ~e · ~a ~e − ~a − ~e · ~a β~ + ~e · β~ ~a 1 d ~e − β~ = ~ dt0 c 1 − ~e · β~ X c2 ~ 1 − ~e · β~ 2 X # 2 ~2 2 ~e · β~ − ~e · β~ − β~ 2 1−β ~ ~e − β , + ~ ~ X X so dass Gl. (X.76) insgesamt lautet Z ∞ q δ(s) ~ E(t, ~r) = 4π0 −∞ X ~ 1 − ~e · β~ 3 ! ~ − ~e · ~e − β~ ~a ~e · ~a ~e − β 1 − β~ 2 ~e − β~ + ds. ~ X c2 Dann ist der Integrand gleich dem Produkt eines Terms δ(s) mit einer Funktion von s: das Integral ist einfach der Wert der Letzteren für s = 0, d.h. t0 = tret. . Somit findet man Gl. (X.74a). ~ ~r) lässt sich ähnlich berechnen, ausgehend aus Das magnetische Feld B(t, " # Z ∞ ~ 0 ) ~ 0 ) X(t X(t µ q −1 1 0 0 0 0 0 0 ~ A(t,~ ~ r) = ∇× ~e(t )×~v (t ) − dt0 . δ t−t − δ t−t − ~ 0 ) 4π −∞ c c ~ 0 )2 X(t cX(t Die retardierten elektromagnetischen Felder (X.74) bestehen aus einem Beitrag proportional ~ ret. |2 und einem Term proportional zu 1/|X ~ ret. |. In einem Bezugssystem, das sich mit der zu 1/|X ~ret. = ~0, lauten sie Punktladung zur retardierten Zeit mitbewegt, d.h. wo β " # ~ e × ~ e × ~ a q ~ e ret. ret. ret. ret. ~ = ~ = 1 ~eret. × E. ~ E , B 2 + ~ ret. ~ ret. 4π0 X c c2 X ~ ret. |2 einer ruhenden Punktladung Das elektrische Feld ist die Summe aus dem Coulomb-Feld in 1/|X ~ Coul. = E q ~eret. , ~ ret. 2 4π0 X ~ Coul. = ~0, B 188 Zeitabhängige elektromagnetische Felder und, wenn die retardierte Beschleunigung ~aret. der Punktladung nicht Null ist, aus dem Strahlungsfeld ~ ret. | in 1/|X q ~ Strahl. = ~ Strahl. = 1 ~eret. × E ~ Strahl. . E B ~eret. × ~eret. × ~aret. , ~ ret. c 4π0 c2 X Diese Strahlungsfelder sind senkrecht zu ~eret. . ~ ret. |2 in Gl. (X.74) dem Coulomb-Feld, und der Ähnlicherweise entspricht der Beitrag in 1/|X ~ Term in 1/|Xret. |, dem Strahlungsfeld. Bemerkung: Wenn die Punktladung beschleunigt wird, muss sie einer Kraft unterliegen, d.h. sie muss in einem elektromagnetischen Feld sein: dieses „äußere“ Feld wird hier nicht präzisiert. Dagegen lässt sich die Kraft F~ (t), die für die Beschleunigung zur Zeit t verantwortlich ist, dank dem Grundgesetz der Mechanik (VI.14) einfach durch die kinetischen Größen der Punktladung ausdrücken: d ~ · ~a(t) β(t) ~ F~ (t) = mγ(t) ~v (t) = γ(t) m ~a(t) + γ 2 (t) β(t) (X.77) dt mit m der Masse der Punktladung. Beispiel: Punktladung in gleichförmiger geradliniger Bewegung Wenn ~aret. = ~0 zu jeder retardierten Zeit vereinfacht sich das elektrische Feld (X.74) zu ~ ret. − X ~ ret. ~ ~ X β q ~ e − β q ret. ~ r) = E(t,~ (X.78) 2 = 3 , ~ ret. ~ ret. − X ~ ret. · β~ 3 4π0 γ 2 X 4π0 1 − ~eret. · β~ γ 2 X ~ mit konstanter Geschwindigkeit β. ~ Aus |Xret. | = |~r − ~x(tret. )| = c(t − tret. ) folgt für die gleichförmige Bewegung der Punktladung ~ − tret. ) = ~x(tret. ) + |X ~ ~ ret. |β, ~x(t) = ~x(tret. ) + cβ(t ~ ret. − |X ~ ret. |β~ = ~r − ~x(t): das elektrische Feld zur d.h. für den Vektor im Zähler der Gl. (X.78) X Zeit t ist in der momentanen Richtung von der Ladung nach ~r, nicht in der „retardierten“ Richtung gerichtet. X.5.4 c Abgestrahlte Leistung :::::::::::::::::::::::::::::: Sei d2 S ein Flächenelement in einem Punkt ~r im Abstand X einer Punktladung, von der aus 2 d S unter einem Raumwinkelelement d2 Ω gesehen wird. Der Einheitsvektor in Richtung von der Punktladung nach ~r wird mit ~eret. bezeichnet. Ein Beobachter B in ~r misst die elektromagnetischen Felder (X.74): die Energie, die pro Einheit der Eigenzeit t von B durch d2 S strömt, ist die von B empfangene Leistung ~e.m. · ~eret. X 2 d2 Ω, d2P = S ~e.m. = E ~ × B/µ ~ 0 dem Poynting-Vektor in ~r [Gl. (X.23b)]. Für große Abstände X → ∞ mit S trägt der Coulomb-Anteil der retardierten Felder nicht bei, und man darf das Strahlungsfeld alleine betrachten. Dann gilt h i d2P 1 2 ~ ~ = X E × ~ e × E eret. . ret. Strahl. Strahl. · ~ d2 Ω µ0 c ~2 ~ Strahl. )E ~ Strahl. , wobei der zweite Term wegen Das doppelte Kreuzprodukt lautet E eret.− (~eret.· E Strahl.~ ~ Strahl. und ~eret. Null ist. Damit ergibt sich unter Berücksichtigung des der Orthogonalität von E Ausdrucks des Strahlungsfeldes in Gl. (X.74a) 2 d2P µ0 q 2 ~ret. × ~aret. , = ~ e × ~ e − β ret. ret. 6 d2 Ω (4π)2 c 1 − ~eret. · β~ret. 189 X.5 Klassische Theorie der Strahlung wobei ein Faktor 1/(µ0 20 c5 ) in µ0 /c transformiert wurde. Wegen Energieerhaltung ist die elektromagnetische Energie, welche die Punktladung in Richtung von d2 S abstrahlt, gleich der Energie, die (später) im Beobachtungspunkt ~r durch d2 S strömt. Die Leistung, die durch die Punktladung abgestrahlt wird, ist genau diese Energie, bezogen auf die Einheit der Eigenzeit der Punktladung. Diese Eigenzeit ist gerade die retardierte Zeit tret. , so dass die pro Raumwinkelelement abgestrahlte Leistung durch 2 d2P0 µ0 q 2 d2P ∂t ~ = ~ e × ~ e − β × ~ a = ret. ret. ret. ret. ~ret. 5 d2 Ω d2 Ω ∂tret. (4π)2 c 1 − ~eret. · β (X.79) gegeben wird, wobei ∂t/∂tret. = 1 − ~eret. · β~ret. benutzt wurde. Um die letztere partielle Ableitung zu erhalten, kann man Gl. (X.72) differenzieren, was zu ~ ret. · dX ~ ret. 1X 1 = dtret. − dt + ~eret. · (d~r − ~vret. dtret. ) = 0 ~ ret. X c c führt, d.h. 1 − ~eret. · β~ret. dtret. = dt − eret. ~ · d~r/c. Dann gelten dtret. − dt + 1 ∂tret. = , ∂t 1 − ~eret. · β~ret. ~ ret. = − ∇t ~eret. c 1 − ~eret. · β~ret. . Bemerkungen: ∗ Eine nicht-beschleunigte Punktladung strahlt keine Energie ab! ∗ Aus Sicht der Punktladung entspricht die als elektromagnetisches Feld abgestrahlte Energie bzw. Leistung einem Strahlungsverlust. Dieser Verlust liegt einem wichtigen Problem der klassischen Physik zugrunde, und zwar der Frage der Stabilität von Atomen: die an den Atomkern gebundenen Elektronen unterliegen einer anziehenden Kraft, und werden daher beschleunigt. Wenn sie teil ihrer Energie als Strahlung verlieren, sollte ihre kinetische Energie allmählich kleiner werden, d.h. sie sollten irgendwann auf den Atomkern fallen. Dies ist aber nicht der Fall, was im Rahmen der klassischen Physik nicht erklärbar ist, und stellt damit eine wichtige Begründung für die Quantenmechanik — oder zumindest für etwas jenseits der klassischen Physik — dar. Nicht-relativistischer Grenzfall ~ret. | |~eret. | = 1 vereinfacht sich Gl. (X.79) zu Im Fall |β 2 d2P0 µ0 q 2 . = ~ e × ~ e × ~ a ret. ret. ret. d2 Ω (4π)2 c Sei θ der Winkel zwischen der retardierten Beschleunigung ~aret. und der Beobachtungsrichtung ~eret. ; dann gilt µ0 q 2 q 2 |~aret. |2 sin2 θ d2P0 2 2 = |~ a | sin θ = . ret. d2 Ω (4π)2 c 4π0 c3 4π Die Strahlungsleistung ist maximal für θ = π2 , d.h. senkrecht zur Richtung der Beschleunigung. Die gesamte abgestrahlte Leistung ergibt sich durch Integration dieser Formel über den Raumwinkel: mit d2 Ω = sin θ dθ dϕ erhält man die Larmor (aq) -Formel P0 = (aq) J. Larmor, 1857–1942 Z d2P0 2 2 q 2 |~aret. |2 d Ω = . d2 Ω 3 4π0 c3 (X.80) 190 Zeitabhängige elektromagnetische Felder Allgemeiner Fall Die Larmor-Formel (X.80) gilt in einem mitbewegten Inertialsystem B0 , relativ zu welchem die retardierte Geschwindigkeit der Punktladung momentan verschwindet. In einem Bezugssystem B~v , wo die retardierte Geschwindigkeit der Punktladung den Wert ~v annimmt, gilt P0 = 2 q2 aµ aret.µ , 3 4π0 c3 ret. (X.81) mit aµ ≡ duµ /dτ ≡ d2 xµ /dτ 2 den kontravarianten Komponenten der Viererbeschleunigung (VI.15) der Punktladung, die hier zur retardierten Zeit betrachtet werden soll. Diese Formel lässt sich noch umschreiben als h 2 i 2 q2 6 ~ret. × ~aret. 2 . P0 = γ ~ a − β (X.82) ret. ret. 3 4π0 c3 Beweis der relativistischen Formeln (X.81)–(X.82): Der erste Schritt besteht in der Beobachtung, dass die abgestrahlte Leistung Lorentz-invariant ist. Es seien dE0 bzw. dE das Differential der Energie im Bezugssystem B0 bzw. B~v , und dt0 bzw. dtpdie entsprechenden Differentiale der Zeit. Dann gelten dE = γ dE0 und dt = γ dt0 , mit γ = 1/ 1 − ~v 2 /c2 dem Lorentz-Faktor. Daraus folgt dE dE0 = = P0 . dt dt0 Berechnet man dann das Lorentz-Skalar aµ aµ der Viererbeschleunigung, so kommt erstens duµ duµ ~ · ~a)β~ =γ = γ 4 β~ · ~a, γ 2~a + γ 4 (β dτ dt mit ~a = d~v /dt der Beschleunigung der Punktladung, und daher 2 aµ aµ = γ 4 ~a 2 + γ 2 β~ · ~a . aµ = (X.83) Im Bezugssystem B0 , wo β~ = ~0 bzw. γ = 1, stimmen die Formeln (X.80) und (X.81) miteinander überein. Da der Ausdruck auf der rechten Seite von Gl. (X.81) ein Lorentz-Skalar ist, erhält er den gleichen Wert in allen Inertialsystemen, d.h. die Formel gilt in allen solchen Bezugssystemen. Sei ϑ der Winkel zwischen β~ und ~a. Aus 2 2 2 1 ~a 2 − β~ × ~a = ~a 2 − β~ 2~a 2 (1 − cos2 ϑ) = 1 − β~ 2 ~a 2 + β~ · ~a = 2 ~a 2 + β~ · ~a γ und dem Viererquadrat (X.83) folgt dann die Identität der rechten Gliedern der Gl. (X.81) und (X.82). 2 Beschleunigung parallel zur Geschwindigkeit Wenn Beschleunigung und Geschwindigkeit parallel zueinander sind, gelten ~aret. × β~ret. = ~0 und ~eret. · β~ret. = |β~ret. | cos θ. Dann lautet Gl. (X.79) d2P0 µ0 q 2 |~aret. |2 sin2 θ = 5 . d2 Ω (4π)2 c 1 − |β~ret. | cos θ (X.84) Für |β~ret. | → 1 wird also d2P0 /d2 Ω groß in der Vorwärtsrichtung cos θ = 1. Genauer kann man prüfen, dass das Maximum von d2P0 /d2 Ω im Fall 1−|β~ret. | 1 für θ ' 1/2γ erreicht wird. Die Integration der Leistung (X.84) über den ganzen Raumwinkel führt zu P0 = 2 µ0 q 2 |~aret. |2 6 2 q 2 |~aret. |2 6 γ = γ , 3 4πc 3 4π0 c3 (X.85) 191 X.5 Klassische Theorie der Strahlung mit γ dem Lorentz-Faktor assoziiert mit der Geschwindigkeit der Punktladung. Dieses Resultat folgt auch direkt aus der relativistischen Formel (X.82). Die Leistung (X.85) wird also unendlich groß, wenn die Geschwindigkeit der Punktladung gegen c strebt. Dieses Resultat zeigt, dass es nicht möglich ist, eine Punktladung bis zur Lichtgeschwindigkeit zu beschleunigen: dies würde eine unendliche Energie erfordern, um die abgestrahlte Leistung zu kompensieren. Wenn Beschleunigung und Geschwindigkeit parallel zueinander sind, nimmt die Kraft (X.77), die für die Beschleunigung der Punktladung verantwortlich ist, die Form F~ (t) = γ(t)3 m~a(t) an. Somit lässt sich die Leistung (X.85) als P0 = 2 2 2 µ0 q 2 ~ q2 F~ (tret. )2 = F (t ) ret. 2 2 3 3 4πm c 3 4π0 m c schreiben. Beschleunigung senkrecht zur Richtung der Geschwindigkeit Wenn Beschleunigung und Geschwindigkeit orthogonal sind, entsprechend einer Kreisbewegung, lautet die abgestrahlte Leistung (X.82) P0 = 2 2 q2 6 ~ 2 |~aret. |2 = 2 q γ 1 − β γ 4 |~aret. |2 . ret. 3 4π0 c3 ret. 3 4π0 c3 ret. (X.86) Dazu lautet die Kraft (X.77) auf die Punktladung F~ (t) = γ(t)m~a(t), so dass diese Leistung dadurch noch als 2 q2 2 2 ~ . γ F (t ) P0 = ret. ret. 3 4π0 m2 c3 ausgedrückt werden kann. Die abgestrahlte Leistung ist also größer um einen Faktor γ 2 relativ zum Fall einer Linearbewegung mit der gleichen Kraft. Somit wird mehr Energie als sog. Synchrotronstrahlung in einem kreisförmigen Teilchenbeschleuniger (einem „Speicherring“, wie z.B. das LHC am CERN) verloren,(52) als in einem Linearbeschleuniger. Bemerkung: Wenn ein geladenes Teilchen auf Materie stößt und dort von Wechselwirkungen mit den Atomen abgebremst wird, strahlt es ab. Die entsprechende Strahlung wird Bremsstrahlung (auch auf Englisch!) genannt. Literatur zum Kapitel X • Feynman, Vorlesungen über Physik. Band 2 [20] = Lectures on Physics. Vol. II [21] Kap. 18, 20–21, 27 & 29; Vorlesungen über Physik. Band 1 [22] = Lectures on Physics. Vol. I [23] Kap. 34. • Fließbach, Elektrodynamik [3] Teil IV Kap. 16–17 & Teil V Kap. 20, 23–24. • Greiner, Klassische Elektrodynamik [8] Teil IV Kap. 12–13, 15, 20–21. • Griffiths, Elektrodynamik [9] = Introduction to Electrodynamics [10] Kap. 7–11. • Jackson, Klassische Elektrodynamik [11] = Classical Electrodynamics [12] Kap. 6.1–6.5, 6.7, 7.1–7.2, 9.1–9.2 & 14.1–14.4. (52) Oder genauer, abgestrahlt: die emittierte Strahlung kann benutzt werden, um Materie zu untersuchen. 192 Zeitabhängige elektromagnetische Felder • Landau & Lifschitz, Klassische Feldtheorie [14] = The classical theory of fields [26] Kap. 4 § 26, 29–31, 33, Kap. 6 § 46–48, Kap. 8 § 62–64 & Kap. 9 § 66–67 & 73–76. • Nolting, Elektrodynamik [17] Kap. 4.1, 4.3 & 4.5. • Scheck, Klassiche Feldtheorie [19] Kap. 1.3–1.6, 2.3, 3.5–3.6 & 4.1–4.2. K APITEL XI Relativistisch kovariante Formulierung der Elektrodynamik Die spezielle Relativitätstheorie wurde entwickelt, um die Invarianz der Geschwindigkeit im Vakuum von Licht, d.h. allgemeiner von elektromagnetischen Wellen, in Transformationen zwischen Inertialsystemen zu berücksichtigen. Dementsprechend ist Elektrodynamik automatisch eine „relativistische“ Theorie, was aber an den Maxwell-Gleichungen nicht sofort erkennbar ist. In diesem Kapitel werden die Gesetze und einige Resultate der Elektrodynamik in relativistisch kovarianter Notation formuliert. Somit werden erstens Lorentz-Vierervektoren und -tensoren eingeführt, welche die unterschiedlichen elektromagnetischen Größen beschreiben (Abschn. XI.1). Diese werden dann in Abschn. XI.2 benutzt, um die Grundgleichungen der Elektrodynamik auszudrücken. Schließlich werden weitere Ergebnisse des Kapitels X in relativistisch kovarianter Schreibweise angegeben (Abschn. XI.3). Hiernach bezeichnet x einen Punkt der Raumzeit mit kontravarianten Koordinaten xµ , und der metrische Tensor η hat die Signatur −, +, +, + (vgl. § V.3.3 a). Die Einsteinsche Summenkonvention über doppelt auftretende Lorentz-Indizes wird durchaus benutzt. XI.1 Lorentz-kovariante elektromagnetische Größen Zur Formulierung der Elektrodynamik in relativistisch kovarianter Notation sollen zuerst passende Lorentz-kovariante Größen — Viererskalare, -vektoren oder -tensoren — definiert werden, welche das elektromagnetische Feld (§ XI.1.1) mit den zugehörigen Potentialen (§ XI.1.2), dessen Quellen (§ XI.1.3), sowie dessen Energie und Impuls (§ XI.1.4) beschreiben. XI.1.1 Elektromagnetischer Feldstärketensor In relativistisch kovarianter Schreibweise gewinnt die Bezeichnung „elektromagnetisches Feld“ ihre volle Bedeutung, indem die elektrische und magnetische Dreiervektorfelder miteinander in ein einzelnes mathematisches Objekt kombiniert werden. XI.1.1 a Definition :::::::::::::::::: Um eine relativistisch kovariante Größe zu erhalten, werden das elektrische und das magnetische ~ und B ~ zum elektromagnetischen Feldstärketensor zweiter Stufe F kombiniert. Letzterer kann Feld E durch die Angabe seiner kontravarianten Komponenten F 00 (x) = F ii (x) = 0, E i (x) , c 3 X F ij (x) = −F ji (x) ≡ ijk B k (x) F 0i (x) = −F i0 (x) ≡ (XI.1a) k=1 bezüglich eines gegebenen Inertialsystems B definiert werden. Dabei sind i, j ∈ {1, 2, 3}, während 194 Relativistisch kovariante Formulierung der Elektrodynamik ijk das dreidimensionale völlig antisymmetrische Levi-Civita-Symbol bezeichnet. Die Komponenten ~ und B ~ sind solche, die ein bezüglich B ruhender Beobachter messen würde. E i , B j der Felder E Die Matrixdarstellung des elektromagnetischen Feldstärketensors F lautet E 3 (x) c 3 2 0 B (x) −B (x) , 3 1 −B (x) 0 B (x) B 2 (x) −B 1 (x) 0 E 2 (x) c E 1 (x) c 0 E 1 (x) − c µν F (x) = E 2 (x) − c E 3 (x) − c (XI.1b) wobei der erste bzw. zweite Index des Tensors dem Zeilen- bzw. Spaltenindex der Matrix entspricht. F µν (x) ist offensichtlich antisymmetrisch unter dem Austausch der zwei Indizes F µν (x) = −F νµ (x) ∀µ, ν ∈ {0, 1, 2, 3}. (XI.2) 0 0 Unter Lorentz-Transformationen xµ → xµ = Λµµ xµ zwischen Inertialsystemen bzw. MinkowskiKoordinaten transformiert sich der Feldstärketensor wie jeder Tensor zweiter Stufe, d.h. gemäß 0 0 0 0 F µν → F µ ν = Λµµ Λν ν F µν . ~ und B ~ folgern. Daraus kann man die entsprechenden Transformationen für die Felder E Für einen drehungsfreien Boost (§ V.2.2 b) mit Geschwindigkeit ~v = v~e findet man ~ × ~e − ~v × B ~ ~e × E 0 ~ ~ p E = ~e · E ~e + 1 − ~v 2/c2 ~ × ~e + ~v × E/c ~ 2 ~e × B 0 ~ ~ p B = ~e · B ~e + 1 − ~v 2/c2 mit ~e dem Einheitsvektor in Richtung des Boosts. Sei u = {uµ }µ=0...3 die Vierergeschwindigkeit eines Beobachters B 0 relativ zum Inertialsystem B. Man kann Vierervektoren Eu (x) und Bu (x) durch die Angabe ihrer jeweiligen kontravarianten Komponenten Euµ (x) ≡ F µν(x)uν Buµ (x) ≡ 1 µνρσ uν Fρσ(x) 2c (XI.3a) (XI.3b) bezüglich B definieren, wobei µνρσ den vierdimensionalen Levi-Civita-Tensor (V.46) bezeichnet. Falls B 0 in B ruht — d.h. u0 = −u0 = 1 und ui = 0 für i = 1, 2, 3 —, dann sind die räumlichen Komponenten der entsprechenden Vierervektoren E0 (x) bzw. B0 (x) gleich den Komponenten in B ~ ~ der Dreiervektoren E(x) bzw. B(x), während die 0-Komponenten von E0 (x) und B0 (x) Null sind. Allgemeiner stellt Eu (x) bzw. Bu (x) das elektrische bzw. magnetische Feld relativ zum Ruhesystem des Beobachters B 0 dar, wie es vom Bezugssystem B aus gesehen aussieht. XI.1.1 b Dualer Feldstärketensor ::::::::::::::::::::::::::::::::: Mithilfe des vierdimensionalen Levi-Civita-Tensors definiert man noch den dualen elektromagnetischen Feldstärketensor F̃ F̃, dessen kontravariante Komponenten durch 1 F̃ µν (x) ≡ µνρσ Fρσ (x) 2 (XI.4a) 195 XI.1 Lorentz-kovariante elektromagnetische Größen definiert sind. In Matrixdarstellung ergibt sich(53) 0 B 1 (x) −B 1 (x) 0 µν F̃ (x) = E 3 (x) −B 2 (x) c E 2 (x) 3 −B (x) − c B 2 (x) − E 3 (x) c 0 E 1 (x) c B 3 (x) E 2 (x) c E 1 (x) . − c (XI.4b) 0 Relativ zu den Komponenten F µν von F folgen die F̃ µν aus den Substitutionen E i /c → B i und B i → −E i /c. Der duale Feldstärketensor ist deutlich antisymmetrisch. Bemerkungen: ∗ Die Komponenten des in Gl. (XI.3) eingeführten Vierervektors Bu (x) lassen sich einfacher als 1 Buµ (x) ≡ F̃ µν(x)uν c schreiben. Wiederum gilt Euµ (x) ≡ − 21 µνρσ uν F̃ρσ(x). F. ∗ Der „biduale“ Feldstärketensor mit Komponenten F̃˜ µν = 21 µνρσ F̃ρσ ist einfach −F XI.1.1 c Invarianten des elektromagnetischen Feldes ::::::::::::::::::::::::::::::::::::::::::::::::::::: Aus dem Feldstärketensor (XI.1) und seinem Dual (XI.4) lassen sich durch Kontraktionen zwei unabhängige Größen finden, die sich unter Transformationen zwischen Inertialsystemen nicht ändern, d.h. zwei Lorentz-Skalaren, und zwar ~ 2 E(x) µν 2 ~ Fµν (x)F (x) = 2 B(x) − (XI.5a) c2 und ~ ~ E(x) · B(x) . (XI.5b) c Die dritte natürliche Möglichkeit F̃µν (x)F̃ µν (x) ist nicht unabhängig von den zwei ersten, sondern gleich −Fµν (x)F µν (x). F̃µν (x)F µν (x) = −4 XI.1.2 Viererpotential ~ bilden einen Vierervektor, das Viererpotential , Das Skalarpotential Φ und das Vektorpotential A mit den kontravarianten Komponenten Φ(x) A(x) = c . (XI.6) ~ A(x) Der elektromagnetische Feldstärketensor (XI.1) lässt sich dadurch ausdrücken gemäß F µν(x) = ∂ µAν (x) − ∂ νAµ (x), (XI.7) wobei ∂ µ ≡ ∂ /∂xµ , d.h. ∂ 0 = −(1/c)∂ /∂t während ∂ i die i-te Komponente des Gradienten ist. (53) Dabei muss die Leserin darauf aufpassen, dass numerisch F0i = −Fi0 = −F 0i = −E i /c und Fij = F ij gelten, wie sich aus Fρσ = ηρµ ησν F µν berechnen lässt. 196 Relativistisch kovariante Formulierung der Elektrodynamik Dementsprechend stellen die Beziehungen Ei 1 ∂Ai ∂ = F 0i = ∂ 0 Ai − ∂ i A0 = − − i c c ∂t x Bi = Φ c 3 3 3 1 X ijk jk X ijk j k X ijk ∂Ak F = ∂A = 2 ∂xj j,k=1 j,k=1 j,k=1 jeweils die i-te Komponente der Gleichung (X.13) und (X.12) dar. Eichinvarianz In relativistisch kovarianter Schreibweise lautet die Eichtransformation (X.14) :::::::::::::: µ Aµ (x) → A0 (x) = Aµ (x) + ∂ µ χ(x), (XI.8) mit χ(x) einer zweimal kontinuierlich differenzierbaren skalaren Funktion. Für solche Funktionen gilt ∂ µ ∂ ν χ(x) = ∂ ν ∂ µ χ(x), so dass die Viererpotentiale A und A0 über Beziehung (XI.7) zum gleichen Feldstärketensor F führen, wie zu erwarten war. Unter Berücksichtigung der Beziehung 0 µ0 = 1/c2 [Gl. (X.29c)] wird die Bedingung (X.16), welche die Lorenz-Eichung definiert, zu ∂µ Aµ (x) = 0. (XI.9) Dabei ist deutlich, dass diese Eichbedingung Lorentz-invariant ist, d.h. sie bleibt in allen Inertialsystemen erfüllt. Dagegen gilt diese Eigenschaft nicht für die Coulomb-Eichbedingung, für die es keine Lorentz-kovariante Formulierung gibt. XI.1.3 Elektrischer Viererstrom Die elektrischen Ladungs- und Stromdichte bilden einen Vierervektor Jel.(x), der als elektrischer Viererstrom bzw. Viererstromdichte — was genauer ist — bezeichnet wird: Jel.(x) = ρel.(x)c . ~el.(x) (XI.10a) Komponentenweise entspricht dies 0 (x) = ρel.(x)c, Jel. i i (x) = jel. (x) für i = 1, 2, 3. Jel. (XI.10b) Dabei bezeichnen ρel. und ~el. die bekannten „nicht-relativistischen“ Größen in einem festen Bezugssystem, das sich möglicherweise relativ zu den Ladungen bewegt. Für eine Punktladung q mit Weltlinie bzw. Vierergeschwindigkeit t, ~x(t) bzw. u(τ ) = dx(τ )/dτ , mit τ der Eigenzeit der Punktladung, gilt Jel.(x) = qδ (3) ~r − ~x(t) u(x) = %0 (x) u(x), (XI.11a) wobei %0 (x) die Ladungsdichte im Ruhesystem der Punktladung bezeichnet. Unter Berücksichtigung des Ausdrucks (V.27) der Vierergeschwindigkeit lautet dies noch %0 (x)γc Jel.(x) = (XI.11b) %0 (x)γ~v p mit γ = 1/ 1 − ~v 2/c2 dem Lorentz-Faktor. XI.2 Relativistisch kovariante Formulierung der Grundgesetze 197 XI.1.4 Energieimpulstensor ~e.m. [Gl. (X.23b)], die Impulsdichte Die Energiedichte ee.m. [Gl. (X.23a)], der Poynting-Vektor S σe.m. [Gl. (X.26b)–(X.26c)] des elektro~ge.m. [Gl. (X.26a)] und die Impulsstromdichte T e.m. = −σ magnetischen Feldes lassen sich in einen Vierertensor zweiter Stufe T e.m. , den Energieimpulstensor des Feldes, kombinieren. In Matrixdarstellung lautet dieser ee.m.(x) c~ge.m.(x) µν . Te.m.(x) = (XI.12a) ~e.m.(x) S T e.m.(x) c Der Energieimpulstensor lässt sich auch durch den Feldstärketensor (XI.1) ausdrücken, und zwar komponentenweise 1 1 µν µν µ ρν ρσ Te.m.(x) = −F ρ (x)F (x) − η Fρσ (x)F (x) , (XI.12b) µ0 4 mit η µν den Komponenten des inversen metrischen Tensors. In dieser Form prüft man einfach, dass der Energieimpulstensor symmetrisch ist. XI.2 Relativistisch kovariante Formulierung der Grundgesetze Mit den in Abschn. XI.1 eingeführten Größen lassen sich die Maxwell-Gleichungen (§ XI.2.1), die Kontinuitätsgleichung (§ XI.2.2), die Lorentz-Kraftdichte (§ XI.2.3) und die Energie- und Impulsbilanz (§ XI.2.4) in relativistisch kovarianter Form schreiben. XI.2.1 Maxwell-Gleichungen Mit dem elektromagnetischen Feldstärketensor (XI.1) und dem elektrischen Viererstrom (XI.10) lauten die Maxwell-Gleichungen µ (x) ∀µ ∈ {0, 1, 2, 3}, ∂ν F µν(x) = µ0 Jel. (XI.13a) ∂ µF νρ(x) + ∂ νF ρµ(x) + ∂ ρF µν(x) = 0 ∀µ, ν, ρ ∈ {0, 1, 2, 3}. (XI.13b) Dabei stellen die Gl. (XI.13a) mit einem Quellterm die inhomogenen Maxwell–Gauß- und Maxwell– Ampère-Gleichungen (X.1a) und (X.1d) dar. Wiederum stehen die Gl. (XI.13b) — wobei nur die vier Fälle (µ, ν, ρ) = (0, 1, 2), (0, 1, 3), (0, 2, 3) und (1, 2, 3) unterschiedlich sind — für die homogenen Maxwell-Gleichungen (X.1b) und (X.1c). Unter Verwendung des dualen elektromagnetischen Feldstärketensors (XI.4) lassen sich die homogenen Maxwell-Gleichungen noch als ∂µ F̃ µν(x) = 0 ∀ν ∈ {0, 1, 2, 3} (XI.13c) umschreiben. In dieser Form ist sofort klar, dass es nur vier Gleichungen gibt. XI.2.2 Kontinuitätsgleichung Ausgedrückt durch den elektrischen Viererstrom (XI.10) lautet die Kontinuitätsgleichung (X.7) µ ∂µ Jel. (x) = 0. (XI.14) 198 Relativistisch kovariante Formulierung der Elektrodynamik Genau wie in § X.1.1 b lässt sich diese Bilanzgleichung aus den homogenen Maxwell-Gleichungen herleiten: somit lautet die Viererdivergenz der Gl. (XI.13a) µ ∂µ ∂ν F µν(x) = µ0 ∂µ Jel. (x). Dabei sind auf der linke Seite ∂µ ∂ν symmetrisch und F µν antisymmetrisch unter dem Austausch von µ und ν, so dass die zweifache Kontraktion ∂µ ∂ν F µν automatisch Null ist, entsprechend Gl. (XI.14). XI.2.3 Lorentz-Kraft und -Kraftdichte Das elektromagnetische Feld übt auf eine elektrische Ladungs- und Stromverteilung eine LorentzKraftdichte f~L [Gl. (VII.2)] aus. Mit dieser kann man eine Viererkraftdichte fL assoziieren, die sich durch den elektromagnetischen Feldstärketensor (XI.1) und den elektrischen Viererstrom (XI.10) ausdrücken lässt. Komponentenweise gilt fLν (x) = Jel.,µ (x)F µν(x). (XI.15a) Mit den Ausdrücken des Feldstärketensors und des Viererstroms prüft man nämlich schnell, dass die räumlichen Komponenten fLi (x) = ρel.(x)E i (x) + 3 X k ikl jel. (x)B l (x) für i = 1, 2, 3 (XI.15b) k,l=1 betragen. Wiederum lautet die zeitliche Komponente 1 ~ fL0 (x) = ~el.(x) · E(x). c (XI.15c) Im Fall einer Punktladung q mit Vierergeschwindigkeit u = (γc, γ~v ), entsprechend dem elektrischen Viererstrom (XI.11a), kann die Lorentz-Kraftdichte sofort über die Ortskoordinaten integriert werden. Daraus ergibt sich die Lorentz-Viererkraft FLν = quµ F µν(x). (XI.16) Mit dieser Viererkraft lautet die relativistisch kovariante Verallgemeinerung (VI.14) des zweiten Newton’schen Gesetzes dpν = quµ F µν(x) (XI.17) dτ mit τ = t/γ der Eigenzeit der Punktladung und p = mu ihrer (kinetischen) Viererimpuls. Dabei ~ ~ · ~v : auf der linken Seite lautet die zeitliche Komponente dp0 /dτ = qγ~v · E/c, d.h. d(p0 c)/dt = q E 0 steht die Rate der zeitlichen Änderung von der Energie p c der Punktladung; auf der rechten, die instantane Leistung der Lorentz-Kraft. Bemerkung: Die Lorentz-Viererkraft (XI.16) ist „orthogonal“ zur Vierergeschwindigkeit, uν FLν = 0. Dies folgt aus der Antisymmetrie des elektromagnetischen Feldstärketensors und der Symmetrie des Produkts uν uµ . XI.2.4 Energie- und Impulsbilanzgleichungen Schließlich lassen sich die lokalen Bilanzgleichungen (X.23) und (X.26d) für die Energie und den Impuls des elektromagnetischen Feldes unter Verwendung des Energieimpulstensors (XI.12) und der Lorentz-Viererkraftdichte (XI.15a) in kompakter Form ausdrücken: µν ∂µ Te.m. (x) = −fLν (x). (XI.18) XI.3 Weitere Resultate in relativistisch kovarianter Form 199 XI.3 Weitere Resultate in relativistisch kovarianter Form XI.3.1 Bewegungsgleichung für das Viererpotential Setzt man den Ausdruck (XI.7) des Feldstärketensors durch das Viererpotential in die inhomogenen Maxwell-Gleichungen (XI.13a) ein, so findet man µ ∂ν ∂ µAν(x) − ∂ν ∂ νAµ (x) = µ0 Jel. (x). Dabei ist ∂ν ∂ ν gerade der d’Alembert-Operator [Gl. (X.10)], so dass diese Gleichung in der Form µ Aµ (x) = −µ0 Jel. (x) + ∂ µ ∂ν Aν (x) ∀µ ∈ {0, 1, 2, 3} (XI.19) umgeschrieben werden kann. Dies stellt die Bewegungsgleichung für das Viererpotential A(x) dar. Die Komponente ν = 0 und ist äquivalent zur Bewegungsgleichungen (X.20) des Skalarpotentials, die räumlichen Komponenten entsprechend der Gl. (X.18) für das Vektorpotential. Bemerkung: Aus der Beziehung (XI.7) folgt 1 F̃ µν(x) = µνρσ Fρσ (x) = µνρσ ∂ρ Aσ (x), 2 woraus die homogene Gleichung ∂µ F̃ µν(x) = µνρσ ∂µ ∂ρ Aσ (x) = 0 sofort folgt, da µνρσ antisymmetrisch und ∂µ ∂ρ symmetrisch unter dem Austausch von µ und ρ ist. XI.3.2 Klassische Wellengleichung und ebene Wellen In Abwesenheit von äußeren Quellen des Feldes und in der Lorenz-Eichung ∂ν Aν (x) = 0 wird die Bewegungsgleichung (XI.19) zur klassischen Wellengleichung (vgl. § X.4.1) Aµ (x) = 0 ∀µ ∈ {0, 1, 2, 3} (XI.20a) oder äquivalent, in geometrischer Form A(x) = 0. (XI.20b) Eine ebene Welle ist eine Lösung dieser partiellen Differentialgleichung der Form [vgl. § X.4.1 a] Aµ (x) = εµ f ~k · ~r − ω~k t (XI.21a) wobei ω~k = c ~k [Gl. (X.42c)]. Dabei ist ~k ein Vektor, der die Propagationsrichtung angibt, und εµ die Komponente eines Polarisationsvierervektors ε. Definiert man einen (lichtartigen) Vierervektor k = (k 0 ≡ ω~k /c, ~k), so lässt sich diese Lösung als Aµ (x) = εµ f (k · x) (XI.21b) A(x) = εf (k · x). (XI.21c) schreiben, oder auch geometrisch Wegen der Lorenz-Eichbedingung (XI.9) sollen ε und k i Allgemeinen orthogonal zueinander sein, k · ε = 0. In einem Bezugssystem, wo A0 verschwindet,(54) gilt automatisch ε0 = 0 — woraus man erkennt, dass der Polarisationsvierervektor raumartig ist, ε2 = εµ εµ > 0. In diesem Bezugssystem gilt somit k · ε = ~k · ~ε = 0, und man findet die Transversalität des Polarisationsvektors wieder. (54) (ar) Diese Bedingung definiert die temporale Weyl (ar) -Eichung, die hier, kombiniert mit der Lorenz-Eichung ∂µ Aµ = 0, ~ ·A ~ = 0 ist. äquivalent zur Coulomb-Eichung ∇ H. Weyl, 1885–1955 200 Relativistisch kovariante Formulierung der Elektrodynamik XI.3.3 Retardiertes Viererpotential In der Lorenz-Eichung (XI.9) verschwindet der letzte Term der Bewegungsgleichung (XI.19) für das Viererpotential, die sich somit zu µ Aµ (x) = −µ0 Jel. (x) ∀ν (XI.22) vereinfacht. Wie im § X.5.2 führt die Lösung dieser inhomogenen partiellen Differentialgleichung mithilfe der retardierten Green’schen Funktion (X.57a) für die klassische Wellengleichung zum retardierten Viererpotential Z 1 µ0 |~r − ~r 0 | 0 3 0 d ~r , (XI.23) Aret. (x) = J t − ,~ r el. 4π |~r − ~r 0 | c entsprechend den Gl. (X.63). Im Fall des elektrischen Viererstroms einer bewegten Punktladung mit Weltlinie xq (t) = t, ~x(t) ergibt sich das Liénard–Wiechert-Viererpotential µ0 dxq (tret. ) q A(x) = , (XI.24a) ~vret. 4π dt |~r − ~x(tret. )| − [~r − ~x(tret. )] · c mit tret. der retardierten Zeit und ~vret. der entsprechenden Dreiergeschwindigkeit der Punktladung, vgl. § X.5.4 a. Man kann eine relativistisch kovariante Form dieses Viererpotentials finden. Sei uret. die Vierer geschwindigkeit im retardierten Punkt xret. ≡ xq (tret. ) und X ≡ x − xret. = c(t − tret. ), ~r − ~x(tret. ) . Dann gilt der deutlich kovariante Ausdruck µ0 c q uret. A(x) = . (XI.24b) 4π X · uret. Beweis: Im Inertialsystem B0 , das sich zur retardierten Zeit mit der Geschwindigkeit ~vret. bewegt, d.h. in welchem ~vret. = ~0, vereinfacht sich der Nenner des Viererpotentials (XI.24a) zu X · uret. |~r − ~x(tret. )| = c(t − tret. ) = , c wobei die erste Gleichung der Definition der retardierten Zeit entspricht. Die Zeit t in B0 ist die Eigenzeit τ der Punktladung, so dass dxq (tret. )/dt genau dxq (tret. )/dτ = uret. entspricht. Somit stimmt Gl. (XI.24a) in B0 mit Gl. (XI.24b) überein. Da die letztere eine Gleichung zwischen Vierervektoren ist, bleibt sie in jedem Inertialsystem gültig. 2 Literatur zum Kapitel XI • Feynman, Vorlesungen über Physik. Band 2 [20] = Lectures on Physics. Vol. II [21] Kap. 25, 26 & 31.8 • Fließbach, Elektrodynamik [3] Teil IV Kap. 18 & Teil V Kap. 22 • Greiner, Klassische Elektrodynamik [8] Teil IV Kap. 22. • Griffiths, Elektrodynamik [9] = Introduction to Electrodynamics [10] Kap. 12.3 • Jackson, Klassische Elektrodynamik [11] = Classical Electrodynamics [12] Kap. 11.9–11.10 & 12.11. • Landau & Lifschitz, Klassische Feldtheorie [14] = The classical theory of fields [26] Kap. III § 16–18 & 23–25. • Nolting, Spezielle Relativita?tstheorie, Thermodynamik [27] Erster Teil, Kap. 2.3. • Scheck, Klassiche Feldtheorie [19] Kap. 2.2. K APITEL XII Lagrange-Formulierung der Elektrodynamik Die Gesetze der Elektrodynamik — und zwar die Maxwell-Gleichungen und die Form der LorentzKraft — sind dadurch motiviert, dass die daraus folgenden Vorhersagen im Einklang mit experimentellen Ergebnissen sind. Diese Gesetze können aber auch hergeleitet werden, und zwar aus einem Extremalprinzip: ähnlich wie in Kap. II führt die Forderung, dass eine Wirkung ihr Extremum für die physikalisch realisierte Konfiguration von Feld und Quellen erreicht, zu Euler–LagrangeGleichungen, die genau die üblichen Bewegungsgleichungen sind. Hiernach wird einem System aus bewegten Punktladungen — oder allgemeiner aus elektrischen Ladungs- und Stromverteilungen — und einem elektromagnetischen Feld eine Lagrange-Funktion zugeordnet. Die Letztere besteht aus drei Beiträgen, die jeweils die freien Ladungen, das freie elektromagnetische Feld und deren Wechselwirkungsterm beschreiben. XII.1 Ladungen und Ströme in einem elektromagnetischen Feld Wir betrachten zuerst die Lagrange-Formulierung der Dynamik einer Punktladung, oder allgemeiner von Punktladungen bzw. von einer Ladungs- und Stromverteilung, in einem nicht-dynamischen elektromagnetischen Feld. XII.1.1 Wiederholung: Lagrange-Funktion einer freien Punktladung Die Lagrange-Funktion eines freien punktförmigen Teilchens der Masse m wurde in früheren Kapiteln dieser Vorlesung schon diskutiert. Sei ~x(t) bzw. ~v (t) die Position bzw. die Geschwindigkeit des Teilchens relativ zu einem festen Bezugssystem. Falls das Teilchen nicht-relativistisch ist (§ II.2.3 a) lautet seine Lagrange-Funktion [Gl. (II.13)] (n.-r.) LM m t, ~x(t), ~v (t) = ~v (t)2 , 2 (XII.1a) wobei das tiefgestellte Kürzel M für Materie steht. Für ein relativistisches Teilchen gilt [§ VI.1.1, Gl. (VI.3a)] r ~v (t)2 (rel.) LM t, ~x(t), ~v (t) = −mc2 1 − 2 . (XII.1b) c Entsprechend diesen Lagrange-Funktionen wird der kanonisch konjugierte Impuls ~p ≡ ∂LM /∂~v definiert, und zwar ~p = m~v (XII.2a) im nicht-relativistischen Fall bzw. m~v ~p = p 1 − ~v 2/c2 [Gl. (VI.4)] für das relativistische Teilchen. (XII.2b) 202 Lagrange-Formulierung der Elektrodynamik Das Integral der Lagrange-Funktion (XII.1) über die Zeit entlang einer Bahn ~x(t) gibt die zugehörige Wirkung Z tb (n.-r.) SM = LM t, ~x(t), ~v (t) dt (XII.3a) ta bzw. Z tb SM = ta (rel.) LM Z t, ~x(t), ~v (t) dt = −mc2 τb dτ, (XII.3b) τa wobei τ die Eigenzeit im des Teilchens bezeichnet. Die physikalisch realisierte Bahnkurve ergibt sich laut dem Hamilton-Prinzip (II.8) aus der Extremierung der Wirkung. Dies führt zu den üblichen Euler–Lagrange-Gleichungen (II.9) ∂LM t, ~x(t), ~v (t) d ∂LM t, ~x(t), ~v (t) = , (XII.4a) ∂~x dt ∂~v wobei die Schreibweise mit Ableitungen nach Vektoren eine günstige Notation für ∂LM t, ~x(t), ~v (t) d ∂LM t, ~x(t), ~v (t) = für i = 1, 2, 3, (XII.4b) ∂xi dt ∂v i darstellt. Für die Lagrange-Funktionen (XII.1) ergibt sich einfach d~p(t) ~ =0 dt mit ~p dem kanonisch konjugierten Impuls (XII.2). (XII.5) XII.1.2 Punktladung in einem äußeren elektromagnetischen Feld Sei jetzt angenommen, dass sich die Punktladung mit Masse m und elektrischer Ladung q in einem äußeren, vorgegebenen elektromagnetischen Feld befindet. Das Letztere wird durch Potentiale ~ r) oder äquivalent ein Viererpotential A(t,~r) [Gl. (XI.6)] beschrieben. Φ(t,~r) und A(t,~ XII.1.2 a Lagrange-Funktion und Wirkung :::::::::::::::::::::::::::::::::::::::::: Der Beitrag zur Lagrange-Funktion zur Beschreibung der Wechselwirkung zwischen Punktladung und elektromagnetischem Feld lautet [31] ~ t, ~x(t) LM+F t, ~x(t), ~v (t) = −qΦ t, ~x(t) + q~v (t) · A (XII.6a) oder äquivalent, unter Einführung der Komponenten xµ (t) bzw. Aµ (t,~r) der Weltlinie der Punktladung bzw. des Viererpotentials dxµ (t) µ LM+F t, ~x(t), ~v (t) = q A t, ~x(t) . dt (XII.6b) Dabei steht das Kürzel M+F für die Wechselwirkung zwischen Materie und Feld. Aus dieser Lagrange-Funktion folgt die Wirkung Z tb Z b Z µ SM+F = LM+F t, ~x(t), ~v (t) dt = q A t, ~x(t) dxµ = q ta a τb uµ (t)Aµ t, ~x(t) dτ, (XII.7) τa mit uµ (t) den kovarianten Koordinaten der Vierergeschwindigkeit des Teilchens. Diese Wirkung ist deutlich Lorentz-invariant, wie die Wirkung (XII.3b) des relativistischen freien Teilchens. Dagegen ist die Lagrange-Funktion (XII.6) nicht Lorentz-invariant. Die Lagrange-Funktion (XII.6) ist auch nicht invariant unter Eichtransformationen der Potentiale. Unter einer Transformation (X.14) — oder äquivalent (XI.8) für das Viererpotential — ändert sich die Lagrange-Funktion gemäß XII.1 Ladungen und Ströme in einem elektromagnetischen Feld LM+F 203 ∂χ t, ~x(t) 0 ~ + ~v (t) · ∇ χ t, ~x(t) ~x(t), ~v (t) → LM+F ~x(t), ~v (t) = LM+F ~x(t), ~v (t) + q ∂t dχ t, ~x(t) = LM+F ~x(t), ~v (t) + q . dt Da LM+F und L0M+F nur um eine totale Zeitableitung abweichen, unterscheiden sich die zugehörigen Wirkungen (XII.7) nur um eine Konstante, die später keine Rolle für die Bewegungsgleichungen spielt [vgl. Gl. (II.10) und den entsprechenden Beweis]. Daher werden die Bewegungsgleichungen in § XII.1.2 c eichinvariant sein. XII.1.2 b Kanonischer Impuls und Hamilton-Funktion Der kanonische Impuls der Punktladung im elektromagnetischen Feld folgt aus der üblichen Definition, angewandt auf die gesamte Lagrange-Funktion L(1) = LM + LM+F : ∂L(1) t, ~x(t), ~v (t) ~ = p~ + q A ~ t, ~x(t) , (XII.8) ≡ Π ∂~v ::::::::::::::::::::::::::::::::::::::::::::::::::::: wobei der erste Term im rechten Glied der Impuls (XII.2) der freien Punktladung ist, entsprechend deren kinetischen Impuls. Somit sind kanonischer und kinetischer Impuls einer Punktladung in Anwesenheit eines elektromagnetischen Feldes unterschiedlich. Die Hamilton-Funktion für eine Punktladung in einem äußeren elektromagnetischen Feld ist ~ · ~v − L(1) . H≡Π (XII.9a) Dies ergibt für ein nicht-relativistisches Teilchen m~v (t)2 + qΦ(t,~r) 2 und im allgemeineren Fall einer möglicherweise relativistischen Punktladung H (n.-r.) = mc2 H (rel) = p + qΦ(t,~r). 1 − ~v (t)2 /c2 (XII.9b) (XII.9c) ~ Dabei wird die Hamilton-Funktion aber noch nicht durch die kanonisch konjugierten Variablen (~r, Π) ausgedrückt, wie es für den Hamilton-Formalismus nötig ist. ~ ein, so lautet Führt man den Vierervektor Π mit kontravarianten Komponenten Πµ ≡ (H/c, Π) der kinetische Viererimpuls der Punktladung, bestehend aus ihrer Energie und ihrem kinetischen Impuls, p = Π − q A(x) bzw. komponentenweise pµ = Πµ − qAµ (x).(55) Bildet man den LorentzQuadrat dieser Identität, so kommt 2 1 ~ − q A(t,~ ~ r) 2 , −m2 c2 = pµ pµ = − 2 H − qΦ(t,~r) + Π c d.h. nach trivialer Umformung q ~ ~ − q A(t, ~ ~r) 2 + m2 c4 + qΦ(t, ~r). H(~r, Π) = c2 Π (XII.10) ~ ausgedrückt. Nun wird die Hamilton-Funktion durch die Variablen (~r, Π) XII.1.2 c Bewegungsgleichungen ::::::::::::::::::::::::::::::::: Kombiniert man die aus der Kettenregel folgende Identität ~ t, ~x(t) ~ t, ~x(t) dA ∂A ~ A ~ t, ~x(t) = + ~v (t) · ∇ dt ∂t (55) Diese Gleichungen zeigen im Nachhinein, dass Π ein wohldefinierter Vierervektor ist. 204 Lagrange-Formulierung der Elektrodynamik mit der Ableitung ∂L(1) t, ~x(t), ~v (t) ~ ~ ~v (t) · A ~ t, ~x(t) , = −q ∇Φ(t, ~x) + q ∇ ∂~x so führt die Euler–Lagrange-Gleichung ∂L(1) t, ~x(t), ~v (t) d ∂L(1) t, ~x(t), ~v (t) = ∂~x dt ∂~v zu ~ t, ~x(t) ∂A d~p(t) ~ ~ ~ ~ ~ =q − − ~v (t) · ∇ A t, ~x(t) − ∇Φ t, ~x(t) + ∇ ~v (t) · A t, ~x(t) . dt ∂t ~ × A) ~ = ∇(~ ~ v · A) ~ − (~v · ∇) ~ A ~ und den Beziehungen (X.12) und (X.13) ergibt Aus der Formel ~v × (∇ sich dann die Bewegungsgleichung h i d~p(t) ~ t, ~x(t) + ~v (t) × B ~ t, ~x(t) . =q E (XII.11) dt Auf der linken Seite steht die Zeitableitung des kinetischen Impulses der Punktladung, auf der rechten Seite erkennt man die darauf wirkende Lorentz-Kraft: man findet die übliche Bewegungsgleichung wieder. Bemerkung: Ausgehend aus der Hamilton-Funktion (XII.10) führen die Hamilton-Gleichungen(56) ∂H = ẋi = v i , ∂Πi ∂H = −Π̇i ∂xi für i = 1, 2, 3 zur gleichen Bewegungsgleichung. XII.1.3 Ladungs- und Stromverteilungen in einem elektromagnetischen Feld Die Lagrange-Funktion (XII.6) bzw. die Wirkung (XII.7) lässt sich auf den Fall mehrerer Punktladungen {qa } in einem elektromagnetischen Feld sofort verallgemeinern. Somit gilt X X ~ t, ~xa (t) LM+F t, {~xa (t)}, {~va (t)} = − qa Φ t, ~xa (t) + qa~va (t) · A (XII.12a) a = X a a dxa,µ (t) µ qa A t, ~xa (t) . dt (XII.12b) Dabei sind die {~xa (t)} die Bahnkurven der Punktladungen, die {xa,µ (t)} die kovarianten Koordinaten der entsprechenden Weltlinien, und die {~va (t)} ihre Geschwindigkeiten. Eine Integration über die Zeit liefert die zugehörige Wirkung Z tb X h i ~ t, ~xa (t) dt SM+F = − qa Φ t, ~xa (t) − ~va (t) · A (XII.13a) ta Z tb = a X ta a qa dxa,µ (t) µ A t, ~xa (t) dt. dt Diese Ausdrücke können noch transformiert werden, und zwar in der Form Z tbZ X i h ~ r) d3~r dt. SM+F = − qa δ (3) ~r − ~xa (t) Φ(t,~r) − ~va (t) · A(t,~ ta (56) R3 a Die Position der Indizes in diesen Gleichungen ist nicht willkürlich! (XII.13b) 205 XII.2 Elektromagnetisches Feld mit Quellen Unter Verwendung der elektrischen Ladungsdichte ρel. und -stromdichte ~el. [Gl. (VII.6)] der Punktladungen ergibt sich dann SM+F Z tbZ =− ta h i ~ r) d3~r dt. ρel.(t,~r)Φ(t,~r) − ~el.(t,~r) · A(t,~ (XII.14a) R3 Ausgedrückt durch den aus Gl. (XI.11) folgenden elektrischen Viererstrom Jel. lautet dies noch Z SM+F = Jel.(x) · A(x) d4 x , c (XII.14b) wobei d4 x das Vierervolumenelement bezeichnet [Gl. (V.21)], während das Integrationsgebiet nicht präzisiert wurde. Diese Ausdrücke der Wirkung — und dabei der Lagrange-Funktion, die als Integrand des Integrals über die Zeit in Gl. (XII.14a) auftaucht — gelten noch für beliebige elektrische Ladungs- und Stromverteilungen ρel. , ~el. in einem elektromagnetischen Feld. Man prüft ähnlich wie in § XII.1.2 a nach, dass die Wirkung (XII.14) eichinvariant ist. An der Gl. (XII.14b) erkennt man auch deren Invarianz unter Lorentz-Transformationen. Das Integrand Jel.(x) · A(x) ist nämlich ein Lorentz-Skalar, und so ist das Integrationsmaß d4 x. XII.2 Elektromagnetisches Feld mit Quellen In diesem Abschnitt werden zuerst Elemente der klassischen Feldtheorie — Lagrange-Dichte, mit den zugehörigen Euler–Lagrange-Gleichungen, Noether-Theorem. . . — eingeführt (§ XII.2.1). Diese Ideen werden dann auf das Beispiel des elektromagnetischen Feldes angewandt (§ XII.2.2–XII.2.3). Hiernach werden die relativistisch kovarianten Notationen durchaus benutzt. XII.2.1 Einführung in die klassische Feldtheorie Es seien ϕk (x), k = 1, . . . , N die Komponenten in einem gegebenen Bezugssystem von einem Feld bzw. von einem System von Feldern auf dem Minkowski-Raum,(57) wobei N von der tensoriellen Natur des Feldes abhängt: N = 1 für ein einzelnes Skalarfeld, N = 4 für ein Vierervektorfeld, usw. Die in diesem Paragraph eingeführten Begriffe und Ergebnisse stellen eine Verallgemeinerung jener des § II.2 auf den Fall einer unendlichen Anzahl von Freiheitsgraden dar. XII.2.1 a Definitionen ::::::::::::::::::::: Diesem Feld wird ein Funktional der Komponenten ϕk (x) und deren Ableitungen ∂µ ϕk (x) zugeordnet, die Lagrange-Dichte L ϕk (x), ∂µ ϕk (x) . (XII.15a) Dieses Funktional bestimmt die ganze Dynamik des Feldes. Die entsprechende Lagrange-Funktion ist durch Z L = L ϕk (x), ∂µ ϕk (x) d3~r, (XII.15b) gegeben, wobei die Integration auf den ganzen dreidimensionalen Raum durchgeführt wird — wes(57) Tatsächlich darf man auch Felder auf einem beliebigen Zeitraum betrachten. 206 Lagrange-Formulierung der Elektrodynamik halb L als Dichte bezeichnet wird. Die resultierende Wirkung lautet Z tb S= ta Z d4 x L dt = L ϕk (x), ∂µ ϕk (x) c (XII.15c) mit d4 x dem Vierervolumenelement (V.21). Bemerkungen: ∗ Ist die Lagrange-Dichte eines Systems von Feldern ein Lorentz-Skalar, so ist die resultierende Wirkung automatisch Lorentz-invariant. ∗ Zwei Lagrange-Dichten L und L 0 , die nur um eine Viererdivergenz 6 · M(x) = ∂µ Mµ (x) abweichen, wobei M ein Vierervektorfeld bezeichnet, führen jeweils zu Wirkungen S und S 0 , die dieselben Bewegungsgleichungen liefern. Daher sind solche Lagrange-Dichten äquivalent: die Lagrange-Dichte eines gegebenen Systems von Feldern ist nicht eindeutig. XII.2.1 b Hamilton-Prinzip. Euler–Lagrange-Gleichungen ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Wie im § II.2.2 gilt das Hamilton-Prinzip, laut welchem die physikalisch realisierte „Konfiguration“ der Felder solche ist, welche die Wirkung extremal macht — wobei die Konfiguration in der Raumzeit zu betrachten ist, d.h. sie entspricht der Zeitentwicklung einer räumlichen Anordnung. Betrachtet man die Variation der Wirkung (XII.15c) für eine Variation δϕk des Feldes, so lautet 4 sie Z ∂L ∂L d x δS = δϕk + δ∂µ ϕk , ∂ϕk ∂(∂µ ϕk ) c wobei über doppelt auftretende Indizes k = 1 . . . N und µ summiert wird. Da δ∂µ ϕk = ∂µ δϕk , kann der zweite Term im Integranden durch partielle Integration berechnet werden. Der resultierende integrierte Term verschwindet(58) und es bleibt Z ∂L ∂L d4 x δS = − ∂µ δϕk ∂ϕk ∂(∂µ ϕk ) c übrig. Die Wirkung ist extremal wenn δS = 0 für beliebige Variationen δϕk , d.h. wenn das Feld und seine Ableitungen den Euler–Lagrange-Gleichungen ∂L ϕk , ∂ν ϕk ∂L ϕk , ∂ν ϕk = ∂µ ∂ϕk ∂(∂µ ϕk ) (XII.16) genügen. Diese stellen die Bewegungsgleichungen des Feldes dar. XII.2.2 Elektromagnetisches Feld in Anwesenheit fester Quellen XII.2.2 a Lagrange-Dichte des elektromagnetischen Feldes ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Der Vergleich der Gl. (XII.14b) und (XII.15c) zeigt, dass die Lagrange-Funktion für den Wechselwirkungsterm zwischen einem elektrischen Strom und dem elektromagnetischen Feld als Integral der Lagrange-Dichte ν LM+F ≡ Jel. (x)Aν (x) = Jel.(x) · A(x) (XII.17) betrachtet werden kann. (58) An den „Endpunkten“, entsprechend in der Raumzeit einem Oberflächenterm, werden die Felder nicht variiert. 207 XII.2 Elektromagnetisches Feld mit Quellen In dieser Lagrange-Dichte tritt das elektromagnetische Feld in der Form des Viererpotentials eher als des Feldstärketensors auf: die relevanten Freiheitsgrade sind also die Komponenten Aν (x). Dazu kann die Lagrange-Dichte auch Funktion der Ableitungen ∂µ Aν (x) sein. Die „Standard“-Lagrange-Dichte für das freie elektromagnetische Feld ist LF [Aν , ∂µ Aν ] = − i 1 0 h ~ ~ ~r)2 Fµν (x)F µν (x) = E(t, ~r)2 − c2 B(t, 4µ0 2 (XII.18) mit Fµν (x) den kovarianten Komponenten des elektromagnetischen Feldstärketensors (XI.1). Bemerkungen: ∗ Da die Lagrange-Dichte (XII.18) des freien elektromagnetischen Feldes nur vom Feldstärketensor abhängt, ist sie wie dieser eichinvariant. Im Gegensatz hängt die Lagrange-Dichte (XII.17) für den Wechselwirkungsterm zwischen Feld und Punktladung von der Eichung ab. Wie oben schon bemerkt wurde ist die entsprechende Wirkung aber eichinvariant. ∗ Wie immer kann man andere Lagrange-Dichten für das freie elektromagnetische Feld postulieren, die zu den gleichen Bewegungsgleichungen führen. Daher wird die Wahl (XII.18) oft als Standard bezeichnet. XII.2.2 b Bewegungsgleichungen Ein dynamisches elektromagnetisches Feld in Anwesenheit von festen Quellen lässt sich dann durch die Lagrange-Dichte L (2) [Aν , ∂µ Aν ] = LF [Aν , ∂µ Aν ] + LM+F [Aν , ∂µ Aν ] beschreiben. Die entsprechenden Euler–Lagrange-Gleichungen folgen aus ∂LF ∂LM+F ∂LM+F ν = 0, = Jel. (x), =0 ∂Aν ∂(∂µ Aν ) ∂Aν ::::::::::::::::::::::::::::::::: und 1 ∂ 1 ∂ 1 ∂LF =− Fµν (x)F µν (x) = − ∂µ Aν (x)F µν (x) = − F µν (x). ∂(∂µ Aν ) 4µ0 ∂(∂µ Aν ) 2µ0 ∂(∂µ Aν ) µ0 Laut Gl. (XII.16) ergibt sich 1 ∂µ F µν (x), µ0 d.h. unter Berücksichtigung der Antisymmetrie des Feldstärketensors (∂µ F µν = −∂ν F µν ) ν (x) = − Jel. µ ∂ν F µν (x) = µ0 Jel. (x). (XII.19) Das heißt, man findet die inhomogenen Maxwell-Gleichungen (XI.13a) wieder, was die Wahl der Lagrange-Dichte (XII.18) rechtfertigt.(59) Bemerkung: In der obigen Herleitung der Bewegungsgleichungen wurde angenommen, dass die Komponenten Aν (x) mit ν = 0, 1, 2, 3 unabhängig voneinander sind. Wegen der Eichinvarianz der Elektrodynamik ist dies aber nicht der Fall: das elektromagnetische Feld im Vakuum besitzt nicht vier Freiheitsgrade, sondern nur zwei — entsprechend den zwei möglichen linearen Polarisationen. Die Eichinvarianz der Theorie kann später durchgesetzt werden, wie sich am folgenden Beispiel des Energieimpulstensors beobachten lässt. XII.2.3 Energieimpulstensor Aus der Invarianz der Elektrodynamik unter einer beliebigen Translation xµ → x0µ = xµ + aµ in der Raumzeit folgt die Existenz einer Erhaltungsgröße, des Energieimpulstensors. (59) Wie schon in § XI.3.1 bemerkt folgen die homogenen Maxwell-Gleichungen (XI.13b) automatisch aus der Beziehung Fµν (x) = ∂µ Aν (x) − ∂ν Aµ (x), d.h. sie sind nicht dynamisch. 208 Lagrange-Formulierung der Elektrodynamik XII.2.3 a Noether-Theorem :::::::::::::::::::::::::: Betrachten wir wieder die allgemeine Lagrange-Dichte L ϕk (x), ∂µ ϕk (x) des § XII.2.1. Es wird angenommen, dass die resultierende Wirkung Z d4 x S = L ϕk (x), ∂µ ϕk (x) (XII.20) c Ω invariant ist unter den gleichzeitigen infinitesimalen Transformationen xµ → x0µ = xµ + δxµ , ϕk (x) → ϕ0k (x) = ϕk (x) + δ̃ϕk (x). (XII.21a) (XII.21b) Unter diesen Transformationen ändert sich das vierdimensionale Integrationsvolumen in Gl. (XII.20) gemäß Ω → Ω0 . Dann lautet die transformierte Wirkung (XII.20) Z I Z d4 x d4 x0 d3 σµ = L ϕ0k (x), ∂µ ϕ0k (x) + L ϕ0k (x), ∂µ ϕ0k (x) δxµ , S0 = L ϕ0k (x0 ), ∂µ ϕ0k (x0 ) c c c Ω ∂Ω Ω0 mit ∂Ω der dreidimensionalen Oberfläche („Hyperfläche“) des Integrationsvolumens Ω und d3 σµ einem Hyperflächenelement. Die Taylor-Entwicklung zur ersten Ordnung der rechten Seite dieser Gleichung liefert die Variation der Wirkung 4 Z I d3 σµ ∂L d x ∂L 0 S −S = ∂µ δ̃ϕk + L δxµ δ̃ϕk + ∂(∂µ ϕk ) c c Ω ∂ϕk ∂Ω 3 Z I 4 ∂L ∂L d x ∂L µ d σµ = − ∂µ δ̃ϕk + δ̃ϕk + L δx , ∂(∂µ ϕk ) c c Ω ∂ϕk ∂Ω ∂(∂µ ϕk ) wobei der Übergang von der ersten zur zweiten Zeile einer partiellen Integration entspricht. In allen Termen ist das nicht-geschriebene Argument der Lagrange-Dichte [ϕk (x), ∂µ ϕk (x)]. Wegen der Euler–Lagrange-Gleichungen (XII.16) ist das Volumenintegral in der zweiten Zeile gleich Null. Somit ist die Wirkung nur dann invariant unter der Transformation (XII.21), wenn das Oberflächenintegral ebenfalls verschwindet. Im Letzteren kann δ̃ϕk (x) durch die Variation des Feldes (XII.22) δϕk ≡ ϕ0k (x0 ) − ϕk (x) ' δ̃ϕk (x) + δxν ∂ νϕk (x) ausgedrückt werden. Dann gilt 3 I ∂L ν µ d σµ δϕk − δxν ∂ ϕk + L δx = c ∂Ω ∂(∂µ ϕk ) 3 I d σµ ∂L ∂L µν ν δϕk + η L − ∂ ϕk δxν = 0. ∂(∂µ ϕk ) c ∂Ω ∂(∂µ ϕk ) Man definiert den (kanonischen) Energieimpulstensor T kan. durch seine Komponenten ∂L ∂ νϕk ∂(∂µ ϕk ) (XII.23a) ∂L µν δϕk + Tkan. δxν , ∂(∂µ ϕk ) (XII.23b) µν Tkan. ≡ η µν L − sowie den Noether-Strom N mit Komponenten Nµ ≡ wobei es sich eigentlich um eine Stromdichte handelt. Dann liefert der Satz von Stokes I Z N µ (x) d3 σµ = 0 = ∂µ N µ (x) d4 x. ∂Ω Ω (XII.23c) 209 XII.2 Elektromagnetisches Feld mit Quellen Sei Ω das Volumen zwischen den Hyperflächen t1 = Konstante und t2 = Konstante, entsprechend dem zeitartigen Hyperflächenelement d3 σµ = (−d3~r, ~0). Wenn die Felder ϕk im räumlichen R 0 Unendlichen verschwinden, dann ist N (x) d3~r eine Konstante der Bewegung. Dies gilt insbesondere für jede der vier Komponenten Z 0ν ν (x) d3~r für ν = 0, 1, 2, 3, P ≡ Tkan. t die sich aus dem Einsetzen von δϕk = 0 und δxν = aν — entsprechend der Invarianz der LagrangeDichte unten Translationen in der Raumzeit — in den Ausdruck (XII.23b) des Noether-Stroms ergeben. Die Erhaltung der vier Größen P ν stellt einen Sonderfall des Noether-Theorems dar, laut dem zu jeder kontinuierlichen Gruppe von Transformationen der Felder und Koordinaten, welche die Wirkung invariant lassen, eine Erhaltungsgröße zugeordnet werden kann. Bemerkungen: ∗ Die Invarianz der Wirkung unter Translationen der Raumzeit ist nur Teil der nötigen Invarianz relativistischer Theorien unter allen Elementen [Gl. (V.24)] der Poincaré-Gruppe. Aus der Invarianz unter Lorentz-Transformationen der Koordinaten folgt die Erhaltung des Tensors dritter Stufe mit µνρ µρ µν Komponenten M = xν Tkan. − xρ Tkan. — entsprechend einem „verallgemeinerten Drehimpuls“ —, µν mit Tkan. dem kanonischen Energieimpulstensor (XII.23a). ∗ In manchen Büchern wird statt der Invarianz der Wirkung unter den Transformationen (XII.21) die strengere Invarianz der Lagrange-Dichte erfordert. Diese Bedingung ist aber zu beschränkend und gilt beispielsweise nicht für die Lagrange-Dichte einer Punktladung in einem elektromagnetischen Feld! Für eine Diskussion s. Lévy-Leblond [32]. ∗ In Analogie zur Mechanik einer endlichen Zahl von Freiheitsgraden ordnet man dem Feld ϕk mit der Lagrange-Dichte L einen kanonisch konjugierten Impuls πk ≡ ∂L ∂(∂0 ϕk ) (XII.24) zu. Damit ergibt sich die Hamilton-Dichte H[πk , ϕk ] = πk ∂0 ϕk − L , (XII.25) dessen Integral über den Raum die Hamilton-Funktion liefert. Aus Gl. (XII.23a) mit η 00 = −1 und ∂ 0 ϕk = −∂0 ϕk folgt die Identität der Hamilton-Dichte mit der 00-Komponente des kanonischen 00 . Energieimpulstensors, H = Tkan. XII.2.3 b Elektromagnetischer Energieimpulstensor :::::::::::::::::::::::::::::::::::::::::::::::::::: Im Vakuum, d.h. in Abwesenheit von Quellen, ist die Wirkung des (freien) elektromagnetischen Feldes invariant unter Raumzeittranslationen. Aus Gl. (XII.23a) und der Standard-LagrangeDichte (XII.18) des freien elektromagnetischen Felds ergibt sich der kanonische Energieimpulstensor µν Tkan. = η µν LF − ∂LF 1 ∂ νAρ = η µν LF + F µρ ∂ νAρ , ∂(∂µ Aρ ) µ0 (XII.26) der laut den Ergebnissen des vorigen Paragraphen „erhalten“ sein soll:(60) damit Gl. (XII.23c) für ein beliebiges Ω erfüllt ist, soll µν ∂µ Tkan. (x) = 0 (XII.27) in jedem Punkt x und für jedes ν = 0, 1, 2, 3 gelten. (60) Eigentlich ist die zugehörige Noether-Ladung erhalten. 210 Lagrange-Formulierung der Elektrodynamik Der Tensor (XII.26) ist aber nicht eichinvariant! Ersetzt man Aµ durch A0µ = Aµ + ∂ µ χ, so µν 0µν µν transformiert sich Tkan. in Tkan. = Tkan. + (1/µ0 )F µρ ∂ ν ∂ρ χ. Allgemein existieren neben dem kanonischen Tensor (XII.23a) weitere Energieimpulstensoren, die ebenfalls erhalten sind, und zwar der Art µν T µν(x) = Tkan. (x) + ∂ρ K µρν(x), wobei K µρν antisymmetrisch in µ und σ ist: K µρν = −K ρµν . Man überprüft einfach µν ∂µ T µν(x) = ∂µ Tkan. (x) + ∂µ ∂ρ K µρν(x) = 0, wobei der zweite Term wegen der Symmetrie von ∂µ ∂ρ und der Antisymmetrie von K µρν Null ist. Für das elektromagnetische Feld liefert die Wahl K µρν = −(1/µ0 )F µρ Aν einen eichinvarianten Energieimpulstensor i 1 h µρ µν Te.m. (x) = η µν LF + F (x)∂ νAρ (x) − ∂ρ F µρ (x)Aν(x) µ0 i 1 h µρ F (x)∂ νAρ (x) − F µρ (x)∂ρ Aν(x) , = η µν LF + µ0 wobei die Maxwell-Gleichung ∂ρ F µρ = 0 in der letzten Gleichung benutzt wurde. Mit dem Ausdruck (XII.18) der Lagrange-Dichte lässt sich dieser Tensor noch als µν Te.m. (x) 1 1 µν µρ ν ρσ =− F (x)Fρ (x) + η Fρσ (x)F (x) µ0 4 (XII.28a) umschreiben. Somit findet man Gl. (XI.12b) wieder, und die Gleichung µν ∂µ Te.m. (x) = 0 (XII.28b) stellt einen Spezialfall der Bilanzgleichung (XI.18) mit Jel.(x) = 0 dar. Literatur zum Kapitel XII • Fließbach, Elektrodynamik [3] Teil IV Kap. 19. • Greiner, Klassische Elektrodynamik [8] Teil IV Kap. 23. • Jackson, Klassische Elektrodynamik [11] = Classical Electrodynamics [12] Kap. 12.1, 12.7, 12.10. • Landau & Lifschitz, Klassische Feldtheorie [14] = The classical theory of fields [26] Kap. 4 § 27–33. • Nolting, Spezielle Relativita?tstheorie, Thermodynamik [27] Erster Teil, Kap. 2.4. • Scheck, Klassiche Feldtheorie [19] Kap. 3. Anhang A NHANG A Tensoren auf einem Vektorraum In diesem Anhang werden einige Definitionen und Ergebnisse betreffend Tensoren ohne Anspruch auf mathematische Strenge zusammengestellt. Das Ziel ist, den „modernen“ geometrischen Gesichtspunkt einzuführen. Somit werden Tensoren über ihre Operation auf Vektoren oder Linearformen definiert, d.h. auf koordinatenunabhängiger Weise (Abschn. A.1), im Gegensatz zur „alten“ Charakterisierung durch ihr Verhalten unter Basistransformationen (Abschn. A.2). Dabei wird von der Leserin erwartet, dass sie schon einige Grundkenntnisse in Linearalgebra hat, wie z.B. was Linearität, Linearkombinationen, (multi)lineare Abbildungen, Vektoren, Matrizen. . . sind. Auf ähnlicher Weise werden Begriffe wie Gruppe, Körper, Abbildung/Funktion. . . ohne weitere Erklärung benutzt. Dem durchschnittlichen Physik-Studierenden werden die in Abschn. A.1 eingeführten Begriffe vielleicht auf erster Sicht unnötig abstrakt erscheinen, während die Formeln des Abschn. A.2 mehr praktischer Natur sind. Dem Autor scheint(61) die hier adoptierte Darstellung die natürlichste zu sein, welche die Existenz von Tensoren „mit Indizes oben oder unten oder sogar beides“ irgendwie erklärt. Und auch wenn der Unterschied anscheinend unwichtig ist für die Physik im drei-dimensionalen euklidischen Raum der nicht-relativistischen klassischen Mechanik — solange man in kartesischen Koordinaten arbeitet —, wird er unvermeidbar im relativistischen Kontext, oder wenn man krummlinige Koordinaten benutzt. In den Physik-Kapiteln dieses Skripts werden in der Tat nur Tensoren auf reellen Vektorräumen betrachtet, d.h. der Körper K der Skalaren die Menge R ist; in diesem Anhang wird dies nicht angenommen. Die Einstein’sche Summenkonvention über doppelt auftretende Indizes wird durchgehend verwendet. A.1 Vektoren, Linearformen und Tensoren A.1.1 Vektoren . . . sind definitionsgemäß die Elemente ~c eines Vektorraums V , d.h. einer Menge mit 1) einer inneren zweistelligen Operation („Vektoraddition“), für welche die Menge eine Abel’sche(as) Gruppe(62) bildet, und 2) einer äußeren Verknüpfung („Skalarmultiplikation“) mit „Skalaren“ — den Elementen eines Körpers K —, die assoziativ ist, eine Einheit besitzt, und distributiv bezüglich der Additionen in V und in K ist. Sei B = {~ei } eine Basis, d.h. eine Teilmenge von linear unabhängigen Vektoren(63) , welche auch ein Erzeugendensystem(64) des gesamten Vektorraums V bilden. Jedem Vektor ~c von V werden (61) erstaunlicherweise! Eine Gruppe ist eine Menge mit einer assoziativen zweistelligen inneren Operation, für die es ein Neutralelement gibt, und derart, dass jedes Gruppenelement ein inverses Element besitzt. Die Gruppe heißt kommutativ oder abel’sch, wenn die Operation auch kommutativ ist (63) . . . d.h. keiner ~ei0 kann als Linearkombination der anderen Basisvektoren ~ei mit i 6= i0 ausgedrückt werden. (64) . . . d.h. jeder Vektor von V kann als Linearkombination der Basisvektoren geschrieben werden. (62) (as) N. Abel, 1802–1829 214 Tensoren auf einem Vektorraum dann Zahlen {ci } des Körpers K eindeutig zugeordnet, seine Koordinaten bezüglich der Basis, die derart sind, dass ~c = ci~ei . (A.1) Ist die Anzahl der Vektoren einer Basis endlich — was dann der Fall aller Basen des Vektorraums ist — und gleich einer ganzen Zahl D — welche die gleiche für alle Basen ist —, so wird der Vektorraum V endlich-dimensional genannt und D ist seine Dimension (über K): D = dim V . Wir werden ab jetzt annehmen, dass die betrachteten Vektorräume endlich-dimensional sind. A.1.2 Linearformen . . . auf einem Vektorraum V sind die linearen Abbildungen von V in den zugrundeliegenden Körper K von Skalaren. Hiernach werden diese Linearformen mit h bezeichnet. e Die Menge der Linearformen auf V , mit den „natürlichen“ Addition und Skalarmultiplikation, ∗ ist selbst ein Vektorraum über K. Dieser wird mit V bezeichnet und heißt Dualraum zu V . Wenn V endlich-dimensional ist, dann ist es auch der Fall von V ∗ und dim V ∗ = dim V . Gegeben eine Basis B = {~ei } von V , so kann man die duale Basis B ∗ = {j } auf V ∗ derart definieren, dass e j (~ei ) = δij , (A.2) e wobei δij das übliche Kronecker-Symbol bezeichnet. Die Komponenten einer Linearform h bezüglich einer gegebenen Basis werden im Folgenden mit e {hj } bezeichnet: h = hj j . (A.3) e e Bemerkungen: ∗ Die Wahl der Notationen, insbesondere die Position der Indizes, ist nicht unbedeutend! Somit lässt sich trivial nachprüfen, dass wenn {j } die duale Basis zu {~ei } bezeichnet, gelten e i i c = (~c) und hj = h(~ej ). (A.4) e e ∗ Oft werden die Vektoren von V bzw. die Linearformen von V ∗ „kontravariante Vektoren“ bzw. „kovariante Vektoren“ oder „Kovektoren“ genannt, und demententsprechend ihre Komponenten als „kontravariante“ bzw. „kovariante“ Koordinaten bezeichnet. Die letzteren zwei, betreffend den Komponenten, sind zwar nützliche kurze Bezeichnungen, insbesondere wenn sie sich auf Tensoren beziehen (vgl. unten). Sie sind aber gleichzeitig verwirrend, denn sie sind nicht unterschiedliche Koordinaten einer einzigen mathematischen Größe, sondern Komponenten von unterschiedlichen Objekten, zwischen denen ein „natürlicher“ Zusammenhang eingeführt wurde, insbesondere mithilfe eines metrischen Tensors wie in § A.1.4. ∗ Werden die Vektoren von V in Matrixdarstellung mit Spaltenvektoren bezeichnet, so lassen sich die Linearformen von V ∗ durch Zeilenvektoren darstellen. A.1.3 Tensoren A.1.3 a Erste Definitionen und Resultate ::::::::::::::::::::::::::::::::::::::::: Sei V ein Vektorraum über dem Körper K, und m, n zwei nicht-negative ganze Zahlen. Definition: Man nennt Tensoren vom Typ m n auf V die multilinearen Abbildungen, die m Linearformen — Elemente von V ∗ — und n Vektoren — Elemente von V — auf Skalare des Körpers K abbilden, wobei Linearität bezüglich jedes Arguments gelten soll. Die ganze Zahl m + n heißt Stufe (oder manchmal Rang, was aber relativ inkorrekt ist) des Tensors. A.1 Vektoren, Linearformen und Tensoren 215 Schon bekannte Objekte sind Sonderfälle dieser Definition mit entweder m oder n gleich Null: • die 00 -Tensoren sind einfach die Skalaren des zugrundeliegenden Körpers K; • die 10 -Tensoren stimmen mit den Vektoren überein; Genauer sind sie die Elemente des Bidualraums V ∗∗ , die sich im endlich-dimensionalen Fall mit den Elementen von V dank einem „natürlichen“ Isomorphismus identifizieren lassen. • die Tensoren vom Typ 01 sind die Linearformen. Allgemeiner werden die n0 -Tensoren auch n-Multilinearformen genannt. • Schließlich werden Tensoren vom Typ 20 manchmal — in der älteren Literatur — “Bivektoren” or “Dyaden” genannt. In diesem Skript werden Tensoren allgemein mit T bezeichnet, unabhängig von ihrer Stufe, so lange die letztere weder 0 noch 1 ist. Bemerkungen: ∗ Tensoren vom Typ m n werden oft als „m-fach kontravariant und n-fach kovariant“ bezeichnet. ∗ Falls sowohl m als n ungleich Null sind, spricht man von einem gemischten Tensor . 0 0 ∗ Sei T : (V ∗ )m × (V ∗ )n → K ein Tensor vom Typ m n und m ≤ m, n ≤ n zwei nicht-negative 0 0 ganze Zahlen. Für jedes m -Tupel von Linearformen {hi } und n -Tupel von Vektoren {~cj } — und für zugehörige Tupeln von Positionen der Argumente,eobwohl wir hier der Einfachheit halber die ersten Positionen annehmen — betrachtet man das Objekt T h1 , . . . , hm0 , · , . . . , · ; ~c1 , . . . , ~cn0 , · , . . . , · , e e wobei die Punkte „leere“ Argumente bezeichnen. Dieses Objekt bildet m−m0 Linearformen und n−n0 Vektoren auf ein Skalar ab. Anders gesagt induziert der Tensor T eine multilineare Abbildung(65) 0 0 0 von (V ∗ )m × (V ∗ )n in die Menge der Tensoren vom Typ m−m . n−n0 1 Beispielsweise hängen die 1 -Tensoren natürlich mit den linearen Abbildungen von V nach V zusammen, d.h. wiederum mit den quadratischen Matrizen der Ordnung dim V . Aus diesem Grund werden solche Tensoren oft als Matrizen dargestellt. Ein Tensor kann symmetrisch oder antisymmetrisch unter dem Austausch von zwei seiner Argumente sein, wobei diese entweder beide Vektoren oder beide Linearformen sind. Nach einer direkten Verallgemeinerung kann ein Tensor total symmetrisch — wie z.B. der metrische Tensor, den wir unten weiter diskutieren werden — oder total antisymmetrisch sein. Ein Beispiel für die letztere Möglichkeit ist die Determinante (von D D-dimensionalen Vektoren), welche die einzige (bis auf einem multiplikativen Faktor) total antisymmetrische D-Multilinearform auf einem Vektorraum von Dimension D ist. A.1.3 b Operationen auf Tensoren :::::::::::::::::::::::::::::::::: Versehen mit der Addition und der Skalarmultiplikation, die sich aus den entsprechenden Operationen auf den Körper K induzieren lassen, bilden die Tensoren eines gegebenen Typs auf einem Vektorraum V selbst einen Vektorraum über K. Neben diesen zwei Verknüpfungen lassen sich weitere Operationen auf Tensoren definieren, insbesondere das äußere Produkt oder Tensorprodukt — welches zu Tensoren höherer Stufe führt — und die Kontraktion oder Tensorverjüngung, welche die Stufe reduziert. (65) Genauer, so viele solche Abbildungen, wie es unabhängige Kombinationen — unter Betrachtung der möglichen Symmetrien von T — aus m0 bzw. n0 Linearform bzw. Vektor Argumenten gibt. 216 Tensoren auf einem Vektorraum m0 Es seien zunächst zwei Tensoren T und T0 von den jeweiligen Typen m n und n0 . Ihr äußeres 0 T0 ist ein Tensor vom Typ m+m Produkt T ⊗T , der für jedes (m+m0 )-Tupel (h1 , . . . , hm , . . . , hm+m0 ) n+n0 e e e von Linearformen und jedes (n + n0 )-Tupel (~c1 , . . . , ~cn , . . . , ~cn+n0 ) von Vektoren die Gleichung T ⊗ T0 h1 , . . . , hm+m0 ; ~c1 , . . . , ~cn+n0 = e e T h1 , . . . , hm ; ~c1 , . . . , ~cn T0 hm+1 , . . . , hm+m0 ; ~cn+1 , . . . , ~cn+n0 e e e e erfüllt. Dieses äußere Produkt ist assoziativ und distributiv bezüglich der Addition von Tensoren. Zum Beispiel ist das äußere Produkt zweier Linearformen h, h0 eine Bilinearform h ⊗ h0 derart, e Wiederum gibt die e Tensormule dass für jedes Paar (~c, ~c 0 ) von Vektoren h⊗h0 (~c, ~c 0 ) = h(~c) h0 (~c 0e) gilt. e e e e 0 0 0 2 tiplikation zweier Vectoren ~c, ~c einen 0 -Tensor ~c ⊗ ~c , der für jedes Paar (h, h ) von Linearformen e e ~c ⊗ ~c0 (h, h 0 ) = h(~c) h0 (~c 0 ) erfüllt. e e vom e Typ e m , die sich als Tensorprodukt aus m Vektoren und n Linearformen schreiben Tensoren n lassen, werden manchmal elementare Tensoren genannt. Sei nun T ein gemischter Tensor vom Typ m n mit positiven m und n und seien 1 ≤ j ≤ m und 1 ≤ k ≤ n. In der einfachsten koordinatenunabhängigen Definition der Kontraktion bezüglich des j-ten Linearform-Arguments und des k-ten vektoriellen Arguments wird T als Summe von elementaren Tensoren geschrieben. Wird dann in jedem Summanden die k-te Linearform auf den j-ten Vektor angewandt, was eine Zahl (ein Skalar) gibt, so erhält man eine Summe aus elementaren Tensoren vom Typ m−1 n−1 , d.h. ein Tensor dieses Typs, welcher das Ergebnis der Verjüngung ist. Beispiele von Kontraktionen werden hiernach in § A.1.4 nach der Einführung des metrischen Tensors angegeben. A.1.3 c Komponenten von Tensoren Sei {~ei } bzw. {j } eine Basis auf einem Vektorraum V der Dimension D bzw. auf dessen Duale raum V ∗ — prinzipiell sind die Basen nicht dual zueinander, in der Praxis wird das aber implizit fast immer angenommen — und seien m, n zwei nicht-negative ganze Zahlen. Die Dm+n elementaren Tensoren {~ei1 ⊗ · · · ⊗~eim ⊗ j1 ⊗ · · · ⊗ jn }, wobei jeder Index ik oder jk jeden e der Tensoren e Wert zwischen 1 und D annimmt, bilden eine Basis vom Typ m . Die Komponenten n i ...i m 1 T eines Tensors T bezüglich dieser Basis werden hiernach mit {T j1 ...jn } bezeichnet: :::::::::::::::::::::::::::::::::::: T = T i1 ...im j1 ...jn ~ei1 ⊗ · · · ⊗ ~eim ⊗ j1 ⊗ · · · ⊗ jn e e (A.5a) mit Ti1 ...im j1 ...jn = T(i1 , . . . , im ;~ej1 , . . . ,~ejn ). (A.5b) e e Die mögliche Symmetrie oder Antisymmetrie eines Tensors unter dem Austausch zweier Argumente spiegelt sich in der Symmetrie oder Antisymmetrie seiner Komponenten unter dem Austausch der entsprechenden Indizes wider. Komponentenweise liefert die Kontraktion von T bezüglich seines j-ten Linearform-Arguments und seines k-ten vektoriellen Arguments den Tensor mit Komponenten T ...ij−1 ,`,ij+1 ,... ...jk−1 ,`,jk+1 ,... , mit Summe über den doppelt auftretenden Index `. A.1.4 Metrischer Tensor Nicht-entartete(66) symmetrische Bilinearforme spielen eine wichtige Rolle, denn sie erlauben die Einführung einer weiteren Struktur auf dem Vektorraum V , indem sie ein inneres Produkt definieren. hier genauer sein: Bilinearform auf reellen Vektorräumen, Sesquilinearform auf komplexen Vektorräumen. (66) Das heißt, für jeden Vektor ~a 6= ~0 kann man einen Vektor ~b finden, der g(~a, ~b) 6= 0 erfüllt. Dies kann auch äquivalent als Bedingung über die Matrix mit Elementen gij formuliert werden, wie 4 Zeilen unten zu finden ist. 217 A.1 Vektoren, Linearformen und Tensoren Sei {j } eine Basis des Dualraums V ∗ . Eine Bilinearform g = gij i ⊗ j heißt metrischer Tensor e e e auf V , wenn sie symmetrisch ist — d.h. g(~a, ~b) = g(~b, ~a) für alle Vektoren ~a, ~b, oder äquivalent gij = gji für alle i, j —, und wenn die quadratische Matrix mit Elementen gij regulär ist. Das Skalar g(~a, ~b) wird dann auch als ~a · ~b bezeichnet, was insbesondere gij = g ~ei ,~ej = ~ei · ~ej (A.6) ergibt, wobei {~ei } die Basis von V dual zu {j } ist. e Da die D × D-Matrix mit Elementen gij regulär ist, kann sie invertiert werden. Die Elemente der inversen Matrix seien mit g ij bezeichnet: dann gelten gij g jk = δik und g ij gjk = δki . Die D2 Skalaren ij ij 2 g definieren einen Tensor g ~ei ⊗~ej vom Typ 0 , der als inverser metrischer Tensor und mit g−1 bezeichnet wird. Unter Verwendung eines Satzes über symmetrische Matrizen ist die quadratische Matrix mit Elementen gij diagonalisierbar — d.h. man kann eine geeignete Basis {~ei } von V finden, für welche g ~ei ,~ej = 0 für alle i 6= j gilt. Da g nicht-entartet ist, sind die Eigenwerte nicht Null: auf Kosten der möglichen Multiplikation der Basisvektoren {~ei } mit einem Skalar kann man fordern, dass jede Zahl g ~ei ,~ei gleich entweder +1 oder −1 sei, was die sog. kanonische Form gij = diag(−1, . . . , −1, 1, . . . , 1) (A.7) der Matrixdarstellung der Komponenten des metrischen Tensors ergibt. In dieser speziellen Basis stimmen die Komponenten g ij von g−1 mit den gij , was aber in einer beliebigen Basis nicht der Fall ist. Rolle von g als Abbildung zwischen Tensoren unterschiedlicher Typen ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Sei ~c = ci~ei ein beliebiger Vektor von V . In Übereinstimmung mit der dritten Bemerkung vom § A.1.3 a bildet das Objekt g(~c, · ) die Vektoren von V auf den zugrundeliegenden Körper K ab, d.h. es entspricht einer Linearform c = cj j , mit Komponenten e e cj = c(~ej ) = g(~c,~ej ) = g(ci~ei ,~ej ) = ci gij . (A.8a) e Das heißt, ein metrischer Tensor g stellt eine Abbildung zwischen Vektoren und Linearformen dar. Umgekehrt bildet der inverse metrische Tensor g−1 eine Linearformen auf einen Vektor, dessen Komponenten durch die Beziehungen ci = g ij cj (A.8b) gegeben sind. Die Zusammenhänge der Gl. (A.8a)–(A.8b) lassen sich auf Tensoren höherer Stufe verallgemeinern: der metrische Tensor und sein Inverser werden dann für das „Herunterstellen oder Hochstellen m von Indizes“ benutzt, d.h. für Operationen, die einen Tensor vom Typ auf einen Tensor vom n m∓1 jeweiligen Typ n±1 abbilden. Bemerkungen: ∗ Das Herunterstellen bzw. Hochstellen eines Index entspricht eigentlich dem sukzessiven Durchführen eines äußeren Produkts mit g bzw. g−1 gefolgt durch die Kontraktion zweier Indizes. Zum Beispiel ~c = ci~ei äußeres Produkt Kontraktion ~c ⊗ g = ci gjk ~ei ⊗ j ⊗ k 7−→ c = ci gik k = ck k e e e e e wobei die Verjüngung über das erste und zweite Argumente von ~c ⊗ g operiert. 7−→ ∗ Die Notation mithilfe eines Punkts des durch den metrischen Tensors induzierten Skalarprodukts von Vektoren wird oft auf Tensoren verallgemeinert, deren Kontraktion ebenfalls mit einem Punkt bezeichnet wird. Beispielsweise schreibt man für die Verjüngung einer Bilinearform T und eines Vektors ~c T · ~c = T ij i ⊗ j · ck~ek = T ij cj i , e e e 218 Tensoren auf einem Vektorraum wobei Gl. (A.2) benutzt wurde. Die Notation ist meistens nützlich wenn sie eindeutig ist, d.h. wenn der Tensor T symmetrisch ist, sodass alle seine Indizes die gleiche Rolle spielen. Auf ähnlicher Weise, für einen 20 -Tensor T und eine Bilinearform T0 T · T0 = T ij ~ei ⊗ ~ej · T0kl k ⊗ l = T ij T0jl ~ei ⊗ l . e e e Dies ist unterschiedlich von T0 · T wenn die Tensoren nicht symmetrisch sind. Die Leserin kann so gar in der Literatur die Notation T : T0 ≡ T ij T0ji finden, entsprechend zwei sukzessiven Kontraktionen. ∗ Wichtige Rolle: Struktur eines metrischen Raums A.1.5 Warum Tensoren? hier ein kurzes Essay über die Notwendigkeit von Tensoren in der Physik... A.2 Basistransformation 0 Seien B = {~ei } und B 0 = {~ej 0 } zwei Basen des Vektorraums V , und B ∗ = {i }, B 0∗ = {j } die e von B mithilfe e zugehörigen Dualbasen auf V ∗ . Die Basisvektoren von B 0 lassen sich durch jene einer regulären Matrix Λ mit Elementen Λi j 0 ausdrücken, gemäß ~ej 0 = Λi j 0~ei . (A.9) Bemerkung: Die Matrix Λ ist nicht die Matrixdarstellung eines Tensors, denn die zwei Indizes seiner Elemente beziehen sich auf zwei unterschiedliche Basen — was mit der Verwendung eines gestrichenen und eines ungestrichenen Index betont wird. Im Gegensatz sind beide Komponenten eines Tensors vom Typ 11 bezüglich der „gleichen“ Basis.(67) 0 Die Elemente der inversen Matrix Λ−1 seien mit Λk i bezeichnet, das heißt 0 0 Λk i Λi j 0 = δjk0 0 und Λi k0 Λk j = δji . 0 Man kann dann einfach nachprüfen, dass die Zahlen Λk i die Basistransformation von B ∗ nach B 0∗ angeben, und zwar 0 0 j = Λj i i . (A.10) e e Dementsprechend wird jede „Vektor“-Komponente(68) mit Λ−1 transformiert: 0 0 cj = Λj i ci , 0 0 0 0 T j1 ...jm = Λj1i1 · · · Λjmim T i1 ...im . (A.11) Wiederum transformiert sich jede „Linearform“-Komponente(69) mit Λ: hj 0 = Λi j 0 hi , T j10 ...jn0 = Λi1j10 · · · Λinjn0 T i1 ...in . (A.12) Somit lassen sich die Komponenten eines beliebigen Tensors in irgendeiner Basis erhalten, wenn man die Transformationen der (Basis-)Vektoren und Linearformen kennt. Wichtiges Beispiel von Basistransformation: Drehmatrix (67) Genauer beziehen sie sich auf eine Basis und ihre Dualbasis. Hier ist die Bezeichnung kontravariante Komponente nützlich. (69) ... oder kovariante Komponente. (68) A.2 Basistransformation 219 Literatur zum Anhang A • Ihr bevorzugtes Lehrbuch zur Linearalgebra. • Eine ziemlich ausführliche jedoch noch einfache Darstellung mit einem Schwerpunkt auf die geometrischen Anwendungen der Linearalgebra ist in Postnikov, Lectures in Geometry [34](70) zu finden, insbesondere in Lectures 1 (Anfang), 4–6 & 18. (70) Manchmal werden die verwendeten mathematischen Bezeichnungen, zumindest in der englischen Übersetzung, relativ nicht Standard, z.B. (linear, bilinear) „functional“ anstatt „form“ oder „conjugate“ (space, basis) statt „dual“. A NHANG B Drehungen In diesem Anhang wird erstens der Zusammenhang zwischen Isometrien, insbesondere Drehungen, im euklidischen Raum und orthogonalen Matrizen, die den Gl. (B.3) genügen, präzisiert. Dann werden infinitesimale Drehungen diskutiert, wobei einige Begriffe und Ergebnisse der Gruppentheorie eingeführt und ohne Beweis verwendet werden. Der Anhang bezieht sich auf Transformationen in einem dreidimensionalen Raum. Isometrien, orthogonale Abbildungen, Drehungen, usw. können aber auch in einem D-dimensionalen euklidischen Raum betrachtet werden. Die zugehörige Verallgemeinerung der Ergebnisse des Abschn. B.1 ist trivial, während jene des Abschn. B.2 mehr Arbeit erfordern. B.1 Isometrien im euklidischen Raum Definition: Eine lineare Abbildung des dreidimensionalen (affinen) euklidischen Punktraums E 3 in sich selbst heißt Isometrie, wenn sie den Abstand zwischen zwei Punkten invariant lässt. Darunter sind z.B. die Translationen sowie Transformationen mit mindestens einem Fixpunkt, wie die Drehungen oder die Punktspiegelungen. Die Verkettung zweier Isometrien gibt wieder eine Isometrie. Da die Identitätstransformation in E 3 selbst eine Isometrie ist, während jede Isometrie bijektiv ist — und somit eine inverse Transformation besitzt, die eine Isometrie ist —, bilden die Menge der Isometrien, versehen mit der Verkettung, eine Gruppe, die mit ISO(3) bezeichnet wird. Bemerkung: Statt von Isometrien spricht man auch oft von Bewegungen und dementsprechend von der Bewegungsgruppe.(71) Beschränkt man die Diskussion auf die Transformationen mit einem Fixpunkt, der als Ursprungspunkt eines kartesischen Koordinatensystems gewählt wird, so ist eine solche Isometrie äquivalent zu einer linearen Abbildung O im euklidischen Vektorraum R3 der Form ~x ∈ R3 7→ ~x 0 = O(~x) ∈ R3 , (B.1) die das euklidische Skalarprodukt ~x · ~x invariant lässt, d.h. ~x 0 · ~x 0 = ~x · ~x. Diese Abbildung O wird orthogonale Transformation genannt. Da die orthogonalen Transformationen linear sind, können sie in Matrixform dargestellt werden. Gegeben sei ein System von kartesischen Koordinaten. Ordnet man den Vektoren ~x, ~x 0 von R3 bzw. der orthogonalen Abbildung O die reellen dreikomponentigen Spaltenvektoren ihrer Komponenten bzw. eine 3×3-Matrix zu, die ebenfalls mit ~x, ~x 0 bzw. O bezeichnet werden, so lässt sich Gl. (B.1) als ~x 7→ ~x 0 = O~x (B.2a) umschreiben. Unter Verwendung der jeweiligen Koordinaten xi , x0i mit i = 1, 2, 3 der Vektoren und (71) Im Rahmen einer Mechanik-Vorlesung könnten diese Bezeichnungen aber verwirrend sein! 221 B.1 Isometrien im euklidischen Raum der Matrixelemente O ij mit i, j = 1, 2, 3 der Abbildungsmatrix O lautet dies auch xi 7→ x0i = O ij xj für i = 1, 2, 3 (B.2b) wobei die Einstein’sche Summenkonvention benutzt wurde. In Matrixdarstellung lautet das Skalarprodukt ~xT ~x, mit ~xT dem zu ~x transponierten Zeilenvektor. Damit die Matrix O eine orthogonale Transformation darstellt, muss für jeden ~x ∈ R3 ~xT ~x = ~x 0T ~x 0 = (O~x)T O~x = ~xT O TO~x gelten, d.h. die Matrix muss der Eigenschaft O T O = 13 (B.3a) genügen, mit 13 der 3×3-Einheitsmatrix. Alternativ kann man O T = O −1 (B.3b) schreiben. Umgekehrt stellt jede Matrix O, die diese Gleichung erfüllt, eine orthogonale Transformation des dreidimensionalen Raums dar. Eine solche Matrix wird orthogonale 3×3-Matrix genannt. Diese Matrizen bilden eine Gruppe, die sog. orthogonale Gruppe O(3). Bemerkungen: ∗ Dank der Beschränkung auf Isometrien vonE 3 mit einem festen Fixpunkt ist die Korrespondenz zwischen solchen Isometrien und den Matrizen von O(3) bijektiv. Mathematisch gesagt ist diese Korrespondenz eine sog. lineare Darstellung der Isometrien mit einem Fixpunkt — d.h. ein Homomorphismus von der Gruppe solcher Isometrien in die Gruppe GL(V ) der Automorphismen (d.h. der bijektiven linearen Abbildungen) eines Vektorraums V , des Darstellungsraums, in sich selbst. Da die O(3)-Matrizen den Automorphismen eines dreidimensionalen Vektorraums (R3 ) entsprechen, ist die Darstellung „vom Grad 3“. Diese wird noch als unitär bezeichnet, denn die Matrizen der Darstellung sind unitär — sie sind reell und erfüllen Gl. (B.3). Schließlich ist die Darstellung irreduzibel , weil es keinen nicht-trivialen Unterraum des Darstellungsraums gibt, der invariant unter der Wirkung der ganzen Gruppe O(3) ist. ∗ In diesem Anhang werden aktive Transformationen der Vektoren betrachtet, entsprechend der eigentlichen Operation (Drehen. . . ) auf ein Objekt, nicht der Änderung des Gesichtspunkts. Dementsprechend beziehen sich die Komponenten xi , x0i auf zwei unterschiedliche geometrische Vektoren beobachtet in demselben Koordinatensystem. Somit unterscheidet sich Gl. (B.2b) von der ersten Beziehung in Gl. (A.11), die den Zusammenhang zwischen Koordinaten eines einzigen Vektoren in zwei verschiedenen Koordinatensystemen angibt. Bildet man die Determinante der Gleichung (B.3a), so erhält man (det O)2 = 1, d.h. det O = ±1. Die Matrizen mit Determinante +1 formen die spezielle orthogonale Gruppe SO(3), deren Elemente, die Drehmatrizen — die in diesem Skript meistens mit dem Buchstaben R bezeichnet werden —, die dreidimensionalen Drehungen um den Ursprungspunkt darstellen. Beispielsweise entspricht der Drehung um einen Winkel θ ∈ R um die x3 -Achse die Drehmatrix cos θ − sin θ 0 R = sin θ cos θ 0 . (B.4) 0 0 1 Wiederum ergeben sich die Isometrien(72) mit Determinante −1 durch Komposition der Drehungen mit der Raumspiegelung ~x 7→ ~x 0 = −~x, d.h. der Punktspiegelung bezüglich des Ursprungspunktes des Koordinatensystems, die der Abbildungsmatrix −13 entspricht. (72) Genauer, die durch eine orthogonale Matrix mit Determinante −1 dargestellten Isometrien. 222 Drehungen Bemerkung: Die Bijektivität der Korrespondenz zwischen Isometrien vonE 3 mit einem festen Fix- punkt und orthogonalen 3×3-Matrizen wird benutzt, um die letzteren ebenfalls als „Isometrien“ zu nennen. Dementsprechend werden die Matrizen von SO(3) oft als „Drehungen“ bezeichnet, obwohl sie eigentlich nur eine der möglichen Matrixdarstellungen der Drehungen sind. B.2 Infinitesimale Drehungen Die Resultate dieses Abschnitts werden nirgendwo in der Vorlesung benutzt. Sie lassen sich aber problemlos nachprüfen, und werden in weiteren Vorlesungen auftauchen. Eine Drehung um den infinitesimal kleinen Winkel dθ um die j-te Koordinatenachse transformiert einen Vektor ~x von R3 in ~x 0 = R(~x) = ~x + dθ~ej × ~x (B.5a) mit ~ej dem Einheitsvektor in Richtung j. Unter Verwendung kartesischer Koordinaten lautet diese Transformation (B.5b) x0k = R kl xl = xk + dθkjl xl = xk − dθjkl xl , wobei kjl ≡ δ ki ijl bzw. jkl ≡ δ ki jil , d.h. numerisch kjl = −jkl = −jkl .(73) Nach Identifikation sind die Elemente der Darstellungsmatrix R durch R kl = δlk − dθjkl (B.5c) gegeben. Die Drehmatrix lässt sich somit als R = 13 − i dθJj (B.5d) umschreiben, wobei Jj eine 3 × 3-Matrix ist, die als Generator oder Erzeuger der Gruppe SO(3) bezeichnet ist, und deren Matrixelemente (Jj )kl = −ijkl sind. In Matrixdarstellung 0 J1 = 0 0 (B.6a) lauten die drei Generatoren von SO(3) 0 0 0 0 i 0 −i 0 0 −i , J2 = 0 0 0 , J3 = i 0 0 . i 0 −i 0 0 0 0 0 Beispielsweise ist die Matrix einer infinitesimalen Drehung 1 −dθ 1 R = 13 − i dθJ3 = dθ 0 0 um die x3 -Achse 0 0 , 1 (B.6b) (B.6c) wobei der letzte Ausdruck auch aus einer Taylor-Entwicklung von Gl. (B.4), mit Winkel dθ statt θ, bis zur Ordnung O(dθ) folgt. Die Matrizen (B.6b) besitzen einige wichtigen Eigenschaften. Erstens sind sie offensichtlich hermitesch.(74) Dazu prüft man einfach nach, dass die Generatoren Jj den Vertauschungsrelationen [Ji , Jj ] = iijk Jk für alle i, j ∈ {1, 2, 3} (B.6d) genügen, wobei die rechteckigen Klammer den Kommutator zweier Matrizen bezeichnet.(75) (73) In kartesischen Koordinaten spielt die Stelle der Indizes, oben oder unten, keine Rolle. In einem System beliebiger Koordinaten wird sie aber wichtig; dann sollten die Faktoren δ ki durch die Komponenten g ki des inversen metrischen Tensors ersetzt werden. (74) D.h., die komplex konjugierte Matrix Jj∗ ist gleich der Transponierten JjT . (75) [A, B] ≡ AB − BA. B.2 Infinitesimale Drehungen 223 Allgemein lautet die 3×3-Matrixdarstellung der infinitesimalen Drehung um den Winkel dθ um die Achse mit Einheitsvektor ~e R = 13 − i dθ~e ·J~ , (B.7) wobei zu beachten ist, dass das Punktprodukt ~e ·J~ eine 3×3-Matrix bezeichnet. Eine Drehung um einen beliebigen Winkel θ kann dann als Produkt von N Drehungen um den Winkel θ/N um die gleiche Achse ausgedrückt werden. Somit erhält man die Exponentialdarstellung N θ ~ R = lim 13 − i ~e ·J = exp −iθ~e ·J~ . (B.8) N →∞ N Bemerkungen: ∗ Die Einführung eines Faktors i in Gl. (B.5d), und entsprechend in die Matrizen Jj Gl. (B.6), ist zwar überraschend, denn die SO(3)-Matrizen sind reell. Dieser Faktor erlaubt aber eine einfache Verallgemeinerung auf Gruppen komplexer Matrizen. ∗ Das Minus-Zeichen in Gl. (B.8) — und in den vorigen Gleichungen — gilt für eine aktive Drehung; für eine passive Drehung, entsprechend einer Basistransformation, kommt ein Plus-Zeichen. ∗ Die Generatoren werden oft mit Tj statt Jj bezeichnet. A NHANG C Legendre-Transformation C.1 Legendre-Transformation einer Funktion einer Variablen Sei f (x) eine strikt konvexe reelle Funktion einer reellen Variablen x auf einem Definitionsintervall I, d.h. für alle x1 , x2 ∈ I mit x1 6= x2 und λ ∈ ]0, 1[ gilt f λx1 + (1 − λ)x2 < λf (x1 ) + (1 − λ)f (x2 ). Sei zudem angenommen, dass f zweimal stetig differenzierbar ist. Dann ist die erste Ableitung f 0 streng monoton wachsend und demzufolge die zweite Ableitung 00 f (x) positiv für alle x ∈ I. Die Funktion y auf I definiert durch y(x) ≡ f 0 (x) für alle x ∈ I ist eine bijektive Abbildung von I nach ihrer Wertemenge J ; daher ist sie invertierbar. Hiernach wird die Umkehrfunktion als x(y) bezeichnet. Die Legendre-Transformierte der Funktion f ist eine Funktion g auf J , die für alle y ∈ J durch g(y) ≡ yx(y) − f x(y) (C.1) definiert ist. Da die Ableitung von g nach der Variablen y gleich x(y) ist, findet man, dass eine zweite Legendre-Transformation von g genau f gibt. Das heißt, die Legendre-Rücktransformation nimmt die gleiche Form wie die direkte Transformation an. Sei h(z) = zy(z) − g y(z) mit z(y) = g 0 (y). Die Anwendung der Kettenregel an Gl. (C.1) gibt g 0 (y) = x(y) + yx0 (y) − f 0 x(y) x0 (y) = x(y), d.h. z(y) = x(y). Daher gilt h(x) = xy(x) − g y(x) = f (x), wobei Gl. (C.1) benutzt wurde. 2 Zudem gelten Beziehungen zwischen den Ableitungen von f und g nach ihrer jeweiligen Variablen ab der zweiten Ordnung, insbesondere f 00 (x) g 00 y(x) = f 00 x(y) g 00 (y) = 1. (C.2) C.2 Legendre-Transformation einer Funktion mehrerer Variablen Sei jetzt eine Funktion f (x1 , . . . , xn , t1 , . . . , tp ) von n + p reellen Variablen, mit ∂2f >0 ∂xj ∂xk für alle j, k = 1, . . . n. Für jedes j = 1, . . . , n wird eine Funktion yj durch yj ({xi }, {tk }) ≡ ∂f ({xi }, {tk }) ∂xj definiert, mit xi ({yj }, {tk }) den Umkehrfunktionen, deren Existenz durch die Forderungen an die zweiten Ableitungen gewährleistet wird. C.2 Legendre-Transformation einer Funktion mehrerer Variablen 225 Die Legendre-Transformierte g von f bezüglich der Variablen {xi } wird durch n X g(y1 , . . . , yn , t1 , . . . , tp ) ≡ yj xj − f (x1 , . . . , xn , t1 , . . . , tp ) (C.3) j=1 definiert, wobei die (y1 , . . . , yn , t1 , . . . , tp )-Abhängigkeit der Funktionen xi der Kürze halber nicht geschrieben wurde. Hier auch ist die Rücktransformation gleich der direkten Transformation, d.h. eine zweite Legendre-Transformation von g genau f wiedergibt. Man sieht sofort, dass die ersten Ableitungen von f und g nach tk negativ zueinander sind: ∂f ∂g ({yi }, {tk }) = − ({xi }, {tk }) ∂tj ∂tj (C.4) Für die zweiten Ableitungen von f und g nach ihren jeweiligen natürlichen Variablen ergeben sich mehrere Beziehungen n X ∂2g ∂2f δik = (C.5a) ∂yi ∂yj ∂xj ∂xk j=1 analog zur Gl. (C.2), sowie n X ∂2g ∂2g ∂2f = , ∂yi ∂tk ∂yi ∂yj ∂xj ∂tk ∂2g ∂ti ∂tk = ∂2f ∂ti ∂tk j=1 n X + j,l=1 ∂2f ∂2g ∂2f . ∂ti ∂xj ∂yj ∂yl ∂xl ∂tk (C.5b) (C.5c) Bemerkung: Manchmal, insbesondere in der Thermodynamik und Statistischen Physik, nennt man −g die Legendre-Transformierte von f anstatt g. Literatur zum Anhang C • Arnold, Mathematical methods of classical mechanics [1] Kap. 3 § 14. • Nolting, Analytische Mechanik [16] Kap. 2.1. • Scheck, Mechanik [18] Kap. 2.13–1.14. A NHANG D Die δ -Distribution Physiker verwenden in ihren Modellierungen oft punktförmige Objekte, wie Massenpunkte oder Punktladungen. Zur Beschreibung solcher Objekte wurde die δ-Distribution eingeführt, die in diesem Anhang samt ihrer Eigenschaften kurz dargestellt wird. D.1 Definition und erste Ergebnisse D.1.1 Definition Definition: Als Testfunktion auf einem Raum Ω wird eine Funktion T bezeichnet, die einerseits glatt — d.h. beliebig oft differenzierbar — ist, und andererseits einen kompakten Träger besitzt — d.h. T verschwindet außerhalb eines beschränkten Gebiets von Ω. Sei C0∞ (Ω) der Raum der Testfunktionen auf Ω. In diesem und dem folgenden Abschnitt ist Ω = R, in Abschn. D.3 ist Ω = Rn mit n ≥ 1. Definition: Die δ-Distribution, auch Dirac-Distribution oder Dirac-δ genannt,(76) ist eine stetige lineare Abbildung auf C0∞ (R), die einer Testfunktion T ihren Wert T (0) zuordnet. Für die Operation der δ-Distribution auf eine Testfunktion T existieren mehrere Notationen: Mathematiker schreiben entweder hδ, T i = T (0) oder, selten, δ[T ] = T (0). Physiker verwenden aber die (inkorrekte!) Schreibweise Z T (x)δ(x) dx = T (0), (D.1) wobei das Integrationszeichen ohne Grenzen eine Integration von −∞ bis ∞ bedeuten soll. Diese Notation wird hiernach weiter motiviert, muss aber mit Vorbehalt genommen werden. Insbesondere handelt es sich beim Integrationszeichen nicht um ein (Lebesgue-)Integral mit dem üblichen Integrationsmaß, wie bei der Integration von Funktionen. Bemerkungen: ∗ Die δ-Distribution ist ein Beispiel von. . . Distribution, d.h. von einem stetigen linearen Funktional auf einem Raum von Testfunktionen sind, das den üblichen Begriff einer Funktion verallgemeinert — weshalb Distributionen auch als verallgemeinerte Funktionen bezeichnet werden. ∗ Die Beschränkung auf (Test)Funktionen mit einem kompakten Träger kann aufgehoben werden. ∗ Die mithilfe einer δ-Distribution modellierten physikalischen Größen sind meistens Verteilungen, die als Gewicht in Integralen dienen, was eine erste Motivation die Schreibweise (D.1) gibt. Wichtig dabei ist, dass wenn die Variable x eine physikalische Dimension X hat, dann hat δ(x) die Dimension X−1 , so dass δ(x) dx dimensionslos ist. (76) oder noch, fehlerhaft, δ- bzw. Dirac-Funktion, da es sich nicht um eine „Funktion“ handelt. 227 D.1 Definition und erste Ergebnisse D.1.2 Erste Eigenschaften Definitionsgemäß ist die δ-Distribution linear, d.h. gegeben zwei beliebige Testfunktionen T1 , T2 und zwei Zahlen λ1 , λ2 , sie erfüllt die Bedingung hδ, λ1 T1 +λ2 T2 i = λ1 hδ, T1 i + λ2 hδ, T2 i, d.h. mit der Notation der Physiker Z Z Z λ1 T1 (x) + λ2 T2 (x) δ(x) dx = λ1 T1 (x)δ(x) dx + λ2 T2 (x)δ(x) dx. (D.2) Schließlich ist dies noch gleich λ1 T1 (0) + λ2 T2 (0). Diese Eigenschaft ist eine der Motivationen hinter der Schreibweise (D.1), denn sie gilt für das übliche Integral von Funktionen. Unter Verwendung der Integralschreibweise sieht auch die folgende Faltungseigenschaft trivial aus. Sei ξ ∈ R; dann gilt Z T (x)δ(x − ξ) dx = T (ξ). (D.3) Die unterliegende mathematische Konstruktion ist etwa aufwändig: dabei wird eine translatierte δ-Distribution δ(ξ) definiert, die auf eine Testfunktion gemäß hδ(ξ) , T i = T (ξ) operiert. Dann gilt symbolisch hδ(ξ)(x), T (x)i ≡ hδ(x), T (x + ξ)i ≡ hδ(x − ξ), T (x)i, wobei die letzte Gleichung als Definition von δ(x − ξ) zu betrachten ist. Wird die „definierende“ Beziehung (D.1) auf T (x) = e−ikx angewandt — wobei es sich natürlich nicht um eine Testfunktion von C0∞ (R) handelt —, so ergibt sich Z e−ikx δ(x) dx = 1. (D.4a) Diese Gleichung sieht wie eine Formel für die Fourier-Transformation der δ-Distribution aus, und die entsprechende Rücktransformation lautet Z dk δ(x) = eikx . (D.4b) 2π Diese Formel stellt die sog. Fourier-Darstellung der δ-Distribution dar. Wieder lassen sich diese Ergebnisse mathematisch korrekt begründen, indem die herkömmliche Fourier-Transformation auf Distributionen verallgemeinert wird. D.1.3 Darstellungen der δ -Distribution Die δ-Distribution lässt sich als Grenzwert einer Funktionenfolge darstellen, d.h. symbolisch δ(x) = lim δε (x) ε→0 (D.5a) mit δε eine (integrierbare) Funktion im üblichen Sinn, die von einem reellen Parameter ε > 0 kontinuierlich abhängt. Dabei bedeutet der obige Grenzwert Z Z f (x)δ(x) dx = lim f (x)δε (x) dx (D.5b) ε→0 für jede Funktion f mit bestimmten Eigenschaften — z.B. jede Testfunktion von C0∞ (R).(77) Dann bilden die Funktionen δε eine Darstellung der δ-Distribution. Da δε eine Funktion ist, ist das Integral auf der rechten Seite von Gl. (D.5b) ein übliches (Lebesgue)-Integral. Somit wird das Verwenden der Integralnotation für die Operation auf f der δ-Distribution, auf der linken Seite von Gl. (D.5b), weiter motiviert. (77) Je nach der gewählten Klasse von Funktionen f können die Funktionen δε eine passende Darstellung bilden oder nicht. Die δ -Distribution 228 Die Funktionen δε werden oft so gewählt, dass sie die folgenden Eigenschaften haben: • sie haben einen Peak bei x = 0, der mit abnehmenden ε schmaler und höher wird; • für jeden x 6= 0 gilt lim δε (x) = 0; ε→0 Z • δε (x) dx = 1. Die Leserin kann nachprüfen, dass die hiernach angegebenen Beispiele diese Eigenschaften erfüllen. D.1.3 a Skalierte Rechteckfunktionen ::::::::::::::::::::::::::::::::::::: Eine einfache Darstellung, jedoch durch unstetige Funktionen, ist 1 für |x| < ε δε (x) = 2ε 0 für |x| > ε. D.1.3 b Skalierte Dreieckfunktionen :::::::::::::::::::::::::::::::::::: Eine stetige, aber nicht überall differenzierbare Darstellung, ist ε − |x| für |x| ≤ ε ε2 δε (x) = 0 für |x| > ε. (D.6) (D.7) D.1.3 c Exponentialfunktionen ::::::::::::::::::::::::::::::: Ebenfalls nicht überall differenzierbar — diesmal liegt das Problem in x = 0 — ist die Darstellung durch Exponentialfunktionen 1 −|x|/ε δε (x) = e . (D.8) 2ε D.1.3 d Gaußsche Verteilungen ::::::::::::::::::::::::::::::: Gaußsche Verteilungen liefern eine unendlich differenzierbare Darstellung: 1 2 2 δε (x) = √ e−x /2ε . ε 2π (D.9) D.1.3 e Lorentz-Verteilungen ::::::::::::::::::::::::::::: Mithilfe von Lorentz-Verteilungen ergibt sich die Darstellung: δε (x) = 1 ε 1 1 = Im . 2 2 π x +ε π x − iε (D.10) D.1.3 f Kardinalsinus ::::::::::::::::::::: Ebenfalls nützlich ist die Darstellung sin(x/ε) πx δε (x) = 1 πε für x 6= 0 (D.11) für x = 0, wobei die Definition des Zahlenwerts in x = 0 die Stetigkeit der Funktion δε gewährleistet. Für x 6= 0 gilt nämlich Z 1/ε dk δε (x) = eikx , 2π −1/ε und der Limes → 0 gibt die Fourier-Darstellung (D.4b) wieder. 229 D.2 Rechenregeln D.1.4 Heaviside-Funktion Definition: Die Heaviside- oder Stufenfunktion wird durch Θ(x) = 1 für x > 0 (D.12) 0 für x < 0 definiert, wobei ihr Wert für x = 0 irrelevant ist. Für diese Funktion kann man, genau wie für die δ-Distribution, Darstellungen Θε finden, mit Θ(x) = lim Θε (x) (D.13a) ε→0 oder genauer Z lim ∞ ε→0 −∞ Z ∞ Z ∞ f (x) dx f (x)Θ(x) dx = f (x)Θε (x) dx = −∞ (D.13b) 0 für jede passende Funktion f , wobei die zweite Gleichung aus der Definition der Heaviside-Funktion folgt. Dann liefert die Ableitung jeder (differenzierbaren!) Darstellung Θε der Heaviside-Funktion eine Darstellung δε der δ-Distribution: symbolisch schreibt man Θ0ε = δε oder noch Θ0 (x) = δ(x). (D.14) Dabei handelt es sich um eine Ableitung „im Sinne der Distributionen“. Beispiele von Darstellungen der Heaviside-Funktion sind 0 für x < −ε x+ε Θε (x) = für |x| ≤ ε 2ε 1 für x > ε, entsprechend der Darstellung (D.6) der δ-Distribution, oder x 1 1 , Θε (x) = + arctan 2 π ε (D.15) (D.16) deren Ableitung die Darstellung (D.10) der δ-Distribution wiedergibt. D.2 Rechenregeln Neben den schon in § D.1.2 angegebenen Eigenschaften gelten noch weitere, die hiernach ohne Beweis(78) aufgelistet werden. D.2.1 Skalierung Sei a ∈ R (oder allgemeiner a ∈ C); dann gilt eine Skalierungseigenschaft, die sich symbolisch als δ(ax) = 1 δ(x) |a| (D.17a) schreiben lässt, was eigentlich Z T (x)δ(ax) dx = 1 T (0), |a| (D.17b) für jede Testfunktion T bedeutet. (78) Die interessierte Leserin kann die verschiedenen Gleichungen relativ leicht prüfen, indem sie die δ-Distribution als Grenzwert einer Darstellung schreibt. Die δ -Distribution 230 Für eine Darstellung δε folgt die entsprechende Gleichung einfach aus einer Substitution der Integrationsvariablen. Insbesondere gilt für a = −1 δ(−x) = δ(x), (D.18) d.h. die δ-Distribution ist gerade. D.2.2 Ableitung Man definiert eine Distribution δ 0 , die sich bezüglich der δ-Distribution wie die Ableitung f 0 bezüglich einer (Stamm)Funktion f verhält. Dann gilt für jede Testfunktion T Z T (x)δ 0 (x) dx = −T 0 (0). (D.19) Nimmt man die Integralschreibweise ernst und führt man eine partielle Integration durch, so ergibt sich Z Z h i∞ − T 0 (x)δ(x) dx, T (x)δ 0 (x) dx = T (x)δ(x) −∞ woraus das gesuchte Ergebnis „folgt“, denn T verschwindet im Unendlichen. Auf ähnlicher Weise wird eine zweite Ableitung δ 00 definiert, für die Z T (x)δ 00 (x) dx = T 00 (0) 2 (D.20) gilt, und so weiter für die höheren Ableitungen. D.2.3 Substitution der Integrationsvariablen Sei f eine differenzierbare reelle Funktion auf R, mit einer einzigen Nullstelle in x0 : f (x0 ) = 0, wo ihre Ableitung nicht Null ist, f 0 (x0 ) 6= 0. Dann gilt für die Verkettung von der δ-Distribution mit f 1 δ f (x) = 0 δ(x − x0 ), (D.21a) |f (x0 )| entsprechend für jede Testfunktion T Z Z 1 1 T (x)δ(x − x0 ) dx = 0 T (x0 ). (D.21b) T (x)δ f (x) dx = 0 |f (x0 )| |f (x0 )| Dank den Annahmen über f gilt in der Nachbarschaft von x0 f (x) ∼ f (x0 ) + f 0 (x0 )(x − x0 ) + O (x − x0 )2 = f 0 (x0 )(x − x0 ) + O (x − x0 )2 . Das Ergebnis folgt dann aus der Skalierungseigenschaft (D.17). 2 Für eine Funktion f mit mehreren Nullstellen xi , in denen die Ableitung f 0 nicht verschwindet, gilt die Verallgemeinerung δ f (x) = X Nullstellen xi 1 |f 0 (x i )| δ(x − xi ). (D.22) Beispiel 1: Sei f (x) = arctan x, mit einer einzigen Nullstelle in x0 = 0, während die Ableitung f 0 (x) = 1/(1 + x2 ) nirgendwo verschwindet. Da f 0 (0) = 1 lautet wird Gl. (D.21a) zu δ(arctan x) = δ(x). D.3 Mehrdimensionale δ -Distributionen 231 Beispiel 2: Sei f (x) = x2 − a2 mit a ∈ R+ ; f hat zwei Nullstellen in −a und a. Aus f 0 (x) = 2x folgen f 0 (−a) = −2a, f 0 (a) = 2a, und somit |f 0 (−a)| = |f 0 (a)| = 2a. Somit ergibt Gl. (D.22) 1 δ(x2 − a2 ) = δ(x − a) + δ(x + a) . (D.23) 2a Bemerkung: Falls eine Funktion f eine Nullstelle x0 mit f 0 (x0 ) = 0 hat, kann man die Funktion oft leicht „verformen“, um statt nur x0 zwei (oder mehr) Nullstellen zu erhalten, in denen die Ableitung nicht verschwindet. Beispielsweise würde man δ(x2 ) durch δ(x2 − η) ersetzen, den letzteren Ausdruck mithilfe der Gl. (D.23) umschreiben, die daraus folgenden Berechnungen durchführen, und schließlich den Limes η → 0 betrachten. . . und hoffen, dass das Ergebnis sinnvoll ist! D.3 Mehrdimensionale δ -Distributionen Seien x1 , x2 , . . . , xn unabhängige Variablen, die in einen n-dimensionalen Vektor x zusammengefasst werden. Betrachtet man Testfunktionen T (x) dieser n-Variablen, so kann man eine n-dimensionale δ-Distribution, die oft mit δ (n) bezeichnet wird, gemäß Z (D.24) T (x)δ (n)(x) dn x = T (0), wobei das Integral über Rn ist. Anders gesagt gilt δ (n) 1 n (x) = δ(x ) · · · δ(x ) = n Y δ(xk ). (D.25) k=1 Die für die eindimensionale δ-Distribution angegebenen Eigenschaften lassen sich einfach auf δ (n) verallgemeinern. Beispielsweise gelten die Faltungseigenschaft Z (D.26) T (x)δ (n)(x − ξ) dn x = T (ξ), wobei ξ ∈ Rn , sowie die Fourier-Darstellung δ (n) Z (x) = eik·x dn k (2π)n (D.27) mit k · x dem euklidischen Skalarprodukt k 1 x1 + · · · + k n xn . Die Skalierungseigenschaft lautet jetzt δ (n)(ax) = 1 (n) δ (x) |a|n (D.28) für a ∈ R, und kann erweitert werden: wenn A eine invertierbare n×n-Matrix ist, dann ist δ (n)(A x) = 1 δ (n)(x). | det A | (D.29) Ähnlich gilt im Fall einer Variablenänderung (x1 , . . . , xn ) → (y 1 , . . . , y n ) bzw. x → y δ (n)(y) = 1 δ (n)(x) | det J| (D.30) mit J der Jacobi-Matrix der Substitution, mit Elementen ∂y i /∂xj . Aus dieser letzten Gleichung lässt sich die Verallgemeinerung der Formel (D.22) ableiten. 232 Literatur zum Anhang D • Gelfand & Shilov, Verallgemeinerte Funktionen. Band 1 [35], Kap. I. • Schwartz, Mathematische Methoden der Physik. Band 1 [36], Kap. II. Die δ -Distribution A NHANG E Kugelflächenfunktionen Betrachte man (zweimal kontinuierlich differenzierbare) Funktionen auf der Einheitskugelfläche S2 von R3 , d.h. Funktionen des Polarwinkels θ ∈ [0, π] und des Azimutwinkels ϕ ∈ [0, 2π]. Unter diesen Funktionen lassen sich sog. Kugelflächenfunktionen Y`m (θ, ϕ) ∈ C mit ` = 0, 1, . . . einer beliebigen ganzen Zahl und m ∈ {−`, −` + 1, . . . , 0, . . . , `} mit folgenden Eigenschaften finden: • Die Kugelflächenfunktionen sind gleichzeitige Eigenfunktionen der zwei hiernach über ihre ~ˆ2 Operation auf eine zweimal differenzierbare Funktion f definierten Differentialoperatoren L und L̂3 −1 ∂ ∂f (θ, ϕ) 1 ∂ 2f (θ, ϕ) ˆ2 ~ L f (θ, ϕ) ≡ sin θ − (E.1a) sin θ ∂θ ∂θ sin2 θ ∂ϕ2 und L̂3 f (θ, ϕ) ≡ −i ∂f (θ, ϕ) . ∂ϕ (E.1b) Genauer gelten ~ˆ2 Y`m (θ, ϕ) = `(` + 1)Y`m (θ, ϕ) und L̂3 Y`m (θ, ϕ) = mY`m (θ, ϕ). L • Die Kugelflächenfunktionen genügen der Beziehung Z π Z 2π ∗ Y`m (θ, ϕ) Y`0 m0 (θ, ϕ) dϕ sin θ dθ = δ``0 δmm0 . 0 (E.2) (E.3) 0 • Jede zweimal kontinuierlich differenzierbare Funktion f auf S2 lässt sich als Summe f (θ, ϕ) = ∞ X ` X a`m Y`m (θ, ϕ) (E.4a) `=0 m=−` von Kugelflächenfunktionen schreiben, wobei die Koeffizienten a`m eindeutig durch Z π Z 2π ∗ a`m = Y`m (θ, ϕ) f (θ, ϕ) dϕ sin θ dθ 0 (E.4b) 0 gegeben sind. Diese Eigenschaften werden beispielsweise durch die folgenden Funktionen erfüllt: für ` = 0 1 Y00 (θ, ϕ) = √ ; 4π (E.5a) für ` = 1 r 3 cos θ 4π r 3 Y1±1 (θ, ϕ) = ∓ sin θ e±iϕ ; 8π Y10 (θ, ϕ) = (E.5b) (E.5c) 234 Kugelflächenfunktionen für ` = 2 r 5 (cos2 θ − 1) 16π r 15 Y2±1 (θ, ϕ) = ∓ sin θ cos θ e±iϕ 8π r 15 Y2±2 (θ, ϕ) = sin2 θ e±2iϕ ; 32π Y20 (θ, ϕ) = (E.5d) (E.5e) (E.5f) usw. Bemerkungen: ~ˆ2 ist in der Tat der Winkelanteil des Laplace-Operators in Kugelkoor∗ Der Differentialoperator L dinaten (r, θ, ϕ): ~ˆ2 f (~r) L 1 ∂2 4f (~r) = rf (~ r) − (E.6) r ∂r2 r2 ∗ Die dritte Eigenschaft [Gl. (E.4)] bedeutet, dass die Kugelflächenfunktionen eine (Hilbert-)Basis des Raums der zweimal kontinuierlich differenzierbaren Funktionen auf S2 bilden. Die Koeffizienten a`m sind dann die Komponenten einer Funktion f auf dieser Basis. ∗ Führt man eine Abbildung über Funktionen auf S2 Z π Z 2π ∗ (f, g) 7→ hf, gi ≡ f (θ, ϕ) g(θ, ϕ) dϕ sin θ dθ 0 0 ein, so ist diese eine hermitesche Sesquilinearform,(79) die ein Skalarprodukt auf dem Raum der Funktionen definiert. Dann ist die Basis der {Y`m } laut Gl. (E.3) eine Orthonormalbasis für dieses Skalarprodukt. Einerseits sind unterschiedliche Kugelflächenfunktionen orthogonal zueinander (hY`m , Y`0 m0 i = 0 falls ` 6= `0 und m 6= m0 ); andererseits ist jede Y`m auf 1 normiert (hY`m , Y`m i = 1). ∗ Manchmal werden reellwertige Kugelflächenfunktionen√anstatt komplexwertiger √ Funktionen definiert. Diese reellen Varianten — wie z.B. (Y11 + Y1−1 )/ 2 oder (Y11 − Y1−1 )/ 2 — bilden noch ~ˆ2 ; sie sind aber nicht mehr Eigeneine Orthonormalbasis und sind Eigenfunktionen zum Operator L funktionen zu L̂3 . (79) D.h. die Abbildung h · , · i erfüllt für alle Funktionen f , g, h die Bedingungen i. hf, f i ≥ 0; ii. hf, f i = 0 nur für f = 0; iii. hf, gi = hg, f i∗ ; iv. hf, λg + µhi = λ hf, gi + µ hf, hi für alle λ, µ ∈ C. Literaturverzeichnis [1] V. I. Arnold, Mathematical methods of classical mechanics, 2nd Aufl. (Springer, New York, 1989). [2] T. Fließbach, Lehrbuch zur theoretischen Physik I. Mechanik , 7. Aufl. (Springer-Verlag, Berlin & Heidelberg, 2015). [3] T. Fließbach, Lehrbuch zur theoretischen Physik II. Elektrodynamik , 6. Aufl. (Springer-Verlag, Berlin & Heidelberg, 2012). [4] H. Goldstein, C. Poole, J. Safko, Classical mechanics, 3. Aufl. (Wiley-VCH, Weinheim, 2012). [5] H. Goldstein, C. Poole, J. Safko, Classical mechanics, 3rd Aufl. (Addison-Wesley, Reading, MA, 2001). [6] W. Greiner, Klassische Mechanik I , 8. Aufl. (Harri Deutsch, Frankfurt am Main, 2007). [7] W. Greiner, Klassische Mechanik II , 8. Aufl. (Harri Deutsch, Frankfurt am Main, 2008). [8] W. Greiner, Klassische Elektrodynamik , 7. Aufl. (Harri Deutsch, Frankfurt am Main, 2008). [9] D. J. Griffiths, Elektrodynamik , 3. Aufl. (Pearson, München, 2011). [10] D. J. Griffiths, Introduction to Electrodynamics, 3rd Aufl. (Prentice-Hall, Upper Suddle River, NJ, 1999). [11] J. D. Jackson, Klassische Elektrodynamik , 4. Aufl. (de Gruyter, Berlin, 2013). [12] J. D. Jackson, Classical electrodynamics, 3. Aufl. (John Wiley & Sons, New York, 1999). [13] L. Landau, E. Lifschitz, Lehrbuch der theoretischen Physik. Band I : Mechanik , 14. Aufl. (Harri Deutsch, Frankfurt am Main, 1997). [14] L. Landau, E. Lifschitz, Lehrbuch der theoretischen Physik. Band II : Klassische Feldtheorie, 12. Aufl. (Harri Deutsch, Frankfurt am Main, 1997). [15] W. Nolting, Grundkurs Theoretische Physik. Band 1 : Klassische Mechanik , 8. Aufl. (Springer, Berlin & Heidelberg, 2006). [16] W. Nolting, Grundkurs Theoretische Physik. Band 2 : Analytische Mechanik , 7. Aufl. (Springer, Berlin & Heidelberg, 2006). [17] W. Nolting, Grundkurs Theoretische Physik. Band 3 : Elektrodynamik , 8. Aufl. (Springer, Berlin & Heidelberg, 2007). [18] F. Scheck, Theoretische Physik 1 : Mechanik , 8. Aufl. (Springer, Berlin & Heidelberg, 2007). [19] F. Scheck, Theoretische Physik 3 : Klassische Feldtheorie, 2. Aufl. (Springer, Berlin & Heidelberg, 2006). 236 Literaturverzeichnis [20] R. P. Feynman, R. B. Leighton, M. Sands, Feynman-Vorlesungen über Physik. Band 2 : Elektromagnetismus und Struktur der Materie, 5. Aufl. (Oldenbourg Wissenschaftsverlag, München, 2007). [21] R. P. Feynman, R. B. Leighton, M. Sands, The Feynman Lectures on Physics. Volume II : Mainly Electromagnetism and Matter , definitive Aufl. (Addison-Wesley, Reading, MA, 2005). [22] R. P. Feynman, R. B. Leighton, M. Sands, Feynman-Vorlesungen über Physik. Band 1 : Mechanik, Strahlung, Wärme, 5. Aufl. (Oldenbourg Wissenschaftsverlag, München, 2007). [23] R. P. Feynman, R. B. Leighton, M. Sands, The Feynman Lectures on Physics. Volume I : Mainly Mechanics, Radiation, and Heat, definitive Aufl. (Addison-Wesley, Reading, MA, 2005). [24] L. Landau, E. Lifshitz, Course of Theoretical Physics. Vol. 1 : Mechanics, 3rd Aufl. (Butterworth-Heinemann, Oxford, 1976). [25] A. Einstein, Ann. Phys. (Leipzig) 17 (1905) 891–921. [26] L. Landau, E. Lifschitz, Course of Theoretical Physics. Vol. 2 : The classical theory of fields, 4th Aufl. (Butterworth-Heinemann, Oxford, 1975). [27] W. Nolting, Grundkurs Theoretische Physik. Band 4 : Spezielle Relativitätstheorie. Thermodynamik , 6. Aufl. (Springer, Berlin & Heidelberg, 2005). [28] D. Petrascheck, Eur. J. Phys. 37 (2016) 015201. [29] P. Aichelburg, R. Beig, Ann. Phys. (NY) 98 (1976) 264–283. [30] J. A. Wheeler, R. P. Feynman, Rev. Mod. Phys. 17 (1945) 157–181. [31] K. Schwarzschild, Nachr. Ges. Wiss. Göttingen (1903) 126–131. [32] J.-M. Lévy-Leblond, Am. J. Phys. 39 (1971) 502–506. [33] J. Schwinger, L. L. DeRaad, Jr., K. A. Milton, W.-y. Tsai, Classical electrodynamics (Perseus, Reading, MA, 1998). [34] M. Postnikov, Lectures in Geometry. Semester II : Linear Algebra and Differential Geometry (Mir Publishers, Moscow, 1982). [35] I. M. Gelfand, G. E. Shilov, Verallgemeinerte Funktionen (Distributionen) Band 1 , Band 47 von Hochschulbücher für Mathematik , 2. Aufl. (Deutscher Verlag der Wissenschaft, Berlin, 1967). [36] L. Schwartz, Mathematische Methoden der Physik. Band 1 (Bibliographisches Institut, Mannheim, 1974).