Theoretische Physik 3 Elektrodynamik Urbaan M. Titulaer 1. Auflage 1 Vorwort Dieses vorliegende Skript ist die Vorlesungsunterlage von Prof. Urbaan Maria Titulaer in LATEX. Ich habe beim Lernen für die Klausur mit dem Aufsetzen begonnen, weil es nicht nur eine Lernhilfe war, sondern vor allem weil erstens LATEX besser zu lesen ist und zweitens weil dieses Skript nun korrigierund erweiterbar ist. Obwohl mir meine Studienkollegen dieses getexte Skript durchgesehen haben (herzlichen Dank dafür), bin ich mir sicher, dass sich noch zahlreiche Fehler eingeschlichen haben. Ich wäre deshalb sehr dankbar, wenn ihr mir die Fehler per email berichtet ([email protected]), damit entweder eine Fehlersammlung ins Netz gestellt werden kann oder später korrigierte Neuauflagen erscheinen können. Einige Bilder habe ich aus dem alten maschinegeschriebenen Skript weggelassen, weil sie unter LATEX schwer zu verwirklichen gewesen wären (vorallem im ersten Teil, da auch viele aus den Methoden bekannt sind). Ich wünsche viel Spaß beim Lesen :-) und hoffe, dass dieses Skript eine kleine Verbeserung beim Lernen für die doch ziemlich schwierige Elektrodynamik darstellt. Michael Bergmair 2 Contents 1 Die 1.1 1.2 1.3 Maxwellschen Gleichungen 4 Überblick der Elektrodynamik . . . . . . . . . . . . . . . . . . 4 Mathematische Beschreibung von Vektorfeldern . . . . . . . . 7 Die Maxwell Gleichungen . . . . . . . . . . . . . . . . . . . . . 17 2 Elektrostatik und Magnetostatik 2.1 Die Multipolentwicklung in der Elektrostatik 2.2 Elektrostatik in Anwesenheit von Leitern . . 2.3 Die elektrostatische Energie . . . . . . . . . 2.4 Dielektrika . . . . . . . . . . . . . . . . . . . 2.5 Magnetostatik . . . . . . . . . . . . . . . . . 2.6 Die magnetische Energie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Elektromagnetische Strahlung 3.1 Lösungen der freien Maxwellgleichung . . . . . . . . . . . . . 3.2 Wellen an Grenzflächen und in Hohlleitern . . . . . . . . . . 3.3 Skalares und Vektorpotential . . . . . . . . . . . . . . . . . . 3.4 Strahlung einer lokalisierten Verteilung von Ladungen und Strömen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 Streuung elektromagnetischer Strahlung . . . . . . . . . . . 4 Die spezielle Relativitätstheorie 4.1 Das Verhalten der Maxwellgleichungen unter Galilei - Transformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Die Postulate der speziellen Relativitätstheorie; die Lorentztransformation . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Vierervektoren und Tensoren; Relativistische Mechanik . . . 4.4 Relativistische Elektrodynamik . . . . . . . . . . . . . . . . 4.5 Die Lorentzgruppe . . . . . . . . . . . . . . . . . . . . . . . 3 . . . . . . 21 21 28 36 43 51 56 65 . 65 . 74 . 79 . 85 . 93 102 . 102 . . . . 109 118 127 131 1 1.1 Die Maxwellschen Gleichungen Überblick der Elektrodynamik Die Elektrodynamik beschäftigt sich mit den Kräften, die elektrisch geladene Teilchen aufeinander ausüben. Nach dem Coulombschen Gesetz ist die Kraft, wie die Gravitationskraft, zentral und umgekehrt proportional zum Quadrat des Abstandes zwischen den Teilchen. ~ 1 = −K ~ 2 = e1 e2 r~1 − r~2 K |~ r1 − r~2 |3 (1.1) In diesem Ausdruck bezeichnen e1 und e2 die elektrischen Ladungen im Gaußschen Einheitensystem. Diese Einheiten sind so gewählt, dass die Kraftkonstante im obigen Gesetzt gleich eins ist (im cgs-System). Anders als die Masse kann die elektrische Ladung sowohl positives als auch negatives Vorzeichen haben. Da weiter das Superpositionsprinzip gilt (Kräfte ausgeübt von verschiedenen geladenen Teilschen auf ein vorgegebenes Teilchen dürfen einfach addiert werden) und es in der Welt genauso viele positive wie negative Ladungen gibt (makroskopische Ladungsneutralität), können elektrisch geladene Kraftwirkungen einander weitgehend kompensieren: Positiv geladene Kerne umgeben sich z.B. mit negativ geladenen Elektronen und bilden Atome und Moleküle, die nach außen nur noch schwache elektrische Wirkungen zeigen. Bei der näheren Untersuchung der elektrischen Kräfte ergab sich, dass das Coulombsche Gesetz nur für ruhende Ladungen gilt. Das Gesetz, das die Kräfte zwischen bewegenden Ladungen beschreibt (Liénard-Wiechert-Gesetz) ist sehr viel komplizierter: Die Kraft hängt von den Geschwindigkeiten der beiden Teilchen ab und ist weiter nicht- instantan: Die Kraft ausgeübt vom Teilchen 1 auf Teilchen 2 zur Zeit t enthält nicht die Geschwindigkeit zur Zeit t, sondern zur Zeit t0 = t − |~r(t0 )|/c, wobei ~r(t0 ) der Abstand der beiden Teilchen zur Zeit t0 ist. Wegen der Kompliziertheit des Kraftgesetzes wählt man eine mathematisch äquivalente Beschreibung, die auf Faraday zurückgeht: Elektrische Ladungen erzeugen nach Gesetzen, die wir noch näher angeben werden, elektrische und ~ r, t) und B(~ ~ r, t). (Aus historischen Gründen wird die magnetische Felder E(~ ~ aber als magnetische Induktion bezeichnet). Ein Teilchen mit der Größe B Ladung e und Geschwindigkeit ~v , das sich am Ort ~r befindet, erfährt eine Kraft gleich ~ r, t)]. ~ r, t) = e[E(~ ~ r, t) + ~v × B(~ (1.2) K(~ c Die Größe c ist die Lichtgeschwindigkeit im Vakuum; sie erscheint zuerst nur, ~ und B ~ dieselbe physikalische Dimension zu geben und die um den Größen E 4 ~ festzulegen. (Das obige Lorentzsche Gesetz ist zugleich eine Größe von B ~ und B). ~ Messvorschrift für die Größen E ~ reduziert sich das Coulombsche Gesetzt auf die Nach der Einführung von E ~ einer ruhenden, punktförmigen Ladung e’ Aussage: das elektrische Feld E im Punkt ~r ist gegeben durch: ~0 ~ r) = e0 ~r − r . E(~ |~r − r~0 |3 (1.3) Die magnetische Induktion verschwindet in diesem Falle. ~ r, t) Es ist die Aufgabe der (mikroskopischen) Elektrodynamik, die Felder E(~ ~ r, t) zu berechnen für vorgegebene Werte der Orte und Geschwindigkeiten und B(~ aller in einem System anwesenden geladenen Teilchen. Dies geschieht durch Lösunger der Maxwellgleichungen (im Vakuum). Es erweist sich dabei als bequem, statt mit den Orten und Geschwindigkeiten der einzelnen Teilchen mit den Ladungs- und Stromdichten, definiert durch ρ(~r, t) = N X ei δ(~r − r~i (t)) (1.4) ei v~i (t)δ(~r − r~i (t)) (1.5) i=1 und ~j(~r, t) = N X i=1 wobei ei , r~i (t) und v~i (t) die Ladung, der Ort und die Geschwindigkeit des i-ten Teilchens darstellen, zu arbeiten. Die explizite Form der Maxwellgleichungen werden wir im dritten Abschnitt dieses Kapitels nach einer mathematischen Einleitung im zweiten Abschnitt geben. Ein Großteil der weiteren Vorlesung wird sich dann mit der Lösung der Maxwellgleichungen für vorgegebene ρ und ~j beschäftigen. In den meisten physikalischen Systemen sind ρ(~r, t) und ~j(~r, t) allerdings keine vorgegebenen Größen; der zeitliche Verlauf der Teilchengeschwindigkeiten ~ r, t) und B(~ ~ r, t) ab. Wir ~vi (t) hängt über die Lorentzkraft wieder von E(~ müssen also zwei Probleme parallel lösen. ~ und B ~ für vorgegebene • Das elektrodynamische Problem: Bestimme E ρ und ~j. • Das mechanische Problem: Bestimme die zeitliche Änderung von ρ und ~ und B. ~ ~j für vorgegebene E Das mechanische Problem muss nicht nur für die im Raum frei beweglichen Ladungen, sondern auch für die gebundenen Ladungen in den Atomen, Molekülen 5 und makroskopischen Körpern gelöst werden. Dabei erweist es sich als günstig, die Ladungsdichte und Stromdichte, verursacht von den gebundenen Ladungen in einer elektrischen Polarisationsdichte P~ (~r, t) und einer Mag~ (~r, t), auszudrücken. netisierungsdichte M ~ B, ~ P~ Auf diese Weise erhält man Maxwellgleichungen, die die vier Felder E, ~ mit den Beiträgen der freien Ladungen zur Ladungs- und Stromdichte und M verknüpfen; dies sind die sogenannten makroskopischen Maxwellgleichungen. Sie können etwas kompakter geschrieben werden, falls man zwei Hilfsfelder ~ r, t) = E(~ ~ r, t) + 4π P~ (~r, t) D(~ (1.6) ~ r, t) = B(~ ~ r, t) − 4π M ~ (~r, t) H(~ (1.7) einführt. Weil die makroskopischen Maxwellgleichungen zwei zusätzliche, zuerst unbekannte, Felder enthalten, reichen sie meistens nicht aus, um ~ B, ~ P~ und M ~ zu bestimmen (Das schwierige Problem der Bestimmung der E, Ladungs- und Stromdichten für gebundene Ladungen kann nicht durch das Definieren neuer Größen gelöst werden!). Man hat aber, zuerst experimentell, gefunden, dass für viele Materialien ein sehr einfacher Zusammenhang zwis~ und den Feldern E ~ und B ~ besteht. Z.B. chen den Materialgrößen P~ und M gilt für einfache Dielektrika ~ r, t) P~ (~r, t) = χE(~ (1.8) ~ (~r, t) = χm B(~ ~ r, t) M (1.9) wobei χ, die elektrische Suszeptibilität, eine für das Material spezifische Konstante, ist. Beziehungen vom Typ 1.8 bzw. 1.9 heißen konstitutive Gleichungen. Die theoretische Herleitung solcher Beziehungen ist unerwartet kompliziert, und zum Teil erst in den letzten Jahrzehnten gelungen. Weiter sind sie immer nur in mehr oder weniger guter Näherung gültig. In dieser Vorlesung werden wir uns aber um die Herleitung nicht kümmern und die konstitutiven Gleichungen nur benützen, um die makroskopischen Maxwellgleichungen zu einem lösbaren System zu machen. Der letzte Teil der Vorlesung beschäftigt sich mit der speziellen Relativitätstheorie. Logisch gesehen ist sie kein Teil der Elektrodynamik, wurde aber entwickelt, um Schwierigkeiten, die bei der Beschreibung von elektrodynamischen Phänomenen in relativ zueinander bewegten Koordinatensystemen aufgetreten waren, zu lösen (Einsteins Arbeit zur Relativitätstheorie hieß ”Zur Elektrodynamik bewegter Körper.”). 6 1.2 Mathematische Beschreibung von Vektorfeldern Ein Vektorfeld F~ (~r, t) besteht aus drei Komponenten, Fx (~r, t), Fy (~r, t) und Fz (~r, t). Vektorfelder traten zuerst in der Hydrodynamik auf, und verschiedene in der Theorie der Vektorfelder übliche Bezeichnungen lassen diesen Ursprung erkennen. Die Flussdichten in der Hydrodynamik sind definert als Fx (~r, t)dtd2 O (1.10) = Masse, die im Zeitintervall dt um t durch ein Flächenelement d2 O um ~r senkrecht zur x- Achse strömt (in der positiven x- Richtung) und ähnlich für Fy und Fz . Durch ein willkürliche orientiertes Flächenelement strömt dann pro Sekunde eine Masse F~ (~r, t)n̂d2 O, wobei n̂ ein Einheitsvektor senkrecht zum Flächenelement ist. Wir können dies noch etwas kompakter schreiben, ~ einführen mit der Größe d2 O und der Richtung n̂: indem wir den Vektor d2 O 2 ~ Fluss durch d O = F~ (~r, t)d2 O. Als Nächstes betrachten wir eine geschlossene Fläche S. Durch diese Fläche strömt pro Sekunde netto eine Masse I I ~ Q= F~ (~r, t)d2 O (1.11) S ~ so orientieren, dass nach außen. Dabei soll man die Flächenelemente d2 O n̂ überall nach außen zeigt. Diese Größe Q nennt man die Ergiebigkeit sämtlicher im durch S umschlossenen Volumen V befindlichen Quellen der Flüssikkeitsströmung. Der Kreis durch die Integralzeichen ist eine Erinnerung daran, dass es sich um ein Integral um eine geschlossene Fläche handelt. Quellen mit negativer Ergiebigkeit werden auch Senken genannt. Als Nächstes wollen wir jetzt die Quellen innerhalb V lokalisieren. Dazu teilen wir das Volumen V in Teilvolumina V1 und V2 ein. Die umschließenden Flächen seien S1 und S2 . Die innere Trennfläche ist Teil beider Oberflächen; sie ist aber in den beiden Fällen entgegengesetzt orientiert. Es gilt also I I ~ Q = Q1 + Q2 mit Qi = F~ (~r, t)d2 O (1.12) Si weil sich die Integrale über die Trennfläche aufheben. Durch Wiederholung dieses Prozesses kann man letztendlich Q als Integral über eine Ergiebigkeitsdichte oder Quellendichte q(~r, t) schreiben I I Z Z Z 2~ ~ Q= F (~r, t)d O = q(~r, t)d3~r (1.13) S V 7 wobei q(r, t) als das Oberflächenintegral für einen infinitesimalen Quader mit Kantenlängen ds, dy und dz aufgefasst werden kann. Innerhalb des Quaders entwickeln wir jetzt F~ (~r, t) in eine Taylorreihe um einen der Eckpunkte ~r0 ∂ F~ F~ (~r, t) = F~ (~r0 , t) + (~r − ~r0 ) + ... ∂~r (1.14) und vernachlässigen Terme höherer Ordunung. Für das Integral über die Quaderfläche erhält man so ½· ¸ ¾ ∂Fx 3 q(~r0 , t)d ~r = dydz Fx (~r0 , t) + dx − Fx (~r0 , t) (1.15) ∂x ¸ ¾ ½· ∂Fy − Fy (~r0 , t) (1.16) +dxdz Fy (~r0 , t) + dy ∂y ½· ¸ ¾ ∂Fz +dxdy Fz (~r0 , t) + dz − Fz (~r0 , t) (1.17) ∂z = d3~r ∂Fx ∂Fy ∂Fz + + ∂x ∂y ∂z (1.18) Wir haben also die Quellendichte q(~r, t) identifiziert mit der Größe div F~ := ∂Fx ∂Fy ∂Fz + + , ∂x ∂y ∂z (1.19) die auch die Divergenz des Vektorfeldes F~ genannt wird. Die Definition kann etwas kompakter geschrieben werden, indem wir den Nabla-Operator ∇ einführen: µ ¶ ∂ ∂ ∂ ∇= , , ; (1.20) ∂x ∂y ∂z es gilt dann div F~ = ∇F~ . (1.21) Der mathematische Satz, den wir oben auf etwas heuristische Weise bewiesen haben I I Z Z Z 2~ ~ Fd O = ∇F~ d3 r (1.22) S V heißt (mathematischer) Gaußscher Satz ; er ist inzwischen in der Vektoranalysis natürlich auch streng bewiesen worden, unter gewissen Voraussetzungen über Regularität von F~ und S. Ein hydrodynamisches Strömungsfeld F~ ist natürlich nicht durch seine Quellendichte allein festgelegt (Ein einziges Feld q(~r, t) kann keine drei Felder 8 F~ (~r, ) festlegen!). Bei vorgegebenem q(~r, t) gibt es immer unendlich viele F~ (~r, t), deren Divergenz gleich q(~r, t) ist. Eine spezielle Klasse von Lösungen bilden die Potentialströmungen, die aus einem Potential φ(~r, t) herleitbar sind: F~φ (~r, t) = −∇φ(~r, t) (1.23) ´ ³ Das Vektorfeld ∇φ = ∂φ , ∂φ , ∂φ heißt der Gradient von φ. Das Vektorfeld ∂x ∂y ∂z F~φ (~r, t) hat die Divergenz q(~r, t), falls φ der Potentialgleichung µ 2 ∇ φ := ∇∇φ = ∂2 ∂2 ∂2 + + ∂x2 ∂y 2 ∂z 2 ¶ φ = −q (1.24) genügt. Potentialströmungen haben die zusätzliche Eigenschaft, dass das Linienintegral Z ~ r2 F~φ d~s = φ(~r1 ) − φ(~r2 ) (1.25) ~ r1 nur von den Endpunkten des Integrationsweges, nicht aber vom gewählten Weg abhängt. Insbesondere gilt für jeden geschlossenen Weg C I F~φ d~s = 0. (1.26) C Diese Beziehung gilt aber nicht für ein willkürliches Strömungsfeld. Falls wir z.B. C um eine Wirbellinie legen, so ist anschaulich klar, dass F~ immer in der Richtung von d~s zeigt (falls C entsprechend orientiert ist) und das Integral also einen nichtverschwindenden Wert hat. Die Größe I Z= F~ d~s, (1.27) C auch Zirkulation genannt, ist also ein Maß für die Stärke der von C umschlossenen Wirbel. Zur näheren Lokalisierung der Wirbelstärke können wir wieder den Weg C aufgebaut denken aus zwei geschlossenen Wegen C1 und C2 ; wie im Falle der Quellendichte gilt wieder Z = Z1 + Z2 , und im Grenzfall immer feinere Unterteilungen ZZ ~ r, t)d2 O ~ ζ(~ Z= (1.28) (1.29) O wobei O eine willkürliche durch C umrandete Fläche ist. Die Größe ζ~ heißt Wirbeldichte: Es ist eine Vektorgröße, die entlang der Wirbellinie gerichtet 9 ist. Die Zirkulation für einen infinitesimalen Rechteckweg mit Kantenlängen dy und dz (also senkrecht zur x- Achse) beträgt nach dieser Definition dZ = ζx (~r, t)dydz. (1.30) Andererseits findet man durch Einsetzen der Taylorentwecklung und Auswertung des Integrals ¶ µ ∂Fz ∂Fy dydz. (1.31) dZ = − ∂y ∂z Ähnliche Rechnungen für Flächenelemente senkrecht zur y- und z- Achse liefern letzendlich µ ¶ ∂F ∂F ∂F ∂F ∂F ∂F y x z y x z ~ r, t) = (1.32) ζ(~ − , − , − ∂y ∂z ∂z ∂x ∂x ∂y oder auch ~ r, t) = ∇ × F~ := rotF~ . ζ(~ (1.33) Die Größe rotF~ heißt die Rotation von F~ ; in der englischsprachigen Literatur wird sie auch mit curl F~ bezeichnet. Unsere obigen Überlegungen können zusammengefasst werden in dem Stokesschen Satz : I ZZ ~ ~ F d~s = rotF~ d2 O. (1.34) C O ~ mit derjenigen von C übereinstimmen. Dabei soll die Orientierung von d2 O Auch dieser Satz kann in der Vektoranalysis streng hergeleitet werden. Aus dem Stokesschen Satz folgt, dass das Flächenintegral nicht von der Wahl der Fläche abhängen kann. Dies lässt sich auch direkt zeigen: Aus zwei durch C berandete Flächen lässt sich eine geschlossenen Fläche S bilden, die, für den einfachen Fall, dass die Flächen O1 und O2 sich nicht schneiden, ein Volumen V umschließen. Falls die Flächen im selben Sinn orientiert sind, so gilt z.B. im skizzierten Fall I I ZZ ZZ 2~ 2~ ~ ~ ~ rotF d O = rotF d O − F~ d2 O. (1.35) O1 O2 Andererseits gilt auf Grund des Gaußschen Satzes I I ZZZ 2~ ~ rotF d O = div rotF~ d3~r. (1.36) V Nun gilt aber div rotF~ = ∇(∇ × F~ ) = X ijk 10 ²ijk ∂ ∂ Fk = 0. ∂ri ∂rj (1.37) Damit ist das Verschwinden des Integrals über die geschlossene Fläche S, und damit die Gleichheit der zwei Flächenintegrale über O1 und O2 bewiesen. ~ r, t) nur dann die RoAus Gl.1.37 folgt weiters noch, dass ein Vektorfeld ζ(~ tation eines anderen Vektorfeldes sein kann, falls es der Zusatzbedingung ~ r, t) = 0 div ζ(~ (1.38) genügt. Diese Zusatzbedingung erlaubt es, eine der Komponenten von ζ~ zu bestimmen (bis auf eine Konstante), falls die zwei anderen Komponenten bekannt sind: Ein Feld, das der Bedingung Gl.1.38 genügt, hat effektiv nur zwei unabhängige Komponenten. Es ist deshalb nicht von vornherein unsinnig anzunehmen, dass ein Vektorfeld F~ durch seine Quellen q(~r, t) = div F~ und seine Wirbel ζ~ = rotF~ ”bis auf einige Konstanten” festgelegt ist. Diese genaue mathematische Formunlierung dieses ”Haupsatzes der Vektoranalysis” lautet: ~ r, t), das Gegeben sind ein skalares Feld q(~r, t) und Vektorfeld ζ(~ die Zusatzbedingung div ζ~ = 0 erfüllt. Die Felder q und ζ~ sollen weiters nur im Endlichen von Null verschieden sein. Es existiert dann genau ein Vektorfeld F~ (~r, t), für das gilt: rotf~ = ζ~ div F~ = q (1.39) und das weiters für r → ∞ mindestens wie r−2 nach Null strebt. Der Beweis benützt einen der zwei Hilfssätze, die als Greensche Sätze bekannt sind. Wir werden deshalb zuerst diese Sätze beweisen. Dazu wählen wir ein Vektorfeld F~ der Gestalt F~ (~r, t) = ψ(~r, t)∇φ(~r, t), (1.40) wobei ψ und φ skalare Felder sind. Es gilt dann div F~ = ∇(ψ∇φ) = ∇ψ∇φ + ψ∇2 φ. Einsetzen in den Gaußschen Satz I I ZZZ 2~ ~ Fd O = div F~ d3~r S liefert I I (1.41) (1.42) V ZZZ 2~ (∇ψ∇φ + ψ∇2 φ)d3~r. ψ(∇φd O) = V 11 (1.43) Durch Vertauschen von ψ und φ erhält man ZZZ ZZ 2~ (∇φ∇ψ + φ∇2 ψ)d3~r. φ(∇ψd O) = (1.44) V S Subtraktion der beiden Ausdrücke liefert ZZ ZZZ 2~ (φ∇ψ − ψ∇φ)d O = (φ∇2 ψ − ψ∇2 φ)d3~r S (1.45) V Die Formeln Gl.1.43 und Gl.1.45 sind als erster und zweiter Greenscher Satz bekannt. Als nächstes zeigen wir die Eindeutigkeit der Lösung des im Hauptsatz der Vektoranalysis gestellten Problems. Dazu nehmen wir zuerst an, es gäbe zwei Lösungen F~1 (~r) und F~2 (~r) mit div F~i = q ∇ × F~i = ζ~ (1.46) ∇ × F~d = 0. (1.47) Für die Differenz F~d muss also gelten div F~d = 0 Aus ∇ × F~d = 0 folgt insbesonders, dass das Linienintegral Z~r2 F~d d~s (1.48) ~ r1 nur von ~r1 und ~r2 abhängen kann; das Linienintegral kann also benützt werden, um ein Potential φ zu bestimmen, wofür gilt F~d = −∇φ (1.49) (Vgl. die Konstruktion eines Potentials für ein konservatives ¡ 1 ¢Kraftfeld in der ~ Mechanik, S.9 des Skriptums Mechanik). Wegen Fi = O r2 gilt auch F~d = ¡1¢ O r2 ; man kann dann durch geschickte Wahl der Integrationskonstante erreichen, dass gilt µ ¶ 1 φ=O (1.50) r Aus div F~d = 0 folgt ∇∇φ = ∇2 φ = 0. Wir wählen jetzt im ersten Greenschen Satz φ = ψ mit der oben konstruierten Funktion φ und wählen für V eine Kugel mit Radius R. Wir erhalten dann µ ¶ ZZZ ZZZ 1 2 3 2 3 ~ I(R) := |∇φ| d ~r = |Fd (~r)| d ~r = O (1.51) R v V 12 (Der Integrand im Oberflächenintegral ist von der Ordnung R12 R1 ; die Oberfläche ist 4πR2 ). Das Integral ist einerseits wegen der Positivität des Integrandes eine monoton nicht-abnehmende Funktion von R, andererseits soll es der Ordnung R−1 sein; das geht nur, falls gilt F~d = 0, also F~1 (~r) = F~2 (~r). Damit ist der Eindeutigkeitsbeweis gelierfert. Nachdem wir jetzt die Eindeutigkeit bewiesen haben, zeigen wir als nächstes die Existenz der gesuchten Lösung. Wir tun dies mittels einer expliziten Konstruktion der Lösung. Dazu schreiben wir zunächst (um Konsistenz mit später benötigten Formeln herzustellen) ~ r, t) = 4π~c(~r, t). ζ(~ q(~r, t) = 4πρ(~r, t) (1.52) Weiters schreiben wir die gesuchte Lösung als F~ = F~ρ + F~~c (1.53) ∇F~ρ = 4πρ (1.54) ∇F~~c = 0 (1.55) ∇ × F~ρ = 0 (1.56) mit 4π ∇ × F~~c = 4π~c = ~j (1.57) c und nehmen weiters noch an, dass die beiden Komponenten geschrieben werden können in der Form F~ρ = −∇φ ~ F~~c = ∇ × A ~=0 mit∇A (1.58) Durch diese Wahl sind die Bedingungen ∇×F~ρ = 0 und ∇F~~c = 0 automatisch erfüllt, wie man leicht nachweist: es gilt z.B. ~= ∇∇ × A X ²ijk ijk ∂ ∂ Ak = 0. ∂xi ∂xj (1.59) Damit auch die restlichen Bedingungen erfüllt sind muss gelten und −∇2 φ = −4πρ (1.60) ~ = 4π~c. ∇×∇×A (1.61) Letztere Beziehung kann noch etwas umgeformt werden: es gilt ~ ~ = ∇(∇A) ~ − ∇2 A ∇×∇×A 13 (1.62) ~ = grad div A ~ − ∇2 A ~ (Beweis: oder rot rot A ~ i= (∇ × ∇ × A) X ²ijk ²klm jklm = X jklm ∂ ∂ Am ∂xj ∂xl X ∂ ∂ ∂ ∂ (δil δjm − δim δjl ) Am = Am ∂xj ∂xl ∂x j ∂xl jlm à ! X ∂2 ∂ X ∂ = Am − Ai = 2 ∂xi m ∂xm ∂x j j ²kij ²klm (1.63) ~ − ∇2 A) ~ i .) (grad div A ~ = 0 erhalten wir letztendlich: Wegen ∇A ~ = −4π~c. ∇2 A (1.64) ~ eine Wir erhalten also sowohl für φ als auch für jede Komponente von A Gleichung vom Typ der Poissongleichung: ∇2 φ(~r) = −4πρ(~r). (1.65) Diese Gleichung lösen wir jetzt mittels der Methode der Greenschen Funktion, d. h. wir suchen zuerst eine Lösung der Gleichung ∇2 Gφ (~r, ~r0 ) = −4πδ(~r − ~r0 ), (1.66) wobei die Vektor-δ-Funktion δ(~r) definiert ist als δ(~r) = δ(x)δ(y)δ(z) (1.67) und schreiben die Lösung von Gl.1.65 als ZZZ φ(~r) = d3~r0 Gφ (~r − ~r0 )ρ(~r0 ). (1.68) Die Greensche Funktion des Problems (1.65) ist Gφ (~r − ~r0 ) = 1 |~r − ~r0 | Beweis: Für ~r 6= ~r0 gilt (mit ~r0 = ~r − ~r0 ): Gφ (~r0 ) = ∇Gφ − ~r0 r03 ; ∇2 Gφ = − 14 (1.69) 1 r0 3 ~r0~r0 +3 5 =0 3 r0 r0 (1.70) Die Funktion ∇2 Gφ erfüllt also die erste Eigenschaft der δ- Funktion: Sie verschwindet für ~r 6= ~r0 . Zur Bestimmung der δ- Funktion RRR der Koeffizienten 0 3 müssen wir als Nächstes das Integral Gφ (~r, ~r )d ~r bestimmen über ein 0 Gebiet V das den Punkt ~r = ~r entählt. Wir wählen dafür eine Kugel mit Radius r0 . Nach dem Gaussschen Satz gilt dann ZZZ Zπ Z2π I I 2 3 ∇ Gφ d ~r = 2~ ∇Gφ d O = − V 0 also 0 ~r0 ~r0 2 r sin θdθdφ r03 r0 0 (1.71) ZZZ ∇2 Gφ d3~r = −4π. (1.72) Damit ist der Beweis der Beziehung (1.66) mit der vorgegebenen Form von G(~r, ~r0 ) geliefert. Die Lösung des Hauptproblems der Vektoranalysis ist also: ~ F~ = −∇φ + ∇ × A mit ZZZ φ(~r) = (1.73) ZZZ ρ(~r0 )d3~r0 |~r − ~r0 | ~ r) = A(~ Wir brauchen noch die Zusatzbedingung µ ¶ 1 ~ F (~r) = O 2 r ~c(~r0 )d3~r0 |~r − ~r0 | (1.74) (1.75) zu verifizieren für den Fall, dass ρ(~r) und ~c(~r) nur in einem endlichen Gebiet von Null verschieden sind. Dazu reicht es aus, zu zeigen, dass gilt µ ¶ µ ¶ 1 ~ r) = O 1 . A(~ φ(~r) = O (1.76) r r Nehmen wir jetzt an, das Gebiet in dem ρ(~r) und ~c(~r) von Null verschieden sind, liegt innerhalb der Kugeloberfläche r = R. Dann gilt für r > 2R : |~r − ~r0 | > 21 r für |r0 | < R. Also ¯Z Z Z ¯ Z Z ¯ ρ(~r0 )d3~r0 ¯¯ |ρ(~r0 )|d3~r0 2 ¯ ≤ ≤ |ρ(~r0 )|d3~r0 (1.77) |φ(~r)| = ¯ |~r − ~r0 | ¯ |~r − ~r0 | r für r > 2R. ¡ ¢ Das ist aber genau mit φ(~r) = O 1r gemeint. Ähnliche Beziehungen lassen 15 ~ auf völlig analoge Weise herleiten. sich für die einzelnen Komponenten von A Damit ist der Beweis des Hauptsatzes der Vektoranalysis zu Ende. Durch Nachlesen des Beweises kann man noch zeigen, dass die auf Seite 10 zuerst bequemlichkeitshalber auferlegten Bedingungen in Wirklichkeit immer gültig sein müssen: 1. Ein Vektorfeld F~ (~r) kann immer geschrieben werden als Summe eines wirbelfreien oder longitudinalen Anteils F~ρ und eines quellenfreien oder transversalen Anteil F~~c. 2. Ein wirbelfreies Feld kann immer geschrieben werden als (minus der) Gradient einer Potentialfunktion φ F~ρ = −∇φ (1.78) 3. Ein quellenfreies Feld kann geschrieben werden als die Rotation eines ~ r) sogenannten Vektorpotentials A(~ ~ F~~c = ∇ × A (1.79) ~ festDurch diese Beziehung wird nur der transversale Anteil von A gelegt; das Vektorpotential ~0 = A ~ + ∇χ A (1.80) führt zum selben Feld F~c . Diese Freiheit kann man dadurch ausnutzen dass man die Zusatzbedingung ~=0 div A (1.81) stellt. Für gewisse Probleme erweist es sich aber als bequemer, einen ~ festzulegen. Eine Transformation vom Typ anderen Wert für div A Gl.(1.80) heißt Eichtransformation. ¡ ¢ 4. Falls F~ (~r) der Bedingung F~ (~r) = O r12 genügt und wir für F~ρ und F~~c die gleiche Bedingung verlangen, so ist die unter 1. diskutierte Aufspaltung eindeutig. Sonst kann F~ (~r) Beiträge enthalten, die sowohl wirbel- als auch quellenfrei sind. Solche Beiträge haben die Gestalt F~0 (~r) = −∇φ0 (~r) mit∇2 φ0 (~r) = 0. (1.82) Funktionen φ0 , die der Laplace - Gleichung ∇2 φ0 (~r) = 0 genügen, heißen harmonische Funktionen. Sie werden später noch systematisch diskutiert. 16 1.3 Die Maxwell Gleichungen ~ und B ~ dadurch, dass sie Die Maxwell Gleichungen bestimmen die Felder E von beiden die Divergenz und die Rotation festlegen. Wie im vorhergehenden Abschnitt gezeigt wurde, reicht dies aus, um die beiden Felder zu bestimmen. Als erstes betrachten wir die Divergenz des elektrischen Feldes. Das Coulombsche Gesetz für des Feld einer ruhenden Ladung lautet also gilt 0 ~ r) = e0 ~r − ~r = −e0 ∇ 1 E(~ |~r − ~r0 | |~r − ~r0 | (1.83) ~ r) = 4πe0 δ(~r − ~r0 ). ∇E(~ (1.84) Für eine Verteilung ruhender Ladungen mit Ladungsdichte ρ(~r) gilt also nach dem Superpositionsprinzip ~ r) = 4πρ(~r). ∇E(~ (1.85) Weil es keine experimentellen Hinweise für Abweichungen von diesem Gesetz für bewegte Ladungen gab (und seitdem auch nicht gegeben hat), schlug Maxwell vor, dieses Gesetz auch für willkürlich bewegte Ladungen vorauszusetzen: ~ r, t) = 4πρ(~r, t) ∇E(~ (1.86) Trotz wiederholter Versuche gibt es noch immer keine reproduzierbaren Experimente, in denen magnetische Ladungen (magnetische Monopole) nachgewiesen werden konnten. Wir werden also, wie Maxwell, annehmen, dass es solche ~ - Feld ist also quellenfrei: magnetischen Ladungen nicht gibt. Das B ~ r, t) = 0 ∇B(~ (1.87) ~ betrachten wir das Induktionsgesetz: In einem Zur Bestimmung von ∇ × E Stromkreis, der sich in einem zeitlich veränderlichen Magnetfeld befindet, wird ein elektrischer Strom erzeugt. Die antreibende Kraft beträgt nach Faraday I ZZ 1d ~ ~ r, t).d2 O ~ E(~r, t).d~s = − B(~ (1.88) c dt C S wobei C eine Kurve entlang des Stromkreises und S eine durch C berandete Fläche ist (Umlaufsinn des Stromkreises und Orientierung der Fläche sollen ~ ist die Wahl der Fläche miteinander konsistent gewählt werden.) Wegen div B für das Ergebnis belanglos. Anwendung des Stokesschen Satzes liefert nun Z Z ZZ 1d 2~ ~ ~ d2 O ~ (∇ × E)d O = − B (1.89) c dt S 17 Weil das Induktionsgesetz für jeden Stromkreis gelten muss, können wir schließen ~ r, t) + 1 ∂ B(~ ~ r, t) = 0 ∇ × E(~ (1.90) c ∂t Das Auftreten der Konstante − 1c im Faradayschen Gesetz kann auch aus den ~ und B ~ verstanden werden. In Transformationseigenschaften der Felder E ~ = m~a der klassischen Mechanik ist die Beschleunigung, und damit wegen K auch die Kraft, in allen Inertialsystemen gleich. Dies muss natürlich auch für die Lorentzkraft gelten: 0 ~ + ~v × B ~ =E ~ 0 + ~v × B ~0 E c c (1.91) wobei die ungestrichenen Größen sich auf ein System in Ruhe und die gestrichenen sich auf ein mit gleichförmiger Geschwindigkeit ~v − ~v 0 bewegtes System beziehen. Falls wir insbesondere das gestrichene System momentan mit dem Probeteilchen mitbewegen lassen, so gilt ~0 = E ~ + ~v × B. ~ E c (1.92) Betrachte jetzt einen Stromkreis, der aus einem ruhenden Drahtbügel C1 und einer mit der Geschwindigkeit v in der -y Richtung bewegten Schleife C2 besteht. Das ganze befindet sich ein einem konstanten Magnetfeld B in der -z Richtung (in die Ebene der Zeichnung hinein) im Ruhesystem des Bügels C1 . ~ - Feld soll in diesem System verschwinden. Auf eine Einheitsladung, Das E ~0 = vB die den Stromkreis durchläuft, wirkt in C1 kein Feld, in C2 ein Feld E c in der x Richtung. Insgesamt gilt also I ZZ v 1d ~ ~ 2 O. Eds = − Bl = − Bd (1.93) c c dt O Für diese spezielle Konfiguration kann also das Faradaysche Gesetz aus den ~ und B ~ hergeleitet werden. Transformationseigenschaften von E Als Ausgangspunkt für die Formulierung der vierten Maxwellgleichung nehmen wir das Oerstedsche Gesetz für das Magnetfeld eines unendlichen Drahtes mit einem stationären Strom I. Das Magnetfeld läuft in Kreisen um den Stromdraht herum und hat die Größe B(r) = 2I/cr auf einem Kreis mit dem Radius r. Es gilt also nach Integration über einen solchen Kreis I ~ s = 2πrB(r) = 4π I . (1.94) Bd~ c C 18 Man überzeugt sich leicht, dass dies auch für eine willkürliche, den Stromdraht in positiver Richtung umschließende Kurve gilt. Wir können dann auch auf den Fall verallgemeinern, dass der Strom nicht in einem Draht konzentriert ist, sondern kontinuierlich verteilt. Das verallgemeinerte Oerstedsche Gesetz lautet also I ZZ 4π ~ s= ~ ~jd2 O. Bd~ (1.95) c C O (mit willkürlichem C, ~j stationär) Mit Hilfe des Stokesschen Satzes und der Willkürlichkeit von C erhält man die differentielle Form ~ = 4π ~j ∇×B (~j stationär) (1.96) c Die Konstante 1/c ist als experimentelles Messergebnis zu betrachten und hat einen anderen Stellenwert als die Konstante 1/c im Induktionsgesetz, ~ die letztendlich auf die Wahl der Einheiten der magnetischen Induktion B zurückzuführen war. ~ kann nicht ohne weiteres auch für nichtstaDer obige Ausdruck für ∇ × B tionäre Ströme gültig sein. Durch Bildung der Divergenz würde man wegen ~ =0 das Ergebnis ∇(∇ × B) ∇~j = 0 (1.97) erhalten. Dies ist aber nicht mit dem Gesetz der Ladungserhaltung im Einklang. Letzteres sagt aus, dass die Gesamtladung, die in einem Volumen V enthalten ist, sich nur mittels Ein- und Ausströmen durch die Oberfläche ändern kann: ZZZ I I d 3 ~ ~j(~r, t)d2 O ρ(~r, t)d ~r = − (1.98) dt V (V ist beliebig) oder in differentieller Form (über den Gaußschen Satz) ∂ρ(~r, t) = −∇~j(~r, t). (1.99) ∂t Maxwell hat deshalb vorgeschlagen, das Gesetz Gl.1.96 durch Hinzufügen des sogenannten Verschiebungsterms abzuändern : ~ 4π 1 ∂E = ~j. (1.100) c ∂t c Bildung der Divergenz und Benützung der ersten Maxwellgleichung liefern jetzt die korrekte Beziehung: " # ~ 4π ∂ρ 4π ~ 1 ∂ E 1∂ ~ ~− ∇E = − = ∇j (1.101) ∇ ∇×B =− c ∂t c ∂t c ∂t c ~− ∇×B 19 Wir schreiben jetzt die vier Maxwell Gleichungen noch mal zusammen: ~ = 4πρ ∇E (1.102) ~ =0 ∇B (1.103) ~ ~ + 1 ∂B = 0 ∇×E (1.104) c ∂t ~ ~ − 1 ∂ E = 4π ~j (1.105) ∇×B c ∂t c Zum Schluss dieses Abschnittes zeigen wir noch, dass diese Gleichungen auch für ρ = 0 und ~j = 0 nichttriviale Lösungen haben. Bilden der Rotation der dritten Maxwellgleichung liefert in diesem Fall ~ = ∇(∇E) ~ − ∇2 E ~ = − 1 ∂ (∇ × B) ~ ∇ × (∇ × E) c ∂t (1.106) Einsetzen der ersten und vierten Maxwellgleichung liefert ~ = ∇2 E ~ 1 ∂ 2E c2 ∂t2 (1.107) Auf ähnliche Weise erhält man durch Bildung der Rotation der vierten Maxwellgleichung: 2~ ~ = 1 ∂ B. ∇2 B (1.108) c2 ∂t2 ~ und B ~ genügen also der Wellengleichung Alle Komponenten von E ¸ · 1 ∂2 2 (1.109) ∇ − 2 2 f (~r, t) = 0 c ∂t deren Lösungen sich mit der Geschwindigkeit c fortpflanzende Wellen sind (Näheres über diese elektromagnetischen Wellen später in der Vorlesung). Diese Wellen wurden von Maxwell mit den Lichtwellen identifiziert. Die Übereinkunft zwischen der Ausbreitungsgeschwindigkeit c der Lichtwelle und der Kraftkonstante 1/c im Oerstedschen Gesetz war wohl das überzeugendste Argument für die Richtigkeit der Maxwellschen Theorie. Ganz zum Schluss noch eine historische Bemerkung: Die oben angegebenen Gleichungen gelten für Ladungen ρ(~r, t) und Ströme ~j(~r, t) im Vakuum (oder: einschließlich der Ladungen und Ströme innerhalb von Atomen, Molekülen und makroskopischen Körpern). Formal gesehen sind sie ein Spezialfall der (später zu behandelnden) von Maxwell formulierten sogenannten Maxwellschen Gleichungen. Die fundamentale Bedeutung der Vakuum- oder mikroskopischen Maxwellgleichungen wurde zuerst von Lorentz klar erkannt. 20 2 Elektrostatik und Magnetostatik In diesem Kapitel beschäftigen wir uns mit den Feldern, verursacht von zeitunabhängigen Ladungen und Strömen. Bis auf Lösungen der homogenen Gleichungen (elektromagnetische Wellen), mit denen wir uns im nächsten ~ und B ~ zeitunKapitel beschäftigen werden, sind dann auch die Felder E abhängig, und die Maxwellgleichungen lauten: ~ = 4πρ ∇E (2.1) ~ =0 ∇B ~ =0 ∇×E (2.2) (2.3) ~ = 4π ~j ∇×B (2.4) c ~ - Feld also wirbelfrei und das B ~ - Feld quellenfrei. In diesem Fall ist das E Sie können mit den im vorigen Kapitel behandelten Methoden aus ρ bzw. ~ und B ~ nicht, wie im zeitabhängigen ~j bestimmt werden. Weil die Felder E Fall, miteinander verknüpft sind, können wir die Elektrostatik (die Bestim~ für eine stationäre Ladungsdichte) und die Magnetostatik (die mung von E ~ für eine stationäre Stromverteilung) getrennt behandeln. Bestimmung von B 2.1 Die Multipolentwicklung in der Elektrostatik Durch den Vergleich mit den im Abschnitt 1,2 hergeleiteten Ergebnissen sieht man sofort, dass gelten muss ~ = −∇φ E Die Lösung der Gleichung lautet φ(~r) = mit∇2 φ = −4πρ ZZZ ρ(~r0 ) 3 0 d ~r . |~r − ~r0 | (2.5) (2.6) Wir nehmen jetz an, die Ladungsdichte ist nur innerhalb einer Kugel mit ~ - Feld außerhalb dem Radius a von Null verschieden und betrachten das E der Kugel. Es wird sich dabei herausstellen, dass das Feld in genügend großer Entfernung kaum mehr von den genauen Details der Ladungsverteilung abhängt, sondern nur noch von gewissen globalen Eigenschaften, den sogenannten Multipolmomenten der Ladungsverteilung. Um dies zu zeigen, entwickeln wir die Funktion |~r − ~r0 |−1 in einer Taylorreihe in ~r0 um den Punkt ~r0 = 0 µ ¶ µ ¶ 1 1 1 X 0∂ 0 1 1 X 0 0 ∂2 1 := = + ri ri + ri rj 0 0 +..... = (2.7) 0 R |~r − ~r | r ∂ R ~r0 =0 2! i,j ∂ri rj R 21 ∞ X (−1)n X n! n=0 ri01 ...ri0n i1 ,...,in ∂ ∂ 1 ... ∂ri1 ∂rin n (2.8) Einsetzen der obigen Entwicklung im Ausdruck für das Potential φ(~r) liefert Z φ(~r) = 0 ρ(~r ) ∞ X −1n n=0 = ∞ X (−1)n n=0 n! n ri01 ...ri0n ∂ ∂ 1 3 ... d ~r ∂ri1 ∂rin r (2.9) ∞ (n) Pi1 ,...,in Die Größen X ∂ 1 ∂ ... := φn (~r). ∂ri1 ∂rin r n=0 (2.10) Z (n) Pi1 ,...,in = ri01 ...i0n ρ(~r)d3~r (2.11) heißen (elektrische) Multipolkomponenten n-ter Ordnung. Die 3n Multipolkomponenten n-ter Ordnung bilden zusammen einen Tensor n-ter Stufe: das Multipolmoment n-ter Ordnung. Das vom Multipolmoment n-ter Ordnung erzeugte Potential φ(~r) fällt für große r wie r−(n+1) ab, wie wir gleich noch im Detail zeigen werden. Weil die Multipolkomponenten selbst mit Hilfe der Ungeleichung Z (n) n Pi1 ,...,in < a Qabs ; Qabs = |ρ(~r0 )|d3~r (2.12) abgeschätzt werden können, verlieren die Terme in der Multipolentwicklung für r >> a mit zunehmenden n rasch an Bedeutung. Mathematisch konvergiert die Reihe für alle ~r außerhalb der kleinsten Kugel, die die Ladungsverteilung völlig umschließt; es gibt also eine möglichst günstige Wahl für den Ursprung. Als nächstes werden wir jetzt die niedrigsten Terme der Entwicklung einzeln betrachten: 1. n = 0 Z Q (0) mit Q := P = ρ(~r0 )d3~r0 (2.13) φ0 (r) = r das heißt: in großen Abständen nähert sich das Potential dem Potential einer Punktladung im Ursprung an, die Stärke der Punktladung ist gleich der totalen Ladung der Ladungsverteilung. Zwischenbemerkung: Die Multipoltentwicklung kann natürlich genauso für das Gravitationpotential einer Massenverteilung aufgeschrieben werden; sie liefert die Rechtfertigung dafür, dass man Gravitationspotential der Sonne oder der Erde in der Keplertheorie dur dasjenige einer 22 Punktmasse im Schwerpunkt ersetzen darf. Allerdings spürt ein Satellit auf einer erdnahen Bahn durchaus die höheren Multipolmomente der Massenverteilung; das genaue Studium der Satellitenbahen bildet inzwischen sogar die genauste Methode zur Bestimmung der Multipolmomente der Massenverteilung innerhalb der Erde (mit gewissen Einschränkungen, die im weiteren Teil dieses Abschnitts noch klar werden). Es gibt allerdings einen wichtigen Unterschied zwischen Elektrostatik und Gravitation: Weil Massen immer positiv sind, ist das gravitationelle ”Monopolmoment” P (0) immer ungleich Null; das elektrostatische Monopolmoment dagegen kann verschwinden, wie z.B. für Atome und Moleküle der Fall ist (Ladungsneutralität). 2. n = 1 ∂ 1 ~r = p~ 3 ∂ri r r (2.14) ~ 1 (~r) = −∇φ1 (~r) = T (~r)~p E (2.15) (1) φ1 (~r) = −P1 R Der Vektor p~ = ~rρ(~r)d3~r heißt das elektrische Dipolmoment. Das korrespondierende elektrische Feld ist wobei 1 T (~r) = 3 r µ ~r~r −I + 3 2 r ¶ (2.16) der sogenannte Dipoltensor ist. Das Feld fällt also ab wie r−3 und hat eine Winkelverteilung, gegeben durch den Faktor −1 + 3~r~r/r2 . Für einen Dipol in z-Richtung sind die Komponenten des elektrischen Feldes µ ¶ 3xz 3yz 3z 2 1 Ex = 5 Ey = 5 Ez = −1 + 2 (2.17) r r r r3 Das Musterbeispiel einer Ladungsverteilung mit nichtverschwindendem Dipolmoment besteht aus zwei Punktladungen e1 und e2 in ~r1 und ~r2 : ρ(~r) = e1 δ(~r − ~r1 ) + e2 δ(~r − ~r2 ) (2.18) p~ = (e1 + e2 )~r1 + (~r2 − ~r1 )e2 (2.19) mit Für den wichtigen Sonderfall e1 = −e2 (keine Nettoladung) erhält man p~ = e~s 23 (2.20) wobei ~s der Vektor ist, der von der negativen zur positiven Ladung +e u ¡ µ ¡ ~s ¡ ¡ ¡ −e ¡ u zeigt; in diesem Fall ist p~ also unabhängig von der Wahl des Ursprungs. Weiter sieht man, dass das Dipolmoment invariant ist unter der Transformation ~s0 = εs e0 = e/ε (2.21) In dem Limes ε → 0 entsteht ein ”idealer Dipol”, d. h. eine Ladungsverteilung, deren höhere Multipolmomente alle verschwinden [wegen P (n) = O (²n−1 )] und dessen Potential für alle r 6= 0 durch φ1 (~r) gegeben ist (weil r > |s0 | im Grenzfall überall erfüllt ist). Ideale Dipole sind gelegentlich bequeme Gedankenkonstruktionen für theoretische Überlegungen, aber deren Bedeutung soll nicht überbewertet werden. 3. n = 2 1 (2) ∂ 2 1 1 (2) φ2 (~r) = Pij = Pij Tij (~r) 2 ∂ri rj r 2 Der Tensor (2.22) Z Q=P (2) = ~r~rρ(~r)d3~r oder in der Komponentenschreibweise Z Qij = ri rj ρ(~r)d3 r (2.23) (2.24) heißt das Quadrupolmoment der Ladunsverteilung ρ(~r). Der Tensor Q ist offensichtlich symmetrisch: Qij = Qji . Er kann weiters zerlegt werden gemäß 1 (2.25) Qij = tr(Q)δij + Q̃ij 3 mit 1 Q̃ij = Qij − tr(Q)δij (2.26) tr(Q) = Qii 3 Dabei heißt tr(Q) die Spur des Tensors Q und Q˜ij heißt das reduzierte Dipolmoment. Einsetzen dieser Zerlegung im Ausdruck für φ2 (~r) ergibt, 24 dass nur Q̃ij zum Potential beiträgt: Die Spur des Tensors T verschwindet wegen ∇2 1r = 0. Der reduzierte Quadrupoltensor hat fünf unabhängige Elemente. Jedes Quadrupolfeld lässt sich darstellen als das Feld eines geschickt gewählten Rhombus wie nebenan gezeichnet. Auch für die Spezifikation des Rhombus sind fünf Daten notwendig: Drei Eulerwinkel für die Orientierung der Figur im Raum, das Achsenverhältnis s1 /s2 und die Stärke es21 . Das Potential ist invariant unter der Transformation si → εsi (i = 1, 2) e → e/ε2 (2.27) und der Limes ε → 0 ergibt den idealen Quadrupol. +e u ­­JJ ­ J ­ J ­ Ju −e −e u JJ ­­ ­ J J ­ ­ Ju +e 4. n > 2: Die höheren Mulitpolmomente sind für die Praxis nicht sehr wichtig. Wir bestimmen hier nur die Zahl der unabhängigen und für das Potential relevanten Parameter. Zuerst bemerken wir, dass die Multipoltensoren gegen paarweise Vertauschung der Indizes invariant sind. Für den Wert einer Mulipolkomponente der Ordnung n ist nur wichtig, wieviele Indizes die Werte x,y und z annehmen; nennen wir diese Zahlen nx , ny und nz . Bei vorgegebenem nx kann ny die Werte 0 bis n − nx annehmen; nz liegt dann fest. Insgesamt hat das Multipolmoment n-ter Ordnung also n X n − nx + 1 = nx =0 1 (n + 1) (n + 2) 2 (2.28) verschiedene Elemente. Diese sind aber nicht alle für das Potential außerhalb der Ladungsverteilung relevant. Mittels der Zerlegung (n) (n) Pi1 ...in = Si3 ...in δi1 i2 + P̃i1 ...in 25 (2.29) mit 1 (n) Si3 ...in = Pi,i,i3 ...in (2.30) 3 zeigt man, dass die Teilspur Si3 ...in nicht beobachtbar ist; sie wird im Ausdruck für das Potential multipliziert mit 1 ∂ ∂ ∂ ∂ 1 ∂ ∂ 1 ∂ ∂ ∇2 = 0 (2.31) ... = ∇2 ... = ... ∂ri ∂ri ∂ri3 ∂rin r ∂ri3 ∂rin r ∂ri3 ∂rin r Solche Teilspuren lassen sich für jedes Paar Indizes bilden; insgesamt gibt es also 21 n(n − 1) unbeobachtbare Linearkombinationen der Multipolkomponenten n-ter Ordnung. Die Zahl der unabhängigen, im Fernfeld beobachtbaren Komponenten beträgt also 1 1 (n + 1) (n + 2) − n (n − 1) = 2n + 1. 2 2 (2.32) Die Zahl 2n+1 ist also auch gleich der Zahl der unabhängigen Lösungen der Laplace-Gleichung ∇2 φ = 0, die im Unendlichen wie r−n−1 abfallen. Dieses Ergebnis erhält man auch auf natürliche Weise aus der Lösung der Laplace-Gleichung in Kugelkoordinaten, die wir in der Vorlegung Quantenmechanik durchgeführt haben. Dabei wird sich herausstellen, dass die allgemeinste Lösung der Laplace-Gleichung geschrieben werden kann als φ(~r) = l ∞ X X ¡ ¢ Alm rl + Blm r−(l+1) Ylm (θ, φ) (2.33) l=0 m=−l wobei Ylm (θ, φ) die sogenannten Kugelfunktionen sind und Alm und Blm willkürliche Konstanten. In unserem Fall suchen wir ein Potential, das im Unendlichen mindestens wie r−1 verschwindet; deshalb müssen sämtliche Alm verschwinden. Die Blm müssen, wie der Vergleich mit der oben erhaltenen allgemeinen Lösung (Gl.2.11) zeigt, Linearkombi(l) nationen der Pi1 ,...,il sein; aus der Struktur von Gl.2.33 geht hervor, dass es genau (2l + 1)l relevante Linearkombinationen geben darf. Bemerkung 1 Weil nicht alle Komponenten der Multipolmomente mit n > 2 für das Potential außerhalb der Verteilung relevant sind, lässt sich umgekehrt auch nicht die komplette Ladungsverteilung aus dem äußeren Potetial rekonstruieren. So hat z.B. jede kugelsymmetrische Ladungsverteilung nach außen nur ein Monopolmoment: 26 ~ Aus Symmetriegründen muss das E-Feld rein radial gerichtet sein. Andererseits folgt aus dem Gaußschen Satz für eine Kugel mit Radius R > a: ZZ ZZZ 2 2 ~ ~ Eêr d O = 4πR |E(R)| = 4πρd3~r = 4πQ (2.34) R ~ r) = ~r3 Q; genau das Monopolfeld. Der Satz (2.34) heißt elektroalso: E(~ r statischer Gaußscher Satz. Bemerkung 2 Die in Gl.2.33 erhaltenen Zusatzlösungen erhält man durch Betrachtung einer Ladungsverteilung, die nur für |~r| > a von Null verschieden ist. Die Greensche Funktion |~r − ~r0 |−1 kann dann nach ~r entwickelt werden: ∞ X 1 1 ∂ ∂ = ri1 . ..rin ... 0 |~r − ~r | n=0 n! ∂ri1 ∂rin also φ(~r) = ∞ X (−1)n n=0 n! mit µ ¶ ∞ X (−1)n ∂ 1 1 ∂ = ... ri1 ...rin 0 R ~r=0 n=0 n! ∂ri1 ∂ri0n r0 (2.35) (n) ri1 ...rin Pext i1 ...in = φext r) n (~ (2.36) n=0 ZZZ (n) Pext i1 ...in := ∞ X d3~rρ(~r) ∂ ∂ 1 ... . ∂ri1 ∂rin r (2.37) (n) Weil der Tensor Pext symmetrisch und für jedes Paar Indizes spurlos ist, kann man wieder zeigen, dass es genau 2n + 1 unabhängige Lösungen der Ordnung n gibt; weiters sind diese offensichtlich Polynome der Ordnung n in den Komponenten von r: (0) (1) φext r) = Pext φext r) = ~rP~ext 0 (~ 1 (~ usw. (2.38) Die Form (2.33) erhält man durch Umdefinitionen, die wir nicht weiters nachvollziehen werden. 27 2.2 Elektrostatik in Anwesenheit von Leitern In Metallen und Halbleitern, im weiteren Leiter genannt, gibt es frei be~ wegliche Ladungsträger. Falls im Inneren dieser Materialien ein E-Feld ~ herrscht, so werden sich die positiven Ladungsträger in Richtung von E, die negativen in entgegengesetzter Richtung bewegen. In der Elektrostatik, ~ wo das E-Feld aus einem Potential herleitbar ist, wird also Ladung von den Maxima von φ(~r) weg- und auf die Minima von φ(~r) zuströmen. Ein stationärer Zustand kann nur existieren, falls φ(~r) im Leiter (einschließlich des Randes) überhaupt keine Maxima oder Minima mehr aufweist: φ(~r) ist konstant innerhalb eines Leiters. Wegen ∇2 φ = −4πρ verschwindet dann auch die Ladungsdichte im Inneren des Leiters: In einem Leiter können nur auf der Oberfläche Ladungen existieren. Dies ist natürlich eine Idealisierung, die z.B. die Wärmebewegung der Ladungsträger, sowie gewisse Quanteneffekte (Pauli - Verbot) vernachlässigt. Diese bewirken, dass die Ladungen sich in Wirklichkeit in einer dünnen, aber nicht unendlich dünnen, Schicht in der Nähe der Oberfläche aufhalten können. Solange die Dicke dieser Schicht gegenüber den Abmessungen des Körpers vernachlässigbar ist, kann man sie aber als unendlich dünn behandeln. Eine weitere Einschränkung der Verwendbarkeit der in diesem Abschnitt behandelten Theorie betrifft die Zeitskala: Wenn die Zahl der Ladungsträger oder deren Beweglichkeit niedrig ist, so kann es sehr lange bis sich der stationäre eingestellt hat, gegebenfalls sogar länger als die Dauer des Experiments oder der Erscheinung, die man beschreiben will. Das Potential einer auf die Oberfläche S beschränkten Ladungsverteilung mit Flächendichte (= Ladung pro Oberflächenelement) ω(~r) beträgt ZZ ω(~r) 2 0 φ(~r) = d ~r (r0 läuft über S) (2.39) 0 r − ~r | S |~ Wenn ~r sich der Oberfläche nähert, z.B. für ~r → ~r0 in der Skizze, bleibt φ(~r) stetig. Um dies zu zeigen, spart man zuerst aus der Oberfläche eine Kreisfläche mit dem Radius ∆r um den ”Schnittpunkt” ~r0 aus. 28 s~ r |~r − ~r0 | ¶¶ ¶ ¶ ¶ s¶ s ~r0 S ~r0 ∆r Das Integral über den Rest der Oberfläche ist stetig, weil der Integrand nirgendwo singulär ist. Das Integral über die Kreisfläche ist (für ein glattes ω(~r)) ZZ ∆r ω(~r0 ) 2 0 d ~r = |~r − ~r0 | Z∆rZ2π 0 ¡ 3¢ ω(~r0 ) 0 0 |~ r − ~ r | d|~ r − ~ r |dφ + O ∆r 0 0 |~r − ~r0 | (2.40) 0 Für ~r → ~r0 ergibt dies: ¡ ¢ 2πω(~r0 )∆r + O ∆r3 (2.41) (Die Fehlerabschätzung erfolgt durch Taylorentwicklung von ω(~r0 ) um den Punkt ~r0 ). Der Beitrag der Kreisfläche ist also für alle ~r außerhalb der Oberfläche stetig und bleibt beschränkt für ~r → ~r0 ; der Beitrag der Kreisfläche, und damit der ganze Ausdruck für φ(~r), ist also stetig für ~r → ~r0 , und der Grenzwert ist der gleiche auf beiden Seiten. Mittels einer ähnlichen Abschätzung erhält man das gleiche Ergebnis für die Ableitungen von φ(~r) ~ r). Weil parallel zur Oberfläche, also für die Tangentialkomponenten von E(~ ~ innerhalb des Leiters verschwinden, sollen die Tangentialkomponenten von E sie auch außerhalb des Leiters nach Null gehen, wenn man sich der Oberfläche ~ = 0). Das E-Feld ~ nähert (Alternativer Beweis aus ∇ × E steht also an der Oberfläche senkrecht zur Oberfläche. ~ zeigt an der Oberfläche einen Sprung. Diesen Die Normalkomponente von E könnte man wie oben durch Integration über einer kleinen Kreisfläche bestimmen; einen direkteren Zugang bietet aber der elektrostatische Gaußsche Satz, angewandt auf eine ”Pillendose” mit kreisförmigen Durchschnitt wie nebenan skizziert, mit Radius ∆r und infinitesimaler Höhe dh. Im Integral 29 ¾ ∆r - dh 6 ? I I S ZZZ 2~ ∇2 φ d3~r ' −4πω(~r0 )π(∆r)2 ∇φd O = S (2.42) V liefert die Mantelfläche einen Beitrag der Ordnung ∆r(dh)2 , der für infinitesimales dh vernachlässigt werden kann. Der Boden gibt einen verschwindenden ~ Beitrag, weil im Inneren des Leiters das E-Feld verschwindet. Der Beitrag des Deckels beträgt −π(∆r)2 En (~r0 + dh) ' −π(∆r)2 En (~r0 + εên ) (2.43) für dh → 0. Wir erhalten also: En (~r0 + εên ) = 4πω(~ro ), (2.44) ~ bezeichnet. Diese hat also an der wobei En die Normalkomponente von E Oberfläche einen Sprung der Größe 4πω(~r0 ). Beispiel 1: Leitende Kugel mit Gesamtladung Q und Radius a. Das Feld außerhalb der ~ = Q~r/r3 . An der Oberfläche Kugel ist radialsymmetrisch und beträgt E ~ auf Null; dies korrespondiert mit einer Oberflächenladungsdichte springt E ω= Q , 4πa2 (2.45) wie auch aus der Symmetrie des Problems leicht zu erraten ist. Das Potential beträgt φ = Q/r für r > a. Für r ≤ a hat φ(~r) den konstanten Wert φa = Q/a. Das Verhältnis Q C= (2.46) φa heißt die Kapazität eines Leiters; für eine Kugel gilt C = a. φ 6 a - r 30 Beispiel 2: b¯ ¯ ¯ ¯ ¯ a Kugelkondensator: Zwei leitende konzentrische Kugeln mit Radien a und b. Falls die Ladung auf der inneren Kugel Q beträgt, so wird auf der Innenoberfläche der äußeren Kugel insgesamt eine Ladung −Q induziert; es gilt Q −Q ω1 = ω2 = . (2.47) 2 4πa 4πb2 Das Potential beträgt Q φ(~r) = + k, (2.48) r wobei k eine Konstante ist. Der Potentialunterschied zwischen den beiden Kugeln beträgt µ ¶ 1 1 b−a V =Q − =Q , (2.49) a b ab die Kapazität ist definiert als C= Q ab = . V b−a (2.50) Im Grenzfall a → ∞, b → ∞ bei festem D = b − a nähert sich dies dem Wert C= O , 4πd (2.51) wobei O = 4πa2 die Oberfläche der Kugel ist. Dieses Ergebnis gilt auch, unter Vernachlässigung von Randeffekten, für einen ”aus den beiden Kugeln herausgeschnittenen” ebenen Plattenkondensator. Elektrostatische Probleme mit Leitern Bis jetzt haben wir die Oberflächenladungsdichte als bekannt vorausgesetzt, 31 oder aus der Symmetrie des Problems einfach herleiten können. In praktischen Problemen ist dies typischerweise nicht der Fall. Dort kann man entweder den Leiter isoliert halten und seine Gesamtladung vorgeben oder ihn mit einem Leiter sehr großer Kapazität verbinden und damit sein Potential vorgeben (in der Praxis meistens durch Erden, wodurch er das Potential φ = 0 erhält). Wie sich die Ladung genau über die Oberfläche verteilt ist nicht vorgegeben; es soll ein Teil der Lösung des Problems ausmachen. Die typische Aufgabe ist also: Bestimme eine Lösung der Poissongleichung ∇2 φ(~r) = −4πρ(~r) mit vorgegebenen ρ(~r) unter den Nebenbedingungen, dass für jeden der vorhandenen Leiter gilt entweder 1. φ(~r) = φi auf der Oberfläche des i-ten Leiters 2. oder HH ~ = 4πQi , wobei das Integral über die Oberfläche des ∇φ(~r)d2 O i-ten Leiters läuft. Si Zur Lösung dieser Aufgabe gibt es keine allgemeine Methode, wie für das Hauptproblem der Vektorechnung. Wohl aber können wir über den Greenschen Satz leicht die Eindeutigkeit beweisen. Die Differenz zweier Lösungen des obigen Problems muss nämlich eine Lösung der Laplace-Gleichung ∇2 φd = 0 sein mit den Randbedingungen: φd = 0 auf Leitern vom Typ 1 HH ~ = 0 auf Leitern vom Typ 2 ∇φd d2 O Anwendung des ersten Greenschen Satzes (1.43) mit Ψ = φ = φd und V das Volumen außerhalb sämtlicher Leiter liefert ZZZ X I I 2 3 ~ |∇φd (~r)| d ~r = − φi ∇φd (~r)d2 O (2.52) V i Si wobei die Summe über sämtliche Leiter im Problem läuft, und die Oberflächennormalen immer vom Leiter nach außen gerichtet sind. Weil φd (~r) auf jeder Leiteroberfläche konstant ist, kann der Faktor φd (~r) = φi vor das Integral geschrieben werden. In der Summe über i ist in jedem Term entweder der erste oder der zweite Faktor gleich Null. Es muss also gelten: ∇φd (~r) = 0 −→ φd (~r) = cst, (2.53) wobei die Konstante gleich Null sein muss, falls es mindestens einen Leiter vom Typ 1 gibt, oder falls V bis ins Unendliche reicht. 32 Der Nutzen dieses Eindeutigkeitssatzes ist, dass falls wir irgendeine Lösung konstruiert oder erraten haben, wir sicher sein können, dass diese auch die einzige Lösung ist. Ein praktisches numerisches Verfahren wird im nächsten Abschnitt kurz diskutiert werden. Für einfache, hochsymmetrische Probleme liefert die Methode der Bildladungen oft eine Lösung in geschlossener Form. Beispiel 1: ´ ´ r ´ ¡@ ´ ¡ ´ @ R R´ ¡´´ @ ¡´ ´ @ ´ ¡ r ´ ´ @r −e ´´ +e ´ ´ ´ Punktladung gegenüber unendlicher, leitender, geerdeter Platte. Wir legen die Platte in die y-z-Ebene und die Ladung in ~a = (a, 0, 0). Im Halbraum x ≥ 0 erfüllt das Potential φ(~r) = e e − |~r − ~a| |~r + ~a| (2.54) die Poissongleichung ∇2 φ = −4πeδ(~r − ~a) und die Randbedingung φ(~r) = 0 für x = 0. Es ist eine, also die Lösung des Problems. Unmittelbar rechts von der Platte gilt Ex (x = 0 + ε) = − ∂φ ea ea 2ea =− 3 − 3 =− 3 ∂x R R R (2.55) mit R2 = a2 + y 2 + z 2 . Die Oberflächenladungsdichte ist deshalb ω= 1 1 ea Ex (x = 0 + ε) = − , 4π 2π R3 (2.56) und die Gesamtladung auf der Platte ist ZZ ea ω dydz = − 2π Z∞ Z2π 0 0 ¯∞ ¯ ea ρ dρdφ ¯ p = ¯ = −e, 2 2 (ρ2 + a2 )3/2 ρ + a ¯0 33 (2.57) also genau minus die Punktladung. Das induzierte Feld am Ort der Punktladung beträgt ¯ ¯ x + a ~ ind (~a) = −e ¯ êx = − e êx . E (2.58) |~r + ~a|3 ¯~r=~a 4a2 Die Ladung wird also durch die Platte angezogen mit der Kraft µ ¶ 2 e ~ = − K , 0, 0 . 4a2 (2.59) Beispiel 2: Punktladung gegenüber einer geerdeten leitenden Kugel: ``` ``` ` R ¡¯ ¡¯ ¡θ0 ¯ 0 s −e ``` s ``` `` +e Wir versuchen wieder den Effekt der auf die Kugel influenzierten Ladungsverteilung außerhalb der Kugel durch eine Bildladung −e0 innerhalb der Kugel darzustellen. Aus Symmetriegründen plazieren wir die Bildladung auf der Achse durch Punktladung und Kugelmittelpunkt in einem Abstand s0 vom Zentrum. Der Abstand der Punktladung vom Zentrum sei s, der Radius der Kugel sei R. Unser Ansatz ist also φ(~r) = e e0 − |~r − ~s| |~r − ~s0 | (2.60) mit ~s = sêz ; ~s0 = s0 êz . Für einen Punkt auf der Kugel gilt |~r − ~s|2 = R2 + s2 − 2Rs cos θ (2.61) |~r − ~s0 |2 = R2 + s02 − 2Rs0 cos θ (2.62) Damit das Potential auf der Kugel verschwindet, muss gelten R2 + s2 − 2Rs cos θ e2 = e02 R2 + s02 − 2Rs0 cos θ 34 (2.63) p Dies ist für alle θ erfüllt, falls R2 = ss0 und e0 /e = s0 /s; es gilt also 0 2 0 s = R /s und e = −eR/s. Die Bildladung, und damit auch die gesamte auf der Kugel induzierte Ladung (Satz von Gauß) ist also immer kleiner als e. e0 Das induzierte Feld am Ort ~s beträgt − |s−s 0 |2 êz . Die Kraft zwischen Punktladung und Kugel beträgt also Kz = − ee0 ee0 s e2 Rs e2 R = − = − ∼ − |s − s0 |2 (s2 − R2 )2 (s2 − R2 )2 s3 (2.64) für s >> R. Für s − R = a << R erhält man e0 ' −e und Kz ' − e2 R2 e2 ' − , 4R2 a2 4a2 also das vorher erhaltene Ergebnis für die ebene Platte. 35 (2.65) 2.3 Die elektrostatische Energie Die potentielle Energie zweier Punktladungen e1 und e2 in ~r1 und ~r2 beträgt nach Coulomb e1 e2 V (~r1 , ~r2 ) = = e1 φ2 (~r1 ) = e2 φ1 (~r2 ). (2.66) |~r1 − ~r2 | Die potentielle Energie kann also wahlweise als die Energie der Ladung e1 im Feld der Ladung e2 oder als die Energie der Ladung e2 im Feld der Ladung e1 aufgefasst werden. Ganz analog gilt für die potentielle Energie von N Punktladungen V (~r1 , ..., ~rN ) = N −1 X i=1 N N X 1 X ei ej ei ej X ei ej = = , r rij 2 i6=j rij j=i+1 ij i<j (2.67) wobei rij = |~ri − ~rj |; dieses Ergebnis lässt sich auch schreiben als V (~r1 , ..., ~rN ) = N X ei φ(i) (~ri |{~rj }), (2.68) i=1 wobei φ(i) (~ri |{~rj }) das Potential aller Ladungen j 6= i ist. Falls es zusätzlich noch ein äußeres elektrostatisches Potential φ0 (~r) gibt, so hat man noch einen zusätzlichen Term N X V0 (~r1 , ..., ~rN ) = ei φ0 (~r). (2.69) i=1 Man beachte das Fehlen des Faktors 12 . Dies hat damit zu tun, dass die Positionen der Ladungen, die als Quellen des Feldes φ0 auftreten, nicht als Variablen des Systems betrachtet werden; es ist daher nicht sinnvoll, die Energie V0 zwischen den Ladungen ei und den Quellen von φ0 (~r) ”aufzuteilen”. Die obigen Ausdrücke werden für eine kontinuierliche Ladungsverteilung ρ(~r) U = U0 + Uint mit (2.70) Z U0 = ρ(~r)φ0 (~r)d3~r ZZ 1 ρ(~r)ρ(~r0 ) 3 3 0 d ~rd ~r . Uint = 2 |~r − ~r0 | Die Wechselwirkungsenergie kann auch geschrieben werden als Z 1 Uint = ρ(~r)φint (~r)d3~r 2 36 (2.71) (2.72) (2.73) wobei φint(~r) die Lösung der Poisson-Gleichung ∇2 φint (~r) = −4πρ(~r) ist. Unter Benützung dieser Gleichung erhält man Z Z Z 1 1 1 2 3 2 3 ~ int (~r)|2 d3~r. Uint = − ∇ φint (~r)φint (~r)d ~r = |∇φint | d ~r = |E 8π 8π 8π (2.74) Man kann sich also auch die Wechselwirkungsenergie als über den Raum ver1 ~ schmiert, mit der Dichte u(~r) = 8π |Eint (~r)|2 , vorstellen. Die Selbstenergie Wenn wir im gerade hergeleiteten Ausdruck für Uint für ρ(~r) eine Summe von δ-Funktionen einsetzen, so erhalten wir zusätzlich zur Wechselwirkungsenergie auch noch Selbstenergieterme, die durch das Weglassen der Einschränkung i 6= j in Gl.2.72 entstanden sind. Für Punktladungen sind diese sogar divergent: es kostet unendlich viel Energie, die Ladung eines Elektrons in einem Punkt zu konzentrieren! Diese Energie ist aber nicht praktisch nützbar, solange es nicht gelingt, z.B. ein Elektron zu spalten und in Komponenten mit noch kleinerer Ladung zu zerlegen. Unendlichkeiten lassen sich vermeiden, wenn man sich Ladungen auf kleine Kügelchen verteilt denkt. Das Hinzunehmen der Selbstenergieterme führt auch dazu, dass Uint , im Gegensatz zu V ({~ri }), eine positiv-definite Größe ist. Konkret erhält man für zwei Punktladungen (und φ0 (~r) = 0) ~ r) = e1 ~r − ~r1 + e2 ~r − ~r2 E(~ |~r − ~r1 |3 |~r − ~r2 |3 (2.75) und deshalb für die Energiedichte 1 ~ e21 e22 e1 e2 (~r − ~r1 )(~r − ~r2 ) 2 u(~r) = |E(~r)| = + + . 4 4 8π 8π|~r − ~r1 | 8π|~r − ~r2 | 4π |~r − ~r1 |3 |~r − ~r2 |3 (2.76) Die ersten beiden Terme sind Selbstenergieterme. Sie liefern bei Integration über den Raum außerhalb einer Kugel mit Radius a e2i 4π 8π Z∞ e2i 1 2 ρ dρ = . ρ4 2a (2.77) a Der Beitrag zur Selbstenergie des Gebiets r < a hängt vom spezifischen Modell für die ”Punktladung” ab. In der klassischen Theorie gibt es keinen Anhaltspunkt für die Wahl des Abschneideparameters a. In der Relativitätstheorie trägt aber die elektrostatische Selbstenergie (wegen E = mc2 ) zur Masse z.B. 37 des Elektrons bei. Dieser Beitrag wird von der Ordnung der Ruhemasse m0 für e2 e2 ∼ mc2 −→ a0 = ' 2, 8.10−13 cm; (2.78) a0 mc2 a0 heißt der klassische Elektronenradius. Experimentell gibt es auch keinerlei Hinweise für eine räumliche Struktur des Elektrons! Auch theoretisch gibt es kein befriedigendes Modell für den ”Aufbau” des Elektrons, in dem die Schwierigkeiten der unendlichen Selbstenergie umgangen werden kann. Man hat aber formale Rechenvorschriften entwickelt, die es erlauben ”mit den Unendlichkeiten zu leben”, d.h. trotz der in der Theorie vorkommenden Divergenzen für alle experimentell zugänglichen Größen endliche Ergebnisse zu erhalten (Renormierungsverfahren in der Quantenelektrodynamik, entwickelt von Tomonaga, Schwinger und Feynman). Betrachten wir jetzt den Wechselwirkungsterm in u(~r). Dieser liefert nach Integration (in Polarkoordinaten um ~r1 ) ~qr ½ > ½ ½ ½ ρ~½½ ½ ½ ½ ½ ½ q½ θ ~r1 ¾ ~r21 -q ~r2 Z e1 e2 ~r − ~r1 ~r − ~r1 + ~r12 3 d (~r − ~r1 ) 4π |~r − ~r1 |3 |~r − ~r1 + ~r12 |3 Z ρ − r12 cos θ e1 e2 = dρ sin θdθdφ 2 4π (ρ2 + r12 − 2ρr12 cos θ)3/2 ¯∞ Z ¯ e1 e2 −1 ¯ sin θdθdφ = 2 4π (ρ2 + r12 − 2ρr12 cos θ)1/2 ¯0 e1 e2 , = r12 also das bekannte Ergebnis für die Wechselwirkungsenergie. (2.79) (2.80) (2.81) (2.82) Multipolentwicklung für die elektrostatische Energie Als nächstes betrachten wir die Energie einer Ladungsdichte ρ(~r) in einem vorgegebenen äußeren Potential φ0 (~r): Z U0 = ρ(~r)φ0 (~r)d3~r. (2.83) 38 Taylorentwicklung von φ0 (~r) um den Ursprung ergibt ¯ ∞ ¯ X ∂ 1 ∂ ¯ φ0 (~r) = ri1 ...rin ... φ0 ¯ n! ∂ri1 ∂rin ¯ . (2.84) ¯ Z ∞ ¯ X 1 ∂ ∂ ¯ φ0 ¯ U0 = ri1 ...rin ρ(~r)d3~r ... ¯ n! ∂r ∂r i1 in n=0 (2.85) n=0 r=0 Einsetzen in Gl.2.83 ergibt ¯ ∞ ¯ X 1 (n) ∂ ∂ ¯ = φ0 ¯ Pi1 ,...,in ... n! ∂ri1 ∂rin ¯ n=0 r=0 (2.86) r=0 mit den vorher (Gl.2.11) definierten Multipolmomenten P (n) . Mehr explizit erhält man ~ 0 (0) − 1 Qij ∂ Ej (0) + ... U0 = Qφ0 (0) − p~E (2.87) 2 ∂ri In relativ schwach variierenden Feldern spielen also nur die niedrigeren Multipolmomente eine Rolle. Ausdrücke wie Gl.2.85 oder Gl.2.87 sind nützlich, wenn wir Kräfte und Drehmomente berechnen wollen, die auf einen Körper mit im körperfesten System vorgegebenem ρ(~r) wirken. Diese erhält man durch Differenzieren von U0 nach den Schwerpunktskoordinaten oder einem Orientierungswinkel des Körpers. Wir werden nur einige einfache Beispiele diskutieren. 1. Dipol in einem homogenen Feld: Die Feldenergie beträgt ~ = −pE0 cos θ U0 = −~pE (2.88) ~ sonst wirkt ein Drehmoment der Die Energie ist minimal für p~||E; Größe ~ | = −| ∂U0 | = | − pE sin θ| |N (2.89) ∂θ ~ 0 und wird mit Die Richtung steht senkrecht zu p~ und E ~ = p~ × E ~0 N richtig beschrieben. 39 (2.90) 2. Kraft auf eine starre Ladungsverteilung: Dazu bestimmen wir die Abhängigkeit von U0 vom Ort, um den die Taylorentwicklung vorgenommen wird. ¯ Z ¯ ∂ 3 ~ =− K ρ(~r + ~a)φ0 (~r)d ~r¯¯ (2.91) ∂~a ~a=0 = ∂ ~ 0 (~a) − 1 Qij ∂ E0j (~a) + ...)~a=0 (Qφ0 (~a) − p~E ∂~a 2 ∂ri ~ 0 (0) + pi ∇E0i (0) + 1 Qij ∇ ∂ E0j + ... = QE 2 ∂ri (2.92) (2.93) In einem inhomogenen Feld hängt die Schwerpunktsbewegung also vom Dipolmoment und von den höheren Multipolmomenten ab. Insbesondere kann man ein inhomogenes Feld dazu benützen, einen Strahl von Molekülen nach der Richtung ihrer elektrischen Dipolmomente zu sortieren. Das magnetische Analogon (Stern - Gerlach) war ein Schlüsselexperiment für die Quantenmechanik. Der Satz von Thomson (später Lord Kelvin) Im letzten Abschnitt haben wir gezeigt, dass die Ladungsträger auf Leitern sich so verteilen, dass das Potential innerhalb jedes Leiters konstant ist. Wir werden jetzt zeigen, dass dies genau die Verteilung ist, für die die elektrostatische Energie minimal ist bei vorgegebenen Gasamtladungen auf den einzelnen Leitern. Dies wurde zuerst von Thomson gezeigt. Wir betrachten die elektrostatische Energie ZZ XZ 1X ρi (~r)ρj (~r0 ) 0 U= φ0 (~r)ρi (~r)d3~r (2.94) d~rd~r + 2 i,j |~r − ~r0 | i in Abhängigkeit von den Ladungsdichten ρi (~r) auf den einzelnen Leitern. Dabei ist φ0 (~r) das Potential der fest vorgegebenen Ladungsverteilungen außerhalb der Leiter (im unendlichen Raum). Damit U minimal ist unter den Nebenbedingungen Z ρi (~r)d3~r = Qi (2.95) Vi muss nach Lagrange gelten ! à Z N X δ ρi (~r)d3~r U− φi δρi (~r) V i i i = 1, ..., N (2.96) wobei die Konstanten φi sogenannte Lagrange-Multiplikatoren sind. In Worten: Nur Variationen von U , die gleichzeitig auch eine oder mehrere 40 der Nebenbedingungen verletzen, können zu einer Variation von U führen. Dies ist sicherlich eine notwendige Bedingung für die Existenz eines Minimums. Ausarbeiten von Gl.2.96 liefert X Z ρj (~r0 ) φ0 (~r) + d3~r0 = φi für ~r ∈ Vi (2.97) 0| |~ r − ~ r j (die Einschränkung erfolgt, weil ρi (~r) nur innerhalb Vi von Null verschieden ist). Der Multiplikator φi hat also die Bedeutung des Potentials auf dem Leiter i. Ein Variationsprinzip kann fast immer für eine genäherte oder numerische Lösung eines physikalischen Problems genützt werden. Im vorliegenden Fall könnte man mit irgendeiner Verteilung der Ladungen auf den Oberflächen ~ anfangen und daraus E-Feld und elektrostatische Energie bestimmen. (In der Praxis mit einer diskretisierten Verteilung der Ladungen). Zunächst bewegt man einige der Ladungen etwas auf den Oberflächen umher (am ~ besten in der Richtung des berechneten E-Feldes) und prüft nach, ob dies zu einer Verringerung der Energie führt; bei genügend kleinen Verschiebungen entlang Etg ist dies immer der Fall und das Energiefunktional entscheidet was genügend klein ist! Dies wiederholt man, bis keine nennenswerte Verbesserungen der Energie mehr erreichbar sind (oder bis die verfügbare Rechenzeit zu Ende ist). Für φ0 = 0 lässt sich die Energie im stationären Punkt durch Einsetzen der Stationaritätsbeziehungen (Gl.2.96), schreiben als N 1X U= Qi φi 2 i=1 (2.98) wobei die φi aus der Lösung des Problems folgen, also Funktionen der {Qj } sind. Insbesondere gilt auf Grund des Superpositionsprinzips der Maxwellgleichungen N X φ(~r) = Qi φ(i) (~r) (2.99) i=1 (i) wobei φ (~r) die Lösung ist mit Qi = 1, Qj = 0 für j 6= i. Falls wir insbesondere den Wert von φ(i) (~r) auf dem Leiter j mit Γji andeuten: φ(i) (~r) = Γji so gilt φi = für ~r ∈ Vj X j 41 Γij Qj (2.100) (2.101) Die Inverse C der Matrix Γ heißt Kapazitätsmatrix. Es gilt also auch X Qi = Cij φj . (2.102) j Für die elektrostatische Energie kann man schreiben U= X 1X Qi Γij Qj = φi Cij φj . 2 ij ij (2.103) Die Kapazitätsmatrix wurde bestimmt aus dem Problem, in dem auf allen Leitern die Ladung vorgegeben ist. Wenn wir C einmal haben, können wir aber auch Probleme, in denen auf einigen der Leiter φi statt Qi gegeben ist, auf Probleme mit nur vorgegebenem Qi zurückführen. Falls k der {Qi } und für die restlichen Leiter die φj vorgegeben sind, so lassen sich aus Q = Cφ (N lineare Gleichungen) die restlichen Q’s und φ’s bestimmen. Zum Schluss zeigen wir noch, dass die Matrizen C und Γ symmetrisch sind. Dazu betrachten wir zuerst zwei willkürliche Ladungsverteilungen ρ(~r) und ρ0 (~r). Die korrespondierenden Potentiale seien φ(~r) und φ0 (~r). Jetzt gilt ZZ Z Z ρ(~r)ρ0 (~r) 3 3 0 0 3 d ~rd ~r = ρ(~r)φ (~r)d ~r = ρ0 (~r)φ(~r)d3~r (2.104) |~r − ~r0 | (Greensches Reziprozitätstheorem). Für zwei stationäre Verteilungen auf einem vorgegebenen Satz von Leitern P P reduziert sich dies zu i Qi φ0i = i Q0i φi oder X X X Qi Γij Q0j = Q0i Γij Qj = Qi Γji Q0j (2.105) ij ij ij Dies kann nur dann für beliebige {Qi } und {Q0i } gelten, falls Γij = Γji , also falls Γ, und damit auch C symmetrisch ist. 42 2.4 Dielektrika In diesem Abschnitt beschäftigen wir uns mit der Behandlung von Ladungen, die sich innerhalb von Atomen, Molekülen oder Isolatoren befinden. Wir nehmen an, diese Gebilde besitzen keine Nettoladung, sondern nur Dipol- und höhere Mulitpolmomente. In einer Koninuumsbeschreibung werden hieraus Dipol- und höhere Multipoldichten p(n) (~r). Das elektrostatische Potential φp einer solchen Verteilung findet man durch eine Umformung des Ausdruckes 2.9: Z ∞ X (−1)n ∂ ∂ 1 (n) φp (~r) = pi1 ,...,in (~r0 ) ... d3~r0 (2.106) 0| n! ∂r ∂r |~ r − ~ r i i n 1 n=1 Falls die Multipoldichten nur in einem endlichen Gebiet von Null verschieden sind, kann man jetzt alle ∂r∂ j durch − ∂r∂ j ersetzen und partiell integrieren. Das Ergebnis ist Z ρp (~r0 ) 3 0 d ~r (2.107) φ(~r) = |~r − ~r0 | mit ∞ X (−1)n ∂ ∂ (n) ρ(~r) = p ... n! ∂ri1 ∂rin i1 ,...,in n=1 (2.108) die sogenannte Polarisationsladungsdichte. Eine alternative Schreibweise ist ρp (~r) = −∇P~ (~r) mit (2.109) ∞ X ∂ (n) −1n ∂ ... p Pi (~r) = n ∂ri2 ∂rin i2 ,...,in n=1 (i) = pi (~r) − 1 ∂ (2) 1 ∂ ∂ (3) pij (~r) + p (~r)... 2 ∂rj 6 ∂rj ∂rk ijk (2.110) In der Praxis sind die höheren Multipolmomente meist gegenüber der Dipoldichte vernachlässigbar; dann kann P~ (~r) mit der Dipoldichte identifiziert werden. Im zeitabhängigen Fall ist mit der Polarisationsladungsdichte ρ(~r, t) = −∇P~ (~r, t) auch ein Polarisationsstrom verbunden. Aus dem Ladungserhaltungssatz ∂ ρ folgt ∇~j = − ∂t ∂ ∇~jp (~r, t) = ∇P~ (~r, t). (2.111) ∂t Es liegt nahe, für den Polarisationsstrom ~ ~jp (~r, t) = ∂ P~ (~r, t) + c∇ × M ∂t 43 (2.112) anzusetzen. Dies heißt nicht, dass die von den gebundenen Ladungen verursachte Stromdichte immer gleich der Zeitableitung von P~ ist; die Differenz wird aber durch die magnetische Multipoldichten gegeben (diese sind nicht mit Ladungsdichten verknüpft!). Falls wir in den Maxwellgleichungen Ladungs- und Stromdichte aufspalten gemäß ρ(~r, t) = ρf (~r, t) − ∇P~ (~r, t) (2.113) ~) ~j(~r, t) = ~jf (~r, t) + ∂ P~ (~r, t) + (c∇ × M ∂t (2.114) wobei ρf und ~jf die Beiträge der freien Ladungsträger darstellen, so erhält man für die zwei inhomogenen Maxwellgleichungen ~ = 4πρf − 4π∇P~ ∇E (2.115) ~ ~ − 1 ∂ E = 4π ~jj + 4π ∂ P~ (~r, t). (2.116) ∇×B c ∂t c c ∂t ~ + 4π P~ auf; die Gleichungen lassen Es tritt also immer die Kombination E sich kompakter schreiben mit den Hilfsgrößen So erhält man ~ r, t) = E(~ ~ r, t) + 4π P~ (~r, t). D(~ (2.117) ~ = 4πρf ∇D (2.118) ~ ~ − 1 ∂ D = 4π ~jf . ∇×B (2.119) c ∂t c Die letzte Gleichung wird in Anwesenheit von Magnetisierungsströmen noch weiter modifiziert. Sie ist aber für die Elektrostatik sowieso noch nicht notwendig. Nach diesem Exkurs in die Elektrodynamik kehren wir jetzt wieder zur reinen Elektrostatik zurück, also zur Diskussion der Gleichungen ~ = 4πρf ∇D (2.120) ~ =0 ∇×E (2.121) In praktischen Problemen ist die Polarisation P~ (~r) nicht eine vorgegebene Größe, sondern eine der zu bestimmenden Größen. Für viele Materialien folgt aus der Quantentheorie oder aus der statistischen Physik, dass P~ (~r) auf ~ und B ~ am gleichen Ort zusammenhängt. einfache Weise mit den Feldern E 44 Im einfachsten Fall (und für genügend schwache Felder) besteht ein linearer ~ Zusammenhang zwischen P~ und E: ~ r) P~ (~r) = χ(~r)E(~ (2.122) dabei heißt χ(~r) der elektrische Suszeptibilitätstensor. Dieser Tensor soll sämtliche Symmetrien des untersuchenden Materials bestitzen. So ist z.B. ein kubischer Kristall invariant unter Drehungen um 90◦ um die z-Achse. Dabei gilt êx → êy êy = −êx êz → êz (2.123) also χxx → χyy χyy → χxx χxy → −χyx (2.124) Für ein kubisches (und natürlich auch für ein isotropes) Medium gilt also χxx = χyy χxy = 0 (2.125) und analog χzz = χxx χxz = 0 χyz = 0 (2.126) Der Suszeptibilitätstensor ist also ein Vielfaches des Einheitstensors: ~ χ = χI; P~ = χE. (2.127) Die Kombination ε = I + 4πχ (Matrixgleichung), bzw. ε = 1 + 4πχ (skalare ~ und E ~ bewirkt, heißt dielekGleichung), welche die Verknüpfung zwischen D trische Matrix, bzw. dielektrische Konstante. Randwertaufgaben mit Dielektrika An einer Grenzfläche zwischen zwei Dielektrika muss gelten ~ tg ist stetig (aus ∇ × E ~ = 0) E ~ n ist stetig (aus ∇D ~ = 0) D Letztere Beziehung impliziert, dass En an der Oberfläche einen Sprung hat: E1n + 4πP1n = E2n + 4πP2n (2.128) E1n − E2n = 4π(P2n − P1n ) := 4πωp (2.129) also mit der Polarisationsoberflächenladungsdichte ωp (ein auf der Oberfläche konzentrierter Term in der Ladungsdichte, ρp = −∇P~ ). 45 Beispiel 1: Homogen polarisierte Kugel Wir betrachten eine spontan polarisierte Kugel (z.B. ein Ferroelektrikum) mit Polarisation P~ und Radius a. Das Gesamtdipolmoment ist also 4 p~ = πa3 P~ 3 (2.130) Es liegt also nahe, für das Potential außerhalb der Kugel anzusetzen p~~r r3 φ(~r) = (r > a) (2.131) Damit Etg stetig sein kann, muss auch φ(~r) stetig sein. Weiter gilt innerhalb der Kugel ∇2 φ = −4πρp = 4π∇P~ = 0 (2.132) also auch dort muss φ harmonisch sein. Wegen der Regularität für R = 0 und der Stetigkeit für r = a kommt dann nur p~~r a3 φ(~r) = (r < a) (2.133) in Betracht. Für die Normalkomponenten von E gilt also: p~ ~r a3 r (r < a) (2.134) p~ ~r r3 r (r > a) (2.135) p~ ~r = −4πP1n a3 r (2.136) E1n = − E2n = 2 Für r = a gilt daher E1n − E2n = −3 die oben hergeleitete Randbedingung ist also immer erfüllt. Beispiel 2: Dielektrische Kugel in einem homogenen Feld In Abwesenheit der Kugel gilt ~ 0~r. φ(~r) = φ0 (~r) = −E (2.137) Wir versuchen jetzt eine Lösung, bei der die Kugel homogen polarisiert ist: φ(~r) = φ0 (~r) + p~~r r3 (r > a) (2.138) φ(~r) = φ0 (~r) + p~~r a3 (r < a) (2.139) 46 Das elektrische Feld im Inneren der Kugel beträgt also ~ r) = E ~ 0 (~r) − p~ = E ~ 0 (~r) − 4π P~ (~r). E(~ 3 a 3 (2.140) Das Feld im Inneren der Kugel ist homogen, was mit dem Ansatz einer homogenen Polarisation verträglich ist. Der Wert von P~ kann jetzt aus der Materialgleichung bestimmt werden. Für ein isotropes Material muss gelten ~ = χ(E ~ 0 − 4π P~ ) P~ = χE 3 oder P~ = χ 3 ε−1~ ~ E0 . 4π E0 = 4π ε + 2 1+ 3 χ (2.141) (2.142) ~ Feld im Inneren der Kugel beträgt Das E~ 0. ~ =E ~ 0 − 4π P~ = 3 E E 3 ε+2 (2.143) ~ < |E ~ 0 |. Der Zusatzterm − 4π P~ heißt Depolarisationsfeld. Weil ε > 1 gilt |E| 3 Der Ansatz homogener Polarisation führt auch für ein homogenes dielektrisches Ellipsoid zum Ziel. Für andere Geometrien sind die Lösungen des dielektrischen Randproblem sehr viel komplizierter. Beispiel 3: Das Hohlraumfeld Eien mathematische triviale Variante des vorherigen Beispiels erhält man dadurch, dass man einen kugelförmigen Hohlraum (ε = 1) in einem ”unendlichen” Dielektrikum mit dielektrischer Konstante ε betrachtet. Weit ~ ∞ haben. Näher am Hohlraum weg vom Hohlraum soll das Feld den Wert E sollte man das Feld der ”fehlenden” Kugel spüren. Wir setzen also an ~ r − p~0~r φ(~r) = −E~ r3 (r > a) (2.144) Im Inneren setzen wir ein homogenes Feld an ~ c~r φ(~r) = −E (r < a) (2.145) ~c E ~ ∞) Aus der Stetigkeit von φ folgt (für p~0 E E∞ + p0 = Ec a3 (2.146) 2p0 ) = Ec a3 (2.147) und aus der Stetigkeit von Dn ε(E∞ − 47 Elimination von p0 aus den beiden Gleichungen liefert Ec = 3ε E∞ , 2ε + 1 (2.148) also immer größer als E∞ . Für das Dipolmoment der fehlenden Polarisation erhält man ε−1 3 p0 = a E∞ . (2.149) 2ε + 1 Das lokale Feld In den obigen Beispielen haben wir innerhalb eines Dielektrikums konstante oder wenigstens räumlich schwach variierende Felder gefunden. Dies kann natürlich nur auf einer groben, makroskopischen Skala richtig sein, nicht aber auf der atomaren Skala, wo man rasche Variationen des Feldes erwarten sollte. Diese Variationen sind nicht nur von akademischen Interesse; sie spielen eine Rolle, wenn man versucht, die dielektrischen Eigenschaften von dichten Medien (z.B. Flüssigkeiten oder Festkörpern) aus denjenigen von atomaren oder molekularen Bausteinen herzuleiten. Als einfachstes Beispiel betrachten wir nach Lorentz ein kubisches Gitter, auf dem sich Moleküle mit molekularer Polarisierbarkeit α befinden: ~ loc P~mol = αE ~ loc das Feld am Ort des Atoms darstellt. wobei E höherer Multipolmomente gilt also (2.150) Bei Vernachlässigung ~ loc P~ = nαE (2.151) ~ loc mit dem makroskopiswobei n die Dichte der Moleküle darstellt. Falls E ~ identifizierbar wäre, würde also gelten chen Feld E χ = nα ε = 1 + 4πnα (falsch) (2.152) Zur Berechnung des tatsächlichen Zusammenhangs bringen wir um den Mittelpunkt eines Moleküls eine Kugeloberfläche mit Radius groß gegenüber der Gitterkonstante, aber klein gegenüber den Abstäden, innerhalb denen ~ variiert an. Das Feld E ~ loc setzt sich zusamdas makroskopische Feld E men aus Beiträgen der Dipole außerhalb und innerhalb der Kugel (die eine ~ loc = E ~ f ern + E ~ nah . Den reine mathematische Hilfskonstruktion darstellt): E Beitrag der fernen Moleküle kann man makroskopisch berechnen. (Die Mulitpolentwicklung zeigt ja, dass in genügend großer Entfernung die Details der 48 Ladungsverteilung irrelevant werden). Das Feld eines unendlich homogenen polarisierten Körpers mit ausgesparter Kugel beträgt ~ f ern = E ~ −E ~ Kugel . E (2.153) Im Beispiel 1 haben wir gefunden, dass im Inneren der Kugel gelten muss ~ Kugel = − 4π P~ E 3 (2.154) also ~ f ern = E ~ + 4π P~ = (1 + 4π χ)E ~ = ε + 2 E. ~ E (2.155) 3 3 3 Dieses Feld ist nicht identisch mit dem in Beispiel 3 berechneten Hohlraumfeld! Dort war der ausgesparte Raum ein echtes physikalisches ”Loch”, das ~ f ern die Homogenität im Außenraum zerstörte. Wir bemerken noch, dass in E der Radius der ausgesparten Kugel nicht eingeht. @ @ ¡ ¡ I @ @ ¡ @ I @¡ I @ @ ¡ @ I @¡ I @ @ ¡ @ I @¡ I @ @ ¡ @ I @¡ ¡ ¡ @ @ ~ nah müssen wir die Beiträge der einzelnen Dipole inZur Berechnung von E nerhalb der Kugel aufsummieren. Diese kommen wegen der Symmetrie des Gitters immer in Gruppen von acht Stück auf den Eckpunkten eines Würfels ~ Felder mit dem Mittelpunkt im Ursprung vor. Wir zeigen jetzt, dass die Eeiner solchen Gruppe sich genau zu Null addieren. Die x- Komponente des Feldes eines Dipols am Ort ~r(x, y, z) beträgt (im Ursprung) Ex = 3(x2 px + xypy + xzpz ) − r2 px r5 (2.156) Wenn die Beiträge von (±x, ±y, ±z) (8 Kombinationen) aufsummiert werden, kürzen sich die Beiträge proportional zu py und pz sofort, und die Beiträge proportional zu px wegen x2 = 13 r2 (Gleichheit der Kanten des 49 Würfels). Dieselbe Rechnung lässt sich natürlich für Ey und Ez genauso durchführen. Wir erhalten also auf Grund der Symmetrie des Problems ~ nah = 0 E (2.157) ~ loc = E ~ f ern + E ~ nah = ε + 2 E ~ E (2.158) 3 Das Ergebnis für ein kubisches Gitter wird im Mittel auch für eine Flüssigkeit oder für einen isotropen amorphen Festkörper gelten. Für den Zusammenhang zwischen Polarisation und Feld erhalten wir also ¶ µ Eloc ε+2 χ = nα = nα (2.159) E 3 oder auch µ ¶ ε−1 ε+2 = nα (2.160) 4π 3 ε−1 4π = nα (kubische Materialien) (2.161) ε+2 3 Dies ist die berühmte Clausius-Mossotti Beziehung. Für nicht-kubische Ma~ nah terialien kann man ähnliche, aber nich identische Beziehungen herleiten (E ist nicht mehr Null!). Physikalisch ist es nicht immer gerechtfertigt für α die Suszeptibilität des Moleküls in der Gasphase einzusetzen; in Flüssigkeiten oder Festkörpern können Moleküle etwas ”zerquetscht” werden, was auch ihre Suszeptibilität ändern kann. Zum Schluss bemerken wir noch, dass die Clausius-Mossotti Beziehung für 4π nα > 1 keine Lösung mehr hat; wenn 3 diese Größe von unten nach Eins strebt, geht ε nach unendlich, d.h. auch ein infinitesimal kleines Feld kann eine endliche Polarisation hervorrufen (spontane Polarisation; Ferroelektrizität). Allerdings bricht schon für niedrige Werte das einfache physikalische Bild, das der Clausius-Mossotti Beziehung zu Grunde liegt, zusammen; die starken elektrostatischen Kräfte können zur Verzerrung des Gitters führen, die Linearität der Beziehung zwischen p~ und ~ loc ist nicht länger gesichert und Schwankungen in Größe und Richtung der E individuellen molekularen Dipole können nicht länger vernachlässigt werden. Schlussbemerkung: Einheitensysteme ~ und D ~ im Vakuum physikalisch Aus dem Vorhergehenden folgt, dass die Felder E identisch sind. Im MKSA-Einheitensystem sind die beiden Größen mit verschiedenen Dimensionen behaftet und unterscheiden sich auch im Vakuum durch die ”Naturkonstante” ε0 . Dies hat messtechnische Vorteile, kann aber das Verständnis des physikalischen Sachverhalts etwas erschweren. Eine schöne Parabel über diese Frage findet man in: HBG Casimir, Helvetica Physica Acta 41 (1968) 741. 50 2.5 Magnetostatik Das Grundproblem der Magnetostatik, das heißt die Lösung der Geleichungen ~ =0 ~ = 4π ~j ∇B ∇×B (2.162) c wurde schon beim Hauptproblem der Vektoranalysis mit dem Ansatz ~ =∇×A ~ gelöst. Unter der Nebenbedingung ∇A ~ = 0 ist die Lösung B Z 1 ~j(~r0 )d3~r0 ~ A(~r, t) = (2.163) c |~r − ~r0 | Diese Lösung gilt nur, falls ∇~j = 0 (sonst ergibt sich ein Widerspruch mit ~ = 0). Dies ist aber in der Statik wegen ∇~j = − ∂ρ immer erfüllt. Die ∇×B ∂t ~ = 0: obige Lösung erfüllt dann auch die Nebenbedingung ∇A Z ~ 0 3 0 Z 3 0 j(~r )d ~r ~j(~r0 )∇ d ~r ∇ = |~r − ~r0 | |~r − ~r0 | Z Z h i d3~r0 3 0 d ~ r 0 0 0~ 0 = − ~j(~r )∇ = ∇ j(~ r ) =0 (2.164) |~r − ~r0 | |~r − ~r0 | ~ Feld findet man aus Gl.2.163: Für das BZ ~j(~r0 ) 3 0 1 Z ~j(~r0 ) × (~r − ~r0 ) 3 0 1 ~ ~ B =∇×A= ∇× d ~r = d ~r c |~r − ~r0 | c |~r − ~r0 | (2.165) was eine Erweiterung des Biot-Savartschen Gesetzes auf kontinuierlich verteilte Ströme darstellt. Die magnetostatische Multipolentwicklung Wir betrachten jetzt das Vektorpotential einer lokalisierten stationären Stromverteilung, und entwickeln wie vorher den Faktor |~r − ~r0 |−1 um ~r0 = 0: Z Z ~r 1 0 3 0 ji (~r )d ~r + 3 ~r0 ji (~r0 )d3~r0 + ... (2.166) Ai (~r) = cr cr die höheren Terme werden wir nicht explizit berücksichtigen. Zur Umformung dieser Integrale benützen wir eine Identität für ein quellenfreies, nur im Endlichen von Null verschiedenes Vektorfeld ~j(~r) und zwei willkürliche skalare Felder f (~r) und g(~r): Z f (~r)~j(~r)∇g(~r) + g(~r)~j(~r)∇f (~r)d3~r = 0 (2.167) 51 Der Beweis erfolgt durch partielle Integration: Z Z Z Z 3 3 3 ~ ~ ~ f j∇gd ~r = − g∇(f j)d ~r = − gf ∇jd ~r − g~j∇gd3~r, (2.168) wobei der erste Term wegen ∇~j = 0 verschwindet. Einsetzen von f = 1 und g = ri liefert Z Z ~j(~r)∇ri d3~r = ji (~r)d3 r = 0 (2.169) und zeigt also das Verschwinden des ersten Terms in Gl.2.166. Einsetzen von f = ri und g = rj liefert Z (ri jj + rj ji )d3~r = 0 (2.170) also Z ~r Z 0 3 ~r ji d ~r = rj 1 = − rj ²ijk 2 Z rj0 ji (~r0 )d3~r0 1 = − rj 2 Z 1 (~r × ~j(~r0 ))k d3~r = − (~r × 2 0 (ri0 jj − rj0 ji )d3~r0 (2.171) Z ~r0 × ~j(~r0 )d3~r0 )i . Mit der Definition des magnetischen Dipolmoments m ~ Z 1 m ~ = ~r × ~j(~r)d3~r 2c (2.172) (2.173) reduziert sich Gl.2.166 damit zu ~ × ~r ~ r) = m A(~ r3 ~ Feld ist Das zugehörige Bµ ¶ ∂ m ~ × ~r ∂ ∂ 1 Bi = ²ijk = −²ijk ²klm ml = 3 ∂rj r ∂rj ∂rm r k µ ¶ µ ¶ ∂ ∂ 1 ∂ ∂ 1 2 −mi ∇ + mj = mj für ~r 6= 0 ∂ri ∂rj r ∂ri ∂rj r Wir erkennen hier den Dipoltensor Tij = ~ = Tm B ~ (2.175) ∂ ∂ 1 : ∂ri ∂rj r ~ = T p~ analog zu E 52 (2.174) (2.176) Diese Analogie hat zur Bezeichnung magnetisches Dipolmoment geührt. Das kanonische Beispiel einer Verteilun, die ein magnetisches Dipolmoment besitzt, ist ein Kreisstrom mit dem Radius a und der Stärke j0 ; m ~ steht offensichtlich senkrecht zur Stormebene und hat den Wert 1 m= 2c Z2π aj0 a dφ = πa2 j0 . c (2.177) 0 Dipoldichte (Magnetisierung) ~ (~r). Als nächstes betrachten wir eine kontinuierliche Verteilung von Dipolen M Deren Vektorpotential ist offensichtlich Z ~ r) = A(~ 1 ~ (~r ) × ∇ M d3~r0 = |~r − ~r0 | 0 0 Z ~ (~r0 ) ∇0 × M d3~r0 |~r − ~r0 | (2.178) Es ist zu beachten, dass beim ”Herüberbringen” des ∇× mittels partieller Integration kein Minuszeichen entsteht: ¸ µ ¶ ·Z ¶ Z Z µ Z ∂ ∂ ∂ ~a × ∇f = ²ijk aj f = −²ijk aj f = f ²ijk aj Ii = ∂rk ∂rk ∂rk i (2.179) ~ Mit der Magnetisierung (magnetische Dipoldichte) M (~r) korrespondiert also eine effektive Stromdichte ~ (~r) ~jM (~r) = c∇ × M (2.180) Diese Darstellung ist hier nur für eine Dipoldichte hergeleitet worden; wegen ∇~j = 0 ist sie aber für jede Stromverteilung im Prinzip möglich. Für den Strom der freien Ladungsträger ist eine Darstellung gemäß Gl.2.180 aber nicht sehr nützlich. Im allgemeinsten Fall lässt sich die Stromdichte ~j(~r) also schreiben als ~ (~r) ~j(~r) = ~jf (~r0 ) + c∇ × M (2.181) (im stationären Fall). Im zeitabhängigen Fall kann man auch noch eine Polarisationsstromdichte haben: ~ (~r, t) + ∂ P~ (~r, t). ~j(~r, t) = ~jf (~r, t) + c∇ × M ∂t (2.182) Einsetzen in die vierte Maxwellgleichung ergibt ~ ~ ~ − 1 ∂ E = 4π ~jf + 4π∇ × M ~ + 4π ∂ P ∇×B c ∂t c c ∂t 53 (2.183) ~ =E ~ + 4π P~ auch noch das zweite Wenn wir neben dem früher eingeführten D Hilfsfeld ~ =B ~ − 4π M ~ H (2.184) einführen, so reduziert sich obiger Ausdruck zu ~ ~ − 1 ∂ D = 4π ~jf . ∇×H c ∂t c (2.185) ~ hat sich die Bezeichnung ”magnetisches Feld” eingebürgert Für die Größe H ~ sondern B ~ die fundamentale magnetische Feldgröße ist). (obwohl nicht H Insgesamt findet man also für die makroskopischen Maxwellgleichungen ~ = 4πρf ∇D (2.186) ~ =0 ∇B (2.187) ~ ~ + 1 ∂B = 0 ∇×E (2.188) c ∂t ~ ~ − 1 ∂ D = 4π ~jf ∇×H (2.189) c ∂t c Diese Gleichungen bilden zusammen mit Material- oder Verknüpfungsgleichungen ~ = D( ~ E, ~ B), ~ H ~ = H( ~ E, ~ B) ~ ein lösbares System. D In der Magnetostatik gelten die Gleichungen ~ = 4π ~jf ∇×H c ~ =0 ∇B (2.190) Auf einer Oberfläche zwischen zwei Medien, auf der sich keine freien Ladungsträger befinden, soll deshalb gelten: Bn ist stetig; Htg ist stetig. Die magnetische Suszeptibilität Für einfache isotrope Materialien (mit der wichtigen Ausnahme der Ferro~ eine lineare Funktion von B: ~ magneten) ist M ~ = χm B ~ M ~ = (1 − 4πχm )B ~ H (2.191) ~ aber nicht in B ~ sondern in H ~ ausgedrückt: Üblicherweise wird M ~ = κH ~ M ~ = (1 + 4πκ)H ~ = µH ~ B (2.192) Die Größen κ und µ heißen magnetische Suszeptibilität bzw. Permeabilität. Der mathematische Zusammenhang ist einfach: κ= χm 1 − 4πχm µ= 54 1 1 − 4πχm (2.193) Die übliche Formulierung hat den Vorteil, dass magnetostatische Probleme mit ~jf = 0 sich direkt auf elektrostatische Analoga abbilden lassen (einschließlich der Randbedingungen) ~ ↔H ~ E ~ ↔B ~ D ~ P~ ↔ M ² ↔ µ. (2.194) Der einzige Unterschied ist, dass µ, im Gegensatz zu ², sowohl größer als auch kleiner als Eins sein kann. Materialien mit µ < 1 heißen diamagnetisch, solche mit µ > 1 heißen paramagnetisch. 55 2.6 Die magnetische Energie Die elektrostatische Energie einer Ladungsverteilung ist gleich der Energie, die man aufbringen muss, um die Ladungen aus einer Vergleichskonfiguration, in der alle Punktladungen unendlich weit voneinander entfernt sind, in die vorgeschreibene Konfiguration zu bringen. Dabei bewegen sich die Ladungen zum Teil in Richtung der elektrischen Felder; somit ist der Beitrag eines Teilchens zur elektrostatischen Energie als ein Wegintegral Zr Zt ~ (i) Ui = −ei 0 0 ~ (i) (~r0 , t0 )~v (t0 )dt0 E 0 E (~r , t )d~r = −ei ∞ (2.195) t0 ~ (i) das Feld der übrigen, festgehaltenen Ladungen ist zu schreiben, wobei E und ~r0 (t0 ) die Bahn entlang der das Teilchen mit der Ladung ei im Zeitintervall (t0 , t) aus dem Unendlichen zum Ort ~r gebracht wird. Die magnetischen Beiträge zur Energie des Systems können nicht als die Arbeit verstanden werden, die von den magnetischen Feldern geleistet wird. Die Lorentzkraft e~v ~ r) F~L = × B(~ (2.196) c steht immer senkrecht zur Geschwindigkeit des Teilchens und leistet daher keine Arbeit. Andererseits wirken während des Einschaltens der für das Magnetfeld verantwortlichen Ströme elektrische Induktiosfelder, die sehr wohl Arbeit leisten können. Magnetische Energie ist letztendlich Arbeit, die von den ~ Feldes, geleistet Induktionsfeldern, das heißt vom quellenfreien Anteil des Ewird. Sie ist also im Rahmen der Magnetostatik nicht wirklich befriedigend zu behandeln. Wir betrachten zuerst einen festen Stromkreis, in dem der Strom von Null auf den Wert J hochgefahren wird. Der Strom J(t) erzeugt eine magnetische ~ r, t) und damit ein Induktionsfeld mit ∇ × E ~ = − 1 ∂ B~ . Die vom Induktion B(~ c ∂t Induktionsfeld geleistete Arbeit ist dUm = −I(t) dt I ZZ ~ ~l = −I Ed C ~ 2O ~ =I ∇ × Ed c S ZZ ~ ∂B ~ d2 O ∂t (2.197) wobei S eine durch den Stromkreis C berandete Fläche ist. Einsetzen von ~ = ∇×A ~ erlaubt es, das Integral wieder auf ein Linienintegral zu reduzieren: B I c ZZ S ~ ∂B ~ =I d2 O ∂t c ZZ ~ ∂A ~ =I ∇× d2 O ∂t c 56 I C ~ ∂A d~l ∂t (2.198) Dieser Ausdruck kann jetzt von einem einzelnen Stromkreis auf eine kontinuirliche Stromverteilung verallgemeinert werden Z Z ~ r, t) ~ dUm 1 ~ ∂ A(~ 1 3 ~ ∂ A(~r, t) d3~r. = j(~r, t) d ~r = (∇ × B) (2.199) dt c ∂t 4π ∂t Bei der Herleitung der magnetischen Feldenergie ist ein Term in dUm /dt weggelassen worden. Dieser beträgt (für ε = 1) Z ~ ~ 1 ∂E ∂A 3 − d ~r (2.200) 4πc ∂t ∂t Als erstes bemerken wir, dass der Term beliebig klein wird, wenn das Hochfahren der Ströme beliebig langsam durchgeführt wird. Der Term kann aber zur stationären Feldenergie überhaupt keinen Beitrag liefern: ~ + 1 ∂ A~ ) = 0. Die dritte Maxwellgleichung kann geschrieben werden als ∇ × (E c ∂t ~ als auch A ~ divergenzfrei sind, bzw. gewählt Weil in unserem Fall sowohl E werden können, kann man den obigen Term schreiben als Z ~ Z 1 ∂E ~ 3 1 d ~ 2 d3~r. Ed ~r = |E| (2.201) 4π ∂t 8π dt ~ konstant ist, und E ~ deshalb verWeil im Anfangs- wie im Endzustand B schwindet, gibt der oben erwähnte Term nach Integration über t keinen Beitrag zu Um . Patielle Integration liefert (vgl. Gl. 2.178) für lokalisierte Ströme · Z ¸ Z Z ~ ~ dUm 1 ∂A 1 ∂B d 1 3 3 2 3 ~ ~ ~ = B(∇ × )d r = B dr= B d ~r . dt 4π ∂t 4π ∂t dt 8π (2.202) ~ Falls wir die magnetische Feldenergie für j := 0 gleich Null setzen, erhalten wir also Z 1 ~ r)|2 d3~r Um = |B(~ (2.203) 8π Der Ausdruck ist ganz analog zum Ausdruck für die elektrostatische Energie; insbesondere spielt es keine Rolle, wie rasch oder langsam man den Strom anwachsen lässt; die Energie hängt nur von der Endkonfiguration der Ströme ab. Wenn die Ströme sich nicht im Vakuum befinden, sondern es auch noch magnetisierbare Substanzen gibt, so soll in der obigen Herleitung nur ~jf ~ substituiert werden. Dies führt zu ~j soll ∇ × H auftreten und für 4π c f 1 Um = 4π Zt Z ~ ~ r, t0 ) ∂ B(~r, t) dt0 d3~r H(~ ∂t −∞ 57 (2.204) Für isotrope Materialien mit der Permeabilität µ führt dies zu Z 1 ~ r, t)B(~ ~ r, t)d3~r Um = H(~ 8π (2.205) Für reale Meaterialien, in denen die Magnetisierung sich nicht sofort dem ~ Feld anpassen kann, muss Gl.2.204 verwendet werden. In dem Fall ist BUm zwar die von den Induktionsfeldern geleistete Arbeit; man braucht aber eine seperate Überlegung, um festzustellen, ob diese Arbeit in der Feldenergie ”gespeichert” ist oder villeicht schon im magnetisierbaren Material in Wärme umgesetzt worden ist. Solche Fragen sind allerdings Gegenstang der Thermodynamik und sollen hier nicht weiter diskutiert werden. Zwischenbemerkung über die elektrostatische Energie Auch für die elektrostatische Energie in Anwesenheit von Dielektrika kann man zu Gl.2.204 und Gl.2.205 analoge Ausdrücke herleiten. Die Änderung der elektrostatischen Energie auf Grund einer infinitesimalen Änderung der freien Ladungsträger beträgt Z Z dUe ∂ ∂ρf (~r, t) 1 3 ~ 3~r = φ (∇D)d = φ(~r, t)d ~r = dt ∂t 4π ∂t 1 − 4π Z ~ ∂D 1 ∇φ d3~r = ∂t 4π Z ~ ~ ∂ D d3~r, E ∂t ~ = εE) ~ zu was für isotrope lineare Dielektrika (D Z 1 ~ r)E(~ ~ r)d3~r D(~ Ue = 8π (2.206) (2.207) ~ nicht instantan führt. Auch hier gibt es Komplikationen, falls P~ dem Feld E folgen kann. Alternative Ausdrücke für die magnetische Energie im Vakuum Für den für Ströme im Vakuum gültigen Ausdruck Z Z 1 1 2 3 ~ (~r)d r = ~ ~ 3r B B(∇ × A)d (2.208) Um = 8π 8π kann man über eine partielle Integration (für eine auf einem endlichen Bereich beschränkte Stromverteilung) den alternativen Ausdruck Z Z 1 1 3 ~ ~ ~ r)d3~r ~j(~r)A(~ Um = (∇ × B)Ad ~r = (2.209) 8π 2c 58 ~ als Funktion von ~j liefert erhalten. Einsetzen des Ausdrucks für A ZZ ~ ~ 0 1 j(~r)j(~r ) 3 3 0 Um = 2 d ~rd ~r . 2c |~r − ~r0 | (2.210) Für eine auf N Stromkreise Ci mit Strömen Ji lokalisierte Stromverteilung ergibt dies I N I 1 X 1X Ii Ij ~ ~ Li,j Ii Ij Um = 2 d l d l = i j 2c i,j=1 C1 C2 |~r − ~r0 | 2 i,j (2.211) wobei d~li ein Längenelement entlang dem i-ten Stromkreis ist. Die rein geometrischen Koeffizienten I I d~li d~lj 1 Lij = 2 (2.212) c Ci C2 |~r − ~r0 | heißen Induktivitätskoeffizienten. Offenbar gilt Lij = Lji . Die Größe Lii heißt die Selbstinduktivität des i-ten Stromkreises, die Größe Lij heißt wechselseitige Induktivität der Stromkreise i und j. Die Koeffizienten Lij geben auch den Zusammenhang zwischen den Strömen Ii und dem Induktionsfluss φj durch den Stromkreis j. Letzterer ist definiert als ZZ ~ r)d2 O ~ φi = B(~ (2.213) Si ~ = 0). für eine willkürlich durch Ci berandete Fläche (willkürlich wegen ∇B Durch Spezialisierung von Z 1 ~ 3~r ~j Ad Um = (2.214) 2c auf den Fall von N Stromkreisen erhält man I ZZ X 1 X 1 X ~ ~ = 1 ~ ~ 2O Um = Ii Adl = Ii Bd Ii φi 2c i 2c i 2c i Ci Si (2.215) und Vergleich mit dem oben erhaltenen Ausdruck erhält man N X 1 φi = Lij Ij c j=1 (2.216) (Genau betrachtet könnte man hier zu Lij noch eine willkürliche antisymmetrische Matrix addieren. Die Symmetrie von Lij lässt sich aber genauso 59 beweisen wie die Symmetrie von Cij ). Magnetische Wechselwirkungsenergie Wir teilen jetzt die Stromdichte ~j(~r) auf gemäß ~j(~r) = ~j0 (~r) + ~j1 (~r), wobei ~j0 (~r) die, festgehaltenen Erzeuger des ”äußeren Vektorpotentials” und ~j1 (~r) die Stromverteilung in einem ”Testkörper” darstellen. Es gilt dann Z 1 ~0 + A ~ 1 )d3~r Um = (~j0 + ~j1 )(A (2.217) 2c ~ 0 und A ~ 1 die von ~j0 bzw. ~j1 erzeugten Vektorpotentiale sind. Ausarwobei A beiten dieses Ausdrucks liefert Z Z Z 1 1 1 3 3 ~ 0 d ~r + ~ 1 d ~r + ~ 0 d3~r ~j0 A ~j1 A ~j1 A Um = (2.218) 2c 2c c wobei wir die leicht beweisbare Identität Z Z 3 ~ ~ 1~j0 d3~r ~j1 A0 d ~r = A (2.219) benutzt haben. Der interessante Term in Gl.2.218 ist die Wechselwirkungsenergie Z 1 ~ ~ 3 Um0 = j1 A0 d ~r (2.220) c Für eine lokalisierte Stromverteilung liegt es nahe, eine Multipolentwicklung durchzuführen. Die etwas langwierige Rechnung kann ”kurzgeschlossen” werden, in dem man einsetzt ~ 1 (~r) ~j1 (~r) = c∇ × M Man erhält so Z Um0 = (2.221) Z ~ 1 )A ~ 0 d3~r = (∇ × M oder ~ 1 (∇ × A ~ 0 )d3~r M (2.222) Z Um0 = ~ 1 (~r)B ~ 0 (~r)d3~r M (2.223) Insbesondere erhält man für einen Punktdipol m ~ 1 in ~r ~ 0 (~r). Um0 = m ~ 1B (2.224) Das Vorzeichen ist also genau das entgegengesetzte desjenigen im analogen elektrostatischen Ausdruck ~ 0 (~r) Ue0 = −~pE 60 (2.225) Der Ausdruck (2.224) darf nicht dazu benutzt werden, die Kraft und das ~ 0 (~r) zu bestimmen. Drehmoment auf den Dipol im vorgegebenen Magnetfeld B Falls der Dipol verschoben oder gedreht wird, ändert sich nämlich der Fluss ~ 0 erzeugen. Um trotzdem den Strom φ durch die Stromkreise, die das Feld B ~j0 aufrechtzuerhalten, muss Energie geleistet werden; auch diese Energie ist in Um0 enthalten. Kraft und Drehmoment auf eine Stromverteilung in einem vorgegebenen Feld berechnet man aus der Dichte der Lorentzkraft: ~k(~r) = 1~j1 (~r) × B ~ 0 (~r). c (2.226) ~ 1 ergibt das Für ~j1 = c∇ × M ki = ²ijk ²jlm ( ∂ ∂ ∂ M1m )B0k = ( M1i )B0j − ( M1j )B0j ∂rl ∂rj ∂ri (2.227) Also für die Gesamtkraft: Z Z 3 ~ ~ ~ 0) + M ~ 1 (∇B0i ))d3~r. Ki = (B0 ∇M1i − B0i (∇M1 ))d ~r = (−M1i (∇B (2.228) Der erste Term verschwindet indentisch; der zweite liefert einen Punktdipol Ki = m(∇B ~ 0i ) also das genaue Analogon des elektrischen Ausdruckes. Für das Drehmoment erhält man Z Z 1 3 ~ 0 )d3~r ~ = ~r × ~k(~r)d ~r oder N ~ = ~r × (~j × B N c Einsetzen der Identität ~a × (~b × ~c) = ~b(~a~c) − ~c(~a~b) liefert Z 1 ~ ~ ~j − (~r~j)Bd ~ 3~r N= (~rB) c (2.229) (2.230) (2.231) ~ 0 - Feld lässt der erste Term sich genauso behandeln wie Für ein homogenes B ~ der zweite Term in Gl.2.166. Das Ergebnis ist ~r/r3 → B(0): ~1 = m ~0 N ~ ×B Im zweiten Term erscheint das Integral Z XZ 3 ~ ~rj(~r)d ~r = ri ji (~r)d3~r, i 61 (2.232) (2.233) das wegen der Identität Z ri jj + rj ji d3~r = 0 (2.234) identisch verschwindet. Das gesamte Drehmoment ist also ~ =m ~ 0; N ~B (2.235) dieser Ausdruck ist völlig analog zum Ausdruck ~ = p~ × E ~0 N (2.236) für das elektrische Analogon. Das Potentialfeld, aus dem sich die Kräfte und Drehmomente im vorgegebenen Magnetfeld herleiten lassen, ist, wie man auch allgemein zeigen kann, Z ~ 1 (~r).B ~ 0 (~r)d3~r, Vm = − M (2.237) also das Negative des Wechselwirkungsterms Um0 in der magnetischen Feldenergie. Das unterschiedliche Vorzeichen der elektrischen und magnetischen Wechselwirkungsenergie trat auch schon in der Lagrangefunktion eines Teilchens in elektrischen und magnetischen Feldern auf. Auf Seite 99 des Skriptums Mechanik hatten wir gefunden e ~ 1 L = m~v 2 + ~v A. 2 c (2.238) Falls auch noch ein elektrostatisches Feld anwesend ist, so muss man wegen L = T − V einen Term −eφ0 (~r) addieren: 1 e ~ L = m~v 2 + ~v A 0 − eφ0 2 c (2.239) In Kontinuumsschreibweise ergibt dies Z Z 1 ~ ~ 3 L = Ekin + j(~r)A0 (~r)d ~r − ρ(~r)φ0 (~r)d3~r = Ekin + Um0 − Ue0 (2.240) c Zur Klärung der Hintergründe gehen wir nochmals zum analogen elektrostatischen Problem zurück, und zwar zum im Zusammenhang mit dem Satz von Thomson betrachteten System von N Leitern. Die elektrostatische Energie beträgt für dieses System 1X Ue = Qi Γij Qj . (2.241) 2 ij 62 Die Matrix Γ ist eine rein geometrische Größe, die von der Form und der relativen Lage der Leiter abhängt; diese seien mit den verallegemeinerten Koordinaten Xk (k = 1, ..., M ) angedeutet. Die verallgemeinerte Kraft entlang der Koordinate Xk ist ¯ ¯ X X ¯ ∂Γij ∂φi ¯¯ ∂Ue ¯ Qi Qj =− Qi (2.242) Kk = − =− ¯ ∂Xk ¯Qk ∂Xk ∂Xk ¯ ij i Qk wobei |Qk bedeuten soll, dass die Ableitungen bei konstanten Ladungen erfolgenPsollten; bei der letzten Umformung haben wir die Beziehung φi = j Γij Qj benützt. Die Größe Ue kann aber auch als Funktion der Potentiale aufgefasst werden: Ue = 1X φi Cij φj 2 ij mit C = Γ−1 Die Ableitung von Ue nach Xk bei konstanten φa beträgt ¯ X ∂Cij X ∂Cij ∂Ue ¯¯ Γil φ = Γjm Ql Qm . = φ j i ∂Xk ¯φa ∂X ∂X k k ij ijlm (2.243) (2.244) Jetzt nützen wir aus, dass Γ die Inverse von C ist X ∂Cij ∂ X ∂Γjm ∂ ( Cij Γjm ) = ( Γjm + Cij )= δim = 0 ∂Xk j ∂X ∂X ∂X k k k j (2.245) Es gilt also ¯ X ∂Γlm X ∂Ue ¯¯ ∂Γjm Q Q = Ql Qm = − Γ C il ij l m ∂Xk ¯φa ∂Xk ∂Xk lm ijlm (2.246) wobei wir die Symmetrie von C ausgenützt haben. Wir haben also letztendlich gefunden ¯ ¯ ¯ ∂Ue ¯¯ ∂Ue ¯¯ ∂Ue ¯¯ =− oder Kk = (2.247) ∂Xk ¯φj ∂Xk ¯Qj ∂Xk ¯φj Der unterschiedliche Energieaufwand ist natürlich die Energie, die benötigt wird, um die Leiter trotz der Änderung der Geometrie auf demselben Potential zu halten durch Zuführung von Ladungen aus dem Unendlichen (φ = 0). Diese Energie ist offenbar genau 2mal so groß wie die Energie, die für die Änderung der Geometrie bei festen Ladungen nötig ist. 63 Kehren wir jetzt zurück zum magnetischen Fall mit N Stromkreisen. Die magnetische Energie beträgt Um = 1X Ii Lij Ij . 2 ij (2.248) Wir können diese Energie aber auch in den Flüssen ausdrücken X φi = c Lij Ij . (2.249) j Der so erhaltene Ausdruck ist 1 X Um = 2 φi Λij φj c ij mit 1 Λ = L−1 c2 (2.250) Völlig analog zum elektrostatischen Fall kann man wieder herleiten ¯ ¯ ∂Um ¯¯ ∂Um ¯¯ =− (2.251) ∂Xk ¯φj ∂Xk ¯Ij Das Potential, aus dem man die magnetischen Kräfte mittels der ”normalen” Formel ∂Um (2.252) Kk = − ∂Xk herleiten kann, ist also die magnetische Energie bei festgehaltenen Flüssen. In diesem, nur für supraleitenden Stromkreisen realistischen Fall, brauchen die Stromquellen tatsächlich keien Arbeit zu leisten. Falls wir dieselbe Änderung der Geometrie bei festen Strömen durchführen wollen, so ist die für das Konstanthalten der Ströme benötigte Energie offensichtlich genau 2mal der Änderung der Feldenergie, was dann zum anomalen Vorzeichen führt. Auch ein Vergleich der Herleitungen von Gl.2.202 und von dUe /dt in Gl2.206 zeigt, dass die Flüsse in den magnetischen Formeln dort auftraten, wogegen die Ströme die Rollen der Poteniale spielen. Zum Schluss sei noch darauf hingewiesen, dass die Kräfte selbst natürlich nicht davon abhängen, unter welchen Nebenbedingungen sie gemessen werden: Kräfte können durch Balanzieren gegen eine Feder, oder ein Gewicht, gemessen werden, ohne dass eine tatsächliche Änderung der Koordinate auftritt. 64 3 3.1 Elektromagnetische Strahlung Lösungen der freien Maxwellgleichung In diesem Kapitel werden die zeitabhängigen Terme in den Maxwellgleichungen ernst genommen. Der einfachste Fall ist dann der Fall verschwindender ~j und ρ, oder der Fall eines homogenen Mediums mit verschwindendem ~jf und ρf (wobei der Index f für ”frei” steht) und mit konstantem skalarem ε und µ. Weil der letztere Fall formal den ersten einschließt, betachten wir die freien Maxwellgleichungen ~ =0 ε∇E (3.1) ~ =0 µ∇H (3.2) ~ µ ∂H =0 (3.3) c ∂t ~ ~ − ε ∂E = 0 ∇×H (3.4) c ∂t Wie schon in Absatz I.3 gezeigt wurde, erhält man Wellengleichungen durch das Anwenden der Rotation auf die dritte und vierte Maxwellgleichung und das Ausnützen der Identität ~+ ∇×E ∇ × (∇ × ~c) = ∇(∇~c) − ∇2~c : (3.5) 2~ ~ − µ ∂ (∇ × H) ~ = −∇2 E ~ + µε ∂ E = 0 ∇ × (∇ × E) (3.6) c ∂t c2 ∂t2 2~ ~ = −∇2 H ~ + µε ∂ H = 0 ~ − ε ∂ (∇ × E) (3.7) ∇ × (∇ × H) c ∂t c2 ∂t2 ~ = 0 und ∇H ~ =0 Bei dieser Herleitung wurde auch noch die Bedingungen ∇E ~ ~ verwendet. Jede Komponente von E und H gehorcht also der Wellengleichung 1 ∂ 2 ψ(~r, t) c ∇2 ψ(~r, t) − 2 =0 v=√ (3.8) 2 v ∂t εµ deren Lösungen sich mit der Geschwindigkeit v fortpflanzende Wellen sind. √ Im Vakuum gilt v = c; die Größe εµ heißt Brechungsindex und wird auch mit n bezeichnet. Spezielle Lösungen dieser Gleichung sind die ebenen Wellen. Wir setzen zuerst an ~ r, t) = Re(E ~ ~ ei~k~r−iωt ) E(~ (3.9) k ~ r, t) = Re(H ~ ~ ei~k~r−iωt ) H(~ k 65 (3.10) ~ ~ . Einsetzen in die Maxwell~ ~ und H mit im allgemeinen komplexen Vektoren E k k gleichungen ergibt ~k E ~~ = 0 (3.11) k ~k H ~~ = 0 k ~k × E ~ ~ − µω H ~~ = 0 k c k ~k × H ~~ = 0 ~ ~ + εω E k c k Als Beispiel der Herleitung diskutieren wir die erste Gleichung: (3.12) (3.13) (3.14) ~ = Re(i~k E ~ ~ ei~k~r−iωt ) = ∇E k ~ ~ ) cos(~k~r − ωt) − Re(~k E ~ ~ ) sin(~k~r − ωt) = 0 −Im(~k E k k (3.15) Diese Gleichung kann nur für alle ~r und t erfüllt sein, wenn Realteil und ~ ~ seperat verschwinden. Aus der Gl.3.13 oder Gl.3.14 Imaginärteil von ~k E k ~ ~ bzw. H ~~: erhält man durch Skalarmultiplikation mit E k k ~~ H ~ E k ~k = 0 (3.16) und durch Vektormultiplikation mit ~k 2 ~k × (~k × E ~ ~ = − εµω E ~ ~ (3.17) ~ ~ ) = ~k(~k E ~ ~ ) − k2E ~ ~ = −k 2 E ~ ~ = µω ~k × H k k k k k k c c2 also die Beziehung ω2 = c2 k 2 n2 (3.18) Für die weitere Diskussion legen wir die x-Achse entlang ~k. Aus den Gl.3.13 und 3.14 folgt dann (für ω > 0) r r ck ε ε H~kz = E~ky = E~ky H~ky = − E~ (3.19) µω µ µ kz ~ ~ frei wählbar; In unserem Ansatz sind also nur die zwei Komponenten von E k ~ liegen damit fest. die Komponenten von H E~ Falls der Quotient E~ky eine reelle Zahl ist, welche als tan θ geschrieben werden kz ~ Vektor zeigt immer entkann, so schwingen E~ky und E~kz in Phase und der Elang der Geraden in der y-z- Ebene, die einen Winkel θ mit der y-Achse ein~ Vektor zeigt immer entlang der dazu senkrechten Geraden in schließt. Der Hder y-z- Ebene; die Welle heißt linear polarisiert. Ist das Verhältnis komplex, 66 z.B. tan θeiφ , so schwingen E~ky und E~kz mit verschiedener Phase; wie wir in der Vorlesung Mechanik am Fall des isotropen harmonischen Oszillators gese~ Vektor eine Ellipse. Der H~ Vektor hen haben (S.39), durchläuft dann der E◦ durchläuft ein um 90 gedrehte Ellipse mit demselben Achsenverhältnis. Die Welle heißt dann elliptisch polarisiert. Der Spezialfall tan θ = 1, φ = ± π2 ergibt eine zirkular polarisierte Welle. Die allgemeinste Lösung der freien Wellengleichungen ist also Z ~ ~ (+) ei~k~r−iωt + E ~ (−) ei~k~r+iωt )d3~r E(~r, t) = (E (3.20) ~k ~k ~ (+) und E ~ (−) zwei komplexe Vektoren sind, die nur den Bedingunwobei E ~k ~k (±) ~ ~ ~ r, t), E ~ (±)∗ = E ~ (∓) untergen k E~k = 0, und wegen der Realität von E(~ ~k −~k liegen. Letztere Bedingung kann hergeleitet werden durch die Verwendung ~ r, t) und Umbenennung der Indes komplex konjugierten der Gl.3.20 für E(~ ~ r, t) schreibt man entsprechend tegrationsvariablen von ~k in −~k. Für H(~ Z ~ ~ (+) ei~k~r−iωt + H ~ (−) ei~k~r+iωt )d3~r H(~r, t) = (H (3.21) ~k ~k mit r ~ (+) H ~k ~ (+) E ~k r ε ~ (+) = k̂ × E ~k µ r µ ~ (+) =− k̂ × H ~k ε ~ (−) H ~k ε ~ (−) k̂ × E ~k µ (3.22) µ ~ (−) k̂ × H ~k ε (3.23) =− r ~ (−) E ~k = wobei k̂ der Einheitsvektor in der Richtung von ~k ist. ~ (+) und E ~ (−) folgen aus den Anfangswerten der Felder E ~ Die Koeffizienten E ~k ~k ~ Nach dem Fourierschen Satz gilt nämlich und H. Z ~ r, 0) = E(~ Z i~k~ r 3~ ~~ e E k ~ r, 0) = H(~ dk ~ ~ ei~k~r d3~k H k (3.24) ~ r, 0)e−i~k~r d3~r H(~ (3.25) mit ~~ = 1 E k 8π 3 Z ~ r, 0)e−i~k~r d3~r E(~ ~~ = 1 H k 8π 3 Z ~ ~ und H ~ ~ lassen sich E ~ (+) und E ~ (−) bestimmen Aus den so vorgegebenen E ~k ~k k k mittels den Beziehungen r ε ~ (+) ~ (−) (+) (−) ~ ~ ~ ~ E~k = E~k + E~k k̂ × H~k = − (E − E~k ), (3.26) µ ~k 67 die durch die Substitution von t = 0 in Gl.3.20/3.21 und den Beziehungen ~ (±) und H ~ (±) erhalten werden. Die Energie des elektromagnetiszwischen E ~k ~k chen Strahlungsfeldes beträgt Z 1 ~ 2 (~r, t) + µH ~ 2 (~r, t))d3~r. U= (εE (3.27) 8π Die Auswertung des ersten Terms ergibt (für t = 0) ZZZ ε ~ (+)∗ + E ~ (−)∗ )(E ~ (+) + E ~ (−) )ei(~k−~k0 )~r d3~k 0 d3~kd3~r, Ue = (E ~k0 ~k0 ~k ~k 8π was wegen (3.28) Z ~ ~0 ei(k−k )~r d3~r = 8π 3 δ(~k − ~k 0 ) (3.29) geschrieben werden kann als Z Ue = επ 2 ~ (+) + E ~ (−) |2 d3~k. |E ~k0 ~k0 (3.30) Für den magnetischen Beitrag erhält man ebenso Z Z (+) (−) 2 2 3 2 ~ ~ | d ~k = επ ~ (+) + E ~ (−) |2 d3~k, Um = µπ |H +H |E ~k ~k ~k ~k (3.31) ~ (±) und H ~ (±) benützt wurden. Die gesamte wobei die Beziehungen zwischen E ~k ~k Energie beträgt also Z 2 ~ (+) |2 + |E ~ (−) |2 d3~k. (3.32) U = 2επ (|E ~k ~k oder 1 1 ~~ ~ H) ~ (εE 2 + µH 2 ) = (D E + B 8π 8π Die Energiedichte beträgt U= h i ~ ~ 1 ∂D ∂u(~r, t) ~ + ∂ B H) ~ = c E(∇ ~ ~ − H(∇ ~ ~ . = ( E × H) × E) ∂t 4π ∂t ∂t 4π (3.33) (3.34) Die Energie ist also aus Beiträgen der einzelnen räumlichen Fourierkomponenten zusammengesetzt. Für t 6= 0 substituiert man ~ (−) → E ~ (−) eiωt E ~k ~k ~ (+) → E ~ (+) e−iωt E ~k ~k (3.35) In den Ausdrücken für Ue und Um treten zeitabhängige Terme auf; der Ausdruck für U ist völlig zeitunabhängig. Weiter sind im Zeitmittel die Größen 68 Ue und Um einander gleich. In den elekromagnetischen Wellen wird also ständig elektrische in magnetische Energie umgewandelt und umgekehrt, genauso wie in Schwingungen einer Saite potentielle in kinetische Energie umgewandelt wird. Die Gesamtenergie bleibt dabei selbstverständlich erhalten. Man kann sich die Energieverhältnisse auch im Ortsraum ansehen. Für die Änderung der lokalen Energiedichte erhält man durch Einsetzen der Maxwellgleichungen = ∂ 1 ~2 ~ 2 ) = c (E∇ ~ ×H ~ − H∇ ~ × E) ~ (εE + µH ∂t 8π 4π (3.36) c ∂ ∂ c ∂ ²ijk (Ei Hk − Hi Ek ) = − (²jik Ei Hk ) 4π ∂rj ∂rj 4π ∂rj (3.37) wobei im zweiten Term die Indizes i und k umbenannt wurden. Das Ergebnis lässt sich also schreiben als ∂ ~ r, t) u(~r, t) = −∇S(~ ∂t (3.38) wobei ~ r, t) = c E(~ ~ r, t) × H(~ ~ r, t) S(~ (3.39) 4π der sogenannte Poynting - Vektor ist, der den Energiestrom im Strahlungsfeld darstellt. In Anwesenheit einer freien Stromdichte ~jf (~r, t) erhält man ∂ ~ r, t) − E ~ ~jf (~r, t) u(~r, t) = −∇S(~ ∂t (3.40) Der Zusatzterm entspricht der vom Feld geleisteten Arbeit und der obige Satz (Poyntingscher Satz) ist als ein Spezialfall des Energieerhaltungssatz anzusehen. Neben der Energie trägt das Strahlungsfeld auch Impuls (und Drehimpuls, aber dieser wird in dieser Vorlesung nicht betrachtet). Weil die Definition des Feldimpulses in Medien einer gewissen Willkür unterliegt und zum Teil noch kontroverst ist, beschränken wir uns bei der Betrachtung des Impuslsatzes auf das Feld im Vakuum, d.h. auf die mikroskopischen Maxwellgleichungen. Der vom Feld pro Volumselement übertragene Impuls ist gleich der Kraftdichte " # ~ 1 1 ∂ E 1 ~k(~r) = ρE ~ E ~ + (∇ × B ~− ~ . ~ = ~ + ~j × B (∇E) )×B (3.41) c 4π c ∂t 69 Verwendet man die Identität ~ ~ ~ × ∂ E = − ∂ (E ~ × B) ~ +E ~ × ∂ B = − ∂ (E ~ × B) ~ − cE ~ × (∇ × E) ~ (3.42) B ∂t ∂t ∂t ∂t erhält man ~k(~r) + 1 ∂ (E ~ × B) ~ 4πc ∂t i 1 h~ ~ + B(∇ ~ B) ~ −B ~ × (∇ × B) ~ −E ~ × (∇ × E) ~ E(∇E) (3.43) 4π ~ B) ~ nur dazu dient, dem Auswobei der ohnehin verschwindende Term B(∇ druck ein etwas schöneres Aussehen zu geben. Wir identifizieren jetzt versuchsweise den Ausdruck 1 ~ ~ ~g = E×B (3.44) 4πc mit der Impulsdichte des elektromagnetischen Feldes. Das ist nur dann gerechtfertigt, wenn jede Komponente des Ausdrucks der rechten Seite in Gl.3.43 als Divergenz eines Stromes dargestellt werden kann. In der Tat gilt z.B. ¶ ¶ µ µ h i ∂Ey ∂Ex ∂Ex ∂Ez ~ ~ ~ ~ ~ E(∇E) − E × (∇ × E) = Ex ∇E−Ey − +Ez − ∂x ∂y ∂z ∂x x µ ¶ ∂ 1 2 1 2 1 2 ∂ ∂ = Ex − Ey − Ez + (Ex Ey ) + (Ex Ez ) (3.45) ∂x 2 2 2 ∂y ∂z = also die Divergenz eines Vektors. Allgemein gilt ki (~r) + wobei ∂ ∂ gi (~r) = Tij ∂t ∂rj · ¸ 1 1 2 2 ~ ~ Tij = Ei Ej + Bi Bj − δij (E + B ) 4π 2 (3.46) (3.47) der Maxwellsche Spannungstensor genannt wird. Die Impulsbilanzgleichung 3.46 sagt aus, dass das Strahlungsfeld neben Energie auch Impuls transportiert und deshalb auf Materie, die sie absorbiert oder reflektiert einen Druck ausübt. Dieser Strahlungsdruck ist z.B. für das Verständnis des Aufbaus von Sternen wesentlich. Für statistisch isotrope Strahlungsfelder gilt im Mittel 1 ~ 2 Bi Bj = |B| δij 3 1 ~ 2 δij Ei Ej = |E| 3 70 (3.48) also 1 Tij = 4π µ 1 1 − 3 2 ¶ ~ 2 + |B| ~ 2 )δij = − 1 u. (|E| 3 (3.49) Der Strahlungsdruck eines isotropen Feldes ist also genau ein Drittel der Energiedichte, eine Tatsache, die für die Theorie der Wärmestrahlung von wesentlicher Bedeutung ist. Dispersion Bisher haben wir angenommen, dass die Polarisation P~ und die Magnetisierung ~ sich auch bei zeitlich veränderlichen Feldern instantan den Feldern E ~ und M ~ anpassen. Es ist realistischer anzunehmen, dass die Ladungen innerhalb B von Atomen und Molekülen nur mit einer gewissen Verzögerung auf die Felder reagieren; so würde z.B. für ein Elektron in einem Atom gelten Zt ~ 0 )dt0 g(t − t0 )E(t ~r(t) = e (3.50) −∞ wobei g(t − t0 ) die Greensche Funktion des Elektrons darstellt. Eine solche Greensche Funktion haben wir in der Vorlesung Mechanik für einen gedämpften harmonischen Oszillator bestimmt. Für das Dipolmoment würde dann gelten Zt p~(t) = e ~ 0 )dt0 g(t − t0 )E(t 2 (3.51) −∞ ~ Insbesondere gilt für ein zeitlich harmonisch variierendes E-Feld ~ ~ ω e−iωt E(t) =E ~ω mit p~ω = α(ω)E p~(t) = p~ω e−iωt und (3.52) Z∞ g(τ )eiωt dτ 2 α(ω) = e (3.53) 0 Aus α(ω) lässt sich (z.B. über die Clausius Mosotti - Beziehung) eine frequenzabhängige dielektrische Konstante ε(ω) bestimmen. Sowohl α(ω) als auch ε(ω) sind i.a. komplexe Größen. Auf ähnliche Weise kann man auch eine frequenzabhängige magnetische Permeabilität µ(ω) einführen (in der Praxis ist aber sowohl µ als auch µ(ω) sehr nahe bei Eins für die meisten Substanzen). ~ r, t) = Re(E ~ ω eikr−iωt ) führt auch für Medien mit frequenzDer Ansatz E(~ abhängigen ε(ω) und µ(ω) zum Ziel. Allerdings können für Frequenzen, bei 71 denen der Brechungsindex n(ω) = ω in p ε(ω)µ(ω) komplex ist, die Größen ~k und ω2 c2 nicht mehr beide reell sein. Wichtige Spezialfälle sind k 2 = ε(ω)µ(ω) (3.54) 1. ω reell, ~k komplex; z.B. (k + iκ)eˆx Ex = Eω eikx−κx−iωt (3.55) Dies beschreibt eine gedämpfte Welle. Aus der Thermodynamik folgt, dass für Materie im Gleichgewicht κ immer positiv sein muss. Negative Werte von κ würden zu Verstärkung von elekromagnetischen Wellen führen; dies tritt in Laser und Maser und gelegentlich im interstellaren Raum auf. Das Abklingen der Welle impliziert, dass beim Durchgang der Welle durch das Medium elektromagnetische Energie verloren gehen ~ r, t) und der Polarisationsstrom muss. Der Grund dafür ist, dass E(~ ∂ ~ ~ ω ei~k~r−iωt ) P (~r, t) = Re(χ(ω)iω E ∂t (3.56) ~ r, t). Deshalb leistet, auch gemitnicht mehr 90◦ außer Phase ist mit E(~ telt über eine Periode, das Feld Arbeit an dem für die Polarisation verantwortlichen Ladungsträgern, die letztendlich in Wärme umgesetzt wird. Der Fall 1 tritt auf im Strahlungsfeld harmonisch bewegter Quellen, oder falls eine Welle aus dem Vakuum in ein Material eintritt (siehe nächster Abschnitt für Einzelheiten). Insbesondere im letzten Fall brauchen für isotrope Materialien die Vektoren ~k und ~κ nicht parallel zu sein. Für Materialien im thermischen Gleichgewicht sind die Vorzeichen der Komponenten von ~κ aber immer so, dass die Welle beim Durchlaufen des Mediums Energie an das Medium abgibt. 2. ~k reell; ω komplex Dieser Fall tritt bei der Lösung von Anfangswertproblemen auf: nur die ~ eik~r mit reellem ~k bilden ein vollständiges Funktionensystem, nach dem man bequem entwickeln kann. Für die Lösung braucht man ε(ω) und µ(ω) für komplexe Werte von ω. Weil der Zusammenhang zwischen P~ ~ kausal ist: und E Zt P~ (~r, t) = ~ r, t0 )dt0 , Gp (~r; t − t0 )E(~ −∞ 72 (3.57) ist die Funktion χ(ω) und damit ε(ω) in die obere komplexe Halbebene ~ r, t) wohldefiniert. analytisch fortsetzbar und für zeitlich abklingende E(~ Für Medien im Gleichgewicht treten bei der Lösung des Anfangswertproblems nur zeitlich abklingende Lösungen auf. In einem Laser hat man auch instabile, exponentiell anwachsende Lösungen, die aus winzigen Feldfluktuationen zu makroskopischen Werten anwachsen können. 73 3.2 Wellen an Grenzflächen und in Hohlleitern An einer Grenzfläche zwischen zwei Medien, die keine Oberflächenladung oder Oberflächenstrom enthält, muss auf Grund der ersten zwei Maxwellgleichungen, auch in der Elektrodynamik, gelten: Dn stetig Bn stetig Aus der dritten und vierten Maxwellgleichung folgt über eine Herleitung Etg stetig Htg stetig (Die Beiträge der Zeitableitungen kann man beliebig klein machen durch die Wahl einer beliebig ”engen” Schleife). Obige Stetigkeitsbedingungen müssen an jedem Ort der Grenzfläche gültig sein. In diesem Abschnitt beschäftigen wir uns nur mit ebenen Grenzflächen, auf die eine ebene Welle aus einem Medium mit reellem Brechungsindex n1 auf ein Medium mit Brechungsindex n2 einflällt. Für eine Grenzfläche in der x-yEbene variiert das einfallende Feld entlang der Oberfläche wie ei(kx x+ky y) . Zur Erfüllung der Randbedingungen postulieren wir noch zwei weitere Wellen, die dieselbe Abhängigkeit haben: 1. eine reflektierte Welle kx0 = kx , ky0 = ky , kz0 = −kz q n22 ω 2 00 00 00 − kx2 − ky2 mit 2. eine transmittierte Welle kx = kx , ky = ky , kz = c2 ω= c|~k| n1 QQ ´´ ~ Q k 0 ´ k~3́ ´ Q ´ QQ ´ Q ´ Q s α α0 Q ´ Q ´ Q´ C C C C C α00CWC k~00 C C C 74 n2 n1 Der reflektierte Strahl erfüllt die Spiegelungsbedingung α = α0 , für reelles n2 gilt das Gesetz von Snellius: n1 sin α = n2 sin α00 (3.58) Im Falle n1 < n2 kann es vorkommen, dass dieses Kriterium ein sin α00 > 1 vorhersagt (bzw. dass für kz00 ein rein imaginärer Wert herauskommt). In diesem Fall tritt im Medium n2 eine exponentiell abklingende oder evaneszente Welle auf. Mit dieser Welle ist kein Energiestrom in das Medium hinein verbunden: h i h i ~ ~ ) × (ReH ~ ~ ) ∼ ReE ~ ~ × Re(~k × E ~~ ) Sz ∼ (ReE (3.59) k k k k z wegen z ~ ~ ) = ~k|| × ReE ~ ~ − ~κ × ImE ~~ , Re(~k × E k k k (3.60) wobei ~κ nur eine z-Komponente hat, ergibt die Ausarbeitung des doppelten Vektorprodukts ~ ~ ImE ~ ~ ) − ReE ~ ~ (ReE ~ ~ ~k|| − ImE ~ ~ ~κ) Sz ∼ −κ(ReE k k kz k k (3.61) ~ ~ ImE ~ ~ ) − ReE ~ ~ Re(E ~ ~ ~k) = −κ(ReE k k kz k (3.62) ~ ~ ~k = 0; der erste Term verschwindet Der zweite Term verschwindet wegen E k ~ ~ und ImE ~ ~ einen Phasenunternach Mittelung über eine Periode, weil ReE k k ◦ schied von genau 90 haben: h i ~ ~ (~r, t)) = e−κz ReE ~ ~0 cos(~k||~r − ωt) − ImE ~ ~0 sin(~k||~r − ωt) Re(E (3.63) k k k h i ~ ~ (~r, t)) = e−κz ReE ~ ~0 sin(~k||~r − ωt) − ImE ~ ~0 cos(~k||~r − ωt) Im(E (3.64) k k k Weil keine Energie ins Medium 2 hineinfließt, muss die Intensität des reflektierten Strahls gleich der Intensität des einfallenden Strahls sein. Um die Intensitäten für reelle Werte von kz00 zu bestimmen, müssen die Stetigkeitsbedingungen der Felder ausgenützt werden. Wir werden dies in der Vorlesung nur für senkrechte Inzidenz durchführen, und für eine Welle ~ ~ in der x-Richtung. Für alle drei Wellen setzen wir dann ein E~ Feld mit E k ~ Feld in y-Richtung an; Stetigkeit der Tangenin der x-Richtung und ein H~ und H ~ liefert: tialkomponenten von E 00 0 =0 − H0y Hoy + Hoy 00 0 =0 − E0x E0x + E0x ~ und H ~ ergibt Einsetzen der Beziehung zwischen E r r r ε1 ε1 0 ε2 00 00 0 H0y = E0x H0y = E0x E H0y = − µ1 µ1 µ2 0x 75 (3.65) (3.66) Die Stetigkeitsbedingung für Htg ergibt also r ε2 µ1 00 0 E0x − Eox − E =0 ε1 µ2 0x 0 00 Auflösen der zwei Beziehungen zwischen E0x , E0x und E0x ergibt r 2 1−β ε 2 µ1 00 0 E0x = E0x E0x = E0x β= 1+β 1+β ε 1 µ2 (3.67) (3.68) Der Reflexionskoeffizient ist das Verhältnis der Energieströme in der reflektierten und in der einfallenden Welle: R= 0 2 |E0x | (1 − β ∗ )(1 − β) 4Reβ = =1− 2 ∗ |Eox | (1 + β )(1 + β) (1 − β ∗ )(1 + β) (3.69) Hierbei wurde verwendet, dass im Medium 1 ε1 und µ1 reell sind und damit auch das Verhältnis q zwischen E0x und H0y . Der Poynting Vektor ist also ε1 ~ 2 proportional zu |E| . Im Medium 2 trägt nur der Anteil von H0y der µ1 in Phase ist mit E0x zum Energiestrom bei (vgl. unsere Diskussion der q ε2 ~ 2 evaneszenten Welle); im Medium 2 gilt S ∼ Re µ2 |E| und für den Transmissionskoeffizienten erhält man q Re µε22 |E 00 |2 4Reβ 0x T = q = =1−R 2 ε1 |E0x | (1 − β ∗ )(1 − β) (3.70) µ1 √ Der Ausdruck für R nimmt für ε1 = µ1 = 1; µ2 reell und ε2 µ2 = n2 + iκ2 die vertraute Form (n2 − µ2 )2 + κ22 R= (3.71) (n2 + µ2 )2 + κ22 an. Wir bemerken noch, dass für negative reelle Werte des Brechungsindex (für ω = 0 nicht zulässig, aber für endliche ω durchaus) der Transmissionskoeffizient verschwindet; hier tritt auch für senkrechte Inzidenz Totalreflexion auf. Andererseits gibt es für Frequenzbereiche mit Re [ε(ω)µ(ω)] < −1 Oberflächenwellen, d.h. Wellen, die sich entlang der Oberfläche ausbreiten und in beiden Medien exponentiell abklingen. Wellen in Hohlleitern Ein interessanter Grenzfall des obigen Problems ist der Fall einer Welle, die ~ auf einen idealen Leiter trifft. Innerhalb des Leiters muss das E-Feld und ~ damit das H-Feld verschwinden. An der Leiteroberfläche gilt deshalb Etg = 0 Hn = 0 76 (3.72) ~ und H ~ können nicht stetig auf Null abDie sonstigen Komponenten von E fallen, weil es Oberflächenladungen und Oberflächenströme geben kann. Wir betrachten jetzt einen Wellenleiter mit Rechteckquerschnitt: 0 < x < X und 0 < y < Y , in dessen Inneren sich Vakuum befindet. ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ 6 ¡ ¡ ¡ Y X - ¡ ¡¾ ¡ ¡ ? ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ Es gilt also Ey = Ez = Hx = 0 für x = 0, x = X (3.73) Ex = Ez = Hy = 0 für y = 0, y = Y (3.74) Für eine durch den Leiter laufende Welle setzen wir an nπx mπy ikz−iωt cos e X Y (3.75) nπx mπy ikz−iωt nπx mπy ikz−iωt 0 Ey = β sin cos e Hy = β cos sin e X Y X Y (3.76) nπx mπy ikz−iωt nπx mπy Ez = γ sin sin e Hz = γ 0 cos cos eikz−iωt X Y X Y (3.77) mit m, n ∈ Z. Dieser Ansatz genügt den Randbedingungen automatisch. ~ = 0 und ∇H ~ =0 Die cos- Faktoren sind auch fast zwingend, wenn wir ∇E erfüllen wollen. Weil weiters jede Fourier- Komponente des Ansatzes die Wellengleichung im Vakuum erfüllen soll, muss gelten Ex = α cos nπx mπy ikz−iωt sin e X Y ³ nπ ´2 X + Hx = α0 sin ³ mπ ´2 Y + k2 = ω2 c2 (3.78) Die Maxwellgleichungen führen zu Bedingungen zwischen den sechs Koeffizienten α, β, γ, α0 , β 0 , γ 0 . Insgesamt gibt es vier unabhängige Bedingungen, d.h. zwei unabhängige Lösungen. 1. Wellen vom H- Typ (oder TE = transversal elektrische Wellen) 2 ω 0 ω 0 δ , β = nπ δ , α0 = − nπ kδ 0 , β 0 = mit γ = 0, γ 0 = i(k 2 − ωc2 )δ 0 , α = − mπ Y c X c X mπ 0 − Y kδ . Wir sehen, dass für m = n = 0 die Lösung identisch verschwindet; falls nur eine dieser Zahlen ungleich Null ist, so hat man 77 sehr wohl eine Lösung. Für den Fall X > Y hat man also die Lösungen mit reellem k ab der Grenzfrequenz ωLH = πc X (3.79) 2. Wellen vom E- Typ (TM = transversal magnetische Wellen) 2 ω mit γ 0 = 0, γ = i(k 2 − ωc2 )δ, α = nπ kδ, β = mπ kδ, α0 = − mπ δ, β 0 = X Y Y c nπ ω δ. Jetzt stehen die Faktoren n und m bei ihrem cos statt bei ihrem X c sin und schon für entweder m oder n gleich Null verschwindet die ganze Lösung. Die Grenzfrequenz ist jetzt r 1 1 ωLE = πc + (3.80) X2 Y 2 q 2 2 Ab jeder Grenzfrequenz ωmn = πc Xn 2 + m erhält man eine (für n oder Y2 m = 0) oder zwei zusätzliche Typen von Wellen, die sich im Wellenleiter ausbreiten können. Hohlraumresonatoren Falls wir einen Wellenleiter auch noch in der z- Richtung zumachen, so können im Inneren nur Linearkombinationen der oben konstruierten laufenden Wellen mit k und −k existieren, die auch noch bei z = 0 und z = Z die Randbedingungen erfüllen. nπx mπy lπz cos cos X Y Z (3.81) nπx mπy lπz nπx mπy lπz Ey = β sin cos sin Hy = β 0 cos sin cos X Y Z X Y Z (3.82) nπx mπy lπz nπx mπy lπz sin cos Hz = γ 0 cos cos sin Ez = γ sin X Y Z X Y Z (3.83) und es gibt nur die diskreten Frequenzen r m2 l2 n2 + + (3.84) ωnml = πc X2 Y 2 Z2 Ex = α cos nπx mπy lπz sin sin X Y Z Hx = α0 sin Es gibt wieder zwei Lösungen für den Fall, dass mindestens zwei Zahlen n, m, l ungleich Null sind und eine Lösung, falls nur eine der Zahlen ungleich Null ist. 78 3.3 Skalares und Vektorpotential Wir betrachten jetzt die vollständigen mikroskopischen Maxwellgleichungen: ~ = 4πρ ∇E (3.85) ~ =0 ∇B (3.86) ~ =− ∇×E ~ 1 ∂B c ∂t ~ ~ = 4π ~j + 1 ∂ E ∇×B c c ∂t Wegen der zweiten Gleichung kann man immer schreiben ~ =∇×A ~ B Einsetzen in die dritte Gleichung liefert à ! ~ 1 ∂ A ~+ ∇× E = 0, c ∂t (3.87) (3.88) (3.89) (3.90) also gibt es ein skalares Feld φ, so dass ~ ~ = − 1 ∂ A − ∇φ. E c ∂t (3.91) Die Übereinkunft in der Notation mit dem elektrostatischen Potential ist vorläufig zufällig. Einsetzen in die zwei übrigen Maxwellgleichungen liefert ∇2 φ + 1∂ ~ ∇A = −4πρ c ∂t 2~ ~ + 1 ∂ A + 1 ∂ ∇φ = 4π ~j. ∇×∇×A c2 ∂t2 c ∂t c (3.92) (3.93) ~ und φ heißen Vektorpotential und skalares Potential. Sie sind Die Größen A nicht eindeutig bestimmt; die Gleichungen Gl.3.89 und Gl.3.91 sind invariant unter der Transformation φ0 = φ − 1 ∂f c ∂t ~0 = A ~ + ∇f A (3.94) mit einer beliebigen skalaren Funktion f (~r, t). Die Transformation (3.94) heißt Eichtransformation, die Funktion f heißt Eichfunktion. 79 Es gibt zwei Arten von Eichungen, die zu einer Vereinfachung der Gleichun~ und φ führen. Die erste ist die schon eingeführte Coulomb-Eichung gen für A ~ ~ = g, so kann man durch Lösen ∇A = 0. Falls in irgendeiner Eichung gilt ∇A 2 der Gleichung ∇ f = −g eine Eichfunktion finden, die zur Coulomb-Eichung führt: ~ 0 = ∇A ~ + ∇2 f = g − g = 0. ∇A (3.95) In der Coulomb-Eichung lauten die Gleichungen für die Potentiale ~ 1 ∂ 2A 1∂ 4π = − ~j + ∇φ, (3.96) 2 2 c ∂t c c ∂t ~ = ∇(∇A) ~ − ∇2 A ~ benutzt haben. Die erste wobei wir die Formel ∇ × ∇ × A Gleichung wird gelöst durch Z φ(~r0 , t) 3 0 φ(~r, t) = d ~r + φ0 (~r, t), (3.97) |~r − ~r0 | ∇2 φ = −4πρ ~− ∇2 A wobei φ0 (~r, t) eine Lösung der Laplace-Gleichung ∇2 φ0 = 0 ist. Einsetzen von φ(~r, t) in die zweite Gleichung liefert eine inhomogene Wellengleichung, die wir gleich näher betrachten werden. Die Zusatzbedingung für die Coulomb~ noch immer nicht ganz fest; wir können noch eine Umeichung Eichung legt A durchführen mit einer Eichfunktion, die ∇2 f = 0 genügt. ~ ist die Lorentz-Bedingung Eine zweite nützliche Nebenbedingung für A 1 ∂φ = 0. (3.98) c ∂t Auch für diese Bedingung kann eine Eichfunktion leicht durch Lösen einer Poissongleichung bestimmt werden. Die Lorentz-Bedingung führt zur En~ und φ: tkopplung der Gleichungen für A ~+ ∇A ~ 1 ∂ 2φ 1 ∂ 2A 4π 2~ = −4πρ ∇ A − = − ~j. (3.99) 2 2 2 2 c ∂t c ∂t c ~ als auch φ einer inhomogenen Wellengleichung. Auch Jetzt genügen sowohl A die Lorentz-Bedingung legt die Potentiale noch nicht eindeutig fest: Es sind noch Eichtransformationen zugelassen mit Eichfunktionen die der homogenen Wellengleichung 1 ∂2f (3.100) ∇2 f − 2 2 = 0 c ∂t genügen, wie man durch Einsetzen leicht nachweist. ∇2 φ − Die inhomogene Wellengleichung ¤ψ := ∇2 ψ − 1 ∂2ψ = 4πρ c2 ∂t2 80 (3.101) hat die Lösungen Z ψret (~r, t) = und Z ψadv (~r, t) = 0 r| ρ(~r0 , t − |~r−~ ) 3 0 c d ~r 0 |~r − ~r | (3.102) 0 r| ρ(~r0 , t + |~r−~ ) 3 0 c d ~r 0 |~r − ~r | (3.103) Zum Beweis unterteilen wir die Integrale in ein Integral ψ1 über eine sehr kleine Umgebung |~r0 − ~r| < ε vom Aufpunkt ~r und ein Integral ψ2 über den übrigen Raum. In ψ1 können wir t ∓ 1c |~r − ~r0 | wegen der Kleinheit von |~r − ~r0 | durch t ersetzen. Wir erhalten also dann den bekannten Fall der Elektrostatik; es gilt also ∇2 ψ1 = −4πρ. (3.104) Weiters ist für nichtsinguläres ρ(~r) ψ1 selbst, und damit zu machen; es gilt also auch in beliebig guter Näherung ∂ 2 ψ1 ∂t2 beliebig klein ¤ψ1 = −4πρ. (3.105) Der Integrand in ψ2 hängt nur über r1 = |~r − ~r0 | von ~r ab. Für solche Funktionen gilt ∇2 f (~r1 ) = ∇ ~r1 ∂f ∂ 2f 2 ∂f 1 ∂2 = 2 + = r1 f (r1 ) r1 ∂r1 ∂r1 r1 ∂r1 r1 ∂r12 Einsetzen mit f (r1 ) = 1 ρ(~r0 , t r1 ∓ Z 2 ∇ ψ2 = V0 r1 ) c (r1 6= 0). (3.106) liefert 1 ∂2 r1 ρ(~r0 , t ∓ )d3~r1 . 2 r1 ∂r1 c Weil r1 unter den Differentiationen nur in der Kombination t ∓ sieht man sofort, dass gelten muss 1 ∂ 2 ψ2 ∇ ψ2 − 2 = 0. c ∂t2 2 (3.107) r1 c auftritt, (3.108) Damit ist der Beweis der Korrektheit der retadierten und avancierten Lösungen geliefert. Die Integration erstreckt sich über den sogenannten Lichtkegel, und zwar für die retardierten Lösungen ψret über den Teil, der in der Vergangenheit liegt, und für die avancierten Lösungen ψadv über den Teil, der in der Zukunft liegt. 81 t 6J ­ J ­ J ­ J ­t0 − t = |~r−r~0 | c J ­ J ­ J ­ J q­ J~ ­ r ­ J J ­ J ­ J ­ |~ r−r~0 | 0 Jt − t = c ­ J ­ J ­ J ­ - r~0 Für die meisten physikalischen Probleme ist ψret die relevante Lösung (Kausalität, falls die Ladungen und Ströme als ”Ursache” für das Feld aufgefasst werden.) Der Unterschied zwischen den retadierten Lösungen und den avancierten ist eine Lösung der homogenen Wellengleichung. Welche von beiden Lösungen (oder welche Linearkombination der beiden) man zu wählen hat, hängt also letztendlich von den Randbedingungen für das Strahlungsfeld ab. Die allgemeine Lösung der Potentialgleichungen in Lorentzeichung lautet also Z r0 | ) 3 0 ρ(~r0 , t − |~r−~ c φ(~r, t) = d ~r + φ0 (~r, t) (3.109) 0 |~r − ~r | Z |~ r−~ r0 | 1 ~j(~r0 , t − c ) 3 0 ~ ~ A(~r, t) = d ~r + A0 (~r, t), (3.110) c |~r − ~r0 | ~ r, t) Lösungen der freien Wellengleichungen sind, die wobei φ0 (~r, t) und A(~ über die Lorentz-Bedingung miteinander zusammenhängen. Der homogene Teil der obigen Ausdrücke kann noch etwas umgeschrieben werden ZZ 0 φret (~r, t) = Gret (~r − ~r0 , t − t0 )ρ(~r0 , t0 )d3~rdt (3.111) ~ ret (~r, t) = 1 A c mit ZZ ∞ 0 Gret (~r − ~r0 , t − t0 )~j(~r0 , t0 )d3~rdt (3.112) ∞ 1 ³ r´ Gret (~r, t) = δ t − r c 82 (3.113) die retardierte Greensche Funktion. Ganz analog führt man 1 ³ r´ Gadv (~r, t) = δ t + , r c (3.114) die avancierte Greensche Funktion ein. Für eine Punktladung, die sich entlang der Bahn ~r0 (t) bewegt, gilt, dass φret ~ ret im Punkt ~r bestimmt werden vom Schnittpunkt von ~r0 (t) mit dem und A rückwertigen Lichtkegel, dessen Spitze in ~r liegt, und von der Geschwindigkeit ~v (t) in diesem Punkt (Ein Teilchen, dessen Geschwindigkeit immer kleiner als c ist, durchstößt den Lichtkegel nur einmal): Z φ(~r, t) = e δ(t − t0 − 1c |~r − ~r0 (t0 )|) 0 dt |~r − ~r0 (t0 )| (3.115) ~ r, t). und analog für A(~ t 6 ¢ ¢ A A ¢ A ¢ r A¢q ~ ¢A ¢ A ¢ A A ¢ r~0 (t) Aq A ¢ ¢ A ¢ ¢ A ¢ A A ¢ ¢ A A - r Bei der Auswertung des Integrals muss man bedenken, dass gilt δ(f (t)) = 1 |f 0 (t0 )| δ(t − t0 ) (3.116) wenn t0 eine Nullstelle von f (t) ist. Für das Argument u(t) der δ- Funktion gilt ~ 0) ~v (t0 ) ~r − ~r0 (t0 ) ~v (t0 )R(t du = −1 + := −1 + . (3.117) dt0 c |~r − ~r0 (t0 )| R(t0 )c 83 ~ Das Ergebnis ist also (für φ und analog für A) φ(~r, t) = h R− e ~ v R−~ c i t0 =t− R c " ~v e ~ r, t) = A(~ c R− # ~v R~ c (3.118) t0 =t− R c Diese Potentiale heißen Lienard-Wiechert-Potentiale. Es sind äußerst komplizierte Ausdrücke, weil für jeden Punkt (~r, t) zuerst der korrespondierende ~ t0 ) bestimmt werden muss. Quellenpunkt (~r0 = ~r + R, 84 3.4 Strahlung einer lokalisierten Verteilung von Ladungen und Strömen Wie in der Statik ist es auch in der Dynamik oft vorteilhaft, für das Feld einer lokalisierten Verteilung von Ladungen und Strömen eine Multipolentwicklung durchzuführen. Dabei stellt es sich als bequem heraus, zuerst bezüglich der Zeit eine Fouriertransformation durchzuführen. Wir schreiben also Z ρ(~r, t) = ρω (~r)e−iωt dω (3.119) Z φ(~r, t) = φω (~r)e−iωt dω (3.120) ~ r, t). Die Bestimmungsgleichungen für die Pound analog für ~j(~r, t) und A(~ tentiale lauten in der Lorentz-Eichung ∇2 φω + k 2 φω = −4πρω (3.121) 4π ~ jω c (3.122) ~ ω + k2A ~ω = − ∇2 A mit ω ~ − iω φω = 0 und ∇A c c Die Lösungen können geschrieben werden als Z φω = Gret r − ~r0 )ρω (~r0 )d3~r0 + φ0ω (~r) ω (~ k= (3.123) (3.124) Z 1 ~ ~ 0 (~r) Aω = Gret r − ~r0 )~jω (~r0 )d3~r0 + A (3.125) ω (~ ω c ~ 0ω (~r) Lösungen der homogenen Gleichungen und Gret Dabei sind φ0ω (~r) und A ω ist die Fouriertransformierte der retadierten Greenschen Funktion; es gilt z.B. Z 1 ret φret (t)eiωt dt φω = 2π ZZZ 1 Gret (~r − ~r0 , t − t0 )ρ(~r0 , t0 )eiωt dtd3~rdt0 = 2π ZZZZ 1 0 Gret (~r − ~r0 , t − t0 )ρω0 (~r)eiωt−iωt dtd3~rdt0 dω 0 = (3.126) 2π 1 Wenn wir jetzt (beachte das Fehlen des üblichen 2π .) Z 0 ret 0 Gω (~r − ~r ) = Gret (~r − ~r0 , t − t0 )ei(t−t ) d(t − t0 ) 85 (3.127) einführen und in Gl.3.126 die Integration über t in eine über t−t0 umwandeln, so erhalten wir ZZZ 1 0 0 ret φω = Gret r − ~r0 )ρω0 (~r0 )ei(ω−ω )t d3~rdt0 dω 0 ω (~ 2π Z ZZ 0 3 0 ret 0 r − ~r0 )ρω (~r0 )d3~r (3.128) = Gω (~r − ~r )ρω0 (~r)δ(ω − ω )d ~rdω = Gret ω (~ Die explizite Form von Gret ist Z 1 R eikR ret ~ Gω (R) = δ(τ − )eiωτ dτ = . R c R (3.129) Dies ist der räumliche Anteil einer auslaufenden Kugelwelle; in R1 eikR−iωt sind die Oberflächen konstanter Phase Kugeloberflächen (kR − ωt = cst), die sich mit der Lichtgeschwindigkeit c = ωk vom Ursprung wegbewegen. Für die avancierte Greensche Funktion erhält man e−ikR ~ Gadv ω (R) = R also eine einlaufende Kugelwelle. Betrachten wir jetzt die retadierten Potentiale etwas näher: Z ik|~r−~r0 | e ret φω (~r) = ρω (~r0 )d3~r0 |~r − ~r0 | Z ik|~r−~r0 | 1 e ret ~ (~r) = ~jω (~r0 )d3~r0 A ω c |~r − ~r0 | (3.130) (3.131) (3.132) 0 Falls kr0 << 1 gibt es eine Nahzone kr << 1, in der man den Faktor eik|~r−~r | vernachlässigen kann; dort sind dann die Potentiale gleich den elektrostatischen und magnetostatischen Ausdrücken. Dagegen gilt im Fernfeld, kr >> 1, dass man die ~r0 - Abhängigkeit des Nenners völlig vernachlässigen kann und im Exponenten die Näherung |~r − ~r0 | = r − ~r~r0 r (3.133) r , so kann man schreiben einsetzen. Falls wir noch einführen, dass ~k = k~ r Z eikr eikr ~ 0 ret φω (~r) ' ρω (~r0 )e−ik~r d3~r0 := ρ~ (3.134) r r k,ω Z eikr ~ 0 −i~k~r0 3 0 eikr ~ ret ~ Aω (~r) ' jω (~r )e d ~r := j~ (3.135) cr cr k,ω 86 Die Amplitude der auslaufenden Welle in der Richtung r̂ ist also proportional zur Fouriertransformation der Ladungs- und Stromverteilung für einen Wellenvektor mit Betrag k = ωc und Richtung r̂. (Wenigstens: Näherungsweise ~ ω (~r) und B ~ ω (~r): im Fernfeld.) In derselben Näherung gilt für die Felder E ikr ~ ~ ω (~r) ' −∇φω (~r) − 1 ∂ Aω (~r, t) = e (−i~kρ~ + iω ~j~ ) E kω c ∂t r c2 kω (3.136) ikr ~ ω (~r) ' ∇ × A ~ ω (~r) = e i ~k × ~j~ B (3.137) kω r c ~ ω lässt sich noch etwas vereinfachen durch Anwenden der Der Ausdruck für E Kontinuitätsgleichung ωρ~kω = ~k~j~kω (3.138) und der Identität ~k × (~k × ~j) = ~k(~k~j) − k 2~j Das Ergebnis ist (3.139) i~k~ r ~ ω (~r) ' − i ~k × (~k × ~j~ ) e E kω c r (3.140) ~ ik~ r ~ ω (~r) ' i ~k × ~j~ e . B (3.141) kω c r ~ ω und B ~ ω also senkrecht aufeinander und auf den AusIm Fernfeld stehen E ~ breitungsvektor k der Kugelwelle, die lokal wie eine ebene Welle ausschaut. Intensitätsverteilung Wir berechnen als Nächstes den Energiestrom (Poynting - Vektor) in Abhängigkeit der Richtung r̂. Dabei muss man zwei Fälle unterscheiden: 1. harmonisch variierende Ströme ~j(~r, t) = Re(~jω (~r)e−iωt ). (3.142) ~ r, t) = c Re(E ~ ω e−iωt ) × Re(B ~ ω e−iωt ) S(~ 4π (3.143) Es gilt dann Bei der Ausarbeitung von Re(fω e−iωt ) = 21 (fω e−iωt + fω∗ eiωt ) entstehen zeitunabhängige Terme und solche, die wie e±2iωt variieren. Bei der Zeitmittlung über eine Periode (mit einem Querstrich angedeutet), fallen letztere Terme weg und man erhält i c 1 h ~∗ ~ ¯ ∗ ~ ~ ~ (Eω × Bω ) + (Eω × Bω ) (3.144) S= 4π 4 87 ~ω also, nach Substitution unseres Ergebnisses für B ~¯ ' 1 |~k × ~j~ |2 ~r . S kω 8πc r3 (3.145) Dies ist ein Energiestrom pro Zeiteinheit und pro Flächeneinheit d2~r. Für die Intensität dIω im Raumwinkel dΩ erhält man dIω = 1 ~ ~ 2 |k × j~kω | dΩ 8πc (3.146) 2. zeitlich begrenzte Ströme Wir betrachten jetzt Größen f (t) und g(t) vom Typ Z Z −iωt f (t) = fω e dω g(t) = gω e−iωt dω (3.147) Es gilt nun offensichtlich Z∞ ZZZ 0 fω gω∗ 0 e−iωt+iω t dωdω 0 dt0 f (t)g(t)dt = −∞ ZZ = 2π Z fω gω∗ 0 δ(ω 0 0 fω gω∗ 0 dω; − ω )dωdω = 2π (3.148) (dies ist das Theorem von Fourier - Plancherel). Wenn ~j(~r, t) und ~g (~r, t) von diesem Typ sind, so erhält man für die insgesamt in Richtung r̂ emittierte Energie Z∞ ~ r, t)dt = c S(~ 4π Z ~ r, t) × B(~ ~ r, t)dt = c E(~ 2 Z ~ ω (~r) × B ~ ∗ (~r)dω E ω −∞ (3.149) also Z∞ −∞ ~ r, t)dt = 1 ~r S(~ 2c r3 Z∞ 1 ~r |~k × ~j~kω |2 dω = c r3 −∞ Z∞ |~k × ~j~kω |2 dω (3.150) 0 wobei wir verwendet haben, dass wegen der Realität von ~j(~r, t) gelten muss ~jω∗ (~r) = ~j−ω (~r), also ~j~kω = ~j~k,−ω . Falls wir jetzt die insgesamt im dE Raumwinkel dΩ und im Frequenzbereich dω abgestrahlte Energie dω~kω einführen über Z∞ Z∞ dE~kω ~ r ~ r, t)dt = r2 dΩ S(~ dω, (3.151) r dω −∞ 0 88 so erhalten wir dζ~kω 1 = |~k × ~j~kω |2 dΩ dω c (3.152) oder auch dζ~kω 1 = |~k × ~j~kω |2 (3.153) dωdΩ c Die Fälle 1 und 2 sind physikalisch unterschiedlich. Im ersten Fall wird stationär Strahlung einer genau festgelegten Frequenz emittiert; im zweiten Fall hat man eine zeitlich begrenzte Emission, die über ein mehr oder weniger breites Band von Frequenzen verteilt ist. Man kann nicht von einem zum anderen Fall geraten durch Substitution fω = fω0 δ(ω−ω0 ), weil man dann im Fourier - Plancherelschen Theorem das Quadrat einer δ- Funktion erhält, welches nicht wohldefiniert ist. Die Multipolentwicklung Die für die Strahlungsemision bestimmende Größe ist Z ~j~ = ~jω (~r)e−i~k~r d3~r. kω (3.154) Wegen ~k~r << 1 (die Voraussetzung für sämtliche Überlegungen in diesem Abschnitt) ist es sinnvoll, die Exponentialfunktion in diesem Integral zu entwickeln: Das Verhalten von ~j~kω wird dann vom niedrigsten nichtverschwindenden Term dominiert werden. Wie schon im Kapitel über Elektrostatik und Magnetostatik gezeigt wurde, kann jede räumlich beschränkte Stromverteilung geschrieben werden als Summe von Polarisations- und Magnetisierungsanteilen1 . oder ~ ~ (~r, t) + ∂ P (~r, t) ~j(~r, t) = c∇ × M ∂t (3.155) ~ ω (~r) − iω P~ω (~r). ~jω (~r) = c∇ × M (3.156) Dabei ist P~ω (~r) aufzufassen als (vgl. Gl.2.110) (1) Piω (~r) = piω (~r) − 1 ∂ (2) p (~r) + ... 2 ∂rj ijω (3.157) 1 Diese Darstellung ist für den Fall, dass ~j(~r, t) ein einzelnes Atom oder Molekül darstellt, natürlich nicht erlaubt. Die Ergebnisse sind trotzdem auch für den Fall gültig, nur sehr langwieriger herzuleiten (siehe Jackson, Kap. 9) 89 wobei p(n) (~r) die elektrischen 2n -Poldichten darstellen. In ähnlicher Weise ist ~ ω (~r) aufzufassen als Summe einer magnetischen Dipoldichte und KorrekM turterme, die höhere magnetische Multipoldichten enthalten. Zum führenden Term in ~j~kω Z ~j (0) = ~jω (~r)d3~r (3.158) ~kω trägt der Magnetisierungsanteil nicht bei, weil für diesen Anteil die Divergenz verschwindet (S*) Z ~j (0) = −iω P~ω (~r)d3~r = −iω~pω , (3.159) ~kω wobei p~ω die Fouriertransformierte des gesamten elektrischen Dipolmoments (0) der Verteilung ist. Die von ~j~kω emittierte Strahlung heißt deshalb elektrische ~ ω und B ~ ω gilt Dipolstrahlung. Für die Felder E ~ ~ ω (~r) = ω ~k × p~ω eik~r B c r ~ ~ ω (~r) = −~k × (~k × p~ω ) eik~r E r el. Dipol (3.160) und für den Poynting Vektor eines harmonisch schwingenden Dipols erhält man für den Fall, dass die Komponenten von p~ω in Phase schwingen 2 4 ~¯ω = ω |~k × p~ω |2 ~r = ω |~pω |2 sin2 θ ~r S 8πc r3 8πc3 r3 (3.161) wobei θ den Winkel zwischen p~ω und ~r darstellt. Die gesamte abgestrahlte Leistung erhält man durch Integration der Radi~¯ω (sowieso die einzige nichtverschwindende Komponente) alkomponente von S über eine Kugel mit beliebigem Radius. Für ein im wesentlichen reelles p~ω erhalten wir ZZ ω4 ω4 3 2 Itot = sin θdθdφ = |p | |pω |2 (3.162) ω 8πc3 3c3 wobei wir benutzt haben ZZ Zπ 3 Z1 3 sin θdθdφ = 2π sin θdθ = 2π 0 2 8π (1 − µ2 )dµ = 2π(2 − ) = . 3 3 −1 (3.163) 90 Die Gl.3.162, die hier nur für ein reelles p~ω hergeleitet wurde, gilt auch für p~ω , deren Komponenten nicht die gleiche Phase haben. In der nächsten Ordnung erhält man Z (1) ~ ω (~r) − iω P~ω (~r))d3~r ~j = −i ~k~r(c∇ × M (3.164) ~kω Der erste Term liefert nach partieller Integration Z Z ∂ (1,1) 3 (j~kω )j = −ic ki ri ²jkl Mωl (~r)d ~r = ic ki ²jil Mωl (~r)d3~r, ∂rk also ~j (1,1) = ic~k × m ~ ω, ~kω (3.165) (3.166) wobei m ~ ω die Fouriertransformierte des gesamten magnetischen Dipolmo~ ω und B ~ω ments der Verteilung darstellt. Einsetzen in den Ausdrücken für E liefert ~ eik~r ~ ~ ~ Bω (~r) = −k × (k × m ~ ω) r magn. Dipol (3.167) ~ i k~ r ~ ω (~r) = − ω (~k × m E ~ ω) e r c wobei im letzten Ausdruck wieder die Formel für ~k × ~k ×~a verwendet wurde. ~ ω und B ~ ω verVerglichen mit dem elektrischen Dipol, sind die Rollen von E tauscht. Für den Poynting Vektor erhält man 4 ~r ~¯ = ω |m S ~ ω |2 sin2 θ 3 . 3 8πc r (3.168) Elektrische und magnetische Dipolstrahlung unterscheiden sich nur durch die Polarisation. R (1) Für den zweiten Term in Gl.3.164 erhält man für ~rp~ω (~r)d3~r = 0 den Ausdruck Z Z 1 ∂ (2) 1 (1,2) (2) 3 (j~kω )i = −ω kj rj (− pik (~r) + ...)d ~r = ωkj pij (~r)d3~r (3.169) 2 ∂rk 2 also 1 (1,2) (j~kω )i = ωkj qijω 2 (3.170) R (1) wobei qijω dem Quadrupolmoment der Verteilung entspricht (falls ~rp~ω (~r)d3~r nicht verschwindet liefert auch dieses Integral einen Beitrag zu Qω ; Jackson verwendet eine Definition des Quadrupolmoments, die sich um einen Faktor 3 ~ ω und B ~ ω sind von der hier verwendeten unterscheidet). Die Ausdrücke für E 91 wieder einfach herzuschreiben. Wir betrachten hier nur noch den Ausdruck für die abgestrahlte Leistung etwas näher: ~r 1 ω2 ¯ ~ Sω = |²ijk kj kl qklω |2 3 8πc 4 r (3.171) Wir können ohne Einschränkung der Allgemeinheit annehmen, dass der Tensor Qω diagonal ist Qklω = Qk δkl . Der obige Ausdruck reduziert sich dann zu ~¯ω = r~rS ω6 (sin2 θ cos2 θ sin2 φ|Qz − Qy |2 + sin2 θ cos2 θ cos2 φ|Qx − Qz |2 32πc5 + sin4 θ sin2 φ cos2 φ|Qy − Qx |2 ). (3.172) Die Winkelverteilung kann also recht kompliziert aussehen. Der einfachste Fall ist der gestreckte Quadrupol: Qx = Qy = − 12 Qz , wofür gilt ~¯ω = r~rS 9ω 6 Q2 sin2 θ cos2 θ 128πc5 z (3.173) also eine zylindrisch symmetrische, kleeblattartige Richtungsverteilung. Bei höheren Multipolmomenten kommen immer mehr Komponenten von k ins Spiel, was zu immer schärferen Richteffekten führen kann. Allerdings ist dafür notwendig, dass die Mulitpolentwicklung nicht ”zu stark” konvergiert, d.h. dass man ein Antenne wählt, deren Dimension mit einer Wellenlänge vergleichbar ist (für solche Verteilungen ist natürlich die direkte Auswertung von ~j~kω der Multipolentwicklung vorzuziehen). Bemerkung: Die in diesem Abschnitt berechneten Winkelverteilungen gelten nur für polarisationsunempfindliche Detektoren. Falls man vor dem De~ω tektor einen Polarisator aufstellt, so muss man bei der Auswertung von S ~ ω und die (dazu nur die vom Polarisator durchgelassene Komponente von E ~ ω berücksichtigen. senkrechte) entsprechende Komponente von B 92 3.5 Streuung elektromagnetischer Strahlung In diesem Abschnitt betrachten wir zuerst die Streuung elektromagnetischer Strahlung an Objekten, die klein sind verglichen mit der Wellenläng des Lichtes, z.B. an Atomen oder Molekülen. Im einfachsten Fall induziert das einfallende Licht im Atom ein elektrisches Dipolmoment gemäß ~0 p~ω = α(ω)E ω (3.174) ~ 0 das elektrische Feld der einfallenden Lichtwelle darstellt. Das wobei E ω Dipolmoment p~ω emittiert seinerseits elektromagnetische Strahlung nach den im vorigen Abschnitt besprochenen Gesetzen. Insbesonder gilt für das gestreute ~ E-Feld ikr ~ ω = −α(ω)~k × (~k × E ~ 0)e E (3.175) ω r ~ ~ ω0 Für linear polarisiertes Licht liegt das gestreute E-Feld in der Ebene durch E senkrecht zu ~k. Die Intensität in der Richtung θ beträgt (pro Raumwinkeleinheit) 4 4 ~ ω0 |2 sin2 θ ~¯ω = ω |~pω |2 sin2 θ = ω |α(ω)|2 |E (3.176) S 3 3 8πc 8πc Der Poynting Vektor der einfallenden Strahlung hat den Betrag ~¯ω0 | = c |E ~ 0 |2 |S 8π ω (3.177) Wie in den Streuproblemen der Mechanik definiert man den differentiellen Streuquerschnitt ~¯ω (θ, φ) dσ S ω4 = = |α(ω)|2 sin2 θ (3.178) 4 ¯0 dΩ c ~ |S ω | Der gesamte Streuquerschnitt beträgt (vgl. Gl.3.161) ZZ dσ 8π ω 4 sin θdθdφ → σ = |α(ω)|2 . σ= dΩ 3 c4 (3.179) Für viele Moleküle hängt α(ω) nur relativ schwach von ω ab; die Frequenzabhängigkeit von σ wird dann vom Faktor ω 4 dominiert. Von Sonnenlicht werden also in der Atmosphäre vor allem die blauen und ultravioletten Strahlen gestreut: hieraus erklärte Lord Rayleigh die blaue Farbe des Himmels, sowie die rote Farbe der untergehenden Sonne. Diese Erklärung setzt allerdings voraus, dass die an verschiedenen Molekülen gestreuten Lichtwellen nicht miteinander interferieren; man kann zeigen, dass dies für genügend verdünnte Gase zutrifft. 93 Der oben erwähnte differentielle Wirkungsquerschnitt gilt für polarisiertes Licht. Das Licht der Sonne ist bekanntlich nicht polarisiert, aber die zwei Polarisationen werden in einem vorgegebenen Winkel mit unterschiedlichen Intensitäten gestreut. ~k ´ ´ ´ - k~0 ´ ] J´3́ ´J ~ ´ ^E ω θ´ ´ θ0 6 ? E~0 Die Polaristion in der Streuebene hat in ihrem Streuquerschnitt einen Faktor sin2 θ = cos2 θ0 (siehe Skizze). Die Polarisation senkrecht zur Ebene der Skizze hat θ = π2 und wird also maximal getstreut. Das Sonnenlicht ist eine inkohärente Mischung der beiden Polarisationen und hat deshalb einen Streuquerschnitt dσ ω4 1 + cos2 θ0 = 4 |α(ω)|2 dΩ c 2 pro Molekül (3.180) Der Polarisationsgrad Π des gestreuten Lichts ist Π(θ0 ) = 1 − cos2 θ0 1 + cos2 θ0 (3.181) Die Vorzugspolaristion steht senkrecht zur Ebene durch die Sonne und die Blickrichtung. In dieser Rechnung ist Mehrfachstreuung, sowie Streuung an Staubpartikeln und Wassertröpfchen, Schneekristallen usw. vernachlässigt worden. Für Teilchen, die groß sind gegenüber der Wellenlänge wird Licht alle Frequenzen etwa gleich stark gestreut (die Reflexion an einer Ebene hängt nur vom Brechungsindex ab und enthält keine weiteren ω - Faktoren). Wolken sind deshalb weiß und der Himmel über Linz ist oft nicht allzu blau. Streuung an freien Elektronen (Thomson - Streuung) Für ein nichtrelativistisches Elektron gilt ~ 0 (~r0 , t), m~r¨0 = eE 94 (3.182) oder, für Auslenkungen klein gegenüber der Wellenlänge, ~ 0 (0, t), m~r¨0 = eE (3.183) wenn wir den Ursprung in der mittleren Lage des Elektrons wählen. Die Lösung für monochromatische Strahlung ist ~r0 (t) = ~r0ω e−iωt mit ~ 0ω −mω 2~r0ω = eE (3.184) Das Dipolmoment relativ zum Ursprung ist p~ω = e~rω ; wir erhalten also einen Sonderfall des schon behandelten Formalismus mit α(ω) = − e2 mω 2 (3.185) Der differentielle Wirkungsquerschnitt für polarisiertes Licht ist dσ ω 4 e4 = 4 2 4 sin2 θ = a20 sin2 θ, dΩ c mω (3.186) 2 e −13 wobei a0 = mc cm der schon in Gl.2.78 begegnete klassis2 = 2, 8.10 che Elektronenradius ist. Der Streuquerschnitt ist frequenzunabhängig; der Gesamtquerschnitt ist 8π 2 σ= a (3.187) 3 0 Das Lorentzmodell eines Atoms; Strahlungsdämpfung Nach Lorentz behandeln wir ein Elektron in einem Atom als ein harmonisch ~ 0 (~r, t) einer Lichtwelle gebundenes Teilchen mit der Bewegungsgleichung im Feld E ~ 0 (~r, t) ' eE ~ 0 (~0, t) m~r¨ + mω02~r = eE (3.188) wobei wir in der letzten Umformung angenommen haben, dass die Auslenkung ~r(t) klein gegenüber der Wellenlänge des Lichtes. Nach einer Fouriertransformation erhält man ~ 0ω (3.189) m(ω02 − ω 2 )~rω = eE oder p~ω = e~rω = also e2 ~ 0ω , E m(ω02 − ω 2 ) e2 α(ω) = m(ω02 − ω 2 ) 95 (3.190) (3.191) α(ω) ω0 ω ~ 0 (~r, t) kann Für ω = ω0 tritt eine Resonanz auf: Ein unendlich kleines E schon zu einem unendlichen p~ω und damit zu einer endlichen Abstrahlung führen. Schon aus Gründen der Energieerhaltung ist dies nicht akzeptabel. Auch der Grund für den Fehler ist ersichtlich: Für starke Streuung darf für das Feld am Ort des Elektrons nicht einfach nur das äußere Feld genommen werden; auch die Rückwirkung des Streufeldes auf das strahlende Elektron sollte berücksichtigt werden. Die präzise Behandlung wird sehr kompliziert; es treten Divergenzen auf wie in der Theorie der elektrostatischen Selbstenergie des Elektrons. Wir werden diese Rechnung ”kurzschließen” über die Annahme, dass die Strahlungsrückwirkung zu einem (wegen der Isotropie skalaren) Dämpfungsterm in der Bewegungsgleichung führt: ~ 0 (~0, t) m~r¨ + mγ~r˙ + mω02~r ' eE Dies führt zu ~rω = e 1 ~ 0ω E 2 m ω0 − ω 2 − iωγ α(ω) = e2 1 2 m ω0 − ω 2 − iωγ (3.192) (3.193) (3.194) Die Dämpfungskonstante γ bestimmen wir aus der Energieerhaltung: die von der Reibungskraft F~ = −mγ~r˙ pro Zeiteinheit geleistete Arbeit soll gleich der abgestrahlten Leistung sein. Die geleistete Arbeit pro Zeiteinheit ist ~ v = − 1 (F~ ∗~vω + F~ω~v ∗ ) = − 1 Re(F~ ∗~vω ) −F~ ω ω 4 ω 2 96 (3.195) 0.12 0.1 |alpha|^2 0.08 0.06 0.04 0.02 0 0 1 2 3 omega 4 5 6 Dies soll der abgestrahlten Leistung dIω = ω4 e2 ω 2 2 |~ p | = |~vω |2 ω 3c3 3c3 (3.196) gleich sein. Für paralleles F~ω und ~vω liefert dies 2e2 ω02 2e2 ω 2 ~ ~vω ' − ~vω Fω = − 3c3 3c3 (3.197) (in der Nähe der Resonanz) also 2e2 2 2a0 2 4πa0 γ= ω = ω = ω0 (3.198) 3mc3 0 c 0 3λ0 wobei λ0 die Wellenlänge des Lichtes mit Frequenz ω0 ist und a0 der klassische Elekronenradius. Für sichtbares Licht gilt γ << ω0 , also die Bewegung des Elektrons ist nur leicht gedämpft (Für λ0 von der Ordnung a0 wäre sowieso ~ r, t) ' E( ~ ~0, t) unerlaubt gewesen). Das die oben gemachte Dipolnäherung E(~ 2 2 Ersetzen von ω durch ω0 in Gl.3.197 ist nicht nur eine Bequemlichkeitssache: Belassen des Faktors ω 2 würde nach Fourierrücktransformation zu einer Bewegungsgleichung ... führen, in der die Strahlungsrückwirkung zu einem Term proportional zu ~r führen würde: mγ ... ~ 0 (~r, t). (3.199) − 2 ~r + m~r¨ + mω02~r = eE ω0 Die Lösungen dieser Gleichung sind nicht länger durch die Anfangswerte von ~r und ~r˙ eindeutig festgelegt; es gibt zusätzlich exponentiell anwachsende Lösungen (runaway solutions), die offensichtlich unphysikalisch sind. In einer 97 genauen Theorie von Atom + Strahlungsfeld kann man in der Tat zeigen, dass solche Lösungen nicht auftreten dürfen. Dies rechtfertigt im nachhinein das Ersetzen von ω 2 durch ω02 , das diese Lösungen durch einen Trick eliminiert. Zum Schluss unserer Betrachtungen schreiben wir noch den Ausdruck für den differentiellen Streuquerschnitt eines Lorentz Atoms hin dσ ω4 = a20 2 |k̂ × ê0ω |2 (3.200) dΩ (ω0 − ω 2 )2 + ω 2 γ 2 wobei r̂ und êoω Einheitsvektoren in der Beobachtungsrichtung und in der ~ 0 sind. Für ω << ω0 erhält man den Ausdruck für Richtung des Feldes E e2 Rayleighstrahlung mit α(ω) = α(0) = mω 2 ; für ω >> ω0 erhält man den 0 Ausdruck für Thomson - Streuung an freien Elektronen. Streuung an mehreren schwach streuenden Zentren; der Strukturfaktor Zum Schluss dieses Abschnittes betrachten wir die Streuung von Licht an einer Wolke von Atomen und Molekülen, mit einer zeitunabhängigen Dichte n(~r). Die Wolke kann Abmessungen haben, die vergleichbar sind mit der Wellenlänge des einfallenden Lichtes. Wir werden zur Vereinfachung des Problems annehmen, dass jedes Atom für sich nur schwach streut und deshalb die Möglichkeit der Streuung des Lichtes an mehreren Atomen hintereinander vernachlässigbar ist. Ein Atom am Ort ~ri mit Polarisierbarkeit α(ω) gibt im Punkt ~r in der Fernzone Anlass zu Streufeldern ik|~ r−~ ri | ~ ωi (~r) ' −ei~k0~ri α(ω) e ~ 0ω ) E (~k × ~k × E |~r − ~ri | eikr −i(~k−~k0 )~ri ~ ~ ~ e (k × k × E0ω ) r eikr −i(~k−~k0 )~ri ω ~ ~ ' α(ω) e (k × E0ω ) r c ' −α(ω) (3.201) ~ ωi B (3.202) ¡ ¡ ¡ k~0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ µ ¡ µ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ µ ¡ µ ¡ ¡ ¡ ¡ ¡ r¡ ¡~ k r¡ r¡ ¡ ¡ ¡ ¡ r¡ r¡ θ0 - 98 ~ ω und B ~ ω der verschiedenen Streuzentren Wenn wir jetzt die Beiträge zu E addieren, so erhalten wir, vergleichen mit den Ausdrücken für Einzelstreuung, einen zusätzlichen Faktor Z 0 ~ ~ n~κ = n(~r0 )e−i(k−k0 )~r d3~r (3.203) Der Vektor ~κ = ~k0 − ~k heißt Streuvektor. Seine Länge hängt mit dem Streuwinkel θ0 über 1 |~κ| = 2k sin θ0 (3.204) 2 zusammen. > ½B ½ ~k ½½ ½ ½ ½ ½ ³ ³ ½ ½ ³³ B Bk ³³ B B B -BN k~0 Für den Streuquerschnitt der gesamten Wolke aus punktförmigen Dipolstreuer erhalten wir letztendlich µ ¶ µ ¶ dσ dσ 2 = |n~κ | = |n~κ |2 |α(ω)|2 k 4 sin2 θe (3.205) dΩ W dΩ at für polarisiertes Licht, oder µ ¶ µ ¶ dσ 1 + cos2 θ0 2 2 4 = |n~κ | |α(ω)| k dΩ W 2 (3.206) für unpolarisiertes Licht. Der Vorfaktor |n~κ |2 := S(~κ) (3.207) der die Modifikation der Richtungsverteilung der gestreuten Strahlung verglichen mit derjenigen der einzlenen Streuer angibt, heißt (statistischer) Strukturfaktor. Beispiel 1: Eine Kugel n(~r) = n0 θ(a − r) 99 (3.208) Za Zπ Z2π n~κ = n0 e 0 Za = 4πn0 Z 0 i~κ~ r 2 r dr sin θdθdφ = 2πn0 eiκµr r2 dµdr = 0 · ¸ 1 4πn0 1 a 2 sin(κr)r dr = sin(κa) − cos(κa) κr κ κ2 κ (3.209) 0 Für κa << 1 erhält man n~κ ' teilchen. Für κa >> 1 gilt n~κ ' − 4π n a3 3 0 und die Kugel streut wie ein Punkt- 4πn0 a πn0 a cos(κa) ' 2 2 1 cos(κa) 2 κ k sin 2 θ0 (3.210) Der Strukturfaktor beträgt also S(~κ) = π 2 n20 a2 cos2 (κa) 4 1 4 k sin 2 θ0 (3.211) Der Faktor k −4 fällt gegen k 4 im Streuquerschnitt des Einzelstreuers weg. Das Streulicht von großen Streuern ist also weiß und stark vorwärts gerichtet. Dies ”erklärt” die weiße Farbe von Nebel und Wolken (Allerdings ist dort die Annahme schwacher Streuung nicht länger gerechtfertigt; die Faktoren k n treten aber auch dann auf ähnliche Weise auf. Näheres über Streutheorie in der Vorlesung Quantenmechanik). Beispiel 2: periodische Strukturen Für dreidimensionale (unendliche) periodische Strukturen (Kristalle) tritt bei der Bildung von n~κ destruktive Interferenz auf, außer für Vektoren ~κ des sogenannten reziproken Gitters, die definiert sind durch die Bedingung ~κ~ai = 2πni (3.212) ~ai (i = 1, 2, 3) sind die drei Gittervektoren der Elementarzelle des Kristalls und ni sind ganze Zahlen. Streuung tritt nur in ganz bestimmten Richtungen auf (Bragg - Peaks). Um die Kristallstruktur von ”echten” Kristallen zu sehen, braucht man wegen |~κ| < 2k Strahlung genügend kurzer Wellenlänge (Röntgen - Strahlung). Bragg - Streuung mit sichtbarem Licht kann man an Superposition von Polystyrolkügelchen im Wasser, die sich für geschickt gewählte Werte von Radius, Dichte und Ionenkonzentration spontan periodisch ordnen, beobachten. 100 4 4.1 Die spezielle Relativitätstheorie Das Verhalten der Maxwellgleichungen unter Galilei - Transformationen Die klassische Mechanik ist invariant unter der Transformation zu einem gleichförmig bewegten System: ~r0 = ~r − ~v0 t ~v 0 = ~v − ~v0 (4.1) Es ist deshalb unmöglich, mittels mechanischer Experimente festzustellen, ob das System, in dem der Experimentator sich befindet, sich bezüglich des ”absoluten Raumes” bewegt oder in Ruhe ist. Dies heißt das Relativitätsprinzip. Es stellt sich jetzt heraus, dass die Maxwellgleichungen nicht invariant sind unter der Transformation in Gl.4.1. Wir zeigen das an zwei Beispielen. 1. Lichtausbreitung Die Maxwellgleichungen sagen voraus, dass das Licht sich in allen Richtungen mit der Geschwindigkeit c ausbreitet. Nach Gl.4.1 kann dies allerdings nur in einem einzelnen ausgezeichneten System der Fall sein. Andererseits lassen die Maxwellgleichungen nicht zu, dass jede Lichtwelle mit der Geschwindigkeit c bezüglich ihrer Quelle läuft: In den Lösungen der freien Maxwellgleichungen im Vakuum ist nur eine einzelne Ausbreitungsgeschwindigkeit zulässig. ¡ ¡ ¡ ¡ ¡ ¡ S2 l2 ¡ ¡ S0 ¡ ¡ ¡ l1 ¡ ¡ ¡ ¡ ¡ ¡ S1 Det. Eine Anordnung um nachzuprüfen, wie das Laborsystem sich bezüglich des Vorzugsystems der Maxwellgleichungen bewegt, wurde von Michelson vorgeschlagen: Ein Lichtstrahl trifft auf einen Strahlteiler (halbdurchlässiger Spiegel) S0 , der 45◦ zur Strahlrichtung geneigt ist. Die Teilstrahlen durchlaufen die 101 Strecken l1 und l2 bis zu festen Spiegeln S1 und S2 und werden dort zu S0 zurückreflektiert. Im ruhenden System ist der Unterschied zwischen den Laufzeiten 2l1 2l2 t1 − t2 = − (4.2) c c Betrachten wir jetzt dieselbe Anordnung in einem System, das sich in der Richtung S0 − S1 mit der Geschwindigkeit v bewegt. Auf dem Hinweg läuft das Licht nach unserer Annahme 4.1 mit der Geschwindigkeit c − v, auf dem Rückweg mit c + v. Die Laufzeit des ”waagrechten” Strahls ist also t1 = l1 l2 2l1 2l1 1 + = ¡ 2 ¢ := v c−v c+v c (1 − β 2 ) c 1 − c2 (4.3) wobei wir die Abkürzung β = vc eingeführt haben. Der ”senkrechte” Strahl hat in der für das Durchlaufen der Strecke 2l2 benötigten Zeit im Ruhesystem auch noch den waagrechten Abstand vt2 zurückgelegt. ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¤¤C S1 ¤ C ¤ C C ¤ C ¤ l2 C ¤º¤ CW ¤ C ¤ C ¤¢ C ¢¢ ¢ ¤ ¢ ¤¾ -C ¢ S0 (t = t2 ) ¢ ¢C vt2 ¢ ¢ C ¢ ¢ C C S0 (t = t0 ) C C ¡ ¡ ¡ ¡ Det. Es gilt also ct2 = oder t2 = q 4l22 + v 2 t22 2l2 1 p . c 1 − β2 102 (4.4) (4.5) Für den Laufzeitunterschied erhalten wir also 2l1 1 2l2 1 p t1 − t2 = − 2 c 1−β c 1 − β2 (4.6) Um jetzt das Interferenzmuster am Detektor zu zentrieren, sollten l1 und l2 so justiert werden, dass gilt t1 − t2 = 2πn , wobei n ∈ N ist. Diese Justierung ω sollte dann aber verloren gehen, wenn wir die ganze Anordnung um 90◦ drehen. Dann sollten auch die Nenner in Gl.4.6 vertauscht werden und man erhält 2l1 1 2l2 1 p t1 − t2 = − (4.7) 2 c c 1 − β2 1−β was für allgemeines β nicht gleichzeitig ein ganzes Vielfaches von 2π sein kann. ω Die Versuche von Michelson, und später von Michelson und Morley, waren so ausgelegt, dass sich das Interferenzmuster bei Drehung der Anordnung auf Grund der Umlaufgeschwindigkeiten der Erde um die Sonne merkbar hätte verschieben müssen. Für einen bestimmten Tag wäre dies noch dadurch zu erklären, dass sich die Geschwindigkeit derErde um die Sonne und diejenige der Sonne bezüglich des absoluten Raums zufällig zu Null addieren. Diese Erklärung würde aber implizieren, dass der Effekt ein halbes Jahr später umso größer sein sollte. Auch das traf nicht ein. Ein verzweifelter Versuch, dieses Nullergebnis zu erklären wurde von FitzGerald und Lorentz gemacht: Sie nahmen an, dass die p Abmessungen jedes Körpers in der Bewegungsrichtung um einen Faktor 1 − β 2 gestaucht werden. Zur Motivation, sicher bei Lorentz, dienten Überlegungen über die Kraftwirkungen zwischen bewegten Ladungen: Die Felder einer gleichmäßig bewegten Ladungsverteilung Wir betrachten eine gleichmäßig bewegte Ladungsverteilung, gekennzeichnet durch eine Ladungsdichte ρ(~r, t) und die zugehörige Stromdichte ~j(~r, t) = ~v ρ(~r, t). (4.8) In der Lorentzeichung gilt jetzt ¤φ = −4πρ ~ ~ = ~v φ := βφ. ~ = −4πρ ~v → A ¤A c c (4.9) ~ unverformt mit der Ladungsverteilung mitbeWeiter gilt, dass sich φ und A wegen: φ(~r, t) = φ(~r − ~v t, 0) (4.10) oder ∂φ ∂φ + ~v =0 ∂t ∂~r 103 (4.11) ~ - Feld gilt also Für das E µ ¶ ~ 1 ∂A 1 ~v ∂φ ~v ~v ~ E = −∇φ − = −∇φ − = −∇φ + ∇φ c ∂t c c ∂t c c ~ - Feld und für das B µ ~ =∇×A ~ =∇× B ~v φ c ¶ ~v ~v ~ = − × ∇φ = × E c c (4.12) (4.13) ~ zu ~v parallel steht Die letzte Umformung ist erlaubt, weil der Zusatzterm in E c und zum Vektorprodukt keinen Beitrag liefert. Die Bestimmungsgleichung für φ lautet à ! µ ¶ ~v~v 2 1 ∂ 2 ¤φ = ∇2 − 2 2 φ = ∇2 − ∂c 2 φ = −4πρ (4.14) c ∂t ∂~ r∂~ r oder in einem System mit ~v entlang der x- Achse: · ¸ 2 ∂2 ∂2 2 ∂ (1 − β ) 2 + 2 + 2 φ = −4πρ ∂x ∂y ∂z Für β < 1 lässt sich die Lösung finden mittels der Transformation p y = y0 z = z0. x = x0 1 − β 2 Es gilt dann µ 2 ¶ p ∂ ∂2 ∂2 0 0 0 0 + + 1 − β 2, y0, z0) φ(x , y , z ) = −4πρ(x 02 02 02 ∂x ∂y ∂z (4.15) (4.16) (4.17) mit der Lösung Z 0 0 0 φ(x , y , z ) = p ρ(ξ 0 p 1 − β 2 , η 0 , ζ 0 )dξ 0 dη 0 dζ 0 (x0 − ξ 0 )2 + (y 0 − η 0 )2 + (z 0 − ζ 0 )2 oder, in den ursprünglichen Koordinaten Z ρ(ξ, η, ζ)dξdηdζ p φ(x, y, z) = 2 (x − ξ) + (1 − β 2 ) [(y − η)2 + (z − ζ)2 ] (Beachte, dass gilt dξ 0 = √ dξ 1−β 2 (4.18) (4.19) ). Insbesondere findet man für eine Punkt- ladung die sich für t = 0 im Ursprung befindet (ξ = η = ζ = 0): φ(~r, 0) = p e x2 + (1 − β 2 )(y 2 + z 2 ) 104 . (4.20) ~ und B~ Feld sofort bestimmen. Wir Aus diesem Ausdruck lassen sich E beschränken uns auf die Betrachtung der Kraft auf eine mit Geschwindigkeit ~v mitbewegte Ladung e0 : h i 0 ~ 0 ~ ~ ~ ~ ~ ~ K = e (E + ~v c × B) = −e (1 − β β)∇φ + β × (β × ∇φ) = −e0 (1 − β 2 )∇φ, (4.21) ~ β∇φ) ~ wobei wir benutzt haben β~ × (β~ × ∇φ) = β( − β 2 ∇φ). Die Kraft auf eine mitbewegte Ladung ist also herleitbar aus einem Konvektionspotential ψ = (1 − β 2 )φ. Dessen Äquipotentialflächen sind die Ellipsoiden x2 + (1 − β 2 )(y 2 + z 2 ) = const. (4.22) ³ 1~ e0 ³³ k ³³ ¢ ¢ ¢ -v ¢ e Äquidistantfläche Diese Ellipsoiden sind also in der x-Richtung gestaucht um genau den Faktor p 1 − β 2 , dem wir in der Kontraktionshypothese von Lorentz und FitzGerald begegneten. Die Idee von Lorenetz war jetzt, dass die Stauchung der Äquipotentialoberflächen es den Atomen in z.B. einem Festkörper erlauben würde, in der Richtung von ~v näher zusammenzurücken. Grundannahme dabei war, dass die Kräfte, die die Kristallform bestimmen, letztendlich elektromagnetischer Natur sind. Wir werden auf die Argumentation nicht näher eingehen; die obige Rechnung zeigt aber, dass die Kontraktionshypothese keine reine ad-hoc Lösung war, sondern durchaus auch physikalischen Hintergrund hatte. ~ hat aber noch einige weitere Konsequenzen: Die Der obige Ausdruck für K Kraft zwischen zwei Teilchen ist nicht länger rein radial gerichtet. Die eröffnet neue Möglichkeiten für Experimente, die die Geschwindigkeit eines Labors bezüglich des absoluten Raums feststellen könnten: 1. Der Versuch von Trouton und Noble: Betrachte einen Stab, an dessen Enden sich Ladungen befinden. 105 : e0 »»»»» r » ee0 > 0 »» ¤ ¤ »» » 9 ¤ ¤ ¤ » r » ¤ » » » »»» 9 : » »» ee0 < 0 e Auf diesem Stab würde nach den obigen Rechnungen ein Drehmoment wirken, das bei gleichen Vorzeichen der Ladungen versuchen würde, den Stab in die Richtung von ~v zu drehen, bei entgegengesetzten Vorzeichen eine Ausrichtung senkrecht zu ~v bewirken würde. Der Versuch (mit einem Kondensator an einem Torsionsfaden) lieferte ein Nullergebnis. Erklärung laut Lorentz: Auch die mechanischen Spannungen, die die Kondensatorplatten trotz der elektrostatischen Anziehung auseinander halten, sind elektromagnetischer Natur und zeigen eine ähnliche Abweichung in einem bewegten System. 2. Als Gedankenexperiment könnte man versuchen, zwei Punktladungen aus einer Ruhelage heraus frei bewegen zu lassen. Im absoluten ~ = m~a die Bahnen auf einer gemeinsamen Ruhesystem würden nach K Geraden liegen; in bewegten Systemen sollten Abweichungen auftreten und das Relativitätsprinzip wäre verletzt. Jetzt hilft keine Kontraktionshypothese mehr; man müsste, um das Relativitätsprinzip zu ret~ = m~a die skalare Größe Masse ten vielmehr annehmen, dass auch in K durch p einen Tensor ersetzt wird, dessen xx-Komponente um einen Faktor 1 − β 2 größer wäre als die yy- und zz- Komponenten. Auch dies ist nicht absurd, falls man annimmt, dass auch die Masse letztendlich elektromagnetischer Natur ist; die Vermehrung von Zusatzhypothesen verschönert die Theorie aber nicht. Zusammenfassend lässt sich der Stand der Theorie um 1905 etwas wie folgt charakterisieren: Falls wir annehmen, dass die Maxwellgleichungen uneingeschrenkt richtig sind und dass Transformationen zwischen zwei relativ zueinander bewegten Systemen durch Galilei-Transformationen korrekt beschrieben werden (was damals als selbstverständlich galt), so ist das Relativitätsprinzip auf der Ebene der Grundgleichungen verletzt. Es gelingt aber nicht diese Verletztungen auch experimentell nachzuweisen, weil es immer eine Verschwörung von einander gerade aufhebenden Effekten zu geben scheint. 106 Dieser Zustand war natürlich sehr unbefriedigend. Der naheliegende Ausweg wäre, die Maxwellgleichungen so abzuändern, dass sie Galilei-invariant werden. Dies ist aber nicht befriedigend gelungen. Die von Einstein 1905 vorgeschlagene Lösung war eine Abänderung der Galilei-Transformation. Gegenüber der neuen Transformation, die von Lorentz schon als eine Art mathematische Kuriosität eingeführt war, sind die Maxwellgleichungen offensichtlich invariant. Das negative Ergebnis der Experimente von Michelson und Morley, Trouton und Noble usw. lässt sich jetzt zwanglos erklären. Allerdings enthält die Lorentztransformation auch eine Transformation der Zeitvariable, deren physikalische Bedeutung verstanden werden muss. Weiters wird auch eine Abänderung der Mechanik notwendig. Diese ist nämlich gegenüber Galileitransformationen invariant, aber nicht gegenüber Lorentztransformationen. Einem Aspekt der benötigten Modifikationen (anisotrope Masse) sind wir in der obigen Diskussion schon begegnet. 107 4.2 Die Postulate der speziellen Relativitätstheorie; die Lorentztransformation Einstein löste die Schwierigkeiten der Elektrodynamik bewegter Körper dadurch, dass er das Reltivitätsprinzip als Postulat annahm: 1. Die Grundgleichungen der Physik sind dieselben in jedem Inertialsystem. Als zweites Postulat nahm er die Gültigkeit der Maxwellgleichungen in jedem Inertialsystem oder etwas schwächer: 2. Das Licht pflanzt sich im Vakuum in allen Inertialsystemen und in jede Richtung mit der gleichen Geschwindigkeit c fort. Um diese Postulate erfüllen zu können, erweist es sich als notwendig, beim Übergang in ein bezüglich des Ausgangssystems gleichmäßig bewegtes System nicht nur die Raumkoordinaten, sondern auch die Zeit zu transfomieren: (x, y, z, t) =⇒ (x0 , y 0 , z 0 , t0 ) (4.23) Die gesuchte Transformation heißt Lorentztransformation. In der Transformation darf kein Punkt im Raum eine ausgezeichnete Rolle spielen; das geht nur, wenn die Transformation linear ist. Wir betrachten zuerst den Fall, dass die zwei Bezugssysteme sich gegeneinander mit einer Geschwindigkeit ~v in x-Richung bewegen. Zur Zeit t = 0 sollen die Ursprünge zusammenfallen und die Uhren werden synchronisiert: x = y = z = t = 0 ⇐⇒ x0 = y 0 = z 0 = t0 = 0 (4.24) Die Verknüpfungsgleichungen sind also homogen. y0 y k0 k v 0 ¡ x 0 0 ¡ ¡ ¡ ¡ ¡ z0 z 108 - x0 Die Bewegung des Ursprungs 00 des bewegten Systems wird definiert durch x0 = 0 ⇐⇒ x = vt (4.25) x0 = γ(x − vt) (4.26) es muss also gelten mit noch zu bestimmendem γ. Umgekehrt muss natürlich auch gelten (wegen der Symmetrie der Anordnung) x = γ(x0 + vt0 ) (4.27) Betrachte jetzt einen Lichtimpuls der aus 0=0’ in t = t0 = 0 emittiert wird. Zur Zeit t werde er in K im Punkte x = ct absorbiert. Dasselbe Absorptionsergebnis findet bezüglich K 0 im Punkt x0 zur Zeit t0 statt, wobei nach dem zweiten Postulat wieder gelten muss x0 = ct0 . Es gilt also ct0 = x0 = γ(x − vt) = γ(ct − vt) = γt(c − v) (4.28) ct = x = γ(x0 + vt0 ) = γ(ct0 + vt0 ) = γt0 (c + v) (4.29) bzw. Multiplikation der beiden Gleichungen ergibt 1 c2 = γ 2 (c2 − v 2 ) ⇒ γ = q 1− v2 c2 1 =p 1 − β2 (4.30) Wir erhalten also x0 + vt0 x= p 1 − β2 x − vt x0 = p 1 − β2 (4.31) Elimination von x0 bzw x aus den beiden Gleichungen ergibt t − v2 x t0 = p c 1 − β2 t0 + v2 x0 t= p c 1 − β2 (4.32) Man überprüft leicht, dass gilt x02 − c2 t02 = ¤ 1 £ 2 2 = x2 − c2 t2 . (x − βct) − (ct − βx) 2 1−β (4.33) Bisher haben wir über das Verhalten von y und z unter der Transformation noch keine Aussage gemacht. Um solche zu erhalten, benützen wir wieder 109 die Invarianz der Lichtgeschwindigkeit. Wird ein Punkt x,y,z zur Zeit t von der aus ~r = 0 zur Zeit t = 0 ausgehenden Kugelwelle erreicht, so muss gelten x2 + y 2 + z 2 − c 2 t 2 = 0 ⇒ y 2 + z 2 = c 2 t 2 − x2 (4.34) Die Koordinaten für dasselbe Ereignis im Koordinatensystem K 0 müssen natürlich derselben Bedingung genügen x02 + y 02 + z 02 − c2 t02 = 0 ⇒ y 02 + z 02 = c2 t02 − x02 . (4.35) Es gilt also wegen der oben gezeigten Invarianz von c2 t2 − x2 y 02 + z 02 = y 2 + z 2 (4.36) Die alten und neuen transversalen Koordinaten hängen also über eine Rotation zusammen; die einfachste Lösung ist, sie in den beiden Systemen identisch zu wählen: y0 = y z 0 = z. (4.37) In Matrixform ist der Zusammenhang der alten und neuen Koordinaten 0 √1 √β 0 0 − 2 2 x x 1−β 1−β y0 y 0 1 0 0 0 = (4.38) z z 0 0 1 0 ct0 ct −√ β 2 0 0 √ 1 2 1−β 1−β Diese Transformation kann als eine Drehung um einen ”imaginären” Winkel ψ aufgefasst werden, d.h. wir können definiern 1 p 1 − β2 β p = sinh ψ 1 − β2 = cosh ψ wodurch die Transformationsmatrix die Gestalt cosh ψ 0 0 − sinh ψ 0 1 0 0 0 0 1 0 − sinh ψ 0 0 cosh ψ annimmt. 110 (4.39) (4.40) u0 (x0 = 0) @ @ u @ @ @ s @ £ £ £s £ £ ¡ ¡ ¡ ¡ ¡ £ ¡ ³³ 0 0 s ³ £ ¡ ³³ x (u = 0) @ £³ ¡³³ s ³ @ £ ³³¡ ³ x ³ ¡£ @ ³ ³ @ ³ ¡ £ ³ @ ¡ £ @ ¡ £ @ ¡ £ @ ¡ £ @ ¡ £ @ ¡ £ @ Geometrisch heißt dies, dass die Einheitsintervalle auf der x- und u := ctAchse sich nicht, wie bei einer Rotation, in gleicher Richtung auf dem Kreis x2 + u2 = 1 bewegen, sondern in entgegengesetzter Richtung auf den Hyperbelästen x2 − u2 = ±1. (Die x’ und u’-Achsen erhält man auch durch Lösen der Gleichungen t0 = 0 bzw. x’=0). Folgerungen aus der Lorentztransformation a. Die Lorentzkontraktion: Betrachte einen im System K 0 ruhenden Einheitsmaßstab. Die Koordinate der Endpunkte sind also durch die Gleichungen x01 = 0 und x02 = 1 (alle t) gegeben. Im ”ruhenden” System K korrespondiert dies zu p (4.41) x1 = vt x2 = vt + 1 − β 2 Für einen Beobachter in K haben also p die Enden des Maßstabes am für ihn gleichen Zeitpunkt einen Abstand 1 − β 2 . Dies ist genau der Faktor, der in der Lorentz-Fitzgerald Hypothese auftrat. Allerdings ist die Erklärung ganz anders: Die Erklärung im vorherigen Abschnitt beruhte auf dem Verhalten der Maxwellgleichungen unter einer Galilei - Transformation; diese Transformation beschreibt aber nach Einstein den Übergang zwischen zwei zueinander bewegten Systemen nicht korrekt. In der Skizze erkennt man auch die Symmetrie des Effektes: Auch die Weltlinie des Endes eines in K ruhenden Maßstabes schneidet die x’- Achse (t0 = 0) links vom Punkt x’=1 b. Die Zeitdilitation: Betrachte eine in K 0 ruhende Uhr. Ihr Uhrzeiger geht durch Null in t0 = t01 und t0 = t02 (am selben Ort x0 = x00 ). Im System K wird der Abstand der zwei Ereignisse (x00 , t01 ) und (x00 , t02 ) gemessen als t02 − t01 p t2 − t1 = ; 1 − β2 (x01 = x02 ) (4.42) der Zeitabstand erscheint also als verlängert (siehe Skizze für den Spezialfall x00 = 0, t01 = 0). Auch hier ist der Effekt symmetrisch: Eine in K ruhende Uhr 111 erscheint einem Beobachter in K 0 genauso verlangsamt. Die Zeitdilitation ist inzwischen wiederholt experimentell bestätigt worden. Beispiel: µ- Mesonen werden von der kosmischen Strahlung in etwa 10 km Höhe erzeugt. Ihre Geschwindigkeit ist etwa die Lichtgeschwindigkeit, also ihre Flugzeit bis zur Erdoberfläche ist 3, 3.10−5 s. Die Lebensdauer eines µ- Mesons ist etwa 2.10−6 s; der Fluss an senkrecht einfallenden Myonen wäre deshalb ohne Zeitdilitation um e−16,5 = 6, 83.10−8 abgeschwächt. In Wirklichkeit p beobachtet man kaum eine Schwächung: Der Faktor 1 − β 2 beträgt etwa 10−4 , wodurch der Abschwächungsfaktor nur noch 0,998 beträgt. Sehr genaue Messungen der Zeitdilitation gibt es an in Speicherringen kreisenden Neutronen. Inzwischen ist die Zeitdilitation auch mit normalen Cäsium - Uhren, von denen eine am Boden bleibt und zwei andere in Flugzeugen um die Welt ostwärts bzw. westwärts umkreisen, gemessen worden. Allerdings muss man dabei auch allgemein - relativistische Effekte (Zeitverlangsamung in äußeren Potentialen, Effekte der Rotation) berücksichtigen. Die von der Uhr registrierte Zeit ist dabei der sogenannten Eigenzeit gleichzusetzen, d.h. der Zeit in einem jeweils mit der Uhr mitbewegten Koordinatensystem. Für ein infinitesimales Zeitelement dt ist das entsprechende Element der Eigenzeit dτ gegeben durch r v(t)2 dτ = dt 1 − 2 (4.43) c oder µ ¶ |~v (t)|2 2 2 2 2 c dτ = c dt 1 − = c2 dt2 − dx2 − dy 2 − dz 2 , (4.44) c2 wobei die Definition dxi (4.45) dt verwendet wurde. Weil das Intervall ds2 = c2 dt2 − dx2 − dy 2 − dz 2 dür jedes Inertialsystem dasselbe ist, erhält auch jeder Beobachter für die Eigenzeit dτ denselben Wert. Das Zwillingsparadoxon: Ein Raumfahrer fliegt mit einer Geschwindigkeit v = 21 c nach einem 5 Lichtjahre entfernten Stern und zurück. Für einen ruhenden Beobachter dauert die Reise 10 × 2 = 20a. q Die 3 = Eigenzeit des Raumfahrers dagegen ist um einen Faktor 4 0, 866 kürzer: für ihn sind nur 17, 32a vergangen. Am Ende seines vi = 112 Abenteuers ist er also um 2 Jahre und 8 Monate jünger als ein etwaiger zurückgebliebener Zwillingbruder. Hierbei sind Effekte der Beschleunigungsphasen nicht berücksichtigt; diese können nur aus der allgemeinen Relativitätstheorie berechnet werden. Sie werden aber erwartungsgemäß von der insgesamt zurückgelegten Streckt unabhängig sein und deshalb den oben errechneten Effekt nie aufheben können. Beachte, dass die Situation der beiden Brüder, anders als in den vorherigen Beispielen, nicht symmetrisch ist: Nur der zuhause gebliebene Bruder sitzt (näherungsweise) in einem Inertialsystem! c. Absolute Zukunft und Vergangenheit; der Lichtkegel: In den obigen Diskussionen ist schon enthalten, dass dem Begriff der Gleichzeitigkeit in der Relativitätstheorie keine absolute Bedeutung zukommt. Zwei an verschiedenen Orten x01 und x02 im System K 0 aufgestellte Uhren zeigen im System K eine Gangunterschied t2 − t1 = t02 − t01 + cv2 (x02 − x01 ) v x0 − x01 p =⇒ 2 p2 c 1 − β2 1 − β2 (4.46) für t02 = t01 . Ob zwei räumlich getrennte Ereignisse gleichzeitig sind, hängt also vom Koordinatensystem ab. Dagegen hat das Vorzeichen der Invariante s212 = c2 (t2 − t1 )2 − |~r2 − ~r1 |2 (4.47) schon eine absolute Bedeutung. Es gibt drei Möglichkeiten: 1. s212 > 0: Der Intervall heißt zeitartig. Lorentztransformationen mit v < c können das Vorzeichen nicht ändern. Wohl gibt es eine Transformation, die für die zwei Ereignisse dieselben Ortskoordinaten liefert. Das Ereignis (~r2 , t2 ) liegt bezüglich (~r1 , t1 ) in der absoluten Zukunft oder in der absoluten Vergangenheit 2. s12 < 0: Der Intervall heißt raumartig. Das Vorzeichen von t02 − t01 kann zu Null gemacht werden; zwischen den Ereignissen (~r1 , t1 ) und (~r2 , tr ) kann kein Signal mit Licht- oder Unterlichtgeschwindigkeit laufen. (~r2 , t2 ) liegt bezüglich (~r1 , t1 ) im absoluten Anderswo. 3. s12 = 0. Die Ereignisse können durch ein Lichtsignal verknüpft werden. Jedes Ereignis liegt auf dem Lichtkegel des anderen. Falls die Ereignisse nicht zusammenfallen, kann man sie durch Lorentztransformation mit |~v | < c weder am selben Ort noch zur selben Zeit stattfinden lassen. 113 In der Skizze sind die Verhältnisse 3- dimensional skizziert. Für das Getrenntbleiben von Zukunft und Vergangenheit ist es wesentlich, die Existenz von Überlichgeschwindigkeiten auszuschließen. Einführen solcher Geschwindigkeiten führt sofort zu in der Science Fiction Literatur beliebten Paradoxa, wie das Grundthema des Films ”Zurück in die Zukunft” 1. Ein Jüngling wird aus dem Punkt 0 auf der Erde mit Überlichtgeschwindigkeit zu einem rasch bewegten Raumschiff transportiert und trifft dort im Punkt P an. 2. Er wird sofort zur Erde zurückgeschossen, gleichfalls mit v > c (aber: mit positiver Neigung zur Achse t0 = const, also subjektiv in die Zukunft) 3. Er kommt dort in einem Punkt Q an, der früher liegt als 0 und begegnet seiner Mutter als jungem Mädchen. Im Abschnitt ”relativistische Mechanik” werden wir leider finden, dass Beschleunigung auf Überlichtgeschwindigkeiten mit endlichem Energieaufwand nicht möglich ist. d. Transformation der Geschwindigkeiten: Betrachte ein Teilchen, das sich im System K mit der Geschwindigkeit ~v = (vx , vy , vz ) bewegt. Es gilt also dri vi = (4.48) dt Im System K 0 sind die Koordinaten des Teilchens bekanntlich x − vt x =p 1 − β2 0 0 y =y t − cv2 x t =p 1 − β2 0 0 z =z Die Geschwindigkeit in K 0 ist definiert als dr0 , dt (4.49) also insbesondere √vx −v 0 0 dt vx − v dx dx 1−β 2 vx0 = 0 = = 1− v vx = 0 dt dt dt 1 − vvc2x √ c2 (4.50) 1−β 2 und vy0 p vy 1 − β 2 dy 0 = 0 = dt 1 − vvc2x (4.51) p vz 1 − β 2 = 1 − vvc2x (4.52) bzw. vz0 Für den Spezialfall vy = vz = 0 gilt auch vy0 = vz0 = 0 aber im allgemeinen werden auch die Transversialkomponenten von ~v durch die Transformation geändert. 114 Ein zweiter wichtiger Spezialfall tritt für den Fall, dass ~v die Geschwindigkeit eines Lichtimpulses |~v | = c2 ist auf. Es gilt dann µ vx02 +vy02 +vz02 −c2 µ = = 1 1 − vvc2x ¶2 · 2 (vx − v) + (1 − β 2 )(vy2 + vz2 ) ¸ ³ vvx ´2 −c 1− 2 c 2 ¶2 · ¸ v 2 vx2 1 2 2 2 2 2 2 vx − 2vvx + v + (1 − β )(vy + vz ) − c + 2vvx − 2 1 − vvc2x c ¶ µ ¤ £ 2 1 (4.53) (vx + vy2 + vz2 )(1 − β 2 ) − c2 (1 − β 2 ) = 0 = vvx 1 − c2 also auch |~v 0 | hat den Betrag c; die Transformation ändert nur die Richtung der Geschwindigkeit. Als Beispiel betrachten wir die Aberration des Sternlichtes für einen Stern in einer Richtung senkrecht zur Erdbahn. Bezüglich der Sonne hat dessen Licht eine Geschwindigkeit ~v = −cêz . Bezüglich der Erde gilt p p vx0 = −v vy0 = 0 vz0 = vz 1 − β 2 = −c 1 − β 2 (4.54) tan α = vx0 β p = vz0 1 − β2 (4.55) Sternlicht k 0 ' Erde k ' Sonne z0 z £°£ Sternlicht £ £ £ ? £ £° £ £ £ £ £ £ £ Teleskop x0 x Weil die Umlaufgeschwindigkeit der Erde etwas 30 km/s beträgt, erhält man α ' β ' 10−4 , was etwa 20 Bogensekunden entspricht. Im Laufe des Jahres beschreibt ein Stern am Pol der Ellipsen am Himmel also einen Kreis mit Radius 20”. Eine zweite Anwendung ist der Fizeauscher Mitführungsversuch. Ein Lichtimpuls bewege sich in einer mit der Geschwindigkeit ±v parallel zum Licht strömenden Flüssigkeit. Bezüglich der Flüssigkeit ist die Geschwindigkeit 115 des Lichtimpulses bekanntlich u = sion). Im Laborsystem gilt also c n (Unter Vernachlässigung der Disper- µ ¶ ±v c 1 ±v 1− 2 u = v ' 1 ± cn n n 0 Der Faktor 1 − 1 n2 c n (v << c) (4.56) heißt Mitführungskoeffizient. Ströhmungsrohr ¡ ¡ ¡ v - @ @ @ ¡ ¡ ¡ Strahlteiler Quelle ¡ ¡ ¡ ¡ ¡ ¾ ¡ ¡ ¡ −v ¡ Det. In der skizzierten Versuchsanordnung würde man also einen Laufzeitunterschied ¶ ¸ µ · 1 1 1 n2 (4.57) − c ' 2lv 1 − 2 l c n c2 − v(1 − n−2 ) + (1 − n−2 ) n n erwarten, wie auch experimentell bestätigt wurde. 116 4.3 Vierervektoren und Tensoren; Relativistische Mechanik In diesem Abschnitt befassen wir uns mit dem Verhalten verschiedener physikalischer Größen unter Lorentztransformationen. Dies ist vor allem wichtig, wenn wir die Newtonsche Mechanik so abändern wollen, dass sie unter Lorentztransformationen, statt wie bisher unter Galileitransformationen invariant ist. Insbesondere werden wir versuchen, für die Beschreibung physikalischer Phänomene Größen mit möglichst einfachem Verhalten unter Lorentztransformationen auszuwählen. Das Beispiel der zu entwickelnden Theorie ist die Vektorrechnung und Vektoranalysis. Falls ein Naturgesetz in Vektorschreibweise formuliert ist, so ist seine Invarianz unter Drehungen des Bezugssystems unmittelbar evident (Allerdings muss natürlich verifiziert werden, dass Größen, die als Vektoren geschrieben werden, sich auch tatsächlich wie Vektoren unter Drehungen verhalten; das Einführen eines Formalismus beweist an und für sich keine Naturgesetze!). Ich möchte in diesem Zusammenhang zwei Aspekte der Vektorrechnung hervorheben: 1. Der Transformationscharakter sämtlicher Größen unter Drehungen (bis auf Skalare, die sich überhaupt nicht ändern) wird auf das Verhalten des Ortsvektors ~r reduziert: Ein Vektor ist ein Satz dreier Größen, die sich wie die Komponenten von ~r transformieren: fi0 = Dij fj falls gilt ri0 = Dij rj (4.58) ein Tensor zweiter Stufe verhält sich wie das dyadische Produkt (oder Tensorprodukt) eines Ortsvektors mit sich selbst Tij0 = Dik Djl Tkl (4.59) und so weiter für Tensoren höherer Stufe. 2. Es gibt ein unter Drehungen invariantes Skalarprodukt ~g = fi gi f~ (4.60) dessen Invarianz aus einer speziellen Symmetrieeigenschaften der Drehmatrizen erfolgt; die Gespiegelte ist gleich der Inversen: −1 −1 Dij = Dji ⇒ fi0 gi0 = Dij Dik fj gk = fj Dji Dik gk = fj gj . (4.61) Das Skalarprodukt kann verwendet werden, um aus Tensoren oder Paaren von Tensoren und/oder Vektoren Tensoren niedrigerer Stufe zu bilden; so ist die Spur Tii eines Tensors zweiter Stufe ein Skalar und das Skalarprodukt f~T = fi Tij ein Vektor. 117 In der Relativitätstheorie ist die Ausgangsgröße nicht der Ortsvektor, sondern der Vierervektor, der die Raum- und Zeitkoordinaten eines Ereignis festlegt. Wir wählen dafür die Notation xµ = (x0 , x1 , x2 , x3 ) := (ct, x, y, z). (4.62) (Die Gründe für die Hochstellung der Indizes werden später klar.) Unter Lorentztransformation verhält sich dieser Vierervektor wie x0µ = Λµν xν (4.63) wobei Λµν die konstruierte Matrix (Gl.4.38) der Lorentztransformation darstellt. Die invariante Länge s2 = c2 t2 − x2 − y 2 − z 2 (4.64) kann geschrieben werden als s2 = xµ gµν xν (4.65) 1 0 0 0 0 −1 0 0 g= 0 0 −1 0 0 0 0 −1 (4.66) wobei gµν die 4 × 4 Matrix darstellt. Die Invarianz dieses Ausdrucks folgt aus x0µ gµν x0ν = xµ Λκµ gκλ Λλν xν = xµ gµν xν , (4.67) λκµ gκλ Λλν = gµν (4.68) also wie man leicht durch ausschreiben der relevanten Komponenten von Λ leicht nachweist: µ ¶µ ¶µ ¶ cosh ψ − sinh ψ 1 0 cosh ψ − sinh ψ − sinh ψ cosh ψ 0 −1 − sinh ψ cosh ψ µ ¶µ ¶ cosh ψ − sinh ψ cosh ψ − sinh ψ = − sinh ψ cosh ψ sinh ψ − cosh ψ µ ¶ µ ¶ cosh2 ψ − sinh2 ψ 0 1 0 = = (4.69) 0 −1 0 sinh2 ψ − cosh2 ψ Ein zweites Beispiel einer skalaren Größe (neben der Länge eines Vierervektors oder des Skalarprodukts f µ gµν hν zweier Vierervektoren) ist die Phase 118 einer elektromagnetischen Welle. Die Aussage ”Die Welle hat in (ct, ~r) ein Maximum oder einen Knoten” sollte eine vom Bezugssystem unabhängige Bedeutung haben. Deshalb müsste der Ausdruck φ(~r, t) = ~k~r − ωt (4.70) der offensichtlich linear ist in den Komponenten xµ als das Skalarprodukt des Vierervektors xµ mit einem Wellenvierervektor k µ aufzufassen sein. Man prüft leich nach, dass gilt ω mit k = ( , kx , ky , kz ). c φ(~r, t) = −k µ gµν xν (4.71) Der Vierervektor k µ hat also als räumliche Komponenten die Komponenten des gewöhnlichen Wellenvektors ~k und als zeitliche Komponente den Betrag 2 von ~k. Die Viererlänge k µ gµν k ν = ωc2 − |~k 2 | erweist sich deshalb als Null. Das Verhalten der k µ unter Lorentztransformationen ist jetzt auch klar: die Komponenten k µ transformieren wie die xµ : k 0µ = Λµν k ν (4.72) also insbesondere v kx ω0 1 ω =p − pc 2 c 1−β c 1 − β2 kx0 kx − vω c2 =p 1 − β2 ky0 = ky kz0 = kz (4.73) Der erste Ausdruck beschreibt eine Änderung der Frequenz der Welle; für β << 1 erhält man den klassischen Ausdruck für den Dopplereffekt: ³ v|| ´ 0 ω =ω 1− (4.74) c Der volle Ausdruck erhält Korrekturen dazu; insbesondere tritt auch für rein transversale Geschwindigkeiten eine Frequenzverschiebung auf (transversaler Dopplereffekt). Die Transformationsregeln für die räumlichen Komponenten von k µ zeigen, dass neben der Längenänderung von ~k auch noch eine Drehung auftritt. Dies ist nichts anderes als die schon in Gl.4.53-4.55 begegnete Aberration. Ein weiteres Beispiel eines Vierervektors ist die Vierergeschwindigkeit, d.h. die Ableitung des Vektors xµ nach der Eigenzeit des bewegenden Teilchens (Die normale Geschwindigkeit hat, wie im vorhergehenden Abschnitt gezeigt, ein ziemlich kompliziertes Transformationsverhalten). Aus Gl4.43 folgt 1 d d =p dτ 1 − β 2 (τ ) dt 119 (4.75) Man erhält also für die Komponenten der Vierergeschwindigkeit uµ : 1 (u0 , u1 , u2 , u3 ) = p 1 − β 2 (τ ) (c, vx , vy , vz ). (4.76) Das invariante Längenquadrat dieses Vierervektors hat offensichtlich den universellen Wert uµ gµν uν = c2 . Nochmaliges Differenzieren von uµ nach der Eigenzeit liefert die Viererbeschleunigung d µ aµ = u . (4.77) dτ Es liegt also nahe, als relativistische Verallgemeinerung des zweiten Newtonschen Gesetzes zu postulieren m0 aµ = K µ , (4.78) wobei m0 eine invariante Masse ist und K µ ein Vierervektor, dessen räumliche Komponenten für niedrige Geschwindigkeiten (streng: im momentanen Ruhesystem des Teilchens) die vertraute Newtonsche Kraft liefern. Die Gl.4.78 wurde zuerst von Minkowski vorgeschlagen und die Größe K µ heißt deshalb Minkowski Kraft. Die räumlichen Komponenten von Gl.4.78 können mit Hilfe der soeben benutzen Beziehung zwischen t und τ umgeschrieben werden: ~ K d ~v p =p 1 − β 2 dt 1 − β 2 1 − β2 p mit m0 ~ := K p 1 − β 2 (Kx , Ky , Kz ). (4.79) (4.80) ~ hat im Ruhesystem des Teilchens und für nicht zu große BeschleDie Größe K unigungen die Eigenschaften der Newtonschen Kraft. Die nullte Komponente von K µ folgt aus der Bedingung, dass die Viererlänge von uµ den konstanten Wert c hat. Dies bedeutet also d µ (u gµν uν ) = 2K µ gµν uν = 0 dτ (4.81) ~v ~v K 0c K~ K~ 0 p p =⇒ K = = . 1 − β2 1 − β2 c 1 − β2 (4.82) ~ Im nichtrelativistischen Grenzfall reduziert sich K 0 auf die von der Kraft K erbrachte Arbeit; diese muss wegen der Energieerhaltung gleich der Zunahme 120 der kinetischen Energie des Teilchens sein, genauso wie die Kraft selber gleich der Änderung des Impulses des Teilchens sein muss. Die Minkowskische Bewegungsgleichung liefert also eine Zusammenfassung und zugleich eine relativistische Verallgemeinerung der Erhaltungssätze für Energie und Impuls: d m0 c2 ~ v. = K~ =p 2 dt 1−β d m0~v ~ p =K dt 1 − β 2 Die Identifikation von √m0 c 2 1−β 2 (4.83) mit der kinetischen Energie erfolgt durch Tay- lorentwicklung: 1 m c2 1 p 0 = m0 c2 (1 + β 2 + ...) = m0 c2 + m0 v 2 + ... 2 2 1 − β2 (4.84) Der Zusatzterm m0 c2 ist eine eher unbedeutende additive Konstante solange das Teilchen seine Identität nicht ändert. Bei chemischen Reaktionen und sonstigen Stoßprozessen sowie bei radioaktiven Zerfällen wird der Term aber wichtig. In der klassischen Mechanik ist bei Stößen die Summe der Teichenimpulse immer eine erhaltene Größe, die Summe der kinetischen Energien dagegen nur bei elastischen Stößen, in denen sich die innere Energie der Teilchen nicht ändert. In einer relativistischen Theorie ist ein solcher Unterschied aber nicht möglich: Die vier Komponenten des Viererimpulses 1 pµ = m0 uµ = p 1 − β2 (m0 c, m0~v ) (4.85) können durch Lorentztransformationen miteinander vermischt werden. Falls in einem Stoßprozess die Summe der räumlichen Komponenten der Viererimpulse der beteiligten Teilchen erhalten ist, so muss dies auch mit der Summe der zeitlichen Komponenten der Fall sein. Im nichtrelativistischen Grenzfall bedeutet dies, dass eine Änderung der gesamten kinetischen Energie durch eine Änderung des Massenterms ausgeglichen werden muss: X X ∆( m0i vi2 ) + ∆( m0i c2 ) = 0. (4.86) i i Einer Änderung der inneren Energie eines Teilchens entspricht also eine Änderung der Ruhemasse gemäß ∆Eint = (∆m0 )c2 . (4.87) Dies ist die berühmte Äquivalenz von Masse und Energie. Zum Schluss betrachten wir noch den Impulsvektor im momentanen Ruhesystem des Teilchens. Dort verschwinden seine räumlichen Komponenten; 121 der Vektor hat die Gestalt pµ = (m0 c, 0, 0, 0). (4.88) Für Teilchen mit der Ruhemasse m0 = 0 würde dies das Verschwinden des gesamten Ausdrucks bedeuten (im Ruhesystem und wegen der Linearität der Lorentztransformation deshalb in jedem System). Es gibt aber einen Ausweg: Für ein Teilchen mit einer Geschwindigkeit vom Betrag c ist eine Transformation in das Ruhesystem nicht möchlich: Teilchen mit Ruhemasse Null haben immer |~v | = c. Andererseits können Teilchen mit endlicher Ruhemasse die Lichtgeschwindigkeit nie erreichen: Die Teilchenenergie m0 c2 E=p 1 − β2 (4.89) divergiert offensichtlich für β → 1. Die Aufnahme einer endlichen Menge Energie kann also nie ein Teilchen auf Lichtgeschwindigkeit bringen (geschweige denn auf Überlichtgeschwindigkeit) Kovariante und Kontravariante Vektoren. Die in Gl.4.70 diskutierte Phase ist ein Beispiel eines skalaren Feldes; d.h. einer Größe, die für jeden Punkt des Raum - Zeit Kontinuums einen skalaren Wert annimmt. In der normalen Vektorananlysis erhält man aus einem skalaren Feld ein Vektorfeld durch Bildung des Gradienten. Der Vierergradient ∂φ ∂µ φ := = gµν k ν (4.90) ∂xµ ist aber offensichtlich kein Vierervektor vom soeben betrachteten Typ; es gilt vielmehr ∂µ0 φ = gµν Λνλ k λ = (Λ−1 )νµ gνλ k λ = (Λ−1 )νµ ∂ν φ (4.91) Dabei ist Λνµ die Matrix der Lorentztransformation, die in unserer jetzigen Notation die Gestalt γ −γβ 0 0 cosh ψ − sinh ψ 0 0 −γβ γ 0 0 = − sinh ψ cosh ψ 0 0 Λ= (4.92) 0 0 1 0 0 0 1 0 0 0 0 1 0 0 0 1 hat. Die in Gl.4.91 benützte Identität gµν Λνλ = (Λ−1 )νµ gνλ erhält man aus dem schon bekannten (4.93) Λκµ gκλ Λλν = gµν 122 durch Matrixmultiplikation von links mit (Λ−1 )µρ . Die Transformationseigenschaft (4.91) kann auch direkt aus der Definition des Vierergradienten hergeleitet werden. Aus der Definition der Lorentztransformation x0µ = Λµν xν (4.94) ∂x0µ ∂xν (4.95) folgt sofort Λµν = und für die inverse Transformation (Λ−1 )µν = ∂xµ . ∂x0ν (4.96) Auswertung von ∂µ0 φ über die Kettenregel ergibt jetzt ∂µ0 φ = ∂φ ∂xν ∂φ = = (Λ−1 )νµ ∂ν φ. ∂x0µ ∂xν ∂x0µ (4.97) Wir haben also offensichtlich zwei Arten von Vektoren: solche die mit Λµν transformieren und solche, die mit (Λ−1 )µν transformieren. Vekoren vom ersten Typ (d.h. der Sorte xµ ) heißen kontravariant und werden mit hochgestelltem Index geschrieben; Vektoren vom zweiten Typ (d.h. der Sorte ∂µ φ) heißen kovariant und werden mit niedergestelltem Index geschrieben. Aus einem kontravarianten Vektor k µ kann man den dazugehörigen kovarianten Vektor kµ durch Matrixmultiplikation mit gµν bilden: kµ = gµν k ν . Weil gµν sein eigenes Inverses ist gilt auch k µ = g µν kν (4.98) wobei g µν vorläufig als eine alternative Schreibweise für gµν aufzufassen ist. Tensoren Analog zum gewöhnlichen Vektorformalismus definiert man einen Tensor nter Stufe als ein in einem gewissen Bezugssystem definiertes Gebilde mit 4n Komponenten, die unter Lorentztransformationen wie das direkte Produkt (auch Tensorprodukt oder dyadisches Produkt genannt) von n Vektoren transformieren. Weil es zwei Arten von Vektoren gibt, gibt es (2n + 1) Typen von Tensoren n-ter Stufe. Wir werden uns im Folgenden vorwiegend mit Tensoren zweiter Stufe befassen. Es gibt davon 3 Typen: 1. Kontravariante Tensoren T µν , die transformieren wie k µ hν 2. Kovariante Tensoren Tµν , die transformieren wie kµ hν 123 3. Gemischte Tensoren T µ ν , die transformieren wie k µ hν oder Tµ ν , die transformieren wie kµ hν T 0µν = Λµκ Λνλ T κλ T 0µ ν = Λµκ (Λ−1 )λν T κ 0 Tµν = (Λ−1 )κµ (Λ−1 )νλ Tκλ Tµ0 λ ν = (Λ−1 )κµ Λνλ Tκ (4.99) λ (4.100) Die Spur Tµµ eines gemischten Tensors transformiert offensichtlich wie ein Skalar, wie aus der obigen Formel sofort einsichtlich ist: Λµκ (Λ−1 )λµ = δκλ (4.101) Bemerkung 1: Die Transformationsmatrizen Λµν sind trotz ihrer Erscheinung keine Tensoren, weil sie nicht in einem bestimmten System definiert sind, sondern Größen in verschiedenen Bezugssystemen miteinander verknüpfen! (Genauso sind Drehmatrizen in der Vektorrechnung keine Tensoren.) Bemerkung 2: Der metrische Tensor gµν ist sehr wohl ein richtiger Tensor, jedoch einer der in jedem Bezugssystem denselben Wert hat. Die schon einige Male benutzte Beziehung Λκµ Λλν gκλ = gµν entspricht genau dem Transformationsverhalten eines kovarianten Tensors. Weil (Λ−1 genauso wie Λ eine Lorentztransformation ist (nur mit dem anderen Vorzeichen von v) gilt genauso (Λ−1 )µκ (Λ1 )νλ g κλ = g µν (4.102) also die Matrix g (die Diagonalmatrix mit Elementen 1,-1,-1,-1) ist auch als kontravarianter Tensor aufzufassen. Skalare Multiplikation, Verjüngung Weil der metrische Tensor gµν (oder g µν ) einen kontravarianten Vektor in seinen kovarianten Zwilling umwandelt (oder umgekehrt), kann man das Skalarprodukt zweier kontravarianter Vektroren auch schreiben als (f, h) := f µ gµν hν = f µ hν = fµ hν . (4.103) Die Summation über einen Index, der einmal als oberer und einmal als unterer Index vorkommt, ergibt also in diesem Fall (wie bei der Spurbildung eines gemischten Tensors) einen Skalar. Dies ist auch aus den Transformationseigenschaften ersichtlich: mit dem oberen Index ist eine Λ- Matrix assoziiert, mit dem unteren eine Λ−1 - Matrix und mit der Summe das Matrixprodukt dieser beiden, also die Einheitsmatrix. Allgemein bildet man aus einem gemischten Tensor (m + 2)-ter Stufe einen Tensor m-ter Stufe durch Summation über einen Index, der einmal als oberer und einmal als unterer Index vorkommt. Dieser Prozess heißt Verjüngung oder Kontraktion. 124 Die Summation über eine Zahl, die zweimal als oberer oder zweimal als unterer Index vorkommt, liefert hingegen keine Größe mit vernünftigem Transformationscharakter. Einschränkung der Einsteinkonvention: Wir werden deshalb ab jetzt (Nachprüfung des Skriptums erweist: eigentlich schon ab Anfang dieses Abschnittes) die Einsteinsche Konvention nur gelten lassen für Indizes, die einmal als oberer und einmal als unterer Index vorkommen. Schlussbemerkung: Die drei Gestalten des metrischen Tensors. Man prüft leicht nach: g µκ g νλ gλκ = g µν ; g µκ gκν = δνµ (die 4-dimensionale Einheitsmatrix). Die Einheitsmatrix bildet also mit g µν und gµν einen Tensor - Drilling. 125 4.4 Relativistische Elektrodynamik Die spezielle Relativitätstheorie wurde eingeführt, um eine Rahmentheorie zu schaffen, innerhalb derer sowohl das Relativitätsprinzip als auch die Maxwellgleichungen streng gültig sein können. Allerdings haben wir dies bis jetzt nur für einen Aspekt der Maxwellgleichungen, die Konstanz der Lichtgeschwindigkeit, auch wirklich nachgewiesen. In diesem Abschnitt werden wir die Invarianz der vollständigen Maxwellgleichungen nachweisen. Dabei werden wir zugleich auch die elektromagnetischen Größen in Vierervektoren und Vierertensoren ausdrücken, damit ihr Transformationsverhalten einfach zu ermitteln ist. Als Ausgangspunkt betrachten wir die Quellen des elektromagnetischen Feldes, die Ladungen und Ströme. Wir schlagen vor, diese zu einem Viererstrom 2 J µ = (cρ, jx , jy , jz ) (4.104) zusammenfassen. Dessen Viererdivergenz ∂ρ + ∇~j ∂t ∂µ J µ = (4.105) verschwindet wegen der Kontinuitätsgleichung. Für eine Vektordichte mit verschwindender Viererdivergenz ist das Integral über den Raum nicht nur in der Zeit erhalten, sondern auch ein Lorentzskalar. v = −v1 + v2 t0 = t0 © © H HH ©© AAU © © HH j 6 ©© v2 H t=0 © HH ¢ ¢ ¢ 6 ¢ ¢ © v1 ¢® ©© © ©© ©© AAU Um dies zu zeigen, verwenden wir den 4-dimensionalen Gaußschen Satz: Z Z µ 4 ∂µ A d x = Aµ d3 Sµ (4.106) V S und wählen für V ein Volumen begrenzt durch die Hyperebenen t = 0 (im Laborsystem) und t = t00 (in irgendeinem Inertialsystem) und eine räumliche 2 Eigentlich ist j µ (x) kein Vierervektor, sondern eine sogenannte Vektordichte; der Unterschied ist aber für unsere Zwecke unwichtig. 126 Begrenzung außerhalb des Gebietes wo J µ (x) von Null verschiedene Werte annimmt. Die Normalen auf die Hyperebenen zeigen entlang den jeweiligen Zeitrichtungen; falls Aµ wie ein Vierervektor transformiert gilt also Z Z 0 3 (4.107) A (0, ~r)c ~r = A00 (t00 , ~r0 )d3~r0 d.h. das Raumintegral von A0 (t, ~r) ist nicht nur unabhängig von t0 , sondern auch vom Bezugssystem. Als Nächstes betrachten wir die Potentialgleichungen (in Lorentzeichung) ~=− ¤A 4π ~ j c ¤φ = −4πρ (4.108) Der Operator ¤ ist ein skalarer Operator: 1 ∂2 ¤ = ∇ − 2 2 = −∂µ g µν ∂ν = −∂µ ∂ µ c ∂t 2 (4.109) ~ einführen, wofür gilt Wir können also einen Vierervektor φν = (φ, A) ∂µ ∂ µ φ ν = 4π ν J c (4.110) Das Viererpotential erfüllt zusätzlich die Nebenbedingung ~+ ∇A 1 ∂φ =0 c ∂t oder ∂µ φµ = 0 (4.111) Diese zwei Ausdrücke fassen die gesamten Maxwellgleichungen zusammen in einer offensichtlich Lorentz - invarianten Form. ~ wird aus A ~ und φ abgeleitet über Das elektrische Feld E ~ ~ = − 1 ∂ A − ∇φ E c ∂t (4.112) ∂φi ∂φ0 − = −(∂0 φi + ∂i φ0 ) = −(∂ 0 φi − ∂ i φ0 ) ∂x0 ∂xi (4.113) also Ei = − wobei wir bei der letzten Umformung die Indizes der Differentialoperatoren ~ erhält man mittels g µν angehoben haben. Für die Komponenten von B ähnliche Ausdrücke; so gilt für die Komponente Bx : ~ x = ∂y Az − ∂z Ay = ∂2 φ3 − ∂3 φ2 = −(∂ 2 φ3 − ∂ 3 φ2 ). (4.114) Bx = (∇ × A) 127 Die elektrischen und magnetischen Felder kann man also zusammenfassen in einem antisymmetrischen kontravarianten Tensor zweiter Stufe 0 −Ex −Ey −Ez Ex 0 −Bz By F µν = ∂µφν − ∂ ν φµ = (4.115) Ey Bz 0 −Bx Ez −By Bx 0 ~ und B ~ sofort abgelesen Jetzt können die Transformationseigenschaften von E werden. Sie folgen aus F 0µν = Λµκ Λνλ F κλ (4.116) also für die einzelnen Komponenten (nach einigem Rechnen) Ex0 = Ex Bx0 = Bx Ey0 = γ(Ey − βBz ) By0 = γ(By + βEz ) Ez0 = γ(Ez + βBy ) Bz0 = γ(Bz − βEy ) (4.117) (4.118) (4.119) (4.120) ~ → B; ~ An diesen Formeln sieht man, dass man nach der Substitution E ~ ~ ~ ~ also B → −E eine gleichartige Struktur erreicht; man kann aus E und B einen zweiten kontravarianten Tensor bilden, den dualen Tensor 0 −Bx −By −Bz Bx 0 Ez −Ey (4.121) F̃ µν = By −Ez 0 Ex Bz Ey −Ex 0 Mit Hilfe von F µν und F̃ µν lassen sich auch die Maxwellgleichungen sehr kompakt schreiben. Der Ausdruck ( ~ = 4πρ 4π ∇E (ν = 0) ∂µ F µν = J ν =⇒ (4.122) ~ ~ − 1 ∂ E = 4π ~j c ∇×B (ν = 1, 2, 3) c ∂t c ( ∂µ F̃ µν = 0 =⇒ ~ =0 ∇B ~+ ∇×E ~ 1 ∂B c ∂t (ν = 0) =0 (= 1, 2, 3) (4.123) Weiters liest man aus Gl.4.119 die Existenz zweier Lorentz - Skalare ab: ~2 − B ~ 2 = 1 F µν Fνµ E 2 (4.124) ~B ~ = 1 F µν F̃νµ E 4 (4.125) 128 Zum Schluss dieses Abschnittes betrachten wir noch die Lorentzkraft ~ = e(E ~ + ~v × B). ~ In diesem Abschnitt erkennt man die räumlichen KompoK c nenten des Skalarprodukts zwischen F µν und der kovaranten Teilchengeschwindigkeit uµ = γ(c, −~v ). (4.126) Der Faktor γ, der zuerst zuviel erscheint, entfällt, falls wir zur zugehörigen Minkowski - Kraft übergehen e K µ = F µν uν c (4.127) Die Nullkomponente ergibt erwartungsgemäß K0 = γ ~ eE~v c (4.128) also bis auf den Faktor γ die vom Feld geleistete Arbeit, wie in Gl.4.82 Das Magnetfeld liefert bekanntlich zur geleisteten Arbeit keinen Beitrag. 129 4.5 Die Lorentzgruppe Bisher haben wir uns nur mit Lorentztransformationen beschäftigt, für die die Relativgeschwindigkeit der beiden Systeme entlang der x-Achse liegt. Solange nur zwei Systeme im Spiel sind, ist dies selbstverständlich erlaubt. Falls wir aber z.B. die momentanen Ruhesysteme für ein Teilchen diskutieren wollen, das sich entlang einer gekrümmten Bahn bewegt, so reicht diese einfache Beschreibung nicht mehr aus. Als Erstes werden wir daher die Lorentztransformation für eine willkürliche Richtung von ~v bestimmen. Die Verallgemeinerung von ct0 = γ(ct − βx) x0 = γ(x − βct) y0 = y z0 = z (4.129) lautet in Dreiervektornotation (x0 , ~x) ~ x) x00 = γ(x0 − β~ ~x0 = ~x + (γ + 1) ~ xβ) ~ β(~ ~ 0 − γ βx 2 β (4.130) (Der zweite Term in ~x0 enthält die Projektion von ~x auf den Geschwindigkeitsvektor β~ = ~vc ; der Term verschwindet also für die Komponenten von ~x0 senkrecht ~ xβ) ~ zu β~ und gibt (γ − 1)x|| für die Komponente x|| = β(~ ). Die Matrix für die β2 durch 4.130 vermittelte Transformation ist γ −γβ1 −γβ2 −β3 γ−1 −γβ 1 + γ−1 β 2 γ−1 β β ββ 1 β2 1 β2 1 2 β2 1 3 ~ Λ(β) = (4.131) γ−1 γ−1 2 γ−1 ββ 1 + β 2 β2 ββ −γβ2 β2 1 2 β2 2 3 γ−1 −γβ3 γ−1 ββ ββ 1 + γ−1 β2 β2 1 3 β2 2 3 β2 3 Die so erhaltene Matrix ist für jeden Vektor β~ symmetrisch. Weiters ist die ~ invariant, wie man z.B. durch invariante Länge s2 = x20 − |~x|2 unter Λ(β) direkte Substitution beweisen kann. Ein eleganterer Beweis erfolt, falls man in Gl.4.131 in der Form ~ = I − βγK + (γ − 1)K 2 = (I − K 2 ) − sinh ψK + cosh ψK 2 (4.132) Λ(β) β̂ β̂ β̂ β̂ β̂ schreibt, mit der bekannten Parametrisierung βγ = sinh ψ, γ = cosh ψ, und 2 β 0 0 0 0 −β1 −β2 −β3 1 0 0 β12 β1 β2 β1 β3 −β1 0 ; K2 = 1 0 Kβ̂ = 0 0 β̂ β 2 0 β1 β2 β22 β2 β3 |β| −β2 0 0 β1 β3 β2 β3 β32 −β3 0 0 0 (4.133) 130 Man sieht leicht, dass gilt Kβ̂3 = Kβ̂ ; alle höheren geraden Potenzen sind gleich Kβ̂2 , alle ungeraden Potenzen sind gleich Kβ̂ . Der obige Ausdruck für ~ geht also nach Substitution der Potenzreihen für sinh ψ und cosh ψ in Λ(β) die Potenzreihen für die Marixfunktion exp(−ψKβ̂ ) über: Λ(β) = e−ψKβ̂ (4.134) d ~ ~ = Λ(β)(−K ~ ~ Λ(β)gΛ( β) β̂ g − gKβ̂ )Λ(β) = 0 dψ (4.135) und man sieht sofort wegen des Verschwindens des Ausdrucks in eckigen Klammern. Weil Λ(0) = 0 ist also Λ̃gΛ gleich g und damit auch s02 = xΛ̃gΛx = xgx = s2 (4.136) wobei x für den Vierervektor (x0 , ~x) steht. Die Lorentztranformationen sind allerdings nicht die allgemeinsten linearen Transformationen unter denen s2 invariant ist. Ein weiteres Beispiel sind die räumlichen Drehungen; diese lassen x02 und ~x2 einzeln invariant, also auch deren Differenz. Für eine räumliche Drehung kann man die Parametrisierung Dω~ = e−ωSω̂ einführen mit 0 0 0 0 1 0 0 −ω3 ω2 ; Sω̂ = 0 −ω1 ω 0 ω3 0 −ω2 ω1 0 0 0 0 0 2 2 1 0 ω1 − ω ω1 ω2 ω1 ω3 Sω̂2 = 2 2 2 0 ω1 ω2 ω2 − ω ω2 ω3 ω 0 ω1 ω3 ω2 ω3 ω32 − ω 2 (4.137) (4.138) und, wie man relativ leicht sieht, Sω̂3 = −Sω̂ (4.139) Dω̂ = I − Sω̂2 − sin ωSω̂ − cos ωSω̂ . (4.140) also Man erkennt auch die bekannte Eigenschaft der Drehmatrizen −1 D−ω = D̃ω~ ~ := (Dω ~) 131 (4.141) in diesen Ausdrücken leicht wieder. Wir suchen jetzt die allgemeinste reelle Transformation, die s2 invariant lässt und stetig mit der Identität verbunden werden kann. Die Matrix ist also Element einer stetigen Klasse invertierbarer Matrizen A(λ) mit A(0) = I. Weil eine invertierbare Matrix keine Eigenwerte Null haben darf, sind die Eigenwerte von A(λ) für alle Werte von λ ungleich Null; weil sie für λ → 0 nach Eins gehen müssen, sind sie daher alle positiv und A lässt sich schreiben als A = eL . (4.142) Jetzt muss gelten ÃgA = g, also Ãg = gA−1 . Wegen g 2 = 1 muss auch gelten g Ãg = A−1 = e−L Andererseits gilt egL̃g = 1 + g L̃g + 12 g L̃2 g + ... = g Ãg Die Matrizen gLg und −L müssen deshalb identisch sein. Ausarbeiten dieser Bedingungen ergibt, dass L die Gestalt 0 L01 L02 L03 L01 0 L12 L13 L= (4.143) L02 −L12 0 L23 L03 −L13 −L23 0 haben muss. L ist also die Summe einer infinitesimalen Lorentztransformation vom Typ Kβ̂ und einer infinitesimalen Drehung vom Typ Sω̂ . Weiters gilt Sp(L) = 0, also det A = eSp(L) = 1. (4.144) Um die allgemeinste Matrix A zu finden, die s2 invariant lässt müssen wir noch zulassen, dass die hier gefundenen Matrizen noch mit denen der Raumspiegelung 1 0 0 0 0 −1 0 0 Π~x = (4.145) 0 0 −1 0 0 0 0 −1 oder der Zeitspiegelung −1 0 Π0 = 0 0 0 1 0 0 0 0 1 0 0 0 0 1 (4.146) multipliziert werden dürfen oder auch mit beiden oder keiner der beiden. Spin-Bahn Kopplung und Thomaspräzession 132 Als Anwendung des in den letzten zwei Abschnitten behandelten Formalismus betrachten wir einen relativistischen Effekt aus der Atomphysik, die Spin-Bahn Kopplung. Nach Uhlenbeck und Goudsmit (1926) besitzt das Elektron einen intrinsischen Drehimpuls ~s und damit ein assoziertes magnetisches Moment ge ~µ = ~s (4.147) 2mc wobei g bis auf winzige Korrekturen den Wert g = 2 hat. In einem Magnet~ 0 empfindet ein magnetisches Moment bekanntlich ein Drehmoment feld B ~ = ~µ × B ~ 0. N (4.148) Das assozierte Potential beträgt ~ 0. U = −~µB (4.149) ~ 0 durch das Magnetfeld im RuhIn der Relativitätstheorie soll allerdings B esystems des Elektrons ersetzt werden. Weil im Atom auch ein elektrisches ~ herrscht, erhalten wir also nach Anwendung der TransformationsFeld E ~ formeln (Gl.4.121) (in niedrigster Ordnung in β) ~ 0 = ~µ × (B ~ 0 − ~v × E) ~ N c ~ 0 − ~v × E). ~ U 0 = −~µ(B c (4.150) ~ von einem zentralsymmetrischen elektrostatischen Potential hergeleitet Weil E ge~s werden kann, gilt (mit ~µ = 2mc ) ~ = − 1 ~r dV =⇒ U 0 = ge ~sB ~ + g (~sL) ~ 1 dV E 2 2 e r dr 2mc 2m c r dr (4.151) ~ = m~v × ~r der Bahndrehimpuls des Elektrons ist. Der Effekt kann wobei L tatsächlich gemessen werden; man findet dann allerdings nur etwa die Hälfte ~ des Terms mit ~sL. Dieser Effekt wurde von Thomas erklärt. Er machte darauf aufmerksam, dass das Elektron im Laufe seiner Umdrehung des Kerns dauernd senkrecht zu seiner Geschwindigkeit beschleunigt wird. Um ein Ruhesystem des Elektrons zu bleiben müssen also dauernd Lorentztransformationen um zueinander senkrechte Achsen ausgeführt werden. Das Produkt zweier solcher Transformationen ist aber selbst keine reine Lorentztransformation mehr, sondern das Produkt einer Lorentztransformation und einer Rotation. Falls wir für t = 0 die Geschwindigkeit entlang der x-Achse und die Beschleunigung entlang der y-Achse wählen, so erhalten wir für den Zusammenhang zwischen 133 x0 (im Ruhesystem für t = 0) und x im Laborsystem: γ −βγ 0 0 −βγ γ 0 0 x x0 = 0 0 1 0 0 0 0 1 (4.152) (bis zu linearen und für x00 im Ruhesystem zu Zeit t + ∆τ mit ∆β = a∆t c Termen in ∆β) γ −βγ −∆βγ 0 γ−1 −βγ γ ∆β 0 β x x00 = (4.153) γ−1 −∆βγ ∆β 1 0 β 0 0 0 1 Elimination von x liefert: 1 0 −γ∆β 0 γ−1 0 1 ∆β 0 β x0 x00 = −γ∆β − γ−1 ∆β 1 0 β 0 0 0 1 (4.154) d.h. eine infinitesimale Lorentztransformation über ∆βêy und eine Drehung um γ−1 βγ 2 a βaêz ∆Ω = − ∆βêz = − êz dt ' − dt (4.155) β 1+γ c 2c 2 wobei wir β 2 = γ γ−1 benutzt haben und nur die niedrigste Ordnung in 2 β beibehalten haben. Das Ruhesystem des Elektrons rotiert also mit der Winkelgeschwindigkeit ω ~T = − βaêz ~v × ~r 1 dV 1 ~ 1 dV =− = − 2 2L 2 2c 2emc r dr 2m c r dr (4.156) Diese Rotation heißt Thomaspräzession. Um im momentanen Ruhesystem des Elektrons zu bleiben müssen wir also nicht nur die Richtung des Geschwindigkeit andauernd justieren, sondern auch noch die Thomaspräzission mitmachen. Auch die Präzission des Spins erhält man dadurch einen Zusatzterm: µ ¶ ge ~ ~v ds ~ + ~s × ω (B − × E) ~T (4.157) = ~s × dt Lab 2mc c und für die Wechselwirkungsenergie erhält man letztendlich U 00 = ge ~ g ~ 1 dV + ~s~ωT ~sB + (~sL) 2 2 2mc 2m c r dr 134 (4.158) oder durch Einsetzen von Gl.4.156 U 00 = ge ~ g − 1 ~ 1 dV ~sB + (~sL) , 2mc 2m2 c2 r dt (4.159) womit die Halbierung des Spin-Bahn Kopplungsterms erklärt ist. Der Präzissionseffekt tritt nicht nur für elektrisch geladene Teilchen auf; auch ein Gyroskop in einer Erdumlaufbahn müsste den Effekt zeigen. Zur Berechnung braucht man aber die relativistische Verallgemeinerung der Newtonschon Gravitationsgesetze, d.h. die allgemeine Relativitätstheorie. Das Experiment ist technisch schwierig und könnte den Verzögerungen im amerikanischen Raumfahrtsprogramm zum Opfer fallen. Die Thomaspräzession wurde zuerst richtig beschrieben durch relativistische quantenmechanische Theorie des Elektrons (Diracgleichung). Die oben skizzierte klassische Erklärung durch Thomas erfolgte erst nacher. 135