T7 Spezielle Relativitätstheorie Die Maxwellschen Gleichungen beschreiben alle elektromagnetischen Phänomene, vom Coulombfeld einer Ladung bis zur Ausbreitung von Röntgenstrahlen, von der Dipolantenne bis zur Erzeugung von Synchrotonstrahlung. Sie sind also sicher richtig. Eine Frage haben wir aber bisher sorgfältig umgangen: In welchem Bezugssystem gelten die Maxwellschen Gleichungen? Diese Frage ist nicht trivial! Nach unserer bisherigen Kenntnis gilt Galilei’s Relativitätsprinzip: In gleichförmig gegeneinander bewegten Laboren läuft die Mechanik in gleicher Weise ab. Als Transformation zwischen den jeweiligen Bezugssystemen kennen wir die Galilei Transformation ~ t, ~r = ~r ′ + V ~ ~r˙ = ~r˙ ′ + V (T7.1) (Mechanik, T3.3). Damit müsste sich beim Übergang von einem Labor zum anderen auch die Lichtgeschwindigkeit ändern, die ja in den Maxwellgleichungen auftaucht. Es ist noch viel schlimmer. In den Maxwellgleichungen taucht nur c2 auf. Sie sind also von der Raum~ eine Vorzugsrichtung richtung unabhängig. Die Galilei Transformation führt aber über V ein. Wäre die Elektrodynamik also in allgemeinen Inertialsystemen richtungsabhängig? Und wieso leben wir in einem ausgezeichneten Bezugssystem, in dem man das nicht merkt? Um diesen Fragen nachzugehen, wollen wir uns zunächst genauer mit der Ausbreitung von mechanischen Wellen und den hierfür relevanten Bezugssystemen auseinander setzen. T7.1 Mechanische Wellen: Doppler Effekt Betrachten wir als Beispiel Schallwellen. In Gasen oder Flüssigkeiten sind dies Oszillationen der Massendichte, die sich mit der Schallgeschwindigkeit ca ausbreiten (a für ’akustisch’). Ebene Schallwellen δ ρm (~r, t) = δ ρm,0 cos (~k · ~r − ωt) , 2 π ca . ω = ca | ~k | = λ (T7.2) ca ist die Phasengeschwindigkeit der ebenen Wellen. Diese Beschreibung gilt aber nur in einem ausgezeichneten Bezugssystem, in dem das die Welle tragende Medium als Ganzes ruht. In einem Experiment gibt es noch zwei weitere relevante Bezugssysteme: Das System des Senders und das des Empfängers. Wenn Sender und Empfänger im Medium ruhen, ist die Beschreibung des Experiments sehr einfach. Der Sender schwingt mit Frequenz ωS , regt damit das Medium zu einer Schwingung mit Frequenz ω = ωS an, diese Welle wandert die Distanz L bis zum Empfänger in der Zeit δt = L/ca und regt den Empfänger zu Schwingungen mit Frequenz ωE = ω = ωS an. Was passiert, wenn sich der Sender gegen das Medium bewegt? Um die Diskussion einfach zu halten, wollen wir annehmen, dass die Welle in ~e1 -Richtung läuft: ~k = k ~e1 T7 - 1 und der Sender eine Geschwindigkeit ~vS = vS ~e1 , vS < ca (T7.3) hat. Es bewegt sich also entweder in Richtung oder gegen die Richtung der Welle. Beachten Sie: vS ist die Geschwindigkeit des Senders relativ zum Medium! Die Bedingung vS < ca ist notwendig, um singuläre ’Schockwellen’ (Überschallknall) auszuschließen. Nehmen wir nun an, zur Zeit t = 0 sei die Amplitude der Welle am Sender gerade maximal. Das nächste Maximum wird sie nach einer Periode des Senders erreichen, also zur Zeit t1 = 2π . ωS In dieser Zeit ist aber das erste Maximum die Strecke ~e1 δ x = ca t1 ~e1 = 2 π ca ~e1 ωS zurückgelegt, und der Sender ist ~e1 δ xS = vS t1 ~e1 = 2 π vS ~e1 ωS weitergewandert. Der Abstand zwischen den beiden Maxima und damit die Wellenlänge ist also λ = δ x − δ xS = Mit ω= 2π (ca − vS ) . ωS 2 π ca λ folgt für die Frequenz der Welle: ω = ωS ca . ca − vS (T7.4) Für einen im Medium ruhenden Empfänger ist die empfangene Frequenz ωE = ω höher als ωS , falls sich der Sender auf ihn zu bewegt, andernfalls ist sie niedriger. Das ist für diese einfache Geometrie der Dopplereffekt. Jeder, an dem einmal ein Krankenwagen im Einsatz vorbeigefahren ist, kennt das. Ganz entsprechendes gilt, wenn sich der Empfänger mit Geschwindigkeit ~vE = vE ~e1 , vE < ca gegen das Medium bewegt. Er empfängt zwei aufeinander folgende Maxima im zeitlichen Abstand δ t ca δ t = λ + vE δ t y δt = λ . ca − vE T7 - 2 Die Anregungsfrequenz ist damit ωE = ca − vE 2π = ω. δt ca (T7.5) Diese Ergebnisse lassen sich mit ein wenig Geometrie leicht auf beliebige Bewegungsrichtungen von Sender und Empfänger verallgemeinern. Die ganze Diskussion ist natürlich völlig verträglich mit Galilei Invarianz. Eine Galilei Transformation bedeutet ja, dass wir das ganze ~ bewegen. Das ändert die relativen GeschwinSystem: Medium, Sender, Empfänger mit V digkeiten ~vS , ~vE nicht. Betrachten wir jetzt noch den Fall, dass sich Sender und Empfänger mit gleicher Geschwindigkeit vS ~e1 = vE ~e1 = v ~e1 gegen das Medium bewegen. Ihr konstanter Abstandsvektor sei ~rSE = L ~e1 . Wegen Galilei Invarianz ist dies gleichbedeutend mit einer Bewegung − v ~e1 des Mediums, in dem Bezugssystem, in dem Sender und Empfänger ruhen, d.h. wir haben (in Luft) konstanten Wind. Zunächst folgt durch Kombination von Gl. (T7.4), (T7.5) ωE = ca − v ca ca − v ω= ωS = ωS . ca ca ca − v (T7.6) Der Empfänger registriert die Frequenz des Senders! Die Stimme Ihres Freundes klingt auch bei Wind nicht anders als bei Windstille. Wie lange benötigt ein Signal vom Sender zum Empfänger? In der Zeit δ t legt das Signal die Strecke ca δ t zurück und der Empfänger ist v δ t weitergewandert. Also gilt ca δ t = L + v δ t δt = L . ca − v Interpretieren wir nun dies als die Messung einer Geschwindigkeit c(v) = L , δt (T7.7) so folgt c(v) = ca − v . (T7.8) Dies sieht aus wie eine Galilei Transformation, ist es aber nicht!! Wir haben nur Sender und Empfänger, nicht aber dem Gesamtsystem die Geschwindigkeit v gegeben! Dies eröffnet nun die Möglichkeit, sowohl die Schallgeschwindigkeit ca als auch die Windgeschwindigkeit vW = − v akustisch zu messen. Wir benötigen nur zwei Sender und zwei Empfänger, wie hier dargestellt T7 - 3 Die Messung mit S1 , E1 ergibt c1 (vW ) = ca + vW , (T7.9) c2 (vW ) = ca − vW , (T7.10) die Messung mit S2 , E2 ergibt und damit haben wir sowohl ca als auch v. Die ebene Welle (T7.2) δ ρm (~r, t) = δ ρm,0 cos (~k · ~r − ωt) , ω = ca | ~k | . ist eine Lösung der Wellengleichung 1 ∂2 − ∆ δ ρm (~r, t) = 0 . c2a ∂t2 Diese Beschreibung gilt aber nur in einem Bezugssysem K, in dem das Trägermedium ruht! Gehen wir mit der Galilei-Transformation ~t ~r = ~r ′ + V zu einem System K ′ über, so erhält die ebene Welle die Form ~ − ω)t , δ ρ ′m (~r ′ , t) = δ ρm,0 cos ~k · ~r ′ + (~k · V und die Wellengleichung hat in K ′ die kompliziertere Form 2 2 ∂ 1 ∂ ~ ~ − 2V · ∆ + V · ∆ − ∆ δρ ′m (~r ′ , t) = 0 . c2a ∂t2 ∂t Die Wellengleichung ist also unter Galilei-Transformation nicht forminvariant. T7 - 4 T7.2 Ätherhypothese, Lichtgeschwindigkeit und Einstein’s Relativitätsprinzip Jetzt wenden wir uns den elektromagnetischen Wellen zu. Aufgrund unserer Erfahrung mit mechanischen Wellen liegt es nahe, anzunehmen, dass auch die elektromagnetischen Wellen Schwingungen irgend eines Mediums sind. Da sie aber auch durch Vakuum gehen - sonst würden wir weder Sonnenstrahlung empfangen noch Sterne sehen, es gäbe kein Leben - kann dieses Medium nichts uns bekanntes materielles sein. Man nennt es Äther. Dieser Äther hat keinen Einfluss auf die Bewegung von Materie, der sich ja als eine Art Reibung äußern müsste. Deshalb kann der Äther keine träge Masse haben. Da wir ihn nicht abpumpen können - einen Wecker unter einer leergepumpten Glasglocke hören Sie nicht, aber sie sehen ihn - können wir ihn auch nicht wiegen. Er ist ausschließlich Träger der elektromagnetischen Wellen, ohne irgendwelche sonstigen Einflüsse auf Materie. Und er hat noch mehr seltsame Eigenschaften. Die elektromagnetischen Wellen sind transversal polarisiert. Transversale mechanische Wellen gibt es nur in Festkörpern, nicht in Flüssigkeiten und Gasen. Also benimmt sich der Äther wie ein Festkörper, hat aber keinerlei Einfluss auf eine Masse, die sich hindurchbewegt. Dass in Fluiden keine transversalen Wellen auftreten können, kann man sich leicht überlegen. Jeder mechanische Schwingungsvorgang benötigt Kräfte, die das System wieder in den Gleichgewichtszustand zurücktreiben wollen. Im mechanischen Gleichgewichtszustand einer Flüssigkeit ist die Dichte konstant. Eine Dichteschwankung in ~e1 -Richtung ist eine Verschiebung der Teilchen j um Vektoren ~uj ∼ ~e1 ; diese ~ ∼ ~e1 , und der Bewegungszustand pflanzt sich in ~e1 -Richtung fort. Der erzeugt rücktreibende Kräfte K ~ Wellenvektor k einer ebenen Welle ist also parallel zur Verschiebung, die Welle ist longitunal polarisiert. Für eine in ~e1 -Richung laufende transversale Welle, Polarisationsrichtung ~e2 , wäre ~u(x, y, z) = ~e2 u(x). Unabhängig von y, z würden alle Teilchen für gegebenes x gleichermaßen verschoben. Das ändert aber die Dichte nicht und erzeugt keine rücktreibenden Kräfte. Also kann es eine solche Welle nicht geben. Für Festkörper trifft diese Argumentation nicht zu, da die Teilchen aneinander gebunden sind und jede lokale Verschiebung auch ohne Dichteänderung rücktreibende Kräfte erzeugt. Trotz dieser seltsamen Eigenschaften kann man zunächst einmal mit der Ätherhypothese leben. Es gibt dann ein ausgezeichnetes Bezugssystem, nämlich das, in dem der Äther ruht. Es ist dann plausibel, dass die Maxwellgleichungen genau in diesem System gelten, so wie die Wellengleichung für Schall im ruhenden materiellen Medium gilt. Falls wir uns aber gegen den Äther bewegen, so müssten wir in der Lage sein, den Ätherwind zu messen, analog zu Gleichungen T7.9, T7.10 im vorigen Abschnitt. Zuerst müssen wir feststellen, ob Materie den Äther mit sich führt, obwohl umgekehrt der Äther keine messbare Auswirkung auf die Materie hat. Wenn es so wäre, gäbe es natürlich keinen messbaren Ätherwind. Ein solches Experiment wurde von Fizeau (1851) durchgeführt. T7 - 5 Schematischer Aufbau Teile des Lichtweges laufen durch ein mit Flüssigkeit gefülltes Rohr. Die Lichtwelle wird durch den halbdurchlässigen Spiegel geteilt, und die beiden Teilwellen laufen in entgegengesetzten Richtungen durch die Flüssigkeit. Sie werden zur Interferenz gebracht, und die Interferenzfigur wird mit dem Fernrohr betrachtet. Ändert sich die Strömungsgeschwindigkeit, so ändern sich gemäß T7.9, T7.10 die Lichtlaufzeiten entgegengesetzt, falls die Flüssigkeit den Äther mitnimmt. Damit ändert sich die Phasendifferenz der beiden Wellen und die Interferenzfigur verschiebt sich. Ergebnis: Der Äther wird ’teilweise mitgeführt’: 1 vÄther = 1 − 2 vFlüssigkeit n (T7.11) n: Brechungsindex der Flüssigkeit. In Luft ist n ≈ 1, also sollte man durch Messung in Luft den Ätherwind bestimmen können. Das Experiment konnte man aber nicht analog zur Schallmessung einfach mit zwei Lichtquellen und zwei Empfängern durchführen. So genau konnte man Zeiten nicht messen. Genau vermessen konnte man Interferenzfiguren. Also baute Michelson sein Interferometer (1881). Schema des Michelson-Interferometers T7 - 6 Das System bewegt sich mit Geschwindigkeit v gegen den Äther. Lichtlaufzeit S0 → S1 → S0 . 1 L 2Lc 2L 2L L + = 2 = = δ t1 = 2 2 c−v c+v c −v c 1 − (v/c) c 1+ v 2 c +O v 4 c . Lichtlaufzeit S0 → S2 → S0 . c2 y δ t2 2 2 = L2 + v 2 δ t2 = = 2L q c 2L c δ t2 2 2 1 1− v 2 c v 4 1 v 2 +O . 1+ 2 c c Unterschied der Lichtlaufzeiten δ t1 − δ t2 = v 4 L v 2 +O . c c c Dreht man jetzt S2 in die Richtung der Erdbewegung, so vertauschen die beiden Teilwellen ihre Rollen. Die Interferenzfigur sollte sich verschieben um einen Betrag, der einer relativen Phasenänderung δϕ = ω·2 L v 2 c c entspricht. Nimmt man an, dass der Äther relativ zur Sonne ruht, so ist v ≈ 10−4 c die Geschwindigkeit der Erde auf ihrer Bahn um die Sonne. Das Experiment war so genau, dass man noch v/30 hätte beobachten können. Unabhängig von der Jahreszeit, d.h. der Richtung von ~v , hat man keinen Effekt gefunden: Es gibt keinen ’Ätherwind’. Dies hat man mit weiteren Hypothesen zu reparieren versucht. Am wichtigsten war die Hypothese von Lorentz: Maßstäbe verkürzen sich bei der Bewegung gegen den Äther so, dass man keinen Ätherwind sieht. Lorentzkontraktion. Alle diese Hypothesen liefen im Grunde auf eine Aussage hinaus: Man kann den Äther nicht beobachten. T7 - 7 Nun wurden in den Jahren um 1900 herum in der Naturphilosophie die Ideen von Mach intensiv diskutiert, der postulierte, dass die Physik nur mit beobachtbaren Größen umgehen darf. Hierdurch geprägt, kam Einstein dazu, das klassische, mechanistische Bild elektromagnetischer Wellen zu verwerfen und an die Stelle einer Ätherhypothese die experimentell beobachtete Konstanz der Lichtgeschwindigkeit zu setzen. Das mechanische Bild beruht auf Galilei’s Relativitätsprinzip. Galilei’s Relativitätsprinzip G 1: In gleichförmig gegeneinander bewegten Systemen läuft die Mechanik in gleicher Weise ab. G 2: Die Zeit ist absolut, d.h. in allen Inertialsystemen dieselbe. Man sollte betonen, dass G 2 weder von Galilei noch von Newton oder seinen Nachfolgern so formuliert worden ist. Es war einfach selbstverständlich. Niemand kam auf die Idee, dass eine gleichförmig bewegte Uhr eine andere Zeit anzeigen könnte als ruhende Uhren. Zu Einstein’s Relativitätsprinzip kommt man mit folgender Überlegung: Alle Experimente zeigen, dass die Maxwellgleichungen in jedem Inertialsystem gelten. Also gibt es kein ausgezeichnetes Bezugssystem des Äthers, und G 1 gilt unverändert auch in der Elektrodynamik. Aber G 2 war eine unbewiesene Hypothese. Um 1900 überstieg ein experimenteller Test alle Möglichkeiten. G 1 und G 2 zusammen führen zwingend auf Galilei’s Gesetz der Addition von Geschwindigkeiten.1 Dies widerspricht der experimentellen Tatsache, dass die Lichtgeschwindigkeit in allen Inertialsystemen die gleiche ist. Damit erhalten wir Einstein’s Relativitätsprinzip E 1: In gleichförmig gegeneinander bewegten Systemen läuft die Physik in gleicher Weise ab. E 2: Die Lichtgeschwindigkeit ist absolut, d.h. in allen Inertialsystemen dieselbe. Im nächsten Abschnitt wollen wir aus diesem Prinzip die Transformation zwischen bewegten Bezugssystemen herleiten. 1 Dies folgt direkt aus der Analyse in Abschnitt T7.3, wenn Sie annehmen, dass t ′ = t ist und c keine Naturkonstante ist und deshalb in der Transformation nicht auftauchen darf. T7 - 8 T7.3 Die Lorentztransformation Wir betrachten zwei Koordinatensysteme K : x, y, z, t K ′ : x ′ , y ′, z ′, t ′ . Da wir nicht mehr fordern, dass die Zeit absolut ist, haben wir den 3-dimensionalen Ortsraum um eine ’Zeitdimension’ erweitert. Um alle überflüssigen Komplikationen zu vermeiden, nehmen wir an, dass K und K ′ zur Zeit t = 0 = t′ aufeinander fallen. t = 0 = t′ : x=y=z=0 x′ = y′ = z ′ = 0 ↔ x′ -Achse auf der x-Achse, u.s.w. K ′ bewege sich gegen K mit Geschwindigkeit V in x-Richtung, d.h. der Ursprung O ′ , (~r ′ = 0), von K ′ hat, gemessen in K, die Koordinate O′ : x = V t, y = 0 = z. (T7.12) Nach E 1 sind die Systeme gleichberechtigt. Also hat der Ursprung O, (~r = 0), von K, gemessen in K ′ , die Koordinate x ′ = −V t ′ y′ = 0 = z′. (T7.13) Da die Koordinatensysteme gleichberechtigt sind, muss hier dieselbe Geschwindigkeit V auftreten. Sonst gäbe es einen messbaren nichttrivialen Unterschied zwischen K und K ′ . Wir suchen die Transformation K ↔ K ′ . Wir betrachten zunächst x ′ . x ′ kann von den Koordinaten x, y, z, t in K abhängen, und wird natürlich auch von V abhängen. Außerdem ist eine Abhängigkeit von c erlaubt, da c nach E 2 eine vom Koordinatensystem unabhängige Naturkonstante ist x ′ = x ′ (x, y, z, t, V, c) . Statt t führen wir die Variable ct ein. Damit sind x, y, z, ct Längen. Da x ′ eine Länge ist, können dann die Geschwindigkeiten V, c nur noch in der dimensionslosen Kombination V /c auftreten (Dimensionsanalyse!). Also erhalten wir V ′ ′ x = x x, y, z, ct, . (T7.14) c Die Abbildung K ↔ K ′ muss für alle endlichen x, y, z, ct, als glatte Abbildung existieren, d.h. die Funktion x ′ kann im Endlichen keine Singularitäten haben. Also können wir nach Taylor entwickeln x ′ V c x + a2 + a5 V c = a1 2 V c x + a6 y + a3 V c T7 - 9 V c xy + ··· z + a4 V c ct Die Koeffizientenfunktionen a1 Vc , a2 Vc · · · , hängen nur von der dimensionslosen Variablen Vc ab, sind also selbst dimensionslos. Da x ′ , x, y, z, ct Längen sind, dürfen dann nur die linearen Terme in der Entwicklung auftreten. Der Term a5 Vc x2 etwa hätte Dimension Länge2 , ist also verboten. Glattheit und Dimensionsanalyse erzwingen also die Linearität der Transformation V V V V x ′ = a1 x + a2 y + a3 z + a4 ct . (T7.15) c c c c Für ct = 0 soll die x ′ -Achse mit der x-Achse zusammenfallen: x ′ (t = 0) = a1 gilt a2 Vc = 0 = a3 Vc , und wir erhalten V V ′ x + a4 ct . x = a1 c c V c x. Also (T7.16) Für y ′ gilt natürlich dieselbe Argumentation. Also haben wir V V ′ y = b1 y + b4 ct . c c Hier können wir aber noch weiter gehen. Wir wissen: Der Ursprung von K ′ : x ′ = 0 = y ′ = z ′ hat in K die Koordinaten x = V t, y = 0 = z. Damit folgt V ′ ct , 0 = y = b4 c oder b4 Also gilt V c ′ y = b1 ct = 0 . V c y. Nun sind die Koordinatensysteme gleichberechtigt. K bewegt sich gegen K ′ mit Geschwindigkeit − V . Also gilt auch V y′. y = b1 − c Es folgt y ′ = b1 und damit gilt b1 V c V c b1 V c V b1 − y′, c V − c = ±1. = 1. Der Raum ist isotrop: Es muss gleichgültig sein, ob sich K ′ in +~e1 oder −~e1 Richtung bewegt. Daraus folgt V V = b1 − . b1 c c Zusammengenommen ergibt dies b1 T7 - 10 Da die y-Achse und die y ′ -Achse dieselbe Richtung haben sollen, bleibt nur b1 V c Wir erhalten also = +1. y′ = y. (T7.17) z′ =z. (T7.18) Ebenso folgt Betrachten wir nun die Zeit, so erhalten wir zunächst analog zu (T7.15) V V V V ct ′ = d1 x + d2 y + d3 z + d4 ct . c c c c Mit (T7.17), (T7.18) folgt V V V V ′ ′ ′ x + d2 y + d3 z + d4 ct . ct = d1 c c c c Die Zeit in K ′ darf aber nicht vom Ort in K ′ abhängen. Also gilt d2 Fassen wir alles zusammen, so sehen wir: V c = 0 = d3 V c . Die Transformation K → K ′ hat notwendig die Form ′ x = a1 V c x + a4 V c ct y′ = y z′ =z ′ ct = d1 V c x + d4 V c ct . (T7.19) Bisher haben wir nur ausgenutzt, dass c in der Transformation auftreten darf, da diese Geschwindigkeit eine Koordinatensystem unabhängige Naturkonstante ist. Diese Unabhängigkeit vom Koordinatensystem formulieren wir jetzt mathematisch. Wir definieren den relativistischen Abstand zweier Raum-Zeit Punkte P0 und P . in K in K ′ P0 : x0 , y0 , z0 , ct0 ; x′0 , y0′ , z0′ , ct′0 P ; x′ , y ′ , z ′ , ct′ . : x, y, z, ct T7 - 11 Def.: Der relativistische Abstand von P0 , P ist gemessen in K s2 = c2 (t − t0 )2 − (~r · ~r0 )2 , (T7.20) s ′ 2 = c2 (t ′ − t ′0 )2 − (~r ′ · ~r ′0 )2 . (T7.21) gemessen in K ′ Dies ist kein ’Abstand’ im üblichen Sinn. s2 kann negativ sein! Nehmen wir nun an, dass im Raum-Zeit Punkt P0 ein Lichtsignal ausgesendet wird, das in P1 empfangen wird. Dann gilt (~r − ~r0 )2 , (t − t0 )2 also (~r − ~r ′0 )2 , (t ′ − t ′0 )2 also c2 = s2 = 0 . Da die Lichtgeschwindigkeit vom Koordinatensystem unabhängig ist, gilt auch c2 = s ′2 = 0 . Zwei Raum-Zeit Punkte, die durch ein Lichtsignal miteinander verbunden sind, haben in jedem Inertialsystem den relativistischen Abstand Null: s2 = 0 ↔ s′2 = 0. (T7.22) Wir behaupten nun: Auch für zwei beliebige Raum-Zeit Punkte gilt s2 = s ′ 2 (T7.23) d.h. der relativistische Abstand ist unter der Transformation K → K ′ invariant.2 Beweis: Wir können ohne Einschränkung der Allgemeinheit P0 als den Ursprung x0 = 0 = y0 = z0 = ct0 wählen. Nach Konstruktion gilt dann auch x ′0 = 0 = y ′0 = z ′0 = ct ′0 , und (T7.20), (T7.21) ergibt s2 = (ct)2 − x2 − y 2 − z 2 s ′ 2 = (ct ′ )2 − x ′ 2 − y ′ 2 − z ′ 2 . Da nach (T7.19) y ′ = y, z ′ = z, folgt s ′ 2 = (ct ′ )2 − x ′ 2 − y 2 − z 2 . 2 Wenn Sie Gailei’s Äquivalenzprinzip zu Grunde legen, so würden Sie an dieser Stelle erhalten: Der geometrische Abstand zweier Raumpunkte ist invariant. T7 - 12 Wenn also s2 = s ′ 2 für y = 0 = z gilt, gilt es für beliebige Punktepaare. Wir können uns auf Raum-Zeit Punkte (ct, x) beschränken s2 = (ct)2 − x2 s ′ 2 = (ct ′ )2 − x ′ 2 (T 7.19) = (d1 x + d4 ct)2 − (a1 x + a4 ct)2 = (d24 − a24 ) (ct)2 + 2 (d4 d1 − a4 a1 ) x ct + (d21 − a21 ) x2 . Hier drücken wir (ct)2 durch s2 aus α2 α1 s ′2 z }| { z }| { = (d24 + a24 ) s2 + (d21 + a21 + d24 − a24 ) x2 + 2 (d4 d1 − a4 a1 ) x ct . {z } | α3 Wir wissen: s2 = 0 y s ′ 2 = 0, also 0 = α2 x2 + 2 α3 x ct , für 0 = s2 = (ct)2 − x2 . s2 = 0 bedeutet aber ct = ± x. Setzen wir ct = + x ein, so folgt 0 = (α2 + 2 α3 )x2 , oder α2 = − 2 α3 . oder α2 = + 2 α3 . Setzen wir ct = − x, so folgt 0 = (α2 − 2 α3 )x2 , Also gilt α2 = α3 = 0, und es folgt s ′2 = α1 V c s2 . Aus der Gleichberechtigung von K, K ′ folgt dann V 2 s = α1 − s′2 , c oder α1 V c α1 V − c = 1. Wie oben erzwingt die Isotropie des Raumes V V = α1 , α1 − c c T7 - 13 oder α1 V c = ±1. Für V = 0 müssen die Koordinatensysteme zusammenfallen. Also bleibt nur α1 V c Wir haben = + 1. s ′ 2 = s2 bewiesen. Der Beweis hat uns Relationen zwischen den Koeffizienten a1 , a4 , d1 , d4 der Transformation (T7.19) geliefert: 1 = α1 = d24 − a24 0 = α2 = d21 − a21 + d24 − a24 y d21 − a21 = − 1 0 = α3 = d4 d1 − a4 a1 . Wir erinnern uns an die Beziehung (T7.24) cosh2 ϕ − sinh2 ϕ = 1 . Also werden die ersten beiden Gleichungen durch d4 = cosh ϕ , a4 = sinh ϕ a1 = cosh ϕ̂ , d1 = sinh ϕ̂ , ) gelöst. Die letzte Gleichung ergibt dann cosh ϕ sinh ϕ̂ = sinh ϕ cosh ϕ̂ , oder tanh ϕ̂ = tanh ϕ . Es folgt ϕ̂ = ϕ, denn tanh ϕ nimmt keinen Wert mehrmals ein. Die Transformation K → K ′ , (T7.19), hat also die Form x ′ = x cosh ϕ + ct sinh ϕ y′ = y z′ =z ct ′ = x sinh ϕ + ct cosh ϕ . Um ϕ zu bestimmen, nutzen wir noch aus, wie sich der Ursprung von K ′ bewegt: x′ = 0 = y′ = z′ y T7 - 14 x = V t. (T7.25) Also folgt 0= oder V cosh ϕ + sinh ϕ ct , c tanh ϕ = − V . c (T7.26) Ein Blick in die Formelsammlung zeigt dann 1 cosh ϕ = p 1 − V 2 /c2 −V /c p . 1 − V 2 /c2 sinh ϕ = (T7.27) Damit haben wir die spezielle Lorentztransformation, auch ’Boost’ genannt, gefunden. Man schreibt üblicherweise β = γ = V c (T7.28) 1 p x0 = ct, 1 − V 2 /c2 x1 = x, (T7.29) x2 = y, x3 = z . (T7.30) Man beachte: 0, 1, 2, 3 sind hochgestellte Indizes! Mit dieser Notation erhalten wir in MatrixSchreibweise ′ x0 γ −βγ 0 0 x ′ 1 −βγ γ 0 0 ′ = x2 0 0 1 0 ′ 0 0 0 1 x3 x0 x1 x2 x3 (T7.31) Für die Matrixelemente führt man das Symbol Λkℓ , k ℓ = 0, 1, 2, 3 ein. Damit wird (T7.31) in Komponenten xk = 3 X Λkℓ xℓ . (T7.32) ℓ=0 Aus dem Transformationsgesetz (T7.31) folgt sofort eine sehr wichtige Aussage. In jedem physikalisch sinnvollen Koordinatensystem müssen die Koordinaten reell sein. Also müssen β und γ reell sein. Nach (T7.31) bedeutet dies aber V2 ≤ 1. (T7.33) c2 Relativgeschwindigkeiten | V | > c zwischen Koordinatensystemen sind physikalisch sinnlos. Da wir uns für ein an uns vorbeifliegendes Teilchen stets ein Koordinatensystem denken T7 - 15 können, in dem es momentan ruht, folgt sofort, dass sich kein Teilchen mit ’Überlichtgeschwindigkeit’ bewegen kann. Die Lichtgeschwindigkeit ist die obere Grenze der möglichen Teilchengeschwindigkeiten. Wenn alle Geschwindigkeiten klein sind gegen die Lichtgeschwindigkeit, muss die relativistische Theorie in die klassische, nicht-relativistische Beschreibung übergehen. Um dies zu überprüfen, bilden wir in der Lorentztransformation den Limes V /c → ∞. Wir schreiben zunächst die Transformation explizit als x′ = p 1 1−V 2 /c2 y′ = y x− p V 1 − V 2 /c2 t z′ =z Limes V c t′ = p →0 v/c 1−V 2 /c2 1 1 t. x+ p c 1 − V 2 /c2 y x′ = x − V t y′ = y z′ = z t′ = t. Galilei Transformation. (T7.34) Wir haben hier den Spezialfall betrachtet, dass sich K ′ gegen K in x-Richtung bewegt. Der Fall einer beliebigen Bewegungsrichtung V~ lässt sich leicht hierauf zurückführen. Wir führen zuerst eine räumliche ~ zeigt. Im 4-dimensionalen Raum hat die zugehörige Drehung durch, so dass die neue x-Achse in Richtung V Matrix die Form 1 0 0 0 0 , 0 O1 0 wobei O1 die 3 × 3 Drehmatrix ist. Dann wenden wir den Boost Λ an, und drehen zum Schluss die räumlichen Achsen in die gewünschte Richtung. Die allgemeine Lorentztransformation hat also die Form 1 0 0 0 1 0 0 0 0 . Λ 0 0 0 O1 O2 0 0 Dies beantwortet die Ausgangsfrage nach der Gültigkeit der Maxwell’schen Gleichungen: Die Transformationen zwischen gleichförmig gegeneinander bewegten Bezugssystemen sind nicht die Galilei-Transformationen, sondern die Lorenztransformationen. Man kann zeigen, dass die Maxwellgleichungen unter Lorentztransformationen forminvariant sind. (So hat Lorentz sie gefunden, vor Formulierung der Relativitätstheorie!). Die Maxwellgleichungen gelten in jedem Inertialsystem! T7 - 16 T7.4 Relativistische Kinematik Wie wir gesehen haben, müssen wir in der Relativitätstheorie den dreidimensionalen Ortsraum durch eine Zeit-Koordinate ergänzen, also zur vierdimensionalen ’Raum-Zeit’, dem Minkowski-Raum übergehen. Ein Punkt in diesem Raum, (ct, ~r) = (x0 , x1 , x2 , x3 ) = x wird als ’Weltpunkt’ oder ’Ereignis’ bezeichnet. Er könnte etwa angeben, dass ein Teilchen zur Zeit t am Ort ~r ist. Eine Linie in diesem Raum ist eine ’Weltlinie’. Sie könnte etwa die Bewegung eines Teilchens vollständig bescheiben: (ct, ~r(t)). Eine zentrale Rolle spielen die Weltlinien eines Lichtblitzes, der im Ursprung x = 0 ausgesandt wird. Sie sind durch s2 = (ct)2 − ~r 2 = x0 2 − x1 2 − x2 2 − x3 2 gegeben. Die Menge aller dieser Weltpunkte definiert den ’Lichtkegel’. Wäre der Raum zweidimensional, so erhielten wir einen Doppelkegel 2 (x0 )2 = x(1) + x(2) = ρ2 mit Spitze im Ursprung und der x0 -Achse als zentraler Achse. Der Kegel x0 ≥ 0 beschreibt einen in x = 0 erzeugten Lichtblitz, der Kegel x0 ≤ 0 einen in x = 0 empfangenen Lichtblitz. Der Lichtkegel beschreibt einen physikalischen Vorgang, ist also unabhängig vom gewählten Koordinatensystem. A Minkowski-Diagramm Die Lorentztransformation lässt sich in einer zweidimensionalen Raum-Zeit x = x0 , x1 anschaulich darstellen.Wir zeichnen ein Koordinalensystem K mit einer Raum-Achse x1 und der Zeit-Achse x0 . Der Lichtkegel s2 = 0 = x0 2 − x1 2 ist dann durch die Winkelhalbierenden gegeben. T7 - 17 Jetzt betrachten wir das Koordinatensystem K ′ . Die x ′1 -Achse ist die Menge aller Punkte ′ t ′ = 0. Aus x 0 = ct ′ = 0 folgt nach (T7.33) 0 = γ x0 − β γ x1 , oder x0 = β x1 ↔ ct = V x. c (T7.35) ′ Die x 1 -Achse ist also im Minkowski-Diagramm eine Gerade, die vom linken Viertel zum rechten Viertel des Minkowski-Diagramms geht. Ebenso folgt für die x ′ 0 = ct ′ -Achse 0 = x ′1 = − β γ x0 + γ x1 , oder x1 = β x(0) ↔ x= V ct . c (T7.36) Dies ist das am Lichtkegel x0 = x1 gespiegelte Bild der x ′ 1 -Achse. Wegen 0 = s2 = s ′ 2 = (x ′ 0 )2 − (x ′ 1 )2 ist der Lichtkegel die Winkelhalbierende in jedem Koordinatensystem. Aber die Koordinatensysteme im Minkowski-Diagramm sind im Allgemeinen schiefwinklig! Hier sei noch einmal daran erinnert, wie man in einem schiefwinkligen Koordinatensystem die Koordinaten eines Punktes P findet. x ′ 0 ergibt sich als Schnittpunkt der Parallelen zur x ′ 1 -Achse durch P mit der x ′ 0 -Achse. Entsprechend ergibt sich x ′ 1 als Schnittpunkt der Parallelen aus x ′ 0 -Achse durch P mit der x ′ 1 -Achse. Im Folgenden nehmen wir an, dass wir unseren Längenmaßstab ein- für allemal fest gewählt haben. Jedes Koordinatesystem führt seinen Maßstab mit sich, und alle diese Maßstäbe sind physikalisch identische Kopien unseres Maßstabs. Ich lasse deshalb im Folgenden die Längeneinheit weg. Wir betrachten die invariante Linie s ′ 2 = s2 = −1 , d.h. (x0 )2 − (x(1) )2 = − 1 = (x ′ 0 )2 − (x ′ 1 )2 . (T7.37) Dies sind Hyperbeläste in linken und rechten Viertel mit dem Lichtkegel als Asymptoten. Die Schnittpunke mit der x1 -Achse liegen bei x0 = 0, also x1 = ± 1, und geben damit die Längeneinheit im System K an. Die Schnittpunkte mit der x ′ 1 -Achse (x ′ 0 = 0) liegen bei (x ′ 1 ) = ±1 , geben also die Längeneinheit in K ′ an. Die Gleichung s ′ 2 ≡ s2 = +1 , also (x0 )2 − (x1 )2 = + 1 = (x ′ 0 )2 − (x ′ 1 )2 T7 - 18 (T7.38) beschreibt Hyperbeln im oberen und unteren Viertel. Der Schnittpunkt mit der x0 -Achse gibt die Zeiteinheit (genauer die von ct) in K an, der Schnittpunkt mit der x ′ 0 -Achse gibt die Zeiteinheit in K ′ . Jetzt sind wir in der Lage, interessante Folgerungen zu diskutieren. B Zeitartige Abstände Wir betrachten zwei Ereignisse P0 , P1 mit relativistischem Abstand s2 > 0. P0 wählen wir als Ursprung des MinkowskiDiagramms und P1 liege im oberen Viertel. Wegen 0 < s2 = (x0 )2 − (x1 )2 = (x ′ 0 )2 − (x ′ 1 )2 folgt (x ′ 0 )2 > 0 für jedes System K ′ . Es gibt kein System, in dem die Ereignisse gleichzeitig sind. Deshalb heißen Abstände s2 > 0 ’zeitartig’. Es gibt aber ein System K ′′ , in dem sie am gleichen Ort stattfinden: x ′′ 1 = 0. Damit folgt (x ′ 0 )2 − (x ′ 1 )2 = (x ′′ 0 )2 , oder (x ′ 0 )2 = (x ′′ 0 )2 + (x ′ 1 )2 ≥ (x ′′ 0 )2 . (T7.39) Die Zeitdifferenz zwischen zwei Ereignissen mit s2 > 0 ist am kleinsten in dem System, in dem sie am gleichen Ort stattfinden. In einem gegen dieses bewegte System ist die Zeitdifferenz größer. Das ist die Zeitdilatation. Außerdem sehen wir sofort, dass alle x ′ 0 > 0 sind. P1 ist immer später als P0 . Das obere Viertel ist der Zukunftsvektor von P0 . Liegt P1 im unteren Viertel, so sieht man sofort, dass x ′ 0 < 0 ist. Das untere Viertel ist die Vergangenheit. Die Gegenwart von P0 ist der Punkt P0 selbst: In der Relativitätstheorie schrumpft die Gegenwart auf einen Raum-Zeit Punkt zusammen. Die Gegenwart meiner Nasenspitze ist etwas anderes als die Gegenwart meines linken kleinen Fingers! Nehmen wir nun an, die beiden Ereignisse P0 , P1 seien das Ablesen einer Uhr. Wir haben jetzt gesehen, dass die Zeit in K ′′ , d.h. in dem System, in dem die Uhr am gleichen Ort bleibt, stets kürzer ist, als die Zeit, die in einem gegen die Uhr bewegten System zwischen den beiden Ableseereignissen verstreicht. Wie passt das zur häufig gehörten Aussage: ’Bewegte Uhren gehen langsamer’ ? Die kürzere Zeit wird doch auf der ruhenden Uhr abgelesen! Hier muss man - wie immer in der Relativitätstheorie - sehr präzise sagen, was man eigentlich meint. Wir wollen den Gang einer gegen uns bewegten Uhr mit unserer Uhr vergleichen. Vergleichen kann ich direkt nur Ereignisse, die am selben Raum-Zeit Punkt stattfinden. Sonst müsste ich Signale schicken, was das Experiment komplizierter macht. T7 - 19 Betrachten wir folgendes Gedankenexperiment. Ich (1), sitze in meinem System K am Punkt x(1) = 0, 1 Meine Weltlinie ist also die x0 -Achse. mit der Uhr . 3 fliegt gleichförmig an mir vorbei. Wenn sie Eine Uhr an meinem Raum-Zeit Punkt ist, zeigen beide Uhren 1 und 3 die gleiche Zeit ct = ct ′ = 0 an. 2 die mit meiner Mein Kollege sitzt in meinem Inertialsystem am Punkt x(2) mit einer Uhr , (0) Uhr synchron geht. Seine Weltlinie ist eine Parallele zur x -Achse, d.h. zu meiner Weltlinie. 2 mit der Weltlinie der Uhr 3 x (2) sei so gewählt, dass der Schnittpunkt der Weltlinie ′ 0 2 der x -Achse - auf der Kurve s = 1 liegt. 3 wenn sie am Beobachter 2 vorbeifliegt, die Zeit ct ′ = 1 an, während Dann zeigt die Uhr , der Beobachter 2 an seiner Uhr die Zeit ct > 1 abliest: Die bewegte Uhr geht nach. Das ist völlig konsistent mit der Zeitdilatation, denn im Ruhesystem K ′ der bewegten Uhr ist zwischen beiden Ablese-Ereignissen weniger Zeit verstrichen. Was passiert, wenn der Beob1 überprüfen will? Dazu benötigt er einen Kollegen achter in K ′ den Gang meiner Uhr 4 in seinem System. Aus dem Minkowski-Diagramm lesen Sie ab, dass die Beiden mit Uhr zum Schluss kommen, dass meine Uhr nachgeht. Das ist kein Widerspruch, denn die beiden Experimente messen zwei verschiedene Paare von Ereignissen. Ich und mein Kollege messen Ereignisse E1 , E2 , die beiden im System K ′ messen E1 und E3 . Wir haben jetzt gesehen, dass es keine universell gültige Zeit gibt: Die Zeit ist - wie die Ortskoordinaten - vom Bezugssystem abhängig. Es gibt aber für jeden Körper eine ausgezeichnete Zeit, nämlich die, die eine mit ihm fest verbundene Uhr anzeigt. Das ist die Eigenzeit τ . Ein mit dem Körper fest verbundenes Koordinatensystem heißt ’Ruhesystem’ des Körpers. Da der Körper sich im Allgemeinen nicht gleichförmig bewegt, ist das Ruhesystem im Allgemeinen kein Inertialsystem. Dennoch können wir den Zusammenhang zwischen unserer Laborzeit, Inertialsystem K, und der Eigenzeit bestimmen. Der Körper bewege sich mit der Geschwindigkeit ~v (t), gemessen in K. Da es keine unendlich große Beschleunigung gibt, gilt ~v (t + dt) = ~v (t) + O(dt) . Im differentiellen Zeitintervall dt können wir die Änderung von ~v vernachlässigen. Dann folgt ds2 = (c dτ )2 = Ruhesystem y (dτ )2 Laborsystem = oder dτ = dt (c dt)2 − (~v · dt)2 r (dt)2 1 − 1− T7 - 20 ~v 2 (t) . c2 ~ v2 c2 Integration liefert τ (t) = τ (t0 ) + Zt t0 dt ′ s 1− ~v 2 (t ′ ) . c2 (T7.40) Nur, wenn ~v (t) ≡ 0 für alle t, ist die Eigenzeit gleich der Laborzeit. Sonst ist sie kürzer. Eine nette Bemerkung ist hier folgende: Ein Photon - ein Lichtteilchen - bewegt sich mit | ~v | = c. Also ist τ immer Null! Das arme Photon hat weder Zukunft noch Vergangenheit. Die Eigenzeit regiert das intrinsische - nicht von außen erzwungene - Verhalten aller Körper. Ein Beispiel: Es gibt Teilchen, die spontan zerfallen können - ohne Einwirkung von Außen. Erzeugen wir ein solches Teilchen zur Eigenzeit τ = 0, so nimmt die Wahrscheinlichkeit P (τ ), dass Teilchen zur Zeit τ > 0 noch intakt zu finden, exponentiell ab. P (τ ) = e−τ /τ0 . τ0 ist die Lebensdauer des Teilchens, und da wir über intrinsische Eigenschaften des Teilchens reden, kann hier nur die Eigenzeit auftauchen. Ein konkretes Beispiel ist das Myon µ. Es zerfällt mit Lebensdauer τ0 ≈ 2.2 10−6 sek in ein Elektron und Neutrinos. Die Sonne beschießt uns ständig mit Protonen, und diese erzeugen durch Stöße mit Luftmolekülen in ungefähr 20 km Höhe über einige Zwischenschritte hochenergetische Myonen, mit Geschindigkeiten nahe der Lichtgeschwindigkeit. Naiv würden wir erwarten, dass diese im Mittel c τ0 ≈ 660 m weit fliegen, ehe sie zerfallen. Dennoch misst man einen Strom von Myonen, ungefähr 1 Teilchen/(cm2 min), auf der Erdoberfläche (’Höhenstrahlung’). Das ist die Konsequenz der Zeit-Dilatation. Wir wollen noch überlegen, wie wir die Eigenzeit τ (t) eines gegen unser Inertialsystem bewegten Körpers messen können. Das geht nicht, in dem wir von unserem Ort x1 = 0 aus einfach eine mit dem Körper verbundene Uhr betrachten. Wir benötigen vielmehr in jedem Punkt unseres Ortsraumes einen Kollegen mit Uhr, der feststellt, ob und zu welcher Laborzeit t der Körper bei ihm vorbeikommt und was dann die Eigenzeit τ (t) ist. Bei optischer Beobachtung aus der Ferne müssen wir jeweils die Entfernung x(1) (τ ) des Körpers kennen, um die Laufzeit des Lichtes berücksichtigen zu können. Wir würden also t̂(τ ) = t(τ ) + x(1) (τ )/c messen und hätten, da wir x(1) (τ ) nicht kennen, alleine keine Möglichkeit, t(τ ) zu bestimmen. Über diese Retardierung muss man sich - je nach Experiment - genau klar sein. In der Relativistik kann man mit schlampigen Formulierungen beliebige Verwirrung erzeugen. Ein Beispiel für so etwas ist das ’Zwillingsparadoxon’. Es geht so: Ein Zwilling bleibt in Ruhe in einem Inertialsystem. Der zweite besteigt ein hypermodernes T7 - 21 Raumschiff, das wahnsinnig schnell beschleunigen kann. Er fliegt eine Zeit τ mit konstanter Geschwindigkeit v, kehrt plötzlich um, und fliegt zurück. Frage: Wer ist beim Wiedersehen älter? Antwort von Zwilling 1: Ich bin älter, denn du hast dich ja bewegt, und bewegte Uhren gehen langsamer. Antwort von Zwilling 2: Nein, ich bin älter. Ich habe mich ja - bis auf die vernachlässigbar kurze Umkehrzeit gleichförmig bewegt, und das ist nach dem Relativitätsprinzip äquivalent damit, dass du dich bewegt hat. Wer hat recht? Zur Klärung zeichnen wir ein Minkowski-Diagramm. x0 , x1 sei das Inertialsystem von Zwilling 1. x ′ 0 , x ′ 1 sei das Inertialsystem von Zwilling 2 während er wegfliegt, x ′′ 0 , x ′′ 1 sein Inertialsystem beim Rückflug. Zwilling 2 beginnt das Wendemanöver zur Zeit τ − und beendet es zur Zeit τ + dτ 2 . dτ 2 0 Wenn er zu seiner Eigenzeit τ − dτ 2 die Uhr x ablesen könnte (was er nicht kann, da er nicht an zwei Orten zugleich sein kann), so würde er mit Befriedigung feststellen, dass (−) xu = x0 τ − dτ < c (τ − dτ 2 2 ). Aber während er wendet, würde er zu seinem Erstaunen feststellen, dass die Uhr x0 verglichen mit seiner Eigenzeit, plötzlich rast. Erst nach dem Wendemanöver geht sie wieder langsamer. Das zeigt, dass Zwilling 2 in seiner Argumentation den beim Umkehren vorgenommenen Wechsel des Inertialsystems nicht unter den Teppich kehren darf. Natürlich bleibt Gleichung (T7.40) richtig. Für den hier betrachteten Fall der plötzlichen Umkehr gilt v 2 (t) = ~v 2 = const, und wir erhalten r v2 δτ = δt 1 − 2 < δt . c Beachten Sie: Auch im Inertialsystem von Zwilling 1 ist die für das Umkehren benötigte Zeit beliebig klein. Um sie zu messen, muss der Beobachter am Raumpunkt der Umkehr sein, nicht am Ort des Zwillings 1. Die Zeitdauer der Umkehr in System 1 ist also nicht (+) (−) dτ = xu − xu . Diese Zeitdifferenz würden nur zwei Beobachter x0 τ + dτ 2 − x0 τ − 2 dτ messen, die sich genau so bewegen wie Zwilling 2, und jeweils zu Zeiten τ − dτ 2 bzw. τ + 2 1 an meinem Ort x = 0 sind. Wir sehen wieder, dass wir ganz genau definieren müssen, wovon wir reden. T7 - 22 C Raumartige Abstände Jetzt betrachten wir zwei Punkte P1 , P2 mit relativistischem Abstand s2 < 0 . P0 sei wieder der Ursprung von K. Dann liegt P1 im linken oder rechten Viertel des Minkowski-Diagramms. Jetzt können wir ein Koodinatensystem finden, in dem P1 auf der x ′1 -Achse liegt, also mit P0 gleichzeitig ist: 0 = x ′ 0 (0) = x ′ 0 (1) . Es folgt 0 > s2 = (x0 )2 − (x1 )2 = s ′ 2 = −(x ′ 1 )2 , oder (x1 )2 = (x ′ 1 )2 + (x0 )2 ≥ (x ′ 1 )2 . (T7.41) Zwei Ereignisse mit raumartigen Abstand s2 < 0 finden in allen Inertialsystemen an verschiedenen Raumpunkten statt. Ihr Abstand im Ortsraum ist am kleinsten in dem System, in dem sie gleichzeitig sind. Es gibt Koordinationssysteme, in denen P0 früher stattfindet als P1 , und solche, in denen P0 später ist. Die zeitliche Reihenfolge hängt also vom Koordinatensystem ab. Das verletzt die Kausalität nicht, denn die beiden Ereignisse können sich nicht beeinflussen. Dazu müssten Signale mit Überlichtgeschwindigkeit laufen. P0 und P1 können aber ein drittes Ereignis beeinflussen, dass im Schnitt ihrer Lichtkegel liegt. Jetzt wollen wir noch die Lorentzkontraktion verstehen: ’In Bewegungsrichtung sind alle Längen verkürzt’. Wieder müssen wir genau formulieren, was das heißen soll. Wir betrachten einen Stab, der in x-Richtung ausgerichtet ist und sich in x-Richtung bewegt. Um die Länge des Stabes zu bestimmen, muss ich die Orte der beiden Endpunkte messen, und das muss gleichzeitig geschehen. Das ist wesentlich, aber trivial. Messe ich den Ort x (1) des linken Endes zur Zeit t(1), und den Ort x (2) des anderen Endes zur Zeit t (2) 6= t (1), so hat sich der Stab ja inzwischen bewegt. Sei K das Ruhesystem des Stabes und x (1) = 0, x (2) = 1, d.h. der Stab hat in seinem Ruhesystem die Einheitslänge. Wir zeichnen ein entsprechendes Minkowski-Diagramm. T7 - 23 Die Weltlinie des Endes 1 ist die x0 -Achse, die des Endes 2 die Parallele durch x1 = 1. Wir fliegen in x-Richung am Stab vorbei. (Das ist ja damit äquivalent, dass sich der Stab gegen uns bewegt). Im Ruhesystem des Stabes messen wir die Länge durch die Ereignisse P0 und P1 . Unser Inertialsystem ist K ′ . Messen wir jetzt die Länge des Stabes, so verwenden wir die in unserem System ′ 0 ′ 1 gleichzeigen Ereignisse P0 : x = 0, x = 0 und P2 : x ′ 0 = 0, x ′ 1 (2) , und offensichtlich ist x ′ 1 (2) < 1. Quantitativ folgt das Ergebnis aus den Lorentztransformationen (T7.31) x ′ 0 = λ x0 − β λ x1 (T7.42) x ′ 1 = − β λ x0 + λ x1 . (T7.43) Die Länge des Stabes in seinem Ruhesystem ist ℓ = x1 . Die Länge in unserem System ist ℓ′ = x′1 , gemessen zur Zeit x′0 = 0. Damit folgt aus (T7.42) x0 = β x1 = β ℓ . Das ist im Ruhesystem des Stabes die Zeit, zu der ich x ′ (2) messe. Einsetzen in (T7.43) ergibt ℓ′ = y ℓ′ = −β 2 γ + γ r 1− ℓ = γ 1 − β2 V2 ℓ < ℓ. c2 1 − V 2 /c2 ℓ= p ℓ 1 − V 2 /c2 (T7.44) Man beachte, dass wir zur Beobachtung der Lorentztransformation wieder in jeden Raumpunkt unseres Systems einen Beobachter mit Uhr x ′ 0 haben müssen. Der Auftrag lautet festzustellen, ob zur Zeit x ′ 0 = 0 ein Ende des Stabes beim Beobachter ist. Hinterher können wir dann abfragen und so die x ′ 1 -Koordinaten der Stabenden zur Zeit x ′ 0 = 0 feststellen. Wenn wir von unserem Ort aus ein Objekt vorbeifliegen sehen, bemerken wir die Lorentzkontraktion nicht. Dies wollen wir uns wieder an einem Gedankenexperiment klar machen. T7 - 24 Wir betrachten ein Rechteck, die Kantenlängen im Ruhesystem des Rechtecks seien a und b, Kante a sei parallel zu unserer x-Achse, und das Rechteck fliege mit Geschwindigkeit V in x-Richtung an uns vorbei. In unserem System ist also die Kante a Lorentz kontrahiert r V2 ′ a = 1 − 2 a. c b ist ungeändert. Dies würden unsere überall in der x − yEbene verteilten Kollegen bei gleichzeitiger Beobachtung feststellen. Wir selbst betrachten das Rechteck aus einem großen Abstand in y-Richtung. Der Abstand sei so groß, dass wir die Lichtstrahlen, die uns vom Rechteck erreichen, als parallel annehmen können (das vereinfacht die Analyse erheblich). Die Bilder der unteren Kante A B kommen dann gleichzeitig an, und wir sehen diese Kante als ÂB̂, Lorentz-kontrahiert. Gleichzeitig empfangen wir aber Licht vom Punkt D. Da dieses die zusätzliche Strecke b zurücklegen muss, ist es früher ausgesandt worden, am Ort D ′ , der in x-Richung um − V bc verschoben ist. Wir sehen also auch das Stück D̂ Â, Länge V bc , als Bild der Kante DA. Das sieht genau so aus, wenn das Rechteck in Ruhe, aber gekippt ist. Wir betrachten das Rechteck, Kantenlängen a, b, gekippt um den Winkel ϕ so, dass die Projektion der Kante A B auf die x-Achse gerade die Länge r V2 a ′ = 1 − 2 a = a cos ϕ c hat. Die Projektion der Seite A D hat dann die Länge b sin ϕ, sin2 ϕ = 1 − cos2 ϕ = V2 c2 y sin ϕ = V ! c Ein gekipptes, ruhendes, also nicht Lorentz-kontrahiertes Rechteck erzeugt für uns also dasselbe Bild, wie das vorbeifliegende Rechteck. Da unser Gehirn an Vorgängen mit Geschwindigkeiten V ≪ c trainiert ist, interpretieren wir also das vorbeifliegende Rechteck nicht als Lorentz-kontrahiert, sondern als gedreht! Der Drehwinkel nimmt mit V zu und erreicht ϕ ≈ π/2 für V ≈ c! Im Internet finden Sie beeindruckende Videos die zeigen, was Sie sehen würden, wenn Sie etwa V = 9/10 c durch’s Brandenburger Tor fliegen würden. T7 - 25 D Die Vierer-Geschwindigkeit Physikalische Zusammenhänge müssen vom Koordinatensystem, in dem wir sie beschreiben, unabhängig sein. In der nichtrelativistischen Physik führte uns dies zur Klassifizierung der physikalischen Größen nach ihrem Verhalten unter Drehungen: Skalare sind invariant, Vektoren transformieren sich wie der Ortsvektor, usw. In der (speziellen) Relativitätstheorie sind es die Lorentztransformationen, die von einem Inertialsystem auf das andere transformieren. Da die Physik nach wie vor vom Koordinatensystem unabhängig sein muss, müssen wir jetzt die physikalischen Größen nach ihrem Verhalten unter Lorentztransformationen klassifizieren. Lorentzskalare sind invariant unter Lorentztransformationen. Ein Beispiel ist der relativistische Abstand s2 . Vierervektoren (Lorentzvektoren), transformieren sich wie ein Raum-Zeit Vektor x = (x0 , x1 , x2 , x3 ). Weiter gibt es Lorentztensoren höherer Stufen. Ein Beispiel, dem wir noch begegnen werden, ist das elektromagnetische Feld. In der nicht-relativistischen Physik ist die Geschwindigkeit definiert als ~v = d~r . dt ~v ist ein Vektor, denn ~r ist ein Vektor und t ist ein Skalar. Jetzt suchen wir einen Vierervektor u = (u0 , u1 , u2 , u3 ) , dessen räumliche Komponenten uj , j = 1, 2, 3 für c → ∞ in vj übergehen. Offensichtlich müssen wir den Raum-Zeit Vektor (x0 , x1 , x2 , x3 ) nach einer Zeit differenzieren. Dies kann aber nicht die Laborzeit t = x0 /c sein, denn diese ist kein Skalar, sondern die 0-Komponente eines 4-Vektors. Aber jeder Körper hat seine Eigenzeit τ . τ ist unabhängig vom Koordinatensystem, also ein Skalar. Formal folgt dies aus der Definition (cd τ )2 = ds2 . ds2 ist ein Lorentzskalar, und da wir über die Bewegung eines Körpers reden, ist ds2 > 0 zeitartig. Also ist √ ds2 ǫ R. dτ = c Wir definieren die 4-Geschwindigkeit als 0 dx dx dx1 dx2 dx3 u= = , , , . (T7.45) dτ dτ dτ dτ dτ In unserem Laborsystem gilt (Gl. T7.40) dτ = dt r 1− T7 - 26 v 2 (t) . c2 Also folgt p u0 = uj √ = 1 − v 2 /c2 vj 1−v2 /c2 , j = 1, 2, 3 . (T7.46) Für c → ∞ ergibt sich das erwünschte Ergebnis (u1 , u2 , u3 ) → ~v . Die Nullkomponente erfüllt u0 = 1, c→∞ c lim unabhängig von ~v . Daher ist sie in diesem Limes unwichtig. Jetzt können wir das relativistische ’Additionsgesetz’ der Geschwindigkeit herleiten. Im System K habe das Teilchen die Geschwindigkeit ~v (t), entsprechend der 4-Geschwindigkeit u. Unser System K ′ bewege sich gegen K mit Geschwindigkeit − V ~e1 . Nach Galilei würden wir dann die Geschwindigkeit ~v ′ = ~v + V ~e1 messen. In der relativistischen Theorie transformieren wir zunächst den 4-Vektor u auf unser System. Da sich K ′ in K mit − V bewegt, erhalten wir aus (T7.33) u0 1−V 2 /c2 + √V u u′0 = √ u′1 0 √V u c 1−V 2 /c2 = c +√ 1 1−V 2 /c2 u1 1−V 2 /c2 u ′ 2 = u2 (T7.47) u ′ 3 = u3 u ′ erfüllt die Gleichungen (T7.46) mit ~v → ~v ′ . ~v ′ = d~r ′ /dt ist die im Laborsystem K ′ gemessene übliche Geschwindigkeit. Also erhalten wir für die 0-Komponente ! 1 c V v c 1 p , =p + p u′0 = p 1 − v ′ 2 /c2 1 − V 2 /c2 1 − v 2 /c2 c 1 − v 2 /c2 oder 1 p 1 − v ′ 2 /c2 =p Für die Komponenten uj , j = 2, 3, folgt u′j = p 1 + V v1 /c2 p . 1 − V 2 /c2 1 − v 2 /c2 v ′j 1 − v ′ 2 /c2 = uj = p T7 - 27 vj 1 − v 2 /c2 , (T7.48) oder mit (T7.48) v ′j p vj = p 1 − V 2 /c2 1 − v 2 /c2 1 + V v1 /c2 p 1 − v 2 /c2 p 1 − V 2 /c2 = v1 . 1 + V v1 /c2 (T7.49) Die 1-Komponente ergibt v ′1 u′1 = √ v ′1 V +v1 1+V v1 /c2 y = 1−v ′ 2 /c2 =√ 1 1−V 2 /c2 √ 1 1−v2 /c2 (V + v1 ) (T7.50) . (T7.49), (T7.50) sind das relativistische Additionsgesetz der Geschwindigkeit. Wir sehen sofort, dass es für c → ∞ in das Galilei’sche Additionsgesetz übergeht. (T7.48) enthält eine wichtige Aussage. Nehmen wir an, dass sowohl | V | als auch | ~v | kleiner sind als c. Dann folgt aus (T7.48) 0< p 1 1 − v ′ 2 /c2 < ∞, also | ~v ′ | < c. Durch Addition zweier Geschwindigkeiten, die kleiner sind als die Lichtgeschwindigkeit, kann keine Überlichtgeschwindigkeit erzeugt werden. Nehmen wir nun an, dass entweder | V | oder | ~v | gegen c streben. Dann wird die rechte Seite von (T7.48) unendlich und es folgt | ~v ′ | → c: Addiert man zu c eine Geschwindigkeit kleiner c, so erhält man wieder c! Eine einfache Anwendung des Additionsgesetzes ist die Erklärung von Fizeau’s Experiment. Licht läuft durch eine Flüssigkeit, Brechungsindex n, die mit der Geschwindigkeit vF ℓ durch ein Rohr strömt. Fizeau fand als Phasengeschwindigkeit des Lichtes, gemessen im Laborsystem v′ = 1 c + 1 − 2 vF ℓ n n und interpretiert den zweiten Beitrag als die Geschwindigkeit des Äthers. Nun betrachten wir das Experiment im Rahmen der Relativitätstheorie. Im Ruhesystem K der Flüssigkeit ist die Phasengeschwindigkeit ~v = nc ~e1 . Das Laborsystem K ′ bewegt sich gegen K mit − V ~e1 = − vF ℓ ~e1 , gemessen in K. Nach (T7.50) messen wir damit im Laborsystem die Phasengeschwindigkeit vF ℓ + nc . v′ = 1 + vF ℓc2c/n T7 - 28 Im Experiment ist vF ℓ /c ≪ 1. Also können wir entwickeln 1 1+ 1 vF ℓ n c v 2 1 vF ℓ Fℓ +O n c c v 2 vF ℓ 1 vF ℓ c Fℓ 1+n 1− +O n c n c c v 2 c 1 n Fℓ vF ℓ + O 1 + vF ℓ − n c nc c v c 1 Fℓ + 1 − 2 vF ℓ + vF ℓ O . n n | {z c } = 1− v′ = = = ≪vF ℓ Wir haben Fizeau’s Ergebnis gefunden. E Relativistische Invarianten Wir wissen: In der nichtrelativistiscchen Physik sind Skalarprodukte unter Drehungen O des Koordinatensystems invariant, also Skalare. ~b ′ = O ~b ~a ′ = O ~a, y ~a ′ · ~b ′ = ~a · ~b . 3 X aj δjk bk . Das Skalarprodukt ist definiert als ~a · ~b = 3 X j=1 aj bj ≡ (T7.51) j,k=1 Das Kroneckersymbol δjk repräsentiert die Elemente der Einheitsmatrix. Diese wird als der ’metrische Tensor’ des euklidischen Raumes bezeichnet. Etwas entsprechendes gilt auch in der relativistischen Physik. Wir wissen s2 = (x0 )2 − (x1 )2 − (x2 )2 − (x3 )2 ist unter Lorentztransformationen invariant. Wir bilden die entsprechende Kombination für die 4-Geschwindigkeit (u0 )2 − (u1 )2 − (u2 )2 − (u3 )2 = T 7.46 = γ 2 c2 − γ 2 v12 + v22 + v32 , 2 2 γ c v2 1− 2 c = c2 . γ=p 1 1 − v 2 /c2 Dies gilt für jedes Inertialsystem, also ist (u0 )2 − 3 X (uj )2 = c2 j=1 T7 - 29 ein Lorentzskalar. (T7.52) Dies ist nur ein Sonderfall eines allgemeinen Ergebnisses. Zur kompakten Formulierung führen wir den metrischen Tensor gjk ein: g00 = 1 , gjj = − 1 , Als Matrix: j = 1, 2, 3 , gjk = 0 für j 6= k . (T7.53) 1 0 0 0 0 −1 0 0 g= 0 0 −1 0 . 0 0 0 −1 Das ’Skalarprodukt’ zweier 4-Vektoren a, b ist definiert als 3 X j,k=0 aj gjk bk = a0 b0 − a1 b1 + a2 b2 + a3 b3 . (T7.54) Es ist ein Lorentzskalar, d.h. invariant unter Lorentztransformationen. Das kann man leicht mit Hilfe der Matrix Λ der Lorentztransformationen (Gl. T7.31) nachrechnen. gjk ist die ’Metrik’ im Minkowski Raum. Sie ersetzt das Kronecker-Symbol, das als ’euklidische Metrik’ in Gl. (T7.53) auftritt. Da in g sowohl positive als auch negative Elemente auftreten, redet man von der ’indefiniten’ Metrik des Minkowski Raumes. T7.5 Relativistische Dynamik Bisher haben wir die rein kinematische Beschreibung der Bewegung von Teilchen diskutiert und den Effekt von Koordinatentransformationen in der Raum-Zeit, dem Minkowski Raum, untersucht. Jetzt wollen wir uns der Dynamik, d.h. den Bewegungsgleichungen, zuwenden. Die Grundlage der Newton’schen Mechanik ist die Gleichung d ~ , ~p = K dt ~ Kraft. Wir wollen zunächst das relativistische Gegenstück zu p~ konp~ = m ~r˙ : Impuls, K: struieren. Der relativistische Impuls P muss ein 4-Vektor sein: P = (P 0 , P 1 , P 2 , P 3 ) . Für c → ∞ sollen die räumlichen Komponenten in den nicht-relativistischen Impuls übergehen: −−∞ → p~ = m ~v . (P 1 , P 2 , P 3 ) − c− → Offensichtlich ist der einfachste Ansatz, der diese Bedingungen erfüllt P = mu, mit der 4-Geschwindigkeit u, Gl. (T7.45). T7 - 30 (T7.55) Die träge Masse m ist eine Eigenschaft des Teilchens, sollte also vom Koordinatensystem unabhängig sein, ist also ein Lorentzskalar. u ist ein 4-Vektor. Damit ist m u ein 4-Vektor. Im nicht-relativistischen Limes erhalten wir das gewünschte Ergebnis, da (u1 , u2 , u3 ) −→ ~v . c→∞ Wir sind hier sehr theoretisch vorgegangen. Was einging war a) Transformationseigenschaften (P ist 4-Vektor), b) nicht-relativistischer Limes, c) Einfachheit. Bei einem solchen Vorgehen müssen wir als nächsten Schritt aus (T7.55) experimentell überprüfbare Konsequenzen herleiten und sehen, ob das Experiment sie verifiziert. Es gibt andere Möglichkeiten, die Form des relativistischen Impulses zu bestimmen. Wenn wir mehr über die klassische Mechanik wüssten, könnten wir zeigen, dass (T7.55) eindeutig aus tiefliegenden Prinzipien, die die Struktur der Theorie beherrschen, folgt. Eine weitere Möglichkeit besteht in der Diskussion von elastischen Stößen, bei denen Energie und Impuls erhalten sein muss. Diese Gedankenexperimente sind allerdings recht kompliziert und die Argumentation, wie sie in manchen Schulbüchern steht, ist nicht völlig zwingend. Wir wollen jetzt den Ausdruck (T7.55) genauer diskutieren. (P 0 , P 1 , P 2 , P 3 ) = m (u0 , u1 , u2 , u3 ) . Aus Gl. (T7.46) folgt P0 = j P = cm p 1 − v 2 /c2 p m vj 1 − v 2 /c2 . (T7.56) In älteren Darstellungen führt man hier häufig eine ’geschwindigkeitsabhängige träge Masse’ ein: m m(v) = p . 1 − v 2 /c2 Dann kann man die räumliche Komponenten von P in Newton’scher Form schreiben: (P 1 , P 2 , P 3 ) = p~ = m(v) ~v . Dies ist kein befriedigendes Konzept. m(v) ist eine ein-komponentige Größe, aber kein Lorentzskalar. Es hängt ja von v und damit vom jeweils verwendeten Inertialsystem ab. Zwei Beobachter, die sich gegeneinander bewegen, weisen dem Teilchen unterschiedliche ’Massen’ m(v) zu. Diese ’träge Masse’ ist also keine intrinsische Eigenschaft des Teilchens. Die Aussage, dass die Masse zunimmt, wenn das Teilchen sich bewegt, ist äußerst missverständlich und verschleiert den wahren Gehalt der Relativitätstheorie. Masse ist ’Ruhemasse’ m, ein Lorentzskalar. T7 - 31 Wie kann man m unabhängig vom Koordinatensystem bestimmen? Wir bilden den Lorentzskalar (P 0 )2 − (P 1 )2 + (P 2 )2 + (P 3 )2 = m2 (u0 )2 − (u1 )2 + (u2 )2 + (u3 )2 . Mit (T7.52) folgt m2 = (P 0 )2 − (P~ )2 . c2 (T7.57) unabhängig vom Koordinatensystem. P~ = (P 1 , P 2 , P 3 ) ist der räumliche Impuls. Welche Bedeutung hat die zeitliche Komponente P 0? Um dies zu sehen, entwickeln wir P 0 für v ≪ c. Es folgt 1 v2 + ··· = mc 1+ P =p 2 c2 1 − v 2 /c2 0 cm c P 0 = m c2 + 1 2 . 1 m v2 + · · · 2 m v 2 ist aber die nicht-relativistische kinetische Energie. Wir schließen: cP0 = E (T7.58) ist die relativistische Energie des Teilchens. Das macht Sinn: In der Mechanik haben wir gelernt, dass die Energie erhalten ist, wenn die Kräfte nicht von der Zeit (oder der Geschwindigkeit) abhängen. Es muss gleichgültig sein, ob wir unser Experiment zur Zeit t oder zur Zeit t + δt durchführen. Eine Bedingung für Impulserhaltung ist, dass die Kräfte nur von Relativabständen abhängen. Es muss gleichgültig sein, ob wir unseren Experimentiertisch am Ort ~r oder am Ort ~r + δ~r aufstellen. Die Loretztransformationen verkoppeln t und ~r. Also sollten auch E und ~ p verkoppelt sein, wie wir es jetzt gefunden haben. E/c ist die Null-Komponente des 4-Impulses: E ~ ,P . (T7.59) P = c Für ein ruhendes Teilchen folgt E = m c2 , (~v = 0) . (T7.60) Energie und Ruhemasse sind äquivalent. In der nicht-relativistischen Theorie war die Energie nur bis auf eine irrelevante Konstante festgelegt. In der relativistischen Theorie haben wir diese Freiheit nicht mehr. E ist im gegebenen Inertialsystem K eindeutig als festgelegt. E = cP0 = p c2 m 1 − v 2 /c2 T7 - 32 (T7.61) Aus (T7.56) sehen wir noch Folgendes: Ein Teilchen mit Masse m > 0 kann sich nur mit | ~v | < c bewegen. Für | ~v | = c wären Energie und Impuls unendlich. Ein masseloses Teilchen m = 0, das sich mit | ~v | < c bewegt, hat Energie und Impuls Null, ist also physikalisch gar nicht vorhanden. Es ist aber nicht ausgeschlossen, dass es masselose Teilchen gibt, die sich mit Lichtgeschwindigkeit bewegen. Dann steht in (T7.56) 0/0, also etwas unbestimmtes. Die Relation zwischen dem räumlichen Impuls und der Energie ist aber auch in diessem Fall festgelegt. Aus (T7.56) folgt ganz allgemein Pj = E P0 vj = 2 vj c c j = 1, 2, 3 . Nehmen wir nun an, das Teilchen bewegt sich mit Lichtgeschwindigkeit in Richtung ~e, so folgt E P~ = ~e . c Die Photonen (Lichtteilchen) sind genau solche masselose Teilchen, die sich mit Lichtgeschwindigkeit bewegen. Vergleichen Sie dieses Ergebnis mit Gleichungen (T4.63): ~π = w ~σ = ~e . 2 c c Diese theoretiscchen Ergebnisse lassen sich in Stoßexperimenten verifizieren. Die gesamte experimentelle Hochenergiephysik befasst sich mit Stößen relativistischer Teilchen, bei denen der 4-Impuls erhalten ist. Als Beispiel wollen wir nur den Zerfall eines im Laborsystem ruhenden Teilchens, Masse m (1), betrachten. Vor dem Zerfall ist der 4-Impuls P (1) = c m (1), ~0 . Das Teilchen 1 zerfalle in Teilchen 2 und 3, mit 4-Impulsen ! c m (2) p , P~ (2) , P~ (2) 6= 0 P (2) = 1 − v 2 (2)/c2 ! c m (3) p P (3) = , P~ (3) , P~ (3) 6= 0 . 1 − v 2 (3)/c2 Es gilt die Erhaltung des 4-Impulses P (1) = P (2) + P (3) . Es folgt P~ (2) = − P~ (3) , also m (2) ~v (2) p 1− v 2 (2)/c2 =p m (3) ~v (3) 1 − v 2 (3)/c2 T7 - 33 , sowie c m (1) = p c m (3) c m (2) +p . 2 2 1 − ~v (2)/c 1 − ~v 2 (3)/c2 Da ~v (1) und ~v (2) von Null verschieden sind, sind die Wurzeln kleiner als 1. Also folgt m (1) > m (2) + m (3) . Der Teil m (1) − m (2) − m (3) > 0 der Ruhemasse ist in kinetische Energie verwandelt worden. Wie Sie alle wissen, beruhen hierauf Kernkraftwerke und schlimmere Erfindungen. Die hier eingeführte Energie des Teilchens E = c P 0 verdient noch eine genauere Betrachtung. Nach Konstruktion ist E die relativistische Verallgemeinerung der kinetischen Energie. In der nicht-relativistischen Physik hat ein Teilchen im Allgemeinen auch potentielle Energie. Wie steht es damit in der Relativitätstheorie? In der relativistischen Physik ist ein Potential V (~r) kein akzeptables Lorentz-kovariantes Objekt. Wenn wir die Wechselwirkung zweier Teilchen durch V (~r1 − ~r2 ) beschreiben, nehmen wir ja an, dass sich die Ortsänderung eines Teilchens instantan dem anderen mitteilt. Wechselwirkungen werden durch Felder mit ihrer eigenen Dynamik vermittelt. An die Stelle der potentiellen Energie tritt die Energie der Felder. Wir haben bisher nur den 4-Impuls eingeführt und können daher auch nur die Physik der Stöße behandeln, d.h. Experimente, zu deren Verständnis die Erhaltung des 4-Impulses genügt. Zur vollen Beschreibung einer Bewegung benötigen wir das relativistische Gegenstück zur Newton’schen Bewegungsgleichung. d ~ . ~p = K dt Offensichtlich müssen wir p~ durch den 4-Impuls und t durch die Eigenzeit τ ersetzen. Wir erhalten d j P = Kj , dτ j = 0, 1, 2, 3 , (T7.62) wobei die K j die Komponenten eines 4-Vektors K sein müssen. Für viele der Kräfte, die wir aus der nicht-relativistischen Physik kennen (elastische Kräfte, Reibungskräfte), gibt es keine einfache relativistische Verallgemeinerung. Tatsächlich sind dies effektive Kräfte, anwendbar, solange alle Relativgeschwindigkeiten klein sind gegen die Lichtgeschwindigkeit und solange alle Teilchenabstände so klein sind, dass wir Retardierungseffekte vernachlässigen dürfen, so dass eine Lageänderung eines Teilchens praktisch momentan allen anderen mitgeteilt wird. Dann gilt im Laborsystem die klassische Physik. In der klassischen Physik gibt es nur zwei fundamentale Kräfte, die Gravitation und die elektromagnetische Kraft. Elastische und Reibungskräfte entstehen mikroskopisch gesehen durch elektromagnetische Wechselwirkung der Ladungen in den Atomen. Die Behandlung der Gravitation ist Thema der allgemeinen Relativitätstheorie. Hier konzentrieren wir uns auf die elektromagnetische Kraft, d.h. die Lorentzkraft ~k = q E ~ + ~r˙ × B ~ . T7 - 34 ~ und B ~ die gleiche Dimension haben. Deshalb Zunächst wollen wir dafür sorgen, dass E ~ ersetzen wir B gemäß ~ ~ →B. B c (T7.63) Damit wird die Lorentzkraft zu ! , B3 − ṙ3 c B2 B1 − ṙ1 c B3 B2 − ṙ2 c ˙ ~k = q E ~ + ~r × B ~ c oder in Komponenten k1 = k2 = k3 = E1 + q E2 + q E3 + q ~ r˙2 c ~ r˙3 c ~ r˙1 c B1 . (T7.64) Die Geschwindigkeiten ersetzen wir durch ihr relativistisches Gegenstück ṙj → uj . Damit tauchen in kj , die räumlichen Komponenten von u auf. Dann sollte aber auch die zeitliche Komponente u0 auftauchen; nur die räumlichen Komponenten alleine bilden kein Lorentz kovariantes Objekt. Nun gilt aber lim c→∞ u0 = 1. c Konsistent mit der Ersetzung ṙj → uj können wir also die Koeffizienten 1 bei Ej , j = 1, 2, 3 0 durch uc ersetzen. Wir erhalten so die räumlichen Komponenten der relativistischen Lorentzkraft K 1 = qc E1 u0 + u2 B3 − u3 B2 q 2 0 3 1 K = c E2 u + u B1 − u B3 q 3 0 1 2 K = c E3 u + u B2 − u B1 . (T7.65) Wir benötigen noch eine Komponente K 0 . Wir wissen, dass P 0 mit der Energie zusammenhängt: P 0 = E/c. Also bestimmen wir die Energie in nicht-relativistischer Näherung. Aus ! ˙ ~ r ~ + ×B ~ ~r˙ · m ~r¨ = q E c folgt d m ~r˙ 2 ~ · ~r˙ . = qE dt 2 Links steht die Änderung der kinetischen Energie, das relativistische Gegenstück ist T7 - 35 d dτ (c P 0 ). ~r˙ ersetzen wir wieder durch die räumlichen Komponenten von u und erhalten d 0 q P = E1 u1 + E2 u2 + E3 u3 = K 0 . dτ c Gl. (T7.65, T7.66) können wir in Matrixform zusammenfassen K0 0 E1 E2 1 K q E1 0 = K 2 c E −B 2 3 K3 E3 E3 u0 −B2 u1 2 B1 u B3 0 B2 (T7.66) −B1 0 (T7.67) u3 (Sie sehen hier übrigens den aus dem ersten Semester bekannten Effekt, dass hinter einem Kreuzprodukt eine schiefsymmetrische Matrix steckt). Damit haben wir einen 4-komponentigen Vektor K konstruiert, dessen Komponenten (K 1 , K 2 , K 3 ) im Limes c → ∞ die Lorentzkraft ergeben. und der eine Chance hat, ein Lorentzvektor zu sein. Die Matrix in (T7.67) ist der Tensor des elektromagnetischen Feldes, üblicherweise als F k ℓ bezeichnet. Man schreibt also 3 qX k ℓ K = F ℓu , c k k = 0, 1, 2, 3 , (T7.68) ℓ=0 bzw. q F u. (T7.69) c Was müssen wir zeigen, um nachzuweisen, dass K ein 4-Vektor ist? 4-Vektoren transformieren sich beim Übergang K → K ′ gemäß (T7.31): K= x′ = Λx. γ −β γ 0 0 −β γ γ 0 0 Λ= , 0 0 1 0 0 0 0 1 Es folgt x = Λ−1 x ′ . Λ−1 transformiert von Geschwindigkeit − V . Also folgt Λ−1 aus Λ β → −β γ βγ Λ−1 = 0 0 β= V 1 . :γ= p c 1 − V 2 /c2 (T7.70) K ′ auf K, und K bewegt sich gegen K ′ mit einfach durch die Ersetzung V → − V , d.h. βγ 0 0 γ 0 0 . 0 1 0 0 0 1 Die Relation Λ Λ−1 = 1 = Λ−1 Λ T7 - 36 (T7.71) ist einfach nachzurechnen. In K ′ muss gelten K′ = mit q ′ ′ F u c (T7.72) E ′3 E ′2 0 E ′1 E′ 0 B ′3 −B ′2 F ′ = ′1 E 2 −B ′3 0 B ′1 0 E ′3 B ′2 −B ′1 (T7.73) und K ′ = Λ K, u ′ = Λ u. Multiplizieren wir (T7.69) mit Λ und setzen u = Λ−1 u ′ ein, so folgt q K ′ = Λ F Λ−1 u ′ . c Vergleich mit (T7.72) ergibt F ′ = Λ F Λ−1 . (T7.74) Dies ist das Transformationsgesetz für einen Lorentztensor zweiter Stufe. Die so bestimmen Elemente von F ′ müssen die Maxwellgleichungen in K ′ erfüllen, also ~′=0 ∇r ′ · B usw. F ′ ergibt sich als F ′ γ −β γ = 0 0 −β γ 0 0 γ 0 0 0 E1 = γ E2 − β γ B3 γ E3 + β γ B2 0 E1 E2 E3 γ 0 B3 −B2 0 0 βγ E1 0 B1 0 1 0 E2 −B3 0 E3 B2 −B1 0 0 1 βγ 0 0 γ 0 0 0 0 1 0 0 1 γ E2 − β γ B3 γ E3 + β γ B2 −β γ E2 + γ B3 −β γ E3 − γ B2 . β γ E2 − B3 γ 0 B1 β γ E3 + γ B2 −B1 0 E1 0 Es folgt E ′1 = E1 ; E ′2 = γ (E2 − β B3 ) ; E ′3 = γ (E3 + β B2 ) B ′1 = B1 ; B ′2 = γ (β E3 + B2 ) ; B ′3 = γ (−β E2 + B3 ) . ~ nach B! ~ Dies war zu erwarten, denn wenn wir Die Lorentztransformationen vermischen E uns gegen eine Ladung bewegen, beobachten wir auch einen Strom. Wir müssten jetzt also noch Folgenden nachweisen: Wir führen in den Maxwellgleichungen die Lorentztransformation (ct, ~r) → (ct ′ , ~r ′ ) durch. Das Ergebnis müsste sich wieder in der ursprünglichen Form schreiben lassen, mit den T7 - 37 ~ ′, B ~ ′ (Gl. T7.75), und einem transformierten ’4-Strom’ (c ρ, ~j) → transformierten Feldern E (c ρ ′ , ~j). Dies ist wirklich der Fall. Auf diese Weise sind die Lorentztransformationen gefunden worden - vor Aufstellung der Relativitätstheorie. Man bemerkte, dass die Maxwellgleichungen nicht Galilei-invariant sind. Da ein ausgezeichnetes Bezugssystem des Äthers sich jeder Beobachtung entzog, suchte man nach einer Verallgemeinerung der Galilei-Transformation, die die Maxwellgleichungen invariant lässt. Wir wollen den Beweis der Invarianz der Maxwellgleichungen hier nicht durchführen. Er ist in unserer nicht-relativistischen Formuierung der Gleichungen sehr mühsam. Einfach durchschaubar wird er nur, wenn wir zuerst die Maxwellgleichungen in relativistisch kovarianter Form schreiben. Dann werden sie sehr einfach und elegant. Zum Beispiel werden die inhomogenen Gleichungen zu 3 3 X 4π X ∂ j F = gk ℓ j ℓ k ∂xj c j=0 , j = (c ρ, ~j) , ℓ=0 zusammengefasst (j ℓ = Komponente des 4-Stromes, ǫ0 = 1/4 π gesetzt). Um zu dieser Formulierung zukommen, müssten wir aber die Algebra im Minkowski-Raum genauer studieren. Das ist nicht schwer, führt aber einige neue Notation ein, die wir hier umgangen haben. Zum Abschluss wollen wir die relativistische Darstellung einer ebenen elektromagnetischen ~ r , t), B(~ ~ r , t) werden zum Feldtensor F (x) zusammengefasst; Welle diskutieren. Die Felder E(~ ~ 0, B ~ 0 ergeben den Feldtensor F (0) . Wir schreiben also die Amplituden E h i F jℓ (x) = F (0) j ℓ exp i (~k · ~r − ωt) . Das Argument des Exponenten müssen wir in relativistischer Form schreiben. ~k · ~r − ωt = k1 x1 + k2 x2 + k3 x3 − ω x0 c = − 3 X kj gj ℓ xℓ (T7.75) j, ℓ=0 mit ω . (T7.76) c Das Argument der Exponentialfunktion muss ein Lorentskalar sein. x it ein Lorentzvektor, und (T7.75) hat die Form (T7.54). Invarianz erzwingt: k0 = k = k0 , k1 , k2 , k3 ist ein Lorentzvektor. Die ebene Welle wird relativistisch in der Form 3 X km gm n xn Fℓj (x) = F (0) j ℓ exp − i m, n=0 dargestellt. Die Dispersionsrelation (T4.14) ist relativistisch invariant. T7 - 38 (T7.77) (T7.78) ω2 ~ 2 −k = 0 c2 (T4.14) 3 X y kj gj ℓ kℓ = 0 . (T7.79) j, ℓ=0 Wir können jetzt sehr einfach den relativistischen Dopplereffekt berechnen. Eine Quelle sende in ihrem Ruhesystem K eine Welle mit 4-Vektor k aus. Unser Laborsystem K ′ bewegt sich mit V ~e1 gegen K. Also empfangen wir eine Welle mit 4-Vektor k′ = Λk. Nehmen wir an, die Welle propagiert in ~e1 -Richtung ω , k1 , 0, 0 , ω = c | k1 | . k= c Dann messen wir ′ ω ′ ′1 k = , k , 0, 0 , ω ′ = c | k ′ 1 | . c 1 ω V 1 ω′ =q − k c c c V2 1 − c2 1 V ω ′1 1 q k = − +k . 2 c c V 1 − c2 Nehmen wir weiter an, das k1 > 0 , d.h. k1 = (T7.80) ω c. Wir messen dann die Frequenz 1 − Vc ωE ≡ ω ′ = q ω. 2 1 − Vc2 (T7.81) Dies sollten wir mit dem nicht-relativistischen Dopplereffekt vergleichen. In der Notation von § 7.1 ist ω ′ = ωE , ω = ωS , und Gleichungen (T7.4), (T7.5) ergeben ωE = 1 − vcEa ca ca − vE ωS = ωS . ca ca − vS 1 − vcSa (T7.82) Die Geschwindigkeit V ist die Relativgeschwindigkeit zwischen Empfänger und Sender. V = vE − vS . Wie wir sehen, sind die Ausdrücke (T7.81), (T7.82) deutlich verschieden. Mechanische Wellen (T7.82) laufen in einem Trägermedium, und deshalb treten die Geschwindigkeiten vE , vS von Empfänger und Sender relativ zum Medium auf. Für elektromagnetische Wellen gibt es kein Trägermedium, und deshalb tritt nur die Relativgeschwindigkeit V zwischen Sender und Empfänger auf. Der relativistische Dopplereffekt spielt in der Astronomie eine große Rolle. Durch Messung des Dopplereffekts in den Spektren der Sterne werden die Geschwindigkeiten relativ zum Sonnensystem bestimmt. T7 - 39 Wie in §T7.1 haben wir hier angenommen, dass wir uns genau in Richtung des Senders bewegen. Für andere Bewegungsrichtungen müssen wir die allgemeine Form der Lorentztransformation anwenden, (siehe die Diskussion unter Gl. T7.34). Dann erhalten wir zusätzlich zur Frequenzänderung - dem Dopplereffekt - eine Änderung der Richtung von ~k ′ relativ zu ~k. Dies ist die ’Aberration’ des Lichtes. Verfolgt man im Verlauf eines Jahres den genauen Ort eines Sternes am Himmel, so erhält man eine kleine Ellipse, d.h. ein verzerrtes Bild der Erdbahn. Die Exzentrizität der Ellipse hängt von der Lage des Sternes relativ zur Eliptik ab. Steht er genau senkrecht über der Ekliptik, so ist es ein Kreis mit Radius ∼ 20 Bogensekunden. Die Aberration hat nichts mit der Entfernung des Sternes zu tun. Sie resultiert aus der Geschwindigkeit der Erdbewegung um die Sonne. Es gibt natürlich auch eine Aberraton auf Grund der Rotation der Erde. Diese ist am Äquator ungefähr 0.3 Bogensekunden. T7 - 40