Allgemeine Relativitätstheorie und Kosmologie Stefan Weinzierl 14. Februar 2016 1 Inhaltsverzeichnis 1 Einführung 1.1 Geschichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Spezielle Relativitätstheorie 2.1 Postulate . . . . . . . . . . . . . . . 2.2 Abstand, Metrik und Vierervektoren 2.3 Die Eigenzeit . . . . . . . . . . . . 2.4 Die Lorentztransformation . . . . . 2.5 Transformation der Geschwindigkeit 2.6 Die Vierergeschwindigkeit . . . . . 2.7 Die Lorentzgruppe . . . . . . . . . 2.8 Tensoren im Minkowski-Raum . . . 2.9 Die relativistische Mechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 4 6 6 6 9 10 11 12 13 15 17 3 Elektrodynamik 20 3.1 Die Maxwell’schen Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . 20 3.2 Die Lagrangedichte für die Wechselwirkung zwischen Teilchen und elektromagnetischen Feldern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 3.3 Die Lagrangedichte der Elektrodynamik . . . . . . . . . . . . . . . . . . . . . . 25 4 Erhaltungssätze 27 4.1 Noether’sche Erhaltungsgrößen . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4.2 Translationsinvarianz und der Energie-Impuls-Tensor . . . . . . . . . . . . . . . 28 4.3 Der Energie-Impuls-Tensor des elektromagnetischen Feldes . . . . . . . . . . . 30 5 Riemann’sche und semi-Riemann’sche Geometrie 5.1 Mannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . 5.2 Differentialformen und Integration auf Mannigfaltigkeiten 5.3 Tensoren . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Riemann’sche Mannigfaltigkeiten . . . . . . . . . . . . . 5.5 Hodge-Theorie . . . . . . . . . . . . . . . . . . . . . . . 5.6 Die kovariante Ableitung . . . . . . . . . . . . . . . . . . 5.7 Der Levi-Civita-Zusammenhang . . . . . . . . . . . . . . 5.8 Der Satz von Stokes . . . . . . . . . . . . . . . . . . . . . 5.9 Der Krümmungstensor . . . . . . . . . . . . . . . . . . . 5.10 Symmetrien und Killingvektoren . . . . . . . . . . . . . . 5.11 Der Weyl Tensor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 32 35 41 44 46 47 50 51 54 59 62 6 Allgemeine Relativitätstheorie 6.1 Größenordnungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Das Äquivalenzprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Bewegung eines Teilchens im Gravitationsfeld . . . . . . . . . . . . . . . . . . . 64 64 65 66 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 6.5 6.6 6.7 6.8 Die Einstein’schen Feldgleichungen . . . . . . . . . . . . . . . . Die Wirkung der allgemeinen Relativitätstheorie . . . . . . . . . . Der Energie-Impuls-Tensor in der allgemeinen Relativitätstheorie Der Palatini-Formalismus . . . . . . . . . . . . . . . . . . . . . . Der Vielbein-Formalismus . . . . . . . . . . . . . . . . . . . . . 7 Spezielle Lösungen der Einstein’schen Gleichungen 7.1 Die Schwarzschild-Lösung . . . . . . . . . . . . . . . . . . . . 7.2 Die Periheldrehung des Merkur . . . . . . . . . . . . . . . . . . 7.3 Schwarze Löcher, Kruskal-Koordinaten und Penrose-Diagramme 7.4 Geladene schwarze Löcher: Die Reissner-Nordström-Lösung . . 7.5 Rotierende schwarze Löcher: Die Kerr-Lösung . . . . . . . . . 8 Kosmologie 8.1 Die perfekte Flüssigkeit . . . . . . . . . . . . . . . . . . . . . 8.2 Energiebedingungen . . . . . . . . . . . . . . . . . . . . . . 8.3 Die Robertson-Walker-Metrik . . . . . . . . . . . . . . . . . 8.4 Die Friedmann’schen Gleichungen und der Hubble-Parameter 8.5 Evolution des Universums . . . . . . . . . . . . . . . . . . . 8.6 Die Rotverschiebung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 75 78 80 82 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 90 95 100 105 108 . . . . . . 110 110 111 112 115 117 119 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Schritte zur Quantengravitation 122 9.1 Die Gravitation als Eichtheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 9.2 Störungstheoretische Behandlung der Quantengravitation . . . . . . . . . . . . . 124 3 1 Einführung Literatur: - R. Sexl and H. Urbantke, Gravitation und Kosmologie, Spektrum Akademischer Verlag - W. Rindler, Relativity, Oxford University Press - S. Carroll, Spacetime and Geometry, Addison-Wesley - J. Peacock, Cosmological Physics, Cambridge University Press - Ch. Misner, K. Thorne and J. Wheeler, Gravitation, Freeman and Company - S. Weinberg, Gravitation and Cosmology, John Wiley - G. Ellis and S. Hawking, The Large-Scale Structure of Space-time, Cambridge University Press - G. Börner, The Early Universe - Facts and Fiction, Springer - L.D. Landau und E.M. Lifschitz, Band II, Klassische Feldtheorie, Akademie-Verlag 1.1 Geschichte 1638 G. Galilei 1676 O. Rømer Ch. Huygens 1687 I. Newton 1864 J. C. Maxwell 1900 M. Planck 1905 A. Einstein 1915 A. Einstein 1919 A. Eddingtons Relativitätsprinzip Endliche Lichtgeschwindigkeit 1000 Erddurchmesser pro Minute Gesetze der Mechanik Maxwell’schen Gleichungen h: Wirkungsquantum Spezielle Relativitätstheorie Allgemeine Relativitätstheorie Experimentelle Bestätigung der allgemeinen Relativitätstheorie Die Newton’schen Gesetze: 1. Ein freies Teilchen bewegt sich mit konstanter Geschwindigkeit entlang gerader Linien. 2. Die Kraft auf ein Teilchen ist gleich dem Produkt seiner Masse und seiner Beschleunigung ~F = m~a. 3. Die Kräfte von Aktion und Reaktion sind vom gleichen Betrag und entgegengesetzt. Übt ein Teilchen A eine Kraft ~F auf ein Teilchen B aus, so übt Teilchen B eine Kraft −~F auf Teilchen A aus. 4 Bemerkung: Physikalische Gesetze werden im allgemeinen bezüzglich eines Bezugssystems angegeben. Ein festes Bezugssystem ist eine gedachte Erweiterung eines festen Körpers. So bestimmt zum Beispiel die Erde ein festes Bezugssystem im gesamten Raum, bestehend aus den Punkten, die relativ zur Erde und untereinander fest (in Ruhe) sind. Ein Beispiel hierfür sind die Orte geostationärer Satelliten. Unter allen festen Bezugssystemen sind die Inertialsysteme besonders ausgezeichnet. Inertialsysteme sind dadurch definiert, daß sich in ihnen freie Teilchen mit konstanter Geschwindigkeit auf geraden Linien bewegen. Die Newton’schen Gesetze gelten in Inertialsystemen. Bemerkung: Newton postulierte die Existenz eines absoluten Raums, den er mit dem Schwerpunktssystem des Sonnensystems identifizierte. Newton ging ebenfalls von einer absoluten Zeit aus. Die Galileitransformation: Gegeben seien zwei Inertialsysteme K und K ′ , so daß sich der Ursprung von K mit der Geschwindigkeit v entlang der x-Achse von K ′ bewegt. Die Galileitransformation lautet: x′ = x + vt, y′ = y, z′ = z, t ′ = t. 5 2 Spezielle Relativitätstheorie 2.1 Postulate Inertialsystem: Bezugssystem, in dem sich ein Körper, der keinen äußeren unterliegt, mit konstanter Geschwindigkeit bewegt. Verschiedene Inertialsysteme bewegen sich relativ zueinander mit geradlinig-gleichförmiger Geschwindigkeit. Relativitätsprinzip: Naturgesetze gelten in jedem Inertialsystem in gleicher Form. Prinzip einer endlichen Signalgeschwindigkeit (Maximalgeschwindigkeit der Wirkungsausbreitung). Die Signalgeschwindigkeit ist in jedem Inertialsystem gleich, und gleich der Lichtgeschwindigkeit c = 2.99792 · 108m/s. Grenzfall der klassischen Mechanik: c → ∞. In der klassischen Mechanik gilt das Galileische Relativitätsprinzip: Räumliche Beziehungen hängen vom Bezugssystem ab. Die Zeit wird allerdings als absolut betrachtet. In der speziellen Relativitätstheorie ist die Zeit keine absolute Größe mehr. Beispiel: Zwei Intertialsysteme K und K ′ , wobei sich K relativ zu K ′ nach rechts relativ der Achsen x und x′ bewege. Von irgendeinem Punkt A aud der x-Achse werden Signale in zwei entgegengesetzte Richtungen ausgesandt. Da die Signalgeschwindigkeit im System K in beiden Richtungen gleich c ist, werden, gemessen im System K, die von A aus in gleicher Entfernung befindlichen Punkte B und C von den Signalen in gleicher Zeit erreicht. Diese beiden Ereignisse der Ankunft der Signale ist für einen Beobachter im System K ′ aber keineswegs gleichzeitig. 2.2 Abstand, Metrik und Vierervektoren Ereignis charakterisiert durch den Ort, an dem es stattfindet, und durch den Zeitpunkt, an dem es geschieht. Ein Ereignis ist also durch drei Ortskoordinaten und einer Zeitkoordinate in einem vier-dimensionalen Raum gegeben. Betrachte wieder die Bezugssysteme K und K ′ : Betrachte ein erstes Ereignis, das darin besteht daß vom Punkt (x1 , y1 , z1 ) zur Zeit t1 ein Lichtsignal ausgesandt wird. Dieses Signal trifft zur Zeit t2 am Punkt (x2 , y2 , z2 ) ein (Ereignis 2). Da sich das Signal mit Geschwindigkeit c ausbreitet, hat es die Entfernung c(t2 − t1 ) 6 zurückgelegt. Anderseits ist die Entfernung natürlich q (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 Daher gilt: c2 (t2 − t1 )2 − (x1 − x2 )2 − (y1 − y2 )2 − (z1 − z2 )2 = 0. In K ′ seien die Koordinaten des ersten Ereignisses x′1 , y′1 , z′1 ,t1′ und die des zweiten Ereignisses x′2 , y′2 , z′2 ,t2′ . Wegen der Konstanz der Lichtgeschwindigkeit gilt auch in diesem System c2 (t2′ − t1′ )2 − (x′1 − x′2 )2 − (y′1 − y′2 )2 − (z′1 − z′2 )2 = 0. Definition: Sind x1 , y1 , z1,t1 und x2 , y2 , z2 ,t2 die Koordinaten von zwei beliebigen Ereignissen, so heißt die Größe q s12 = c2 (t2 − t1 )2 − (x1 − x2 )2 − (y1 − y2 )2 − (z1 − z2 )2 der Abstand zwischen diesen beiden Ereignissen. Aus der Invarianz der Lichtgeschwindigkeit folgt: Verschwindet der Abstand zwischen zwei Ereignissen in einem Bezugssystem, so auch in allen anderen. Allgemeiner gilt: Der Abstand zwischen zwei Ereignissen ist in allen Bezugssytemen gleich. Beweis: Sind zwei Ereignisse infinitessimal benachbart, so ist der Abstand ds2 = c2 dt 2 − dx2 − dy2 − dz2 . Gilt ds = 0 in einem Inertialsystem, so verschwindet ds′ in einem anderen System ebenfalls. ds und ds′ sind infinitessimale Größen gleicher Ordnung. Aus diesen beiden Umständen folgt, daß sie zueinander proportional sein müssen: ds2 = a ds′2 Die Proportionalitätskonstante a kann nicht von den Raum- und Zeitkoordinaten abhängen, da dies der Homogenität von Raum und Zeit widersprechen würde. a kann auch nicht von der Richtung der Relativgeschwindigkeit anhängen, da dies im Widerspruch zur Isotropie des Raumes stehen würde. Daher kann a nur vom Betrag der Relativgeschwindigkeit der beiden Inertialsysteme abhängen. Betrache die Bezugsysteme K, K1 und K2 . Sei ~v1 die Geschwindigkeit von K1 relativ zu K, ~v2 die Geschwindigkeit von K2 relativ zu K und ~v12 die Geschwindigkeit von K2 relativ zu K1 . Dann gilt ds2 = a(v1 )ds21 , ds2 = a(v2 )ds22 , ds21 = a(v12 )ds22 , und daher a(v2 ) = a(v12 ). a(v1 ) 7 Nun hängt v12 auch vom Winkel zwischen ~v1 und ~v2 ab, die linke Seite dagegen nicht. Daher muß a(v) gleich einer Konstanten sein, die wie aus derselben Gleichung folg, gleich 1 sein muß. Daher ds2 = ds′2 , und aus der Gleichheit infinitesimaler Abstände folgt auch die endlicher Abstände: s = s′ . s212 > 0 zeitartiger Abstand; es gibt ein Bezugssystem, in dem die Ereignisse 1 und 2 am gleiche Ort stattfinden. s212 < 0 raumartiger Abstand; es gibt ein Bezugssystem, in dem die Ereignisse 1 und 2 gleichzeitig stattfinden. s212 = 0 lichtartiger Abstand; Lichtkegel Zwei Ereignisse können miteinander nur dann kausal verbunden sein, wenn der Abstand zwischen ihnen ≥ 0 ist. Dies folgt unmittelbar daraus, daß sich keine Wirkung mit einer Geschwindigkeit ausbreiten kann, die größer als die des Lichtes ist. Vierervektoren: Die Koordinaten (ct, x, y, z) eines Ereignisses können als Komponenten eines Vektors in einem vier-dimensionalen Raum betrachtet werden. x0 = ct, x1 = x, x2 = y, x3 = z. xµ = (x0 , x1 , x2 , x3 ), = (x0 ,~x). Wir verwenden griechische Indizes µ, ν, ..., die die Werte 0, 1, 2, 3 annehmen, um die Komponenten eines Vierervektors zu bezeichnen. Lateinische Indizes i, j, ... werden verwendet, um die Komponenten eines räumlichen Dreiervektors zu bezeichnen. Sie nehmen die Werte 1, 2, 3 an. Der Abstand zweier Ereignisse xa und xb ist: s2ab = (x0a − x0b )2 − (x1a − x1b )2 − (x2a − x2b )2 − (x3a − x3b )2 . Wir definieren den metrischen Tensor gµν durch 1 0 0 0 0 −1 0 0 gµν = 0 0 −1 0 0 0 0 −1 8 Der Abstand läßt sich dann schreiben als: s2ab = 3 3 ∑ ∑ gµν µ=0 ν=0 µ xµa − xb (xνa − xνb ) . Einsteinsche Summenkonvention: Solche Summen werden üblicherweise unter Fortlassung des Summenzeichens geschrieben. Allgemein soll die Regel gelten, daß über Indizes, die paarweise auftreten, summiert wird, das Summationszeichen aber nicht aufgeschrieben wird. Dabei muß in jedem Paar der eine Index oben stehen, der andere unten stehen. Also: s2ab = gµν (xa − xb )µ (xa − xb )ν . Wir nennen einen Vierervektor xµ mit einem oberen Index einen kontravarianten Vektor, ein Vierervektor xµ mit einem unteren Index wird kovarianter Vektor genannt. Der Zusammenhang zwischen ko- und kontra-varianten Vektoren ist durch xµ = gµν xν gegeben. Somit läßt sich der Abstand auch schreiben als s2ab = (xa − xb )µ (xa − xb )µ = (xa − xb )µ (xa − xb )µ . Bemerkung: Die durch die quadratische Form gµν = diag(1, −1, −1, −1) definierte Geometrie ist keine euklidische Geometrie. Man nennt sie pseudoeuklidische Geometrie. Der spezielle Fall eines vierdimensionalen Raumes mit der Metrik diag(1, −1, −1, −1) wird auch als MinkowskiRaum bezeichnet. 2.3 Die Eigenzeit Wir beobachten aus einem Inertialsystem K ′ eine Uhr, die sich beliebig bewegt. Diese Bewegung können wir näherungsweise durch eine Sequenz geradliniger-gleichförmiger Bewegungen beschreiben. Man kann daher in jedem Zeitmoment der Uhr ein Inertialsystem K zuordnen, in dem diese ruht. Im Koordinatensystem K ′ legt die Uhr im infinitessimalen Zeitintervall dt ′ die Strecke q dx′ 2 + dy′ 2 + dz′ 2 zurueck. Gefragt wird, welches Zeitintervall dt sie danach anzeigt. Aus der Invarianz des Abstandes folgt: 2 2 2 c2 dt ′ − dx′ − dy′ − dz′ 2 = c2 dt 2 und daher dt = dt ′ s dx′ 2 + dy′ 2 + dz′ 2 1− = dt ′ c2 dt ′2 9 r 1− v2 . c2 Integration liefert für eine beliebige Bewegung ′ t2 − t1 = Zt2 dt ′ t1′ r 1− v2 . c2 Bemerkung 1: Die Eigenzeit eines sich bewegenden Gegenstandes ist immer kleiner als das entsprechende Zeitintervall im unbewegten System. Bemerkung 2: Die ist kein Widerspruch zum Relativitätsprinzip, da zum Vergleich eine Uhr im “bewegten” System, aber mehrere Uhren im “unbewegten” System notwendig sind. Bemerkung 3: Auch eine Uhr, die auf einer geschlossenen Kurve bewegt wird, stellt keine Widerspruch dar, da sie sich nicht dauernd in einem Inertialsystem befinden kann. 2.4 Die Lorentztransformation Gesucht: Formel, die es uns gestatte, aus den Koordinaten x, y, z,t eines Ereignisses in einem Bezugssystem K die Koordinaten x′ , y′ , z′ ,t ′ desselben Ereignisses in einem anderen Inertialsystem K ′ zu berechnen. Zur Erinnerung: Galilei-Transformation: x′ = x + vt, y′ = y, z′ = z, t ′ = t. System K bewegt sich mit Geschwindigkeit v relativ zum System K ′ entlang der x-Achse. Die relativistische Verallgemeinerung muß den Abstand invariant lassen. Daher kommen nur Parallelverschiebungen und Drehungen in Frage. Parallelverschiebungen sind hier nicht so interessant, da sie nur die Lage des Ursprungs ändern. Jede Drehung im vierdimensionalen Raum kann in sechs Einzeldrehungen in den Ebenen xy, yz, zx, tx, ty und tz zerlegt werden. Drehungen in den ersten drei Ebenen entsprechen gewöhnlichen räumlichen Drehungen. Betrachte als Beispiel für die letzten drei die Drehung in der tx-Ebene, die y- und z-Koordinaten ändern sich hier nicht. Diese Drehung muß die Differenz ct 2 − x2 invariant lassen. Aufgrund der pseudo-euklifischen Metrik mit negativen Vorzeichen erhalten wir hier einen imaginären Drehungswinkel und damit hyperbolische trigometrische Funktionen: ct ′ = x sinh φ + ct cosh φ, x′ = x cosh φ + ct sinh φ, oder in Viererschreibweise x′ µ µ = Λ ν xν , 10 mit µ Λ ν cosh φ sinh φ 0 0 sinh φ cosh φ 0 0 . = 0 0 1 0 0 0 0 1 Bestimmung von φ: Betrachte hierzu den Koordinatenursprung des Systems K im System K ′ : ct ′ = ct cosh φ, x′ = ct sinh φ, und daher v x′ = . tanh φ = ′ ct c Somit v , sinh φ = q c v2 1 − c2 cosh φ = q 1 1− v2 c2 . Im Grenzfall v ≪ c findet man die Galilei-Transformation. Übliche Abkürzungen: v β= , c 1 . γ= q v2 1 − c2 Längenkontraktion: Ein Stab der Länge l, der im System K ruht und parallel zur x-Achse orientiert ist, hat im System K ′ die Länge r v2 l′ = l 1 − 2 . c (Bestimme hierzu die x′ -Koordinaten x′1 und x′2 des Anfangs- und des Endpunktes zu demselben Zeitpunkt t ′ im System K ′ .) 2.5 Transformation der Geschwindigkeit Das System K bewege sich relativ zum System K ′ mit der Geschwindigkeit V längs der x-Achse. Die Geschwindigkeit eines Teilchens in K sei vx = dy dz dx , vy = , vz = , dt dt dt die entsprechenden Größen in K ′ seien v′x = dy′ dz′ dx′ ′ ′ , v = , v = , y z dt ′ dt ′ dt ′ 11 Die infinitessimalen Größen stehen mittels der Lorentztransformation V ′ ′ ′ ′ dx = γ (dx +V dt) , dy = dy, dz = dz, dt = γ dt + 2 dx c in Verbindung. Divison der ersten drei Gleichungen durch die vierte liefert: v′x = vy vx +V vz ′ . vxV , vy = vxV , vz = 1 + c2 γ(1 + c2 ) γ(1 + vcx2V ) Spezialfall: vx = v, vy = vz = 0: v′ = v +V . 1 + vV 2 c Die nach dieser Formel berechnete Summe zweier Geschwindigkeiten ist immer kleiner als c. 2.6 Die Vierergeschwindigkeit Die Vierergeschwindigkeit eines Teilchens ist der Vektor u µ dxµ = ds Um die Komponenten zu finden erinnern wir uns, daß r ds = cdt 1− v2 , c2 wobei v die gewöhnliche dreidimensionale Geschwindigkeit des Teilchens ist. Daher u1 = Ergebnis: dx1 vx dx1 q = q . = 2 2 ds cdt 1 − vc2 c 1 − cv2 ~v 1 . , q uµ = q v2 v2 1 − c2 c 1 − c2 Die Komponenten von uµ sind nicht unabhängig sondern erfüllen die Relation uµ uµ = 1. Die Vierergeschwindigkeit läßt sich daher geometrisch als Einheitsvektor auffassen, der die Weltlinie des Teilchens tangiert. 12 2.7 Die Lorentzgruppe Gruppenaxiome: Sei G eine nicht-leere Menge mit einer Verknüpfung. G ist eine Gruppe, falls die folgenden Axiome gelten: • Assoziativgesetz: a · (b · c) = (a · b) · c. • Es gibt ein neutrales Element: e · a = a. • Es gibt zu jedem Element ein Inverses: a−1 · a = e. Beispiele: Matrixgruppen. - GL(n, R), GL(n, C): Gruppe der nicht singulären n × n Matrizen: det M 6= 1 - SL(n, R), SL(n, C): det M = 1; - O(n) : MM T = 1 - SO(n): MM T = 1 und det M = 1. - U (n): MM † = 1. - SU (n): MM † = 1 und det M = 1. Definition der Lorentzgruppe: Matrixgruppe, welche den metrischen Tensor gµν = diag(1, −1, −1, −1) invariant läßt: ΛT gΛ = g, oder, etwas ausführlicher mit Indizes: µ Λ σ gµν Λντ = gστ . Diese Gruppe wird auch mit O(1, 3) bezeichnet. Wie leicht zu sehen ist, gilt (det Λ)2 = 1, und daher det Λ = ±1. Gilt zusätzlich det Λ = 1 bezeichnet man die Gruppe mit SO(1, 3) und spricht von der eigentlichen Lorentzgruppe. Eine weitere Unterscheidung ergibt sich dadurch, ob die Zeitrichtung erhalten bleibt oder umgekehrt wird. Gilt Λ00 ≥ 1, 13 so ist die Zeitrichtung erhalten und man spricht von der orthochronen Lorentzgruppe. Gilt dagegen Λ00 ≤ −1, so wird die Zeitrichtung umgekehrt. Bemerkung: 0 Λ ≥ 1 0 µ folgt aus Λ σ gµν Λντ = gστ für σ = τ = 0: Λ00 2 3 j 2 = 1. −∑ Λ0 j=1 Zusammenfassend läßt sich sagen, daß die Lorentzgruppe aus vier Komponenten besteht, jenachdem welche Werte det Λ und Λ00 annehmen. Hiervon ist die “eigentliche orthochrone Lorentzgruppe”, definiert durch Λ σ gµν Λντ = gστ , det Λ = 1, Λ00 ≥ 1, µ am interessantesten. Die drei anderen Komponenten lassen sich durch ein Element der eigentlichen orthochronen Lorentzgruppe und den beiden diskreten Transformationen der Zeitumkehr −1 0 0 0 0 1 0 0 µ Λ ν = 0 0 1 0 0 0 0 1 und der Raumspiegelung µ Λ darstellen. ν 1 0 0 0 0 −1 0 0 = 0 0 −1 0 0 0 0 −1 Die Poincarégruppe: Die Poincarégruppe besteht aus den Elementen der Lorentzgruppe und den Translationen. Die Koordinaten transformieren sich wie folgt x′ µ µ = Λ ν xν + bµ . 14 2.8 Tensoren im Minkowski-Raum Sei V ein Vektorraum und G eine Gruppe. Man sagt, G wirkt auf V , falls eine Abbildung gegeben ist, G ×V → V die g1 (g2 v) = (g1 g2 ) v erfüllt. In diesem Fall nennt man V eine Darstellung von G. Beispiel 1: Sei V ein n-dimensionaler Vektorraum und G = GL(n, R). Die Abbildung G ×V → V ist durch die Multiplikation einer Matrix mit einem Spaltenvektor gegeben: v′i = n ∑ Mi j v j j=1 Beispiel 2: Sei V der Minkowskiraum und G die Lorentzgruppe. x′ µ µ = Λ ν xν , (Einsteinsche Summenkonvention) Beispiel 3: Sei V ein n2 -dimensionaler Vektorraum und G = GL(n, R). Elemente aus V schreiben wir als vi j mit 1 ≤ i, j ≤ n. G wirkt auf V wie folgt: v′i j = n n ∑ ∑ Mik M jl vkl k=1 l=1 Man nennt vi j einen Tensor zweiter Stufe. Beispiel 4: Sei V ein 16-dimensionaler Raum und G die Lorenzgruppe. T′ µν µ = Λ ρ Λνσ T ρσ T µν ist ein Tensor zweiter Stufe. Beispiel 5: Sei V ein 64-dimensionaler Raum und G die Lorentzgruppe. T′ µνρ µ ρ = Λ σ Λνκ Λ λ T σκλ T µνρ ist ein Tensor dritter Stufe. Allgemein: Ein Tensor ist ein Element eines Vektorraums, auf den eine Gruppenwirkung gegeben ist. Die Anzahl der Kopien des Gruppenelements, die zur Definition der Gruppenwirkung benötigt werden, bezeichnet man als Rang des Tensors. 15 Pseudotensoren verhalten sich bei allen Transformationen, die sich auf Drehungen zurückführen lassen, wie Tensoren. Sie verhalten sich allerdings anders bei Spiegelungen (Raumspiegelung, Zeitumkehr), d.h. Transformationen, die sich nicht auf Drehungen zurückführen lassen: Hier unterscheiden sie sich von den Tensoren um ein Minuszeichen. Pseudotensoren nullter Stufe nennt man Pseudoskalare. Pseudotensoren erster Stufe nennt man auch axiale Vektoren. In der speziellen Relativitätstheorie unterscheiden wir außerdem zwischen oberen und unteren Indizes (kontravariante und kovariante Komponenten). Der Zusammenhang ist wieder durch den metrischen Tensor gegeben: µ T ν = gνρ T µρ , Tµν = gµρ gνσ T ρσ Tensoren mit bestimmten Symmetrieeigenschaften: Ein Tensor heißt symmetrisch falls gilt Sµν = Sνµ Ein Tensor heißt antisymmetrisch, falls Aµν = −Aνµ gilt. Insbesondere gilt für einen antisymmetrischen Tensor zweiter Stufe A00 = A11 = A22 = A33 = 0. Beispiele für Tensoren in der speziellen Relativitätstheorie: Rang 1: Ortsvektor xµ , Impulsvektor pµ . Rang 2: Metrischer Tensor gµν . Rang 4: Total antisymmetrischer Tensor (Levi-Civita-Tensor) εµνρσ . Der total antisymmetrischer Tensor ist definiert durch ε0123 εµνρσ εµνρσ εµνρσ = = = = 1, 1 falls (µ, ν, ρ, σ eine gerade Permutation von (0, 1, 2, 3) ist, −1 falls (µ, ν, ρ, σ eine ungerade Permutation von (0, 1, 2, 3) ist, 0 sonst. Der total antisymmetrische Tensor ist ein Pseudotensor, er ändert bei Raumspiegelung und Zeitumkehr seine Komponenten nicht. Duale Tensoren: Sei F µν ein antisymmetrischer Tensor zweiter Stufe. Der Pseudotensor F̃ µν = 1 µνρσ ε Fρσ 2 16 heißt der zu F µν duale Tensor. Analog gilf für einen Vektor Aµ : Der Tensor dritter Stufe õνρ = εµνρσ Aσ heißt der zum Vektor Aµ duale Tensor. 2.9 Die relativistische Mechanik Die wichtigsten Elemente der klassische Mechanik: Im Lagrangeformalismus betrachtet man verallgemeinerte Koordinaten qi (t) und die zugehörigen Geschwindigkeiten q̇i (t) = ∂t∂ qi (t). Lagrangefunktion L (qi , q̇i ) Wirkung: S [qi (t)] = Ztb dt L (qi , q̇i ) ta Prinzip der kleinsten Wirkung: Ein Teilchen bewegt sich so, daß das Wirkungsintegral ein Extremum annimmt. Wirkungsintegral für freie Materieteilchen: - muß invariant bezüglich Lorentztransformationen sein. - nur Differentiale erster Ordnung. Die Wirkung für ein freies Teilchen hat daher die Gestalt S = −α Zb ds a Das Integral ist längs einer Weltlinie zwischen den Ereignissen a und b zu nehmen. Damit S ein Minimum hat muß α > 0 gelten. Begründung: Für eine ruhende Uhr ist ds = cdt. Wir schreiben auch S = Ztb L dt, ta wobei L als Lagrange-Funktion bezeichnet wird. Mit r ds = cdt 17 1− v2 c2 erhalten wir r L = −αc 1− v2 . c2 Im klassischen Grenzfall muß gelten: 1 lim L = const + mv2 . c→∞ 2 Wir entwickeln L: r 1− v2 αv2 ≈ −αc + c2 2c v2 1− 2, c r L = −αc Daher α = mc und S = −mc2 Ztb dt ta r L = −mc2 1− v2 . c2 Der Impuls eines Teilchens ist der Vektor ∂L m~v ˙ ~p = mit ~v = ~x, =q ∂~v v2 1 − c2 ∂L zur Erinnerung : pi = . ∂q̇i Die Energie eines Teilchens ist die Größe (zur Erinnerung : E = pi q̇i − L) , r m~v v2 mc2 m = q ~v + mc2 1 − 2 = q , v2 + c2 − v2 = q 2 2 2 c 1 − vc2 1 − vc2 1 − cv2 E = ~p~v − L, Für kleine Geschwindigkeiten erhält man 1 E ≈ mc2 + mv2 . 2 mc2 bezeichnet man als Ruheenergie. Herleitung der Bewegungsgleichung für ein freies Teilchen in Vierer-Schreibweise: Ausgangspunkt: S = −mc 18 Zb a ds Variation der Koordinaten: xµ → xµ + δxµ Variationsprinzip: δ δxµ (t) S [xµ (t)] = 0. Nebenrechnung: und somit δ δ p δ δ 1 ds = dxν dxν = √ 2dxν µ dxν = uν µ dxν µ µ δx δx δx δx 2 ds2 δds = uν δdxν Weiter δS = −mc Zb a δds = −mc b = −mc uν δxν |a + mc Zb uν δdx = −mc a Zb a ν Zb uν a dδxν ds ds d uν δxν ds ds Daraus folgt: d uν = 0, ds d.h. die kräftefreie Bewegung eines Teilchens erfolgt mit konstanter Vierergeschwindigkeit. Definition des kontravarianten Impulsvierervektors: mc m~v pµ = (E/c,~p) = q ,q 2 2 1 − vc2 1 − vc2 Bemerkung: p2 ist invariant. 19 3 Elektrodynamik 3.1 Die Maxwell’schen Gleichungen Die Maxwell’schen Gleichungen: ~∇ · ~B(t,~x) ~∇ × ~E(t,~x) + 1 ∂ ~B(t,~x) c ∂t ~∇ · ~E(t,~x) ~∇ × ~B(t,~x) − 1 ∂ ~E(t,~x) c ∂t = 0, = 0, = 4πρ(t,~x), 4π ~ = j(t,~x). c Potentiale: ~E(t,~x) = −~∇Φ(t,~x) − 1 ∂ ~A(t,~x), c ∂t ~B(t,~x) = ~∇ × ~A(t,~x). Eichtransformation: 1∂ χ(t,~x), c ∂t ~A′ (t,~x) = ~A(t,~x) + ~∇χ(t,~x), Φ′ (t,~x) = Φ(t,~x) − Die Lorentz-Kraft: ~ v ~F(t,~x) = q ~E(t,~x) + × ~B(t,~x) . c Wir können die Elektrodynamik auch in kovarianter Form formulieren. Zur Erinnerung: Vierergeschwindigkeit µ 1 dx ~v 1 µ = q u = , q = γ 1, ~v . 2 2 ds c 1− v c 1− v c2 c2 ds = c dt, γ wµ = duµ ds Viererbeschleunigung: Newton’s Gesetz F = ma in relativistischer Verallgemeinerung: mc2 d µ u = K µ. ds 20 Kontraktion mit uµ liefert: mc2 uµ 1 2d 2 d µ u = mc u = 0, ds 2 ds |{z} 1 und daher K µ uµ = 0. Für die räumlichen Komponenten gilt: ~ = γ~F K Angewandt auf die Lorentzkraft: d ~v ~v ~ 2 d ~ mc ~u = mc γ = qγ E + × B . ds ds c c 2 Für die zeitliche Komponente gilt γ ~ = 0, uµ K µ = γK 0 − ~vK c 1 ~ K 0 = ~vK, c und daher mc2 1 d d 0 u = mc2 γ = qγ~E~v. ds ds c Somit: ~v d mc2 (γ) = γq~E · , ds c d ~ v ~ v 2 mc γ = γq ~E + × ~B . ds c c Die linke Seite lautet kovariant geschrieben mc2 d µ u ds Setzt man nun F µν 0 −E x −E y −E z Ex 0 −Bz By = E y Bz 0 −Bx E z −By Bx 0 21 so ist F µν uν γ 0 −E x −E y −E z −γ vx Ex 0 −Bz By cy = y E Bz 0 −Bx −γ vc z E z −By Bx 0 −γ vc γ~E ~vc γE x + γ (vy Bz − vz By ) ~E ~v c c = = γ ~ ~v ~ . γE y + cγ (vz Bx − vx Bz ) E + c ×B γE z + cγ (vx By − vy Bx ) Daher kann man schreiben mc2 d µ u = qF µν uν ds Die linke Seite transformiert sich wie ein kontravarianter Vektor unter der Lorentzgruppe, uν transformiert wie ein kovarianter Vektor, daher muß sich F µν wie ein Tensor zweiter Stufe transformieren: F′ µν µ = Λ ρ Λνσ F ρσ F µν nennt man den Feldstärketensor. Die elektrischen und magnetischen Felder erhält man aus F µν durch E i = F i 0 = −F 0 i , Bi = − 1 2 3 ∑ εi jk F jk . j,k=1 Bemerkung: F µν ist anti-symmetrisch: F µν = −F νµ . Zusammenfassung der kovarianten Formulierung: Definition des Feldstärketensors: F µν Maxwell’sche Gleichungen: 0 −E x −E y −E z Ex 0 −Bz By = y z E B 0 −Bx E z −By Bx 0 ∂λ F µν + ∂µ F νλ + ∂ν F λµ = 0, 4π ν ∂µ F µν = j , c 22 wobei jµ = (cρ, ~j). Bemerkung: Mit Hilfe des anti-symmetrischen Tensors εµνρσ und wegen der Antisymmetrie von F µν kann die erste Gleichung auch als εµνρσ ∂ν F ρσ = 0 geschrieben werden. Lorentz-Kraft: mc2 d µ u = qF µν uν ds Vierer-Potential: Aµ = Φ, ~A F µν = ∂µ Aν − ∂ν Aµ . Die inhomogenen Maxwell’schen Gleichungen: ✷Aν − ∂ν ∂µ Aµ = 4π ν j . c Lorenz-Eichung: ∂µ Aµ = 0 Die inhomogenen Maxwell’schen Gleichungen in der Lorenz-Eichung: 4π ν j . c ✷Aν = 3.2 Die Lagrangedichte für die Wechselwirkung zwischen Teilchen und elektromagnetischen Feldern Zur Erinnerung: Die Wirkung eines freien relativistischen Teilchens: STeilchen = −mc Zb ds a Für die Wechselwirkung zwischen einem Teilchen und dem elektromagnetischen Feld setzen wir SWW q = − c Zb a 23 dxµ Aµ (x). Für ein Teilchen müssen wir Zb STeilchen + SWW = −mc a q ds − c Zb dxµ Aµ (x) a betrachten. Variation der Koordinaten: xµ → xµ + δxµ Variationsprinzip: δ (STeilchen + SWW ) = 0. Zur Erinnerung δds = uν dδxν Des weiteren ist δ Aµ dxµ und = Aµ dδxµ + δAµ dxµ δAµ = Aµ (x + δx) − Aµ (x) = ∂ν Aµ δxν . Somit δ (STeilchen + SWW ) = −mc Zb = −mc Zb = mc Nun ist a µ Aµ dδx = Zb a = − a δ(dxµ Aµ (x)) a q uν dδx − c Zb a q Aµ dδx − c µ Zb δAµ dxµ a Zb Zb q q d µ ν Aµ dδx − ∂ν Aµ dxµ δxν uν δx ds − ds c c µ a ν d Aµ δxµ ds = − ds Zb Zb ν ∂ν Aµ dx δx a Zb a a Zb a Zb q δds − c = Zb a Zb a ∂ν Aµ uν δxµ ds = − 24 a ∂ν Aµ uµ δxν ds, Zb ∂Aµ ∂xν µ d µ Aµ δx ds = − δx ds ds ∂xν ds Zb a a ∂µ Aν uµ δxν ds und somit Zb δ (STeilchen + SWW ) = q q d µ µ mc uν + ∂µ Aν u − ∂ν Aµ u δxν ds ds c c a Zb = d q µ mc uν + Fµν u δxν ds ds c a Somit muss gelten mc q d uν + Fµν uµ = 0, ds c und daher mc2 d uµ = qFµν uν . ds 3.3 Die Lagrangedichte der Elektrodynamik Für die Wirkung der Elektrodynamik machen wir den Ansatz, daß sie aus einem Term, der “freie” Felder beschreibt und einem Term, der die Wechselwirkung mit der Materie beschreiben soll, besteht. S = SFelder + SWW Für die Konstruktion von SWW können wir den Ausdruck für eine Punktladung auf allgemeine Ladungsverteilungen verallgemeinern: SWW,Punktladung q = − c Zb dxµ Aµ (x). a Die Ladungs- und die Stromdichte einer Punktladung mit Bahnkurve ~x′ (t) sind: ρ(t,~x) = qδ3 (~x −~x′ (t)), ~j(t,~x) = q~v(t)δ3(~x −~x′ (t)). Somit ist jµ (x) = SWW qi = −∑ i c 1 → − 2 c Z Zb Z cρ, ~j = qc ds uµ δ4 x − x′ (s) dxµ Aµ (x) a 3 d x cρ(x) Z dxµ 1 ds Aµ (x) = − 2 ds c Z dxµ Aµ (x) d x cρ(x) | {z ds} 4 jµ (x) Für die Konstruktion von SFelder sollen die folgenden Forderungen erfüllt sein: 25 • Lorentz-Invarianz. • Superpositionprinzip, d.h. das Ziel sind lineare Differentialgleichungen. Daher sollte der Integrand von SFelder quadratisch in den Feldkomponenten sein • Physikalisch eindeutig, d.h. eichinvariant. Daher sollte der Integrand durch Fµν und nicht durch Aµ gegeben sein. Der einfachste Ansatz ist SFelder 1 = − 16πc Z d 4 xFµν F µν Betrachten wir also nun SFelder + SWW = − 1 16πc Z d 4 xFµν (x)F µν (x) − 1 c2 Z d 4 x jµ (x)Aµ (x) Mit Fµν = ∂µ Aν − ∂ν Aµ erhalten wir Z µ ν ν µ 1 1 µ 1 4 ∂µ Aν (∂ A ) + ∂µ Aν (∂ A ) − 2 j (x)Aµ (x) SFelder + SWW = d x − 8πc 8πc c Die Lagrangedichte lautet L = − 1 1 1 ∂µ Aν (∂µ Aν ) + ∂µ Aν (∂ν Aµ ) − jµ (x)Aµ (x) 8π 8π c Die Euler-Lagrange-Gleichungen lauten Somit ∂L ∂L = 0. − ∂µ ∂Aν ∂ ∂µ Aν 1 1 1 − jν (x) + ∂µ (∂µ Aν ) − ∂µ (∂ν Aµ ) = 0, c 4π 4π 1 1 ν ∂µ F µν = j (x), 4π c 4π ν j (x). ∂µ F µν = c 26 4 Erhaltungssätze 4.1 Noether’sche Erhaltungsgrößen Wir betrachten das Funktional Z I [ψ] = d 4 x L ψ(x), ∂µ ψ(x) Σ Wir betrachten zunächst eine Transformation, die L strikt invariant läßt. Diese Transformation sei gegeben durch ψ(x) → ψ′ (x) = hα (ψ(x)), mit h0 (ψ(x)) = ψ(x). Für α nahe bei Null gilt d α . δψ = ψ − ψ = α h (ψ(x)) dα α=0 ′ Für die Variation der Lagrangedichte ergibt sich δL = ∂L ∂L ∂µ δψ δψ + ∂ψ ∂ ∂µ ψ ! ! ∂L ∂L ∂L δψ − ∂µ δψ = δψ + ∂µ ∂ψ ∂ ∂µ ψ ∂ ∂µ ψ " # ! ∂L ∂L ∂L δψ + ∂µ δψ = − ∂µ ∂ψ ∂ ∂µ ψ ∂ ∂µ ψ Falls ψ eine Lösung der Euler-Lagrange-Gleichungen ist, so verschwindet der erste Term. Ist die Lagrangedichte invariant unter der Transformation hα , so folgt, daß auch der zweite Term verschwindet, also ∂µ J µ (x) = 0, wobei der erhaltene Strom durch J µ (x) = gegeben ist. ∂L δψ ∂ ∂µ ψ 27 Wir können das Noethertheorem auf Transformationen erweitern, die die Lagrangedichte bis auf Eichterme invariant lassen, d.h. Situationen in denen 1 L A′µ , ∂µ A′ν = L Aµ , ∂µ Aν + jµ (x)∂µ Λ(x) c anstelle von L A′µ , ∂µ A′ν = L Aµ , ∂µ Aν gilt. Falls ∂µ jµ = 0 gilt, kann man jµ (x)∂µ Λ(x) durch ∂µ ( jµ (x)Λ(x)) ersetzten. Der Zusatzterm ist dann eine Divergenz und gibt im Wirkungsintegral nur einen Oberflächenterm. Da dort die Variation der Felder verschwinden soll, ändert er nichts. 4.2 Translationsinvarianz und der Energie-Impuls-Tensor Wir betrachten wieder die Lagrangedichte L ψ(x), ∂µ ψ(x) , die nicht explizit von x abhängt. Unter Translationen xµ′ → xµ + αcµ , gilt Es gilt weiter Somit ist ψ(x) → ψ′ (x′ ) = ψ(x + αc) = ψ(x) + δψ(x), d ′ δψ = ψ − ψ = α = αcµ ∂µ ψ(x). ψ(x + αc) dα α=0 δL = L ψ′ (x′ ), ∂µ ψ′ (x′ ) − L ψ(x), ∂µ ψ(x) = αcµ ∂µ L (ψ(x), ∂ν ψ(x)) δL = ∂µ Daher folgt ! ∂L δψ = ∂µ ∂ ∂µ ψ ∂L αcµ ∂µ ψ(x) ∂ ∂µ ψ ! ∂ L αcν ∂ν ψ(x) αcν ∂ν L − ∂µ = 0, ∂ ∂µ ψ !# " ∂ L ∂ν ψ(x) = 0, αcν gνµ ∂µ L − ∂µ ∂ ∂µ ψ " !# ∂ L ∂ν ψ(x) αcν ∂µ gνµ L − = 0, ∂ ∂µ ψ 28 ! Man nennt das Tensorfeld T µν = ! ∂L ∂ν ψ(x) − gµν L ∂ ∂µ ψ den kanonischen Energie-Impuls-Tensor. T µν erfüllt die vier Erhaltungssätze ∂µ T µν = 0. Bemerkung: Treten mehrere Felder ψ(i) auf, so wird über alle Felder summiert: ! N ∂ L ∂ν ψ(i) (x) − gµν L T µν = ∑ (i) ∂ ∂ ψ µ i=1 Bemerkung: Addiert man zu T µν einen Term ∂ρ Bµρν , wobei Bµρν antisymmetrisch in µ und ρ ist, so gilt ebenfalls Bρµν = −Bµρν , ∂µ T µν + ∂ρ Bµρν = 0. Der kanonische Energie-Impuls-Tensor gibt also noch keine eindeutige Erhaltungsgröße. Zur Eindeutigkeit betrachten wir den Drehimpuls. Vorbemerkung: Die relativistische Verallgemeinerung des Drehimpulses ~ = ~x ×~p M ist durch 1 µ ν (x p − xν pµ ) 2 stellt man nun die Zusatzforderung, daß mit der Definition der DrehimpulsM µν = gegeben. An T µν dichte M µνρ = T µν xρ − T µρ xν gilt: ∂µ M µνρ = 0. Dies bedeutet Also ∂µ M µνρ = ∂µ (T µν xρ − T µρ xν ) = ∂µ T µν xρ + T ρν − ∂µ T µρ xν − T νρ = T ρν − T νρ = 0. T µν = T νµ , d.h. der Energie-Impuls-Tensor muß symmetrisch sein. 29 4.3 Der Energie-Impuls-Tensor des elektromagnetischen Feldes Wir betrachten des elektromagnetische Feld ohne äußere Quellen: L Aµ , ∂µ Aν Wir finden = − 1 Fµν F µν 16π ! 1 1 µν 1 ∂L ∂ν Aτ − gµν L = − (∂µ Aτ ) (∂ν Aτ ) + (∂τ Aν ) (∂ν Aτ ) + g Fρσ F ρσ 4π 4π 16π ∂ ∂µ Aτ 1 1 µν 1 µτ ν ρσ = F (x)Fτ (x) + g Fρσ F − F µτ ∂τ Aν . 4π 4 4π Nun ist allerdings, da wir keine äußeren Quellen betrachten ∂µ F µν = 0, und daher − 1 1 µτ F ∂τ Aν = − ∂τ (F µτ Aν ) . 4π 4π Dieser Term stellt also einen Oberflächenterm dar. Der symmetrische Energie-Impuls-Tensor des elektromagnetischen Feldes lautet: 1 µν 1 µτ ν µν ρσ F (x)Fτ (x) + g Fρσ F . T = 4π 4 Für die expliziten Einträge erhält man 1 ~ 2 ~ 2 E + B = u(t,~x), 8π 1 ~ ~ i 1 i = E × B = S (t,~x), 4π c 1 ~ i ~ j ~ i~ j 1 i j ~ 2 ~ 2 E E +B B − δ E +B . = − 4π 2 T 00 = T i0 Tij u(t,~x) die Energiedichte des elektromagnetischen Feldes. Den Vektor ~S bezeichnet man als Poynting’scher Vektor. Er beschreibt die Impulsdichte bzw. die Flußdichte der Energie. Die rein räumlichen Komponenten bezeichnet man als Maxwell’scher Spannungstensor. 30 Zusammenfassung der letzten Vorlesung δL = " # ∂L ∂L δψ + ∂µ − ∂µ ∂ψ ∂ ∂µ ψ 1. Fall: - ψ erfüllt die Euler-Lagrange-Gleichungen. - L ist strikt invariant unter Symmetrietransformationen. Dann: Noetherstrom J µ (x) = ist erhalten: ! ∂L δψ ∂ ∂µ ψ ∂L δψ ∂ ∂µ ψ ∂µ J µ (x) = 0, 2. Fall: - ψ erfüllt die Euler-Lagrange-Gleichungen. - L ist invariant unter Symmetrietransformationen bis auf Eichterme. Dann: Noetherstrom ist ebenfalls erhalten. 3. Fall: - ψ erfüllt die Euler-Lagrange-Gleichungen. - L hängt nicht explizit von xµ ab. Dann: Erhaltungssatz für den kanonischen Energie-Impuls-Tensor ! ∂L ∂ν ψ(x) − gµν L , T µν = ∂ ∂µ ψ ∂µ T µν = 0. T µν eindeutig bis auf T µν → T µν + ∂ρ Bµρν , Bρµν = −Bµρν , Zusatzforderung: T µν ist symmetrisch: T µν = T νµ . Energie-Impuls-Tensors des elektro-magnetischen Feldes: 1 µν 1 µτ ν ρσ µν F (x)Fτ (x) + g Fρσ F . T = 4π 4 31 5 Riemann’sche und semi-Riemann’sche Geometrie 5.1 Mannigfaltigkeiten Ein topologischer Raum ist eine Menge M zusammen mit einer Familie T von Untermengen von M, so daß die folgenden Eigenschaften erfüllt sind: 1. 0/ ∈ T , M ∈ T 2. U1 ,U2 ∈ T ⇒ U1 ∩U2 ∈ T 3. Für jede Indexmenge A gilt Uα ∈ T ; α ∈ A ⇒ S α∈A Uα ∈ T Die Mengen U ∈ T nennt man offene Mengen. Einen topologischen Raum bezeichnet man als Hausdorff-Raum, falls es zu jedem Paar verschiedener Punkte p1 , p2 ∈ M offene Mengen U1 ,U2 ∈ T gibt, so daß die folgenden Bedingungen erfüllt sind: / p1 ∈ U1 , p2 ∈ U2 , U1 ∩U2 = 0. Eine Abbildung zwischen topologischen Räumen nennt man stetig falls das Urbild jeder offenen Menge wieder offen ist. Eine bijektive Abbildung, welche stetig in beiden Richtungen ist, bezeichnet man als Homeomorphismus. Eine offene Karte von M ist ein Paar (U, ϕ), wobei U eine offene Untermenge von M und ϕ ein Homeomorphismus von U auf eine offene Untermenge von Rn ist. Eine differenzierbare Mannigfaltigkeit der Dimension n ist ein Hausdorff-Raum mit einer Familie offener Karten (Uα, ϕα )α∈A , so daß M1: M = [ Uα . α∈A −1 M2: Für jedes Paar α, β ∈ A ist die Abbildung ϕβ ◦ ϕα eine beliebig oft differenzierbare Abbildung von ϕα Uα ∩Uβ auf ϕβ Uα ∩Uβ . Eine differenzierbare Mannigfaltigkeit wird auch oft als C∞ Mannigfaltigkeit bezeichnet. Da wir uns nur mit differenzierbaren Mannigfaltigkeiten beschäftigen werden, werden wir oft die Bezeichnung “differenzierbar” weglassen und daher einfach und kurz von Mannigfaltigkeiten sprechen. 32 Die Familie offener Karten (Uα, ϕα )α∈A bezeichnet man als Atlas. Für p ∈ Uα und ϕα (p) = (x1 (p), ..., xn(p)) , bezeichnet man die Menge Uα als die Koordinatenumgebung von p. Die Zahlen xi (p) bezeichnet man als die lokalen Koordinaten von p. Bemerkung: M schaut lokal in jeder Koordinatenumgebung wie der Rn aus, doch gilt dies nicht global. Seien M und N zwei Mannigfaltigkeiten der Dimension m und n. Wir bezeichnen mit xi die Koordinaten von M und mit y j die Koordinaten von N. Eine Abbildung f : M → N zwischen zwei Mannigfaltigkeiten bezeichnet man als analytisch, falls es zu jedem Punkt p ∈ M eine Umgebung U von p und n Potenzreihen Pj , j = 1, ..., n gibt, so daß y j ( f (q)) = Pj (x1 (q) − x1 (p), ..., xm(q) − xm (p)) für alle q ∈ U gilt. Als eine analytische Mannigfaltigkeit bezeichnet man eine Mannigfaltigkeit, bei der die Abbildung ϕβ ◦ ϕ−1 α analytisch ist. Beispiele a) Rn : Der Raum Rn ist eine Mannigfaltigkeit. Rn kann mit einer einzigen Karte überdeckt werden. b) S1 : Die Kreislinie S1 = {~x ∈ R2 ||~x|2 = 1} ist eine Mannigfaltigkeit. Für einen Atlas benötigt man mindestens zwei Karten. c) Sn : Die n-Sphäre, definiert durch Sn = {~x ∈ Rn+1 ||~x|2 = 1} d) Pn (R): Der projektive Raum definiert als alle Linien durch den Ursprung im Rn+1 : (x0 , x1 , ..., xn) = λ(x′0 , x′1 , ..., x′n), λ 6= 0. e) Die Menge aller Rotationsmatrizen in zwei Dimensionen: cos ϕ − sin ϕ , sin ϕ cos ϕ 33 Die Menge all dieser Matrizen bildet eine Mannigfaltigkeit, die homeomorph zur Kreislinie S1 ist. f) Allgemeiner sind alle Liegruppen per Definition analytische Mannigfaltigkeiten. Gegenbeispiele Zum besseren Verständniss der Definition einer Mannigfaltigkeit seien einige Beispiele angeführt, die keine Mannigfaltigkeiten sind: a) Eine ein-dimensionale Linie vereinigt mit einer zwei-dimensionalen Fläche, wie zum Beispiel durch x3 x21 + x22 = 0 definiert. Die so definierte Punktmenge ist an einigen Punkten homeomorph zu R, an anderen Punkten homeomorph zu R2 . In der Definition einer Mannigfaltigkeit wird aber verlangt, daß die Menge an allen Punkten homeomorph zu Rn für ein festes n ist. b) Der Kegel x21 + x22 − x23 = 0. Die Umgebung des Punktes (0, 0, 0) läßt sich nicht homoemorph auf den R2 abbilden. c) Ein einzelnes Kegelsegment x21 + x22 − x23 = 0, x3 ≥ 0. Hier läßt sich zwar eine Umgebung des Punktes (0, 0, 0) stetig auf den R2 abbilden, aber nicht differenzierbar. d) Das Liniensegment [0, 1] Hier gibt es zu den Endpunkten keine offene Umgebungen. Morphismen Noch einmal zur Übersicht die verschiedenen Morphismen, die wir bisher definiert haben: Homeomorphismus: Eine Abbildung f : M → N von einer Mannigfaltigkeit M nach einer Mannigfaltigkeit N bezeichnet man als Homeomorphismus, falls sie bijektiv ist und sowohl f : M → N als auch die Umkehrabbildung f −1 : N → M stetig sind. 34 Diffeomorphismus: Eine Abbildung f : M → N bezeichnet man als Diffeomorphismus, falls die Abbildung eine Homeomorphismus ist und sowohl f als auch f −1 beliebig oft differenzierbar sind. Analytischer Diffeomorphismus: In diesem Fall ist die Abbildung f : M → N ein Diffeomorphismus und analytisch. 5.2 Differentialformen und Integration auf Mannigfaltigkeiten Vorbemerkungen: Wir möchten nun Integrale auf Mannigfaltigkeiten definieren. Diese sollen zum Beispiel Volumenintegrale wie Z d 4 x L (x) M über den Euklidischen Raum oder Minkowski-Raum verallgemeinern, aber auch Linienintegrale wie sie zum Beispiel in −mc Zb ds a auftraten. Betrachten wir zunächst ein-dimensionale Integrale, welche wir durch einen Grenzwertprozeß definieren können: Z dx f (x) = lim ∑ f (x j )∆x j j R Ebenso zwei-dimensionale Integrale: Z dx dy g(x, y) = lim ∑ ∑ g(x j , yk )∆x j ∆yk j R2 k Bemerkung: Das Vorzeichen des letzten Beispiels ist von der gewählten Orientierung abhängig. Anstelle der Funktionen f (x) und g(x, y) werden wir nun neue Objekte f (x) dx, g(x, y) dx ∧ dy einführen, die über ein Gebiet der entsprechenden Dimension integriert werden können, einführen. Der Grund hierfür sind die übersichtlicheren Transformationseigenschaften. 35 Tangentialvektoren Sei I ⊂ R ein Intervall und γ : I → M ⊂ Rn eine differenzierbare Abbildung. Man bezeichnet d γ(t) ∈ Rn dt t0 als Tangentialvektor an M im Punkte γ(t0). Die Gesamtheit aller Tangentialvektoren an M im Punkte p wird mit Tp M bezeichnet. Die Dimension des Tangentialraumes ist gleich der Dimension der Mannigfaltigkeit. Wir bezeichnen mit Tp∗ M den dualen Vektorraum von Tp M, d.h. die Menge aller Linearformen φ : Tp M → R. Die Elemente von φ ∈ Tp∗ M heißen auch Kotangentialvektoren. Ein Vektorfeld ist eine Abbbildung X : M → Rn X ordnet jedem Punkt p ∈ M einen Tangentialvektor X (p) ∈ Rn zu. Differentialformen erster Ordnung Eine Differentialform erster Ordnung ist eine Abbildung ω:M→ [ Tp∗ M p mit ω(p) ∈ Tp∗ M. Die Differentialform ω ordnet also jedem Punkt p ∈ M einen Kotangentialvektor ω(p) ∈ Tp∗ M zu. Wir bezeichnen den Wert von ω(p) auf dem Tangentialvektor v ∈ Tp M mit hω(p), vi Definition: Sei U ⊂ Rn und f : U → R eine differenzierbare Funktion. Unter dem totalen Differential d f von f versteht man eine Differentialform, für die n hd f (p), vi = ∂ f (p) vi ∂x i i=1 ∑ für alle Tangentialvektoren v = vi ei gilt. Mit Hilfe der Koordinatenfunktionen xi : Rn → R, (y1 , ..., yn) → yi 36 lassen sich nun die Differentiale dx1 , ..., dxn definieren. Es gilt dxi , e j = δi j . Die Kotangentialvektoren dx1 (p), ..., dxn (p) bilden eine Basis von Tp∗ M Koordinatendarstellung: Jede Differentialform erster Ordnung läß sich schreiben als n ω = ∑ fi(x)dxi. i=1 Kurvenintegrale: Sei γ : [a, b] → U eine Kurve. Dann wird das Integral von ω über γ definiert als Z ω = γ Zb a hω(γ(t)), γ′(t)idt. Differentialformen höherer Ordnung Wir haben bisher gesehen, daß Differentialformen erster Ordnung über Kurven integriert werden können. Wir möchten nun eine Verallgemeinerung, die eine Integration über höher dimensionale Gebiete erlaubt. Wir beginnen mit der Definition des Dachproduktes von Linearformen: Seien ω1 , ..., ωK ∈ V ∗ Linearformen, also Abbildungen ω j : V → R. Dann wird die Abbildung ω1 ∧ ... ∧ ωk : V k → R definiert durch hω1 , v1 i ... hω1 , vk i ... ... ... (ω1 ∧ ... ∧ ωk ) (v1 , ..., vk ) = det hωk , v1 i ... hωk , vk i Eigenschaften des Dachproduktes: • Das Dachprodukt ist linear in jedem Argument: ω1 ∧ ... ∧ aω′i + bω′′i ∧ ... ∧ ωk = a ω1 ∧ ... ∧ ω′i ∧ ... ∧ ωk + b ω1 ∧ ... ∧ ω′′i ∧ ... ∧ ωk 37 • Das Dachprodukt ist alternierend: ωσ(1) ∧ ... ∧ ωσ(k) = sign(σ) · ω1 ∧ ... ∧ ωk Wir bezeichnen die Menge aller alternierenden linearen k-Formen auf V mit ∧kV ∗ Definition: Eine Differentialform der Ordnung k (oder kurz k-Form) ist eine Abbildung ω:M→ [ p ∧k Tp∗ M mit ω(p) ∈ ∧k Tp∗ M. Für k = 1 stimmt diese Definition mit der schon bekannten Definition für Differentialformen erster Ordnung überein. Eine Differentialform nullter Ordnung ist eine reellwertige Funktion. Koordinatendarstellung von Differentialformen k-ter Ordnung: 1 fi1 ...ik dxi1 ∧ ... ∧ dxik k! i1 ∑ ,...,ik ω = ∑ = i1 <...<ik fi1 ...ik dxi1 ∧ ... ∧ dxik . Abbleitungen von Differentialformen: Sei ω = ∑ i1 <...<ik fi1 ...ik dxi1 ∧ ... ∧ dxik . eine k-Form. Dann bezeichnte dω die (k + 1)-Form dω = ∑ i1 <...<ik d fi1 ...ik ∧ dxi1 ∧ ... ∧ dxik . Rechenregeln: Seien ω und ω′ zwei k-Formen und f eine Funktion. Dann sind die k-Formen f ω und ω + ω′ durch ( f ω) (p) = f (p)ω(p), ω + ω′ (p) = ω(p) + ω′ (p) definiert. Sei weiter σ eine l-Form. Dann definiert man die (k + l)-Form ω ∧ σ durch (ω ∧ σ) (p) = ω(p) ∧ σ(p). Bemerkung: ω ∧ σ = (−1)kl σ ∧ ω. 38 Weiter gilt: d aω + bω′ = adω + bdω′ , d (ω ∧ σ) = (dω) ∧ σ + (−1)k ω ∧ (dσ) , d (dω) = 0. Zurückziehen von Differentialformen: Sei U ⊂ Rn und 1 fi ...i dxi ∧ ... ∧ dxik . k! ∑ 1 k 1 ω = eine k-Form in U . Weiter sei eine offene Menge V ⊂ Rm und eine stetig differenzierbare Abbildung ϕ = (ϕ1 , ..., ϕn) : V → U vorgegeben. Dann definiert man eine k-Form ϕ∗ ω in V durch ϕ∗ ω = 1 ( fi ...i ◦ ϕ) dϕi1 ∧ ... ∧ dϕik . k! ∑ 1 k Bemerkung: k-Formen können über k-dimensionale (Unter)-Mannigfaltigkeiten integriert werden. Sei M eine Mannigfaltigkeit der Dimension n, K eine Untermannigfaltigkeit der Dimension k und A eine kompakte Teilmenge von K, ebenfalls mit der Dimension k. Sei ferner ω eine kForm auf M und ϕ : U → Rn eine lokale Karte von M, so daß A ∈ U . Dann haben wir ϕ−1 : Rn → U und man definiert nun Z ω = A Z ϕ(A) ϕ−1 ∗ ω Die Differentialform ω wird durch ϕ−1 auf eine offene Untermenge des Rn zurückgezogen. Dies führt die Integration auf Mannigfaltigkeiten auf die Integration im Rn zurück. Beispiel: Im R3 sei die Differentialform ω = 3x3 dx2 ∧ dx3 + (x21 + x22 )dx3 ∧ dx1 + x1 x3 dx1 ∧ dx2 gegeben. Sei M die folgende zweidimensionale Untermannigfaltigkeit M = {(x1 , x2 , x3 ) ∈ R3 : x3 = x1 x2 } 39 und A die folgende kompakte Teilmenge von M: A = {(x1 , x2 , x3 ) ∈ M : 0 ≤ x1 ≤ 1, 0 ≤ x2 ≤ 1}. Wir möchten Z ω A berechnen. Wir wählen zunächst eine lokale Karte von M ϕ−1 : R2 → M, (y1 , y2 ) → (y1 , y2 , y1 y2 ) Die einzelnen Koordinatenabbildungen sind ϕ−1 1 = y1 , ϕ−1 2 = y2 , ϕ−1 und daher d ϕ−1 Somit Z ω= Z ϕ−1 ϕ(A) A = Z ϕ(A) = Z ϕ(A) ∗ = dy1 , d ϕ−1 1 = dy2 , d ϕ−1 2 3 3 = y1 y2 , = y2 dy1 + y1 dy2 . ω= 3y1 y2 dy2 ∧ (y2 dy1 + y1 dy2 ) + y21 + y22 (y2 dy1 + y1 dy2 ) ∧ dy1 + y1 (y1 y2 ) dy1 ∧ dy2 y21 y2 − 4y1 y22 − y31 dy1 ∧ dy2 = Z1 dy1 0 Z1 0 3 dy2 y21 y2 − 4y1 y22 − y31 = − . 4 Zum Abschluss betrachten wir noch Beispiele für Differentialformen, die in der Physik auftreten: A = i e Aµ (x)dxµ , ~c definiert eine Eins-Form. Es ist außerdem e e dA = d i Aν dxν = i ∂µ Aν dxµ ∧ dxν ~c ~c e 1 = i ∂µ Aν − ∂ν Aµ dxµ ∧ dxν . ~c 2 Daher ist es naheliegend die Feldstärkezweiform als F = dA = i e 1 Fµν dxµ ∧ dxν ~c 2 40 zu definieren. Bemerkung zu den Vorfaktoren: Wir betrachten den folgenden Differentialoperator: e q i DA = d + A = d + i Aµ dxµ = − i~d − Aµ dxµ . ~c ~ c Nun entspricht i~∂µ in der Quantenmechanik dem Impulsoperator pµ , so daß in der Klammer die Verallgemeinerung des Terms q ~p − ~A c steht. Wir berechnen noch DA ∧ DA auf eine beliebige Form ω angewandt: e e (DA ◦ DA ) ω = d + i Aµ dxµ ◦ d + i Aν dxν ω ~c ~c e 2 e e Aµ Aν dxµ ∧ dxν ∧ ω = d i Aµ dxµ ∧ ω + i Aν dxν ∧ dω − ~c ~c ~c = (dA) ∧ ω Daher DA = d + A, D2A = dA + A ∧ A = dA = F. DA bezeichnet man als kovariante Abbleitung, F als Krümmungsform. 5.3 Tensoren In der speziellen Relativitätstheorie hatten wir bereits Tensoren definiert. Seien K und K ′ zwei Koordinatensysteme, die durch eine Lorentztransformation verknüpft sind: x′ µ µ = Λ ν xν . Dann haben wir eine Größe T µ1 ...µr , die sich wie T′ µ1 ...µr µ1 µ1 ν1 ...νr ν1 ...Λ ν1 T = Λ transformiert, als Tensor r-Stufe bezeichnet. Der kontravariante Vierervektor xµ ist ein Tensor erster Stufe. Wir verallgemeinern nun diese Definition auf Koordinatensysteme die durch eine beliebige Transformation, welche nicht notwendigerweise eine Lorentztransformation ist, miteinander verknüpft sind. Wir betrachten die Transformation eines Koordinatensystems x0 , x1 , x2 , x3 in ein anderes x′ 0 , x′ 1 , x′ 2 , x′ 3 : x′ µ = f µ (x0 , x1 , x2 , x3 ). 41 Bei einer Koordinatentransformation transformieren sich die Differentiale der Koordinaten gemäß ′µ dx ∂x′ µ ν dx . = ∂xν Als kontravarianter Vierervektor wird jede Gesamtheit von vier Größen Aµ bezeichnet, die sich bei Koordinatentransformationen wie diese Differentiale verhalten: A ′µ ∂x′ µ ν = A . ∂xν Diese Definition ist mit der schon bekannten Definiton in der speziellen Relativitätstheorie verträglich: Sei x′ µ = f µ (x0 , x1 , x2 , x3 ) = Λ ν xν . µ Dann ist ∂x′ µ ∂ f µ (x0 , x1 , x2 , x3 ) µ = =Λ ν ν ν ∂x ∂x und somit x′ µ µ = Λ ν xν = ∂x′ µ ν x . ∂xν Es sei φ eine skalare Funktion. Die Ableitungen ∂φ/∂xµ transformieren sich bei dem Übergang zu einem anderen Koordinatensystem nach der Formel ∂φ ∂xν ∂φ = . ∂x′ µ ∂xν ∂x′ µ Als kovarianter Vierervektor wird jede Gesamtheit von vier Größen Aµ bezeichnet, die sich bei Koordinatentransformationen wie die Ableitung eines Skalars verhalten: A′ µ = ∂xν Aν ∂x′ µ Ein Tangentialvektor läß sich in jedem Punkt als Linearkombination der Basisvektoren eµ darstellen: V = V µ eµ . Man verwendet für die Basisvektoren auch die Schreibweise ∂µ = eµ . (Es sollte aus dem Kontext ersichtlich sein, ob ∂µ eine partielle Ableitung oder einen Basisvektor des Tangentialraums bezeichnet.) 42 Ein Vektorfeld ordnet jedem Punkt einer Mannigfaltigkeit einen Vektor zu. Dual zu einem Vektorfeld sind Eins-Formen. Sie ordnen an jedem Punkt der Mannigfaltigkeit einem Vektor eine (reelle oder komplexe) Zahl zu. Als Basis für den Raum der Einsformen verwendet man die Differentiale dxµ : ω = ωµ dxµ . Die Dualität zwischen Vektorfeldern und Einsformen impliziert µ dxµ (∂ν ) = δν . Ebenso können wir aufgrund der Dualität ein Vektorfeld, daß ursprünglich per Definition jedem Punkt der Mannigfaltigkeit einen Tangentialvektor zuordnet, uminterpretieren: Ein Vektorfeld ordnet ebenso jedem Punkt der Mannigfaltigkeit eine Linearform zu, die einen Kotangentialvektor auf R abbildet. Ein Tensorfeld mit r kontravarianten und s kovarianten Indizes bildet am Punkt x ∈ M r Einsformen und s Tangentialvektoren auf eine reelle Zahl ab. (Tsr )x : (Tx∗ M)r × (Tx M)s → R, ω1 , ..., ωr ,V1 , ...,Vs → (Tsr )x ω1 , ..., ωr ,V1 , ...,Vs . Koordinatendarstellung: µ ,...,µ tν11,...,νsr (x) = (Tsr )x (dxµ1 , ..., dxµr , ∂ν1 , ..., ∂νs ) . Basisdarstellung eines Tensorfeldes auf einer D-dimensionalen Mannigfaltigkeit (wobei die Koordinaten von 0 bis D − 1 durchnummeriert werden): Tsr = D−1 D−1 ∑ ∑ µ1 ,...,µr =0 ν1 ,...,νs =0 µ ,...,µ tν11,...,νsr (x) ∂µ1 ⊗ ... ⊗ ∂µr ⊗ (dxν1 ⊗ ... ⊗ dxνs ) . Beispiel: Ein (0, 2)-Tensorfeld ist gegeben durch D−1 g = ∑ µ,ν=0 gµν (x)dxµ ⊗ dxν . Bemerkung: In einem allgemeinen (0, s)-Tensorfeld tritt das Tensorprodukt ⊗ und nicht das Dachprodukt ∧ auf. Differentialformen haben die zusätzliche Eigenschaft antisymmetrisch zu sein und es ist dxµ ∧ dxν = 1 (dxµ ⊗ dxν − dxν ⊗ dxµ ) . 2 43 5.4 Riemann’sche Mannigfaltigkeiten Definition einer Riemann’schen Mannigfaltigkeit: Sei M eine differentierbare Mannigfaltigkeit. Eine Riemann’sche Metrik g auf M ist ein (0, 2)-Tensorfeld auf M, daß für jeden Punkt x ∈ M folgende Eigenschaften hat: gx (U,V ) = gx (V,U ) gx (U,U ) ≥ 0, Gleichheit gilt falls U = 0, wobei U,V ∈ Tx M und gx = g|x . Kurz gefasst beduetet dies, daß gx eine symmetrische positiv-definite Bilinearform ist. Eine Metrik g nennt man semi-Riemann’sche Metrik, falls gilt gx (U,V ) = gx (V,U ), falls gx (U,V ) = 0 für alle U ∈ Tx M gilt, dann ist V = 0. Eine Mannigfaltigkeit mit einer semi-Riemann’schen Metrik nennt man eine semi-Riemann’sche Mannigfaltigkeit. Bemerkung: Da die Metrik symmetrisch ist, sind die Eigenwerte von gµν reell. Für eine Riemann’sche Mannigfaltigkeit sind alle Eigenwerte positiv, Für eine semi-Riemann’sche Mannigfaltigkeit können auch einige Eigenwerte negativ sein. Mannigfaltigkeit auf denen gµν genau einen positiven Eigenwert (und (D − 1) negative Eigenwerte) hat, bezeichnet man als LorentzMannigfaltigkeit. Sei (U, ϕ) eine Karte von M und {xµ } die Koordinaten. Man schreibt die Metrik als gx = gµν (x)dxµ ⊗ dxν wobei wieder die Einstein’sche Summenkonvention verwendet wurde. Man findet auch oft die Notation gµν (x)dxµ dxν , wobei das Symbol ⊗ für das Tensorprodukt weggelassen wurde. Auch in dieser verkürzten Notation bezeichnen die dxµ eine Basis des Kotangentialraumes und g = gµν (x)dxµ dxν ein (0, 2)Tensorfeld. Eine weitere Schreibweise ist und g = det gµν , |g| = det gµν . 44 Aus dem Kontext sollte es hervorgehen, ob mit g das (0, 2)-Tensorfeld gµν (x)dxµ dxν oder die Determinante det(gµν ) gemeint ist. Das Inverse von gµν wird mit gµν bezeichnet. gµρ gρν = gνρ gρµ = δνµ Die Metrik induziert einen Isomorphismus zwischen Tx M und Tx∗ M, der durch und Tx M → Tx∗ M, U µ ∂µ → U µgµν dxν gegeben ist. Tx∗ M → Tx M, ωµ dxµ → ωµ gµν ∂ν Wir betrachten noch Tensordichten und rufen hierzu nochmal das total antisymmetrische LeviCivita Symbol in Erinnerung: εµ1 µ2 ...µn = 1 falls µ1 , µ2 , ..., µn eine gerade Permutation von 0, 1, ..., (n − 1) ist, εµ1 µ2 ...µn = −1 falls µ1 , µ2 , ..., µn eine ungerade Permutation von 0, 1, ..., (n − 1) ist, εµ1 µ2 ...µn = 0 sonst. Im flachen Minkowski-Raum transformiert sich εµνρσ wie ein Tensor. Wir untersuchen nun, wie µ sich das Levi-Civita Symbol auf beliebigen Mannigfaltigkeiten verhält. Sei M µ′ eine beliebige n × n-Matrix. Es gilt εµ′1 µ′2 ...µ′n |M| = εµ1 µ2 ...µn M µ1 µ µ M µ2′ ...M µn′ . µ′1 n 2 Setzt man nun M µ µ′ = ∂xµ ′ ∂xµ so ergibt sich εµ′1 µ′2 ...µ′n ′ ∂xµ ∂xµ1 ∂xµ2 ∂xµn = µ εµ1 µ2 ...µn µ′ µ′ ... µ′ . ∂x ∂x 1 ∂x 2 ∂x n ′ Mit Ausnahme der Determinante |∂xµ /∂xµ | ist dies das Transformationsverhalten eines Tensors. Wir betrachten auch das Transformationsverhalten von g = det gµν und finden ′ −2 ∂xµ g(x′ ) = µ g(x). ∂x 45 Allgemein bezeichnet man eine Größe, die sich wie ′ m ∂xµ µ × Tensor ∂x transformiert, als eine Tensordichte vom Gewicht m. Daher ist εµ1 µ2 ...µn eine Tensordichte mit Gewicht 1 und |g| eine Tensordichte mit Gewicht −2. Die Kombination p |g| εµ1 µ2 ...µn transformiert sich wie ein Tensor. Wir geben noch eine nützliche Formel für die Kontraktion zweier Levi-Civita-Symbole an. Es ist ...νr |g| εµ1 µ2 ...µr σ1 ...σn−r εν1 ν2 ...νr σ1 ...σn−r = (−1)s (n − r)!δνµ11µν22...µ , r wobei s die Anzahl der negativen Eigenwerte der Metrik ist und ν1 δµ1 ... δνµr 1 ...νr δνµ11µν22...µ = ... ... ... . r δνµ1 ... δνr r µr 5.5 Hodge-Theorie Sei M eine m-dimensionale Mannigfaltigkeit. Falls M eine Metrik besitzt, gibt es einen natürlichen Isomorphismus zwischen dem Raum aller r-Formen und dem Raum aller (m − r)-Formen, der durch die Hodge-Operation ∗ gegeben ist. ∗ : Ωr (M) → Ωm−r (M) µ1 µr ∗(dx ∧ ... ∧ dx ) = Bemerkung: p |g| µ1 ...µr νr+1 ε ∧ ... ∧ dxνm νr+1 ...νm dx (m − r)! ∗ ∗ ω = (−1)r(m−r)+s ω, wobei s wieder die Anzahl der negativen Eigenwerte der Metrik ist. Diese Formel verifiziert man leicht, indem man |g| σ ...σ µ ...µ ε 1 r σr+1 ...σm ε r+1 mν1 ...νr (dxν1 ∧ ... ∧ dxνr ) r! (m − r)! |g| εµ1 ...µr σr+1 ...σm εν1 ...νr σr+1 ...σm (dxν1 ∧ ... ∧ dxνr ) = (−1)r(m−r) r! (m − r)! ∗ ∗ (dxµ1 ∧ ... ∧ dxµr ) = (−1)r(m−r)+s µ1 ...µr ν1 δν1 ...νr (dx ∧ ... ∧ dxνr ) r! = (−1)r(m−r)+s (dxµ1 ∧ ... ∧ dxµr ) = 46 betrachtet. Mittels der Hodge-Operation kann man ein Skalarprodukt zwischen zwei r-Formen definieren. Sei 1 ωµ1 ...µr dxµ1 ∧ ... ∧ dxµk , r! 1 η = ηµ1 ...µr dxµ1 ∧ ... ∧ dxµk , r! ω = dann ist (ω, η) = Z M = 1 r! ω ∧ ∗η Z ωµ1 ...µr ηµ1 ...µr M p |g|dx1 ∧ ... ∧ dxm Dieses Produkt ist symmetrisch: (ω, η) = (η, ω) Beispiel: e 1 e 1 1 e µ ν ∗F = ∗ i F̃µν dxµ ∧ dxν . Fµν dx ∧ dx = i F µν εµνρσ dxρ ∧ dxσ = i ~c 2 4 ~c ~c 2 Wir haben weiter und daher 1 e 2 i (F, F) = 2 ~c Z 1 d xL = 8π 4 Z ~c e d 4 xFµν F µν 2 (F, F) . 5.6 Die kovariante Ableitung In flachen Raumzeiten bilden die Ableitungen eines Vektors ∂ Aµ ∂xν einen Tensor. In krummlinigen Koordinaten gilt dies jedoch nicht mehr. Man vergleicht hier einen Vektor an zwei verschiedenen Orten. Definition eines affinen Zusammenhangs: Ein affiner Zusammenhang ist eine Abbildung ∇ ∇ : Vect(M) × Vect(M) → Vect(M) (X ,Y ) → ∇X Y, 47 welche die folgenden Bedingungen erfüllt: ∇(X+Y ) Z ∇( f X)Y ∇X (Y + Z) ∇X ( fY ) ∇X Z + ∇Y Z f ∇X Y ∇X Y + ∇X Z X ( f )Y + f ∇X Y = = = = wobei f ∈ F(M) und X ,Y, Z ∈ Vect(M). Sei (U, ϕ) eine Karte mit den Koordinaten x = ϕ(p). Man definiert D3 Funktionen, die als Zuµ sammenhangskoeffizienten C νλ bezeichnet werden, durch ∇eµ eν = eλCλµν wobei {eµ } = {∂/∂µ } die Koordinatenbasis von Tp M ist. Für Funktionen f ∈ F(M) definiert man µ ∂f ∇X f = X ( f ) = X ∂xµ Dann hat ∇X ( fY ) die Form der Leibnitz-Regel ∇X ( fY ) = (∇X f )Y + f (∇X Y ) Weiter setzt man für Tensoren ∇X (T1 ⊗ T2 ) = (∇X T1 ) ⊗ T2 + T1 ⊗ (∇X T2 ) Im weiteren wird die Notation ∇µ = ∇eµ verwendet. Man beachte, daß ∂Y ν eν +Y ν ∇µ eν ∇X Y = X ∇µ (Y eν ) = X ∂xµ ! λ ∂Y = Xµ +Y νCλµν eλ ∂xµ µ ν µ gilt. ∇X Y ist unabhängig von der Ableitung von X . Daher betrachtet man ∇µ = ∇êµ und bezeichnet dies als kovariante Ableitung. Die obige Gleichung läßt sich nun wie folgt schreiben: ∇µ (Y ν eν ) = ∂µY ν +CνµλY λ eν 48 In der physikalischen Literatur wird der Basisvektor eν oft weggelassen und man findet die Komponentenschreibweise: ∇µY ν = ∂µY ν +CνµλY λ Man muß sich hier den Basisvektor eν dazudenken. Streng mathematisch hat man ∇µ eν = Cλµν eλ , ∇µY ν = ∂µY ν , ∇µ (Y ν eν ) = ∂µY ν +CνµλY λ eν . Wir betrachten noch wie die kovariante Ableitung auf kovariante Indizes wirkt. Sei ω = ωµ dxµ und Y = Y ν eν . Es ist ∇µ hω,Y i = ∇µ (ωνY ν ) = ∂µ ων Y ν + ων ∂µY ν . Andererseits soll sein ∇µ ω,Y + ω, ∇µY E D = (∂µ ων )dxν + ων ∇µ dxν ,Y + ω, (∂µY ν +CνµλY λ )eν D E = (∂µ ων )Y ν + ων ∇µ dxν ,Y λ eλ + ων (∂µY ν +CνµλY λ ). ∇µ hω,Y i = Somit und daher ων ∇µ dxν , eλ Y λ + ωνCνµλY λ = 0 ∇µ dxν = −Cνµλ dxλ . Es ist also ∇µ (ων dxν ) = Auch hier findet man oft die Schreibweise ∂µ ων −Cλµν ωλ dxν . ∇µ ων = ∂µ ων −Cλµν ωλ Wird diese Schreibweise verwendet, so muß man sich auch hier den Basisvektor dxν dazudenken. Paralleltransport: Falls ∇V X = 0 gilt, sagt man daß der Vektor entlang einer Kurve, die durch V beschrieben ist, parallel transportiert worden ist. 49 5.7 Der Levi-Civita-Zusammenhang Falls die Mannigfaltigkeit eine Metrik besitzt, können wir zusätzliche Bedingungen an den affinen Zusammenhang stellen: Wir verlangen, daß die Metrik gµν kovariant konstant ist, d.h. falls zwei Vektoren X und Y entlang einer Kurve paralleltransportiert werden, daß dann das Skalarprodukt zwischen ihnen sich nicht ändert. Durch eine Formel ausgedrückt bedeutet dies ∇V (g(X ,Y )) = 0 für alle X und Y mit ∇V X = ∇V Y = 0. Da dies für alle Kurven und parallelverschobene Vektoren gilt, folgt: ∇κ gµν dxµ ⊗ dxν = 0 bzw. ∂κ gµν −Cλκµ gλν −Cλκν gµλ dxµ ⊗ dxν = 0. Da dies für alle Komponenten gelten soll, folgt ∂κ gµν −Cλκµ gλν −Cλκν gµλ = 0. Man schreibt dies auch als ∇κ gµν = 0. In diesem Fall lassen sich die Zusammenhangskoeffizienten Cκµν wie folgt schreiben: Cκµν = Γκµν + K κµν Die Größen Γκµν nennt man die Christoffel-Symbole. Sie sind symmetrische in µ ↔ ν. Die Größen K κµν bezeichnet man als Kontorsionskoeffizienten. Man findet 1 κλ g ∂µ gνλ + ∂ν gµλ − ∂λ gµν 2 1 κ = T µν + Tµ κν + Tν κµ 2 = Cκµν −Cκνµ Γκµν = K κµν T κµν T κµν ist antisymmetrisch bezüglich der unteren Indizes und wird Torsionstensor genannt. Einen affiner Zusammenhang nennt man symmetrisch, falls der Torsionstensor verschwindet. Ist dies der Fall, so gilt Cκµν = Γκµν , Γλµν = Γλνµ . 50 Theorem: Auf einer Riemann’schen Mannigfaltigkeit bzw. semi-Riemann’schen Mannigfaltigkeit (M, g) gibt es einen eindeutigen symmetrischen Zusammenhang, der mit der Metrik kombatibel ist. Diesen Zusammenhang bezeichnet man als Levi-Civita-Zusammenhang. Ist die Metrik kovariant konstant und sind die Zusammenhangskoeffizienten symmetrisch, so läßt sich die Formel für die Christoffelsymbole, die auch die Existenz und Eindeutigkeit zeigt, relativ leicht herleiten. Wir schreiben zunächst die Gleichung für die Metrik für drei verschiedene Permutationen von Indizes auf: ∇ρ gµν = ∂ρ gµν − Γλρµ gλν − Γλρν gµλ = 0, ∇µ gνρ = ∂µ gνρ − Γλµν gλρ − Γλµρ gνλ = 0, ∇ν gρµ = ∂ν gρµ − Γλνρ gλµ − Γλνµ gρλ = 0. Subtrahiert man die letzten beiden von der ersten, so erhält man ∂ρ gµν − ∂µ gνρ − ∂ν gρµ + Γλµν gλρ + Γλνµ gρλ + Γλνρ gλµ − Γλρν gµλ + Γλµρ gνλ − Γλρµ gλν = 0. Verwendet man nun die Symmetrie der Christoffelsymbole und der Metrik, so ergibt sich ∂ρ gµν − ∂µ gνρ − ∂ν gρµ + 2Γλµν gλρ = 0. Auflösen dieser Gleichung liefert die Formel Γκµν = 5.8 Der Satz von Stokes 1 κλ g ∂µ gνλ + ∂ν gµλ − ∂λ gµν . 2 Der Satz von Stokes läßt sich mittels Differentialformen für differenzierbare Mannigfaltigkeiten mit Rand elegant wie folgt schreiben: Z dω = M Z ω. ∂M Hierbei ist M eine n-dimensionale Mannigfaltigkeit, die einen Rand haben darf. Der Rand wird mit ∂M bezeichnet. ω ist eine (n − 1)-Form. Besitzt die Mannigfaltigkeit eine Metrik g, so läßt sich der Satz von Stokes auch wie folgt schreiben: Z Z p p n µ d x |g|∇µV = d n−1 y |γ| nµV µ . M ∂M Hierbei ist ∇µ die kovariante Ableitung bezüglich des Levi-Civita-Zusammenhangs, γ die durch g auf ∂M induzierte Metrik und nµ ein Einheitsnormalenvektor auf ∂M. 51 Die zweite Fassung des Satzes von Stokes läßt sich wie folgt für semi-Riemannsche Mannigfaltigkeiten aus der ersten Version herleiten: Da M eine Metrik besitzt, läßt sich jede (n−1)-Form als das Hodge-Duale einer Einsform V = Vµ dxµ darstellen: ω = ∗V Schreiben wir ω = 1 ωµ ...µ dxµ1 ∧ ... ∧ dxµn−1 (n − 1)! 1 n−1 so ist ωµ1 ...µn−1 = Weiter ist p |g|Vµ gµν ενµ1 ...µn−1 = p |g|V µ εµµ1 ...µn−1 . 1 ∂µ1 ωµ2 ...µn dxµ1 ∧ dxµ2 ∧ ... ∧ dxµn (n − 1)! p 1 µ ∂µ = |g|V εµµ2 ...µn dxµ1 ∧ dxµ2 ∧ ... ∧ dxµn (n − 1)! 1 1 p µ |g|V εµ1 µ2 ...µn dxµ1 ∧ dxµ2 ∧ ... ∧ dxµn . ∂µ = n! dω = In der zweiten Zeile muß aufgrund von εµµ2 ...µn und dxµ1 ∧ dxµ2 ∧ ... ∧ dxµn die Beziehung µ = µ1 gelten, wir können also die kovarianten Indizes µ und µ1 vertauschen. Nach der Vertauschung können wir die Beschränkung µ = µ1 aufheben und über alle Paare (µ, µ1) ohne weitere Einschränkungen summieren. Dadurch wird jeder Term n-fach gezählt, dies wird durch den zusätzlichen Faktor 1/n kompensiert. Da weiter ∂µ εµ1 µ2 ...µn = 0 ist, erhalten wir p dω = ∂µ |g|V µ dx1 ∧ ... ∧ dxn . Wir betrachten nun für den Levi-Civita-Zusammenhang µ ν µνV ∇µV µ = ∂µV µ + Γ Hierbei haben wir µ µν Γ verwendet. Wir erhalten also dω = p 1 = p ∂µ |g|V µ . |g| p 1 = p ∂ν |g| |g| ∇µV µ 52 p |g|d n x und somit ergibt sich für die linke Seite des Satzes von Stokes Z M Z dω = M p d n x |g|∇µV µ . Betrachten wir nun die rechte Seite des Satzes von Stokes, die die Integration über den Rand von M beinhaltet. Der Rand ∂M stellt eine (n − 1)-dimensionale Hyperfläche dar. Es empfiehlt sich, Gaußsche Normalkoordinaten (z, y1 , ..., yn−1 ) zu verwenden, wobei die Koordinaten (y1 , ..., yn−1) die (n − 1)-dimensionale Hyperfläche ∂M parametrisieren und z eine Koordinate in Richtung des Normalenvektors nµ ist. Die auf ∂M induzierte Metrik ist durch γαβ = ∂xµ ∂xν gµν ∂yα ∂yβ gegeben. Die Metrik auf M läßt sich durch die Gaußschen Normalkoordinaten ausdrücken: g = ±dz ⊗ dz + γαβ dyα ⊗ dyβ , d.h. Mischterme dyα ⊗ dz treten nicht auf. In diesen Koordinaten gilt p p |g| = |γ|. Das Volumenelement auf dem Rand ist dann p |γ|dy1 ∧ ... ∧ dyn−1 . Mit Hilfe des Einheitsnormalenvektors nµ können wir das Volumenelement auf dem Rand ∂M koordinatenunabhängig schreiben: 1 p |g|nµ1 εµ1 µ2 ...µn dxµ2 ∧ ... ∧ dxµn . (n − 1)! Betrachten wir nun die rechte Seite des Satzes von Stokes. Es ist Z ω = ∂M Z ∂M = Z ∂M = Z ∂M 1 p |g|V µ εµµ2 ...µn dxµ2 ∧ ...dxµn (n − 1)! 1 p |g|V µ nµ nµ1 εµ1 µ2 ...µn dxµ2 ∧ ...dxµn (n − 1)! p d n−1 y |γ|V µ nµ . Es bleibt noch das Vorzeichen des Einheitsnormalenvektors nµ zu diskutieren. Im Riemann’schen Fall mit positiver definiter Metrik zeigt nµ nach außen. Daher gilt im semi-Riemannschen Fall: Ist nµ zeitartig, so zeigt nµ nach außen, ist nµ hingegen raumartig, so zeigt nµ nach innen. 53 5.9 Der Krümmungstensor Vorbemerkung: Sei X = X µ eµ = X µ ∂ ∂xµ ein Vektorfeld. Ein Vektorfeld wirkt auf eine Funktion als Richtungsableitung: X( f ) = Xµ ∂ f. ∂xµ Sei nun Y = Yν ∂ ∂xν ein weiteres Vektorfeld. Man definiert die Lie-Klammer [X ,Y ] als [X ,Y ]( f ) = X (Y ( f )) −Y (X ( f )). Nun hat man und somit X (Y ( f )) = X µ ∂µ (Y ν ∂ν f ) = X µ ∂µY ν (∂ν f ) + X µY ν ∂µ ∂ν f , Y (X ( f )) = Y µ ∂µ (X ν ∂ν f ) = Y µ ∂µ X ν (∂ν f ) +Y µ X ν ∂µ ∂ν f , [X ,Y ]( f ) = X µ∂µY ν −Y µ ∂µ X ν ∂ν f . Die Lie-Klammer ist wieder ein Vektorfeld, dessen Komponenten durch [X ,Y ] = X µ ∂µY ν −Y µ ∂µ X ν eν gegeben sind. Bemerkung: Weder XY noch Y X sind Vektorfelder, da sie zweite Ableitungen enthalten. Die Kombination [X ,Y ] enthält dagegen nur erste Ableitungen und ist daher ein Vektorfeld. Bemerkung: Ein wichtiger Spezialfall ist eµ , eν = 0. (Dies sieht man am leichtesten wenn man eµ = ∑ X σeσ mit X σ = 0 für µ 6= σ und X σ = 1 für µ = σ betrachtet.) 54 Da die Zusammenhangskoeffizienten Cλµν keinen Tensor darstellen, können sie keine intrinsische Bedeutung als Maß der Krümmung einer Mannigfaltigkeit haben. Als intrinsische Objekte stehen der Torsionstensor T : Vect(M) ⊗ Vect(M) → Vect(M) T (X ,Y ) = ∇X Y − ∇Y X − [X ,Y ] und der Riemann’sche Krümmungstensor R : Vect(M) ⊗ Vect(M) ⊗ Vect(M) → Vect(M) R(X ,Y, Z) = ∇X ∇Y Z − ∇Y ∇X Z − ∇[X,Y ] Z zur Verfügung. Offensichtlich sind R und T anti-symmetrisch in X und Y : T (X ,Y ) = −T (Y, X ) R(X ,Y, Z) = −R(Y, X , Z) Verwendet man die Koordinatendarstellung, so hat man λ T (eµ , eν ) = T µν eλ , κ R(eµ , eν , eλ ) = R λµν eκ . Bemerkung: Man achte auf Stellung des Index λ! Mit Hilfe von ∇µ eν = Cλµν eλ , λ und Rκ : bestimmen wir nun T µν λµν eµ , eν = 0, T (eµ , eν ) = ∇µ eν − ∇ν eµ − eµ , eν = Cλµν eλ −Cλνµ eλ = Cλµν −Cλνµ eλ , R(eµ , eν , eλ ) = ∇µ ∇ν eλ − ∇ν ∇µ eλ − ∇[eµ ,eν ] eλ Wir haben also: = ∇µCκνλ eκ − ∇νCκµλ eκ κ κ κ = ∇µC νλ eκ +C νλ ∇µ eκ − ∇νC µλ eκ −Cκµλ ∇ν eκ η η = ∂µCκνλ eκ +CκνλC µκ eη − ∂νCκµλ eκ −CκµλC νκ eη η η = ∂µCκνλ − ∂νCκµλ +C νλCκµη −C µλCκνη eκ . λ T µν = Cλµν −Cλνµ , η η Rκλµν = ∂µCκνλ − ∂νCκµλ +C νλCκµη −C µλCκνη . 55 Wir werden im folgenden nur den Levi-Civita-Zusammenhang betrachten. Hier verschwindet der Torsionstensor und die Zusammenhangskoeffizienten Cκµν sind gleich den Christoffel-Symbolen Γκµν : 1 Cκµν = Γκµν = gκλ ∂µ gνλ + ∂ν gµλ − ∂λ gµν . 2 Der Riemann’sche Krümmungstensor läßt sich dann durch die Christoffel-Symbole ausdrücken: η η Rκλµν = ∂µ Γκνλ − ∂ν Γκµλ + Γ νλ Γκµη − Γ µλ Γκνη . ρ Bemerkung: Für Rκλµν = gκρ R λµν findet man Rκλµν 1 = 2 ∂2 gλµ ∂2 gκµ ∂2 gλν ∂2 gκν − + − ∂xλ ∂xµ ∂xκ ∂xµ ∂xκ ∂xν ∂xλ ∂xν ! ξ ξ η η + gξη Γ κν Γ λµ − Γ κµ Γ λν . Der Tensor Rκλµν hat die folgenden Symmetrien: Rκλµν = −Rκλνµ , Rκλµν = −Rλκµν , Rκλµν = Rµνκλ . Als Ricci-Tensor definiert man die folgende Verjüngung des Krümmungstensors: Ricµν = Rλµλν Der Ricci-Tensor ist symmetrisch: Ricµν = Ricνµ . Die skalare Krümmung ist definiert als R = gµν Ricµν Der Einstein’sche Tensor wird als die folgende Kombination definiert: 1 Gµν = Ricµν − gµν R 2 Die Identitäten von Bianchi: Rκλµν + Rκµνλ + Rκνλµ = 0, ∇ρ Rκλµν + ∇κ Rλρµν + ∇λ Rρκµν = 0. Beweis der ersten Identität von Bianchi: Äquivalente Formulierungen sind Rκλµν + Rκµνλ + Rκνλµ = 0, R(X ,Y, Z) + R(Y, Z, X ) + R(Z, X ,Y) = 0. 56 Für den Beweis geht man vom Verschwinden des Torsionstensors aus: T (X ,Y ) = ∇X Y − ∇Y X − [X ,Y ] = 0. Differenziert man kovariant, so erhält man ∇Z (∇X Y − ∇Y X − [X ,Y ]) = 0, ∇Z ∇X Y − ∇Z ∇Y X − ∇Z [X ,Y ] = 0. Wir betrachten den Term ∇Z [X ,Y ] und verwenden nochmal die Torsionsfreiheit: ∇Z [X ,Y ] − ∇[X,Y ] Z − [Z, [X ,Y ]] = 0. Somit ergibt sich ∇Z ∇X Y − ∇Z ∇Y X − ∇[X,Y ] Z − [Z, [X ,Y ]] = 0. Summiert man über die drei zyklischen Permutationen von (X ,Y, Z) und verwendet man die Jacobi-Identität [Z, [X ,Y ]] + [X , [Y, Z]] + [Y, [Z, X ]] = 0. so erhält man ∇Z ∇X Y − ∇Z ∇Y X − ∇[X,Y ] Z +∇X ∇Y Z − ∇X ∇Z Y − ∇[Y,Z] X +∇Y ∇Z X − ∇Y ∇X Z − ∇[Z,X]Y = 0, oder anders ausgedrückt R(X ,Y, Z) + R(Y, Z, X ) + R(Z, X ,Y) = 0. Beweis der zweiten Identität von Bianchi: Äquivalente Formulierungen sind ∇ρ Rµνκλ + ∇κ Rµνλρ + ∇λ Rµνρκ = 0, µ µ µ ∇ρ R νκλ + ∇κ R νλρ + ∇λ R νρκ = 0, (∇X R) (Y, Z,V ) + (∇Y R) (Z, X ,V ) + (∇Z R) (X ,Y,V ) = 0. Bei der zweiten Zeile ist zu beachten, daß für den Levi-Civita Zusammenhang die Metrik kovariant konstant ist (∇ρ gκµ = 0) und man daher die kovariante Ableitung mit dem Hochziehen der Indizes vertauschen kann. Für den Beweis führen wir die folgende Notation ein, um etwas Schreibarbeit zu sparen: Sei S die Operation, die über die drei zyklischen Permutationen von (X ,Y, Z) summiert. In dieser Schreibweise ist also zu zeigen S (∇Z R) (X ,Y,V ) = 0. 57 Wir beginnen wieder mit dem Verschwinden des Torsionstensors T (X ,Y ) = 0 und erhalten R (T (X ,Y ), Z,V ) = R (∇X Y, Z,V ) − R (∇Y X , Z,V ) − R ([X ,Y ] , Z,V ) = 0. Summation über alle drei zyklischen Permutationen liefert S (R (∇Z X ,Y,V ) − R (∇ZY, X ,V ) − R ([X ,Y ] , Z,V )) = 0, und da der Riemann’sche Tensor in den ersten beiden Komponenten anti-symmetrisch ist: S (R (∇Z X ,Y,V ) + R (X , ∇ZY,V ) − R ([X ,Y ] , Z,V )) = 0, Wir betrachten nun ∇Z (R(X ,Y,V )) = (∇Z R) (X ,Y,V ) + R (∇Z X ,Y,V ) + R (X , ∇ZY,V ) + R (X ,Y, ∇ZV ) . Dies eingesetzt ergibt S (∇Z (R(X ,Y,V )) − (∇Z R) (X ,Y,V ) − R (X ,Y, ∇ZV ) − R ([X ,Y ] , Z,V )) = 0. Wir zeigen nun S (∇Z (R(X ,Y,V )) − R (X ,Y, ∇ZV ) − R ([X ,Y ] , Z,V )) = 0, dann folgt hieraus die zweite Bianchi-Identität S (∇Z R) (X ,Y,V ) = 0. Es ist ∇Z (R(X ,Y,V )) − R (X ,Y, ∇ZV ) − R ([X ,Y ] , Z,V ) = = ∇Z ∇X ∇Y − ∇Z ∇Y ∇X − ∇Z ∇[X,Y ] V − ∇X ∇Y ∇Z − ∇Y ∇X ∇Z − ∇[X,Y ] ∇Z V − ∇[X,Y ] ∇Z − ∇Z ∇[X,Y ] − ∇[[X,Y ],Z] V = [∇Z , [∇X , ∇Y ]]V + ∇[[X,Y ],Z]V. Summiert man nun über die drei zyklischen Permutationen so ist wegen der Jacobi-Identität S [∇Z , [∇X , ∇Y ]]V + ∇[[X,Y ],Z]V = 0, und die zweite Bianchi-Identität ist bewiesen. Ein wichtige Folgerung aus der zweiten Bianchi-Identität erhält man aus den folgenden Schritten: Kontrahiert man in der zweiten Identität κ und µ so findet man: gµκ ∇ρ Rκλµν + ∇µ Rλρµν + gµκ ∇λ Rρκµν = 0. 58 Nun ist für den Levi-Civita Zusammenhang die Metrik kovariant konstant ∇ρ gκµ = 0 und man kann Kontraktion und kovariante Ableitung vertauschen: ∇ρ Ricλν + ∇µ Rλρµν − ∇λ Ricρν = 0. Kontrahiert man noch λ und ν, so findet man ∇ρ R − ∇µ Ricρµ − ∇ν Ricρν = 0. ∇ρ R − 2∇µ Ricρµ = 0, 1 µ −2∇ Ricµρ − gµρ R = 0. 2 Anders ausgedrückt erhält man ∇µ Gµν = 0. 5.10 Symmetrien und Killingvektoren Symmetrien spielen eine wichtige Rolle in der Physik und wir betrachten nun das Symmetriekonzept für semi-Riemann’sche Mannigfaltigkeiten. Die Poincarégruppe, bestehend aus Lorentztransformationen und Translationen, ist zum Beispiel die Symmetriegruppe des flachen MinkowskiRaumes. Unter einer Poincarétransformation transformieren sich die Koordinaten wie x′ µ µ = Λ ν xν + bµ . Die Metrik gµν dxµ dxν ist invariant unter diesen Transformationen. Symmetrien, die die Metrik invariant lassen, bezeichnet man als Isometrien. Wir definieren nun Isometrien (d.h. Symmetrien die die Metrik invariant lassen) für eine beliebige semi-Riemann’sche Mannigfaltigkeit M: Sei f :M→M ein Diffeomorphismus. Man nennt f eine Isometrie, falls f ∗g = g gilt. Falls X ,Y ∈ Tp M bedeutet dies g f (p) ( f∗ X , f∗Y ) = g p(X ,Y ). Die identische Abbildung, die Komposition von Isometrien und das Inverse einer Isometrie sind wieder Isometrien. Die Isometrien bilden daher eine Gruppe. Isometrien erhalten die Länge eines 59 Vektors. Beispiel: Für den Minkowski-Raum ist die Isometriegruppe durch die Poincarégruppe gegeben. Killing Vektorfelder: Sei (M, g) eine semi-Riemann’sche Mannigfaltigkeit und X ∈ Vect(M) ein Vektorfeld auf M. Falls die Transformation x′ µ = xµ + εX µ , wobei ε eine infinitessimale Größe ist, eine Isometrie ist, so bezeichnet man X als ein Killing Vektorfeld. In diesem Fall gilt ∂(xκ + εX κ ) ∂(xλ + εX λ) gκλ (x + εX ) = gµν (x). ∂xµ ∂xν Mit gκλ (x + εX ) = gκλ (x) + εX σ∂σ gκλ (x) + O (ε2 ) ergibt sich X σ∂σ gµν + gκν ∂µ X κ + gµλ ∂ν X λ = 0. Dies ist die Gleichung von Killing. Für den Levi-Civita-Zusammenhang können wir diese Gleichung auch wie folgt schreiben: ∇µ Xν + ∇ν Xµ = 0. Eine Menge von Killing Vektorfeldern nennt man abhängig, falls ein Vektorfeld aus dieser Menge sich als Linearkombination der anderen mit konstanten Koeffizienten darstellen läßt. Bemerkung: Die Anzahl der unabhängigen Killing Vektorfelder kann größer als die Dimension der Mannigfaltigkeit sein. Beispiel: Für den Minkowski-Raum verschwinden die Zusammenhangskoeffizienten des LeviCivita-Zusammenhangs und die Gleichung von Killing reduziert sich auf ∂µ Xν + ∂ν Xµ = 0. Offensichtlich erfüllen die vier konstanten Vektorfelder µ µ X(i) = δ i , 0 ≤ i ≤ 3, diese Gleichung. Darüberhinaus erfüllen auch die Vektorfelder X µ = aµν xν , 60 wobei aµν anti-symmetrisch und konstant ist, die Killing-Gleichung. Wir haben also 4 + 6 = 10 unabhängige Killing Vektorfelder, die natürlich den Translationen und den Lorentztransformationen entsprechen. Für den euklidischen Raum der Dimension D (bzw. Minkowski-Raum der Dimension D) findet man D (D + 1) 2 unabhängige Killing Vektorfelder, die den D Translationen und den D(D − 1)/2 Rotationen bzw. Lorentztransformationen entsprechen. Allgemein bezeichnet man eine semi-Riemann’sche Mannigfaltigkeit (M, g) der Dimension D, welche D (D + 1) 2 unabhängige Killing Vektorfelder besitzt, als einen maximal symmetrischen Raum. Für maximal symmetrische Räume ist die Krümmung an jedem Punkt und in jede Richtung identisch, da die Killing Vektorfelder D Symmetrien bezüglich Translationen und D(D − 1)/2 Symmetrien bezüglich Rotationen liefern. Wir können nun versuchen den Krümmungstensor aus invarianten Tensoren zu konstruieren. Hierfür stehen die Metrik und der total anti-symmetrische Tensor zur Verfügung. Berücksichtigt man die Symmetrieeigenschaften des Riemann’schen Krümmungstensors, so ergibt sich für die Tensorstruktur nur eine Möglichkeit: Rκλµν = c gκµ gλν − gκν gλµ . Die Proportionalitätskonstante findet man durch Kontraktion mit gκµ und gλν : R = c D2 − D , und daher Rκλµν = R gκµ gλν − gκν gλµ . D(D − 1) Die Krümmung maximal symmetrischer Räume ist daher vollständig durch die skalare Krümmung R beschrieben. Man unterscheidet die Fälle R = 0, R > 0 und R < 0. Maximal symmetrische Räume, in der die Metrik eine euklidische Signatur hat, sind: R>0 R=0 R<0 Sphäre Sn , Euklidischer Raum Rn , hyperbolischer Raum H n . 61 Maximal symmetrische Räume, in der die Metrik Lorentz-Signatur hat, sind: R>0 R=0 R<0 Anti de Sitter-Raum AdSn , Minkowski-Raum M n , de Sitter-Raum dSn . Zur Erinnerung sei darauf hingewiesen, daß hier die Konvention verwendet wird, bei der eine Metrik mit Lorentz-Signatur einen positiven und (n − 1) negative Eigenwerte hat. Man findet in der Literatur auch oft die entgegengesetzte Konvention, in dem eine Metrik mit Lorentz-Signatur einen negativen und (n − 1) positive Eigenwerte besitzt. Die beiden Fälle stehen durch gµν → −gµν in Beziehung. Unter dieser Transformation findet man Γκµν Rκλµν Ricµν R → → → → Γκµν , Rκλµν , Ricµν , −R. 5.11 Der Weyl Tensor Der Ricci Tensor und die skalare Krümmung enthalten die Information, die durch Spurbildung aus dem Riemann’schen Krümmungstensor gewonnen werden kann. Der spurlose Anteil geht hierbei verloren. Dieser Anteil wird durch den Weyl Tensor ausgedrückt. In D Dimensionen ist der Weyl Tensor durch 2 gκµ Ricνλ − gκν Ricµλ − gλµ Ricνκ + gλν Ricµκ D−2 2 gκµ gνλ − gκν gµλ R + (D − 1)(D − 2) Cκλµν = Rκλµν − definiert. Der Weyl Tensor ist nur für Mannigfaltigkeiten mit einer Dimension D ≥ 3 definiert. Für D = 3 verschwindet er identisch. Der Weyl Tensor hat die gleichen Symmetrieeigenschaften wie der Riemann’sche Krümmungstensor: Cκλµν Cκλµν Cκλµν Cκλµν +Cκµνλ +Cκνλµ = = = = −Cκλνµ , −Cλκµν , Cµνκλ , 0, Der Weyl Tensor wird auch oft als konformer Tensor bezeichnet. Dies hat den folgenden Grund: Betrachtet man zwei Metriken gµν und g′ µν = ω2 (x)gµν , 62 wobei ω(x) eine beliebige nicht-verschwindende Funktion auf der Mannigfaltigkeit ist, so findet man κ Cκλµν = C′ λµν . 63 6 Allgemeine Relativitätstheorie 6.1 Größenordnungen Wir betrachten zunächst die Größenordnung der Gravitation im Vetgleich zur elektromagnetischen Kraft: Die gravitative Wechselwirkung zwischen einem Proton und einem Antiproton beträgt FG = − Gm2p r̂, r2 wobei die Newton’sche Konstante G den Wert G = (6.67259 ± 0.00085) · 10−11 m3 kg−1 s−2 hat. Zum Vergleich: Die Coulombkraft beträgt FC = − 1 e2 r̂. 4πε0 r2 Für das Verhältnis der beiden Kräfte findet man FG 4πε0 Gm2p = = 0.81 · 10−36. FC e2 Die Gravitation ist die schächste der bekannten Kräfte. Bemerkung: Im Gegensatz zur elektrischen Kraft ist die Gravitation immer anziehend. Dimensionslose Größen: 1 e2 1 = 0.0072973 = , 4πε0 ~c 137.036 Gm2p = 5.9 · 10−39. = ~c α = αG Planck-Masse: MPl = r ~c = 1.221 · 1019 GeV = 2.177 · 10−8 kg. G Die Planck-Masse ist wesentlich größer als die Massen der heute bekannten Elementarteilchen. Planck-Länge: λPl = 2π~c = (2π)1.62 · 10−35 m. 2 MPl c Die Planck-Länge ist kürzer als die typische Reichweite der Teilchenkräfte (≈ 10−18 m). 64 6.2 Das Äquivalenzprinzip Das Äquivalenzprinzip: Wir betrachten zunächst ein Teilchen im Gravitationsfeld in der nichtrelativistischen Mechanik. Die Lagrange-Funktion lautet: L = 1 mT v2 − mS φ, 2 wobei mT die Träge Masse des Teilchens bezeichne, und mS die schwere Masse des Teilchens bezeichne. Die Bewegungsgleichung lautet: mT d ~v = −mS~∇φ. dt Experimentell ist bekannt, daß mT = mS gilt. Dies ist die schwache Formulierung des Äquivalenzprinzips: Die schwere und die träge Masse sind gleich. Daher: d ~v = −~∇φ. dt Betrachte eine Anzahl von Probeteilchen in einem homogenen und zeitlich konstanten Gravitationsfeld. In einem Inertialsystem K lauten die Bewegungsgleichungen: mi d 2 (i) ~x = mi~g + ∑ ~Fi j . dt 2 j6=i Geht man von dem Inertialsystem K über zu einem mit ~g gleichmäßig beschleunigten Bezugssystem K ′ , 1 ~y = ~x − ~gt 2 , 2 so lauten die Bewegungsgleichungen mi d 2 (i) ~y = dt 2 ∑ ~Fi j . j6=i Starke Version des Äquivalenzprinzips: In jedem Punkt x der Raumzeit M kann man immer ein lokales Inertialsystem finden derart, daß in einer hinreichend kleinen Umgebung U ∈ M von x die Bewegungsgleichungen genau die aus der speziellen Relativitätstheorie bekannte Form annehmen, d.h. die Existenz eines Graviationsfeldes kann durch lokale Experimente alleine nicht nachgewiesen werden. Bemerkung: Die schwache Version des Äquivalenzprinzips bezieht sich nur auf die Bewegungsgesetze frei fallender Körper, die starke Version bezieht sich auf alle physikalischen Phänomene. 65 Im folgenden sei ηµν 1 0 0 0 0 −1 0 0 = 0 0 −1 0 0 0 0 −1 die bekannte Metrik der flachen Minkowski Raum-Zeit. In der allgemeinen Relativitätstheorie wird die Metrik eine ortsabhängige Funktion. Eine mathematisch präzise Formulierung des starken Äquivalenzprinzips lautet: In jedem Punkt x0 der Raumzeit kann man ein Bezugssystem so konstruieren, daß gµν (x0 ) = ηµν , ∂gµν (x) = 0. ∂xα x0 Solche Bezugssysteme werden Gauß’sche Koordinaten oder Normalkoordinaten genannt. 6.3 Bewegung eines Teilchens im Gravitationsfeld Wir betrachten zunächst, wie sich ein Teilchen kräftefrei auf einer gegebenen Mannigfaltigkeit bewegt. Zur Erinnerung: In der Newton’schen Mechanik bewegt sich ein freies Teilchen mit konstanter Geschwindigkeit entlang gerader Linien. In der speziellen Relativitätstheorie hatten wir dies wie folgt formuliert: Die kräftefreie Bewegung eines Teilchens erfolgt mit konstanter Vierergeschwindigkeit: d µ u = 0, ds Diese Bewegungsgleichung konnten wir mit Hilfe des Prinzips der kleinsten Wirkung aus der Wirkung eines freien Teilchens S = −mc Zb ds a herleiten. Diese Wirkung ist proportional zur Länge des Weges zwischen den Raumzeitpunkten a und b, und ein Minimum wird erreicht für die kürzeste Verbindung zwischen a und b. Wege, welche die kürzeste Verbindung zwischen zwei Punkten beschreiben, nennt man Geodäten. 66 Um die Bewegung eines kräftefreien Teilchens auf einer beliebigen semi-Riemann’schen Mannigfaltigkeit zu beschreiben, betrachten wir daher Geodäten. Für eine semi-Riemann’sche Mannigfaltigkeit mit dem Levi-Civita-Zusammenhang gibt es eine alternative Definition für Geodäten: Eine Geodäte ist eine Kurve entlang der der Tangentialvektor der Kurve paralleltransportiert wird. Sei xµ (λ) eine Kurve und T xµ (0) ist µ1 ...µk ν1 ...νl ein Tensor. Der Tangentialvektor an die Kurve im Punkte V = dxµ eµ dλ Der Tensor wird entlang der Kurve paralleltransportiert, falls gilt: µ ...µ ∇V T 1 kν1 ...νl dxτ µ ...µ = ∇τ T 1 kν1 ...νl = 0. dλ Für einen Vektor (ein (1, 0)-Tensorfeld) vereinfacht sich diese Gleichung zu dxτ dxτ µ ∂τV µ + Γ τσV σ = 0. ∇τV µ = dλ dλ Setzen wir nun für V µ den Ausdruck für den Tangentialvektor V µ = dxµ /dλ ein, so erhält man σ τ σ dxτ dxµ d 2 xµ µ dx µ dx dx ∂τ = + Γ τσ + Γ = 0. τσ dλ dλ dλ dλ2 dλ dλ Die Gleichung τ σ d 2 xµ µ dx dx + Γ = 0 τσ dλ2 dλ dλ nennt man die Geodäten-Gleichung. Falls die Zusammenhangskoeffizienten verschwinden, was zum Beispiel im euklidischen Raum oder im Minkowski-Raum der Fall ist, so reduziert sich die Geodäten-Gleichung auf d 2 xµ = 0, dλ2 was der Bewegung eines Teilchens mit konstanter Geschwindigkeit entlang einer geraden Linie entspricht. Bei der Herleitung der Geodäten-Gleichung sind wir von der Definition bezüglich des Paralleltransports des Tangentialvektors einer Kurve ausgegangen. Betrachten wir nun die erste Definition, welche Geodäten als die kürzeste Verbindung zwischen zwei Punkten definiert, und hierzu das Funktional Z r dxµ dxν s = dλ gµν dλ dλ 67 Setzen wir f = gµν dxµ dxν dλ dλ so ergibt sich für die Variation dieses Funktionals δs = Z Z p 1 1 √ δ f dλ. δ f dλ = 2 f Wählt man nun als Parameter λ die Eigenzeit s (genauer gesagt s = cτ), so erhält man f = gµν dxµ dxν = gµν uµ uν = 1. ds ds Es ist daher ausreichend, die Extrema des einfacheren Funktionals I = 1 2 Z f ds = 1 2 Z gµν dxµ dxν ds ds ds zu betrachten. Wir betrachten nun xµ → xµ + δxµ , gµν → gµν + ∂σ gµν δxσ . Dies eingesetzt ergibt 1 δI = 2 Z dxµ dxν σ d (δxµ ) dxν dxµ d (δxν ) ∂σ gµν ds. δx + gµν + gµν ds ds ds ds ds ds Die letzten beiden Terme lassen sich partiell integrieren, so zum Beispiel Z Z 1 d 2 xµ dgµν dxµ dxµ d (δxν ) 1 gµν 2 + gµν δxν ds ds = − 2 ds ds 2 ds ds ds Z dxσ dxµ d 2 xµ 1 δxν ds. gµν 2 + ∂σ gµν = − 2 ds ds ds Setzt man dies ein, so erhält man Z dxµ dxν d 2 xµ 1 gµσ 2 + ∂µ gνσ + ∂ν gσµ − ∂σ gµν δI = − δxσ ds. ds 2 ds ds Falls die Variation verschwindet, erhält man gµσ dxµ dxν d 2 xµ 1 ∂ g + ∂ g − ∂ g + = 0. µ νσ ν σµ σ µν ds2 2 ds ds Multipliziert man noch mit der inversen Metrik, so ergibt sich dxµ dxν d 2 xρ 1 ρσ + g ∂ g + ∂ g − ∂ g = 0. µ νσ ν σµ σ µν ds2 2 ds ds 68 Dies ist genau die Geodäten-Gleichung mit den Christoffesymbolen als Zusammenhangskoeffizienten. Also sind die beiden Definitionen der Geodäten für den Levi-Civita-Zusammenhang äquivalent. Zum Abschluss betrachten wir noch eine dritte Herleitung der Geodäten-Gleichung, indem wir bekannte Beziehungen aus dem flachen Minkowski-Raum “kovariant”-verallgemeinern: Wir starten von der Bewegungsgleichung eines kräftefreien Teilchens im Minkowski-Raum: d µ u = 0, ds Dies läßt sich auch als duµ = 0 schreiben. Die Verallgemeinerung auf gekrümmte Räume lautet ∇uµ = 0. Mit der Definition der kovarianten Ableitung erhält man µ duµ + Γ νρ uν dxρ = 0. Teilt man wieder durch ds, so findet man ρ ν d 2 xµ µ dx dx + Γ = 0. νρ ds2 ds ds Dies ist die gesuchte Bewegungsgleichung. Die Bewegung des Teilchens wird durch die Größen 2 µ µ Γ νρ bestimmt. Da ddsx2 die Viererbeschleunigung des Teilchens ist, kann man die Größe µ −mΓ νρ uν uρ als die auf Teilchen im Graviationsfeld wirkende Viererkraft bezeichnen. 6.4 Die Einstein’schen Feldgleichungen In diesem Abschnitt werden wir die Einstein’schen Feldgleichungen heuristisch “herleiten”. Wir hatten bereits im letzten Abschnitt gesehen, daß sich die Geodätengleichung ergibt, wenn man ausgehend von der Bewegungsgleichung im flachen Raum duµ /ds = 0 partielle Ableitungen durch kovariante Ableitungen ersetzt. In diesem Abschnitt werden wir diese “Regeln” nun auch verwenden, um die Feldgleichungen der Gravitation zu finden. Im darauffolgenden Abschnitt werden wir dann die Feldgleichungen in einer strikteren Betrachtungsweise aus einer Lagrangedichte ableiten. Die Regeln für die “minimale Ersetzung”: • Ersetze partielle Ableitungen durch kovariante Ableitungen. 69 • Ersetze die flache Metrik ηµν durch gµν . Als ein Beispiel sei angeführt, daß im flachen Minkowski-Raum gilt ∂µ T µν = 0. Dies wird für gekrümmte Mannigfaltigkeiten verallgemeinert zu ∇µ T µν = 0. Haben wir die Einstein’schen Feldgleichungen gefunden, so möchten wir auch zeigen, daß sie sich im Newton’schen Grenzfall auf die uns bekannten Gleichungen der klassischen Mechanik reduzieren. d 2~x = −~∇Φ, dt 2 ∆Φ = 4πGρ. Newton’scher Grenzfall bedeutet • Die Teilchen bewegen sich langsam gegenüber der Lichtgeschwindigkeit. • Das Gravitationsfeld ist schwach, so daß es als Störung der flachen Raumzeit behandelt werden kann. • Das Gravitationsfeld ist statisch (zeitunabhängig). Wir betrachten nun ein schwaches stationäres Gravitationsfeld. Die Bewegungsgleichung für ein freies Teilchen ist allgemein ρ ν d 2 xµ µ dx dx + Γ = 0. νρ ds2 ds ds Für die Vierergeschwindigkeit gilt uµ = dxµ ~v c 1 . ,q = q ds v2 v2 1 − c2 1 − c2 Für eine sehr langsame Bewegung gilt 0 d~x dx ≪ ds ds . Daher vereinfacht sich die Bewegungsgleichung zu 0 0 d 2 xµ µ dx dx + Γ = 0. 00 ds2 ds ds 70 Für die Christoffel-Symbole findet man µ 00 Γ = 1 µλ 1 g (∂0 g0λ + ∂0 g0λ − ∂λ g00 ) = − gµλ ∂λ g00 , 2 2 da nach Voraussetzung das Gravitationsfeld statisch sein soll. Setzt man nun gµν = ηµν + hµν , mit |hµν | ≪ 1, so ergibt sich für die inverse Metrik gµν in erster Ordnung gµν = ηµν − hµν , wobei hµν = ηµσ ηντ hστ . µ 00 Für Γ findet man µ 00 Γ 1 = − ηµλ ∂λ h00 , 2 Eingesetzt in die Bewegungsgleichung ergibt dies 0 2 d 2 xµ 1 µλ dx = η (∂λ h00 ) . 2 ds 2 ds Mit ds = cdτ ergibt sich für die räumlichen Komponenten der Bewegungsgleichung: d 2 xi 1 2 i dt 2 . = c ∂ h00 dτ2 2 dτ Teilt man beide Seiten durch (dt/dτ)2, so erhält man 1 2 i d 2 xi = c ∂ h00 , 2 dt 2 Mit ~∇ = (∂1 , ∂2 , ∂3 ) = −(∂1 , ∂2 , ∂3 ) ergibt sich d 2~x 1 = − c2~∇h00 , 2 dt 2 Vergleicht man diese Gleichung mit d 2~x = −~∇Φ, dt 2 so findet man, daß das Gravitationspotential durch Φ = 1 2 c h00 2 71 gegeben ist. Somit g00 = η00 + h00 = 1 + 2 Φ. c2 Dies bedeutet, daß eine Metrik der Form g00 = 1 + c22 Φ im Newton’schen Grenzfall dem Newton’schen Gesetz d 2~x/dt 2 = −~∇Φ entspricht. Wir suchen nun nach einer Verallgemeinerung des Poisson’schen Gesetzes: ∆Φ = 4πGρ. Der Ausgangspunkt ist, daß die Masse die Quelle des Gravitationsfeldes ist. Masse = Ruheenergie = 0-Komponente eines Vierervektors. Massendichte = Energiedichte = 00-Komponente eines Vierer-Tensors. Daher erwartet man daß der Energie-Impuls-Tensor T µν die Quellen des Gravitationsfeldes beschreibt. Im Minkowski-Raum folgt aus der Energie-Impuls-Erhaltung: ∂µ T µν = 0. In allgemeinen Koordinaten lautet diese Gleichung ∇µ T µν = 0. Daher sucht man eine Gleichung, die allgemein kovariant ist, und T µν enthält. Weiter ist bekannt, daß das Newton’sche Gravitationspotential die Poisson-Gleichung erfüllt: ∆Φ = 4πGρ, wobei die Massendichte ρ sich durch die 00-Komponente des Energie-Impuls-Tensors ausdrücken läßt: 1 00 T . c2 ρ = Weiter hat man 1 2 c h00 , 2 = 1 + h00 , Φ ≈ g00 und daher findet man ∆g00 = 72 8πG T00 . c4 Daher sucht man eine Gleichung der Form G̃µν = 8πG Tµν , c4 wobei der Tensor G̃µν die Metrik mit Ableitungen bis zur zweiten Ordnung enthält. Gesucht ist also G̃µν mit folgenden Eigenschaften: 1. G̃µν ist ein Tensor; 2. G̃µν enthält Ableitungen der Metrik bis zur 2. Ordnung, linear in g′′ oder quadratisch in g′ ; 3. G̃µν ist symmetrisch, da Tµν symmetrisch ist; 4. ∇µ G̃µν = 0, da Tµν erhalten ist; 5. Für schwache stationäre Gravitationsfelder gilt G̃00 → ∆g00 . Die ersten beiden Punkte implizieren, daß nur Ricµν und gµν R zur Verfügung stehen, daher G̃µν = c1 Ricµν + c2 gµν R. Damit ist auch Bedingung 3 erfüllt. Wir wissen schon, daß für den Einstein’schen Tensor ∇µ Gµκ = 0 gilt, daher muß wegen Gµν = Ricµν − 12 gµν R gelten: 1 c2 = − c1 . 2 Aus 5 folgt, daß die Proportionalitätskonstante durch c1 = 1 gegeben ist. Daher G̃µν = Gµν und die Einstein’schen Feldgleichungen lauten 8πG Tµν , c4 1 8πG Ricµν − gµν R = Tµν , 2 c4 Gµν = 73 Eindeutigkeit der Einstein’schen Gleichungen: Annahmen 1-4 sind unverzichtbar, aber möglicherweise sind kleine Abweichungen vom Newton’schen Gravitationsgesetz bisher unbeobachtet geblieben. Es läßt sich zeigen, daß die Einstein’schen Gleichungen eindeutig bis auf einen möglichen Zusatzterm Λgµν sind. Λ bezeichnet man als kosmologische Konstante, sie wurde von Einstein 1917 eingeführt uns später wieder verworfen (“größte Eselei ...”). Heute gibt es starke Hinweise, daß Λ 6= 0 ist. Die Einstein’schen Gleichungen mit kosmologischer Konstante lauten: 8πG 1 Tµν , Ricµν − gµν R − Λgµν = 2 c4 Bemerkung zum Vorzeichen des Terms Λgµν : Verwendet man anstelle der Signatur (+, −, −, −) die Signatur (−, +, +, +), so ändern die Terme Ricµν und gµν R ihr Vorzeichen nicht, die Metrik gµν dagegen ändert ihr Vorzeichen. Um unabhängig von der Vorzeichenkonvention numerisch den gleichen Wert für die kosmologische Konstante zu erhalten, findet man in der Literatur, welche die Konvention (−, +, +, +) verwendet den Ausdruck Ricµν − 1/2gµν R + Λgµν . In der Gegenwart einer kosmologischen Konstante findet man für den Newton’schen Grenzfall 1 ∆Φ = 4πGρ + c2 Λ. 2 Daher impliziert eine nicht-verschwindende kosmologische Konstante Λ eine homogene, statische Energiedichte im Universum von ρvac = c2 Λ. 8πG Bemerkungen: - Die Einstein’schen Gleichungen sind nicht-lineare Differentialgleichungen, sie enthalten neben den zweiten Ableitungen von gµν auch Produkte von ersten Ableitungen und gµν . Daher gilt für die Gravitation kein Superpositionsprinzip. - Kontrahiert man die Einstein’schen Gleichungen mit gµν , so erhält man 8πG T, c4 wobei wir T = gµν Tνµ gesetzt haben. Auflösen nach R liefert R − 2R − 4Λ = 8πG T − 4Λ. c4 Wir können nun diesen Ausdruck für die skalare Krümmung wieder in die Einstein’schen Feldgleichungen einsetzen und erhalten 1 8πG ρσ Tµν − gµν g Tσρ − Λgµν . Ricµν = c4 2 R = − 74 - Im leeren Raum ist Tµν = 0, und daher bei verschwindender kosmologischer Konstante auch Ricµν = 0. Dies impliziert aber nicht notwendigerweise, daß Rµνρσ = 0 ist, d.h. daß die Krümmung verschwindet. Anmerkung: Für D = 2 oder D = 3 folgt aus Ricµν = 0 auch Rµνρσ = 0. 6.5 Die Wirkung der allgemeinen Relativitätstheorie Wir betrachten zunächst das Gravitationsfeld für sich, d.h. ohne weitere Materiefelder. Die EinsteinHilbert-Wirkung mit einer kosmologischen Konstante lautet: SEH c3 = − 16πG Z d4x √ −g (R + 2Λ) Hier bezeichnet g = det gµν . Wir leiten nun die Bewegungsgleichungen durch die Variation der Metrik ab. Es ist technisch einfacher, anstelle der Variation δgµν die Variation nach der inversen Metrik gµν durzuführen. Da µ gµρ gρν = δν ist, folgt (δgµρ ) gρν + gµρ δgρν = 0, δgµν = −gµρ gνσ δgρσ . Mit R = gµν Ricµν ergeben sich für die Variation der Wirkung drei Terme: δSEH Z √ c3 = − δ d 4 x −g gµν Ricµν + 2Λ 16πG Z Z Z √ c3 µν µν 4 √ 4 µν 4 √ = − d x −gg δRicµν + d x −gRicµν δg + d x g Ricµν + 2Λ δ −g . 16πG | {z } | {z } | {z } (δS)1 (δS)2 (δS)3 Der zweite Term hat schon die Form eines Ausdruck der mit δgµν multipliziert wird. Wir betrachten zunächst den ersten Term. Der Ricci-Tensor ist als Kontraktion des Riemann’schen Krümmungstensors definiert, der wiederum durch die Christoffel-Symbole gegeben ist: η η Rκλµν = ∂µ Γκνλ − ∂ν Γκµλ + Γ νλ Γκµη − Γ µλ Γκνη . 75 Man berechnet daher zunächst die Variation des Riemann’schen Krümmungstensors bezüglich der Christoffel-Symbole. κ Γ′ µν = Γκµν + δΓκµν . Zur Erinnerung: Die Christoffel-Symbole sind kein (1, 2)-Tensor! Um das Transformationsverhalten der Christoffel-Symbole unter einer Koordinatentransformation zu finden betrachtet man ∇µ′ V ′ ∂xµ ∂xν = ∇µV ν . ′ ∂xµ ∂xν ν′ Nun läßt sich die linke Seite ausdrücken durch ∇µ′ V ν ′ ′ ′ ′ = ∂µ′ V ν + Γνµ′ λ′ V λ ! ′ ν λ′ µ ∂x ν ∂x ν′ ∂x V + Γ µ′ λ′ λ V λ = ′ ∂µ ν µ ∂x ∂x ∂x ′ ′ ′ λ ∂xµ ∂xν ∂xµ ν ∂2 xν λ ν ν′ ∂x = V + ∂ V + Γ . ′ ′ µ ′ ′V µλ ∂xµ ∂xν ∂xµ ∂xν ∂xµ ∂xλ Auf der rechten Seite ergibt sich ′ ′ ′ ∂xµ ∂xν ∂xµ ∂xν ν λ ∂xµ ∂xν ν ν ∇ V = ∂ V + Γ V . µ µ ′ ′ ′ ∂xµ ∂xν ∂xµ ∂xν ∂xµ ∂xν µλ Somit λ′ ν′ ∂x Γ µ′ λ′ λ V λ + ′ ′ ∂xµ λ ∂2 xν ∂xµ ∂xν ν λ = Γ V . V ′ ′ ∂xµ ∂xµ ∂xν µλ ∂xµ ∂xλ ∂x Hier wurde im zweiten Term auf der linken Seite der Summationsindex ν durch λ ersetzt. Da ′ dies für alle V λ gelten soll, findet man nachdem man mit ∂xλ /∂xλ durchmultipliziert hat ′ Γνµ′ λ′ ′ ′ ∂xµ ∂xν ∂xλ ν ∂xµ ∂xλ ∂2 xν = Γ . − ′ ′ ∂xµ ∂xν ∂xλ′ µλ ∂xµ ∂xλ′ ∂xµ ∂xλ Seien nun Cνµλ und C̃νµλ zwei Zusammenhänge. Die Differenz transformiert sich als ′ ′ Cνµ′ λ′ − C̃νµ′ λ′ ′ ∂xµ ∂xν ∂xλ ν ν C − C̃ = ′ µλ µλ , ∂xµ ∂xν ∂xλ′ da sich die Terme mit den zweiten Ableitungen wegheben. Die Differenz Cνµλ − C̃νµλ ist daher ein (1, 2)-Tensor. Insbesondere ist damit gezeigt, daß die Variation der Christoffel-Symbole κ δΓκµν = Γ′ µν − Γκµν 76 sich wie ein Tensor transformiert. Somit ρ ρ ρ ∇µ δΓκνλ = ∂µ δΓκνλ + Γκµρ δΓ νλ − Γ µν δΓκρλ − Γ µλ δΓκνρ . Variiert man den Riemann’schen Krümmungstensor nach den Christoffel-Symbolen so findet man η η η η δRκλµν = ∂µ δΓκνλ − ∂ν δΓκµλ + δΓ νλ Γκµη + Γ νλ δΓκµη − δΓ µλ Γκνη − Γ µλ δΓκνη κ κ = ∇µ δΓ νλ − ∇ν δΓ µλ . Dann drückt man die Variation δΓκµν durch δgµν aus: δΓκµν = − Setzt man ein, so findet man (δS)1 = i 1h gλµ ∇ν δgλκ + gλν ∇µ δgλκ − gµα gνβ ∇κ δgαβ . 2 Z 4 d x √ i h σ µν σλ . −g∇σ gµν ∇ (δg ) − ∇λ δg Dieses Integral ist eine kovariante Divergenz und kann daher in ein Randintegral umgeschrieben werden, es trägt zur Variation daher nichts bei. Wir betrachten nun (δS)3 : Wir müssen die Variation der Determinante von g berechnen. Hierzu ist folgende Formel hilfreich: Für jede quadratische Matrix mit nicht-verschwindender Determinante gilt: ln (det M) = Tr (ln M) . Hierbei ist der Logarithmus einer Matrix durch exp (ln M) = M definiert, und die Exponentialfunktion durch die Reihenentwicklung. Falls M = diag(λ1 , ..., λn) eine Diagonalmatrix ist, ist die obige Formel unmittelbar einsichtig: ln (λ1 · λ2 · ... · λn) = ln λ1 + ln λ2 + ... + ln λn . Für eine beliebige invertierbare Matrix diagonalsiert man zunächst. Variiert man diese Gleichung, so ergibt sich 1 δ (det M) = Tr M −1 δM . det M Nimmt man nun für M die Matrix gµν , so erhält man δg = g gµν δgµν = −g gµν δgµν . 77 Somit √ 1 g 1√ 1 −ggµν δgµν . δ −g = − √ δg = √ gµν δgµν = − 2 −g 2 −g 2 Somit findet man für die Variation der Einstein-Hilbert-Wirkung Z c3 1 4 √ d x −g Ricµν − gµν R − Λgµν δgµν . δSEH = − 16πG 2 Da dies für beliebige Variationen δgµν gelten soll, folgt 1 Ricµν − gµν R − Λgµν = 0, 2 d.h. die Einstein’schen Gleichungen, falls keine weitere Materie vorhanden ist. 6.6 Der Energie-Impuls-Tensor in der allgemeinen Relativitätstheorie Sind weitere Felder und Materie vorhanden, so lautet die gesamte Wirkung S = SEH + STeilchen + SFelder + ... mit STeilchen = −mc SFelder Zb a 1 = − 16πc ds, Z d 4x √ −gFµν F µν , In die Einstein’schen Gleichungen geht der Energie-Impuls-Tensor ein. Wir haben schon ein allgemeines Verfahren zur Berechnung des Energie-Impuls-Tensor aus einer Lagrangedichte L (φ, ∂µφ) kennengelernt: ! ∂ L ∂ν φ(x) − gµν L + ∂ρ Bµρν . T µν = ∂ ∂µ φ Hierbei ist Bµρν antisymmetrisch in µ und ρ und so zu bestimmen, daß T µν symmetrisch ist. Beispiel: Ein skalares Feld besitzt die Lagrangedichte i ~c h µν L = g ∂µ φ(x) (∂ν φ(x)) − m2 (φ(x))2 . 2 Es ergibt sich (∂ρ Bµρν verschwindet in diesem Fall): ! ∂ L ∂ν φ(x) − gµν L T µν = ∂ ∂µ φ i ~c h µ 2 (∂ φ(x)) (∂ν φ(x)) − gµν (∂λ φ(x)) ∂λ φ(x) + m2 gµν (φ(x))2 . = 2 78 Hier betrachten wir noch ein alternatives Verfahren, daß den Vorteil hat, direkt das richtige und symmetrische Resultat zu liefern. Wir betrachten die Wirkung 1 S = c Z d4x √ −gL . Variiert man bezüglich gµν , so erhält man " √ # √ Z µν 1 g −g L −g L ∂ ∂ δS = d4x δgµν + ∂gµν δ λ c ∂gµν ∂x ∂ ∂xλ # " √ √ Z 1 ∂ ∂ −gL ∂ −gL 4 δgµν . = d x − λ ∂gµν c ∂gµν ∂x ∂ λ ∂x Setzt man nun √ √ ∂ ∂ −gL ∂ −gL 1√ − λ ∂gµν −gTµν = 2 ∂gµν ∂x ∂ λ ∂x so erhält man δS = 1 2c Z d 4x √ −gTµν δgµν . Es läßt sich zeigen, daß Tµν # " √ √ 2 ∂ ∂ −gL ∂ −gL = √ − λ ∂gµν −g ∂gµν ∂x ∂ λ ∂x mit der ersten Definition des Energie-Impuls-Tensors übereinstimmt. Wir verifizieren dies für das obige Beispiel des skalaren Feldes: i ~c h µν 2 2 L = g ∂µ φ(x) (∂ν φ(x)) − m (φ(x)) . 2 Wir finden Tµν √ √ 2 ∂ −gL ∂L 2 ∂ −g = √ = 2 µν + √ L −g ∂gµν ∂g −g ∂gµν ∂L = 2 µν − L gµν ∂g i ~c h 2 λ 2 2 ∂µ φ(x) (∂ν φ(x)) − gµν (∂λ φ(x)) ∂ φ(x) + m gµν (φ(x)) . = 2 Nun wieder zurück zum allgemeinen Fall. Man erhält somit für die Variation von c3 S = − 16πG Z 4 d x √ 1 −g (R + 2Λ) + c 79 Z d4x √ −gL folgenden Ausdruck: c3 δS = − 16πG Z 4 d x √ Z √ 1 1 µν −g Ricµν − gµν R − Λgµν δg + d 4 x −gTµν δgµν . 2 2c Also folgt c3 1 1 − Ricµν − gµν R − Λgµν + Tµν = 0, 16πG 2 2c bzw. 8πG 1 Tµν . Ricµν − gµν R − Λgµν = 2 c4 6.7 Der Palatini-Formalismus Vorbemerkung: Betrachte in der klassischen Mechanik die Wirkung Z tb S = 1 L(q, q̇) = q̇2 −V (q). 2 L(q, q̇)dt, ta Variiert man die verallgemeinerte Koordinate q(t) und hält die Endpunkte fest δq(ta) = δq(tb) = 0 so erhält man die Euler-Lagrange-Gleichung δL d δL − = 0, δq dt δq̇ q̈ = − δV . δq Dies ist die Formulierung der klassischen Mechanik nach Lagrange. Ebenso können wir die Hamilton-Formulierung der klassischen Mechanik betrachten: S = Z tb ta (pq̇ − H(q, p)) dt, 1 H(q, p) = p2 +V (q) 2 Wir betrachten nun q(t) und p(t) als unabhängig (d.h. wir setzen nicht von Anfang an p(t) = q̇(t)) und variieren nach q(t) und p(t). Variation nach p(t) liefert die Beziehung δH(q, p) = p. δp q̇ = Variation nach q(t) liefert die Bewegungsgleichung ṗ = − δH(q, p) δV =− . δq δq Wir übertragen dies nun auf die allgemeine Relativitätstheorie. Wir hatten bei der Herleitung der Einstein’schen Gleichungen aus der Einstein-Hilbert-Wirkung SEH c3 = − 16πG Z d 4x 80 √ −g gµν Ricµν + 2Λ die Variation nach der inversen Metrik gµν betrachtet. Der Ricci-Tensor η η Ricµν = ∂κ Γκνµ − ∂ν Γκκµ + Γ νµ Γκκη − Γ κµ Γκνη hängt von den Christoffel-Symbolen ab, welche wiederum von der Metrik abhängen Γκµν = 1 κλ g ∂µ gνλ + ∂ν gµλ − ∂λ gµν . 2 Im Palatini-Formalismus betrachtet man dagegen die (inverse) Metrik gµν und die (symmetrischen) Zusammenhangskoeffizienten als unabhängige Größen. Variation nach der inversen Metrik liefert die Einstein’schen Gleichungen 1 Ricµν − gµν R − Λgµν = 0. 2 √ (Hier tragen nur die Terme (δS)2 und (δS)3 , welche die Variation von gµν und −g bezüglich gµν beschreiben, bei.) Im Palatini-Formalismus hängt Ricµν nur von den Zusammenhangskoeffizienten ab. Variation von η η Ricµν = ∂κCκνµ − ∂νCκκµ +C νµCκκη −C κµCκνη bezüglich der Zusammenhangskoeffizienten Cκµν liefert δRicµν = ∇κ δCκνµ − ∇ν δCκκµ Somit ergibt sich für die Variation der Wirkung bezüglich der Zusammenhangskoeffizienten: δSEH Z Z √ √ c3 c3 = − d 4 x −ggµν δRicµν = − d 4 x −ggµν ∇κ δCκνµ − ∇ν δCκκµ 16πG 16πG Z 3 √ √ c = d 4 x ∇κ −ggµν − δνκ ∇λ −ggµλ δCκνµ . 16πG Da dies für alle Variationen gelten soll, muß die Klammer verschwinden, und daher dann auch die symmetrische Kombination √ √ 1 1 µ √ ∇κ −ggµν − δνκ ∇λ −ggµλ − δ κ ∇λ −ggνλ = 0. 2 2 √ Dies ist ein System von 40 Gleichungen für die 40 kovarianten Ableitungen ∇κ −ggµν . Die einzige Lösung ist √ ∇κ −ggµν = 0. Man zeigt nun √ ∇κ −g = 0, 81 hieraus folgt sofort ∇κ gµν = 0. Mit Hilfe von √ √ √ ρ 0 = ∇κ −gδ ν = ∇κ −ggρµ gµν = −ggρµ ∇κ gµν folgt dann auch ∇κ gµν = 0. Dies ist die Bedingung daß die Metrik bezüglich des Zusammenhangs kovariant konstant ist. Zusammen mit der Voraussetzung, daß der Zusammenhang torsionsfrei (symmetrisch) ist, definiert dies genau den Levi-Civita-Zusammenhang. In diesem Fall sind die Zusammenhangskoeffizienten durch die Christoffelsymbole gegeben. Bemerkung: Betrachtet man nur die Metrik als ein unabhängiges Feld, so enthält die EinsteinHilbert-Wirkung zweite Ableitungen der Metrik. Der Vorzug des Palatini-Formalismuses besteht darin, daß nur erste Ableitungen der Zusammenhangskoeffizienten auftreten. 6.8 Der Vielbein-Formalismus Der Vielbein-Formalismus ist notwendig, um die Wechselwirkung zwischen Fermionen und der Gravitation beschreiben zu können. Wir betrachten eine Mannigfaltigkeit der Dimension n. Wir hatten bisher für die Basisvektoren des Tangentialraumes am Punkte p die Ableitungen in Richtung der Koordinatenachsen verwendet: eµ = ∂µ , Als Standardbasis für den Kotangentialraum am Punkte p haben wir bisher die hierzu dualen Vektoren verwendet: θµ = dxµ . Für die Kugeloberfläche mit den Koordinaten Polarwinkel ϑ und Azimuthwinkel ϕ lautet die Metrik g = dϑ ⊗ dϑ + sin2 ϑdϕ ⊗ dϕ. Am Punkte (ϑ, ϕ) = (π/3, 0) findet man g(eϕ , eϕ ) = 82 3 , 4 am Punkte (ϑ, ϕ) = (π/2, 0) dagegen g(eϕ , eϕ ) = 1. Allgemein kann auch der Fall auftreten, daß zwei Basisvektoren am Punkte A orthogonal sind, am Punkte B dagegen nicht, man nehme hierzu eine Metrik mit einem Term c(x)ei ⊗ e j , wobei der Koeffizient c(x) am Punkte A verschwindet, am Punkte B hingegen nicht. Die Ableitungen in die Richtung der Koordinatenachsen bilden daher nicht in jedem Punkte eine Orthonormalbasis. Für die Tangentialräume können wir uns eine neue Basis ea definieren, welche per Definition g(ea , eb ) = ηab erfüllt. (Diese Definition gilt für eine Lorentz-Mannigfaltigkeit, für eine Mannigfaltigkeit mit euklidischer Signatur ersetzt man ηab durch δab .) Diese Basis ist im allgemeinen nicht mehr durch die Richtungen der Koordinatenachsen definiert, aber läßt sich als Linearkombination der bisherigen Basis eµ ausdrücken: ea = eaµ eµ , µ wobei ea eine invertierbare n × n Matrix ist. Um die Orientierung zu erhalten, fordert man µ det ea > 0. Man bezeichnet die neue Basis ea als die nicht-Koordinatenbasis. Es hat sich die Konvention eingebürgert, für die Koordinatenbasis eµ griechische Indizes zu verwenden und lateinische Indizes für die nicht-Koordinatenbasis ea . Man verwendet auch die Bezeichnungen µ holonome Basis für eµ und nicht-holonome Basis für ea . Die n × n-Matrix ea bezeichnet man im allgemeinen als Vielbein, auf einer Mannigfaltigkeit der Dimension vier als Vierbein (und µ auf einer Mannigfaltigkeit der Dimension drei als Dreibein usw.). Die zu ea inverse Matrix wir mit eaµ bezeichnet: µ eaµ eaν = δν , eaµ ebµ = δba . Mit Hilfe von eaµ erhält man eµ = eaµ ea und gµν = eaµ ebν ηab . Ebenso läßt sich eine neue Basis θa des Kotangentialraumes definieren, welche hθa , eb i = δab erfüllt. Man findet θa = eaµ θµ , θµ = eaµ θa . 83 Für Vektorfelder hatten wir die Lie-Klammer definiert, welche wieder ein Vektorfeld liefert: [X ,Y ] = X µ ∂µY ν −Y µ ∂µ X ν eν Für die Koordinatenbasis hatten wir eµ , eν = 0. Für die nicht-Koordinatenbasis gilt allerdings µ [ea , eb ] = eaµ eµ , ebν eν = eaµ ∂µ ebν − eb ∂µ eaν eν = cabc ec , wobei cabc = µ eaµ ∂µ ebν − eb ∂µ eaν ecν , d.h. die nicht-Koordinatenbasis hat eine nicht verschwindende Lie-Klammer: [ea , eb ] = cabc ec . µ Mit Hilfe von eaµ und ea können Tensoren von der Koordinatenbasis in die nicht-Koordinatenbasis umgeschrieben und zurückverwandelt werden. So hat man zum Beispiel für einen (1, 2)-Tensor κ c Tµν = ecκ eaµ ebν Tab . Die Zusammenhangskoeffizienten bilden keinen Tensor, hier setzt man ∇a eb = ωcab ec . Nun ist aber und somit ∇a eb = ∇eaµ eµ (ebν eν ) = eaµ ∇µ (ebν eν ) = eaµ ∂µ ebν eν +Cκµν ebν eκ i h ρ = eaµ ∂µ ebν ecν +Cκµν ebν ecκ ec = eaµ ecν ∂µ ebν +Cνµρ eb ec , i h ρ ωcab = eaµ ecν ∂µ ebν +Cνµρ eb . Wir definieren nun die Zusammenhangs-Einsform ωab : ρ a a c a ν ν ω b = ω cb θ = e ν ∂µ eb +C µρ eb dxµ . ωab nennt man auch die Spin-Zusammenhangsform. Wir betrachten nun den Torsionstensor und den Krümmungstensor in der nicht-Koordinatenbasis: c T (ea , eb ) = T ab ec , R(ea , eb , ec ) = Rdcab ed . 84 c : Aus der Definition des Torsionstensors bestimmen wir T ab T (ea , eb ) = ∇a eb − ∇b ea − [ea , eb ] = (ωcab − ωcba − cabc ) ec , also c T ab = ωcab − ωcba − cabc . Ebenso ergibt sich aus R(ea , eb , ec ) = ∇a ∇b ec − ∇b ∇a − ∇[ea ,ab ] ec = ∂a ωdbc − ∂b ωdac + ωebc ωdae − ωeac ωdbe − cabe ωdec ed die Koeffizienten Rdcab = ∂a ωdbc − ∂b ωdac + ωebc ωdae − ωeac ωdbe − cabe ωdec . Man definiert nun die Torsions-Zweiform T a und die Krümmungs-Zweiform Rab : 1 a b T θ ∧ θc , 2 bc 1 a c = R θ ∧ θd . 2 bcd Ta = Rab Mit Hilfe dieser Definitionen lassen sich nun die Strukturgleichungen von Cartan aufschreiben: T a = dθa + ωab ∧ θb , Rab = dωab + ωac ∧ ωcb . Wir betrachten noch die Bianchi-Identitäten in der nicht-Koordinatenbasis: dT a + ωab ∧ T b = Rab ∧ eb , dRab + ωac ∧ Rcb − Rac ∧ ωcb = 0. Bemerkung: Wir hatten die Bianchi-Identitäten in der Koordinatenbasis schon für den Fall in dem der Torsionstensor verschwindet bewiesen. In der jetzigen Form sind sie allgemein gültig (auch für T a 6= 0). Die allgemeine Relativitätstheorie läßt sich im Vielbein-Formalismus elegant formulieren. Dieser Formalismus hat außerdem den Vorteil, das Spinorfelder berücksichtigt werden können. Anstelle der Metrik gµν benutzt man im Vielbein-Formalismus das Vielbein und die Spin-Zusammenhangsform als fundamentale Felder. Ähnlich wie im Palatini-Formalismus (der die inverse Metrik und die symmetrischen Zusammenhangskoeffizienten verwendet), läßt sich im VielbeinFormalismus zeigen, daß die Spin-Zusammenhangsform durch die Vielbeinfelder ausgedrückt 85 werden kann. Im Vielbein-Formalismus und im Palatini-Formalismus enthält man anstelle von Differentialgleichungen zweiter Ordnungen gekoppelte Differentialgleichungen erster Ordnung. Der Ausgangspunkt für die Formulierung im Vielbein-Formalismus sind zwei Eins-Formen. Man betrachtet das Vielbein-Feld θa = eaµ dxµ und die Spin-Zusammenhangsform ωab = ωaµb dxµ . Die Transformation von der Koordinatenbasis zur nicht-Koordinatenbasis soll umkehrbar und orientierungserhaltend sein, daher fordert man det eaµ > 0. Die Spin-Zusammenhangsform definiert die kovariante Ableitung: ∇µ ea = ωbµa eb . Torsion und Krümmung sind gegeben durch T a = dθa + ωab ∧ θb , Rab = dωab + ωac ∧ ωcb . Explizit haben wir für die Krümmung 1 a R dxµ ∧ dxν , 2 bµν = ∂µ ωaνb − ∂ν ωaµb + ωaµc ωcνb − ωaνc ωcµb . Rab = Rabµν Die Metrik ist gegeben als gµν = eaµ ebν ηab . Das Vielbein definiert auch eindeutig einen torsionsfreien Spin-Zusammenhang, der mit der Metrik kompatibel ist. Dies sieht man am leichtesten wie folgt: Die Beziehung zwischen den Zusammenhangskoeffizienten ωaµb in der nicht-Koordinatenbasis und den Zusammenhangskoeffizienten Cκµν in der Koordinatenbasis ist gegeben durch i h ρ ωaµb = eaν ∂µ ebν +Cνµρ eb . Nun soll aber der Zusammenhang in der Koordinatenbasis torsionsfrei und metrik-kompatibel sein, also muß er der Levi-Civita-Zusammenhang sein. Dieser ergibt sich aus den Ableitungen der Metrik zu 1 Cκµν = Γκµν = gκλ ∂µ gνλ + ∂ν gµλ − ∂λ gµν 2 i 1 κ aλ h b = ea e ebλ ∂µ e ν + ∂ν ebµ + ebν ∂µ ebλ − ∂λ ebµ + ebµ ∂ν ebλ − ∂λ ebν . 2 86 Somit erhalten wir 1 ν aλ eb e ecµ ∂ν ecλ − ∂λ ecν + ecν ∂µ ecλ − ∂λ ecµ − ecλ ∂µ ecν − ∂ν ecµ . ωaµb = 2 Für die Wirkung findet man Z √ c3 d 4 x −g (R + 2Λ) 16πG Z c3 Λ a 1 a b cd b c d = − εabcd θ ∧θ ∧R + θ ∧θ ∧θ ∧θ . 16πG 2 12 SEH = − Für die Herleitung der letzten Zeile betrachten wir zunächst den Term mit der kosmologischen Konstante. Hier haben wir Λ Λ εabcd θa ∧ θb ∧ θc ∧ θd = εabcd eaµ ebν ecρ edσ dxµ ∧ dxν ∧ dxρ ∧ dxσ 12 12 Λ = − εabcd εµνρσ eaµ ebν ecρ edσ dx0 ∧ dx1 ∧ dx2 ∧ dx3 12 = 2Λ det eaµ dx0 ∧ dx1 ∧ dx2 ∧ dx3 , wobei dxµ ∧ dxν ∧ dxρ ∧ dxσ = −εµνρσ dx0 ∧ dx1 ∧ dx2 ∧ dx3 verwendet wurde. Das Minuszeichen ergibt sich, da aufgrund der verwendeten Konvention ε0123 = 1 aber ε0123 = −1 ist. Nun ist allerdings auch q p q √ −g = − det gµν = − det eaµ ebν ηab = − det eaµ det ebν det ηab = det eaµ , womit die Gleichheit des Terms mit der kosmologischen Konstante gezeigt wäre. Für die Herleitung des Terms mit der Krümmungsform benötigen wir die Schouten-Identität: µ µ µ εabcd e f + εbcd f eaµ + εcd f a eb + εd f ab ecµ + ε f abc ed = 0. Nehmen wir nun die Wirkung SEH c3 = − 16πG Z εabcd Λ 1 a θ ∧ θb ∧ Rcd + θa ∧ θb ∧ θc ∧ θd 2 12 mit den Nebenbedingungen det eaµ > 0, ωaµb = −ωbµa als Ausgangspunkt. Die Antisymmetrie der Spinzusammenhangsform ωaµb = −ωbµa impliziert ∇κ gµν = 0, wie man leicht sieht: ρ σ a b 0 = ∇µ gρσ dx ⊗ dx = ∇µ ηab θ ⊗ θ = − ωaµb + ωbµa θa ⊗ θb = − ωaµb + ωbµa ηac ηbd θc ⊗ ηd . 87 Variiert man die Wirkung bezüglich des Spin-Zusammenhangs, so findet man Z c3 1 c µ ν ρ σ fg ∂ν e ρ edσ δea δhg dx ∧ dx ∧ dx ∧ dx εcde f η ηbh δSEH = − 16πG 2 1 c d e h 1 c d h e 1 c d e h + e ρ ∂ν e σ δa δg − e ρ e σ ω νa δg + e ρ e σ ω νg δa δωaµb . 2 2 2 Hieraus folgt unter der Verwendung der Antisymmetrie der Spinzusammenhangsform ωaµb = −ωbµa daß der in a und b antisymmetrische Ausdruck n h i 1 µνρσ e f e f c d c d εcde f 0 = − ε δa δb − δb δa ∂ν e ρ e σ + e ρ ∂ν e σ 4 h io f f f −ecρ edσ ωeνa δb + ω νb δea − ωeνb δaf − ω νa δeb h i h io n 1 f f = − εµνρσ εcde f δea δb ∂ν ecρ edσ + ecρ ∂ν edσ − ecρ edσ ωeνa δb − ωeνb δaf 2 o n 1 µνρσ f f g = − ε εcde f δea δb ∂ν ecρ − ∂ρ ecν − eeρ δaf δb − δga δb ωcνg edσ 2 verschwinden muß. Nun ist 1 g f δaf δb − δga δb = − εabi j ε f gi j 2 und εcde f g f δaf δb − δga δb Somit erhalten wir 1 εabi j εgi j f εcde f 2 1 j g g j = − εabi j δgc δid δej + δic δd δge + δcj δd δie − δcj δid δge − δic δd δej − δgc δd δie 2 j g = −εabi j δgc δid δej + δic δd δge + δcj δd δie . = o 1 µνρσ n c c e g i j i j g j g i c εabcd ∂ν e ρ − ∂ρ e ν + e ρ εabi j δc δd δe + δc δd δe + δc δd δe ω νg edσ 0 = − ε 2 o 1 µνρσ n g c e c c c = − ε εabcd ∂ν e ρ − ∂ρ e ν + εabcd ω νg e ρ + e ρ εabec ω νd edσ 2 o n 1 µνρσ g g c c c c = − ε εabcd ∂ν e ρ − ∂ρ e ν + ω νg e ρ − ω ρg e ν edσ 2 Dies ist nicht anderes als die Bedingung, daß die Torsion verschwindet: g g ν ∂ν ecρ − ∂ρ ecν + ωcνg e ρ − ωcρg e = 0. Variiert man nun die Wirkung bezüglich des Vierbein-Feldes, so findet man Z 1 b c d 1 b cd c3 µ ν ρ σ dx ∧ dx ∧ dx ∧ dx εabcd e ν R ρσ + Λe ν e ρ e σ δeaµ . δSEH = − 16πG 2 3 88 Hier folgt 0 = −ε µρστ εabcd 1 b c d 1 b cd e R + Λe ρ e σ e τ . 2 ρ στ 3 Wir multiplizieren die Gleichung mit eaκ gκν : 1 b cd 1 b c d a κν µρστ 0 = −ε εabcd e ρ R στ + Λe ρ e σ e τ e κ g . 2 3 Nach einer etwas längeren Rechnung unter wiederholter Ausnutzung der Schouten-Identität findet man 1 µν µν a µν . 0 = −2 det e ρ Ric − g R − Λg 2 Dies sind die Einsteinschen Feldgleichungen. 89 7 Spezielle Lösungen der Einstein’schen Gleichungen 7.1 Die Schwarzschild-Lösung Wir betrachten eine statische kugelsymmetrische Massenverteilung, wie sie zum Beispiel durch die Erde oder durch die Sonne in guter Näherung gegeben ist und suchen eine Lösung der Einstein’schen Gleichungen ausserhalb der Massenverteilung. Hierzu suchen wir Lösungen von Ricµν = 0 Bemerkung: Die Einstein’schen Gleichungen lassen sich (ohne kosmologische Konstante) auch als 1 8πG ρσ Tµν − gµν g Tρσ Ricµν = c4 2 schreiben. Im Vakuum gilt Tµν = 0, also reduzieren sich die Einstein’schen Gleichungen auf Ricµν = 0. Bemerkung: Die genaue Definition von “statisch” und “kugelsymmetrisch” erfordert aufgrund der notwendigen Koordinatenunabhängigkeit etwas Sorgfalt. Diese Diskussion wird auf später aufgeschoben. Für den Moment soll “statisch” implizieren, daß alle Metrikkomponenten von der Zeitkoordinate unabhängig sind und daß keine gemischten Terme cdt ⊗ dxi + dxi ⊗ cdt in der Metrik auftreten. Diese Bedingung wird einsichtigt, wenn man annimmt daß “statisch” auch die Invarianz unter der Zeitumkehr t → −t impliziert. Unter dieser Transformation ändern Terme wie c2 dt 2 oder dxi dx j ihr Vorzeichen nicht, die gemischten Terme cdtdxi dagegen schon. Die Kugelsymmetrie impliziert, daß das Raumwinkelelement dΩ2 seine Form nicht ändert: Der Koeffizient des dϕ2 -Terms soll immer sin2 ϑ mal der Koeffizient des dϑ2 -Tems sein. Desweiteren impliziert die Kugelsymmetrie, daß außer dϕ2 und dϑ2 keine weiteren (d.h. gemischten) Terme mit dϕ oder dϑ vorkommen. Wir machen daher den folgenden Ansatz: ds2 = e2a(r) c2 dt 2 − e2b(r) dr2 − e2c(r) r2 dΩ2 Wir können noch die folgende Vereinfachung durchführen: Betrachtet man eine neue radiale Variable r′ = ec(r) r so findet man ds 2 = e dc(r) c dt − 1 + r dr 2a(r) 2 2 90 −2 e2b(r)−2c(r) dr2 − r2 dΩ2 Durch eine Redefinition der Funktion b(r) ist es daher ausreichend, den Ansatz ds2 = e2a(r) c2 dt 2 − e2b(r) dr2 − r2 dΩ2 zu betrachten. a(r) und b(r) sind zwei noch zu bestimmende Funktionen. Wir berechnen zunächst die Christoffelsymbole (und setzen für die Rechnung zur Vereinfachung c = 1): Γttr = ∂r a, Γrtt = e2(a−b) ∂r a, Γrrr = ∂r b, Γθrθ = 1r , Γrθθ = −re−2b , Γ rϕ = 1r , ϕ ϕ Γrϕϕ = −re−2b sin2 θ, Γθϕϕ = − sin θ cos θ, Γ θϕ = cos θ sin θ . Alle anderen Komponenten erhält man entweder durch Symmetriebetrachtungen oder sind null. Als nächstes berechnet man die Komponenten des Riemann’schen Krümmungstensor: Rtϕtϕ = −re−2b sin2 θ a′ , Rtrtr = a′ b′ − a′′ − (a′ )2 , Rtθtθ = −re−2b a′ , Rrθrθ = re−2b b′ , Rrϕrϕ = re−2b sin2 θ b′ , Rθϕθϕ = 1 − e−2b sin2 θ, wobei a′ = ∂r a und b′ = ∂r b. Somit ergeben sich die Komponenten des Ricci-Tensors zu 2 ′ ′′ ′ 2 ′ ′ 2(a−b) a + (a ) − a b + a , Rtt = e r 2 Rrr = −a′′ − (a′ )2 + a′ b′ + b′ , ′ r −2b ′ Rθθ = e r b − a − 1 + 1, Rϕϕ = sin2 θ Rθθ . Die skalare Krümmung ist gegeben durch 1 2 ′ ′′ ′ 2 ′ ′ −2b ′ 2b a + (a ) − a b + a − b + 2 1 − e R = −2e . r r Ausserhalb der Massenverteilung gilt: Ricµν = 0. Da Rtt und Rrr unabhängig voneinander verschwinden müssen, gilt auch 0 = e2(b−a) Rtt + Rrr = 2 ′ a + b′ r und daher a′ + b′ = 0. Diese Gleichung führt integriert zu b(r) = −a(r) + c. 91 Die Integrationskonstante c kann durch eine Reskalierung t → e−ct eliminiert werden. Daher können wir ohne Einschränkung b(r) = −a(r) setzen. Betrachten wir nun Rθθ = 0. Einsetzen liefert e2a 2ra′ + 1 = 1. Dies läßt sich auch als d 2a(r) re = 1 dr schreiben. Diese Gleichung wird durch e2a(r) = 1 − rs r gelöst, wie man leicht durch nachrechnen verifiziert. rs ist eine noch zu bestimmende Integrationskonstante. Fügen wir nun wieder alle Faktoren der Lichtgeschwindigkeit c ein, so ergibt sich für die Metrik das Resultat rs 2 2 dr2 2 2 2 2 ds2 = 1 − c dt − rs − r dθ + sin θdφ . r 1− r Diese Lösung wurde 1916 von K. Schwarzschild gefunden. Zur Bestimmung der Integrationskonstante betrachten wir die tt-Komponente der Metrik. Für eine Punktmasse m ergibt sich im Newton’schen Grenzfall 2 2Gm 2 2 gtt = c 1 + 2 Φ = c 1 − 2 c rc und somit rs zu rs = 2Gm . c2 Man bezeichnet rs als Schwarzschildradius der Masse m. Beispiele für den Schwarzschildradius: Sonne : m ≈ 2 · 1030 kg → rs = 2.95 km, Erde : m ≈ 6 · 1024 kg → rs = 0.9 cm. Ein Theorem von Birkhoff besagt, daß die Schwarzschild-Lösung die einzige kugelsymmetrische Lösung der Einstein’schen Gleichungen im Vakuum ist. Insbesondere impliziert dieses Theorem, 92 daß es keine zeitabhängigen Lösungen gibt. Der Beweis des Birkhoff’schen Theorems sei kurz skizziert: Wir beginnen mit einer genauen Definition des Begriffes “Kugelsymmetrie”: In einem flachen dreidimensionalen Raum entspricht die Kugelsymmetrie der Invarianz unter der Rotationsgruppe SO(3). Auf einer beliebigen semi-Riemannschen Mannigfaltigkeit sind Symmetrien durch Killing Vektorfelder charakterisiert. Die Killing Vektorfelder der Kugeloberfläche S2 sind gegeben durch R = ∂ϕ , S = cos ϕ ∂θ − cot θ sin ϕ ∂ϕ , T = − sin ϕ ∂θ − cot θ cos ϕ ∂ϕ . Diese Vektorfelder erfüllen die Kommutatorrelationen [R, S] = T, [S, T ] = R, [T, R] = S. Dies ist nicht anderes als die Lie-Algebra der Gruppe SO(3). Wir können nun den Begriff “Kugelsymmetrie” für eine beliebige vier-dimensionale Raumzeit definieren: Wir fordern die Existenz von drei Killing Vektorfeldern, welche die obigen Vertauschungsrelationen erfüllen. Durch geeignete Wahl des Koordinatensystems impliziert dies, daß die Metrik die Form ds2 = e2a(t,r) c2 dt 2 − e2b(t,r) dr2 − r2 dΩ2 hat. Bemerkung: Die hier auftretenden Funktionen a(t, r) und b(t, r) sind a priori Funktionen von t und r. Man berechnet nun wieder die Christoffelsymbole, den Krümmungstensor und den RicciTensor. Man findet zum Beispiel Rictr = 2 ∂t b r also b = b(r). Mit Hilfe einer geeigneten Koordinatenredefinition der Zeitkoordinate läßt sich auch erreichen, daß a(t, r) nicht von t abhängt. Dies führt dann zu dem Ansatz ds2 = e2a(r) c2 dt 2 − e2b(r) dr2 − r2 dΩ2 , welcher bei der Herleitung der Schwarzschild-Lösung verwendet wurde. Bemerkung: Alle Komponenten der Metrik sind zeitunabhängig. Dies bedeutet, daß jede kugelsymmetrische Lösung der Einstein’schen Gleichungen im Vakuum ein zeitartiges Killing Vektorfeld besitzt. 93 Man bezeichnet eine Metrik mit einem Killing Vektorfeld, welches im Unendlichen zeitartig ist, als stationär. Die allgemeine Form einer stationären Metrik ist ds2 = g00 (~x)dt 2 + g0i (~x) dtdxi + dxi dt + gi j (~x)dxi dx j . Man bezeichnet eine Metrik mit einem Killing Vektorfeld, welches zeitartig und orthogonal zu einer Familie von Hyperflächen ist, als statisch. Die allgemeine Form einer statischen Metrik ist ds2 = g00 (~x)dt 2 + gi j (~x)dxi dx j . Wir betrachten nun die Singularitäten der Schwarzschildmetrik: • Die Metrik wird singulär für r = rs . Dies ist allerdings nicht mehr als eine Koordinatensingularität, physikalische Größen wie der Einstein’sche Tensor und der Krümmungstensor sind endlich für r = rs . Physikalisch interpretiert man rs als Ereignishorizont eines schwarzen Lochs. Anmerkung: Ein triviales Beispiel für eine Koordinatensingularität findet man in einer Ebene am Ursprung, fall man Polarkoordinaten verwendet: ds2 = dr2 + r2 dϕ2 . gµν = 1 0 0 r2 , g µν = 1 0 0 r12 . Insbesondere ist gϕϕ = 1 . r2 Offensichtlich ist dies ein Artefakt des verwendeten Koordinatensystems, da in einer Ebene kein Punkt vor einem anderen ausgezeichnet ist. • Der Punkt r = 0 stellt eine echte Singularität dar. Um echte Singularitäten von Koordinatensingularitäten zu unterscheiden betrachtet man skalare Größen wie zum Beispiel R = gµν Ricµν , Ricµν Ricµν , Rµνρσ Rµνρσ . Für die Schwarzschildmetrik findet man zum Beispiel Rµνρσ Rµνρσ = 94 12rs2 . r6 7.2 Die Periheldrehung des Merkur Wir betrachten zunächst Geodäten für die Schwarzschild-Metrik. τ σ d 2 xµ µ dx dx + Γ = 0 τσ dλ2 dλ dλ Die Christoffelsymbole für die Schwarzschild-Metrik lauten (wir setzen wieder c = 1): Γttr = rs 2r(r−rs ) , Γθrθ = 1r , Γrtt = rs (r − rs ), 2r3 Γrθθ = −(r − rs ), rs Γrrr = − 2r(r−r , s) ϕ Γ rϕ = 1r , ϕ Γrϕϕ = −(r − rs ) sin2 θ, Γθϕϕ = − sin θ cos θ, Γ θϕ = cos θ sin θ . Die Geodätengleichung führt zu vier gekoppelten Differentialgleichungen zweiter Ordnung, welche sich nur sehr schwer direkt lösen lassen. Ein besserer Weg ist der folgende: Wir wissen, daß die Schwarzschild-Metrik vier Killing Vektorfelder besitzt: Ein Vektorfeld aufgrund der Zeittranslationinvarianz, drei weitere Vektorfelder aufgrund der Kugelsymmetrie. Falls K µ ein Killing Vektorfeld ist, so gilt dxµ = const Kµ dλ Darüberhinaus gibt es noch eine weitere erhaltene Größe: ε = gµν dxµ dxν . dλ dλ Wählen wir λ = s so gilt ε = 1. Das zeitartige Killing Vektorfeld entspricht der Energieerhaltung und ist in den Koordinaten (t, r, θ, ϕ) gegeben durch K µ = (∂t )µ = (1, 0, 0, 0) Zieht man den Index herunter, so findet man rs Kµ = 1− , 0, 0, 0 r Die drei Killing Vektorfelder der Kugelsymmetrie entsprechen der Drehimpulserhaltung, ein Vektorfeld bestimmt den Betrag des Drehimpulses, zwei Vektorfelder die Richtung. Erhaltung des Drehimpulses bedeutet, daß sich ein Teilchen in der Ebene bewegt. Wir können daher θ = 95 π 2 wählen. Das Killing Vektorfeld, das den Betrag des Drehimpulses beschreibt, ist durch µ Rµ = ∂ϕ = (0, 0, 0, 1) gegeben. Auch hier ziehen wir wieder den Index nach unten: Rµ = 0, 0, 0, −r2 sin2 θ . Mit sin θ = 1 ergeben sich die Erhaltungsgrößen rs dt dxµ = 1− , dλ r dλ dϕ dxµ = r2 . L = −Rµ dλ dλ E = Kµ Wir betrachten nun ε = gµν dxµ dxν . dλ dλ Ausgeschrieben ergibt dies ε = 2 rs −1 dr 2 rs dt 2 2 dϕ − 1− −r 1− r dλ r dλ dλ Einsetzen der Erhaltungsgrößen liefert 2 dr rs L2 + 1− ε+ 2 = E 2. dλ r r Diese Gleichung läßt sich auch schreiben als 1 dr 2 +V (r) = E , 2 dλ wobei 1 2 E , 2 1 εrs L2 rs L2 V (r) = ε− + − 2 2r 2r2 2r3 E = Bemerkung: In der Newton’schen Theorie würde man ein effektives Potential finden, welches den Term 1/r3 nicht enthält, die anderen Terme sind identisch. Der erste Term des effektiven Potentials ist eine Konstante, der zweite Term entspricht dem Newton’schen Gravitationspotential, der dritte Term gibt einen Beitrag des Drehimpulses an, dessen Form in der Newton’schen Mechanik und der allgemeinen Relativitätstheorie identisch ist. Der letzte Term tritt nur in der allgemeinen Relativitätstheorie auf. 96 Die Planeten bewegen sich auf Ellipsen um die Sonne. Der Punkt mit der geringsten Entfernung zur Sonne wir als das Perihel bezeichnet. Wir betrachten nun die Perihelpräzession des Merkur. Hierzu wollen wir eine Gleichung bestimmen, die die Radialekoordinate r als Funktion des Winkels ϕ angibt: r = r(ϕ). Wir multiplizieren die Bewegungsgleichung mit dϕ dλ −2 = r4 L2 und erhalten dr dϕ 2 ε 4 εrs 3 E2 4 2 r − r + r − r r = r . s L2 L2 L2 + Setzt man nun 2L2 rs r x = so ergibt sich dx dϕ 2 +4 Wir differenzieren nun nach ϕ: L2 1 rs2 3 2 2 ε − E − 2εx + x = x . rs2 2 L2 dx d 2 x dx dx 3 rs2 2 dx 2 − 2ε + 2x = x dϕ dϕ2 dϕ dϕ 2 L2 dϕ und erhalten folgende Gleichung: d 2x 3 rs2 2 − ε + x = x . dϕ2 4 L2 Der Parameter ε war definiert durch ε = gµν dxµ dxν . dλ dλ Wählen wir als Parameterisierung der Bahn die Eigenzeit λ = s so gilt dxµ dxν gµν = 1. ds ds Mit ε = 1 lautet unsere Gleichung nun d 2x 3 rs2 2 − 1 + x = x . dϕ2 4 L2 97 In der Newton’schen Mechanik verschwindet der Term auf der rechten Seite und die Gleichung d2x − 1 + x = 0. dϕ2 läßt sich exakt lösen: xNewton (ϕ) = 1 + e cos ϕ. Dies ist die Lösung von Kepler und Newton und beschreibt eine perfekte Ellipse. Die Größe e gibt die Ekzentrizität an. In der allgemeinen Relativitätstheorie behandeln wir nun den Term 3 rs2 2 x 4 L2 als kleine Störung und suchen eine Lösung der Form x(ϕ) = xNewton (ϕ) + x̃(ϕ). Im Rahmen der Störungstheorie ergibt sich für x̃ die Differenzialgleichung 3 rs2 2 d 2 x̃ + x̃ = x dϕ2 4 L2 Newton 3 rs2 (1 + e cos ϕ)2 = 4 L2 e2 3 rs2 e2 + 2e cos ϕ + cos 2ϕ . = 1+ 4 L2 2 2 Nun ist d2 (ϕ sin ϕ) + ϕ sin ϕ = 2 cos ϕ, dϕ2 d2 (cos 2ϕ) + cos 2ϕ = −3 cos 2ϕ, dϕ2 und daher 3 rs2 x̃ = 4 L2 e2 e2 + eϕ sin ϕ − cos 2ϕ 1+ 2 6 eine Lösung. Der erste Term 1 + e2 /2 beschreibt eine konstante Verschiebung von x (bzw. r), der dritte Term −e2 /6 cos 2ϕ eine Oszillation die sich zu Null mittelt. Interessant ist der Term eϕ sin ϕ, der sich mit jedem Umlauf aufsummiert. Wir vernachlässigen den ersten und den dritten Term und erhalten x(ϕ) = 1 + e cos ϕ + 98 3 rs2 eϕ sin ϕ. 4 L2 Nun ist ebenfalls näherungsweise cos ((1 − α)ϕ) ≈ cos ϕ + α d cos ((1 − α)ϕ)|α=0 = cos ϕ + αϕ sin ϕ dα und daher x(ϕ) = 1 + e cos ((1 − α)ϕ) , mit 3 rs2 . 4 L2 α = Pro Umlauf verschiebt sich das Perihel daher um einen Winkel ∆ϕ = 2πα = 3πrs2 . 2L2 Wir bestimmen noch L2 : Für eine perfekte Ellipse gilt (1 − e2 )a , 1 + e cos ϕ r = wobei a die große Halbachse bezeichnet. Aus x = 1 + e cos ϕ folgt andererseits r = 2L2 1 rs 1 + e cos ϕ und somit L2 = rs (1 − e2 )a. 2 Mit rs = 2Gm/c2 findet man letztendlich ∆ϕ = 6πGm . (1 − e2 )a Für die Sonne haben wir Gm = 1.48 · 103m. c2 Die Umlaufbahn des Merkurs wird beschrieben durch a = 5.79 · 1010m, e = 0.2056. Man findet also ∆ϕ = 0.103′′/Umlauf. 99 Üblicherweise wird die Präzession pro Jahrhundert angegeben. Mit einer Umlaufzeit von 88 Tagen für Merkur ergibt sich ∆ϕ = 43.0′′/(100 y). Dies kann nun mit den gemessenen Daten verglichen werden: 5601′′ /(100 y) −5025′′ /(100 y) −532′′ /(100 y) gemessen Präzession der Äquinoktialpunkte Störung aufgrund der anderen Planeten 44′′ /(100 y) Die Präzession der Äquinoktialpunkte ergibt sich da die Äquatorialebene um 23.5◦ gegenüber der Ekliptikebene geneigt ist. 7.3 Schwarze Löcher, Kruskal-Koordinaten und Penrose-Diagramme Nachdem wir die Schwarzschild-Lösung im Aussenraum (r > rs ) betrachtet haben, wollen wir nun die Schwarzschild-Lösung für den Fall betrachten, daß wir uns dem Schwarzschild-Radius rs nähern. Wir können als erstes versuchen die kausale Struktur zu verstehen und betrachten hierzu die Lichtausbreitung für konstantes θ und ϕ: ds 2 dr2 rs 2 2 c dt − . = 0 = 1− r 1 − rrs Daher cdt dr = ± 1 . 1 − rrs Für großes r geht die rechte Seite über in ±1, doch für r → rs findet man lim r→rs cdt dr = ±∞. In diesem Koordinatensystem werden die Lichtkegel enger und enger, je mehr man sich dem Schwarzschildradius nähert. Es bedeutet nicht, daß man den Schwarzschildradius nicht überqueren kann. Ein Beobachter hat keine Probleme, sich auf das schwarze Loch zuzubewegen. Sendet er in regelmässigen Abständen seiner Eigenzeit Lichtsignale, so erreichen diese Lichtsignale einen zurückgebliebenen Beobachter in immer grösseren Abständen. Es werden nur die Signale beim zurückgebliebenen Beobachter empfangen, welche vor dem Überqueren des Schwarzschildradius abgeschickt wurden. 100 Zum besseren Verständnisses des Ereignishorizontes rs versuchen wir nun bessere Koordinatensysteme zu finden, welche keine Koordinatensingularität für r = rs aufweisen. Wir werden in mehreren Schritten vorgehen. Definiert man für r > rs r ∗ −1 r = r + rs ln rs so lautet die Metrik nun ds2 = rs 2 2 1− c dt − dr∗2 − r2 dΩ2 , r wobei nun r als eine Funktion von r∗ aufzufassen ist. Nun gilt zwar cdt = ±1, dr∗ aber der Ereignishorizont r = rs entspricht nun r∗ = −∞. Definiert man nun v = ct + r∗ , u = ct − r∗ , so gilt für in das schwarze Loch einfallende radiale lichtartige Geodäten v = const und für auslaufende radiale lichtartige Geodäten u = const. Geht man nun wieder über zur alten radialen Koordinate r, ersetzt aber die Zeitkoordinate durch r ∗ −1 , v = ct + r = ct + r + rs ln rs so erhält man die Eddington-Finkelstein Koordinaten. Die Metrik lautet nun rs 2 ds2 = 1 − dv − (dvdr + drdv) − r2 dΩ2 . r In diesen Koordinaten findet man für die Determinante der Metrik 1 − rs −1 0 0 r −1 0 0 0 = −r4 sin2 θ. 2 0 0 −r 0 2 0 0 0 −r2 sin θ Die Determinante weist keine Singularität für r = rs auf. Für radiale lichtartige Kurven hat man nun ( 0, einlaufend dv = 2 , auslaufend, dr 1− rs r 101 Bei r = rs wird aus dem radial auslaufenden Strahl nun ebenfalls ein einlaufender Strahl. Der Ort r = rs ist daher ein “point of no return”, überquert ein Teilchen diesen Ort, so kommt es nie mehr zurück. Man definiert nun als Ereignishorizont eine Fläche, jenseits derer Teilchen niemals wieder nach räumlich Unendlich zurückkommen können. Den Raum, der durch den Ereignishorizont eingeschlossen wird, nennt man schwarzes Loch. Wir haben nun für die Schwarzschild-Raumzeit zwei Bereiche: den Aussenraum r > rs , und den Bereich des schwarzen Loches, welcher vom Aussenbereich auf zukunftsartigen Kurven erreicht werden. Wir stellen auch fest, daß es unmöglich ist, daß schwarze Loch auf vergangenheitsartigen Kurven zu erreichen. Die Schwarzschild-Lösung ist allerdings statisch und damit invariant unter Zeitumkehr. Daher können diese beiden Bereiche noch nicht die komplette Raumzeit beschreiben. Einen weiteren Bereich erhält man, indem man in der Redefinition der Zeitkoordinate anstelle von v die Größe u verwendet: r ∗ u = ct − r = ct − r − rs ln −1 , rs Die Metrik lautet nun ds 2 = rs 2 du − (dudr + drdu) − r2 dΩ2 . 1− r In diesem Koordinatensystem definiert der Bereich r < rs eine Region, die vom Aussenraum nur auf vergangenheitsorientierten Kurven erreicht werden kann, aber nie auf zukunftsorientierten Kurven. Es können also Signale aus dieser Region in den Aussenraum gelangen, doch ist es unmöglich vom Aussenraum in diese Region zu gelangen. Man spricht hier von einem weissen Loch. Um nun alle Bereiche der Schwarzschild-Raumzeit mit einem Koordinatensystem abzudecken, definieren wir ein neues Koordinatensystem r r r ct T = , − 1 e 2rs sinh rs 2rs r r r ct 2r R = . − 1 e s cosh rs 2rs Die Metrik lautet nun 4rs3 rr e s dT 2 − dR2 − r2 dΩ2 , r ds2 = wobei nun r impliziert durch 2 T −R 2 r r = 1− e rs rs 102 definiert ist. Diese Koordinaten bezeichnet man als Kruskal-Koordinaten. In den KruskalKoordinaten gilt für radiale lichtartige Kurven T = ±R + const. Der Ereignishorizont r = rs ist gegeben durch T = ±R. Allgemeiner gilt für Flächen mit r = const: T 2 − R2 = const. Die erlaubten Bereiche von (T, R) sind daher −∞ ≤ R ≤ ∞, T 2 < R2 + 1. Flächen mit t = const sind gegeben durch ct T . = tanh R 2rs Die wichtigsten Eigenschaften einer Raumzeit lassen sich mit Hilfe von Penrose-Diagrammen darstellen. Penrose-Diagramme haben die folgenden Eigenschaften: • Penrose-Diagramme stellen die Zeitkoordinate und die radiale Koordinate dar. • Lichtstrahlen in radialer Richtung laufen in Penrose-Diagrammen in 45◦ -Winkeln. • Penrose-Diagramme bilden die komplette Raumzeit auf ein endliches Gebiet ab. Wir betrachten zunächst die Konstruktion des Penrose-Diagramms für die flache MinkowskiRaumzeit. Wir beginnen mit der Metrik in Kugelkoordinaten (der Einfachheithalber setzen wir c = 1): ds2 = dt 2 − dr2 − r2 dΩ2 . Wir definieren nun Lichtkegelkoordinaten u = t − r, v = t + r. Die Bereiche von u und v sind: −∞ < u < ∞, −∞ < v < ∞, u ≤ v. Die Metrik lautet nun ds2 = 1 1 (dudv + dvdu) − (v − u)2 dΩ2 . 2 4 103 Wir setzen nun u′ = arctan u, v′ = arctan v. Die Bereiche transformieren sich auf π π π π − < u′ < , − < v′ < , u′ ≤ v′ . 2 2 2 2 Die Metrik lautet nun ds2 = Setzt man nun 1 ′ ′ ′ ′ 2 ′ ′ 2 2 du dv + dv du − sin (v − u )dΩ . 4 cos2 u′ cos2 v′ t ′ = v′ + u′ , r′ = v′ − u′ , so erhält man die Bereiche ′ ′ t + r < π, 0 ≤ r′ < π, und die Metrik ds2 = 1 (cost ′ + cos r′ )2 dt ′2 − dr′2 − sin2 r′ dΩ2 . Das Penrose-Diagramm der Minkowski-Raumzeit: i+ I+ i0 I− i− In einem Penrose-Diagramm bezeichnet man mit i+ i0 i− I+ I− Unendlich für alle zukunftsorientierten zeitartigen Kurven, Unendlich für alle raumartigen Kurven, Unendlich für alle vergangenheitsorientierten zeitartigen Kurven, Unendlich für alle zukunftsorientierten lichtartigen Kurven, Unendlich für alle vergangenheitsorientierten lichtartigen Kurven. Alle zeitartigen Geodäten beginnen daher bei i− und enden bei i+ . Alle raumartigen Geodäten beginnen und enden bei i0 . Alle lichtartigen Geodäten beginnen bei I − und enden bei I + . 104 (Lichstrahlen, die bei I − beginnen und radial einwärts laufen, tun dies bis r = 0. Danach laufen sie radial auswärts. Zeichnet man dies im Penrose-Diagramm ein, so werden sie bei r = 0 effektiv reflektiert. Die Lichtstrahlen enden dann bei I + .) Man bezeichnet eine Raumzeit (oder eine Region einer Raumzeit) als asymptotisch flach, falls im zugehörigen Penrose-Diagramm I + , i0 und I − wie im Penrose-Diagramm der MinkowskiRaumzeit sind. Das Penrose-Diagramm für die Schwarzschild-Metrik erhält man völlig analog. Man beginnt mit den Kruskal-Koordinaten und definiert U = T − R, V = T + R. Man setzt dann V V ′ = arctan √ , rs U U ′ = arctan √ , rs und letztendlich T ′ = V ′ +U ′ , R′ = V ′ −U ′ . Als Bereich findet man π π π π π π − < U ′ < , − < V ′ < , − < U ′ +V ′ < . 2 2 2 2 2 2 Das Penrose-Diagramm der Schwarzschild-Raumzeit: i+ i+ I+ I+ rs i0 i0 rs I− i− I− i− 7.4 Geladene schwarze Löcher: Die Reissner-Nordström-Lösung Ein Theorem besagt, daß stationäre, asymptotisch flache Lösungen für schwarze Löcher der allgemeinen Relativitätstheorie gekoppelt mit der Elektrodynamik, welche nicht-singulär ausserhalb eines Ereignishorizontes sind, vollständig durch die Größen Masse, Ladung und Drehimpuls beschrieben werden. Für die Schwarzschild-Lösung haben wir Ladung und Drehimpuls des scharzen Loches vernachläßigt. Wir betrachten nun die Verallgemeinerung für ein geladenes schwarzes Loch. Die 105 Reissner-Nordström-Lösung beschreibt ein elektrisch geladenes schwarzes Loch. Die Ladung wird mit Q bezeichnet. Die Metrik lautet: ds ∆ 2 2 r2 2 = 2 c dt − dr − r2 dΩ2 , r ∆ 2 wobei ∆ = r2 − 2Gmr GQ2 + 4 . c2 c Wir setzen c = 1, somit ergibt sich ∆ = r2 − 2Gmr + GQ2 . Diese Lösung wurde in den Jahren 1916-1918 von Reissner und Nordström gefunden. Den Ereignishorizont erhält man aus ∆ = 0, r± = Gm ± Wir betrachten nun die verschiedenen Fälle: p G2 m2 − GQ2 . 1. Fall: Gm2 < Q2 . In diesem Fall gibt es keine reelle Lösung für r± . ∆ ist immer positiv und die Metrik ist regulär für alle Punkte r 6= 0. Die Singularität bei r = 0 ist durch keinen Ereignishorizont von der Region der asymptotisch flachen Raumzeit getrennt. Man bezeichnet als nackte Singularität eine Singularität von welcher Signale I + erreichen können. Das zugehörige Penrose-Diagramm der Reissner-Nordström-Lösung für Gm2 < Q2 : i+ I+ i0 I− i− 2. Fall: Gm2 > Q2 . Hier haben wir Ereignishorizonte bei r± = Gm ± p G2 m2 − GQ2 . Die Singularität bei r = 0 ist für die Reissner-Nordström-Lösung zeitartig. Das zugehörige Penrose-Diagramm der Reissner-Nordström-Lösung für Gm2 > Q2 : 106 I+ I+ r+ i0 r+ I− i0 I− r− r− I+ I+ r+ i0 r+ I− i0 I− 3. Fall: Gm2 = Q2 . Diesen Fall bezeichnet man als die extreme Reissner-Nordström Lösung. In diesem Fall fallen r+ und r− zusammen: r = Gm. Die Singularität bei r = 0 ist zeitartig, überquert man den Ereignishorizonzt, so ist es möglich die Singularität zu vermeiden und man kann in ein weiteres Universum gelangen. Das zugehörige Penrose-Diagramm der Reissner-Nordström-Lösung für Gm2 = Q2 : 107 I+ i0 r I− I+ r i0 I− 7.5 Rotierende schwarze Löcher: Die Kerr-Lösung Die Kerr-Lösung beschreibt ein rotierendes schwarzes Loch. Der Drehimpuls des schwarzen Loches wird mit J bezeichnet. Die Metrik lautet: 2Gmr 2 2 2Gmr j sin2 θ 2 ds = 1− 2 c dt + (cdtdϕ + dϕcdt) c Σ c2 Σ 2 (r + j2 )2 − ∆ j2 sin2 θ Σ 2 2 sin2 θdϕ2 , − dr − Σdθ − ∆ Σ wobei ∆ = r2 − 2Gmr + j2 , 2 c Σ = r2 + j2 cos2 θ, j= J . mc Diese Lösung wurde 1953 von Kerr gefunden. Wir betrachten noch den allgemeinen Fall: Ein rotierendes geladenes schwarzes Loch mit der Masse m, Ladung Q und Drehimpuls J. Die Metrik lautet 2 2 + j2 − ∆ 2 sin2 θ j sin θ r ∆ − j ds2 = c2 dt 2 + (cdtdϕ + dϕcdt) Σ Σ 2 (r + j2 )2 − j2 ∆ sin2 θ Σ 2 2 sin2 θdϕ2 , − dr − Σdθ − ∆ Σ wobei ∆ = r2 − 2Gmr GQ2 + 4 + j2 , c2 c Σ = r2 + j2 cos2 θ, Diese Metrik bezeichnet man als Kerr-Newman-Metrik. 108 j= J . mc Die Koordinaten (t, r, θ, ϕ) bezeichnet man auch als Boyer-Lindquist-Koordinaten. Für Q = J = 0 reduziert sich die Metrik auf die Schwarzschild-Metrik. Wir betrachten im weiteren einige Besonderheiten, die sich aufgrund des Drehimpulses ergeben. Zur Vereinfachung diskutieren wir nur die ursprüngliche Kerr-Lösung (Q = 0). Hält man j konstant und betrachtet man m → 0 so findet man ds 2 (r2 + j2 cos2 θ) 2 = c dt − dr − (r2 + j2 cos2 θ)dθ2 − (r2 + j2 ) sin2 θdϕ2 . 2 2 r +j 2 2 Dies ist die Minkowski-Metrik in elliptische Koordinaten p r2 + j2 sin θ cos ϕ, x = p r2 + j2 sin θ sin ϕ, y = z = r cos θ. Insbesondere entspricht r = 0 einer zwei-dimensionalen Scheibe. Die Kerr-Metrik ist nicht statisch, sondern stationär. In der Metrik treten gemischte Terme (cdtdϕ+ dϕcdt) auf. Die Ereignishorizionte findet man wieder durch Lösen der Gleichung (wir setzen wieder c = 1) ∆ = r2 − 2Gmr + j2 = 0. Wie bei der Reissner-Nordström-Lösung unterscheidet man wieder drei Fälle: Gm < j, Gm = j und Gm > j. Wir betrachten hier nur den letzten Fall. Man findet p r± = Gm ± G2 m2 − j2 . Wir hatten den Ereignishorizont als eine Fläche definiert, jenseits derer Teilchen niemals wieder nach räumlich Unendlich zurückkommen können. Der Ereignishorizont ist eine lichtartige Fläche. Wir definieren nun einen Killing-Horizont als eine lichtartige Fläche, entlang derer ein Killing-Vektorfeld lichtartig ist. Für die Schwarzschild-Metrik und die Reissner-NordströmMetrik können wir das Killing-Vektorfeld K = ∂t betrachten. In diesem Fall ist der zugehörige Killing-Horizont genau der Ereignishorizont. Für die Kerr-Metrik trifft dies nicht mehr zu: Der Killing-Horizont des Vektorfeldes K = ∂t ist nicht mit dem Ereignishorizont identisch. Dies liegt daran, daß die Kerr-Lösung zwar stationär, aber nicht statisch ist. Den Killing-Horizont des Vektorfeldes K = ∂t findet man durch lösen der Gleichung K µ Kµ = 0. (r − Gm)2 = G2 m2 − j2 cos2 θ. Zum Vergleich: Für den äußeren Ereignishorizont hat man (r+ − Gm)2 = G2 m2 − j2 . Die Region zwischen diesen beiden Flächen bezeichnet man als Ergosphäre. 109 8 Kosmologie 8.1 Die perfekte Flüssigkeit Eine Flüssigkeit stellt oft eine hinreichend gute Näherung für ein System mit vielen Teilchen dar. Anstelle die Koordinaten und Geschwindigkeiten jedes einzelnen Teilchens zu spezifizieren, begnügen wir uns mit der Angabe des Vierergeschwindigkeitfeldes uµ (x) der Flüssigkeit. Eine besondere Rolle spielt das Konzept der perfekten Flüssigkeit: Eine perfekte Flüssigkeit wird per Definition im Ruhesystem der Flüssigkeit durch nur zwei Parameter beschrieben: die Energiedichte ρ und die Druckdichte p. Von besonderem Interesse ist nun der Energie-Impuls-Tensor der perfekten Flüssigkeit. Wir können ihn wie folgt plausibel machen: Im Ruhesystem der Flüssigkeit hängt T µν nur von ρ und p ab: 2 c ρ 0 0 0 0 p 0 0 T µν = 0 0 p 0 . 0 0 0 p Wir suchen nun die Verallgemeinerung auf beliebige Koordinatensysteme. Berücksichtigt man, daß im Ruhesystem gilt 1 0 0 0 1 0 0 0 0 −1 0 0 0 0 0 0 µν , g = uµ uν = 0 0 −1 0 , 0 0 0 0 0 0 0 −1 0 0 0 0 so findet man leicht die gewünschte Verallgemeinerung: T µν = p + c2 ρ uµ uν − pgµν . Das Konzept einer perfekten Flüssigkeit ist allgemein genug, um eine Vielzahl verschiedener physikalischer Situationen zu beschreiben. Die Spezifizierung geschieht durch eine Zustandsgleichung p = p(ρ), die einen Zusammenhang zwischen der Druckdichte und der Massendichte herstellt. Beispiele sind • Staub: Für Staub gilt die Zustandsgleichung p = 0. In diesem Fall lautet der Energie-Impuls-Tensor T µν = c2 ρuµ uν . Nicht wechselwirkende Galaxien können zum Beispiel durch Staub modelliert werden. 110 • Isotropisches Photonengas: Für ein Photonengas haben wir die Zustandsgleichung 1 2 c ρ 3 p = und der Energie-Impulstensor reduziert sich auf T µν = 4 2 µ ν 1 2 µν c ρu u − c ρg . 3 3 • Vakuumenergie: Hier gilt die Zustandsgleichung p = −c2 ρ und der Energie-Impulstensor reduziert sich auf T µν = c2 ρgµν . Bemerkung: Startet man von den Einstein’schen Gleichungen ohne kosmologische Konstante 1 8πG Ricµν − gµν R = Tµν 2 c4 und zerlegt man den Energie-Impuls-Tensor in einen Teil, der der Vakuumenergie entspricht und den restlichen Beitrag aller übrigen Materie (M) Tµν = Tµν + ρvac c2 gµν so ergibt sich 8πG 8πG (M) 1 T . Ricµν − gµν R − 2 ρvac gµν = 2 c c4 µν Dies ist äquivalent zu einer kosmologischen Konstante Λ = 8πG ρvac . c2 8.2 Energiebedingungen Anstelle der Verwendung von Modellen für den Energie-Impuls-Tensor, ist es oft auch nützlich ganz allgemein Charakteristiken der Lösungen der Einstein’schen Gleichungen zu diskutieren, welche sich aus bestimmten Eigenschaften des Energie-Impuls-Tensors ergeben. Die Eigenschaften des Energie-Impuls-Tensor werden als Energiebedingungen formuliert: • Die schwache Energiebedingung: Tµνt µt ν ≥ 0 für alle zeitartigen Vektoren t µ. Für die perfekte Flüssigkeit bedeutet dies ρ ≥ 0 und c2 ρ + p ≥ 0. 111 • Die lichtartige Energiebedingung: Tµν l µ l ν ≥ 0 für alle lichtartigen Vektoren l µ . Für die perfekte Flüssigkeit bedeutet dies c2 ρ + p ≥ 0. • Die dominante Energiebedingung: Tµνt µt ν ≥ 0 gµν Tµρt ρ Tνσt σ ≥ 0, für alle zeitartigen Vektoren t µ ; d.h. Tµρt ρ ist nicht raumartig. Für die perfekte Flüssigkeit bedeutet dies c2 ρ ≥ |p|. • Die lichtartig dominante Energiebedingung: Tµν l µ l ν ≥ 0 gµν Tµρ l ρ Tνσ l σ ≥ 0, für alle lichtartigen Vektoren l µ ; d.h. Tµρ l ρ ist nicht raumartig. Für die perfekte Flüssigkeit bedeutet dies c2 ρ ≥ |p| oder c2 ρ = −p. • Die starke Energiebedingung: Tµνt µt ν ≥ 1 ρ σ T ρ t tσ 2 für alle zeitartigen Vektoren t µ. Für die perfekte Flüssigkeit bedeutet dies c2 ρ + p ≥ 0 und c2 ρ + 3p ≥ 0. Für die perfekte Flüssigkeit können wir die Energiebedingungen wie folgt zusammenfassen. Geht man von einer Zustandsgleichung p = wc2 ρ aus (wobei man w als den Parameter der Zustandsgleichung bezeichnet), so impliziert jede der obigen Energiebedingungen zusammen mit ρ ≥ 0, daß w ≥ −1 gilt. 8.3 Die Robertson-Walker-Metrik Wir wiederholen nochmal die Begriffe Isotropie und Homogenität eines Raumes: Isotropie bedeutet, daß keine Richtung eines Raumes ausgezeichnet ist, Homogenität bedeutet, daß kein Punkt eines Raumes ausgezeichnet ist. Bemerkung: Isotropie und Homogenität sind zunächst unabhängige Konzepte, es gibt Mannigfaltigkeiten die homogen, aber nirgends isotrop sind, R × S2 wäre ein Beispiel. 112 Andererseits gilt: Falls ein Raum überall isotrop ist, so ist er auch homogen. Ebenso gilt: Fall ein Raum isotrop in einem Punkt ist und darüberhinaus homogen ist, so ist er auch überall isotrop. Aus der Beobachtung der kosmischen Hintergrundstrahlung können wir folgern, daß das Universum von der Erde aus betrachtet räumlich isotrop ist. Da wir nicht davon ausgehen, daß der Beobachtungspunkt Erde besonders ausgezeichnet ist, können wir (räumliche) Isotropie im gesamten Universum und damit auch (räumliche) Homogenität im gesamten Universum folgern. Bemerkung: Über die zeitliche Komponente ist nichts gesagt, wir werden davon ausgehen, daß das Universum in der Zeit sich verändert. Wir betrachten daher eine Raumzeit, die in den räumlichen Komponenten homogen und isotrop ist, aber in der Zeit evolviert. Wir können (zumindestens lokal) annehmen, dass sich diese Raumzeit als R×Σ darstellen läß, wobei R die Zeitkoordinate darstellt und Σ eine dreidimensionale Mannigfaltigkeit ist, welche die räumlichen Komponenten darstellt. Da die räumlichen Komponenten homogen und isotrop sind, folgt daß Σ ein maximal symmetrischer Raum ist. Durch eine geeignete Wahl der Zeitkoordinate können wir erreichen, daß sich die Metrik als ds2 = c2 dt 2 − R(t)2dσ2 schreiben läßt. R(t) bezeichnet man als Skalierungsfaktor, dσ2 gibt die Metrik auf der Mannigfaltigkeit Σ an. Für maximal symmetrische Räume gilt Rσλµν = κ gσµ gλν − gσν gλµ . Wir wenden dies nun auf den drei-dimensionalen Raum Σ mit der Metrik dσ2 = γi j dui du j an: (3) Ri jkl = κ γik γ jl − γil γ jk , wobei die hochgestellte 3 andeutet, daß wir hier für den Krümmungstensor nur die Beschränkung auf die drei-dimensionale Mannigfaltigkeit Σ betrachten. Für die Konstante κ gilt κ = R(3) . 6 Für den Ricci-Tensor findet man (3) Rici j = 2κγi j . Ähnlich wie bei der Schwarzschildlösung läßt sich die Metrik dσ2 auf die Form dσ2 = γi j dui du j = e2b(r) dr2 + r2 dΩ2 113 bringen. Wie bei der Schwarzschildlösung berechnet man aus dieser Form den Ricci-Tensor. In den Koordinaten (r, θ, ϕ) findet man (3) Ric11 (3) Ric22 (3) Ric33 2 ∂r b, r = e−2b (r∂r b − 1) + 1, h i = e−2b (r∂r b − 1) + 1 sin2 θ. = (3) Setzt man dies nun mit der obigen Gleichung Rici j = 2κγi j gleich, so findert man für b(r): 1 b(r) = − ln 1 − κr2 2 und somit dr2 + r2 dΩ2 1 − κr2 Insgesamt ergibt sich für die Metrik der vier-dimensionalen Raumzeit dr2 2 2 2 2 2 2 2 2 + r dθ + sin θdφ ds = c dt − R(t) 1 − κr2 dσ2 = Eine Metrik dieser Form bezeichnet man als Robertson-Walker-Metrik. Der Skalierungsfaktor R(t) ist noch zu bestimmen. Die Geometrien lassen sich durch den Parameter κ in drei Klassen wie folgt charakterisieren: κ>0 κ=0 κ<0 geschlossene Geometrie räumlich flach offene Geometrie Dies sieht man am leichtesten, indem man sich eine neue radiale Koordinate durch dr dχ = √ 1 − κr2 definiert. Integriert man diese Gleichung, so erhält man sin χ, κ = 1, χ, κ = 0, r = sinh χ, κ = −1. und somit dσ2 dχ2 + sin2 χdΩ2, κ = 1, = dχ2 + χ2 dΩ2 , κ = 0, 2 2 2 dχ + sinh χdΩ , κ = −1. Für κ = 1 erhält man somit für dσ2 die Metrik der Sphäre S3 , für κ = 0 erhält man die flache euklidische Metrik und für κ = −1 erhält man eine hyperbolische Metrik. 114 8.4 Die Friedmann’schen Gleichungen und der Hubble-Parameter Zur Bestimmung der Funktion R(t) verwendet man nun die Einstein’schen Gleichungen und das Modell der perfekten Flüssigkeit für den Energie-Impuls-Tensor T µν = p + c2 ρ uµ uν − pgµν . zusammen mit der Zustandsgleichung p = wc2 ρ. Im Ruhesystem der Flüssigkeit gilt uµ = (1, 0, 0, 0) und somit 2 c ρ 0 0 0 0 T µν = 0 −pgi j 0 Zieht man einen Index herunter, so ergibt sich T ν = diag(c2 ρ, −p, −p, −p). µ Für die Spur hat man T = T µµ = c2 ρ − 3p. Wir erinnern uns, daß die Einstein’schen Gleichungen sich auch als 8πG 1 Ricµν = Tµν − gµν T − Λgµν c4 2 schreiben lassen. Für die µν = 00-Komponente findet man −3 4πG 2 1 R̈ = c ρ + 3p − Λ 2 4 c R c und für die µν = i j-Komponenten erhält man 1 1 R̈ +2 2 2 c R c 2 κ 4πG 2 Ṙ +2 2 = c ρ − p + Λ. 4 R R c (Ein Punkt über einer Funktion stehe hier für d/dt.) Eliminiert man noch die zweite Ableitung aus der letzten Gleichung, so erhält man die Friedmann’schen Gleichungen: 2 8πGρ κc2 Λc2 Ṙ = − 2 + R 3 R 3 Λc2 4πG R̈ = − 2 c2 ρ + 3p + R 3c 3 115 Man bezeichnet die Größe H(t) = Ṙ(t) R(t) als Hubble-Parameter. Der Wert des Hubble-Parameters zum jetzigen Zeitpunkt wird als Hubblekonstante H0 bezeichnet. Die Hubblekonstante hat den Wert H0 = 70 ± 10 km s−1 Mpc−1 . Ein Megaparsec ist gleich 1Mpc = 3.09 · 1022m. Der Hubble-Parameter ist ein Maß für die Ausdehnung des Universums. Schlägt man die kosmologische Konstante der Massendichte zu (als ideale Flüssigkeit mit p = −c2 ρ), so lautet die erste Gleichung: 8πGρ κc2 − 2, 3 R Die Rate, mit der sich die Expansion verlangsamt, wird durch den Parameter H(t)2 = q = − R̈ RR̈ R = − 2 . Ṙ2 Ṙ R beschrieben. Aus den Friedmann’schen Gleichungen folgt (für Λ = 0): q = c2 ρ + 3p 4 3c κ 2c2 ρ − 4πGR 2 . Für die zeitliche Änderung des Hubble-Parameters findet man 2 d Ṙ(t) R̈ Ṙ Ḣ(t) = = − [1 + q(t)]H(t)2. = − dt R(t) R R Die kritische Dichte ist durch κ = 0 definiert, also 3H 2 ρc = 8πG Man definiert auch oft einen Dichteparameter Ω als ρ 8πG Ω = = ρ. ρc 3H 2 Die erste Friedmann’sche Gleichung läßt sich dann schreiben als κ . Ω−1 = 2 H R2 Daher gilt: ρ < ρc ↔ Ω < 1 ↔ κ < 0 ↔ offen, ρ = ρc ↔ Ω = 1 ↔ κ = 0 ↔ flach, ρ > ρc ↔ Ω > 1 ↔ κ > 0 ↔ geschlossen. 116 8.5 Evolution des Universums Wir betrachten noch die Energieerhaltung. Aus µ ∇µ T ν = 0 folgt für die 0-Komponente 0 = ∂µ T 0 + Γ µλ T λ0 − Γλµ0 T λ = ∂0 c2 ρ − 3 µ µ µ Mit der Zustandsgleichung p = wc2 ρ ergibt sich Ṙ 2 c ρ+ p . R ρ̇ Ṙ = −3(1 + w) . ρ R Diese Gleichung läßt sich integrieren ρ(t) ∼ R(t)−3(1+w) . Wir betrachten einige Extremfälle: Nimmt man an, daß das Universum nur aus nicht wechselwirkenden Galaxien besteht (Staub), so hat man w = 0 und ρM (t) ∼ R(t)−3. Man bezeichnet ein Universum, in dem die Energiedichte wie R(t)−3 abfällt als materiedominiert. Betrachtet man hingegen ein Universum, welches nur aus Photonen besteht, so hat man w = 1/3 und ρR (t) ∼ R(t)−4. Man bezeichnet ein Universum, in dem die Energiedichte wie R(t)−4 abfällt als strahlungsdominiert. Zuletzt betrachten wir noch ein Universum, welches nur aus Vakuumenergie besteht. Hier hat man w = −1 und ρΛ (t) ∼ R(t)0. Man bezeichnet ein Universum, in dem die Energiedichte zeitlich konstant ist als vakuumdominiert. Für alle Fälle finden wir ein Potenzgesetz ρ(t) = ρ0 R(t)−n, wobei n = 3(1 + w). Betrachten wir nochmal die erste Friedmann’sche Gleichung H(t)2 = 8πG κc2 ρ(t) − , 3 R(t)2 117 so läßt sich auch der Term proportional zur räumlichen Krümmung κ als eine effektive Energiedichte ρcurv (t) = − 3c2 κ R(t)−2 8πG betrachten. Aus n = 3(1 + w) folgt für diesen Fall w = −1/3. Man setzt auch Ωcurv = ρcurv c2 κ c2 κ . =− = − ρc R(t)2H(t)2 Ṙ2 Mit diesen Konventionen haben wir H(t)2 ! 8πG = ρcurv (t) + ∑ ρ j (t) . 3 j Dividiert man beide Seiten durch H(t)2 so ergibt sich 1 = Ωcurv + ∑ Ω j j Bemerkung: Die gesamte Energiedichte des Universums ist natürlich nur ∑ Ω j, Ω = j d.h. ohne Ωcurv . Daher gilt Ωcurv = 1 − Ω. Die Definition von ρcurv und Ωcurv dient nur zur Vereinfachung der Diskussion der verschiedenen Beiträge zu H(t). Betrachten wir nun zur Vereinfachung nur eine Energiedichte mit der Zeitabhängigkeit ρ(t) = ρ0 R(t)−n, mit n > 0 so folgt aus H(t)2 = Ṙ(t) = und somit R(t) = r 8πG ρ(t) 3 n 8πG ρ0 R(t)1− 2 3 2 2 n πGρ0 (t − t0 )2 3 1 n . Zum Zeitpunkt t = t0 haben wir R(t0) = 0. Den Zeitpunkt t0 bezeichnet man als Urknall und stellt eine echte Singularität der Raumzeit dar. Für n > 0 divergiert zum Beispiel die Energiedichte ρ(t) ∼ R(t)−n. Das zugehörige Penrose-Diagramm läßt sich wie folgt darstellen: 118 i+ I+ i− i0 Wir betrachten noch den Spezialfall n = 0, der der Vakuumsenergie entspricht. In diesem Fall ist die Energiedichte konstant ρ(t) = ρ0 und man findet R(t) = exp r ! 8 πGρ0 (t − t0 ) . 3 8.6 Die Rotverschiebung Wir betrachten zur Vereinfachung ein räumlich flaches Universum (κ = 0) mit der RobertsonWalker-Metrik ds2 = c2 dt 2 − R(t)2 dr2 + r2 dθ2 + sin2 θdφ2 und nehmen weiter an, daß die Zeitabhängigkeit des Skalierungsfaktors einem Potenzgesetz folgt: q t , 0 < q < 1, R(t) = t0 wobei t0 hier eine Größe mit der Dimension Sekunden ist, um R(t) dimensionslos zu halten. Für die Potenz q ergibt sich für eine perfekte Flüssigkeit mit der Zustandsgleichung p = wc2 ρ q = 2 2 = . n 3(1 + w) Für ein strahlungsdominiertes Universum haben wir zum Beispiel q = 1/2, für ein materiedominiertes Universum q = 2/3. Für die Lichtausbreitung findet man −q t dx . = ±c dt t0 Diese Gleichung läßt sich integrieren und man findet t = (1 − q) q (±x − x0 ) c t0 1 1−q . Aus der Differentialgleichung findet man auch, daß die Llichtkegel für t = 0 tangential zur Singularität bei t = 0 sind. Ein wichtiger Punkt dieser Geometrie ist, daß sich die Lichtkegel zweier 119 Punkte in der Vergangenheit nicht schneiden müssen. Schneiden sie sich nicht, so besteht kein kausaler Zusammenhang zwischen diesen beiden Punkten. Wir betrachten nun für eine Metrik der Form ds2 = c2 dt 2 − R(t)2 dr2 + r2 dθ2 + sin2 θdφ2 die Geodäten-Gleichung τ σ d 2 xµ µ dx dx + Γ = 0 τσ dλ2 dλ dλ Für ein masseloses Teilchen (Photon) haben wir dxµ dxµ = 0. dλ dλ Als Normalisierung verwendet man p µ dxµ . = dλ Ein Beobachter mit Vierergeschwindigkeit U µ mißt die Energie des Photons zu E = pµU µ . Für die 0-Komponente der Geodäten-Gleichung finden wir c2 dxi dx j d 2t + R Ṙδ i j dλ2 dλ dλ = 0. Mit dr c dt = dλ R dλ ergibt sich d 2t Ṙ + dλ2 R dt dλ 2 = 0. Eine Lösung ist ω0 dt = , dλ R(t) wobei ω0 eine Konstante ist. Verifikation der Lösung: d 2t Ṙ dt 2 d ω0 Ṙ ω20 d ω0 dt ω20 Ṙ = + + = + 3 dλ2 R dλ dλ R R R2 dt R dλ R 2 −ω0 Ṙ ω0 ω0 Ṙ + 3 = 0. = R2 R R 120 Ein Beobachter mit konstanten räumlichen Koordinaten (und somit Vierergeschwindigkeit U µ = (1, 0, 0, 0)) beobachtet daher ein Photon mit Energie E = Uµ dxµ ω0 = . dλ R(t) Hieraus folgt die kosmologische Rotverschiebung: Ein Photon, welches mit der Energie E1 bei dem Skalierungsfaktor R(t1) emittiert wurde und mit der Energie E2 bei dem Skalierungsfaktor R(t2) gemessen wurde, erfüllt die Relation E2 R(t1) = . E1 R(t2) Der Begriff “Rotverschiebung” erklärt sich daraus, daß in einem expandierenden Universum R(t2) > R(t1) für t2 > t1 gilt. Daraus folgt E2 < E1 . Üblicherweise wird die Rotverschiebung als z = E1 − E2 λ2 − λ1 R(t2) = = −1 E2 λ1 R(t1) angegeben. Setzt man R(t2) = 1 so findet man R(t1) = 1 . 1+z Man erhält also aus der Rotverschiebung den Skalierungsfaktor zur Zeit der Emission des Photons. Bemerkung: Die Rotverschiebung und der Dopplereffekt sind konzeptionell verschieden: Von einem Dopplereffekt kann man nur in flachen Räumen sprechen, in dem die Relativgeschwindigkeit zwischen zwei Punkten wohldefiniert ist. Auf einer gekrümmten Mannigfaltigkeit lassen sich nur Tangentialvektoren am gleichen Punkt vergleichen, eine Relativgeschwindigkeit zwischen zwei entfernten Punkten ist nicht wohldefiniert. Die Rotverschiebung ergibt sich aufgrund der Änderung der Metrik. Mit dieser Warnung im Hinterkopf, werden wir nun trotzdem der Rotverschiebung eine Geschwindigkeit zuordnen. Wir führen zunächst den momentanen physikalischen Abstand d p (t) zweier Objekte (Galaxien) ein. Befindet sich ein Objekt im Ursprung und das zweite bei der radialen Koordinate r, so ist d p (t) = R(t)r. Die Änderung des momentanen physikalischen Abstandes definiert eine Geschwindigkeit Ṙ(t) d p (t) = H(t)d p(t). v = d˙p (t) = Ṙ(t)r = R(t) Dies ist das Hubble’sche Gesetz. 121 9 Schritte zur Quantengravitation Dieses Kapitel setzt ein Verständnis der Quantenfeldtheorie voraus. In der Quantenfeldtheorie ist es üblich, die natürlichen Einheiten c = 1, ~ = 1, zu wählen. Darüberhinaus ist es üblich, die Felder zu reskalieren: ~E nat = √1 ~E Gauss , 4π ~Bnat = √1 ~BGauss , 4π ρnat = √ ~jnat = √ 4πρGauss , 4π~jGauss . Die Maxwellschen Gleichungen lauten dann ~∇ · ~E = 0, ~∇ × ~E + ∂t ~B = 0, ~∇ · ~E = ρ, ~∇ × ~B − ∂t ~E = ~j. Wir betrachten kurz die Poisson-Gleichung für das skalare Potential in der Elektrostatik, die in natürlichen Einheiten ∆Φem = −ρ lautet. Die Lagrangedichte der Elektrodynamik in natürlichen Einheiten ergibt sich zu 1 4 L = − Fµν F µν , d.h. ohne einen zusätzlichen Faktor 1/(4π). Der Energie-Impuls-Tensor der Elektrodynamik hat ebenfalls in natürlichen Einheiten keinen expliziten Vorfaktor 1/(4π). In diesem Kapitel verwenden wir natürliche Einheiten. Die Einsteinschen Feldgleichungen lauten dann 1 Ricµν − gµν R − Λgµν = 2GTµν , 2 und die Wirkung der allgemeinen Relativitätstheorie lautet SEH 1 = − 4G Z d 4x √ −g (R + 2Λ) . Wir setzen κ = und somit SEH 2 = − 2 κ Z √ d 4x 122 8G, √ −g (R + 2Λ) . 9.1 Die Gravitation als Eichtheorie Wir können die Gravitation als eine Theorie betrachten, die invariant unter bestimmten “Eichtransformationen” ist. Im Falle der Gravitation sind die Eichtransformationen die allgemeinen Koordinatentransformationen x′ µ = f µ (x) . Eine infinitessimale allgemeine Koordinatentransformation schreiben wir als x′ µ = xµ − εξµ (x) . (Das Minuszeichen hat keine weitere Bedeutung und ist Konvention.) Die infinitessimale Umkehrtransformation ist dann µ xµ = x′ + εξµ x′ + O ε2 . Wir bestimmen die Metrik im transformierten System: g′µ′ ν′ x′ ∂xµ ∂xν gµν x x′ ′ ′ ∂x ∂x ν µ = δµ′ + ε∂µ′ ξµ x′ δν′ + ε∂ν′ ξν x′ gµν x′ + εξρ x′ ∂ρ gµν x′ + O ε2 = gµ′ ν′ x′ + ε ∂µ′ ξµ x′ gµν′ x′ + ∂ν′ ξν x′ gµ′ ν x′ + ξρ x′ ∂ρ gµ′ ν′ x′ +O ε2 . = µ′ ν′ Man schreibt auch oft in kürzerer Form g′µν = gµν + ε ∂µ ξρ gρν + (∂ν ξρ ) gµρ + ξρ ∂ρ gµν + O ε2 . Schreiben wir nun gµν (x) = ηµν + κhµν (x) , so findet man für h′µν : ε ∂µ ξρ ηρν + (∂ν ξρ ) ηµρ h′µν = hµν + κ ρ +ε ∂µ ξ hρν + (∂ν ξρ ) hµρ + ξρ ∂ρ hµν + O ε2 . Wir können dies etwas vereinfachen und finden ε h′µν = hµν + ∇µ ξν + ∇ν ξµ + O ε2 , κ wobei ξµ = gµν ξν = ηµν ξν + κhµν ξν . Wir können die Transformation von hµν nach h′µν als eine infinitessimale Eichtransformation betrachten. 123 9.2 Störungstheoretische Behandlung der Quantengravitation Bei der Herleitung der Einsteinschen Gleichungen hatten wir den Newtonschen Grenzfall betrachtet. Dieser Grenzfall war durch drei Bedingungen definiert: schwache Kopplung, statisches Gravitationsfeld sowie der Forderung, daß sich alle Teilchen langsam gegenüber der Lichtgeschwindigkeit bewegen. In diesem Abschnitt werden wir auf die letzten beiden Forderungen verzichten, behalten aber die erste bei, so daß wir das Gravitationsfeld als Störung der flachen Raumzeit behandeln können. Darüberhinaus wollen wir alle (kleinen) Störungen des Gravitationsfeldes betrachten und jede Störung mit exp iS gewichten. Dies führt uns direkt zu einer störungstheoretischen Beschreibung der Quantengravitation. Dies wird uns auch erlauben, Gravitationswellen und deren Streuung zu beschreiben. Wir bezeichnen mit 1 0 0 0 0 −1 0 0 ηµν = 0 0 −1 0 0 0 0 −1 die Metrik des flachen Minkowskiraumes. Wir schreiben gµν = ηµν + κhµν √ und behandeln κhµν als einen Störterm. Wir erinnern uns, daß wir κ = 8G definiert hatten. Der Tensor hµν beschreibt das Feld eines Graviton. Die Metrik ηµν des flachen Minkowskiraumes ist Lösung der Einsteinschen Gleichungen ohne kosmologische Konstante, 1 Ricµν − gµν R = 0, 2 ηµν ist keine Lösung der Einsteinschen Gleichungen mit einer von Null verschiedenen kosmologischen Konstante. Da wir um eine triviale Lösung entwickeln wollen, beschränken wir uns im folgenden auf Λ = 0. Die Einstein-Hilbert-Wirkung ohne kosmologische Konstante läßt sich somit als SEH = Z d 4x L , L =− 2√ −gR κ2 schreiben. Hierbei betrachten wir κ/4 als eine (kleine) Kopplungskonstante. Wir betrachten nun für hµν eine effektive (nicht-renormierbare) Quantenfeldtheorie, die durch das generierende Funktional Z Z µν 4 µν Z [J ] = D h exp i d x L + LGF + LFP + J hµν definiert ist. Hierbei bezeichnet LGF einen eichfixierenden Term und LFP den zugehörigen FaddeevPopov-Term. Auf den eichfixierenden Term LGF werden wir später noch genauer eingehen, der Faddeev-Popov-Term LFP ist in der Born-Näherung nicht weiter relevant. Die so definierte Quantenfeldtheorie wollen wir im Rahmen der Störungstheorie behandeln. Unser erstes Ziel hierbei 124 ist die Entwicklung der Lagrangedichte in Potenzen von hµν . Wir führen die folgenden Abkürzungen ein: (ηhη)µν = ηµµ1 hµ1 µ2 ηµ2 ν , (ηhηhη)µν = ηµµ1 hµ1 µ2 ηµ2 µ3 hµ3 µ4 ηµ4 ν , (ηhηhηhη)µν = ηµµ1 hµ1 µ2 ηµ2 µ3 hµ3 µ4 ηµ4 µ5 hµ5 µ6 ηµ6 ν , Mit Hilfe dieser Abkürzungen können wir den inversen metrischen Tensor durch hµν ausdrücken: gµν = ηµν − κ (ηhη)µν + κ2 (ηhηhη)µν − κ3 (ηhηhηhη)µν + O κ4 . Der inverse metrische Tensor is eine unendliche Reihe in κ. Wir betrachten nun die Determinante g = det(gµν ). Auch hier führen wir wieder einige Abkürzungen ein: (ηh) (ηhηh) (ηhηhηh) (ηhηhηhηh) = = = = ηµ1 µ2 hµ2 µ1 , ηµ1 µ2 hµ2 µ3 ηµ3 µ4 hµ4 µ1 , ηµ1 µ2 hµ2 µ3 ηµ3 µ4 hµ4 µ5 ηµ5 µ6 hµ6 µ1 , ηµ1 µ2 hµ2 µ3 ηµ3 µ4 hµ4 µ5 ηµ5 µ6 hµ6 µ7 ηµ7 µ8 hµ8 µ1 . Für die Determinante gilt dann: − det gµν = 1 1 1 2 3 3 1 2 1 (ηh) − (ηhηh) + κ (ηh) − (ηhηh) (ηh) + (ηhηhηh) 1 + κ (ηh) + κ 2 2 6 2 3 1 1 1 1 4 2 2 4 1 (ηh) − (ηhηh) (ηh) + (ηhηh) + (ηhηhηh) (ηh) − (ηhηhηhηh) . +κ 24 4 8 3 4 Dieser Ausdruck endet mit dem O (κ4)-Term. Nehmen wir nun allerdings die Wurzel, so erhalten wir wieder eine unendliche Reihe in κ: i κ3 h i √ κ κ2 h 2 3 (ηh) − 2 (ηhηh) + (ηh) − 6 (ηhηh) (ηh) + 8 (ηhηhηh) −g = 1 + (ηh) + 2 8 48 +O κ4 . Zur Berechnung der skalaren Krümmung R betrachten wir zunächst die Christoffel-Symbole Γκµν = κ 1 ∂µ gνκ + ∂ν gµκ − ∂κ gµν = ∂µ hνκ + ∂ν hµκ − ∂κ hµν . 2 2 Hierbei haben wir ∂α ηβγ = 0 verwendet. Der Riemannsche Krümmungstensor ergibt sich zu Rκλµν = κ ∂λ ∂µ hκν − ∂κ ∂µ hλν + ∂κ ∂ν hλµ − ∂λ ∂ν hκµ + gξη Γξκν Γηλµ − Γξκµ Γηλν . 2 Der erste Term ist hierbei linear in hµν , während der zweite Term mindestens quadratisch in hµν ist. Für die skalare Krümmung gilt dann R = gκµ gλν Rκλµν . 125 √ Da sowohl gµν als auch −g unendliche Reihen in κ sind, erhalten wir auch für die Lagrangedichte eine unendliche Reihe in κ. Wir schreiben ∞ L + LGF = ∑ L (i), i=1 wobei der Term L (i) das Feld hµν genau i-mal enthält. Wir erhalten also eine Theorie mit einer unendlichen Anzahl von Wechselwirkungsvertices, geordnet nach der Anzahl der Felder. L (1) ist gegeben durch 2 κ L (1) = − ηκµ ηλν ∂λ ∂µ hκν − ∂ν hκµ Dieser Term ist eine totale Ableitung und verschwindet in der Wirkung nach partieller Integration: 2 − ηκµ ηλν κ Z d 4 x ∂λ ∂µ hκν − ∂ν hκµ = 0. Die Lagrangedichte beginnt also mit Termen quadratisch in hµν . Bemerkung: Hätten wir naiv die Einstein-Hilbert-Wirkung mit einer kosmologischen Konstante Λ 6= 0 um die flache Minkowskimetrik ηµν entwickelt, so würden wir von der Entwicklung von √ −g einen Zusatzterm zu L (1) bekommen: − 2Λ µν η hµν . κ Dieser Term ist keine totale Ableitung und verschwindet nicht. Ein Term dieser Art wird als Tadpole bezeichnet und zeigt an, daß um das falsche Hintergrundfeld entwickelt wurde. Wir kehren zum Fall Λ = 0 zurück und betrachten nun L (2) . Zu L (2) trägt auch LGF bei. Eine übliche Eichung für die Gravitation ist die de Donder-Eichung. In dieser Eichung ist LGF = 1 Cµ ηµνCν , κ2 wobei Cµ durch Cµ κ αβ 1 αβ = η Γµαβ = η ∂α hβµ + ∂β hαµ − ∂µ hαβ = κη ∂α hβµ − ∂µ hαβ 2 2 αβ gegeben ist. In dieser Eichung findet man 1 µ1 µ2 ν1 ν2 1 µ1 ν1 µ2 ν2 1 µ1 ν2 µ2 ν1 1 (2) hµ µ η η − η η − η η ✷hν1 ν2 . L = 2 1 2 2 2 2 126 Hiebei haben wir den Ausdruck in Klammern in (µ1 , µ2 ) und (ν1 , ν2 ) symmetrisiert. Dies ist problemlos möglich, da hµν symmetrisch ist. Wir betrachten zuerst die Tensorstruktur (in D RaumZeit-Dimensionen). Für 1 µ1 ν1 µ2 ν2 1 µ1 ν2 µ2 ν1 1 µ1 µ2 ν1 ν2 η η + η η − η η , 2 2 2 2 1 ηµ1 ν1 ηµ2 ν2 + ηµ1 ν2 ηµ2 ν1 − ηµ µ ην ν = 2 D−2 1 2 1 2 M µ1 µ2 ν1 ν2 = Nµ1 µ2 ν1 ν2 gilt M µ1 µ2 ρ1 ρ2 Nρ1 ρ2 ν1 ν2 = 1 µ1 µ2 µ µ δν1 δν2 + δν12 δν21 . 2 Als Propagator für das Graviton findet man 1 2 i ηµ1 ν1 ηµ2 ν2 + ηµ1 ν2 ηµ2 ν1 − ηµ1 µ2 ην1 ν2 2 . 2 D−2 k Als nächstes bestimmen wir den 3-Graviton-Vertex. Hierzu betrachten wir L (3) . Nach einer etwas längeren Rechnung und unter Verwendung partieller Integration findet man 1 1 (3) L = κ − ηµ1 ν1 ηµ2 ν2 ηµ3 ν3 ηρ2 ρ3 + ηµ1 ν1 ηµ2 ν3 ηµ3 ν2 ηρ2 ρ3 + ηµ1 ν2 ηµ2 ν1 ηµ3 ν3 ηρ2 ρ3 4 4 1 1 −ηµ1 ν2 ηµ2 ν3 ηµ3 ν1 ηρ2 ρ3 + ηµ1 ρ2 ηρ3 ν1 ηµ2 ν2 ηµ3 ν3 − ηµ1 ρ2 ηρ3 ν1 ηµ2 ν3 ηµ3 ν2 2 2 1 +2ηµ1 ρ2 ηρ3 ν2 ηµ2 ν3 ηµ3 ν1 − ηµ1 ρ2 ηρ3 ν2 ηµ2 ν1 ηµ3 ν3 − ηµ3 ρ2 ηρ3 ν2 ηµ1 ν1 ηµ2 ν3 2 +ηµ3 ρ2 ηρ3 ν2 ηµ1 ν3 ηµ2 ν1 − ηµ1 ρ2 ηρ3 ν3 ηµ2 ν2 ηµ3 ν1 − ηµ3 ρ2 ηρ3 ν3 ηµ1 ν2 ηµ2 ν1 1 µ3 ρ2 ρ3 ν3 µ1 ν1 µ2 ν2 + η η η η hµ1 ν1 ∂ρ2 hµ2 ν2 ∂ρ3 hµ3 ν3 . 2 Wir schreiben L (3) als L (3) = O µ1 µ2 µ3 ν1 ν2 ν3 (∂1 , ∂2 , ∂3 ) hµ1 ν1 hµ2 ν2 hµ3 ν3 , wobei O µ1 µ2 µ3 ν1 ν2 ν3 (∂1 , ∂2 , ∂3 ) durch Vergleich mit der vorherigen Gleichung definitiert ist. Hierbei bezeichnet ∂ j eine Ableitung, die auf das Feld hµ j ν j wirkt. Die Feynmanregel für den 3Graviton-Vertex lautet dann V µ1 µ2 µ3 ν1 ν2 ν3 (p1 , p2 , p3 ) = i ∑ O µσ(1) µσ(2) µσ(3) νσ(1) νσ(2) νσ(3) ipσ(1) , ipσ(2) , ipσ(3) . σ∈S3 Der explizite Ausdruck für V µ1 µ2 µ3 ν1 ν2 ν3 ist länglich und wird hier nicht angegeben. Es soll aber eine interessante Eigenschaft erwähnt werden. Der 3-Graviton-Vertex läßt sich schreiben als V µ1 µ2 µ3 ν1 ν2 ν3 (p1 , p2 , p3 ) = i κ µ1 µ2 µ3 V (p1 , p2 , p3 )V ν1 ν2 ν3 (p1 , p2 , p3 ) + ..., 4 127 wobei die Punkte für Terme stehen, die im On-Shell-Limes verschwinden. V µ1 µ2 µ3 (p1 , p2 , p3 ) ist der kinematische Anteil des zyklisch geordneten 3-Guon-Vertex, gegeben durch µ µ µ µ µ µ V µ1 µ2 µ3 (p1 , p2 , p3 ) = i gµ1 µ2 p13 − p23 + gµ2 µ3 p21 − p31 + gµ3 µ1 p32 − p12 . Wir sehen also, daß der 3-Graviton-Vertex im On-Shell-Limes im wesentlichen das Quadrat des 3-Gluon-Vertex ist. Dies stellt eine Verbindung zwischen nicht-abelschen Eichtheorien und der Gravitation her und wird als “double copy”-Eigenschaft bezeichnet. Im Prinzip ist es möglich, aus der Lagrangedichte systematisch die weiteren Wechselwirkungsvertices für vier, fünf, ... Gravitonen herzuleiten. Zur Berechnung der Streuamplitude mit n Gravitonen benötigt man alle Vertices mit bis zu n Feldern. Die Streuamplitude läßt sich dann über Feynmandiagramme berechnen. Allerdings ist dieser Weg sehr mühselig. Effizientere Methoden basieren auf der oben erwähnten “double copy”-Eigenschaft oder auf On-shell-Rekursionsformeln. Wir betrachten noch die Kopplung eines Gravitons an ein komplexes skalares Feld. Die relevante Lagrangedichte lautet √ LSkalar = −g ∂µ φ∗ (∂ν φ) gµν − m2 φ∗ φ . Auch diese Lagrangedichte können wir wieder in eine Reihe in κ entwickeln. ∞ LSkalar = (i) ∑ LSkalar . i=0 (0) Der nullte Term LSkalar lautet (0) = LSkalar ∂µ φ∗ (∂ν φ) ηµν − m2 φ∗ φ. Dieser Term gibt den Propagator des skalaren Feldes: i p 2 − m2 . (1) Der Term LSkalar lautet (1) = LSkalar κ 2 (ηµ1 µ2 ηµ3 µ4 − ηµ1 µ3 ηµ2 µ4 − ηµ1 µ4 ηµ2 µ3 ) hµ1 µ2 ∂µ3 φ∗ ∂µ4 φ − 2m2 ηµ1 µ2 hµ1 µ2 φ∗ φ . 4 Hieraus ergibt sich der Skalar-Skalar-Graviton-Vertex zu i κ µ1 µ2 µ µ 2p1 p2 + 2p21 p12 − 2p1 · p2 + 2m2 ηµ1 µ2 , 4 wobei p1 der Impuls des auslaufenden φ∗ -Teilchens und p2 der Impuls des auslaufenden φTeilchens ist. Wir können nun die Streuamplitude für die Streunung zweier skalarer Teilchen mit den Massen m und m′ durch Gravitonaustausch berechnen. Das relevante Feynmandiagramm ist hierbei 128 p2 p3 p1 p4 Wir erhalten für die Steuamplitude κ µ µ µ µ M = i 2p21 p32 + 2p31 p22 − 2p2 p3 + 2m′2 ηµ1 µ2 4 i 1 × ηµ1 ν1 ηµ2 ν2 + ηµ1 ν2 ηµ2 ν1 − ηµ1 µ2 ην1 ν2 2 (p2 + p3 )2 κ i 2pν11 pν42 + 2pν41 pν12 − 2p1 p4 + 2m2 ην1 ν2 , × 4 wobei in der ersten Zeile die Feynmanregel für den oberen Skalar-Skalar-Graviton-Vertex steht, in der zweiten Zeile die Feynmanregel für den Gravitonpropagator und in der dritten Zeile die Feynmanregel für den unteren Skalar-Skalar-Graviton-Vertex. Kontrahiert man die Indizes, so erhält man κ 2 4 M = −i (s + u) m2 + m′2 − su − m4 − m′4 − 4m2 m′2 . 4 t Hierbei haben wir die Mandelstam-Variablen s = (p1 + p2 )2 = (p3 + p4 )2 , t = (p2 + p3 )2 = (p1 + p4 )2 , u = (p1 + p3 )2 = (p2 + p4 )2 verwendet. Wir betrachten nun die Streuung φ1 φ2 → φ3 φ4 im nicht-relativistischen Grenzfall. In diesem Grenzfall sind die räumlichen Komponenten der Vierervektoren klein gegenüber den Energiekomponenten. Behalten wir nur den jeweils führenden Term so ist in diesem Grenzfall µ p1 = (−m, −~p1 ), µ p2 = (−m′ , −~p2 ), µ p3 = (m′ ,~p3 ), µ p4 = (m,~p4 ). Das Minuszeichen bei p1 und p2 rührt daher, daß wir in unserer Konvention alle Impulse als auslaufend betrachten. Für die Mandelstam-Variablen s und u ergibt sich 2 2 s = m + m′ , u = m − m′ . Für die Mandelstam-Variable t ergibt sich t = − |~p3 −~p2 |2 = − |~p4 −~p1 |2 = − |~q|2 . Im nicht-relativistischen Grenzfall ist die Mandelstam-Variable t klein gegenüber den anderen Variablen s, u, m2 und m′2 . Wir können die Variable t daher im Zähler vernachläßigen. Wir erhalten für die Streuamplitude κ 2 8m2 m′2 Gm2 m′2 = 4i . M = i 4 |~q|2 |~q|2 129 Wir können diese Streuamplitude mit der Streuamplitude für die Streuung zweier geladener Fermionen mit den Ladungen Q und Q′ und den Massen m und m′ vergleichen. Im Rahmen der Quantenelektrodynamik findet man im nicht-relativistischen Grenzfall A = −4i QQ′ mm′ |~q|2 . Betrachten wir zunächst die Vorzeichen. Aus der Elektrodynamik ist bekannt, daß sich gleichartige Ladungen (QQ′ > 0) abstoßen und entgegengesetzte Ladungen (QQ′ < 0) anziehen. Aus dem Vorzeichen von M folgt, daß die Gravitation eine anziehende Kraft ist. Bis auf Vorfaktoren sind die beiden Streuamplituden identisch. Die funktionale Abängigkeit von den Impulsen ist in beiden Fällen durch den Faktor 1/|~q|2 gegeben und entspricht im klassischen Grenzfall einem 1/r-Potential. 130