Allgemeine Relativitätstheorie und Kosmologie Inhalt 0 I Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 10 15 18 . . . . . . . 22 22 28 32 33 39 41 47 III Kovarianzprinzip und Energie-Impuls-Tensor 12 Vorbemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . 13 Erhaltungssätze . . . . . . . . . . . . . . . . . . . . . . . . . . 51 51 53 IV Dynamik des Gravitationsfeldes 14 Einsteinsche Feldgleichungen . . 15 Linearisierte Theorie . . . . . . 16 Newtonscher Grenzfall . . . . . 17 Gravitationswellen . . . . . . . II V VI Äquivalenzprinzip 1 Formulierungen . . . . . . . . . . . . . . . . . . . . . . 2 Beschleunigte Bezugssysteme im Minkowski-Raum . . . 3 Physikalische Effekte in homogenen Gravitationsfeldern 4 Die Geodätengleichung . . . . . . . . . . . . . . . . . . 1 Pseudo-Riemannsche Geometrie 5 Mannigfaltigkeiten und Tangentialraum 6 Tensorfelder . . . . . . . . . . . . . . . 7 Das metrische Tensorfeld . . . . . . . . 8 Zusammenhänge und Paralleltransport 9 Krümmung und Torsion . . . . . . . . 10 Levi-Civita-Zusammenhang . . . . . . 11 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 55 57 58 58 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 61 64 68 70 74 78 Kosmologie 24 Friedmann-Robertson-Walker-Metrik . . . . . . . . . . . . . . 25 Kosmologische Modelle . . . . . . . . . . . . . . . . . . . . . . 26 Beobachtende Kosmologie . . . . . . . . . . . . . . . . . . . . 86 86 90 93 Die 18 19 20 21 22 23 Schwarzschild-Lösung Vakuumlösung . . . . . . . . . Bahnen im Schwarzschild-Feld Lichtablenkung . . . . . . . . Innere Schwarzschild-Lösung . Schwarze Löcher . . . . . . . . Ergänzungen . . . . . . . . . . . . . . . . Preliminary version – 4. August 2016 27 28 29 30 Dunkle Materie . . . . . . . Frühes Universum . . . . . . Das aufgeblasene Universum Beschleunigte Expansion des . . . . . . . . . . . . . . . . . . . . . Universums Literatur siehe Internet i Preliminary version – 4. August 2016 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 97 97 98 0 0.1 Überblick Newtonsches Gravitationsgesetz Unser Ziel ist eine mit allgemeinen Prinzipien kompatible Gravitationstheorie. Die Gravitation umfaßt vor allem den freien Fall, der offenbar durch eine Zentralkraft beschreiben wird. Entscheidend war nun Newtons Erkenntnis, daß die Planetenbahnen, die durch die Keplerschen Gesetze beschrieben werden, durch dasselbe Bewegungsgesetz wie der freie Fall vermittelt werden. Die Planetenbahnen liegen in einer Ebene und sind in dieser Ellipsen mit der Sonne in einem der Brennpunkte. Ebene Ellipsen entstehen im Hookeschen Kraftgesetz ẍ = −ω 2 x , ÿ = −ω 2 y mit einer zum Mittelpunkt (0, 0) gerichteten Zentralkraft, die proportional zum Abstand ist. Newton erkannte, daß der Übergang von Hooke zu Kepler eine Dualitätstransformation ist (mit heutigen Techniken: x + iy = z 7→ z 2 ), unter der eine zum Abstand |z| proportionale Zentralkraft in eine zu |z|1 2 proportionale Zentralkraft überführt wird. Somit gewinnt man das Newtonsche Gravitationsgesetz mr̈ = − rC2 , wobei m die Masse des Testkörpers (Planet, fallender Körper) ist. Wegen der schon von Galilei herausgestellten Unabhängigkeit der Gravitationsbeschleunigung von der Masse muß C proportional zur Testmasse m sein, aus Symmetriebetrachtungen auch proportional zur (viel größeren) Masse M des gravitierenden Körpers. Es folgt (bei M in ~0) GN mM~r . (0.1) m~r¨ = − k~rk3 0.2 Zur Stärke und Universalität der Gravitation Formal sehr ähnlich ist das Coulombsche Gesetz für die Kraft zwischen zwei LaqQ ~ r dungen Q in ~0 und q in ~r: F~ = 4πε . Vergleicht man beide Kräfte für das Proton k~ r k3 der Masse mp und Ladung e, und drückt e2 durch die dimensionslose Kopplungs1 aus, so erhält man als gravitative Kopplungskonstante des konstante α ≈ 137 Protons GN m2p αG = = 5.9 × 10−39 . ~c Entsprechend wird der gravitative Bohr-Radius aG = α mp aB ≈ 1031 cm , αG me was den ‘Radius’ des Universums um einen Faktor 1000 übertrifft. Deshalb darf z.B. in der Hochenergiephysik die Gravitation komplett vernachlässigt werden. Dennoch gewinnt die Gravitation in kosmologischen Maßstäben, da in Sternen 1 Preliminary version – 4. August 2016 und Galaxien große Massen zusammenkommen, die Gravitation große Reichweite hat und vor allem (im Gegensatz zu elektrischen Ladungen) nicht kompensiert werden kann. Antiteilchen haben dieselbe Masse wie Teilchen. 0.3 Elektrodynamik und Spezielle Relativitätstheorie Das Coulombsche Gesetz ergibt sich als statische Lösung der Maxwellschen Feldgleichungen. Eine wichtige weitere Lösungsklasse der Maxwellschen Gleichungen sind elektromagnetische Wellen, deren Ausbreitungsgeschwindigkeit c festgelegt ist. Damit ist ein scheinbar gravierendes Problem verbunden. Nach Galilei sind gleichförmig gegeneinander bewegte Bezugssysteme völlig gleichwertig zur Beschreibung der Physik. Die übliche Schlußfolgerung ist, daß nur Relativgeschwindigkeiten eine Bedeutung haben, und deshalb die Maxwellschen Gleichungen mit der daraus folgenden absoluten Lichtgeschwindigkeit das Prinzip der Gleichwertigkeit der Bezugssysteme verletzen. Einsteins überraschende Lösung in der Speziellen Relativitätstheorie (1905) lautet: Die Maxwellschen Gleichungen sind kompatibel mit dem galileischen Relativitätsprinzip, es ist lediglich eine stillschweigend gemachte (tatsächlich aber absurde!) Annahme aufzugeben: Daß die zeitliche Ordnung entfernter (d.h. kausal getrennter) Ereignisse einen Sinn hat. 0.4 Allgemeines Relativitätsprinzip Einstein war sich der Defizite der speziellen Relativitätstheorie bewußt. Die Physik sollte nicht nur in allen Inertialsystemen (welche im Rahmen der speziellen Relativitätstheorie gar nicht sinnvoll definierbar sind!), sondern in beliebig bewegten Bezugssystemen identisch sein. Dieses allgemeine Relativitätsprinzip gab der Theorie ihren Namen. Im Laufe der Zeit wurde aber klar, daß das nicht der Kern der Theorie ist. Das Prinzip sagt einfach nur, daß man die Physik zu geometrisieren hat und durch intrinsische Objekte auf Mannigfaltigkeiten beschreiben muß. Mannigfaltigkeiten sind durch einen Atlas lokaler Karten definiert, zusammen mit einer Umrechnungsvorschrift im Überlappungsgebiet. Jede Karte ist Abbild der tatsächlichen Physik in einem gewählten Bezugssystem. Experimente liefern immer nur diese Kartenbeschreibung, und man hat einen Abstraktionsprozeß durchzuführen, um auf die intrinsische Realität auf einer Mannigfaltigkeit zu schließen. In der Praxis kann das schwierig sein. Aus theoretischer Sicht ist es aber eine enorme Vereinfachung: Man formuliere die Naturgesetze auf Mannigfaltigkeiten. Dann: • Das allgemeine Relativitätsprinzip ist eine leere Aussage. • Man hat die Freiheit, eine besonders sinnvolle Karte zu wählen, in der die Rechnung einfach ist. Man gewinnt Vorhersagen für Experimente. 2 Preliminary version – 4. August 2016 • Die Geometrisierung ist eine starke Einschränkung an mögliche Naturgesetze; man muß also weniger durchprobieren. 0.5 Äquivalenzprinzip Durch tiefsinnige Überlegungen kam Einstein 1907 zu dem Schluß, daß diese Geometrisierung zusammen mit dem Äquivalenzprinzip, d.h. der Universalität des freien Falls, etwas über Gravitation aussagt. Dieses Äquivalenzprinzip ist der eigentliche Kern der gesamten Theorie, alles andere ist mathematisches Handwerk. Wir gehen im ersten Kapitel im Detail darauf ein, da einiges über den Anwendungsbereich zu sagen ist. Hier beschränken wir uns auf die Schlußfolgerung: Eine Gravitationskraft gibt es nicht! Es gibt den freien Fall, d.h. die kräftefreie geodätische Bewegung in pseudoRiemannschen Mannigfaltigkeiten. Die Mondbahn ist ebenso wie Newtons Apfel nichts anderes als freie Fall zur Erde hin, nur mit verschiedenen Anfangsdaten. Dieser freie Fall ist die natürliche Bewegung, und dazu ist keine Kraft erforderlich! Eine Kraft wird nur benötigt, wenn man den freien Fall bremsen oder gänzlich verhindern möchte. Die üblicherweise als Gravitationskraft bezeichnete Kraft ist die gleiche Illusion wie die Zentrifugalkraft. Beide Kräfte müssen aufgewandt werden, um den betrachteten Körper von seiner natürlichen Bewegung abzubringen, d.h. um eine Beschleunigung relativ zur geodätischen Bewegung zu erzwingen. Das Äquivalenzprinzip führt bereits zu beobachtbaren Effekten, wenn man Eigenschaften beschleunigter Bezugssysteme doch als Gravitationsfeld interpretiert: • Lichtablenkung im Gravitationsfeld. Der Ablenkungswinkel wird später berechnet, wenn die genaue Form des ‘Gravitationsfeldes’ festgelegt ist. Aber die Tatsache, daß Licht sich nicht längs Geraden ausbreitet, folgt bereits aus dem Äquivalenzprinzip. • Verlangsamung von Uhren im Gravitationsfeld: Eigenfrequenzen verlangsamen sich in der Nähe gravitativer Zentren. Der Effekt konnte bei sehr schmalen Resonanzen von Absorption/Emission gemessen werden. Stehen Quelle und Empfänger auf unterschiedlicher Höhe, dann kommt es erst dann wieder zur Resonanz, wenn durch speziell-relativistische Effekte eine kompensierende Frequenzänderung hinzugefügt wird. Die Frequenzverlangsamung muß vor allem in der Satellitennavigation (GPS/GLONASS) berücksichtigt werden, wo wohldefinierten Laufzeitunterschiede der Signale zur Lokalisierung benutzt werden. Die Uhren in den Satelliten gehen nicht langsamer als auf der Erde (wie nach spezieller Relativitätstheorie erwartet), sondern um einen relativen Faktor 4.4 × 10−10 schneller! Deshalb wird die Uhr in den Satelliten um diesen Faktor verstimmt, und es werden Signale von 4 Satelliten zur Ortsbestimmung gebraucht. 3 Preliminary version – 4. August 2016 Es sei hier bemerkt, daß die Geometrisierung durch Mannigfaltigkeiten für das elektromagnetische Feld und für die Verallgemeinerung zu Yang-Mills-Feldern auf sehr ähnliche Objekte wie in der Einsteinschen Gravitationstheorie führt. Dennoch ist das Äquivalenzprinzip, also die Nichtexistenz einer Gravitationskraft im Gegensatz zur Realität der anderen Wechselwirkungen, der eigentliche Grund, weshalb eine Quantisierung der Gravitation mit immensen Schwierigkeiten verbunden ist. Man darf behaupten, daß die richtigen Strukturen der Quantengravitation noch nicht gefunden sind. 0.6 Einsteinsche Feldgleichungen Verbleibt die Frage, was aus Newtons Gravitationsgesetz wird. Dieses ist wegen der Fernwirkung sogar mit dem speziellen Relativitätsprinzip inkompatibel; für Einstein der Grund, tiefer über das Wesen der Gravitation nachzudenken. Wie zuvor betont, ist Newtons Gravitationsgesetz (bis auf Zahlenwerte) äquivalent zu den Keplerschen Gesetzen. Man hat also jene pseudo-Riemannschen Mannigfaltigkeiten zu ermitteln, in der der freie Fall (zumindest in exzellenter Näherung) durch Kegelschnitte beschrieben wird. Das ist die Frage nach den Einsteinschen Feldgleichungen: Welche Eigenschaften der anderen Materiefelder bestimmen welche pseudo-Riemannsche Geometrie (und zwar in einer intrinsischen Formulierung auf Mannigfaltigkeiten)? Diese Identifikation war historisch ein schwieriger Schritt. Tatsächlich konnte Hilbert das Problem 1915 kurz vor Einstein lösen, indem er die im Rahmen sinnvoller Kriterien eindeutige Lagrange-Funktion angegeben hat, deren Euler-Lagrange-Gleichungen die Einsteinschen Feldgleichungen liefern. Technisch sind diese Feldgleichungen ein gekoppeltes nichtlineares System partieller Differentialgleichungen 2. Ordnung. Bei schwacher Gravitation, d.h. nur infinitesimaler Abweichung von der Minkowski-Mannigfaltigkeit, kann man die Gleichungen linearisieren. In diesem Grenzfall wird das Newtonsche Gravitationsgesetz zurückgewonnen. Zum einen ist das eine wichtige Kontrolle der Gleichungen, zum anderen wird eine freie Konstante in den Gleichungen festgelegt. Eine weitere Lösungsklasse der linearisierten Theorie sind Gravitationswellen. Deren Existenz konnte indirekt aus der Dynamik von Doppolsternpulsaren geschlußfolgert werden. Die langjährige direkte Suche scheint kürzlich Erfolg gehabt zu haben. 0.7 Exakte Lösungen Eine exakte Lösung zu vorgegebener Materieverteilung erscheint zunächst aussichtslos. Tatsächlich vereinfachen sich die Gleichungen enorm, falls besondere Symmetrien vorliegen, und solche hochsymmetrsichen Lösungen konnten relativ rasch gefunden werden. Die erste ist die Schwarzschild-Lösung im Vakuum (1916), die die Symmetrie eines einzigen statischen Sterns hat. Betrachtet man typische 4 Preliminary version – 4. August 2016 Bahnen in der Schwarzschild-Lösung, so findet man geringfügige Abweichungen von der Newtonschen Gravitation: • Perihel-Drehung: Der Lenz-Runge-Vektor ist nicht mehr erhalten, so daß sich die Planetenbahnen nicht exakt zu Ellipsen schließen, sondern über viele Umläufe Rosetten bilden. Zwar geschieht das infolge der Bahnstörungen durch andere Planeten sowieso, es bleibt aber ein gewisser Überschuß, im Einklang mit den Beobachtungen. • Lichtablenkung an der Sonne: Auch Licht bewegt sich auf Geodäten, d.h. den kürzesten Bahnen zwischen zwei Punkten. In der Schwarzschild-Lösung, und ganz allgemein in jeder gekrümmten Mannigfaltigkeit, sind das keine Geraden mehr. Näherungsweise sind es Hyperbeln, deren Asymptoten einen Winkel bilden, der vom Abstand des Scheitels von der Sonne abhängt. Eine Ablenkung erwartet man auch in der Newtonschen Gravitationstheorie, wenn man den Photonen eine infinitesimale Masse gibt. Der Ablenkungswinkel ist in der Einsteinschen Theorie jedoch doppelt so groß, und genau das wurde bei totalen Sonnenfinsternissen bestätigt. Die Schwarzschild-Lösung hat eine Singularität bei kleinen Radien. Normalerweise liegt diese weit im Inneren der Sterne, wo sowieso kein Vakuum mehr vorliegt. (Es gibt eine Fortsetzung der Schwarzschild-Lösung in radialsymmetrische Materieverteilungen, die keine Singularität hat). In Entstadien der Sternentwicklung können beim Gravitationskollaps prinzipiell so hohe Dichten auftreten, daß der Schwarzschild-Horizont ins Vakuum wandert. Durch angepaßte Wahl der Koordinaten läßt sich die Lösung über den Horizont hinaus erweitern. Sie zeigt, daß der Gravitationskollaps nicht gestoppt werden kann, sobald der Horizont passiert ist. Es entsteht ein schwarzes Loch mit punktförmiger Singularität. Deren Existenz im Kosmos war lange Zeit fraglich, scheint inzwischen aber gesichert. Es existieren Varianten der Schwarzschild-Lösung, die rotierende Sterne und/oder elektrisch geladene Sterne beschreiben. 0.8 Kosmologische Modelle Schließlich lassen sich Lösungen zu gewissen Klassen von homogen und isotrop verteilter Materie finden. Diese sind brauchbare Näherungen für den Kosmos als ganzes, so daß die Lösungen eine Evolution des Universums beschreiben. Aus der Rotverschiebung der Spektren entfernter Galaxien folgt, daß das Universum gegenwärtig expandiert. Damit verbunden ist die Schlußfolgerung, daß es in der Vergangenheit sehr klein und möglicherweise singulär war (Urknall). Die zukünftige Entwicklung hängt von der Materiedichte sowie Existenz und Vorzeichen der kosmologischen Konstante ab. Neuere Beobachtungen führen zu der überraschenden Aussage, daß sich die Expansion beschleunigt. Als Ursache nimmt man sogenannte dunkle Energie an, es genügt jedoch auch eine geeignete kosmologische 5 Preliminary version – 4. August 2016 Konstante. Weiter gibt es größere Diskrepanzen zwischen der Dichte der gravitativ wirkenden Materie und jener Materie, die in Sternen und Staub gebunden ist. Daraus schließt man auf die Existenz einer dunklen Materie. Die Hochenergiephysik spekuliert viel über mögliche Kandidaten. 6 Preliminary version – 4. August 2016 Teil I Äquivalenzprinzip Wir könnten es uns leichtmachen und den mathematischen Rahmen und die Feldgleichungen der Einsteinschen Gravitationstheorie einfach postulieren. Das würde jedoch der grandiosen wissenschaftlichen Leistung von Albert Einstein nicht gerechtwerden. Es gab vor 100 Jahren keinerlei experimentelle Notwendigkeit, vom Newtonschen Gravitationsgesetz abzurücken. Eine tiefe Intuition, ausgedrückt im Äquivalenzprinzip, führte Einstein zur Erkenntnis, daß sich Gravitation radikal von den anderen Kräften der Natur unterscheidet. Das Äquivalenzprinzip gilt strenggenommen nur in idealisierter Form, so daß es nicht wirklich befriedigend zu formulieren ist. Es ist ein heuristisches Prinzip, welches historisch auf den richtigen mathematisches Rahmen der Gravitationstheorie geführt hat. Genauere Experimente haben im Laufe von 100 Jahren die Einsteinsche Gravitationstheorie exzellent bestätigt und alle Alternativen verworfen. 1 Formulierungen Man kann die Ausgangslage wohl nicht besser formulieren als Einstein selbst in seiner Schrift “Über die spezielle und die allgemeine Relativitätstheorie”: Das Gravitationsfeld weist im Gegensatz zum elektrischen und magnetischen Felde eine höchst merkwürdige Eigenschaft auf, welche für das Folgende von fundamentaler Bedeutung ist. Körper, die sich unter ausschließlicher Wirkung des Schwerefeldes bewegen, erfahren eine Beschleunigung, welche weder vom Material noch vom physikalischen Zustande des Körpers im geringsten abhängt. Ein Stück Blei und ein Stück Holz fallen beispielsweise in Schwerefelde (im luftleeren Raume) genau gleich, wenn man sie ohne bzw. mit gleicher Anfangsgeschwindigkeit fallen läßt. Man kann dies äußerst genau gültige Gesetz auch noch anders formulieren auf Grund folgender Erwägung. Nach Newtons Bewegungsgesetz ist (Kraft) = (träge Masse) · (Beschleunigung), wobei die träge Masse” eine charakteristische Konstante des beschleunigten Körpers ” ist. Ist nun die beschleunigende Kraft die Schwere, so ist andererseits (Kraft) = (schwere Masse) · (Intensität des Schwerefeldes), wobei die schwere Masse” ebenfalls eine für den Körper charakteristische Konstante ” ist. Aus beiden Relationen folgt (Beschleunigung) = (schwere Masse) · (Intensität des Schwerefeldes). (träge Masse) 7 Preliminary version – 4. August 2016 Soll nun, wie die Erfahrung ergibt, bei gegebenem Schwerefelde die Beschleunigung unabhängig von der Natur und dem Zustande des Körpers stets dieselbe sein, so muß das Verhältnis der schweren zur trägen Masse ebenfalls für alle Körper gleich sein. Man kann also dies Verhältnis durch passende Wahl der Einheiten zu 1 machen; dann gilt der Satz: Die schwere und die träge Masse eines Körpers sind einander gleich. Die bisherige Mechanik hat diesen wichtigen Satz zwar registriert, aber nicht interpretiert. Eine befriedigende Interpretation kann nur so zustande kommen, daß man einsieht: Dieselbe Qualität des Körpers äußert sich je nach Umständen als Trägheit” ” oder als Schwere”. ” Man diskutiert nun zwei (voneinander abhängige) Gedankenexperimente: i) Ein Labor sei an einen Punkt im Universum gebracht, in dem es keine Gravitationskraft gibt. Der Experimentator bestätigt das Trägheitsgesetz, d.h. ein kräftefreier Körper bleibt in Ruhe oder bewegt sich gleichförmig geradlinig. Jetzt wird das Labor von außen mit konstanter Kraft gezogen, somit gleichmäßig beschleunigt. Nach dem Äquivalenzprinzip wird der Experimentator zur Schlußfolgerung kommen, daß das Labor in einem homogenen Gravitationsfeld ruht. ii) Das Labor wird in einem Gravitationsfeld fallengelassen, was heute tatsächlich realisiert ist z.B. in der Raumstation (ISS, Mir, . . . ) bei abgeschalteten Triebwerken und Vernachlässigung der Reibung in der oberen Atmosphäre. Der Experimentator bestätigt wieder das Trägheitsgesetz. Falls es keine Fenster gibt, kann der Experimentator nicht unterscheiden, ob er sich an einem Punkt im Universum ohne Gravitationsfeld befindet, oder ob er in einem nahezu homogenen Gravitationsfeld frei fällt. Hierzu einige Bemerkungen. • Reale ‘Gravitationsfelder’ sind nicht homogen. Der Beobachter wird minimale Unterschiede bei Experimenten am Boden oder an der Decke feststellen, außerdem Gezeiteneffekte an verschiedenen Wänden. Wenn wir das Äquivalenzprinzip etwas präziser formulieren, müssen wir von lokalen Experimenten an einem einzigen Punkt (mit bestenfalls infinitesimaler Umgebung) sprechen. Strenggenommen läßt sich auch lokal ein nichthomogenes ‘Gravitationsfeld’ als solches erkennen! • Das Äquivalenzprinzip wird für Testkörper und allgemein ‘Testphysik’ formuliert. Damit ist gemeint, daß die Rückwirkung des Testkörpers oder des Labors auf das äußere Gravitationsfeld vernachlässigt wird, bzw. daß das Labor kein eigenes Gravitationsfeld erzeugt, falls es solches ohne Labor nicht vorhanden ist. In der Realität gibt es immer eine Rückwirkung, so daß hier eine mathematische Idealisierung betrachtet wird. Gegebenenfalls müßte man eine Folge immer kleinerer werdender Labore untersuchen und den Limes ermitteln. Nach diesen Vorbemerkungen können wir festhalten: 8 Preliminary version – 4. August 2016 1.1 Äquivalenzprinzip. Lokale Experimente von einer gewissen Art mit Testkörpern können nicht unterscheiden, ob das Experiment in einem Labor durchgeführt wird, das in einem Gravitationsfeld frei fällt, oder ob es im Labor kein Gravitationsfeld gibt. Die physikalischen Gesetze können deshalb lokal in ein Bezugssystem transformiert werden, in dem die spezielle Relativitätstheorie gilt. Der Grund, sich auf Experimente ‘gewisser Art’ einzuschränken, liegt am sehr unterschiedlichen Grad der experimentellen Überprüfung. Das soll nun etwas präzisiert werden1 : • schwaches Äquivalenzprinzip (WEP): beschränkt auf die Mechanik von Testkörpern ohne Selbstgravitation im äußeren Gravitationsfeld. • Einsteinsches Äquivalenzprinzip (EEP): Die fundamentalen Gesetze der nichtgravitationellen Physik, sofern sie Testcharakter haben, sind an jedem Punkt der Raumzeit lokal blind gegenüber Gravitationsfeldern. • Starkes Äquivalenzprinzip (SEP): Wie Einstein, nur daß Gravitationsphysik selbst zugelassen ist. Die Abgrenzungen sind nicht immer ganz klar in der Literatur. Das WEP ist experimentell mit großer Genauigkeit überprüft. Es läßt jedoch viele alternative Gravitationstheorien zu. Das EEP betont eine andere Richtung, nämlich z.B. die Maxwellschen Gleichungen und allgemein die klassischen Feldtheorien, die der Elementarteilchenphysik zugrunde liegen. Außerdem wird implizit gefordert, daß die Naturkonstanten überall im Universum und zu allen Zeiten die gleichen sind. Einerseits geht es darum, zusammengesetzte Körper auszuschließen, mit denen man selbst infinitesimal Gezeitenkräfte messen kann. Die eigentliche Motivation für EEP ist, daß man die fundamentale Physik im Minkowski-Raum sehr gut kennt. Nach EEP kann man nichtgravitationelle fundamentale Physik lokal immer auf einen Minkowski-Raum transformieren. Damit muß die Gravitationstheorie eine metrische sein, zumindest in ihrer Wirkung auf fundamentale Physik. Was metrisch heißt, wird später diskutiert. Die genaue Form der Feldgleichungen für die Gravitation ist damit noch nicht festgelegt. Es könnte auch noch zusätzliche Skalarfelder geben, welche ein zentraler Teil der Gravitation sind, aber eben nicht an die sonstige fundamentale Physik koppeln. Andererseits schließt das EEP einiges aus, was problemlos mit der Einsteinschen Gravitationstheorie kompatibel wäre, wie Kopplungen von Teilchen mit Spin an den Riemanntensor oder eine konforme Kopplung von Skalarfeldern an den Krümmungsskalar (beide führen wir im Laufe der Vorlesung ein). Das SEP scheint nur mit der Einsteinschen Gravitationstheorie kompatibel zu sein. Einige Autoren gehen sogar soweit, daß in 4 Dimensionen sogar die Feldgleichungen festgelegt sind. 1 Wir folgen in Teilen der Arbeit: E. Di Casola, S. Liberati & S. Sonego, “Nonequivalence of equivalence principles,” Am. J. Phys. 83 (2015) 39 [arXiv:1310.7426 [gr-qc]]. 9 Preliminary version – 4. August 2016 Alle Beobachtungen sind kompatibel mit der Annahme, daß die Einsteinschen Gravitationstheorie exakt gilt. Aus theoretischer Sicht wäre das problemeatisch, da in extremen Situationen die rein metrische Gravitation nicht mit den Gesetzen der Quantenphsik kompatibel sein kann. Die Suche nach einer konsistenten Theorie der Quantengravitation ist eines der großen Forschungsprogramme in der theoretischen Physik. 2 Beschleunigte Bezugssysteme im Minkowski-Raum Daß Beschleunigungen die Geometrie ändern, sieht man durch folgende Überlegung. Betrachte eine Scheibe vom Radius r, die mit Winkelgeschwindigkeit ω rotiert. Ein mitrotierender Beobachter, für den die Scheibe ruht, überzeugt sich durch Längenmessungen von der üblichen Beziehung u = 2πr für den Umfang der Scheibe. Ein äußerer Beobachter wird denselben Radius messen, da die Scheibe keine radiale Bewegung ausführt. Dagegen ist die Rotation eine tangentiale Bewegung, die am Umfang der Geschwindingkeit v = rω entspricht. Entsprechend sind p infinitesimale Tangenten nach der speziellen Relativitätstheorie um nach Ausführen den Faktor 1 − v 2 /c2 verkürzt, so daß der äußere Beobachter p ′ 2 der Integration den Umfang der Scheibe zu u = 2πr 1 − ω r 2 /c2 bestimmt. Einen ähnlichen Effekt findet man bei Kreisen auf der Kugeloberfläche: Legen wir den Kreismittelpunkt in den Nordpol N und laufen die Strecke r in beliebige Richtung, so erreichen wir den Breitengrad α = Rr , falls die Winkelmessung bei N beginnt und R der Radius der Kugel ist. Der Umfang des Breitenkreises α ist u = 2πR sin α = 2πr sinα α < 2πr. Solche nichteuklidischen Geometrien wurden erstmals 1813 von Gauß verstanden. Gauß konnte zeigen, daß man die Frage, ob und wie ein Raum gekrümmt ist, allein durch Messungen im Raum entschieden kann. Im obigen Beispiel heißt das folgendes: Zwar kann man die Kugel (isometrisch) in den R3 einbetten und durch dreidimensionalen Blick von außen die Krümmung bestimmen. Aber auch zweidimensionale Wesen können allein durch lokale geometrische Messungen in u der Ebene das Verhältnis 2πr = sinα α messen, daraus α ermitteln und zusammen mit der Information über r den Krümmungsradius R berechnen. Die in größter Allgemeinheit anzuwendenden Methoden wurden dann von Riemann 1854 ausgearbeitet. Beim freien Fall im Gravitationfeld handelt es sich um geodätische Bewegung in einem gekrümmten Raum. Die Krümmung kann allein durch Messungen im Raum selbst ermittelt werden; es besteht keinerlei Notwendigkeit, ihn als Untermannigfaltigkeit in einen höherdimensionalen RN einzubetten. Die zu betrachtende Geometrie in der Physik unterscheidet sich von der Riemannschen Geometrie durch die zusätzliche kausale Struktur. Wir führen diese zunächst für den Minkowski-Raum ein. Definition 2.1 i) Als Minkowski-Raum R1,D−1 , D ≥ 2, bezeichnet man den Euklidischen Vektorraum (RD , h , i) zusammen mit einer linearen symmetri10 Preliminary version – 4. August 2016 schen Abbildung η = η t : RD → RD , deren Eigenwerte {+1, −1, . . . , −1} | {z } D−1 sind. Einer der beiden Eigenvektoren e0 = η(e0 ) ∈ RD mit he0 , e0 i = 1 werde als Zeitrichtung ausgezeichnet. ii) Ein Endomorphismus Λ ∈ End(RD ) heißt Lorentz-Transformation, falls hΛx, η(Λy)i = hx, η(y) für alle x, y ∈ RD . iii) Sei I ⊆ R ein Intervall. Eine (stückweise) differenzierbare Kurve I ∋ τ 7→ γ(τ ) ∈ RD heißt kausal, falls für den Tangentialvektor gilt hγ̇(τ ), η(γ̇(τ ))i ≥ 0 und hγ̇(τ ), e0 i > 0 für alle τ ∈ I. Wir nennen eine kausale Kurve zeitartig, falls sogar hγ̇, η(γ̇)i > 0 für alle τ ∈ I, und rein lichtartig für hγ̇, η(γ̇)i = 0 für alle τ ∈ I. iv) Die Teilmenge Vx+ = {y ∈ RD : ∃ differenzierbare kausale Kurve [α, β] ∋ τ 7→ γ(τ ) ∈ RD mit γ(α) = x und γ(β) = y} heißt Zukunftskegel von x ∈ RD . Die Familie {Vx+ : x ∈ RD } heißt kausale Struktur des Minkowski-Raums R1,D−1 = (RD , η). Hierzu einige Bemerkungen. • Die Menge aller Lorentz-Transformationen bildet eine Gruppe, die O(1, D − 1): Wegen der Nichtausgeartetheit der Bilinearform (x, y) 7→ hx, η(y)i läßt sich die Invarianz schreiben als Λt ◦ η ◦ Λ = η, woraus nach Determinantenbildung (det Λ)2 = 1 folgt. Damit ist Λ invertierbar. • Ergänzt man e0 zu einer ONB (e0 , e1 , . . . , eD−1 ), dann folgt P η(ei ) = −ei für i = 1, . . . , D − 1. Mit der darstellenden Matrix Λ(e0 ) = D−1 µ=0 Λµ0 eµ ergibt P 2 2 sich aus hΛ(e0 ), η(Λ(e0 )i = he0 , η(e0 )i = 1 die Relation Λ00 − D−1 i=1 Λi0 = 1. Daraus folgt einerseits he0 , Λ(e0 )i2 = Λ200 ≥ 1 und für die Komposition von zwei Lorentz-Transformationen (Λ ◦ Λ′ )00 = Λ00 Λ′00 − D−1 X i=1 Λi0 Λ′i0 ≥ Λ00 Λ′00 − q p Λ200 − 1 (Λ′00 )2 − 1 nach Cauchy-Schwarz. Ist Λ00 = cosh(α) > 1 und Λ′00 = cosh(β) > 1, so (Λ ◦ Λ′)00 ≥ cosh(α − β) ≥ 1. Somit darf man sich konsistent auf die Untergruppe SO+ (1, D − 1) der eigentlichen (speziellen, orthochronen) LorentzTransformationen mit det Λ = 1 und he0 , Λ(e0 )i ≥ 1 einschränken. • Mit γ ist auch Λ(γ) kausal für eine eigentliche Lorentz-Transformation Λ ∈ SO+ (1, D − 1). 11 Preliminary version – 4. August 2016 Definition 2.2 Sei γ : [α, β] → R1,D−1 eine stückweise differenzierbare kausale p Rβ Kurve mit γ(α) = x und γ(β) = y. Dann heißt τ (x, y) := α dτ hγ̇(τ ), η(γ̇(τ ))i die Eigenzeitdifferenz längs γ. Das Integral τ (x, y) ist invariant unter Reparametrisierungen I ∋ τ 7→ ϑ(τ ) ∈ J mit ϑ̇(τ ) > 0. Ist die Kurve sogar zeitartig, so kann man die Kurve auf Eigenzeit reparametrisieren, d.h. (nach Rücksubstitution zu den alten Variablen) gilt hγ̇(τ ), η(γ̇(τ ))i = 1 und τ (x, y) = β − α. Solche zeitartigen Kurven beschreiben die ‘Weltlinien’ von Beobachtern. Für einen räumlich ruhenden Beobachter (im Punkt x) läuft dennoch eine Zeitevolution ab, d.h. er beschreibt eine Kurve γ(τ ) = x + τ e0 in seinem eigenen Koordinatensystem. Ein dazu mit konstanter Geschwindigkeit bewegter Beobachter sieht diese Kurve als Lorentz-Transformation γ ′ (τ ) := Λ(γ(τ )) = Λ(x) + τ Λ(e0 ) . Wir suchen nun die Kurve R+ ∋ τ 7→ γ(τ ) ∈ R1,D−1 , die einer gleichmäßig beschleunigten Bewegung entspricht. Als Anfangsdaten dürfen wir γ(0) = 0 und γ̇(0) = e0 wählen, d.h. einen zur Eigenzeit τ = 0 im Ursprung ruhenden Beobachter. Die Beschleunigung ist offenbar γ̈(τ ) ∈ RD . Zum ... Eigenzeitpunkt τ = 0 soll die Beschleunigung...räumlich konstant sein, d.h. γ (0) hat höchstens eine zeitliche Komponente: γ (0) = F e0 = F γ̇(0) für eine Konstante F ∈ R. Diese Gleichung muß jedoch für alle Eigenzeiten richtig bleiben, da wir durch eine geeignete Kombination aus Lorentz-Transformation und Raum-Zeit-Translation den neuen Ursprung in den Kurvenpunkt legen dürfen. Dann heißt Konstanz der Beschleunigung, daß F konstant ist, also gilt für alle τ : ... γ (τ ) = F γ̇(τ ) ⇒ γ̈(τ ) = F (γ(τ ) + x) für einen konstanten Vektor x ∈ RD . Wir setzen F = g 2 und integrieren die letzte Gleichung zu γ(τ ) = y cosh(gτ ) + y ′ sinh(gτ ) − x mit weiteren konstanten Vektoren y, y ′ ∈ RD . Die Anfangsdaten bei τ = 0 liefern x = y und gy ′ = e0 . Aus hγ̇, η(γ̇)i = 1 folgt hγ̈(τ ), η(γ̇(τ ))i = 0, was für τ = 0 auf hx, e0 i = 0 hinausläuft. Damit ist η(x) = −x, woraus nach Einsetzen in hγ̇, η(γ̇)i = 1 schließlich folgt: hx, xi = g12 . Legen wir die Bewegung in die e0 -e1 Ebene, so erhalten wir das Endergebnis γ(τ ) = 1 1 cosh(gτ ) − 1 e1 . sinh(gτ )e0 + g g (2.1) Für kleine Zeiten τ , also noch geringen Geschwindigkeiten, finden wir γ(τ ) ≈ g 2 τ e1 + τ e0 + O(τ 3 ), so daß g ein Maß für die Beschleunigung ist. 2 12 Preliminary version – 4. August 2016 Diese Gleichung (2.1) erlaubt folgende wichtige Interpretation: Wir fassen Lorentz-Transformationen Λ ∈ SO+ (1, D − 1) Verschiebungen a ∈ RD zur Poincaré-Transformation (Λ, a) zusammen. Diese wirken auf x ∈ R1,D−1 gemäß (Λ, a)(x) := Λx + a . Mit diesen Bezeichnungen entsteht aus (2.1) γ(τ ) = (Λgτ , − g1 e1 )( g1 e1 ) , (2.2) wobei Λv die Lorentz-Transformation in der e0 -e1 -Ebene zum Parameter v ist: Λv (e0 ) = cosh(v)e0 + sinh(v)e1 , Λv (e1 ) = sinh(v)e0 + cosh(v)e1 , Λv (ej ) = ej für j ≥ 2 . Die Gleichung (2.2) ist plausibel: v = gτ ist für kleine τ der Geschwindigkeitszuwachs zur Zeit τ ; der Übergang zu einem mit Relativgeschwindigkeit v bewegten Bezugssystem erfolgt gerade durch Lorentz-Transformation Λv . Die zusätzliche Verschiebung um − g1 e1 ergibt sich aus den Anfangsbedingungen. Wenn wir nun nicht nur einen Massepunkt, PD−1 isondern ein ausgedehntes La2 ~ bor mit räumlichen Koordinaten ξ = i=1 ξ ei gleichmäßig beschleunigen, so muß die Weltline der anderen Laborpunkte sich durch dieselbe PoincaréTransformation (Λgτ , − 1g e1 ) ergeben. Aus den Anfangsbedingungen folgt, daß dabei der Punkt 1 e1 + ξ~ zu transformieren ist: g ~ γξ~(τ ) = (Λgτ , − g1 e1 )( g1 e1 + ξ) = ( 1g 1 + ξ ) sinh(gτ )e0 + ( g1 1 + ξ ) cosh(gτ ) − 1 g e1 + D−1 X ξ i ei . (2.3) i=2 Mit dieser Formel sind bemerkenswerte Effekte verbunden: • Die Eigenzeitdifferenz Z β α dτ q hγ̇ξ~, η(γ̇ξ~)i = (1 + gξ 1 )(β − α) wird höhenabhängig. • Die Kurve γξ~(τ ) beschreibt für g1 + ξ 1 > 0 eine Hyperbel, die sich asymptotisch der Geraden − g1 + τ ′ (e0 + e1 ) nähert. Diese liegt auf dem Rand von V− 1 e1 . Ein im Punkt −x1 e1 mit x1 ≥ g1 ausgandtes Lichtsignal kann g den beschleunigten Beobachter niemals erreichen. So etwas nennt man einen Ereignishorizont. 2 Die Wahl hochgestellter Indizes wird sich später als sinnvoll erweisen. 13 Preliminary version – 4. August 2016 Eine weitere Schlußfolgerung erfordert mathematische Strukturen, die erst später ausführlich eingeführt werden. Die aus (2.3) abzulesenen Koordinaten des Punkts γξ~ in der gewählten Basis (e0 , e1 , . . . , eD−1 ) definieren folgenden Satz von D Funktionen auf dem Minkowski-Raum: x0 := ( g1 + ξ 1 ) sinh(gτ ) , x1 := ( g1 + ξ 1 ) cosh(gτ ) − 1 g xi := ξ i für 2 ≤ i ≤ D − 1 . , (2.4) Derselbe Punkt γξ~ hat im mitbeschleunigten Koordinatensystem die Koordinaten ξ 0 := τ , ξ i := ξ i für 1 ≤ i ≤ D − 1 . (2.5) Die Differentiale dieser Funktionen liefert sogenante 1-Formen, welche längs Kurven integriert werden können. Setzen wir (2.5) in (2.4) ein, so ergibt Differenzieren: dx0 = sinh(gξ 0)dξ 1 + (1 + gξ 1) cosh(gξ 0 )dξ 0 , dx1 = cosh(gξ 0)dξ 1 + (1 + gξ 1) sinh(gξ 0 )dξ 0 , dxi = dξ i für i ≥ 2 . (2.6) Somit erhalten wir (dx0 )2 − (dx1 )2 − . . . (dxD−1 )2 = (1 + gξ1)2 (dξ 0)2 − (dξ 1 )2 − . . . (dξ D−1)2 , oder D−1 X µ ν ηµν dx dx = D−1 X gµν (ξ)dξ µdξ ν (2.7) µ,ν=0 µ,ν=0 mit den einzigen nichtverschwindenden Komponenten η00 = 1 , g00 (ξ) = (1 + gξ 1)2 , ηii = gii (ξ) = −1 für i = 1, . . . , D − 1 . (2.8) Die Koordinaten ξ µ heißen auch Rindler-Koordinaten, der die damit erfaßte Geometrie heißt Rindler-Raum. Wir werden später sehen, daß ein solches symmetrisches Produkt der Koordinatendifferentiale eine fundamentale geometrische Größe ist. Die linke Seite reflektiert die zuvor durch η ∈ End(RD ) eingeführte kausale Struktur des Minkowski-Raums. Die rechte Seite hat zwar gleiche Vorzeichen und damit eine ähnliche kausale Struktur; aber es gibt eine ortsabhängige Deformation im mitbeschleunigten Bezugssystem. Beispiel 2.3 Eine verwandte Situation trifft man im R3 bei Verwendung von Kugelkoordinaten an: x1 = r sin ϑ cos ϕ , x2 = r sin ϑ sin ϕ , 14 Preliminary version – 4. August 2016 x3 = r cos ϑ und daraus dx1 = sin ϑ cos ϕ dr + r cos ϑ cos ϕ dϑ − r sin ϑ sin ϕ dϕ , dx2 = sin ϑ sin ϕ dr + r cos ϑ sin ϕ dϑ + r sin ϑ cos ϕ dϕ , dx3 = cos ϑ dr − r sin ϑ dϑ . Eine kurze Rechnung zeigt (dx1 )2 + (dx2 )2 + (dx3 ) := (dr)2 + r 2 (dϑ)2 + r 2 sin2 ϑ(dϕ)2 . (2.9) Nennen wir jetzt r = ξ 1 , ϑ = ξ 2 , ϕ = ξ 3 , so schreibt sich die letzte Gleichung als 3 X i j δij dx dx = i,j=1 3 X gij (ξ)dξ i dξ j i,j=1 mit den einzigen nichtverschwindenden Komponenten g11 (ξ) = 1 , g22 (ξ) = (ξ 1 )2 , g33 (ξ) = (ξ 1 )2 sin2 ξ 2 .tag (2.10) ⊳ Nach dem Allgemeinen Relativitätsprinzip sind beliebige Bezugssysteme zur Beschreibung der Physik zugelassen. Wir lernen, daß die damit verbundenen Effekte durch die Größen gµν (ξ) erfaßt werden. 3 Physikalische Effekte in homogenen Gravitationsfeldern Wir interpretieren nun die zuvor beschriebene gleichmäßig beschleunigte Bewegung als ein im Gravitationsfeld ruhendes System. 3.1 Gravitative Frequenzänderung P µ Die Eigenzeitdifferenz eines sich auf der Weltlinie γ(λ) = D−1 µ=0 x (λ)eµ bewegenden Beobachters im Minkowski-Raum war v Z β rD Z β u E X u D−1 dxµ dxν dγ dγ ηµν ∆s = dλ = ,η dλt dλ dλ dλ dλ α α µ,ν=0 v Z β u X u D−1 dξ µ dξ ν gµν (ξ) = dλt (3.1) dλ dλ α µ,ν=0 Der Kurvenparameter λ spielt wegen der Reparametrisierungsinvarianz keine Rolle; die Intervallgrenzen reflektieren nur die Kurvenparameter der Endpunkte der Kurve. Längs der Kurve werde eine Uhr transportiert, d.h. ein periodischer Vorgang. Wir nehmen die Uhr als räumlich ruhend im mitbeschleunigten System 15 Preliminary version – 4. August 2016 an, ξ i = const, äquivalent als im Gravitationsfeld ruhend. Somit ist dξ i = 0 für i = 1, . . . , D − 1. Als Kurvenparameter können wir λ = τ = ξ 0 wählen. Der periodische Vorgang habe im mitbeschleunigten p System die Periode ∆τ = β − α = 1, die dann im ruhenden System als ∆s = g00 (ξ)∆τ erscheint. Die Gleichung ist nun umgekehrt zu lesen: Wird die Uhr im feldfreien Minkowski-Raum mit Periode ∆s hergestellt, so hat sie am Punkt ξ~ im homogenen Gravitationsfeld (der Richtung −e1 und Stärke g) die Periode ∆τ = p ∆s g00 (ξ) = ∆s 1+ gξ 1 c2 , (3.2) wobei wir die Lichtgeschwindigkeit c = 1 explizit mitgenommen haben. Es ist zu betonen, daß diese Periodenänderung lokal an einem Punkt nicht beobachtet werden kann. Die Sekunde ist definiert über eine gewisse Periodenzahl von Übergängen im Cäsiumatom, und in dieser Einheit messen wir die Periode der Uhr. Bringen wir jetzt das Cäsium-Atom und die Uhr an den Punkt ξ~ im Gravitationsfeld −ge1 , so hat die Uhr wieder nach Äquivalenzprinzip dieselbe Periode in Sekunden. Gangunterschiede ergeben sich nur bei Differenzen in der Höhe ξ 1 . Wir bringen wir einen Sender elektromagnetischer Wellen in Höhe ξB1 an, der dort die Periode ∆τB := ∆s hat, falls er im Minkowski-Raum mit Periode ∆s vergξ1 1+ B c2 sehen wurde. Die Zeitdifferenz ∆τB entspricht der Zeit zwischen zwei Scheiteln der elektromagnetischen Welle. Da nachfolgende Scheitel die gleiche Zeit für den Weg von ξB1 nach ξA1 brauchen, kommen sie in ξA1 mit genau dieser Zeitdifferenz ∆τB := ∆s an. Derselbe Sender ∆s hat dort jedoch die Periode ∆τA := ∆s . gξ1 gξ1 1+ B c2 1+ Umgerechnet auf Frequenzen entsteht eine Frequenzverschiebung 1+ ∆τA νB = = νA ∆τB 1+ 1 gξB c2 1 gξA c2 ⇒ ∆ν νB − νA g := ≈ 2 (ξB1 − ξA1 ) . ν νA c A c2 (3.3) Die Vorhersage wurde 1960 von Pound und Rebka in einem 22,56 m hohen Turm überprüft, indem sie die Verstimmung einer infolge des Mößbauereffekts sehr schmalen Resonanz gemessen haben. Die erwartete Frequenzänderung ∆ν = 2.5 · ν 10−15 konnte bestätigt werden. Wegen Z B 1 1 g(ξB − ξA ) = − ~g · d~r = ΦB − ΦA (3.4) A können wir die Frequenzänderung interpretieren als hervorgerufen durch die Differenz der gravitativen Potentiale. Diese Korrespondenz erlaubt Abschätzungen für Fälle, in denen das Gravitationsfeld nicht mehr als homogen angesehen werden darf, wie z.B. für die GPS-Satelliten. Sind RE = 6360 km der mittlere Radius und 16 Preliminary version – 4. August 2016 ME die Masse der Erde und H = 20200 km die Bahnhöhe über Erdoberfläche, so erwarten wir GN ME 1 GN ME HRE g HRE 1 ∆ν = =− − = 2 = 5.3 · 10−10 . 2 2 2 ν c RE + H RE RE c RE + H c RE + H (3.5) Um diesen Prozentsatz geht die Uhr in den Satelliten schneller, wenn wir nur die gravitativen Effekte berücksichtigen. Andererseits haben sie bei einer Umlaufzeit von T = 12 Stunden relativ zur Erde eine Bahngeschwindigkeit 2π(RE + H)/T und damit eine speziell-relativistische Frequenzverlangsamung r ∆ν 4π 2 (RE + H)2 = 1− − 1 = −8.3 · 10−11 . ν SRT c2 T 2 Der gravitative Effekt überwiegt. Man kann sich von der Richtigkeit der gravitativen Frequenzänderung auch wie folgt überzeugen: Ein Teilchen der Masse m werde aus der Höhe ξ 1 fallengelassen. Seine Gesamtenergie bei der Höhe 0 ist E = mc2 + mgξ 1 . Diese wird in 2 1 umgewandelt, das zurück auf die Höhe ein Photon der Frequenz νB = mc +mgξ h 1 ξ gestrahlt wird. Dabei ist h das Plancksche Wirkungsquantum. Nach Energie2 erhaltungssatz darf das Photon in der Höhe ξ 1 nur mit Frequenz νA = mch an1 A = gξc2 . Umgekehrt folgt aus der Gültigkeit der gravitativen kommen, also νBν−ν A Frequenzverschiebung, daß die Energie eines Photons proportional zur Frequenz sein muß. 3.2 Gravitativer Ereignishorizont 2 Signale, die von unterhalb einer kritischen Tiefe ξH = − cg gesandt werden, können den Beobachter im Punkt 0 nicht erreichen. Für die Erde ist die kritische Tiefe |ξE | = 9.2 · 1015 m und hat keinerlei Relevanz. Ganz anders bei Neutronensternen. Bei einer typischen Masse von 1.5 Sonnenmassen (M = 3 · 1030 kg) und typischen Radien von R = 10 km = 104 m resultiert eine Schwerebeschleunigung von g = GRN2M = 2 · 1012 m s−2 an der Sternoberfläche, somit eine kritische Tiefe von |ξN | = 45 km. Diese kommt dem tatsächlichen Radius gefährlich nahe. Bei deutlich größerer Masse, damit verbunden nicht wesentlich anderem Radius (die Dichte wächst) entsteht irgendwann R = ξH , und der Stern verschwindet unter seinem Ereignishorizont: Ein schwarzes Loch wird gebildet. Natürlich ist hier das Gravitationsfeld exakter zu behandeln (es ist ganz sicher nicht homogen) und auch die Materialgleichungen werden wichtig, die die Abhängigkeit der Dichte von der Masse beschreiben. Das Ergebnis bestätigt jedoch die Überschlagsrechnung: Die Grenze liegt bei etwa 2.5 Sonnenmassen. 17 Preliminary version – 4. August 2016 4 Die Geodätengleichung 4.1 Herleitung Wir sind an dieser Stelle nur an der Bahnkurve von Licht im homogenen Gravitationsfeld interessiert. Es bereitet jedoch kaum Mehraufwand, den allgemeinen Fall durchzurechnen. Dadurch ersparen wir uns später doppelte Arbeit. Wir haben gesehen, daß sich Zeitintervalle im Gravitationsfeld gemäß ∆τ = ∆s ändern. Diese Änderung beeinflußt die Laufzeiten von Wegen. Wenn wir gξ1 1+ c2 gemäß dem Prinzip von Fermat postulieren, daß das Licht einen zeitlich extremalen Weg zwischen zwei Punkten nimmt, dann wird dieser Weg im Gravitationsfeld i.a. keine Gerade mehrP sein. Die Eigenzeitdifferenz zwischen End- und µ Anfangspunkt einer Kurve λ 7→ D−1 µ=0 ξ (λ)eµ berechnet sich nach (3.1) zu ∆s = q Rβ PD−1 dξ µ dξ ν dλ µ,ν=0 gµν (ξ) dλ dλ . Diese soll für den tatsächlich gewählten Weg zu festα gehaltenen räumlichen Anfangs- und Endpunkten stationär sein. Das Variationsproblem entspricht deshalb exakt jenem wenn wir als q der klassischen Mechanik, PD−1 gµν (ξ)ξ̇ µξ˙ν Lagrange-Funktion L(ξ(λ), ξ̇(λ)) = E(ξ, ξ̇) mit E(ξ, ξ̇) := µ,ν=0 µ und ξ˙µ := dξ wählen. Die Lösung gewinnt man deshalb aus den D Eulerdλ Lagrange-Gleichungen ˙ ˙ ∂L(ξ, ξ) d ∂L(ξ, ξ) − dλ ∂ ξ˙µ ∂ξ µ D−1 D−1 d 1 X 1 X ∂gνσ (ξ) ˙ν ˙σ ν √ = gµν (ξ)ξ̇ − √ ξ ξ . dλ E ν=0 2 E ν,σ=0 ∂ξ µ 0= (4.1) Die weitere Rechnung wird durch folgende Überlegung entscheidend vereinfacht: Der Kurvenparameter λ war wegen Reparametrisierungsinvarianz beliebig. Wir haben deshalb die Freiheit, ihn für die Lösungskurve so zu wählen, daß E(ξ(λ), ξ̇(λ)) unabhängig von λ ist. Wichtig ist zu betonen, daß für jede benachbarte Kurve Ė = 6 0 sein wird! √ Mit dieser Überlegung vereinfacht sich die Rechnung nach Multiplikation mit E zu 0= D−1 X ν=0 gµν (ξ)ξ¨ν + D−1 X D−1 ∂gµν (ξ) ˙ν ˙σ 1 X ∂gνσ (ξ) ˙ν ˙σ ξ ξ − ξ ξ . σ µ ∂ξ 2 ∂ξ ν,σ=0 ν,σ=0 (4.2) Verwendet wurde, daß λ-Abhängigkeit in der Verkettung ξ(λ), ξ̇(λ) besteht. Der zweite Summand ist symmetrisch in ξ˙ν ξ˙σ , so daß der Vorfaktor durch den in σ, ν symmetrisierten Ausdruck ersetzt werden darf. Da gµν die Matrixelemente einer invertierbaren symmetrischen Matrix sind, gibt es eine Matrix g −1 mit Matrix- 18 Preliminary version – 4. August 2016 elementen (g −1)ρµ bestimmt aus D−1 X −1 ρµ (g ) gµν = δνρ und µ=0 D−1 X gσρ (g −1 )ρµ = δσµ . (4.3) σ=0 Um die Beschleunigung ξ¨ zu isolieren, multiplizieren wir (4.2) mit (g −1)ρµ und summieren über µ: 0 = ξ¨ρ + D−1 X Γρνσ ξ˙ν ξ˙σ , (4.4) ν,σ=0 Γρνσ 1 := 2 D−1 X ∂g (ξ) ∂g (ξ) ∂g (ξ) µν µσ νσ (g ) . + − σ ν ∂ξ ∂ξ ∂ξ µ µ=0 −1 ρµ (4.5) Diese obere Gleichung (4.4) heißt Geodätengleichung, die darin auftretenden Objekte Γρνσ heißen Christoffelsymbole. Sind diese = 0, so verschwindet die Beschleuniugung, und die Lösung ist eine mit konstanter Geschwindigkeit durchlaufene Gerade ξ ρ(λ) = λv ρ + ξ0ρ mit Konstanten v ρ , ξ0ρ. Für Γρνσ 6= 0 werden die Lösungen im gewählten Koordinatensystem keine Geraden mehr sein. Das kann durchaus ein alleiniger Effekt einer ungünstigen Koordinatenwahl sein. Wählen wir im R3 Kugelkoordinaten (r, ϑ, ϕ), so erscheint eine in den Koordinaten (x1 , x2 , x3 ) beschriebene Gerade, die nicht durch 0 verläuft, als beschleunigt/gekrümmt in Kugelkoordinaten. Die Lösung der Geodätengleichung liefert die korrekte Umrechnung einer Geraden in Kugelkoordinaten. Wir werden später sehen, daß die Geodätengleichung eine intrinsische geometrische Eigenschaft (metrischer Paralleltransport) reflektiert. Je nach Wahl des Bezugssystems findet man entsprechende Christoffelsymbole, die dann nach Wahl der Anfangsbedingungen auf die Bahnkurve in den gewählten Koordinaten führen. =0 Bei der Lösung der Geodätengleichung wäre noch die Nebenbedingung dE dλ PD−1 µ ˙ν ˙ zu berücksichtigen, mit E(ξ, ξ̇) = µ,ν=0 gµν (ξ)ξ ξ . Eine einfache Rechnung zeigt jedoch, daß diese Bedingung bei Gültigkeit der Geodätengleichung automatisch erfüllt ist. Die Energiebedingung ist nichts anderes als ein erstes Integral der Bewegung, festgelegt durch die Anfangsdaten. Erst hier tritt ein Unterschied zwischen den Bahnen von Materie auf: Licht wird beschrieben durch PD−1 und von µLicht ν ˙ sogenannte Nullgeodäten µ,ν=0 gµν (ξ)ξ̇ ξ = 0 (auch wenn dafür die Herleitung der Geodätengleichung problematisch wird). Für Materie dürfen wir die Bahnen PD−1 nach der Eigenzeit parametriesieren und µ,ν=0 gµν (ξ)ξ˙µ ξ˙ν = 1 setzen (oder = c2 bei Mitnahme der Lichtgeschwindigkeit). 4.2 Lichtablenkung im homogenen Gravitationsfeld Im homogenen Gravitationsfeld −ge1 mit gµν (ξ) gegeben durch (2.8) erhalten wir offenbar als nichtverschwindende Christoffel-Symbole (bei expliziter Mitnahme 19 Preliminary version – 4. August 2016 der Lichtgeschwindigkeit c): Γ001 ∂g 1 1 ∂g00 g gξ 1 00 Γ100 = (g −1)11 − = + = 1 + , 2 ∂ξ 1 2 ∂ξ 1 c2 c2 1 ∂g00 g 1 −1 00 ∂g00 0 =+ = 2 . = Γ10 = (g ) 1 1 2 ∂ξ 2g00 ∂ξ (c + gξ 1) (4.6) Es entsteht das System 0 = ξ¨0 + 1 ˙0 ˙0 2g ˙0 ξ˙1 , 0 = ξ¨1 + g 1 + gξ ξ ξ , 0 = ξ¨i ξ c2 + gξ 1 c2 c2 für i ≥ 2 . (4.7) Damit verläuft die räumliche Bewegung in einer Ebene, die wir als e1 -e2 -Ebene wählen können. Die 1.+3. Gleichung sind sofort zu integrieren: gξ 1 2 1 + 2 ξ˙0 = u = const , c ξ˙2 = v = const . (4.8) Eingesetzt in die 2. Gleichung ergibt sich nach Multiplikation mit ξ˙1 : 0 = ξ˙1 ξ¨1 + ⇒ (ξ˙1 )2 − (1 u2 (1 + g 2 u c2 1 + gξc2 )3 gξ 1 2 ) c2 = u2 1 d ˙1 2 (ξ ) − 1 2 dλ (1 + gξc2 )2 = K = const . (4.9) 1 Es folgt (1+ gξc2 )2 (ξ˙1 )2 −(ξ˙1 )2 −(ξ˙2 )2 = −K −v 2 und, da es sich um Licht handelt, K = −v 2 . Trennung der Variablen ergibt ±q (1 + u2 − r gξ 1 ) c2 v 2 (1 dξ 1 gξ 1 2 ) c2 = dλ + r 2 1 2 gξ gξA1 2 c c2 B 2 2 2 2 ± 2 u −v 1+ 2 = λB − λA . ⇒ ∓ 2 u −v 1+ 2 gv c gv c (4.10) q gξ 1 c2 ′ Sei nun abkürzend λA := λA ± gv2 u2 − v 2 (1 + c2A )2 . Dann folgt 1+ gξB1 2 u2 (λB − λ′A )2 g 2 v 2 . = 2− c2 v c2 c2 (4.11) Die Lösung sieht zunächst merkwürdig aus, da λB beschränkt ist. Sie liefert jedoch das plausible Ergebnis, daß die Lichtkurve nach endlicher Parameterzeit im 2 1 Ereignishorizont ξH = − cg endet und bis dahin auch nur endlich weit in Richtung e2 kommen kann. Umgekehrt zeigt rückwärtige Verlängerung der Bahnkurve, 20 Preliminary version – 4. August 2016 daß das Licht aus dem Ereignishorizont emittiert wurde. Lokal in der Nähe von 2 |ξ 1 | ≪ cg liefert Reihenentwicklung von (4.10): ξ 1 − ξA1 ± √B = λB − λA . u2 − v 2 (4.12) 2 Somit wird im Fall |ξ 1| ≪ cg sowohl die e1 - als auch die e2 -Richtung mit konstanter Geschwindigkeit durchlaufen, d.h. die Lichtbahn ist (entsprechend der Erfahrung!) eine Gerade in der e1 -e2 -Ebene. Global sieht es auch für Materieteilchen nicht anders aus: Die Bahn endet im Ereignishorizont. Im Unterschied zu Licht kann die Bewegung aber mit ver~˙ A )k ≪ c erfolgen. Dann liefert die nachlässigbarer Anfangsgeschwindigkeit kξ(λ Nebenbedingung (ξ˙0 )2 = c2 , und die Geodätengleichungen (4.7) reduzieren sich auf den Newtonschen Grenzfall ξ¨1 = −g , ξ¨2 = · · · = ξ¨D−1 = 0 . 21 Preliminary version – 4. August 2016 (4.13) Teil II Pseudo-Riemannsche Geometrie Die Überlegungen zum Äquivalenzprinzip zeigen, daß Gravitation durch gewisse Funktionen gµν beschrieben wird. Aus den gµν gewinnen wir die Christoffelsymbole Γρνσ und formulieren damit die Geodätengleichung für die Bahnen von Testteilchen. Verbleibt die Frage: Wie bestimmt man gµν für reale Gravitationsfelder von Sternen, Galaxien und den Kosmos insgesamt? Die Antwort lautet: 8πGN 1 Tµν , Rµν − gµν R = 2 c4 (*) wobei Rµν und R gewisse Funktionen von gµν und deren partiellen Ableitungen sind und Tµν sowohl von der Materieverteilung als auch von gµν selbst abhängt; GN war die Newtonsche Gravitationskonstante. In diesem mathematischen Teil geht es darum zu verstehen, daß die gegebene Antwort (unter sehr natürlichen Annahmen!) die einzig mögliche ist. Ein wesentlicher Aspekt dabei ist das Allgemeine Relativitätsprinzip, welches impliziert, daß die Physik durch geometrische Objekte beschrieben werden muß. Alle Strukturen in (*) sind Abbilder solcher geometrischen Objekte bezüglich eines gewählten Bezugssystems. 5 Mannigfaltigkeiten und Tangentialraum 5.1 Differenzierbare Mannigfaltigkeiten Definition 5.1 Eine D-dimensionale (differenzierbare) Mannigfaltigkeit ist ein gutartiger topologischer Raum M, ausgestattet mit einem Atlas (Uα , ψα )α∈I lokaler Karten, durch die M lokal einem RD homöomorph wird. Für die Karten wird gefordert: i) Die Uα sind offen, und ψα : Uα 7→ ψα (Uα ) ⊆ RD ist ein Homöomorphismus (d.h. ψα ist bijektiv auf das Bild und ψα , ψα−1 sind stetig). ii) Jeder Punkt p ∈ M liegt in mindestens einem und höchstens endlich vielen Uα . iii) Für jedes Paar Uα ∩ Uβ 6= ∅ ist die Abbildung ψβ ◦ ψα−1 : ψα (Uα ∩ Uβ ) → ψβ (Uα ∩ Uβ ) zwischen Teilmengen des RD beliebig oft differenzierbar. Hierzu einige Bemerkungen: • In topologischen Räumen sind gewisse Teilmengen als ‘offen’ ausgezeichnet. Diese offenen Mengen können sehr exotisch sein, was wir mit ‘gutartig’ ausschließen. Wir verzichten hier bewußt auf Details und geben im Vorgriff auf später einzuführende Strukturen die Topologie konkret an. Wir werden später nur Lorentz-Mannigfaltigkeiten mit kausaler Struktur brauchen, die ähnlich wie für den Minkowski-Raum definiert ist. Für jeden Punkt p ∈ M läßt sich dann die Teilmenge Op+ der von p verschiedenen Punkte definieren, 22 Preliminary version – 4. August 2016 die von p aus durch eine rein zeitartige Kurve erreicht werden können, außerdem die Teilmenge Op− der von p verschiedenen Punkte, von denen aus p durch eine rein zeitartige Kurve erreicht werden kann. Alle Op+ und alle Op− nennen wir offen, und damit ist auch Op+ ∩ Op−′ offen für beliebige p, p′ ∈ M. Die nichtleeren Op+ ∩Op−′ sind die Bausteine unserer Topologie; sie sind das Analogon der offenen Kugeln in metrischen Räumen. Eine beliebige Teilmenge U unserer (Lorentz-)Mannigfaltigkeit M heißt offen, wenn es zu jedem q ∈ U Punkte p, p′ ∈ M gibt mit q ∈ Op+ ∩ Op−′ ⊆ U. Die so definierte Topologie ist ‘gutartig’. • Die Karten (Uα , ψα ) entsprechen den Bezugssystemen in der Physik. Durch sie können wir Punkte und Wege auf der Mannigfaltigkeit durch Koordinaten beschreiben. Im allgemeinen wird das nur in einer Umgebung des Ausgangspunktes möglich sein. Schon die Erde läßt sich nicht fehlerfrei durch eine einzige Erdkarte beschreiben! • Man möchte Mannigfaltigkeiten, die sich nur durch Hinzunahme weiterer kompatibler Karten oder Weglassen überflüssiger Karten unterscheiden, als identisch ansehen. Das kann einerseits durch Wahl eines maximalen Atlas geschehen, was in der Praxis aber unzweckmäßig ist. Alternativ müßte man von einer Äquivalenzklasse kompatibler Atlanten sprechen. Wir werden das aber vermeiden und annehmen, daß ein möglichst sinnvoller Atlas fest gewählt ist. • Hier ist eine Skizze des Kartenwechsels: Uα Uα ∩Uβ ψα Uβ M ❄ ψα (Uα ) ψβ ◦ ψα−1 ψβ ❘ ❅ ❅ ψα (Uα ∩ Uβ ) ✠ ψβ (Uβ ) ψβ (Uα ∩ Uβ ) • Über die Karten können wir intrinsische geometrische Objekte auf M durch Koordinaten im RN D beschreiben. Der Kartenwechsel definiert dann eine eindeutige Umrechnungsvorschrift zwischen den RN D -Koordinaten des 23 Preliminary version – 4. August 2016 Objekts bezüglich eines Bezugssystems und den RN D -Koordinaten desselben Objekts bezüglich eines anderen Bezugssystems. Das ist eine extrem ökonomische Sichtweise: Man muß nur den einen Diffeomorphismus ψβ ◦ψα−1 kennen und kann so sämtliche Größen ineinander umrechnen! Auf diese Weise wird das Allgemeine Relativitätsprinzip implementiert: Formuliere die Physik durch geometrische Objekte auf Mannigfaltigkeiten. Welches Bezugssystem (=lokale Karte (Uα , ψα )) man dann wählt, ist völlig egal! Jede Wahl ist gleichberechtigt, und eine Beschreibung läßt sich leicht in eine andere umrechnen. • Mathematisch erlauben die Karten das Differenzieren und Integrieren von geometrischen Objekten auf Mannigfaltigkeiten. Die Idee ist immer, das Bild im RN D unter der Kartenabbildung zu differenzieren und integrieren. Hier ist dann immer zu zeigen, daß das Ergebnis eine geometrische Bedeutung unabhängig von der Kartenwahl behält. Das ist eine nichttriviale Forderung: Es wird sich beispielsweise zeigen, daß die partielle Ableitung eines Vektorfeldes keinen Sinn hat! Man wird so auf die sogenannte ‘kovariante Ableitung’ geführt. 5.2 Tangentialraum Grundlegende geometrische Objekte auf Mannigfaltigkeiten sind Vektoren und Vektorfelder. Die Idee ist, von Scharen von Kurven τ 7→ γ(τ ) ∈ M auf der Mannigfaltigkeit auszugehen und diese als Feldlinien eines Vektorfeldes anzusehen, das in jedem Punkt tangential an die Kurve ist. Für die Erde und allgemein für D-dimensionale Untermannigfaltigkeiten im RN gewinnt man so eine geometrische Vorstellung von der Tangentialebene bzw. vom Tangentialraum als D-dimensionalen Untervektorraum des RN . Diese Konstruktion steht uns aber nicht zur Verfügung! Die Lösung ist, wie oben skizziert, durch die Kartenabbildung gegeben: Die Kurve γ(τ ) hat ein Bild τ 7→ ψα (γ(τ )) ∈ RD , und die Tangentialvektoren dieses Bildes definieren ein Vektorfeld auf M. Wir kommen später auf diese Konstruktion zurück. Es zeigt sich nämlich, daß es eine sinnvollere Konstruktion gibt; die Äquivalenz zur vorigen wird bewiesen. Ausgangpunkt sind Funktionen auf M, d.h. Abbildungen f : U → R für U ⊂ M offen. Stetigkeit ist sofort einzuführen über die Topologien auf M und R. Differenzierbarkeit ist wieder über die Kartenabbildungen definiert: Die Zusammensetzung f ◦ ψα−1 : ψα (Uα ) → R soll als Abbildung einer Teilmenge des RD nach R beliebig oft differenzierbar sein. Wir bezeichen mit C ∞ (U) den Vektorraum der differenzierbaren Funktionen auf U ⊂ M. Wie üblich sind die Vektorraumoperationen punktweise erklärt, also (λ1 f1 + λ2 f2 )(p) := λ1 f1 (p) + λ2 f2 (p). Definition 5.2 Ein Tangentialvektor vp im Punkt p ∈ M ist eine lineare Abbildung 24 Preliminary version – 4. August 2016 vp : C ∞ (U) → R, die die Leibniz-Regel erfüllt: vp (f1 f2 ) = vp (f1 )f2 (p) + f1 (p)vp (f2 ) . (5.1) Der Vektorraum Tp M aller Tangentialvektoren in p heißt Tangentialraum (von M in p). Die Vektorraum-Operationen sind einfach (λvp + µwp )(f ) = λvp (f ) + µwp(f ). Da C ∞ (U) ein unendlich-dimensionaler Vektorraum ist, würde man vermuten, daß Tp M ebenfalls unendlich-dimensional ist (und dann nichts mit der Vorstellung eines Tangentialraums zu tun hat). Die Leibniz-Regel ändert das aber gravierend: Satz 5.3 Ist M eine D-dimensionale Mannigfaltigkeit, so gilt dim(Tp M) = D. Beweis. Durch Konstruktion einer Basis. Sei (U, ψ) eine beliebige Karte um p ∈ U und f ∈ C ∞ (U). Dann ist f ◦ ψ −1 ∈ C ∞ (ψ(U)) eine partiell differenzierbare Funktion auf RD , und wir setzen Xµ (f ) := (∂µ (f ◦ ψ −1 ))(ψ(p)) , µ = 0, . . . , D − 1 . (5.2) Offenbar gilt Xµ : C ∞ (M) → R, und diese Abbildung ist linear. Wählen wir f so, daß f ◦ ψ −1 die Koordinatenfunktionen selbst sind, so folgt die lineare Unabhängigkeit der Xµ . Schließlich ist die Leibniz-Regel erfüllt: 1 ((f1 · f2 ) ◦ ψ −1 )(ψ(p) + teµ ) − ((f1 · f2 ) ◦ ψ −1 )(ψ(p)) t→0 t 1 = lim f1 (ψ −1 (ψ(p) + teµ )) · f2 (ψ −1 (ψ(p) + teµ )) − f1 (p) · f2 (p) t→0 t 1 −1 −1 = lim (f1 ◦ ψ )(ψ(p) + teµ )) − (f1 ◦ ψ )(ψ(p)) · f2 (ψ −1 (ψ(p) + teµ )) t→0 t 1 −1 −1 + lim f1 (p) · (f2 ◦ ψ )(ψ(p) + teµ ) − (f2 ◦ ψ )(ψ(p)) t→0 t = Xµ (f1 ) · f2 (p) + f1 (p) · Xµ (f2 ) . Xµ (f1 f2 ) = lim Somit ist Xµ ∈ Tp M bewiesen. Verbleibt zu zeigen, daß {X0 , . . . XD−1 } ein Erzeugendensystem von Tp M ist. Zwei Punkte a, x ∈ RD haben bezüglich der kanonischen Basis (eµ )µ=0,...,D−1 die PD−1 µ P D µ Darstellung x = D−1 µ=0 a eµ . Für Funktionen F : R → R µ=0 x eµ und a = gilt nach Hauptsatz der Differential- und Integralrechnung und Kettenregel F (x) −F (a) = Z 1 0 Z 1 D−1 X d µ µ dt F (a+ t(x−a)) = (x −a ) dt (∂µ F )(a+ t(x−a)) . dt 0 µ=0 R1 Setze nun Hµ (x) := 0 dt (∂µ F )(a + t(x − a)) und werte die Formel aus für F = f ◦ ψ −1 , a = ψ(p) und x = ψ(q). Eine beliebige differenzierbare Funktion f 25 Preliminary version – 4. August 2016 auf U läßt sich somit entwickeln als f (q) = f (p) + D−1 X µ=0 ((xµ ◦ ψ)(q) − aµ ) · (Hµ ◦ ψ)(q) . (5.3) Dabei sind f (p) und aµ Konstanten, und xµ ◦ψ ist eine Funktion, die jedem Punkt q ∈ U die µ-te Koordinate (eine reelle Zahl) von ψ(q) ∈ RD zuordnet. Wir wenden ein beliebiges v ∈ Tp M an. Wegen vp (1) = vp (12 ) = 2vp (1) = 0 und Linearität annihiliert vp jede konstante Funktion, wie z.B. f (p) und aµ . Zusammen mit der Leibniz-Regel folgt vp (f ) = D−1 X µ=0 = D−1 X µ=0 µ vp (x ◦ ψ) · (Hµ ◦ ψ)(p) + D−1 X µ=0 ((xµ ◦ ψ)(p) − aµ ) · vp (Hµ ◦ ψ) vp (xµ ◦ ψ) · Hµ (a) wegen (xµ ◦ ψ)(p) = xµ (a) = aµ . Nun war aber Hµ (a) = (∂µ F )(a) = (∂µ (f ◦ ψ))(ψ(p)) = Xµ (f ), d.h. es ist gezeigt: vp (f ) = D−1 X µ=0 vpµ Xµ (f ) mit vpµ := vp (xµ ◦ ψ) . Somit ist {X0 , . . . , XD−1 } eine Basis von Tp M. Eine andere Karte (U ′ , ψ ′ ), d.h. Wahl eines anderen Bezugssystems, wird auf eine andere Basis {Xµ′ }µ=0,...,D−1 von Tp M führen, mit Xν′ (f ) := ∂x∂′ ν (f ◦ (ψ ′ )−1 ))(ψ ′ (p)). Seien D = ( ∂x∂ µ )µ=0,...,D−1 bzw D′ = ( ∂x∂′ ν )µ=0,...,D−1 die totalen Differentiale in x = ψ(p) bzw. x′ = ψ ′ (p). Dann gilt nach Kettenregel D′ f ◦ (ψ ′ )−1 (x′ ) = D′ f ◦ ψ −1 ◦ {ψ ◦ (ψ ′ )−1 } (x′ ) = D(f ◦ ψ −1 )(x) · D′ (ψ ◦ (ψ ′ )−1 )(x′ ) . Nun ist (ψ ◦ (ψ ′ )−1 )(x′ ) = x(x′ ) = (xµ (x′ ))µ=0,...D−1 , so daß folgendes Transformationsgesetz bewiesen ist: Xν′ (f ) = D−1 X µ=0 ∂xµ Xµ (f ) . ∂x′ ν (5.4) Da ein Tangentialvektor vp ∈ Tp M unabhängig von der Kartenwahl definiert ist, muß für die Komponenten bezüglich verschiedener Karten gelten: vp = D−1 X µ=0 vpµ Xµ = D−1 X ν v ′ p Xν′ ν=0 ⇒ ν v′p = D−1 X 26 Preliminary version – 4. August 2016 µ=0 ∂x′ ν µ v . ∂xµ p (5.5) ′ν die Matrixelemente der zu (D′ (ψ ◦ (ψ ′ )−1 ))(x′ ) inversen JacobiDabei sind ∂x ∂xµ ′ Matrix (D(ψ ◦ (ψ)−1 ))(x). Gleichung (5.5) führt auf eine gelegentlich anzutreffende (aber wenig sinnvolle) Charakterisierung von Vektoren: Ein D-Tupel (vpµ ) reeller Zahlen bildet einen P Vektor im Punkt x, falls es sich unter Koordinaten∂x′ ν µ wechsel x′ (x) gemäß v ′ νp = D−1 µ=0 ∂xµ vp transformiert. Wichtige Beispiele für Vektoren aus Tp M sind Tangentialvektoren an Kurven durch p: Sei τ 7→ γ(τ )Peine differenzierbare Kurve mit γ(τ0 ) = p, dann ist D−1 µ D τ 7→ ψ(γ(τ )) =: x(τ ) = deren Kartendarstellung. Nach µ=0 x (τ )eµ ∈ R Kettenregel gilt: d d −1 γ̇p (f ) := (f ◦ γ) (τ0 ) = D(f ◦ ψ )(ψ(γ(τ0 ))) · (ψ ◦ γ) (τ0 ) dτ dτ D−1 X = Xµ (f )ẋµ (τ ) . (5.6) µ=0 Somit sind ẋµ (τ ) einerseits die Komponenten von γ̇p (τ ) ∈ Tp M bezüglich der Basis {Xµ } und andererseits die Komponenten von ẋ(τ ) ∈ RD bezüglich der Standardbasis {eµ }. Man sagt, daß die Kartenabbildung ψ : U → RD einen Isomorphismus ψp ∗ : Tp M → RD induziert; für diesen gilt ψp ∗ (Xµ ) = eµ . 5.3 Vektorfelder Ein Vektorfeld auf M ist eine Familie3 {p, vp }, die jedem Punkt p ∈ M einen Tangentialvektor vp ∈ Tp M zuordnet. Diese Zuordnung soll zumindest stetig, besser differenzierbar, sein. Das ist in lokalen Karten aber schwierig auszudrücken: Schon für Untermannigfaltigkeiten im RN ist ersichtlich, daß alle Tp M verschiedene Vektorräume sind! Es gibt keine natürliche Möglichkeit, ein vp ∈ Tp M mit einem wq ∈ Tq M in einem zu p benachbarten Punkt q zu vergleichen4 . Die Lösung des Problems besteht in der Beobachtung, daß für f ∈ C ∞ (U) sowohl vp (f ) als auch vq (f ) reelle Zahlen sind, d.h. U ∋ p 7→ vp (f ) ∈ R ist eine Funktion: Definition 5.4 Ein differenzierbares Vektorfeld auf M ist eine lineare Abbildung v : C ∞ (M) → C ∞ (M), die punktweise mit einem Tangentialvektor übereinstimmt: (vf )(p) = vp (f ) für ein vp ∈ Tp M. Der Vektorraum aller Vektorfelder auf M werde mit X(M) bezeichnet. Hierzu einige Bemerkungen: 3 Diese Beschreibung läßt sich präzisieren im Rahmen von Faserbündeln. Faserbündel werden auch für die geometrische Beschreibung von Eichtheorien gebraucht. Da Faserbündel für reine Gravitation, eventuell plus Elektromagnetismus, keine Vorteile bieten, verzichten wir darauf. 4 Wir werden später genau diesen Vergleich benötigen, müssen dazu aber eine Zusatzstruktur einführen, den Paralleltransport. 27 Preliminary version – 4. August 2016 • Es ist nun üblich, die durch (5.2) definierte Basisvektoren von Tp M mit (∂µ )p selbst zu bezeichnen und durch (∂µ f )(p) := (∂µ (f ◦ ψ −1 ))(ψ(p)) (5.7) eine Familie von D lokalen Vektorfeldern ∂0 , . . . , ∂D−1 ∈ X(U) zu definieren. Hier ist jedoch wichtig zu betonen, daß diese Felder ∂µ immer bezüglich einer fest gewählten Karte (U, ψ) zu verstehen sind, auch wenn das in der Bezeichnung nicht ersichtlich ist! • Für v ∈ X(M) und f ∈ C ∞ (M) wird durch (f v)(f ′) := f · v(f ′ ) ein Vektorfeld f v ∈ X(M) erklärt. • Vektorfelder erfüllen die Leibniz-Regel v(f1 · f2 ) = f2 · v(f1 ) + f1 · v(f2 ) . (5.8) • Sind v, w ∈ X(M), so ist auch der durch [v, w](f ) := v(w(f )) − w(v(f )) (5.9) erklärte Kommutator wieder ein Vektorfeld: [v, w] : C ∞ (M) 7→ C ∞ (M) ist klar, und es gilt die Leibniz-Regel: [v, w](f1 · f2 ) = v(w(f1 · f2 )) − w(v(f1 · f2 )) = v f2 · w(f1 ) + f1 · w(f2 ) − w f2 · v(f1 ) + f1 · v(f2 ) = v(f2 ) · w(f1 ) + f2 · v(w(f1)) + v(f1 ) · w(f2 ) + f1 · v(w(f2)) − w(f2 ) · v(f1 ) − f2 · w(v(f1)) − w(f1 ) · v(f2 ) − f1 · w(v(f2)) = f2 · [v, w](f1) + f1 · [v, w](f2) . Damit stimmt [v, w] punktweise mit einem Tangentialvektor überein. Auf diese Weise wird X(M) zu einer Lie-Algebra, insbesondere gilt die Jacobi-Identität [u, [w, v]] + [w, [v, u]] + [v, [u, w]] = 0 . 6 6.1 (5.10) Tensorfelder Tensoren und Summenkonvention Für einen endlich-dimensionalen Vektorraum V bezeichne V ∗ seinen Dualraum, d.h. den Vektorraum der linearen Abbildungen ω : V → R. Jede Basis (e0 , . . . , eD−1 ) von V definiert eine (genauer: die duale) Basis (e∗0 , . . . , e∗D−1 ) von V ∗ durch e∗ µ (eν ) := δνµ . Zwar liefert jede Basiswahl einen Isomorphismus zwischen V ∗ und V , jedoch kommt diesem keine intrinsische Bedeutung zu. Dagegen läßt sich (im endlich-dimensionalen) das Bidual V ∗∗ := (V ∗ )∗ wegen v(ω) := ω(v) auf kanonische Weise mit V identifizieren. 28 Preliminary version – 4. August 2016 Definition 6.1 Sei V ein endlich-dimensionaler Verktorraum und V ∗ sein Dualraum. Ein Tensor vom Typ (k, l) über V ist eine multi-lineare Abbildung ∗ T :V · · × V }∗ × V · · × V} → R . | × ·{z | × ·{z k mal (6.1) l mal Die Menge aller Tensoren vom Typ (k, l) werde mit T (k,l) bezeichnet. Durch (λ1 T1 + λ2 T2 )(ω1 , . . . , ωk , v1 , . . . , vl ) = λ1 · T1 (ω1 , . . . , ωk , v1 , . . . , vl ) + λ2 · T2 (ω1 , . . . , ωk , v1 , . . . , vl ) wird T (k,l) zu einem Vektorraum, und durch {eµ1 ⊗ · · · ⊗ eµk ⊗ e∗ ν1 ⊗ · · · ⊗ e∗ µl }D−1 µi ,νj =0 , ∗ ν1 (eµ1 ⊗ · · · ⊗ eµk ⊗ e ∗ µl ⊗···⊗e (6.2) )(ω1 , . . . , ωk , v1 , . . . , vl ) := k Y ωi (eµi ) i=1 l Y e∗ νj (vj ) j=1 wird eine Basis erklärt. Um ein wenig Schreibarbeit zu ersparen, werde von nun an vereinbart: 6.2 Einsteinsche Summenkonvention: Über ein Paar identischer oberer und unterer Indizes werde automatisch von 0 bis − 1 summert, ohne daß das SummenPD D−1 µ µ zeichen explizit geschrieben wird: v eµ ≡ µ=0 v eµ usw. Ein Tensor T ∈ T (k,l) besitzt somit eine Darstellung ...µk T = Tνµ11...ν eµ1 ⊗ · · · ⊗ eµk ⊗ e∗ν1 ⊗ · · · ⊗ e∗µl . l Folgende Operationen mit Tensoren werden wichtig: ′ ′ • Tensorprodukt. Sind T ∈ T (k,l) und T̃ ∈ T (k ,l ) , so wird durch (T ⊗ T̃ )(ω1 , . . . , ωk+k′ , v1 , . . . , vl+l′ ) := T (ω1 , . . . , ωk , v1 , . . . , vl )T̃ (ωk+1 , . . . , ωk+k′ , vl+1 , . . . , vl+l′ ) ′ ′ ein Tensor T ⊗ T̃ ∈ T (k+k ,l+l ) erklärt. Dieses Tensorprodukt ist assoziativ, aber nicht kommutativ. In einer Basis reduziert es sich auf das Produkt der Komponenten: µ1 ...µ µ ...µ k+1 k+k ...µk k+k (T ⊗ T̃ )ν1 ...νl+l = Tνµ11...ν T̃νl+1 . ...νl+l′ ′ l ′ 29 Preliminary version – 4. August 2016 ′ • Kontraktion. Ist T ∈ T (k,l) mit k, l ≥ 1, so wird für beliebiges 1 ≤ i ≤ k und 1 ≤ j ≤ l durch (C (i,j) T )(ω1, . . . , ωk−1 , v1 , . . . , vl−1 ) := T (ω1 , . . . , ωi−1 , e∗ σ , ωi+1 , . . . , ωk−1 , v1 , . . . , vj−1, eσ , vj+1 , . . . , vl−1 ) ein Tensor C (i,j) T ∈ T (k−1,l−1) erklärt. Summation über σ ist automatisch. Eine einfache Rechnung zeigt, daß die Definition unabhängig von dem Paar e, e∗ dualer Basen ist. In Komponenten gilt ...µk−1 ...µi−1 σµi+1 ...µk−1 (C (i,j) T )νµ11...ν = Tνµ11...ν . j−1 σνj+1 ...νl−1 l−1 Man kann aus der Indexstruktur der Komponenten den Typ des Tensors ablesen; dabei darf man aber nur die freien (nicht summierten) Indizes zählen. Solche Kontraktionen können mehrfach angewandt werden. Häufig benötigt wird das Tensorprodukt gefolgt von einer oder mehreren Kontraktionen. 6.2 Kovektorfelder Die vorherigen Konstruktionen können sofort auf V = Tp M angewandt werden: Definition 6.3 Der Dualraum Tp∗ M des Tangentialraums Tp M heißt Kotangentialraum im Punkt p ∈ M. Ein Kovektorfeld auf M ist eine C ∞ (M)-lineare Abbildung ω : X(M) → C ∞ (M), die punktweise mit einem Kotangentialvektor ωp ∈ Tp∗ M übereinstimmt: (ω(v))(p) = ωp (vp ) mit ωp ∈ Tp∗ M , vp ∈ Tp M , ω(f1 v1 + f2 v2 ) = f1 ω(v1 ) + f2 ω(v2 ) ∈ C ∞ (M) für v1 , v2 ∈ X(M) , f1 , f2 ∈ C ∞ (M) . Der Vektorraum der Kovektorfelder auf M werde mit X∗ (M) bezeichnet. Auch hier ist mit ω ∈ X∗ (M) und f ∈ C ∞ (M) wieder f ω ∈ X∗ (M). Man sagt, beide Vektorräume X(M) und X∗ (M) sind C ∞ (M)-Moduln. Eine wichtige Beispielklasse für Kovektorfelder sind die äußeren Differentiale von Funtionen: Für f ∈ C ∞ (M) werde ein Kovektorfeld df ∈ X∗ (M) definiert durch (df )(v) := v(f ) . (6.3) Besonders wichtig werden die Differentiale der im Beweis von Satz 5.3 eingeführten Koordinatenfunktionen xµ ◦ ψ, die im Punkt q die µ-te Koordinate von y = ψ(q) = y µeµ liefern: (xµ ◦ ψ)(q) = y µ . Aus (5.7) folgt punktweise (5.7) (d(xµ ◦ ψ))(∂ν ) (p) = ∂µ (xµ ◦ ψ) (p) = ∂ν ((xµ ◦ ψ) ◦ ψ −1 ) (ψ(p)) = δνµ . (6.4) 30 Preliminary version – 4. August 2016 Somit bilden die Koordinatendifferentiale {(d(xµ ◦ ψ))p }µ=0,...,D−1 genau die zu {(∂ν )p }ν=0,...,D−1 duale Basis von Tp∗ M. Ähnlich wie bei ∂µ ist es nun üblich, die Kartenabbildungen ψ einfach wegzulassen und nur dxµ ≡ d(xµ ◦ ψ) zu schreiben. Wir haben also dxµ ∈ X(U) mit (dxµ (∂ν ))(p) = (dxµ )p ((∂ν )p ) = δνµ für alle p ∈ U . 6.3 (6.5) Tensoren und Tensorfelder auf Mannigfaltigkeiten Ein Tensor von Typ (k, l) im Punkt p ist eine multilineare Abbildung Tp : (Tp∗ M)k × (Tp M)l → R. Sind seine Komponenten bezüglich der durch (U, ψ) ...µk definierten Kartenbasis {(∂µ )p } und {(dxµ )p } gegeben durch (Tνµ11...ν )p , so bel ′ ′ rechnen sie sich bezüglich einer anderen durch (U , ψ ) definierten Basis {(∂µ′ )p } und {(dx′ µ )p } gemäß µ′ ...µ′ (Tν ′1...ν ′ k )p = 1 l ∂x′ µk ∂xν1 ∂xνl µ1 ...µk ∂x′ µ1 · · · · · · (T )p . ∂xµ1 ∂xµk ∂x′ ν1 ∂x′ νl ν1 ...νl (6.6) Dabei kommen die Matrixelemente der Jacobi-Matrizen (D′(ψ ◦ (ψ ′ )−1 ))(ψ ′ (p)) = µ ν ′ ∂x und (D(ψ ′ ◦ ψ −1 ))(ψ(p)) = ∂x ins Spiel. Man ∂x′ ν ν,ν ′ =0,...,D−1 ∂xµ µ,µ′ =0,...,D−1 vergleiche (6.6) mit (5.5). Ausgehend von den Vektorräumen X(M) und X∗ (M) der Vektor- und Kovektorfelder auf M können wir definieren: Definition 6.4 Ein Tensorfeld vom Typ (k, l) auf M (bzw. ein k-fach kontravariantes und l-fach kovariantes Tensorfeld auf M) ist eine C ∞ (M)-multilineare Abbildung T : X∗ (M) × · · · × X∗ (M) × X(M) × · · · × X(M) → C ∞ (M) . {z } | {z } | k mal (6.7) l mal Der Vektorrraum der Tensorfelder vom Typ (k, l) auf M werde mit T (k,l) (M) bezeichnet. Einige Bemerkungen: • Punktweise reduzieren sich Tensorfelder auf Tensoren. Damit liefert eine Karte (U, ψ) eine Darstellung ...µk ∂µ1 ⊗· · ·⊗∂µk ⊗dxν1 ⊗· · ·⊗dxνl , T (k,l) (M) ∋ T = Tνµ11...ν l ...µk Tνµ11...ν ∈ C ∞ (U) . l • Tensorprodukt und Kontraktion übertragen sich auf Tensorfelder. Dabei kann die Kontraktion lokal über die Kartenbasen formuliert werden. Ist T ∈ T (k,l) (M), so gilt (C (i,j)T )(ω1 , . . . , ωk−1, v1 , . . . , vl−1 ) := T (ω1 , . . . , ωi−1 , dxσ , ωi+1 , . . . , ωk−1, v1 , . . . , vj−1 , ∂σ , vj+1, . . . , vl−1 ) , für ω? ∈ X∗ (M) und v? ∈ X(M). 31 Preliminary version – 4. August 2016 • Die C ∞ (M)-Multilinearität T (. . . , f1 ω1 + f2 ω2 , . . . ) = f1 T (. . . , ω1 , . . . ) + f2 T (. . . , ω2 , . . . ) , T (. . . , f1 v1 + f2 v2 , . . . ) = f1 T (. . . , v1 , . . . ) + f2 T (. . . , v2 , . . . ) , für f1 , f2 ∈ C ∞ (M), ω1 , ω2 ∈ X∗ (M) und v1 , v2 ∈ X(M) ist unser wichtigstes Kriterium, um Tensorfelder als solche zu erkennen. 7 Das metrische Tensorfeld Definition 7.1 Eine pseudo-Riemannsche Mannigfaltigkeit ist eine differenzierbare Mannigfaltigkeit M zusammen mit einem symmetrischen, punktweise nichtentarteten, zweifach-kovarianten Tensorfeld g ∈ T (0,2) (M), d.h. i) g(v, w) = g(w, v) für alle v, w ∈ X(M), ii) gp (vp , wp ) = 0 für alle vp ∈ Tp M genau dann, wenn wp = 0. Dieses Tensorfeld g heißt metrisches Tensorfeld. Ist g positiv definit5 , so nennen wir (M, g) eine Riemannsche Mannigfaltigkeit. Nach dem Sylvesterschen Trägheitssatz gibt es eine Basis ((v0 )p , . . . , (vD−1 )p ) von Tp M mit gp ((vµ )p , (vν )p ) = ±δµν , wobei die Zahlen r der +-Vorzeichen und s der −-Vorzeichen unabhängig von der Basis sind. Die entsprechende Invariante (r, s) heißt Signatur von gp . Nach einer Variante von Gram-Schmidt6 kann man lokale Vektorfelder auf U derart konstruieren, daß die Auswertung in jedem Punkt orthonormal (bis auf Vorzeichen) bezüglich g ist. Damit ist die Signatur von g lokal konstant, somit konstant auf jeder Zusammenhangskomponente von M. Wir treffen einige Annahmen über die Topologie von M: • M erlaube ein metrisches Tensorfeld der Signatur (1, D − 1). • M ist orientierbar und orientiert, d.h. für jedes Paar (U, ψ) und (U ′ , ψ ′ ) von Karten mit U ∩U ′ 6= ∅ gilt det(D(ψ ′ ◦ ψ −1 )(x′ )) > 0 für alle x′ ∈ ψ ′ (U ∩U ′ ). • M ist zeitorientierbar und zeitorientiert, d.h. es gibt ein stetiges Vektorfeld t ∈ X(M) mit (g(t, t))(p) = +1 für alle p ∈ M, und ein solches Feld sei fest gewählt. Definition 7.2 Eine zusammenhängende, orientierte und zeitorientierte Mannigfaltigkeit M mit metrischem Tensorfeld g ∈ T (0,2) (M) der Signatur (1, D − 1) heißt Lorentz-Mannigfaltigkeit. 5 d.h. für alle p ∈ M gilt gp (vp , vp ) ≥ 0 für alle vp ∈ Tp M mit gp (vp , vp ) = 0 genau für vp = 0 Wähle Vektorfelder vµ , die in p orthonormal sind mit vorgegebenen (vµ )p . Wegen Stetigg(v0 ,v1 ) keit ist g(v0 , v0 ) 6= 0 in einer Umgebung von p. Setze dort ṽ1 := v1 − g(v v0 . Dann ist 0 ,v0 ) g(ṽ1 , ṽ1 ) zumindest in p verschieden von 0, wegen Stetigkeit in einer Umgebung von p, während g(v0 , ṽ1 ) ≡ 0 ist. Weiter wie Gram-Schmidt. 6 32 Preliminary version – 4. August 2016 Einige Bemerkungen: • Völlig identisch wie für den Minkowski-Raum ist auf jeder LorentzMannigfaltigkeit eine kausale Struktur erklärt, ausgehend von zukunftsgerichteten kausalen Kurven τ 7→ γ(τ ) ∈ M mit g(γ̇, γ̇) ≥ 0 und g(t, γ̇) > 0. Die kausale Struktur induziert eine Topologie auf M, die von nun an gewählt sei. • Das Einsteinsche Äquivalenzprinzip führt letztlich auf die Schlußfolgerung, daß Gravitation allein durch das metrische Tensorfeld einer LorentzMannigfaltigkeit (M, g) beschrieben wird. Die Begründung können wir erst später geben. • Lokal ist g ∈ T (0,2) (M) durch seine Auswertung auf der Kartenbasis {∂µ } bestimmt: g(∂µ , ∂µ ) =: gµν ⇔ g = gµν dxµ ⊗ dxν mit gµν ∈ C ∞ (U) . (7.1) • In jedem Punkt p ∈ M vermittelt gp einen Isomorphismus zwischen Tp M und Tp∗ M: Tp M ∋ vp 7→ gp (vp , . ) ∈ Tp∗ M . (7.2) Genau das Nullelement von Tp∗ M schickt jedes w ∈ Tp M auf 0 ∈ R; wegen der Nichtausgeartetheit ist das der Fall nur für v = 0. Somit ist die Abbildung injektiv und aus Dimensionsgründen surjektiv. In der nichtgravitativen Physik darf man diesen Isomorphismus nutzen, um Kotangentialvektoren komplett zu vermeiden. Da wir hier an Gleichungen für das metrische Tensorfeld selbst interessiert sind, müssen wir in der Allgemeinen Relativitätstheorie sorgfältig zwischen X(M) und X∗ (M) unterscheiden! 8 Zusammenhänge und Paralleltransport 8.1 Affiner Zusammenhang Definition 8.1 Ein affiner Zusammenhang auf M ist eine Zuordnung eines Vektorfeldes ∇v w ∈ X(M) zu jedem Paar v, w ∈ X(M) derart, daß ∇(u+v) w = ∇u w + ∇v w , ∇v (u + w) = ∇v u + ∇v w , ∇(f v) w = f ∇v w , ∇v (f w) = f ∇v w + v(f ) · w (8.1) für f ∈ C ∞ (M) und u, v, w ∈ X(M). • Wählen wir als Vektorfelder die Kartenbasen ∂µ , so folgt ∇∂µ ∂ν =: Γρµν ∂ρ , Γρµν ∈ C ∞ (U) . 33 Preliminary version – 4. August 2016 (8.2) Die hier auftretenden Funktionen Γρµν heißen Zusammenhangskoeffizienten. Sie bilden jedoch nicht die Komponenten eines Tensors vom Typ (1, 2), da der Zusammenhang wegen der letzten Gleichung in (8.1) nicht C ∞ (M)-linear ist. Ist allgemeiner v = v µ ∂µ und w = w µ ∂µ für Funktionen v µ , w ν ∈ C ∞ (U), so folgt aus (8.1) ∇v w = v µ ∂µ (w ρ ) + Γρµν v µ w ν ∂ρ . (8.3) • Auch wenn wir hier dasselbe Symbol Γρµν wie für die Christoffelsymbole (4.4) verwenden, ist vorerst streng zwischen beiden zu unterscheiden! Zusammenhänge ∇ sind durch Definition 8.1 auch für Mannigfaltigkeiten ohne metrisches Tensorfeld erklärt, und selbst wenn ein solches existiert, muß es nichts mit ∇ und Γρµν zu tun haben! 8.2 Paralleltransport Zusammenhänge definieren einen Paralleltransport von Vektorfeldern längs Kurven: Definition 8.2 Sei τ 7→ γ(τ ) eine Kurve auf M. Ein Vektorfeld v ∈ X(M) heißt autoparallel längs γ, falls ∇γ̇ v = 0 auf γ (punktweise (∇γ̇ v)γ(τ ) = 0 ∈ Tγ(τ ) M). Ist w = w µ ∂µ und γ̇ = ẋν ∂ν mit w µ , ẋν ∈ C ∞ (U), so folgt aus (8.3) die folgende Differentialgleichung zur Bestimmung eines autoparallelen Vektorfeldes: 0 = ẋµ ∂µ (w ρ) + Γρµν w ν ∂ρ = ẇ ρ + Γρµν ẋµ w ν ∂ρ , (8.4) wobei ẇ ρ ∈ C ∞ (U) auf γ(τ ) erklärt ist durch ẇ ρ (γ(τ0 )) := ( dτd (w ρ ◦ γ))(τ0 ) = ∂µ (w ρ )ẋµ . Die Gleichung (8.4) ist ein System gewöhnlicher Differentialgleichungen zur Bestimmung der Funktionen τ 7→ w ρ ◦ γ(τ ) über einem Intervall. Nach Existenz- und Eindeutigkeitssatz (Picard-Lindelöf) gibt es zu vorgegebenem Anfangswert (w ρ ◦ γ)(τ0 ) eine eindeutige Lösung ]−ǫ, ǫ[ ∋ τ 7→ (w ρ ◦ γ)(τ ). Auf diese Weise definieren Zusammenhang und Kurve einen eindeutig bestimmten Isomorphismus γ Pτ,τ : Tγ(τ0 ) M ∋ (w ρ ◦ γ)(τ0 )(∂ρ )γ(τ0 ) 7→ (w ρ ◦ γ)(τ )(∂ρ )γ(τ ) ∈ Tγ(τ ) M 0 (8.5) γ zwischen Tangentialräumen entlang der Kurve. Dieser Isomorphismus Pτ,τ heißt 0 Paralleltransport. Wieder nach Eindeutigkeitssatz gilt die Gruppeneigenschaft γ γ Pτ,τ ◦ Pτγ1 ,τ0 = Pτ,τ . 1 0 Wir können nun den Paralleltransport auf Kovektoren und dann beliebige Tensoren ausdehnen durch die Forderung, daß sämtliche Dualitäten bei Paralleltransport erhalten bleiben. Ist vp ∈ Tp M und ωp ∈ Tp∗ M mit p = γ(τ0 ), so besagt diese Forderung γ γ (Pτ,τ ω ) Pτ,τ v := ωp (vp ) . (8.6) 0 p 0 p 34 Preliminary version – 4. August 2016 Dadurch können wir im nächsten Schritt für vip ∈ Tp M und ωjp ∈ Tp∗ M den γ Paralleltransport (Pτ,τ T ) in den Punkt γ(τ ) eines im Punkt p = γ(τ0 ) gegebenen 0 p Tensors Tp vom Typ (k, l) formulieren: γ γ γ γ γ (Pτ,τ T ) (Pτ,τ ω ), . . . , (Pτ,τ ω ), (Pτ,τ v ), . . . , (Pτ,τ v ) 0 p 0 1p 0 kp 0 1p 0 lp := Tp (ω1p , . . . , ωkp, v1p , . . . , vlp ) . 8.3 (8.7) Kovariante Ableitung nach Vektorfeldern Umgekehrt definiert ein solcher Paralleltransport eine kovariante Ableitung nach einem Vektorfeld. Zunächst folgende Beobachtung aus Picard-Lindelöf: Lemma 8.3 Sei v ∈ X(U) ein Vektorfeld auf einer Umgebung U von p. Dann gibt es genau eine Lösung ]−ǫ, ǫ[ ∋ τ 7→ γv (τ ) ∈ U des Anfangswertproblems7 (γ̇v )γv (τ ) = vγv (τ ) , γv (0) = p . (8.8) Die maximale Erweiterung dieser Lösung heißt Integralkurve von v durch p. γv Wir bezeichnen den zugehörigen Paralleltransport kurz mit Pτv := Pτ,0 . Nun ist folgender Grenzwert korrekt im selben Raum erklärt: γv Definition 8.4 Sei v ∈ X(M) ein Vektorfeld und Pτv ≡ Pτ,0 der zugehörige Paralleltransport längs der Integralkurve γv von v durch p = γv (0), definiert ausgehend von Pτv : Tp M → Tγv (τ ) M mittels (8.6) und (8.7). Dann heißt 1 v −1 (Pτ ) Tγv (τ ) − Tγv (0) (8.9) (∇v T )p := lim τ →0 τ die kovariante Ableitung, im Punkt p, des Tensorfeldes T ∈ T (k,l) (M) nach dem Vektorfeld v. Für Funktionen f ∈ C ∞ (M), also Tensoren vom Typ (0, 0), setzt man 1 f (γv (τ )) − f (γv (0)) ≡ ((df )(γ̇v ))(p) = (v(f ))(p) . (8.10) (∇v f )(p) := lim τ →0 τ Die zugehörige Abbildung p 7→ (∇v T )p definiert damit ein Tensorfeld vom selben Typ. Es ist wichtig zu betonen, daß eine partielle Ableitung “limτ →0 τ1 (Tγv (τ ) − Tγ v (0) ” nicht sinnvoll definiert werden kann, da die Tγv (τ ) und Tγv (0) in verschiedenen Vektorräumen liegen. Erst der parallele Rücktransport von Tγv (τ ) in denselben Raum wie Tγv (0) ermöglicht einen sinnvollen Ableitungsbegriff. Lemma 8.5 Die Definition der kovarianten Ableitung is konsistent für Vektorfelder, d.h. ∇v w = limτ →0 τ1 ((Pτv )−1 wγv (τ ) − wγv (0) ). d (f ◦ γ))(τ ) = (vf )(γ(τ )). Wähle nun f = xµ ◦ ψ, Angewandt auf Funktionen heißt das ( dτ d µ µ so folgt ( dτ (x ◦ ψ ◦ γv ))(τ ) = (v ◦ γv )(τ ). Schreiben wir kurz xµv (τ ) := (xµ ◦ ψ ◦ γv )(τ ), so dxµ entsteht ( dτv )(τ ) = (v µ ◦ ψ −1 )(x0v (τ ), . . . , xvD−1 (τ )). Aus der Lösung bestimmt sich γv (τ ) = ψ −1 (x0v (τ ), . . . , xvD−1 (τ )). 7 35 Preliminary version – 4. August 2016 Beweis. Sei zunächst up = uµ (∂µ )p ∈ Tp M und uγ(τ ) = uρ (τ )(∂ρ )γ(τ ) := v ρ µ Pτ µ up (∂ρ )γ(τ ) sein Paralleltransport längs γv , mit (γ̇v )γv (τ ) = v µ (γ(τ ))(∂ν )γv (τ ) . Nach (8.4) gilt d d ρ v ρ ρ µ ν = −Γρµν (p)v µ (p) Pτ ν u (τ ) + Γµν (γ(τ )) v (γ(τ )) u = 0 ⇔ τ =0 dτ dτ und dann für den Rücktransport d v −1 ρ (Pτ ) ν = +Γρµν (p)v µ (p) . dτ τ =0 Sei nun w ∈ X(U) dargestellt durch wγ(τ ) = w µ (γ(τ ))(∂µ )γ(τ ) für Funktionen w µ (γ(τ )), so folgt ((Pτv )−1 w)p = ((Pτv )−1 )νµ w µ (γ(τ ))(∂ν )p und deshalb 1 d d lim ((Pτv )−1 w)p − wp = · w µ (p)(∂ν )p + (w ρ ◦ γ) · (∂ρ )p ((Pτv )−1 )νµ τ →0 τ τ =0 τ =0 dτ dτ = v µ ∂µ (w ρ ) + Γρµν v µ w ν (∂ρ )p , in Übereinstimmung mit (8.3). Bemerkung 8.6 Das schwache Äquivalenzprinzip, also die Universalität des freien Falls, kann nun so interpretiert werden, daß ein Geschwindigkeitsvektor zum Kurvenparameter τ0 in einen Geschwindigkeitsvektor zum Kurvenparameter τ überführt wird. Diese Überführung ist unabhängig von der Natur und dem Zustand des Testkörpers, somit eine rein geometrische Eigenschaft. Wir gelangen (nach einigen Idealisierungen) zur Schlußfolgerung: Allgemeines Relativitätsprinzip Gravitation ist Zusammenhang ∇ ⇒ auf Mannigfaltigkeit M + schwaches Äquivalenzprinzip Die Aussage wird auch in der Einsteinschen Gravitationstheorie richtig bleiben; es wird lediglich ein ganz bestimmter Zusammenhang gewählt. Legt man nur die Universalität des freien Falls zugrunde, so sind viele alternative Gravitationstheorien möglich. Es ist letztlich eine experimentelle Frage, den richtigen Zusammenhang zu ermitteln. Satz 8.7 Die kovariante Ableitung ist eine Derivation auf der Algebra der Tensorfelder, d.h. ∇v (T ⊗ T̃ ) = (∇v T ) ⊗ T̃ + T ⊗ ∇v T̃ , (8.11) die mit Kontraktionen kommutiert: ∇v (C (i,j) T ) = C (i,j) (∇v T ) . 36 Preliminary version – 4. August 2016 (8.12) Beweis. Die Derivationseigenschaft folgt sofort aus der üblichen Beweismethode jeder Leibniz-Regel8 . Im Beweis von (8.12) kommt es nur auf das zu kontrahierende Paar an, so daß wir T = u ⊗ ω annehmen können. Dann ist nach (8.6) C (1,1) (Pτv )−1 (uγv (τ ) ⊗ ωγv (τ ) ) = C (1,1) (Pτv )−1 (uγv (τ ) ) ⊗ (Pτv )−1 (ωγv (τ ) ) = (Pτv )−1 (ωγv (τ ) ) (Pτv )−1 (uγv (τ ) ) = ωγv (τ ) (uγv (τ ) ) . Es folgt (C (1,1) (∇v (u ⊗ ω)))(p) = lim C (1,1) 1 (Pτv )−1 (uγv (τ ) ⊗ ωγv (τ ) ) − (up ⊗ ωp ) τ (ω(u))(γv (τ )) − (ω(u))(p) = lim = (γ̇(ω(u)))(p) τ →0 τ = (v(ω(u)))(p) = (∇v (C (1,1) (u ⊗ ω)))(p) . τ →0 Die Aussagen des Satzes erlauben es uns nun, die kovariante Ableitung von Kovektorfeldern ω ∈ X∗ (M)zu berechnen: ⇒ v(ω(u)) = ∇v (ω(u)) = ∇v (C (1,1) (u ⊗ ω)) = C (1,1) (∇v u ⊗ ω + u ⊗ ∇v ω) = ω(∇v u) + (∇v ω)(u) (∇v ω)(u) = v(ω(u)) − ω(∇v u) . (8.13) Setzen wir v = ∂µ , u = ∂ν und ω = dxρ in (8.13), so folgt (∇∂µ dxρ )(∂ν ) = ∂µ (δνρ ) − dxρ (Γσµν ∂σ ) = −Γρµν ⇒ ∇∂µ dxρ = −Γρµν dxν . (8.14) Die Leibniz-Regel (8.11) zusammen mit den elementaren kovarianten Ableitungen (8.2) von Vektorfeldern, (8.14) von Kovektorfeldern und (8.10) von Funktionen liefert sofort die Kartendarstellung der kovarianten Ableitung beliebiger lokaler ...µk Tensorfelder T = Tνµ11...ν ∂µ1 ⊗ · · · ⊗ ∂µk ⊗ dxν1 ⊗ · · · ⊗ dxνl . Stellvertretend sei die l kovariante Ableitung des metrischen Tensorfeldes erwähnt: ∇∂µ (gνσ dxν ⊗ dxσ ) = ∂µ (gνσ )dxν ⊗ dxσ − gνσ Γνµρ dxρ ⊗ dxσ − gνσ Γσµρ dxν ⊗ dxρ . = ∂µ (gνσ ) − gρσ Γρµν − gνρ Γρµσ dxν ⊗ dxσ . (8.15) Aus (8.13) folgt außerdem ∇f v ω = f ∇v (ω), so daß ∇v auf der gesamten Tensoralgebra C ∞ (M)-linear im Argument v ist. Auf diese Weise wird eine Abbildung T (k,l) (M) ∋ T 7→ (∇T ) ∈ T (k,l+1) (M) , (∇T )(ω1 , . . . , ωk , v1 , . . . , vl , vl+1 ) := (∇vl+1 T )(ω1 , . . . , ωk , v1 , . . . , vl ) (8.16) 8 Es sei hier jedoch bemerkt, daß dadurch die kovariante Ableitung von Funktionen (also Typ-(0, 0)-Tensoren) festgelegt ist: Wegen der C ∞ (M )-Multilinearität ist f ⊗ w = 1 ⊗ f w, und aus ∇v (1) = ∇v (12 ) = 2∇v (1) = 0 folgt (∇v f )w + f ∇v w = ∇v (f w), d.h. (8.10) folgt aus (8.1). 37 Preliminary version – 4. August 2016 erklärt, die ebenfalls kovariante Ableitung heißt. Für die Komponenten bezüglich der Kartenbasis ist eine abkürzende Schreibweise üblich, in der das letzte mit ∇ zu kontrahierende Vektorfeld mittels Semikolon abgetrennt wird; außerdem wird ∇ nicht geschrieben: ...µk T (dxµ1 , . . . , dxµ1 , ∂ν1 , . . . , ∂νl =: Tνµ11...ν l ⇒ 8.4 ...µk (∇T )(dxµ1 , . . . , dxµ1 , ∂ν1 , . . . , ∂νl , ∂ρ ) =: Tνµ11...ν . l ;ρ (8.17) Geodäten und Normalkoordinaten Definition 8.8 Eine Kurve τ 7→ γ(τ ) heißt Geodäte, falls γ̇ autoparallel entlang γ ist. Ausgedrückt durch γ̇ = ẋµ ∂µ erfüllen Geodäten die Gleichung ẍρ + Γρµν ẋµ ẋν = 0 . (8.18) Wieder nach Picard-Lindelöf gibt es zu gegebenem vp ∈ Tp M eine eindeutige Geodäte ]−ǫ, ǫ[ ∋ τ 7→ γvp (τ ) mit γvp (0) = p und (γ̇vp )p = vp . Eine Skalierung τ 7→ λτ überführt Geodäten in Geodäten, jedoch mit Anfangsgeschwindigkeit vp 7→ λvp . Dadurch läßt sich die Geodäte bis τ = 1 fortsetzen, falls vp in einer genügend kleinen Umgebung von 0 ∈ Tp M liegt. Somit ist eine Abbildung expp : V0 ∋ vp 7→ γvp (1) ∈ Up (8.19) zwischen einer Umgebung V0 ⊂ Tp M von 0 und einer Umgebung Up ⊂ M von p erklärt. Unter Verwendung des Satzes über implizite Funktionen läßt sich zeigen, daß die so definierte Exponentialabbildung expp ein Diffeomorphismus zwischen V0 und U ist. Jede Wahl einer Basis in Tp M liefert dann über die zugehörige Identifizierung Tp M ≃ RD eine Karte (Up , exp−1 p ). Die zugehörigen Koordinaten heißen Normalkoordinaten. Die Kartendarstellung der Geodäte durch p ist somit exp−1 p (γvp (τ )) = p + vp τ , d.h. eine Gerade, so daß in Normalkoordinaten gilt Γρµν (p + vp τ )vpµ vpν = 0 . Setzt man τ = 0, so verschwindet der symmetrische Teil der Zusammenhangskoeffizienten im Punkt p (nach Diagonalisierung müssen alle Eigenwerte Null sein). Außerhalb p läßt sich das nicht folgern, denn z.B. könnte Γρµν (p + vp τ ) = f ρ vµ⊥ vν⊥ (ρ)⊥ sein, mit (vµ ) orthogonal zu (vµ ). Ist (M, g) pseudo-Riemannsche Mannigfaltigkeit, so kann man durch Hauptachsentransformation Koordinaten wählen, in denen gp orthonormal (mit Vorzeichen entsprechend der Signatur) ist. Diese Transformationen ändern nichts an Γρµν (p) + Γρνµ (p) = 0. Solche in p zusätzlich orthonormalen Koordinaten heißen Riemannsche Normalkoordinaten. 38 Preliminary version – 4. August 2016 9 9.1 Krümmung und Torsion Krümmungs- und Torsionstensoren Definition 9.1 Sei ∇ ein affiner Zusammenhang auf M. Durch T(v, w) := ∇v w − ∇w v − [v, w] (9.1) wird eine Abbildung T : X(M) × X(M) → X(M) definiert, die Torsion. Durch R(u, v)w := ∇u (∇v w) − ∇v (∇u w) − ∇[u,v] w (9.2) wird eine Abbildung R : X(M) × X(M) × X(M) → X(M) definiert, die Krümmung. Man rechnet für fi ∈ C ∞ (M) nach: T(f1 v, f2 w) = f1 f2 T(v, w) , R(f1 u, f2 v)(f3 w) = f1 f2 f3 R(u, v)w . (9.3) Somit wird durch X∗ (M) × X(M) × X(M) ∋ (ω, v, w) 7→ ω T(v, w) ∈ C ∞ (M) (9.4) ein Tensorfeld vom Typ (1, 2), der Torsionsstensor definiert, und durch X∗ (M)×X(M) × X(M) × X(M) ∋ (ω, u, v, w) 7→ K(ω, u, v, w) := ω R(v, w)u ∈ C ∞ (M) (9.5) wird ein Tensorfeld vom Typ (1, 3), der Krümmungstensor 9 definiert. In lokalen Koordinaten ∂µ , dxν gilt wegen [∂µ , ∂ν ] = 0 (Satz von Schwarz) ρ Tµν := dxρ (T(∂µ , ∂ν )) = Γρµν − Γρνµ , ρ Rσµν ρ (9.6) ρ := K(dx , ∂σ , ∂µ , ∂ν ) = dx (R(∂µ , ∂ν )∂σ ) = ∂µ Γρνσ − ∂ν Γρµσ + Γρµκ Γκνσ − Γρνκ Γκµσ . (9.7) Obwohl Γρµν keinen Tensor definiert, bildet bezüglich der Kartenbasen die Antisymmetrisierung in den unteren Indizes einen Tensor. Die Krümmung ist ein Maß für die Richtungsänderung eines Vektors bei Paralleltransport längs geschlossener Kurven: Transportieren wir den Vektor (∂σ )p erst längs ∂ν und dann längs ∂µ in den Punkt p′ , so ist das Ergebnis (∇∂µ ∇∂ν ∂σ )p′ verschieden vom umgekehrten Transport (∇∂ν ∇∂µ ∂σ )p′ von (∂σ )p erst längs ∂µ und dann längs ∂ν . Der Ricci-Tensor ist die C (1,2) -Kontraktion des Krümmungstensors X(M) × X(M) ∋ (v, w) 7→ Ric(v, w) := K(dxρ , v, ∂ρ , w) ∈ C ∞ (M) . (9.8) In lokalen Koordinaten gilt ρ Rσν := Ric(∂σ , ∂ν ) = Rσρν = ∂ρ Γρνσ − ∂ν Γρρσ + Γρρκ Γκνσ − Γρνκ Γκρσ . (9.9) 9 Unsere Bezeichnung K ist kein Standardsymbol; aber R wird zu oft in verschiedener Weise gebraucht. Die ungewöhnliche Reihenfolge hat historische Gründe. 39 Preliminary version – 4. August 2016 9.2 Bianchi-Identitäten Satz 9.2 (Bianchi-Identitäten) Torsion und Krümmung eines affinen Zusammenhangs erfüllen die Gleichungen 0 = R(u, v)w − T(T(u, v), w) − (∇u T)(v, w) + zyklische Permutationen (9.10) 0 = (∇u R)(v, w) + R(T(u, v), w) + zyklische Permutationen (9.11) Beweis: Zunächst liefert die Korrespondenz zwischen T, R und Tensorfeldern vom Typ (1, 2) bzw. (1, 3) sowie Vertauschung mit Kontraktion10 : (∇u T)(v, w) = ∇u (T(v, w)) − T(∇u v, w) − T(v, ∇u w) = ∇u (∇v w − ∇w v − [v, w]) − T(∇u v, w) + T(∇u w, v) , (9.12) (∇u R)(v, w)z = ∇u (R(v, w)z) − R(∇u v, w)z − R(v, ∇u w)z − R(v, w)∇u z . (9.13) Die zyklische Summierung (die wir hier als hu, v, wi darstellen) von (9.12) ergibt X (∇u T)(v, w) hu,v,wi = X hu,v,wi R(u, v)w − X T T(u, v) + [u, v], w hu,v,wi + ∇[u,v] w + ∇[v,w] u + ∇[w,u]v − ∇u ([v, w]) − ∇v ([w, u]) − ∇w ([u, v]) X = R(u, v)w − T(T(u, v), w) + [[u, v], w] + [[v, w], u] + [[w, u], v] . {z } | hu,v,wi =0 Damit ist (9.10) bewiesen. Setzen wir in den ersten und letzten Term von (9.13) die Definition (9.2) von R ein und summieren zyklisch, so heben sich alle dreifachen kovarianten Ableitungen gegenseitig weg. Im dritten Term von (9.13) gilt −R(v, ∇u w)z = +R(∇u w, v)z. Die zyklische Summe produziert zusammen mit dem 2. Term T(u, v) + [u, v], so 10 Wir zeigen das für das Paar R, K. (∇u K)(ω, v, w, z) ≡ ω((∇u R)(w, z)v) = ∇u (K(ω, v, w, z)) − K(∇u ω, v, w, z)) − K(ω, ∇u v, w, z)) − K(ω, v, ∇u w, z)) − K(ω, v, w, ∇u z)) = u(ω(R(w, z)v)) − (∇u ω)(R(w, z)v) − ω(R(w, z)∇u v) − ω(R(∇u w, z)v) − ω(R(w, ∇u z)v) = ω(∇u (R(w, z)v)) − ω(R(w, z)∇u v) − ω(R(∇u w, z)v) − ω(R(w, ∇u z)v) Im Schritt von der vorletzten auf die letzte Zeile wurde (8.13) eingesetzt. 40 Preliminary version – 4. August 2016 daß insgesamt entsteht: X X (∇u R)(v, w)z = R(T(u, v), w)z − ∇u ∇[v,w] z − ∇v ∇[w,u] z − ∇w ∇[u,v] z hu,v,wi hu,v,wi + ∇[v,w] ∇u z + ∇[w,u] ∇v z + ∇[u,v] ∇w z − R([u, v], w)z − R([v, w], u)z − R([w, u], v)z . Nach Einsetzen von R in die letzte Zeile heben sich alle doppelten kovarianten Ableitungen weg: X X (∇u R)(v, w)z = R(T(u, v), w)z + ∇[[u,v],w]z + ∇[[v,w],u]z + ∇[[w,u],v]z , | {z } hu,v,wi hu,v,wi =0 da wegen der Linearität die kovariante Ableitung nach einem einzigen Vektorfeld entsteht, welches nach Jacobi-Identität verschwindet. Die Bianchi-Identitäten werden besonders einfach für verschwindende Torsion T(u, v) = 0. Dann liefert (9.10) zusätzliche Symmetrien des Krümmungstensors, die die Zahl der unabhängigen Kompenenten (in einer Basis) reduzieren. Nach (9.11) verschwinden gewisse Kombinationen der kovarianten Ableitungen des Krümmungstensors. Es wird sich zeigen, daß ein besonderer Zusammenhang weitere Symmetrien hat, die den einzuführenden Einstein-Tensor divergenzfrei machen. Damit sind Erhaltungssätze verbunden, und diese führen direkt auf die Einsteinschen Feldgleichungen. 10 10.1 Levi-Civita-Zusammenhang Metrische und torsionsfreie Zusammenhänge Die bisher betrachteten affinen Zusammenhänge erfordern kein metrisches Tensorfeld auf M. Ist jedoch ein solches gegeben und (M, g) eine pseudo-Riemannsche Mannigfaltigkeit, so kann man zusätzlich fordern, daß die indefiniten Skalarprodukte invariant unter Paralleltransport bleiben: Definition 10.1 Ein affiner Zusammenhang ∇ auf einer pseudo-Riemannsche Mannigfaltigkeit (M, g) heißt metrisch, falls für alle Vektorfelder v, w gilt γ γ gγ(τ ) (Pτ,τ v , Pτ,τ wγ(τ0 ) ) = gγ(τ0 ) (vγ(τ0 ) , wγ(τ0 ) ) . 0 γ(τ0 ) 0 (10.1) Die Formel (10.1) darf nicht verwechselt werden mit der Definition (8.7) des Paralleltransports von g; sie ist nicht automatisch erfüllt. Es werden nur die Tangentialvektoren transportiert und mit dem metrischen Tensor am Zielpunkt kontrahiert. 41 Preliminary version – 4. August 2016 Bemerkung 10.2 Nach Sylvesterschem Trägheitssatz gibt es ein lokales Koordinatensystem derart, daß in einem Punkt p der metrische Tensor identisch zu jenem des Minkowski-Raums ist. Da wir den freien Fall nach Bemerkung 8.6 als Paralleltransport beschreiben, heißt das, daß die metrischen Verhältnisse beim freien Fall genau dann die des Minkowski-Raums bleiben, falls der Zusammenhang metrisch ist. Wir kommen also zur Schlußfolgerung, daß das Einsteinsche Äquivalenzprinzip die Wahl eines metrischen Zusammenhangs erzwingt. Der freie Fall macht keine Einschränkung an die Torsion. Es ist vor allem die folgende mathematische Besonderheit, die uns die Torsion ausschließen läßt: Satz 10.3 Es gibt auf einer pseudo-Riemannschen Mannigfaltigkeit genau einen metrischen torsionsfreien Zusammenhang, den Levi-Civita-Zusammenhang. Dieser erfüllt die Gleichung 2g(∇w u, v) = w(g(u, v)) + u(g(v, w)) − v(g(w, u)) + g([v, u], w) − g([w, v], u) − g([u, w], v) . (10.2) Beweis. Angenommen, es gibt einen metrischen torsionsfreien Zusammenhang. Aus dem Vergleich zwischen (10.1) und (8.7) folgt, daß g autoparallel unter meγ trischen Zusammenhängen ist, d.h. gγ(τ ) = Pτ,τ g für beliebige Kurven. Nach 0 γ(τ0 ) (8.9) verschwindet dann die kovarianten Ableitung, ∇w g ≡ 0. Wegen der Kontraktionseigenschaft von ∇ folgt die Ricci-Identität 0 = (∇w g)(u, v) = w(g(u, v)) − g(∇w u, v) − g(u, ∇w v) . (10.3) Der letzte Term kann bei verschwindender Torsion und Berücksichtigung der Symmetrie von g umgeformt werden: 0 = w(g(u, v)) − g(∇w u, v) − g(∇v w, u) − g([w, v], u) . (*) Nach zyklischer Vertauschung: 0 = u(g(v, w)) − g(∇u v, w) − g(∇w u, v) − g([u, w], v) , 0 = v(g(w, u)) − g(∇v w, u) − g(∇u v, w) − g([v, u], w) , (**) (***) Die Linearkombination (∗) + (∗∗) − (∗ ∗ ∗) ist exakt (10.2). Die rechte Seite von (10.2) enthält nur das metrische Tensorfeld. Da g nicht ausgeartet ist, ist eine Abbildung X(M) × X(M) ∋ (v, w) 7→ ∇w u ∈ X(M) durch (10.2) eindeutig bestimmt. Nun ist jedoch noch die Existenz des Levi-Civita-Zusammenhangs zu zeigen (es könnte noch sein, daß (10.2) einen Widerspruch enthält). Dazu sieht man (10.2) als Definition an und zeigt die Eigenschaften (8.1) sowie g(T(w, u), v) = 0 und 2g(∇w u, v) + 2g(∇w v, u) = 2w(g(u, v)) durch direktes Nachrechnen. 42 Preliminary version – 4. August 2016 Setzen wir u = ∂σ , v = ∂µ , w = ∂ν , so folgt mit der Kommutativität dieser Kartenbasen für den Levi-Civita-Zusammenhang 2Γρνσ gρµ = ∂ν gσµ + ∂σ gµν − ∂µ gνσ . (10.4) Wir multiplizieren mit der zu g = (gρσ ) inversen Matrix. Es ist üblich, deren Matrixelemente mit g µρ zu bezeichnen, d.h. g µρ gρσ = δσµ = gσρ g ρµ . (10.5) Somit folgt die aus (4.5) bekannte Gleichung für die Christoffel-Symbole 1 Γρνσ = g µρ ∂ν gσµ + ∂σ gµν − ∂µ gνσ . 2 (10.6) Die Christoffelsymbole sind somit die Zusammenhangskoeffizienten des LeviCivita-Zusammenhangs. Der Vergleich von (8.18) mit der Herleitung von (4.4) zeigt, daß die Geodäten τ 7→ γ(τ ) des Levi-Civita-Zusammenhangs (γ̇ autoparallel längs γ) genau jene Kurven sind, die in extremaler Eigenzeit δs := Rβ p dτ g(τ̇ , τ̇ ) durchlaufen werden. α 10.2 Kontraktion mit der (inversen) Metrik Das inverse metrische Tensorfeld g −1 ∈ T (2,0) (M) ist definiert durch (C (2,1) (g −1 ⊗ g))(ω, w) = (g −1 (ω, dxµ)g(∂µ , v) := ω(v) . Wegen der Symmetrien liefern die Kontraktionen C (1,1) , C (1,2) , C (2,2) dasselbe Ergebnis. Die Koordinaten bezüglich der Kartenbasis g −1 (dxρ , dxµ ) := g ρµ erfüllen (10.5). Aus der Gleichung folgt insbesondere ∇v g −1 = 0 für den Levi-CivitaZusammenhang. Wir können den durch das metrische Tensorfeld (und sein Inverses) implementierten Isomorphismus zwischen X(M) und X∗ (M) nutzen, um den Typ eines Tensors zu verschieben. Ist T ∈ T (k,l) (M), so bezeichne11 T ∗ := C (2,1) (g −1 ⊗ T ) ∈ T (k+1,l−1) die Kontraktion des ersten Vektorfelds in T , und T∗ := C (1,2) (g ⊗ T ) ∈ T (k−1,l+1) die Kontraktion des ersten Kovektorfelds in T . Für die Komponenten bezüglich der Kartenbasen bedeutet das ...µk ...,µk (T ∗ )νµ20...ν := g µ0 ν1 Tνµ11...ν , l l 11 Unsere Operationen ∗ und ∗ ...µk ...,µk (T∗ )νµ02...ν := gν0 µ1 Tνµ11...ν . l l sind keine Standardbezeichnungen. 43 Preliminary version – 4. August 2016 Gegebenenfalls würden wir mit T ·∗ bzw T·∗ die Kontraktion des zweiten (Ko)vektorfeldes bezeichnen, usw. Die Eigenschaften (Derivation der Tensoralgebra, Vertauschen mit Kontraktionen, ∇g = 0 und ∇g −1 = 0) des Levi-Civita-Zusammenhangs implizieren, daß eine Gleichung für die kovariante Ableitung richtig bleibt, wenn sie mit g oder g −1 kontrahiert wird. 10.3 Riemann-Tensor Der Krümmungstensor zum Levi-Civita-Zusammenhang heißt Riemann-Tensor. Der mit g kontrahierte Riemann-Tensor K∗ ∈ T (0,4) (M) , K∗ (z, w, u, v) := g(z, ∂ρ )K(dxρ , w, u, v) = g(z, R(u, v)w) (10.7) besitzt (neben der aus (9.2) folgenden Antisymmetrie in den ersten beiden Argumenten und (9.10) für T ≡ 0) weitere Symmetrien: Satz 10.4 Für beliebige Vektorfelder u, v, w, z ∈ X(M) gilt K∗ (z, w, u, v) = g(R(u, v)w, z) = −g(R(u, v)z, w) = −K∗ (w, z, u, v) , K∗ (z, w, u, v) = g(R(u, v)w, z) = g(R(w, z)u, v) = K∗ (v, u, w, z) (10.8) und zusammen auch K(z, w, u, v) = K(u, v, z, w). Beweis: Aus der Ricci-Identität (10.3) und der Symmetrie von g folgt g(∇u ∇v w, w) = u(g(∇v w, w)) − g(∇v w, ∇u w) 1 = uvg(w, w) − g(∇v w, ∇u w) . 2 Nach Antisymmetriesierung entsteht 1 1 g(R(u, v)w, w) + g(∇[u,v]w, w) = uvg(w, w) − vug(w, w) . 2 2 Wieder nach Ricci-Identität gilt aber g(∇[u,v] w, w) = 12 [u, v](g(w, w)), so daß g(R(u, v)w, w) = 0 gezeigt ist für alle Vektorfelder w. Aus w 7→ w + z folgt dann die erste Gleichung (10.8). Die Bianchi-Identität (9.10) für T = 0 führt auf g(R(u, v)w, z) = −g(R(v, u)w, z) = g(R(u, w)v, z) + g(R(w, v)u, z) . (*) Die analoge Rechnung mit der ersten Gleichung (10.8) führt auf g(R(u, v)w, z) = −g(R(u, v)z, w) = g(R(v, z)u, w) + g(R(z, u)v, w) . 44 Preliminary version – 4. August 2016 (**) Die Summe beider Gleichungen ist 2g(R(u, v)w, z) = g(R(u, w)v, z) + g(R(w, v)u, z) + g(R(v, z)u, w) + g(R(z, u)v, w) . Die rechte Seite ist unter Berücksichtigung der bisherigen Symmetrien invariant unter u ↔ w und v ↔ z. In lokalen Basen gilt nach (10.7) und (9.7) κ Rρσµν := K∗ (∂ρ , ∂σ , ∂µ , ∂ν ) = g(∂ρ , R(∂µ , ∂ν )∂σ ) = gρκ Rµνσ . (10.9) Die Komponenten dieses komplett kovarianten Riemann-Tensors haben somit die Symmetrien Rρσµν = −Rσρµν = −Rρσνµ = Rµνρσ = −Rµνσρ = −Rνµρσ , 0 = Rρσµν + Rρµνσ + Rρνσµ , 0 = Rρσµν;κ + Rρσνκ;µ + Rρσκµ;ν . (10.10) Wir zählen die unabhängigen Komponenten des Riemann-Tensors. Es gibt D(D−1) 2 antisymmetrisierte Indexpaare. Der Riemann-Tensor ist symmetrisch in beiden Paaren, so daß nach der ersten Gleichung D(D−1)(D(D−1)+2) unabhängige Kompo8 nenten verbleiben. Die zweite Gleichung in (10.10) ist nur dann nicht identisch erfüllt, wenn alle Indizes verschieden sind. Dazu gibt es D4 Möglichkeiten. Es 2 2 D − = D (D12 −1) unabhängige Kompontenten, also verbleiben D(D−1)(D(D−1)+2) 8 4 eine für D = 2, 6 für D = 3 und 20 für D = 4. Die Gleichungen in der letzten Zeile von (10.10) sind Integrabilitätsbedingungen. Ein Tensor K mit den in den ersten beiden Gleichungen definierten Symmetrien geht nur dann aus einem D Metrischen Tensorfeld hervor, wenn die D(D−1) · Integrabilitätsbedingungen 2 3 erfüllt sind. In D = 3 Dimensionen sind es 3 Bedingungen, in D = 4 schon 24. Einsetzen von (10.6) in (9.7) zeigt, daß die Komponenten des RiemannTensors Polynome12 in gµν , g ρσ und deren ersten und zweiten partiellen Ableitungen sind. Die zweiten partiellen Ableitungen treten höchstens linear auf. 10.4 Ricci-Tensor Wir sehen uns nun den Ricci-Tensor Ric(u, v) = K(dxρ , u, ∂ρ , v) an. Satz 10.5 Der Ricci-Tensor zum Levi-Civia-Zusammenhang ist symmetrisch, Ric(w, v) = Ric(v, w) für alle v, w ∈ X(M). Beweis. Ric(w, v) = K(dxρ , w, ∂ρ, v) = g −1(dxρ , dxκ )K∗ (∂κ , w, ∂ρ , v) = g −1 (dxρ , dxκ )K∗ (∂ρ , v, ∂κ , w) = K(dxκ , v, ∂κ , ρ) = Ric(v, w) . 12 Dabei ist g ρσ eine rationale Funktion von gµν . 45 Preliminary version – 4. August 2016 Definition 10.6 Der Krümmungsskalar R ∈ C ∞ (M) ist die vollständige Kontraktion des Ricci-Tensors mit dem inversen metrischen Tensorfeld g −1 , R := C (1,1) Ric ∗ ≡ Ric ∗ (dxµ , ∂µ ) ≡ g −1 (dxµ , dxν )Ric(∂ν , ∂µ ) . (10.11) Als Einstein-Tensor G ∈ T 0,2 (M) wird die folgende Linearkombination bezeichnet: 1 G = Ric − Rg . 2 (10.12) Der Einstein-Tensor ist symmetrisch, und es gilt G∗ (ω, v) = Ric ∗ (ω, v) − 21 Rω(v). Das folgende Theorem ist das wichtigste Ergebnis dieses mathematischen Teils der Vorlesung. Es wird direkt auf die Einsteinschen Feldgleichungen führen! Theorem 10.7 Der Einstein-Tensor ist divergenzfrei (bezüglich des Levi-CivitaZusammenhangs), d.h. (div G)(v) := (∇∂µ G∗ )(dxµ , v) = 0 für alle v ∈ X(M) . (10.13) Beweis. Wir formen die Divergenz des Ricci-Tensors mit Hilfe der BianchiIdentität (9.11) um, wobei wir die Kommutativität der kovarianten Ableitung mit Kontraktionen mit g −1 nutzen: (div Ric)(v) := (∇∂µ Ric ∗ )(dxµ , v) = g −1 (dxµ , dxν )(∇∂µ K)(dxρ , ∂ν , ∂ρ , v) = g −1 (dxµ , dxν )dxρ (∇∂µ R)(∂ρ , v)∂ν = g −1 (dxµ , dxν )dxρ − (∇∂ρ R)(v, ∂µ )∂ν − (∇v R)(∂µ , ∂ρ )∂ν = −g −1 (dxµ , dxν )(∇∂ρ K)(dxρ , ∂ν , v, ∂µ ) − g −1 (dxµ , dxν )(∇v K)(dxρ , ∂ν , ∂µ , ∂ρ ) = −g −1 (dxµ , dxν )g −1 (dxρ , dxκ )(∇∂ρ K∗ )(∂κ , ∂ν , v, ∂µ ) + g −1 (dxµ , dxν )(∇v Ric)(∂ν , ∂µ ) = −g −1 (dxµ , dxν )g −1 (dxρ , dxκ )(∇∂ρ K∗ )(∂ν , ∂κ , ∂µ , v) + (∇v R) = −g −1 (dxρ , dxκ )(∇∂ρ Ric)(∂κ , v) + (∇v R) = −(∇∂ρ Ric ∗ )(dxρ , v) + (∇v R) . Schreiben wir nun v = dxµ (v)∂µ = g −1 (dxµ , dxν )g(∂ν , v)∂µ = g ∗ (dxµ , v)∂µ , so folgt 2(div Ric)(v) = (∇v R) = g ∗ (dxµ , v)∇∂µ R = (∇∂µ (Rg ∗ ))(dxµ , v) = (div(Rg))(v) . Die Divergenzfreiheit des Einstein-Tensors ist eine äußerst seltene Eigenschaft. Ohne Beweis13 zitieren wir: 13 D. Lovelock, “The Einstein tensor and its generalizations,” J. Math. Phys. 12 (1971) 498– 501. D. Lovelock, “The four-dimensionality of space and the Einstein tensor,” J. Math. Phys. 13 (1972) 874–876. 46 Preliminary version – 4. August 2016 Theorem 10.8 (Lovelock, 1971) Sei D = 4. Die einzigen zweifach kovarianten Tensorfelder T ∈ T 0,2 (M) mit den Eigenschaften i) Tµν (p) ist ein index-kontrahiertes Polynom allein von gρσ (p), g ρσ (p) und deren ersten und zweiten partiellen Ableitungen, ii) T ist divergenzfrei sind reelle Linearkombinationen des Einstein-Tensors G und des metrischen Tensors g. 11 11.1 Beispiele D=2 Wir betrachten die Einschränkung der Kugelkoordinaten aus Beispiel 2.3 auf konstanten Radius r = const. Dann gilt nach (2.10) g = gϑϑ dϑ ⊗ dϑ + gϕϕ dϕ ⊗ dϕ , gϑϑ = r 2 , gϕϕ = r 2 sin2 ϑ . (11.1) Γϕϕϑ = Γϕϑϕ = cot ϑ . (11.2) Es folgt für die Christoffelsymbole Γϑϕϕ = − sin ϑ cos ϑ , Die einzige unabhängige Komponente des Riemann-Tensors ist nach (9.7) ϕ ϑ ϑ Rϑϕϑϕ = gϑϑ ∂θ Γϕϕ − Γϕϕ Γϑϕ = r 2 (sin2 ϑ − cos2 ϑ + cos2 ϑ) = r 2 sin2 ϑ . (11.3) Damit gilt für den Ricci-Tensor Rϑϑ = g ϕϕ Rϑϕϑϕ = 1 Rϕϕ = g ϑϑ Rϑϕϑϕ = sin2 ϑ (11.4) oder kurz Rµν = r12 gµν . Wegen gµν g µν = 2 folgt R = r22 für den Krümmungsskalar, so daß der Einstein-Tensor identisch verschwindet: Gµν = 0. Letzteres muß für eine beliebige 2-dimensionale Mannigfaltigkeit gelten, da es für D = 2 keine Integrabilitätsbedingung geben kann. Außerdem gilt ganz allgemein R(p) = 2κ1 (p)κ2 (p), wobei κi (p) die beiden Hauptkrümmungen im Punkt p sind, und daraus bestimmt sich Rµν = 21 gµν R und Rρσµν = 21 (gρµ gσν − gρν gσµ )R. 11.2 D=3 Wir greifen erneut das Beispiel 2.3 auf, erlauben aber einen variablen Radius. Dann sind nach (2.10) die einzigen nichtverschwindenden Komponenten des metrischen Tensorfeldes grr = 1 , gϑϑ = r 2 , gϕϕ = r 2 sin2 ϑ . 47 Preliminary version – 4. August 2016 (11.5) Es folgt für die Christoffelsymbole Γrϑϑ = −r , Γrϕϕ = −r sin2 ϑ , Γϕϕϑ = Γϕϑϕ = cot ϑ , Γϑϑr = Γϑrϑ Γϑϕϕ = − sin ϑ cos ϑ , 1 1 = , Γϕϕr = Γϕrϕ = . r r Es gibt nach (9.7) 6 unabhängige Komponenten des Riemann-Tensors: Rϑϕϑϕ = gϑϑ ∂θ Γϑϕϕ + Γϑϑr Γrϕϕ − Γϑϕϕ Γϕϑϕ = 0 Rϑrϑr = gϑϑ − ∂r Γϑϑr − Γϑrϑ Γϑϑr = 0 Rϕrϕr = gϕϕ − ∂r Γϕϕr − Γϕrϕ Γϕϕr = 0 Rϕrϕϑ = gϕϕ − ∂ϑ Γϕϕr + Γϕϕϑ Γϑϑr − Γϕϑϕ Γϕϕr = 0 Rrϑrϕ = 0 . Rϑrϑϕ = gϑϑ − ∂ϕ Γϑϑr = 0 , (11.6) (11.7) (11.8) Die Krümmung verschwindet. Das war zu erwarten, da wir die Euklidische Metrik nur durch krummlinige Koordinaten ausgedrückt hatten. Ein Tensorfeld verschwindet genau dann in einem Koordinatensystem, wenn es in jedem Koordinatensystem verschwindet. Natürlich gibt es echte gekrümmte Mannigfaltigkeiten in D = 3. Man kann zeigen, daß der Riemann-Tensor allein durch den Ricci-Tensor und den metrischen Tensor festgelegt ist (Riemann-Tensor und Ricci-Tensor haben jeweils 6 unabhängige Komponenten): 1 Rρσµν = gρµ Rσν + gσν Rρµ − gσµ Rρν − gρν Rσµ − R(gρµ gσν − gρµ gσµ ) . 2 (11.9) Wir werden sehen, daß die Einsteinschen Feldgleichungen im Vakuum sich auf Ric ≡ 0, d.h. Rµν = 0 reduzieren. Somit gibt es in 2 + 1 Dimensionen keine Krümmung im Vakuum. Das bedeutet, daß Gravitation, aufgefaßt als Krümmung von Raum und Zeit, nicht propagieren kann. In 3 + 1 Dimensionen ist das grundlegend anders! 11.3 D = 4: Rinder-Raumzeit Wir berechnen den Riemann-Tensor für die durch den metrischen Tensor (2.8) definierte Rinder-Mannigfaltigkeit. Die Christoffelsymbole wurden in (4.6) berechnet. Damit folgt als einzige nicht trivialerweise verschwindende Komponente des Riemann-Tensor R1010 = g11 ∂1 Γ100 − Γ100 Γ010 = 0 . (11.10) Da es sich nur um eine Koordinatentransformation des flachen Minkowski-Raums handelte, muß die Krümmung verschwinden. 48 Preliminary version – 4. August 2016 11.4 D = 4: Rotation Die folgende Koordinatentransformation beschreibt ein um die x3 -Achse mit Winkelgeschwindigkeit ω rotierendes Bezugssystem im flachen Minkowski-Raum: x1 = ξ 1 cos( ωc ξ 0 ) − ξ 2 sin( ωc ξ 0 ) , x3 = ξ 3 . (11.11) ct = x0 = ξ 0 , x2 = ξ 1 sin( ωc ξ 0 ) + ξ 2 cos( ωc ξ 0) , Es folgt (dx0 )2 − (dx1 )2 − (dx2 )2 − (dx3 )2 2 = 1 − ωc2 ((ξ 1 )2 + (ξ 2 )2 ) (dξ 0)2 + 2 ωc ξ 2 dξ 1dξ 0 − 2 ωc ξ 1 dξ 2 dξ 0 − (dξ 1 )2 − (dξ 2)2 − (dξ 3)2 und daraus als nichtverschwindende Komponenten des metrischen Tensorfeldes 2 g11 = g22 = g33 = −1 , g00 = 1 − ωc2 ((ξ 1 )2 + (ξ 2)2 ) , 2 g10 = g01 = ωc ξ , g20 = g02 = − ωc ξ 1 . (11.12) 2 2 Man berechnet det g = −g00 − g01 − g02 = −1 und dann 1 =1, − det g 2 g00 + g01 2 = = −1 + g02 , det g = g 10 = g01 , g 02 = g 20 = g02 , 2 g00 + g02 2 = −1 + g01 , det g g 00 = g 11 = g 22 g 33 = −1 g 01 g 12 = g 21 = g01 g02 . (11.13) Daraus gewinnt man die folgenden nicht identisch verschwindenden ChristoffelSymbole ω2 1 ξ , c2 = 12 g 10 ∂1 g00 − 21 g 12 ∂2 g01 + 21 g 12 ∂1 g02 = 0 , Γ110 Γ120 = − 12 g 11 ∂1 g20 + 12 g 11 ∂2 g10 + 21 g 10 ∂2 g00 = − ω2 2 ξ , c2 =0, ω = , c =0. (11.14) Γ200 = − Γ100 = − 12 g 11 ∂1 g00 − 12 g 12 ∂2 g00 = − ω , c Γ001 = 12 g 00 ∂1 g00 − 21 g 02 ∂2 g01 + 21 g 02 ∂1 g02 = 0 , Γ220 Γ210 Γ002 Der Krümmungstensor muß identisch Null sein. Interessant sind vor allem die resultierenden Geodätengleichungen. Zunächst ist ξ¨0 = 0, so daß wir den Kurvenparameter als ξ0 = ct annehmen können. Wegen der Homogenität im Kurvenparameter ist in den folgenden Gleichungen der Punkt einfach die Zeitableitung: 0 = ξ¨1 + Γ100 (ξ˙0)2 + 2Γ120 ξ˙0 ξ˙2 = ξ¨1 − ω 2 ξ 1 − 2ω ξ˙2 , 0 = ξ¨2 + Γ200 (ξ˙0)2 + 2Γ210 ξ˙0 ξ˙1 = ξ¨2 − ω 2 ξ 2 + 2ω ξ˙1 . 49 Preliminary version – 4. August 2016 (11.15) Fassen wir die räumlichen Koordinaten zu ~r := (ξ 1 , ξ 2 , ξ 3) zusammen und setzen ~ω = (0, 0, ω), so ergeben sich die vektoriellen Gleichungen ~r¨ = −~ω × (~ω × ~r) − 2~ω × ~r˙ . (11.16) Die beiden Terme auf der rechten Seite beschreiben die Zentrifugalbeschleunigung plus die Coriolis-Beschleunigung. 50 Preliminary version – 4. August 2016 Teil III Kovarianzprinzip und Energie-Impuls-Tensor 12 Vorbemerkungen Rückblickend können wir nach Äquivalenzprinzip folgende Korrespondenz aufstellen: Metrik gµν Gravitationspotential Φ Christoffel-Symbole Γµνσ Kräfte (genauer: Beschleunigungen) ρ Riemann-Tensor Rσµν Inhomogenität des Gravitionsfeldes, Gezeitenkräfte Das Allgemeine Kovarianzprinzip fordert, alle Koordinatensysteme als gleichwertig zu betrachten: • Gleichungen der Physik sind allgemein-kovariant, d.h. sie behalten ihre Form unter allgemeinen Koordinatentransformationen. • Gleichungen der Physik nehmen ihre speziell-relativistische Form an, falls gµν (x) = ηµν (x). Das läßt sich erreichen, wenn die Gleichungen der Physik tensoriell formuliert werden. Lautet eine Gleichung z.B. Aµνρ = Bµνρ , so behält sie die gleiche Form in beliebigen Koordinatensystemen: A′µ′ ν ′ ρ′ = Bµ′ ′ ν ′ ρ′ mit A′µ′ ν ′ ρ′ (x′ ) = ∂xµ ∂xν ∂xµ Aµνρ (x(x′ )) . ∂x′µ′ ∂x′ν ′ ∂x′ρ′ Ein lokales Inertialsystem ist definiert durch gµν = ηµν und Γρµν = 0. Der ρ Riemann-Tensor Rσµν kann jedoch nicht wegtransformiert werden. Genauer gilt: Satz 12.1 Sei p ein Punkt der Raumzeit. In einer Umgebung von p gibt es Koordinaten ξ µ derart, daß gµν (p) = ηµν und (∂ρ gµν )(p) = 0. Ein solches Koordinatensystem heißt lokal-flach in p, und die ξ µ heißen Riemannsche Normalkoordinaten. Beweis. Die in Abschnitt 8.4 eingeführte Exponentialabbildung liefert das gewünschte. Die Geodätengleichung (8.18) reduziert sich deshalb lokal auf ẍµ x=p = 0, d.h. es liegt lokal ein Inertialsystem vor. Folgende Methode kann als Daumenregel formuliert werden, um allgemeinkovariante Gleichungen der Physik zu gewinnen: 51 Preliminary version – 4. August 2016 12.2 Korrespondenzprinzip. Nehme speziell-relativistische Gleichungen, ersetze die Minkowski-Metrik η durch ein allgemeines metrisches Tensorfeld g und alle partiellen Ableitungen ∂µ durch kovariante ∇∂µ . Diese Vorschrift ist nicht immer eindeutig, da im Gegensatz zu partiellen Ableitungen mehrfache kovariante Ableitungen nicht kommutieren. Der Unterschied wird durch den Riemann-Tensor beschrieben. Gegebenenfalls muß experimentell ermittelt werden, welche Gleichung die richtige ist. 12.1 Allgemein-kovariante Elektrodynamik Die Maxwellschen Gleichungen lauten in speziell-relativistischer Schreibweise14 : ∂ρ Fµν ∂ν F µν = −µ0 j µ , + ∂µ Fνρ + ∂ν Fρµ = 0 . (12.1) Somit würde man als allgemein-kovariante Gleichungen erwarten: ∇ρ Fµν ∇ν F µν = −µ0 j µ , + ∇µ Fνρ + ∇ν Fρµ = 0 . (12.2) Ergänzt man die Koordinatendifferentiale und berücksichtigt deren kovariante Ableitungen (8.14), so zeigt sich jedoch, daß sich die Christoffelsymbole wegheben und (12.1) eine korrekte tensorielle Gleichung ist. Ebenso zeigt sich ∇µ Aν − ∇ν Aµ = ∂µ Aν − ∂ν Aµ . Dagegen wird in den inhomogenen Maxwellschen Gleichungen (die obere Gleichung in (12.2) ) die kovariante Ableitung wichtig. Lemma 12.3 Es gilt folgende Version der Kontinuitätsgleichung: ∇µ j µ = 0 . (12.3) Beweis. Das ist sofort klar für die speziell-relativistische Gleichung ∂µ j µ = 0. Aus dem Korrespondenzprinzip folgt die allgemeine Form. Tatsächlich ist ∇µ j µ proportional zu Rµν F µν , was wegen der Symmetrieeigenschaften verschwindet. Drückt man F durch A aus, so folgen in der speziell-relativistischen Physik die Wellengleichungen ∂ν ∂ µ Aν −∂ν ∂ ν Aµ = −µ0 j µ , die sich nach Kovarianzprinzip in ∇ν ∇µ Aν − ∇ν ∇ν Aµ = −µ0 j µ (12.4) Führt man das Vektorpotential A = Aµ dxµ ∈ X∗ (M ) ein, so ist mit F = dA = 21 Fµν (dxµ ⊗ dx − dxν ⊗ dxµ ) die zweite Gleichung die Identität d2 A = 0, während die erste die Form ∗d ∗ F = µ0 j annimmt. 14 ν 52 Preliminary version – 4. August 2016 übersetzen. Tauscht man im ersten Term die Indizes, so ergibt sich ein RicciTensor: ∇µ ∇ν Aν − ∇ν ∇ν Aµ − Rνµ Aν = −µ0 j µ . (12.5) Der Term mit dem Ricci-Tensor hängt von der gewählten Reihenfolge der partiellen Ableitungen in der speziell-relativistischen Formulierung ab. Hier zeigt sich, daß die Übersetzung von partiellen in kovariante Ableitungen nicht immer zu eindeutigen Ergebnissen führt. 13 Erhaltungssätze Die Kontinuitätsgleichung (12.3) führt auf: Lemma 13.1 p 1 − det g j ν . (13.1) ∂ν − det g Beweis. Aus den Eigenschaften der kovarianten Ableitung folgt ∂µ j µ + Γµµν j ν = 0. Die Formel (10.6) für die Christoffelsymbole reduziert sich bei gleichem oberen und einem unteren Index bei Beachtung der Symmetrien von g auf 1 Γµνµ = g µρ ∂ν gρµ . (13.2) 2 Nach Entwicklungssatz für die Determinante gilt 0 = ∇µ j µ = √ ∂ν (det g) = (−1)ρ+µ det Aρµ ∂ν gρµ , (13.3) wobei Aρµ ∈ M(D − 1, R) der Minor ist, der aus g durch Weglassen der ρ-ten Zeile und µ-ten Spalte entsteht. Dieser Minor tritt auch in der Formel für die inverse Matrix auf: (−1)µ+ν g µρ = det Aρµ . det g Somit folgt p 1 1 (13.4) ∂ν − det g = ∂ν ln(− det g) ∂ν (det g) = √ Γµνµ = 2 det g − det g und daraus die Kontinuitätsgleichung (13.1). √ Somit hat die Dichte − det g j ν eine verschwindende 4-dimensionale Divergenz im üblichen Sinn. Aus dem Gaußschen Integralsatz folgt der Erhaltungssatz Z p 1 (13.5) dS0 − det g j 0 = const Q= c Σ für die Ladung, falls ~j außerhalb einer endlichen Raumzeit-Region verschwindet. Dabei ist Σ eine dreidimensionale Hyperfläche mit Volumenelement dS0 . Ähnliche Erhaltungssätze können für i.a. nicht erwartet werden für divergenzfreie Tensoren höheren Typs (falls diese nicht komplett antisymmetrisch sind). 53 Preliminary version – 4. August 2016 13.1 Energie-Impuls-Tensor Dieser beschreibt die Ströme zu den Erhaltungsgrößen pµ = ( Ec , p~). Nach Anwendung von Symmetrisierungstechniken erreicht man w c~π µν . (13.6) T = c~π T Dabei sind T 00 = w die Energiedichte, ~π rechts oben die Impulsdichte, c2~π links unten die Energiestromdichte und T der Spannungstensor. In der speziellen Relativitätstheorie erhält man aus den Bewegungsgleichungen die vier Kontinuitätsgleichungen ∂µ T µν = 0. Die Gleichung für ν = 0 lautet dann ∂w + div(c2~π ) = 0. Aus diesen Gleichungen ergeben sich mit Gaußschem ∂t Integralsatz die Erhaltungsgrößen Z 1 ν d3 x T 0ν = const . (13.7) P = c Beispiel 13.2 (Staub) Staub kann als ein Materiestrom der Dichte ̺(x) und Geschwindigkeit uµ (x) aufgefaßt werden. Im mitbewegten Ruhsystem u′µ = (c, 0, 0, 0) sei ε(x) = ̺(x)c2 die Energiedichte und p der Druck. Dann gilt 2 ̺c p µν T′ = p p Nach Rücktransformation in das ursprüngliche Bezugssystem folgt die tensorielle Gleichung p T µν = (̺ + 2 )uµ uν − pη µν (13.8) c Für Photonen zeigt sich Tµµ = 0 (Dilatationsinvarianz). Somit folgt p = 3ǫ . Angenommen, die allgemein-kovariante Verallgemeinerung ist ∇µ T µν = 0, mit µν T = T νµ . Dann gilt p 1 0 = ∂µ T µν + Γµρµ T ρν + Γνρµ T ρµ = √ ∂µ ( det gT µν ) + Γνρµ T ρµ . (13.9) − det g Somit kann auf dem üblichen Weg kein Erhaltungssatz gewonnen werden: Für die kovariante Verallgemeinerung von (13.7), Z p 1 µ d3 x − det g T 0µ (13.10) P = c x0 =const gilt Z p d 0 P =− d3 x − det g Γ0ρν T ρν . (13.11) dt x0 =const Man würde diese Gleichung so interpretieren, daß auch das Gravitatioinsfeld Energie enthält, die mit jener der Materie ausgetauscht wird. 54 Preliminary version – 4. August 2016 Teil IV Dynamik des Gravitationsfeldes 14 Einsteinsche Feldgleichungen Die Geodätengleichungen beschreiben, in welcher Weise die Geometrie bestimmt, wie sich Materie bewegt [Einstein, 1907]. Umgekehrt suchen wir Gleichungen, nach denen die Materie festlegt, wie sich die Geometrie krümmt. Diese Gleichungen wurden gefunden in • A. Einstein, “Die Feldgleichungen der Gravitation,” S. Ber. Preuß. Akad. Wiss., 25.11.1915. • D. Hilbert, 20.11.1915 Die Gleichungen sollten tensoriell sein und sich im nichtrelativistischen Limes auf das Newtonsche Gravitationsgesetz ∆Φ = 4πGN ρ (14.1) reduzieren. In dieser Poisson-Gleichung ist ρ die Massedichte und Φ das Gravitationspotential. In der speziellen Relativitätstheorie ist die Massendichte nur eine Komponente des Energie-Impuls-Tensors: T00 = ̺c2 . Wir wissen nach Diskussion zum Äquivalenzprinzip (Kombination von (2.8) mit (3.4)), daß sich homogene Gravitationsfelder beschreiben lassen15 durch die Komponente g00 = (1 + cΦ2 )2 ≈ . Daraus ergibt sich ein erster Ansatz 1 + 2Φ c2 ∆g00 = 8πGN T00 . c4 (14.2) Gesucht ist nun eine tensorielle Gleichung, deren 0-0-Komponente sich im nichtrelativistischen Grenzfall auf (14.2) reduziert. Im ersten Schritt ist ∆ 7→ = −∂µ ∂ µ zu setzen, dann nach Korrespondenzprinzip die partiellen durch kovariante Ableitunge zu ersetzen. Aber wegen der Metrizität des Levi-Civita-Zusammenhangs gilt ∇ρ ∇ρ gµν = 0, d.h. diese Idee scheitert. Wir suchen deshalb eine Gleichung Gµν = κTµν , wobei wir (nach Einstein) folgende Bedingungen an Gµν stellen: Im nichtrelativistischen Grenzfall k~x˙ k ≪ ẋ0 ≈ c nehmen die Geodätengleichungen die Form ẍσ ≈ −Γσ00 c2 an. Für statische ∂0 gµν = 0 und schwache Felder gµν = ηµν + hµν mit |hµν | ≪ 1 folgt außerdem Γσ00 ≈ − 12 η σj ∂j h00 , somit Γ000 ≈ 0 und Γj00 ≈ 12 ∂j h00 . Vergleich der resultierenden Gleichung c2 ẍj ≈ − ∂j h00 2 15 mit der Newtonschen Bewegungsgleichung ẍi = −∂i Φ zeigt g00 = 1 + mit (2.8). 55 Preliminary version – 4. August 2016 2Φ c2 , in Übereinstimmung i) Gµν ist symmetrisch, Gµν = Gνµ . ii) Gµν setzt sich zusammen aus gµν und den ersten und zweiten partiellen Ableitungen, wobei die zweiten nur linear auftreten. iii) ∇µ Gµν = 0 soll als Identität gelten, da dann der Erhaltungssatz ∇µ T µν = 0 folgt. Ein besserer Grund ist, daß die Metrik nicht vollständig durch Gµν = κTµν festgelegt werden kann, sondern noch Koordinatentransformationen zulassen muß. Somit sollen nicht alle 10 Gleichungen unabhängig sein. Die 4 Identitäten ∇µ Gµν = 0 reduzieren das Problem auf 6 unabhängige Gleichungen. iv) Im Vakuum Tµν = 0 soll gµν = ηµν eine Lösung sein. Einsteins erster Ansatz war Gµν = Rµν . Hier zeigte sich aber schnell, daß das nur in speziellen Koordinatensystemen gültig sein kann. Mehr Freiheit erlaubt der Ansatz Gµν = Rµν + bgµν R − Λgµν . Damit sind die Bedingungen i)+ii) erfüllt. Eine damals sehr schwierige Rechnung, heute die Bianchi-Identität (Theorem 10.7) zeigt, daß die Bedingung iii) genau für 1 + 2b = 0 gilt. Damit entsteht der folgende Vorschlag: 14.1 Einsteinsche Feldgleichungen. Das metrische Tensorfeld berechnet sich bei gegebener (aber kompatibler) Materieverteilung als Lösung von 1 Rµν − gµν R − Λgµν = κTµν . 2 (14.3) N . Bedingung iv) erzwingt Λ = 0. Der Newtonsche Grenzfall (s.u.) liefert κ = 8πG c4 Neuere Beobachtungsdaten zeigen jedoch, daß die Bedingung iv) im Kosmos nicht realisiert ist. Einige Bemerkungen: • Einstein hat später ohne größeren Erfolg versucht, auch die rechte Seite Tµν geometrisch zu verstehen. • Die Feldgleichungen (14.3) sind nichtlinear und deshalb schwierig zu lösen. Hinzu kommt, daß auch Tµν nicht beliebig vorgegeben werden kann: Es muß ∇µ T µν = 0 gelten, aber die kovariante Ableitung enthält über die Christoffelsymbole die Metrik. Deshalb sind nur wenige exakte Lösungen, zumeist im Vakuum, bekannt. Die einfachste und gleichzeitig wichtigste ist die Schwarzschild-Lösung, die z.B. die Planetenbewegung beschreibt. Für das Universum als ganzes findet man die Friedmann-Robertson-WalkerLösungen. Alternativ kann man Näherungslösungen suchen. Der einfachste Fall besteht hier in einer Linearisierung; diese führt z.B. auf Gravitationswellen. 56 Preliminary version – 4. August 2016 • Hilbert hat die Feldgleichungen über ein Variationsprinzip erhalten. Die Wirkung Z p 1 d4 x − det g R + SMaterie S= (14.4) 2κc führt auf 1 δS = − 2κc Z Z p p 1 µν d x − det g G δgµν + d4 x − det g T µν δgµν 2c (14.5) 4 • Aus den Feldgleichungen folgen die Bewegungsgleichungen ∇µ T µν = 0. Mit einem Ansatz für T µν , der Punktteilchen beschreibt, reduziert sich diese Gleichung auf die Geodätengleichung. • Kontraktion mit der inversen Metrik liefert −R = κTµµ . Somit können die Feldgleichungen auch geschrieben werden als 1 Rµν = κ(Tµν − gµν Tρρ ) . 2 (14.6) Daraus ergeben sich die Vakuumgleichungen Rµν = 0. In vier Dimensionen ρ folgt daraus nicht Rσµν = 0. 15 Linearisierte Theorie Wir betrachten schwache Felder gµν = ηµν +hµν mit |hµν | ≪ 1 und berücksichtigen in den Feldgleichungen (14.3) nur h-lineare Terme. Zunächst ist 1 Γµνρ = ∂ν hµρ + ∂ρ hµν − ∂ µ hνρ 2 (15.1) wobei das Heben der Indizes mit der (inversen) Minkowski-Metrik η µν erfolgt. Der Ricci-Tensor reduziert sich in dieser Näherung auf Rµν = ∂σ Γσµν − ∂ν Γσµσ + O(h2 ) 1 = ∂σ ∂µ hσν + ∂σ ∂ν hσµ − ∂µ ∂ν hσσ − ∂σ ∂ σ hµν + O(h2 ) 2 1 ∂σ ∂µ Ψσν + ∂σ ∂ν Ψσµ − ∂σ ∂ σ Ψµν + O(h2 ) , = 2 (15.2) wobei Ψµν := hµν − 21 δνµ hσσ . Wir führen eine Koordinatentransformation xµ 7→ x′µ = xµ +ǫµ (x) derart aus, daß h′µν = hµν +∂µ ǫν +∂ν ǫµ +O(ǫ2 ). Wir wählen ǫ(x) gemäß Lorentz-Eichung ∂σ Ψσµ = 0. In dieser Eichung ergibt sich 1 Rµν = − ∂σ ∂ σ hµν 2 57 Preliminary version – 4. August 2016 (15.3) und damit die Feldgleichungen 2Rµν = hµν := −∂σ ∂ σ hµν = κ(2Tµν − ηµν Tσσ ) . (15.4) Die allgemeine Lösung dieser Wellengleichung ist (wie in der Elektrodynmik) gegeben durch retardierte Potentiale. 16 Newtonscher Grenzfall Für langsam bewegte Himmelskörper können wir T00 = ̺c2 als einzige nichtverschwindende Komponente von Tµν annehmen. Damit folgt h00 = κ̺c2 , hjj = κ̺c2 . (16.1) und Φ = ∆Φ, und daraus ergibt sich ∆Φ = Für statische Felder war h00 = 2Φ c2 κc4 ̺. Vergleich mit der Poisson-Gleichung zeigt 2 2 8πGN −43 s κ= = 2.07 · 10 . c4 kg m (16.2) Die Lösung außerhalb einer sphärisch-symmetrischen Masseverteilung der Masse m ist Φ = − GNr m . Es folgt g00 2GN m , ≈1− c2 r 2GN m . gjj ≈ − 1 + 2 cr (16.3) Die Abweichungen von der Minkowski-Metrik führen auf Zeitdilatation und radiale Längenkontraktion. Die Effekte wurden im Shapiro-Experiment (Reflexion von Radarsignalen an der Venus, 1964, 1979) überprüft. Die Laufzeitverzögerung liegt in der Größenordnung von 10−4 s. 17 Gravitationswellen Hier werden Vakuum-Lösungen der linearisierten Theorie betrachtet, hµν = 0 . Eine Lösung sind ebene Wellen in Richtung x1 : hµν = Aµν cos(k(x0 − x1 )) . (17.1) In der Lorentz-Eichung 2∂σ hσµ = ∂µ hσσ folgt für die Amplituden 1 1 1 A0ν − δν0 Aσσ − A1ν + δν1 Aσσ = 0 , A00 − A10 − Aσσ = 0 , 2 2 2 1 A01 − A11 − Aσσ = 0 , A02 − A12 = 0 , A03 − A13 = 0 . (17.2) 2 58 Preliminary version – 4. August 2016 Eine weitere Freiheit in der Koordinatenwahl, die die Lorentz-Eichung erhält, erlaubt die Wahl 0 0 0 0 0 0 0 0 (17.3) (Aµν ) = 0 0 b a . 0 0 a −b Eine solche Welle führt zu Abstandsänderungen von zunächst parallel bewegten Testteilchen (geodätische Abweichung). Ist ~n der Abstandsvektor, so folgt16 im Ruhsystem d2 ni i = −c2 R0j0 nj . 2 dτ (17.4) i Wegen R0j0 = − 12 ∂0 ∂0 hij folgen die Bewegungsgleichungen d2 n2 1 = (bn2 + an3 ) (kc)2 cos(k(x1 − ct)) , 2 dt 2 2 3 1 dn = (an2 − bn3 ) (kc)2 cos(k(x1 − ct)) . 2 dt 2 d2 n1 =0, dt2 (17.5) Diese beschreiben eine harmonische Bewegung in der x2 -x3 -Ebene. Sei z.B. a = 0 (lineare Polarisation) und für t = 0 ein Kreis gegeben, so wird dieser periodisch in Ellipsen deformiert, deren große Halbachse abwechselnd in x2 - und x3 -Richung 16 Betrachte eine Schar von Geodäten xµ (s, λ) (λ ist der Schar-Parameter, s der Kurvenpaµ ∂xµ µ µ rameter) und setze nµ = ∂x ∂λ ∆λ sowie u := ẋ = ∂s . Für jedes λ gilt die Geodätengleichung µ µ µ ∂u µ ν ρ 0 = Du relative Geschwindigkeit v µ := Du ∆λ = (∇ν uµ )nν . ds := ∂s + Γνρ u u µ. Definiere die dλ µ µ D dx D dx Dn µ ν Andererseits ist v µ = dλ ds ∆λ = ds dλ ∆λ = ds = (∇ν n )u . ρ ν Aus der Geodätengleichung (∇ν u )u = 0 folgt nach Ableitung 0 = ∇µ ((∇ν uρ )uν ) = (∇µ ∇ν uρ )uν + ∇ν uρ ∇µ uν . Betrachte die Relativbeschleunigung Dv ρ = (∇µ v ρ )uµ = ∇µ ((∇ν uρ )nν )uµ ds = (∇µ ∇ν uρ )nν uµ + (∇ν uρ )(∇µ nν )uµ = (∇µ ∇ν uρ )nν uµ + (∇ν uρ )(∇µ uν )nµ aρrel = = (∇µ ∇ν uρ )nν uµ − (∇µ ∇ν uρ )nµ uν ρ = − (∇µ ∇ν uρ ) − (∇ν ∇µ uρ ) nµ uν = −Rσµν u σ nµ u ν . Daraus folgt die Gleichung für die geodätische Abweichung, die die Änderung von nρ bei Fortschreiten is s beschreibt (Gezeitenkräfte). 2 i i nj . In Beispiel: Im lokalen Inertialsystem u = (1, 0, 0, 0), n0 = 0 ergibt sich c12 ddtn2 = −R0j0 der Newtonschen Mechanik ist d2 dt2 2 = − ∂x∂i ∂xj nj . 59 Preliminary version – 4. August 2016 zeigt. Für andere Parameter a, b werden elliptische und zirkulare Polarisationen erhalten. Die vorhergesagte quadrupol-artige Bewegung wurde seit 1960 mit WeberDetektoren gesucht. Mögliche Quellen wären Doppelsterne und Supernovae. Weisberg und Taylor (1984) haben Doppelstern-Pulsare untersucht und eine Änderung ≈ −2.4 · 10−12 . Dieser Wert ist innerhalb 0.3% der Umlaufzeit T gefunden: dT dt konsistent mit der Vorhersage der ART infolge Abstrahlung von Gravitationswellen. Mit den zwei LIGO-Detektoren (Laser-Interferometer) in Hanford und Livingston wurden am 14.9.2015 Gravitationswellen detektiert (Phys. Rev. Lett. 116 (2016) 061102). Das Signal wird interpretiert als Verschmelzung zweier schwarzer Löcher mit Massen von 36 bzw 29 Sonnenmassen. Das verschmolzene schwrze Loch hat eine Masse von 63 Sonnenmassen. Die Differenz von 3 Sonnenmassen wurde innerhalb von 0.2 s als Energie der Gravitationswellen abgestrahlt. 60 Preliminary version – 4. August 2016 Teil V Die Schwarzschild-Lösung Die radialsymmetrische Schwarzschild-Lösung ist die erste (1916) und zugleich wichtigste exakte Lösung der Einsteinschen Feldgleichungen. 18 Vakuumlösung Wir suchen eine Lösung der Einsteinschen Feldgleichungen (14.3) entweder für eine statische radialsymmetrische Materieverteilung oder außerhalb einer solchen. Entsprechend der Symmetrie wählen wir Koordinaten x′0 = T, x′1 = R, x′2 = ϑ, x′3 = ϕ, wobei die Winkel ϑ, ϕ ihre übliche Bedeutung haben: Für konstante ‘Radien’ R und ‘Zeiten’ T soll die Metrik konzentrischer Kugelschalen erhalten werden, und der ‘Radius’ R steht senkrecht auf der Tangentialebene: = f 2 (R, T ) (dϑ)2 + sin2 ϑ(dϕ)2 , g12 = g13 = 0 . (−g) R,T const Die Lösung soll für alle Zeiten diese Symmetrie behalten, was durch die Wahl g02 = g03 = 0 reflektiert wird. Physikalisch bedeutet diese Annahme, daß die Materieverteilung nicht rotiert (siehe im Gegensatz dazu die Rechnung in Abschnitt 11.4). Somit erhalten wir folgenden Ansatz für das metrische Tensorfeld: g = g00 (R, T )(dT )2 + 2g01 (R, T )dT dR + g11 (R, T )(dR)2 − f 2 (R, T ) (dϑ)2 + sin2 ϑ(dϕ)2 . (18.1) g = eν(r,t) c2 (dt)2 − eλ(r,t) (dr)2 − r 2 (dϑ)2 − r 2 sin2 ϑ(dϕ)2 . (18.2) Da die Signatur (+1, −1, −1, −1) festgelegt ist, gilt f 2 (R, T ) > 0. Man kann nun als neue Koordinate x1 = r = f (R, T ) > 0 wählen und dann jene Funktion x0 = ct(R, T ) bestimmen, die das metrische Tensorfeld diagonalisiert: Damit sind (bis auf reine Diffeomorphismen t 7→ t′ (t), die wir später ausnutzen) sämtliche Freiheiten der Koordinatenwahl erschöpft, und als Diagonalelemente verbleiben (bis auf die festgelegten Vorzeichen) beliebige Funktionen g11 = −eλ(r,t) und g00 = eν(r,t) . Durch elementare, aber umfangreiche Rechnung findet man die folgenden nicht identisch verschwindenden Christoffelsymbole (f˙ = ∂f , f ′ = ∂f ): ∂t ∂r ν̇ , 2 λ′ = , 2 ν′ , 2 λ̇ = , 2 = −re−λ , 1 = , r λ̇ λ−ν e , 2c2 c2 ν ′ ν−λ = e , 2 = −r sin2 ϑe−λ , Γ000 = Γ001 = Γ011 = Γ111 Γ110 Γ100 Γ122 Γ212 = 1 , r Γ313 Γ133 Γ233 = − sin ϑ cos ϑ , 61 Preliminary version – 4. August 2016 Γ322 = cot ϑ . (18.3) Im nächsten Schritt sind die Komponenten des Riemann-Tensors (9.7) zu bestimmen. Man findet nach langer Rechnung, die wir hier nicht widergeben: 0 1 2 3 R0123 = 0, und die Summanden Rµ0ν , Rµ1ν , Rµ2ν , Rµ3ν des Ricci-Tensors sind nur für µ = ν oder (µν) = (01) nicht identisch Null. Sie summieren sich zu ν ′2 ν ′ λ′ ν ′ λ̈ λ̇2 λ̇ν̇ , − + + − − 2 4 4 r 2 4 4 ν ′′ ν ′2 ν ′ λ′ λ′ eλ−ν λ̈ λ̇2 λ̇ν̇ =− , + − − + − + 2 2 4 4 r c 2 4 4 r = 1 − e−λ 1 + (ν ′ − λ′ ) , R33 = sin2 ϑR22 , 2 λ̇ = . r R00 = c2 eν−λ R11 R22 R01 ν ′′ + (18.4) Im Vakuum, also außerhalb des einer radialsymmetrischen, nichtrotierenden Materieverteilung, ist Tµν = 0. Somit reduzieren sich die Einsteinschen Feldgleichungen auf 1 Rµν = gµν (R + 2Λ) = −Λgµν . 2 (18.5) Damit folgt für die (01)-Komponente λ̇ = 0, d.h. λ = λ(r) hängt nur vom Radius ab. Die Gleichung für die (22)-Komponente lautet dann 1 − e−λ(r) (1 + r(ν ′ (r, t) − λ′ (r))) = Λr 2 . (18.6) Diese Gleichung ist nur dann konsistent für alle t, wenn auch ν ′ = ν ′ (r) von t unabhängig ist, R td.h. 1es gilt ν(r, t) = ν(r) + f (t). Durch eine Redefinition der Zeit gemäß t̃(t) = 0 dτ e 2 f (τ ) kann die Funktion f (t) jedoch absorbiert werden, und die Metrik g̃µν bezüglich der Koordinaten (cτ̃ , r, ϑ, ϕ) ist zeitunabhängig. Somit ist bewiesen: Satz 18.1 (Birkhoff, 1923) Jede radialsymmetrische Vakuumlösung der Einsteinschen Feldgleichungen ist statisch. Die Aussage ist ein wenig überraschend. Sie zeigt z.B., daß das Gravitationsfeld radial pulsierender oder sogar explodierender Sterne keinerlei Spuren dieser rein radialen Bewegungen trägt. Insbesondere können rein radiale Supernovae keine Gravitationswellen erzeugen. Deshalb ist der experimentelle Nachweis von Gravitationswellen für die (sehr seltene!) Kollision zweier schwarzer Löcher geglückt, die weit von der Radialsymmetrie entfernt ist. Wir schreiben vereinfachend wieder t statt t̃. Die für alle Λ gültige Gleichung ′ ′ e−ν R00 + e−λ R11 = 0 reduziert sich auf ν +λ = 0, mit Lösung ν = −λ + C. Eine c2 r erneute Reskalierung t 7→ e−C/2 t beseitigt die mögliche Konstante, so daß wir 62 Preliminary version – 4. August 2016 λ = −ν annehmen können. Damit verbleibt folgende Differentialgleichung für die (22)-Komponente: 1 − Λr 2 = e−λ(r) (1 − rλ′ (r)) = d (re−λ(r) ) , dr (18.7) die durch Trennung der Variablen gelöst wird: e−λ(r) = 1 − Λ 2 2M r − . 3 r (18.8) Dabei ist M eine beliebige Integrationskonstante. Nur für Λ ≤ 0 gibt es eine für große r sinnvolle Lösung. Einsetzen in die verbleibene Gleichung für R00 selbst zeigt, daß diese identisch erfüllt ist und keine weitere Bedingung liefert. Für Λ = 0 erhalten wir die eigentliche Schwarzschild-Metrik (1916) 1 2M (d(ct))2 − (dr)2 − r 2 (dϑ)2 − r 2 sin2 ϑ(dϕ)2 . g = 1− r 1 − 2M r (18.9) Einige Bemerkungen: • Offenbar gilt limr→∞ g = η (Minkowski-Metrik), d.h. asymptotisch verschwindet das Gravitationsfeld (wie erwartet). • Vergleich der für homogene Gravitationsfelder bekannten Korrespondenz 2 g00 = 1 + 2Φ mit der Minkowski-Metrik zeigt Φ(r) = − c rM . Andererseits c2 erwarten wir nach der Newtonschen Theorie Φ(r) = − mGr N für das Gravitationspotential im Abstand r zu einer Punktmasse m. Somit identifizieren wir 2M = 2mGN >0. c2 (18.10) Die Konstante 2M hat die Dimension einer Länge und heißt SchwarzschildRadius. Das Produkt mGN läßt sich bequem über die Umlaufzeit T eines Planeten oder Satelliten auf einer elliptischen Bahn der großen Halbachse a 2 a3 bestimmen (s.u.). Damit erhält man 2M = 8π und z.B. 2M = 8.8 mm für c2 T 2 die Erde und 2M = 2.96 km für die Sonne. Diese Werte liegen weit im Inneren der Himmelskörper, wo die Voraussetzung Tµν = 0 für die Herleitung der Schwarzschild-Metrik nicht gilt. Mit Ausnahme der schwarzen Löcher, auf die wir später eingehen, ist die Voraussetzung r > 2M im Vakuum immer erfüllt. • Die Schwarzschild-Metrik stimmt für Mr << 1 mit dem Newtonschen Grenz2 fall (16.3) überein. Erst in Ordnung O( Mr 2 ) ergeben sich Abweichungen, die die Einsteinschen Feldgleichungen gegenüber anderen Gravitationstheorien auszeichnen. 63 Preliminary version – 4. August 2016 • Mit dieser Normierung der Integrationskonstante M ergeben sich (in führender Ordnung in 1c ) exakt die Frequenzänderungen v u p 1 − 2M g00 (A) u νB rA t = (18.11) =p 2M νA 1 − rB g00 (B) im Gravitationsfeld, die wir im Zusammenhang mit dem Pound-RebkaExperiment (3.3) und den GPS-Satelliten (3.5) über das Äquivalenzprinzip diskutiert hatten. • Radiale Abstände zwischen konzentrischen Kugelschalen der Fläche 4πr12 und 4πr22 bei konstanter Zeit sind vergrößert: Z r2 dr q d(r1 , r2 ) = (18.12) r1 1 − 2M r p q q r 2 − 2Mr2 r − M + 2 p 2 . = r22 − 2Mr2 − r12 − 2Mr1 + M log r1 − M + r12 − 2Mr1 Oft visualisiert man diese metrischen Verhältnisse für ϑ = π2 durch eine Rotationsfläche (r cos ϕ, r sin ϕ, z(r)) im R3 , deren Schnitte mit einer Ebene z = p const Kreise vom Radius ri sind, während d(ri , rj ) R r2zi = dem Weg r1 dr 1 + (z ′ (r))2 auf der Mantelfäche entspricht. Somit ist q 2M ′ mit Lösung (Flammsches Paraboloid) z (r) = r−2M p √ √ z(r) = z(r0 ) + 8M ( r − 2M − r0 − 2M ) . • Durch die Transformation r = (1 + M )2 r̃ erreicht man denselben Vorfaktor 2r̃ vor dem räumlichen Koordinaten. In diesen isotropen Koordinaten lautet die Schwarzschild-Metrik 1 − M 2 M 4 2 2r̃ g= (d(ct)) ((dx)2 + (dy)2 + (dz)2 ) − 1 + 2r̃ 1+ M 2r̃ mit x2 + y 2 + z 2 = r̃ 2 . Da hier die Lichtgeschwindigkeit in allen Richtungen dieselbe ist, läßt sich hier am einfachsten die Laufzeitänderung im ShapiroExperiment berechnen. 19 19.1 Bahnen im Schwarzschild-Feld Erste Integrale der Bewegung Wir lösen die Geodätengleichungen für die Schwarzschild-Metrik. Dazu ist die zuvor bestimmte Parametrisierung λ = −ν = − log(1 − 2M ) r 64 Preliminary version – 4. August 2016 in die Gleichungen (18.3) für die Christoffelsymbole einzusetzen. Ist τ der auf Bogenlänge c2 parametriserte Kurvenparameter, so folgt für die 2. Komponente dϕ 2 2 dr dϑ d2 ϑ − sin ϑ cos ϑ =0. (19.1) + dτ 2 dτ r dτ dτ Solche Differentialgleichungen 2. Ordnung erfordern die Vorgabe von Anfangsbe˙ Man kann das Koordinatensystem so wählen, daß dingungen wie ϑ(0) und ϑ(0). die von den beiden Vektoren ~r(0) und ~r˙ (0) aufgespannte Ebene durch ϑ(0) = π2 und ϑ̇(0) = 0 parametrisiert wird. Dann löst aber ϑ(τ ) = π2 das Anfangswertproblem, und nach Picard-Lindelöf ist es die einzige Lösung. Wir bestätigen wie in der Newtonschen Therorie, daß die Bahnen im Zentralkraftfeld eben sind. Die Gleichung für die 3. Komponente vereinfacht sich mit dieser Parametrisierung zu d2 ϕ 2 dr dϕ 1 d 2 dϕ 0= 2 + r , (19.2) = 2 dτ r dτ dτ r dτ dτ d.h. der Drehimpuls ist erhalten: L = r2 dϕ = const . dτ (19.3) Analog führt die 0. Komponente auf den Energieerhaltungssatz: d2 t 2M dt dr dt d ν dt 0 = 2 + ν′ e ⇒ (1 − = e−ν ) = E = const . (19.4) dτ dτ dτ dτ dτ r dτ An Stelle der verbleibenden Geodätengleichung für die 1. Komponente nehmen wir die Gleichung, die die Parametrisierung der Bahnkurve nach der Bogenlänge µ dxν = c2 : c2 beschreibt, gµν dx dτ dτ ⇒ 2 2M d(ct) 2 1 dr 2 2 dϕ c2 = 1 − − − r , r dτ dτ dτ 1 − 2M r dr 2 2M L2 2Mc2 2 2 − 1− . =E −c + dτ r r r2 (19.5) (19.6) Dabei haben wir die Integrationskonstanten eingesetzt. An dieser Stelle bietet sich der Vergleich mit der Newtonschen Theorie an. Dort haben wir die beiden Erhaltungssätze ⇒ wobei wir 2M = 1 GN m EN = (ṙ 2 + r 2 φ̇2 ) − , 2 r dr 2 2Mc2 L2 − 2 , = 2EN + dτ r r 2GN m c2 V (r) := L = r 2 φ̇ (19.7) eingesetzt haben. Offenbar können L2 Mc2 ML2 − − 3 , 2r 2 r r VN (r) := 65 Preliminary version – 4. August 2016 L2 Mc2 − 2r 2 r (19.8) als effektive Potentiale aufgefaßt werden. Das Schwarzschild-Potential wird durch 2 den Zusatzterm − M2rL3 stark negativ für kleine r, während für große r kaum Un2 2 terschiede auftreten. Bei festgehaltenem Drehimplus bestimmt die Energie E 2−c bzw. EN die Art der Bewegung. Ist sie negativ, so liegt eine gebundene Bewegung r1 ≤ r ≤ r2 vor. Für EN positiv gibt es eine Streuung. Das bleibt auf im Schwarzschild-Fall richtig für 0 < E 2 − c2 < 2Ekrit . Oberhalb einer kritischen, vom Drehimpuls abhängigen, Energie kann die Drehimpulsbariere überwunden werden, und das Teilchen fällt in den Horizont r = 2M. Ableitung des Potentials V (r) zeigt, daß stabile gebundene √ Bahnen, charakterisiert durch ein Potentialminimum, nur für L > Lkrit = 2 3Mc möglich sind. 19.2 Periheldrehung Für gebundene Bahnen drückt man den Kurvenparameter besser durch den Windr dr dϕ kel aus und nutzt die Kettenregel dτ = dϕ , um letztlich eine Bahnkurve r(φ) dτ zu bestimmen: 1 L dr 2 L2 E2 − (19.9) − 2 c2 = r 2 dφ r 1 − 2M 1 − 2M r r Offenbar vereinfacht sich die Gleichung für inverse Radien u := 1r . Mit u′ := folgt (u′ )2 = c2 E2 − ( + u2 )(1 − 2Mu) . L2 L2 du dφ (19.10) Trennung der Variablen führt auf ein elliptisches Integral. Geschickter ist es, die Gleichung erneut zu differenzieren: u′′ + u = Mc2 + 3Mu2 L2 (19.11) N Dieselbe Rechnung für die Newtonsche Theorie zeigt, daß dort 3Mu2 = 3 mG c2 r 2 1 nicht auftritt. Für die Planetenbahnen kann dieser Term gegenüber u = r und M c2 vernachlässigt werden. Deshalb löst man zunächst den Newtonschen Fall, L2 eine inhomogene lineare Differentialgleichung, mit offensichtlicher Lösung u0 = Mc2 1 + ǫ cos(ϕ − ϕ0 )) . L2 (19.12) Diese Näherung wird (mit Anfangsbedingung ϕ0 = 0) in die rechte Seite von (19.11) eingesetzt: u′′1 + u1 = Mc2 3M 3 c4 ǫ2 ǫ2 1 + + + 2ǫ cos ϕ + cos(2ϕ) . L2 L4 2 2 66 Preliminary version – 4. August 2016 (19.13) Das ist wieder eine lineare Schwingungs-Differentialgleichung mit periodischer äußerer Kraft, welche einen Resonanzanteil ∝ cos ϕ trägt. Entsprechend der allgemeinen Lösungstheorie gibt es eine mit ϕ linear wachsende spezielle Lösung: 3M 3 c4 ǫ2 ǫ2 Mc2 1 + + ǫϕ sin ϕ − cos(2φ) . (19.14) u1 = 2 1 + ǫ cos ϕ + L L4 2 6 3 4 Der Vorfaktor 3ML4c ist im Sonnensystem extrem klein. Über sehr viele Umläufe 3 4 ϕ = 2πN wird dennoch ein merklicher Beitrag 3ML4c ϕ generiert. Vernachlässigen wir alle in ϕ beschränkten Zusatzterme in u1 und setzen näherungsweise 3 4 3 4 3 4 sin 3ML4c ϕ ≈ 3ML4c ϕ und cos 3ML4c ϕ ≈ 1, so entsteht u1 = 1 Mc2 3M 2 c2 = 2 1 + ǫ cos 1 − ϕ r L L2 a 3M = ϕ . 1 + ǫ cos 1 − 1 − ǫ2 a(1 − ǫ2 ) (19.15) wobei wir die den Drehimpuls durch die große Halbachse L2 L2 1 1 1 = + a = (rmax + rmin) = 2 2Mc2 1 + ǫ 1 − ǫ Mc2 (1 − ǫ2 ) ausgedrückt haben. Weiter können wir den halben Schwarzschild-Radius, der die Sonnenmasse enthält, wie üblich über die Umlaufzeit T und die Halbachse ausgedrücken: Integration des Drehimpulses liefert Z 2π Z 2π Z T Z T a2 (1 − ǫ2 )2 dϕ 2 2 = dϕ r (ϕ) = dϕ TL = dtL = dτ r (τ ) dτ (1 + ǫ cos ϕ)2 0 0 0 0 √ = 2πa2 1 − ǫ2 Folglich ist L2 = u1 = 4π 2 a4 (1−ǫ2 ) T2 = aMc2 (1 − ǫ2 ), also M = 4π 2 a3 . c2 T 2 Damit entsteht 1 12π 2 a2 a ϕ . 1 + ǫ cos 1 − = r 1 − ǫ2 c2 T 2 (1 − ǫ2 ) (19.16) Damit ist der Winkelabstand zwischen nachfolgenden Periheldurchgängen nicht 2 a2 2π, sondern näherungsweise 2π 1 + c2 T12π , d.h. das Perihel wandert pro Um2 (1−ǫ2 ) lauf um ∆ϕ = 24π 3 a2 T 2 c2 (1 − ǫ2 ) (19.17) in Drehrichtung weiter: Die Planetenbahnen sind also keine Ellipsen mehr, sondern Rosetten. Für den Merkur mit T = 88 d und a = 5.79 · 1010 m, ǫ = 0.206 ergibt sich [Einstein, Nov. 1915] (∆ϕ)Merkur = 5.03 · 10−7 = 43.03′′ . Jahrhundert 67 Preliminary version – 4. August 2016 Tatsächlich führen die Störungen des Zweikörperproblems sowieso zu Rosettenbahnen, und diese Störungen überwiegen. Für den Merkur findet man insgesamt 574′′ /Jahrhundert, wovon 277′′ auf die Venus zurückgehen, 153′′ auf den Jupiter usw. Nach Abzug dieser Störungen verblieb ein in der Newtonschen Himmelsmechanik unerklärter Rest von (43.11 ± 0.45)′′ /Jahrhundert. Die perfekte Übereinstimmung mit der Vorhersage war die erste grandiose Bestätigung der Allgemeinen Relativitätstheorie. 20 Lichtablenkung Ausgangspunkt sind wieder die Geodätengleichungen für die Christoffel-Symbole zur Schwarzschild-Metrik. Diese Gleichungen haben dieselben ersten Integrale (19.3) für Drehimpuls und (19.4) für Energie, aber der Kurvenparameter parmatrisiert eine Nullgeodäte: 1 dr 2 L2 E2 dxµ dxν − = (20.1) 0 = gµν − 2 . 2M dτ dτ dτ r 1 − 2M 1 − |{z} r r = L dr r 2 dφ Damit wird das effektive Potential für Nullgeodäten L2 M L2 − . (20.2) 2r 2 r3 Streulösungen, die einer Lichtablenkung entsprechen, sind nur möglich für r > 3M. Für r = 3M gibt es eine instabile Kreisbahn, während Licht, das sich bis auf < 3M dem Ursprung nähert, dort endet. Die Streubahnen parametrisieren wir wie zuvor durch den inversen Radius u = 1r : V0 (r) = E2 − u2 (1 − 2Mu) ⇒ u′′ + u = 3Mu2 . (20.3) L2 Die exakte Lösung ist wieder durch elliptische Funktionen gegeben, die nicht anschaulich zu diskutieren sind. Wir nutzen deshalb, daß 3Mu2 sehr klein ist und in der Newtonschen Theorie nicht auftritt. Die Newtonsche Lösung von u′′0 + u0 = 0 ist u0 = 1r = 1d cos(ϕ − ϕ0 ), also d = r cos(ϕ − ϕ0 ) beschreibt, wie erwartet, eine im Abstand d vom Ursprung verlaufende Gerade. Diese wird (bei sinnvoller Wahl ϕ0 = 0) als erste Näherung in die rechte Seite eingesetzt: (u′ )2 = 3M (1 + cos(2ϕ)) (20.4) 2d2 Das ist wieder eine Schwingungs-Differentialgleichung mit periodischer äußerer Kraft, aber ohne Resonanz: u′′1 + u1 = u1 = 1 1 3M 1 1 M = cos ϕ + 2 (1 − cos(2ϕ)) = cos ϕ + 2 (2 − cos2 ϕ) r d 2d 3 d d 68 Preliminary version – 4. August 2016 (20.5) Die Winkel, bei denen der Lichtstrahl im Unendlichen ist, entsprechen den Nullstellen dieser Gleichung. Insgesamt ist der Winkel gemäß u1 ≥ 0 zu wählen. Damit läuft für M = 0 der Winkel von − π2 bis + π2 . Für M > 0 darf cos ϕ etwas negativ werden: r 8M 2 2M d 1− 1+ 2 ≈− , (20.6) cos ϕ0 = 2M d d 3 ) = − π2 − 2M + O( Md3 ) ∈ [−π, − π2 ] und der Lichtstrahl verläuft von arccos(− 2M d d 3 nach arccos(− 2M ) = π2 + 2M + O( Md3 ) ∈ [ π2 , π]. Somit beträgt der Gesamtablend d kungswinkel eines den Ursprung im Abstand d passierenden Lichtstrahls 4M . (20.7) d Nimmt man für d den Radius 6.96 · 105 km der Sonne, so folgt ∆ϕ = 8.47 · 10−6 = 1.75′′ . Zum Vergleich sehen wir uns die Lichtablenkung in der Newtonschen Theorie an. Ein sich im sonnennächsten Punkt d befindendes Photon hat offenbar den M c2 Drehimpuls L = dc, so daß nach (19.12) gilt: d1 = (dc) 2 (1 + ǫ). Somit bestimmen sich die asymptotischen Winkel aus der Gleichung d M 0 = 1 + ǫ cos ϕ = 1 + − 1 cos ϕ ⇒ φ = arccos(− ) . M d 2M Damit entsteht ∆N ϕ ≈ d , exakt der halbe Wert gegenüber der SchwarzschildLösung. Auch eine Rechnung nur auf Grundlage des Äquivalenzprinzips, die nur g00 , nicht aber g11 berücksichtigt, führt ebenfalls auf diesen halben Wert. Alle diese Aussagen sind natürlich nur in der Nährung Md ≫ 1 richtig. Nahe der (instabilen) Lichtkreisbahn d = 3M muß exakt gerechnet werden, und die relativen Faktoren zur Newtonschen Theorie werden stark von 2 abweichen. Die Vorhersagen können überprüft werden, indem man Photographien einer totalen Sonnenfinsternis, auf denen Sterne zu sehen sind, vergleicht mit Aufnahmen derselben Sterne am Nachthimmel. Die erste Gelegenheit war eine Finsternis am 29.3.1919, zu der zwei Expeditionen nach Brasilien und eine Insel vor Afrika geschickt wurden. Zurückgerechnet auf den Sonnenrand fand man Lichtablenkungen von (1.98±0.16)′′ bzw. (1.61±0.40)′′. Das Newtonsche Ergebnis konnte damit ausgeschlossen werden. Die Fehler konnten bei folgenden Finsternissen reduziert werden. Die seit den 60er Jahren beste Methode besteht in der Verfinsterung von Quasaren, die im Radiowellenbereich stärker (oder zumindest vergleichbar) strahlen als die Sonne. Jährlich am 8. Oktober bedeckt die Sonne den Quasar 3C 279, während 3C 273 gleichzeitig einen Winkel von 10◦ bildet. ∆ϕ ≈ 20.1 Gravitationslinsen Betrachtet man eine Schar von Lichtkurven, die das gravitative Zentrum in unterschiedlichen Abständen passieren, so folgt aus der Symmetrie des Problems, 69 Preliminary version – 4. August 2016 daß die Lichtstrahlen auf einer Brennlinie fokussiert werden, die Teilmenge der Geraden durch Lichtquelle und Zentrum ist. Es liegt eine Gravitationslinse vor. Die Brennlinie ist jedoch ein entscheidender Unterschied zum Brennpunkt bei üblichen Linsen. Bei parallelen Lichtstrahlen und minimalem Abstand d beginnt d2 d = 4M . Für die Sonne läuft das auf etwa 10−2 die Brennline im Abstand x = ∆ϕ Lichtjahre hinaus, so daß für Beobachter auf der Erde die Sonne, und allgemein jeder Stern der Milchstraße, nicht als Gravitationslinse in Frage kommt. Dagegen können ausgedehntere Materieverteilungen (außerhalb der Michtstraße, z.B. Galaxien oder Galaxienhaufen) durchaus als Gravitationslinse für noch weiter entfernte Objekte wirken. Solche Linsen sind sehr häufig! Liegen Quelle, Linse und Beobachter exakt auf einer Geraden, so wird die Quelle als ‘Einstein-Ring’ abgebildet. Ansonsten erwartet man bei sphärisch-symmetrischer Materieverteilung in der Linse genau zwei Bilder. Reale Gravitationslinsen weichen von der sphärischen Symmetrie ab, so daß es neben Teilringen auch z.B. 4 Bilder derselben Quelle geben kann (Einstein-Kreuz). Ob es sich um Bilder derselben Quelle handelt, wird durch Abgleich der sehr charakteristischen Spektren ermittelt. Eine genauere Analyse zeigt, daß eines der Bilder verstärkt ist. Manche sehr entfernte Galaxien können nur durch diese Lichtverstärkung durch die größten Teleskope der Erde oder das Hubble Space Telescope gesehen werden. 21 Innere Schwarzschild-Lösung Ausgangspunkt ist wieder der radialsymmetrische Ansatz (18.2) für das metrische Tensorfeld, jedoch mit anderen Funktionen λ(r, t) und ν(r, t), die durch Lösung der Einsteinschen Feldgleichungen zum Energie-Impulstensor (13.8) einer idealen Flüssigkeit p(r) T µν = ̺(r) + 2 uµ uν − p(r)g µν c bestimmt werden. Dabei sollen Dichte und Druck Funktionen allein von r sein, und die Flüssigkeit soll ruhen. Im Ruhsystem hat die Vierergeschwindigkeit nur eine zeitliche Komponente u0 6= 0, die sich aus der Nebenbedingung gµν uµ uν = c2 bestimmt zu ν uµ = (e− 2 , 0, 0, 0) . In dieser Wahl gilt T01 = 0, so daß unverändert die Gleichung R01 = 0 und damit λ = λ(r) folgt. Wir lösen die Einsteinschen Feldgleichungen in der Form (14.6). Dabei ist Tρρ = ̺c2 − 3p und deshalb 1 eν c2 2 T00 − g00 Tρρ = (̺c + 3p) , 2 2 1 p − ̺c2 ρ Tjj − gjj Tρ = gjj für j = 1, 2, 3 . 2 2 70 Preliminary version – 4. August 2016 (21.1) (21.2) Insbesondere hängt die (22)-Komponente nicht von der Zeit ab, so daß wie im Vakuum ν = ν(r) gesetzt werden kann. Somit entstehen mit (18.4) die Gleichungen ν ′′ ν ′2 ν ′ λ′ ν ′ ̺c2 + 3p = e−λ + − + 2 2 4 4 r 2 ′2 ′ ′ ′′ p − ̺c ν νλ λ′ −λ ν κ =e + − − 2 2 4 4 r 1 1 1 p − ̺c2 = − 2 + e−λ 2 + (ν ′ − λ′ ) . κ 2 r r 2r κ (21.3) Die halbe erste Gleichung, minus die halbe zweite Gleichung minus die dritte Gleichung lautet: κ̺c2 = ′ 1 1 1 d −λ −λ λ . r − re + e − ) = r2 r r2 r 2 dr (21.4) Sie kann deshalb integriert werden zu −λ e 2M(r) , =1− r κc2 M(r) = 2 Z r dx x2 ̺(x) . (21.5) 0 Bei einer isolierten Materieverteilung mit ̺(r) = 0 für r > R wird M(r) = R κc2 R ds s2 ̺(s) =: M = const für r > R, so daß genau die Schwarzschild2 0 Lösung im Vakuum erhalten wird, mit konkreter Berechnungsvorschrift für die Masse M aus der Dichteverteilung. Wir erhalten (zumindest für λ) einen stetigen N Anschluß an die äußere Schwarzschild-Lösung. Mit κ = 8πG wird scheinbar c4 exakt R R das 2Ergebnis der Newtonschen Theorie bezüglich der Gesamtmasse m = 4π 0 ds s ̺(s). Zu beachten ist jedoch, daß das nicht das Volumenintegral der Dichte ist: dieses Integral ist Z Z Z π Z 2π p κc2 κc2 R M0 := dvol(r, ϑ, ϕ) ̺(r) = dr dϑ dϕ det g (3) ̺(r) 8π 8π 0 0 0 Z π Z 2π 2 Z R λ κc = dr dϑ dϕ e 2 r 2 sin ϑ ̺(r) 8π 0 0 0 Z r 2 ̺(r) κc2 R >M . (21.6) dr q = 2 0 2M(r) 1− r Die Differenz kann als gravitative Bindungsenergie aufgefaßt werden. Um ν zu bestimmen, bilden wir die Differenz aus der ersten und zweiten Gleichung (21.3): κ(̺c2 + p) = e−λ ν ′ + λ′ ν ′ 2M(r) = e−λ − + κc2 ̺ . r r r3 71 Preliminary version – 4. August 2016 (21.7) Es folgt ν′ = 2M(r) + κpr 3 . r(r − 2M(r)) (21.8) Damit ist (21.3) jedoch noch nicht identisch erfüllt. Einsetzen z.B. in die erste Gleichung (21.3) führt auf eine komplizierte Gleichung für p′ . Diese kann durch folgende Überlegung vereinfacht werden: Wir wissen, daß die Feldgleichungen nur integrabel sind für 0 = ∇ν T µν . Die Gleichungen ∂t ̺ = 0 = ∂t p sowie ∂t u0 = 0, die in der speziellen Relativitätstheorie eine ruhende Flüssigkeit beschreiben bzw. aus obiger Diskussion folgen, führen im Ruhsystem auf uν ∂ν ̺ = 0, uν ∂ν p = 0, ∂ν uν = 0. Nach Korrespondenzprinzip werden daraus die tensoriellen und damit im beliebigen Koordinatensystemen richtigen Gleichungen 0 = uν ∇∂ν ̺ , 0 = uν ∇∂ν p , 0 = ∇∂ν uν . Deshalb reduzieren sich die Integrabilitätsbedingungen auf p(r) ν p(r) ν µ ρ µσ µ g ∂σ p = ̺(r) + 2 u ∇ν u = ̺(r) + 2 u Γνρ u . c c Es verbleibt eine Bedingung (21.9) M(r) + κpr 3 /2 ν′ , (21.10) p′ = − (̺c2 + p) = −(̺c2 + p) 2 r(r − 2M(r)) die Tolman-Oppenheimer-Volkoff-Gleichung des hydrostatischen Gleichgewichts. Zu ihrer Integration benötigt man die Zustandsgleichung ̺ = ̺(p). Aus der Lösung erhält man dann die verbleibende Funktion eν(r) der Metrik. Der einfachste, zwar wenig realistische, aber dennoch lehrreiche Fall ist die Annahme konstanter Dichte, was einer inkompressiblen Flüssigkeit entspricht. ν Die erste Gleichung in (21.10) kann integriert werden zu Ke− 2 = ̺c2 + p für eine Integrationskonstante K. Ist R der Radius des Sterns, so folgt 1 r3 M(r) = κc2 ̺r 3 = M 3 . 6 R Damit wird aus (21.7) ν 2Mr 2 ν ′ 4M + 3 κKe− 2 = 1 − R3 r R 1 2Mr 2 1−α e−βν d 2Mr 2 α βν = 1− 1 − e . β R3 r dr R3 α=−β (21.11) (21.12) Bei sinnvoller Wahl von β = 12 ergibt sich die Lösung (mit Integrationskonstanten A, B) zu Z r κKR3 κKs 2Mr 2 − 12 ν(r) 2Mr 2 − 21 2 = = A + ds 1− e −B 1 − s2 32 R3 4M R3 2(1 − 2M ) 0 3 R r 3 2 ν(r) κKR 2Mr K ⇒ e 2 = −B 1− = 2 . (21.13) 3 4M R ̺c + p 72 Preliminary version – 4. August 2016 Daraus und unter Verwendung von (21.11) gewinnen wir den Druck: q r2 K − 2̺c B 1 − 2M 3 2 R 2 q p(r) = ̺c . 2M r 2 3K − B 1 − 2̺c2 R3 (21.14) Im Gleichgewicht muß q der Druck an der Oberfläche verschwinden, p(r = R) = 0. K 1 − 2M und damit Somit ist 2̺c 2 = B R q q r2 1 − 2M 1 − 2M − R3 R 2 q p(r) = ̺c q . 2M r 2 2M 3 1 − R − 1 − R3 Der Druck wird, wie erwartet, maximal im Zentrum r = 0 q 1 − 1 − 2M R . p(0) = ̺c2 q 2M 3 1− R −1 (21.15) (21.16) Aus der Forderung, daß ein endlicher Druck p(0) die Gravitationskraft kompensiert, folgt die Bedingung 9 1 2 3 1 2 9 3 R > ⇒ M = κc R > κc M 2M 8 6 6r 4 c2 M 2 1 c2 8 4c3 p ⇒ m= < = . (21.17) √ GN GN 9 3κc2 ̺ 9 3πG3N ̺ Ein Stern gegebener Masse kann nur stabil sein, wenn der Radius genügend groß bzw. die Dichte genügend klein ist. Zwar gilt die Herleitung nur unter der Annahme ̺ = const, die Schlußfolgerung bleibt aber ganz allgemein richtig: i) Ist der Radius R vorgegeben und die Dichteverteilung beliebig innerhalb der einzig sinnvollen Relationen ̺(r) > 0 und ̺′ (0) < 0, dann ist die maximal mögliche Masse des Sterns jene aus der uniformen Dichteverteilung 2M < 8 R. 9 ii) Für jede vorgegebene Zustandsgleichung ̺(p), die bis zu ̺ ≤ ̺0 gültig ist, gibt es unabhängig von der oberhalb ̺0 gültigen Zustandsgleichung eine obere Schranke für die Masse. Die Argumentation in (ii) beruht auf der Aufteilung in einen Kern der Dichte ≥ ̺0 , der nach (i) eine maximale Masse haben muß, und der genaueren Rechnung für die Schale der Dichte < ̺, plus Stetigkeit des Drucks an der Grenzfläche. Typische Sterne haben relativ geringe Dichte (̺ = 1.4 g/cm3 für die Sonne) und können deshalb sehr massiv sein. Es liegt ein Gleichgewicht vor zwischen 73 Preliminary version – 4. August 2016 Temperatur, Kernfusionsrate, Druck und Dichte. Das Zünden der jeweils nächsten Kernfusionstypen erfordert jedoch immer höhere Dichten, so daß irgendwann die Masseschranken wesentlich werden. Es zeigt sich, daß in Sternen unterhalb 1.4 Sonnenmasse (Chandrasekhar-Grenze) der Druck des entarteten Elektronengases genügt, um selbst bei Versiegen der Kernfusion und Temperatur = 0 eine Dichte aufrechtzuerhalten, die auf R ≫ 2M führt. Noch massivere Sterne kollabieren zu Neutronensternen. Die Dichte ist jene der Kernmaterie und bereits so groß, daß die nach (21.17) maximal mögliche Masse mit etwa 2 Sonnenmassen nicht viel größer ist als die Chandrasekhar-Grenze. Verbleibt selbst nach Abstoßen von Material durch eine Supernova mehr Masse als diese Grenze, so gibt es keinen stabilen Zustand für den Stern: Die einsetzende gravitative Kontraktion vergrößert die Dichte, verkleinert damit die maximale Masse. Der Stern kollabiert zu einem schwarzen Loch. Neutronensterne haben wegen ihrer kleinen Radien sehr hohe Rotationsgeschwindigkeit (wegen Drehimpulserhaltung) von 100 bis 1000 Rotationen pro Sekunde und sehr starkes Magnetfeld. Stimmen Rotationsachse und Magnetfeldachse nicht überein, so wird gebündelte Synchrotronstrahlung in Richtung der Dipolachse emittiert. Trifft dieser Strahl die Erde, so spricht man von einem Pulsar. Solche Pulsare und allgemein Neutronensterne sind ideal, um die Vorhersagen der Allgemeinen Relativitätstheorie zu überprüfen. 22 Schwarze Löcher Ein schwarzes Loch ist eine Konzentration einer Masse m innerhalb eines RadiN us R < 2M = 2mG . Wir hatten gesehen, daß ein solcher Zustand kann nicht c2 mehr über den Energie-Impuls-Tensor einer idealen Flüssigkeit beschrieben werden kann. Es war zunächst fraglich, ob es solche Massekonzentrationen tatsächlich 2 a3 über einen Doppelgibt. Anhaltspunkt wäre die Bestimmung von 2M = 8π c2 T 2 sternbegleiter. Findet man 2M > 6 . . . 8 km, so muß ein stellares schwarzes Loch vorliegen. Ebenso können Sternhaufen oder die Kerne von Galaxien über die Bahnen umlaufender Sterne gewogen werden. Im Zentrum der Milchstraße gibt es mit Sagittarius A∗ eine Quelle von Radiowellen. Der Stern S2 hat bei einer großen Halbachse von a = 980 astronomischen Einheiten eine Umlaufzeit von nur T = 15.2 Jahren. Zusammen mit der Exzentrizität von ǫ = 0.876 ergibt sich ein minimaler Bahnabstand von 17 Lichtstunden, der dreifachen Entfernung Sonne-Pluto. Man erhält für Sagittarius A∗ einen Schwarzschild-Radius von 2M = 1.27 · 1010 m, was 4.2·106 Sonnenmassen entspricht. Diese Masse ist innerhalb eines Radius von < 6 Lichtstunden konzentriert (folgt aus Bahn von S14). Da andere Konfigurationen nicht über das gesamte Alter der Milchstraße stabil sein können, geht man davon aus, daß Sagittarius A∗ ein supermassives schwarzes Loch ist. In diesem Abschnitt geht es darum zu verstehen, was beim Durchgang durch die Singularität r = 2M passiert. Zunächst stellt man fest, daß die Singularität 74 Preliminary version – 4. August 2016 r = 2M eine Koordinatensingularität der Schwarzschild-Metrik ist. Skalare Funk2 tionen der Metrik wie det g = −c2 r 4 sin2 ϑ und Rµνρσ Rµνρσ = 48 Mr6 erweisen sich als stetig bei r = 2M, lassen jedoch ein Problem bei r = 0 erwarten. Wir sehen uns zunächst für einen radial fallenden Beobachter, d.h. für L = 0, die Annäherung an r = 2M an. Aus (19.6) folgt für die Eigenzeitdifferenz auf der radialen Bahn zwischen r > 2M und 2M Z r ds q <∞. (22.1) ∆τ = 2M c2 2 2 2M E −c + s Für einen äußeren Beobachter, der seine Koordinatenzeit t verwendet, ist dt = dt dτ dr und deshalb dτ dr Z r ds E q →∞. (22.2) ∆t = 2M 2M c2 2 2 2M 1 − s E −c + s Während ein mitbewegter Beobachter den kritischen Radius r = 2M in endlicher Zeit erreicht und (wie wir sehen werden) ohne Schaden passiert, sieht ein entfernter Beobachter ihn nie durch die Kugelschale r = 2M fallen. Für Licht kann nur die Koordinatenzeit sinnvoll betrachtet werden, da der Kurvenparameter τ keine physikalische Bedeutung hat. Aus der für L = 0 gültigen Gleichung (19.5) der Nullgeodäten 1 dr 2 2M d(ct) 2 − 0= 1− r dτ dτ 1 − 2M r (22.3) folgt ∆t = Z r 2M ds →∞, 1 − 2M s (22.4) so daß für den äußeren Beobachter auch Licht die Kugelschale r = 2M nie erreicht. In der Realität werden fallende Materie und davon ausgesandte Lichtsignale dennoch unsichtbar für äußere Beobachter, da wegen der gravitativen Frequenzänderung (18.11) die Wellenlänge unendlich rotverschoben ist. Ein bei r = 2M mit Frequenz ν2M aussgesandtes Signal erreicht den Radius r mit Frequenz s p 2M 1 − 2M g00 (2M) νr p = =0. (22.5) = ν2M 1 − 2M g00 (r) r Auch deshalb kann ein äußerer Beobachter keine Information über die Physik bei r = 2M erhalten: Der Schwarzschild-Radius ist für jeden äußeren Beobachter ein Horizont. 75 Preliminary version – 4. August 2016 22.1 Kruskal-Szekeres-Koordinaten Jede Koordinatentransformation überführt eine Lösung der Feldgleichungen in eine andere Lösung. Die Schwarzschild-Metrik deformiert Lichtkegel. Deshalb suchen wir eine Beschreibung in Lichtkegelkoodinaten, in denen der Lichtkegel immer derselbe bleibt. Die Gleichung einer radialen (L = 0) Nullgeodäte in der r = ± r−2M , so daß Schwarzschild-Metrik ist nach (22.3) d(ct) dr r ct = ±r∗ + const , r∗ = r + 2M log − 1 . (22.6) 2M Wie definieren somit die Lichtkegelkoordinaten u = ct − r∗ und v = ct + r∗ . Die hybriden Eddington-Finkelstein-Koordianten (v, r, ϑ, ϕ) führen bereits auf eine bei r = 2M reguläre Metrik 2M g = 1− (dv)2 − 2(dr)(dv) − r 2 (dϑ)2 − r 2 sin2 ϑ(dϕ)2 . (22.7) r Besser ist es auch r zu eliminieren: 2M g =− 1− du dv − r 2 (dϑ)2 − r 2 sin2 ϑ(dϕ)2 , r (22.8) wobei r(u, v) für r > 2M und der Umformung r r r r∗ r v−u −1= −1= − 1 + log − 1 = log − 1 e 2M −1 4M 2M 2M 2M 2M durch die Lambert W -Funktion W (z)eW (z) = z gegeben ist, v−u r = 2M + 2MW (e 4M −1 ) . (22.9) Es gilt W (x) > 0 für x > 0. Die W -Funktion hat jedoch eine Fortsetzung zu W : [− 1e , 0] → [−1, 0], über die wir eine Fortsetzung der Lösung in das Gebiet 0 < r < 2M definieren. Dazu verwenden wir neue Koordinaten v V := e 4M =: X + T , u U := −e− 4M =: T − X , in denen mit (4M)2 dU dV (4M)2 dU dV du dv = − =− −1 e (−UV e ) e W (−UV e−1 )eW (−U V e−1 ) 32M 3 − r dU dV dU dV (4M)2 = e 2M =− r r e ( 2M r 1 − 2M − 1)e 2M −1 r entsteht: g= 32M 3 − r e 2M ((dT )2 − (dX)2 ) − r 2 (dϑ)2 − r 2 sin2 ϑ(dϕ)2 . r 76 Preliminary version – 4. August 2016 (22.10) Dabei ist r = 2M + 2MW ct = 2M log X2 − T 2 e , X +T , X −T X 2 − T 2 ≥ −1 , (22.11) wobei die bisherige Koordinatenzeit nur für X > T , entsprechend r > 2M erklärt ist. Die Koordinaten (T, X, ϑ, ϕ) heißen Kruskal-Szekeres-Koordinaten. Das Kruskal-Diagramm stellt radiale Bahnen im X-T -Koordinatensystem dar. Einige Bemerkungen: • Die Kruskal-Koordinaten (T, X, ϑ, ϕ) haben für alle zugelassenen Werte X 2 − T 2 > −1 die korrekte Lorentz-Signatur und parametrisieren deshalb eine Lorentz-Mannigfaltigkeit, in die die bisherige Schwarzschild-Raumzeit isometrisch eingebettet ist. • Radiale Nullgeodäten (ϑ, ϕ konstant) sind global gegeben durch T = ±X + const, so daß Lichtkegel überall dieselben sind. • Die beiden Hyperbeln {X 2 = T 2 − 1 , T > 1} und {X 2 = T 2 − 1 , T < −1} beschreiben die Singularität r = 0 und begrenzen von oben und unten das zulässige Gebiet. Die Geraden X = T und X = −T beschreiben den Schwarzschild-Horizont r = 2M. Hier divergiert die Koordinatenzeit t nach ±∞. Zusammen mit den begrenzenden Hyperbeln r = 0 teilen sie die Kruskal-Raumzeit in 4 Gebiete: I: X > |T |. Dieses ist die eigentliche Schwarzschild-Raumzeit mit korrekt definierter Koordinatenzeit t. √ II: T 2 − 1 < |X| < T . Das innerhalb des üblichen SchwarzschildHorizonts liegende Gebiet, entsprechend 0 < r < 2M. Die Koordinatenzeit t ist hier nicht erklärt. I’: X < −|T |. Eine mit der Schwarzschild-Raumzeit I nicht zusammenhängende Kopie derselben. Eine Koordinatenzeit kann definiert werden. √ II’: T 2 − 1 < |X| < −T . Eine mit II nicht zusammenhängende Kopie von II. • Bahnen t = const in I und I’ sind Geraden T = αX mit |α| < 1. Bahnen r = const sind Hyperbeln X 2 − T 2 = const. • Ein Beobachter in I kann jeden Radius r > 2M in I, den Teil X > 0, T > 0 des Horizonts r = 2M und jeden Radius 0 < r < 2M in II erreichen. • Ein Beobachter in I’ kann jeden Radius r > 2M in I’, den Teil X < 0, T > 0 des Horizonts r = 2M und jeden Radius 0 < r < 2M in II erreichen. 77 Preliminary version – 4. August 2016 • Ein Beobachter in II und auch von ihm ausgesandtes Licht kann keines der anderen Gebiete I,I’,II’ erreichen. Deshalb wird II als Schwarzes Loch bezeichnet. • Jede kausale Bewegung in II verringert den Koordinatenradius r. Der Beobachter endet unvermeidlich nach endlicher Eigenzeit in der Singularität r = 0. Diese Zeit läßt sich am besten ausder formal fortgesetzten dr 2 > c2 führt. Damit folgt Schwarzschild-Metrik berechnen, die auf 2M1−1 dτ r für die Eigenzeit von r nach 0 r Z r p ds r q c(∆τ )(r) = = 2M arcsin − r(2M − r) ≤ πM . 2M 2M 0 −1 s Diese Eigenzeitdifferenz ist umso kürzer, je kleiner r bereits ist. Räumlich ausgedehnte Objekte werden deshalb auseinandergerissen. • Ob in II eine andere Koordinatenzeit sinnvoll erklärt werden kann, in der man rückwärts läuft und so die eigene Zukunft sehen kann, ist unklar. • Beobachter aus I und I’ können sich in II treffen, bevor sie die Singularität erreichen. • Der Radius eines Sterns schirmt das Gebiet links der Bahnkurve u(R, T ) des Sternrands ab, einschließlich der Gebiete I’,II’. Dort ist Tµν 6= 0 und die Lösung I’,II’ nicht relevant. Der kollabierende Stern erreicht jedoch einen Teil des Gebiets II. Jeder Punkt des Sterns, der den Horizont r = 2M überschritten hat, endet nach endlicher Eigenzeit in der Singularität r = 0. • Deshalb können beim Sternkollaps gebildete schwarze Löcher II keine Verbindung zu einer weiteren Raumzeit II’ haben. Nur primordiale schwarze Löcher, die von Anfang an existiert haben, könnten mit einem Gebiet II’ in Verbindung stehen. • Ein Beobachter in II’ wird nach endlicher Kruskal-Zeit in eines der Gebiete I,I’,II getrieben. Deshalb definiert II’ ein weißes Loch, das Strahlung oder jede Form von Materie und Beobachtern emittiert. Da sich so die Physik in I (und I’) beliebig beeinflussen ließe, darf es das Gebiet II’, außer in einer Form des Urknalls, nicht geben. • Spekulativ sind Verklebungen von Schwarzschild-Horizonten an verschiedenen Orten im Universum zu einem Wurmloch. 23 23.1 Ergänzungen Zur Thermodynamik schwarzer Löcher Die Kerr-Lösung (1963)ist eine Verallgemeinerung der Schwarzschild-Lösung auf den Außenraum rotierender Sterne oder rotierender schwarzer Löcher. Die Metrik wird dann durch M, L parametriesiert. Hier ist keine innere Kerr-Lösung 78 Preliminary version – 4. August 2016 bekannt. Auch elektrische Ladungen Q sind möglich (Schwarzschild 7→ ReissnerNordström, Kerr 7→ Kerr-Newman). Penrose und Hawking haben ab den 60er Jahren Singularitäten-Theoreme bewiesen. Die Singularität ist im Sinn kausaler Unvollständigkeit zu verstehen, d.h. es gibt nicht fortsetzbare Geodäten. Die Theoreme beweisen unter Positivitätsannahmen an die Energie wie Tµν uµ uν ≥ 0 (schwache Energiebedingung), daß jedes schwarze Loch (nicht nur die Schwarzschild-Lösung) eine Singularität enthält. Ein weiteres Ergebnis in diesem Umfeld is das No-Hair-Theorem, besser NoHair-Vermutung. Es besagt, daß das äußere Gravitationsfeld schwarze Löcher nur durch die drei Parameter Masse m, Drehimpuls J = mL und Ladung Q parametrisiert ist, d.h. die Kerr-Newmann-Lösung wäre die allgemeinste. Diese wenigen Informationen entsprechen sehr wenig Entropie. Insbesondere ließe sich Entropie vernichten, indem man sie in das schwarze Loch schickt. Um den 2. Hauptsatz der Thermodynamik dennoch zu retten, wurde eine Größe gesucht, die in der Summe mit der Entropie im Außenraum stets zunimmt. Anhaltspunkt war ein Theorem von Hawking, nach dem die Gesamtoberfläche r G m 2 G Q2 2 G m J2 J N N N + − (23.1) − A = 4π rh2 + 2 2 , rh := mc c2 c2 c4 m2 c2 der Horizonte beim Verschmelzen schwarzer Löcher stets zunimmt. Bekenstein konnte so folgende Formel für die Entropie schwarzer Löcher herleiten: A k B c3 A S = kB 2 = . 4ℓP 4GN ~ (23.2) In verschiedenen Varianten der Quantegravitation versucht man, diese Formel durch Abzählen von Mikrozuständen zu verstehen. Die Rolle der Oberfläche in dieser Formel gab Anlaß zur Formulierung holographischer Prinzipien von ’t Hooft und Susskind. Diese behaupten, daß jede über die Entropie schwarzer Löcher hinausgehende Information, z.B. über einkommende und (s.u.) abgestrahlte Teilchen, auf der Horizont-Oberfläche eingeprägt ist, die wie ein Hologramm die Wechselwirkung des Universums mit dem schwarzen Loch kodiert. Wenn schwarze Löcher eine Entropie haben, sollten sie auch eine Temperatur haben, die Hawking-Temperatur 2~c rh − GcN2m J,Q=0 ~c3 T = −→ · . kB A 8πGN kB m (23.3) Ensprechend sollten schwarze Löcher strahlen. Sehr vereinfacht passiert folgendes: Nahe am Horizont, aber noch im Gebiet I, wird aus dem Vakuum ein virtuelles Teilchen-Antiteilchen-Paar erzeugt. Bevor sie rekombinieren, fällt eines der Teilchen in den Horizont, während das andere entkommt und zur Strahlung beiträgt. Die dazu notwendige Energie muß aus dem schwarzen Loch kommen, d.h. seine 79 Preliminary version – 4. August 2016 Masse verringern. Umgekehrt empfängt das schwarze Loch Temperaturstrahlung aus dem Universum. Sobald das Universum durch seine Expansion kühler wird als das schwarze Loch, überwiegt die Abstrahlung, die sich mit abnehmender Masse weiter beschleunigt und am Ende das schwarze Loch vollständig verdampft. Gegenwärtig könnten primordiale schwarze Löcher der Masse 1014 g verdampfen, was jedoch nicht beobachtet wurde. Schwarze Löcher mit 2 Sonnenmassen verdampfen in 1067 Jahren. 23.2 Zur Vereinigung der fundamentalen Wechselwirkungen Die beiden Steiten der Einsteinschen Feldgleichungen, Rµν − 12 Rgµν bzw. Tµν , haben einen völlig unterschiedlichen Charakter. Die linke Seite ist rein geometrisch, die rechte zunächst nicht. Kaluza und Klein haben schon in den 20er Jahren eine vereinheitlichte Theorie von Gravitation und Elektromagnetismus in 5 Dimensionen vorgeschlagen. Dabei ist die 5. Dimension zu einem genügend kleinen Kreis kompaktifiziert. Das Vektorpotential Aµ ist dabei die Komponente gµ5 der Metrik. Letztlich scheitert dieses Programm, weil weitere Elementarteilchen und Kräfte gefunden wurden, die nicht in der Metrik unterzubringen sind. Allerdings haben gerade diese Kräfte, die wir als elektromagnetische, schwache und starke Wechselwirkungen bezeichnen, eine sehr natürliche geometrische Interpretation als Zusammenhänge in Faserbündeln über der Raumzeit-Mannigfaltigkeit. Diese Yang-Mills-Felder lassen sich gemeinsam mit der Gravitation zu einem einzigen geometrischen Objekt kombinieren, dem Dirac-Operator 1 . D = γ a eµa i∂µ + [γb , γc ]ωµbc + τK AK µ 8 Dabei sind die γ-Matrizen γ a die Generatoren der Clifford-Algebra {γ a , γ b } = η ab 1, eµa sind die Vierbeine definiert durch η ab eµa eνb = g µν , ωµbc ist der Spina µ Zusammenhang zum Levi-Civita-Zusammenhang. Hier gilt ∂ν eµa +Γµνσ eσa −ωνb eb = 0, so daß sich ωνab allein aus den eµa berechnen läßt. Die τK sind Basen der LieAlgebren U(1), SU(2), SU(3) des Standardmodells, und AK µ sind die entsprechenden Komponenten der Yang-Mills-Felder. Die Euler-Lagrange-Gleichungen zu einer beliebigen Funktion des Spektrums von D auf einer kompakten Riemannschen Mannigfaltigkeit sind (bis auf falsche Signatur und Topologie) die Einsteinschen Feldgleichungen zum Energie-Impuls-Tensor der Yang-Mills-Felder. 23.3 Zum Verhältnis von Quantenphysik und Gravitation In Wirklichkeit sind die Yang-Mills-Felder Quantenfelder. In zweidimensionalen konformen Quantenfeldtheorie konstruiert man einen Energie-Impuls-Tensor als Operator auf einem Hilbert-Raum. Man hofft, das das auch für Yang-Mills-Felder in 4 Dimensionen gelingt. Der Versuch, die Einsteinschen Feldgleichungen durch Gmuν = κhTµν i zu retten, wobei hTµν i der Vakuumerwartungswert ist, führt nicht 80 Preliminary version – 4. August 2016 weit: hTµν i ist nicht divergenzfrei. Also müßte man auch Gmuν zu einem Operator machen, was auf Quantengravitation hinausläuft. In jedem Fall weiß man, daß Quantenfelder die Energie-Ungleichungen verletzen, die Voraussetzung für die Singularitätentheoreme sind. Quanten-EnergieUngleichungen beweisen eine negative untere Schranke für Tµν uµ uν , mit der sich manche Theoreme retten lassen. Pathologien wie Zeitmaschinen und WarpGeschwindigkeiten können nur in so engen Grenzen auftreten, daß sie nicht ausgenutzt werden können. Eine auf Wigner zurückgehende Überlegung zeigt, daß bei gleichzeitiger Berücksichtigung der Allgemeinen Relativitätstheorie und der Prinzipien der Quantenphysik unsere Raumzeit keine Riemannsche Mannigfaltigkeit mehr sein kann. Dazu betrachtet man Ereignisse an zwei Punkte im Abstand ∆x. Um sie zu trennen, ist ein Streuexperiment mit Teilchen genügend kurzer de BroglieWellenlänge durchzuführen. Nach der Heisenbergschen Unbestimmtheitsrelation ~c wird dem Objekt eine Energie der Größenordnung E = c∆p ≥ 2∆x übertragen und in einem Gebiet der Ausdehnung ∆x konzentriert. Diese zusätzliche Energiedichte ist Quelle eines Gravitationsfeldes, das schwach genug sein muß, um die Streuteilchen entkommen zu lassen. Das erfordert ∆x ≥ 2M = 2GcN2 m = 2GcN4 E ≥ GN ~ oder c3 ∆x p ∆x ≥ ℓP = ~GN c3 = 1.6 · 10−35 m . Dabei heißt ℓP Planck-Länge Genauer gilt nach Doplicher-Fredenhagen-Roberts (1995) ∆x0 (∆x1 + ∆x2 + ∆x3 ) ≥ ℓ2P und ∆x1 ∆x2 + ∆x2 ∆x3 + ∆x3 ∆x1 ≥ ℓ2P . Entsprechend sollten die Koordinaten durch Operatoren auf Hilbert-Räumen realisiert werden, deren Vertauschungsrelationen auf die angegebenen Schranken führen. Dieser Weg wird in manchen Arbeiten zur nichtkommutativen Geometrie versucht. Auch die Renormierungsgruppe führt zur gleichen Schlußfolgerung: Die Renormierungsgruppe erkärt, weshalb Systeme der statistischen Physik mit unendlich vielen Freiheitsgraden durch sehr wenige makroskopische Parameter wie Druck und Temperatur zu beschreiben sind (Universalitätsklassen). Es ist demnach auch kein Zufall, daß die Wechselwirkungen des Standardmodells renormierbar sind: Alle anderen möglichen Wechselwirkungen werden durch den Renormierungsgruppenfluß wegskaliert. Gravitation ist als Quantenfeldtheorie nicht renormierbar und dürfte deshalb nicht existieren, falls der Renormierungsgruppenfluß bei unendlich hoher Energieskala begonnen wird. Da es Gravitation gibt, muß der der Fluß bei endlicher Skala starten, deren Wert sich, wie erwartet, als die Planck-Skala EP = ℓ~cP ergibt. 23.4 String-Theorie Die String-Theorie ist der am weitesten ausgebaute Zugang zur Quantengravitation. An die Stelle punktförmiger Teilchen treten offene oder geschlossene Saiten 81 Preliminary version – 4. August 2016 der Länge ℓP . Sie entstand Ende der 60er Jahre als Theorie der starken Wechselwirkung. Dabei wurden die heutigen Gluonen als Feder (oder Saite) zwischen den Quarks aufgefaßt. Jedoch treten im Spektrum der Theorie masselose Tensorfelder vom Typ (2, 0) auf, so daß man die Theorie 1974 uminterpretiert hat als eine die Gravitation umfassende Theorie aller Wechselwirkungen. Die einfachsten Formulierung ist die Polyakow-Wirkung Z √ 1 (23.4) S= dσdτ − det h hab gµν (∂a X µ (σ, τ ))(∂b X ν (σ, τ )) . ′ 4πα Σ Dabei ist Σ die zweidimensionale Weltfläche des Strings, parametrisiert durch σ, τ , und h eine (nicht relevante) Metrik auf Σ. Weiter ist gµν eine vorgegebene Metrik auf der D-dimensionalen Raumzeit M, und die X µ sind die Komponenten einer Abbildungen X : Σ → X(M). Die Euler-Lagrange-Gleichungen für X µ sind Wellengleichungen, für die Randbedingungen gestellt werden. Nach Quantisierung und Renormierung werden entsprechend der konformen Invarianz der Weltfläche Darstellungen der Virasoro-Algebra erhalten. Die Forderung nach Anomaliefreiheit führt bei Berücksichtigung der zentrale Ladung zur Schlußfolgerung, daß die Quantentheorie dieser Strings nur in D = 26 Dimensionen konsistent ist. Durch Hinzunahme supersymmetrischer Partner Ψ der X µ läßt sich die kritische Dimension auf D = 10 reduzieren. Die überschüssigen 6 Dimensionen müssen entsprechend der Kaluza-Klein-Idee kompaktifiziert sein. Diese kompakte Untermannigfaltigkeit ist typischerweise eine Calabi-Yau-Mannigfaltigkeit – eine komplex-3-dimensionale Mannigfaltigkeit, die eine Ricci-flache Metrik zuläßt. Nach Abschätzungen gibt es O(10500 ) Möglichkeiten für solche Kompaktifizierungen. Deshalb sind physikalische Vorhersagen schwierig, es konnten jedoch zahlreiche sehr tiefe Ergebnisse in der Mathematik erhalten werden, vor allem in der algebraischen Geometrie. Hier ist die String-Theorie eine unverzichtbare Quelle von Inspiration. Bis Mitte der 80er Jahre wurden (neben der rein bosonischen) folgende 5 konsistente (d.h. zumindest in Einschleifennäherung renormierbare) SuperstringTheorien ermittelt: • Typ-I: offene Strings (die sich schließen dürfen), Symmetrie SO(32) • Typ-IIA: nur geschlossene Strings, masselose Fermionen beider Chiralitäten • Typ-IIA: nur geschlossene Strings, masselose Fermionen nur einer Chiralität • zwei heterotische String-Theorien geschlossener Strings. Einer der chiralen Sektoren ist ein Superstring (in 10 Dimensionen), der andere rein bosonisch in 26 Dimensionen, dann kompaktifiziert auf einem 16-dimensioanlen Gitter, wobei es zwei mögliche Symmetrien gibt: E(8) × E(8) bzw. SO(32). Anschließend konzentrierte man sich auf D-Branen, also Untermannigfaltigkeiten der 10-dimensionalen Raumzeit. Offene Strings enden auf diesen Branen, wobei den Enden Dirichlet-Randbedingungen auferlegt werden. In diesem Rahmen 82 Preliminary version – 4. August 2016 konnte die Bekenstein-Formel für 5-dimensionale extreme schwarze Löcher mikroskopisch durch Abzählen möglicher Branenkonfigurationen erhalten werden. Mitte der 90er Jahre wurden Dualitäten zwischen den String-Theorien gefunden. S-Dualität überführt stark gekoppelte Teilchen einer Theorie in schwach gekoppelte Teilchen der anderen Theorie, und umgekehrt. So ist Typ I S-dual zu Typ HO, und Typ IIB ist in nichtrivialer Weise selbstdual. T-Dualität überführt eine n-fache Schwingungsmode bei Radius R in eine n-fache Windungsmode bei Radius 1/R, und umgekehrt. Typ HO ist T-dual zu Typ HE, und Typ IIB ist T-dual zu Typ IIA. Diese Dualitäten führten Witten zu der Vermutung, daß alle String-Theorien Spezialfälle einer noch allgemeineren Theorie sind, der MTheorie. Diese enthält mit 11-dimensionaler, klassischer, Supergravitation einen weiteren interessanten Spezialfall, der nach Kompaktifizierung auf dem Kreis S 1 zur Typ IIA-Superstringtheorie führt und bei Kompaktifizierung auf dem Intervall zur heterotischen E(8) × E(8)-Theorie führt. Es gibt Vorschläge, M-Theorie als Matrixmodelle zu realisieren. Branen scheinen auch in der M-Theorie eine wichtige Rolle zu spielen. Das wohl wichtigste Ergebnis dieser Forschungen ist die von Juan Maldacena 1997 initiiierte AdS-CFT-Korrespondenz. Der Anti-de-Sitter-Raum ist eine maximal-symmetrische Vakuum-Lösung der Einsteinschen-Feldgleichungen mit negativer kosmologischer Konstante. So entsteht eine hyperbolische Geometrie, die in geeigneten Koordinaten mit einem Rand versehen werden kann, der im wesentlichen der flache Minkowski-Raum ist. Die Korrespondenz besagt, daß die Gravitationstheorie im Inneren dual, und damit exakt äquivalent, zu einer konformen Feldtheorie auf dem (niederdimensionalen!) Rand ist. Es realisiert damit das aus der Bekenstein-Formel für die Entropie schwarzer Löcher bekannte holographische Prinzip, nach dem die Information vollständig auf der Oberfläche kodiert ist. Das wichtigste Beispiel ist die Dualität zwischen der Typ-IIB-Stringtheorie auf AdS5 × S 5 und der N = 4 Super-Yang-Mills-Theorie. Letztere zeigt faszinierende Eigenschaften wie Integrabilität in 4 Dimensionen. 23.5 Schleifenquantengravitation Ausgangspunkt ist die 3+1-Zerlegung der Raumzeit in eine Familie Σt dreidimensionaler Hyperflächen. Das metrische Tensorfeld zerlegt sich dann gemäß g = (Ndt)2 − hij (dxi − N i dt)(dxj − N j dt) . Dabei ist h eine Riemannsche Metrik auf Σt . Die Funktionen N und Vektoren N j heißen lapse und shift. Die Metrik h definiert ein Dreibeinfeld eaj über hij = eai ebj δab . Offenbar läßt sich die Einstein-Hilbert-Wirkung durch eai , N i , N ausdrücken. Man stellt fest, daß N i und N linear auftreten, so daß ihre Koeffizienten in Folge der Feldgleichungen identisch Null sind √ (Hamilton-constraint H ≈ 0 und Diffeomorphismen-constraint). Seien Πai = 12 det h ebi (Kab − δab Kcc ) 83 Preliminary version – 4. August 2016 die kanonischen Impulse zu den eai (dabei ist Kab die äußere Krümmung). In der ursprünglichen Formulierung, der ADM-Theorie, betrachtete man die Wheelerde Witt-Gleichung HΨ = 0, jedoch ohne Erfolg. Ashtekar fand 1987 neue Variablen, in denen der Hamilton-constraint sehr viel einfacher ist. Die Linearkombination 1 i + γeib Kab , Aia := − ǫabc ωbc 2 wobei der Immirzi-Parameter√γ zunächst beliebig ist, erfüllt zusammen mit den skalierten Dreibeinen Eia := det heai die Poisson-Klammern {Eia (x), Ejb (y)} = 0 , {Aia (x), Ajb (y)} = 0 , {Eia (x), Ajb (y)} = κδba δij δ(x − y) . Der Diffeomorphismen-constraint nimmt in diesen Variablen die einfache i i Form Eia Fab ≈ 0 an, wobei Fab die so(3)-Feldstärke zu den so(3)i Zusammenhangskoeffizienten Aa ist. Des weiteren wird der Hamilton-constraint bei der Wahl γ = i und Übergang von so(3) zu su(2) sogar polynomial. Bei der Quantisierung sind die Funktionen Eia (x), Ajb durch Operatoren zu ersetzen. Es genügt aber nicht, nur die kanonischen Kommutatorrelationen zu fordern, denn auch die constraints müssen als Operatorgleichung realisiert werden. Das ist für den Hamilton-constraint ein schwieriger Schritt, der nicht vollständig gelungen ist. Es zeigte sich, daß die Festlegung γ = i keine Vorteile bringt und man γ besser reell wählt. Schleifen-Quantengravitation besteht in einer Quantisierung dieser PoissonAlgebra durch Wilson-Linien entlang von Netzwerken. Letztere sind Darstellungen der su(2), werden R deshalb Spin-Netzwerke genannt. Die Bausteine sind Holonomien he = P exp( e Ai dxi ), die durch das weggeordnete exponentierte Integral der Zusammenhänge über die Kanten e des Netzwerks gegeben sind. Zunächst kann man sich die Netzwerke als eingebettet in die Zeitscheibe Σt denken, dann wird Σt jedoch vergessen, und das Netzwerk selbst ist die Raumzeit. Ashtekar und Lewandowski konnten der gesamten Hierarchie von Netzwerken einen HilbertRaum zuordnen. Wichtige frühe Ergebnisse waren Quantisierung von Fläche und Volumen durch die Spins der Kanten, die durch die Fläche gehen bzw. der Knoten im Volumen. Damit konnte eine weitere mikroskopische Herleitung der BekensteinEntropie gefunden werden, wobei der Immirzi-Parameter sich aus dieser Rech√2 . nung bestimmt. Ohne Korrekturen folgt γ = log π 3 Vertreter der Schleifenquantengravitation betonen als konzeptionelle Vorteile gegenüber der aus der Teilchenphysik heraus entstandenen String-Theorie, daß ihre Theorie explizit unabhängig vom Hintergrund und invariant unter Diffeomorphismen ist. Auch ist die Konsistenz ohne komplizierte Formen von Materie gesichert. Umgekehrt gab es keinen Rückfluß tiefer Erkenntnisse in die Mathematik. 84 Preliminary version – 4. August 2016 Zweidimensionale euklidische Quantengravitation läßt sich über die Abzählung von Triangulierungen von Flächen verstehen. Diese Abzählungen sind äquivalent zu gewissen Matrix-Modellen. Kürzlich konnte Teilaspekte innerhalb der farbigen Tensor-Modelle in höhere Dimension verallgemeinert werden. Es gibt Verbindungen dieser Tensor-Modelle zur Schleifenquantengravitation über Gruppenfeldtheorie. 85 Preliminary version – 4. August 2016 Teil VI Kosmologie Die wissenschaftlichen Kosmologie begann 1917 mit einer Arbeit von Albert Einstein. Darin wurde die Frage untersucht, ob die gekrümmte Raumzeit für das Universum relevant ist. Einstein ging von der Annahme einer gleichförmigen Materieverteilung aus, was auf Skalen sehr viel größer als die Duchmesser der Galaxien realistisch erscheint. Seine Erwartung war, daß es wie für die SchwarzschildLösung eine statische Lösung für ein endliches homogenes Universum geben sollte. Dieser Annahme erwies sich als falsch, so daß Einstein die kosmologische Konstante zur Rettung eines statischen Universums eingeführt hat. 1922 hat Alexander Friedmann nichtstatische Lösungen der kosmologischen Modelle gefunden. Einstein sah diese als interessante mathematische Arbeit an, jedoch ohne physikalische Bedeutung. 1929 konnte Edwin Hubble zeigen, daß die Galaxienspektren systematisch rotverschoben sind, d.h. die Galaxien entfernen sich von uns. Lemaı̂tre und andere haben das als Expansion des Universums gedeutet. 24 Friedmann-Robertson-Walker-Metrik Kosmologische Modelle sind Lösungen der Einsteinschen Feldgleichungen zu Materieverteilungen, die das kosmologische Prinzip erfüllen: 24.1 Kosmologisches Prinzip. Der räumliche Teil der Geometrie ist homogen und isotrop, d.h. es gibt keine ausgezeichneten Punkte und Richtungen. Wir zeigen: es gibt eine universelle Zeit t, so daß der metrische Tensor folgende Form annimmt: g = (ds)2 = c2 (dt)2 − gij dxi dxj , i, j = 1, 2, 3 . (24.1) Die xi heißen mitbewegte Koordinaten, da in ihnen die Materie ruhend ist. Die Herleitung von (24.1) basiert auf folgenden Argumenten: µ µ i) Seien xµ (τ ) die Weltlinien. Setze uµ = dx und aµ = Du = (∇ν uµ )uν . Die dτ dτ Beschleunigung ist raumartig. Aus der lokalen Isotropie folgt dann aµ = 0, d.h. die xµ sind Geodäten. ii) uµ = ∂µ f für eine geeignete Funktion f . Betrachte ∇µ uν − ∇ν uµ = ∂µ uν − ∂ν uµ . Nach i) gilt (∇ν uµ )uν = 0, außerdem ist uµ uµ = c2 und deshalb (∇ν uµ )uµ = 0. Beides zusammen liefert (∂µ uν − ∂ν uµ )uµ = 0. Im mitbewegten Koordinatensystem gilt u = (c, 0, 0, 0), so daß ∂µ uν − ∂ν uµ nur räumliche Komponenten hat. Aber der Vektor ∂i uj − ∂j ui zeichnet eine Richtung aus, die Rotation von u. Nach kosmologischem Prinzip muß diese Rotation verschwinden, d.h. u ist ein Gradient: ui = ∂i f . 86 Preliminary version – 4. August 2016 iii) Setze f =: c2 t, uµ = c2 ∂µ t. Dann ist t die Eigenzeit längs jeder Weltline, da dt = 1 1 dxν µ 1 (ds)2 µ u dx = g dx = = dτ . µ µν c2 c2 dτ 2c2 dτ Die Hyperfläche t = const ist orthogonal zur Weltlinie: uµ dxµ = c2 dt = 0. iv) In der Hyperfläche t = const, wähle mitbewegte Koordinaten xi , i = 1, 2, 3, d.h. xi = const längs Weltlinien. Somit (ds)2 = c2 (dt)2 − gij (t, x)dxi dxj , da g0i = 0 wegen iii). v) Die Zeitabhängigkeit ist durch einen globalen Skalenfaktor gegeben: (ds)2 = c2 (dt)2 − R̃2 (t, x)(dσ)2 mit (dσ)2 = g̃ij (x)dxi dxj . Betrachte dazu drei infinitesimal benachbarte Punkte A, B, C. Angenommen, ∡(BAC) wäre zeitabhängig. Wegen Isotropie müssen sich die Winkel anderer Dreiecke mit gemeinsamer Ecke A in gleicher Weise ändern, was lokal bei A nicht möglich ist. Somit bleiben alle Dreiecke im Zeitverlauf ähnlich, d.h. die Zeitabhängigkeit ist ein gemeinsamer Faktor aller gij . vi) Schließlich ist (ds)2 = c2 (dt)2 − R̃2 (t)(dσ)2 : Betrachte zwei infinitesimal benachbarte Teilchen mit Abstand ∆ℓ = R̃∆σ. Die relative Expansionsrate ist d d d ∆ℓ (R̃∆σ) (R̃) dt = dt = dt =: H . ∆ℓ R̃∆σ R̃ Angenommen, H hängt von x ab. Dann verletzt ∂Ri H 6= 0 die Isotropieannahme, so daß H = H(t). Es folgt R̃ = W (x) exp H dt, aber der Faktor W (x) kann in Redefinition von dσ absorbiert werden. Insgesamt ist gezeigt: (ds)2 = c2 (dt)2 − R̃2 (t)(dσ)2 . (24.2) Die Materie ist mitbewegt in den Koordinaten xi . Wegen Homogenität muß die Krümmung für festes t räumlich konstant sein. Wir betrachten deshalb dreidimensionale Räume konstanter Krümmung. Dreidimensionale Räume konstanter Krümmung sind homogene Räume, die mit Methoden der Gruppentheorie studiert werden. In ihnen spielen Killingvektoren eine wichtige Rolle. Eine andere Konstruktion startet von 3-dimensionalen Hypersphären im R4 , die wie folgt parametrisiert werden: p 1 2 3 4 x = r sin ϑ cos ϕ , x = r sin ϑ sin ϕ , x = r cos ϑ , x = ± R̃2 − r 2 . 87 Preliminary version – 4. August 2016 Dann gilt (dℓ)2 := 4 X (dxi )2 = (dr)2 + r 2 (dϑ)2 + r 2 sin2 dϑ(dϕ)2 + i=1 (dr)2 2 2 2 2 + r (dϑ) + sin ϑ (dϕ) , = 2 1 − R̃r 2 (rdr)2 R̃2 − r 2 0 < r < R̃ . (24.3) Man rechnet R = R̃12 > 0 für die Skalarkrümmung nach. P Analog betrachtet man für negative Krümmung das Hyperboloid 3i=1 (xi )2 − (x4 )2 = −R̃2 . Eine identische Rechnug zeigt (dℓ)2 = (dr)2 + r 2 (dϑ)2 + sin2 ϑ (dϕ)2 , r2 1 + R̃2 r>0. (24.4) Die Skalarkrümmung ist R = − R̃12 < 0. Beide Fälle, und der flache Raum R3 , können mit r̄ := R̃r zusammengefaßt werden zu (dr̄)2 2 2 2 2 , k ∈ {−1, 0, 1} . (24.5) + r̄ (dϑ) + sin ϑ (dϕ) (dℓ)2 = R̃2 1 − kr̄ 2 Für k = 1 (positive Krümmung) wird ein geschlossener Raum mit Volumen V =2 Z R̃ dr 0 Z 0 π dϑ Z 2π 0 r 2 sin ϑ = 2π 2 R̃3 dϕ q r2 1 − R̃2 erhalten, während für k = −1 (negative Krümmung) V = ∞ gilt. In jedem Fall ist der Umfang eines Kreises mit Radius r gleich 2πr. Die Berechnung des Abstands einesPunktes p(r, ϑ, ϕ) von 0 wird zweckmäßigerweise in Abstandskoordinaten sin χ für k = 1, durchgeführt. In diesen Koordinaten gilt r̄ = sinh χ für k = −1, 2 2 2 2 2 2 2 (dℓ) = R̃ (dχ) + sin[h] χ (dϑ) + sin ϑ (dϕ) . R̃ arcsin r̄ für k = 1, Für k = 1 folgt d(0, p) ≥ R̃ arsinh r̄ für k = −1. U U , während d(0, p) ≤ 2π für k = 1. 2π Eingesetzt in (24.2) folgt die Robertson-Walker-Metrik (1936) Damit ist d(0, p) = R̃χ = (ds)2 = c2 (dt)2 − R̃2 (t) (dr̄)2 2 2 2 2 , + r̄ (dϑ) + sin ϑ (dϕ) 1 − kr̄ 2 (24.6) mit k ∈ {−1, 0, +1}. Diese ist die allgemeinste Metrik, die mit dem kosmologischen Prinzip verträglich ist. 88 Preliminary version – 4. August 2016 Eine längliche Rechnung liefert folgende Komponenten des Einstein-Tensors: G00 = 3 R̃˙ 2 + kc2 , R̃2 c2 G0i = 0 , ¨ R̃ R̃˙ 2 + kc2 gij . Gij = − 2 + R̃c2 R̃2 c2 (24.7) Dieser ist in die Feldgleichungen Gµν = κTµν + Λgµν einzusetzen. Wir wählen den Energie-Impuls-Tensor einer idealen Flüssigkeit Tµν = (̺ + cp2 )uµ uν − pgµν , wobei in mitbewegten Koordinaten u0 = c und ui = 0 gilt. Es folgt: R̃˙ 2 + kc2 = κc4 ̺ + Λc2 , 2 R̃ ¨ ˙ 2 R̃ R̃ + kc2 2 + = −κc2 p + Λc2 . R̃ R̃2 3 (I) (II) Gleichung (I) heißt Friedmann-Gleichung. Zur Lösung dieser Gleichungen muß die Zustandsgleichung ̺(p) vorgegeben werden. Die Gleichungen können kombiniert werden zu ¨ R̃ 1 1 κc2 p + ̺c2 + Λc2 . =− 2 3 3 R̃ Weiter nimmt die Kombination d ((I) dt (II’) · R̃2 ) − (II’) · 3R̃2 R̃˙ folgende Form an: Λ d 3 d 2 Λ 3 ̺c + R̃ + p − R̃ = 0 . dt κ κ dt (III) Für Λ = 0 entspricht das der thermodynamischen Gleichung dE + pdV = 0. Hintergrund dieses “1. Hauptsatzes der Thermodynamik” ist die Tatsache, daß der Energie-Implus-Tensors kovariant-konstant ist. Zusammen mit der Zustandsgleichung ist (III) die einfachste Möglichkeit, R̃(̺) zu berechnen. Dann kann (I) integriert werden zu R̃(t). Alternativ führt man den Skalenfaktor a(t) ein durch R̃(t) = a(t)R0 mit R0 := R̃(t0 ). Dann folgt ȧ2 + k R20 = κc2 ̺ + Λ , (I”) 0 = −κp + Λ , a2 d d (̺a3 ) + p a3 = 0 . dt dt (II”) 3 ä 2 + a a2 2 ȧ + Rk2 89 Preliminary version – 4. August 2016 (III”) 25 25.1 Kosmologische Modelle Einstein-Kosmos Einstein hat 1917 neben dem kosmologischen Prinzip gefordert, daß das Universum statisch ist. Damit reduzieren sich (II,I) auf 3k = κ̺c2 + Λ . 2 R̃ k = −κp + Λ , R̃2 (25.1) Für Staub (p = 0) ist die Lösung k =Λ, R̃2 κ̺c2 = 2Λ , (25.2) somit Λ > 0. Genauer hat die Forderung, daß die Gleichungen eine statische Lösung für Staub zulassen, Einstein zur Einführung der kosmologischen Konstante bewogen. Weiter folgt k = 1, d.h. das Universum hat positive Krümmung und ist geschlossen. Die Dichte ergibt sich zu ̺= c2 . 4πGN R̃2 Eine genauere (spätere) Diskussion zeigt, daß dieses Weltmodell instabil ist, so daß die Stationarität nicht realisierbar ist. 25.2 Friedmann-Kosmos Alexander Friedmann hat 1922,1924 nichtstatische Lösungen der Feldgleichungen für Staub p = 0 gefunden. Als Friedmann-Kosmos bezeichnet man die Lösung mit Λ = 0. Für Λ = 0 und p = 0 folgt aus (III) ̺R̃3 (t) = M = const (25.3) und dann für k = 1 eine Gesamtmasse m = 2π 2 M des Universums. Gleichung (I) nimmt folgende Form an: κMc4 R̃˙ + kc2 = . R̃2 3R̃3 (25.4) Trennung der Variablen führt auf auf die Friedmann-Gleichung κMc4 R̃˙ 2 − + kc2 = 0 . 3R̃ (25.5) Im wesentlichen ist das die (radiale) Energiegleichung für das Newtonsche Gravitationsgesetz (mit Gesamtenergie proportional zu −k). Die Lösung der 90 Preliminary version – 4. August 2016 Friedmann-Gleichung ist: q 2R̃ R0 − R0 R̃ − R̃2 , arccos 1 − ct = 2 R0 q R0 2R̃ ct = − arcosh 1 + + R0 R̃ + R̃2 , 2 R0 2R0 R̃ 32 , ct = 3 R0 k=1: k = −1 : k=0: wobei R0 := (25.6) κM c2 . 3 • Die Lösung für k = 1 ist eine Zykloide, die ein oszillierendes Universum beschreibt. Für k = −1 und k = 0 gibt es eine permanente Expansion. • Alle Lösungen haben eine Singulatität bei t = 0. Selbstverständlich kann die Materie dann nicht mehr durch Staub beschrieben werden. Jedoch zeigen Singularitätentheoreme von Penrose und Hawking, daß (unter Positivitätsannahmen an den Energie-Impuls-Tensor) ein gegenwärtig expandierendes Universum notwendigerweise eine Singularität in der Vergangenheit hatte. 2 • In der Nähe von t = 0 gilt näherungsweise R̃ ∼ t 3 unabhängig von k. In einem mit Staub gefüllten Newtonschen radialsymmetrischen Universum ′ = −mR̈, ist die Kraft auf ein Teilchen im Abstand R gegeben durch F = GNRmM 2 ′ wobei M die Masse innerhalb der Kugel vom Radius R ist. Radialsymmetrische Beiträge außerhalb der Kugelschale kompensieren sich exakt. Somit gilt der Energiesatz 2GN M ′ Ṙ2 − = E = const . R M ist das exakt die Friedmann-Gleichung. Nach Redefinition M ′ = 4π 3 Berücksichtigt man Λ, so lautet der Energiesatz Ṙ2 − 2GN M ′ Λc2 2 − R = E = const . R 3 Das Maximum lokalisiert den instabilen Einstein-Kosmos. 25.3 Strahlungskosmos Für ultrarelativistische Teilchen gilt, wie für Photonen, p = 31 ̺c2 . Damit lautet Gleichung (III) 1 d 3 d ̺c2 R̃3 + ̺c2 R̃ = 0 dt 3 dt ⇒ ̺c2 R̃4 = A = const . 91 Preliminary version – 4. August 2016 (25.7) Eingesetzt in (I) folgt κA + kc2 = 0 R̃˙ 2 − 3R̃2 (25.8) mit Lösung 2 R̃ = 2 κA 12 3 ct − kc2 t2 (25.9) Für k = 1 wird wieder ein oszillierendes Universum erhalten, für k = 0 und k = 1 eine permanente √ Expansion. Wie zuvor gibt es bei t = 0 eine Singularität. Für t ≈ 0 gilt R̃ ∼ t unabhängig von k. 25.4 De Sitter-Kosmos Es wird ̺ = 0 und p = 0 angenommen, aber Λ 6= 0. Dann nehmen Gleichungen (I,II) die folgende Form an: R̃˙ 2 + kc2 3 = Λc2 . 2 R̃ ¨ − 1 Λc2 R̃ = 0 , R̃ 3 (25.10) Die Lösung ist für Λ > 0 r Λ cosh ct , R̃ = 3 3 Λ − 12 r Λ R̃ = sinh ct , 3 3 r Λ ct . R̃ = A exp 3 Λ − 12 k = +1 k = −1 k=0 Für Λ < 0 ergibt sich k = −1 , R̃ = Für Λ = 0 ergibt sich k=0, R̃ = const Λ − 21 3 r |Λ| cos ct . 3 (Minkowski-Raum) . (25.11) (25.12) (25.13) Die Lösungen haben die Besonderheit, daß sogar die 4-dimensionale Krümmung konstant ist, d.h. die Symmetriegruppe ist größer als in den zuvor diskutierten kosmologischen Lösungen. 92 Preliminary version – 4. August 2016 26 Beobachtende Kosmologie 26.1 Rotverschiebung Eine Quelle mit radialem Parameter r̄ = r̄1 emittiere zu Zeiten t1 und t1 + ∆t2 Licht. Dieses werde zu Zeiten t0 , t0 + ∆t0 > t1 von einem Beobachter in r̄ = 0 dr und dann empfangen. Da ds2 = 0 für Licht, gilt c dt = R̃(t) √1−kr̄ Z r̄1 Z t0 +∆t0 Z t0 dr cdt cdt √ = = 1 − kr̄ 0 t1 +∆t1 R̃(t) t1 R̃(t) ∆t0 ∆t1 ⇒ = (26.1) R̃(t0 ) R̃(t1 ) (gilt allgemein für ∆χ0 = ∆χ1 q). Mit ∆t1 als Zeit zwischen zwei Maxima einer Welle folgt für die Frequenzen ν1 der gesendeten Welle und ν0 der empfangenen Welle ν0 R̃(t0 ) = ν1 R̃(t1 ) . (26.2) Expandiert das Universum, R̃(t1 ) < R̃(t0 ) für t1 < t0 , so ist ν0 < ν1 , d.h. die Wellenlänge ist rotverschoben. Man definiert z := ν1 − ν0 , ν0 somit z+1= R̃(t0 ) . R̃(t1 ) (26.3) Es ist üblich, kosmische Entfernungen als Rotverschiebung anzugeben, da diese im Gegensatz zur Differenz der Koordinatenzeiten modellunabhängig ist. Für kleine t0 − t1 gilt nach Taylor-Entwicklung 1 (26.4) R̃(t) = R̃(t0 ) 1 + (t − t0 )H(t0 ) − q(t0 )(t − t0 )2 H 2 (t0 ) + . . . . 2 Dabei heißt H = ˙ R̃(t) R̃(t) die Hubble-Zahl, und H(t0 ) =: H0 heißt gegenwärtige R̃(t) Hubble-Konstante. Die Funktion q(t) = − R̈(t) heißt Verzögerungsparameter, ˙2 R̃ (t) mit q0 := q(t0 ). In diesen Parametern ergibt sich q0 (26.5) z = H0 (t0 − t1 ) + (1 + )H02 (t0 − t1 )2 + . . . 2 Die Zeitdifferenz t0 − t1 kann durch den gegenwärtigen Abstand Z r̄1 Z t0 1 dr̄ cdt √ = c(t0 − t1 ) + H0 c(t0 − t1 )2 (26.6) d = R̃(t0 ) = R̃(t0 ) 2 1 − kr̄ 2 0 t1 R̃(t) ausgedrückt werden. Es folgt 1 1 1 z = H0 d + (q0 + 1) 2 H02 d2 + . . . c 2 c Somit: 93 Preliminary version – 4. August 2016 (26.7) 26.1 Hubblesches Gesetz, 1929. Die Rotverschiebung z ist in erster Näherung proportional zur Entfernung. Abweichungen von der Linearität (zugänglich über Typ IA-Supernovae) erlauben Rückschlüsse auf q0 und damit auf das realisierte kosmologische Modell. Experimentell bestimmt man (2015) H0 = (2.19 ± 0.02) · 10−18 s−1 = (67.7 ± 0.5) km/s Mpc (26.8) Über q0 war lange Zeit wenig bekannt. 1998 gab es erste Hinweise, daß q0 < 0 ist, entsprechend Λ > 0. Der inverse Hubble-Parameter H0−1 = 14.5 · 109 Jahre ist größer als das Alter t0 = 13.7 · 109 Jahre des Universums, t 7→ R̃(t) in den diskutierten Weltmodellen eine konkave Funktion ist. Die Friedmannschen Gleichungen (I,II) lassen sich durch H0 , q0 ausdrücken: H2 + 1 1 kc2 = κ̺c4 + Λc2 , 2 3 3 R̃ 1 1 2qH 2 = κc2 (̺c2 + 3p) + Λc2 . 3 3 (26.9) Für p = 0 folgt H 2 (2q − 1) = kc2 , R̃2 2q = κc4 2Λc2 ̺ + , 3H 2 3H 2 (26.10) d.h. das Universum ist für q0 > 12 geschlossen, für q = 21 flach und für q < 12 2 hyperbolisch gekrümmt. Man definiert ̺c := 3H als kritische Dichte. Mit dem κc4 gegenwärtigen Hubble-Parameter ergibt sich ̺c,0 = 9.5 · 10−27 mkg3 . Dann folgt aus 2 2q = ̺̺c + 2Λc für Λ = 0, daß für ̺ > ̺c das Universum geschlossen ist (k = 1), 3H 2 für ̺ = ̺c flach ist (k = 1), und für ̺ < ̺c hyperbolisch ist (k = −1). Aus den Massen der Galaxien bestimmt man ̺0 = 3 · 10−28 mkg3 und ̺γ = 4.5 · 10−31 mkg3 als Dichte der Strahlung. Beobachtungen zeigen ΩM ≈ 0.03, also ̺ < ̺c . Dunkle Materie und Λ > 0 dürften diese Aussagen modifizieren. Man schreibt (I,II) auch als 1 kc2 R̃˙ 2 = κc4 (̺ + ̺Λ ) − , 3 R̃2 R̃2 ¨ 1 R̃ 2 = − κc2 (̺ + ̺Λ )c2 + 3(p + pΛ ) , 3 R̃ ̺Λ := Λ Λc2 = , κc2 8πGN pΛ := − (26.11) Λ = ̺Λ c2 . κ In Dichteparametern ΩM (t) = ̺(t) , ̺c (t) ΩΛ (t) = ̺Λ (t) , ̺c (t) Ω = ΩM + ΩΛ 94 Preliminary version – 4. August 2016 (26.12) nehmen die Gleichungen (26.11) (in Verallgemeinerung von (26.10) auf p 6= 0) folgende Form an: kc2 , (26.13) R̃2 κc2 (p + pΛ ) 2q = Ω + . H2 Gegenwärtig ist in guter Näherung p = 0 und dann 2q = Ω − 2ΩΛ = ΩM − 2ΩΛ . Aus der Messung von ΩM und q läßt sich ΩΛ bestimmen. H 2 (Ω − 1) = 26.2 Abstände arcsin r̄ für k = 1, Der gegenwärtige Abstandsparameter ist d = R̃χ = R̃ · arsinh r̄ für k = −1, r̄ für k = 0. Alternativ führt man den Helligkeitsabstand ein. Sei L die absolute Helligkeit, d.h. der Energiefluß eines Objekts. Sei l die scheinbare Helligkeit, d.h. der beim Beobachter ankommende Energiefluß. Im flachen Universum gilt L = l · 4πd2 . Entsprechend wird der Helligkeitsabstand eingeführt als r L . (26.14) dL = 4πl In der Friedmann-Robertson-Walker-Metrik wird das Licht über eine Fläche A = 4π(R̃r̄)2 = 4π R̃2 f 2 ( R̃d ) verteilt, wobei f (x) je nach Krümmung sin x, sinh x, x ist. ∆t1 ∆t0 Für Licht war R̃dχ = cdt und daraus R̃(t = R̃(t . 1) 0) Bei gegenwärtiger Expansion kommt es zu einer Ausdünnung von Photonen 1) . Hinzu kommt der Energieverlust duch die Rotverschiebung um den Faktor R̃(t R̃(t ) 0 um den gleichen Faktor R̃(t1 ) . R̃(t0 ) l= Insgesamt entsteht R̃2 (t1 ) L · 4π R̃02 f 2 ( R̃d ) R̃02 0 ⇒ dL = f 2 ( R̃02 f (χ0 ) d . ) = d(1 + z) χ0 R̃0 R̃2 (t1 ) Dabei ist R̃0 = R̃(t0 ) und χ0 = χ(t0 ) = 26.3 (26.15) d . R̃0 Kosmologische Horizonte Wird Licht bei r = 0, d.h. χ = 0 und t = t1 emittiert, so erreicht es zum Zeitpunkt t0 den Abstandsparameter Z t0 c dt χ= . (26.16) t1 R̃(t) 95 Preliminary version – 4. August 2016 Wir nehmen eine Anfangssingularität bei t = 0 an. Sterne sind sichtbar bis zu einer maximalen Entfernung Z t0 c dt , dmax = R̃0 · χmax . (26.17) χmax = R̃(t) 0 Im geschlossenen Universum gibt es einen “Teilchen-Horizont”, falls χmax < π. Im offenen Universum gibt es immer einen Teilchen-Horizont. In der Nähe von t = 0 war R̃(t) = Atα mit α = 12 für Strahlung und α = 32 im frühen Friedmann-Kosmos. Dann folgt χmax = c t1−α A(1 − α) 0 ⇒ dmax = 1 ct0 . (1 − α) (26.18) Der Horizont wächst linear mit t0 . 27 Dunkle Materie Folgende Anhaltspunkte für die Existenz dunkler Materie wurden gegeben: • J.H. Oort (1932) und F. Zwicky (1933) haben die Bewegungsverhältnisse in Galaxien untersucht und Widersprüche zur Summe der in den Sternen gebundenen Masse gefunden. • Überzeugendere Argumente ergaben sich aus den Rotationskurven der Galaxien (Vera Rubin, seit 1960). • Heute lassen sich Massen über Gravitationslinseneffekte sehr genau bestimmen, z.B. im Bullet-Cluster (2006). • Die kosmische Hintergrundstrahlung (CMB) zeigt Fluktuationen, die von den COBE, WMAP, Planck-Satelliten studiert wurden. Details dieser Flukuationen hängen von der Dichte der dunklen Materie ab. • Schließlich kann die Strukturbildung im Universum simuliert werden, in Abhängigkeit von der Dichte der dunklen Materie. Genauer bezeichnet man nichtbaryonische Materie als dunkle Materie. Es gibt durchaus braune Zwerge und Gas-Wolken, die zwar nicht strahlen, aber nicht als dunkel klassifiziert werden. Jüngste Beobachtungen ergeben folgende Dichten: Dunkle Materie: 84% Atome (=Baryonen): 16% Photonen: 0.02% Neutrinos: 0.01% 96 Preliminary version – 4. August 2016 28 Frühes Universum ̺ ∼ R̃1 . Für Strahlung gilt das Strahlung dominiert für R̃ ≪ R̃0 wegen ̺Strahlung Materie Stefan-Boltzmannsche Gesetz ̺Strahlung ∼ T 4 und damit T ∼ R̃1 . Einen heißen Urknall mit anschließender Abkühlung und Nachglimmen hat Gamov 1946 vorgeschlagen. Diese CMB-Strahlung der Temperatur von 2.7 K wurde 1964 von Penzias-Wilson entdeckt. 400 000 Jahre nach dem Urknall war das Universum soweit abgekühlt, daß neutrale Atome sich bilden konnten. Die Physik bis 10−13 Sekunden nach dem Urknall ist mit Teilchenbeschleunigern zugänglich. Zeit, Skalenparameter, Temperatur und Dichte hängen nach den aktuell favorisierten Modellen wie folgt zusammen: t R̃ (m) T (K) ̺ (kg/m3 ) 10−4 s 3 · 1014 1012 1019 Baronen, Antibaryonen 2s 3 · 1016 1010 1011 2000 s 1018 3 · 108 10 5 4 · 10 a 1010 a 29 10 23 1026 Kernreaktionen, kleosynthese Nu- Strahlung dominiert 3000 10−18 Entkopplung der Strah- Materie dolung miniert 2.7 10−27 heute Das aufgeblasene Universum Dennoch hat die Urknall-Theorie Probleme: i) Horizont-Problem: Weshalb ist die Hintergrundstrahlung so gleichförmig? ii) Flachheits-Problem: Weshalb gilt näherungsweise ̺ ≈ ̺c ? iii) Magnetische Monopole werden nicht beobachtet. Ein Lösungsvorschlag ist Aufblasung des Universums (inflation). Zu i) Der gegenwärtige Teilchenhorizont ist dmax ≈ 3.5ct, im frühen Universum eher dmax ≈ 3ct. Betrachte mitbewegte Teilchen, die gegenwärtig am HoriR̃(t) zont mit Abstand dmax (t0 ) sind. Ihr früherer Abstand war d(t) = dmax (t0 ) R̃(t ) 0 R̃(t) . Für t = TE = 400 000 Jahre (Entkopplung der Strahoder d(t) = dmax (t) tt0 R̃(t 0) lung) ergibt sich d(tE ) = 50dmax(tE ). Nur ein kleiner Teil des heute sichtbaren Universum (im Winkelbereich von 1◦ ) war in kausalem Zusammenhang zur Zeit der Entkopplung, im Gegensatz zur beobachteten Isotropie der Hintergrundstrahlung. 1 ˙ 2 R̃˙ 0 t −2 0 Zu ii) Es gilt Ω(t) − 1 = R̃ , so (Ω − 1). Verwendet man ≈ 0 ˙ ˙ t0 t (Ω0 −1). t0 R̃(t) R̃(t) Da Ω0 = O(1), muß für kleine t mit großer Genauigkeit q Ω(t) = 1 gewesen sein. Zur Planck-Zeit t = tPlanck = ~Gc5N = 5.4 · 10−44 s folgt Ω − 1 ≈ 10−60 . Das erfordert eine extreme Feinabstimmung der Anfangsdaten. folgt Ω(t)−1 = 97 Preliminary version – 4. August 2016 Wäre Ω > 1 bei t = tPlanck nicht so genau 1, das Universum also geschlossen, so wäre auch das erreichbare maximale Alter extrem kurz, im Widerspruch zur Beobachtung. A. Guth hat 1980/81 zur Lösung der Probleme vorgeschlagen, daß es in der Frühzeit des Universums eine Phase exponentieller Expansion gab. Genauer soll es eine de Sitter-Phase mit Λ ≫ 0 gegeben haben. Nach (25.11) gilt für große Λ r Λ ct . (29.1) R̃(t) ≈ A exp 3 Innerhalb eines Intervalls [ta , tf ] soll löst das Flachheits-Problem, denn Ωf − 1 = R̃˙ 2 a R̃˙ a (Ωa − 1) = R̃f R̃a > 1039 erreicht werden. Diese Annahme R̃ 2 a R̃a (Ωa − 1) ≈ 10−78 (Ωa − 1) . (29.2) Somit wird auch für generische Ωa zum Ende der de Sitter-Phase Ωf = 1 mit extremer Genauigkeit erreicht. In der anschließenden Friedmann-Phase wird dann der heutige Wert Ω0 −1 ≈ 1051 (Ωf −1) ≈ 10−27 (Ωa −1) erreicht. Unser Universum sollte demnach flach sein. Durch diese exponentielle Expansion wird eine sehr kleine, kausal zusammenhängende, Region des Universums auf ein Volumen aufgeblasen, welches nach Friedmann-Evolution das gesamte heute sichtbare Universum umfaßt. So erklärt sich die Isotropie der Hintergrund-Strahlung: Bei linearer Extrapolation von R̃ scheinbar nicht kausal zusammenhängende Gebiete waren es in Wirklichkeit. Auch werden ursprünglich vorhandene magnetische Monopole extrem verdünnt. Als auslösender Mechanismus wurde von Guth eine spontane Symmetriebrechung vorgeschlagen. Das Universum befand sich zu t = ta in einem metastabilen Gleichgewicht mit Λ > 0. Innerhalb der de Sitter-Phase bewegte sich das Universum in sein stabiles Gleichgewicht mit Λ = 0. In genaueren Modellen werden typischerweise folgende Parameter angenomR̃ men: ta ≈ 10−35 s, tf ≈ 10−22 s, R̃f ≈ 10−50 , R̃f ≈ 1 cm. a 30 Beschleunigte Expansion des Universums Die Vorhersage Ω = 1 ist im Widerspruch zur Beobachtung ΩBaryonen = 0.05 und ΩDunkle Materie = 0.26. Der fehlende Teil wird dunkle Energie genannt, für deren Existenz es folgenden Hinweis gibt. Eine Typ-IA Supernova hat eine genau definierte Helligkeitskurve, so daß aus der beobachteten Helligkeit auf die Entfernung geschlossen werden kann. 1998 wurde im Hubble Deep Field eine extrem weit entfernte Typ-1A Supernova gefunden. Die damit und aus weiteren Supernovae bestimmbare Kurve R̃(t) führt zur Schlußfolgerung, daß die Expansion des 98 Preliminary version – 4. August 2016 Universums gegenwärtig beschleunigt ist. Entsprechend ist auch gegenwärtig die Λc2 kosmologische Konstante Λ > 0 mit Beitrag ̺Λ = 8πG zur Dichte. N Eine weitere Stütze der Annahmen Λ > 0 sind Schwankungen der Hintergrundstrahlung, die erstmals durch den WMAP-Satellit und dann sehr viel genauer durch den Planck-Satellit (2013) bestimmt wurden. Diese Daten sind in großer Genauigkeit kompatibel mit Ω = 1. Folgende individuellen Beiträge zu Ω wurden bestimmt: ΩΛ = 0.691 ± 0.006 , ΩDM = 0.259 ± 0.006 , ΩBaryonen = 0.0486 ± 0.001 . (30.1) In der Summe führt das auf Ω = 1.000 ± 0.005 und damit k = 0, wie von der aufgeblasenen Phase vorhergesagt. Weitere Parameter sind km s−1 , Mpc = (8.6 ± 0.1) · 10−27 kg m−3 . H0 = (67.74 ± 0.04) ̺c,0 t0 = (13.8 ± 0.02) · 109 Jahre , (30.2) Auch Modelle zur Strukturbildung (ΛCDM = Kosmologisches Standardmodell, Λ+kalte dunkle Materie) stützen die obigen Aussagen. Für k = 0, p = 0, ̺R̃3 = M = const nimmt Gleichung (I) folgende Form an: 4 2 ˙ 2 = κc M 1 + Λc R̃2 . (R̃) 3 R̃ 3 (30.3) Die Lösung ist R̃(t) = κc2 M 31 Λ √3Λ 32 ct sinh . 2 99 Preliminary version – 4. August 2016 (30.4)