Numerische Simulationen zu Quantenschaum-Modellen Diplomarbeit von Michael Ankele 3. November 2009 Hauptberichter: Prof. Dr. Günter Wunner Mitberichter: Prof. Dr. Günter Haag 1. Institut für Theoretische Physik Universität Stuttgart Pfaffenwaldring 57, 70550 Stuttgart Ehrenwörtliche Erklärung Ich erkläre, dass ich diese Arbeit selbständig verfasst und keine anderen als die angegebenen Quellen und Hilfsmittel benutzt habe. Stuttgart, 3. November 2009 Michael Ankele Inhaltsverzeichnis 1 Einleitung 1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Aufbau der Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Theoretische Vorbereitungen 2.1 Relativitätstheorie . . . . 2.2 Cartan-Formalismus . . . 2.3 Ashtekar-Zusammenhang . 2.4 Kanonische Beschreibung . 1 1 2 . . . . 5 5 7 10 12 . . . . . 15 15 17 22 27 29 4 Spin-Schaum Modelle 4.1 Kanonisch aus der Loop-Quantengravitation . . . . . . . . . . . . . . . . 4.2 Ponzano-Regge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Barrett-Crane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 31 33 36 5 Erzeugung von Gittern 5.1 Topologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Gitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 39 41 6 Simulationen - Statik 6.1 Zustandssumme der 3-Sphäre . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Näherung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Numerisches Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 47 49 51 7 Simulationen - Dynamik 7.1 Dynamische Näherung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Eingeschränkte Dynamik . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 59 66 3 Loop-Quantengravitation 3.1 Quantisierung . . . . 3.2 Spin-Netzwerke . . . 3.3 Operatoren . . . . . 3.4 Hamilton-Operator . 3.5 Aussagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v Inhaltsverzeichnis 8 Zusammenfassung und Ausblick 8.1 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 77 77 A Riemannsche Geometrie A.1 Mannigfaltigkeiten . . . . . . . A.2 Tangentialraum . . . . . . . . . A.3 Metrik . . . . . . . . . . . . . . A.4 Zusammenhang und Krümmung . . . . 79 79 80 81 81 B Differentialformen B.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.2 Hodge-Dualität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.3 Äußere Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 85 87 87 C Lie-Gruppen und -Algebren C.1 Lie-Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.2 Haar-Maß . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 89 91 D Spin-Darstellung der SU(2) D.1 Darstellungen von Gruppen . . . D.2 Tensorprodukt-Basen . . . . . . . D.3 Spin-Darstellungen . . . . . . . . D.4 Invariante Tensoren (3j-Symbole) D.5 6j-Symbole . . . . . . . . . . . . . . . . . . 93 93 94 94 95 99 . . . . 101 101 102 104 106 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E Einige Beweise E.1 Wichtige Hilfsformeln . . . . . . . . . . . E.2 Feldgleichungen im Cartan-Formalismus E.3 Wirkungsfunktional . . . . . . . . . . . . E.4 Graphische Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Literaturverzeichnis 109 Danksagung 111 vi 1 Einleitung 1.1 Motivation Quantenmechanik und allgemeine Relativitätstheorie brachten vor etwa einhundert Jahren einen großen Umbruch in die Welt des physikalischen Denkens. Beide bilden Verallgemeinerungen und fundamentale Umformulierungen klassischer Sichtweisen und wurden in ihrem jeweiligen Gültigkeitsbereich hervorragend bestätigt. Dennoch scheiterten bislang noch alle Bestrebungen, eine vollständige Vereinigung beider Theorien zu finden. In den 1960er Jahren wurde fieberhaft versucht, die bewährten Methoden der kanonischen Quantisierung auf die Gravitation anzuwenden. Aber schon in den 1970ern wurde entdeckt, dass die konstruierten Theorien nicht renormierbar sind. Änderungen der klassischen Theorie um dieses Problem zu beseitigen mündeten in der Stringtheorie. Sie gilt seither als vielversprechendster Kandidat für die Beschreibung einer Quantengravitation. Allerdings kamen trotz zahlreicher Fortschritte auch einige Gegenargumente auf. Zum einen ist sie bisher nur als Störungstheorie formuliert. Es fehlt noch immer ein einheitliches und zu Grunde liegendes Gerüst. Zum anderen sieht sie die dynamische Metrik relativ zu einer Hintergrund-Metrik des flachen Minkowski-Raum. Man sagt, sie sei nicht Hintergrund-unabhängig. Ein weiterer Kritikpunkt ist, dass die Theorie eine höhere Zahl von Dimensionen fordert, als bisher beobachtet wurden. Auch lässt sich eine immense Zahl von möglichen Stringtheorien konstruieren und es besteht noch Unklarheit darüber, ob eine davon in Einklang mit unserer Welt ist, und falls ja, wodurch sich diese auszeichnet. Einen alternativen Zugang zur Vereinheitlichung bildet die Loop-Quantengravitation. Abhay Ashtekar entwickelte 1986 eine Formulierung der klassischen Relativitätstheorie, die auf dem Zusammenhang statt der Metrik beruht[1]. Erste Quantisierungsversuche mit Hilfe der Wheeler-DeWitt-Gleichung zeigten, dass einfache Lösungen in Form sogenannter Wilson-Loops existieren. Diese beschreiben eine Feldanregung des Zusammenhangs entlang einer geschlossenen Kurve und gaben der Theorie ihren Namen. Eine Verallgemeinerung dieses Konzepts führte zu den Spin-Netzwerken. Sie sind als SpinDarstellungen auf beliebigen Graphen definiert und wurden schon vorher von Roger Penrose eingeführt, um einen diskreten Raum zu beschreiben, der durch die Richtungsquantelung von Drehimpulsoperatoren entsteht. Die Loop-Quantengravitation ist enger mit der Relativitätstheorie und ihren Grundideen verbunden. So ist sie unabhängig von jeglichem Hintergrundfeld und diffeomorphismusinvariant. Sie zeichnet sich auch durch ihre mathematische Rigerosität aus. Darüber 1 1 Einleitung hinaus macht sie die erstaunliche Vorhersage, dass die Geometrie auf der Planck-Skala diskret ist. Dies erlaubt z.B. den leichteren Umgang mit klassischen Divergenzen in der Raumzeit[2], wie sie in schwarzen Löchern oder dem Urknall auftreten. Allerdings ist die Theorie noch nicht vollständig. So wird noch nach einem HamiltonOperator für die Zeitentwicklung gesucht. Wegen Uneindeutigkeit der Quantisierung wurden bisher mehrere mögliche Operatoren vorgeschlagen und kontrovers diskutiert[23, 22]. Eine weitere offene Frage ist, ob die Theorie im klassischen Grenzfall die bekannte Relativitätstheorie wiedergibt. Darüber hinaus entziehen sich wie bei der Stringtheorie die Vorhersagen noch den experimentellen Möglichkeiten. Ein sehr eng mit der Loop-Quantengravitation verbundenes Konzept ist das des SpinSchaums. Dieser wurde zuerst 1968 von Tullio Regge und Giorgio Ponzano als Pfadintegral-Quantisierung in drei Dimensionen vorgeschlagen[8]. Ende der 1990er Jahre kamen weitere Modelle für den 4-dimensionalen Fall hinzu. Zu den bekanntesten darunter zählt das Barrett-Crane-Modell[3]. Auch einige unabhängig hiervon entstandene Theorien lassen sich in diesem Formalismus beschreiben. Dazu zählen die Summen über Raumzeiten von Stephen Hawking sowie die von Edward Witten eingeführte Gruppenfeldtheorien. 1.2 Aufbau der Arbeit Die ersten drei Kapitel erklären die für diese Arbeit nötige, physikalische Theorie: Kapitel 2 befasst sich mit der allgemeinen Relativitätstheorie als klassische Eichtheorie und bildet die Vorbereitung zur Quantisierung. Es werden schrittweise neue Variablen eingeführt und eine kanonische Formulierung vorgestellt. Zwischenschritte bilden dabei die Tetrad-Basen von Cartan und der Ashtekar-Zusammenhang. Das dritte Kapitel stellt die Loop-Quantengravitation als kanonische Quantisierung vor. Spin-Netzwerke werden eingeführt und ihre Bedeutung als Basisvektoren der Zustände verdeutlicht. Dazu wird gezeigt, wie die Zwangsbedingungen auf diesen Netzen zu implementieren sind. Als direkte Folge wird das diskrete Spektrum des Operators für den Flächeninhalt hergeleitet und Konsequenzen dieser quantisierten Geometrie beschrieben. Auch auf Probleme der Definition und mögliche Wirkungen eines Hamilton-Operators wird eingegangen. Als nächstes wird die Theorie auf sogenannte Spin-Schaum-Modelle ausgeweitet. Diese bilden eine kovariante Beschreibung der Quantentheorie und können als eine diskrete Form der Pfadintegrale angesehen werden. Es werden zwei dieser Modelle vorgestellt: Das erste ist das Ponzano-Regge-Modell der 3-dimensionalen Gravitation. Es beruht auf einer Quantisierung des Regge-Kalküls, also der Triangulierung der Raumzeit. Dieses Modell wird später in den Simulationen verwendet. Das zweite Modell ist das BarrettCrane-Modell und beschreibt die Quantentheorie für den 4-dimensionalen Fall. In den nächsten drei Kapiteln wird dann auf die numerischen Verfahren eingegangen: 2 1.2 Aufbau der Arbeit Zuerst werden Möglichkeiten zur Erzeugung von Triangulierungen in verschiedenen Dimensionen und mit unterschiedlichen Topologien beschrieben. Kapitel 6 stellt das Verfahren vor, mit dem Zustandssummen im Ponzano-Regge-Modell berechnet werden sollen. Da sich diese Aufgabe als numerisch schwierig erweist, sind dazu mehrere Näherungen nötig. Auch Versuche, die dadurch entstehenden Fehler zu beseitigen, werden diskutiert. Das letzten Kapitel befasst sich mit der Möglichkeit, Zustandssummen in einer Art Zeitentwicklung zu berechnen. Dazu wird die Raumzeit entlang einer Zeit“-Achse in Raum” schichten unterteilt, für die dann iterativ eine Lösung gesucht wird. Zwei verschiedene Zeitentwicklungen werden vorgestellt, die sich aus unterschiedlichen Vereinfachungen ergeben. 3 1 Einleitung 4 2 Theoretische Vorbereitungen Bevor im nächsten Kapitel die eigentliche quantenmechanische Theorie besprochen werden kann, sollte zunächst auf die klassische Theorie eingegangen werden. Vor allem ist es für die Quantisierung, wie sie in der Loop-Quantengravitation erfolgt, nötig, die Einsteinschen Feldgleichungen auf eine dafür praktischere Form zu bringen. Zuerst werden die Feldgleichungen in den Tetrad-Formalismus von Cartan übersetzt und durch die Variablen des Tetradfeldes und des Zusammenhangs beschrieben. Diese ersetzen die in der Literatur übliche Metrik. Um die Theorie dann kanonisch quantisieren zu können, wird sie als Hamilton-Mechanik geschrieben, wozu die 4-dimensionale Raumzeit in einen 3-dimensionalen Raum und dessen Zeitentwicklung übersetzt wird. Diese Arbeit hält sich dabei an das Vorgehen in [20]. Zur Schreibweise: • griechische Kleinbuchstaben (µ, ν, ρ = 0, 1, 2, 3) beschreiben Tensorkomponenten im Tangentialraum • lateinische Großbuchstaben (I, J, K = 0, 1, 2, 3) in einem Lorentzsystem • lateinische Kleinbuchstaben (i, j, k, i, j, k = 1, 2, 3) im (3-dimensionalen) Raum; dabei wird hier zwischen Raumkomponenten aus dem Tangentialraum (i, j, k) und aus einem Lorentzsystem (i, j, k) unterschieden • in der Hoffnung die Lesbarkeit zu erhöhen sind interne Indizes (über die summiert wird) vom Anfang der Alphabete gewählt (α, β, A, B, a, b), externe dagegen aus der Mitte (µ, ν, I, J, i, j) Eine kleine Zusammenfassung der Riemannschen Geometrie ist in Anhang A (Seite 79) zu finden, für Differentialformen in Anhang B (Seite 85). 2.1 Relativitätstheorie Die spezielle Relativitätstheorie vereint die Konzepte von Raum und Zeit, die vorher als unabhängig voneinander angesehen wurden, in einem einzigen Objekt, der Raumzeit. Ein fundamentales Prinzip der Theorie ist die Unabhängigkeit der physikalischen Gesetze vom Inertialsystem des Beobachters. Mathematisch entspricht das der Invarianz der Gesetze unter Koordinatentransformation des 4-dimensionalen Vektorraums der Raumzeit. 5 2 Theoretische Vorbereitungen Die allgemeine Relativitätstheorie1 weitet dieses Konzept noch aus und erlaubt die Beschreibung physikalischer Vorgänge in einer gekrümmten Raumzeit. Inertialsysteme existieren dabei nur noch lokal und entsprechen frei fallenden Beobachtern, die sich entlang geodätischer Kurven bewegen. Große Eleganz offenbart die Theorie bei der Beschreibung der Gravitation. Quellen des Gravitationsfeldes werden hier als Quellen der Raumzeit-Krümmung interpretiert. Die gravitative Wechselwirkung der Körper untereinander folgt dann rein aus der geodätischen Bewegung. Quantitativ wird die Erzeugung von Krümmung durch die Einsteinschen Feldgleichungen beschrieben. In der üblichen Notation der Riemannschen Geometrie lauten diese: 8πG 1 (2.1) Rµν − R gµν + Λ gµν = 4 Tµν 2 c (die griechischen Indizes µ, ν beschreiben die Tensor-Komponenten im Tangentialraum mit der üblichen Basis {∂µ =: eµ } und deren Dualbasis {dxµ }). Anschaulich stehen auf der rechten Seite die physikalischen Größen, die die Gravitation erzeugen: Massenströme und sonstige Energieformen. Die linke Seite beschreibt die Krümmung der Raumzeit. Die kosmologische Konstante Λ ist hierbei ein freier Parameter der Theorie und wird erst durch astronomische Beobachtungen abgeschätzt. In diesem Formalismus ist das Metrikfeld gµν die zentrale Größe und es werden folgende, daraus abgeleitete Größen definiert2 : Γρµν 1 := g ρα (−∂α gµν + ∂µ gνα + ∂ν gαµ ) 2 Christoffelsymbole Rµνρσ := ∂ρ Γµνσ − ∂σ Γµνρ + Γανσ Γµαρ − Γανρ Γµασ Krümmungstensor Rµν := Rαµαν Ricci-Tensor R := Rαα = g αβ Rβα Krümmungsskalar. Für die spätere Beschreibung durch Differentialformen sind noch wichtig: 1 2 6 ω µ ν := Γµαν dxα Zusammenhangs-(1-)formen Ωµ ν := dω µ ν + ω µ α ∧ ω α ν = Rµναβ dxα ∧ dxβ Krümmungs-(2-)formen. Von nun an sei mit Relativitätstheorie“ immer die allgemeine Version gemeint. ” Im Anhang A (Seite 79) werden diese Größen genauer besprochen. 2.2 Cartan-Formalismus Die Christoffelsymbole Γρµν (damit gleichbedeutend die Zusammenhangsformen ω µ ν ) definieren die kovariante Ableitung, also die Ableitung eines Vektorfeldes in Richtung eines zweiten. In Koordinatenschreibweise: ∇µ V ν = ∂µ V ν + Γνµα V α . Eine wichtige Folgerung aus der Riemannschen Geometrie ist, dass die Christoffelsymbole eindeutig aus den Forderungen der Torsionsfreiheit (Γρµν = Γρνµ ) sowie 0 = ∇ρ gµν = ∂ρ gµν − Γαρµ gαν − Γαρν gµα (2.2) (der Verträglichkeit mit der Metrik) bestimmt werden können. Es sei noch erwähnt, dass die Einsteinschen Feldgleichungen für eine gegebene Massenverteilung keine eindeutige Lösung für das Metrikfeld besitzen. Zunächst tritt in (2.1) nicht der komplette Krümmungstensor auf, sondern nur der Ricci-Tensor. An die übrigen Formen der Krümmung (diese entsprechen dem Weyl-Tensor) werden lokal keine Forderungen gestellt3 . Darüber hinaus kann jede gefundene Lösung durch Koordinatentransformation und Diffeomorphismen in eine neue Lösung überführt werden. Diese Transformationen ändern nichts an physikalischen Aussagen und werden als Eichtransformationen bezeichnet. 2.2 Cartan-Formalismus Tetrade Es lässt sich für jeden Punkt auf der Raumzeit-Mannigfaltigkeit eine Orthonormalbasis (genauer eine Lorentzbasis) wählen mit den Basisvektoren eI (x) := eαI (x)∂α (Tetrade oder begleitendes 4-Bein genannt) mit einer ortsabhängigen Transformationsmatrix eµI (x) und deren Inversen eµI (große lateinische Indizes bezeichnen Komponenten in einem Lorentzsystem). Die Dualbasis dazu sei eI = eαI dxα . Nach Konstruktion nimmt in dieser Basis die Metrik die Form (ηIJ ) = Diag(−1, 1, 1, 1) an, wie sie aus der speziellen Relativitätstheorie bekannt ist4 . Lorentzindizes können mit dieser Metrik gehoben oder gesenkt werden. Es gilt: 3 Man sagt, die Theorie habe lokale Freiheitsgrade. Diese bilden z.B. die Grundlage für Gravitationswellen. In Dimensionen kleiner 4 verschwindet der Weyl-Tensor und damit auch jeder dieser Freiheitsgrade. Die Theorie wird dann als topologisch“ bezeichnet. ” 4 In der Literatur ist auch Diag(1, −1, −1, −1) üblich. Es wird aber im Folgenden einfacher sein, mit dieser Konvention zu rechnen, weil sich so die euklidische Metrik δij für Raumkomponenten ergibt. 7 2 Theoretische Vorbereitungen Abbildung 2.1: Natürliche Koordinaten-Basis (schwarz) und eine mögliche Cartansche Tetradbasis (blau) hV, W i = VA W A = V A ηAB W B = (V α eαA ) ηAB (eβB W β ) = Vα W α = V α gαβ W β und somit gµν = eµA ηAB eνB . (2.3) Zusammenhang Für diese Tetrad-Basisfelder kann wieder eine kovariante Ableitung definiert werden ∇µ V I = ∂µ V I + ωµIA V A mit matrixwertigen Zusammenhangsformen (= eine Matrix von 1-Formen) ω IJ = ωα IJ dxα . Dieser Zusammenhang wird oft als Spin-Zusammenhang bezeichnet. Der Zusammenhang beschreibt, wie sich die Tetrad-Basisvektoren von einem Punkt der Mannigfaltigkeit zu einem benachbarten ändern. Da die Basen aber als Lorentzsysteme angenommen wurden, erfolgt die Änderung über die Lorentz-Transformationen (SO(3, 1)). Die ω IJ ergeben sich als die infinitesimalen Transformationen, nehmen also Werte in der Lie-Algebra so(3, 1) an. 8 2.2 Cartan-Formalismus Abbildung 2.2: Der Übergang von einer Tetradbasis in die eines benachbarten Punktes geschieht über Rotationen (bzw. Lorentz-Transformationen) Wie oben beschrieben, wird der Zusammenhang eindeutig aus der Metrik bestimmt, wenn zwei Forderungen gestellt werden. Die Verträglichkeit mit der Metrik ist automatisch dadurch erfüllt, dass die ω IJ nur Werte in so(3, 1) annehmen (Lorentz-Transformationen lassen die Metrik invariant). Die Torsionsfreiheit entspricht den Cartanschen Strukturgleichungen: Torsion T I := deI + ω IA ∧ eA = 0 . Wegen (2.3) bestimmt in diesem Formalismus das Tetradfeld eµI die übliche Metrik und bildet auch die zentrale Größe, aus der alle weiteren Größen (wie Zusammenhang und Krümmung) definiert werden. Der Spin-Zusammenhang und die üblichen Christoffelsymbole lassen sich aus dem jeweils anderen berechnen: eα I Γαµν = ∂µ eνI + ωµIA eνA . (2.4) Dass beide Zusammenhänge (Γ, ω) äquivalent sind, lässt sich z.B. zeigen, indem man (2.4) als Definition für Γ ansieht und sich vergewissert, dass diese dann (2.2) erfüllen. Die Äquivalenz folgt dann aus der Eindeutigkeit des Zusammenhangs. Feldgleichungen Aus dem Zusammenhang lassen sich wieder Krümmungsformen definieren: RIJ := ΩIJ := dω IJ + ω IA ∧ ω AJ =: RIJαβ dxα ∧ dxβ . Sie stehen mit den Komponenten des üblichen Krümmungstensors in einfacher Weise in Beziehung: RIJµν = eαI eβJ Rαβµν . (2.5) Die Feldgleichungen lauten damit: 2πG 2 εABCI (eA ∧ RBC − ΛeA ∧ eB ∧ eC ) = 4 TI . 3 c (2.6) 9 2 Theoretische Vorbereitungen Der eher technische Beweis, dass dies wirklich die bekannten Einsteinschen Feldgleichungen sind, ist für den Vakuumfall im Anhang E.2 (Seite 102) nachzulesen. Das Wirkungsfunktional der Gravitation ist c3 S[e, ω] = 64πG Z 1 εABCD (eA ∧ eB ∧ R[ω]CD − ΛeA ∧ eB ∧ eC ∧ eD ) . 3 (2.7) Dabei werden e und ω als unabhängige, dynamische Variablen angesehen5 . Im Weiteren wird die kosmologische Konstante vernachlässigt! 2.3 Ashtekar-Zusammenhang Für die kanonische Quantisierung von großer Bedeutung ist der von Abhay Ashtekar in [1] vorgeschlagene Formalismus, den reellen Spin-Zusammenhang ω aus der 4-dimensionalen Raumzeit durch einen komplexen Zusammenhang im 3-dimensionalen Raum zu ersetzen6 : 1 Ai := − εi ab ω ab + i ω 0i 2 (kleine lateinische Indizes bezeichnen die 3 Raumdimensionen, sie werden mit der euklidischen Metrik δji gehoben und gesenkt!). Aufgrund der Antisymmetrie von ω IJ enthält der Ashtekar-Zusammenhang A dieselbe Information wie der Spin-Zusammenhang. Es lässt sich recht einfach ein Projektionsoperator hierfür definieren: 1 P i jk = − εi jk , 2 i P i 0j = −P i j0 = δji 2 Ai = P i AB ω AB . Diese eigenwillig anmutende Definition kann an einem Beispiel veranschaulicht werden: Die Projektion auf den Feldstärketensor aus der Elektrodynamik angewandt ergibt (ohne Rücksicht auf Konstanten) die magnetischen und elektrischen Felder als Real- und Imaginärteil: P i AB F AB = B i + iE i . Die Krümmungsformen können auf zwei äquivalente Arten definiert werden, entweder als selbstduale Projektion der bisherigen Krümmung oder als Krümmungsform zum selbstdualen Zusammenhang: 5 Das Vorgehen, e und ω als unabhängig anzusehen, ist üblich und in der Literatur als first-order ” formalism“ bekannt. 6 Das negative Vorzeichen widerspricht der Definition in [20], ist aber in Einklang mit [12]. 10 2.3 Ashtekar-Zusammenhang 1 F i := P i AB RAB = dAi + εi ab Aa ∧ Ab . 2 Der Projektionsoperator erfüllt die Beziehung7 i PaIJ P a KL = εIJKL + symmetrische Anteile 4 (am einfachsten durch Wahl eines festen externen Indizes zu sehen), deshalb kann das ε in der Wirkung (2.7) durch Projektoren ersetzt werden. Dabei entfallen diejenigen Anteile, die symmetrisch in beliebigen Indizes sind, denn es wird mit einer 4-Form kontrahiert, und diese ist nach Definition total antisymmetrisch. Es folgt für die Wirkung: Z −i c3 S[e, A] = PaAB eA ∧ eB ∧ F a . (2.8) 16πG Die eben beschriebene Projektion führt auf den selbstdualen (Plebanski-) Formalismus (siehe [12]). Er definiert die 2-Formen: Σi := P i AB eA ∧ eB oder explizit: Σ1 = −e2 ∧ e3 + i e0 ∧ e1 Σ2 = −e3 ∧ e1 + i e0 ∧ e2 Σ3 = −e1 ∧ e2 + i e0 ∧ e3 . Diese sind selbstdual, denn es gilt ?Σj = −i Σj , was auch den Namen des Formalismus erklärt. Für die Basis der Bivektoren Σ ist auch wieder A der Zusammenhang. Damit vereinfacht sich (2.8) weiter zu: Z −i c3 Σa ∧ F a . (2.9) S[Σ, A] = 16πG Für die spätere Quantisierung ist noch der Barbero-Zusammenhang8 zu erwähnen: 1 Ai := − εi ab ω ab + γ ω 0i . 2 Er verallgemeinert die imaginäre Einheit aus der selbstdualen Version auf eine bisher noch beliebige komplexe Konstante γ. Sie wird Barbero-Immirzi-Parameter genannt, nach J. Fernando Barbero, der einen realen Zusammenhang wählte, um die 7 8 Man beachte die Vorzeichenkonvention des ε-Symbols siehe Anhang E (Seite 101). In der Literatur auch unter verschiedenen Kombinationen und Permutationen der Namen Ashtekar“, ” Barbero“ und Immirzi“ bekannt. ” ” 11 2 Theoretische Vorbereitungen Quantisierung zu vereinfachen, sowie Giorgio Immirzi, der den allgemeinen Fall konstruierte und zeigen konnte, dass die verschiedenen Fälle aus kanonischen Transformationen aus einander hervorgehen, also dieselbe (klassische) Theorie beschreiben (siehe [14]). 2.4 Kanonische Beschreibung Projektion auf den 3d-Raum Bisher wurde die Theorie rein kovariant beschrieben, alle 4 Dimensionen der Raumzeit wurden gleichberechtigt behandelt. Da es für die kanonische Quantisierung von Nöten ist, von einer Hamiltonmechanik auszugehen, wird nun eine Trennung von Raum und Zeit vollzogen. Dazu wird eine 3-dimensionale Untermannigfaltigkeit σ der Raumzeit gewählt und als Raum“ bezeichnet. ” Die Koordinaten der Raumzeit können immer so gewählt werden, dass die Zeitkomponente x0 der Koordinaten auf dem Raum konstant ist, dann spannen auch die 1-Formen {dxi } wieder den dualen Tangentialraum Tx? σ des Raumes auf. Alle bisher definierten Größen können auf σ herunter projiziert werden, indem nur Komponenten berücksichtigt werden, die in Raumrichtung weisen. So z.B. die 4 TetradBasisformen: I 4d e = eαI dxα 7→ I 3d e = eaI dxa (es wird hier nicht mehr über α = 0, 1, 2, 3 summiert, sondern über a = 1, 2, 3). Da die Dimension des Tangentialraums nur noch 3 ist, sind diese 4 Formen linear abhängig. Es wird deshalb üblicherweise eine Eichung gewählt, in der eine der Formen verschwindet: 3d e 0 =0 ⇔ ei 0 = 0 . Im Weiteren sind Größen, falls nicht anders angegeben, immer als 3d-Projektion aufzufassen. Das elektrische Feld Eine zentrale Rolle in der Theorie nimmt die Größe 1 (2.10) E i j := εiab Σj ab = εiab εjcd ea c eb d 2 ein. Sie wird in Anlehnung an Yang-Mills-Theorien das elektrische Feld genannt. Seine große Bedeutung erhält E dadurch, dass es der kanonisch konjugierte Impuls des Zusammenhangs A ist. Um dies zu sehen, wird das Wirkungsfunktional (2.9) in den Variablen E und A formuliert: −i c3 S[E, A] = 8πG 12 Z a E b a Ȧb + λa0 (Db E b a ) + λc (E b a Fbca ) + λ(εabc E e b E f c Fa ef ) d4 x 2.4 Kanonische Beschreibung (Beweis siehe Anhang E.3 (Seite 104)). Die verschiedenen λs bezeichnen dabei LagrangeMultiplikatoren, D ist die kovariante Ableitung. Aus dieser Form des Funktionals lässt sich die Poisson-Klammer ablesen: {Ai j (x), E k l (y)} = 8πiG k j δ δ δ(x − y) . c3 i l Darüberhinaus lassen sich aus Gleichung (2.4) Bedingungen an die Felder ableiten, indem die Lagrange-Multiplikatoren variiert werden: ε abc e Db E b a = 0 (2.11) E b a Fbia = 0 (2.12) f (2.13) E b E c Fa ef = 0 . Die Gaußgleichung (2.11) fordert die lokale SO(3)-Eichinvarianz in Form von Rotationen der Cartan-Basen, (2.12) fordert die Diffeomorphismusinvarianz. Beide werden in [18] als Erzeuger lokaler Eichtransformationen beschrieben. Gleichung (2.13) erzeugt die Zeitentwicklung und somit die Dynamik der Theorie. In der englischsprachigen Literatur wird sie deshalb meist hamiltonian constraint“ genannt. ” In der oben beschriebenen Eichung ist E reell und es gilt: E i j = det(e) (e−1 )i j (2.14) wie die folgende Rechnung zeigt: 1 E a i ea j = εabc εide eb d ec e ea j 2 1 = det(e) εide εjde 2 = det(e) δij . Darüber hinaus wird sich im nächsten Kapitel zeigen, dass das Integral über das elektrische Feld den Flächeninhalt ergibt. Mit Barbero-Immirzi-Parameter Wird statt des reinen selbstdualen Zusammenhangs der Barbero-Zusammenhang verwendet, so fließt der Barbero-Immirzi-Parameter γ in die Poisson-Klammern mit ein: {Ai j (x), E k l (y)} = 8πγG k j δi δl δ(x − y) c3 13 2 Theoretische Vorbereitungen und es ergeben sich zusätzliche Terme in den Feldgleichungen9 : Db E b a = 0 E ebE f c E b a Fbia − (1 + γ 2 )Kia Db E b a = 0 a εa bc Fef − 2(1 + γ 2 )K[eb Kfc] = 0 Eine Herleitung dieser Terme aus Sicht des ADM-Formalismus10 ist in [18] zu finden. Dabei ist K die äußere Krümmung, d.h. die Krümmung der Einbettung des 3d-Raumes in die 4d-Raumzeit. Details hierzu siehe [10]. 9 Mit den eckigen Klammern um die Indizes in der letzten Gleichung ist der antisymmetrische Anteil gemeint. 10 Benannt nach Richard Arnowitt, Stanley Deser und Charles W. Misner. 14 3 Loop-Quantengravitation In diesem Kapitel soll eine kanonische Quantisierung der Relativitätstheorie vorgestellt werden. Die Basiszustände des Hilbertraums bilden hierbei sogenannte Spin-Netzwerke, die als diskrete Struktur des Raumes auf der Planck-Skala interpretiert werden können. Für eine Einführung in das Thema siehe [18] oder [16]. Eine abstraktere Sichtweise bietet [20]. 3.1 Quantisierung Im letzten Kapitel wurde die klassische Relativitätstheorie vorgestellt, deren kanonische Variablen der so(3)-Zusammenhang A und das elektrische Feld E auf einer 3dimensionalen Mannigfaltigkeit sind. Im Weiteren wird die Eichgruppe SO(3) durch ihre universelle Überlagerungsgruppe SU (2) ersetzt. Dies hat keinen Einfluss auf die klassische Theorie, da beide Gruppen dieselbe Lie-Algebra so(3) ∼ = su(2) besitzen, in der der Zusammenhang Werte annimmt. Dem üblichen Weg der kanonischen Quantisierung folgend, muss zu diesen Variablen ein Hilbertraum gefunden werden, so dass die Operatoren des Raumes eine Darstellung dieser Variablen bilden. Eine natürliche Wahl hierfür stellen Funktionale des Zusammenhangs dar, die sich aus den Holonomien konstruieren lassen. Holonomie V γ (0) h(t) V γ (t) . γ (t) Abbildung 3.1: Paralleltransport eines Vektors V entlang einer Kurve γ(t). In gekrümmten Räumen geht der allgemeine Begriff der Parallelität von Vektoren verloren. Statt dessen wird Parallelität entlang einer Kurve γ als die Eigenschaft definiert, dass die kovariante Ableitung nach der Kurventangente verschwindet. Sei V ein Vektor am Startpunkt γ(0) einer Kurve γ(t). Dann kann eine Abbildung h(t) : Tγ(0) M → Tγ(t) M 15 3 Loop-Quantengravitation definiert werden, die den Vektor vom Startpunkt auf einen parallel verschobenen Vektor h(t)V an einem beliebigen Punkt der Kurve abbildet. Die Gleichung für Parallelität lautet dann: ∇γ̇ (h(t)V ) = 0 ⇔ ∂t hµν + γ̇ α Γµαβ hβν = 0 mit γ̇ := dγ(t) dt ⇔ ∂t h + γ̇ α ωα h = 0 . Sei nun der Parameterbereich t ∈ [0, 1]. Die Differentialgleichung hat als eindeutige Lösung mit Anfangsbedingung h(0) = 1 die Abbildung h := h(1) : Tγ(0) M → Tγ(1) M . 1 Sie wird Holonomie genannt. Die Abbildung ist linear und wegen der Verträglichkeit der kovarianten Ableitung mit der Metrik gilt: h ∈ SO(n). Sei nun der 3-dimensionale Raum mit dem Zusammenhang A gegeben. Dieser ist eine 1-Form mit Werten in der Lie-Algebra su(2). Explizit lautet seine Basisentwicklung A = Aa b dxa τb mit drei Basisvektoren τi der Algebra su(2). Die formale Lösung ergibt sich dann als Grenzwert, indem das Parametergebiet in viele kleine Teilstücke zerlegt wird, in denen alle Größen als konstant angenommen werden. 2 a Jedes Teilstück trägt einen Faktor 1 + γ̇ (ti )Aa (ti )dt bei. Die gesamte Holonomie ergibt sich dann als Grenzwert des Produkts Y h= 1 + γ̇ a Aa (ti )dt . (3.1) i Eine alternative und übliche Schreibweise hierfür folgt aus der Reihenentwicklung dieses Ausdrucks nach Termen in dt. Diese wird Pfad-geordnetes Integral“ genannt und ist ” z.B. aus der Störungstheorie bekannt: Z 1 a h=1+ dt γ̇ Aa (t) + 0 Z =: P exp A . Z 1 Z dt1 0 t1 dt2 γ̇A(t1 )γ̇A(t2 ) + . . . 0 γ Die SU (2)-Eichtransformationen entsprechen der lokalen Wahl von Cartan-Basen. Eine wichtige Eigenschaft von h ist, dass es nur von Transformationen an den Endpunkten abhängt und unabhängig von Eichungen im Inneren der Kurve ist. Insbesondere ist die Holonomie von geschlossenen Kurven eichinvariant. Darüber hinaus kann die komplette Information des Zusammenhangs aus den Holonomien rekonstruiert werden, indem der Raum mit beliebigen Kurven abgetastet wird. 1 Mit Holonomie ist im strengeren Sinne meist der Fall von geschlossenen Kurven gemeint, hier wird der Begriff allerdings auch für offene Kurven verwendet. 2 Man beachte das Vorzeichen in der Definition von A. 16 3.2 Spin-Netzwerke Zwangsbedingungen Im nächsten Schritt sollen die Zwangsbedingungen (2.11), (2.12) und (2.13) in die Theorie eingebaut werden. Die Forderung der ersten beiden auf dem Raum der Funktionale ist leicht zu realisieren und führt zu den im nächsten Kapitel vorgestellten Spin-Netzwerken. Beim Anwenden der Zwangsbedingungen wird sich eine Hierarchie von Hilberträumen ergeben. Hkin ist der Raum der quantisierten Variablen ohne Zwangsbedingungen, also der Funktionale des Zusammenhangs. Die Lösungen der Gaußgleichung ergeben einen Unterraum HG < Hkin . Weitere Einschränkungen durch Diffeomorphismusinvarianz (2.12) ergibt den Raum Hdiff < HG < Hkin . Die dritte Bedingung (hamiltonian constraint) ist zur Zeit noch Gegenstand der Forschung. Es gibt allerdings mehrere Vorschläge zur Lösung. Der Lösungsraum wird als physikalischer Hilbertraum Hphys bezeichnet. 3.2 Spin-Netzwerke Um die Gaußbedingung (2.11) zu erfüllen, werden nun spezielle Funktionale des Zusammenhangs konstruiert. Sei dazu Γ ein Graph im Raum. Dieser besteht aus einer Menge von Knoten (Punkten im Raum) und Kanten (Pfade, die die Knoten verbinden). Der Einfachheit halber werden nur Knoten erlaubt, in denen maximal 3 Kanten enden. Der allgemeine Fall lässt sich hierauf zurückführen. Für einen gegebenen Zusammenhang entspricht jeder Kante γ eine Holonomie hγ ∈ SU (2) entlang ihres Weges. Als zylindrische Funktion 3 werden nun Funktionale bezeichnet, die nur von den Holonomien auf einem Graphen abhängen. Eine einzelne zylindrische Funktion Ψ[A] sieht“ nicht den kompletten Informationsgehalt des kontinuierlichen ” Zusammenhangs sondern ist eine gewöhnliche Funktion von den Gruppenelementen hγ in die komplexen Zahlen Ψf [A] = f (hγ1 [A], . . . , hγn [A]) . Jede Kante γi im Graphen Γ ergibt dabei einen Parameter der Funktion f . Die Menge der zylindrischen Funktionen kann zu einem Hilbertraum vervollständigt werden (das Skalarprodukt dazu wird weiter unten definiert). Dieser wird als kinematischer Hilbertraum Hkin bezeichnet, da er die Grundlage für die quantenmechanische Theorie ohne Zwangsbedingung bildet. Spezielle Elemente dieses Raumes werden Spin-Netzwerke genannt. Dabei trägt jede Kante im Graphen eine halbzahlige Spin-Zahl, die eine irreduzible Darstellung der Gruppe SU (2) wählt (siehe Anhang D (Seite 93)). Jede Holonomie ist dann in Form einer (2j + 1)-dimensionalen Matrix (ρj (hγ [A]))mm0 gegeben. Den Knoten werden invariante Tensoren T zugeordnet. Sie liegen im Tensorprodukt der Darstellungen der drei angrenzenden Kanten mit deren Spin-Zahlen. 3 Für diese Objekte scheint es nur den englischen Ausdruck cylindrical functions“ zu geben. ” 17 3 Loop-Quantengravitation Sei nun ein Graph Γ zusammen mit den Daten der Spin-Zahlen {jγ } und der invarianten Tensoren {Tk } gegeben. Das Funktional des Spin-Netzwerks wird dadurch konstruiert, dass für jeden Knoten die freien Indizes des zugehörigen Tensors mit den Indizes der Holonomie-Darstellungsmatrizen der angrenzenden Kanten kontrahiert werden. Die beiden Indizes der Matrix einer Kante entsprechen dabei deren Anfangs- und Endpunkt. Beispiele j δ ik Abbildung 3.2: Einfachster Graph aus nur einem Knoten und einer Kante mit Spinzahl j. Für den Tensor des Knotens kommt nur das δ-Symbol in Frage. Der einfachste Graph (Abb. 3.2) besteht aus einem Knoten und einem geschlossenen Pfad als Kante. Als invariante Tensoren kommen nur skalare Vielfache der Eins in Frage. Dies folgt aus den Schur-Lemmata. Nach Kontraktion der Indizes ergibt sich einfach die Spur der Darstellungsmatrix, bzw. ein Vielfaches davon: ρj (hγ [A])ab λ δ ab = λ Tr ρj (hγ [A]) . Der Fall λ = 1, j = beruhte. 1 2 wird als Wilson-Loop bezeichnet, auf dem die Theorie anfangs j1 Tikl j3 j2 Abbildung 3.3: Knoten, an dem sich 3 Kanten treffen. Diesem wird der Tensor T zugeordnet. Sei nun ein Knoten gegeben, in den drei Kanten münden (Abb. 3.3). Der Tensor sei T ikl und die drei Kanten tragen Spins j1 , j2 , j3 . Dann ergibt sich als Teil des Spin-Netzwerks der Ausdruck T abc ρj1 (hγ1 [A])ai ρj2 (hγ2 [A])bk ρj3 (hγ3 [A])cl . 18 3.2 Spin-Netzwerke Die drei noch offenen Indizes werden dann mit den Tensoren kontrahiert, die den Endpunkten der Kanten entsprechen. Tensoren Wie in Anhang D (Seite 93) beschrieben, müssen invariante Tensoren im Tensorprodukt der Darstellungen liegen. Dieser Raum ist entweder eindimensional, falls die ClebschGordan-Bedingungen erfüllt sind, oder ansonsten leer. D.h. die drei Spin-Zahlen j1 , j2 , j3 auf Kanten, die sich in einem Knoten treffen, müssen diese Bedingungen erfüllen: j1 + j2 + j3 ∈ N , (j1 + j2 ) ≥ j3 ≥ |j1 − j2 | mit Permutationen. Da das Tensorprodukt der Darstellungen in diesem Fall eindimensional ist, ist auch der Tensor für jeden Knoten bis auf ein skalares Vielfaches festgelegt. Diese Rolle übernehmen die Wigner 3j-Symbole. Der oben beschriebene Term im Spin-Netzwerk Funktional nimmt dann die folgende Form an: j1 j2 j3 ρj1 (hγ1 [A])ai ρj2 (hγ2 [A])bk ρj3 (hγ3 [A])cl . a b c Die skalaren Vielfachheiten können für das komplette Funktional zusammengefasst werden und fließen in die Normierung ein. Wie im ersten Beispiel gesehen, können Knoten mit nur zwei Verbindungen komplett in den Normierungsfaktor einfließen. Auch Knoten mit mehr als 3 Kanten können in mehrere Knoten zerlegt werden, die jeweils nur 3 Kanten besitzen. Gaußbedingung Die soeben beschriebenen Spin-Netzwerke erfüllen die Gaußgleichung (2.11). Diese Gleichung kann als Forderung interpretiert werden, dass das Funktional invariant unter lokalen SU (2)-Eichtransformationen ist. Wie weiter oben bemerkt, hat eine Eichtransformation, die nur auf das Innere von Kanten wirkt, keinen Einfluss auf die Holonomien, und man kann sich darauf beschränken, einzelne Knoten zu betrachten. Eine lokale Eichtransformation g ∈ SU (2) wirke also auf einen Knoten. Dies entspricht einer Rotation der Cartan-Basis an diesem Punkt im Raum. Die Holonomie einer angrenzenden Kante transformiert sich dann zu hγ 7→ g · hγ falls der Knoten der Startpunkt der Kurve γ ist, bzw. hγ 7→ hγ · g −1 für den Endpunkt. Diese Transformation wirkt auf alle drei Holonomien, die sich diesen Knoten teilen. Also o.B.d.A.: 19 3 Loop-Quantengravitation Ψf [A] = f (hγ1 , hγ2 , hγ3 , . . . ) 7→ f (g hγ1 , g hγ2 , g hγ3 , . . . ) . Der Term für den Knoten ist dann wegen der Homomorphismuseigenschaft der Darstellungen T abc ρj1 (g hγ1 )ai ρj2 (g hγ2 )bk ρj3 (g hγ3 )cl = T abc ρj1 (g)aa0 ρj1 (hγ1 )a0 i . . . . Andererseits transformiert sich der invariante Tensor des Knotens trivial unter genau dieser Operation. Somit absorbiert er alle drei gs bzw. deren Darstellungsmatrizen T abc ρj1 (g)ai ρj2 (g)bk ρj3 (g)cl = (T 0 )ikl = T ikl . Damit ist der Wert des Funktionals Ψ[A] unabhängig von lokalen Transformationen. Skalarprodukt Ein Graph Γ habe die Kanten γ1 , . . . , γn . Für zwei zylindrische Funktionen Ψf , Ψg , die auf diesem Graphen Γ definiert sind, kann durch folgenden Ausdruck ein Skalarprodukt dieser beiden Zustände definiert werden: Z hΨf |Ψg i := f (h1 , . . . , hn ) g(h1 , . . . , hn ) dn h . SU (2)n Hier wird über die Möglichkeiten der Holonomien aller Kanten mit dem Haar-Maß integriert. Diese Definition ist analog zum Skalarprodukt der Quantenmechanik in der Darstellung der Schrödingerschen Wellenmechanik. Dort wird ein Zustand als Wellenfunktion Ψ(x) angesehen, also als Funktion der klassischen Zustandsvariablen des Ortes. Im Skalarprodukt Z hΨ|Φi = Ψ(x)Φ(x)d3 x R3 wird dann auch dieser klassische Freiheitsgrad ausintegriert. Falls die Funktionale auf unterschiedlichen Graphen Γ0 , Γ00 definiert sind, kann die Vereinigung Γ := Γ0 ∪ Γ00 betrachtet werden. Beide Funktionale sind auf Γ ausdehnbar, indem formal weitere Parameter für die zusätzlichen Kanten in die Funktion geschrieben werden. Das Integral läuft dann über alle Kanten der Vereinigung Γ. In [18] wird mit Hilfe des Peter-Weyl-Theorems bewiesen, dass die (normierten) SpinNetze eine vollständige und orthonormale Basis in HG bilden. 20 3.2 Spin-Netzwerke Diffeomorphismusinvarianz Wir gehen nun zu den Lösungen der Gleichung (2.12) über. Anschaulich entspricht dies der Forderung der Invarianz unter Diffeomorphismen, also bijektiven und differenzierbaren Abbildungen des Raumes in einen anderen Raum. Sei Diff die Menge dieser Abbildungen. Auch gewöhnliche Koordinatentransformationen können hierzu gezählt werden. N M γ φ φ −1γ φ *A A Abbildung 3.4: Ein Diffeomorphismus φ zwischen zwei Räumen und seine Wirkung auf Pfade γ und Zusammenhang A. Sei eine Mannigfaltigkeit M gegeben sowie eine Abbildung Diff 3 φ : M → N in eine zweite Mannigfaltigkeit N (siehe Abb. 3.4). Von Interesse ist das Transformationsverhalten einer Holonomie unter dieser Abbildung. Dazu sei ein Pfad γ in N gegeben4 , dem eine Holonomie hγ [A] zugeordnet werden kann. Diese nimmt als Argument den Zusammenhang in N . Über die Abbildung φ kann hieraus eine Holonomie im ursprünglichen Raum M konstruiert werden, indem das Urbild des Pfades also φ−1 γ ⊂ M betrachtet wird. Dies definiert eine Holonomie, die einen Zusammenhang auf M als Parameter nimmt. Alternativ kann der Pfad γ in N betrachtet werden und stattdessen wird der Parameter A von M nach N abgebildet. Das Differential dφ bildet Vektoren von M nach N ab, dementsprechend bildet das Dual von dφ eine 1-Form ab. Das Ergebnis dieser Abbildung wird geschrieben als φ? A. Beide Definitionen der neuen Holonomie sind äquivalent: hγ [φ? A] = hφ−1 γ [A] =: Uφ h[A] . Entsprechend transformiert ein Diffeomorphismus die Zustände |ΨΓ,f i entweder als Abbildung der Parameter oder als Verschiebung“ des Graphen Γ. ” Die Grundidee, invariante Zustände zu konstruieren, ist es, nun für ein gegebenes Funktional über alle möglichen Diffeomorphismen zu integrieren: Z Uφ |ΨiDφ . (3.2) Diff 4 Die Richtung, in der die Transformation definiert wird, ist Konvention und im Folgenden nicht von Bedeutung, da das Ziel die Invarianz ist. 21 3 Loop-Quantengravitation Ein solcher Zustand wäre wegen der Gruppeneigenschaften von Diff invariant unter Transformationen. Um diese Idee auf mathematisch sinnvollen Grund zu stellen, werden nun die Funktionale auf dem Zustandsraum betrachtet, also die Dualvektoren hΨ| und deren Transformierten hΨ|Uφ . Das Skalarprodukt mit einem Zustand (die duale Paarung) hΨΓ,f | Uφ (|ΨΓ0 ,g i) ist wegen der Orthogonalitätseigenschaften der Spinnetze nur ungleich Null, wenn der Diffeomorphismus den Graphen Γ auf den Graphen Γ0 abbildet. Für den Fall von Spinnetzen ergeben sich nur endlich viele Möglichkeiten für die Transformation entsprechend den Symmetrieeigenschaften des Netzes, da die Kanten des Graphen nur jeweils auf Kanten mit derselben Spinzahl abgebildet werden dürfen. Die einzig erlaubte Änderung ist dann die Durchlaufrichtung der Kanten. Andererseits ist für die Zustände nur die Wirkung der Transformation auf dem Graphen von Bedeutung. Deswegen kann das Integral in (3.2) zu einer endlichen Summe umgeschrieben werden, die nur über Vertreter von Äquivalenzklassen von Diffeomorphismen mit diesen Eigenschaften läuft: (ΨΓ,f | := X hΨΓ,f | Uφ . φ∈Diff Der Lösungsraum Hdiff der Diffeomorphismusinvarianz wird dann definiert als der Raum der Spinnetze, mit Abgeschlossenheit unter dem folgenden Skalarprodukt: h[Ψ]|[Φ]iDiff := (Ψ|Φi = X hΨ|Uφ |Φi . (3.3) φ∈Diff Der wichtige Punkt bei dieser Definition ist, dass die Zustände nun Äquivalenzklassen unter Diffeomorphismen sind. Wie am Skalarprodukt (3.3) zu sehen, kann der Graph eines Zustands Ψ beliebig durch Diffeomorphismen deformiert werden. Jede Deformation wird im Skalarprodukt dadurch kompensiert, dass die Diffeomorphismen verändert werden, über die summiert wird. Eine echte Änderung des Zustands erfolgt erst, sobald sich die Topologie des Graphen verändert, z.B. wenn eine Kante durch eine andere hindurch geschoben wird. Diese Definition ist von einem anderen mathematischen Gebiet bekannt: der Knotentheorie. Die neuen Zustände werden deshalb als Spin-Knoten bezeichnet. 3.3 Operatoren Ziel dieses Abschnitts wird sein, einen quantisierten Operator für den Flächeninhalt zu finden, und zu zeigen, dass er ein diskretes Spektrum besitzt. 22 3.3 Operatoren Klassischer Flächeninhalt Seien xi kartesische Koordinaten in einem 3-dimensionalen (flachen) Raum und xi (u, v) eine durch u und v parametrisierte Fläche. Der Flächeninhalt wird dann durch das Integral über ein Parametergebiet S berechnet Z p Z knkdu dv = na nb δ ab du dv A= S S mit dem Normalenvektor ni := ∂xa ∂xb εabi . ∂u ∂v Bei der Verallgemeinerung zu beliebigen Koordinaten xi mit Metrik gij erhalten die √ Normalenvektoren jeweils einen Faktor von g, weil sich das ε-Symbol wie eine Tensordichte transformiert. Auch das δ ab wird zur inversen Metrik g ab . Unter Verwendung der unveränderten Definition der Normalenvektoren berechnet sich der Flächeninhalt als Z p A= g na nb g ab du dv . S Andererseits gilt wegen Gleichung (2.14) für das elektrische Feld E i a E j b δ ab = det(e)2 (e−1 )i a (e−1 )j b δ ab = det(e · 1 · e) (e−1 )i a (e−1 )j b δ ab = det(g) (g −1 )ij mit (2.3) ij = gg . Damit und mit der Abkürzung Ei := E a i na lässt sich der Flächeninhalt durch das elektrische Feld ausdrücken als Z p Ea Eb δ ab du dv . (3.4) A= S Elektrisches Feld als Operator Ähnlich der Ortsvariablen in der Schrödingerschen Wellenmechanik wirkt der Zusammenhang  als Operator durch einfache Multiplikation auf die Zustände5 . Wie von der Impulsvariable zu erwarten ist das elektrische Feld die (funktionale) Ableitung nach dem Zusammenhang: 5 Streng genommen wird hierfür nicht A, sondern die Holonomie h[A] benutzt, damit das Produkt wieder eine zyklische Funktion ist, also nur von Holonomien abhängt. 23 3 Loop-Quantengravitation 8π~γG δ δ =: −iC . 3 c δA δA Nun soll die Wirkung dieser Ableitung auf eine Holonomie berechnet werden. Die funktionale Ableitung wird gerne geschrieben als: Ê = −i δ δAi j (y) h[Ak l (x) + δki δjl δ 3 (x − y)] − h[A] . →0 hγ [A] = lim Mit der Produktschreibweise (3.1) und der Produktregel ergibt sich unter Benutzung impliziter Grenzwertbildung: δ δAi j (y) hγ [A] = X Y x = X Y = ... δ δAi j (y) Y 1 + γ̇ Aa (x)dt ... a vor x Y i 3 γ̇ τj dt δ (x − y) ... vor x nach x X Zx ... nach x x = hγ1 [A] γ̇ i τj dt δ 3 (x − y) hγ0 [A] γ̇ i δ 3 (xt − y) hγ1 τj hγ0 dt . (3.5) Dabei sind γ0 und γ1 die Teil-Kurven vor bzw. nach dem Punkt x. Das Ergebnis (3.5) hat nach Ausführen des Integrals noch distributiven Charakter in zwei Raumdimensionen. Daher liegt es nahe, eine mathematisch sauberere Version des elektrischen Feldoperators zu definieren, indem mit einer Testfunktion f über eine Fläche S integriert wird: Z du dv f a Êa hγ . Ê[S, f ] hγ := S Für den Fall, dass γ die Fläche S genau einmal im Punkt p schneidet, folgt Z Ê[S, f ] hγ = −iC du dv dt f a nb γ̇ b δ 3 x(t) − x(u, v) hγ0 τa hγ1 Z = −iC du dv dt ∂xd ∂xc ∂xb εdcb f a δ 3 x(t) − x(u, v) hγ0 τa hγ1 |∂u ∂v{z ∂t } =det Z = −iC ∂x ∂(uvt) d3 x f a δ 3 x − p hγ0 τa hγ1 = −iCf a (p) hγ0 [A] τa hγ1 [A] =: f a (p) Êa [S] hγ [A] . 24 3.3 Operatoren γ1 p S γ0 Abbildung 3.5: Der Pfad γ einer Holonomie schneidet die Fläche S, auf der der Operator des elektrischen Feldes definiert wird, im Punkt p und wird dabei in zwei Teil-Pfade γ0 und γ1 aufgeteilt. Der Fall einer Kurve γ, die die Fläche berührt, also tangential verläuft, ist aufwändiger zu behandeln. In [18] wird beschrieben, dass dann gilt: Ê[S, f ] hγ = 0 . Flächeninhalt-Operator Die Grundidee bei der Konstruktion eines Operators für den Flächeninhalt ist es, das Integral in der klassischen Formel (3.4) als Grenzwert einer Summe über kleine Flächenstücke anzusehen Xp Ea (Si )Eb (Si ) δ ab . A= i Im nächsten Schritt werden die klassischen Felder E durch ihre Operatoren ersetzt. Dafür wird zuerst die Wirkung zweier E-Operatoren auf die Darstellung einer Holonomie berechnet: δ ab Êa [Si ] Êb [Si ] ρj (hγ [A]) = δ ab (−iC)2 ρj (hγ0 ) ρj (τb ) ρj (τa ) ρj (hγ1 ) = −C 2 ρj (hγ0 ) ρj (δ ab τb τa ) ρj (hγ1 ) = C 2 (j(j + 1)) ρj (hγ ) . Im letzten Schritt wurde ausgenutzt, dass δ ab τb τa ein Casimir-Operator von su(2) ist. Dessen Darstellungsmatrix zur Darstellung j ist gerade das −(j(j + 1))-fache der Einheitsmatrix. In der Quantenmechanik ist dieser Sachverhalt für das Quadrat des Drehimpulsoperators L̂2 = L̂2x + L̂2y + L̂2z bekannt. Der Operator für den Flächeninhalt nimmt die Form Xq ÂS = Êa [Si ]Êb [Si ] δ ab i 25 3 Loop-Quantengravitation Abbildung 3.6: Zur Berechnung des Flächeninhalts für ein Spinnetz wird die Fläche in Teilstücke zerlegt, so dass jedes von höchstens einer Kante einmal geschnitten wird. an. Bisher wurde die Wirkung der Operatoren nur für den Fall berechnet, dass Fläche und Kurve sich nur in (höchstens) einem Punkt schneiden. Wird der Operator ÂS auf ein Spinnetz im Graphen Γ angewandt, kann es sein, dass Γ und S eine große Zahl von Schnittpunkten besitzen. Die Aufteilung von S in kleine Flächenstücke Si muss dann so erfolgen, dass jedes Si nur höchstens einen Schnittpunkt besitzt. Auch macht es keine zusätzlichen Schwierigkeiten, einen Grenzwert für beliebig kleine Flächenstücke zu berechnen, da in der Wirkung der Operatoren die Fläche Si nicht mehr auftritt. Somit genügt es, eine Flächenaufteilung endlicher Größe zu wählen, um die exakte Wirkung von ÂS auf ein Spinnetz zu berechnen: ÂS |Ψi = Xp Xp C 2 ji (ji + 1)|Ψi = C ji (ji + 1)|Ψi i = 8πγ i lp2 Xp ji (ji + 1)|Ψi . (3.6) i Jede p Kante im Graphen, die die Fläche schneidet, trägt dabei mit einem Summanden j(j + 1) bei. Dieses Ergebnis ist von großer Bedeutung für die Loop-Quantengravitation (LQG). Zunächst bedeutet es, dass die Spinnetze Eigenzustände zum Operator  sind. Erstaunlicher ist, dass  offensichtlich ein diskretes Spektrum besitzt. Der kleinste √ positive 1 Eigenwert ergibt sich für eine einzelne Kante mit Spin j = 2 und beträgt C 3/2, also in der Größenordnung des Quadrats der Plancklänge lp . Der genaue Wert hängt von der Wahl des Immirzi-Parameters γ ab. Die Theorie sagt somit eine Quantisierung der Fläche auf der Planck-Skala voraus. Die abstrakten Spinnetze können dann als Erzeuger“ von Flächeninhalt angesehen wer” 26 3.4 Hamilton-Operator den. Die Spinzahlen an den Kanten entsprechen elementaren Anregungszuständen der Raumzeit, die einer Fläche einen Inhalt geben, die sie durchschneiden. Volumen-Operator Eine ähnliche aber aufwändigere Konstruktion des Operators für den Rauminhalt offenbart auch eine Quantisierung des Volumens. Dieses wird von den Knoten im Graphen im Spin-Netzwerk erzeugt. Details siehe [18] und ausführlicher in [19]. 3.4 Hamilton-Operator Die große Schwierigkeit in der LQG ist, die Zwangsbedingung (2.13) zu quantisieren ( hamiltonian constraint“). Das Ziel ist, für diesen Ausdruck einen Operator Ĥ zu fin” den und dann den physikalischen Hilbertraum Hphys der Theorie aus den Lösungen der Gleichung Ĥ|Ψi = 0 zu konstruieren. Viele wichtige Beiträge hierzu stammen von der Arbeitsgruppe um Thomas Thiemann. Genaue Beschreibung oder gar eine Herleitung wären zu aufwändig, deswegen sollen hier nur die groben Ideen zusammengefasst werden. In [22] schlug er einen ersten, mathematisch konsistenten Operator vor. Dazu ersetzte er in (2.13) die elektrischen Felder durch eine Poissonklammer mit dem Volumen. Der klassische Ausdruck wurde dann zu Z Z H(N ) ∝ N Tr(F ∧ {A, V }) =: N C(x) d3 x σ mit einer Testfunktion N . Die Quantisierung dieses Ausdrucks erfordert eine Regularisierung und ist nicht eindeutig. Wirkung j1 j1 j1 + j3 j2 j3 1 2 1 2 j2− 12 j2 Abbildung 3.7: Eine lokale Änderung eines Spinnetzes durch den Hamilton-Operator. 27 3 Loop-Quantengravitation Die Wirkung des Operators Ĥ auf ein Spin-Netzwerk Ψ ergibt sich als Summe lokaler Änderungen (siehe Abb. 3.7). Jede dieser Änderungen beschränkt sich auf einen einzelnen Knoten im Graphen. Ein Paar von Kanten, das in diesem Knoten endet, wird mit einem zusätzlichen Knoten versehen und die beiden neuen Knoten durch eine neue Kante verbunden. Die neue Kante erhält den Spin j = 21 , die beiden Verbindungsstücke zum gewählten Knoten werden um 12 erhöht oder gesenkt. Jede lokale Änderung erhält einen Gewichtsfaktor. Diese Faktoren entsprechen den Matrixelementen hΨ|Ĥ|Φi zwischen Spin-Netzwerk-Zuständen und können noch nicht allgemein berechnet werden. Es wird auch beobachtet, dass der Operator Ĥ nur eine Zeitentwicklung in diskreten Schritten erlaubt. D.h. auch die Zeit kann in der Theorie als quantisiert angesehen werden, wie es auch wegen der Gleichberechtigung von Raum und Zeit erwartet wurde. Der so konstruierte Operator Ĥ ist nicht symmetrisch. Er zeichnet eine Richtung der Zeit aus, in der die Graphen von Spinnetzen komplexer werden. Deshalb wird in [19] vorgeschlagen, einen symmetrisierten Operator Ĥsym := Ĥ + Ĥ † zu verwenden. Ĥ † ist dabei der adjungierte Operator. Er vernichtet die lokalen Änderungen, die Ĥ erzeugen kann. Master Constraint Die Konstruktion von Ĥ besitzt mehrere Nachteile. So kommutieren z.B. Operatoren, die über unterschiedliche Testfunktionen integriert wurden, nicht. Deshalb müsste eine unendliche Menge von Zwangsbedingungen gleichzeitig gefordert werden, eine zu jeder möglichen Testfunktion. Auch ist der Operator nicht diffeomorphismusinvariant definiert und scheint nicht auf dem Raum HDiff zu operieren. Um diese Probleme zu lösen, schlägt Thiemann in [23] ein Verfahren vor, das er Master ” Constraint Programme“ nennt. Die klassische Funktion ist dabei Z M= σ [C(x)]2 3 p dx det E(x) und verschwindet genau dann, wenn H(N ) für alle Testfunktionen verschwindet. Da M diffeomorphismusinvariant ist, kann die Quantisierung direkt in HDiff erfolgen. Thiemann gibt zwei mögliche Konstruktionen von Operatoren M̂ an. Die erste ändert den Graphen des Spinnetzes, auf das er wirkt. Die andere Version behält den Graphen und ist kombinatorisch definiert. 28 3.5 Aussagen 3.5 Aussagen Entropie schwarzer Löcher Von Stephen Hawking und Jacob Bekenstein stammt die bekannte Formel für die Entropie schwarzer Löcher (z.B. [6]): SBH (A) = kB A . 4lp2 Dabei ist A die Fläche des Ereignishorizonts, kB die Boltzmann-Konstante und lp die Planck-Länge. Diese Formel stammt aus der Erkenntnis, dass sich für schwarze Löcher Gesetze ähnlich denen der Thermodynamik aufstellen lassen. Carlo Rovelli argumentiert in [19], dass sich der von außen beobachtbare Zustand eines schwarzen Loches durch die Geometrie seines Ereignishorizonts beschreiben lässt. Eine Entropie ließe sich dann durch die Zahl der möglichen Mikrozustände angeben. Die Fläche des Ereignishorizonts wird in der LQG wie schon beschrieben durch ein Spinnetz erzeugt, dessen Kanten durch den Horizont verlaufen. Unter der Annahme, jede √ Kante 1 2 trage den Spin j = 2 , erzeugt jede Kante einen Flächeninhalt von A0 = 4πγlp 3. Damit ist die Zahl der Kanten durch den Horizont A/A0 . Da der Hilbertraum jeder Kante (2j + 1) = 2-dimensional ist, ist die Zahl der Basiszustände des Horizonts 2A/A0 . Und somit ist die Entropie SLQG = kB ln 2A/A0 = kB A ln 2 √ . 4πγlp2 3 Diese Formel ist im Einklang mit SBH . Damit beide Formeln auch numerisch übereinstimmen, muss der bisher noch unbestimmte Immirzi-Parameter auf den Wert γ = πln√23 gesetzt werden. Statt der Annahme, alle Spins seien 12 , können auch andere Verteilungen verwendet werden. Dies führt dann zu anderen Werten für γ. Singularitäten Martin Bojowald und Abhay Ashtekar beschreiben in [2] ein Modell für die Zeitentwicklung des Universums, das auf der LQG beruht. Die darin hergeleitete WheelerDeWitt-Gleichung führt für einen positiven Zeitparameter t zu Ergebnissen, wie sie von klassischen Modellen vorhergesagt wird. Auch in der Nähe von t = 0 zieht sich das Universum stark zusammen, allerdings tritt keine Singularität auf. Stattdessen ist es sogar möglich, auch in den Bereich negativer Zeit zu entwickeln ( vor den Urknall“). Hier sagt ” die Theorie erneut eine Ausdehnung in ein klassisch beschreibbares Universum vorher. Anschaulich werden in der LQG Singularitäten durch die Quantisierung des Raumes vermieden. Wegen der diskreten Struktur der Geometrie besitzen Flächeninhalt und 29 3 Loop-Quantengravitation Volumen eine untere Schranke. Dies kann als (sehr hohe aber endliche) obere Schranke für die Krümmung interpretiert werden. Diese Konzepte lassen sich auch auf schwarze Löcher anwenden. Dadurch erhofft man sich die bisherigen Probleme wie den Verlust von Information der hineinfallenden Materie zu beseitigen. Waghalsigere Interpretationen reichen bis hin zu Übergangsmöglichkeiten in andere Universen durch die Singularität“. ” 30 4 Spin-Schaum Modelle Zur kanonischen Quantisierung in der LQG war es nötig, die kovariante Schreibweise aufzugeben und eine Trennung zwischen Raum und Zeit einzuführen. Deshalb stellt sich die Frage, ob sich die Theorie auch rein kovariant formulieren lässt. Ein anderes Problem ist, dass für die LQG noch keine allgemein anerkannte Dynamik definiert wurde. Auch wenn eine Dynamik gefunden werden sollte, wäre es immer noch schwierig, Übergangsamplituden zwischen Zuständen auszurechnen. Eine Antwort hierauf erhofft man sich in einer Pfadintegral-Formulierung der Quantengravitation. Es existieren mehrere Theorien, die unter dem Begriff Spin-Schaum“ ” zusammengefasst werden (siehe [17]). 4.1 Kanonisch aus der Loop-Quantengravitation Grundidee Es kann in der LQG versucht werden, die Übergangsamplitude zwischen zwei Zuständen |Ψi i und |Ψf i zu berechnen. Dazu soll naiv wie in einer gewöhnlichen Quantendynamik vorgegangen werden, und das Matrixelement der Zeitentwicklung ausgewertet werden. Die folgende Rechnung sei hier nur symbolisch zu verstehen (siehe [18]): n Ĥ |Ψi i Z = hΨf |ei ∆tĤ |Ψi i = lim hΨf | 1 + i ∆t n n→∞ Z = lim dΨ1 . . . dΨn hΨf | 1 + i n∆ tĤ |Ψ1 ihΨ1 | (. . . ) |Ψ2 i . . . hΨn | (. . . ) |Ψi i . (4.1) n→∞ R Im letzten Schritt wurde jeweils die Identität dΨ |ΨihΨ| = 1 zwischen die Faktoren i ∆t von 1 + n Ĥ geschrieben. (4.1) kann als Pfadintegral interpretiert werden. Es wird über die Menge der möglichen Folgen von n Spinnetzen (Ψ1 , . . . , Ψn ) integriert. Jede dieser Folgen entspricht einer zeitlichen Abfolge von Spinnetzen, also einer möglichen Zeitentwicklung eines Spinnetzes. Sie wird als Spin-Schaum bezeichnet. Weil die Basis von Spinnetzen diskret ist, wird das Integral in (4.1) zu einer Summe. Obwohl noch Unklarheit über die genaue Definition des Operators Ĥ und damit auch i ∆t 1 + n Ĥ besteht (siehe Abschnitt 3.4 (Seite 27)), ist bekannt, dass seine Wirkung aus (einer Summe von) kleinen Änderungen um die Knoten im Spinnetz besteht. In der 31 4 Spin-Schaum Modelle t j j j j Abbildung 4.1: Zeitentwicklung eines Spinnetzes (links) und Spin-Schaum (rechts). Folge (Ψ1 , . . . , Ψn ) unterscheiden sich die aufeinander folgenden Zustände also nur um genau diese lokalen Änderungen. Der Übergang von einer Abfolge von Spinnetzen zu einem Spin-Schaum ist in Abb. 4.1 dargestellt. Aus den Netz-Knoten werden deren eindimensionale Weltlinien (rot) und aus den Kanten werden Flächen. Diese erben die Spinzahlen von den Kanten. Hinzu kommen Vertex-Punkte für die in der Zeitentwicklung auftretenden Verzweigungen von Spinnetzen. Spin-Schaum Ein Spin-Schaum“ σ sei nun allgemein ein Zwei-Komplex Γ, also eine 2-dimensionale ” Struktur aus Flächenstücken, die sich in Kurven ( Kanten“) und Vertex-Punkten schnei” den. Dieses Gebilde sei in der Raumzeit eingebettet. Die Flächenstücke tragen Darstellungen einer Gruppe, z.B. Spinzahlen. Kanten werden invariante Tensoren zugeordnet. Um die Amplitude (4.1) zu berechnen, werden alle Spin-Schäume gesucht, die die beiden Spinnetze verbinden. Jeder Spin-Schaum trägt dann mit einem Summanden zur Amplitude bei. Allgemeiner werden Spin-Schäume in einem Gebiet gesucht, deren Konfiguration auf einem Teil des Randes vorgegeben ist. Der genaue Wert dieser Summanden kann in der LQG zur Zeit dieser Arbeit noch nicht berechnet werden. Deshalb werden eigenständige Theorien definiert, die jeweils von einer expliziten Formel für diese Summanden ausgehen. Alle diese Spin-Schaum Modelle besitzen folgende Struktur als gemeinsame Grundlage: • eine Menge von Zwei-Komplexen Γ mit einer Gewichtsfunktion w(Γ) • einer Gruppe mit Darstellungen j und invarianten Tensoren T • Gewichtsfunktionen Ae (j, T ), Av (j, T ) für die Kanten und Vertex-Punkte 32 4.2 Ponzano-Regge • die Gewichtsfunktionen für die Flächen sind (in den meisten Modellen) die Dimensionen der Darstellungsräume Die Summe der Gewichtsfunktionen über alle Spin-Schäume wird wie bei Pfadintegralen die Zustandssumme genannt: X Y Y Y Z= w(Γσ ) dim(jf ) Ae (j, Te ) Av (j, T ) . (4.2) σ Flächen f Kanten e Vertizes v In den nächsten Kapiteln sollen zwei dieser Modelle vorgestellt werden. 4.2 Ponzano-Regge Das Ponzano-Regge Modell ([4]) ist historisch das erste Spin-Schaum Modell und beschreibt Gravitation in einer 3-dimensionalen Raumzeit, deren Metrik euklidische Signatur besitzt. Klassisch Dieses Modell baut auf dem als Regge-Kalkül bezeichneten Formalismus von Tullio Regge auf. In diesem wird die glatte Mannigfaltigkeit der Raumzeit durch ein Simplexgitter approximiert. Das Innere jedes 4-Simplex wird dabei als flach angesehen. Auch die Tetraeder, in denen sich jeweils zwei 4-Simplizes berühren, sind flach. Die gesamte Krümmung ist in den 2-Simplizes, also Dreiecken, konzentriert. Diese macht sich als Winkeldefekt bemerkbar, wenn ein geschlossener Weg um die Dreiecke gegangen wird. Die Theorie beruht auf der mathematischen Beobachtung, dass sich die totale Krümmung, die das Wirkungsfunktional der Gravitation bildet, Z S ∝ R dV auch als Summe der Winkeldefekte ausdrücken lässt (siehe [15]): Z X R dV = 2 Ai δi . Dreiecke i Hier sind δi die Winkeldefekte und Ai die Flächeninhalte der 2-Simplizes. Diese Tatsache entspricht einer diskreten Version des verallgemeinerten Satzes von Gauß-Bonnet. Im Regge-Kalkül werden dann die Kantenlängen der Simplizes als dynamische Variablen betrachtet und in ihnen die diskretisierten Feldgleichungen aufgestellt. Für eine 3-dimensionale Raumzeit ist die Relativitätstheorie eine topologische Theorie, d.h. sie besitzt keine lokalen Freiheitsgrade. Da hier der Weyl-Tensor identisch verschwindet, besitzt der Ricci-Tensor die gesamte Information über die Krümmung. Dieser wird aber durch die Einsteinschen Feldgleichungen festgelegt. Physikalisch bedeutet das, 33 4 Spin-Schaum Modelle dass jegliche Krümmung lokal und direkt von der Materie (dem Energie-Impuls-Tensor) bestimmt wird, Gravitationswellen sind hier also nicht möglich. Im 3-dimensionalen Fall ist die totale Krümmung gegeben als Summe über die Winkeldefekte um jede Kante multipliziert mit der Länge der jeweiligen Kante: Z X R dV = 2 li δi . Kanten i Weiter schränkt man sich für die folgenden Überlegungen auf den Fall einer Riemannschen Metrik ein. Quantisierung Tullio Regge und Giorgio Ponzano schlugen eine Pfadintegral-Quantisierung des ReggeKalküls vor (abgedruckt in [8]): Z i (4.3) Z = e ~ S(l1 ,...,ln ) dl1 . . . dln . Das Integral läuft über alle in der Triangulierung auftretenden Kantenlängen. In einem zweiten Schritt nahmen sie an, dass die Kantenlängen nur diskrete Werte annehmen können. Diese seien halbzahlige Vielfache der Plancklänge lp . Unter dieser Annahme machten sie die erstaunliche Entdeckung, dass (4.3) eine einfache gruppentheoretische Beschreibung erlaubt. Wie bei den Spinnetzen werden Spinzahlen ji = li /lp ∈ N/2 als Darstellungen der SU (2) verwendet. Der Integrand in (4.3) zerfällt dann in ein Produkt von 6j-Symbolen (siehe Anhang D.5 (Seite 99)). Jeder Tetraeder der Triangulierung ergibt ein 6j-Symbol, das von den Spinzahlen auf dessen Kanten abhängt. j4 j6 j2 j1 j4 j2 j5 j6 j3 j5 j3 j1 Abbildung 4.2: Reihenfolge der 6 Spins auf dem Tetraeder für das 6j-Symbol. Insgesamt nimmt die Zustandssumme des Ponzano-Regge Modells die folgende Form an: 34 4.2 Ponzano-Regge Z= X Y Y 2j (−1) (2j + 1) {ji } Kanten (−1) j1 +j2 +j3 Dreiecke Y Tetraeder j1 j2 j3 j4 j5 j6 . (4.4) Es kann gezeigt werden, dass die so definierte Zustandssumme nicht von der Triangulierung abhängt. Aus mathematischer Sicht ist sie eine topologische Invariante von 3-Mannigfaltigkeiten. Eine Beschreibung als Spin-Schaum folgt, indem das duale Gitter betrachtet wird. Jedem Tetraeder in der Triangulierung entspricht ein dualer Punkt im Inneren des Tetraeders, jedem Dreieck eine duale Kante, die durch das Dreieck verläuft. Die dualen Flächen tragen dann die Spinzahlen von den Kanten, die sie schneiden. Wegen der topologischen Invarianz der Zustandssumme genügt es in diesem Modell, über eine einzelne Triangulierung zu summieren. Zur Berechnung von Übergangsamplituden zwischen Spinnetzen werden also duale Spinnetze1 konstruiert. Diese sind einfach Dreiecksgitter mit Spins auf den Kanten. Dann wird eine möglichst einfache Verbindung zwischen den Gittern durch Tetraeder gesucht und die Zustandssumme (4.4) berechnet. Um eine wirkliche Übergangswahrscheinlichkeit zu erhalten, müssen die Zustandssummen mit allen möglichen End-Spinnetzen berechnet werden. Die Summe aller Werte ergibt den Normierungsfaktor. Zur Herleitung von (4.4) war die Annahme von diskreten Kantenlängen von Nöten. Diese Annahme wird inzwischen durch die LQG begründet, die in drei Dimensionen eine Quantisierung von Längen vorhersagt. Eine direkte und ausführlichere Begründung ist in [19] zu finden. Darin wird von einer klassischen Theorie ausgegangen, die durch Längen und Holonomien beschrieben wird. Das aufgestellte Pfadintegral wird dann explizit über die Holonomien integriert, was genau zur Ponzano-Regge-Zustandssumme führt. Regularisierung Es lassen sich leicht Fälle konstruieren, in denen die Summe (4.4) divergiert. Für jeden Vertex-Punkt im Inneren einer Triangulierung kann ein beliebiger Wert zu allen Kantenlängen hinzuaddiert werden, die in diesem Punkt enden. Diese Reihe allein divergiert schon. Deshalb ist es nötig, eine Regularisierung zu verwenden. Die einfachste Möglichkeit ist, nicht über alle möglichen Spinzahlen zu summieren, sondern eine obere Grenze jmax einzuführen. Für jeden Vertex-Punkt wird ein Skalierungsfaktor λ(jmax ) eingeführt, der die Divergenz beseitigt. Die regularisierte Zustandssumme ist dann der Grenzwert (siehe [4]): jmax Z̃ := 1 lim λ(jmax )(# Vertizes) jmax →∞ X ... . {ji =0} Da in diesem Modell nur duale Spinnetze auftreten, wird bei der späteren Beschreibung der Simulationen auf das dual“ verzichtet. ” 35 4 Spin-Schaum Modelle Eine andere Regularisierung ist die Turaev-Viro Methode. Diese verwendet statt der Gruppe SU (2) die Quantengruppe“ SU (2)q mit einer komplexen Einheitswurzel q. Die ” Zahl der irreduziblen Darstellungen und damit die möglichen Spinzahlen sind hierbei begrenzt. Außerdem hängen die neuen 6j-Symbole ebenfalls von q ab. Zur Regularisierung wird dann der Grenzwert für q → 1 betrachtet. 4.3 Barrett-Crane Für Gravitation in vier Dimensionen wurden mehrere Modelle vorgeschlagen [17], zu den vielversprechendsten gehören die Modelle von John W. Barrett und Louis Crane [3]. Die Wirkung der Relativitätstheorie lautet wie in Gleichung (2.7) ohne Rücksicht auf Konstanten: Z A B εABCD e ∧ e ∧ R S= CD Z = ?(e ∧ e)CD ∧ R CD Z =: Tr [?(e ∧ e) ∧ R] Z =: Tr [B ∧ R] mit einer 2-Form B, die Werte in der Lie-Algebra2 so(4) annimmt. Der Stern Operator ? dualisiert dabei nicht die 2-Formen sondern die Bivektoren, deren Indizes in der Gleichung zu sehen sind. Formal stimmt diese Wirkung mit der der sogenannten BF-Theorie3 überein, einer topologischen und damit einfacheren Version der Relativitätstheorie. Der Unterschied zwischen beiden Theorien ist, dass hier B eine zusätzliche Zwangsbedingung erfüllen muss: Es muss als Bivektor zerlegbar sein: B = ?(e ∧ e) . Für die BF-Theorie lässt sich ähnlich dem Ponzano-Regge-Modell eine PfadintegralFormulierung als Spin-Schaum finden. In [19] ist eine Herleitung sowie eine explizite Formel für die Zustandssumme zu finden. Wie schon bei den Rechnungen in drei Dimensionen wird die Gruppe SO(4) durch ihre einfach zusammenhängende Überlagerung Spin(4) = SU (2) × SU (2) ersetzt. Die irreduziblen Darstellungen werden also durch zwei Spinzahlen (j1 , j2 ) auf den Flächen des 2-Komplexes beschrieben. In [3] wird gezeigt, dass die zusätzliche Zwangsbedingung zur Folge hat, dass nur einfache Darstellungen auftreten, d.h. es gilt (j1 , j2 ) = (j, j). Um eine Zustandssumme der Relativitätstheorie zu konstruieren, kann also von der BF-Theorie ausgegangen werden und nur über die Teilmenge der Konfigurationen summiert werden, in denen die beiden Spins auf jeder Fläche übereinstimmen. Zusätzlich ergibt sich auch eine Änderung für die Gewichtsfunktion der Vertex-Punkte. 2 3 In dieser Arbeit wird nur der Fall besprochen, dass die Metrik euklidische Signatur besitzt. Der R Name stammt von der Gewohnheit, die Krümmung mit F zu bezeichnen. Die Wirkung ist dann Tr[B ∧ F ]. 36 4.3 Barrett-Crane Insgesamt lautet die Zustandssumme im Barrett-Crane-Modell: X Y Y Y Ak (2j + 1) {10j} . Z= {j} Kanten Flächen Vertizes Hierbei ist {10j} ein 10j-Symbol. An jedem Vertex-Punkt treffen 10 Flächen zusammen, jede mit einem Spin j. Die 10j-Symbole sind Kontraktionen der etwas bekannteren 15jSymbole, die aus der BF-Theorie stammen. Sie berechnen sich aus diesen durch: 2 j j j j j 1 2 3 4 5 X j6 j7 j8 j9 j10 . {10j} = i1 ,...,i5 i1 i2 i3 i4 i5 Das Gewicht Ak für die Kanten ist in der Theorie nicht direkt festgelegt. Es wurden deshalb mehrere Modelle mit unterschiedlichen Gewichten konstruiert. In den einfacheren Varianten ist Ak = 1. 37 4 Spin-Schaum Modelle 38 5 Erzeugung von Gittern Für die numerische Auswertung der Zustandssummen von Spinschaum-Modellen werden zufällig erzeugte, simpliziale Gitter benötigt. Für das Ponzano-Regge-Modell (3d) sind das Tetraedergitter, für Barrett-Crane (4d) bestehen sie aus 4-Simplizes. Durch den Zufall in der Erzeugung soll verhindert werden, dass sich Gittereffekte in den später folgenden Simulationen zu stark auswirken. 5.1 Topologie Um verschiedene n-dimensionale topologische Räume nachzubilden, werden die Gitter in einen höherdimensionalen Vektorraum eingebettet. Es genügt dabei, nur die Einbettungen in den Rn+1 zu betrachten, da sich alle für diese Arbeit interessanten Räume auf diese Art behandeln lassen. Der topologische Raum wird dann als Untermannigfaltigkeit durch die Nullstellen einer reellen Funktion definiert. So kann z.B die 1-Sphäre als Nullstellenmenge der Funktion f (x, y) = x2 + y 2 − 1 im R2 definiert werden. Die hier am häufigsten benutzen Räume und ihre Einbettungen sind: • 2-Sphäre: fS2 (x, y, z) = x2 + y 2 + z 2 − R2 2 p • 2-Torus: fT2 (x, y, z) = R2 2 − R1 − x2 + y 2 − z 2 • Doppel-2-Torus: f2−T2 (x, y, z) = fT2 1 (R 2 + r) + x2 , y, z • 3-Sphäre: fS3 (x, y, z, w) = x2 + y 2 + z 2 + w2 − R2 ! r 2 p • 3-Torus: fT3 (x, y, z, w) = R3 2 − R2 − R1 − x2 + y 2 + z 2 − w2 . Um in späteren Schritten zufällige Gitter auf diesen Räumen erzeugen zu können, werden sie zunächst mit regelmäßigen Gittern überdeckt. Eine einfache Möglichkeit hierfür ist das folgende Schema: 1. den Einbettungsraum Rn+1 in ein regelmäßiges Netz von (Hyper-) Würfeln zerlegen 2. die Funktion f auf allen Eckpunkten der Würfel auswerten 39 5 Erzeugung von Gittern 3. Würfel, auf deren Eckpunkten f wechselnde Vorzeichen besitzt, schneiden den gesuchten Raum: a) Würfelkanten, deren Endpunkte verschiedene Vorzeichen besitzen, schneiden den Raum b) ein Schnittpunkt mit der Kante kann durch die Werte von f auf den Endpunkten linear interpoliert werden c) die so gefundenen Schnittpunkte werden durch Simplizes verbunden Abbildung 5.1: Triangulierung des eingebetteten Raumes. Von links nach rechts: Suche der Schnitt-Volumina; Verbindung der Schnittpunkte in Seitenquadraten; Verbinden der Simplizes zu höherdimensionalen Abbildung 5.2: 3-Torus mit regelmäßigem Tetraedergitter überzogen und zur Visualisierung mit einem 3d-Raum geschnitten. Dabei entsteht das sichtbare Dreiecksgitter. Die beiden Ansichten unterscheiden sich in der Lage des 3d-Schnittraumes. 40 5.2 Gitter Der n-dimensionale Würfel besitzt (n − 1)-dimensionale Würfel als Seitenflächen“. Das ” Verbinden der Schnittpunkte kann somit rekursiv über die Dimension geschehen. Zwei Schnittpunkte auf den Kanten eines Quadrates werden durch eine Strecke (1-Simplex) verbunden. Im 3-Würfel können die so gefundenen Strecken auf den Seitenquadraten sehr einfach durch Dreiecke (2-Simplizes) verbunden werden. Diese dienen dann wiederum als Grundflächen von Tetraedern (3-Simplizes) in der Dimension 4, usw. 5.2 Gitter Um das eigentliche Gitter zu erzeugen, bieten sich 2 Möglichkeiten an: 5.2.1 Konstruktiv Hierbei wird eine Punktmenge im eingebetteten Raum zufällig verteilt. Da in diesem Raum schon ein Simplexgitter vorhanden ist, ist dies einfach zu erreichen. Abbildung 5.3: Zufällige Punkteverteilungen: Links auf dem 2-Torus; rechts auf dem 3Torus. Die Farbe der Punkte gibt die Tiefe“ in der 4. Dimension an, das ” sichtbare Gitter im Inneren ist wieder ein Schnitt mit dem 3d-Raum. (Zu Visualisierungszwecken wurde hier eine hohe Anzahl von Punkten gewählt, die in den Simulationen verwendete Zahl ist deutlich geringer.) Im nächsten Schritt werden die zufälligen Punkte wieder mit Simplizes zu einem neuen Gitter verbunden. Es gibt hierzu schon vielgenutzte Algorithmen, die aber für den flachen Raum konzipiert sind und für den Umgang mit Krümmungen abgeändert werden müssen. Eine Möglichkeit ist die Delaunay-Triangulierung. Sie stellt die Forderung, dass für jedes Simplex außer dessen Eckpunkten kein weiterer Punkt in der Umsphäre (n- 41 5 Erzeugung von Gittern dimensionales Äquivalent zum Umkreis) befindet. Für den flachen Raum ist diese Triangulierung eindeutig und kann immer konstruiert werden. Abbildung 5.4: Triangulierung der 2-Sphäre: Der Algorithmus ist noch nicht abgeschlossen. Blau sind die schon erzeugten Dreiecke, rot das Randgebiet, an dem neue Dreiecke erstellt werden. Für den eingebetteten und gekrümmten Raum ist die Forderung mit der Umsphäre nicht immer erfüllbar. Im Rn+1 als Einbettungsraum werden die gesuchten n-Simplizes von n+1 Punkten aufgespannt. Die Um-n-Sphäre dieser Punkte liegt in der n-dimensionalen Hyperebene dieser, einer Art Tangentialraum an den gekrümmten Raum. Verschiedene Punktmengen, für die überprüft werden soll, ob sie ein Delaunay-Simplex aufspannen, benutzen nun verschiedene Hyperebenen zu dieser Überprüfung. Das kann dazu führen, dass einzelne Punkte mit keinen der Punkte in ihrer Umgebung ein Delaunay-Simplex ergeben können und die Triangulierungsalgorithmen abbrechen. Dieses Problem kann behoben werden, indem die Delaunay-Bedingung weniger zwingend angesehen, oder komplett ignoriert wird, sobald der Algorithmus auf Problempunkte stößt. Der in dieser Arbeit genutzte Algorithmus geht nach folgendem Muster vor (siehe Abb. 5.4): • begonnen wird mit einem zufälligen n-Simplex, das die Delaunay-Bedingung erfüllt • dann iterativ: – der Rand des bisher triangulierten Gebietes wird gefunden – auf diesem Rand wird ein zufälliges (n − 1)-Simplex gewählt und seine Umgebung nach einem weiteren Punkt durchsucht, mit dem es ein Delaunay-nSimplex aufspannt 42 5.2 Gitter Im letzten Schritt muss die Wahl möglicher Punkte so erfolgen, dass das neue Simplex tangential an den gekrümmten Raum liegt. Da mit Projektionen auf Tangentialräume gearbeitet wird, kann es sein, dass ein Punkt von der gegenüberliegenden Seite“ gewählt ” wird, z.B. ein antipodaler Punkt auf der Sphäre. Außerdem kann die Effizienz des Algorithmus dadurch deutlich gesteigert werden, dass der Rand nicht in jedem Schritt komplett neu berechnet wird, sondern nur bei der Erstellung eines neuen Simplex angepasst wird. Die Schwierigkeit hierbei ist allerdings, dass mehrere Fälle zu unterscheiden sind, ob das neue Simplex den Rand nur ausbeult“, ” oder verschiedene Gebiete des Randes verbindet und somit dessen topologische Gestalt verändert. Insgesamt erwies sich das Vorgehen, Gitter konstruktiv zu erzeugen, als zu unzuverlässig und fehleranfällig. Die oben beschriebenen Abschwächungen der Delaunay-Bedingung waren nicht sensibel genug, die Triangulierung immer vollständig abzuschließen ohne dabei Gitterfehler zu erzeugen. Gerade bei kleiner Punktzahl werden diese Probleme auf Grund der hohen Krümmung deutlich. Deswegen wurde eine zweite Möglichkeit betrachtet: 5.2.2 Destruktiv Abbildung 5.5: Von 1 nach 4 werden in der Ebene Kanten gelöscht. Die von diesen Operationen betroffenen Dreiecke sind rot markiert. 43 5 Erzeugung von Gittern Anstatt aus zufälligen Punkten ein komplett neues Gitter zu erzeugen, wird in dieser Variante vom schon vorhandenen Gitter ausgegangen. Es werden dann iterativ zufällige Simplizes ausgewählt und gelöscht. Deren Eckpunkte werden zu einem einzigen Punkt vereint, alle angrenzenden Simplizes, die mehrere dieser Eckpunkte enthalten, müssen dabei gelöscht werden. A B Abbildung 5.6: Problemfall 1: Wird das rote Dreieck gelöscht, so fallen die Punkte A und B zusammen und die beiden blauen Dreiecke werden identisch Bei diesem Vorgehen ergeben sich allerdings Bedingungen an die Simplizes, die entfernt werden können. Abbildung 5.6 zeigt einen möglichen Problemfall für Dreiecksgitter: Nach Löschen eines Dreiecks und anschließendem Vereinen der Eckpunkte können zwei Dreiecke existieren, die von den selben 3 Punkten aufgespannt werden. Abbildung 5.7: Problemfall 2: Ein Dreiecksgitter umschließe eine dünne Röhre. Blau sind 3 Kanten markiert, die einen geschlossenen Weg um die Röhre bilden. Wird ein Dreieck gelöscht, das eine der blauen Kanten enthält, so wird die Röhre abgeschnürt“. Die verbleibenden 2 blauen Kanten sind dann ” identisch und es teilen sich 4 Dreiecke diese Kante. Dies verletzt die Eindeutigkeit der Nachbarschaftsbeziehung. Ein weiteres Problem ist die mögliche Änderung der Topologie beim Löschen. Abbildung 5.7 zeigt ein Beispiel hierfür. Erfahrung hat gezeigt, dass es einfacher ist, die Erkennung der Problemfälle zu implementieren, falls im n-Simplexgitter nicht n-Simplizes gelöscht werden, sondern deren Kanten, also 1-Simplizes. 44 5.2 Gitter 1 6000 Punkte 4000 Punkte 2000 Punkte 1000 Punkte 0.8 500 Punkte 200 Punkte relative Haeufigkeit 100 Punkte 0.6 0.4 0.2 0 0 5 10 15 20 Anzahl Simplizes pro Punkt 25 30 Abbildung 5.8: Für ein Dreiecksgitter auf dem 2-Torus sind hier die Häufigkeiten der unterschiedlichen Simplexzahlen, die sich an den Punkten treffen, aufgetragen. Für das Ausgangsgitter mit 6000 Punkten treffen sich in fast jedem Punkt 6 Simplizes. Je mehr Iterationen des Algorithmus durchlaufen werden, desto tiefer sinkt dieser Durchschnitt, dafür steigen die hohen Simplexzahlen. Man beachte die auftretenden Peaks bei kleinen Punkte- und hohen Simplexzahlen. Ziel des Algorithmus ist es, ein möglichst zufälliges“ Gitter zu erzeugen, ohne beson” deren Strukturierungen Vorrang zu geben. Dabei tritt noch ein weiteres Problem auf: Beim Vereinen der Eckpunkte nach Löschen eines Simplex erhöht sich die Zahl der Simplizes, die sich den neu entstandenen Punkt teilen. Wird der Vorgang zu oft wiederholt, ohne die zufällige Wahl auf diesen Effekt anzupassen, so kann für einzelne Punkte die Zahl angrenzender Simplizes drastisch vom Durchschnitt abweichen. Der Algorithmus scheint dieses divergente Verhalten zu begünstigen (siehe Abbildung 5.8). In dieser Arbeit wurde nicht versucht, das Problem zu lösen, da es sich erst bei einer hohen Anzahl von Iterationsschritten negativ auswirkt. 45 5 Erzeugung von Gittern Abbildung 5.9: Erfolgreiche Anwendung des destruktiven Algorithmus auf den 2-Torus 46 6 Simulationen - Statik In diesem Kapitel sollen für einfache Beispielräume jeweils die Zustandssumme des Ponzano-Regge-Modells numerisch berechnet werden. Dies wird nur mit Hilfe starker Näherungen möglich sein. 6.1 Zustandssumme der 3-Sphäre Die einfachste Modellierung der 3-Sphäre ist als Doppeltetraeder“, also durch 2 Tetrae” der, die an allen 4 Randflächen zusammengeklebt werden. Dieses Objekt ist eine gewisse Herausforderung für die Vorstellungskraft, verhält sich aber analog zum Fall der 1- oder 2-Sphäre. Letztere lässt sich ebenfalls durch 2 Dreiecke modellieren, die aufeinander gelegt und an den Rändern zusammengeklebt werden. Alternativ kann man sich den 3-dimensionalen Raum als 3-Sphäre vorstellen, in die ein Loch gebohrt wurde, das dem Rand im Unendlichen entspricht. Ein Tetraeder umschließt dann ein Volumen, während der andere das Komplement (sowie das Unendliche“) um” schließt. j4 j6 j5 j2 j3 j1 Abbildung 6.1: Spins auf den Kanten eines Tetraeders 6.1.1 Brute Force In der Zustandssumme des Ponzano-Regge-Modells (Gleichung (4.4)) tritt in diesem Fall das Produkt der 6j-Symbole der beiden Tetraeder auf. Diese werden von denselben 47 6 Simulationen - Statik Kanten aufgespannt, nehmen somit auch dieselben 6 Spins als Parameter. Sie unterscheiden sich nur in ihrer Orientierung: Der eine Tetraeder beschreibt das Innere“, der ” andere das Äußere“. Die dadurch entstehende Umverteilung der Spin-Parameter hat ” allerdings keine Auswirkungen auf den Wert, da die 6j-Symbole symmetrisch bezüglich dieser Vertauschung sind: j1 j2 j3 j1 j3 j2 = . j4 j5 j6 j4 j6 j5 Außerdem heben sich alle Vorzeichen gegenseitig auf, denn die Vorzeichen für Kanten und Dreiecke ergeben zusammen (−1)2j1 +···+2j6 (−1)2j1 +···+2j6 = (±1)2 = 1 . {z }| {z } | Kanten Dreiecke Somit wird die Zustandssumme zu Z= ! 2 j1 j2 j3 (2ji + 1) j4 j5 j6 X Y {ji } i=1...6 und nach Regularisierung durch Einführung eines maximalen Spins als Cut-Off: ! 2 X Y j1 j2 j3 Z(jmax ) = . (2ji + 1) j4 j5 j6 {ji <jmax } (6.1) i=1...6 Abbildung 6.2 zeigt die numerische Auswertung dieser Zustandssumme abhängig von der Wahl des maximalen Spins. Die Auswertung erfolgte durch ein einfaches Brute-ForceVerfahren, also die explizite Berechnung aller in (6.1) auftretenden Terme. Es deutet sich 9 ein divergentes Verhalten mit jmax an. Um dieser Divergenz entgegen zu wirken, wäre −9/4 eine Regularisierung nötig mit je einem Faktor jmax für die vier Vertizes. Wie erwartet ist das Brute-Force-Verfahren für die gegebene Problemstellung ungeeignet. Die Rechenzeit ist etwa proportional zur Anzahl der Möglichkeiten, den Kanten Spins zuzuordnen, also ∝ (2jmax )Kanten . Für dieses einfache Beispiel steigt sie mit (jmax )6 und betrug schon für die in Abb. 6.2 zu sehende Rechnung ungefähr einen Tag. Auch komplexere Triangulierungen sind wegen des hohen Aufwands nicht möglich. 6.1.2 Regularisierung Der in dieser Rechnung gefundene Regularisierungsfaktor wird in den folgenden Rechnungen nicht von Bedeutung sein. Bei vorgegebener Triangulierung und maximalem Spin können diese Terme in einem konstanten Faktor zusammengefasst werden. Für die physikalischen Überlegungen in dieser Arbeit sind nur Verhältnisse von Zustandssummen relevant, weshalb die Faktoren von nun an nicht mehr berücksichtigt werden. 48 6.2 Näherung Zustandssumme Z 1e+14 Fitkurve j9 1e+12 Zustandssumme Z 1e+10 1e+08 1e+06 10000 100 1 1 10 jmax Abbildung 6.2: Auswertung der Zustandsumme der 3-Sphäre abhängig vom maximalen Spin. Die 3-Sphäre ist hier als Doppeltetraeder modelliert. 6.2 Näherung Einige numerische Testrechnungen1 haben gezeigt, dass die einzelnen Summanden in der Zustandssumme (4.4) von einer Spin-Konfiguration zu einer benachbarten über viele Größenordnungen variieren. Abbildung 6.3 zeigt am Beispiel der 3-Sphäre dieses chaotische Verhalten. Die beiden Kurven im Diagramm sind die Summe aller bisher berechneten Terme sowie der höchsten Summanden. Beide Kurven liegen fast perfekt aufeinander. Dieser Sachverhalt gibt Anlass zu einer Näherung für die weiteren numerischen Simulationen. Anstatt möglichst viele Terme aufzusummieren wird die Zustandssumme (4.4) durch ihren größten Summanden approximiert. Dadurch vereinfacht sich die Berechnung zur Suche eines Extremums im Konfigurationsraum der Spins. Diese Näherung entspricht einem tiefen Eingriff in die Theorie, da die Gewichtsfunktion im Konfigurationsraum durch einen Delta-Peak ersetzt wird. Dabei geht auch in gewissem Sinne der Quantencharakter der Theorie verloren, da nur noch ein einzelner Zustand berücksichtigt wird und keine Linearkombination mehr. Dennoch machen die folgenden Simulationen von der Näherung Gebrauch, da das Prob1 Details des Verfahrens werden im nächsten Abschnitt behandelt. 49 6 Simulationen - Statik log10 W log10 Z log10 Wmax Zustandssumme log10 Z -460 -480 -500 -520 -540 0 500000 1e+06 Iterationen 1.5e+06 2e+06 Abbildung 6.3: Vergleich der iterativ berechneten Zustandssumme mit dem Wert des höchsten Summanden am Beispiel der 3-Sphäre lem ansonsten numerisch nicht zu behandeln wäre. Außerdem wird erhofft, von der dominierenden Konfiguration ausgehend die Gewichtsfunktion später in einer gewissen Umgebung analytisch annähern zu können, um ähnlich einer Sattelpunktsnäherung doch wieder quantenmechanisch zu rechnen. Analytischer Versuch Es könnte analytisch versucht werden, ein Extremum in der Gewichtsfunktion in Gleichung (4.4) als Nullstelle der Ableitung zu finden. Dazu müsste eine analytische Funktion gefunden werden, die die rein kombinatorisch definierten 6j-Symbole approximiert. Eine solche Näherung wird in [11] vorgestellt. Sie verwendet eine Stirling-Formel für die Fakultäten und nähert auch die Summe durch ein Integral an. Es wird in der Arbeit aber nur der Grenzfall großer Spinzahlen behandelt, weswegen sich die Formeln hier nur eingeschränkt verwenden ließen. Das Problem, dass die Integrationsgrenzen weiterhin als Maximum und Minimum der Spinzahlen gegeben sind, könnte z.B. durch die Näherung max(a, b) ≈ ln(eax + ebx )/x für große x behoben werden. Auch das Rechnen mit Gamma-Funktionen wäre denkbar. 50 6.3 Numerisches Verfahren Dieses Vorgehen scheint hier allerdings nicht sinnvoll zu sein. Zunächst ist die Zahl der beim Ableiten auftretenden Terme immens. Schon bei einem Gitter mit 100 Kanten wären Produkte und Quotienten von über 1000 Fakultäten abzuleiten. In dieser Größenordnung ist zu erwarten, dass die Fehler in den einzelnen Näherungen sich zu drastisch auswirken. Auch wäre es sehr schwer, ein nichtlineares Gleichungssystem mit einer Gleichung für jede Kante zu lösen. Numerische Testrechnungen (wie z.B. in Abb. 6.3 zu sehen) zeigen, dass die Werte der 6j-Symbole sehr stark von den Parametern abhängen und teilweise schnell oszillieren. Diese fehlende Korrelation zwischen den Werten benachbarter Punkte verhindert die Benutzung eines einfachen Gradientenverfahrens. Deshalb ist auch zu erwarten, dass, falls die soeben beschriebenen Probleme gelöst werden könnten, eine analytische Suche nach Extremstellen eine sehr hohe Anzahl von Kandidaten finden würde. Da der Zustandsraum der Spinzahlen diskret aber hochdimensional ist, wären dann für jeden Kandidaten eine Überprüfung aller Nachbarpunkte, die auf dem Gitter liegen, nötig. 6.3 Numerisches Verfahren 6.3.1 Verfahren Es stellt sich wie im letzten Abschnitt beschrieben das Problem, diejenige Spinkonfiguration zu finden, die die Gewichtsfunktion maximiert. In dieser Arbeit wurde hierfür ein Verfahren entwickelt, das auf dem Metropolis-Algorithmus beruht und in einer ähnlichen Form als simuliertes Abkühlen bekannt ist. Dazu wird iterativ vorgegangen: • es wird von einer Konfiguration ausgegangen und deren Gewichtsfunktion W0 berechnet • eine zufällige neue Konfiguration in der Nachbarschaft der ersten wird erzeugt und auch deren Gewichtsfunktion Wneu ausgewertet • mit einer gewissen Wahrscheinlichkeit p(W0 , Wneu ) wird die alte Konfiguration durch die neue ersetzt Die Wahrscheinlichkeit berechnet sich aus 1 p(W0 , Wneu ) = W 1/T neu W0 wenn Wneu > W0 sonst mit einem positiven Parameter T , der Temperatur“. ” Die so berechnete Wahrscheinlichkeit entspricht dabei der Formel des Metropolis-Algorithmus, allerdings nicht direkt auf die Gewichtsfunktion angewandt, sondern auf deren Logarithmus. 51 6 Simulationen - Statik Für T = ∞ wählt der Algorithmus immer die neue Konfiguration solange2 Wneu 6= 0, da die Wahrscheinlichkeit 1 ist. In diesem Fall wird der Algorithmus nicht zum Maximum streben. Für das andere Extrem T = 0 werden neue Konfigurationen nur akzeptiert, wenn Wneu > W0 . Diese Variante wird ein lokales Maximum nicht mehr verlassen können. Es zeigt sich, dass der Algorithmus am effektivsten arbeitet, wenn die Temperatur T für die ersten Iterationen hoch gewählt und im Laufe der Simulation langsam abgesenkt wird. Dadurch wird der Konfigurationsraum zuerst grob abgesucht und dann potentielle Gebiete mit einem Maximum feiner aufgelöst. In dieser Arbeit wurde T exponentiell und in konstanten Abständen gesenkt. 6.3.2 Erzeugung neuer Konfigurationen Die naive Vorgehensweise, von einer Konfiguration ausgehend eine zufällige Kante zu wählen und den Spin um ± 21 zu ändern, ist wenig sinnvoll. Wegen den Bedingungen der 6j-Symbole wäre die Gewichtsfunktion dann immer 0. Auch ±1 ist nicht sinnvoll, da dann die Anfangskonfiguration vorschreibt, welche Kante ganz- und welche halbzahlig bleibt. Es sollen also neue Konfigurationen erzeugt werden, die automatisch die Dreiecksungleichung (1) und die Bedingung der ganzzahligen Spinsummen (2) auf Dreiecken erfüllen. Die Bedingung (2) kann topologisch interpretiert werden: Abbildung 6.4: Topologische Interpretation der Ganzzahl-Bedingung auf einem Dreiecksgitter. Blau gestrichelt die halbzahligen Kanten, rot die Wege Für den anschaulicheren Fall eines 2d-Gitters aus Dreiecken (siehe Abb. 6.4) kann jedes Dreieck entweder 0 oder 2 Kanten mit halbzahligem Spin besitzen um auf eine ganz2 Dies wird von der im Folgenden beschriebenen Erzeugung der Konfigurationen gewährleistet. 52 6.3 Numerisches Verfahren zahlige Summe zu kommen. Jedes Dreieck mit 2 halbzahligen Kanten kann über diese nur mit Dreiecken verbunden sein, die ebenfalls 2 halbzahlige Spins beherbergen. Somit kann von einem solchen Dreieck ein eindeutiger Weg gefunden werden, der nur halbzahlige Kanten überquert. Dieser Weg kann keine Verzweigung besitzen, da dazu ein Dreieck 3 halbzahlige Kanten bräuchte. Andererseits kann der Weg auch nicht im Inneren des Gitters enden, da dann ein Dreieck nur eine halbzahlige Kante besäße. Ein Gitter, das Bedingung (2) erfüllt, wird also von 1d-Mannigfaltigkeiten durchzogen, die sich nicht schneiden und deren Rand auch auf dem Rand des Gitters liegt. Erlaubt sind damit auch geschlossene Kurven, da diese keinen Rand besitzen. Abbildung 6.5: Tetraeder mit halbzahligen Kanten (blau gestrichelt) werden von 2dMannigfaltigkeiten (rot) zerteilt Auf einem 3d-Gitter aus Tetraedern ist die Situation analog. Die Oberfläche jedes Tetraeders lässt sich als Dreiecksgitter ohne Rand beschreiben, somit muss durch jede halbzahlige Kante ein geschlossener Weg auf dieser Oberfläche verlaufen. Diese durchläuft 3 oder 4 Kanten und lässt sich immer als 2d-Fläche interpretieren, die den Tetraeder zerteilt (siehe Abb. 6.5). Damit wird auch ein Tetraedergitter insgesamt wieder von 2d-Mannigfaltigkeiten durchzogen, die sich nicht schneiden und deren Rand auf dem Rand des Gitters liegt. Aus diesen Überlegungen ergibt sich eine einfache Möglichkeit, neue Konfigurationen zu erzeugen: • ein zufälliger Vertex-Punkt wird gewählt • alle Spins der an diesen Punkt angrenzenden Kanten werden von halb- nach ganzzahlig gekippt“ und umgekehrt ” Diese Operation entspricht der Erzeugung einer Sphäre um diesen Punkt, welche dann entsprechend der XOR-Logik zu den bestehenden Schnittmannigfaltigkeiten addiert wird. D.h. die Sphäre löscht schon bestehende Flächenstücke (siehe Abb. 6.6). Das Kippen der Spins muss dann mit der Dreiecksbedingung (1) verträglich sein. Dazu gibt es auch zwei einfache Implementierungsmöglichkeiten: 53 6 Simulationen - Statik + = Abbildung 6.6: Kippen der Spins als Addition einer Sphäre zu den bestehenden Wegen • alle Spins um denselben halbzahligen Wert ∆j erhöhen oder erniedrigen, wobei alle angrenzenden Dreiecke durch ihre Dreiecksbedingung eine obere und untere Schranke an ∆j ergeben. Dann wird ∆j zufällig aus diesem Intervall gewählt • für jeden Spin wird ein eigenes ∆ji gewählt, das nur durch dessen unmittelbar angrenzenden Dreiecke beschränkt wird. Dies wird dann iterativ für alle zu kippenden Spins getan3 In beiden Fällen kann es vorkommen, dass keine neue Konfiguration gefunden wird, da das mögliche Intervall für ∆j leer ist. Dann muss ein neuer Vertex-Punkt gewählt werden. Die Simulationen in dieser Arbeit wechseln für jeden Iterationsschritt zwischen diesen beiden Erzeugungsmöglichkeiten, um möglichst zufällige Konfigurationen zu erhalten. 6.3.3 Meta-Algorithmus Das oben beschriebene Verfahren zur Findung des Maximums der Gewichtsfunktion besitzt mehrere Parameter: • Anfangstemperatur T0 • Geschwindigkeit der Temperaturabnahme • Anzahl der Schritte, die nach jeder Temperaturabnahme thermalisiert wird • Anzahl der Schritte, nach der zur bisher besten Konfiguration zurückgesprungen werden soll, falls keine bessere gefunden wurde Diese Parameter wirken sich stark auf die Effizienz und Ergebnisse des Algorithmus aus. Damit gibt es für eine vorgegebene Problemstellung wieder einen optimalen Punkt im Raum dieser 4 Parameter. Um diesen optimalen Punkt zu finden wurde für die Simulationen in dieser Arbeit der Algorithmus auf sich selbst angewandt. Dazu wurde eine Test-Simulation geschrieben, 3 Die möglichen Ergebnisse sind dann von der Reihenfolge der gewählten Spins abhängig! 54 6.3 Numerisches Verfahren die von den obigen Parametern abhängt und eine vorgegebene Anzahl an Iterationen durchführt. Das von dieser Simulation gefundene Maximum wurde dann als Wert einer Funktion“ von den 4 Parametern genommen. ” Auf einer höheren Ebene wirkte dann derselbe Algorithmus zur Findung des Maximums dieser Funktion im Parameterraum. Bei jeder Auswertung der Funktion wurde die TestSimulation einmal durchlaufen. Auch hier eignet sich kein einfaches Gradientenverfahren, da für diese Funktion wieder keine Ableitung definiert werden kann. Schon der Wert für denselben Punkt im Parameterraum ändert sich bei jeder Auswertung! log10 Z (optimiert) log10 Z (unoptimiert) 350 300 Zustandssumme log10 Z 250 200 150 100 50 0 -50 -100 0 200000 400000 600000 800000 Iterationen 1e+06 1.2e+06 Abbildung 6.7: Unterschiedliche Parameter für den Algorithmus auf der 3-Sphäre. Rot zeigt eine Simulation mit optimierten Parametern und blau mehrere unoptimierte Beispiele Abbildung 6.7 demonstriert die Vorteile der optimierten Parameter. Der Algorithmus findet ein deutlich höheres Maximum und konvergiert schneller. 6.3.4 Ergebnisse Mit dem optimierten Algorithmus wurden auf der 3-Sphäre drei Rechnungen mit identischen Parametern durchgeführt. Das Gitter bestand aus 204 Vertex-Punkten und 970 Kanten. Der maximale Spin lag bei jmax = 50. Abb. 6.8 zeigt das Konvergenzverhalten in 55 6 Simulationen - Statik 350 Zustandssumme log10 Z 300 250 200 150 100 Rechnung 1 Rechnung 1 Rechnung 1 50 0 500000 1e+06 1.5e+06 2e+06 2.5e+06 3e+06 Iterationen 3.5e+06 4e+06 4.5e+06 5e+06 Abbildung 6.8: Drei Rechnungen auf der 3-Sphäre mit gleichen Parametern. Rechnung Z = Wmax 1 5,929 · 10348 2 1,572 · 10352 3 3,102 · 10348 Tabelle 6.1: Ermittelte Werte für die Zustandssumme aus den drei Rechnungen. den jeweiligen Rechnungen. In Tabelle 6.1 sind die Endergebnisse für die Zustandssumme aufgelistet. Die mittlere Quadratische Abweichung des Logarithmus der berechneten Zustandsfunktionen entspricht einem Faktor von 48,314. Dieser gibt eine mittlere (multiplikative) Schwankung um den geometrischen Mittelwert bei 6,612 · 10349 an. Einfache Überlegungen zur Regularisierung des divergenten Verhaltens der Zustandssumme lassen erwarten, dass der reale Wert der Zustandssumme bei etwa Z ≈ jmax # Vertizes ·9/4 = 50204·9/4 ≈ 10780 liegt. 56 6.3 Numerisches Verfahren 6.3.5 Gauß-Näherung Um nicht nur einen einzelnen Wert der Zustandssumme zu berücksichtigen, wurde versucht, die Gewichtsfunktion um das gefundene Maximum durch eine Gauß-Funktion anzunähern: W (x) ≈ Wmax e−x T Ax . x ist ein Vektor im Konfigurationsraum der Spins. Hier sei o.B.d.A. das Maximum bei x = 0. Da diese Funktion schnell nach außen hin abfällt, kann die Zustandssumme als Gauß-Integral über den kompletten Rn angesehen werden: r Z πn . W (x) dn x = Wmax Z≈ det A Rn Da die Eigenwerte Ai und Richtungen der Eigenvektoren der Matrix A schlecht bestimmt werden können, wurde die Annahme benutzt, A sei in den Koordinaten dieses Raums diagonal. Dies stellt eine weitere Näherung dar. Damit berechnet sich das komplette Gauß-Integral aus den 1-dimensionalen Integralen entlang der einzelnen Koordinatenachsen: 2 r Z π Wmax √ ⇒ Ai = π Zi := W (xi ) dxi = Wmax Ai Zi R Y Zi Z ≈ Wmax . Wmax i Rechnung Wmax 1 5,929 · 10348 2 1,572 · 10352 3,102 · 10348 3 4 1,374 · 10326 5 3,236 · 10324 6 9,120 · 10245 7 5,047 · 10131 8 9,897 · 1085 9 6,484 · 10−9 10 7,870 · 10−449 Gauß-Näherung 6,383 · 10393 8,818 · 10−841 2,932 · 10−221 4,819 · 10−869 7,194 · 10−211 1,096 · 10−1455 2,825 · 10−770 2,173 · 10−362 5,610 · 10−689 2,825 · 10−779 Tabelle 6.2: Vergleich der gefundenen maximalen Gewichte Wmax und der GaußNäherung. In Tabelle 6.2 sind für mehrere gefundene Werte Wmax die Gauß-Näherungen berechnet worden. Um Zi zu berechnen, wurde dabei über einen Bereich 10 Punkte zu beiden Seiten 57 6 Simulationen - Statik des Maximums auf der Achse xi summiert. Die unterschiedlichen Werte für Wmax stammen aus unterschiedlich gut optimierten Algorithmen zum Auffinden des Maximums. Der Wert aus Rechnung (1) ist der einzige, der durch die Gauß-Näherung vergrößert wurde. In allen anderen Fällen oszilliert die Gewichtsfunktion stark und nimmt um das lokale Maximum herum zu viele negative Werte an. Daraus kann geschlossen werden, dass die Näherung durch eine Gauß-Funktion nicht sinnvoll ist. Auch scheinen diese Überlegungen nicht zu bestätigen, dass die gefundenen Maxima jeweils einem stationären Zustand entsprechen, denn dann müssten alle drei Werte der optimierten Rechnungen (1),(2),(3) hierdurch vergrößert werden. R P 2 2 Fehler durch die implizit benutzte Näherung Z e−x ≈ R e−x dx sind vernachlässigbar. Die Eulersche Summenformel lässt iterativ eine obere Schranke hierfür berechnen, welche aber langsam konvergiert. Einfache Numerik zeigt, dass der Fehler bei etwa 10−4 liegt und auch bei 970 Spins nur 20% Unterschied verursacht. Es ist allerdings zu erwarten, dass die Annahme, A sei diagonal, große Abweichungen mit sich bringt. Auch zeigen die hohen Schwankungen der Gewichtsfunktion, dass die Gauß-Funktion keine gute Näherung darstellt. Eine direkte Monte-Carlo-Integration der Gewichtsfunktion in einem Bereich um das Maximum erwies sich als unpraktikabel. Die Zwangsbedingungen (Dreiecksungleichungen und ganzzahlige Spinsummen auf Dreiecken) schränken die Punkte, an denen die Funktion ungleich Null ist, zu stark ein. Eine Summation über Punkte, die diese Bedingungen nicht berücksichtigt, läuft in annehmbarer Zeit nur über Nullstellen. Die Erzeugung der zufälligen Konfigurationen, über die summiert wird, könnte zwar so umgeschrieben werden, dass sie die Zwangsbedingungen immer erfüllt, dann wäre es allerdings nötig, zu wissen, wie viele Konfigurationen die Bedingungen erfüllen. Hierfür konnte in dieser Arbeit keine explizite Formel gefunden werden. 58 7 Simulationen - Dynamik Ziel dieses Kapitels ist es, eine Möglichkeit zu finden, das Verhalten des Ponzano-ReggeModells für ein größeres Gitter zu berechnen, indem iterativ nur kleine Teile des Gitters betrachtet werden. Dieses Vorgehen wird hier als Dynamik“ bezeichnet, da die Iteration ” in einer Koordinatenrichtung ablaufen wird. Es kann somit als Zeitentwicklung eines Spinnetz-Zustandes angesehen werden. Eine ausführlichere Diskussion folgt in Abschnitt 7.2.2 (Seite 68). 7.1 Dynamische Näherung 7.1.1 Verfahren A B t Abbildung 7.1: Zerlegung des Raumzeit-Gitters in dünne Raumschichten (blau) mit Grenzflächen (A und B) dazwischen. Die 3-dimensionale Raumzeit wird in eine Folge dünner raumartiger Schichten aufgeteilt, die durch eine Zeitkoordinate nummeriert werden. Die Schichten werden dabei durch 2dimensionale Randflächen getrennt, an denen sich benachbarte Schichten berühren. Die beiden Randflächen einer Schicht werden hier als vergangene“ und zukünftige“ Fläche ” ” bezeichnet, je nachdem, ob sie die Grenze zur vorangegangenen oder folgenden Schicht in der Zeitkoordinate bilden. Auf der vergangenen Randfläche der ersten Schicht werden nun die Spinzahlen vorgegeben, diese bilden die Daten des Anfangswertproblems der folgenden Simulation. Es kann nun 59 7 Simulationen - Dynamik für jede Konfiguration von Spinzahlen auf der zukünftigen Fläche der ersten Schicht eine Zustandssumme für diese Schicht berechnet werden. Sie entspricht einer (nicht normierten) Übergangsamplitude des vergangenen Spinnetzes zum zukünftigen. Die Aufgabe wird sein, diejenige Spinkonfiguration auf der zukünftigen Schicht zu suchen, die die höchste Übergangsamplitude besitzt. Der im letzten Kapitel beschriebene Algorithmus zur Berechnung der Zustandssummen sucht seinerseits nur die Konfiguration im Inneren der Schicht, die die Gewichtsfunktion maximiert. Daher können die beiden Suchen nach maximalen Konfigurationen vereint werden, d.h. der Algorithmus variiert nicht nur die Spinzahlen im Inneren der Schicht sondern auch auf der zukünftigen Randfläche. Die gefundene Konfiguration auf der zukünftigen Randfläche der ersten Schicht kann im nächsten Schritt als die vergangene Konfiguration der zweiten Schicht angesehen werden. Iterativ werden so für alle Schichten Spinkonfigurationen gefunden. Dadurch dass für jede Schicht nur das zukünftige Spinnetz mit der höchsten Amplitude berücksichtigt wird, geht hier eine weitere Näherung ein. Erst die im nächsten Abschnitt vorgestellte Simulation soll dieses Problem beheben. 7.1.2 Krümmung Für die Auswertung der Simulationen ist es nötig, ein Maß für die Krümmung der Spinkonfigurationen zu definieren. Es soll eine Größe konstruiert werden, die im Grenzfall der kontinuierlichen Geometrie in die skalare Krümmung übergeht. Vi αi Vi α Abbildung 7.2: Krümmung auf einer Kante (rot), die von mehreren Tetraedern umschlossen wird. Die Innenwinkel der Tetraeder um diese Kante sind αi . Wie schon in Abschnitt 4.2 (Seite 33) beschrieben ist im Regge-Kalkül die Krümmung im Tetraedergitter auf den Kanten konzentriert. Sie verursacht Winkeldefekte auf geschlossenen Wegen um diese Kante. Global gilt ein Zusammenhang zwischen den Kantenlängen lk , Winkeldefekten δk und der totalen Krümmung: Z X R dV = 2 lk δk . Kanten k Um R als Funktion vom Ort abschätzen zu können, wird angenommen, dass die Krümmung homogen auf ein bestimmtes Volumen verteilt ist. Dieses Volumen sei 60 7.1 Dynamische Näherung V = X Vi /6 . Vi sind die Volumen der Tetraeder, die die Kante umschließen. Da jeder Tetraeder sechs Kanten besitzt, wird sein Volumen auf sechs Krümmungsgebiete verteilt. Das führt zum Faktor 61 . P Die Defekte δk berechnen sich aus der Summe der Innenwinkel α := αi : δk = 2π − α . Dann wird die Krümmung im Gebiet V abgeschätzt durch R= 2 lk (2π − α) . V (7.1) Das Volumen eines Tetraeders mit Kantenlängen li = ji +1/2 folgt aus Tartaglias Formel in Determinantenschreibweise1 0 l1 2 l2 2 l6 2 2 2 2 l1 2 02 l3 l5 2 1 2 det l2 l3 V = 0 l4 288 l6 2 l5 2 l4 2 0 1 1 1 1 1 1 1 . 1 0 (7.2) Der Innenwinkel αi an der Kante l1 lässt sich damit geometrisch herleiten zu P − MN cos αi = p (1 − M 2 )(1 − N 2 ) mit l2 2 + l6 2 − l4 2 P := 2 l2 l6 2 l1 + l2 2 − l3 2 M := 2 l1 l2 2 l1 + l6 2 − l5 2 N := . 2 l1 l6 7.1.3 Gitter Für die Simulationen in diesem Kapitel wurden zwei verschiedene Gitter benutzt. 61 7 Simulationen - Dynamik Abbildung 7.3: Einfaches, kubisches Gitter. Links ist die elementare Würfel-Zelle aus 5 Tetraedern gezeigt, rechts die Anordnung der Würfel zu einem Gitter. Kubisches Gitter In Abb. 7.3 ist die erste Gittervariante zu sehen. Die dünne Schicht in der Raumzeit besteht aus einer einzelnen Lage von Würfeln, die schachbrettartig in der Ebene angeordnet sind. Jeder Würfel besteht aus 5 Tetraedern. Dieses Gitter hat den Vorteil, leicht implementierbar zu sein. Allerdings bräuchte es, um einen √ flachen Raum zu repräsentieren, zwei verschiedene Kantenlängen im Verhältnis 1 : 2. Da wegen der Gittergeometrie in diesem Fall nur ganzzahlige Spins erlaubt sind, ist dieses Verhältnis nur schlecht mit kleinen Spinzahlen zu approximieren. Hexagonales Gitter Um den flachen Raum besser abbilden zu können, wurde für diese Arbeit ein zweites Gitter entwickelt. In Abb. 7.4 ist die Gitterstruktur gezeigt. Die untere ( vergangene“) Grenzfläche der ” Schicht bildet ein gleichseitiges Dreiecksgitter. Dagegen besitzt die obere Schicht nur die Symmetrie eines Sechseckgitters, sie ist in der Abbildung blau und gelb dargestellt. Das Verhältnis der beiden √ verschiedenen Kantenlängen des flachen Raums hat bei diesem Gitter das Verhältnis 1 : 3. Spinzahlen von 1 und 2 weichen nur um 4% von diesem Verhältnis ab. Für beide Gitter wurde die Krümmung einer flachen“ Konfiguration berechnet. Im neuen ” Gitter ist die Krümmung etwa um den Faktor 14 kleiner, Abb 7.5 zeigt eine direkte Gegenüberstellung. Dafür wurden jeweils entlang einer Schnittebene durch die Gitterschicht die für die Kanten berechneten Krümmungen innerhalb der jeweiligen Tetraeder interpoliert. 1 Für die Reihenfolge der Kanten auf dem Tetraeder siehe Abb. 4.2. 62 7.1 Dynamische Näherung 1 2 3 4 Abbildung 7.4: Aufbau des neuen Gitters. Von 1 nach 4 werden die verschiedenen Tetraedertypen hinzugefügt - graue und gelbe sind jeweils gleichseitig. Abbildung 7.5: Berechnete Krümmung für flache“ Gitter. Links das kubische, rechts ” das hexagonale Gitter. Blau ist positive Krümmung, rot negative; Die Intensität gibt den Betrag an. Iterationsverfahren Für jeden Iterationsschritt ist es nötig, von einem Spinnetz auf der Randfläche eine erlaubte Spinkonfiguration im Inneren der Gitterschicht zu finden, die als Ausgangspunkt für den im letzten Kapitel beschriebenen Suchalgorithmus dient. Für den ersten Schritt kann dies manuell geschehen. In den weiteren Schritten bietet sich die einfache Lösung an, von der im jeweils letzten Schritt gefundenen (und gespiegelten) Konfiguration auszugehen. Diese besitzt als Rand das geforderte Spinnetz und erfüllt die an die Tetraeder 63 7 Simulationen - Dynamik gestellten Bedingungen. Bei der Suche nach der besten Konfiguration innerhalb der Schichten kann in jedem Schritt ein Vertex-Punkt auf der zukünftigen Grenzfläche gewählt und die angrenzenden Spins gekippt werden. 7.1.4 Ergebnisse Abbildung 7.6: Skalare Krümmung auf einem Schnitt durch zwei gefundene Lösungskonfigurationen. Blau ist positiv, rot negativ und grün imaginär. Es wurde auf dem hexagonalen Gitter mit Länge und Breite von 16 Gitterzellen gerechnet. Ausgangskonfiguration war das flache Gitter. Alle durchgeführten Rechnungen lieferten schlechte Ergebnisse, wie an zwei Beispielen gezeigt werden soll. In Abb. 7.6 sind die ausgewerteten Krümmungen auf jeweils einer Schnittebene durch das Gitter in Raumrichtung zu sehen. Das linke Bild stammt von einer Rechnung mit maximal erlaubtem Spin von 10, in der der Suchalgorithmus für die optimale Konfiguration noch nicht optimiert war. Das rechte Bild stammt von einem optimierten Algorithmus mit maximalem Spin von 50. Die Ergebnisse der unoptimierten Simulation waren zu verrauscht und ließen auch in der Zeitentwicklung keinerlei Struktur erkennen. Nach der Optimierung wurden die gefundenen Konfigurationen von Spinzahlen dominiert, die den höchsten in der Simulation erlaubten Wert annahmen. Abb. 7.7 zeigt die Häufigkeitsverteilungen der Spins. Deutlich zu erkennen ist der Peak beim maximalen Wert 50. Dieser ist ein unphysikalisches Artefakt der Begrenzungen in der Simulation und wird wahrscheinlich durch das divergente Verhalten der Zustandssumme begünstigt. Die hohe Zahl von Spins mit Wert 2 hingegen scheint physikalischer Natur zu sein. 64 7.1 Dynamische Näherung 14000 12000 Haeufigkeit 10000 8000 6000 4000 2000 0 0 10 20 30 40 50 Spin Abbildung 7.7: Häufigkeitsverteilung der Spinwerte in der Lösungskonfiguration. Merkwürdige Tetraeder In den Rechnungen traten 2 interessante Sonderfälle für Konfigurationen der Tetraeder auf: Es kommt vor, dass das 6j-Symbol Null wird, obwohl alle Bedingungen erfüllt sind und die Kantenlängen einen nicht entarteten Tetraeder ergeben. Da jeder Wert der 6jSymbole multiplikativ in das Gewicht eingeht, verschwindet dann der komplette Anteil der Konfiguration in der Zustandssumme. So ist z.B. 2 2 2 =0. 4 5 5 Im anderen Fall ist der Wert des 6j-Symbols endlich und die Bedingungen erfüllt, aber die Kantenlängen lassen sich nicht zu einem Tetraeder im R3 verbinden. Die Formel (7.2) ergibt dann ein imaginäres Volumen des Tetraeders. Auch der Innenwinkel wird imaginär. Z.B. gilt: 1 3 5 2 = √ 2 2 3 7 6 65 7 Simulationen - Dynamik 7 2 11 2 7 2 0 7 2 ( 2 ) ( 25 )2 ( 52 )2 ( ) 0 (2) (2) 2 11 1 2 5 2 2 0 ( 25 )2 det ( 2 ) ( 2 ) V = 288 ( 7 )2 ( 5 )2 ( 5 )2 0 2 2 2 1 1 1 1 1 1 4175 1 = − . 4608 1 0 Bei der Auswertung wurde hierbei mit komplexen Volumina und Winkeln gerechnet, weshalb sich auch teilweise eine komplexe skalare Krümmung ergab. 7.2 Eingeschränkte Dynamik 7.2.1 Verfahren Das Ziel der neuen Zeitentwicklung ist es, weniger chaotische Konfigurationen zu finden. Diese sollen auch weniger vom Cut-Off Wert der Spinzahlen abhängen. Darüber hinaus soll der Quantencharakter der Theorie berücksichtigt und mit Linearkombinationen statt nur mit einzelnen Konfigurationen gerechnet werden. Dazu wird eine kleine Zahl von Spinnetzen S1 , . . . , Sn für die Grenzflächen der Gitterschicht vor der Simulation gewählt. Für jede Wahl eines Spinnetzes Si für die vergangene Fläche und eines weiteren Sk für die zukünftige lässt sich für diese Schicht eine Übergangsamplitude Aik als Zustandssumme berechnen. Diese wird weiterhin durch das Gewicht der dominanten Konfiguration im Inneren der Schicht approximiert. Nun soll die Zustandssumme für die Vereinigung zweier aufeinander folgender Gitterschichten berechnet werden. Dazu seien wieder auf den beiden Flächen, die das Gitter begrenzen, jeweils ein Spinnetz Si und Sk gegeben. Die Zustandssumme läuft nun über alle möglichen Konfigurationen in den beiden Gitterschichten, sowie über die Grenzfläche zwischen den beiden. Seien {j1 } und {j2 } die Spins innerhalb der ersten bzw. zweiten Schicht, sowie {jG } die Spins auf der Grenzfläche dazwischen. Dann gilt X Z(Si , Sk ) = W1 (Si , {j1 }, {jG }) WG ({jG }) W2 ({jG }, {j2 }, Sk ) {j1 },{jG },{j2 } = X {jG } ≈ X WG ({jG }) X W1 (Si , {j1 }, {jG }) {j1 } WG (Sm ) Aim Amk . X W2 ({jG }, {j2 }, Sk ) {j2 } (7.3) m Entsprechend kann für jede höhere Zahl von Iterationsschritten die Übergangsamplitude nach diesem Muster berechnet werden. D.h. die gesamte Dynamik folgt aus den einmal bestimmten Amplituden Aik . 66 7.2 Eingeschränkte Dynamik In der Simulation wird ein Zustandsvektor als Linearkombination von Spinnetzen auf einer Anfangsfläche aufgefasst. Dessen Zeitentwicklung soll über die Amplituden in (7.3) berechnet werden. Das ganze entspricht einer Einschränkung des Zustandsraumes für die Grenzflächen auf einen n-dimensionalen Unterraum, der nur von den Spinnetzen Si erzeugt wird. Würde eine genügend hohe Zahl von Spinnetzen gewählt werden und wäre es möglich, die einzelnen Übergangsamplituden Aik ohne Näherung zu berechnen, so wäre dieses Verfahren exakt. Vor allem entfällt die Näherung der im letzten Abschnitt behandelten Dynamik, dass für jeden Zeitschritt nur ein einzelner Basiszustand betrachtet wird. Übergangsamplituden Wieder werden die einzelnen Aik durch die dominante Konfiguration im Inneren der Gitterschicht genähert. Allerdings versagt das bisherige Verfahren, Vertex-Punkte zu wählen und benachbarte Spins zu kippen. Die Gitterschicht besteht nur aus einer einzelnen Lage von Tetraedern, jeder Vertex-Punkt gehört somit zu einer Randfläche, auf denen die Spins durch die Spinnetze festgelegt sind. Deshalb würde jeder Kippvorgang die Spinnetze ändern. Änderungen einzelner Spins im Inneren sind weiterhin möglich, solange nicht zwischen ganz- und halbzahlig gewechselt wird. Dann müssen wieder nur die Dreiecksungleichungen erfüllt bleiben. Seien nun z.B. alle Spins im Gitter ganzzahlig2 . Wird ein Spin durch das Kippen halbzahlig, so kann dies (wie in Abschnitt 6.3.2 (Seite 52) beschrieben) als ein Stück einer Fläche durch diese Kante angesehen werden. Die Theorie fordert, dass diese Fläche entweder geschlossen ist, oder dass ihr Rand auf dem Rand des Gitters liegt. Um geschlossen sein zu können, muss sie einen Vertex-Punkt umschließen, dazu fehlen allerdings VertexPunkte im Inneren des Gitters. Weil die Konfigurationen auf vergangener und zukünftiger Grenzfläche vorbestimmt sind, bleibt nur die Möglichkeit, dass die neue Fläche von halbzahligen Spins die gesamte Gitterschicht parallel durchdringt. D.h. wenn ein einzelner Spin halbzahlig wird, müssen alle anderen Spins im Inneren der Schicht ebenfalls halbzahlig werden. Andererseits ist es sehr schwer, alle Spins im Inneren auf einmal zu kippen. Dafür ist die hohe Anzahl von gleichzeitig zu berücksichtigenden Dreiecksungleichungen zu hoch. Es ist zwar immer möglich alle Spins um 21 zu erhöhen, das würde allerdings dazu führen, dass Konfigurationen mit hohen Spinzahlen bei der Suche deutlich bevorzugt werden. Eine einfache Lösung dieses Problems liegt darin, mit zwei Kopien des Gitters zu arbeiten. Bei der einen werden anfangs alle Spins um 12 erhöht. Danach werden in beiden Gittern unabhängig voneinander neue Konfigurationen erzeugt, ohne dabei weitere Übergänge zwischen ganz- und halbzahligen Spins mehr zu vollziehen. 2 Die Folgerung ist für beliebige Spins analog, allerdings ist sie dann weitaus aufwändiger in Worte zu fassen. 67 7 Simulationen - Dynamik 7.2.2 Interpretation In der Schrödingermechanik beschreibt die Wellenfunktion Ψt0 (x) ∈ Ht0 ein System zu einem festen Zeitpunkt t0 . Das Wissen der Zustände zu allen Zeiten kann als relativistische Verallgemeinerung des Zustands-Begriffs angesehen werden und ist Lösung der Schrödinger-Gleichung. Er soll hier als relativistischer Zustand Ψ(x, t) ∈ H bezeichnet werden. Die Schrödinger-Gleichung wirkt auch als Abbildung P : Ht0 → H : Ψt0 (x) 7→ Ψ(x, t). Die Übergangsamplitude zwischen zwei Zuständen Ψt1 (x) und Φt2 (x) zu verschiedenen Zeiten kann geschrieben werden als hΨ(t2 )|Φt2 i = hP Ψt1 |Φt2 i =: hΨt1 |Φt2 iphys und wird das physikalische Skalarprodukt genannt. Eine mögliche Konstruktion von P ist als Pfadintegral. Sei dazu Ψt1 ein Eigenvektor zu x. Dann ist (P Ψt1 )(y, t2 ) die (normierte) Summe von Gewichten aller klassischen Pfade x(t) mit x(t2 ) = y und x(t1 ) = Ψt1“. ” Hier bezeichnet die klassische Variable x ein Spinnetz. Ein Zustand Ψt0 (x) gibt jedem möglichen Spinnetz eine Amplitude. Ein Spin-Schaum entspricht dann einem klassischen Pfad, der zwei Spinnetze xt1 und yt2 verbindet. Die Übergangsamplitude als Summe der Gewichte aller Spin-Schäume gibt somit einen einzelnen Wert (PΨx,t1 )(y, t2 ) des relativistischen Zustandes PΨx,t1 an. Somit konstruiert die hier beschriebene Methode iterativ die Abbildung P und damit eine Dynamik eines Spin-Netzwerk-Zustandes. 7.2.3 Spinnetze In der Simulation werden 10 Spinnetze verwendet (siehe Abb. 7.8). Zur Berechnung der Übergangsamplituden war es notwendig von einer Spinkonfiguration auf der Gitterschicht auszugehen, die auf dem Randgebiet durch die Spinnetze festgelegt ist. Diese Suche nach einer Startkonfiguration ist dank der hohen Zahl von Bedingungen äußerst schwierig. Deshalb war es nötig, die Spinnetze als eine Folge von Spin-Additionen in der Umgebung von Vertex-Punkten in einem flachen Anfangsgitter darzustellen. Die Zahl der verwendeten Spinnetze wurde durch den hohen Rechenaufwand für die Übergangsamplituden begrenzt. Die Berechnung der 102 = 100 Amplituden dauerte trotz hoher Parallelisierung etwa 10 Tage. Man beachte dabei, dass die Matrix Aij nicht symmetrisch ist, da die gewählte Gitterschicht unterschiedliche Struktur auf ihren beiden Grenzflächen besitzt. Um die 10 Spinnetze qualitativ beschreiben zu können, sind in Tabelle 7.1 Ausdrücke der Krümmung berechnet: • der maximale Wert des Betrags der Krümmung (|R|max ) • die totale Krümmung, also das Integral über die skalare Krümmung: Z Rtotal := R dV 68 7.2 Eingeschränkte Dynamik Abbildung 7.8: Die skalare Krümmung der 10 Spinnetze, die in dieser Simulation verwendet werden (blau ist positiv, rot negativ). Um diese Bilder zu erzeugen, wurden sie jeweils in ein ansonsten flaches Gitter eingebettet. l • der maximale Spin, der einer Kante im flachen Gitter hinzuaddiert wurde In Rtotal wurde die Krümmung auf der Grenzfläche zwischen zwei Schichten des hexagonalen Gitters über diese beiden Schichten integriert. Das Gitter hatte eine Länge und Breite von jeweils 16 Zellen, das Spin-Netzwerk bildete dabei die Grenzfläche. Von den in Abb. 7.8 zu sehenden Störungen abgesehen befanden sich die Gitter in der weiter oben beschriebenen flachen“ Konfiguration mit Spinzahlen 1 und 2. ” 7.2.4 Ergebnisse Alle 10 Spinnetze wurden nacheinander als Anfangszustand für eine Zeitentwicklung verwendet. Abb. 7.9 zeigt als Beispiel die Entwicklung des Zustands S1 , der dem flachen Raum entspricht3 . Das Ergebnis ist aber für alle Anfangszustände sehr ähnlich. 3 In den Abbildungen wird jeweils nur jeder zweite Iterationsschritt gezeigt, da erst in jedem zweiten Schritt dieselbe Gitterstruktur erreicht wird. Die ungeraden Iterationsschritte folgen aus einer linearen Abbildung aus den geradzahligen. 69 7 Simulationen - Dynamik Netz |R|max Rtotal ∆jmax 1 0,349 -68,5 0 2 2 0,858 -62,0 3 0,928 35,6 4 93,4 8 4 0,928 5 0,928 219,8 8 6 0,928 319,9 8 8 7 0,928 371,5 8 0,928 403,8 8 8 9 0,928 397,0 10 0,928 312,5 8 Tabelle 7.1: Daten der verschiedenen Spinnetze: maximaler Betrag der skalaren Krümmung, totale Krümmung sowie maximaler Spinunterschied zum flachen Gitter. 1 S1 S2 S3 S4 1e-05 S5 S6 S7 S8 S9 S10 1e-10 Amplitude 1e-15 1e-20 1e-25 1e-30 1e-35 0 50 100 150 Iterationen 200 250 300 Abbildung 7.9: Zeitentwicklung des (flachen) Spin-Netzwerk-Zustands S1 Endzustand Für alle Anfangszustände konvergiert die Simulation in denselben, stabilen Endzustand, der von den beiden flachsten“ Spinnetzen S1 und S2 dominiert wird. Im Falle des S1 ” 70 7.2 Eingeschränkte Dynamik 1 S1 S2 S3 S4 1e-05 S5 S6 S7 S8 S9 S10 1e-10 Amplitude 1e-15 1e-20 1e-25 1e-30 1e-35 0 50 100 150 Iterationen 200 250 300 Abbildung 7.10: Zeitentwicklung des Spin-Netzwerk-Zustands S3 ist dieser Zustand nach etwa 150 Iterationen erreicht. Der Endzustand lässt sich auch direkt berechnen. Die Zeitentwicklung lässt sich als einfache Matrixmultiplikation beschreiben. Jede Komponente des Zustandsvektors ist als Amplitude eines Spinnetz-Basiszustands zu sehen und wird im ersten Schritt entsprechend den Übergangsamplituden Aik auf die Komponenten des zeitlich folgenden Vektors abgebildet. Insgesamt entspricht der erste Zeitschritt also der Multiplikation mit der Matrix A. In allen weiteren Schritten müssen die einzelnen Komponenten des Vektors, wie aus Gleichung (7.3) abzulesen, zuerst mit einem Gewichtsfaktor für die Spinnetze multipliziert werden. Diese Operation kann als Multiplikation mit einer diagonalen Matrix D interpretiert werden. Vom ersten Zeitschritt abgesehen erfolgt also der Übergang von einem Zeitpunkt zum nächsten über die Matrix M = AD . Weil in dieser Simulation eine Gitterschicht mit unterschiedlichen Grenzflächen verwendet wird, sollte streng genommen mit der Entwicklung über zwei Zeitschritte hinweg gerechnet werden, um die Vektoren vergleichen zu können. Die Matrix ist nun M2 = AT DAD . 71 7 Simulationen - Dynamik 1 2 3 4 5 6 7 8 9 10 Eigenwert 0,583 0,414 2,741 · 10−3 1,000 · 10−8 1,449 · 10−12 8,218 · 10−15 (1,142 + 1,464i) · 10−17 (1,142 − 1,464i) · 10−17 0 0 Tabelle 7.2: Die Eigenwerte der Matrix M2 . 1 2 3 4 5 6 7 8 9 10 0,583 0,414 0,03173 1 − 7,216 · 10−8 0,9994 3,799 · 10−3 5,988 · 10−9 4,098 · 10−12 −16 3,938 · 10 6,506 · 10−21 3,493 · 10−21 1,253 · 10−28 7,462 · 10−21 −7,107 · 10−30 −23 5,930 · 10 −6,264 · 10−32 5,701 · 10−22 −6,023 · 10−31 −27 2,899 · 10 3,354 · 10−35 4,511 · 10−18 −4,766 · 10−27 Tabelle 7.3: Die Eigenvektoren zu den beiden höchsten Eigenwerten der Matrix M2 Der in Abb. 7.9 zu sehende Endzustand ist exakt der Eigenvektor der Matrix M2 zum Eigenwert4 0,583. Da dies der höchste reelle Eigenwert ist (siehe Tabelle 7.2) und die Dynamik einer iterativen Multiplikation mit der Matrix M2 entspricht, ist also auch zu erwarten, dass dieser Eigenvektor einen stabilen Endzustand darstellt. Anfangszustand In Abb. 7.9 kann für die ersten Zeitschritte gesehen werden, dass die Anteile mit hoher Amplitude die ersten 50 Iterationen fast konstant bleiben, bis sie in den Endzustand zerfallen. Dieser Anfangszustand entspricht dem Eigenvektor zum zweit höchsten Eigenwert von M2 und ist auch in allen Zeitentwicklungen der anderen Spinnetze (z.B. Abb. 4 Die Matrix wurde zur leichteren Handhabung durch ihre Spur geteilt, da ein skalarer Faktor keinen Einfluss auf die Dynamik hat. Deshalb besitzen hier auch nur Verhältnisse von Eigenwerten eine Bedeutung. 72 7.2 Eingeschränkte Dynamik 7.10) mehr oder wenig stark ausgeprägt. Seine recht hohe Stabilität lässt sich dadurch begründen, dass die beiden höchsten Eigenwerte nahe bei einander liegen. Im Inneren der Gitterschicht Für jede Übergangsamplitude zwischen Zuständen Si und Sj wurde nur der höchste Summand in der Zustandssumme gesucht. Diesem Summanden entspricht eine Spinkonfiguration im Innern des Gitters, die die Gewichtsfunktion maximiert. Abbildung 7.11: Die skalare Krümmung im Inneren der Gitterschicht bei der Übergangsamplitude des Spin-Netzwerk-Zustandes S4 zu sich selbst. Für alle Übergänge wurden die maximierenden Konfigurationen näherungsweise bestimmt und jeweils die Krümmung berechnet. In Abb. 7.11 ist exemplarisch der Übergang von S4 nach S4 zu sehen. In allen Fällen ist deutlich erkennbar, dass die Krümmung stark fluktuiert, wo die Spinnetze einem flachen Raum entsprechen. Andererseits verschwindet sie an den Stellen, an denen die Spinnetze gekrümmt sind. Es wird angenommen, dass die Krümmung der Spinnetze stärkere Bedingungen an mögliche Spin-Konfigurationen im Inneren stellt und damit nur kleinere Schwankungen erlaubt. Dies könnte physikalisch so interpretiert werden, dass um den flachen Raum, der der Lösung der Feldgleichungen in drei Dimensionen entspricht, stärkere Quantenfluktuationen möglich sind, da dies lokal ein stationärer Zustand ist. Verhalten Die Dynamik hat eindeutig dissipativen Charakter. Dies folgt daraus, dass ein stabiler Endzustand angestrebt wird, und dass von den kleinsten abgesehen alle Eigenwerte der Matrix M2 reell sind. 73 7 Simulationen - Dynamik Dies würde in vier Dimensionen auch die Erwartung aus der Theorie bestätigen. Für eine Metrik mit Lorentz-Signatur ähneln die Feldgleichungen dann einer Wellengleichung. Der Übergang zu einer euklidischen Signatur entspricht einer Imaginärzeit-Entwicklung. In dieser wird eine Wellengleichung dissipativ. In drei Dimensionen ist die einzige Lösung der Feldgleichungen der flache Raum. Die Iterationsschritte entsprechen dann der Bildung des Kontinuumslimes für ein großes Gitter. Hier scheint dann die Dominanz der flacheren Zustände hervorzutreten. 1 Endzustand Fitkurve exp(-Rtotal) 1e-05 Amplitude 1e-10 1e-15 1e-20 1e-25 1e-30 -100 -50 0 50 100 150 200 250 totale Kruemmung Rtotal 300 350 400 450 Abbildung 7.12: Die Amplituden der Komponenten im Endzustand über der totalen Krümmung der zugehörigen Spinnetze. Beim Vergleich der Komponenten des gefundenen Endzustandsvektors mit den berechneten Werten der totalen Krümmung der einzelnen Spinnetze (Abb. 7.12) fällt ein exponentieller Zusammenhang zwischen beiden Größen auf. Interpretiert man die Spinzahlen innerhalb der Gitterschicht als zeitliche Entfernung zwischen den Zuständen bei der Iteration und sieht diese als etwa konstant an, ergibt sich ein fester Zeitschritt ∆t bei der Entwicklung. Die klassische Wirkung ist gerade die totale Krümmung. Für eine Gitterschicht ist diese zur Energie proportional: S = E·∆t. Dies führt auf einen Zusammenhang zwischen den Amplituden Ai der Spin-Netzwerke im Endzustand und deren Energie Ei : Ai ∝ e−k·Ei . 74 7.2 Eingeschränkte Dynamik Die Ermittlung der totalen Krümmung für die einzelnen Spinnetze ist allerdings einer gewissen Willkür unterworfen, da die Krümmung nur für eine Einbettung des Spinnetzes als Fläche in den Raum berechnet werden kann. Hierzu wurde eine einfach implementierbare Variante gewählt, in der das Spinnetz als Menge von Operationen auf Gitterpunkten des flachen Raumes behandelt wird. Somit wird auch die Krümmung innerhalb des Volumens der Gitterschichten beeinflusst. Es müsste auch überprüft werden, in wie weit dieses Ergebnis von den Näherungen bei der Berechnung der Übergangsamplituden abhängt. 75 7 Simulationen - Dynamik 76 8 Zusammenfassung und Ausblick 8.1 Zusammenfassung In dieser Arbeit wurde ein Verfahren entwickelt, das erlaubte Spin-Konfigurationen auf Spin-Schäumen modifizieren kann, ohne dabei die Zwangsbedingungen zu verletzen. Dieses wurde dazu verwendet mit Hilfe eines Monte-Carlo ähnlichen Algorithmus die Zustandssumme des Ponzano-Regge-Modells zumindest näherungsweise zu berechnen. Es stellte sich heraus, dass die auftretende Gewichtsfunktion ein sehr komplexes Verhalten besitzt und nur schwer numerisch integrierbar ist. Methoden zur analytischen Näherung der auftretenden 6j-Symbole waren nicht anwendbar und auch der Versuch einer Gauß-Näherung der Zustandssumme schlug fehl. Um das Verfahren auf verschiedene Räume anwenden zu können, wurde ein Algorithmus entwickelt, der zufällige Triangulierungen für eine beliebig wählbare Raumtopologie Konstruiert. In dieser Arbeit wurden hauptsächlich 3-Sphären verwendet, um darauf die Näherungen zu testen. Darüber hinaus wurden zwei Möglichkeiten getestet, die Zustandssumme eines großen Gebietes iterativ durch kleine Teilstücke zu berechnen. Dieses Vorgehen entspricht einer Zeitentwicklung von Spin-Netzwerk-Zuständen. Die erste dieser Dynamiken wurde zu sehr von den eingegangenen Näherungen und dem ungeeigneten Regularisierungsverfahren der Divergenzen dominiert. Es wurde eine zweite Dynamik entwickelt, die auf einem kleineren Zustandsraum abläuft und dafür auf einige der Näherungen verzichten kann. Eine mit dieser Dynamik durchgeführte numerische Simulation führte zu auswertbaren Ergebnissen. Die Zeitentwicklung hat dissipativen Charakter und läuft in einen stabilen Endzustand, der hauptsächlich von Anteilen annähernd flacher Räume dominiert wird. Dies bestätigt die Erwartung, dass im Grenzfall größerer Gitter die klassische Lösung hervortritt. Die Simulation zeigt auch starke Fluktuationen um die klassische Vakuum-Lösung, die durch auferzwungene Krümmung vermindert wird. Es ist allerdings möglich, dass dieses Verhalten ein Artefakt der verwendeten Methoden ist, weshalb eine Überprüfung auf anderen Wegen sinnvoll wäre. 8.2 Ausblick • Die wichtigste Verbesserung wäre eine exaktere Berechnungsmöglichkeit der Zustandssummen zu finden. Die Näherungsverfahren erwiesen sich als sehr ungenau. 77 8 Zusammenfassung und Ausblick Es scheint nicht besonders sinnvoll, den Algorithmus für die Suche nach dem höchsten Gewicht zu verbessern. Statt dessen sollten mehr Summanden berücksichtigt werden, vielleicht eine globalere Näherung für die Gewichtsfunktion gefunden werden. Der optimale Weg wäre allerdings die Summe auf einem anderen Weg exakt zu berechnen. Es wäre denkbar, dass sich eine gruppentheoretische Umformulierung finden lässt, die einfacher zu berechnen ist. Die darauf aufbauenden Simulationen würden dadurch stark profitieren und vor allem an Aussagekraft gewinnen. • Es wäre sehr interessant, den 4-dimensionalen Fall des Barrett-Crane-Modells zu betrachten. Dadurch würde sich eine reichere Fülle an klassischen Lösungen und quantenmechanischen Dynamiken ergeben. Formal ähnelt dieses dem PonzanoRegge-Modell, weshalb die Simulationen nur wenig abgeändert werden müssen. Einige der Programme sind sogar schon allgemein genug implementiert. • Auch die entwickelten Methoden zur Gittererzeugung mit interessanterer Topologie wurden wenig genutzt. Es wäre unter anderem möglich, auch die Dynamik auf diese Topologien auszuweiten. • Während der Arbeit mit dem Ponzano-Regge-Modell kam die Frage auf, in wie weit sich die quantenmechanische Theorie als Fluktuation von Masseströmen interpretieren ließe. Klassisch ist die Lösung der Vakuum-Feldgleichungen in drei Dimensionen der flache Raum. In der Quantenmechanik wird über gekrümmte Räume summiert. Diese Krümmung ist auf die Kanten des Gitters beschränkt. Klassisch würden Masseströme entlang der Kanten genau diese Art von Ricci-Krümmung erzeugen. Die Spin-Schaum-Theorie wäre dann eine quantenmechanische Fluktuation von möglichen Masseströmen relativ zum Vakuum. 78 A Riemannsche Geometrie Gute Grundlagen können in [13] und [21] gefunden werden. A.1 Mannigfaltigkeiten Die Mannigfaltigkeit verallgemeinert den Begriff des ( flachen“) Vektorraumes und er” möglicht es, auch mit gekrümmten Räumen zu rechnen, indem diese über Kartenabbildungen auf einen Rn zurückgeführt werden: M U V Ψ R n Ψ Φ −1 R n Φ Abbildung A.1: Kartenabbildungen einer Mannigfaltigkeit Definition 1 Eine n-dimensionale differenzierbare Mannigfaltigkeit M ist ein Hausdorff-Raum mit einer Familie (Ui , Ψi )i∈I offener Untermengen Ui ⊂ M ( Kartenge” biete“) und dazugehörigen Abbildungen Ψi ( Kartenabbildungen“) mit folgenden Eigen” schaften: S • M = i∈I Ui (die Kartengebiete überdecken ganz M ) 79 A Riemannsche Geometrie • ist (U, Ψ) ein Kartengebiet, dann ist Ψ : U → Rn injektiv und Ψ(U ) offen • sind (U, Ψ), (V, Φ) Kartengebiete mit U ∩ V 6= ∅, so ist die Abbildung Ψ ◦ Φ−1 : Φ(U ∩ V ) → Ψ(U ∩ V ) (Kartenwechsel) differenzierbar im Rn Der Einfachheit halber werden innerhalb eines festen Kartengebietes die Komponenten der Kartenabbildung eines Punktes p ∈ M mit xµ := Ψµ (p) ∈ R bezeichnet. Definition 2 Eine (reelle) differenzierbare Funktion f auf M ist eine Abbildung f : M → R, deren Koordinatenrepresentation f ◦ Ψ−1 : Rn → R differenzierbar ist. Die Menge aller differenzierbaren Funktionen auf M sei F(M ). Aus physikalischer Sicht können diese Funktionen als skalare Felder angesehen werden und werden im Folgenden auch so bezeichnet. A.2 Tangentialraum Vektoren auf M können auf verschiedene Arten definiert werden. Hier sei der Tangentialraum die Menge der Differentialoperatoren auf skalaren Funktionen. Definition 3 Ein Vektor X ist ein Differentialoperator auf F(M ) (ist linear und erfüllt die Produktregel). Die Menge aller Vektoren eines Punktes p ∈ M wird Tangentialraum Tp M genannt. Die Koordinatenableitungen {eµ := ∂µ := ∂x∂ µ } bilden eine Basis. Eine alternative und anschauliche Definition von Vektoren sind Kurven durch einen Punkt, bzw. deren Äquivalenzklassen bezüglich der Tangente. Sind Koordinaten auf M gegeben, so lässt sich ein Vektor durch Komponenten in einer Basisentwicklung beschreiben: X = X α ∂α (Einsteinsche Summenkonvention). Definition 4 Nützliche Begriffe: • ein Vektorfeld ist eine Abbildung, die jedem Punkt p einen Vektor aus Tp M zuordnet • es ist differenzierbar, wenn seine Koordinaten differenzierbar sind • die Menge aller differenzierbaren Vektorfelder sei X(M ) • die Lie-Klammer von Vektorfeldern ist wieder ein Vektorfeld, es ist über seine Wirkung auf Skalarfelder definiert: [X, Y ]f := X(Y (f )) − Y (X(f )) • der Dualraum Tp? M ist die Menge der linearen Abbildungen Tp M → R und isomorph zu Tp M 80 A.3 Metrik • ein r-fach kovarianter, s-fach kontravarianter Tensor ist eine multilineare Abbildung Tp M × · · · × Tp M × Tp? M × · · · × Tp? M → R | {z } | {z } r mal s mal Als Basis des Dualraumes wird die Dualbasis {dxµ } über die Relation dxµ (∂ν ) = δνµ gewählt. ,...,αs dxβ1 ⊗ · · · ⊗ dxβr ⊗ ∂α1 ⊗ Die r-s-Tensoren lassen sich hiermit schreiben als T = Tβα11,...,β r µ1 ,...,µs µ1 · · · ⊗ ∂αs mit Komponenten Tν1 ,...,νr = T (∂ν1 , . . . , ∂νr , dx , . . . , dxµs ). A.3 Metrik Die Metrik ist das Skalarprodukt auf jedem Tangentialraum: Definition 5 Eine Metrik ist ein symmetrisches, positiv definites und 2-fach kovariantes Tensorfeld g auf M . Um auch das relativistische Skalarprodukt mit einschließen zu können, sei hier auch der indefinite Fall gestattet. In Koordinaten ist das Skalarprodukt gegeben durch g(X, Y ) = gαβ dxα ⊗ dxβ (X γ ∂γ , Y δ ∂δ ) = gαβ X γ Y δ dxα (∂γ ) dxβ (∂δ ) = gαβ X α Y β . Die Metrik ist außerdem ein Isomorphismus zwischen Tangentialraum und Dualraum: Tp M → Tp? M : X 7→ g(X, ·) = X̃ = Xα dxα . In Koordinaten wird dies genutzt, um Indizes zu heben und zu senken: Xµ = gµα X α . A.4 Zusammenhang und Krümmung Eine Richtungsableitung für Vektorfelder zu definieren ist komplizierter, als für Skalarfelder, und außerdem einer gewissen Willkür unterlegen. Erst durch zusätzliche Forderungen ist es möglich, eine eindeutige Ableitung zu definieren: Definition 6 Der Levi-Civita-Zusammenhang ist eine Abbildung X(M ) × X(M ) → X(M ) : (X, Y ) 7→ ∇X Y mit: • ∇ ist linear im ersten Parameter und derivativ im zweiten (Produktregel) • der Torsionstensor ist T (X, Y ) := ∇X Y − ∇Y X − [X, Y ] = 0 (torsionsfrei) 81 A Riemannsche Geometrie • Xg(Y, Z) = g(∇X Y, Z) + g(Y, ∇X Z) (verträglich mit der Metrik) Der Zusammenhang wird auch kovariante Ableitung“ genannt. ” Theorem 1 Der Levi-Civita-Zusammenhang ist eindeutig und wird durch die KoszulFormel bestimmt: 2g(∇X Y, Z) =Xg(Y, Z) + Y g(X, Z) − Zg(X, Y ) − g(Y, [X, Z]) − g(X, [Y, Z]) − g(Z, [Y, X]) . Ein Beweis hierfür ist in [13] nachzulesen. Für die Koordinatenschreibweise werden die Christoffelsymbole eingeführt: 1 Γρµν := g ρα (−∂α gµν − ∂ν gµα + ∂µ gνα ) . 2 Sie beschreiben die Ableitung der Basisfelder (∇∂µ ∂ν = Γαµν ∂α ). Mit ihnen nimmt die kovariante Ableitung folgende Form an: ∇X Y = ∇(X α ∂α ) Y β ∂β = X α ∂α Y β + Γβαγ Y γ ∂β =: X α ∇α Y β ∂β . Definition 7 Der Krümmungstensor ist gegeben durch R(X, Y )Z := ∇X ∇Y Z − ∇Y ∇X Z − ∇[X,Y ] Z seine Komponenten sind Rµ νρσ = ∂ρ Γµνσ − ∂σ Γµνρ + Γανσ Γµαρ − Γανρ Γµασ . Krümmungstensor und Zusammenhang sind eng mit dem Paralleltransport verbunden: In einem gekrümmten Raum gibt es keine eindeutige Parallelitätsbeziehung für Vektoren an verschiedenen Punkten. Es ist nur noch möglich, von Parallelität entlang eines Weges zu sprechen. Formal ist ein Vektorfeld X parallel entlang einer Kurve γ, wenn gilt: dγ(t) dt also, wenn die kovariante Ableitung des Feldes in Richtung der Kurventangente verschwindet. Anschaulich entspricht der Krümmungstensor R(X, Y )Z der Änderung eines Vektors Z beim Paralleltransport entlang einer geschlossenen Kurve, die von den ( sehr kleinen“) ” Vektoren X und Y aufgespannt wird (Abb. A.2). ∇γ̇ X = 0 82 mit γ̇ := A.4 Zusammenhang und Krümmung −X Z −Y X Y Abbildung A.2: Die Wirkung des Krümmungstensors auf einen Vektor Z als Differenz beim Paralleltransport um das kleine“ Parallelogramm mit Kanten X ” und Y . Definition 8 Der Ricci-Tensor entsteht durch Spurbildung aus dem Krümmungstensor: Ric(Y, Z) := dxα (R(∂α , Y )Z) in Komponenten: Rµν = Rα µαν . Durch weitere Spurbildung entsteht der Krümmungsskalar: R = g αβ Rαβ = Rα α . Die anschauliche Bedeutung des Ricci-Tensors ergibt sich aus den Schnittkrümmungen“: ” In einer 2-dimensionalen Fläche ist nur eine skalare Krümmung möglich. Sie ist positiv für eine Kugeloberfläche und negativ für eine Sattelfläche. In einem höherdimensionalen Raum ist dann Ric(X, X) die Summe der Schnittkrümmungen aus den zu X senkrechten 2-dimensionalen Flächen durch einen Punkt. In der Relativitätstheorie ist der Ricci-Tensor eine zentrale Größe und beschreibt für eine freifallende Wolke“ aus Teilchen, wie sich ihr Volumen mit der Zeit verändert, abhängig ” von ihrem Geschwindigkeitsvektor. 83 A Riemannsche Geometrie 84 B Differentialformen B.1 Definition Eine Kurzfassung: Definition 9 Für eine Mannigfaltigkeit M sind die Differentialformen kovariante Tensorfelder, die in allen Parametern antisymmetrisch sind. Vk Die Tensoren k-ter Stufe werden k-Formen genannt. Die Menge der k-Formen ist (M ), die Menge aller DiffeV rentialformen (M ). Entsprechend dem Tensorprodukt ⊗ gibt es das äußere Produkt ∧: Man setzt hierzu felder). V1 k ^ l k+l ^ ^ (M ) × (M ) → (M ) : (ω, σ) 7→ ω ∧ σ . (M ) := X? (M ) (duale Vektorfelder) und V0 (M ) := F(M ) (Skalar- Ausführlichere Einblicke in das Thema gibt es in [25]. Das äußere Produkt hat folgende Eigenschaften (ω i seien duale Vektorfelder, also 1Formen): • ω i ∧ ω j = −ω j ∧ ω i • ω 1 ∧· · ·∧ω k = 0, an allen Punkten, an denen die ω 1 , . . . , ω k nicht linear unabhängig sind • daraus folgt, dass • seien α ∈ Va Vk (M ) = 0 für alle k ≥ dim(M ) (M ), β ∈ Vb (M ), so gilt: α ∧ β = (−1)ab β ∧ α Beim Einsetzen von Vektorfeldern X i ergibt sich: • (ω 1 ∧ ω 2 )(X 1 , X 2 ) = ω 1 (X 1 )ω 2 (X 2 ) − ω 1 (X 2 )ω 2 (X 1 ) 85 B Differentialformen • allgemein: α ∈ Va (M ), β ∈ Vb (M ), dann ist (α ∧ β)(X 1 , . . . , X a+b ) X = sign(σ) α(X σ(1) , . . . , X σ(a) ) β(X σ(a+1) , . . . , X σ(a+b) ) 0 σ∈Sa+b = 1 X sign(σ) α(X σ(1) , . . . , X σ(a) ) β(X σ(a+1) , . . . , X σ(a+b) ) a! b! σ∈S (B.1) a+b 0 (Sa+b sind die Permutationen von a + b Elementen, Sa+b die Permutationen, für die gilt: σ(1) < · · · < σ(a) und σ(a + 1) < · · · < σ(a + b)) Basis-Darstellung Wie bei den im letzten Abschnitt definierten kovarianten Tensoren bilden die dxµ Basisfelder, nach denen die 1-Formen entwickelt werden können. Für höhere Formen ist aber zu beachten, dass nicht jede Kombination von äußeren Produkten der dxµ benötigt werden, da z.B. schon dx1 ∧ dx2 = −dx2 ∧ dx1 gilt. Jede Permutation der Indizes ändert höchstens das Vorzeichen. Somit kann man sich auf Basisprodukte beschränken, deren Indizes monoton wachsen: dxµ ∧ dxν ∧ . . . µ < ν < ... . Wie bei den Tensoren ergeben sich die Komponenten der Differentialformen durch Einsetzen der Basisvektoren: k ^ ω ∈ (M ) ⇒ ωµ1 ,...,µk = ω(∂µ1 , . . . , ∂µk ) . Wegen den überflüssigen Permutationen der Basisprodukte, werden die Basisentwicklungen üblicherweise mit Summationen über monoton wachsende Index-Kombinationen geschrieben: ω = ωα1 ,...,αk dxα1 ∧ · · · ∧ dxαk , α1 < · · · < αk . Um nicht zwischen Summenkonvention für Tensoren und Differentialformen unterscheiden zu müssen, wird in dieser Arbeit eine Schreibweise verwendet, die über alle IndexKombinationen summiert und die überflüssigen Vielfachheiten wieder herausdividiert: ω= 86 1 ωα ,...,α dxα1 ∧ · · · ∧ dxαk . k! 1 k B.2 Hodge-Dualität B.2 Hodge-Dualität Die Dimension von M sei n, dann gibt es keine k-Formen mit k > n. Ebenso gibt es (bis auf Multiplikation mit einem Skalarfeld) nur eine n-Form, da es n linear gerade n n! unabhängige Vektoren im Tangentialraum gibt. Allgemein gibt es k = k!(n−k)! linear unabhängige k-Formen und somit genauso viele wie (n − k)-Formen. Es lässt sich damit ein Isomorphismus konstruieren: Definition 10 Der Hodge-(Stern-)Operator ?: k ^ (M ) → n−k ^ (M ) : ω 7→ ?ω sei hier definiert durch seine Wirkung auf die Komponenten: 1p | det g| εα1 ,...,αk ,µ1 ,...,µn−k ω α1 ,...,αk k! 1p = | det g| εα1 ,...,αk ,µ1 ,...,µn−k g α1 ,β1 . . . g αk ,βk ωβ1 ,...,βk . k! ?ωµ1 ,...,µn−k = (B.2) Beispiel Ist M = R3 mit der Standard-Dualbasis {dx1 , dx2 , dx3 }, so gilt: ?1 = dx1 ∧ dx2 ∧ dx3 ?dx1 = dx2 ∧ dx3 ?dx2 = dx3 ∧ dx1 ?dx3 = dx1 ∧ dx2 ?(dx1 ∧ dx2 ) = dx3 (zyklisch) ?(dx1 ∧ dx2 ∧ dx3 ) = 1 . Der Hodge-Operator findet in der Physik häufig Anwendung, da er zusammen mit der im nächsten Abschnitt definierten äußeren Ableitung erlaubt, die Operationen aus der Vektoranalysis elegant zu formulieren (z.B. in der Elektrodynamik). B.3 Äußere Ableitung Definition 11 Die äußere Ableitung d: k ^ (M ) → k+1 ^ (M ) : ω 7→ dω 87 B Differentialformen ist definiert durch: V • f ∈ F(M ) = 0 (M ) ⇒ df = (∂α f )dxα V V • α ∈ a (M ), β ∈ b (M ) ⇒ d(α ∧ β) = dα ∧ β + (−1)a α ∧ dβ V • ddω = 0 ∀ω ∈ (M ) In Koordinaten gilt dω = 1 1 dωα1 ,...,αk ∧ dxα1 ∧ · · · ∧ dxαk = (∂β ωα1 ,...,αk ) dxβ ∧ dxα1 ∧ · · · ∧ dxαk . k! k! Die äußere Ableitung begründet auch die Schreibweise dxµ für die dualen Basisvektoren. Sie sind einfach die 1-Formen, die entstehen, wenn die äußere Ableitung auf die einzelnen Komponenten der Kartenfunktion wirkt: d(xµ ). Bei der Verallgemeinerung der Ableitung auf vektorwertige Funktionen und Formen werden die einzelnen Vektorkomponenten als skalare Funktionen oder Formen interpretiert und abgeleitet. Ist z.B. V ein Vektorraum mit Basis {ei } und f eine Funktion f : M → V , dann gilt: df = d(f a ea ) = (df a )ea = (∂β f a ) dxβ ea . Dies ist ein Vektor von 1-Formen ( vektorwertige 1-Form“). Man beachte, dass V nicht ” unbedingt der Tangentialraum sein muss. Für diese Arbeit sind hauptsächlich Formen mit Werten aus Lie-Algebren von Bedeutung. [5] behandelt dieses Thema sehr ausführlich und definiert auch kovariante Ableitungen für solche Formen. 88 C Lie-Gruppen und -Algebren [9] liefert einen guten Einstieg in das Thema. Eine kleine Wiederholung: Definition 12 Eine Gruppe (G, ·) ist eine Menge G mit einer Verknüpfung · : G×G → G mit folgenden Eigenschaften: • neutrales Element: • inverses Element: • Assoziativität: ∃e ∈ G ∀g ∈ G : e · g = g · e = g ∀g ∈ G ∃g −1 ∈ G : g −1 · g = g · g −1 = e ∀a, b, c ∈ G : (a · b) · c = a · (b · c) Eine Folgerung aus dieser Definition ist, dass für jedes beliebige Gruppenelement g ∈ G die Funktion Lg : G → G : h 7→ Lg (h) = g · h bijektiv ist. Sie wird Linkstranslation genannt. C.1 Lie-Gruppen Viele für die Physik wichtige Gruppen besitzen kontinuierliche Parameter, so sind z.B. die Rotationen im 3-dimensionalen Raum (SO(3)) durch 3 Winkel beschreibbar, sie bilden demnach eine 3-dimensionale Mannigfaltigkeit. Definition 13 Eine Lie-Gruppe (M, φ) ist eine n-dimensionale Mannigfaltigkeit M mit einer Verknüpfung φ : M × M → M : (a, b) 7→ φ(a, b) =: a · b , die die Gruppenaxiome erfüllt und zudem glatt ist (stetig differenzierbar). Werden auf M Koordinaten gewählt, so kann auch φ geschrieben werden als n reelle Funktionen (a, b, c ∈ M mit Koordinaten ai , bi , ci , i = 1, . . . , n): a · b = c ⇔ φi (a1 , . . . , an , b1 , . . . , bn ) = ci . Lie-Gruppen werden gerne benutzt, um Symmetrien und Transformationen zu beschreiben. Oft werden aber auch infinitesimale“ Transformationen benötigt, also eine Linea” risierung der Lie-Gruppe um ihr neutrales Element. Formaler ausgedrückt: 89 C Lie-Gruppen und -Algebren Definition 14 Die Lie-Algebra M zu einer Lie-Gruppe M ist der Tangentialraum Te M des neutralen Elements e ∈ M . Dieser ist ein n-dimensionaler Vektorraum, dessen Basisvektoren {Xi } als Generatoren der Gruppe bezeichnet werden. Auf M lässt sich eine zusätzliche, Abbildung [·, ·] : M × M → M (Lie-Klammer) definieren, z.B. durch: • a, b ∈ M • Kurven in der Lie-Gruppe γa , γb : R → M durch das neutrale Element (γa,b (0) = e) mit Tangentialvektoren ∂t γa,b (t = 0) = a, b • Lie-Klammer als linearisierter Kommutator: [a, b] := ∂t γa (t) · γb (t) · γa (t)−1 · γb (t)−1 (t = 0) Diese Abbildung ist bilinear und antisymmetrisch. Die Entwicklungskoeffizienten cki,j der Lie-Klammer heißen Strukturkonstanten: [Xi , Xj ] = cki,j Xk . In vielen Fällen sind die Gruppen- und Algebraelemente als Matrizen gegeben, dann ergibt sich die Lie-Klammer als der bekannte Kommutator [a, b] = ab − ba. Zwei Lie-Algebren sind isomorph, wenn sie dieselben Strukturkonstanten besitzen. Das heißt, sind die Strukturkonstanten bekannt, so folgen alle Eigenschaften der Algebra aus diesen. In gewissem Maße kann aus ihnen sogar die Lie-Gruppe rekonstruiert werden. Beispiele Die Lie-Gruppen SU (2) und SO(3) können jeweils als 3-parametrige Rotationen oder als 3-Sphäre angesehen werden. SU (2) ist die zweifache Überlagerungsgruppe zu SO(3), das heißt, SO(3) kann zwar in die SU (2) eingebettet werden, dabei gibt es aber geschlossene Wege in SO(3), die 2 mal durchlaufen werden müssen, um auch in der SU (2) wieder zum Ausgangspunkt zurück zu führen. Ein bekanntes Beispiel hierfür ist der Elektronenspin, der bei einer Rotation um 360◦ zu einem Vorzeichenwechsel führt und erst bei 720◦ zur ursprünglichen Wellenfunktion zurückkehrt. Beide Gruppen sind in nicht zu großen“ Gebieten isomorph, besitzen somit dieselbe ” Lie-Algebra. Im Falle der SU (2) bilden {Xi := iσi } mit den Paulimatrizen 0 1 0 −i 1 0 σ1 = , σ2 = , σ3 = 1 0 i 0 0 −1 eine Basis der Algebra su(2). Die Strukturkonstanten ergeben sich aus der Beziehung σi σj = δij + i εijk σk der Pauli-Matrizen: cki,j = −2 εijk . 90 C.2 Haar-Maß C.2 Haar-Maß Gegeben sei eine reelle Funktion auf einer Gruppe G (f : G → R). Falls G nur endlich viele Elemente besitzt, kann ein Integral“ von f über der Gruppe einfach definiert ” werden als Z X f := f (g) . G g∈G Dieses ist invariant unter der Linkstranslation: Z Z X X 0 Lh f = f (h · g) = f (g ) = f . G g∈G g 0 ∈G G Dieses Integral kann auf Lie-Gruppen ausgeweitet werden, dazu ist aber ein Maß auf der Mannigfaltigkeit G nötig, das mit der Gruppenstruktur verträglich ist. Dieses wird Haar-Maß genannt. Definition 15 Sei (M, φ) wie oben eine (zusammenhängende) Lie-Gruppe. Dann ist das Haar-Maß dµ(g) = ρ(g) dV (g) in Koordinaten x1 , . . . , xn definiert durch: • dV (g) = dx1 ∧ · · · ∧ dxn das euklidische Volumenelement im Parameterraum −1 i • ρ(g) = ∂φ∂h(g,h) j h=e R Das so definierte Integral G f (g) dµ(g) ist invariant unter Linkstranslation und bis auf einen konstanten Faktor (durch die Wahl der RKoordinaten) eindeutig. Dieser wird für kompakte Gruppen meist so gewählt, dass gilt: G dµ(g) = 1. Das Integral kann auf nicht-zusammenhängende Gruppen erweitert werden, indem zuerst über Zusammenhangskomponenten integriert und danach aufsummiert wird. 91 C Lie-Gruppen und -Algebren 92 D Spin-Darstellung der SU(2) Für eine ausführlichere Behandlung des Themas sind [9] und der Anhang von [19] zu empfehlen. D.1 Darstellungen von Gruppen Definition 16 Als (lineare) Darstellung einer Gruppe G bezeichnet man eine Abbildung ρ : G → Aut(V ) : g 7→ ρ(g), die jedem Gruppenelement g einen linearen Operator ρ(g) auf einem Vektorraum V zuordnet, sodass die Operatorverknüpfung mit der Gruppenstruktur verträglich ist: ∀a, b ∈ G : ρ(a · b) = ρ(a) ρ(b) . Da meistens eine Basis in V gegeben ist, bedeutet diese Definition, dass jedem Gruppenelement eine Matrix zugeordnet wird, wobei die Matrixmultiplikation die Gruppenverknüpfung wiedergibt. Beispiele von Darstellungen sind für die Gruppe SO(n) die reellen, orthogonalen n × nMatrizen mit Determinante 1. Eine andere (aber triviale) Darstellung derselben Gruppe wäre die Abbildung, die jedem Gruppenelement die 1 zuordnet (als 1 × 1-Matrix). Definition 17 Einige nützliche Begriffe: • unterschiedliche Darstellungen ρ, σ (auf demselben Vektorraum) heißen ähnlich, wenn sie über einen Operator T verbunden sind: ρ(g) = T σ(g) T −1 (∀g ∈ G) (z.B. über einen Basiswechsel) • zwei Darstellungen ρ, σ auf den Vektorräumen V, W bilden über die direkte Summe ρ(g) ⊕ σ(g) eine neue Darstellung auf dem Raum V ⊕ W • gleiches gilt für das Tensorprodukt ρ(g) ⊗ σ(g) auf V ⊗ W • eine Darstellung, die nicht zu einer Summendarstellung ähnlich ist, heißt irreduzibel Die genauen Definitionen und tiefere Einsichten in das Thema sind z.B. in [24] nachzulesen. 93 D Spin-Darstellung der SU(2) D.2 Tensorprodukt-Basen Sei V ein r-dimensionaler Vektorraum mit Basis {ei }. Dann bilden im n-fachen Tensorprodukt |V ⊗ ·{z · · ⊗ V} =: V n die n-fachen Tensorprodukte der Basisvektoren wieder eine n Mal Basis: {ei1 ⊗ · · · ⊗ ein } (rn Stück). Auf V ⊗ V (also n = 2), lassen sich Unterräume mit symmetrischer bzw. antisymmetrischer Basis finden: (Dimension: 21 r(r + 1)) • Symmetrisch: {ei ⊗ ej + ej ⊗ ei } • Antisymmetrisch: {ei ⊗ ej − ej ⊗ ei } (Dimension: 12 r(r − 1)) Diese Konstruktion lässt sich auf höhere Tensorprodukte V n ausweiten (es interessieren hier nur die symmetrischen Basen): X ei1 ∨ · · · ∨ ein := eiσ(1) ⊗ · · · ⊗ eiσ(n) σ∈Sn wobei Sn die Menge der Permutationen der n Indizes ist. Die Dimension dieses Unter. raumes ist (r+n−1)! n!(r−1)! D.3 Spin-Darstellungen SU (2) sei hier als Matrixgruppe definiert: SU (2) := A ∈ C2×2 | A† A = 12×2 , det A = 1 . 2 Die Gruppehat somit eine natürliche Darstellung auf dem Raum V := C mit kanoni1 0 scher Basis e := , f := . 0 1 Konstruiert man wieder den symmetrischen Unterraum von V n , so ergibt sich die normierte Basis: ) ( 1 ea f b √ := √ e ∨ · · · ∨ e} ∨ |f ∨ ·{z (a + b = n) . (D.1) · · ∨ }f a! b! a! b! | {z a b n Dieser Unterraum Vsym ≤ V n besitzt die Dimension n + 1, seine Elemente werden Spinoren genannt. Um zur in der Quantenmechanik üblichen Formulierung zu gelangen, werden Parameter j := n/2 ( Spin“) und m ∈ {−j, −j + 1, . . . , j − 1, j} eingeführt und die Basisvektoren ” geschrieben als: ej+m f j−m |j, mi := p . (j + m)! (j − m)! 94 (D.2) D.4 Invariante Tensoren (3j-Symbole) Für j = 1 2 ergibt sich wieder der Raum V mit Basis {e = | 12 , 21 i, f = | 21 ,− 12 i} . Die natürliche Darstellung von SU (2) auf V kann als Basiswechsel interpretiert werden (A : e 7→ e0 = Ae), der das natürliche Skalarprodukt invariant lässt. Dieser Basiswechsel n kann für ein festes j auch auf den Raum Vsym ausgeweitet werden über die Relation: (e0 )j+m (f 0 )j−m . A|j, mi = |j, mi0 = p (j + m)! (j − m)! Diese neue Basis kann nach der alten entwickelt werden, die Entwicklungskoeffizienten hj, m0 |A|j, mi =: Djm0 ,m (A) bilden die Matrizen der Spin-Darstellung: ρj (A) = Djm0 ,m (A) m0 ,m . Diese Darstellungen sind irreduzibel und für j ∈ N sogar eine Darstellung von SO(3). Eine explizite Formel für die Spin-Darstellungsmatrizen ist (siehe [9]): p Djm0 ,m (A) = (j + m)! (j − m)! (j + m0 )! (j − m0 )! · . . . X (A1 )j+m−l (A1 )l (A2 )l+m0 −m (A2 )j−m0 −l 2 1 2 1 . 0 − m)! (j − m0 − l)! (j + m − l)! l! (l + m l D.4 Invariante Tensoren (3j-Symbole) In diesem Abschnitt sollen Tensoren gefunden werden, die mehrere Spin-Darstellungen verbinden“. Dazu ein paar Vorüberlegungen. ” Aus der Quantenmechanik ([26]) ist bekannt, dass ein System von 2 Teilchen mit Spin j = 21 nach einer gemeinsamen Eigenbasis von Drehimpulsoperatoren (Ĵ2 , Jˆz , Ĵ21 , Ĵ22 ) entwickelt werden kann. Diese Eigenbasis besteht aus drei Vektoren zum Gesamtspin j = 1, sowie einem Vektor zu j = 0. Allgemeiner ergeben sich gewisse Regeln, wie verschiedene Spins zu neuen gekoppelt werden können. Gruppentheoretisch ist dieses Beispiel so zu interpretieren: Zwei Spin-Darstellungen mit j = 12 auf V werden über das Tensorprodukt zu einer neuen Darstellung auf dem Produktraum V ⊗ V verbunden. Dieses ist nicht irreduzibel, zerfällt also in eine direkte Summe von kleineren Darstellungen, genauer in Darstellungen zu j = 0 und j = 1. Als symbolische Formel: 1 1 ⊗ = 0⊕1 . 2 2 95 D Spin-Darstellung der SU(2) Allgemein ergeben sich Regeln, wann eine Darstellung (als direkter Summand) in einem Tensorprodukt enthalten ist: Theorem 2 Für 3 Spins j1 , j2 , j3 ∈ N/2 ist die Spin-Darstellung von j3 genau dann als direkter Summand im Tensorprodukt der Darstellungen zu j1 und j2 enthalten, wenn die Clebsch-Gordon-Bedingungen gelten: • j1 + j2 + j3 ∈ N • (j1 + j2 ) ≥ j3 ≥ |j1 − j2 | (Dreiecksungleichung) Wenden wir uns den Tensoren zu. j 3 j j 1 2 Abbildung D.1: 3 Spin-Darstellungen treffen aufeinander Gegeben seien 3 Spin-Darstellungen ρ1 , ρ2 , ρ3 mit Spins j1 , j2 , j3 . Diese wirken auf drei Spinor-Räumen. Gesucht ist ein Tensor mit drei Indizes, gegen die drei Spinoren aus diesen Räumen kontrahiert werden können. Dieser Tensor soll invariant unter der Gruppenwirkung sein, d.h. ! T 0ijk := T abc ρ1 (g)ia ρ2 (g)jb ρ3 (g)kc = T ijk ∀g ∈ SU (2) . Dieser Tensor liegt im Tensorprodukt der Spinorräume und transformiert sich nach dem Tensorprodukt der 3 Darstellungen ( j1 ⊗j2 ⊗j3“). Die Forderung der Invarianz bedeutet, ” dass er sich nach der trivialen Darstellung (j = 0) transformiert, diese ist genau dann als direkter Summand in der Produktdarstellung j1 ⊗ j2 ⊗ j3“ enthalten, wenn j1 , j2 , j3 ” die obigen Clebsch-Gordon-Bedingungen erfüllen. Da der dazugehörige Unterraum 1dimensional ist, ist dieser Tensor bis auf einen skalaren Vorfaktor λ eindeutig. In [19] wird der invariante Tensor aus Epsilon-Symbolen konstruiert, da diese invariant unter der Fundamentaldarstellung von SU (2) sind. Er wird in der unsymmetrisierten Tensorbasis angegeben, indem a, b, c ∈ N gefunden werden, für die gilt: 2j1 = a + c , 2j2 = a + b , 2j3 = b + c . (D.3) Dies ist genau dann möglich, wenn die Clebsch-Gordon-Bedingungen erfüllt sind. In der unsymmetrisierten Tensorbasis sieht der Tensor wie folgt aus: 96 D.4 Invariante Tensoren (3j-Symbole) 2j 3 c b a 2j 2 2j1 Abbildung D.2: die Indexverknüpfungen der 3 Spin-Darstellungen Ti1 ...i2j1 ,k1 ...k2j2 ,l1 ...l2j3 = λ εi1 k1 . . . εia ka εia+1 l1 . . . εia+c lc εka+1 lc+1 . . . εka+b lc+b . | {z }| {z }| {z } j1 ↔j2 j1 ↔j3 j2 ↔j3 Jeder Spinorraum benötigt 2j Indizes. Von diesen werden nach (D.3) a Indizes zwischen den Spinorräumen von j1 und j2 mit Epsilon-Symbolen kontrahiert und entsprechend mit b und c. Die Tensorkomponenten können in der symmetrisierten Basis berechnet werden über: Tm1 m2 m3 := T (|j1 , m1 i, |j2 , m2 i, |j3 , m3 i) . Wird der noch unbestimmte Vorfaktor λ durch die Normierung X Tm1 m2 m3 T m1 m2 m3 = 1 mi festgelegt, so gelangt man zu den Wigner 3j-Symbolen: j1 j2 j3 Tm1 m2 m3 = . m1 m2 m3 In [7] ist eine explizite Formel angegeben: j1 j2 j3 m1 m2 m3 p = ∆(j1 , j2 , j3 ) f (j1 , m1 ) f (j2 , m2 ) f (j3 , m3 ) · . . . X k (−1)k+j1 −j2 −m3 k!(j1 +j2 −j3 −k)!(j3 −j2 +m1 +k)!(j2 +m2 −k)!(j1 −m1 −k)!(j3 −j1 −m2 +k)! mit den beiden Funktionen 97 D Spin-Darstellung der SU(2) (j1 + j2 − j3 )! (j2 + j3 − j1 )! (j3 + j1 − j2 )! (j1 + j2 + j3 + 1)! f (j, m) := (j − m)! (j + m)! . ∆(j1 , j2 , j3 ) := Beispiel 2j3=1 b=0 c=1 a=1 2j1 =2 2j2=1 Abbildung D.3: Beispielrechnung für j1 = 1, j2 = 21 , j3 = 1 2 Seien j1 = 1, j2 = 12 , j3 = 12 und somit a = 1, b = 0, c = 1 (siehe Abb. D.3), dann hat der Tensor in der unsymmetrisierten Basis die Form Ti1 ,i2 ,k,l = λ εi1 ,k εi2 ,l . Die symmetrischen Basisvektoren der Darstellungen sind nach (D.2): | 21 ,− 12 i = f | 21 , 12 i = e √ f ∨f |1, −1i = √ = 2 f ⊗ f 2 |1, 0i = e ∨ f = e ⊗ f + f ⊗ e e∨e √ |1, 1i = √ = 2 e ⊗ e . 2 Die einzigen Tensorkomponenten 6= 0 in der symmetrischen Basis sind: 98 D.5 6j-Symbole T1,− 1 ,− 1 = T (|1, 1i, | 21 ,− 12 i, | 21 ,− 12 i) 2 2 √ = λ 2 ε12 ε12 √ = 2λ = T−1, 1 , 1 2 2 T 0, 12 ,− 12 = T (|1, 0i, | 1 1 , 2 2 i, | 1 ,− 12 2 i) = λ (ε12 ε21 + ε21 ε11 ) = −λ = T0,− 1 , 1 . 2 2 Die Normierung ergibt 1 = |λ|2 (2 + 2 + 1 + 1) ⇒ |λ| = damit1 : √1 6 und die 3j-Symbole sind 1 1 1 1 1 1 12 2 2 2 = =√ 1 − 21 − 12 −1 12 12 3 1 1 1 1 1 1 2 2 1 2 2 = = −√ . 1 1 1 1 0 −2 2 0 2 −2 6 D.5 6j-Symbole Die 6j-Symbole entstehen durch Kontraktion von vier 3j-Symbolen. Wird jedes 3j-Symbol als Dreieck interpretiert, ergibt sich die Struktur eines Tetraeders. Die sechs Spinzahlen liegen dann auf den Kanten. Eine explizite Formel lautet (siehe [11]): p j1 j2 j3 = ∆(j1 , j2 , j3 )∆(j1 , j5 , j6 )∆(j4 , j2 , j6 )∆(j4 , j5 , j3 ) · . . . j4 j5 j6 X (t + 1)! Q (−1)t Q (t − v )! i i (pi − t)! i v ≤t≤p max min mit: ∆(a, b, c) := v1 v2 v3 v4 1 (a + b − c)! (b + c − a)! (c + a − b)! (a + b + c + 1)! = j1 + j2 + j3 = j1 + j5 + j6 = j4 + j2 + j6 = j4 + j5 + j3 p1 = j1 + j2 + j4 + j5 p1 = j1 + j3 + j4 + j6 p1 = j2 + j3 + j5 + j6 . Die Wahl der komplexen Phase λ = − √16 ist hierbei reine Konvention. 99 D Spin-Darstellung der SU(2) Für jedes Dreieck mit seinen 3 Spins gibt es einen ∆-Term. Außerdem ergibt die Summe der Spins für jedes Dreieck jeweils ein v. Die ps sind entsprechend die Summe der Spins auf geschlossenen Wegen über 4 Kanten. 100 E Einige Beweise E.1 Wichtige Hilfsformeln Epsilon-Symbol Das Epsilon-Symbol (auch Levi-Civita-Symbol genannt) ist in 4 Dimensionen definiert durch εIJKL = −εIJKL wenn IJKL gerade Permutation 1 = −1 wenn IJKL ungerade Permutation 0 sonst. Das Minuszeichen für das kovariante Symbol ist Konvention und erlaubt es, die Indizes wie üblich über den metrischen Tensor zu heben und zu senken: εIJKL = εABCD η AI η BJ η CK η DL = −εIJKL ⇒ ε0123 = ε0123 η 00 η 11 η 22 η 33 = ε0123 (−1) (+1) (+1) (+1) = −ε0123 . Es erfüllt folgende Relationen: N M L N M L − εAIJK εALM N = δIL (δJM δK − δJN δK ) + δIM (δJN δK − δJL δK ) + δIN (δJL δK − δJM δK ) (E.1) εABCI εABCJ = −6 δIJ (E.2) εABCI η Aà η B B̃ η C C̃ εÃB̃ C̃J = −6 ηIJ . (E.3) Gleichungen (E.1) und (E.2) folgen aus der Determinanten-Schreibweise des EpsilonSymbols. (E.2) lässt sich aber auch leicht nachrechnen: Die linke Seite ist nur 6= 0 für I = J und die Permutationen der restlichen Indizes heben sich gegenseitig auf. Gleichung (E.3) folgt dann aus (E.2) durch Senken der Indizes und unter Ausnutzung der Eigenschaft, dass (ηIJ ) und (η IJ ) zueinander inverse Matrizen sind. 101 E Einige Beweise Duale Basisformen Die Komponenten der 3-Form eI ∧eJ ∧eK erhält man durch einsetzen der entsprechenden Basisvektoren. Hierbei wird die Beziehung eI (eJ ) = δJI der Dualbasis ausgenutzt und über alle Permutationen der eingesetzten Vektoren summiert. Das Ergebnis ist die rechte Seite von (E.1), somit ist es auch gleich der linken Seite: eI ∧ eJ ∧ eK LM N = eI ∧ eJ ∧ eK (eL , eM , eN ) J K δN + . . . = δLI δM = −εIJKA εLM N A . Mit (B.2) und hiervon: p p | det η| = | − 1| = 1 folgt für die Komponenten der dualen 1-Form 1 (E.3) ?(eI ∧ eJ ∧ eK )L = − εABCL η Aà η B B̃ η C C̃ εIJKD εÃB̃ C̃D = ηLD εIJKD 3! und die duale 1-Form ist gegeben durch ? (eI ∧ eJ ∧ eK ) = εIJKA ηAB eB . (E.4) E.2 Feldgleichungen im Cartan-Formalismus Es sollen die Vakuum-Feldgleichungen in Cartan-Schreibweise A εABCI e ∧ R BC 2 − λeA ∧ eB ∧ eC 3 =0 (E.5) wieder auf die übliche Schreibweise zurückgeführt werden. Durch Dualisieren erhält man die äquivalenten Gleichungen 2 A A BC B C ? εABCI e ∧ R − λe ∧ e ∧ e =0. 3 (E.6) Der Stern-Operator ist linear und kann einzeln auf die beiden Terme angewandt werden: 102 E.2 Feldgleichungen im Cartan-Formalismus Kosmologischer Term TICosm 2 A B C := ? εABCI − λ (e ∧ e ∧ e ) 3 2 = − λ εABCI ? (eA ∧ eB ∧ eC ) linear 3 2 = − λ εABCI εABCD ηDE eE mit (E.4) 3 2 = λ 3! δID ηDE eE mit (E.2) 3 = 4λ ηIA eA Krümmungs-Term TICurv := ? εABCI (eA ∧ RBC ) = εABCI ? (eA ∧ RBC αβ dxα ∧ dxβ ) = εABCI RBCαβ eαD =: εABCI RBCDE eβE A D Def. Krümmungsform E ? (e ∧ e ∧ e ) Basiswechsel A ? (e ∧ eD ∧ eE ) = εABCI RBCDE ηF G εADEF eG mit (E.4) Mit (E.1) folgt hieraus = − δBD (δCE δIF − δCF δIE ) + δBE (δCF δID − δCD δIF ) + δBF (δCD δIE − δCE δID ) RBCDE ηF G eG = −RBCBC ηIA + RBCBI ηCA − RBCIB ηCA + RBCCB ηIA −RBCCI ηBA + RBCCI ηBA eA . In dieser Summe gibt es nun 2 Terme mit einem doppelt kontrahierten R und 4 Terme mit einfach kontrahiertem R. Für die Symbole mit doppelter Kontraktion gilt: RABAB := RABαβ eαA eβB = η BC RACαβ eαA eβB = η BC (eγA eδC Rγδαβ )eαA eβB mit (2.5) = (eγA eαA ) (eβB η BC eγC )Rγδαβ = (δγα ) (g βσ )Rγδαβ Inverse, (2.3) = g βδ Rαδαβ = g βδ Rδβ =R Def. Ricci-Tensor Def. Krümmungsskalar. 103 E Einige Beweise Mit ähnlichen Schritten folgt für die einfach kontrahierten Terme: RABAI ηBC eC = Rαβ eαA eβI eA . Der gesamte Krümmungsterm besteht nun aus 4 einfach und 2 doppelt kontrahierten Termen: TICurv = −4Rαβ eαA eβI eA + 2R ηIA eA . Zusammengesetzt Setzt man alle Terme zusammen, so ergibt sich als Umformung von (E.6): 0 = TICurv + TICosm ⇔ 0 = 4Rαβ eαA eβI eA − 2R ηIA eA + 4λ ηAI eA ⇔ 0 = 4Rαβ eαJ eβI − 2R ηIJ + 4λ ηJI 1 ⇔ 0 = Rαβ eαJ eβI − R ηIJ + λ ηJI 2 1 α β ⇔ 0 = (Rαβ e J e I − R ηIJ + λ ηJI ) eµJ eνI 2 1 ⇔ 0 = Rµν − R gµν + λgµν . 2 Komponente J (Es schien sinnvoller, in der vorletzten Zeile die Indizes I, J nicht umzubenennen, obwohl sie in dieser Zeile zu internen Summationsindizes wurden.) E.3 Wirkungsfunktional Die Komponenten der Krümmungsform: 4d F i i ⇒ Fµν Nun zur Wirkung (2.9): 104 1 = d4d Ai + εi ab 4d Aa ∧ 4d Ab 2 1 i = d(Aα dxα ) + εi ab (Aα a dxα ) ∧ (Aβ b dxβ ) 2 1 i i = (∂α Aβ + ε ab Aα a Aβ b )dxα ∧ dxβ 2 = ∂µ Aν i − ∂ν Aµ i + εi ab Aµ a Aν b . (E.7) E.3 Wirkungsfunktional S[4d Σ, 4d A] = = = = Z −i c3 16πG Z −i c3 16πG Z −i c3 8πG Z −i c3 8πG 3 = −i c 8πG −i c3 = 8πG 4d Σa ∧ 4d F a a α β Σa αβ Fγδ ∧ dxγ ∧ dx}δ |dx ∧ dx {z =εαβγδ d4 x a a ) εbcd d4 x + Σa 0b Fcd (Σa bc F0d a a E d a (Ȧd − ∂d A0 a + εa bc A0 b Ad c ) + PAB e0A ebB Fa cd εbcd d4 x mit (2.10) und (E.7) 1 a e f 0 a bcd d4 x . . . + (−ε ef e0 eb + i e0 eb ) Fa cd ε 2 Z Z E d a Ȧd a − E d a ∂d A0 a + A0 b E d a εa bc Ad c | {z } | {z } | {z } (1) (2) (3) 1 1 a bcd − e0 e εaef eb f Fcd ε + i e0 0 eb a Fa cd εbcd d4 x . | {z } {z } 2 2 | (4) (5) Term 2 Mit partieller Integration folgt: Z d a 4 −E a (∂d A0 ) d x = Z (∂d E d a )A0 a d4 x + Randterme . Für eine kompakte Mannigfaltigkeit oder eine im Unendlichen verschwindende Krümmung verschwinden auch die Randterme. Term 2+3: Beide Terme zusammen ergeben eine kovariante Ableitung: A0 a ∂d E d a + A0 b E d a εa bc Ad c = A0 a (Dd E d a ) . 105 E Einige Beweise Term 4 1 0 0 a εa0 i0 f (E e a ee a )(E g i eg i ) eb f εbcd Fcd 2 det(e) 1 0 0 a = εa0 i0 f ee a eg i eb f E e a E g i εbcd Fcd 2 {z } det(e) | a = εaif eb f εbcd Fcd mit (2.14) =det(e)εegb 1 a (δ c δ d − δgc δed )E e a E g i Fcd det(e) e g 2 a E d i E c a Fcd = det(e) = F ist antisym. Term 5 1 0 0 εbc d eb a (ec0 e E c e )(ed0 f E d f )Fa cd 2 det(e) 1 0 0 εbc d eb a ec0 e ed0 f E c e E d f Fa cd = 2 {z } det(e) | eb a Fa cd εbcd = mit (2.14) =det(e)εaef = 1 εabc E e b E f c Fa ef det(e) Zusammengesetzt Die Felder A0 i , e0 0 , e0 i können für jeden 3-dimensionalen Raum beliebig durch Eichung gewählt werden. Somit sind sie keine dynamischen Variablen und können als LagrangeMultiplikatoren verwendet werden. Um diese Rolle zu verdeutlichen, werden die Felder geschrieben als λi0 := A0 i , λ := e0 0 , λi := e0 i . Damit ergeben alle Terme zusammen: −i c3 S[4d Σ, 4d A] = 8πG Z a E b a Ȧb + λa0 (Db E b a ) + λc (E b a Fbca ) + λ(εabc E e b E f c Fa ef ) d4 x . E.4 Graphische Notation Die Rechnungen im letzten Abschnitt wirken durch ihre große Anzahl an Indizes teilweise recht unübersichtlich. Auch der Weg ihrer Herleitung war nicht immer offensichtlich. Deshalb hat sich im Laufe der Rechnungen für diese Arbeit eine Schreibweise entwickelt, die den Umgang mit großen Tensortermen stark vereinfacht. Leider ist diese Schreibweise 106 E.4 Graphische Notation schon von Penrose und anderen entwickelt worden und wird allgemein die PenroseNotation genannt1 . Die Schreibweise entstand aus der Angewohnheit, in größeren Termen diejenigen Indizes mit Linien zu verbinden, über die summiert wird. Im nächsten Schritt wurden die Indizes weggelassen und die Tensorsymbole so auf dem Papier angeordnet, dass sich die Verbindungslinien entwirren. Dadurch entsteht ein intuitiver Eindruck der Topologie“ ” des Terms. Kontra- bzw. Kovariante Vektoren V i bzw. Wi nehmen folgende Form an: W V . Ein oben stehender Index ergibt einen von der Oberseite des Symbols ausgehenden Verbindungsstrich und für unten stehende entsprechend von unten ausgehend. Die Punkte an den Enden der Striche symbolisieren die nicht kontrahierten Indizes. Das Skalarprodukt zweier Vektoren V a Wa = V a gab W b wird dann einfach als Verbindung der bisher offenen Striche dargestellt: W V = V W . Das Epsilon-Symbol εijk wird abgekürzt durch: . Es erfüllt die Identitäten εabc εabc = 6 , εiab εabj = 2δij , εija εakl = δki δlj − δli δkj : = 2 = 6 = − . 1 Der Autor war sich zum Zeitpunkt seiner Entdeckung zwar schon über die Existenz der PenroseNotation für Spinoren und Spin-Netzwerke bewusst, kannte aber noch nicht ihre allgemeine Anwendung auf multilineare Algebra. 107 E Einige Beweise Für eine Matrix M i j kann damit über εabc M a i M b j M c k = det(M )εijk die Determinante ausgedrückt werden: M M = det(M) M . Die Definition des elektrischen Feldes (2.10) wird zu: E := 1 2 e e . Unter Ausnutzung des obigen Ausdrucks für die Determinante über Epsilon-Symbole und deren Kontraktionen wird die Identität (2.14) von E sofort ersichtlich: e = E 1 2 e e e = det(e) 2 = det(e) . Leicht einzusehen ist auch, dass diese Identität ebenso bei Vertauschung von e und E gilt. Die Eleganz und Einfachheit dieser Schreibweise soll am Beispiel der Berechnung von Term (5) aus dem letzten Abschnitt demonstriert werden: F F e F = 1 det(e)2 e E E e e = 1 det(e) E E . Bei dieser Berechnung war das Ziel, auftretende e-Felder zu eliminieren und durch EFelder zu ersetzen. Das einzig vorhandene e-Feld ist direkt an ein ε gebunden. Somit liegt es nahe, die Determinantenformel für auszunutzen und dazu 2 weitere e-Felder an die anderen beiden Verbindungsstellen des Epsilon-Symbols zu setzen. Dies kann über die Identität des E-Feldes geschehen. 108 Literaturverzeichnis [1] A. V. Ashtekar. New variables for classical and quantum gravity. Phys. Rev. Lett. 57, 57:2244 – 2247, 1986. [2] A. V. Ashtekar and M. Bojowald. Quantum geometry and the schwarzschild singularity. arXiv:gr-qc/0509075v1, 2005. [3] J. W. Barrett and L. Crane. Relativistic spin networks and quantum gravity. arXiv:gr-qc/9709028v2, 1998. [4] J. W. Barrett and I. Naish-Guzman. The Ponzano-Regge model. arXiv:0803.3319v2 [gr-qc], 2009. [5] H. Baum. Eichfeldtheorie. Springer-Verlag, 2009. [6] J. D. Bekenstein. Black holes and information theory. arXiv:quant-ph/0311049v1, 2003. [7] J. P. M. Flude. The Edmonds asymptotic formulae for the 3j and 6j symbols. arXiv:physics/9710037v1, 1997. [8] W. A. Friedman, H. Feshbach, and F. Bloch. Spectroscopic and Group Theoretical Methods in Physics, Racah Memorial Volume. 1968. [9] R. Gilmore. Lie Groups, Lie Algebras, and Some of Their Applications. John Wiley & Sons, Inc, 10th edition, 1974. [10] E. Gourgoulhon. 3+1 formalism and bases of numerical relativity. qc/0703035v1, 2007. arXiv:gr- [11] R. Gurau. The Ponzano-Regge asymptotic of the 6j symbol: an elementary proof. arXiv:0808.3533v1, 2008. [12] K. Krasnov. Plebanski formulation of general relativity: A practical introduction. arXiv:0904.0423v1 [gr-qc], 2009. [13] W. Kühnel. Differentialgeometrie. Vieweg, 3rd edition, 1999. [14] S. Mercuri. Fermions in Ashtekar-Barbero connections formalism for arbitrary values of the Immirzi parameter. arXiv:gr-qc/0601013v2, 2006. 109 [15] C. Misner, K. S. Thorne, and J. A. Wheeler. Gravitation. W. H. Freeman and Company, 1973. [16] H. Nicolai and K. Peeters. Loop and spin foam quantum gravity: A brief guide for beginners. arXiv:hep-th/0601129v2, 2006. [17] A. Perez. Spin foam models for quantum gravity. arXiv:gr-qc/0301113v2, 2003. [18] A. Perez. Introduction to loop quantum gravity and spin foams. qc/0409061v3, 2004. arXiv:gr- [19] C. Rovelli. Quantum Gravity. Cambridge University Press, 2004. [20] L. Smolin. An invitation to loop quantum gravity. arXiv:hep-th/0408048v3, 2005. [21] E. Teufel. Riemannsche Geometrie (Vorlesungsscript). 2007. [22] T. Thiemann. Lectures on loop quantum gravity. arXiv:gr-qc/0210094v1, 2002. [23] T. Thiemann. The phoenix project: Master constraint programme for loop quantum gravity. arXiv:gr-qc/0305080v1, 2003. [24] H.-R. Trebin. Gruppentheoretische Methoden in der Physik (Vorlesungsscript), 2004. [25] C. von Westenholz. Differential Forms in Mathematical Physics. North-Holland Publishing Company, 1978. [26] G. Wunner. Quantenmechanik 2 (Vorlesungsscript). 2006. 110 Danksagung Ich möchte mich bei all den Personen bedanken, die mir während meiner Diplomarbeit und auch schon davor sehr geholfen haben. Dazu zählen unter anderem: • Herr Prof. Dr. Wunner für die erstaunliche Freiheit, die er mir bei der Wahl meiner Arbeit ließ und für die motivierende Unterstützung, die er mir zukommen ließ • Dem Institut für das hervorragende Arbeitsklima • Dr. Holger Cartarius für seine großen Dienste bei der Aufzucht und Pflege der Computerherde • Vor allem meinen Zimmerkollegen Poulcheria Christou und Axel Keller sowie Kilian Rambach für die zahllosen und fruchtbaren Diskussionen über physikalische und unphysikalische Themen, die seelische Unterstützung und sonstige Ablenkungen vom tristen Alltag • Philippe Suchard, Edouard de Beukelaer, Gottlieb Anton Gries und zahllosen weiteren für wichtige Beiträge auf dem Gebiet der Zuckerverarbeitung 111