Numerische Simulationen zu Quantenschaum-Modellen

Werbung
Numerische Simulationen zu
Quantenschaum-Modellen
Diplomarbeit von
Michael Ankele
3. November 2009
Hauptberichter: Prof. Dr. Günter Wunner
Mitberichter: Prof. Dr. Günter Haag
1. Institut für Theoretische Physik
Universität Stuttgart
Pfaffenwaldring 57, 70550 Stuttgart
Ehrenwörtliche Erklärung
Ich erkläre, dass ich diese Arbeit selbständig verfasst und keine anderen als die angegebenen Quellen und Hilfsmittel benutzt habe.
Stuttgart, 3. November 2009
Michael Ankele
Inhaltsverzeichnis
1 Einleitung
1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Aufbau der Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Theoretische Vorbereitungen
2.1 Relativitätstheorie . . . .
2.2 Cartan-Formalismus . . .
2.3 Ashtekar-Zusammenhang .
2.4 Kanonische Beschreibung .
1
1
2
.
.
.
.
5
5
7
10
12
.
.
.
.
.
15
15
17
22
27
29
4 Spin-Schaum Modelle
4.1 Kanonisch aus der Loop-Quantengravitation . . . . . . . . . . . . . . . .
4.2 Ponzano-Regge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Barrett-Crane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
31
33
36
5 Erzeugung von Gittern
5.1 Topologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Gitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
39
41
6 Simulationen - Statik
6.1 Zustandssumme der 3-Sphäre . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Näherung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3 Numerisches Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . .
47
47
49
51
7 Simulationen - Dynamik
7.1 Dynamische Näherung . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Eingeschränkte Dynamik . . . . . . . . . . . . . . . . . . . . . . . . . . .
59
59
66
3 Loop-Quantengravitation
3.1 Quantisierung . . . .
3.2 Spin-Netzwerke . . .
3.3 Operatoren . . . . .
3.4 Hamilton-Operator .
3.5 Aussagen . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
v
Inhaltsverzeichnis
8 Zusammenfassung und Ausblick
8.1 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2 Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
77
77
A Riemannsche Geometrie
A.1 Mannigfaltigkeiten . . . . . . .
A.2 Tangentialraum . . . . . . . . .
A.3 Metrik . . . . . . . . . . . . . .
A.4 Zusammenhang und Krümmung
.
.
.
.
79
79
80
81
81
B Differentialformen
B.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B.2 Hodge-Dualität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B.3 Äußere Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
85
87
87
C Lie-Gruppen und -Algebren
C.1 Lie-Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C.2 Haar-Maß . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89
89
91
D Spin-Darstellung der SU(2)
D.1 Darstellungen von Gruppen . . .
D.2 Tensorprodukt-Basen . . . . . . .
D.3 Spin-Darstellungen . . . . . . . .
D.4 Invariante Tensoren (3j-Symbole)
D.5 6j-Symbole . . . . . . . . . . . . .
.
.
.
.
.
93
93
94
94
95
99
.
.
.
.
101
101
102
104
106
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
E Einige Beweise
E.1 Wichtige Hilfsformeln . . . . . . . . . . .
E.2 Feldgleichungen im Cartan-Formalismus
E.3 Wirkungsfunktional . . . . . . . . . . . .
E.4 Graphische Notation . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Literaturverzeichnis
109
Danksagung
111
vi
1 Einleitung
1.1 Motivation
Quantenmechanik und allgemeine Relativitätstheorie brachten vor etwa einhundert Jahren einen großen Umbruch in die Welt des physikalischen Denkens. Beide bilden Verallgemeinerungen und fundamentale Umformulierungen klassischer Sichtweisen und wurden
in ihrem jeweiligen Gültigkeitsbereich hervorragend bestätigt. Dennoch scheiterten bislang noch alle Bestrebungen, eine vollständige Vereinigung beider Theorien zu finden.
In den 1960er Jahren wurde fieberhaft versucht, die bewährten Methoden der kanonischen Quantisierung auf die Gravitation anzuwenden. Aber schon in den 1970ern wurde
entdeckt, dass die konstruierten Theorien nicht renormierbar sind. Änderungen der klassischen Theorie um dieses Problem zu beseitigen mündeten in der Stringtheorie. Sie gilt
seither als vielversprechendster Kandidat für die Beschreibung einer Quantengravitation. Allerdings kamen trotz zahlreicher Fortschritte auch einige Gegenargumente auf.
Zum einen ist sie bisher nur als Störungstheorie formuliert. Es fehlt noch immer ein
einheitliches und zu Grunde liegendes Gerüst. Zum anderen sieht sie die dynamische
Metrik relativ zu einer Hintergrund-Metrik des flachen Minkowski-Raum. Man sagt, sie
sei nicht Hintergrund-unabhängig. Ein weiterer Kritikpunkt ist, dass die Theorie eine
höhere Zahl von Dimensionen fordert, als bisher beobachtet wurden. Auch lässt sich
eine immense Zahl von möglichen Stringtheorien konstruieren und es besteht noch Unklarheit darüber, ob eine davon in Einklang mit unserer Welt ist, und falls ja, wodurch
sich diese auszeichnet.
Einen alternativen Zugang zur Vereinheitlichung bildet die Loop-Quantengravitation.
Abhay Ashtekar entwickelte 1986 eine Formulierung der klassischen Relativitätstheorie, die auf dem Zusammenhang statt der Metrik beruht[1]. Erste Quantisierungsversuche mit Hilfe der Wheeler-DeWitt-Gleichung zeigten, dass einfache Lösungen in Form
sogenannter Wilson-Loops existieren. Diese beschreiben eine Feldanregung des Zusammenhangs entlang einer geschlossenen Kurve und gaben der Theorie ihren Namen. Eine
Verallgemeinerung dieses Konzepts führte zu den Spin-Netzwerken. Sie sind als SpinDarstellungen auf beliebigen Graphen definiert und wurden schon vorher von Roger Penrose eingeführt, um einen diskreten Raum zu beschreiben, der durch die Richtungsquantelung von Drehimpulsoperatoren entsteht.
Die Loop-Quantengravitation ist enger mit der Relativitätstheorie und ihren Grundideen
verbunden. So ist sie unabhängig von jeglichem Hintergrundfeld und diffeomorphismusinvariant. Sie zeichnet sich auch durch ihre mathematische Rigerosität aus. Darüber
1
1 Einleitung
hinaus macht sie die erstaunliche Vorhersage, dass die Geometrie auf der Planck-Skala
diskret ist. Dies erlaubt z.B. den leichteren Umgang mit klassischen Divergenzen in der
Raumzeit[2], wie sie in schwarzen Löchern oder dem Urknall auftreten.
Allerdings ist die Theorie noch nicht vollständig. So wird noch nach einem HamiltonOperator für die Zeitentwicklung gesucht. Wegen Uneindeutigkeit der Quantisierung
wurden bisher mehrere mögliche Operatoren vorgeschlagen und kontrovers diskutiert[23,
22]. Eine weitere offene Frage ist, ob die Theorie im klassischen Grenzfall die bekannte
Relativitätstheorie wiedergibt. Darüber hinaus entziehen sich wie bei der Stringtheorie
die Vorhersagen noch den experimentellen Möglichkeiten.
Ein sehr eng mit der Loop-Quantengravitation verbundenes Konzept ist das des SpinSchaums. Dieser wurde zuerst 1968 von Tullio Regge und Giorgio Ponzano als Pfadintegral-Quantisierung in drei Dimensionen vorgeschlagen[8]. Ende der 1990er Jahre kamen weitere Modelle für den 4-dimensionalen Fall hinzu. Zu den bekanntesten darunter
zählt das Barrett-Crane-Modell[3]. Auch einige unabhängig hiervon entstandene Theorien lassen sich in diesem Formalismus beschreiben. Dazu zählen die Summen über
Raumzeiten von Stephen Hawking sowie die von Edward Witten eingeführte Gruppenfeldtheorien.
1.2 Aufbau der Arbeit
Die ersten drei Kapitel erklären die für diese Arbeit nötige, physikalische Theorie:
Kapitel 2 befasst sich mit der allgemeinen Relativitätstheorie als klassische Eichtheorie
und bildet die Vorbereitung zur Quantisierung. Es werden schrittweise neue Variablen
eingeführt und eine kanonische Formulierung vorgestellt. Zwischenschritte bilden dabei
die Tetrad-Basen von Cartan und der Ashtekar-Zusammenhang.
Das dritte Kapitel stellt die Loop-Quantengravitation als kanonische Quantisierung vor.
Spin-Netzwerke werden eingeführt und ihre Bedeutung als Basisvektoren der Zustände
verdeutlicht. Dazu wird gezeigt, wie die Zwangsbedingungen auf diesen Netzen zu implementieren sind. Als direkte Folge wird das diskrete Spektrum des Operators für den
Flächeninhalt hergeleitet und Konsequenzen dieser quantisierten Geometrie beschrieben.
Auch auf Probleme der Definition und mögliche Wirkungen eines Hamilton-Operators
wird eingegangen.
Als nächstes wird die Theorie auf sogenannte Spin-Schaum-Modelle ausgeweitet. Diese
bilden eine kovariante Beschreibung der Quantentheorie und können als eine diskrete
Form der Pfadintegrale angesehen werden. Es werden zwei dieser Modelle vorgestellt:
Das erste ist das Ponzano-Regge-Modell der 3-dimensionalen Gravitation. Es beruht auf
einer Quantisierung des Regge-Kalküls, also der Triangulierung der Raumzeit. Dieses
Modell wird später in den Simulationen verwendet. Das zweite Modell ist das BarrettCrane-Modell und beschreibt die Quantentheorie für den 4-dimensionalen Fall.
In den nächsten drei Kapiteln wird dann auf die numerischen Verfahren eingegangen:
2
1.2 Aufbau der Arbeit
Zuerst werden Möglichkeiten zur Erzeugung von Triangulierungen in verschiedenen Dimensionen und mit unterschiedlichen Topologien beschrieben.
Kapitel 6 stellt das Verfahren vor, mit dem Zustandssummen im Ponzano-Regge-Modell
berechnet werden sollen. Da sich diese Aufgabe als numerisch schwierig erweist, sind
dazu mehrere Näherungen nötig. Auch Versuche, die dadurch entstehenden Fehler zu
beseitigen, werden diskutiert.
Das letzten Kapitel befasst sich mit der Möglichkeit, Zustandssummen in einer Art Zeitentwicklung zu berechnen. Dazu wird die Raumzeit entlang einer Zeit“-Achse in Raum”
schichten unterteilt, für die dann iterativ eine Lösung gesucht wird. Zwei verschiedene
Zeitentwicklungen werden vorgestellt, die sich aus unterschiedlichen Vereinfachungen
ergeben.
3
1 Einleitung
4
2 Theoretische Vorbereitungen
Bevor im nächsten Kapitel die eigentliche quantenmechanische Theorie besprochen werden kann, sollte zunächst auf die klassische Theorie eingegangen werden. Vor allem ist
es für die Quantisierung, wie sie in der Loop-Quantengravitation erfolgt, nötig, die Einsteinschen Feldgleichungen auf eine dafür praktischere Form zu bringen.
Zuerst werden die Feldgleichungen in den Tetrad-Formalismus von Cartan übersetzt und
durch die Variablen des Tetradfeldes und des Zusammenhangs beschrieben. Diese ersetzen die in der Literatur übliche Metrik. Um die Theorie dann kanonisch quantisieren zu
können, wird sie als Hamilton-Mechanik geschrieben, wozu die 4-dimensionale Raumzeit
in einen 3-dimensionalen Raum und dessen Zeitentwicklung übersetzt wird.
Diese Arbeit hält sich dabei an das Vorgehen in [20].
Zur Schreibweise:
• griechische Kleinbuchstaben (µ, ν, ρ = 0, 1, 2, 3) beschreiben Tensorkomponenten im Tangentialraum
• lateinische Großbuchstaben (I, J, K = 0, 1, 2, 3) in einem Lorentzsystem
• lateinische Kleinbuchstaben (i, j, k, i, j, k = 1, 2, 3) im (3-dimensionalen) Raum;
dabei wird hier zwischen Raumkomponenten aus dem Tangentialraum (i, j, k) und
aus einem Lorentzsystem (i, j, k) unterschieden
• in der Hoffnung die Lesbarkeit zu erhöhen sind interne Indizes (über die summiert
wird) vom Anfang der Alphabete gewählt (α, β, A, B, a, b), externe dagegen aus
der Mitte (µ, ν, I, J, i, j)
Eine kleine Zusammenfassung der Riemannschen Geometrie ist in Anhang A (Seite 79)
zu finden, für Differentialformen in Anhang B (Seite 85).
2.1 Relativitätstheorie
Die spezielle Relativitätstheorie vereint die Konzepte von Raum und Zeit, die vorher
als unabhängig voneinander angesehen wurden, in einem einzigen Objekt, der Raumzeit. Ein fundamentales Prinzip der Theorie ist die Unabhängigkeit der physikalischen
Gesetze vom Inertialsystem des Beobachters. Mathematisch entspricht das der Invarianz der Gesetze unter Koordinatentransformation des 4-dimensionalen Vektorraums der
Raumzeit.
5
2 Theoretische Vorbereitungen
Die allgemeine Relativitätstheorie1 weitet dieses Konzept noch aus und erlaubt die
Beschreibung physikalischer Vorgänge in einer gekrümmten Raumzeit. Inertialsysteme
existieren dabei nur noch lokal und entsprechen frei fallenden Beobachtern, die sich entlang geodätischer Kurven bewegen.
Große Eleganz offenbart die Theorie bei der Beschreibung der Gravitation. Quellen des
Gravitationsfeldes werden hier als Quellen der Raumzeit-Krümmung interpretiert. Die
gravitative Wechselwirkung der Körper untereinander folgt dann rein aus der geodätischen Bewegung.
Quantitativ wird die Erzeugung von Krümmung durch die Einsteinschen Feldgleichungen
beschrieben. In der üblichen Notation der Riemannschen Geometrie lauten diese:
8πG
1
(2.1)
Rµν − R gµν + Λ gµν = 4 Tµν
2
c
(die griechischen Indizes µ, ν beschreiben die Tensor-Komponenten im Tangentialraum
mit der üblichen Basis {∂µ =: eµ } und deren Dualbasis {dxµ }).
Anschaulich stehen auf der rechten Seite die physikalischen Größen, die die Gravitation erzeugen: Massenströme und sonstige Energieformen. Die linke Seite beschreibt die
Krümmung der Raumzeit. Die kosmologische Konstante Λ ist hierbei ein freier Parameter der Theorie und wird erst durch astronomische Beobachtungen abgeschätzt.
In diesem Formalismus ist das Metrikfeld gµν die zentrale Größe und es werden folgende,
daraus abgeleitete Größen definiert2 :
Γρµν
1
:= g ρα (−∂α gµν + ∂µ gνα + ∂ν gαµ )
2
Christoffelsymbole
Rµνρσ := ∂ρ Γµνσ − ∂σ Γµνρ + Γανσ Γµαρ − Γανρ Γµασ
Krümmungstensor
Rµν
:= Rαµαν
Ricci-Tensor
R
:= Rαα = g αβ Rβα
Krümmungsskalar.
Für die spätere Beschreibung durch Differentialformen sind noch wichtig:
1
2
6
ω µ ν := Γµαν dxα
Zusammenhangs-(1-)formen
Ωµ ν := dω µ ν + ω µ α ∧ ω α ν = Rµναβ dxα ∧ dxβ
Krümmungs-(2-)formen.
Von nun an sei mit Relativitätstheorie“ immer die allgemeine Version gemeint.
”
Im Anhang A (Seite 79) werden diese Größen genauer besprochen.
2.2 Cartan-Formalismus
Die Christoffelsymbole Γρµν (damit gleichbedeutend die Zusammenhangsformen ω µ ν )
definieren die kovariante Ableitung, also die Ableitung eines Vektorfeldes in Richtung
eines zweiten. In Koordinatenschreibweise:
∇µ V ν = ∂µ V ν + Γνµα V α .
Eine wichtige Folgerung aus der Riemannschen Geometrie ist, dass die Christoffelsymbole
eindeutig aus den Forderungen der Torsionsfreiheit (Γρµν = Γρνµ ) sowie
0 = ∇ρ gµν = ∂ρ gµν − Γαρµ gαν − Γαρν gµα
(2.2)
(der Verträglichkeit mit der Metrik) bestimmt werden können.
Es sei noch erwähnt, dass die Einsteinschen Feldgleichungen für eine gegebene Massenverteilung keine eindeutige Lösung für das Metrikfeld besitzen. Zunächst tritt in (2.1)
nicht der komplette Krümmungstensor auf, sondern nur der Ricci-Tensor. An die übrigen Formen der Krümmung (diese entsprechen dem Weyl-Tensor) werden lokal keine
Forderungen gestellt3 . Darüber hinaus kann jede gefundene Lösung durch Koordinatentransformation und Diffeomorphismen in eine neue Lösung überführt werden. Diese
Transformationen ändern nichts an physikalischen Aussagen und werden als Eichtransformationen bezeichnet.
2.2 Cartan-Formalismus
Tetrade
Es lässt sich für jeden Punkt auf der Raumzeit-Mannigfaltigkeit eine Orthonormalbasis
(genauer eine Lorentzbasis) wählen mit den Basisvektoren eI (x) := eαI (x)∂α (Tetrade
oder begleitendes 4-Bein genannt) mit einer ortsabhängigen Transformationsmatrix eµI (x)
und deren Inversen eµI (große lateinische Indizes bezeichnen Komponenten in einem Lorentzsystem). Die Dualbasis dazu sei eI = eαI dxα .
Nach Konstruktion nimmt in dieser Basis die Metrik die Form
(ηIJ ) = Diag(−1, 1, 1, 1)
an, wie sie aus der speziellen Relativitätstheorie bekannt ist4 . Lorentzindizes können mit
dieser Metrik gehoben oder gesenkt werden.
Es gilt:
3
Man sagt, die Theorie habe lokale Freiheitsgrade. Diese bilden z.B. die Grundlage für Gravitationswellen. In Dimensionen kleiner 4 verschwindet der Weyl-Tensor und damit auch jeder dieser Freiheitsgrade. Die Theorie wird dann als topologisch“ bezeichnet.
”
4
In der Literatur ist auch Diag(1, −1, −1, −1) üblich. Es wird aber im Folgenden einfacher sein, mit
dieser Konvention zu rechnen, weil sich so die euklidische Metrik δij für Raumkomponenten ergibt.
7
2 Theoretische Vorbereitungen
Abbildung 2.1: Natürliche Koordinaten-Basis (schwarz) und eine mögliche Cartansche
Tetradbasis (blau)
hV, W i = VA W A = V A ηAB W B = (V α eαA ) ηAB (eβB W β )
= Vα W α = V α gαβ W β
und somit
gµν = eµA ηAB eνB .
(2.3)
Zusammenhang
Für diese Tetrad-Basisfelder kann wieder eine kovariante Ableitung definiert werden
∇µ V I = ∂µ V I + ωµIA V A
mit matrixwertigen Zusammenhangsformen (= eine Matrix von 1-Formen)
ω IJ = ωα IJ dxα .
Dieser Zusammenhang wird oft als Spin-Zusammenhang bezeichnet.
Der Zusammenhang beschreibt, wie sich die Tetrad-Basisvektoren von einem Punkt der
Mannigfaltigkeit zu einem benachbarten ändern. Da die Basen aber als Lorentzsysteme angenommen wurden, erfolgt die Änderung über die Lorentz-Transformationen
(SO(3, 1)). Die ω IJ ergeben sich als die infinitesimalen Transformationen, nehmen also
Werte in der Lie-Algebra so(3, 1) an.
8
2.2 Cartan-Formalismus
Abbildung 2.2: Der Übergang von einer Tetradbasis in die eines benachbarten Punktes
geschieht über Rotationen (bzw. Lorentz-Transformationen)
Wie oben beschrieben, wird der Zusammenhang eindeutig aus der Metrik bestimmt,
wenn zwei Forderungen gestellt werden. Die Verträglichkeit mit der Metrik ist automatisch dadurch erfüllt, dass die ω IJ nur Werte in so(3, 1) annehmen (Lorentz-Transformationen lassen die Metrik invariant). Die Torsionsfreiheit entspricht den Cartanschen
Strukturgleichungen:
Torsion T I := deI + ω IA ∧ eA = 0 .
Wegen (2.3) bestimmt in diesem Formalismus das Tetradfeld eµI die übliche Metrik und
bildet auch die zentrale Größe, aus der alle weiteren Größen (wie Zusammenhang und
Krümmung) definiert werden.
Der Spin-Zusammenhang und die üblichen Christoffelsymbole lassen sich aus dem jeweils
anderen berechnen:
eα I Γαµν = ∂µ eνI + ωµIA eνA .
(2.4)
Dass beide Zusammenhänge (Γ, ω) äquivalent sind, lässt sich z.B. zeigen, indem man
(2.4) als Definition für Γ ansieht und sich vergewissert, dass diese dann (2.2) erfüllen.
Die Äquivalenz folgt dann aus der Eindeutigkeit des Zusammenhangs.
Feldgleichungen
Aus dem Zusammenhang lassen sich wieder Krümmungsformen definieren:
RIJ := ΩIJ := dω IJ + ω IA ∧ ω AJ =: RIJαβ dxα ∧ dxβ .
Sie stehen mit den Komponenten des üblichen Krümmungstensors in einfacher Weise in
Beziehung:
RIJµν = eαI eβJ Rαβµν .
(2.5)
Die Feldgleichungen lauten damit:
2πG
2
εABCI (eA ∧ RBC − ΛeA ∧ eB ∧ eC ) = 4 TI .
3
c
(2.6)
9
2 Theoretische Vorbereitungen
Der eher technische Beweis, dass dies wirklich die bekannten Einsteinschen Feldgleichungen sind, ist für den Vakuumfall im Anhang E.2 (Seite 102) nachzulesen.
Das Wirkungsfunktional der Gravitation ist
c3
S[e, ω] =
64πG
Z
1
εABCD (eA ∧ eB ∧ R[ω]CD − ΛeA ∧ eB ∧ eC ∧ eD ) .
3
(2.7)
Dabei werden e und ω als unabhängige, dynamische Variablen angesehen5 . Im Weiteren
wird die kosmologische Konstante vernachlässigt!
2.3 Ashtekar-Zusammenhang
Für die kanonische Quantisierung von großer Bedeutung ist der von Abhay Ashtekar in
[1] vorgeschlagene Formalismus, den reellen Spin-Zusammenhang ω aus der 4-dimensionalen Raumzeit durch einen komplexen Zusammenhang im 3-dimensionalen Raum zu
ersetzen6 :
1
Ai := − εi ab ω ab + i ω 0i
2
(kleine lateinische Indizes bezeichnen die 3 Raumdimensionen, sie werden mit der euklidischen Metrik δji gehoben und gesenkt!). Aufgrund der Antisymmetrie von ω IJ enthält
der Ashtekar-Zusammenhang A dieselbe Information wie der Spin-Zusammenhang.
Es lässt sich recht einfach ein Projektionsoperator hierfür definieren:
1
P i jk = − εi jk ,
2
i
P i 0j = −P i j0 = δji
2
Ai = P i AB ω AB .
Diese eigenwillig anmutende Definition kann an einem Beispiel veranschaulicht werden:
Die Projektion auf den Feldstärketensor aus der Elektrodynamik angewandt ergibt (ohne
Rücksicht auf Konstanten) die magnetischen und elektrischen Felder als Real- und Imaginärteil:
P i AB F AB = B i + iE i .
Die Krümmungsformen können auf zwei äquivalente Arten definiert werden, entweder als
selbstduale Projektion der bisherigen Krümmung oder als Krümmungsform zum selbstdualen Zusammenhang:
5
Das Vorgehen, e und ω als unabhängig anzusehen, ist üblich und in der Literatur als first-order
”
formalism“ bekannt.
6
Das negative Vorzeichen widerspricht der Definition in [20], ist aber in Einklang mit [12].
10
2.3 Ashtekar-Zusammenhang
1
F i := P i AB RAB = dAi + εi ab Aa ∧ Ab .
2
Der Projektionsoperator erfüllt die Beziehung7
i
PaIJ P a KL = εIJKL + symmetrische Anteile
4
(am einfachsten durch Wahl eines festen externen Indizes zu sehen), deshalb kann das ε in
der Wirkung (2.7) durch Projektoren ersetzt werden. Dabei entfallen diejenigen Anteile,
die symmetrisch in beliebigen Indizes sind, denn es wird mit einer 4-Form kontrahiert,
und diese ist nach Definition total antisymmetrisch. Es folgt für die Wirkung:
Z
−i c3
S[e, A] =
PaAB eA ∧ eB ∧ F a .
(2.8)
16πG
Die eben beschriebene Projektion führt auf den selbstdualen (Plebanski-) Formalismus (siehe [12]). Er definiert die 2-Formen:
Σi := P i AB eA ∧ eB
oder explizit:
Σ1 = −e2 ∧ e3 + i e0 ∧ e1
Σ2 = −e3 ∧ e1 + i e0 ∧ e2
Σ3 = −e1 ∧ e2 + i e0 ∧ e3 .
Diese sind selbstdual, denn es gilt ?Σj = −i Σj , was auch den Namen des Formalismus
erklärt. Für die Basis der Bivektoren Σ ist auch wieder A der Zusammenhang. Damit
vereinfacht sich (2.8) weiter zu:
Z
−i c3
Σa ∧ F a .
(2.9)
S[Σ, A] =
16πG
Für die spätere Quantisierung ist noch der Barbero-Zusammenhang8 zu erwähnen:
1
Ai := − εi ab ω ab + γ ω 0i .
2
Er verallgemeinert die imaginäre Einheit aus der selbstdualen Version auf eine bisher noch beliebige komplexe Konstante γ. Sie wird Barbero-Immirzi-Parameter
genannt, nach J. Fernando Barbero, der einen realen Zusammenhang wählte, um die
7
8
Man beachte die Vorzeichenkonvention des ε-Symbols siehe Anhang E (Seite 101).
In der Literatur auch unter verschiedenen Kombinationen und Permutationen der Namen Ashtekar“,
”
Barbero“ und Immirzi“ bekannt.
”
”
11
2 Theoretische Vorbereitungen
Quantisierung zu vereinfachen, sowie Giorgio Immirzi, der den allgemeinen Fall konstruierte und zeigen konnte, dass die verschiedenen Fälle aus kanonischen Transformationen
aus einander hervorgehen, also dieselbe (klassische) Theorie beschreiben (siehe [14]).
2.4 Kanonische Beschreibung
Projektion auf den 3d-Raum
Bisher wurde die Theorie rein kovariant beschrieben, alle 4 Dimensionen der Raumzeit
wurden gleichberechtigt behandelt. Da es für die kanonische Quantisierung von Nöten
ist, von einer Hamiltonmechanik auszugehen, wird nun eine Trennung von Raum und
Zeit vollzogen. Dazu wird eine 3-dimensionale Untermannigfaltigkeit σ der Raumzeit
gewählt und als Raum“ bezeichnet.
”
Die Koordinaten der Raumzeit können immer so gewählt werden, dass die Zeitkomponente x0 der Koordinaten auf dem Raum konstant ist, dann spannen auch die 1-Formen
{dxi } wieder den dualen Tangentialraum Tx? σ des Raumes auf.
Alle bisher definierten Größen können auf σ herunter projiziert werden, indem nur
Komponenten berücksichtigt werden, die in Raumrichtung weisen. So z.B. die 4 TetradBasisformen:
I
4d e
= eαI dxα 7→
I
3d e
= eaI dxa
(es wird hier nicht mehr über α = 0, 1, 2, 3 summiert, sondern über a = 1, 2, 3). Da die
Dimension des Tangentialraums nur noch 3 ist, sind diese 4 Formen linear abhängig. Es
wird deshalb üblicherweise eine Eichung gewählt, in der eine der Formen verschwindet:
3d e
0
=0
⇔
ei 0 = 0 .
Im Weiteren sind Größen, falls nicht anders angegeben, immer als 3d-Projektion
aufzufassen.
Das elektrische Feld
Eine zentrale Rolle in der Theorie nimmt die Größe
1
(2.10)
E i j := εiab Σj ab = εiab εjcd ea c eb d
2
ein. Sie wird in Anlehnung an Yang-Mills-Theorien das elektrische Feld genannt. Seine
große Bedeutung erhält E dadurch, dass es der kanonisch konjugierte Impuls des
Zusammenhangs A ist. Um dies zu sehen, wird das Wirkungsfunktional (2.9) in den
Variablen E und A formuliert:
−i c3
S[E, A] =
8πG
12
Z a
E b a Ȧb + λa0 (Db E b a ) + λc (E b a Fbca ) + λ(εabc E e b E f c Fa ef ) d4 x
2.4 Kanonische Beschreibung
(Beweis siehe Anhang E.3 (Seite 104)). Die verschiedenen λs bezeichnen dabei LagrangeMultiplikatoren, D ist die kovariante Ableitung.
Aus dieser Form des Funktionals lässt sich die Poisson-Klammer ablesen:
{Ai j (x), E k l (y)} =
8πiG k j
δ δ δ(x − y) .
c3 i l
Darüberhinaus lassen sich aus Gleichung (2.4) Bedingungen an die Felder ableiten, indem
die Lagrange-Multiplikatoren variiert werden:
ε
abc
e
Db E b a = 0
(2.11)
E b a Fbia = 0
(2.12)
f
(2.13)
E b E c Fa ef = 0 .
Die Gaußgleichung (2.11) fordert die lokale SO(3)-Eichinvarianz in Form von Rotationen der Cartan-Basen, (2.12) fordert die Diffeomorphismusinvarianz. Beide werden in
[18] als Erzeuger lokaler Eichtransformationen beschrieben. Gleichung (2.13) erzeugt die
Zeitentwicklung und somit die Dynamik der Theorie. In der englischsprachigen Literatur
wird sie deshalb meist hamiltonian constraint“ genannt.
”
In der oben beschriebenen Eichung ist E reell und es gilt:
E i j = det(e) (e−1 )i j
(2.14)
wie die folgende Rechnung zeigt:
1
E a i ea j = εabc εide eb d ec e ea j
2
1
= det(e) εide εjde
2
= det(e) δij .
Darüber hinaus wird sich im nächsten Kapitel zeigen, dass das Integral über das elektrische Feld den Flächeninhalt ergibt.
Mit Barbero-Immirzi-Parameter
Wird statt des reinen selbstdualen Zusammenhangs der Barbero-Zusammenhang verwendet, so fließt der Barbero-Immirzi-Parameter γ in die Poisson-Klammern mit ein:
{Ai j (x), E k l (y)} =
8πγG k j
δi δl δ(x − y)
c3
13
2 Theoretische Vorbereitungen
und es ergeben sich zusätzliche Terme in den Feldgleichungen9 :
Db E b a = 0
E ebE f c
E b a Fbia − (1 + γ 2 )Kia Db E b a = 0
a
εa bc Fef
− 2(1 + γ 2 )K[eb Kfc] = 0
Eine Herleitung dieser Terme aus Sicht des ADM-Formalismus10 ist in [18] zu finden.
Dabei ist K die äußere Krümmung, d.h. die Krümmung der Einbettung des 3d-Raumes
in die 4d-Raumzeit. Details hierzu siehe [10].
9
Mit den eckigen Klammern um die Indizes in der letzten Gleichung ist der antisymmetrische Anteil
gemeint.
10
Benannt nach Richard Arnowitt, Stanley Deser und Charles W. Misner.
14
3 Loop-Quantengravitation
In diesem Kapitel soll eine kanonische Quantisierung der Relativitätstheorie vorgestellt
werden. Die Basiszustände des Hilbertraums bilden hierbei sogenannte Spin-Netzwerke,
die als diskrete Struktur des Raumes auf der Planck-Skala interpretiert werden können.
Für eine Einführung in das Thema siehe [18] oder [16]. Eine abstraktere Sichtweise bietet
[20].
3.1 Quantisierung
Im letzten Kapitel wurde die klassische Relativitätstheorie vorgestellt, deren kanonische Variablen der so(3)-Zusammenhang A und das elektrische Feld E auf einer 3dimensionalen Mannigfaltigkeit sind.
Im Weiteren wird die Eichgruppe SO(3) durch ihre universelle Überlagerungsgruppe
SU (2) ersetzt. Dies hat keinen Einfluss auf die klassische Theorie, da beide Gruppen
dieselbe Lie-Algebra so(3) ∼
= su(2) besitzen, in der der Zusammenhang Werte annimmt.
Dem üblichen Weg der kanonischen Quantisierung folgend, muss zu diesen Variablen
ein Hilbertraum gefunden werden, so dass die Operatoren des Raumes eine Darstellung
dieser Variablen bilden. Eine natürliche Wahl hierfür stellen Funktionale des Zusammenhangs dar, die sich aus den Holonomien konstruieren lassen.
Holonomie
V
γ (0)
h(t) V
γ (t)
.
γ (t)
Abbildung 3.1: Paralleltransport eines Vektors V entlang einer Kurve γ(t).
In gekrümmten Räumen geht der allgemeine Begriff der Parallelität von Vektoren verloren. Statt dessen wird Parallelität entlang einer Kurve γ als die Eigenschaft definiert,
dass die kovariante Ableitung nach der Kurventangente verschwindet. Sei V ein Vektor
am Startpunkt γ(0) einer Kurve γ(t). Dann kann eine Abbildung h(t) : Tγ(0) M → Tγ(t) M
15
3 Loop-Quantengravitation
definiert werden, die den Vektor vom Startpunkt auf einen parallel verschobenen Vektor h(t)V an einem beliebigen Punkt der Kurve abbildet. Die Gleichung für Parallelität
lautet dann:
∇γ̇ (h(t)V ) = 0 ⇔ ∂t hµν + γ̇ α Γµαβ hβν = 0
mit γ̇ :=
dγ(t)
dt
⇔ ∂t h + γ̇ α ωα h = 0 .
Sei nun der Parameterbereich t ∈ [0, 1]. Die Differentialgleichung hat als eindeutige
Lösung mit Anfangsbedingung h(0) = 1 die Abbildung
h := h(1) : Tγ(0) M → Tγ(1) M .
1
Sie wird Holonomie genannt. Die Abbildung ist linear und wegen der Verträglichkeit
der kovarianten Ableitung mit der Metrik gilt: h ∈ SO(n).
Sei nun der 3-dimensionale Raum mit dem Zusammenhang A gegeben. Dieser ist eine
1-Form mit Werten in der Lie-Algebra su(2). Explizit lautet seine Basisentwicklung
A = Aa b dxa τb mit drei Basisvektoren τi der Algebra su(2).
Die formale Lösung ergibt sich dann als Grenzwert, indem das Parametergebiet in viele
kleine Teilstücke zerlegt wird, in denen alle Größen als konstant
angenommen werden.
2
a
Jedes Teilstück trägt einen Faktor 1 + γ̇ (ti )Aa (ti )dt bei. Die gesamte Holonomie
ergibt sich dann als Grenzwert des Produkts
Y
h=
1 + γ̇ a Aa (ti )dt .
(3.1)
i
Eine alternative und übliche Schreibweise hierfür folgt aus der Reihenentwicklung dieses
Ausdrucks nach Termen in dt. Diese wird Pfad-geordnetes Integral“ genannt und ist
”
z.B. aus der Störungstheorie bekannt:
Z
1
a
h=1+
dt γ̇ Aa (t) +
0 Z
=: P exp A .
Z
1
Z
dt1
0
t1
dt2 γ̇A(t1 )γ̇A(t2 ) + . . .
0
γ
Die SU (2)-Eichtransformationen entsprechen der lokalen Wahl von Cartan-Basen. Eine
wichtige Eigenschaft von h ist, dass es nur von Transformationen an den Endpunkten
abhängt und unabhängig von Eichungen im Inneren der Kurve ist. Insbesondere ist die
Holonomie von geschlossenen Kurven eichinvariant.
Darüber hinaus kann die komplette Information des Zusammenhangs aus den Holonomien
rekonstruiert werden, indem der Raum mit beliebigen Kurven abgetastet wird.
1
Mit Holonomie ist im strengeren Sinne meist der Fall von geschlossenen Kurven gemeint, hier wird
der Begriff allerdings auch für offene Kurven verwendet.
2
Man beachte das Vorzeichen in der Definition von A.
16
3.2 Spin-Netzwerke
Zwangsbedingungen
Im nächsten Schritt sollen die Zwangsbedingungen (2.11), (2.12) und (2.13) in die Theorie eingebaut werden. Die Forderung der ersten beiden auf dem Raum der Funktionale ist
leicht zu realisieren und führt zu den im nächsten Kapitel vorgestellten Spin-Netzwerken.
Beim Anwenden der Zwangsbedingungen wird sich eine Hierarchie von Hilberträumen
ergeben. Hkin ist der Raum der quantisierten Variablen ohne Zwangsbedingungen, also
der Funktionale des Zusammenhangs. Die Lösungen der Gaußgleichung ergeben einen
Unterraum HG < Hkin . Weitere Einschränkungen durch Diffeomorphismusinvarianz
(2.12) ergibt den Raum Hdiff < HG < Hkin .
Die dritte Bedingung (hamiltonian constraint) ist zur Zeit noch Gegenstand der Forschung.
Es gibt allerdings mehrere Vorschläge zur Lösung. Der Lösungsraum wird als physikalischer Hilbertraum Hphys bezeichnet.
3.2 Spin-Netzwerke
Um die Gaußbedingung (2.11) zu erfüllen, werden nun spezielle Funktionale des Zusammenhangs konstruiert. Sei dazu Γ ein Graph im Raum. Dieser besteht aus einer Menge
von Knoten (Punkten im Raum) und Kanten (Pfade, die die Knoten verbinden). Der
Einfachheit halber werden nur Knoten erlaubt, in denen maximal 3 Kanten enden. Der
allgemeine Fall lässt sich hierauf zurückführen.
Für einen gegebenen Zusammenhang entspricht jeder Kante γ eine Holonomie hγ ∈
SU (2) entlang ihres Weges. Als zylindrische Funktion 3 werden nun Funktionale bezeichnet, die nur von den Holonomien auf einem Graphen abhängen. Eine einzelne zylindrische
Funktion Ψ[A] sieht“ nicht den kompletten Informationsgehalt des kontinuierlichen
”
Zusammenhangs sondern ist eine gewöhnliche Funktion von den Gruppenelementen hγ
in die komplexen Zahlen
Ψf [A] = f (hγ1 [A], . . . , hγn [A]) .
Jede Kante γi im Graphen Γ ergibt dabei einen Parameter der Funktion f .
Die Menge der zylindrischen Funktionen kann zu einem Hilbertraum vervollständigt werden (das Skalarprodukt dazu wird weiter unten definiert). Dieser wird als kinematischer
Hilbertraum Hkin bezeichnet, da er die Grundlage für die quantenmechanische Theorie
ohne Zwangsbedingung bildet.
Spezielle Elemente dieses Raumes werden Spin-Netzwerke genannt. Dabei trägt jede
Kante im Graphen eine halbzahlige Spin-Zahl, die eine irreduzible Darstellung der
Gruppe SU (2) wählt (siehe Anhang D (Seite 93)). Jede Holonomie ist dann in Form
einer (2j + 1)-dimensionalen Matrix (ρj (hγ [A]))mm0 gegeben.
Den Knoten werden invariante Tensoren T zugeordnet. Sie liegen im Tensorprodukt der
Darstellungen der drei angrenzenden Kanten mit deren Spin-Zahlen.
3
Für diese Objekte scheint es nur den englischen Ausdruck cylindrical functions“ zu geben.
”
17
3 Loop-Quantengravitation
Sei nun ein Graph Γ zusammen mit den Daten der Spin-Zahlen {jγ } und der invarianten
Tensoren {Tk } gegeben. Das Funktional des Spin-Netzwerks wird dadurch konstruiert,
dass für jeden Knoten die freien Indizes des zugehörigen Tensors mit den Indizes der
Holonomie-Darstellungsmatrizen der angrenzenden Kanten kontrahiert werden. Die beiden Indizes der Matrix einer Kante entsprechen dabei deren Anfangs- und Endpunkt.
Beispiele
j
δ ik
Abbildung 3.2: Einfachster Graph aus nur einem Knoten und einer Kante mit Spinzahl
j. Für den Tensor des Knotens kommt nur das δ-Symbol in Frage.
Der einfachste Graph (Abb. 3.2) besteht aus einem Knoten und einem geschlossenen Pfad
als Kante. Als invariante Tensoren kommen nur skalare Vielfache der Eins in Frage. Dies
folgt aus den Schur-Lemmata. Nach Kontraktion der Indizes ergibt sich einfach die Spur
der Darstellungsmatrix, bzw. ein Vielfaches davon:
ρj (hγ [A])ab λ δ ab = λ Tr ρj (hγ [A]) .
Der Fall λ = 1, j =
beruhte.
1
2
wird als Wilson-Loop bezeichnet, auf dem die Theorie anfangs
j1
Tikl
j3
j2
Abbildung 3.3: Knoten, an dem sich 3 Kanten treffen. Diesem wird der Tensor T zugeordnet.
Sei nun ein Knoten gegeben, in den drei Kanten münden (Abb. 3.3). Der Tensor sei T ikl
und die drei Kanten tragen Spins j1 , j2 , j3 . Dann ergibt sich als Teil des Spin-Netzwerks
der Ausdruck
T abc ρj1 (hγ1 [A])ai ρj2 (hγ2 [A])bk ρj3 (hγ3 [A])cl .
18
3.2 Spin-Netzwerke
Die drei noch offenen Indizes werden dann mit den Tensoren kontrahiert, die den Endpunkten der Kanten entsprechen.
Tensoren
Wie in Anhang D (Seite 93) beschrieben, müssen invariante Tensoren im Tensorprodukt
der Darstellungen liegen. Dieser Raum ist entweder eindimensional, falls die ClebschGordan-Bedingungen erfüllt sind, oder ansonsten leer. D.h. die drei Spin-Zahlen j1 , j2 , j3
auf Kanten, die sich in einem Knoten treffen, müssen diese Bedingungen erfüllen:
j1 + j2 + j3 ∈ N ,
(j1 + j2 ) ≥ j3 ≥ |j1 − j2 |
mit Permutationen.
Da das Tensorprodukt der Darstellungen in diesem Fall eindimensional ist, ist auch der
Tensor für jeden Knoten bis auf ein skalares Vielfaches festgelegt. Diese Rolle übernehmen
die Wigner 3j-Symbole. Der oben beschriebene Term im Spin-Netzwerk Funktional nimmt
dann die folgende Form an:
j1 j2 j3
ρj1 (hγ1 [A])ai ρj2 (hγ2 [A])bk ρj3 (hγ3 [A])cl .
a b c
Die skalaren Vielfachheiten können für das komplette Funktional zusammengefasst werden und fließen in die Normierung ein.
Wie im ersten Beispiel gesehen, können Knoten mit nur zwei Verbindungen komplett
in den Normierungsfaktor einfließen. Auch Knoten mit mehr als 3 Kanten können in
mehrere Knoten zerlegt werden, die jeweils nur 3 Kanten besitzen.
Gaußbedingung
Die soeben beschriebenen Spin-Netzwerke erfüllen die Gaußgleichung (2.11). Diese Gleichung kann als Forderung interpretiert werden, dass das Funktional invariant unter
lokalen SU (2)-Eichtransformationen ist.
Wie weiter oben bemerkt, hat eine Eichtransformation, die nur auf das Innere von Kanten wirkt, keinen Einfluss auf die Holonomien, und man kann sich darauf beschränken,
einzelne Knoten zu betrachten. Eine lokale Eichtransformation g ∈ SU (2) wirke also
auf einen Knoten. Dies entspricht einer Rotation der Cartan-Basis an diesem Punkt im
Raum. Die Holonomie einer angrenzenden Kante transformiert sich dann zu
hγ 7→ g · hγ
falls der Knoten der Startpunkt der Kurve γ ist, bzw. hγ 7→ hγ · g −1 für den Endpunkt.
Diese Transformation wirkt auf alle drei Holonomien, die sich diesen Knoten teilen. Also
o.B.d.A.:
19
3 Loop-Quantengravitation
Ψf [A] = f (hγ1 , hγ2 , hγ3 , . . . ) 7→ f (g hγ1 , g hγ2 , g hγ3 , . . . ) .
Der Term für den Knoten ist dann wegen der Homomorphismuseigenschaft der Darstellungen
T abc ρj1 (g hγ1 )ai ρj2 (g hγ2 )bk ρj3 (g hγ3 )cl
= T abc ρj1 (g)aa0 ρj1 (hγ1 )a0 i . . . .
Andererseits transformiert sich der invariante Tensor des Knotens trivial unter genau
dieser Operation. Somit absorbiert er alle drei gs bzw. deren Darstellungsmatrizen
T abc ρj1 (g)ai ρj2 (g)bk ρj3 (g)cl = (T 0 )ikl = T ikl .
Damit ist der Wert des Funktionals Ψ[A] unabhängig von lokalen Transformationen.
Skalarprodukt
Ein Graph Γ habe die Kanten γ1 , . . . , γn . Für zwei zylindrische Funktionen Ψf , Ψg , die
auf diesem Graphen Γ definiert sind, kann durch folgenden Ausdruck ein Skalarprodukt
dieser beiden Zustände definiert werden:
Z
hΨf |Ψg i :=
f (h1 , . . . , hn ) g(h1 , . . . , hn ) dn h .
SU (2)n
Hier wird über die Möglichkeiten der Holonomien aller Kanten mit dem Haar-Maß integriert.
Diese Definition ist analog zum Skalarprodukt der Quantenmechanik in der Darstellung
der Schrödingerschen Wellenmechanik. Dort wird ein Zustand als Wellenfunktion Ψ(x)
angesehen, also als Funktion der klassischen Zustandsvariablen des Ortes. Im Skalarprodukt
Z
hΨ|Φi =
Ψ(x)Φ(x)d3 x
R3
wird dann auch dieser klassische Freiheitsgrad ausintegriert.
Falls die Funktionale auf unterschiedlichen Graphen Γ0 , Γ00 definiert sind, kann die Vereinigung Γ := Γ0 ∪ Γ00 betrachtet werden. Beide Funktionale sind auf Γ ausdehnbar,
indem formal weitere Parameter für die zusätzlichen Kanten in die Funktion geschrieben
werden. Das Integral läuft dann über alle Kanten der Vereinigung Γ.
In [18] wird mit Hilfe des Peter-Weyl-Theorems bewiesen, dass die (normierten) SpinNetze eine vollständige und orthonormale Basis in HG bilden.
20
3.2 Spin-Netzwerke
Diffeomorphismusinvarianz
Wir gehen nun zu den Lösungen der Gleichung (2.12) über. Anschaulich entspricht dies
der Forderung der Invarianz unter Diffeomorphismen, also bijektiven und differenzierbaren Abbildungen des Raumes in einen anderen Raum. Sei Diff die Menge dieser Abbildungen. Auch gewöhnliche Koordinatentransformationen können hierzu gezählt werden.
N
M
γ
φ
φ −1γ
φ *A
A
Abbildung 3.4: Ein Diffeomorphismus φ zwischen zwei Räumen und seine Wirkung auf
Pfade γ und Zusammenhang A.
Sei eine Mannigfaltigkeit M gegeben sowie eine Abbildung Diff 3 φ : M → N in eine
zweite Mannigfaltigkeit N (siehe Abb. 3.4). Von Interesse ist das Transformationsverhalten einer Holonomie unter dieser Abbildung. Dazu sei ein Pfad γ in N gegeben4 ,
dem eine Holonomie hγ [A] zugeordnet werden kann. Diese nimmt als Argument den
Zusammenhang in N .
Über die Abbildung φ kann hieraus eine Holonomie im ursprünglichen Raum M konstruiert werden, indem das Urbild des Pfades also φ−1 γ ⊂ M betrachtet wird. Dies definiert
eine Holonomie, die einen Zusammenhang auf M als Parameter nimmt. Alternativ kann
der Pfad γ in N betrachtet werden und stattdessen wird der Parameter A von M nach
N abgebildet. Das Differential dφ bildet Vektoren von M nach N ab, dementsprechend
bildet das Dual von dφ eine 1-Form ab. Das Ergebnis dieser Abbildung wird geschrieben
als φ? A. Beide Definitionen der neuen Holonomie sind äquivalent:
hγ [φ? A] = hφ−1 γ [A] =: Uφ h[A] .
Entsprechend transformiert ein Diffeomorphismus die Zustände |ΨΓ,f i entweder als Abbildung der Parameter oder als Verschiebung“ des Graphen Γ.
”
Die Grundidee, invariante Zustände zu konstruieren, ist es, nun für ein gegebenes Funktional über alle möglichen Diffeomorphismen zu integrieren:
Z
Uφ |ΨiDφ .
(3.2)
Diff
4
Die Richtung, in der die Transformation definiert wird, ist Konvention und im Folgenden nicht von
Bedeutung, da das Ziel die Invarianz ist.
21
3 Loop-Quantengravitation
Ein solcher Zustand wäre wegen der Gruppeneigenschaften von Diff invariant unter
Transformationen.
Um diese Idee auf mathematisch sinnvollen Grund zu stellen, werden nun die Funktionale
auf dem Zustandsraum betrachtet, also die Dualvektoren hΨ| und deren Transformierten
hΨ|Uφ .
Das Skalarprodukt mit einem Zustand (die duale Paarung)
hΨΓ,f | Uφ (|ΨΓ0 ,g i)
ist wegen der Orthogonalitätseigenschaften der Spinnetze nur ungleich Null, wenn der
Diffeomorphismus den Graphen Γ auf den Graphen Γ0 abbildet. Für den Fall von Spinnetzen ergeben sich nur endlich viele Möglichkeiten für die Transformation entsprechend
den Symmetrieeigenschaften des Netzes, da die Kanten des Graphen nur jeweils auf Kanten mit derselben Spinzahl abgebildet werden dürfen. Die einzig erlaubte Änderung ist
dann die Durchlaufrichtung der Kanten.
Andererseits ist für die Zustände nur die Wirkung der Transformation auf dem Graphen
von Bedeutung. Deswegen kann das Integral in (3.2) zu einer endlichen Summe umgeschrieben werden, die nur über Vertreter von Äquivalenzklassen von Diffeomorphismen
mit diesen Eigenschaften läuft:
(ΨΓ,f | :=
X
hΨΓ,f | Uφ .
φ∈Diff
Der Lösungsraum Hdiff der Diffeomorphismusinvarianz wird dann definiert als der Raum
der Spinnetze, mit Abgeschlossenheit unter dem folgenden Skalarprodukt:
h[Ψ]|[Φ]iDiff := (Ψ|Φi =
X
hΨ|Uφ |Φi .
(3.3)
φ∈Diff
Der wichtige Punkt bei dieser Definition ist, dass die Zustände nun Äquivalenzklassen
unter Diffeomorphismen sind. Wie am Skalarprodukt (3.3) zu sehen, kann der Graph
eines Zustands Ψ beliebig durch Diffeomorphismen deformiert werden. Jede Deformation
wird im Skalarprodukt dadurch kompensiert, dass die Diffeomorphismen verändert werden, über die summiert wird. Eine echte Änderung des Zustands erfolgt erst, sobald sich
die Topologie des Graphen verändert, z.B. wenn eine Kante durch eine andere hindurch
geschoben wird. Diese Definition ist von einem anderen mathematischen Gebiet bekannt:
der Knotentheorie. Die neuen Zustände werden deshalb als Spin-Knoten bezeichnet.
3.3 Operatoren
Ziel dieses Abschnitts wird sein, einen quantisierten Operator für den Flächeninhalt zu
finden, und zu zeigen, dass er ein diskretes Spektrum besitzt.
22
3.3 Operatoren
Klassischer Flächeninhalt
Seien xi kartesische Koordinaten in einem 3-dimensionalen (flachen) Raum und xi (u, v)
eine durch u und v parametrisierte Fläche. Der Flächeninhalt wird dann durch das
Integral über ein Parametergebiet S berechnet
Z p
Z
knkdu dv =
na nb δ ab du dv
A=
S
S
mit dem Normalenvektor
ni :=
∂xa ∂xb
εabi .
∂u ∂v
Bei der Verallgemeinerung zu beliebigen Koordinaten xi mit Metrik gij erhalten die
√
Normalenvektoren jeweils einen Faktor von g, weil sich das ε-Symbol wie eine Tensordichte transformiert. Auch das δ ab wird zur inversen Metrik g ab . Unter Verwendung der
unveränderten Definition der Normalenvektoren berechnet sich der Flächeninhalt als
Z p
A=
g na nb g ab du dv .
S
Andererseits gilt wegen Gleichung (2.14) für das elektrische Feld
E i a E j b δ ab = det(e)2 (e−1 )i a (e−1 )j b δ ab
= det(e · 1 · e) (e−1 )i a (e−1 )j b δ ab
= det(g) (g −1 )ij
mit (2.3)
ij
= gg .
Damit und mit der Abkürzung Ei := E a i na lässt sich der Flächeninhalt durch das
elektrische Feld ausdrücken als
Z p
Ea Eb δ ab du dv .
(3.4)
A=
S
Elektrisches Feld als Operator
Ähnlich der Ortsvariablen in der Schrödingerschen Wellenmechanik wirkt der Zusammenhang  als Operator durch einfache Multiplikation auf die Zustände5 .
Wie von der Impulsvariable zu erwarten ist das elektrische Feld die (funktionale) Ableitung
nach dem Zusammenhang:
5
Streng genommen wird hierfür nicht A, sondern die Holonomie h[A] benutzt, damit das Produkt
wieder eine zyklische Funktion ist, also nur von Holonomien abhängt.
23
3 Loop-Quantengravitation
8π~γG δ
δ
=: −iC
.
3
c
δA
δA
Nun soll die Wirkung dieser Ableitung auf eine Holonomie berechnet werden. Die funktionale Ableitung wird gerne geschrieben als:
Ê = −i
δ
δAi j (y)
h[Ak l (x) + δki δjl δ 3 (x − y)] − h[A]
.
→0
hγ [A] = lim
Mit der Produktschreibweise (3.1) und der Produktregel ergibt sich unter Benutzung
impliziter Grenzwertbildung:
δ
δAi j (y)
hγ [A] =
X Y
x
=
X Y
=
...
δ
δAi j (y)
Y
1 + γ̇ Aa (x)dt
...
a
vor x
Y
i
3
γ̇ τj dt δ (x − y)
...
vor x
nach x
X
Zx
...
nach x
x
=
hγ1 [A] γ̇ i τj dt δ 3 (x − y) hγ0 [A]
γ̇ i δ 3 (xt − y) hγ1 τj hγ0 dt .
(3.5)
Dabei sind γ0 und γ1 die Teil-Kurven vor bzw. nach dem Punkt x.
Das Ergebnis (3.5) hat nach Ausführen des Integrals noch distributiven Charakter in
zwei Raumdimensionen. Daher liegt es nahe, eine mathematisch sauberere Version des
elektrischen Feldoperators zu definieren, indem mit einer Testfunktion f über eine Fläche
S integriert wird:
Z
du dv f a Êa hγ .
Ê[S, f ] hγ :=
S
Für den Fall, dass γ die Fläche S genau einmal im Punkt p schneidet, folgt
Z
Ê[S, f ] hγ = −iC
du dv dt f a nb γ̇ b δ 3 x(t) − x(u, v) hγ0 τa hγ1
Z
= −iC
du dv dt
∂xd ∂xc ∂xb
εdcb f a δ 3 x(t) − x(u, v) hγ0 τa hγ1
|∂u ∂v{z ∂t }
=det
Z
= −iC
∂x
∂(uvt)
d3 x f a δ 3 x − p hγ0 τa hγ1
= −iCf a (p) hγ0 [A] τa hγ1 [A] =: f a (p) Êa [S] hγ [A] .
24
3.3 Operatoren
γ1
p
S
γ0
Abbildung 3.5: Der Pfad γ einer Holonomie schneidet die Fläche S, auf der der Operator
des elektrischen Feldes definiert wird, im Punkt p und wird dabei in zwei
Teil-Pfade γ0 und γ1 aufgeteilt.
Der Fall einer Kurve γ, die die Fläche berührt, also tangential verläuft, ist aufwändiger
zu behandeln. In [18] wird beschrieben, dass dann gilt:
Ê[S, f ] hγ = 0 .
Flächeninhalt-Operator
Die Grundidee bei der Konstruktion eines Operators für den Flächeninhalt ist es, das
Integral in der klassischen Formel (3.4) als Grenzwert einer Summe über kleine Flächenstücke anzusehen
Xp
Ea (Si )Eb (Si ) δ ab .
A=
i
Im nächsten Schritt werden die klassischen Felder E durch ihre Operatoren ersetzt.
Dafür wird zuerst die Wirkung zweier E-Operatoren auf die Darstellung einer Holonomie
berechnet:
δ ab Êa [Si ] Êb [Si ] ρj (hγ [A]) = δ ab (−iC)2 ρj (hγ0 ) ρj (τb ) ρj (τa ) ρj (hγ1 )
= −C 2 ρj (hγ0 ) ρj (δ ab τb τa ) ρj (hγ1 )
= C 2 (j(j + 1)) ρj (hγ ) .
Im letzten Schritt wurde ausgenutzt, dass δ ab τb τa ein Casimir-Operator von su(2) ist.
Dessen Darstellungsmatrix zur Darstellung j ist gerade das −(j(j + 1))-fache der Einheitsmatrix. In der Quantenmechanik ist dieser Sachverhalt für das Quadrat des Drehimpulsoperators L̂2 = L̂2x + L̂2y + L̂2z bekannt.
Der Operator für den Flächeninhalt nimmt die Form
Xq
ÂS =
Êa [Si ]Êb [Si ] δ ab
i
25
3 Loop-Quantengravitation
Abbildung 3.6: Zur Berechnung des Flächeninhalts für ein Spinnetz wird die Fläche
in Teilstücke zerlegt, so dass jedes von höchstens einer Kante einmal
geschnitten wird.
an. Bisher wurde die Wirkung der Operatoren nur für den Fall berechnet, dass Fläche
und Kurve sich nur in (höchstens) einem Punkt schneiden. Wird der Operator ÂS auf
ein Spinnetz im Graphen Γ angewandt, kann es sein, dass Γ und S eine große Zahl
von Schnittpunkten besitzen. Die Aufteilung von S in kleine Flächenstücke Si muss
dann so erfolgen, dass jedes Si nur höchstens einen Schnittpunkt besitzt. Auch macht es
keine zusätzlichen Schwierigkeiten, einen Grenzwert für beliebig kleine Flächenstücke zu
berechnen, da in der Wirkung der Operatoren die Fläche Si nicht mehr auftritt. Somit
genügt es, eine Flächenaufteilung endlicher Größe zu wählen, um die exakte Wirkung
von ÂS auf ein Spinnetz zu berechnen:
ÂS |Ψi =
Xp
Xp
C 2 ji (ji + 1)|Ψi = C
ji (ji + 1)|Ψi
i
= 8πγ
i
lp2
Xp
ji (ji + 1)|Ψi .
(3.6)
i
Jede
p Kante im Graphen, die die Fläche schneidet, trägt dabei mit einem Summanden
j(j + 1) bei.
Dieses Ergebnis ist von großer Bedeutung für die Loop-Quantengravitation (LQG).
Zunächst bedeutet es, dass die Spinnetze Eigenzustände zum Operator  sind. Erstaunlicher ist, dass  offensichtlich ein diskretes Spektrum besitzt. Der kleinste
√ positive
1
Eigenwert ergibt sich für eine einzelne Kante mit Spin j = 2 und beträgt C 3/2, also
in der Größenordnung des Quadrats der Plancklänge lp . Der genaue Wert hängt von der
Wahl des Immirzi-Parameters γ ab.
Die Theorie sagt somit eine Quantisierung der Fläche auf der Planck-Skala voraus.
Die abstrakten Spinnetze können dann als Erzeuger“ von Flächeninhalt angesehen wer”
26
3.4 Hamilton-Operator
den. Die Spinzahlen an den Kanten entsprechen elementaren Anregungszuständen der
Raumzeit, die einer Fläche einen Inhalt geben, die sie durchschneiden.
Volumen-Operator
Eine ähnliche aber aufwändigere Konstruktion des Operators für den Rauminhalt offenbart auch eine Quantisierung des Volumens. Dieses wird von den Knoten im Graphen
im Spin-Netzwerk erzeugt.
Details siehe [18] und ausführlicher in [19].
3.4 Hamilton-Operator
Die große Schwierigkeit in der LQG ist, die Zwangsbedingung (2.13) zu quantisieren
( hamiltonian constraint“). Das Ziel ist, für diesen Ausdruck einen Operator Ĥ zu fin”
den und dann den physikalischen Hilbertraum Hphys der Theorie aus den Lösungen der
Gleichung
Ĥ|Ψi = 0
zu konstruieren. Viele wichtige Beiträge hierzu stammen von der Arbeitsgruppe um
Thomas Thiemann. Genaue Beschreibung oder gar eine Herleitung wären zu aufwändig,
deswegen sollen hier nur die groben Ideen zusammengefasst werden.
In [22] schlug er einen ersten, mathematisch konsistenten Operator vor. Dazu ersetzte
er in (2.13) die elektrischen Felder durch eine Poissonklammer mit dem Volumen. Der
klassische Ausdruck wurde dann zu
Z
Z
H(N ) ∝ N Tr(F ∧ {A, V }) =: N C(x) d3 x
σ
mit einer Testfunktion N . Die Quantisierung dieses Ausdrucks erfordert eine Regularisierung und ist nicht eindeutig.
Wirkung
j1
j1
j1 +
j3
j2
j3
1
2
1
2
j2− 12
j2
Abbildung 3.7: Eine lokale Änderung eines Spinnetzes durch den Hamilton-Operator.
27
3 Loop-Quantengravitation
Die Wirkung des Operators Ĥ auf ein Spin-Netzwerk Ψ ergibt sich als Summe lokaler
Änderungen (siehe Abb. 3.7). Jede dieser Änderungen beschränkt sich auf einen einzelnen Knoten im Graphen. Ein Paar von Kanten, das in diesem Knoten endet, wird mit
einem zusätzlichen Knoten versehen und die beiden neuen Knoten durch eine neue Kante
verbunden. Die neue Kante erhält den Spin j = 21 , die beiden Verbindungsstücke zum
gewählten Knoten werden um 12 erhöht oder gesenkt.
Jede lokale Änderung erhält einen Gewichtsfaktor. Diese Faktoren entsprechen den Matrixelementen hΨ|Ĥ|Φi zwischen Spin-Netzwerk-Zuständen und können noch nicht allgemein berechnet werden.
Es wird auch beobachtet, dass der Operator Ĥ nur eine Zeitentwicklung in diskreten
Schritten erlaubt. D.h. auch die Zeit kann in der Theorie als quantisiert angesehen werden, wie es auch wegen der Gleichberechtigung von Raum und Zeit erwartet wurde.
Der so konstruierte Operator Ĥ ist nicht symmetrisch. Er zeichnet eine Richtung der
Zeit aus, in der die Graphen von Spinnetzen komplexer werden. Deshalb wird in [19]
vorgeschlagen, einen symmetrisierten Operator
Ĥsym := Ĥ + Ĥ †
zu verwenden. Ĥ † ist dabei der adjungierte Operator. Er vernichtet die lokalen Änderungen, die Ĥ erzeugen kann.
Master Constraint
Die Konstruktion von Ĥ besitzt mehrere Nachteile. So kommutieren z.B. Operatoren,
die über unterschiedliche Testfunktionen integriert wurden, nicht. Deshalb müsste eine
unendliche Menge von Zwangsbedingungen gleichzeitig gefordert werden, eine zu jeder
möglichen Testfunktion. Auch ist der Operator nicht diffeomorphismusinvariant definiert
und scheint nicht auf dem Raum HDiff zu operieren.
Um diese Probleme zu lösen, schlägt Thiemann in [23] ein Verfahren vor, das er Master
”
Constraint Programme“ nennt. Die klassische Funktion ist dabei
Z
M=
σ
[C(x)]2 3
p
dx
det E(x)
und verschwindet genau dann, wenn H(N ) für alle Testfunktionen verschwindet. Da M
diffeomorphismusinvariant ist, kann die Quantisierung direkt in HDiff erfolgen.
Thiemann gibt zwei mögliche Konstruktionen von Operatoren M̂ an. Die erste ändert
den Graphen des Spinnetzes, auf das er wirkt. Die andere Version behält den Graphen
und ist kombinatorisch definiert.
28
3.5 Aussagen
3.5 Aussagen
Entropie schwarzer Löcher
Von Stephen Hawking und Jacob Bekenstein stammt die bekannte Formel für die Entropie schwarzer Löcher (z.B. [6]):
SBH (A) =
kB A
.
4lp2
Dabei ist A die Fläche des Ereignishorizonts, kB die Boltzmann-Konstante und lp die
Planck-Länge. Diese Formel stammt aus der Erkenntnis, dass sich für schwarze Löcher
Gesetze ähnlich denen der Thermodynamik aufstellen lassen.
Carlo Rovelli argumentiert in [19], dass sich der von außen beobachtbare Zustand eines
schwarzen Loches durch die Geometrie seines Ereignishorizonts beschreiben lässt. Eine
Entropie ließe sich dann durch die Zahl der möglichen Mikrozustände angeben. Die
Fläche des Ereignishorizonts wird in der LQG wie schon beschrieben durch ein Spinnetz
erzeugt, dessen Kanten durch den Horizont verlaufen. Unter der Annahme, jede
√ Kante
1
2
trage den Spin j = 2 , erzeugt jede Kante einen Flächeninhalt von A0 = 4πγlp 3. Damit
ist die Zahl der Kanten durch den Horizont A/A0 . Da der Hilbertraum jeder Kante
(2j + 1) = 2-dimensional ist, ist die Zahl der Basiszustände des Horizonts 2A/A0 . Und
somit ist die Entropie
SLQG = kB ln 2A/A0 =
kB A ln 2
√ .
4πγlp2 3
Diese Formel ist im Einklang mit SBH . Damit beide Formeln auch numerisch übereinstimmen, muss der bisher noch unbestimmte Immirzi-Parameter auf den Wert γ = πln√23
gesetzt werden.
Statt der Annahme, alle Spins seien 12 , können auch andere Verteilungen verwendet
werden. Dies führt dann zu anderen Werten für γ.
Singularitäten
Martin Bojowald und Abhay Ashtekar beschreiben in [2] ein Modell für die Zeitentwicklung des Universums, das auf der LQG beruht. Die darin hergeleitete WheelerDeWitt-Gleichung führt für einen positiven Zeitparameter t zu Ergebnissen, wie sie von
klassischen Modellen vorhergesagt wird. Auch in der Nähe von t = 0 zieht sich das Universum stark zusammen, allerdings tritt keine Singularität auf. Stattdessen ist es sogar
möglich, auch in den Bereich negativer Zeit zu entwickeln ( vor den Urknall“). Hier sagt
”
die Theorie erneut eine Ausdehnung in ein klassisch beschreibbares Universum vorher.
Anschaulich werden in der LQG Singularitäten durch die Quantisierung des Raumes
vermieden. Wegen der diskreten Struktur der Geometrie besitzen Flächeninhalt und
29
3 Loop-Quantengravitation
Volumen eine untere Schranke. Dies kann als (sehr hohe aber endliche) obere Schranke
für die Krümmung interpretiert werden.
Diese Konzepte lassen sich auch auf schwarze Löcher anwenden. Dadurch erhofft man
sich die bisherigen Probleme wie den Verlust von Information der hineinfallenden Materie
zu beseitigen. Waghalsigere Interpretationen reichen bis hin zu Übergangsmöglichkeiten
in andere Universen durch die Singularität“.
”
30
4 Spin-Schaum Modelle
Zur kanonischen Quantisierung in der LQG war es nötig, die kovariante Schreibweise
aufzugeben und eine Trennung zwischen Raum und Zeit einzuführen. Deshalb stellt sich
die Frage, ob sich die Theorie auch rein kovariant formulieren lässt. Ein anderes Problem ist, dass für die LQG noch keine allgemein anerkannte Dynamik definiert wurde.
Auch wenn eine Dynamik gefunden werden sollte, wäre es immer noch schwierig, Übergangsamplituden zwischen Zuständen auszurechnen.
Eine Antwort hierauf erhofft man sich in einer Pfadintegral-Formulierung der Quantengravitation. Es existieren mehrere Theorien, die unter dem Begriff Spin-Schaum“
”
zusammengefasst werden (siehe [17]).
4.1 Kanonisch aus der Loop-Quantengravitation
Grundidee
Es kann in der LQG versucht werden, die Übergangsamplitude zwischen zwei Zuständen
|Ψi i und |Ψf i zu berechnen. Dazu soll naiv wie in einer gewöhnlichen Quantendynamik
vorgegangen werden, und das Matrixelement der Zeitentwicklung ausgewertet werden.
Die folgende Rechnung sei hier nur symbolisch zu verstehen (siehe [18]):
n
Ĥ
|Ψi i
Z = hΨf |ei ∆tĤ |Ψi i = lim hΨf | 1 + i ∆t
n
n→∞
Z
= lim
dΨ1 . . . dΨn hΨf | 1 + i n∆ tĤ |Ψ1 ihΨ1 | (. . . ) |Ψ2 i . . . hΨn | (. . . ) |Ψi i . (4.1)
n→∞
R
Im letzten
Schritt
wurde
jeweils
die
Identität
dΨ |ΨihΨ| = 1 zwischen die Faktoren
i ∆t
von 1 + n Ĥ geschrieben.
(4.1) kann als Pfadintegral interpretiert werden. Es wird über die Menge der möglichen
Folgen von n Spinnetzen (Ψ1 , . . . , Ψn ) integriert. Jede dieser Folgen entspricht einer
zeitlichen Abfolge von Spinnetzen, also einer möglichen Zeitentwicklung eines Spinnetzes.
Sie wird als Spin-Schaum bezeichnet. Weil die Basis von Spinnetzen diskret ist, wird
das Integral in (4.1) zu einer Summe.
Obwohl noch
Unklarheit über die genaue Definition des Operators Ĥ und damit auch
i ∆t
1 + n Ĥ besteht (siehe Abschnitt 3.4 (Seite 27)), ist bekannt, dass seine Wirkung
aus (einer Summe von) kleinen Änderungen um die Knoten im Spinnetz besteht. In der
31
4 Spin-Schaum Modelle
t
j
j
j
j
Abbildung 4.1: Zeitentwicklung eines Spinnetzes (links) und Spin-Schaum (rechts).
Folge (Ψ1 , . . . , Ψn ) unterscheiden sich die aufeinander folgenden Zustände also nur um
genau diese lokalen Änderungen.
Der Übergang von einer Abfolge von Spinnetzen zu einem Spin-Schaum ist in Abb. 4.1
dargestellt. Aus den Netz-Knoten werden deren eindimensionale Weltlinien (rot) und
aus den Kanten werden Flächen. Diese erben die Spinzahlen von den Kanten. Hinzu
kommen Vertex-Punkte für die in der Zeitentwicklung auftretenden Verzweigungen von
Spinnetzen.
Spin-Schaum
Ein Spin-Schaum“ σ sei nun allgemein ein Zwei-Komplex Γ, also eine 2-dimensionale
”
Struktur aus Flächenstücken, die sich in Kurven ( Kanten“) und Vertex-Punkten schnei”
den. Dieses Gebilde sei in der Raumzeit eingebettet. Die Flächenstücke tragen Darstellungen einer Gruppe, z.B. Spinzahlen. Kanten werden invariante Tensoren zugeordnet.
Um die Amplitude (4.1) zu berechnen, werden alle Spin-Schäume gesucht, die die beiden Spinnetze verbinden. Jeder Spin-Schaum trägt dann mit einem Summanden zur
Amplitude bei. Allgemeiner werden Spin-Schäume in einem Gebiet gesucht, deren Konfiguration auf einem Teil des Randes vorgegeben ist. Der genaue Wert dieser Summanden
kann in der LQG zur Zeit dieser Arbeit noch nicht berechnet werden. Deshalb werden
eigenständige Theorien definiert, die jeweils von einer expliziten Formel für diese
Summanden ausgehen.
Alle diese Spin-Schaum Modelle besitzen folgende Struktur als gemeinsame Grundlage:
• eine Menge von Zwei-Komplexen Γ mit einer Gewichtsfunktion w(Γ)
• einer Gruppe mit Darstellungen j und invarianten Tensoren T
• Gewichtsfunktionen Ae (j, T ), Av (j, T ) für die Kanten und Vertex-Punkte
32
4.2 Ponzano-Regge
• die Gewichtsfunktionen für die Flächen sind (in den meisten Modellen) die Dimensionen der Darstellungsräume
Die Summe der Gewichtsfunktionen über alle Spin-Schäume wird wie bei Pfadintegralen
die Zustandssumme genannt:
X
Y
Y
Y
Z=
w(Γσ )
dim(jf )
Ae (j, Te )
Av (j, T ) .
(4.2)
σ
Flächen f
Kanten e
Vertizes v
In den nächsten Kapiteln sollen zwei dieser Modelle vorgestellt werden.
4.2 Ponzano-Regge
Das Ponzano-Regge Modell ([4]) ist historisch das erste Spin-Schaum Modell und beschreibt Gravitation in einer 3-dimensionalen Raumzeit, deren Metrik euklidische Signatur besitzt.
Klassisch
Dieses Modell baut auf dem als Regge-Kalkül bezeichneten Formalismus von Tullio Regge
auf. In diesem wird die glatte Mannigfaltigkeit der Raumzeit durch ein Simplexgitter approximiert. Das Innere jedes 4-Simplex wird dabei als flach angesehen. Auch die Tetraeder, in denen sich jeweils zwei 4-Simplizes berühren, sind flach. Die gesamte Krümmung
ist in den 2-Simplizes, also Dreiecken, konzentriert. Diese macht sich als Winkeldefekt
bemerkbar, wenn ein geschlossener Weg um die Dreiecke gegangen wird. Die Theorie
beruht auf der mathematischen Beobachtung, dass sich die totale Krümmung, die das
Wirkungsfunktional der Gravitation bildet,
Z
S ∝ R dV
auch als Summe der Winkeldefekte ausdrücken lässt (siehe [15]):
Z
X
R dV = 2
Ai δi .
Dreiecke i
Hier sind δi die Winkeldefekte und Ai die Flächeninhalte der 2-Simplizes. Diese Tatsache
entspricht einer diskreten Version des verallgemeinerten Satzes von Gauß-Bonnet.
Im Regge-Kalkül werden dann die Kantenlängen der Simplizes als dynamische Variablen
betrachtet und in ihnen die diskretisierten Feldgleichungen aufgestellt.
Für eine 3-dimensionale Raumzeit ist die Relativitätstheorie eine topologische Theorie, d.h. sie besitzt keine lokalen Freiheitsgrade. Da hier der Weyl-Tensor identisch verschwindet, besitzt der Ricci-Tensor die gesamte Information über die Krümmung. Dieser
wird aber durch die Einsteinschen Feldgleichungen festgelegt. Physikalisch bedeutet das,
33
4 Spin-Schaum Modelle
dass jegliche Krümmung lokal und direkt von der Materie (dem Energie-Impuls-Tensor)
bestimmt wird, Gravitationswellen sind hier also nicht möglich. Im 3-dimensionalen Fall
ist die totale Krümmung gegeben als Summe über die Winkeldefekte um jede Kante
multipliziert mit der Länge der jeweiligen Kante:
Z
X
R dV = 2
li δi .
Kanten i
Weiter schränkt man sich für die folgenden Überlegungen auf den Fall einer Riemannschen
Metrik ein.
Quantisierung
Tullio Regge und Giorgio Ponzano schlugen eine Pfadintegral-Quantisierung des ReggeKalküls vor (abgedruckt in [8]):
Z
i
(4.3)
Z = e ~ S(l1 ,...,ln ) dl1 . . . dln .
Das Integral läuft über alle in der Triangulierung auftretenden Kantenlängen.
In einem zweiten Schritt nahmen sie an, dass die Kantenlängen nur diskrete Werte
annehmen können. Diese seien halbzahlige Vielfache der Plancklänge lp . Unter dieser
Annahme machten sie die erstaunliche Entdeckung, dass (4.3) eine einfache gruppentheoretische Beschreibung erlaubt.
Wie bei den Spinnetzen werden Spinzahlen ji = li /lp ∈ N/2 als Darstellungen der SU (2)
verwendet. Der Integrand in (4.3) zerfällt dann in ein Produkt von 6j-Symbolen (siehe
Anhang D.5 (Seite 99)). Jeder Tetraeder der Triangulierung ergibt ein 6j-Symbol, das
von den Spinzahlen auf dessen Kanten abhängt.
j4
j6
j2
j1
j4
j2
j5
j6
j3
j5
j3
j1
Abbildung 4.2: Reihenfolge der 6 Spins auf dem Tetraeder für das 6j-Symbol.
Insgesamt nimmt die Zustandssumme des Ponzano-Regge Modells die folgende Form an:
34
4.2 Ponzano-Regge
Z=
X Y
Y
2j
(−1) (2j + 1)
{ji } Kanten
(−1)
j1 +j2 +j3
Dreiecke
Y
Tetraeder
j1 j2 j3
j4 j5 j6
.
(4.4)
Es kann gezeigt werden, dass die so definierte Zustandssumme nicht von der Triangulierung abhängt. Aus mathematischer Sicht ist sie eine topologische Invariante von
3-Mannigfaltigkeiten.
Eine Beschreibung als Spin-Schaum folgt, indem das duale Gitter betrachtet wird. Jedem
Tetraeder in der Triangulierung entspricht ein dualer Punkt im Inneren des Tetraeders,
jedem Dreieck eine duale Kante, die durch das Dreieck verläuft. Die dualen Flächen
tragen dann die Spinzahlen von den Kanten, die sie schneiden. Wegen der topologischen
Invarianz der Zustandssumme genügt es in diesem Modell, über eine einzelne Triangulierung zu summieren.
Zur Berechnung von Übergangsamplituden zwischen Spinnetzen werden also duale Spinnetze1 konstruiert. Diese sind einfach Dreiecksgitter mit Spins auf den Kanten. Dann wird
eine möglichst einfache Verbindung zwischen den Gittern durch Tetraeder gesucht und
die Zustandssumme (4.4) berechnet. Um eine wirkliche Übergangswahrscheinlichkeit zu
erhalten, müssen die Zustandssummen mit allen möglichen End-Spinnetzen berechnet
werden. Die Summe aller Werte ergibt den Normierungsfaktor.
Zur Herleitung von (4.4) war die Annahme von diskreten Kantenlängen von Nöten.
Diese Annahme wird inzwischen durch die LQG begründet, die in drei Dimensionen eine
Quantisierung von Längen vorhersagt. Eine direkte und ausführlichere Begründung ist in
[19] zu finden. Darin wird von einer klassischen Theorie ausgegangen, die durch Längen
und Holonomien beschrieben wird. Das aufgestellte Pfadintegral wird dann explizit über
die Holonomien integriert, was genau zur Ponzano-Regge-Zustandssumme führt.
Regularisierung
Es lassen sich leicht Fälle konstruieren, in denen die Summe (4.4) divergiert. Für jeden Vertex-Punkt im Inneren einer Triangulierung kann ein beliebiger Wert zu allen
Kantenlängen hinzuaddiert werden, die in diesem Punkt enden. Diese Reihe allein divergiert schon. Deshalb ist es nötig, eine Regularisierung zu verwenden. Die einfachste
Möglichkeit ist, nicht über alle möglichen Spinzahlen zu summieren, sondern eine obere
Grenze jmax einzuführen. Für jeden Vertex-Punkt wird ein Skalierungsfaktor λ(jmax )
eingeführt, der die Divergenz beseitigt. Die regularisierte Zustandssumme ist dann der
Grenzwert (siehe [4]):
jmax
Z̃ :=
1
lim λ(jmax )(# Vertizes)
jmax →∞
X
...
.
{ji =0}
Da in diesem Modell nur duale Spinnetze auftreten, wird bei der späteren Beschreibung der Simulationen auf das dual“ verzichtet.
”
35
4 Spin-Schaum Modelle
Eine andere Regularisierung ist die Turaev-Viro Methode. Diese verwendet statt der
Gruppe SU (2) die Quantengruppe“ SU (2)q mit einer komplexen Einheitswurzel q. Die
”
Zahl der irreduziblen Darstellungen und damit die möglichen Spinzahlen sind hierbei begrenzt. Außerdem hängen die neuen 6j-Symbole ebenfalls von q ab. Zur Regularisierung
wird dann der Grenzwert für q → 1 betrachtet.
4.3 Barrett-Crane
Für Gravitation in vier Dimensionen wurden mehrere Modelle vorgeschlagen [17], zu den
vielversprechendsten gehören die Modelle von John W. Barrett und Louis Crane [3].
Die Wirkung der Relativitätstheorie lautet wie in Gleichung (2.7) ohne Rücksicht auf
Konstanten:
Z
A
B
εABCD e ∧ e ∧ R
S=
CD
Z
=
?(e ∧ e)CD ∧ R
CD
Z
=:
Tr [?(e ∧ e) ∧ R]
Z
=:
Tr [B ∧ R]
mit einer 2-Form B, die Werte in der Lie-Algebra2 so(4) annimmt. Der Stern Operator
? dualisiert dabei nicht die 2-Formen sondern die Bivektoren, deren Indizes in der Gleichung zu sehen sind. Formal stimmt diese Wirkung mit der der sogenannten BF-Theorie3
überein, einer topologischen und damit einfacheren Version der Relativitätstheorie. Der
Unterschied zwischen beiden Theorien ist, dass hier B eine zusätzliche Zwangsbedingung
erfüllen muss: Es muss als Bivektor zerlegbar sein:
B = ?(e ∧ e) .
Für die BF-Theorie lässt sich ähnlich dem Ponzano-Regge-Modell eine PfadintegralFormulierung als Spin-Schaum finden. In [19] ist eine Herleitung sowie eine explizite
Formel für die Zustandssumme zu finden.
Wie schon bei den Rechnungen in drei Dimensionen wird die Gruppe SO(4) durch ihre
einfach zusammenhängende Überlagerung Spin(4) = SU (2) × SU (2) ersetzt. Die irreduziblen Darstellungen werden also durch zwei Spinzahlen (j1 , j2 ) auf den Flächen des
2-Komplexes beschrieben. In [3] wird gezeigt, dass die zusätzliche Zwangsbedingung zur
Folge hat, dass nur einfache Darstellungen auftreten, d.h. es gilt (j1 , j2 ) = (j, j). Um eine
Zustandssumme der Relativitätstheorie zu konstruieren, kann also von der BF-Theorie
ausgegangen werden und nur über die Teilmenge der Konfigurationen summiert werden,
in denen die beiden Spins auf jeder Fläche übereinstimmen. Zusätzlich ergibt sich auch
eine Änderung für die Gewichtsfunktion der Vertex-Punkte.
2
3
In dieser Arbeit wird nur der Fall besprochen, dass die Metrik euklidische Signatur besitzt.
Der
R Name stammt von der Gewohnheit, die Krümmung mit F zu bezeichnen. Die Wirkung ist dann
Tr[B ∧ F ].
36
4.3 Barrett-Crane
Insgesamt lautet die Zustandssumme im Barrett-Crane-Modell:
X Y
Y
Y
Ak
(2j + 1)
{10j} .
Z=
{j} Kanten
Flächen
Vertizes
Hierbei ist {10j} ein 10j-Symbol. An jedem Vertex-Punkt treffen 10 Flächen zusammen,
jede mit einem Spin j. Die 10j-Symbole sind Kontraktionen der etwas bekannteren 15jSymbole, die aus der BF-Theorie stammen. Sie berechnen sich aus diesen durch:

2
j
j
j
j
j


1
2
3
4
5
X
j6 j7 j8 j9 j10
.
{10j} =


i1 ,...,i5
i1 i2 i3 i4 i5
Das Gewicht Ak für die Kanten ist in der Theorie nicht direkt festgelegt. Es wurden deshalb mehrere Modelle mit unterschiedlichen Gewichten konstruiert. In den einfacheren
Varianten ist Ak = 1.
37
4 Spin-Schaum Modelle
38
5 Erzeugung von Gittern
Für die numerische Auswertung der Zustandssummen von Spinschaum-Modellen werden
zufällig erzeugte, simpliziale Gitter benötigt. Für das Ponzano-Regge-Modell (3d) sind
das Tetraedergitter, für Barrett-Crane (4d) bestehen sie aus 4-Simplizes. Durch den
Zufall in der Erzeugung soll verhindert werden, dass sich Gittereffekte in den später
folgenden Simulationen zu stark auswirken.
5.1 Topologie
Um verschiedene n-dimensionale topologische Räume nachzubilden, werden die Gitter
in einen höherdimensionalen Vektorraum eingebettet. Es genügt dabei, nur die Einbettungen in den Rn+1 zu betrachten, da sich alle für diese Arbeit interessanten Räume
auf diese Art behandeln lassen. Der topologische Raum wird dann als Untermannigfaltigkeit durch die Nullstellen einer reellen Funktion definiert. So kann z.B die 1-Sphäre
als Nullstellenmenge der Funktion f (x, y) = x2 + y 2 − 1 im R2 definiert werden.
Die hier am häufigsten benutzen Räume und ihre Einbettungen sind:
• 2-Sphäre: fS2 (x, y, z) = x2 + y 2 + z 2 − R2
2
p
• 2-Torus: fT2 (x, y, z) = R2 2 − R1 − x2 + y 2 − z 2
• Doppel-2-Torus: f2−T2 (x, y, z) = fT2
1
(R
2
+ r) + x2 , y, z
• 3-Sphäre: fS3 (x, y, z, w) = x2 + y 2 + z 2 + w2 − R2
!
r
2
p
• 3-Torus: fT3 (x, y, z, w) = R3 2 − R2 −
R1 − x2 + y 2 + z 2 − w2 .
Um in späteren Schritten zufällige Gitter auf diesen Räumen erzeugen zu können, werden
sie zunächst mit regelmäßigen Gittern überdeckt. Eine einfache Möglichkeit hierfür ist
das folgende Schema:
1. den Einbettungsraum Rn+1 in ein regelmäßiges Netz von (Hyper-) Würfeln zerlegen
2. die Funktion f auf allen Eckpunkten der Würfel auswerten
39
5 Erzeugung von Gittern
3. Würfel, auf deren Eckpunkten f wechselnde Vorzeichen besitzt, schneiden den
gesuchten Raum:
a) Würfelkanten, deren Endpunkte verschiedene Vorzeichen besitzen, schneiden
den Raum
b) ein Schnittpunkt mit der Kante kann durch die Werte von f auf den Endpunkten linear interpoliert werden
c) die so gefundenen Schnittpunkte werden durch Simplizes verbunden
Abbildung 5.1: Triangulierung des eingebetteten Raumes. Von links nach rechts: Suche
der Schnitt-Volumina; Verbindung der Schnittpunkte in Seitenquadraten; Verbinden der Simplizes zu höherdimensionalen
Abbildung 5.2: 3-Torus mit regelmäßigem Tetraedergitter überzogen und zur Visualisierung mit einem 3d-Raum geschnitten. Dabei entsteht das sichtbare
Dreiecksgitter. Die beiden Ansichten unterscheiden sich in der Lage des
3d-Schnittraumes.
40
5.2 Gitter
Der n-dimensionale Würfel besitzt (n − 1)-dimensionale Würfel als Seitenflächen“. Das
”
Verbinden der Schnittpunkte kann somit rekursiv über die Dimension geschehen. Zwei
Schnittpunkte auf den Kanten eines Quadrates werden durch eine Strecke (1-Simplex)
verbunden. Im 3-Würfel können die so gefundenen Strecken auf den Seitenquadraten sehr
einfach durch Dreiecke (2-Simplizes) verbunden werden. Diese dienen dann wiederum als
Grundflächen von Tetraedern (3-Simplizes) in der Dimension 4, usw.
5.2 Gitter
Um das eigentliche Gitter zu erzeugen, bieten sich 2 Möglichkeiten an:
5.2.1 Konstruktiv
Hierbei wird eine Punktmenge im eingebetteten Raum zufällig verteilt. Da in diesem
Raum schon ein Simplexgitter vorhanden ist, ist dies einfach zu erreichen.
Abbildung 5.3: Zufällige Punkteverteilungen: Links auf dem 2-Torus; rechts auf dem 3Torus. Die Farbe der Punkte gibt die Tiefe“ in der 4. Dimension an, das
”
sichtbare Gitter im Inneren ist wieder ein Schnitt mit dem 3d-Raum.
(Zu Visualisierungszwecken wurde hier eine hohe Anzahl von Punkten
gewählt, die in den Simulationen verwendete Zahl ist deutlich geringer.)
Im nächsten Schritt werden die zufälligen Punkte wieder mit Simplizes zu einem neuen
Gitter verbunden. Es gibt hierzu schon vielgenutzte Algorithmen, die aber für den flachen
Raum konzipiert sind und für den Umgang mit Krümmungen abgeändert werden müssen.
Eine Möglichkeit ist die Delaunay-Triangulierung. Sie stellt die Forderung, dass
für jedes Simplex außer dessen Eckpunkten kein weiterer Punkt in der Umsphäre (n-
41
5 Erzeugung von Gittern
dimensionales Äquivalent zum Umkreis) befindet. Für den flachen Raum ist diese Triangulierung eindeutig und kann immer konstruiert werden.
Abbildung 5.4: Triangulierung der 2-Sphäre: Der Algorithmus ist noch nicht
abgeschlossen. Blau sind die schon erzeugten Dreiecke, rot das Randgebiet, an dem neue Dreiecke erstellt werden.
Für den eingebetteten und gekrümmten Raum ist die Forderung mit der Umsphäre nicht
immer erfüllbar. Im Rn+1 als Einbettungsraum werden die gesuchten n-Simplizes von
n+1 Punkten aufgespannt. Die Um-n-Sphäre dieser Punkte liegt in der n-dimensionalen
Hyperebene dieser, einer Art Tangentialraum an den gekrümmten Raum. Verschiedene
Punktmengen, für die überprüft werden soll, ob sie ein Delaunay-Simplex aufspannen,
benutzen nun verschiedene Hyperebenen zu dieser Überprüfung. Das kann dazu führen,
dass einzelne Punkte mit keinen der Punkte in ihrer Umgebung ein Delaunay-Simplex
ergeben können und die Triangulierungsalgorithmen abbrechen.
Dieses Problem kann behoben werden, indem die Delaunay-Bedingung weniger zwingend
angesehen, oder komplett ignoriert wird, sobald der Algorithmus auf Problempunkte
stößt.
Der in dieser Arbeit genutzte Algorithmus geht nach folgendem Muster vor (siehe Abb.
5.4):
• begonnen wird mit einem zufälligen n-Simplex, das die Delaunay-Bedingung erfüllt
• dann iterativ:
– der Rand des bisher triangulierten Gebietes wird gefunden
– auf diesem Rand wird ein zufälliges (n − 1)-Simplex gewählt und seine Umgebung nach einem weiteren Punkt durchsucht, mit dem es ein Delaunay-nSimplex aufspannt
42
5.2 Gitter
Im letzten Schritt muss die Wahl möglicher Punkte so erfolgen, dass das neue Simplex
tangential an den gekrümmten Raum liegt. Da mit Projektionen auf Tangentialräume
gearbeitet wird, kann es sein, dass ein Punkt von der gegenüberliegenden Seite“ gewählt
”
wird, z.B. ein antipodaler Punkt auf der Sphäre.
Außerdem kann die Effizienz des Algorithmus dadurch deutlich gesteigert werden, dass
der Rand nicht in jedem Schritt komplett neu berechnet wird, sondern nur bei der
Erstellung eines neuen Simplex angepasst wird. Die Schwierigkeit hierbei ist allerdings,
dass mehrere Fälle zu unterscheiden sind, ob das neue Simplex den Rand nur ausbeult“,
”
oder verschiedene Gebiete des Randes verbindet und somit dessen topologische Gestalt
verändert.
Insgesamt erwies sich das Vorgehen, Gitter konstruktiv zu erzeugen, als zu unzuverlässig
und fehleranfällig. Die oben beschriebenen Abschwächungen der Delaunay-Bedingung
waren nicht sensibel genug, die Triangulierung immer vollständig abzuschließen ohne
dabei Gitterfehler zu erzeugen. Gerade bei kleiner Punktzahl werden diese Probleme auf
Grund der hohen Krümmung deutlich.
Deswegen wurde eine zweite Möglichkeit betrachtet:
5.2.2 Destruktiv
Abbildung 5.5: Von 1 nach 4 werden in der Ebene Kanten gelöscht. Die von diesen
Operationen betroffenen Dreiecke sind rot markiert.
43
5 Erzeugung von Gittern
Anstatt aus zufälligen Punkten ein komplett neues Gitter zu erzeugen, wird in dieser
Variante vom schon vorhandenen Gitter ausgegangen. Es werden dann iterativ zufällige
Simplizes ausgewählt und gelöscht. Deren Eckpunkte werden zu einem einzigen Punkt
vereint, alle angrenzenden Simplizes, die mehrere dieser Eckpunkte enthalten, müssen
dabei gelöscht werden.
A
B
Abbildung 5.6: Problemfall 1: Wird das rote Dreieck gelöscht, so fallen die Punkte A
und B zusammen und die beiden blauen Dreiecke werden identisch
Bei diesem Vorgehen ergeben sich allerdings Bedingungen an die Simplizes, die entfernt werden können. Abbildung 5.6 zeigt einen möglichen Problemfall für Dreiecksgitter: Nach Löschen eines Dreiecks und anschließendem Vereinen der Eckpunkte können
zwei Dreiecke existieren, die von den selben 3 Punkten aufgespannt werden.
Abbildung 5.7: Problemfall 2: Ein Dreiecksgitter umschließe eine dünne Röhre. Blau sind
3 Kanten markiert, die einen geschlossenen Weg um die Röhre bilden.
Wird ein Dreieck gelöscht, das eine der blauen Kanten enthält, so wird
die Röhre abgeschnürt“. Die verbleibenden 2 blauen Kanten sind dann
”
identisch und es teilen sich 4 Dreiecke diese Kante. Dies verletzt die
Eindeutigkeit der Nachbarschaftsbeziehung.
Ein weiteres Problem ist die mögliche Änderung der Topologie beim Löschen. Abbildung
5.7 zeigt ein Beispiel hierfür.
Erfahrung hat gezeigt, dass es einfacher ist, die Erkennung der Problemfälle zu implementieren, falls im n-Simplexgitter nicht n-Simplizes gelöscht werden, sondern deren
Kanten, also 1-Simplizes.
44
5.2 Gitter
1
6000 Punkte
4000 Punkte
2000 Punkte
1000 Punkte
0.8
500 Punkte
200 Punkte
relative Haeufigkeit
100 Punkte
0.6
0.4
0.2
0
0
5
10
15
20
Anzahl Simplizes pro Punkt
25
30
Abbildung 5.8: Für ein Dreiecksgitter auf dem 2-Torus sind hier die Häufigkeiten der
unterschiedlichen Simplexzahlen, die sich an den Punkten treffen, aufgetragen. Für das Ausgangsgitter mit 6000 Punkten treffen sich in fast
jedem Punkt 6 Simplizes. Je mehr Iterationen des Algorithmus durchlaufen werden, desto tiefer sinkt dieser Durchschnitt, dafür steigen die
hohen Simplexzahlen. Man beachte die auftretenden Peaks bei kleinen
Punkte- und hohen Simplexzahlen.
Ziel des Algorithmus ist es, ein möglichst zufälliges“ Gitter zu erzeugen, ohne beson”
deren Strukturierungen Vorrang zu geben. Dabei tritt noch ein weiteres Problem auf:
Beim Vereinen der Eckpunkte nach Löschen eines Simplex erhöht sich die Zahl der Simplizes, die sich den neu entstandenen Punkt teilen. Wird der Vorgang zu oft wiederholt,
ohne die zufällige Wahl auf diesen Effekt anzupassen, so kann für einzelne Punkte die
Zahl angrenzender Simplizes drastisch vom Durchschnitt abweichen. Der Algorithmus
scheint dieses divergente Verhalten zu begünstigen (siehe Abbildung 5.8). In dieser Arbeit wurde nicht versucht, das Problem zu lösen, da es sich erst bei einer hohen Anzahl
von Iterationsschritten negativ auswirkt.
45
5 Erzeugung von Gittern
Abbildung 5.9: Erfolgreiche Anwendung des destruktiven Algorithmus auf den 2-Torus
46
6 Simulationen - Statik
In diesem Kapitel sollen für einfache Beispielräume jeweils die Zustandssumme des
Ponzano-Regge-Modells numerisch berechnet werden. Dies wird nur mit Hilfe starker
Näherungen möglich sein.
6.1 Zustandssumme der 3-Sphäre
Die einfachste Modellierung der 3-Sphäre ist als Doppeltetraeder“, also durch 2 Tetrae”
der, die an allen 4 Randflächen zusammengeklebt werden. Dieses Objekt ist eine gewisse
Herausforderung für die Vorstellungskraft, verhält sich aber analog zum Fall der 1- oder
2-Sphäre. Letztere lässt sich ebenfalls durch 2 Dreiecke modellieren, die aufeinander
gelegt und an den Rändern zusammengeklebt werden.
Alternativ kann man sich den 3-dimensionalen Raum als 3-Sphäre vorstellen, in die ein
Loch gebohrt wurde, das dem Rand im Unendlichen entspricht. Ein Tetraeder umschließt
dann ein Volumen, während der andere das Komplement (sowie das Unendliche“) um”
schließt.
j4
j6
j5
j2
j3
j1
Abbildung 6.1: Spins auf den Kanten eines Tetraeders
6.1.1 Brute Force
In der Zustandssumme des Ponzano-Regge-Modells (Gleichung (4.4)) tritt in diesem
Fall das Produkt der 6j-Symbole der beiden Tetraeder auf. Diese werden von denselben
47
6 Simulationen - Statik
Kanten aufgespannt, nehmen somit auch dieselben 6 Spins als Parameter. Sie unterscheiden sich nur in ihrer Orientierung: Der eine Tetraeder beschreibt das Innere“, der
”
andere das Äußere“. Die dadurch entstehende Umverteilung der Spin-Parameter hat
”
allerdings keine Auswirkungen auf den Wert, da die 6j-Symbole symmetrisch bezüglich
dieser Vertauschung sind:
j1 j2 j3
j1 j3 j2
=
.
j4 j5 j6
j4 j6 j5
Außerdem heben sich alle Vorzeichen gegenseitig auf, denn die Vorzeichen für Kanten
und Dreiecke ergeben zusammen
(−1)2j1 +···+2j6 (−1)2j1 +···+2j6 = (±1)2 = 1 .
{z
}|
{z
}
|
Kanten
Dreiecke
Somit wird die Zustandssumme zu
Z=
!
2
j1 j2 j3
(2ji + 1)
j4 j5 j6
X
Y
{ji }
i=1...6
und nach Regularisierung durch Einführung eines maximalen Spins als Cut-Off:
!
2
X
Y
j1 j2 j3
Z(jmax ) =
.
(2ji + 1)
j4 j5 j6
{ji <jmax }
(6.1)
i=1...6
Abbildung 6.2 zeigt die numerische Auswertung dieser Zustandssumme abhängig von der
Wahl des maximalen Spins. Die Auswertung erfolgte durch ein einfaches Brute-ForceVerfahren, also die explizite Berechnung aller in (6.1) auftretenden Terme. Es deutet sich
9
ein divergentes Verhalten mit jmax
an. Um dieser Divergenz entgegen zu wirken, wäre
−9/4
eine Regularisierung nötig mit je einem Faktor jmax für die vier Vertizes.
Wie erwartet ist das Brute-Force-Verfahren für die gegebene Problemstellung ungeeignet.
Die Rechenzeit ist etwa proportional zur Anzahl der Möglichkeiten, den Kanten Spins
zuzuordnen, also ∝ (2jmax )Kanten . Für dieses einfache Beispiel steigt sie mit (jmax )6
und betrug schon für die in Abb. 6.2 zu sehende Rechnung ungefähr einen Tag. Auch
komplexere Triangulierungen sind wegen des hohen Aufwands nicht möglich.
6.1.2 Regularisierung
Der in dieser Rechnung gefundene Regularisierungsfaktor wird in den folgenden Rechnungen nicht von Bedeutung sein. Bei vorgegebener Triangulierung und maximalem
Spin können diese Terme in einem konstanten Faktor zusammengefasst werden. Für die
physikalischen Überlegungen in dieser Arbeit sind nur Verhältnisse von Zustandssummen
relevant, weshalb die Faktoren von nun an nicht mehr berücksichtigt werden.
48
6.2 Näherung
Zustandssumme Z
1e+14
Fitkurve j9
1e+12
Zustandssumme Z
1e+10
1e+08
1e+06
10000
100
1
1
10
jmax
Abbildung 6.2: Auswertung der Zustandsumme der 3-Sphäre abhängig vom maximalen
Spin. Die 3-Sphäre ist hier als Doppeltetraeder modelliert.
6.2 Näherung
Einige numerische Testrechnungen1 haben gezeigt, dass die einzelnen Summanden in
der Zustandssumme (4.4) von einer Spin-Konfiguration zu einer benachbarten über viele
Größenordnungen variieren.
Abbildung 6.3 zeigt am Beispiel der 3-Sphäre dieses chaotische Verhalten. Die beiden
Kurven im Diagramm sind die Summe aller bisher berechneten Terme sowie der höchsten
Summanden. Beide Kurven liegen fast perfekt aufeinander.
Dieser Sachverhalt gibt Anlass zu einer Näherung für die weiteren numerischen Simulationen. Anstatt möglichst viele Terme aufzusummieren wird die Zustandssumme (4.4)
durch ihren größten Summanden approximiert. Dadurch vereinfacht sich die Berechnung
zur Suche eines Extremums im Konfigurationsraum der Spins.
Diese Näherung entspricht einem tiefen Eingriff in die Theorie, da die Gewichtsfunktion
im Konfigurationsraum durch einen Delta-Peak ersetzt wird. Dabei geht auch in gewissem Sinne der Quantencharakter der Theorie verloren, da nur noch ein einzelner Zustand
berücksichtigt wird und keine Linearkombination mehr.
Dennoch machen die folgenden Simulationen von der Näherung Gebrauch, da das Prob1
Details des Verfahrens werden im nächsten Abschnitt behandelt.
49
6 Simulationen - Statik
log10 W
log10 Z
log10 Wmax
Zustandssumme log10 Z
-460
-480
-500
-520
-540
0
500000
1e+06
Iterationen
1.5e+06
2e+06
Abbildung 6.3: Vergleich der iterativ berechneten Zustandssumme mit dem Wert des
höchsten Summanden am Beispiel der 3-Sphäre
lem ansonsten numerisch nicht zu behandeln wäre. Außerdem wird erhofft, von der
dominierenden Konfiguration ausgehend die Gewichtsfunktion später in einer gewissen
Umgebung analytisch annähern zu können, um ähnlich einer Sattelpunktsnäherung doch
wieder quantenmechanisch zu rechnen.
Analytischer Versuch
Es könnte analytisch versucht werden, ein Extremum in der Gewichtsfunktion in Gleichung (4.4) als Nullstelle der Ableitung zu finden. Dazu müsste eine analytische Funktion
gefunden werden, die die rein kombinatorisch definierten 6j-Symbole approximiert.
Eine solche Näherung wird in [11] vorgestellt. Sie verwendet eine Stirling-Formel für die
Fakultäten und nähert auch die Summe durch ein Integral an. Es wird in der Arbeit
aber nur der Grenzfall großer Spinzahlen behandelt, weswegen sich die Formeln hier nur
eingeschränkt verwenden ließen. Das Problem, dass die Integrationsgrenzen weiterhin als
Maximum und Minimum der Spinzahlen gegeben sind, könnte z.B. durch die Näherung
max(a, b) ≈ ln(eax + ebx )/x
für große x behoben werden. Auch das Rechnen mit Gamma-Funktionen wäre denkbar.
50
6.3 Numerisches Verfahren
Dieses Vorgehen scheint hier allerdings nicht sinnvoll zu sein. Zunächst ist die Zahl
der beim Ableiten auftretenden Terme immens. Schon bei einem Gitter mit 100 Kanten wären Produkte und Quotienten von über 1000 Fakultäten abzuleiten. In dieser
Größenordnung ist zu erwarten, dass die Fehler in den einzelnen Näherungen sich zu
drastisch auswirken. Auch wäre es sehr schwer, ein nichtlineares Gleichungssystem mit
einer Gleichung für jede Kante zu lösen.
Numerische Testrechnungen (wie z.B. in Abb. 6.3 zu sehen) zeigen, dass die Werte der
6j-Symbole sehr stark von den Parametern abhängen und teilweise schnell oszillieren.
Diese fehlende Korrelation zwischen den Werten benachbarter Punkte verhindert die Benutzung eines einfachen Gradientenverfahrens. Deshalb ist auch zu erwarten, dass, falls
die soeben beschriebenen Probleme gelöst werden könnten, eine analytische Suche nach
Extremstellen eine sehr hohe Anzahl von Kandidaten finden würde. Da der Zustandsraum der Spinzahlen diskret aber hochdimensional ist, wären dann für jeden Kandidaten
eine Überprüfung aller Nachbarpunkte, die auf dem Gitter liegen, nötig.
6.3 Numerisches Verfahren
6.3.1 Verfahren
Es stellt sich wie im letzten Abschnitt beschrieben das Problem, diejenige Spinkonfiguration zu finden, die die Gewichtsfunktion maximiert.
In dieser Arbeit wurde hierfür ein Verfahren entwickelt, das auf dem Metropolis-Algorithmus beruht und in einer ähnlichen Form als simuliertes Abkühlen bekannt ist.
Dazu wird iterativ vorgegangen:
• es wird von einer Konfiguration ausgegangen und deren Gewichtsfunktion W0
berechnet
• eine zufällige neue Konfiguration in der Nachbarschaft der ersten wird erzeugt und
auch deren Gewichtsfunktion Wneu ausgewertet
• mit einer gewissen Wahrscheinlichkeit p(W0 , Wneu ) wird die alte Konfiguration
durch die neue ersetzt
Die Wahrscheinlichkeit berechnet sich aus

 1
p(W0 , Wneu ) = W 1/T
 neu
W0
wenn Wneu > W0
sonst
mit einem positiven Parameter T , der Temperatur“.
”
Die so berechnete Wahrscheinlichkeit entspricht dabei der Formel des Metropolis-Algorithmus, allerdings nicht direkt auf die Gewichtsfunktion angewandt, sondern auf deren
Logarithmus.
51
6 Simulationen - Statik
Für T = ∞ wählt der Algorithmus immer die neue Konfiguration solange2 Wneu 6= 0, da
die Wahrscheinlichkeit 1 ist. In diesem Fall wird der Algorithmus nicht zum Maximum
streben. Für das andere Extrem T = 0 werden neue Konfigurationen nur akzeptiert,
wenn Wneu > W0 . Diese Variante wird ein lokales Maximum nicht mehr verlassen können.
Es zeigt sich, dass der Algorithmus am effektivsten arbeitet, wenn die Temperatur T
für die ersten Iterationen hoch gewählt und im Laufe der Simulation langsam abgesenkt
wird. Dadurch wird der Konfigurationsraum zuerst grob abgesucht und dann potentielle
Gebiete mit einem Maximum feiner aufgelöst. In dieser Arbeit wurde T exponentiell und
in konstanten Abständen gesenkt.
6.3.2 Erzeugung neuer Konfigurationen
Die naive Vorgehensweise, von einer Konfiguration ausgehend eine zufällige Kante zu
wählen und den Spin um ± 21 zu ändern, ist wenig sinnvoll. Wegen den Bedingungen der
6j-Symbole wäre die Gewichtsfunktion dann immer 0. Auch ±1 ist nicht sinnvoll, da
dann die Anfangskonfiguration vorschreibt, welche Kante ganz- und welche halbzahlig
bleibt.
Es sollen also neue Konfigurationen erzeugt werden, die automatisch die Dreiecksungleichung (1) und die Bedingung der ganzzahligen Spinsummen (2) auf Dreiecken
erfüllen.
Die Bedingung (2) kann topologisch interpretiert werden:
Abbildung 6.4: Topologische Interpretation der Ganzzahl-Bedingung auf einem Dreiecksgitter. Blau gestrichelt die halbzahligen Kanten, rot die Wege
Für den anschaulicheren Fall eines 2d-Gitters aus Dreiecken (siehe Abb. 6.4) kann jedes
Dreieck entweder 0 oder 2 Kanten mit halbzahligem Spin besitzen um auf eine ganz2
Dies wird von der im Folgenden beschriebenen Erzeugung der Konfigurationen gewährleistet.
52
6.3 Numerisches Verfahren
zahlige Summe zu kommen. Jedes Dreieck mit 2 halbzahligen Kanten kann über diese
nur mit Dreiecken verbunden sein, die ebenfalls 2 halbzahlige Spins beherbergen. Somit
kann von einem solchen Dreieck ein eindeutiger Weg gefunden werden, der nur halbzahlige Kanten überquert. Dieser Weg kann keine Verzweigung besitzen, da dazu ein Dreieck
3 halbzahlige Kanten bräuchte. Andererseits kann der Weg auch nicht im Inneren des
Gitters enden, da dann ein Dreieck nur eine halbzahlige Kante besäße.
Ein Gitter, das Bedingung (2) erfüllt, wird also von 1d-Mannigfaltigkeiten durchzogen,
die sich nicht schneiden und deren Rand auch auf dem Rand des Gitters liegt. Erlaubt
sind damit auch geschlossene Kurven, da diese keinen Rand besitzen.
Abbildung 6.5: Tetraeder mit halbzahligen Kanten (blau gestrichelt) werden von 2dMannigfaltigkeiten (rot) zerteilt
Auf einem 3d-Gitter aus Tetraedern ist die Situation analog. Die Oberfläche jedes Tetraeders lässt sich als Dreiecksgitter ohne Rand beschreiben, somit muss durch jede halbzahlige Kante ein geschlossener Weg auf dieser Oberfläche verlaufen. Diese durchläuft
3 oder 4 Kanten und lässt sich immer als 2d-Fläche interpretieren, die den Tetraeder
zerteilt (siehe Abb. 6.5).
Damit wird auch ein Tetraedergitter insgesamt wieder von 2d-Mannigfaltigkeiten durchzogen, die sich nicht schneiden und deren Rand auf dem Rand des Gitters liegt.
Aus diesen Überlegungen ergibt sich eine einfache Möglichkeit, neue Konfigurationen zu
erzeugen:
• ein zufälliger Vertex-Punkt wird gewählt
• alle Spins der an diesen Punkt angrenzenden Kanten werden von halb- nach ganzzahlig gekippt“ und umgekehrt
”
Diese Operation entspricht der Erzeugung einer Sphäre um diesen Punkt, welche dann
entsprechend der XOR-Logik zu den bestehenden Schnittmannigfaltigkeiten addiert wird.
D.h. die Sphäre löscht schon bestehende Flächenstücke (siehe Abb. 6.6).
Das Kippen der Spins muss dann mit der Dreiecksbedingung (1) verträglich sein. Dazu
gibt es auch zwei einfache Implementierungsmöglichkeiten:
53
6 Simulationen - Statik
+
=
Abbildung 6.6: Kippen der Spins als Addition einer Sphäre zu den bestehenden Wegen
• alle Spins um denselben halbzahligen Wert ∆j erhöhen oder erniedrigen, wobei
alle angrenzenden Dreiecke durch ihre Dreiecksbedingung eine obere und untere
Schranke an ∆j ergeben. Dann wird ∆j zufällig aus diesem Intervall gewählt
• für jeden Spin wird ein eigenes ∆ji gewählt, das nur durch dessen unmittelbar angrenzenden Dreiecke beschränkt wird. Dies wird dann iterativ für alle zu kippenden
Spins getan3
In beiden Fällen kann es vorkommen, dass keine neue Konfiguration gefunden wird,
da das mögliche Intervall für ∆j leer ist. Dann muss ein neuer Vertex-Punkt gewählt
werden.
Die Simulationen in dieser Arbeit wechseln für jeden Iterationsschritt zwischen diesen
beiden Erzeugungsmöglichkeiten, um möglichst zufällige Konfigurationen zu erhalten.
6.3.3 Meta-Algorithmus
Das oben beschriebene Verfahren zur Findung des Maximums der Gewichtsfunktion
besitzt mehrere Parameter:
• Anfangstemperatur T0
• Geschwindigkeit der Temperaturabnahme
• Anzahl der Schritte, die nach jeder Temperaturabnahme thermalisiert wird
• Anzahl der Schritte, nach der zur bisher besten Konfiguration zurückgesprungen
werden soll, falls keine bessere gefunden wurde
Diese Parameter wirken sich stark auf die Effizienz und Ergebnisse des Algorithmus aus.
Damit gibt es für eine vorgegebene Problemstellung wieder einen optimalen Punkt im
Raum dieser 4 Parameter.
Um diesen optimalen Punkt zu finden wurde für die Simulationen in dieser Arbeit der Algorithmus auf sich selbst angewandt. Dazu wurde eine Test-Simulation geschrieben,
3
Die möglichen Ergebnisse sind dann von der Reihenfolge der gewählten Spins abhängig!
54
6.3 Numerisches Verfahren
die von den obigen Parametern abhängt und eine vorgegebene Anzahl an Iterationen
durchführt. Das von dieser Simulation gefundene Maximum wurde dann als Wert einer
Funktion“ von den 4 Parametern genommen.
”
Auf einer höheren Ebene wirkte dann derselbe Algorithmus zur Findung des Maximums
dieser Funktion im Parameterraum. Bei jeder Auswertung der Funktion wurde die TestSimulation einmal durchlaufen.
Auch hier eignet sich kein einfaches Gradientenverfahren, da für diese Funktion wieder
keine Ableitung definiert werden kann. Schon der Wert für denselben Punkt im Parameterraum ändert sich bei jeder Auswertung!
log10 Z (optimiert)
log10 Z (unoptimiert)
350
300
Zustandssumme log10 Z
250
200
150
100
50
0
-50
-100
0
200000
400000
600000
800000
Iterationen
1e+06
1.2e+06
Abbildung 6.7: Unterschiedliche Parameter für den Algorithmus auf der 3-Sphäre. Rot
zeigt eine Simulation mit optimierten Parametern und blau mehrere unoptimierte Beispiele
Abbildung 6.7 demonstriert die Vorteile der optimierten Parameter. Der Algorithmus
findet ein deutlich höheres Maximum und konvergiert schneller.
6.3.4 Ergebnisse
Mit dem optimierten Algorithmus wurden auf der 3-Sphäre drei Rechnungen mit identischen Parametern durchgeführt. Das Gitter bestand aus 204 Vertex-Punkten und 970
Kanten. Der maximale Spin lag bei jmax = 50. Abb. 6.8 zeigt das Konvergenzverhalten in
55
6 Simulationen - Statik
350
Zustandssumme log10 Z
300
250
200
150
100
Rechnung 1
Rechnung 1
Rechnung 1
50
0
500000
1e+06
1.5e+06
2e+06
2.5e+06 3e+06
Iterationen
3.5e+06
4e+06
4.5e+06
5e+06
Abbildung 6.8: Drei Rechnungen auf der 3-Sphäre mit gleichen Parametern.
Rechnung
Z = Wmax
1 5,929 · 10348
2 1,572 · 10352
3 3,102 · 10348
Tabelle 6.1: Ermittelte Werte für die Zustandssumme aus den drei Rechnungen.
den jeweiligen Rechnungen. In Tabelle 6.1 sind die Endergebnisse für die Zustandssumme
aufgelistet.
Die mittlere Quadratische Abweichung des Logarithmus der berechneten Zustandsfunktionen entspricht einem Faktor von 48,314. Dieser gibt eine mittlere (multiplikative)
Schwankung um den geometrischen Mittelwert bei 6,612 · 10349 an.
Einfache Überlegungen zur Regularisierung des divergenten Verhaltens der Zustandssumme
lassen erwarten, dass der reale Wert der Zustandssumme bei etwa
Z ≈ jmax # Vertizes ·9/4 = 50204·9/4 ≈ 10780
liegt.
56
6.3 Numerisches Verfahren
6.3.5 Gauß-Näherung
Um nicht nur einen einzelnen Wert der Zustandssumme zu berücksichtigen, wurde versucht, die Gewichtsfunktion um das gefundene Maximum durch eine Gauß-Funktion
anzunähern:
W (x) ≈ Wmax e−x
T Ax
.
x ist ein Vektor im Konfigurationsraum der Spins. Hier sei o.B.d.A. das Maximum bei
x = 0. Da diese Funktion schnell nach außen hin abfällt, kann die Zustandssumme als
Gauß-Integral über den kompletten Rn angesehen werden:
r
Z
πn
.
W (x) dn x = Wmax
Z≈
det A
Rn
Da die Eigenwerte Ai und Richtungen der Eigenvektoren der Matrix A schlecht bestimmt
werden können, wurde die Annahme benutzt, A sei in den Koordinaten dieses Raums
diagonal. Dies stellt eine weitere Näherung dar. Damit berechnet sich das komplette
Gauß-Integral aus den 1-dimensionalen Integralen entlang der einzelnen Koordinatenachsen:
2
r
Z
π
Wmax √
⇒ Ai =
π
Zi :=
W (xi ) dxi = Wmax
Ai
Zi
R
Y Zi Z ≈ Wmax
.
Wmax
i
Rechnung
Wmax
1
5,929 · 10348
2
1,572 · 10352
3,102 · 10348
3
4
1,374 · 10326
5
3,236 · 10324
6
9,120 · 10245
7
5,047 · 10131
8
9,897 · 1085
9
6,484 · 10−9
10 7,870 · 10−449
Gauß-Näherung
6,383 · 10393
8,818 · 10−841
2,932 · 10−221
4,819 · 10−869
7,194 · 10−211
1,096 · 10−1455
2,825 · 10−770
2,173 · 10−362
5,610 · 10−689
2,825 · 10−779
Tabelle 6.2: Vergleich der gefundenen maximalen Gewichte Wmax und der GaußNäherung.
In Tabelle 6.2 sind für mehrere gefundene Werte Wmax die Gauß-Näherungen berechnet
worden. Um Zi zu berechnen, wurde dabei über einen Bereich 10 Punkte zu beiden Seiten
57
6 Simulationen - Statik
des Maximums auf der Achse xi summiert. Die unterschiedlichen Werte für Wmax stammen aus unterschiedlich gut optimierten Algorithmen zum Auffinden des Maximums. Der
Wert aus Rechnung (1) ist der einzige, der durch die Gauß-Näherung vergrößert wurde.
In allen anderen Fällen oszilliert die Gewichtsfunktion stark und nimmt um das lokale
Maximum herum zu viele negative Werte an. Daraus kann geschlossen werden, dass die
Näherung durch eine Gauß-Funktion nicht sinnvoll ist. Auch scheinen diese Überlegungen nicht zu bestätigen, dass die gefundenen Maxima jeweils einem stationären Zustand
entsprechen, denn dann müssten alle drei Werte der optimierten Rechnungen (1),(2),(3)
hierdurch vergrößert werden.
R
P
2
2
Fehler durch die implizit benutzte Näherung Z e−x ≈ R e−x dx sind vernachlässigbar. Die Eulersche Summenformel lässt iterativ eine obere Schranke hierfür berechnen,
welche aber langsam konvergiert. Einfache Numerik zeigt, dass der Fehler bei etwa 10−4
liegt und auch bei 970 Spins nur 20% Unterschied verursacht. Es ist allerdings zu erwarten, dass die Annahme, A sei diagonal, große Abweichungen mit sich bringt. Auch
zeigen die hohen Schwankungen der Gewichtsfunktion, dass die Gauß-Funktion keine
gute Näherung darstellt.
Eine direkte Monte-Carlo-Integration der Gewichtsfunktion in einem Bereich um das
Maximum erwies sich als unpraktikabel. Die Zwangsbedingungen (Dreiecksungleichungen und ganzzahlige Spinsummen auf Dreiecken) schränken die Punkte, an denen die
Funktion ungleich Null ist, zu stark ein. Eine Summation über Punkte, die diese Bedingungen nicht berücksichtigt, läuft in annehmbarer Zeit nur über Nullstellen. Die
Erzeugung der zufälligen Konfigurationen, über die summiert wird, könnte zwar so umgeschrieben werden, dass sie die Zwangsbedingungen immer erfüllt, dann wäre es allerdings
nötig, zu wissen, wie viele Konfigurationen die Bedingungen erfüllen. Hierfür konnte in
dieser Arbeit keine explizite Formel gefunden werden.
58
7 Simulationen - Dynamik
Ziel dieses Kapitels ist es, eine Möglichkeit zu finden, das Verhalten des Ponzano-ReggeModells für ein größeres Gitter zu berechnen, indem iterativ nur kleine Teile des Gitters
betrachtet werden. Dieses Vorgehen wird hier als Dynamik“ bezeichnet, da die Iteration
”
in einer Koordinatenrichtung ablaufen wird. Es kann somit als Zeitentwicklung eines
Spinnetz-Zustandes angesehen werden. Eine ausführlichere Diskussion folgt in Abschnitt
7.2.2 (Seite 68).
7.1 Dynamische Näherung
7.1.1 Verfahren
A B
t
Abbildung 7.1: Zerlegung des Raumzeit-Gitters in dünne Raumschichten (blau) mit
Grenzflächen (A und B) dazwischen.
Die 3-dimensionale Raumzeit wird in eine Folge dünner raumartiger Schichten aufgeteilt,
die durch eine Zeitkoordinate nummeriert werden. Die Schichten werden dabei durch 2dimensionale Randflächen getrennt, an denen sich benachbarte Schichten berühren. Die
beiden Randflächen einer Schicht werden hier als vergangene“ und zukünftige“ Fläche
”
”
bezeichnet, je nachdem, ob sie die Grenze zur vorangegangenen oder folgenden Schicht
in der Zeitkoordinate bilden.
Auf der vergangenen Randfläche der ersten Schicht werden nun die Spinzahlen vorgegeben,
diese bilden die Daten des Anfangswertproblems der folgenden Simulation. Es kann nun
59
7 Simulationen - Dynamik
für jede Konfiguration von Spinzahlen auf der zukünftigen Fläche der ersten Schicht
eine Zustandssumme für diese Schicht berechnet werden. Sie entspricht einer (nicht
normierten) Übergangsamplitude des vergangenen Spinnetzes zum zukünftigen. Die Aufgabe wird sein, diejenige Spinkonfiguration auf der zukünftigen Schicht zu suchen, die die
höchste Übergangsamplitude besitzt. Der im letzten Kapitel beschriebene Algorithmus
zur Berechnung der Zustandssummen sucht seinerseits nur die Konfiguration im Inneren
der Schicht, die die Gewichtsfunktion maximiert. Daher können die beiden Suchen nach
maximalen Konfigurationen vereint werden, d.h. der Algorithmus variiert nicht nur die
Spinzahlen im Inneren der Schicht sondern auch auf der zukünftigen Randfläche.
Die gefundene Konfiguration auf der zukünftigen Randfläche der ersten Schicht kann im
nächsten Schritt als die vergangene Konfiguration der zweiten Schicht angesehen werden.
Iterativ werden so für alle Schichten Spinkonfigurationen gefunden.
Dadurch dass für jede Schicht nur das zukünftige Spinnetz mit der höchsten Amplitude
berücksichtigt wird, geht hier eine weitere Näherung ein. Erst die im nächsten Abschnitt
vorgestellte Simulation soll dieses Problem beheben.
7.1.2 Krümmung
Für die Auswertung der Simulationen ist es nötig, ein Maß für die Krümmung der
Spinkonfigurationen zu definieren. Es soll eine Größe konstruiert werden, die im Grenzfall
der kontinuierlichen Geometrie in die skalare Krümmung übergeht.
Vi
αi
Vi
α
Abbildung 7.2: Krümmung auf einer Kante (rot), die von mehreren Tetraedern umschlossen wird. Die Innenwinkel der Tetraeder um diese Kante sind αi .
Wie schon in Abschnitt 4.2 (Seite 33) beschrieben ist im Regge-Kalkül die Krümmung im Tetraedergitter auf den Kanten konzentriert. Sie verursacht Winkeldefekte
auf geschlossenen Wegen um diese Kante. Global gilt ein Zusammenhang zwischen den
Kantenlängen lk , Winkeldefekten δk und der totalen Krümmung:
Z
X
R dV = 2
lk δk .
Kanten k
Um R als Funktion vom Ort abschätzen zu können, wird angenommen, dass die Krümmung homogen auf ein bestimmtes Volumen verteilt ist. Dieses Volumen sei
60
7.1 Dynamische Näherung
V =
X
Vi /6 .
Vi sind die Volumen der Tetraeder, die die Kante umschließen. Da jeder Tetraeder sechs
Kanten besitzt, wird sein Volumen auf sechs Krümmungsgebiete verteilt. Das führt zum
Faktor 61 .
P
Die Defekte δk berechnen sich aus der Summe der Innenwinkel α := αi :
δk = 2π − α .
Dann wird die Krümmung im Gebiet V abgeschätzt durch
R=
2 lk (2π − α)
.
V
(7.1)
Das Volumen eines Tetraeders mit Kantenlängen li = ji +1/2 folgt aus Tartaglias Formel
in Determinantenschreibweise1
0 l1 2 l2 2 l6 2
2
2
2
l1
2 02 l3 l5 2
1
2
det l2 l3
V =
0 l4
288
l6 2 l5 2 l4 2 0
1 1 1 1
1
1
1 .
1
0
(7.2)
Der Innenwinkel αi an der Kante l1 lässt sich damit geometrisch herleiten zu
P − MN
cos αi = p
(1 − M 2 )(1 − N 2 )
mit
l2 2 + l6 2 − l4 2
P :=
2 l2 l6
2
l1 + l2 2 − l3 2
M :=
2 l1 l2
2
l1 + l6 2 − l5 2
N :=
.
2 l1 l6
7.1.3 Gitter
Für die Simulationen in diesem Kapitel wurden zwei verschiedene Gitter benutzt.
61
7 Simulationen - Dynamik
Abbildung 7.3: Einfaches, kubisches Gitter. Links ist die elementare Würfel-Zelle aus 5
Tetraedern gezeigt, rechts die Anordnung der Würfel zu einem Gitter.
Kubisches Gitter
In Abb. 7.3 ist die erste Gittervariante zu sehen. Die dünne Schicht in der Raumzeit
besteht aus einer einzelnen Lage von Würfeln, die schachbrettartig in der Ebene angeordnet sind. Jeder Würfel besteht aus 5 Tetraedern.
Dieses Gitter hat den Vorteil, leicht implementierbar zu sein. Allerdings bräuchte es, um
einen
√ flachen Raum zu repräsentieren, zwei verschiedene Kantenlängen im Verhältnis
1 : 2. Da wegen der Gittergeometrie in diesem Fall nur ganzzahlige Spins erlaubt sind,
ist dieses Verhältnis nur schlecht mit kleinen Spinzahlen zu approximieren.
Hexagonales Gitter
Um den flachen Raum besser abbilden zu können, wurde für diese Arbeit ein zweites
Gitter entwickelt.
In Abb. 7.4 ist die Gitterstruktur gezeigt. Die untere ( vergangene“) Grenzfläche der
”
Schicht bildet ein gleichseitiges Dreiecksgitter. Dagegen besitzt die obere Schicht nur die
Symmetrie eines Sechseckgitters, sie ist in der Abbildung blau und gelb dargestellt.
Das Verhältnis der beiden √
verschiedenen Kantenlängen des flachen Raums hat bei diesem
Gitter das Verhältnis 1 : 3. Spinzahlen von 1 und 2 weichen nur um 4% von diesem
Verhältnis ab.
Für beide Gitter wurde die Krümmung einer flachen“ Konfiguration berechnet. Im neuen
”
Gitter ist die Krümmung etwa um den Faktor 14 kleiner, Abb 7.5 zeigt eine direkte
Gegenüberstellung. Dafür wurden jeweils entlang einer Schnittebene durch die Gitterschicht die für die Kanten berechneten Krümmungen innerhalb der jeweiligen Tetraeder
interpoliert.
1
Für die Reihenfolge der Kanten auf dem Tetraeder siehe Abb. 4.2.
62
7.1 Dynamische Näherung
1
2
3
4
Abbildung 7.4: Aufbau des neuen Gitters. Von 1 nach 4 werden die verschiedenen
Tetraedertypen hinzugefügt - graue und gelbe sind jeweils gleichseitig.
Abbildung 7.5: Berechnete Krümmung für flache“ Gitter. Links das kubische, rechts
”
das hexagonale Gitter. Blau ist positive Krümmung, rot negative; Die
Intensität gibt den Betrag an.
Iterationsverfahren
Für jeden Iterationsschritt ist es nötig, von einem Spinnetz auf der Randfläche eine erlaubte Spinkonfiguration im Inneren der Gitterschicht zu finden, die als Ausgangspunkt
für den im letzten Kapitel beschriebenen Suchalgorithmus dient. Für den ersten Schritt
kann dies manuell geschehen. In den weiteren Schritten bietet sich die einfache Lösung an,
von der im jeweils letzten Schritt gefundenen (und gespiegelten) Konfiguration auszugehen. Diese besitzt als Rand das geforderte Spinnetz und erfüllt die an die Tetraeder
63
7 Simulationen - Dynamik
gestellten Bedingungen.
Bei der Suche nach der besten Konfiguration innerhalb der Schichten kann in jedem
Schritt ein Vertex-Punkt auf der zukünftigen Grenzfläche gewählt und die angrenzenden
Spins gekippt werden.
7.1.4 Ergebnisse
Abbildung 7.6: Skalare Krümmung auf einem Schnitt durch zwei gefundene Lösungskonfigurationen. Blau ist positiv, rot negativ und grün imaginär.
Es wurde auf dem hexagonalen Gitter mit Länge und Breite von 16 Gitterzellen gerechnet. Ausgangskonfiguration war das flache Gitter. Alle durchgeführten Rechnungen lieferten schlechte Ergebnisse, wie an zwei Beispielen gezeigt werden soll.
In Abb. 7.6 sind die ausgewerteten Krümmungen auf jeweils einer Schnittebene durch
das Gitter in Raumrichtung zu sehen. Das linke Bild stammt von einer Rechnung mit maximal erlaubtem Spin von 10, in der der Suchalgorithmus für die optimale Konfiguration
noch nicht optimiert war. Das rechte Bild stammt von einem optimierten Algorithmus
mit maximalem Spin von 50.
Die Ergebnisse der unoptimierten Simulation waren zu verrauscht und ließen auch in der
Zeitentwicklung keinerlei Struktur erkennen.
Nach der Optimierung wurden die gefundenen Konfigurationen von Spinzahlen dominiert, die den höchsten in der Simulation erlaubten Wert annahmen. Abb. 7.7 zeigt die
Häufigkeitsverteilungen der Spins. Deutlich zu erkennen ist der Peak beim maximalen
Wert 50. Dieser ist ein unphysikalisches Artefakt der Begrenzungen in der Simulation
und wird wahrscheinlich durch das divergente Verhalten der Zustandssumme begünstigt.
Die hohe Zahl von Spins mit Wert 2 hingegen scheint physikalischer Natur zu sein.
64
7.1 Dynamische Näherung
14000
12000
Haeufigkeit
10000
8000
6000
4000
2000
0
0
10
20
30
40
50
Spin
Abbildung 7.7: Häufigkeitsverteilung der Spinwerte in der Lösungskonfiguration.
Merkwürdige Tetraeder
In den Rechnungen traten 2 interessante Sonderfälle für Konfigurationen der Tetraeder
auf:
Es kommt vor, dass das 6j-Symbol Null wird, obwohl alle Bedingungen erfüllt sind
und die Kantenlängen einen nicht entarteten Tetraeder ergeben. Da jeder Wert der 6jSymbole multiplikativ in das Gewicht eingeht, verschwindet dann der komplette Anteil
der Konfiguration in der Zustandssumme. So ist z.B.
2 2 2
=0.
4 5 5
Im anderen Fall ist der Wert des 6j-Symbols endlich und die Bedingungen erfüllt, aber
die Kantenlängen lassen sich nicht zu einem Tetraeder im R3 verbinden. Die Formel
(7.2) ergibt dann ein imaginäres Volumen des Tetraeders. Auch der Innenwinkel wird
imaginär. Z.B. gilt:
1
3 5 2
= √
2 2 3
7 6
65
7 Simulationen - Dynamik
7 2
11 2
7 2
0
7 2 ( 2 ) ( 25 )2 ( 52 )2
( )
0
(2) (2)
2
11
1
2
5 2
2
0
( 25 )2
det ( 2 ) ( 2 )
V =
288
( 7 )2 ( 5 )2 ( 5 )2
0
2
2
2
1
1
1
1
1
1
4175
1 = −
.
4608
1
0
Bei der Auswertung wurde hierbei mit komplexen Volumina und Winkeln gerechnet,
weshalb sich auch teilweise eine komplexe skalare Krümmung ergab.
7.2 Eingeschränkte Dynamik
7.2.1 Verfahren
Das Ziel der neuen Zeitentwicklung ist es, weniger chaotische Konfigurationen zu finden.
Diese sollen auch weniger vom Cut-Off Wert der Spinzahlen abhängen. Darüber hinaus
soll der Quantencharakter der Theorie berücksichtigt und mit Linearkombinationen statt
nur mit einzelnen Konfigurationen gerechnet werden.
Dazu wird eine kleine Zahl von Spinnetzen S1 , . . . , Sn für die Grenzflächen der Gitterschicht vor der Simulation gewählt. Für jede Wahl eines Spinnetzes Si für die vergangene Fläche und eines weiteren Sk für die zukünftige lässt sich für diese Schicht eine
Übergangsamplitude Aik als Zustandssumme berechnen. Diese wird weiterhin durch das
Gewicht der dominanten Konfiguration im Inneren der Schicht approximiert.
Nun soll die Zustandssumme für die Vereinigung zweier aufeinander folgender Gitterschichten berechnet werden. Dazu seien wieder auf den beiden Flächen, die das Gitter
begrenzen, jeweils ein Spinnetz Si und Sk gegeben. Die Zustandssumme läuft nun über
alle möglichen Konfigurationen in den beiden Gitterschichten, sowie über die Grenzfläche
zwischen den beiden. Seien {j1 } und {j2 } die Spins innerhalb der ersten bzw. zweiten
Schicht, sowie {jG } die Spins auf der Grenzfläche dazwischen. Dann gilt
X
Z(Si , Sk ) =
W1 (Si , {j1 }, {jG }) WG ({jG }) W2 ({jG }, {j2 }, Sk )
{j1 },{jG },{j2 }

=
X
{jG }
≈
X
WG ({jG }) 

X
W1 (Si , {j1 }, {jG })
{j1 }
WG (Sm ) Aim Amk .
X
W2 ({jG }, {j2 }, Sk )
{j2 }
(7.3)
m
Entsprechend kann für jede höhere Zahl von Iterationsschritten die Übergangsamplitude
nach diesem Muster berechnet werden. D.h. die gesamte Dynamik folgt aus den einmal
bestimmten Amplituden Aik .
66
7.2 Eingeschränkte Dynamik
In der Simulation wird ein Zustandsvektor als Linearkombination von Spinnetzen auf
einer Anfangsfläche aufgefasst. Dessen Zeitentwicklung soll über die Amplituden in (7.3)
berechnet werden.
Das ganze entspricht einer Einschränkung des Zustandsraumes für die Grenzflächen auf
einen n-dimensionalen Unterraum, der nur von den Spinnetzen Si erzeugt wird. Würde
eine genügend hohe Zahl von Spinnetzen gewählt werden und wäre es möglich, die einzelnen Übergangsamplituden Aik ohne Näherung zu berechnen, so wäre dieses Verfahren
exakt. Vor allem entfällt die Näherung der im letzten Abschnitt behandelten Dynamik,
dass für jeden Zeitschritt nur ein einzelner Basiszustand betrachtet wird.
Übergangsamplituden
Wieder werden die einzelnen Aik durch die dominante Konfiguration im Inneren der
Gitterschicht genähert. Allerdings versagt das bisherige Verfahren, Vertex-Punkte zu
wählen und benachbarte Spins zu kippen. Die Gitterschicht besteht nur aus einer einzelnen Lage von Tetraedern, jeder Vertex-Punkt gehört somit zu einer Randfläche, auf
denen die Spins durch die Spinnetze festgelegt sind. Deshalb würde jeder Kippvorgang
die Spinnetze ändern.
Änderungen einzelner Spins im Inneren sind weiterhin möglich, solange nicht zwischen
ganz- und halbzahlig gewechselt wird. Dann müssen wieder nur die Dreiecksungleichungen erfüllt bleiben.
Seien nun z.B. alle Spins im Gitter ganzzahlig2 . Wird ein Spin durch das Kippen halbzahlig, so kann dies (wie in Abschnitt 6.3.2 (Seite 52) beschrieben) als ein Stück einer
Fläche durch diese Kante angesehen werden. Die Theorie fordert, dass diese Fläche entweder geschlossen ist, oder dass ihr Rand auf dem Rand des Gitters liegt. Um geschlossen
sein zu können, muss sie einen Vertex-Punkt umschließen, dazu fehlen allerdings VertexPunkte im Inneren des Gitters. Weil die Konfigurationen auf vergangener und zukünftiger Grenzfläche vorbestimmt sind, bleibt nur die Möglichkeit, dass die neue Fläche von
halbzahligen Spins die gesamte Gitterschicht parallel durchdringt. D.h. wenn ein einzelner Spin halbzahlig wird, müssen alle anderen Spins im Inneren der Schicht ebenfalls
halbzahlig werden.
Andererseits ist es sehr schwer, alle Spins im Inneren auf einmal zu kippen. Dafür ist die
hohe Anzahl von gleichzeitig zu berücksichtigenden Dreiecksungleichungen zu hoch. Es
ist zwar immer möglich alle Spins um 21 zu erhöhen, das würde allerdings dazu führen,
dass Konfigurationen mit hohen Spinzahlen bei der Suche deutlich bevorzugt werden.
Eine einfache Lösung dieses Problems liegt darin, mit zwei Kopien des Gitters zu arbeiten. Bei der einen werden anfangs alle Spins um 12 erhöht. Danach werden in beiden Gittern unabhängig voneinander neue Konfigurationen erzeugt, ohne dabei weitere
Übergänge zwischen ganz- und halbzahligen Spins mehr zu vollziehen.
2
Die Folgerung ist für beliebige Spins analog, allerdings ist sie dann weitaus aufwändiger in Worte zu
fassen.
67
7 Simulationen - Dynamik
7.2.2 Interpretation
In der Schrödingermechanik beschreibt die Wellenfunktion Ψt0 (x) ∈ Ht0 ein System zu
einem festen Zeitpunkt t0 . Das Wissen der Zustände zu allen Zeiten kann als relativistische Verallgemeinerung des Zustands-Begriffs angesehen werden und ist Lösung der
Schrödinger-Gleichung. Er soll hier als relativistischer Zustand Ψ(x, t) ∈ H bezeichnet
werden. Die Schrödinger-Gleichung wirkt auch als Abbildung P : Ht0 → H : Ψt0 (x) 7→
Ψ(x, t). Die Übergangsamplitude zwischen zwei Zuständen Ψt1 (x) und Φt2 (x) zu verschiedenen Zeiten kann geschrieben werden als
hΨ(t2 )|Φt2 i = hP Ψt1 |Φt2 i =: hΨt1 |Φt2 iphys
und wird das physikalische Skalarprodukt genannt. Eine mögliche Konstruktion von P ist
als Pfadintegral. Sei dazu Ψt1 ein Eigenvektor zu x. Dann ist (P Ψt1 )(y, t2 ) die (normierte)
Summe von Gewichten aller klassischen Pfade x(t) mit x(t2 ) = y und x(t1 ) = Ψt1“.
”
Hier bezeichnet die klassische Variable x ein Spinnetz. Ein Zustand Ψt0 (x) gibt jedem
möglichen Spinnetz eine Amplitude. Ein Spin-Schaum entspricht dann einem klassischen
Pfad, der zwei Spinnetze xt1 und yt2 verbindet. Die Übergangsamplitude als Summe
der Gewichte aller Spin-Schäume gibt somit einen einzelnen Wert (PΨx,t1 )(y, t2 ) des
relativistischen Zustandes PΨx,t1 an. Somit konstruiert die hier beschriebene Methode
iterativ die Abbildung P und damit eine Dynamik eines Spin-Netzwerk-Zustandes.
7.2.3 Spinnetze
In der Simulation werden 10 Spinnetze verwendet (siehe Abb. 7.8). Zur Berechnung
der Übergangsamplituden war es notwendig von einer Spinkonfiguration auf der Gitterschicht auszugehen, die auf dem Randgebiet durch die Spinnetze festgelegt ist. Diese
Suche nach einer Startkonfiguration ist dank der hohen Zahl von Bedingungen äußerst
schwierig. Deshalb war es nötig, die Spinnetze als eine Folge von Spin-Additionen in der
Umgebung von Vertex-Punkten in einem flachen Anfangsgitter darzustellen.
Die Zahl der verwendeten Spinnetze wurde durch den hohen Rechenaufwand für die
Übergangsamplituden begrenzt. Die Berechnung der 102 = 100 Amplituden dauerte
trotz hoher Parallelisierung etwa 10 Tage. Man beachte dabei, dass die Matrix Aij nicht
symmetrisch ist, da die gewählte Gitterschicht unterschiedliche Struktur auf ihren beiden
Grenzflächen besitzt.
Um die 10 Spinnetze qualitativ beschreiben zu können, sind in Tabelle 7.1 Ausdrücke
der Krümmung berechnet:
• der maximale Wert des Betrags der Krümmung (|R|max )
• die totale Krümmung, also das Integral über die skalare Krümmung:
Z
Rtotal := R dV
68
7.2 Eingeschränkte Dynamik
Abbildung 7.8: Die skalare Krümmung der 10 Spinnetze, die in dieser Simulation verwendet werden (blau ist positiv, rot negativ). Um diese Bilder zu erzeugen,
wurden sie jeweils in ein ansonsten flaches Gitter eingebettet.
l
• der maximale Spin, der einer Kante im flachen Gitter hinzuaddiert wurde
In Rtotal wurde die Krümmung auf der Grenzfläche zwischen zwei Schichten des hexagonalen Gitters über diese beiden Schichten integriert. Das Gitter hatte eine Länge und
Breite von jeweils 16 Zellen, das Spin-Netzwerk bildete dabei die Grenzfläche. Von den
in Abb. 7.8 zu sehenden Störungen abgesehen befanden sich die Gitter in der weiter oben
beschriebenen flachen“ Konfiguration mit Spinzahlen 1 und 2.
”
7.2.4 Ergebnisse
Alle 10 Spinnetze wurden nacheinander als Anfangszustand für eine Zeitentwicklung
verwendet. Abb. 7.9 zeigt als Beispiel die Entwicklung des Zustands S1 , der dem flachen
Raum entspricht3 . Das Ergebnis ist aber für alle Anfangszustände sehr ähnlich.
3
In den Abbildungen wird jeweils nur jeder zweite Iterationsschritt gezeigt, da erst in jedem zweiten Schritt dieselbe Gitterstruktur erreicht wird. Die ungeraden Iterationsschritte folgen aus einer
linearen Abbildung aus den geradzahligen.
69
7 Simulationen - Dynamik
Netz |R|max Rtotal ∆jmax
1 0,349 -68,5
0
2
2 0,858 -62,0
3 0,928
35,6
4
93,4
8
4 0,928
5 0,928 219,8
8
6 0,928 319,9
8
8
7 0,928 371,5
8 0,928 403,8
8
8
9 0,928 397,0
10 0,928 312,5
8
Tabelle 7.1: Daten der verschiedenen Spinnetze: maximaler Betrag der skalaren Krümmung, totale Krümmung sowie maximaler Spinunterschied zum flachen Gitter.
1
S1
S2
S3
S4
1e-05
S5
S6
S7
S8
S9
S10
1e-10
Amplitude
1e-15
1e-20
1e-25
1e-30
1e-35
0
50
100
150
Iterationen
200
250
300
Abbildung 7.9: Zeitentwicklung des (flachen) Spin-Netzwerk-Zustands S1
Endzustand
Für alle Anfangszustände konvergiert die Simulation in denselben, stabilen Endzustand,
der von den beiden flachsten“ Spinnetzen S1 und S2 dominiert wird. Im Falle des S1
”
70
7.2 Eingeschränkte Dynamik
1
S1
S2
S3
S4
1e-05
S5
S6
S7
S8
S9
S10
1e-10
Amplitude
1e-15
1e-20
1e-25
1e-30
1e-35
0
50
100
150
Iterationen
200
250
300
Abbildung 7.10: Zeitentwicklung des Spin-Netzwerk-Zustands S3
ist dieser Zustand nach etwa 150 Iterationen erreicht. Der Endzustand lässt sich auch
direkt berechnen.
Die Zeitentwicklung lässt sich als einfache Matrixmultiplikation beschreiben. Jede Komponente des Zustandsvektors ist als Amplitude eines Spinnetz-Basiszustands zu sehen
und wird im ersten Schritt entsprechend den Übergangsamplituden Aik auf die Komponenten des zeitlich folgenden Vektors abgebildet. Insgesamt entspricht der erste Zeitschritt
also der Multiplikation mit der Matrix A.
In allen weiteren Schritten müssen die einzelnen Komponenten des Vektors, wie aus Gleichung (7.3) abzulesen, zuerst mit einem Gewichtsfaktor für die Spinnetze multipliziert
werden. Diese Operation kann als Multiplikation mit einer diagonalen Matrix D interpretiert werden. Vom ersten Zeitschritt abgesehen erfolgt also der Übergang von einem
Zeitpunkt zum nächsten über die Matrix
M = AD .
Weil in dieser Simulation eine Gitterschicht mit unterschiedlichen Grenzflächen verwendet wird, sollte streng genommen mit der Entwicklung über zwei Zeitschritte hinweg
gerechnet werden, um die Vektoren vergleichen zu können. Die Matrix ist nun
M2 = AT DAD .
71
7 Simulationen - Dynamik
1
2
3
4
5
6
7
8
9
10
Eigenwert
0,583
0,414
2,741 · 10−3
1,000 · 10−8
1,449 · 10−12
8,218 · 10−15
(1,142 + 1,464i) · 10−17
(1,142 − 1,464i) · 10−17
0
0
Tabelle 7.2: Die Eigenwerte der Matrix M2 .
1
2
3
4
5
6
7
8
9
10
0,583
0,414
0,03173 1 − 7,216 · 10−8
0,9994
3,799 · 10−3
5,988 · 10−9
4,098 · 10−12
−16
3,938 · 10
6,506 · 10−21
3,493 · 10−21
1,253 · 10−28
7,462 · 10−21
−7,107 · 10−30
−23
5,930 · 10
−6,264 · 10−32
5,701 · 10−22
−6,023 · 10−31
−27
2,899 · 10
3,354 · 10−35
4,511 · 10−18
−4,766 · 10−27
Tabelle 7.3: Die Eigenvektoren zu den beiden höchsten Eigenwerten der Matrix M2
Der in Abb. 7.9 zu sehende Endzustand ist exakt der Eigenvektor der Matrix M2 zum
Eigenwert4 0,583. Da dies der höchste reelle Eigenwert ist (siehe Tabelle 7.2) und die
Dynamik einer iterativen Multiplikation mit der Matrix M2 entspricht, ist also auch zu
erwarten, dass dieser Eigenvektor einen stabilen Endzustand darstellt.
Anfangszustand
In Abb. 7.9 kann für die ersten Zeitschritte gesehen werden, dass die Anteile mit hoher
Amplitude die ersten 50 Iterationen fast konstant bleiben, bis sie in den Endzustand
zerfallen. Dieser Anfangszustand entspricht dem Eigenvektor zum zweit höchsten Eigenwert von M2 und ist auch in allen Zeitentwicklungen der anderen Spinnetze (z.B. Abb.
4
Die Matrix wurde zur leichteren Handhabung durch ihre Spur geteilt, da ein skalarer Faktor keinen
Einfluss auf die Dynamik hat. Deshalb besitzen hier auch nur Verhältnisse von Eigenwerten eine
Bedeutung.
72
7.2 Eingeschränkte Dynamik
7.10) mehr oder wenig stark ausgeprägt. Seine recht hohe Stabilität lässt sich dadurch
begründen, dass die beiden höchsten Eigenwerte nahe bei einander liegen.
Im Inneren der Gitterschicht
Für jede Übergangsamplitude zwischen Zuständen Si und Sj wurde nur der höchste
Summand in der Zustandssumme gesucht. Diesem Summanden entspricht eine Spinkonfiguration im Innern des Gitters, die die Gewichtsfunktion maximiert.
Abbildung 7.11: Die skalare Krümmung im Inneren der Gitterschicht bei der Übergangsamplitude des Spin-Netzwerk-Zustandes S4 zu sich selbst.
Für alle Übergänge wurden die maximierenden Konfigurationen näherungsweise bestimmt und jeweils die Krümmung berechnet. In Abb. 7.11 ist exemplarisch der Übergang
von S4 nach S4 zu sehen. In allen Fällen ist deutlich erkennbar, dass die Krümmung stark
fluktuiert, wo die Spinnetze einem flachen Raum entsprechen. Andererseits verschwindet
sie an den Stellen, an denen die Spinnetze gekrümmt sind.
Es wird angenommen, dass die Krümmung der Spinnetze stärkere Bedingungen an
mögliche Spin-Konfigurationen im Inneren stellt und damit nur kleinere Schwankungen
erlaubt.
Dies könnte physikalisch so interpretiert werden, dass um den flachen Raum, der der Lösung der Feldgleichungen in drei Dimensionen entspricht, stärkere Quantenfluktuationen
möglich sind, da dies lokal ein stationärer Zustand ist.
Verhalten
Die Dynamik hat eindeutig dissipativen Charakter. Dies folgt daraus, dass ein stabiler
Endzustand angestrebt wird, und dass von den kleinsten abgesehen alle Eigenwerte der
Matrix M2 reell sind.
73
7 Simulationen - Dynamik
Dies würde in vier Dimensionen auch die Erwartung aus der Theorie bestätigen. Für eine
Metrik mit Lorentz-Signatur ähneln die Feldgleichungen dann einer Wellengleichung. Der
Übergang zu einer euklidischen Signatur entspricht einer Imaginärzeit-Entwicklung. In
dieser wird eine Wellengleichung dissipativ. In drei Dimensionen ist die einzige Lösung
der Feldgleichungen der flache Raum. Die Iterationsschritte entsprechen dann der Bildung des Kontinuumslimes für ein großes Gitter. Hier scheint dann die Dominanz der
flacheren Zustände hervorzutreten.
1
Endzustand
Fitkurve exp(-Rtotal)
1e-05
Amplitude
1e-10
1e-15
1e-20
1e-25
1e-30
-100
-50
0
50
100
150
200
250
totale Kruemmung Rtotal
300
350
400
450
Abbildung 7.12: Die Amplituden der Komponenten im Endzustand über der totalen
Krümmung der zugehörigen Spinnetze.
Beim Vergleich der Komponenten des gefundenen Endzustandsvektors mit den berechneten Werten der totalen Krümmung der einzelnen Spinnetze (Abb. 7.12) fällt ein exponentieller Zusammenhang zwischen beiden Größen auf. Interpretiert man die Spinzahlen
innerhalb der Gitterschicht als zeitliche Entfernung zwischen den Zuständen bei der Iteration und sieht diese als etwa konstant an, ergibt sich ein fester Zeitschritt ∆t bei der
Entwicklung. Die klassische Wirkung ist gerade die totale Krümmung. Für eine Gitterschicht ist diese zur Energie proportional: S = E·∆t. Dies führt auf einen Zusammenhang
zwischen den Amplituden Ai der Spin-Netzwerke im Endzustand und deren Energie Ei :
Ai ∝ e−k·Ei .
74
7.2 Eingeschränkte Dynamik
Die Ermittlung der totalen Krümmung für die einzelnen Spinnetze ist allerdings einer
gewissen Willkür unterworfen, da die Krümmung nur für eine Einbettung des Spinnetzes
als Fläche in den Raum berechnet werden kann. Hierzu wurde eine einfach implementierbare Variante gewählt, in der das Spinnetz als Menge von Operationen auf Gitterpunkten des flachen Raumes behandelt wird. Somit wird auch die Krümmung innerhalb
des Volumens der Gitterschichten beeinflusst. Es müsste auch überprüft werden, in wie
weit dieses Ergebnis von den Näherungen bei der Berechnung der Übergangsamplituden
abhängt.
75
7 Simulationen - Dynamik
76
8 Zusammenfassung und Ausblick
8.1 Zusammenfassung
In dieser Arbeit wurde ein Verfahren entwickelt, das erlaubte Spin-Konfigurationen auf
Spin-Schäumen modifizieren kann, ohne dabei die Zwangsbedingungen zu verletzen.
Dieses wurde dazu verwendet mit Hilfe eines Monte-Carlo ähnlichen Algorithmus die
Zustandssumme des Ponzano-Regge-Modells zumindest näherungsweise zu berechnen.
Es stellte sich heraus, dass die auftretende Gewichtsfunktion ein sehr komplexes Verhalten besitzt und nur schwer numerisch integrierbar ist. Methoden zur analytischen
Näherung der auftretenden 6j-Symbole waren nicht anwendbar und auch der Versuch
einer Gauß-Näherung der Zustandssumme schlug fehl.
Um das Verfahren auf verschiedene Räume anwenden zu können, wurde ein Algorithmus entwickelt, der zufällige Triangulierungen für eine beliebig wählbare Raumtopologie
Konstruiert. In dieser Arbeit wurden hauptsächlich 3-Sphären verwendet, um darauf die
Näherungen zu testen.
Darüber hinaus wurden zwei Möglichkeiten getestet, die Zustandssumme eines großen
Gebietes iterativ durch kleine Teilstücke zu berechnen. Dieses Vorgehen entspricht einer
Zeitentwicklung von Spin-Netzwerk-Zuständen. Die erste dieser Dynamiken wurde zu
sehr von den eingegangenen Näherungen und dem ungeeigneten Regularisierungsverfahren der Divergenzen dominiert. Es wurde eine zweite Dynamik entwickelt, die auf
einem kleineren Zustandsraum abläuft und dafür auf einige der Näherungen verzichten
kann. Eine mit dieser Dynamik durchgeführte numerische Simulation führte zu auswertbaren Ergebnissen. Die Zeitentwicklung hat dissipativen Charakter und läuft in einen
stabilen Endzustand, der hauptsächlich von Anteilen annähernd flacher Räume dominiert
wird. Dies bestätigt die Erwartung, dass im Grenzfall größerer Gitter die klassische Lösung hervortritt.
Die Simulation zeigt auch starke Fluktuationen um die klassische Vakuum-Lösung, die
durch auferzwungene Krümmung vermindert wird. Es ist allerdings möglich, dass dieses
Verhalten ein Artefakt der verwendeten Methoden ist, weshalb eine Überprüfung auf
anderen Wegen sinnvoll wäre.
8.2 Ausblick
• Die wichtigste Verbesserung wäre eine exaktere Berechnungsmöglichkeit der Zustandssummen zu finden. Die Näherungsverfahren erwiesen sich als sehr ungenau.
77
8 Zusammenfassung und Ausblick
Es scheint nicht besonders sinnvoll, den Algorithmus für die Suche nach dem höchsten Gewicht zu verbessern. Statt dessen sollten mehr Summanden berücksichtigt
werden, vielleicht eine globalere Näherung für die Gewichtsfunktion gefunden werden. Der optimale Weg wäre allerdings die Summe auf einem anderen Weg exakt zu
berechnen. Es wäre denkbar, dass sich eine gruppentheoretische Umformulierung
finden lässt, die einfacher zu berechnen ist.
Die darauf aufbauenden Simulationen würden dadurch stark profitieren und vor
allem an Aussagekraft gewinnen.
• Es wäre sehr interessant, den 4-dimensionalen Fall des Barrett-Crane-Modells zu
betrachten. Dadurch würde sich eine reichere Fülle an klassischen Lösungen und
quantenmechanischen Dynamiken ergeben. Formal ähnelt dieses dem PonzanoRegge-Modell, weshalb die Simulationen nur wenig abgeändert werden müssen.
Einige der Programme sind sogar schon allgemein genug implementiert.
• Auch die entwickelten Methoden zur Gittererzeugung mit interessanterer Topologie
wurden wenig genutzt. Es wäre unter anderem möglich, auch die Dynamik auf diese
Topologien auszuweiten.
• Während der Arbeit mit dem Ponzano-Regge-Modell kam die Frage auf, in wie
weit sich die quantenmechanische Theorie als Fluktuation von Masseströmen interpretieren ließe. Klassisch ist die Lösung der Vakuum-Feldgleichungen in drei Dimensionen der flache Raum. In der Quantenmechanik wird über gekrümmte Räume
summiert. Diese Krümmung ist auf die Kanten des Gitters beschränkt. Klassisch
würden Masseströme entlang der Kanten genau diese Art von Ricci-Krümmung
erzeugen. Die Spin-Schaum-Theorie wäre dann eine quantenmechanische Fluktuation von möglichen Masseströmen relativ zum Vakuum.
78
A Riemannsche Geometrie
Gute Grundlagen können in [13] und [21] gefunden werden.
A.1 Mannigfaltigkeiten
Die Mannigfaltigkeit verallgemeinert den Begriff des ( flachen“) Vektorraumes und er”
möglicht es, auch mit gekrümmten Räumen zu rechnen, indem diese über Kartenabbildungen auf einen Rn zurückgeführt werden:
M
U
V
Ψ
R
n
Ψ Φ
−1
R
n
Φ
Abbildung A.1: Kartenabbildungen einer Mannigfaltigkeit
Definition 1 Eine n-dimensionale differenzierbare Mannigfaltigkeit M ist ein
Hausdorff-Raum mit einer Familie (Ui , Ψi )i∈I offener Untermengen Ui ⊂ M ( Kartenge”
biete“) und dazugehörigen Abbildungen Ψi ( Kartenabbildungen“) mit folgenden Eigen”
schaften:
S
• M = i∈I Ui (die Kartengebiete überdecken ganz M )
79
A Riemannsche Geometrie
• ist (U, Ψ) ein Kartengebiet, dann ist Ψ : U → Rn injektiv und Ψ(U ) offen
• sind (U, Ψ), (V, Φ) Kartengebiete mit U ∩ V 6= ∅, so ist die Abbildung Ψ ◦ Φ−1 :
Φ(U ∩ V ) → Ψ(U ∩ V ) (Kartenwechsel) differenzierbar im Rn
Der Einfachheit halber werden innerhalb eines festen Kartengebietes die Komponenten
der Kartenabbildung eines Punktes p ∈ M mit xµ := Ψµ (p) ∈ R bezeichnet.
Definition 2 Eine (reelle) differenzierbare Funktion f auf M ist eine Abbildung
f : M → R, deren Koordinatenrepresentation f ◦ Ψ−1 : Rn → R differenzierbar ist. Die
Menge aller differenzierbaren Funktionen auf M sei F(M ).
Aus physikalischer Sicht können diese Funktionen als skalare Felder angesehen werden
und werden im Folgenden auch so bezeichnet.
A.2 Tangentialraum
Vektoren auf M können auf verschiedene Arten definiert werden. Hier sei der Tangentialraum die Menge der Differentialoperatoren auf skalaren Funktionen.
Definition 3 Ein Vektor X ist ein Differentialoperator auf F(M ) (ist linear und erfüllt
die Produktregel).
Die Menge aller Vektoren eines Punktes p ∈ M wird Tangentialraum Tp M genannt.
Die Koordinatenableitungen {eµ := ∂µ := ∂x∂ µ } bilden eine Basis.
Eine alternative und anschauliche Definition von Vektoren sind Kurven durch einen
Punkt, bzw. deren Äquivalenzklassen bezüglich der Tangente.
Sind Koordinaten auf M gegeben, so lässt sich ein Vektor durch Komponenten in einer
Basisentwicklung beschreiben: X = X α ∂α (Einsteinsche Summenkonvention).
Definition 4 Nützliche Begriffe:
• ein Vektorfeld ist eine Abbildung, die jedem Punkt p einen Vektor aus Tp M
zuordnet
• es ist differenzierbar, wenn seine Koordinaten differenzierbar sind
• die Menge aller differenzierbaren Vektorfelder sei X(M )
• die Lie-Klammer von Vektorfeldern ist wieder ein Vektorfeld, es ist über seine
Wirkung auf Skalarfelder definiert: [X, Y ]f := X(Y (f )) − Y (X(f ))
• der Dualraum Tp? M ist die Menge der linearen Abbildungen Tp M → R und isomorph zu Tp M
80
A.3 Metrik
• ein r-fach kovarianter, s-fach kontravarianter Tensor ist eine multilineare Abbildung Tp M × · · · × Tp M × Tp? M × · · · × Tp? M → R
|
{z
} |
{z
}
r mal
s mal
Als Basis des Dualraumes wird die Dualbasis {dxµ } über die Relation dxµ (∂ν ) = δνµ
gewählt.
,...,αs
dxβ1 ⊗ · · · ⊗ dxβr ⊗ ∂α1 ⊗
Die r-s-Tensoren lassen sich hiermit schreiben als T = Tβα11,...,β
r
µ1 ,...,µs
µ1
· · · ⊗ ∂αs mit Komponenten Tν1 ,...,νr = T (∂ν1 , . . . , ∂νr , dx , . . . , dxµs ).
A.3 Metrik
Die Metrik ist das Skalarprodukt auf jedem Tangentialraum:
Definition 5 Eine Metrik ist ein symmetrisches, positiv definites und 2-fach kovariantes Tensorfeld g auf M .
Um auch das relativistische Skalarprodukt mit einschließen zu können, sei hier auch der
indefinite Fall gestattet.
In Koordinaten ist das Skalarprodukt gegeben durch
g(X, Y ) = gαβ dxα ⊗ dxβ (X γ ∂γ , Y δ ∂δ ) = gαβ X γ Y δ dxα (∂γ ) dxβ (∂δ ) = gαβ X α Y β .
Die Metrik ist außerdem ein Isomorphismus zwischen Tangentialraum und Dualraum:
Tp M → Tp? M : X 7→ g(X, ·) = X̃ = Xα dxα . In Koordinaten wird dies genutzt, um
Indizes zu heben und zu senken: Xµ = gµα X α .
A.4 Zusammenhang und Krümmung
Eine Richtungsableitung für Vektorfelder zu definieren ist komplizierter, als für Skalarfelder, und außerdem einer gewissen Willkür unterlegen. Erst durch zusätzliche Forderungen ist es möglich, eine eindeutige Ableitung zu definieren:
Definition 6 Der Levi-Civita-Zusammenhang ist eine Abbildung
X(M ) × X(M ) → X(M ) : (X, Y ) 7→ ∇X Y
mit:
• ∇ ist linear im ersten Parameter und derivativ im zweiten
(Produktregel)
• der Torsionstensor ist T (X, Y ) := ∇X Y − ∇Y X − [X, Y ] = 0
(torsionsfrei)
81
A Riemannsche Geometrie
• Xg(Y, Z) = g(∇X Y, Z) + g(Y, ∇X Z)
(verträglich mit der Metrik)
Der Zusammenhang wird auch kovariante Ableitung“ genannt.
”
Theorem 1 Der Levi-Civita-Zusammenhang ist eindeutig und wird durch die KoszulFormel bestimmt:
2g(∇X Y, Z) =Xg(Y, Z) + Y g(X, Z) − Zg(X, Y )
− g(Y, [X, Z]) − g(X, [Y, Z]) − g(Z, [Y, X]) .
Ein Beweis hierfür ist in [13] nachzulesen.
Für die Koordinatenschreibweise werden die Christoffelsymbole eingeführt:
1
Γρµν := g ρα (−∂α gµν − ∂ν gµα + ∂µ gνα ) .
2
Sie beschreiben die Ableitung der Basisfelder (∇∂µ ∂ν = Γαµν ∂α ). Mit ihnen nimmt die
kovariante Ableitung folgende Form an:
∇X Y = ∇(X α ∂α ) Y β ∂β = X α ∂α Y β + Γβαγ Y γ ∂β =: X α ∇α Y β ∂β .
Definition 7 Der Krümmungstensor ist gegeben durch
R(X, Y )Z := ∇X ∇Y Z − ∇Y ∇X Z − ∇[X,Y ] Z
seine Komponenten sind
Rµ νρσ = ∂ρ Γµνσ − ∂σ Γµνρ + Γανσ Γµαρ − Γανρ Γµασ .
Krümmungstensor und Zusammenhang sind eng mit dem Paralleltransport verbunden: In einem gekrümmten Raum gibt es keine eindeutige Parallelitätsbeziehung für
Vektoren an verschiedenen Punkten. Es ist nur noch möglich, von Parallelität entlang
eines Weges zu sprechen. Formal ist ein Vektorfeld X parallel entlang einer Kurve γ,
wenn gilt:
dγ(t)
dt
also, wenn die kovariante Ableitung des Feldes in Richtung der Kurventangente verschwindet.
Anschaulich entspricht der Krümmungstensor R(X, Y )Z der Änderung eines Vektors Z
beim Paralleltransport entlang einer geschlossenen Kurve, die von den ( sehr kleinen“)
”
Vektoren X und Y aufgespannt wird (Abb. A.2).
∇γ̇ X = 0
82
mit γ̇ :=
A.4 Zusammenhang und Krümmung
−X
Z
−Y
X
Y
Abbildung A.2: Die Wirkung des Krümmungstensors auf einen Vektor Z als Differenz
beim Paralleltransport um das kleine“ Parallelogramm mit Kanten X
”
und Y .
Definition 8 Der Ricci-Tensor entsteht durch Spurbildung aus dem Krümmungstensor:
Ric(Y, Z) := dxα (R(∂α , Y )Z)
in Komponenten:
Rµν = Rα µαν .
Durch weitere Spurbildung entsteht der Krümmungsskalar:
R = g αβ Rαβ = Rα α .
Die anschauliche Bedeutung des Ricci-Tensors ergibt sich aus den Schnittkrümmungen“:
”
In einer 2-dimensionalen Fläche ist nur eine skalare Krümmung möglich. Sie ist positiv
für eine Kugeloberfläche und negativ für eine Sattelfläche. In einem höherdimensionalen
Raum ist dann Ric(X, X) die Summe der Schnittkrümmungen aus den zu X senkrechten
2-dimensionalen Flächen durch einen Punkt.
In der Relativitätstheorie ist der Ricci-Tensor eine zentrale Größe und beschreibt für eine
freifallende Wolke“ aus Teilchen, wie sich ihr Volumen mit der Zeit verändert, abhängig
”
von ihrem Geschwindigkeitsvektor.
83
A Riemannsche Geometrie
84
B Differentialformen
B.1 Definition
Eine Kurzfassung:
Definition 9 Für eine Mannigfaltigkeit M sind die Differentialformen kovariante
Tensorfelder, die in allen Parametern antisymmetrisch sind.
Vk Die Tensoren k-ter Stufe
werden k-Formen
genannt.
Die
Menge
der
k-Formen
ist
(M ), die Menge aller DiffeV
rentialformen (M ).
Entsprechend dem Tensorprodukt ⊗ gibt es das äußere Produkt
∧:
Man setzt hierzu
felder).
V1
k
^
l
k+l
^
^
(M ) × (M ) → (M ) : (ω, σ) 7→ ω ∧ σ .
(M ) := X? (M ) (duale Vektorfelder) und
V0
(M ) := F(M ) (Skalar-
Ausführlichere Einblicke in das Thema gibt es in [25].
Das äußere Produkt hat folgende Eigenschaften (ω i seien duale Vektorfelder, also 1Formen):
• ω i ∧ ω j = −ω j ∧ ω i
• ω 1 ∧· · ·∧ω k = 0, an allen Punkten, an denen die ω 1 , . . . , ω k nicht linear unabhängig
sind
• daraus folgt, dass
• seien α ∈
Va
Vk
(M ) = 0 für alle k ≥ dim(M )
(M ), β ∈
Vb
(M ), so gilt: α ∧ β = (−1)ab β ∧ α
Beim Einsetzen von Vektorfeldern X i ergibt sich:
• (ω 1 ∧ ω 2 )(X 1 , X 2 ) = ω 1 (X 1 )ω 2 (X 2 ) − ω 1 (X 2 )ω 2 (X 1 )
85
B Differentialformen
• allgemein: α ∈
Va
(M ), β ∈
Vb
(M ), dann ist
(α ∧ β)(X 1 , . . . , X a+b )
X
=
sign(σ) α(X σ(1) , . . . , X σ(a) ) β(X σ(a+1) , . . . , X σ(a+b) )
0
σ∈Sa+b
=
1 X
sign(σ) α(X σ(1) , . . . , X σ(a) ) β(X σ(a+1) , . . . , X σ(a+b) )
a! b! σ∈S
(B.1)
a+b
0
(Sa+b sind die Permutationen von a + b Elementen, Sa+b
die Permutationen, für
die gilt: σ(1) < · · · < σ(a) und σ(a + 1) < · · · < σ(a + b))
Basis-Darstellung
Wie bei den im letzten Abschnitt definierten kovarianten Tensoren bilden die dxµ Basisfelder, nach denen die 1-Formen entwickelt werden können. Für höhere Formen ist
aber zu beachten, dass nicht jede Kombination von äußeren Produkten der dxµ benötigt
werden, da z.B. schon dx1 ∧ dx2 = −dx2 ∧ dx1 gilt. Jede Permutation der Indizes ändert
höchstens das Vorzeichen. Somit kann man sich auf Basisprodukte beschränken, deren
Indizes monoton wachsen:
dxµ ∧ dxν ∧ . . .
µ < ν < ...
.
Wie bei den Tensoren ergeben sich die Komponenten der Differentialformen durch Einsetzen der Basisvektoren:
k
^
ω ∈ (M ) ⇒ ωµ1 ,...,µk = ω(∂µ1 , . . . , ∂µk ) .
Wegen den überflüssigen Permutationen der Basisprodukte, werden die Basisentwicklungen üblicherweise mit Summationen über monoton wachsende Index-Kombinationen
geschrieben:
ω = ωα1 ,...,αk dxα1 ∧ · · · ∧ dxαk , α1 < · · · < αk .
Um nicht zwischen Summenkonvention für Tensoren und Differentialformen unterscheiden zu müssen, wird in dieser Arbeit eine Schreibweise verwendet, die über alle IndexKombinationen summiert und die überflüssigen Vielfachheiten wieder herausdividiert:
ω=
86
1
ωα ,...,α dxα1 ∧ · · · ∧ dxαk .
k! 1 k
B.2 Hodge-Dualität
B.2 Hodge-Dualität
Die Dimension von M sei n, dann gibt es keine k-Formen mit k > n. Ebenso gibt es
(bis auf Multiplikation mit einem Skalarfeld) nur eine n-Form, da es
n linear
gerade
n
n!
unabhängige Vektoren im Tangentialraum gibt. Allgemein gibt es k = k!(n−k)! linear
unabhängige k-Formen und somit genauso viele wie (n − k)-Formen. Es lässt sich damit
ein Isomorphismus konstruieren:
Definition 10 Der Hodge-(Stern-)Operator
?:
k
^
(M ) →
n−k
^
(M ) : ω 7→ ?ω
sei hier definiert durch seine Wirkung auf die Komponenten:
1p
| det g| εα1 ,...,αk ,µ1 ,...,µn−k ω α1 ,...,αk
k!
1p
=
| det g| εα1 ,...,αk ,µ1 ,...,µn−k g α1 ,β1 . . . g αk ,βk ωβ1 ,...,βk .
k!
?ωµ1 ,...,µn−k =
(B.2)
Beispiel
Ist M = R3 mit der Standard-Dualbasis {dx1 , dx2 , dx3 }, so gilt:
?1 = dx1 ∧ dx2 ∧ dx3
?dx1 = dx2 ∧ dx3
?dx2 = dx3 ∧ dx1
?dx3 = dx1 ∧ dx2
?(dx1 ∧ dx2 ) = dx3 (zyklisch)
?(dx1 ∧ dx2 ∧ dx3 ) = 1 .
Der Hodge-Operator findet in der Physik häufig Anwendung, da er zusammen mit der
im nächsten Abschnitt definierten äußeren Ableitung erlaubt, die Operationen aus der
Vektoranalysis elegant zu formulieren (z.B. in der Elektrodynamik).
B.3 Äußere Ableitung
Definition 11 Die äußere Ableitung
d:
k
^
(M ) →
k+1
^
(M ) : ω 7→ dω
87
B Differentialformen
ist definiert durch:
V
• f ∈ F(M ) = 0 (M ) ⇒ df = (∂α f )dxα
V
V
• α ∈ a (M ), β ∈ b (M ) ⇒ d(α ∧ β) = dα ∧ β + (−1)a α ∧ dβ
V
• ddω = 0 ∀ω ∈ (M )
In Koordinaten gilt
dω =
1
1
dωα1 ,...,αk ∧ dxα1 ∧ · · · ∧ dxαk = (∂β ωα1 ,...,αk ) dxβ ∧ dxα1 ∧ · · · ∧ dxαk .
k!
k!
Die äußere Ableitung begründet auch die Schreibweise dxµ für die dualen Basisvektoren.
Sie sind einfach die 1-Formen, die entstehen, wenn die äußere Ableitung auf die einzelnen
Komponenten der Kartenfunktion wirkt: d(xµ ).
Bei der Verallgemeinerung der Ableitung auf vektorwertige Funktionen und Formen
werden die einzelnen Vektorkomponenten als skalare Funktionen oder Formen interpretiert und abgeleitet. Ist z.B. V ein Vektorraum mit Basis {ei } und f eine Funktion
f : M → V , dann gilt:
df = d(f a ea ) = (df a )ea = (∂β f a ) dxβ ea .
Dies ist ein Vektor von 1-Formen ( vektorwertige 1-Form“). Man beachte, dass V nicht
”
unbedingt der Tangentialraum sein muss. Für diese Arbeit sind hauptsächlich Formen
mit Werten aus Lie-Algebren von Bedeutung. [5] behandelt dieses Thema sehr ausführlich und definiert auch kovariante Ableitungen für solche Formen.
88
C Lie-Gruppen und -Algebren
[9] liefert einen guten Einstieg in das Thema.
Eine kleine Wiederholung:
Definition 12 Eine Gruppe (G, ·) ist eine Menge G mit einer Verknüpfung · : G×G →
G mit folgenden Eigenschaften:
• neutrales Element:
• inverses Element:
• Assoziativität:
∃e ∈ G ∀g ∈ G : e · g = g · e = g
∀g ∈ G ∃g −1 ∈ G : g −1 · g = g · g −1 = e
∀a, b, c ∈ G : (a · b) · c = a · (b · c)
Eine Folgerung aus dieser Definition ist, dass für jedes beliebige Gruppenelement g ∈ G
die Funktion
Lg : G → G : h 7→ Lg (h) = g · h
bijektiv ist. Sie wird Linkstranslation genannt.
C.1 Lie-Gruppen
Viele für die Physik wichtige Gruppen besitzen kontinuierliche Parameter, so sind z.B.
die Rotationen im 3-dimensionalen Raum (SO(3)) durch 3 Winkel beschreibbar, sie
bilden demnach eine 3-dimensionale Mannigfaltigkeit.
Definition 13 Eine Lie-Gruppe (M, φ) ist eine n-dimensionale Mannigfaltigkeit M
mit einer Verknüpfung
φ : M × M → M : (a, b) 7→ φ(a, b) =: a · b ,
die die Gruppenaxiome erfüllt und zudem glatt ist (stetig differenzierbar). Werden auf
M Koordinaten gewählt, so kann auch φ geschrieben werden als n reelle Funktionen
(a, b, c ∈ M mit Koordinaten ai , bi , ci , i = 1, . . . , n):
a · b = c ⇔ φi (a1 , . . . , an , b1 , . . . , bn ) = ci .
Lie-Gruppen werden gerne benutzt, um Symmetrien und Transformationen zu beschreiben. Oft werden aber auch infinitesimale“ Transformationen benötigt, also eine Linea”
risierung der Lie-Gruppe um ihr neutrales Element. Formaler ausgedrückt:
89
C Lie-Gruppen und -Algebren
Definition 14 Die Lie-Algebra M zu einer Lie-Gruppe M ist der Tangentialraum
Te M des neutralen Elements e ∈ M . Dieser ist ein n-dimensionaler Vektorraum, dessen
Basisvektoren {Xi } als Generatoren der Gruppe bezeichnet werden.
Auf M lässt sich eine zusätzliche, Abbildung [·, ·] : M × M → M (Lie-Klammer)
definieren, z.B. durch:
• a, b ∈ M
• Kurven in der Lie-Gruppe γa , γb : R → M durch das neutrale Element (γa,b (0) = e)
mit Tangentialvektoren ∂t γa,b (t = 0) = a, b
• Lie-Klammer als linearisierter Kommutator:
[a, b] := ∂t γa (t) · γb (t) · γa (t)−1 · γb (t)−1 (t = 0)
Diese Abbildung ist bilinear und antisymmetrisch. Die Entwicklungskoeffizienten cki,j der
Lie-Klammer heißen Strukturkonstanten: [Xi , Xj ] = cki,j Xk .
In vielen Fällen sind die Gruppen- und Algebraelemente als Matrizen gegeben, dann
ergibt sich die Lie-Klammer als der bekannte Kommutator [a, b] = ab − ba.
Zwei Lie-Algebren sind isomorph, wenn sie dieselben Strukturkonstanten besitzen. Das
heißt, sind die Strukturkonstanten bekannt, so folgen alle Eigenschaften der Algebra aus
diesen. In gewissem Maße kann aus ihnen sogar die Lie-Gruppe rekonstruiert werden.
Beispiele
Die Lie-Gruppen SU (2) und SO(3) können jeweils als 3-parametrige Rotationen oder als
3-Sphäre angesehen werden. SU (2) ist die zweifache Überlagerungsgruppe zu SO(3), das
heißt, SO(3) kann zwar in die SU (2) eingebettet werden, dabei gibt es aber geschlossene
Wege in SO(3), die 2 mal durchlaufen werden müssen, um auch in der SU (2) wieder zum
Ausgangspunkt zurück zu führen. Ein bekanntes Beispiel hierfür ist der Elektronenspin,
der bei einer Rotation um 360◦ zu einem Vorzeichenwechsel führt und erst bei 720◦ zur
ursprünglichen Wellenfunktion zurückkehrt.
Beide Gruppen sind in nicht zu großen“ Gebieten isomorph, besitzen somit dieselbe
”
Lie-Algebra. Im Falle der SU (2) bilden {Xi := iσi } mit den Paulimatrizen
0 1
0 −i
1 0
σ1 =
, σ2 =
, σ3 =
1 0
i 0
0 −1
eine Basis der Algebra su(2). Die Strukturkonstanten ergeben sich aus der Beziehung
σi σj = δij + i εijk σk der Pauli-Matrizen:
cki,j = −2 εijk .
90
C.2 Haar-Maß
C.2 Haar-Maß
Gegeben sei eine reelle Funktion auf einer Gruppe G (f : G → R). Falls G nur endlich
viele Elemente besitzt, kann ein Integral“ von f über der Gruppe einfach definiert
”
werden als
Z
X
f :=
f (g) .
G
g∈G
Dieses ist invariant unter der Linkstranslation:
Z
Z
X
X
0
Lh f =
f (h · g) =
f (g ) =
f .
G
g∈G
g 0 ∈G
G
Dieses Integral kann auf Lie-Gruppen ausgeweitet werden, dazu ist aber ein Maß auf
der Mannigfaltigkeit G nötig, das mit der Gruppenstruktur verträglich ist. Dieses wird
Haar-Maß genannt.
Definition 15 Sei (M, φ) wie oben eine (zusammenhängende) Lie-Gruppe. Dann ist
das Haar-Maß dµ(g) = ρ(g) dV (g) in Koordinaten x1 , . . . , xn definiert durch:
• dV (g) = dx1 ∧ · · · ∧ dxn das euklidische Volumenelement im Parameterraum
−1
i
• ρ(g) = ∂φ∂h(g,h)
j
h=e
R
Das so definierte Integral G f (g) dµ(g) ist invariant unter Linkstranslation und bis auf
einen konstanten Faktor (durch die Wahl der RKoordinaten) eindeutig. Dieser wird für
kompakte Gruppen meist so gewählt, dass gilt: G dµ(g) = 1.
Das Integral kann auf nicht-zusammenhängende Gruppen erweitert werden, indem zuerst
über Zusammenhangskomponenten integriert und danach aufsummiert wird.
91
C Lie-Gruppen und -Algebren
92
D Spin-Darstellung der SU(2)
Für eine ausführlichere Behandlung des Themas sind [9] und der Anhang von [19] zu
empfehlen.
D.1 Darstellungen von Gruppen
Definition 16 Als (lineare) Darstellung einer Gruppe G bezeichnet man eine Abbildung ρ : G → Aut(V ) : g 7→ ρ(g), die jedem Gruppenelement g einen linearen Operator
ρ(g) auf einem Vektorraum V zuordnet, sodass die Operatorverknüpfung mit der Gruppenstruktur verträglich ist:
∀a, b ∈ G : ρ(a · b) = ρ(a) ρ(b) .
Da meistens eine Basis in V gegeben ist, bedeutet diese Definition, dass jedem Gruppenelement eine Matrix zugeordnet wird, wobei die Matrixmultiplikation die Gruppenverknüpfung wiedergibt.
Beispiele von Darstellungen sind für die Gruppe SO(n) die reellen, orthogonalen n × nMatrizen mit Determinante 1. Eine andere (aber triviale) Darstellung derselben Gruppe
wäre die Abbildung, die jedem Gruppenelement die 1 zuordnet (als 1 × 1-Matrix).
Definition 17 Einige nützliche Begriffe:
• unterschiedliche Darstellungen ρ, σ (auf demselben Vektorraum) heißen ähnlich,
wenn sie über einen Operator T verbunden sind: ρ(g) = T σ(g) T −1 (∀g ∈ G) (z.B.
über einen Basiswechsel)
• zwei Darstellungen ρ, σ auf den Vektorräumen V, W bilden über die direkte Summe ρ(g) ⊕ σ(g) eine neue Darstellung auf dem Raum V ⊕ W
• gleiches gilt für das Tensorprodukt ρ(g) ⊗ σ(g) auf V ⊗ W
• eine Darstellung, die nicht zu einer Summendarstellung ähnlich ist, heißt irreduzibel
Die genauen Definitionen und tiefere Einsichten in das Thema sind z.B. in [24] nachzulesen.
93
D Spin-Darstellung der SU(2)
D.2 Tensorprodukt-Basen
Sei V ein r-dimensionaler Vektorraum mit Basis {ei }. Dann bilden im n-fachen Tensorprodukt |V ⊗ ·{z
· · ⊗ V} =: V n die n-fachen Tensorprodukte der Basisvektoren wieder eine
n Mal
Basis: {ei1 ⊗ · · · ⊗ ein } (rn Stück).
Auf V ⊗ V (also n = 2), lassen sich Unterräume mit symmetrischer bzw. antisymmetrischer Basis finden:
(Dimension: 21 r(r + 1))
• Symmetrisch: {ei ⊗ ej + ej ⊗ ei }
• Antisymmetrisch: {ei ⊗ ej − ej ⊗ ei }
(Dimension: 12 r(r − 1))
Diese Konstruktion lässt sich auf höhere Tensorprodukte V n ausweiten (es interessieren
hier nur die symmetrischen Basen):
X
ei1 ∨ · · · ∨ ein :=
eiσ(1) ⊗ · · · ⊗ eiσ(n)
σ∈Sn
wobei Sn die Menge der Permutationen der n Indizes ist. Die Dimension dieses Unter.
raumes ist (r+n−1)!
n!(r−1)!
D.3 Spin-Darstellungen
SU (2) sei hier als Matrixgruppe definiert:
SU (2) := A ∈ C2×2 | A† A = 12×2 , det A = 1 .
2
Die Gruppehat somit
eine natürliche
Darstellung auf dem Raum V := C mit kanoni1
0
scher Basis e :=
, f :=
.
0
1
Konstruiert man wieder den symmetrischen Unterraum von V n , so ergibt sich die normierte Basis:
)
(
1
ea f b
√
:= √
e ∨ · · · ∨ e} ∨ |f ∨ ·{z
(a + b = n) .
(D.1)
· · ∨ }f
a! b!
a! b! | {z
a
b
n
Dieser Unterraum Vsym
≤ V n besitzt die Dimension n + 1, seine Elemente werden
Spinoren genannt.
Um zur in der Quantenmechanik üblichen Formulierung zu gelangen, werden Parameter
j := n/2 ( Spin“) und m ∈ {−j, −j + 1, . . . , j − 1, j} eingeführt und die Basisvektoren
”
geschrieben als:
ej+m f j−m
|j, mi := p
.
(j + m)! (j − m)!
94
(D.2)
D.4 Invariante Tensoren (3j-Symbole)
Für j =
1
2
ergibt sich wieder der Raum V mit Basis
{e = | 12 , 21 i, f = | 21 ,− 12 i} .
Die natürliche Darstellung von SU (2) auf V kann als Basiswechsel interpretiert werden
(A : e 7→ e0 = Ae), der das natürliche Skalarprodukt invariant lässt. Dieser Basiswechsel
n
kann für ein festes j auch auf den Raum Vsym
ausgeweitet werden über die Relation:
(e0 )j+m (f 0 )j−m
.
A|j, mi = |j, mi0 = p
(j + m)! (j − m)!
Diese neue Basis kann nach der alten entwickelt werden, die Entwicklungskoeffizienten
hj, m0 |A|j, mi =: Djm0 ,m (A)
bilden die Matrizen der Spin-Darstellung: ρj (A) = Djm0 ,m (A) m0 ,m . Diese Darstellungen sind irreduzibel und für j ∈ N sogar eine Darstellung von SO(3).
Eine explizite Formel für die Spin-Darstellungsmatrizen ist (siehe [9]):
p
Djm0 ,m (A) = (j + m)! (j − m)! (j + m0 )! (j − m0 )! · . . .
X (A1 )j+m−l (A1 )l (A2 )l+m0 −m (A2 )j−m0 −l
2
1
2
1
.
0 − m)! (j − m0 − l)!
(j
+
m
−
l)!
l!
(l
+
m
l
D.4 Invariante Tensoren (3j-Symbole)
In diesem Abschnitt sollen Tensoren gefunden werden, die mehrere Spin-Darstellungen
verbinden“. Dazu ein paar Vorüberlegungen.
”
Aus der Quantenmechanik ([26]) ist bekannt, dass ein System von 2 Teilchen mit Spin
j = 21 nach einer gemeinsamen Eigenbasis von Drehimpulsoperatoren (Ĵ2 , Jˆz , Ĵ21 , Ĵ22 )
entwickelt werden kann. Diese Eigenbasis besteht aus drei Vektoren zum Gesamtspin
j = 1, sowie einem Vektor zu j = 0. Allgemeiner ergeben sich gewisse Regeln, wie
verschiedene Spins zu neuen gekoppelt werden können.
Gruppentheoretisch ist dieses Beispiel so zu interpretieren: Zwei Spin-Darstellungen mit
j = 12 auf V werden über das Tensorprodukt zu einer neuen Darstellung auf dem Produktraum V ⊗ V verbunden. Dieses ist nicht irreduzibel, zerfällt also in eine direkte
Summe von kleineren Darstellungen, genauer in Darstellungen zu j = 0 und j = 1. Als
symbolische Formel:
1 1
⊗
= 0⊕1 .
2 2
95
D Spin-Darstellung der SU(2)
Allgemein ergeben sich Regeln, wann eine Darstellung (als direkter Summand) in einem
Tensorprodukt enthalten ist:
Theorem 2 Für 3 Spins j1 , j2 , j3 ∈ N/2 ist die Spin-Darstellung von j3 genau dann als
direkter Summand im Tensorprodukt der Darstellungen zu j1 und j2 enthalten, wenn die
Clebsch-Gordon-Bedingungen gelten:
• j1 + j2 + j3 ∈ N
• (j1 + j2 ) ≥ j3 ≥ |j1 − j2 |
(Dreiecksungleichung)
Wenden wir uns den Tensoren zu.
j
3
j
j
1
2
Abbildung D.1: 3 Spin-Darstellungen treffen aufeinander
Gegeben seien 3 Spin-Darstellungen ρ1 , ρ2 , ρ3 mit Spins j1 , j2 , j3 . Diese wirken auf drei
Spinor-Räumen. Gesucht ist ein Tensor mit drei Indizes, gegen die drei Spinoren aus
diesen Räumen kontrahiert werden können. Dieser Tensor soll invariant unter der Gruppenwirkung sein, d.h.
!
T 0ijk := T abc ρ1 (g)ia ρ2 (g)jb ρ3 (g)kc = T ijk
∀g ∈ SU (2) .
Dieser Tensor liegt im Tensorprodukt der Spinorräume und transformiert sich nach dem
Tensorprodukt der 3 Darstellungen ( j1 ⊗j2 ⊗j3“). Die Forderung der Invarianz bedeutet,
”
dass er sich nach der trivialen Darstellung (j = 0) transformiert, diese ist genau dann
als direkter Summand in der Produktdarstellung j1 ⊗ j2 ⊗ j3“ enthalten, wenn j1 , j2 , j3
”
die obigen Clebsch-Gordon-Bedingungen erfüllen. Da der dazugehörige Unterraum 1dimensional ist, ist dieser Tensor bis auf einen skalaren Vorfaktor λ eindeutig.
In [19] wird der invariante Tensor aus Epsilon-Symbolen konstruiert, da diese invariant
unter der Fundamentaldarstellung von SU (2) sind. Er wird in der unsymmetrisierten
Tensorbasis angegeben, indem a, b, c ∈ N gefunden werden, für die gilt:
2j1 = a + c ,
2j2 = a + b ,
2j3 = b + c .
(D.3)
Dies ist genau dann möglich, wenn die Clebsch-Gordon-Bedingungen erfüllt sind. In der
unsymmetrisierten Tensorbasis sieht der Tensor wie folgt aus:
96
D.4 Invariante Tensoren (3j-Symbole)
2j 3
c
b
a
2j 2
2j1
Abbildung D.2: die Indexverknüpfungen der 3 Spin-Darstellungen
Ti1 ...i2j1 ,k1 ...k2j2 ,l1 ...l2j3 = λ εi1 k1 . . . εia ka εia+1 l1 . . . εia+c lc εka+1 lc+1 . . . εka+b lc+b .
|
{z
}|
{z
}|
{z
}
j1 ↔j2
j1 ↔j3
j2 ↔j3
Jeder Spinorraum benötigt 2j Indizes. Von diesen werden nach (D.3) a Indizes zwischen
den Spinorräumen von j1 und j2 mit Epsilon-Symbolen kontrahiert und entsprechend
mit b und c.
Die Tensorkomponenten können in der symmetrisierten Basis berechnet werden über:
Tm1 m2 m3 := T (|j1 , m1 i, |j2 , m2 i, |j3 , m3 i) .
Wird der noch unbestimmte Vorfaktor λ durch die Normierung
X
Tm1 m2 m3 T m1 m2 m3 = 1
mi
festgelegt, so gelangt man zu den Wigner 3j-Symbolen:
j1 j2 j3
Tm1 m2 m3 =
.
m1 m2 m3
In [7] ist eine explizite Formel angegeben:
j1 j2 j3
m1 m2 m3
p
= ∆(j1 , j2 , j3 ) f (j1 , m1 ) f (j2 , m2 ) f (j3 , m3 ) · . . .
X
k
(−1)k+j1 −j2 −m3
k!(j1 +j2 −j3 −k)!(j3 −j2 +m1 +k)!(j2 +m2 −k)!(j1 −m1 −k)!(j3 −j1 −m2 +k)!
mit den beiden Funktionen
97
D Spin-Darstellung der SU(2)
(j1 + j2 − j3 )! (j2 + j3 − j1 )! (j3 + j1 − j2 )!
(j1 + j2 + j3 + 1)!
f (j, m) := (j − m)! (j + m)! .
∆(j1 , j2 , j3 ) :=
Beispiel
2j3=1
b=0
c=1
a=1
2j1 =2
2j2=1
Abbildung D.3: Beispielrechnung für j1 = 1, j2 = 21 , j3 =
1
2
Seien j1 = 1, j2 = 12 , j3 = 12 und somit a = 1, b = 0, c = 1 (siehe Abb. D.3), dann hat
der Tensor in der unsymmetrisierten Basis die Form
Ti1 ,i2 ,k,l = λ εi1 ,k εi2 ,l .
Die symmetrischen Basisvektoren der Darstellungen sind nach (D.2):
| 21 ,− 12 i = f
| 21 , 12 i = e
√
f ∨f
|1, −1i = √ = 2 f ⊗ f
2
|1, 0i = e ∨ f = e ⊗ f + f ⊗ e
e∨e √
|1, 1i = √ = 2 e ⊗ e .
2
Die einzigen Tensorkomponenten 6= 0 in der symmetrischen Basis sind:
98
D.5 6j-Symbole
T1,− 1 ,− 1 = T (|1, 1i, | 21 ,− 12 i, | 21 ,− 12 i)
2
2
√
= λ 2 ε12 ε12
√
= 2λ
= T−1, 1 , 1
2 2
T
0, 12 ,− 12
= T (|1, 0i, |
1 1
,
2 2
i, |
1
,− 12
2
i)
= λ (ε12 ε21 + ε21 ε11 )
= −λ
= T0,− 1 , 1 .
2 2
Die Normierung ergibt 1 = |λ|2 (2 + 2 + 1 + 1) ⇒ |λ| =
damit1 :
√1
6
und die 3j-Symbole sind
1
1
1
1
1
1 12
2
2
2
=
=√
1 − 21 − 12
−1 12 12
3
1 1 1
1
1
1 2 2
1 2 2
=
= −√ .
1
1
1
1
0 −2 2
0 2 −2
6
D.5 6j-Symbole
Die 6j-Symbole entstehen durch Kontraktion von vier 3j-Symbolen. Wird jedes 3j-Symbol
als Dreieck interpretiert, ergibt sich die Struktur eines Tetraeders. Die sechs Spinzahlen
liegen dann auf den Kanten.
Eine explizite Formel lautet (siehe [11]):
p
j1 j2 j3
= ∆(j1 , j2 , j3 )∆(j1 , j5 , j6 )∆(j4 , j2 , j6 )∆(j4 , j5 , j3 ) · . . .
j4 j5 j6
X
(t + 1)!
Q
(−1)t Q
(t
−
v
)!
i
i (pi − t)!
i
v
≤t≤p
max
min
mit:
∆(a, b, c) :=
v1
v2
v3
v4
1
(a + b − c)! (b + c − a)! (c + a − b)!
(a + b + c + 1)!
= j1 + j2 + j3
= j1 + j5 + j6
= j4 + j2 + j6
= j4 + j5 + j3
p1 = j1 + j2 + j4 + j5
p1 = j1 + j3 + j4 + j6
p1 = j2 + j3 + j5 + j6 .
Die Wahl der komplexen Phase λ = − √16 ist hierbei reine Konvention.
99
D Spin-Darstellung der SU(2)
Für jedes Dreieck mit seinen 3 Spins gibt es einen ∆-Term. Außerdem ergibt die Summe
der Spins für jedes Dreieck jeweils ein v. Die ps sind entsprechend die Summe der Spins
auf geschlossenen Wegen über 4 Kanten.
100
E Einige Beweise
E.1 Wichtige Hilfsformeln
Epsilon-Symbol
Das Epsilon-Symbol (auch Levi-Civita-Symbol genannt) ist in 4 Dimensionen definiert
durch
εIJKL = −εIJKL


wenn IJKL gerade Permutation
1
= −1 wenn IJKL ungerade Permutation


0
sonst.
Das Minuszeichen für das kovariante Symbol ist Konvention und erlaubt es, die Indizes
wie üblich über den metrischen Tensor zu heben und zu senken:
εIJKL = εABCD η AI η BJ η CK η DL = −εIJKL
⇒ ε0123 = ε0123 η 00 η 11 η 22 η 33 = ε0123 (−1) (+1) (+1) (+1) = −ε0123 .
Es erfüllt folgende Relationen:
N
M
L
N
M
L
− εAIJK εALM N = δIL (δJM δK
− δJN δK
) + δIM (δJN δK
− δJL δK
) + δIN (δJL δK
− δJM δK
) (E.1)
εABCI εABCJ = −6 δIJ
(E.2)
εABCI η Aà η B B̃ η C C̃ εÃB̃ C̃J = −6 ηIJ .
(E.3)
Gleichungen (E.1) und (E.2) folgen aus der Determinanten-Schreibweise des EpsilonSymbols. (E.2) lässt sich aber auch leicht nachrechnen: Die linke Seite ist nur 6= 0
für I = J und die Permutationen der restlichen Indizes heben sich gegenseitig auf.
Gleichung (E.3) folgt dann aus (E.2) durch Senken der Indizes und unter Ausnutzung
der Eigenschaft, dass (ηIJ ) und (η IJ ) zueinander inverse Matrizen sind.
101
E Einige Beweise
Duale Basisformen
Die Komponenten der 3-Form eI ∧eJ ∧eK erhält man durch einsetzen der entsprechenden
Basisvektoren. Hierbei wird die Beziehung eI (eJ ) = δJI der Dualbasis ausgenutzt und
über alle Permutationen der eingesetzten Vektoren summiert. Das Ergebnis ist die rechte
Seite von (E.1), somit ist es auch gleich der linken Seite:
eI ∧ eJ ∧ eK
LM N
= eI ∧ eJ ∧ eK (eL , eM , eN )
J K
δN + . . .
= δLI δM
= −εIJKA εLM N A .
Mit (B.2) und
hiervon:
p
p
| det η| = | − 1| = 1 folgt für die Komponenten der dualen 1-Form
1
(E.3)
?(eI ∧ eJ ∧ eK )L = − εABCL η Aà η B B̃ η C C̃ εIJKD εÃB̃ C̃D = ηLD εIJKD
3!
und die duale 1-Form ist gegeben durch
? (eI ∧ eJ ∧ eK ) = εIJKA ηAB eB .
(E.4)
E.2 Feldgleichungen im Cartan-Formalismus
Es sollen die Vakuum-Feldgleichungen in Cartan-Schreibweise
A
εABCI e ∧ R
BC
2
− λeA ∧ eB ∧ eC
3
=0
(E.5)
wieder auf die übliche Schreibweise zurückgeführt werden. Durch Dualisieren erhält man
die äquivalenten Gleichungen
2 A
A
BC
B
C
? εABCI e ∧ R − λe ∧ e ∧ e
=0.
3
(E.6)
Der Stern-Operator ist linear und kann einzeln auf die beiden Terme angewandt werden:
102
E.2 Feldgleichungen im Cartan-Formalismus
Kosmologischer Term
TICosm
2
A
B
C
:= ? εABCI −
λ (e ∧ e ∧ e )
3
2
= − λ εABCI ? (eA ∧ eB ∧ eC )
linear
3
2
= − λ εABCI εABCD ηDE eE
mit (E.4)
3
2
= λ 3! δID ηDE eE
mit (E.2)
3
= 4λ ηIA eA
Krümmungs-Term
TICurv := ? εABCI (eA ∧ RBC )
= εABCI ? (eA ∧ RBC αβ dxα ∧ dxβ )
=
εABCI RBCαβ
eαD
=:
εABCI RBCDE
eβE
A
D
Def. Krümmungsform
E
? (e ∧ e ∧ e ) Basiswechsel
A
? (e ∧ eD ∧ eE )
= εABCI RBCDE ηF G εADEF eG
mit (E.4)
Mit (E.1) folgt hieraus
= − δBD (δCE δIF − δCF δIE ) + δBE (δCF δID − δCD δIF ) + δBF (δCD δIE − δCE δID ) RBCDE ηF G eG
= −RBCBC ηIA + RBCBI ηCA − RBCIB ηCA + RBCCB ηIA
−RBCCI ηBA + RBCCI ηBA eA .
In dieser Summe gibt es nun 2 Terme mit einem doppelt kontrahierten R und 4 Terme
mit einfach kontrahiertem R. Für die Symbole mit doppelter Kontraktion gilt:
RABAB := RABαβ eαA eβB
= η BC RACαβ eαA eβB
= η BC (eγA eδC Rγδαβ )eαA eβB
mit (2.5)
= (eγA eαA ) (eβB η BC eγC )Rγδαβ
= (δγα ) (g βσ )Rγδαβ
Inverse, (2.3)
= g βδ Rαδαβ = g βδ Rδβ
=R
Def. Ricci-Tensor
Def. Krümmungsskalar.
103
E Einige Beweise
Mit ähnlichen Schritten folgt für die einfach kontrahierten Terme:
RABAI ηBC eC = Rαβ eαA eβI eA .
Der gesamte Krümmungsterm besteht nun aus 4 einfach und 2 doppelt kontrahierten
Termen:
TICurv = −4Rαβ eαA eβI eA + 2R ηIA eA .
Zusammengesetzt
Setzt man alle Terme zusammen, so ergibt sich als Umformung von (E.6):
0 = TICurv + TICosm
⇔ 0 = 4Rαβ eαA eβI eA − 2R ηIA eA + 4λ ηAI eA
⇔ 0 = 4Rαβ eαJ eβI − 2R ηIJ + 4λ ηJI
1
⇔ 0 = Rαβ eαJ eβI − R ηIJ + λ ηJI
2
1
α
β
⇔ 0 = (Rαβ e J e I − R ηIJ + λ ηJI ) eµJ eνI
2
1
⇔ 0 = Rµν − R gµν + λgµν .
2
Komponente J
(Es schien sinnvoller, in der vorletzten Zeile die Indizes I, J nicht umzubenennen, obwohl
sie in dieser Zeile zu internen Summationsindizes wurden.)
E.3 Wirkungsfunktional
Die Komponenten der Krümmungsform:
4d F
i
i
⇒ Fµν
Nun zur Wirkung (2.9):
104
1
= d4d Ai + εi ab 4d Aa ∧ 4d Ab
2
1
i
= d(Aα dxα ) + εi ab (Aα a dxα ) ∧ (Aβ b dxβ )
2
1 i
i
= (∂α Aβ + ε ab Aα a Aβ b )dxα ∧ dxβ
2
= ∂µ Aν i − ∂ν Aµ i + εi ab Aµ a Aν b .
(E.7)
E.3 Wirkungsfunktional
S[4d Σ, 4d A] =
=
=
=
Z
−i c3
16πG
Z
−i c3
16πG
Z
−i c3
8πG
Z
−i c3
8πG
3
=
−i c
8πG
−i c3
=
8πG
4d Σa
∧ 4d F a
a
α
β
Σa αβ Fγδ
∧ dxγ ∧ dx}δ
|dx ∧ dx {z
=εαβγδ d4 x
a
a
) εbcd d4 x
+ Σa 0b Fcd
(Σa bc F0d
a
a
E d a (Ȧd − ∂d A0 a + εa bc A0 b Ad c ) + PAB
e0A ebB Fa cd εbcd d4 x
mit (2.10) und (E.7)
1
a
e f
0 a
bcd
d4 x
. . . + (−ε ef e0 eb + i e0 eb ) Fa cd ε
2

Z Z
E d a Ȧd a − E d a ∂d A0 a + A0 b E d a εa bc Ad c
| {z } | {z } |
{z
}
(1)
(2)
(3)

1
1

a bcd
− e0 e εaef eb f Fcd
ε + i e0 0 eb a Fa cd εbcd  d4 x .
| {z }
{z
} 2
2 |
(4)
(5)
Term 2
Mit partieller Integration folgt:
Z
d
a
4
−E a (∂d A0 ) d x =
Z
(∂d E d a )A0 a d4 x + Randterme .
Für eine kompakte Mannigfaltigkeit oder eine im Unendlichen verschwindende Krümmung verschwinden auch die Randterme.
Term 2+3: Beide Terme zusammen ergeben eine kovariante Ableitung:
A0 a ∂d E d a + A0 b E d a εa bc Ad c = A0 a (Dd E d a ) .
105
E Einige Beweise
Term 4
1
0
0
a
εa0 i0 f (E e a ee a )(E g i eg i ) eb f εbcd Fcd
2
det(e)
1
0
0
a
=
εa0 i0 f ee a eg i eb f E e a E g i εbcd Fcd
2
{z
}
det(e) |
a
=
εaif eb f εbcd Fcd
mit (2.14)
=det(e)εegb
1
a
(δ c δ d − δgc δed )E e a E g i Fcd
det(e) e g
2
a
E d i E c a Fcd
=
det(e)
=
F ist antisym.
Term 5
1
0 0
εbc d eb a (ec0 e E c e )(ed0 f E d f )Fa cd
2
det(e)
1
0 0
εbc d eb a ec0 e ed0 f E c e E d f Fa cd
=
2
{z
}
det(e) |
eb a Fa cd εbcd =
mit (2.14)
=det(e)εaef
=
1
εabc E e b E f c Fa ef
det(e)
Zusammengesetzt
Die Felder A0 i , e0 0 , e0 i können für jeden 3-dimensionalen Raum beliebig durch Eichung
gewählt werden. Somit sind sie keine dynamischen Variablen und können als LagrangeMultiplikatoren verwendet werden. Um diese Rolle zu verdeutlichen, werden die Felder
geschrieben als
λi0 := A0 i ,
λ := e0 0 ,
λi := e0 i .
Damit ergeben alle Terme zusammen:
−i c3
S[4d Σ, 4d A] =
8πG
Z a
E b a Ȧb + λa0 (Db E b a ) + λc (E b a Fbca ) + λ(εabc E e b E f c Fa ef ) d4 x .
E.4 Graphische Notation
Die Rechnungen im letzten Abschnitt wirken durch ihre große Anzahl an Indizes teilweise
recht unübersichtlich. Auch der Weg ihrer Herleitung war nicht immer offensichtlich.
Deshalb hat sich im Laufe der Rechnungen für diese Arbeit eine Schreibweise entwickelt,
die den Umgang mit großen Tensortermen stark vereinfacht. Leider ist diese Schreibweise
106
E.4 Graphische Notation
schon von Penrose und anderen entwickelt worden und wird allgemein die PenroseNotation genannt1 .
Die Schreibweise entstand aus der Angewohnheit, in größeren Termen diejenigen Indizes
mit Linien zu verbinden, über die summiert wird. Im nächsten Schritt wurden die Indizes weggelassen und die Tensorsymbole so auf dem Papier angeordnet, dass sich die
Verbindungslinien entwirren. Dadurch entsteht ein intuitiver Eindruck der Topologie“
”
des Terms.
Kontra- bzw. Kovariante Vektoren V i bzw. Wi nehmen folgende Form an:
W
V
.
Ein oben stehender Index ergibt einen von der Oberseite des Symbols ausgehenden
Verbindungsstrich und für unten stehende entsprechend von unten ausgehend. Die Punkte an den Enden der Striche symbolisieren die nicht kontrahierten Indizes. Das Skalarprodukt zweier Vektoren V a Wa = V a gab W b wird dann einfach als Verbindung der bisher
offenen Striche dargestellt:
W
V
=
V W
.
Das Epsilon-Symbol εijk wird abgekürzt durch:
.
Es erfüllt die Identitäten εabc εabc = 6 ,
εiab εabj = 2δij ,
εija εakl = δki δlj − δli δkj :
= 2
= 6
=
−
.
1
Der Autor war sich zum Zeitpunkt seiner Entdeckung zwar schon über die Existenz der PenroseNotation für Spinoren und Spin-Netzwerke bewusst, kannte aber noch nicht ihre allgemeine Anwendung auf multilineare Algebra.
107
E Einige Beweise
Für eine Matrix M i j kann damit über εabc M a i M b j M c k = det(M )εijk die Determinante
ausgedrückt werden:
M
M
= det(M)
M
.
Die Definition des elektrischen Feldes (2.10) wird zu:
E :=
1
2
e
e
.
Unter Ausnutzung des obigen Ausdrucks für die Determinante über Epsilon-Symbole
und deren Kontraktionen wird die Identität (2.14) von E sofort ersichtlich:
e
=
E
1
2
e
e
e =
det(e)
2
= det(e)
.
Leicht einzusehen ist auch, dass diese Identität ebenso bei Vertauschung von e und E
gilt.
Die Eleganz und Einfachheit dieser Schreibweise soll am Beispiel der Berechnung von
Term (5) aus dem letzten Abschnitt demonstriert werden:
F
F
e
F
=
1
det(e)2
e
E
E
e
e
=
1
det(e)
E
E
.
Bei dieser Berechnung war das Ziel, auftretende e-Felder zu eliminieren und durch EFelder zu ersetzen. Das einzig vorhandene e-Feld ist direkt an ein ε gebunden. Somit
liegt es nahe, die Determinantenformel für auszunutzen und dazu 2 weitere e-Felder an
die anderen beiden Verbindungsstellen des Epsilon-Symbols zu setzen. Dies kann über
die Identität des E-Feldes geschehen.
108
Literaturverzeichnis
[1] A. V. Ashtekar. New variables for classical and quantum gravity. Phys. Rev. Lett.
57, 57:2244 – 2247, 1986.
[2] A. V. Ashtekar and M. Bojowald. Quantum geometry and the schwarzschild singularity. arXiv:gr-qc/0509075v1, 2005.
[3] J. W. Barrett and L. Crane. Relativistic spin networks and quantum gravity.
arXiv:gr-qc/9709028v2, 1998.
[4] J. W. Barrett and I. Naish-Guzman. The Ponzano-Regge model. arXiv:0803.3319v2
[gr-qc], 2009.
[5] H. Baum. Eichfeldtheorie. Springer-Verlag, 2009.
[6] J. D. Bekenstein. Black holes and information theory. arXiv:quant-ph/0311049v1,
2003.
[7] J. P. M. Flude. The Edmonds asymptotic formulae for the 3j and 6j symbols.
arXiv:physics/9710037v1, 1997.
[8] W. A. Friedman, H. Feshbach, and F. Bloch. Spectroscopic and Group Theoretical
Methods in Physics, Racah Memorial Volume. 1968.
[9] R. Gilmore. Lie Groups, Lie Algebras, and Some of Their Applications. John Wiley
& Sons, Inc, 10th edition, 1974.
[10] E. Gourgoulhon. 3+1 formalism and bases of numerical relativity.
qc/0703035v1, 2007.
arXiv:gr-
[11] R. Gurau. The Ponzano-Regge asymptotic of the 6j symbol: an elementary proof.
arXiv:0808.3533v1, 2008.
[12] K. Krasnov. Plebanski formulation of general relativity: A practical introduction.
arXiv:0904.0423v1 [gr-qc], 2009.
[13] W. Kühnel. Differentialgeometrie. Vieweg, 3rd edition, 1999.
[14] S. Mercuri. Fermions in Ashtekar-Barbero connections formalism for arbitrary values of the Immirzi parameter. arXiv:gr-qc/0601013v2, 2006.
109
[15] C. Misner, K. S. Thorne, and J. A. Wheeler. Gravitation. W. H. Freeman and
Company, 1973.
[16] H. Nicolai and K. Peeters. Loop and spin foam quantum gravity: A brief guide for
beginners. arXiv:hep-th/0601129v2, 2006.
[17] A. Perez. Spin foam models for quantum gravity. arXiv:gr-qc/0301113v2, 2003.
[18] A. Perez. Introduction to loop quantum gravity and spin foams.
qc/0409061v3, 2004.
arXiv:gr-
[19] C. Rovelli. Quantum Gravity. Cambridge University Press, 2004.
[20] L. Smolin. An invitation to loop quantum gravity. arXiv:hep-th/0408048v3, 2005.
[21] E. Teufel. Riemannsche Geometrie (Vorlesungsscript). 2007.
[22] T. Thiemann. Lectures on loop quantum gravity. arXiv:gr-qc/0210094v1, 2002.
[23] T. Thiemann. The phoenix project: Master constraint programme for loop quantum
gravity. arXiv:gr-qc/0305080v1, 2003.
[24] H.-R. Trebin. Gruppentheoretische Methoden in der Physik (Vorlesungsscript),
2004.
[25] C. von Westenholz. Differential Forms in Mathematical Physics. North-Holland
Publishing Company, 1978.
[26] G. Wunner. Quantenmechanik 2 (Vorlesungsscript). 2006.
110
Danksagung
Ich möchte mich bei all den Personen bedanken, die mir während meiner Diplomarbeit
und auch schon davor sehr geholfen haben. Dazu zählen unter anderem:
• Herr Prof. Dr. Wunner für die erstaunliche Freiheit, die er mir bei der Wahl meiner
Arbeit ließ und für die motivierende Unterstützung, die er mir zukommen ließ
• Dem Institut für das hervorragende Arbeitsklima
• Dr. Holger Cartarius für seine großen Dienste bei der Aufzucht und Pflege der
Computerherde
• Vor allem meinen Zimmerkollegen Poulcheria Christou und Axel Keller sowie Kilian Rambach für die zahllosen und fruchtbaren Diskussionen über physikalische
und unphysikalische Themen, die seelische Unterstützung und sonstige Ablenkungen vom tristen Alltag
• Philippe Suchard, Edouard de Beukelaer, Gottlieb Anton Gries und zahllosen weiteren für wichtige Beiträge auf dem Gebiet der Zuckerverarbeitung
111
Zugehörige Unterlagen
Herunterladen