Vergleich verschiedener Methoden zur Fixierung der Landau

Humboldt-Universität zu Berlin
Mathematisch-Naturwissenschaftliche Fakultät I
Institut für Physik
Vergleich verschiedener Methoden
zur Fixierung der Landau-Eichung
in SU (2)- und SU (3)-Gittereichtheorien
Diplomarbeit
eingereicht von
Peter Schemel
geboren am 27. Januar 1978 in Berlin
Aufgabensteller: Prof. Dr. M. Müller-Preußker
Zweitgutachter: Prof. Dr. Ulrich Wolff
Abgabedatum: 19. Dezember 2005
Zusammenfassung
In dieser Arbeit werden verschiedene Methoden zur Fixierung der Landau-Eichung miteinander verglichen. In der SU (2)-Gittereichtheorie sind dies Simulated Annealing, die
Überrelaxation und die Eichfixierung auf einer endlichen Untergruppe. In der SU (3)Gittereichtheorie sind dies Simulated Annealing, Überrelaxation und die fourierbeschleunigte Eichfixierung. Das Hauptanliegen in dieser Arbeit ist es, den Simulated Anealing
Algorithmus zu optimieren, um eine möglichst eindeutige Fixierung der Landau-Eichung
zu erreichen. Dies ist notwendig, da die Landau-Eichbedingung nicht eindeutig ist und
sogenannte Gribov-Kopien auftauchen, die einen Einfluss auf eichvariante Größen, wie
den Ghost-Propagator haben. Es ist ein Wunsch, diesen Einfluss zu minimieren.
Die wichtigsten Ergebnisse sind eine Optimierung des Simulated Annealing Algorithmus durch das Einfügen von mikrokanonischen Schritten in den Algorithmus. In der
SU (3)-Eichtheorie zeigte sich zudem, dass die Wahl eines nichtlinearen Temperaturverlaufs des Simulated Annealing Fahrplans zu einem optimierten Algorithmus führt.
Nicht zeigen lassen konnte sich hingegen eine Optimierung der numerischen Berechnungen in der SU (2)-Eichtheorie durch die Verlagerung der Berechnungen in die endliche
Ikosaeder-Untergruppe.
Im Rahmen eines Vergleichs von Überrelaxation und fourierbeschleunigter Eichfixierung in der SU (3)-Eichtheorie zeigte sich zudem, dass der Aufwand für fourierbeschleunigte Eichfixierung besser mit der Gittergröße symmetrischer Gitter skaliert als für die
Überrelaxation.
Inhaltsverzeichnis
1 Einleitung
1.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
3
2 Motivation der Eichfixierung
2.1 Kontinuumseichtheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Eichfixierung und Faddeev-Popov Trick . . . . . . . . . . . . . . . . . . . .
7
7
9
3 Diskretisierte Eichtheorien
3.1 Einführung in die Gittereichtheorie . . . . . . . . .
3.1.1 Observable . . . . . . . . . . . . . . . . . . .
3.1.2 Propagatoren . . . . . . . . . . . . . . . . .
3.2 Eichfixierung . . . . . . . . . . . . . . . . . . . . .
3.2.1 Gewöhnliche kovariante Eichung . . . . . . .
3.2.2 Laplace-Eichung . . . . . . . . . . . . . . .
3.2.3 Maximal Abelsche Eichung . . . . . . . . . .
3.2.4 Zentrumseichung . . . . . . . . . . . . . . .
3.2.5 Landau- und Coulomb-Eichung . . . . . . .
3.2.6 Gribov-Kopien . . . . . . . . . . . . . . . .
3.2.7 Gribov-Rauschen . . . . . . . . . . . . . . .
3.3 Methoden der Eichfixierung . . . . . . . . . . . . .
3.3.1 Relaxation . . . . . . . . . . . . . . . . . . .
3.3.2 Überrelaxation . . . . . . . . . . . . . . . .
3.3.3 Mikrokanonische Schritte . . . . . . . . . . .
3.3.4 Fourierbeschleunigte Eichfixierung . . . . . .
3.3.5 Multigrid Methode des Gradientenverfahrens
3.3.6 Simulated Annealing . . . . . . . . . . . . .
3.3.7 Eichfixierung auf endlichen Untergruppen .
3.4 Strategien zur Auswahl optimaler Verfahren . . . .
3.4.1 Verteilung über den Funktionalwerten . . . .
3.4.2 Mobilität . . . . . . . . . . . . . . . . . . .
4 Resultate
4.1 SU (2) Eichfixierung . . . . . . . . . . .
4.1.1 Simulated Annealing . . . . . .
4.1.2 I120 -Eichfixierung . . . . . . . .
4.1.3 Simulated Annealing auf großen
4.1.4 Zusammenfassung . . . . . . . .
4.2 SU(3) Eichfixierung . . . . . . . . . . .
1
. . . . .
. . . . .
. . . . .
Gittern
. . . . .
. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
15
15
17
18
20
20
21
22
23
24
25
27
28
28
29
29
30
31
31
36
37
37
38
.
.
.
.
.
.
41
43
43
58
60
63
64
2
INHALTSVERZEICHNIS
4.2.1
4.2.2
4.2.3
4.2.4
4.2.5
Überrelaxation . . . . . . . . . . . . . . . . . . .
Fourierbeschleunigte Eichfixierung . . . . . . . . .
Skalierung der Iterationszahl für Überrelaxation
schleunigte Eichfixierung . . . . . . . . . . . . . .
Simulated Annealing . . . . . . . . . . . . . . . .
Zusammenfassung . . . . . . . . . . . . . . . . . .
. . .
. . .
und
. . .
. . .
. . .
. . . . . .
. . . . . .
fourierbe. . . . . .
. . . . . .
. . . . . .
. 64
. 65
. 66
. 68
. 79
5 Zusammenfassung und Ausblick
5.1 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Schlussfolgerung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3 Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
81
81
82
83
A Anhang
A.1 Das Ikosaeder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.1.1 Konstruktion der Ikosaedergruppe . . . . . . . . . . . . . . . . . .
A.1.2 Die elegante Methode . . . . . . . . . . . . . . . . . . . . . . . . .
A.1.3 Fortsetzung auf SU (2) . . . . . . . . . . . . . . . . . . . . . . . .
A.1.4 Diskretisierung der SU (2) . . . . . . . . . . . . . . . . . . . . . .
A.2 Konvergenz einer Markov-Kette . . . . . . . . . . . . . . . . . . . . . . .
A.3 Haarsches Maß . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.4 Aktualisierungsalgorithmen . . . . . . . . . . . . . . . . . . . . . . . . .
A.4.1 Heatbath Aktualisierung in SU (N ) Yang-Mills-Theorien . . . . .
A.4.2 Maximierung von Re tr(gK) . . . . . . . . . . . . . . . . . . . . .
A.4.3 Polarzerlegung von M ∈ GL(N ) . . . . . . . . . . . . . . . . . . .
A.5 Änderung der Wahrscheinlichkeitsverteilung bei Mehrfachanwendung einer
Eichfixierungsmethode . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
85
85
87
88
90
91
95
97
97
98
100
.
.
.
.
.
.
.
.
.
.
.
. 101
Kapitel 1
Einleitung
1.1
Einleitung
Eichtheorien spielen heutzutage eine wichtige Rolle für die Beschreibung der elementaren
Bestandteile der Materie und ihrer Wechselwirkungen, die im Standardmodell zusammengefaßt sind. Es herrscht allgemeiner Konsens darüber, dass die starke Wechselwirkung, als
Teil des Standardmodells, von der Quantenchromodynamik (QCD) [FGML73] beschrieben wird. Die stark wechselwirkenden Teilchen sind die Hadronen. Verschiedene Untersuchungen, wie die beobachteten Pion-Zerfallsraten, machten die Einführung elektrisch und
farbgeladener Quarks [GM64] als elementare Bausteine der Hadronen erforderlich. Mit
ihrer Einführung war auch eine erfolgreiche Klassifizierung der Hadronen möglich. Daher
sollte die QCD sowohl die Quarkstruktur der Hadronen als auch ihre Wechselwirkung
beschreiben.
Die Struktur der Hadronen wird experimentell in Beschleunigerversuchen untersucht,
bei denen Leptonen als Projektile benutzt werden. Hier hat sich gezeigt, dass für kleine
Abstände, also große Impulsüberträge, die Wechselwirkungskräfte gering sind und sich
die Quarks dort wie freie Teilchen verhalten. Diese Eigenschaft wird als asymptotische
Freiheit der QCD [Gro05] bezeichnet. Diese Freiheit kann jedoch nur eine Eigenschaft
kleiner Abstände sein, da freie Quarks nicht beobachtet werden. Das Gleiche trifft auch
auf die Quanten der QCD-Wechselwirkung, die Gluonen, zu. Somit besteht eine Aufgabe
darin, einen Mechanismus aufzuzeigen, der zu diesem so genannten Confinement 1 , einer
besonderen Eigenschaft der QCD, führt [DG05].
Die Beschreibung von Vorgängen in Hadron-Hadron-Stößen entzieht sich bisher
einer strengen Behandlung durch die QCD und man ist auf Modelle und Näherungen
angewiesen. Umso wichtiger ist es, zu einer theoretischen Erklärung des Hadronspektrums
und der Hadronstruktur ab initio im Rahmen der Gitter-QCD zu kommen.
Mit der von Kenneth G. Wilson eingeführten Gitterformulierung der QCD [Wil74] wurde ein Rahmen geschaffen, in dem sich sowohl störungstheoretische als auch eine Vielzahl
nichtstörungstheoretischer Methoden und Ansätze zur Behandlung der Theorie einführen
lassen. Darunter ist auch die Methode der numerischen Simulation, in der zunächst über
die Diskretisierung hinaus keine weiteren Näherungen notwendig sind. Und obwohl in der
Wilsonschen Formulierung die Eichinvarianz über die Art der Raum-Zeit-Diskretisierung
1
Confinement ist das englische Wort für Beschränkung oder Gefangenschaft und soll die Eigenschaft
der Quarks bezeichnen, nicht als freie Teilchen vorzukommen.
3
4
Kapitel 1
Einleitung
in die Gittereichtheorie eingebunden wird, ist die Gitterstörungstheorie darauf angewiesen, wie im Kontinuum, von einer Eichfixierung auszugehen.
Es wurde versuchte die Ursache des Confinement-Mechanismus zu beschreiben, indem
man mittels einer geeigneten Eichung die für das Confinement relevanten Freiheitsgerade
der Theorie isoliert [Nam74, Man76, ’t 78]. Als geeignete Eichungen stellten sich dabei
die maximal abelsche Eichung [’t 81, KSW87] und die Zentrumseichung [DDFGO97] heraus. Im Ergebnis der entsprechenden Projektionen auf die entsprechenden Freiheitsgrade
wurden die beiden Mechanismen der Monopolperkolation [KSW87, B+ 91] und Vortexperkolation [LRT98, ELRT00] identifiziert. Beide Mechanismen können das Confinement im
Sinne des Flächengesetzes für Wilsonloops erklären. In jüngster Zeit ist die enge Verbindung zwischen ihnen klar herausgearbeitet worden [KPSZ05]. In diesem Zusammenhang
stellte sich heraus, dass die Nichteindeutigkeit der Eichbedingung auf Grund der Existenz von Gribovkopien ein schwieriges algorithmisches Problem bei der Eichfixierung
von Monte-Carlo-generierten Feldkonfigurationen mit sich bringt. Die wahrscheinlich erste systematische Untersuchung dazu im Rahmen der maximal abelschen Eichung mit
Hilfe des Simulated Annealing Verfahrens stellt [BBMPS96] dar.
Die vorliegende Arbeit stellt, in Hinsicht auf die Verbesserung der Eichfixierungsalgorithmen, eine Fortsetzung der Untersuchungen für den Fall der Landau-Eichung dar. Dabei sollen verschiedenen Algorithmen der Landau-Eichung miteinander verglichen werden.
Ein solcher Vergleich wurde bereits in [Gut96] für SU (2)-Gittereichtheorien durchgeführt.
Das Hauptaugenmerk dieser Arbeit liegt dabei auf der Methode des Simulated Annealing
und ihrer Optimierung.
Ein Grund, weshalb gegebene Gittereichkonfigurationen in die Landau-Eichung gebracht werden, ist die Berechnung der entsprechenden Quark-, Gluon- [MO87, LSWP98,
Man99] und Ghost-Propagatoren [SS96] und die Definition des Confinement über deren
Eigenschaften. Solche Propagatoren werden in der Störungstheorie benutzt und beziehen
sich dort immer auf eine bestimmte Eichung. Es konnte gezeigt werden, dass die Eliminierung der für das Confinement verantwortlichen Freiheitsgrade den Charakter der Gluonund Ghost-Propagatoren tatsächlich wesentlich verändert [LRG02, GLR04].
Das Verhalten der Propagatoren wird in unterschiedlichem Maße auch von der
Nichteindeutigkeit der Eichbedingung auf Grund von Gribovkopien bestimmt. In der
Landau-Eichung wird dabei beobachtet, dass sich das singuläre Verhalten der Ghostpropagatoren abmildern lässt, wenn das globale Maximum des Landau-Eichfunktionals
möglichst exakt bestimmt wird [SIMPS05a]. Trotzdem es Untersuchungen gibt, die
besagen, dass der Einfluss der Gribovkopien im unendlichen Volumen vernachlässigt
werden kann [Zwa04], besteht der Wunsch, die Landau-Eichung mit einem möglichst
effizientem Algorithmus fixieren zu können, solange auf kleinen Gittern gerechnet wird.
Vor diesem Hintergrund ist die vorliegende Arbeit entstanden.
In dem Bestreben, einen effizienten Algorithmus zu finden, ist die Arbeit wie folgt
gegliedert. In Kapitel 2 wird eine Einführung in die theoretische Beschreibung der QCD
gegeben. Es werden die für diese Arbeit grundlegenden Größen definiert und eine erste Motivation der Eichfixierung gegeben. Die von Wilson eingeführte Diskretisierung der
QCD wird in Kapitel 3 beschrieben. Es werden weiterhin einige Eichfixierungsbedingungen
und ihre Gitterdiskretisierung angegeben. Für die Landau-Eichung werden Konzepte zur
Umsetzung der Eichfixierung vorgestellt und das Problem der Gribov-Mehrdeutigkeit dargestellt.In Kapitel 4 werden die verschiedenen Eichfixierungskonzepte miteinander vergli-
1.1 Einleitung
5
chen und die Resultate der Vergleiche vorgestellt. Das Kapitel ist in zwei Teile gegliedert.
Im ersten Teil werden die Ergebnisse der Landau-Eichung in einer SU (2)-Gittereichtheorie
dargestellt, um im zweiten Teil zur physikalisch relevanten SU (3)-Gittereichtheorie überzugehen. Abschließend werden in Kapitel 5 die Ergebnisse zusammengefasst und mögliche
Perspektiven herausgearbeitet, mit denen sich zukünftige Untersuchungen beschäftigen
sollten.
6
Kapitel 1
Einleitung
Kapitel 2
Motivation der Eichfixierung
2.1
Kontinuumseichtheorie
Die Quantenchromodynamik (QCD) ist eine renormierbare Quantenfeldtheorie, die
der starken Wechselwirkung. Ihre fundamentalen Bestandteile sind Spin- 21 -Felder, die
gebrochen-rationale, elektrische Ladung tragen und geladene Spin-1-Eichfelder, die mit
den Spin- 12 -Feldern und mit sich selbst wechselwirken. Die Spin- 12 -Felder sind die Quarks,
die Eichfelder beschreiben die Gluonen.
Die fundamentalen Quarkfelder der QCD werden durch Diracspinoren qαA beschrieben, wobei die Indizes die internen Freiheitsgrade der Theorie kennzeichnen. Jeder Index
repräsentiert die fundamentale Darstellung einer Lie-Gruppe. Der Index A bezeichnet
die Flavour -Quantenzahl, die zwar in der QCD keine dynamische Rolle spielt, aber der
Vollständigkeit halber mit erwähnt werden soll. Der Index α bezeichnet den Freiheitsgrad
der Farbladung . Es gibt deutliche Hinweise, wie die beobachtete Baryonenstatistik, darauf, dass exakt drei Farbladungen in der Natur existieren [BFGM72]. Auf Grund dieser
Tatsache sind die einzigen in Frage kommenden einfachen Lie-Gruppen zur Beschreibung
der Farbladung die SU (3) und die SO(3). Dabei kann die SO(3) als farbbeschreibende LieGruppe ausgeschlossen werden. So könnten in einer SO(3)-Eichtheorie Diquark-Systeme
als Singlet-Zustände auftauchen, die in der Realität nicht beobachtet werden. Im Folgenden soll daher die QCD als SU (3)C -Eichtheorie vorgestellt werden.
Die grundlegende Idee der QCD ist, aus einer globalen SU (3)C -Farbsymmetrie eine lokale Symmetrie zu machen. Um diese lokale SU (3)C -Farbsymmetrie umsetzen zu können,
ist es nötig, ein kompensierendes Vektor-Eichpotential Aaµ (x), a = 1, 2, ..., 8 einzuführen:
X
λa
Aµ (x) = −ig
Aaµ (x) ,
(2.1)
2
a
wobei λa ∈ su(3) die Gell-Mann-Matrizen in der Lie-Algebra sind und die Kommutatorgleichung [λa , λb ] = 2if abc λc mit den Strukturkonstanten f abc der SU (3) erfüllen. Das
Oktett der Aaµ sind die oben erwähnten farbgeladenen Gluonenfelder. Sie stellen die dynamischen Variablen einer SU (3)C -Eichtheorie dar.
Mittels einer kanonischen Konstruktion erhält man die durch die SU (3)C Symmetrie
implizierte, lokal eichinvariante, Lagrangedichte1
1
/ A − Fµν F µν
L1 = iq A Dq
(2.2)
4
1
Über sich wiederholende Indizes soll im Weiteren immer summiert werden.
7
8
Kapitel 2
Motivation der Eichfixierung
mit der kovarianten Ableitung
/ := (∂µ + Aµ )γ µ = Dµ γ µ ,
D
(2.3)
wobei γµ der Vierervektor der 4 × 4 Dirac-Matrizen ist, und dem Feldstärketensor
Fµν (x) := [Dµ , Dν ] = ∂µ Aν (x) − ∂ν Aµ (x) + [Aµ (x), Aν (x)]
X
λa
a
≡ −ig
Fµν
(x) .
2
a
(2.4)
(2.5)
Der Antispinor q ist die Kurzschreibweise von q † γ 0 . Der zweite Term in Gleichung 2.2 ist
die Yang-Mills-Lagrangedichte LY M , die die Selbstwechselwirkung der SU (3)C -Eichfelder
beschreibt. Die so definierte Lagrangedichte L1 ist invariant unter lokalen Eichtransformationen g(x) der Form
Aµ (x) → g(x)(Aµ (x) + ∂µ )g † (x),
q A (x) → g(x)q A (x),
wobei g(x) = exp(iω(x)) ist, und ω(x) ∈ su(3)C in der Lie-Algebra su(3)C der SU (3)C
liegen und die Raum-Zeit-abhängigen Parameter der lokalen Eichtransformation
speR g(x)
4
zifizieren. Als Euler-Lagrange-Gleichungen lassen sich aus der Wirkung S1 = d xL1 die
klassischen Feldgleichungen ableiten:
∂µ
δS1
δS1
−
=0
δ(∂µ Aν ) δAν
und
∂µ
δS1
δ(∂µ qα† )
−
δS1
δqα†
= 0.
(2.6)
Man erhält zum einen die Yang-Mills-Gleichungen
∂ µ Fµν + [Aµ , Fµν ] = Jν
(2.7)
mit der Fermionen-Stromdichte Jν und zum anderen die Diracgleichung
/ A = 0.
Dq
(2.8)
Bisher ist die Flavour-Symmetrie noch nicht berücksichtigt worden. Für NF Flavours
wird die Flavourgruppe SU (NF ) angenommen. Da die Lagrangedichte L1 masselose
Quarks beschreibt, ist sie invariant unter chiralen Symmetrietransformationen der Form
SU (NF )R × SU (NF )L × UB (1) × UA (1) [Pag75], mit den rechts- und linkshändigen Komponenten der Quarkfelder qR,L = 21 (1 ± γ5 )q. Dabei entspricht die UB (1)-Symmetrie
der Baryonenzahl-Ladungserhaltung und die UA (1)-Symmetrie der axialen BaryonenzahlLadungserhaltung. Die komplette Symmetrie in der masselosen Theorie ist nicht notwendig und wird auch nicht beobachtet. Die chirale SU (NF ) × SU (NF )-Symmetrie ist nicht
exakt in der realen Welt und kann auch in der QCD leicht gebrochen werden, indem zu
L1 ein Massenterm2 ∆L addiert wird.
∆L = qαA M0AB qαB ,
2
M0AB = δ AB mA
0.
(2.9)
Die Massenmatrix soll nur diagonal sein. In der Defninition von M AB soll auf der rechten Seite nicht
über A summiert werden.
2.2 Eichfixierung und Faddeev-Popov Trick
9
Für die störungstheoretische QCD muss die so entstandende Lagrangedichte L + ∆L
noch um einen eichfixierenden Term Lgauge fix und einen Faddeev-Popov-Ghost-Term Lghost
erweitert werden. Eine Motivation für diese Erweiterung wird im folgenden Abschnitt
gegeben. Der eichfixierende Term stellt eine korrekte Quantisierung sicher, der GhostTerm ist abhängig von der gewählten Eichfixierung und gewährleistet die Unitarität der
S-Matrix. Alle Terme zusammen sind notwendig um eine in sich konsistente Quantenfeldtheorie mit nichtabelschen Eichfeldern zu erhalten [’t 71]. Die komplette Lagrangedichte
lautet dann
LQCD = L1 + ∆L + Lgaugef ix + Lghost .
(2.10)
Diese Lagrangedichte der QCD ist Ausgangspunkt für die Störungstheorie und für gekoppelte Gleichungen, wie die Dyson-Schwinger-Bewegungsgleichung für die Greensfunktionen der Theorie. Die Dyson-Schwinger-Gleichungen bilden dabei eine Methode, die über
die Störungstheorie hinaus geht und mit der es gelingt, Propagatoren nichtstörungstheoretisch zu definieren. Auch wenn man in der Lage ist, die Lagrangedichte für die QCD
anzugeben, bleibt das Problem zu lösen, eine physikalische S-Matrix zu berechnen, die
Eigenschaften wie Endlichkeit, Analytizität, Unitarität und Lorentz-Eichinvarianz aufweist und das Spektrum der Zustände der beobachtbaren hadronischen Welt beschreibt.
Im Folgenden wird nun über die Pfadintegralquantisierung eine Motivation für die beiden
zusätzlich in die Lagrangedichte eingefügten Terme gegeben.
2.2
Eichfixierung und Faddeev-Popov Trick
Mit Hilfe des Pfadintegralformalismus kann eine SU (N )-Eichtheorie quantisiert werden [Fey48, FH65]. Durch die Pfadintegralquantisierung eröffnet sich unter anderem die
Möglichkeit, auf einfache Weise Feynman-Regeln zu gewinnen, um zu einer unitären SMatrix zu gelangen. Eine kurze Skizzierung der Quantisierung soll zunächst mit dem
Fall des stabilen Vakuums beginnen. Am Anfang steht die Quantisierung des kinetischen
Terms des Eichfeldes. Durch Anwendung der Schwingerschen Funktionalableitung [AL73]
lässt sich nun die n-Punkt Greensfunktion als Funktionalableitung
G(x1 , ..., xn ) = h0|T Â(x1 )...Â(xn )|0i
¯
¯
δ n Z[J]
n
¯
= (−i)
δJ(x1 )...δJ(xn ) ¯J=0
(2.11)
(2.12)
des erzeugenden Funktionals mit dem Zeitordnungsoperator T darstellen. Für eine reine
a
F aµν lässt sich das erzeugende
Yang-Mills-Theorie mit der Lagrangedichte LY M = − 41 Fµν
Funktional aus Gleichung2.12 als Pfadintegral darstellen
µ Z
¶
Z
−1
4
Z[J] = N
[dA] exp i d x [LY M (x) + J(x) · A(x)] .
(2.13)
N ist ein Normierungsfaktor, der sicherstellen soll, dass Z[0] = 1 gilt. J(x) ist eine externe Quelle und [dA] repräsentiert das Funktionalintegrationsmaß über alleQFeldkonfigurationen. Zum Integrationsmaß Q
[dA] tragen die Feldkomponenten [dA] = µ,a [dAaµ ] an
a
verschiedenen Punkten [dAµ ] = x dAaµ (x) bei. Ohne die Quellen J · A = Aaµ J aµ ist das
Funktional
Z
−1
Z[0] = N ∝ [dA] exp (iSYM )
(2.14)
10
Kapitel 2
Motivation der Eichfixierung
R
mit SYM = d4 xLYM eichinvariant. Die Funktionalintegration
[dA] kann in eine IntegraQ
a
tion über die Eichgruppe, symbolisiert durch [dσ] = a [dσ ], und über alle Feldkonfigurationen in der jeweiligen Eichung, symbolisiert durch [dA[σ]] zerlegt werden:
Z
Z
−1
Z[0] = N
[dσ] [dA[σ]] exp (iSA [σ])
(2.15)
Die σ a stellen eine Parametrisierung der Gruppe dar. Die Möglichkeit, die Felder zu eichen, ohne dabei die Wirkung zu ändern, stellt ein Problem dar. Ausgehend von einer
gegebenen Feldkonfiguration Abµ (x), lässt sich ein Eichorbit OA im Aaµ -Raum erzeugen.
Die Pfadintegration in einer bestimmten Eichung liefert immer das gleiche Ergebnis. Die
unendliche Anzahl von möglichen Pfaden im Eichorbit führt so zu einer Divergenz der Integration über die kontinuierliche Gruppe der Eichung. Die Integration über eichinvariante
Pfade lässt sich durch die Einführung einer Eichfixierung
Gabµ Abµ = B a
(2.16)
vermeiden. Dabei ist Gabµ ein auf A wirkender Operator und B a eine Funktion der Raumzeit. Mit einer solchen Eichfixierung kann der Eichorbit auf die Feldkonfigurationen Abµ [σ]
eingeschränkt werden, die Gabµ Abµ [σ] = B a erfüllen. Durch diese Bedingung wird die
Lösung im Allgemeinen noch nicht eindeutig festgelegt, da das QCD-Vakuum für gewöhnlich eine nichttriviale Topologie hat. Diese Mehrdeutigkeit ist auch als Gribov-Ambiguity
bekannt [Gri78]. Um die Eichfixierung in die Pfadintegralquantisierung mit einzubeziehen,
soll nur über solche Pfade integriert werden, die die Eichbedingung 2.16 erfüllen. Dies
geschieht durch das Einfügen einer Identität in Gleichung 2.14. Hierfür wird zunächst
implizit ein Funktional ∆G [A] definiert, in das die Eichbedingung als Argument einer
funktionalen δ-Distribution eingeht [Die03]:
Z Y
£
¤
1 = ∆G [A]
[dσ a ]δ (n) Gabµ Abµ [σ] − B a
(2.17)
a
Einsetzen in Gleichung 2.14 ergibt
Z
Z Y
¤
£
−1
[dσ a ]δ (n) Gabµ Abµ [σ] − B a exp (iSA ) .
[dA]∆G [A]
Z[0] = N
(2.18)
a
Da bis auf die Deltadistribution alle Größen eichinvariant sind, lässt sich die durch die
Eichung spezifizierte Feldkonfiguration Aaµ [σ] durch die allgemeinen Aaµ ersetzen, und man
erhält
Z
Z YY
¢ª
© a ¡ abµ b
−1
[dA]∆G [A]
(2.19)
Z[0] = N
dσ δ G Aµ (x) − B a (x) exp (iSA ) .
a
x
RQ Q
a
Der unendliche Faktor
a
x dσ (x) kann aus obigem Ausdruck herausgezogen werden
und wird in die Normierungskonstante einbezogen. Dadurch erhält man eine modifizierte
Definition des erzeugenden Funktionals in der Form:
Z
Z Y
¡
¢
−1
[dA] ∆G [A]
Z[0] = N
δ Gabµ Abµ − B a exp (iSA ) .
(2.20)
|R {z }
a,x
∝ exp(...)
|
{z
}
∝ exp(...)
2.2 Eichfixierung und Faddeev-Popov Trick
11
In dieser Definition ist bereits angedeutet, dass sich sowohl das Funktional ∆G als Grassmannintegral einer Eponentialfunktion, als auch die Deltadistribution durch eine Exponentialfunktion ausdrücken lassen. Die Exponenten der verschiedenen Exponentialfunktionen lassen sich dann zusammenfassen und werden eine effektive Wirkung ergeben. Der
Weg dorthin soll im Folgenden beschrieben werden.
Zunächst erlaubt es die Linearität der Eichbedingung, die Deltadistribution in Gleichung 2.20 durch ein Exponential zu ersetzen [Lee75],
µ Z
¶
Y
¢
¡ abµ b
−i
4
a 2
(2.21)
δ(...) → exp
d x G Aµ − B
α∈ .
2α
a,x
Mit Wiedereinführung des äußeren Flusses gewinnt man so ein erzeugendes Funktional
der Form
¶¸
· Z
µ
Z
¢
1 ¡ abµ b
a 2
−1
4
G Aµ − B
+ J(x) · A(x) .
Z[J] = N
[dA]∆G [A] exp i d x LY M −
2α
(2.22)
Wertet man nun die Definition 2.17 aus, so lässt sich das Funktional ∆G [A] als Determinante einer Matrix MG schreiben [Lee75]. Diese ist gegeben durch
MGab (x, y) =
δGacµ Acµ [σ(x)]
.
δσ b (y)
(2.23)
Durch die Einführung von antikommutierenden Grassmannzahlen C̄a und Ca kann die
Determinante auch als Exponential
¾
½ Z
Z
£ ¤
4
4
a
ab
b
det MG = [dC] dC̄ exp i d xd y C̄ (x)MG (x, y)C (y)
(2.24)
geschrieben werden [Ber66, Lee75]. Die Determinante wird als effektive Wechselwirkung
der neu eingeführten Faddeev-Popov-Geistfelder C und C̄ interpretiert und im erzeugenden
Funktional 2.20 entsteht ein zusätzlicher Term Sghost zur klassischen Wirkung,
Z
Z
4
(2.25)
Sghost = d xLghost = d4 xd4 y C̄a(x)MGab (x, y)C b (y)
Nimmt man nun noch Quellen für die Antigeist- und Geistfelder hinzu, indem man zusätzliche Grassmannzahlen σ und σ̄ einführt, erhält man als Ergebnis des Tricks von Faddeev
und Popov [FP67] das erzeugende Funktional einer reinen Yang-Mills-Theorie:
¶
µ
Z
Z
x
0
b
−1
(2.26)
[dAµ ][dC̄][dC] exp iSef f + i d (J · A + σ̄C + C̄σ) .
Z[J, σ, σ̄] = N
mit der effektiven Wirkung
0
Seff
SYM
Sgauge fix
Sghost
=
=
=
=
S
+ Sgaugef ix + SghostR
RYM
a
4
F aµν
d xL
= − 41 d4 xFµν
¢
¡
R
R 4 YM
1
4
abµ b
a 2
R d4 xLgauge fix = R− 2α4 d4 x aG Aabµ − B b
d xLqhost
=
d xd y C̄ (x)MG (x, y)C (y)
(2.27)
12
Kapitel 2
Motivation der Eichfixierung
Man erkennt, dass Sgauge fix und Sgauge fix eichabhängig sind, da sie die Eichbedingung
explizit enthalten. Um ein besseres Bild von diesen formalen Ausdrücken zu gewinnen,
sollen nun am Beispiel der Landau-Eichung (Gabµ = δ ab ∂ µ und B a ≡ 0) angegeben werden,
wie sich obige Größen berechen. Für die Matrix MGab erhält man in Landau-Eichung
MGab (x, y) = ∂ µ Dµ δ (4) (x − y) = (δ ab ∂ µ ∂µ + gf abc ∂ µ Acµ )δ (4) (x − y),
(2.28)
woraus mit partieller Integration der Determinante die Darstellung der Ghost-Wirkung
folgt. In den eichfixierenden Term braucht nun nur noch die Eichbedingung, B a ≡ 0,
eingesetzt werden und man erhält die folgenden Ausdrücke
R
Sghost
= − dR4 x(∂ µ C̄(x))Dµ C(x)
1
Sgauge fix = − 2α
d4 x(∂ µ Aaµ )2
Zur Quantisierung der Fermionen wird erneut das Konzept der Grassmanvariablen
benötigt. Auf diese Weise wird der antikommutierenden Natur der Feldoperatoren Rechnung getragen. Das vollständige erzeugende Funktional ist dann
Z[J, η, η, σ, σ̄] =
µ
¶
Z
Z
4
−1
b
N
[dAµ ][dq][dq][dC][dC̄] exp iSef f + i d x(J · A + ηq + qη + σ̄C + C̄σ)
0
mit Seff = Seff
+ Sfermion und dem fermionischen Anteil der Wirkung aus Gleichung 2.2
Z
(2.29)
Sfermion = d4 x (q ((∂µ + Aµ )γ µ + m0 ) q) .
Die Verwendung des erzeugenden Funktionals muss nun noch etwas modifiziert werden.
Da die Quellen η und q Grassmann-wertig sind, ist auf zusätzliche Vorzeichen zu achten,
so dass zum Beispiel für die Zweipunkt-Greensfunktion gilt:
h0|T q̂α (x)q̂(y)|0i =
δ 2 Z[J, η, η]
(i)2
Z[0, 0, 0] δ(+η α )δ(−ηβ (y))
(2.30)
Im Folgenden sollen die grundlegenden Propagatoren berechnet werden. Dazu wird
das erzeugenden Funktional in einen freien Anteil Z f und einen wechselwirdenken Anteil Z W W zerlegt. Der freie Anteil enthält alle Terme zweiter Ordnung in den Feldern.
Um eine Separierung zu erreichen, werden die Felder im wechselwirkenden Anteil durch
Funktionalableitungen nach den Quellen ersetzt.
¶¶
µ
µ
δ
δ
δ
δ
δ
Z[J, η, η, σ, σ̄] = exp iSW W
,
,
,
,
,
Z f [J, η, η, σ, σ̄]
iδJ aµ iδσ̄ a iδ(−σ a ) iδη iδ(−η)
(2.31)
f
f
f
Der freie Anteil Z f [J, η, η, σ, σ̄] = Zgauge
[J] · Zghost
[σ, σ̄] · Zfermion
[η, η] faktorisiert weif
ter in Anteile für das Eichfeld mit dem Beitrag der Eichfelder Zgauge
, in Anteile für die
f
f
Faddeev-Popov-Geister Zghost und in Anteile für die Fermionen Zfermion . Die erzeugenden
2.2 Eichfixierung und Faddeev-Popov Trick
13
Funktionale für die unterschiedlichen freien Felder sind nach dieser Faktorisierung wie
folgt gegeben
³ R
´
R
f
= [dA] exp i d4 x(LfYM + Lfgauge fix + A · J) ,
Zgauge
³ R
´
R
f
f
∗
4
Zghost
= [dC][dC ] exp i d x(Lghost + C̄ · σ + σ̄ · C) ,
³ R
´
R
f
Zfermion = [dq][dq] exp i d4 x(Lffermion + qη + ηq)
mit den Lagrangedichten in Landau-Eichung
Lfgauge fix + LY M = − 21 Aaµ K abµν Abn u mit K abµν (x) =
=
Lfghost
Lffermion
= −C̄ a M ab C b
mit
M ab (x) =
= qΛq
mit
Λ(x) =
¯
∂2L ¯
b ¯
∂Aa
µ ∂Aν A=C ∗ =...=0
ab
δ (−g¯µν ∂ τ ∂τ + (1
∂2L ¯
b¯
∂ C̄ a ∂C
¯ C̄=C=...=0
∂2L ¯
∂q∂q ¯
q=q=A=...=0
− α−1 )∂ µ ∂ν ) ,
= δ ab ∂ µ ∂µ ,
= i∂/ + m0 .
Die freien Propagatoren der Teilchen, Gluonpropagator , Ghostpropagator und Quarkpropagator lassen sich nun als Inverse der durch die Funktionalableitung definierten Operatoren definieren.
K caλρ gρµ Dabµν (x − y) = δ cb gρν δ (4) (x − y)
M ca Gab (x − y) = δ cb δ (4) (x − y)
ΛS(x − y) = δ (4) (x − y)
(2.32)
(2.33)
(2.34)
Man erhält die freien Propagatoren in Landau-Eichung. Ihr Wert ist von der Eichung
abhängig, was umgekehrt bedeutet, dass die Propagatoren nur definiert sind, wenn vorher
eine Eichfixierung durchgeführt wurde.
Im folgenden Kapitel soll der Übergang von der kontinuierlichen Eichtheorie zu einer
Gittereichtheorie vollzogen werden und grundlegende Größen definiert werden. Da auf dem
Gitter Propagatoren berechnet werden sollen, wird es auch auf dem Gitter notwendig sein,
eine Eichung zu fixieren.
Ein wichtiger Schritt auf dem Weg zu einer Gittereichtheorie ist die Wick-Rotation .
die Konvergenz der Integrale im Pfadintegralformalismus ist auf Grund von ungedämpften
Oszillationen der Exponentialfunktion nicht automatisch sichergestellt. Als Ausweg wird
die Zeit in der komplexen Ebene um einen negativen Winkel gedreht. Dadurch erhält der
Exponent einen dämpfenden Realteil und die Konvergenz wird erzwungen. Voraussetzung
für diese Transformation ist, dass im überstrichenen Bereich der komplexen t-Ebene keine Singularitäten liegen. Nur dann ist eine analytische Fortsetzung möglich, so dass das
Ergebnis nicht mehr vom Winkel der Drehung abhängt. Bevor man zu einer Gitterformulierung der Eichtheorie übergeht, wird die Zeit um den Winkel π2 gedreht, wodurch sich
eine imaginäre Zeit ergibt. Es findet ein Übergang vom Minkowski-Vektor xµ = (x0 , ~x)
zum Koordinatenvektor (x1 , x2 , x3 , x4 = ix0 ) statt. Durch die Forderung x4 ∈ bilden die
so gewonnenen Vektoren einen euklidischen Raum. Diese Transformation zu imaginären
Zeiten wird Wick-Rotation genannt und ist die Voraussetzung der im Folgenden vorgestellten Gitterdiskretisierung.
14
Kapitel 2
Motivation der Eichfixierung
Kapitel 3
Diskretisierte Eichtheorien
3.1
Einführung in die Gittereichtheorie
Gittereichtheorien sind geeignet für eine nichtstörungstheoretische Behandlung abelscher
und nichtabelscher Theorien. Sie bieten die Möglichkeit, physikalische Größen wie Korrelationsfunktionen ohne Nutzung der Störungstheorie zu berechnen. Im folgenden Abschnitt
wird zunächst beschrieben, wie die Diskretisierung selbst durchgeführt wird und wie sich
Eichpotential und Eichtransformation im Gittermodell definieren lassen. Danach werden
einige Beispiele diskretisierter Eichbedingung gegeben, wobei der Schwerpunkt auf der
Landau-Eichung liegt. Abschließend werden Konzepte zur Fixierung der Landau-Eichung
auf dem Gitter vorgestellt und wichtige Größen vorgestellt, die die statistischen Prozesse
charakterisieren und anhand derer sich Aussagen über die Effizienz der Fixierungsmethode
treffen lassen.
Gittereichtheorien sind auf einer diskretisierten Raumzeit definiert. Die in der Arbeit verwendete Diskretisierung geht auf die von Wilson eingeführte Formulierung zurück
[Wil74], in der die Links Uµ (x) zwischen den Gitterpunkten eines Raum-Zeit-Gitters die
fundamentalen Freiheitsgrade der Theorie sind (Abbildung 3.1). Die herkömmliche Definition der Eichfelder ist durch
Uµ (x) = Peig0
R x+eµ
x
Aµ (z)dz
= eig0 aAµ (x+eµ /2) + O(a3 )
(3.1)
gegeben, wobei P der Pfadordnungsoperator und g0 die nackte Kopplung ist. Die Definition leitet sich aus der Interpretation der Uµ (x) als Paralleltransporter auf dem Gitter ab.
Der Vektor eµ wird hier und im Weiteren für den Vektor der Länge a in µ-Richtung stehen. In einigen Fällen wird auch eine Definition des Gittereichpotentials benötigt. Dieses
ist gegeben durch
#
"
Uµ (x) − Uµ† (x)
+ O(a2 ).
(3.2)
Aµ (x + eµ /2) =
2iag0
spurlos
Da Beziehung 3.2 und 3.1 nur im Limes a → 0 übereinstimmen müssen, sind auch andere
Definitionen für das Gittereichpotential möglich.
Die auf dem Gitter definierten Uµ (x) sind Elemente der SU (N )C Eichgruppe1 in ihrer
1
Der Index C soll auf den physikalischen Hintergrund hinweisen, dass es sich um einen Farbindex
handelt. Er wird im Folgenden nur noch verwendet, wenn nicht bereits aus dem Kontext hervorgeht, um
welches N es sich handelt.
15
16
Kapitel 3
Diskretisierte Eichtheorien
Fundamentaldarstellung. Unter den auf den Gitterpunkten definierten Eichtransformationen g(x) transformieren sie sich mit:
Uµg (x) = g(x)Uµ (x)g † (x + eµ ).
(3.3)
Eichtransformierte von aus den Eichfeldern abgeleiteten Größen lassen sich durch Einsetzen der U g (x) anstelle der U (x) berechnen. Eichtransformierte Größen werden analog
zum Eichfeld mit dem Index g der Eichtransformation gekennzeichnet.
Die Anordnung der Eichkonfigurationen U und Eichtransformationen g auf einer diskretisierten Raum-Zeit ist in Abbildung 3.1 anhand eines zweidimensionalen Schnittes
dargestellt.
q
g(x +q e2 )
q
U2 (x)
q
U−1 (x)
U (x)
g(x) 1
g(x + e1 )
U−2 (x)
q
q
q
g(x − e2 )
Abbildung 3.1: Freiheitsgrade der Eichtheorie auf dem Gitter
Auf den Gitterpunkten sind die Eichtransformationen definiert. Die Links, auf denen
die fundamentalen Eichfelder definiert sind, werden durch Verbindungslinien gekennzeichnet. Auf Grund von Definition (3.1) gilt:
U−µ (x) = Uµ† (x − eµ ).
(3.4)
Die einfachste eichinvariante Größe, die sich auf dem Gitter definieren lässt, ist die
Plaquette
Pµν (x) = Uµ (x)Uν (x + eµ )Uµ† (x + eν )Uν† (x).
(3.5)
Sie beschreibt das pfadgeordnete Produkt von Link-Variablen um die kleinste Schleife
auf dem Gitter. Für eine Yang-Mills-Eichtheorie lässt sich daraus die Wilson-Wirkung für
SU (N )-Gittereichtheorien definieren
¶
XXµ
1
SW [U ] = β
1 − Re tr Pµν (x) .
(3.6)
N
x µ<ν
Der Parameter β ist der einzige freie Parameter der Theorie. Es wird nun gezeigt, dass
die Wilson-Wirkung im Kontinuumslimes in die Yang-Mills-Wirkung übergeht.
a
Mit der Darstellung der Eichfelder Uµ (x) = e−iagAµ (x) und der Feldstärke Fµν
= ∂µ Aaν −
∂ν Aaµ + gf abc Aaµ Acν lässt sich die Plaquette in Termen von Fµν entwickeln2
1
Pµν (x) = − a2 gFµν + a4 Fµν Fµν ± ...
2
2
(3.7)
In dieser Entwicklung soll auf der rechten Seite keine Summation über µ und ν durchgeführt werden.
3.1 Einführung in die Gittereichtheorie
17
Vollzieht man nun die Spurbildung in der Wilsonwirkung und beachtet, dass tr Fµν = 0, so
sieht man, dass im Kontinuumslimes a → 0 für hinreichend glatte Eichfelder die klassische
Yang-Mills-Wirkung gewonnen wird
Z
g2 b b
F F ,
(3.8)
SW −→ −β d4 x
a→0
8NC µν µν
wenn die Kopplungskonstante g durch β = 2N
bestimmt ist. Das erzeugende Funktional
g2
lässt sich nun formal wie folgt auf dem Gitter definieren
Z
lat.
Z = [dU ]e−SW [U ] ,
(3.9)
wobei das Integrationsmaß [dU ] durch
Z
YZ
[dU ] =
dUµ (x)
(3.10)
x,µ
gegeben ist. Es ist das Haarsches Maß der Lie-Gruppe. Eine genauere Beschreibung des
Haarschen Maßes wird in Anhang A.3 gegeben.
3.1.1
Observable
Nun lässt sich auch der Erwartungswert einer Observable O durch
Z
−1
[dU ]O[U ]e−SW [U ]
hOlattice i = Z
(3.11)
angeben. Der Ausdruck beinhaltet im Falle der Gittereichtheorie ein hochdimensionales
Integral über eine kompakte SU (N )-Gruppe. In Simulationen wird dieses Integral in Form
einer Monte-Carlo-Integration
ausgeführt. Dabei werden Konfigurationen mit dem Maß
P
−SW
−β (...)
3
e
∝e
erzeugt , so dass nur noch über diese Konfigurationen gemittelt werden
muss. Der Erwartungswert der Observable schreibt sich daher auch als
hOlattice iM C =
1
NKonf
NX
Konf
Oi .
(3.12)
i=1
Die Methode, die Integration mit einem Maß in eine einfache Sequenz von Zufallsvariablen umzuwandeln, die bereits mit diesem Maß generiert wurden, wird auch Importance
Sampling genannt. Der Kontinuumslimes einer solchen Observablen kann nur als Limes
kleiner werdender Gitterabstände a bei gleichzeitig wachsendem Gittervolumen V
hOi = lim lim hOlattice iM C
V →∞ a→0
(3.13)
erhalten werden. Nun ist die Wilson-Wirkung SW bereits per Definition eichinvariant,
so dass in der Gittereichtheorie im Hinblick auf die Berechnung eichinvarianter Observablen Eichfixierung und die Einführung von Eich- und Geisttermen nicht mehr notwendig
erscheinen.
3
Um Konfigurationen mit einer Boltzmannverteilung erzeugen zu können, wird auf einen Metropolisoder auf einen Heatbath-Algorithmus zurückgegriffen, der beim Weiterlesen in der Beschreibung des Simulated Annealings auftauchen wird.
18
Kapitel 3
3.1.2
Diskretisierte Eichtheorien
Propagatoren
Im Folgenden werden die Berechnungen von Ghost- und Gluon-Propagatoren in der Gittereichtheorie skizziert. Diese Teilchen unterliegen dem Confinement und dies spiegelt
sich im Propagator wider. Wie schon bei der Definition dieser beiden Propagatoren im
Kontinuum angedeutet wurde, handelt es sich um eichabhängige Größen. Bestimmte Eigenschaften4 dieser Propagatoren lassen sich als Folge der nichttrivialen Vakuumstruktur
ansehen. Sie kehren auch in der Gitterdiskretisierung wieder und lassen sich in Zusammenhang mit der Existenz von Monopolen bzw. Vortizes im Vakuum bringen. Im Folgenden
werden die Propagatoren in der Landaueichung diskretisiert.
Gluon-Propagator
Der Gluonpropagator ist als Zwei-Punkt-Greensfunktion der Gluonfelder Aµ (x) definiert.
Die diskretisierte Definition des Gluon-Propagators ist entsprechend durch

®
ab
Dµν
(x − y) = Aaµ (x)Abν (y) M C
(3.14)
gegeben. Der Index M C steht für die Monte-Carlo-Mittlung auf dem Gitter. Die Art der
Eichfixierung ist in diesem Fall implizit in der Konstruktion der Eichpotentiale Aµ (x)
enthalten.
Der Propagator im Ortsraum ist eine schnell fallende Funktion, wodurch das genaue
Verhalten bei großen Distanzen kx−yk durch statistisches Rauschen verdeckt wird. Stattdessen wurde die Messung des Propagators im Impulsraum vorgeschlagen [Zwa91, Cuc99].
Im Kontinuum wird der Übergang zum Impulsraum in euklidischer Formulierung durch
die Fouriertransformation erreicht
Z
ab
Dµν (p̂) = −i d4 xh0|P[Aaµ (x)Aaν (0)]|0i exp(ip̂x)
(3.15)
mit dem Pfadordnungsoperator P. Es ist günstig, diesen Propagator in einen transversalen
und einen longitudinalen Anteil zu zerlegen:
·µ
¶
¸
p̂µ p̂ν
p̂µ p̂ν dl (p̂2 )
ab
ab
2
δµν − 2
Dµν (p̂) = −iδ
dt (p̂ ) + α 2
(3.16)
p̂
p̂
p̂2
Die skalare Funktion dl (p̂2 ) reduziert sich für linear kovariante Eichungen auf eine Konstante. In der Landau-Eichung verschwindet der zweite Term wegen α = 0 sogar komplett.
Auch der Gluonpropagator in der SU (N )-Gittereichtheorie kann mittels einer Fouriertransformation in analoger Weise im Impulsraum gegeben werden:
ab
Dµν
(p̂k ) =
1 X ab
D (x − y) exp(ip̂(x − y)))
V x,y µν
mit p̂k =
2π
nk ,
Lk a(β)
(3.17)
wobei nk die Matsubara-Moden in k-Richtung sind und Lk die Zahl der Gitterpunkte in in
dieser Richtung bezeichnet5 . Der Gluonpropagator in Landau-Eichung ist diagonal in den
4
Dies sind bestimmte Analytizitätseigenschaften, verstärkte Singularitäten bzw. das Verschwinden im
Infrarotbereich.
5
Die Abhängigkeit des Gitterabstandes von β ist zum Beispiel in [BCLM03, GM84] untersucht.
3.1 Einführung in die Gittereichtheorie
19
Farbladungen und transversal bezüglich p̂ im Impulsraum. Die wesentliche Information
steckt dann in dem durch
X
F (p2 )
p2
a,µ
X
®
Aaµ (p̂)Aaµ (−p̂) M C
=
D(p̂) =
aa
Dµµ
(p̂) =:
(3.18)
(3.19)
a,µ
definierten Propagator mit den durch periodische Fouriertransformation definierten
Gluonfeldern. Da die Gitterausdehnung in jeder Richtung durch Lk · a(β) beschränkt
π
ist, ist auch im Impulsraum ein Ultraviolettcutoff durch λ = α(β)
gegeben. Die Fouriertransformierte des Gluonfeldes ist
1 X
A(p̂) := √
A(x + eµ /2) exp(ip̂(x + eµ /2))
V p
1 X
= √
A(x + eµ /2) [cos(p̂(x + eµ /2)) − i sin(p̂(x + eµ /2))] ,
V p
woraus sich nach Einsetzen in Gleichung 3.19 der Propagator zu
!2 Ã
*Ã
!2 +
X
X
1 X
Aaµ (x + eµ /2) cos(p̂(x + eµ /2)) +
Aaµ (x + eµ /2) sin(p̂(x + eµ /2))
D(p̂) =
V a,µ
x
x
MC
(3.20)
berechnet.
Ghostpropagator
Der Ghostpropagator G ist durch Inversion des inversen Faddeev-Popov-Operators M
gegeben (vgl. Gleichung 2.33) und nimmt auf dem Gitter die Form
D¡
E
¢
ab
−1 ab
G(x − y)δ = M
(x, y)
(3.21)
MC
an. Er ist im Impulsraum durch
G(p̂)δ
ab
=
1
√
adj
NC
V
X
x,y
−ip̂(x−y)
e
D¡
M
¢
−1 ab
E
(x, y)
MC
(3.22)
gegeben. Auch hier ist die Eichabhängigkeit implizit in der Definition des Faddeev-PopovOperators enthalten und darf nicht vernachlässigt
P werden. Der Faddeev-Popov-Operator
in Landau-Eichung ist die Hessische Matrix von xmµ Re[tr(Uµ (x))], wie sich später zeigen
wird. Er ist eine symmetrische positiv semidefinite Matrix und kann mittels des Verfahrens
der konjugierten Gradienten invertiert werden. Für den Ghostpropagator wird durch die
implizite Definition
ZG (p2 )
G(p) ∝
(3.23)
p2
die Strukturfunktion ZG gegeben, anhand derer im Weiteren gezeigt wird, warum die
Eindeutigkeit der Eichfixierung wichtig ist.
20
Kapitel 3
3.2
Diskretisierte Eichtheorien
Eichfixierung
Auch wenn Eichfixierung nicht notwendig ist, um die Wohldefiniertheit des Funktionalintegrals auf dem Gitter zu gewährleisten, wird sie im Kontinuumslimes wichtig beim
Verständnis des Zusammenhangs von Kontinuums- und Gittereichtheorie. Im Kontinuum
ist die Betrachtung von eichabhängigen Korrelationsfunktionen und die Untersuchung
von Propagatoren, wie dem Gluon-, Ghost- oder Quarkpropagator ohne Fixierung der
Eichung nicht möglich. Sollen diese Größen ebenfalls auf dem Gitter untersucht werden,
ist auch hier die Eichung zu fixieren, schon um die Eindeutigkeit des Kontinuumslimes zu
gewährleisten.
Im Folgenden werden daher einige wichtige Eichbedingungen und ihre Umsetzung
in der Gittereichtheorie vorgestellt (für eine ausführlichere Zusammenstellung vgl. z.B.
[GPP+ 01]). Begonnen wird mit der gewöhnlichen kovarianten Eichung, anhand derer die
Hauptidee der Eichfixierung auf dem Gitter über die Maximierung eines Eichfunktionals
eingeführt wird. Dass nicht alle Eichungen auf dem Gitter auf einer solchen Maximierung
beruhen, wird anhand der Laplace-Eichung gezeigt. Im weiteren Verlauf werden mit der
maximal abelschen Eichung und der maximalen Zentrumseichung Eichbedingungen vorgestellt, die bei der Beschreibung des QCD-Confinement von Bedeutung sind. An ihrem
Beispiel wird eine Methode vorgestellt, mit Hilfe von SU (2) Algorithmen auch SU (3) Gittereichtheorien eichfixieren zu können. Der letzte und größte Teil dieses Abschnitts widmet
sich der in der Arbeit betrachteten Landau-Eichung und dem Problem der Gribov-Kopien.
3.2.1
Gewöhnliche kovariante Eichung
Die Faddeev-Popov Quantisierung für die kovariante Eichung wird durch Fixierung der
Eichbedingung
∂µ Agµ (x) = Λ(x)
(3.24)
erreicht, wobei Λ(x) fest vorgegeben ist und Werte in der Lie-Algebra der Eichgruppe
annimmt. Die entscheidende Idee zur Fixierung der Eichbedingung besteht darin, die partielle Differentialgleichung (3.24) als Variationsproblem δH[g] zu formulieren, das (3.24)
impliziert. Dazu sucht man ein Funktional HA [g], das einen kritischen Punkt6 erreicht, falls
Gleichung 3.24 erfüllt ist. Anstelle der Lösung der Differentialgleichung (3.24) wird dann
die numerisch besser zu lösende Extremwertaufgabe betrachtet. Diese Idee liegt auch den
meisten der im Folgenden vorgestellten Eichungen zu Grunde. Für die kovariante Eichung
ist dieses Funktional
Z
¤
£
(3.25)
HA [g] = d4 x tr (∂µ Agµ − Λ)† (∂ν Agν − Λ)
und mit
g(x) = eiω(x)
(3.26)
gilt in der Tat
6
¤b
£
δHA [g]
= 2Φab (ω) Dν ∂ν (∂µ Agµ (x) − Λ(x)) ,
a
δω
(3.27)
Transformationen g werden als kritische Punkte von H bezeichnet, falls das Differential von H dort
nicht surjektiv ist.
3.2 Eichfixierung
wobei
21
·
eγ − Φ (ω) =
γ
ab
¸ab
γ ab = f abc ω c .
HA [g] erreicht demnach einen kritischen Punkt, falls
∂µ Agµ (x) − Λ(x) = 0
(3.28)
gilt. Die Umkehrung gilt jedoch im Allgemeinen nicht, so dass zusätzlich ausgeschlossen
werden muss, dass HA [g] auch kritische Punkte mit der Eigenschaft
∂µ Agµ (x) − Λ(x) = konst.
(3.29)
aufweist. Für periodische Randbedingungen kann dies gezeigt werden (vgl. [Giu97]).
Eine gebräuchliche, diskretisierte Form dieses Funktionals ist
HU [g] =
mit
1 X g
tr
J (x)J g† (x)
V
x
(3.30)
J(x) = N (x) − igP
0 Λ(x),
¢
¡
N (x) = −8 · + ν Uν† (x − eν ) + Uν (x) ,
das für seine Minima die diskretisierte Eichbedingung erfüllt. Die genaue Form der diskretisierten Eichbedingung ist zum Beispiel in [Giu97] zu finden. Lösungsmethoden für
die resultierenden Extremwertaufgaben werden in einem späteren Abschnitt am Beispiel
der Landau-Eichung vorgestellt.
3.2.2
Laplace-Eichung
Als Alternative zu den Standardeichfixierungsmethoden soll nun die Laplace-Eichung vorgestellt werden. Ziel der Laplace-Eichung ist eine Eichbedingung, die eindeutig fixierbar ist, um Probleme mit ungewollten Lösungen der Funktionalmaximierung, wie den
später vorgestellten Gribov-Kopien der Landau-Eichung, zu vermeiden. Weiterhin soll die
Laplace-Eichung zu einer möglichst glatten Konfiguration führen.
Zunächst wird der kovariante, positiv semidefinite Laplaceoperator als
X£
¤
2δ(x − y)δ ab − Uµab (x)δ(x + eµ − y) − Uµab† (y)δ(y + eµ − x) . (3.31)
∆[U ]ab (x, y) =
µ
definiert. Die Eigenfunktionen fi von ∆[U ] ergeben sich folglich aus der Eigenwertgleichung
X
∆[U ]ab (x, y)fib (y) = λi fia (x)
(3.32)
b,y
mit den Eigenwerten λi ≥ 0. Für ein nicht entartetes Spektrum sind diese Eigenfunktionen
bis auf globale Phasenverschiebungen orthogonal, eindeutig und transformieren sich unter
einer Eichtransformation g wie fi (x) → g(x)fi (x), wodurch sich ein Gl (N ) Matrixfeld
£
¤
M (x) := f1 · · · fN (x),
fi (x) ∈ N
(3.33)
22
Kapitel 3
Diskretisierte Eichtheorien
definieren lässt, das sich wie eine Eichtransformation verhält7 . Das Transformationsverhalten von M hängt dabei nicht von der Wahl der Eigenfunktionen ab. Um jedoch die
glattesten zu wählen, entscheidet man sich für die mit den kleinsten Eigenwerten. Im
Allgemeinen liegen die M (x) ∈ Gl (N ) nicht in der Eichgruppe. Es ist jedoch mittels
Polarzerlegung invertierbarer Operatoren möglich, M derart zu zerlegen, dass gilt
†
M (x) = g∆
(x)R(x)
mit g∆ ∈ SU (N ).
(3.34)
Die so gewonnene Eichtransformation g∆ fixiert die Laplace-Eichung. Der mathematische
Hintergrund der Polarzerlegung ist in Anhang A.4.3 dargestellt. Das Entscheidende dieser
Eichfixierungsmethode ist jedoch, dass sie nicht auf der Maximierung eines Funktionals
beruht und sich dadurch von den anderen vorgestellten Eichfixierungen unterscheidet.
3.2.3
Maximal Abelsche Eichung
Die maximal abelsche Eichung lässt sich sehr gut für eine SU (2) Eichtheorie beschreiben
[BBMPS96, STW02]. Am Beispiel der maximal abelschen Eichung soll dann auch gezeigt
werden, wie für SU (3)-Eichtheorien eine Eichfixierung umgesetzt werden kann, die auf
SU (2)-Untergruppeneichfixierungen basiert.
Die maximal abelsche Eichung spielt eine entscheidende Rolle für das Verständnis
des Bildes der Flussschläuche in der Beschreibung des Confinement Mechanismus. Ziel
der maximal abelschen Eichung ist es, die Eichfreiheitsgrade derart zu fixieren, dass die
Symmetrie unter der maximal abelsche Untergruppe (U N −1 (1) für SU (N )) ungebrochen
bleibt. Wird in einer SU (2) Eichtheorie A3µ als abelsches Feld gewählt, so sind die Eichbedingungen
¢
¡
(3.35)
∂µ ± iA3µ A±
µ = 0
1
2
√1
mit A±
µ = 2 (Aµ ± iAµ ) zu erfüllen. Auch diese Eichbedingung lässt sich als Extremwertproblem formulieren, so dass Eichtransformationen, die das Eichfunktional
Z
¡
¢
GU [g] = d4 x (A1µ )2 + (A2µ )2
(3.36)
minimieren, auch die Eichbedingung 3.35 erfüllen. In einer Gittereichtheorie wird die
diskretisierte Form dieses Eichfunktionals verwendet:
X ¡
¢
GU [g] =
tr σ3 Uµg (x)σ3 Uµg † (x) .
(3.37)
x,µ
Die Fixierung dieser Eichung ermöglicht die Nebenklassezerlegung der Konfiguration
Uµ (x) = Cµ (x)Vµ (x),
in der sich, unter Berücksichtigung von U (1) Restklassentransformationen, Vµ (x) =
exp(iΦµ (x)τ3 ) wie ein neutrales Eichfeld und Cµ (x) wie ein geladenes Materiefeld verhält.
Das so gewonnene abelsche Eichfeld Vµ (x) kann nun zur Untersuchung der abelsch approximierten Erwartungswerte von Wilson- und Polyakov-Loops und zur Untersuchung
topologischer Größen wie magnetischen Monopolströmen genutzt werden.
7
Unter einer Eichtransformation g verhält sich M wie M (x) → g(x)M (x), da sich die Spalten in dieser
Weise transformieren.
3.2 Eichfixierung
23
Besonders eingegangen werden soll in diesem Abschnitt jedoch auf die Nutzung der
Eichfixierung aus SU (2)-Eichtheorien für die SU (3)-Eichtheorie.
In einer SU (3)-Eichtheorie gibt es zwei abelsche Eichfelder, A3µ und A8µ . Mit der Wahl
der abelschen Eichfelder werden die SU (2) Untergruppen I, V und U mit den zugehörigen
Eichfeldern wie folgt festgelegt (vgl. z.B. [SW01])
I : A1µ , A2µ , A3µ ,
0
V : A4µ , A5µ , A3µ ,
00
U : A6µ , A7µ , A3µ ,
wobei die Wahl der abelschen Eichfelder zu den Definitionen
¡√
¢
0
A3µ = 12 ¡√3A8µ + A3µ ¢ ,
00
3A8µ − A3µ
A3µ = 21
führt. Aus dieser SU (3)-Zerlegung
bedingungen,
I :
V :
U :
mit
ergeben sich sechs nach Untergruppen sortierte Eich¢ ±
¡
3
= 0,
µ
¡ ∂µ ± iA3µ0 ¢ A±
0
= 0,
µ
¡ ∂µ ± iA3µ00 ¢ A±
00
∂µ ± iAµ Aµ = 0,
0
5
4
√1
V : A±
µ = 2 (Aµ ± iAµ ),
00
6
7
√1
U : A±
µ = 2 (Aµ ± iAµ ).
Die einfachste Wahl eines Eichfunktionals, das alle Felder8 gleichberechtigt behandelt,
ist mit
Z
¡
¢
GU [g] = d4 x (A1µ )2 + (A2µ )2 + (A4µ )2 + (A5µ )2 + A6µ )2 + (A7µ )2
dem für die SU (2)-Eichtheorie formulierten Funktional sehr ähnlich. In seiner Umsetzung
auf dem Gitter werden nun die Pauli-Matrizen der SU (2) durch die Gell-Mann-Matrizen
der SU (3) ersetzt und eine Minimierung des Kontinuumsfunktionals ist äquivalent zur
Maximierung des auf dem Gitter definierten Funktionals:
X ¡
¢
GU [g] =
tr λ3 Uµg (x)λ3 Uµg † (x) + λ8 Uµg (x)λ8 Uµg † (x)
x,µ
= 2
X¡
x,µ
¢
|(Uµg )11 |2 + |(Uµg )22 |2 + |(Uµg )33 |2 − 1 .
Somit wurde wieder das Problem der Eichfixierung auf ein Maximierungsproblem zurückgeführt, dass sich iterativ in den Untergruppen lösen lässt.
3.2.4
Zentrumseichung
Eine weitere, für die Untersuchung topologischer Größen wichtige Eichung ist die Zentrumseichung . Als Zentrum einer Gruppe wird die kleinste mit allen Elementen kommutierende Untergruppe bezeichnet. Im Falle der SU (N ) ist dies die Z(N ), die gerade die
Wurzeln der Eins enthält.
©
ª
m
Z(N ) = {z ∈ SU (N ) | ∀s ∈ SU (N ) : zs = sz} = e2πi N | m = 1, ..., N ,
(3.38)
8
Es sind alle Felder, mit Ausnahme der abelschen Felder gemeint.
24
Kapitel 3
Diskretisierte Eichtheorien
Ziel der Zentrumseichung ist nun, die SU (N )-Links der Konfigurationen so gut auf
das Zentrum Z(N ) der Gruppe zu eichen, wie es die volle nichtabelsche Eichfreiheit
zulässt. Die Zentrumseichung lässt sich wieder auf die Maximierung eines Eichfunktionals
zurückführen.
¯2
1 X ¯¯
ZU [g] =
tr Uµg (x)¯
(3.39)
dNC V x,µ
Dabei entspricht d der Zahl der Dimensionen. Analog zur abelschen Eichung lässt sich
die Maximierung von ZU am einfachsten für eine SU (2)-Eichtheorie durchführen. Deshalb
wird in SU (N )-Eichtheorien die Eichung unter Verwendung des Cabibbo-Marinari-Okawa
Verfahrens schrittweise in den SU (2)-Untergruppen fixiert[Mon00]. Die Maximierung von
Bedingung 3.39 ermöglicht die einfache Zerlegung der Eichkonfiguration
Uµ (x) = Zµ (x)Vµ (x)
in einen Anteil Zµ (x) ∈ Z(N ) und einen Nebenklassenanteil Vµ (x) ∈ SU (N ). Die aus
den Zµ (x) konstruierten Plaquettewerte Zµν (x) sind nun auf die NC Wurzeln der Eins
beschränkt (±1 im Falle der SU (2)). Die Hoffnung besteht nun darin, dass auf den
Plaquetten des Gitters definierte eichabhängige P-Vortices (projizierte Vortices) dazu
dienen können, eichunabhängige Zentrums-Vortices zu lokalisieren, was das ZentrumsVortex-Bild des Confinements unterstützen würde [DDFGO97].
3.2.5
Landau- und Coulomb-Eichung
Die in dieser Arbeit untersuchte Eichung ist die Landau-Eichung . Ihr ist deshalb auch
der ausführlichste Abschnitt gewidmet. Die Coulomb-Eichung wird aufgrund ihrer mathematischen Nähe zur Landau-Eichung in diesem Abschnitt gleichzeitig beschrieben.
Dabei gibt es einen grundlegenden Unterschied zwischen beiden Eichungen, denn
während die Landau-Eichung als kovariante Eichung eine Bedingung für räumliche und
zeitliche Freiheitsgrade des Eichpotentials darstellt, erfasst die Coulomb-Eichung ausschließlich die räumlichen Freiheitsgrade. Die differentiellen Eichbedingungen sind die
folgenden
Landau-Eichung
∂µ Aµ = ∂A = 0
Coulomb-Eichung
∂i Ai = div A = 0.
Das korrespondierende Eichfunktional ist
Z
¡
¢
g
g
g
g 2
FA [g] = − tr d4 x Ag†
µ (x)Aµ (x) = (A , A ) = kA k
(3.40)
(3.41)
und erreicht sein Maximum, falls die Eichbedingung 3.40 erfüllt ist. Die Summation über µ
im Integral erfolgt für die Landau-Eichung über alle vier Indizes, für die Coulomb-Eichung
nur über die drei räumlichen.
Das Standardverfahren (siehe z.B. [Rot97]), die Coulomb- oder Landau-Eichung in
einer Gittereichtheorie zu fixieren, basiert auf der numerischen Maximierung des Eichfunktionals
l
XX
1
Uµg(x) (x).
(3.42)
Re tr
FU [g] =
lNc V
x µ=1
3.2 Eichfixierung
25
Die Normierung enthält die Zahl der Farbindizes Nc , das Gittervolumen und die Zahl der
Dimensionen l, über die summiert wird9 . Für kleine Variationen
g(x) = eiλω(x)
gilt
X
∂FU [g](λ)
= − Re tr
iω(x)[Uµg (x − eµ ) − Uµg (x)],
∂λ
x,µ
(3.43)
so dass in Extremal- und Sattelpunkten mit Re tr(iUµ ) = 21 tr(iUµ − iUµ† ) und mit tr(ω) =
tr(ω † ) gelten muss:
"
#
¯
Xi
X
∂FU [g](λ) ¯¯
ω(x)
= − tr
(Uµ (x − eµ ) − Uµ† (x − eµ )) − (Uµ (x) − Uµ† (x))
¯
∂λ
2
λ=0
x
µ
!
= 0
∀ω(x).
(3.44)
Mit der Definition 3.2 des Eichpotentials Aµ (x + eµ /2) ∝ (Uµ (x) − Uµ† (x)) ist in den den
stationären Punkten auch
X¡
¢
Agµ (x + eµ /2) − Agµ (x − eµ /2) = 0
(3.45)
∆g (x) =
µ
erfüllt. Gleichung 3.45 entspricht der diskretisierten Form der differentiellen Eichbedingung.
3.2.6
Gribov-Kopien
1978 beschrieb Vladimir Naumovich Gribov die Nichteindeutigkeit der Eichfixierung in
nichtabelschen Eichtheorien [Gri78], falls sie auf einer gewöhnlichen linearen Eichbedingung basieren. So existieren verschiedene Eichpotentiale, die die Eichbedingung erfüllen,
ohne über eine globale Eichtransformation miteinander verbunden zu sein. Die Anwesenheit solcher Gribov-Kopien bedeutet aber auch, dass die Bedingungen der Landau-Eichung
(3.40) nicht ausreichen, um alle redundanten Freiheitsgrade durch Eichtransformationen
eliminieren zu können. In der kanonischen Quantisierung dient eine Eichfixierung zur
eindeutigen Identifizierung des Feldes und der Sicherstellung, dass im Pfadintegralformalismus keine Doppelzählungen von Konfigurationen vorkommen, obwohl sie eichäquivalent
sind. Um die dadurch entstehenden Mehrdeutigkeiten zu vermeiden, müssen die Eichfreiheitsgrade der Eichfixierung vollständig entfernt werden.
Es werden nun einige Definitionen eingeführt, anhand derer das Gribovproblem beschrieben werden kann.
Für jedes Eichpotential Aµ heißt die Klasse der mit ihm über eine Eichtransformation g
verbundenen Eichpotentiale der Eichorbit OA von Aµ .
©
ª
OA = A0µ | ∃g : g † A0µ g − ig −1 ∂µ g = Aµ .
(3.46)
Die Schnittmenge des Eichorbits mit der durch die Eichbedingung ∂A = 0 definierten
Mannigfaltigkeit enthält die eichfixierten Potentiale. Gibt es nur einen Schnittpunkt, ist
9
l = 3 entspricht der Coulomb-Eichung, l = 4 der Landau-Eichung
26
Kapitel 3
Diskretisierte Eichtheorien
die Eichung eindeutig. Ist dies nicht der Fall, so repräsentiert jeder Punkt der Schnittmenge eine Gribov-Kopie. Mittels Gleichung 3.41 lässt sich auf dem Orbit eine Norm
(3.47) definieren, die es erlaubt, zwischen den verschiedenen lokalen Gribov-Kopien zu
unterscheiden.
FA [g] = kAg k2
(3.47)
Globale Eichtransformationen ändern die Norm nicht und können in einer Äquivalenzklasse zusammengefaßt werden. Kritische Punkte des Funktionals kennzeichnen Transformationen, die die Landau-Eichbedingung erfüllen. Da, wie bereits erwähnt, nach Auffinden
eines kritischen Punktes die Landau-Eichung noch nicht eindeutig fixiert ist, benötigt
man eine schärferen Bedingung, um die Maxima dieses Funktionals zu finden. Sie sind
durch nichtnegative Eigenwerte der Hesse-Matrix von −kAg k2 gekennzeichnet, deren Determinante auch als Faddeev-Popov-Determinante bezeichnet wird. Im Falle der LandauEichung im Kontinuum ist der Faddeev-Popov-Operator durch
M = −∂ µ Dµ
(3.48)
gegeben. Die Menge der Eichpotentiale Ag , die den Maxima des Eichfunktionals entsprechen, wird als Gribovgebiet 10
Ω = { A | ∂A = 0, −∂D > 0 }
(3.49)
bezeichnet. Dabei ist Ω eine konvexe Menge, auf deren Rand ∂Ω, dem so genannten
Gribovhorizont , die niedrigsten nichttrivialen Eigenwerte des Faddeev-Popov-Operators
verschwinden. Um die Zahl der Lösungen, die die Eichbedingung erfüllen, weiter einzuschränken, wird das Gribovgebiet deshalb auf die Untermenge der absoluten Maxima des
Eichfunktionals eingeschränkt. Diese Untermenge heißt Fundamental Modular Region Λ
Λ = { A | ∀g ∈ G : FA [g] ≤ FA [ ] } .
(3.50)
G bezeichnet die Menge der lokalen Eichtransformationen. Diese Einschränkung führt zu
einer exakten Eichfixierung, falls das Eichfunktional für jedes Eichpotential nur ein nicht
entartetes absolutes Maximum besitzt. Da dies im Allgemeinen nicht so ist [Gri78, Sin78],
müssen die anderen Maxima gefunden werden, um nach einem weiteren Kriterium eines
auszuwählen.
Das Problem der Gribov-Kopien ist auch auf dem Gitter vorhanden. Allerdings haben hier die bereits eingeführten Begriffe eine neue Bedeutung, denn die auf dem Gitter
vorgefundenen Kopien sind zum Teil ein Ergebnis der Gitterdiskretisierung und es stellt
sich die Frage, ob Gittergribovkopien im Kontinuumslimes in Kontinuums-Gribov-Kopien
übergehen.
Der Einfluss der Gitter-Gribov-Kopien auf die numerischen Ergebnisse ist jedoch vorhanden und ihre Auswirkung methodisch untersuchbar. Hierfür wird zu einer thermalisierten Startkonfiguration ein Ensemble von Eichkopien dieser Startkonfiguration mittels
zufällig generierter Eichtransformationen erzeugt. Die Eichung wird nun für alle Kopien
unter Berücksichtigung der Eichbedingung fixiert. Im Allgemeinen wird nicht das gesamte
10
Positivität des Faddeev-Popov-Operators M (A) bedeutet, dass alle nichttrivialen Eigenwerte λn [A]
positiv sind. Es gibt triviale Null-Eigenwert für konstante Eigenvektoren ∂µ ω = 0, die Generatoren von
globalen Eichtransformationen sind.
3.2 Eichfixierung
27
Ensemble auf die gleiche eichfixierte Endkonfiguration geeicht werden. Als Folge tauchen
Gitter-Gribov-Kopien mit verschiedenen lokalen Maxima des Eichfunktionals 3.42 auf.
Eine erste Unterscheidung der Gribov-Kopien ist anhand des Eichfunktionals FA möglich,
da es eine eichvariante Größe auf dem Gitter ist. Sie ist nur invariant unter gÄ lobalen
Eichtransformationen, reagiert aber sehr empfindlich auf Gribov-Kopien.
3.2.7
Gribov-Rauschen
Falls ein Algorithmus eine gegebene Eichkonfiguration hinsichtlich FA exakt maximiert,
aber das Ergebnis nicht eindeutig ist, so wird auch eine eichvariante Größe davon
abhängen, welche Gribov-Kopie der Algorithmus findet. Dies kann zu einer teils systematischen Verzerrung der Messergebnisse führen oder sich lediglich durch ein zusätzliches
Rauschen bemerkbar machen, das Gribov-Rauschen .
In der SU (3)-Gittereichtherie zeigt sich, dass die so entstehende Nichteindeutigkeit für
die Landau-Eichung bei der Berechnung des Ghostpropagators zu einer systematischen
Abweichung führt [SIMPS05b]. Der Unterschied der Geist-Strukturfunktion ZG (q 2 ) zwischen Messungen auf der ersten zufällig erzeugten Kopie und der besten auf einer Konfiguration gefundenen Kopie ist in Abbildung 3.2 dargestellt. Im oberen Teil der Abbildung
β = 5.8 164
244
324
β = 6.0 164
244
β = 6.2 164
244
ZG (q 2 )
3.0
2.0
ratio in %
1.0
105
100
95
0.1
1.0
10.0
100.0
q 2 [GeV2 ]
Abbildung 3.2: Darstellung der Strukturfunktion Zg (q 2 ) über dem Impuls für verschiedene Gitter1st
größen und Kopplungsparameter β. In der unteren Abbildung ist das Verhältnis ZZbest von Messungen
auf der ersten Kopie Z 1st und der besten Kopie Z best dargestellt. Die Abbildung wurde mit freundlicher
Genehmigung aus [SIMPS05b] entnommen.
ist die Strukturfunktion ZG (q 2 ) über dem Impuls q aufgetragen, im unteren Bereich ist
das Verhältnis der Messung auf der ersten und auf der besten Kopie dargestellt. Als beste
Kopie wird die Kopie mit maximalem Funktionalwert auf einer Konfiguration bezeichnet.
Insbesondere für kleine Impulse weicht dieses Verhältnis von Eins ab, was bedeutet, dass
die Messung des Ghostpropagators davon abhängt, wie gut das Eichfunktional maximiert
wird.
Bei der Berechnung des Gluonpropagators ist dieser Effekt anscheinend nicht vorhanden [SIMPS05b] oder nur in Form eines sehr schwachen Gribov-Rauschens [SO04]. Ähnliche Untersuchungen lieferten schon für die SU (2)-Gittereichtheorie eine systematische
Abhängigkeit des Ghostpropagators von der Wahl der Gribov-Kopie [Cuc97, BIMMP04,
28
Kapitel 3
Diskretisierte Eichtheorien
NF04]. Dies ist insofern interessant, als dass es die Suche nach entsprechenden Eichfixierungsalgorithmen dringlich macht.
3.3
Methoden der Eichfixierung
Auch wenn ein globaler Algorithmus wünschenswert wäre, der das Eichfunktional (3.42)
für alle Argumente g(x) gleichzeitig maximiert, ist dies auf Grund der großen Zahl von
Argumenten nur schwer umsetzbar. Als Ausweg wird auf Algorithmen zurückgegriffen,
die das Eichfunktional sukzessiv und lokal optimieren. Eine Reihe von Konzepten zur
Maximierung des Eichfunktionals soll im Folgenden vorgestellt werden. Die dabei beschriebenen Methoden dienen auch der Fixierung der Coulomb-Eichung, die sich von der
Landau-Eichung nur in der Nichtsummation über zeitliche Links unterscheidet.
3.3.1
Relaxation
Ein wichtiger lokaler Algorithums, der die Zahl der gleichzeitig zu optimierenden Parameter stark reduziert, ist die Relaxation. Denn bei der Standardrelaxation wird das
Eichfunktional an jedem Gitterpunkt einzeln und nacheinander optimiert und an Stelle
von FU [g] wird nun das lokale Funktional FU [g; x] betrachtet. Aus der Summe über alle
Links lassen sich im Eichfunktional zunächst alle Terme, die g(x) enthalten, separieren.
£ ©
ª¤
P
P
†
Re
tr
g(y)U
(y)g
(y
+
e
)
+
(lNc V ) · FU [g] =
µ
µ
µ
£ µ©6= x
ª¤
P y,y+e
Re tr g(x)Uµ (x)g † (x + eµ ) + g(x − eµ )Uµ (x − eµ )g † (x)
µ
(3.51)
Der erste Term ist nicht mehr von g(x) abhängig, so dass das Optimierungsproblem nur
noch lokal für den zweiten Term
X £ ©
ª¤
FU [g; x] :=
Re tr g(x)Uµ (x)g † (x + eµ ) + g(x − eµ )Uµ (x − eµ )g † (x)
µ
zu lösen ist, also FU [g; x] = max.
der Spur tr(a + b) = tr(a) + tr(b) und
¡ Die† Linearität
¢
die Eigenschaft Re (tr(a)) = Re tr(a ) ermöglichen die Darstellung des zweiten Terms
in folgender Weise
ª¤
P £ ©
FU [g; x] =
Re tr g(x)Uµ (x)g † (x + eµ ) + g(x − eµ )Uµ (x − eµ )g † (x)
µ · ½
¶¾¸
µ
P
†
†
†
.
Uµ (x)g (x + eµ ) + Uµ (x − eµ )g (x − eµ )
= Re tr g(x)
µ
P
Die Summe K(x) := µ Uµ (x)g † (x + eµ ) + Uµ† (x − eµ )g † (x − eµ ) lässt sich sofort bestimmen. Das resultierende mathematische Problem
!
Re tr (g(x)K(x)) = max
(3.52)
wurde oft untersucht und ist in Angang A.4.2 näher beschrieben. Lokal findet nun eine
Aktualisierung
g(x) → r(x) · g(x) = g 0 (x)
(3.53)
3.3 Methoden der Eichfixierung
29
mit r(x) ∈ SU (N ) so statt, dass g 0 (x) das Maximierungsproblem 3.52 löst. Ein vollständiger Relaxationsschritt besteht nun aus der sukzessiven Aktualisierung der Eichtransformation in jedem Punkt des Gitters. Für eine vollständige Eichfixierung ist es dann notwendig, die Relaxationschritte so oft zu wiederholen, bis die Eichbedingung (3.45) hinreichend
präzise erfüllt ist.
3.3.2
Überrelaxation
Mit zunehmender Gittergröße divergiert die Autokorrelationszeit und iterative Eichfixierungsmethoden konvergieren immer langsamer. Der Grund ist hauptsächlich in langreichweitigen Moden der Anfangseichung und nicht optimal konditionierten Algorithmen zu
finden. Divergierende Autokorrelationenszeiten und -längen sind in Gleichgewichtsprozessen als Critical Slowing Down bekannt und es gibt Methoden dort dieser verlangsamten
Thermalisierung zu begegnen [Adl81, Wol90]. Diese Methoden lassen sich analog auch für
das Eichfixieren benutzen und führen dabei zu guten Resultaten.
Überrelaxation ist die erste vorzustellende Methode, der verlangsamten Konvergenz in
SU (N ) Gittereichtheorien zu begegnen. Sie ist eine Erweiterung des Relaxationsalgorithmus und ersetzt an Stelle der zum lokalen Maximum führenden Aktualierung r(x) (vgl.
3.53) ihre Potenz rω (x) in jedem Schritt, so dass ein Aktualisierungsschritt nun in der
Form
g(x) → rω (x) · g(x) = g 0 (x)
(3.54)
durchgeführt wird. Zur Berechnung der Potenz wird die Reihenentwicklung von rω nach
N Schritten abgebrochen (Gleichung 3.55) und das Ergebnis in die Eichgruppe projiziert.
ω
r (x) =
N
X
γn (ω)
n=0
n!
(r − )n mit γn (ω) =
Γ(ω + 1)
Γ(ω + 1 − n)
(3.55)
Die Gammmafunktion ist nur für Γ(ω+1) zu bestimmen, alle weiteren Vorfaktoren können
daraus über Γ(x + 1) = xΓ(x) bestimmt werden. Für gewöhnlich wird 1 < ω < 2 und
2 ≤ N ≤ 4 gewählt. Für ω = 1 erhält man die einfache Relaxation. Der optimale Wert
für den Überrelaxationsparameter ω strebt gegen 2. Allerdings beginnt die Dynamik ein
kritisches Verhalten zu zeigen und es kommt immer häufiger vor, dass die Überrelaxation
innerhalb einer vorgegebenen Zeit die geforderte Präzision in der Eichbedingung nicht
erreicht (Abschnitt 4.2.1, Seite 64). Im Limes ω → 2 tragen die UV-Moden nicht mehr
bei und das lokale Eichfunktional FU [g; x] bleibt erhalten. Der Algorithmus wird mikrokanonisch. Eine hier nicht untersuchte Variation der Überrelaxation ist die stochastische
Überrelaxation [For89], bei der der Parameter ω während der Relaxation als dynamische
Größe betrachtet und stochastisch gewählt wird.
3.3.3
Mikrokanonische Schritte
Die Wahl ω = 2 im Überrelaxationsalgorithmus führt zu mikrokanonischen Aktualisierungsschritten, die das Eichfunktional und damit auch die später definierte Wirkung
invariant lassen. In einer SU (2)-Eichtheorie lässt sich der mikrokanonische Aktualisierungsschritt explizit angeben
g(x) → α · g(x)
mit
α = − + 4
(3.56)
tr (g(x)K)
g(x)K.
tr(KK † )
30
Kapitel 3
Diskretisierte Eichtheorien
Um auch in SU (N ) Modellen mikrokanonische Schritte zu nutzen, wird diese Aktualisierung in allen SU (2)-Untergruppen ausgeführt [BW87].
Für normale Monte-Carlo-Prozesse kann gezeigt werden, dass das Einfügen solcher mikrokanonischen Schritte zu einer schnelleren Dekorrelation im thermischen Gleichgewicht
führt [DF90]. Im Allgemeinen bedeutet dies, dass der Algorithmus schneller thermalisiert.
Da langsames Thermalisieren auch ein Problem des Simulated Annealing Algorithmus ist
(Kapitel 3.3.6, Seite 31), werden mikrokanonische Schritte im Rahmen der Arbeit genutzt,
um auch hier die Konvergenz zu beschleunigen.
3.3.4
Fourierbeschleunigte Eichfixierung
Der zweite vorzustellende Algorithmus zur Reduzierung des Critical Slowing Down ist
die fourierbeschleunigte Eichfixierung [D+ 88, B+ 85]. Sie ist die Weiterentwicklung des
Gradientenverfahrens zu Maximierung des Eichfunktionals 3.42 der Landau-Eichung, bei
dem die Aktualisierung
g(x) → g 0 (x) = f (x) · g(x)
in Richtung des stärksten Anstieges erfolgt. Dazu dient eine Variante des NewtonRaphson-Verfahrens. Mit Definition des Eichpotentials (3.2) lässt sich zunächst die Divergenz von Ag auf dem Gitter definieren:
4
£
¡
¢¤
¡
¢
1
1X
tr ∆−µ Uµg (x) − Uµg† (x) (3.57)
∆−µ Uµg (x) − Uµg† (x) −
∇ · A (x) =
2 µ=1
NC
g
!
mit ∆−µ (Uµ (x)) = Uµ (x − eµ ) − Uµ (x).
(3.58)
Wie weit der Algorithmus dem Anstieg des Gradienten folgt, wird über einen Parameter
α ∈ abgestimmt. Die aktualisierte Transformation ergibt sich dann für das Gradientenverfahren mit
f (x) = exp [α∇ · Ag (x)].
(3.59)
In dieser lokalen Formulierung hat der Algorithmus jedoch stark mit Effekten des Critical
Slowing Down zu kämpfen. Zur Verbesserung der Konvergenz wird Gleichung 3.59 durch
die fourierbeschleunigte Aktualisierung ersetzt.
¾¸
·
½ 2
pmax a2
g
−1
(3.60)
f (x) = exp F̂
α 2 2 F̂ (∇ · A (x)) (p)
pa
2
2
a
Die entscheidende Neuerung in der Aktualisierung ist das Einfügen des Terms pmax
p2 a 2
zwischen den Fouriertransformationen. Dieser Term führt dazu, dass kurz- und langreichweitige Moden gleich schnell konvergieren. Der Grund für das Einfügen dieses Terms wird
unter anderem in [D+ 88] beschrieben. Heuristisch lässt es sich als Berücksichtigung der
zweiten Ableitung im Gradientenverfahren interpretieren, was zu verbesserten Aktualisierungsschritten führt. Unter Nutzung der schnellen Fouriertransformation lassen sich so
theoretisch Rechenzeiten erreichen, die sich proportional zu V log V verhalten[D+ 88].
Die Fouriertransformation bringt jedoch das Problem mit sich, dass sie als globaler Algorithmus nur schwer parallelisierbar ist, was Berechnungen auf großen Gittern erschwert.
Dies ist auch der Grund, die fourierbeschleunigte Eichfixierung in einer Methode anzuwenden, die komplett ohne Fouriertransformationen auskommt, das Multigrid-Verahren
[CM98].
3.3 Methoden der Eichfixierung
3.3.5
31
Multigrid Methode des Gradientenverfahrens
In der Aktualiserung der fourierbeschleunigten Eichfixierung (Gleichung 3.59) lässt sich
das Exponential als Reihe entwickeln, so dass man genähert
¶
µ
(g)
−1 α
f (x) ∝ − F̂
F̂(∇A ) (x)
(3.61)
p2 (k)
erhält. Die Idee des Multigrid-Algorithmus beginnt mit der Feststellung, dass die Fourierzerlegung in Formel 3.61 äquivalent zur Invertierung des Laplace-Operators ist.
F̂−1 p−2 (k)F̂ = −∆−1
Der große Vorteil des Multigrid-Verfahrens ist die Möglichkeit der effizienten Parallelisierung des inversen Laplace-Operators [Sta93]. Wie bei der fourierbeschleunigten Eichfixierung skaliert die Rechenzeit für eine Aktualisierung des ganzen Gitters mit V und die Zahl
der Schritte bis zur Konvergenz mit log V . Das Multigrid-Verfahren ist hier jedoch nur
der Vollständigkeit halber erwähnt. Eine explizite Beschreibung der Umsetzung und der
Konvergenz des Multigrid-Algorithums findet sich in [HLS92, For89] und insbesondere in
[GS89].
3.3.6
Simulated Annealing
Bisher verwendete Verfahren haben Effekte des Critical Slowing Down zu mildern versucht. Dabei unberücksichtigt geblieben ist das Problem der Nichteindeutigkeit der
Landau-Eichung auf Grund von Gribov-Kopien (Abschnitt 3.2.6, S. 25). Eine besondere
Bedeutung kommt nun der Formulierung der Eichfixierung als Maximierungsaufgabe zu.
Im Jahr 1982 beobachteten Kirkpatrick und andere [KGJV83] eine Ähnlichkeit zwischen
dem Tempern (annealing) von Festkörpern und mathematischen Maximierungsaufgaben.
In der Festkörperphysik lässt sich beobachten, dass bestimmte Materialien, die hinreichend langsam abgekühlt werden, in ihrem Grundzustand enden. Dies ist von besonderer
Bedeutung für die Stabilität des Materials. Diese Idee des Abkühlens lässt sich auf die
Maximierung eines beliebigen Funktionals anwenden. Dazu muss die Maximierung als
Prozess verstanden werden, in dem der Grundzustand eines Systems gefunden werden
soll. In unserem Kontext wird das Eichfunktional als “Energie” verstanden, bezüglich
derer das System in seinen Grundzustand gebracht werden soll.
In der Festkörperphysik wird Tempern als Prozess verstanden, zu niedrigen Energiezuständen des Festkörpers durch eine Sequenz von thermischen Gleichgewichtszuständen
zu gelangen. Der Prozess besteht aus zwei Schritten [KGJV83, BH76]
• Anheben der Temperatur bis auf einen Wert, bei dem der Festkörper schmilzt und
• Ein hinreichend langsames Absenken der Temperatur, bis die Teilchen des
Festkörpers sich von selbst im Grundzustand anordnen.
Der Prozess des Temperns kann erfolgreich mit Simulationsmethoden aus der
Festkörperphysik beschrieben werden. 1953 wurde von Metropolis und anderen [MRR+ 53]
für wechselwirkende Mehrteilchensysteme ein einfacher Algorithmus zur Entwicklung des
thermischen Gleichgewichts und zur Untersuchung von Zustandsgleichungen vorgestellt.
Der vorgestellte Algorithmus basiert auf Monte Carlo Techniken und generiert eine Reihe
32
Kapitel 3
Diskretisierte Eichtheorien
von Zuständen des Vielteilchensystems in folgender Weise. Ausgehend vom Zustand i mit
der Energie Ei wird durch kleine Störungen ein Folgezustand j generiert. Die Energie des
nächsten Zustandes ist Ej . Ist die Differenz Ej − Ei kleiner oder gleich Null, wird der
Zustand j zum aktuellen Zustand. Ist die Energiedifferenz positiv, so wird der Zustand j
mit Wahrscheinlichkeit
¶
µ
Ei − Ej
exp
(3.62)
kB T
akzeptiert, wobei T die Temperatur des Wärmebades und kB die Boltzmannkonstante
bezeichnet. Die Akzeptanzentscheidung wird als Metropoliskriterium bezeichnet, und der
so beschriebene Algorithmus ist als Metropolis-Algorithmus bekannt. Wenn die Temperatur hinreichend langsam abgesenkt wird, kann der Festkörper bei jeder Temperatur das
thermische Gleichgewicht erreichen. Im Metropolis-Algorithums wird dies durch die Generation einer großen Zahl von Übergängen erreicht. Das thermische Gleichgewicht wird
durch die Boltzmannverteilung charakterisiert, die die Wahrscheinlichkeit eines Zustandes
i mit der Energie Ei bei der Temperatur T mit
µ
¶
Ei
1
exp −
PT [X = i] =
(3.63)
Z(T )
kB T
angibt. X ist eine stochastische Variable, die den aktuelle Zustand des Festkörpers angibt.
Die Zustandssumme Z(T ) ist definiert als
Z(T ) =
X
j
µ
¶
Ej
exp −
.
kB T
(3.64)
Die Boltzmannverteilung wird von entscheidender Bedeutung für die Analyse des Simulated Annealing Algorithums sein.
Für kombinatorische Optimierungsprobleme11 kann mittels des Metropolis Algorithums ein Abkühlprozess nachgebildet werden. Der so entstehende Algorithmus ist der
Simulated Annealing Algorithmus. Zunächst wird eine Analogie zwischen einem physikalischen Vielteilchensystem und dem kombinatorischen Optimierungsproblem angenommen,
die auf zwei Äquivalenzen basiert:
• Die Lösungen des kombinatorischen Optimierungsproblems entsprechen den
Zuständen des physikalischen Systems und
• die Kosten einer Lösung entsprechen der Energie des Zustandes.
11
Definition: (kombinatorisches Optimierungsproblem )
Sei E eine endliche Grundmenge, I ⊂ 2E eine Teilmenge der Potenzmenge von E (die Elemente in I
heißen zulässige Mengen oder Lösungen)
und c : E → eine Funktion. Für jede Teilmenge F ⊆ E
P
definiert man weiterhin c(F ) = e∈F c(e). Dann heißt das Problem
max c(G)
G∈I
bzw.
(lineares) kombinatorisches Optimierungsproblem.
max c(G)
G∈I
(3.65)
3.3 Methoden der Eichfixierung
33
In Analogie zum physikalischen Prozess wird ein Parameter zur Kontrolle des Simulated
Annealing Algroithmus eingeführt, der die Rolle der Temperatur übernimmt. Er wird im
Folgenden als Simulated Annealing Temperatur oder als Eichtemperatur bezeichnet und
mit T abgekürzt. Bevor die Konvergenz des Simulated Annealing Algorithmus bewiesen
werden kann, müssen noch einige Größen definiert werden. Die Bezeichnungen werden
sich dabei an dem eigentlichen Problem der Maximierung des Eichfunktionals orientieren.
Definition: Sei (E, f ) ein kombinatorisches Optimierungsproblem, in dem E die Menge
aller möglichen Zustände und gi , gj ∈ E Zustände mit den Kosten f [gi ] und f [gj ], wobei
gj durch einen Erzeugeralgorithmus aus gi hervorgegangen sei. Das Akzeptanzkriterium
gibt mit der Akzeptanzwahrscheinlichkeit
(
´ für f [gj ] ≤ f [gj ]
³ 1
PA [gi → gj ] =
(3.66)
f [gj ]−f [gi ]
für f [gj ] > f [gj ]
exp
T
an, ob eine neu erzeugte Lösung gj als neue Lösung akzeptiert wird.
Die Art der Generation neuer Zustände korrespondiert zu den Störungen des Metropolis Algroithmus. Die Übergangswahrscheinlichkeit P [gi → gj ] ergibt sich nun aus dem
Produkt von Tij , der Wahrscheinlichkeit dafür, dass aus dem Zustand gi der³ Zustand ´gj
erzeugt wird und der Akzeptanzwahrscheinlichkeit PA [gi → gj ] = min[1, exp
·
¸
f [gj ]−f [gi ]
P [gi → gj ] = Tij min 1, e T
f [gj ]−f [gi ]
T
].
(3.67)
Solange die Erzeugung neuer Zustände mit symmetrischer Transmissionswahrscheinlichkeit geschieht, also Tij = Tji gilt, ist die Bedingung der Detailed Balance erfüllt, denn
h f [gj ]−f [gi ] i
min 1, e T
f [gj ]−f [gi ]
P [gi → gj ]
PT [X = gj ]
h f [gi ]−f [gj ] i = e T
=
=
.
P [gj → gi ]
PT [X = gi ]
min e T
,1
Somit sind die Eigenschaften Ergodizität, Normiertheit und Stabilität des Fixpunktes
PT (g) ∝ exp( f T(g) ) für den Metropolisalgorithmus gewährleistet, so dass die Konvergenz
der Markovkette sichergestellt ist (Anhang A.2).
Definition: Ein Thermalisierungsschritt ist ein zusammengesetzter Prozess, der vom gegenwärtigen Zustand gi in einen Folgezustand gj führt. Im Falle des Metropolisalgorithmus
besteht er aus zwei Schritten: (i) Erzeugen eines neuen Zustands und (ii) Anwendung des
Akzeptanzkriteriums. Dieser Algorithmus muss am Ende nicht notwendigerweise zu einem
neuen Zustand führen.
Die beiden Schritte des Aktualisierungsprozesses lassen sich zu einem einzigen zusammenfassen, falls der Folgezustand bereits thermalisiert erzeugt werden kann, also der Wahrscheinlichkeitsverteilung
µ
¶
1
f [gj ]
PT [X = gj ] =
exp −
(3.68)
Z(T )
T
34
Kapitel 3
mit
X
µ
f [g]
Z0 (T ) =
exp −
T
g∈E
Diskretisierte Eichtheorien
¶
(3.69)
genügt. Im Allgemeinen ist dies nicht möglich. Im Falle der lokalen SU (N )Aktualisierungen in nur einem Punkt (3.51) besteht jedoch die Möglichkeit, die Elemente
der Eichtransformation mittels eines Heatbath-Algorithmus bereits mit der Verteilung
(3.68) zu erzeugen.
Die Besonderheit des Simulated Annealing Algorithmus ist, dass er nicht nur Verkleinerungen der Kostenfunktion f zulässt, sondern auch Erhöhungen. Anfangs werden
für große Werte von T große Verschlechterungen akzeptiert. Für abnehmendes T werden die akzeptierten Vergrößerungen im Mittel immer kleiner und für T = 0 werden
letztendlich nur noch Verbesserungen der Kostenfunktion zugelassen. Im Gegensatz zu
lokalen Suchalgorithmen kann der Simulated Annealing Algorithmus durch Erhöhung der
Kostenfunktion lokalen Minima entkommen.
Die Gleichgewichtsverteilung für Thermalisierungsprozesse wird wie folgt definiert:
Definition: Ist (E, f ) ein kombinatorisches Optimierungsproblem, dann heißt eine Verteilung Gleichgewichtsverteilung , falls sie folgende Bedingung erfüllt:
¶
µ
1
f [gj ]
PT [X = gj ] = qj (T ) :=
,
exp −
Z(T )
T
(3.70)
wobei X eine stochastische Variable ist, die den aktuellen Zustand des Simulated Annealing Algorithmus darstellt und
X
µ
f [g]
Z0 (T ) =
exp −
T
g∈E
¶
(3.71)
die Normierungskonstante ist. Falls die durch einen Thermalisierungsalgorithmus erzeugte
Verteilung diese Bedingung erfüllt, wird das Ergebnis als thermalisiert bezeichnet.
Mit den so definierten Größen lässt sich nun der Satz über die Konvergenz des Simulated Annealings angeben.
Satz 3.3.1. Ist (E, f ) ein kombinatorisches Optimierungsproblem und ist die Gleichgewichtsverteilung durch (3.70) gegeben, dann gilt
lim qi (T ) := qi∗ =
T →0
1
· χEopt (gi ), 12
|Eopt |
(3.72)
wobei Eopt ⊂ E die Untermenge der global optimalen Lösungen ist und die Mächtigkeit
dieser Untermenge |Eopt | die Zahl der global optimalen Lösungen angibt.
12
Sind A und A0 ⊂ A zwei Mengen, so ist die charakteristische Funktion χA0 : A → {0, 1} auf der
Untermenge A0 ist wie folgt definiert: χA0 (a) = 1 falls a ∈ A0 und χA0 (a) = 0 sonst.
3.3 Methoden der Eichfixierung
35
Beweis:. Unter Nutzung der Tatsache, dass für alle a ≤ 0 gilt, lim ea/x = 1 falls a = 0
x→0
und lim ea/x = 0 sonst, erhält man
x→0
f [gi ]
e− T
lim = lim P f [g]
T →0
T →0
e− T
g∈E
f [gi ]
efopt − T
= lim P
f [g]
T →0
efopt − T
g∈E
= lim P
T →0
g∈E
1
efopt −
f [g]
T
f [gi ]
efopt − T
· χEopt (gi ) + lim P
· χE\Eopt (gi )
f [g]
T →0
efopt − T
g∈E
1
· χEopt (gi ) + 0.
=
|Eopt |
¥
Das Ergebnis ist von großer Bedeutung, da es asymptotische Konvergenz des Simulated Annealing Algorithmus garantiert, solange die Gleichgewichtsverteilung für jedes T
tatsächlich erreicht wird. Insbesondere die Voraussetzung eines thermischen Gleichgewichtes führt jedoch dazu, dass dieser formale Konvergenzbeweis nur realistisch ist, falls der
Simulated Annealing Algorithmus bei jeder Temperatur unendlich viele Schritte tätigt.
In endlicher Zeit ist dies jedoch nicht möglich und die Hauptaufgabe besteht in einer geeigneten Beschreibung von Simulated Annealing Algorithmen, die auf Grund endlicher Aktualisierungsschrittzahlen die Voraussetzung des thermischen Gleichgewichts nicht
mehr erfüllen können. Dazu ist zunächst zu definieren, wie ein Simulated Annealing Algorithmus aussehen soll, der nach endlich vielen Schritten beendet wird. Auch für solche
Algorithmen soll die Temperatur in wohldefinierter Weise abgesenkt werden. Im weiteren
soll die Veränderung der Temperatur wie folgt beschrieben werden.
Definition: Eine Abbildung T : I → +
0 , die einer Indexmenge I eine reelle Zahl zuordnet, wird Simulated Annealing Fahrplan genannt und beschreibt die Temperaturänderung
während des Simulated Annealings.
Die Indexmenge wird im weiteren immer von der Form I = {1, 2, ..., N } sein, so dass mit
den natürlichen Zahlen die Simulated Annealing Schritte i ∈ I durchnummeriert werden
können. Die Mächtigkeit der Menge ist in diesem Falle |I| = N und der Fahrplan wird als
endlicher Fahrplan bezeichnet.
Weiterhin sind die folgenden Definitionen hilfreich.
Definition: Falls sich die Temperatur zwischen zwei aufeinanderfolgenden Schritten
ändert, also T (i) 6= T (i + 1) gilt, wird dies als Temperaturschritt bezeichnet. Die Gesamtzahl der in einem Fahrplan gemachten Temperaturschritte wird mit nT abgekürzt.
Die Zahl der Temperaturschritte ist nicht notwendigerweie gleich der Zahl der insgesamt
getätigten Schritte nT ≤ |I|, da der Fahrplan bei einigen Temperaturen mehrere Schritte
zulassen kann, was zur folgenden Definition führt.
36
Kapitel 3
Diskretisierte Eichtheorien
Definition: Als Thermalisierungsschritt wird in Anlehnung an den Metropolis Algorithmus eine Aktualisierung des gegenwärtigen Zustandes bei fixierter Temperatur bezeichnet.
Die Gesamtzahl der bei fixierter Temperatur durchgeführten Aktualisierungen wird mit
nT h abgekürzt.
Da die Voraussetzung des thermischen Gleichgewichtes bei einer gegebenen Temperatur mit endlichen Fahrplänen (|I| < ∞) nicht erreicht werden kann, wird für ihre
Untersuchung eine neue Größe eingeführt
Definition: Ist (E, f ) ein kombinatorisches Optimierungsproblem, und T : I → +
0 ein
Simulated Annealing Fahrplan, so heißt T quasithermalisiert nach k Schritten, und die
Wahrscheinlichkeitsverteilung PT (k)[X = gj ] Quasigleichgewichtsverteilung, falls sie hinreichend dicht zur Gleichgewichtsverteilung qj (T (k))liegt, also für ein zu spezifizierendes
² gilt:
kPT (k) − q(T (k))k < ²
(3.73)
Der Abstand zweier Wahrscheinlichkeitsverteilungen ist im Anhang durch Gleichung A.5
definiert.
Für Fahrpläne, die in jedem Schritt quasithermalisiert sind, kann nun gezeigt werden,
dass die zugehörige Wahrscheinlichkeitsverteilung im Grenzwert unendlich vieler Schritte
und T → 0 gegen die Verteilung aus Satz 3.3.1 konvergiert (nachlesbar zum Beispiel in
[AK89]). Das Problem besteht aber eben in der Notwendigkeit unendlich vieler Schritte.
Als Optimierung endlicher Fahrpläne wird daher im Folgenden verstanden, ein Quasigleichgewicht bei möglichst geringen Temperaturen herzustellen, da dies auch eine größere
Wahrscheinlichkeit für das Auffinden des Optimums bedeutet.
Für die Landau-Eichung soll das Funktional FA (Gleichung 3.42) maximiert werden. Unter Verwendung des Simulated Annealing Algorithmus wird die Kostenfunktion
f = 1 − FA minimiert und an Stelle von Metropolisaktualisierungen (Gleichung 3.66)
werden Heatbath-Aktualisierungen genutzt (Anhang A.4.1). Praktisch wird innerhalb des
Simulated Annealing Algorithmus das Optimierungsproblem für Eichtemperaturen T > 0
nicht endgültig gelöst. Daher wird ein abschließendes Relaxieren notwendig, durch das
die differentielle Eichbedingung ∂A = 0 umgesetzt wird. Es lässt sich auch, wie bereits
erwähnt, als Simulated Annealing bei T = 0 verstehen.
3.3.7
Eichfixierung auf endlichen Untergruppen
Unabhängig von der Verwendung neuer Algorithmen lässt sich die Rechenzeit durch die
Einschränkung der Eichgruppe auf eine endliche Untergruppe reduzieren.
In dieser Untergruppe ist die Zahl der möglichen Gruppenoperationen überschaubar
und lässt sich in einer Gruppentabelle abrufbar im Speicher behalten. In der Regel ist
der Abruf aus dem Speicher deutlich schneller, als die direkte Ausführung der Gruppenoperation. Da in endlichen Gruppen auch die Zahl der Gruppenoperationen endlich ist,
liegt der Hauptvorteil in der Möglichkeit eine Multiplikationstabelle für Gruppenoperation
zu nutzen. Ein weiterer Vorteil einer endlichen Untergruppe der SU (2) ist der geringere
Speicherbedarf, da die Gruppenelemente keiner Darstellung als Matrizen, sondern nur
einer natürlichen Zahl als Repräsentanten bedürfen.
3.4 Strategien zur Auswahl optimaler Verfahren
37
Vor der Anwendung der Gruppentabelle werden Eichkonfiguration und Eichtransformation auf die Untergruppe abgebildet. Bei der Anwendung der bisher vorgestellten Algorithmen, lassen sich so sämtliche Gruppenmultiplikationen mithilfe der Multiplikationstabelle beschleunigen. Die am Ende des Simulated Annealings oder der Relaxation erhaltene
Eichtransformation mit Werten in der Untergruppe lässt sich nun als Ausgangspunkt einer
abschließenden Eichfixierung der ursprünglichen Eichkonfiguration nutzen.
In einer U (1) Eichtheorie wurde diese Methode erfolgreich eingesetzt und eine Beschleunigung der Rechnungen um den Faktor zehn erreicht[CFIS04]. Als Untergruppe
dient hier eine Darstellung n . Die vielversprechendste diskrete Untergruppe der SU (2)
ist die Ikosaedergruppe I120 (Appendix A.1.3).
Da durch die Projektion auf die Ikosaedergruppe auch das ursprüngliche Eichfeld verändert wird, optimiert der Simulatd Annealing Algorithmus in der projizierten
Ikosaeder-Eichtheorie das Eichfunktional auch nur in Bezug auf die projizierte Eichkonfiguration. Dies kann sich negativ auf die Präkonditionierung der Eichtransformation auswirken. Weiterhin wird der Vorteil der Multiplikation über eine Multiplikationstabelle
zum Teil wieder durch die Notwendigkeit der Addition von Gruppenelementen zunichte
gemacht. Da die Addition keine Gruppenoperation ist, liegt das Ergebnis im Allgemeinen nicht in der I120 und muss in geeigneter Weise wieder zurückprojiziert werden. Diese
Projektion ist allerdings verhältnismäßig aufwändig.
3.4
Strategien zur Auswahl optimaler Verfahren
Die Fixierung der Landau-Eichung in den folgenden Gittersimulationen besteht aus drei
Schritten,
• Erzeugung einer in Bezug auf β thermalisierten Eichkonfiguration,
• Generierung eines Ensembles E aus zufälligen (T = ∞) Anfangseichtransformationen und
• Anwendung verschiedener Eichfixierungsalgorithmen auf jede Anfangseichtransformation.
Da so die verschiedenen Algorithmen auf den gleichen Anfangseichtransformationen untersucht wurden, lassen sich die Algorithmen leichter miteinander vergleichen. Dieser abschließende Vergleich erfolgt anhand der Verteilung über den durch die Algorithmen gefundenen Maxima des Eichfunktionals. Neben dieser Verteilung wird im Folgenden auch
die Mobilität vorgestellt. Sie ist eine Eigenschaft der Aktualisierungen der verschiedenen Algorithmen und ist von besonderer Bedeutung für die Untersuchung des Simulated
Annealing Algorithums.
3.4.1
Verteilung über den Funktionalwerten
Alle untersuchten Konzepte zur Fixierung der Landau-Eichung sind Optimierungsalgorithmen zur Maximierung des Eichfunktionals FU (3.42). Auch wenn das Ziel eine
Eichtransformation ist, die das globale Maximum des Eichfunktionals darstellt, ist dies im
Allgemeinen nicht erreichbar. Am Ende der Eichfixierung wird das Ensemble E daher aus
eichfixierenden Eichtransformationen bestehen, die zu verschiedenen lokalen Maxima des
38
Kapitel 3
Diskretisierte Eichtheorien
Eichfunktionals gehören. Je besser ein Algorithmus funktioniert, desto häufiger wird er
dabei das größte aufgefundene Maximum wiederfinden und die zugehörige Eichtransformation entsprechend häufig im finalen Ensemble auftauchen. Mit dieser Prämisse werden
die Algorithmen daher in Hinblick auf die Häufigkeitsverteilung der durch sie aufgefundenen lokalen Funktionalwerte verglichen. Dies kann auf zwei Arten geschehen.
Die erste Variante besteht darin, die auf einer Konfiguration aufgefundenen lokalen
Maxima der Größe nach zu ordnen
F1 > F2 > F3 > ....
und für die verschiedenen Funktionalwerte die Häufigkeit des Wiederauffindens anzugeben. Die so entstehenden Häufigkeitsverteilungen lassen sich über eine gewisse Anzahl
von Konfigurationen mitteln und ergeben für jeden Algorithmus eine stochastische Wahrscheinlichkeitsverteilung P [F = Fi ]. Da die verschiedenen Maxima auf Grund von Diskretisierungseffekten nicht exakt übereinstimmen, hängt diese Verteilung auch von dem
Kriterium ² ∈ ab, wann zwei Funktionalwerte als gleich gelten sollen.
F =F
ˆ i
kF − Fi k < ²
Ein Beispiel einer solchen Verteilung ist in Abbildung 4.2 auf der linken Seite für verschiedene Simulated Annealing Algorithmen und den Relaxationsalgorithmus zu sehen.
Die zweite Variante der Darstellung besteht darin, zunächst für eine Konfiguration
das größte lokale Maximum Fmax zu finden und daraus die relativen Funktionalwerte
max
Frel = F −F
zu bilden. Diese relativen Funktionalwerte sind nun auch für verschiedene
Fmax
Konfigurationen miteinander vergleichbar und lassen sich für die verschiedenen Algorithmen in Form eines Histogramms (z.B. Abb. 4.15) angeben.
3.4.2
Mobilität
Eine weitere Größe, die sich nicht am Funktionalwert orientiert, sondern stärker das Aktualisierungsverhalten berücksichtigt, ist die Mobilität. Jeder Algorithmus führt Aktualisierungsschritte der Form
g → g0
durch. Für ein schnelles Erreichen der Quasithermalisiertheit ist nun besonders bei Thermalisierungsalgorithmen wichtig, wie stark diese Änderungen sind. Dies führt zu folgender
Mobilität.
Definition: Führt ein Algorithmus in einem Schritt die Aktualisierung g → g 0 durch, so
wird die Größe
#
"
X ¡
¢
1
(3.74)
tr − g(x)g 0† (x)
M [g → g 0 ] = Re
NC V x
als Mobilität des Algorithmus in diesem Schritt bezeichnet.
Die Mobilität ist ein Indiz für die Autokorrelation eines Algorithmus. Je weiter der
Wert in der Nähe von Eins liegt, um so größer sind die Sprünge im Zusandsraum der
Eichtransformation, die bei jeder Aktualisierung durchgeführt werden. Kleine Mobilitäten
bedeuten entsprechend, dass sich alte und neue Eichtransformation nur wenig voneinander
unterscheiden.
3.4 Strategien zur Auswahl optimaler Verfahren
39
Ist die neue Eichtransformation zufällig erzeugt, so dass von unkorrelierten Größen
gesprochen werden kann und ist jeder Punkt im Zustandraum gleich wahrscheinlich, so
heben sich die Terme tr(g(x)g 0† (x)) im Mittel gegenseitig auf und die Mobilität nimmt den
Wert Eins an. Insofern ist eine Mobilität von Eins umgekehrt ein Indiz auf eine geringe
Autokorrelation, wenn auch kein Beweis dafür.
Sind alte und neue Eichtransformation hingegen sehr ähnlich, so gilt für die Spuren
1
tr(g(x)g 0† (x)) ≈ 1, so dass M ≈ 0 folgt. Auch hier ist die Mobilität nur ein Indiz für
NC
eine starke Autokorrelation. Denn es besteht die Möglichkeit, dass bei der Erzeugung der
Eichtransformationen bestimmte Eichtransformationen bevorzugt werden, so dass auch
bei dekorrelierten Algorithmen sich zwei unabhängig voneinander erzeugte Transformationen mit großer Wahrscheinlichkeit sehr ähnlich sind. Diese Vermutung ließe sich auch
für den Simulated Annealing Algorithmus in SU (N ) Eichtheorien aufstellen. Hier sollen
thermalisierten Eichtransformationen der Wahrscheinlichkeitsverteilung
PT [X = g] =
1 − 1−FU [g]
T
e
Z(T )
(3.75)
genügen, wodurch automatisch Transformationen mit großen Funktionalwerten bevorzugt werden. Von entscheidender Bedeutung ist jedoch, dass FU invariant unter globalen
Eichtransformationen ist, was bedeutet, dass auch jeder globale Phasenfaktor eiφ · mit
gleichem Gewicht in die Mobilität eingehen sollte. Es soll nun der Grenzfall einer bei
T ≈ 0 thermalisierten Verteilung betrachtet werden, bei dem sich die Maxima gmax des
Funktionals nur um solche Phasenfaktoren unterscheiden mögen. Die Mobilität für zwei
solche Transformationen nimmt den Wert M = 1 − cos φ an, wird jedoch, da Mittelung
über dekorrelierte Eichtransformationen alle Werte von φ gleich wahrscheinlich sind, den
Wert hM i = 1 annehmen. Da diese Betrachtung auch für jede andere Eichtransformation
gilt, muss ein dekorrelierte Simulated Annealing Algorithmus eine Mobilität hM i = 1
aufweisen. Im Umkehrschluss haben Algorithmen mit geringer Mobilität eine große Autokorrelation.
40
Kapitel 3
Diskretisierte Eichtheorien
Kapitel 4
Resultate
Im Folgenden werden verschiedene Algorithmen und Methoden getestet, die die LandauEichung fixieren. Ziele sind eine kurze Rechenzeit und die Vermeidung von Gitter-GribovKopien durch die globale Maximierung des Eichfunktionals. Zu diesem Zweck werden
die Methoden nach verschiedenen Kriterien miteinander verglichen, bei denen folgende
Größen eine Rolle spielen:
1. Rechenzeit tr für einmalige Anwendung einer Methode,
2. P[F = Fmax ] = pmax , die Wahrscheinlichkeit das größte bekannte Maximum mit
dieser Methode bei einmaliger Anwendung zu erreichen und
3. p(Fi ), die Wahrscheinlichkeitsverteilung für die nach absteigender Größe sortierten
und so durchnummerierten Funktionalwerte1 .
Sowohl Rechenzeiten, als auch Wahrscheinlichkeiten sind stochastische Größen und für
eine hinreichend genaue Bestimmung ist eine Mittelung über eine große Anzahl von Konfigurationen und Kopien notwendig. Die zweite Größe ist über die Gleichung p(F1 ) =
P [F = Fmax ] mit der dritten verknüpft, wird aber separat betrachtet, da nur das Erreichen des globalen Maximums einer Eichfixierung innerhalb der Fundamental Modular
Region gleichbedeutend ist. Es gilt nun, mittels einer Optimierung des Eichfixierungsalgorithmus, einen Kompromiss aus kurzer Rechenzeit und trotzdem hoher Wahrscheinlichkeit
für die Annahme des größten bekannten Maximums zu erzielen.
Performanz verschiedener Methoden
Eine große Rechenzeit erlaubt im Allgemeinen keine Rückschlüsse auf die Wahrscheinlichkeit das Maximum zu finden, beide Größen sind also unabhängig voneinander. Daher
besteht die Notwendigkeit, ein einziges Kriterium zu definieren, das beide Größen vereint
und einen Vergleich verschiedener Methoden anhand dieses neuen Kriteriums zulässt.
Hierfür werden noch einige Vorüberlegungen benötigt. Für weitere Betrachtungen soll
im Vergleich mehrerer Eichfixierungsmethoden diejenige als die beste gelten, die in fest
vorgegebener Zeit das Maximum des Eichfunktionals mit der größten Wahrscheinlichkeit
findet:
P [Auffinden des Maximums von F ](t) = max .
1
Große Funktionalwerte entsprechen kleinen Zahlen in der Nummerierung.
41
42
Kapitel 4
Resultate
Ist die vorgegebene Zeit ein Vielfaches der Rechenzeit t = ntr , so bedeutet dies, dass
die Eichfixierungsmethode n-fach angewendet werden soll. Die Wahrscheinlichkeit, das
Maximum in einem dieser Versuche zu finden beträgt dann
t
1 − (1 − pmax )n = 1 − (1 − pmax ) T .
Diese Größe soll durch Optimierung der Eichfixierungsmethode maximiert werden
t
1 − (1 − pmax ) tr = max .
Formell kann t jeden Wert annehmen, auch wenn nur ganze Vielfache von tr tatsächlich
umsetzbar sind. Durch Anwenden der monotonen Logarithmusfunktion lässt sich dies wie
folgt in die Form
ln (1 − pmax )
t = max .
−
tr
bringen. Bei der Optimierung der Eichfixierungsmethoden ändern sich nur tr und pmax .
Eine einmal optimierte Methode ist zugleich für jede Zeitvorgabe t optimiert, wenn die
von t unabhängige Maximierungsaufgabe
−
ln(1 − p)
= max
tr
gelöst ist. Auf der linken Seite steht eine für jede Eichfixierungsmethode spezifische Kenngröße, was durch folgende Definition ausgedrückt wird.
Definition: Findet ein Algorithmus zur Eichfixierung das größte auffindbare Maximum
für eine Konfiguration im Mittel mit der Wahrscheinlichkeit p = P [F = Fmax ] und
benötigt dafür die Rechenzeit tr , so wird seine Performanz G definiert als2 :
G=−
ln(1 − p)
tr
(4.1)
Die mittlere Rechenzeit weist natürlich eine gewisse Willkür auf, da sie stark von
der genutzten Hardware abhängt. Um trotzdem Simulationen miteinander vergleichen zu
können, die zu verschiedenen Zeitpunkten erzeugt wurden oder verschiede Hardwarevoraussetzungen nutzten, wird parallel zu jeder Simulation als Vergleichsgröße die mittlere
Rechenzeit für die Relaxation gemessen. Sie dient dann zur Normierung aller in der gleichen Simulation verwendeten Methoden, sozusagen als Zeitnormal.
Eine Eichfixierungsmethode wird nun als besser verstanden, wenn sie die größere Performanz hat. Interessiert man sich nicht dafür, wie hoch die Wahrscheinlichkeit des Auffindens des Maximums in einer vorgegebenen Zeit ist, sondern stellt die umgekehrte Frage,
wie lange man mindestens braucht, um das Maximum mit vorgegebener Wahrscheinlichkeit zu finden, so ergibt sich eine wichtige Folgerung.
Folgerung 4.0.1. Haben zwei Eichfixierungsmethoden die Performanzen G1 und G2 , so
stehen die minimalen Rechenzeiten t1 und t2 , die nötig sind, damit das Maximum Fmax
von beiden Methoden mit der gleichen Wahrscheinlichkeit angenommen wird (ggf. durch
Mehrfachanwendung einer Methode), in einem festen Verhältnis und es gilt:
G1 t1 = G2 t2
2
(4.1)
Die Variablenbezeichnung G steht für das deutsche Wort Güte und wurde gewählt, da die vermutlich
offensichtliche Bezeichnung P bereits für die Wahrscheinlichkeit verwendet wird.
4.1 SU (2) Eichfixierung
43
Insbesondere führt also eine Verdopplung der Performanz dazu, dass nur noch die Hälfte der Rechenzeit notwendig ist, um das Maximum mit der gleichen Wahrscheinlichkeit
zu finden.
4.1
SU (2) Eichfixierung
Für eine SU (2) Eichtheorie wurden lokale Relaxations- und Überrelaxationsalgorithmen
sowie Simulated Annealing mit lokalen Heatbath Aktualisierungen zur Fixierung der
Landau-Eichung miteinander verglichen. Das Hauptgewicht der Untersuchung liegt in der
Optimierung des Fahrplans für das Simulated Annealing, da die Resultate als Basis für
die Eichfixierung in einer SU (3) Gittereichtheorie auf großen Gittern dienen sollen. Ein
weiterer Abschnitt widmet sich der Eichfixierung auf der Ikosaeder-Untergruppe I120 der
SU (2). Die Untersuchungen für die SU (2) Gittereichtheorie werden mit einem Abschnitt
komplettiert, der die Vorteile von Eichfixierungsmethoden mit Simulated Annealing gegenüber einfachen Relaxationsverfahren aufzeigt.
4.1.1
Simulated Annealing
Es kann gezeigt werden, dass Simulated Annealing das globale Maximum mit Wahrscheinlichkeit Eins findet. Allerdings muss der Fahrplan des Simulated Annealings hierfür
berücksichtigen, dass für das Erreichen des Maximum in jeder Umgebung von T = 0
unendlich viele Simulated Annealing Schritte ausgeführt werden[GG84], zum Beispiel in
dem sich Temperatur T und Rechenzeit t wie T (t) ∝ 1/ ln(t) verhalten[GG84]. Dies ist
jedoch in der Realität nicht umsetzbar.
In der Konsequenz kann demnach für jede endliche Rechenzeit das Maximum nur mit
einer von 1 verschiedenen Wahrscheinlichkeit erreicht werden und es stellt sich die Frage
nach dem Fahrplan, der in endlicher Rechenzeit das beste Resultat erzielt. Als Kriterium,
um zu entscheiden, wie erfolgreich die einzelnen Fahrpläne sind, werden die Performanz
(Gleichung 4.1) und die ihr zugrunde liegenden Größen dienen.
Die Absenkung der Temperatur lässt eine gewisse Willkür zu. Um eine empirische Untersuchung zu ermöglichen, wird daher jeder Fahrplan durch folgende Parameter bestimmt
sein und seine Abhängigkeit von diesen Parametern untersucht :
1. [Tmin , Tmax ], dem Temperaturintervall zwischen Endtemperatur Tmin und Starttemperatur Tmax des Simulated Annealings und
2. ein Parameter µ und die Zahl von Thermalisierungschritten nT h , beides Größen,
die die Verteilung der Temperaturschritte in diesem Intervall definieren.
Zunächst wird mit Hilfe der Mobilität (Gleichung 3.74) ein Kriterium für die Wahl
der oberen Grenze des Temperaturintervalls Tmax gefunden. Die Untergrenze wird für weitere Simulationen zunächst willkürlich festgelegt. Für Fahrpläne, die die Eichtemperatur
gleichmäßig absenken, wird zunächst die Zahl der Simulated Annealing Schritte optimiert.
Danach wird der Einfluss verschieden großer Thermalisierungsschrittzahlen im Fahrplan
betrachtet und abschließend für das herkömmliche Simulated Annealing das Verhalten
bei beschleunigtem oder abgebremstem Abkühlen untersucht.
Von besonderer Bedeutung für die Maximierung des Eichfunktionals hat sich das
Einfügen von mikrokanonischen Schritten herausgestellt. Die Ergebnisse zur Simulated
44
Kapitel 4
Resultate
Annealing Methode, die mikrokanonische Schritte enthält, wird daher in der zweite Hälfte dieses Abschnitts vorgestellt.
Temperaturintervall
Mobilitat
Funktional
1
0.9
0.9
0.8
4
β = 2.40, 16 Gitter
4
β = 2.20, 8 Gitter
0.7
4
0.7
β = 2.20, 16 Gitter
0.6
0.6
hF i
0.5
0.5
1
2 tr(1 −
g oldg new )
®
0.8
β = 2.40, 84 Gitter
0.4

0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
0.5
1
1.5
T
2
2.5
0
0
0.5
1
1.5
2
2.5
T
Abbildung 4.1: Mobilität und Eichfunktional in Abhängigkeit von der Eichtemperatur für verschiedene
Gittergrößen und verschiedene Werte von β, gemittelt über 50 Konfigurationen mit jeweils 20 Kopien.
Die Varianz ist für alle Messpunkte kleiner als 0.02.
Die Abhängigkeit der Mobilität und des Eichfunktionals vom Wert der Eichtemperatur
ist in Abbildung 4.1 für verschiedene Gittergrößen und Kopplungen dargestellt. Die Kurvenverläufe dieser Observablen sind hauptsächlich von der Kopplung und kaum von der
Gittergröße abhängig.
Das Augenmerk der Betrachtung soll jedoch auf der Monotonie der Kurven liegen.
Sowohl die Mobilität als auch das Eichfunktional sind streng monoton in T . Die Mobilität
steigt mit der Temperatur streng monoton, das Eichfunktional fällt streng monoton. Die
Besonderheit liegt in einem Übergangsbereich, bei dem der Anstieg der Mobilität von
einem schwachen Anstieg bei großen Temperaturen zu einem starken Anstieg bei kleinen Temperaturen übergeht. Dieser Wechsel des Anstiegverhaltens ist auch im Wert des
Eichfunktionals wiederzufinden. In der Abbildung kann man erkennen, dass er mit kleiner
werdender Temperatur für ein bei β = 2.4 präpariertes Ensemble ab einer Übergangstemperatur von ca. T ≈ 1.4 und für ein bei β = 2.2 präpariertes Ensemble etwas später bei
T ≈ 1.3 einsetzt.
Als Maß für die Autokorrelation der Eichtransformationen (Abschnitt 3.4.2, S. 38)
zeigt große Mobilität eine schnelle Dekorrelation oder auch große Sprünge der Eichtransformationen in deren Zustandsraum an. Werden diese Sprünge zu groß, kommt ein Simulated Annealing Schritt einer zufälligen erzeugten Eichtransformation sehr nahe3 . Als
Starttemperatur Tmax wird daher ein Wert gesucht, ab dem die Mobilität beim Absenken der Temperatur wesentlich von T abhängt. Diese wesentliche Abhängigkeit setzt bei
Tmax ≈ 1.4 ein, welches im weiteren für die SU (2)-Eichfixierung zu wählen ist.
3
Für T = ∞ haben alle SU (2) Elemente das gleiche Gewicht und die Aktualisierung erzeugt tatsächlich
zufällige Eichtransformationen.
4.1 SU (2) Eichfixierung
45
Bei Absenken der Temperatur nimmt auch die Mobilität ab, so dass auch die Sprünge
im Zustandsraum immer kleiner werden. Im Folgenden wird das Simulated Annealing bei
der endlichen Temperatur Tmin = 0.4 abgebrochen, um zu verhindern, dass zu viel Rechenzeit in einem Temperaturbereich eingesetzt wird, bei dem die Gefahr des Einfrierens
der Eichtransformation besteht. Diese Wahl ist nicht zwingend und die Abhängigkeit des
Simulated Annealing von der unteren Intervallgrenze wird in diesem Abschnitt später
gesondert untersucht.
Im Folgenden wird die Untersuchung von Konfigurationen, die bei einer Eichfeldkopplung von β = 2.4 erzeugt wurden, im Vordergrund stehen. Die vorangegangene Analyse
der Mobilität führt dabei zu folgendem Simulated Annealing Intervall:
β
[Tmin , Tmax ]
2.4
[0.4, 1.4]
Verteilung der Temperaturschritte
Die Bestimmung einer optimalen Verteilung der Simulated Annealing Schritte auf diesem Intervall wird Gegenstand der nächsten Abschnitte sein. Ausgehend von der Analyse
des Einflusses der Gesamtzahl der Simulated Annealing Schritte, wird das Verhalten für
verschiedene Verteilungen dieser Schritte auf dem Temperaturintervall untersucht. Abschließend wird die Auswirkung der Endtemperatur auf das Simulated Annealing genauer
analysiert. Da eine Untersuchung dieser Parameter auf allen Gittern gleichzeitig zu aufwendig ist, werden zunächst ausschließlich Simulationen auf 164 Gittern durchgeführt.
Schrittzahl Zu Optimierung der Schrittzahl werden Fahrpläne miteinander verglichen,
die sich nur in der Zahl der Simulated Annealing Schritte voneinander unterscheiden. Die
Temperaturschritte wurden zunächst gleichmäßig über das gesamte Intervall verteilt.
Verteilung der Funktionalwerte
Vergleich der Rechenzeiten
0.45
0.5
RLX
SA, 6000 Schritte
SA, 4000 Schritte
SA, 3000 Schritte
SA, 2000 Schritte
SA, 1000 Schritte
0.35
P [F = F i ]
0.3
0.25
0.45
0.4
0.35
P [F = F max ]
0.4
0.2
0.15
0.25
0.2
0.15
0.1
0.1
0.05
0
0.3
0.05
5
10
15
i – durchnum m erierte Funktio na lwerte
0
1
2
3
4
5
Zeit in Einheiten der Ü berrela xa tio nsrechenzeit
Abbildung 4.2: Verteilung der Funktionalwerte (links) und Zusammenhang von Rechenzeit mit Wahrscheinlichkeit das Maximum zu erreichen (rechts) für Simulated Annealing Methoden mit verschiedener
Schrittzahl im Temperaturintervall [0.4, 1.4]. Gemittelt wurde bei β = 2.4 auf einem 164 Gitter über
37 Konfigurationen mit jeweils 50 Kopien. Die durchgezogene Linie im rechten Bild verbindet Punkte,
die durch Mehrfachanwendung der Überrelaxation (RLX) entstehen. Die Fehler im linken Bild liegen im
Bereich von 0.01 bis 0.06 und sind für eine bessere Übersichtlichkeit weggelassen worden.
46
Kapitel 4
Resultate
Die Verteilung der durchnummerierten Funktionalwerte und die Abhängigkeit zwischen Rechenzeit und der Wahrscheinlichkeit P [F = Fmax ] für das Ergebnis solcher Fahrpläne sind in Abbildung 4.2 dargestellt. Es wird nur die Verteilung für die ersten 15
Funktionalwerte gezeigt. Die Zeit im rechten Bild ist in Einheiten der mittleren Rechenzeit für Überrelaxation (für ω = 1.63) angegeben, um die Berechnung der Performanz
zu vereinheitlichen. Die Wahrscheinlichkeit für mehrfache Anwendung der Überrelaxation
(durchgezogene Linie) ist aus der Wahrscheinlichkeit für die einmalige Anwendung berechnet (vergleiche hierzu Abschnitt 4 über die Performanz). Die Rechenzeit für einen
Simulated Annealing Fahrplan ergibt sich als Summe aus der Zeit des Simulated Annealings und der Zeit für die abschließende Überrelaxation.
Betrachtet man die Abhängigkeit der Verteilung der Funktionalwerte von der Zahl
der Simulated Annealing Schritte, so ist zu beobachten, das die Wahrscheinlichkeit, die
fünf größten lokalen Maxima zu erreichen, mit der Zahl der Simulated Annealing Schritte
wächst. Insbesondere nimmt auch die Wahrscheinlichkeit für das Erreichen von Fmax zu.
Für die wachsende Schrittzahl wird aber mehr Rechenzeit benötigt, so dass im rechten
Bild (Abb. 4.2) Punkte für einfaches Simulated Annealing mit höherer Schrittzahl auch
bei größeren Rechenzeiten liegen.
Aus P [F = Fmax ] und der Rechenzeit wird die Performanz berechnet, um unter den
verglichenen Fahrplänen Aufschluss über den besten für das Simulated Annealing zu erhalten4 .
Schrittzahl Performanz
0
0.08 ± 0.02
1000
0.10 ± 0.02
2000
0.15 ± 0.02
3000
0.16 ± 0.02
4000
0.15 ± 0.02
6000
0.12 ± 0.02
Im Sinne der Performanz wird dieses Optimum mit 3000 Schritten für das gegebenen
Intervall erreicht.
Ein weiteres Kennzeichen der Schrittverteilung ist das Verhältnis von Temperaturschritten und Thermalisierungsschritten im Simulated Annealing.
Einfluß von Thermalisierungsschritten Das Optimum von 3000 Schritten wird nun
für weitere Fahrpläne verwendet, in denen der Einfluß von Thermalisierungsschritten untersucht wird.
Dazu wird das Verhalten einer Reihe von Fahrplänen untersucht, deren Gesamtschrittzahl bei 3000 fixiert ist, die aber unterschiedliche Verhältnisse von Temperatur- und
Thermalisierungsschritten verwenden. Ausschnitte von dreien dieser Fahrpläne werden
in Abbildung 4.3 gezeigt.
Im Intervall [0.4, 1.4] wurde die Temperatur (nT − 1)-mal abgesenkt und bei jeder
Temperatur jeweils nT h Thermalisierungsschritte ausgeführt.
4
Reine Überrel. ist in der Tabelle durch 0 Simulated Annealingschritte gekennzeichnet
4.1 SU (2) Eichfixierung
47
Fa hrplä ne zum Therm a lisierung sverha lten
1.4
30 x 100
150 x 20
3000 x 1
T(i)
1.35
1.3
1.25
1.2
0
50
100
150
200
250
300
350
400
450
500
550
i - Simula ted A nnea ling Schritt
Abbildung 4.3: Ausschnitt der Simulated Annealing Fahrpläne mit 3000 Schritten im Intervall [0.4, 1.4]
mit unterschiedlichen Verhältnissen von Temperaturschritten nT zu Thermalisierungsschritten nT h . Die
Legende gibt dieses Verhältnis in der Form nT × nT h wieder, um zu verdeutlichen, dass das Produkt
konstant ist.
Die Ergebnisse des Vergleichs verschiedener Fahrpläne sind in Abbildung 4.4 dargestellt.
Verteilung der Funktionalwerte
Rechenzeiten
0.35
0.35
RLX
3000 x 1
1000 x 3
250 x 12
150 x 20
30 x 100
P [F = F i ]
0.25
0.2
0.3
P [F = F max ]
0.3
0.15
0.25
0.2
0.15
0.1
0.1
0.05
0.05
0
5
10
15
i – durchnum m erierte Funktio na lwerte
0
1
2
3
4
R echenzeit in Einheiten der Ü berrela xa tio n
Abbildung 4.4: Wahrscheinlichkeitsverteilung über den Funktionalwerten und Zusammenhang von Rechenzeit und Wahrscheinlichkeit, das Maximum zu erreichen für Simulated Annealing Methoden mit
verschiedener Zahl von Thermalisierungsschritten (nT h ∈ {1, 3, 12, 20, 100}) bei konstant gehaltener Gesamtzahl nt × nT h von Simulated Annealing Schritten. Da alle Fahrpläne die gleiche Gesamtschrittzahl
verwenden, benötigen sie auch in etwa die gleiche Zeit für die Eichfixierung. Gemittelt wurde bei β = 2.4
auf einem 164 Gitter über 78 Konfigurationen mit jeweils 50 Kopien.
48
Kapitel 4
Resultate
Weder in der Wahrscheinlichkeitsverteilung über den Funktionalwerten auf der linken Seite, noch in der Rechenzeit auf der rechten Seite der Grafik ist ein signifikanter
Unterschied der Thermalisierungsfahrpläne zu erkennen. Dieses Ergebnis ist insofern von
Bedeutung, dass es zeigt, dass ein längerer Thermalisierungsprozess bei jeder gewählten
Temperatur nicht nötig ist und die Temperatur während des gesamten Simulated Annealings kontinuierlich abgesenkt werden kann.
Bisher ist die Aufteilung der Simulated Annealing Schritte auf das Temperaturintervall sehr gleichmäßig geschehen, so dass zum Beispiel in der oberen Hälfte des Intervalls
genauso viele Schritte gemacht werden, wie in der unteren. Es gibt jedoch auch für andere Verteilungen gute Argumente und ihre Auswirkungen sollen im Folgenden untersucht
werden.
Verteilung der Temperaturschritte Der Beweis für die Konvergenz des Simulated
Annealings verlangt, dass fast alle Schritte des Simulated Annealing Fahrplans in jeder Umgebung von T = 0 liegen müssen. Insbesondere wird also verlangt, dass um so
mehr Schritte gemacht werden, um so kleiner die Temperatur wird. Der Grund liegt
in der Geschwindigkeit der Konvergenz der Markovkette (Abschnitt A.2). Sie ist um
so langsamer, je kleiner die kleinste Übergangswahrscheinlichkeit zwischen zwei beliebigen Eichtransformationen ist. Mit abnehmender Temperatur im Simulated Annealing
geht diese Übergangswahrscheinlichkeit gegen Null und muß, um Quasithermalisiertheit
||Pn;Tn [F = Fmax ] − pmax (Tn )|| ≤ ² im n-ten Schritt bei der Temperatur Tn zu gewährleisten, durch ein längeres Verweilen bei diesen Temperaturen ausgeglichen werden (vgl. hierzu Abschnitt 3.3.6). In diesem Sinne erscheint im Temperaturfahrplan für das Simulated
Annealing eine höhere Dichte von Schritten bei tiefen Temperaturen begründet. Jedoch
ist zu berücksichtigen, dass gerade für niedrige Temperaturen auch die Schrittzahl zum
Erreichen eines Quasigleichgewichtes deutlich zunimmt. Je nach vorgegebener Gesamtschrittzahl, von der auch die veranschlagte Rechenzeit abhängt, wird es dann günstiger
sein diese Temperaturschritte auf einen Temperaturbereich zu konzentrieren, in dem mit
dieser Schrittzahl tatsächlich quasithermalisiert werden kann. Dies kann auch bedeuten,
die Schritte entgegen der ursprünglichen Intuition stärker bei hohen Temperaturen zu
gewichten.
Da eine einfache Entscheidung zwischen diesen beiden Ansätzen nicht ohne weiteres
möglich ist, werden im folgenden drei verschiedene Verteilungen der Simulated Annealing Schritte verglichen. Eine mit überwiegender Zahl von Simulated Annealing-Schritten
bei höheren Temperaturen, eine mit einer stärkeren Gewichtung bei kleinen Temperaturen und eine, die die Schritte, wie schon eingangs betrachtet, gleichmäßig über das
Intervall verteilt. Die Gesamtzahl der Simulated Annealing Schritte wird für alle Fahrpläne konstant gehalten. Gleichzeitig wird damit auch erfasst, inwieweit die abschließende
Überrelaxation die Präkonditionierung des Simulated Annealings erhält.
Hierfür ist es zunächst sinnvoll, eine Funktion zu definieren, die für gegebene Temperaturintervall und Schrittzahl einen Fahrplan erzeugt, der diesen Verteilungen genügt. Ist
nun [Tmin , Tmax ] das Temperaturintervall, in dem N Simulated Annealing Schritte verteilt
werden sollen, so ist
 £
¤ 1
−µ
−µ − µ
−µ
 (Tmin
für µ 6= 0
+ Tmax
− Tmax
) · Ni−1
−1
´ Ni−1
³
T (i) =
−1
Tmin

· Tmax
für µ = 0
Tmax
4.1 SU (2) Eichfixierung
49
eine Funktion, die für jeden Schritt i ∈ [1, .., N ] angibt, bei welcher Temperatur das
Update der Transformation erfolgen soll. Es gilt T (1) = Tmax und T (N ) = Tmin . Der
Parameter µ legt die Verteilung dazwischen liegender Schritte fest und ist so gewählt, dass
die Änderung der Temperatur proportional zu T µ+1 ist und für µ > 0 mit wachsendem i
gegen Null geht.
∂
T ∝ T µ+1 (i)
∂i
und
µ>0
T (i) −−−→ 0
i→∞
Für µ = −1 ergibt sich beispielsweise eine konstante Schrittweite. Für µ > −1 nimmt die
Schrittweite während des Abkühlens ab, für µ < −1 startet sie mit kleinen Schritten und
wird dann größer. Untersucht wurden µ = 2, µ = −1 und µ = −4 für Fahrpläne mit 3000
Schritten im Intervall [0.4, 1.4] (Abb. 4.5).
Fa hrplä ne verschiedener Verteilung en
1.6
µ=2
µ = −1
µ = −4
1.4
T(i)
1.2
1
0.8
0.6
0.4
0.2
0
500
1000
1500
2000
2500
3000
i - Simula ted A nnea ling Schritt
Abbildung 4.5: Darstellung der Simulated Annealing Fahrpläne auf dem Temperaturintervall [0.4, 1.4]
für verschiedene Werte des Verteilungsparameters µ
Da i proportional zur Rechenzeit ist, wird so auch die Verweildauer des Algorithmus
in den einzelnen Temperaturbereichen definiert.
50
Kapitel 4
Vergleich der Performanzwerte
Verteilung der Funktionalwerte
0.35
0.22
0.3
0.18
Perfo rm a nz
P [F = F i ]
0.2
RLX
µ=2
µ = −1
µ = −4
0.25
0.2
0.15
0.16
0.14
0.1
0.12
0.05
0.1
0
Resultate
2
4
6
8
10
12
14
i – durchnum m erierte Funktio na lwerte
0.08
−4
−2
0
2
Verteilung spa ra m eter µ
Abbildung 4.6: Verteilung der Funktionalwerte und Performanz für verschiedene Verteilungen der Simulated Annealing Schritte auf dem Temperaturintervall [0.4, 1.4]. Gemittelt wurde bei β = 2.4 auf einem
164 Gitter über 52 Konfigurationen mit jeweils 50 Kopien.
Abbildung 4.6 stellt für die drei Fahrpläne die Wahrscheinlichkeitsverteilungen der
Funktionalwerte und die Performanz in Abhängigkeit vom Verteilungsparameter µ dar.
Dabei ist kein signifikanter Unterschied zwischen Fahrplänen mit einer Konzentration
der Schritte am unteren Intervallende und solchen mit einer Konzentration der Schritte
am oberen Intervallende zu erkennen. Der Grund ist vermutlich in der als noch zu hoch
angesetzten unteren Grenze des Temperaturintervalls zu suchen, denn in einer später
vorgestellten Untersuchung gibt es einen signifikanten Unterschied zwischen diesen drei
Verteilungen.
Da ein signifikanter Unterschied zu diesem Zeitpunkt jedoch fehlte, war eine konstante
Schrittweite5 und damit eine gleichmäßige Verteilung der Temperaturschritte auf dem
Intervall die unkomplizierteste Wahl für weitere Untersuchungen.
Mikrokanonische Schritte
Eine optimierte Variante des Simulated Annealing geht aus der Nutzung von mikrokanonischen Schritten bei jeder Temperatur hervor. Ursprünglich aus der Überrelaxation
hervorgegangen und auch zur Verminderung der Autokorrelation bei Gleichgewichtssimulationen eingesetzt (Abschnitt 3.3.3, Seite 29), erweisen sie sich auch als hilfreich, die
Ergodizität des Simulated Annealings und damit seine Konvergenz zu beschleunigen.
Betrachtet werden Simulated Annealing Fahrpläne mit 3000 im Intervall [0.4, 1.4]
gleichverteilten Schritten. Bei jeder Temperatur wird ein Thermalisierungsschritt und eine variable Anzahl von mikrokanonischen Schritten durchgeführt. Alle Methoden wurden
auf einem 164 Gitter bei β = 2.4 getestet und unter Berücksichtigung ihrer Rechenzeit,
der Wahrscheinlichkeit, das Maximum zu finden und der Verteilung der Funktionalwerte
miteinander verglichen (Abbildung 4.7). Es fällt auf, das der Einbau von mikrokanonischen Schritten eine stärkere Gewichtung der Wahrscheinlichkeitsverteilung in der Nähe
des Maximums bewirkt (linkes Bild), wodurch auch das Maximum selbst mit größerer
Wahrscheinlichkeit angenommen wird. Auf der anderen Seite benötigen die zusätzlichen
5
Eine konstante Schrittweite entspricht µ = −1.
4.1 SU (2) Eichfixierung
51
Funktionalwertverteilung
Rechenzeiten
0.45
0.5
0.4
0.3
0.4
0.35
P [F = F max ]
0.35
P [F = F i ]
0.45
RLX
3000 + 0
3000 + 1
3000 + 3
1000 + 3
0.25
0.2
0.15
0.3
0.25
0.2
0.15
0.1
0.1
0.05
0.05
0
5
10
15
i – durchnum m erierte Funktio na lwerte
0
1
2
3
4
5
6
m ittlere R echenzeit
Abbildung 4.7: Wahrscheinlichkeitsverteilung über den durchnummerierten Funktionalwerten und der
Zusammenhang von Rechenzeit und Wahrscheinlichkeit, das Maximum zu erreichen, für Überrelaxation
(RLX) und Simulated Annealing mit modifizierter Schrittzahl nT und variabler Zahl von mikrokanonischen Schritten nm (in der Darstellung nT + nm ) im Intervall [0.4, 1.4]. Die Rechenzeit ist in Einheiten
der mittleren Dauer für reine Überrelaxation angegeben. Gemittelt wurde bei β = 2.4 auf einem 164
Gitter über 41 Konfigurationen mit jeweils 50 Kopien.
mikrokanonischen Schritte auch mehr Rechenzeit. Für eine systematischere Analyse wird
nun zunächst die Performanz von Methoden mit gleicher Simulated Annealing Schrittzahl
verglichen, um danach auf Methoden mit konstanter Zahl von mikrokanonischen Schritten
einzugehen.
Ein Vergleich der Performanz für Methoden mit gleicher Simulated Annealing Schrittzahl 3000 zeigt ein Optimum von 1 oder möglicherweise 2 mikrokanonischen Schritten
während jeder Aktualisierung (Tabelle 4.1). Es erweist sich jedoch als günstiger, Simumikrokanonische Performanz
Schritte
0
0.13 ± 0.02
1
0.14 ± 0.02
3
0.10 ± 0.01
Tabelle 4.1: Simulated Annealing Methoden mit 3000 Schritten und einer variablen Zahl von mikrokanonischen Aktualisierungen pro Simulated Annealing Schritt
lated Annealing nicht nur um mikrokanonische Schritte zu erweitern, sondern Simulated
Annealing Schritte teilweise durch mikrokanonische zu ersetzen. Zum einen ist der Rechenaufwand für mikrokanonische Schritte geringer, als für Heatbath Aktualisierungen, so
dass zwei Simulated Annealing Schritte gegen drei mikrokanonische Schritte ausgetauscht
werden können, ohne den Rechenaufwand zu erhöhen6 . Zum anderen wird, obwohl mikrokanonische Schritte das Eichfunktional invariant lassen, mit der so entstandenen Methode
6
In den Simulated Annealing Fahrplänen wurde von je drei Simulated Annealing Schritten einer erhalten und die übrigen beiden durch drei mikrokanonische ersetzt. Dadurch reduziert sich die Zahl der
Simulated Annealing Schritte in den Fahrplänen von 3000 auf 1000.
52
Kapitel 4
Resultate
das Maximum am Ende mit größerer Wahrscheinlichkeit angenommen als mit dem bisher
verwendeten Simulated Annealing. Dies zeigt sich besonders deutlich im Vergleich der
Performanz (Tabelle 4.2).
Sim. Ann. Schritte im Performanz
Intervall [0.4, 1.4]
3000
0.10 ± 0.01
1000
0.24 ± 0.03
Tabelle 4.2: Simulated Annealing Methoden mit variabler Schrittzahl aber je 3 mikrokanonischen Schritten pro Simulated Annealing Schritt
Unter Berücksichtigung von Folgerung 4.0.1 kann das Maximum des Eichfunktionals
mit einem auf diese Weise mikrokanonisch verbessertem Simulated Annealing in halber
Zeit mit der gleichen Wahrscheinlichkeit aufgefunden werden, als mit der üblichen Methode.
Das entscheidende Resultat dieses Abschnitt ist so auch die starke Beschleunigung des
Simulated Annealings durch mikrokanonische Schritte, was in alle weiteren Untersuchungen mit eingehen wird. Bisher nicht betrachtet wurde die Abhängigkeit des Simulated
Annealing Fahrplans von der Endtemperatur.
Variation der Endtemperatur Der Beweis für die Konvergenz des Simulated Annealings basierte auf dem Abkühlen der Eichtransformation im Limes T → 0. Da die
Bewegung im Zustandsraum bei kleinen Temperaturen jedoch sehr langsam wird, wurde Simulated Annealing bisher bei Tmin = 0.4 beendet. Es werden nun verschiedene
Methoden miteinander verglichen, die ein Absenken der Temperatur bis unter diese Temperatur umsetzen. In diesem Zusammenhang wird auch untersucht, wie hoch der Anteil
der Eichtransformationen nach Simulated Annealing ist, für die man bereits nach dem
Simulated Annealing ausschließen kann, dass sie das Eichfunktional maximieren werden,
so dass das abschließende Überrelaxieren eingespart werden kann.
Verglichen werden Simulated Annealing Fahrpläne, deren Schritte gleichmäßig über
das Temperaturintervall verteilt liegen. Dabei werden zwei Varianten des Absenkens der
Temperatur umgesetzt. Die ersten Variante hält die Schrittweite der Simulated Annealing
Schritte konstant, die zweite Variante die Gesamtschrittzahl.
4.1 SU (2) Eichfixierung
53
Verteilung der Funktionalwerte
Vergleich der Performanzen
0.7
Ueberrelaxation
[0.01, 1.4]
[0.20, 1.4]
[0.40, 1.4]
0.6
0.4
0.38
0.36
Perfo rm a nz
P [F = F i ]
0.5
0.4
0.3
0.34
0.32
0.3
0.28
0.2
0.26
0.1
0.24
0
0
5
10
15
0.22
−0.1
0
0.1
i – durchnum m erierte Funktio na lwerte
0.2
0.3
0.4
0.5
T min
Abbildung 4.8: Verteilung der Funktionalwerte und Performanzen für verschiedene Endtemperaturen
des Simulated Annealings bei konstant gehaltener Schrittweite der Temperaturabsenkungen. Gemittelt
wurde bei β = 2.4 auf einem 164 Gitter über 49 Konfigurationen mit jeweils 50 Kopien. Die Fehler im
linken Bild sind nicht eingetragen, um die Grafik übersichtlich zu lassen. Sie sind jedoch so groß, dass sie
hauptsächlich zum Fehler der Performanz beitragen.
Die Verteilungen der Funktionalwerte und die Performanzen von Simulated Annealing Fahrplänen mit verschiedener Endtemperatur sind in Abbildung 4.8 verglichen. Es
wurden Fahrpläne mit konstanter Schrittweite (Variante Eins) bei β = 2.4 auf einem
164 Gitter simuliert. Das Konstanthalten der Schrittweite führt dazu, dass auf größeren
Temperaturintervallen auch mehr Simulated Annealing Schritte nötig sind 7 :
Temperaturintervall Schritte
[0.01, 1.4]
1390
[0.20, 1.4]
1200
[0.40, 1.4]
1000
Vergleichbar werden die Fahrpläne hauptsächlich dadurch, dass sie auf den Teilintervallen,
die sie gemeinsam haben, identisch sind. Wie zu erwarten, wird die Wahrscheinlichkeit,
das Maximum zu erreichen, durch zusätzliche Simulated Annealing Schritte bei niedrigen Temperaturen erhöht (linkes Bild). Die für diese Schritte zusätzliche Rechenzeit geht
jedoch in die Performanz (rechtes Bild) ein, wo sich die Effekte von höherer Wahrscheinlichkeit für das Erreichen des Maximums und längerer Rechenzeit gerade gegenseitig aufheben. Im Sinne der Performanz unterscheiden sich diese Fahrpläne daher nicht signifikant
voneinander.
In einer weiteren Untersuchung wurden daher Simulated Annealing Fahrpläne verglichen, bei denen die Gesamtschrittzahl auf den betrachteten Temperaturintervallen
[0.01, 1.4], [0.2, 1.4] und [0.4, 1.4] für alle Fahrpläne 1000 war.
7
Die Schrittweite ist für Fahrpläne mit gleichmäßiger Schrittverteilung auf dem gesamten Intervall der
Quotient aus Intervalllänge und Schrittzahl.
54
Kapitel 4
Resultate
Vergleich der Performanzen
Verteilung der Funktionalwerte
0.7
0.4
Perfo rm a nz
0.5
P [F = F i ]
0.45
Ueberrelaxation
[0.01, 1.4]
[0.20, 1.4]
[0.40, 1.4]
0.6
0.4
0.3
0.35
0.3
0.2
0.25
0.1
0
0
5
10
0.2
−0.1
15
i – durchnum m erierte Funktio na lwerte
0
0.1
0.2
0.3
0.4
0.5
T min
Abbildung 4.9: Verteilung der Funktionalwerte und Performanzen für verschiedene Endtemperaturen
des Simulated Annealings bei konstant gehaltener Zahl von Simulated Annealing Schritten der unterschiedlichen Fahrpläne. Gemittelt wurde bei β = 2.4 auf einem 164 Gitter über 33 Konfigurationen mit
jeweils 50 Kopien.
Die resultierenden Verteilungen der Funktionalwerte und die Performanzen sind in
Abbildung 4.9 zu sehen.
Bei konstant gehaltener Gesamtschrittzahl führt die niedrigere Endtemperatur auch in
diesem Fall zu einer größeren Wahrscheinlichkeit, nach der Überrelaxation das Maximum
zu finden (linkes Bild). Gleichzeitig benötigen alle drei Fahrpläne die gleiche mittlere
Rechenzeit, so dass Fahrpläne mit geringeren Endtemperaturen eine größere Performanz
erreichen.
Die letzte Untersuchung liefert abschließend einen guten Grund, die Endtemperatur
im Simulated Annealing Fahrplan in der Nähe von T = 0 zu wählen. Den Nullpunkt
direkt zu wählen ist nicht nötig, da dies einem Relaxationsschritt entspräche. Ein weiterer Effekt einer tiefen Endtemperatur ist, dass die einzelne Aktualisierung im Simulated
Annealing der Relaxation immer ähnlicher wird und bereits im Voraus absehbar wird, ob
die abschließende Überrelaxation zum Erfolg führen kann.
Erfolgsprognose nach Simulated Annealing Für die Eichfixierung ist man letzten
Endes nur an solchen Eichtransformationen interessiert, durch die das Eichfunktional sein
absolutes Maximum annimmt. Die nach Simulated Annealing erzeugten Eichtransformationen stellen noch keine Eichfixierung dar und müssen hierfür erst überrelaxiert werden.
Es soll im folgenden eine Methodik vorgestellt werden, die bereits vor der Überrelaxation erlaubt festzustellen, ob das Erreichen des absolute Maximums ausgeschlossen werden
kann.
Das Kriterium hierfür ist der Wert des Eichfunktionals nach dem Simulated Annealing,
der mit dem Endwert nach Überrelaxation verglichen wird. Zum Vergleich der Ergebnisse
verschiedener Konfigurationen wird der relative Funktionalwert
Frel =
F − Fmax
Fmax
(4.2)
4.1 SU (2) Eichfixierung
55
betrachtet. Fmax wird so für alle Konfigurationen auf Null abgebildet und stellt das Maximum der relativen Funktionalwerte einer Konfiguration dar.
Nach dem Simulated Annealing ist das tatsächliche Maximum des Eichfunktionals
ann
noch nicht bekannt, weshalb für die Berechnung des relativen Funktionalwertes Frel
der
ann
maximale Wert nach Simulated Annealing Fmax als Berechnungsgrundlage gewählt wird.
orx
Der relative Wert der schließlich eichfixierten Transformation wird mit Frel
bezeichnet 8
und es gilt:
ann
Frel
=
ann
F − Fmax
ann
Fmax
orx
Frel
=
F − Fmax
.
Fmax
(4.3)
Die Korrelation zwischen beiden Werten ist in Abbildung 4.10 für ein 124 und in Abbildung
4.11 für ein 244 Gitter gezeigt. Bei Versuchen mit verschiedenen Endtemperaturen wurde
ann
orx
erst bei Tmin = 0.01 ein funktioneller Zusammenhang zwischen Frel
und Frel
beobachtet.
Für die nächst größere untersuchte Temperatur Tmin = 0.05 wurde keine Korrelation mehr
gefunden.
−3
0
−4
x 10
0
x 10
−0.2
−1
−0.6
Forx
rel
Forx
rel
−0.4
−0.8
−2
−1
34.7% potentiell maximal
65.3% aussortierbar
98.2% potentiell maximal
1.8% aussortierbar
−1.2
−3
−1
−0.5
Fann
rel
0
−3
x 10
Abbildung 4.10: Korrelation zwischen relaann
tivem Funktionalwert vor (Frel
) und nach
orx
(Frel ) der Überrelaxation für einen Simulated
Annealing Fahrplan mit 1200 Schritten auf dem
Temperaturintervall [0.01, 1.4]. Gemittelt wurde auf einem 124 Gitter bei β = 2.4, über 200
Konfigurationen mit jeweils 50 Kopien.
−3
−2
Fann
rel
−1
0
−4
x 10
Abbildung 4.11: Korrelation zwischen relaann
tivem Funktionalwert vor (Frel
) und nach
orx
(Frel ) der Überrelaxation für einen Simulated
Annealing Fahrplan mit 3738 Schritten auf dem
Temperaturintervall [0.01, 1.4]. Gemittelt wurde auf einem 244 Gitter bei β = 2.4, über 4
Konfigurationen mit jeweils 50 Kopien.
Jeder Punkt in den Darstellungen entspricht einer Gribov-Kopie. Auf der Abzisse ist
der relative Funktionalwert nach Simulated Annealing und auf der Ordinate der Wert nach
Überrelaxation aufgetragen. Durch einen helleren Farbton gekennzeichnet sind Kopien, für
die im Rahmen der Messungen bereits nach dem Simulated Annealing feststellbar gewesen
wäre, dass sie das Eichfunktional nicht maximieren werden.
Auf dem 124 Gitter erreichte keine Eichtransformation, deren relativer Funktionalwert
nach Simulated Annealing kleiner als 2 · 10−4 war, nach Überrelaxation das Maximum.
8
Der Index orx beieht sich auf die englische Bezeichung Overrelaxation für die Überrelaxation
56
Kapitel 4
Resultate
Auf einem 244 Gitter liegt dieser Wert bei 3·10−5 . Nutzt man dies als Ausschlußkriterium,
so lassen sich auf dem 124 Gitter zwar nur 1.8% der Überrelaxationen einsparen, auf dem
244 Gitter sind es aber immerhin deutlich mehr als 50% der Transformationen, die dieses
Kriterium erfüllen.
Der Grund für die Abhängigkeit von der Gittergröße ist vermutlich darin zu suchen,
dass auf kleinen Gittern noch relativ wenige Gribov-Kopien gefunden werden und auch
ohne Simulated Annealing bereits ein großer Anteil von ihnen den maximalen Funktionalwert annimmt. Auf großen Gittern nimmt die Zahl der Gribov-Kopien zu. Da die
Verteilung der Funktionalwerte stark von der Zahl der Simulated Annealing Schritte, von
der Gittergröße und von der Zahl der Schritte bei kleinen Temperaturen abhängt, ist an
dieser Stelle nur die Aussage möglich, dass bereits nach dem Simulated Annealing eine
Prognose über den Erfolg der abschließenden Überrelaxation nur dann getroffen werden
ann
kann, falls Tmin ≤ 0.01 ist. Das exakte Ausschlusskriterium für Frel
muss für jeden Fahrplan separat ermittelt werden.
Verteilung und Schrittzahl Die Parameter Schrittzahl9 und Schrittverteilung10 wurden bisher nur für Simulated Annealing ohne mikrokanonische Schritte untersucht. Die
gleichzeitige Optimierung dieser Parameter ist das Ziel des folgenden Abschnitts. Ein Erklärungsansatz für die sichtbar werdenden Zusammenhänge wird am Ende des Abschnitts
präsentiert.
Fa hrplä ne verschiedener Verteilung en
1.4
1.2
T(i)
1
0.8
0.6
µ = 0.3
µ = −1
µ = −5
0.4
0.2
0
0
200
400
600
800
1000
i - Simula ted A nnea ling Schritt
Abbildung 4.12: Temperaturfahrpläne für verschiedene Verteilungen der Temperaturschritte im Temperaturintervall [0.01, 1.4]. Für Temperaturfahrpläne mit einer anderen Gesamtschrittzahl bleibt das Bild
das gleiche und es ändert sich nur die Einteilung auf der Abzisse. Die Form des Fahrplans bleibt erhalten.
Es wurden wieder Häufungen der Schritte zum Beginn des Simulated Annealings
(µ = −5), Häufungen am Ende (µ = 0.3) und Fahrpläne mit über das Intervall gleichverteilten Simulated Annealing Schritten verglichen. Eine Darstellung solcher Fahrpläne
9
10
Kapitel 4.1.1, Seite 45
Kapitel 4.1.1, Seite 48
4.1 SU (2) Eichfixierung
57
zeigt Abbildung 4.12. Alle Schrittverteilungen hatten das Simulated Annealing Intervall
[0.01, 1.4] als Grundlage und wurden mit verschiedenen Schrittzahlen (150, 300, 700 und
1000 Schritte) simuliert. Die Darstellung von Fahrplänen mit weniger als 1000 Schritten
entsprechen, bis auf Skalierung der Absizze, obiger Abbildung. Alles in allem wurden also
12 verschiedene Fahrpläne miteinander verglichen.
Vergleich der Rechenzeiten
Vergleich der Performanzen
0.4
0.5
0.35
0.4
Perfo rm a nz
P [F = F max ]
0.3
0.3
0.2
0.1
0
−0.1
1
1.5
2
0.25
0.2
1000 Schritte
700 Schritte
300 Schritte
150 Schritte
0.15
0.1
µ = −5
RLX
0.05
µ = −1
µ=2
2.5
3
Zeit in Einheiten der Ü berrela xa tio nsrechenzeit
200
400
600
800
1000
Schrittza hl
Abbildung 4.13: Vergleich der Rechenzeiten und Performanzen für verschiedene Verteilungen der Simulated Annealing Schritte auf dem Intervall [0.01, 1.4] bei variabler Schrittzahl. Fahrpläne, die die
gleiche Anzahl von Simulated Annealing Schritten verwenden, sind mit der gleichen Farbe kodiert (linke
Legende). Fahrpläne mit gleicher Schrittverteilung sind durch die Verwendung der gleichen Symbole gekennzeichnet. Da die Rechenzeit hauptsächlich von der Zahl der Simulated Annealing Schritte abhängt
gehören Punkte, die in der linken Grafik zeitlich dicht beieinander liegen, zu Fahrplänen mit der gleichen Schrittzahl und wurden in der gleiche Farbe eingetragen. Gemittelt wurde bei β = 2.4 auf einem
164 Gitter über 28 Konfigurationen mit jeweils 50 Kopien. Der Fehler der Rechenzeiten ist um zwei
Größenordnungen kleiner als die Rechenzeit selbst.
In Abbildung 4.13 sind die Ergebnisse für die verschiedenen Fahrpläne dargestellt. Im
linken Bild ist die mittlere Wahrscheinlichkeit, das Maximum zu finden, gegen die mittlere
Rechenzeit der Fahrpläne aufgetragen. Da bei der Rechenzeit für einen Aktualisierungsschritt die Temperatur kaum eine Rolle spielt, sind Fahrpläne mit gleicher Anzahl von
Simulated Annealing Schritten auch in etwa bei ähnlich langen Rechenzeiten angesiedelt
und wurden in der gleichen Farbe dargestellt. Die Schrittverteilung selbst, also der Wert
von µ, ist durch das Symbol des Fahrplans kodiert. Im rechten Bild ist die Performanz
dargestellt. Fahrpläne mit gleicher Schrittverteilung sind durch einen approximierten Kurvenverlauf miteinander verbunden, so dass für jede Verteilung die Schrittzahl visuell optimiert werden kann. Für die Approximation im rechten Bild wurde zunächst das Verhalten
P = f (tr ) der Fahrpläne mit gleicher Verteilung im linken Bild mit einer Exponentialfunktion f (T ) = a1 + a2 exp − atr3 abgeschätzt und aus diesen Funktionen das Verhalten
der Performanzen berechnet.
Eine größere Anzahl von Simulated Annealing Schritten verbessert für alle Verteilungen die Wahrscheinlichkeit, das Maximum zu erreichen, wie im linken Bild ablesbar ist.
Gleichzeitig ist damit zusätzlicher Rechenaufwand verbunden. Beide Größen ergeben das
rechte Bild der Performanz. Hier erzielte auf einem 164 Gitter ein Fahrplan mit 300 bis
400 Schritten und einer Verteilung µ = −1 die beste Performanz.
58
Kapitel 4
Resultate
Im rechten Bild der Performanz scheint es bei den Schrittzahlen drei unterschiedliche
Regimes zu geben, für die im Folgenden ein qualitativer Erklärungsansatz geliefert werden soll, da sie auch in der SU (3) Gittereichtheorie wiederzufinden sind. Die Ergebnisse
decken sich auch mit Untersuchungen, die im Rahmen der Coulomb-Eichung durchgeführt
wurden.
Im ersten Regime bei weniger als 50 Schritten sind Fahrpläne von Vorteil, die den
Hauptanteil der Schritte bei hohen Temperaturen durchführen (µ < −1). Der Grund
ist vermutlich, dass Simulated Annealing Aktualisierungen bei kleinen Temperaturen nur
geringe Wirkung zeigen (Abschnitt 3.4.2, S. 38). Die größte Wirkung wird bei großen Temperaturen erzielt, weshalb es am besten ist, auch die meisten Schritte in diesem Bereich zu
machen. Da die Gesamtschrittzahl recht niedrig ist, wird die Eichtransformation trotzdem
noch nicht thermalisiert. Das Optimum von Verteilungen mit µ = −5 liegt entsprechend
bei kleinen Schrittzahlen unterhalb von 300.
In einem zweiten Regime bei sehr großen Schrittzahlen sind Fahrpläne von Vorteil,
die die Mehrzahl der Aktualisierungen in Bereichen kleiner Temperatur machen (µ =
−0.3). Diese Tendenz ist am rechten Bildrand bereits zu erahnen, wo die zugehörige
Kurve bereits besser ist als bei einer gleichmäßige Schrittverteilung. Der Grund ist hier
vermutlich auch in der großen Mobilität bei hohen Temperaturen zu suchen. Schritte
in diesem Bereich würden die Eichtransformation sehr schnell thermalisieren, so dass
zusätzliche Schritte in diesem Temperaturbereich an der Wahrscheinlichkeitsverteilung
der Eichtransformationen im Zustandsraum kaum noch etwas ändern. Wenn viele Schritte
zur Verfügung stehen, ist ein schnelles Absenken der Temperatur daher von Vorteil. Ein
weiteres Indiz ist, dass desto mehr Simulated Annealing Schritte zur Verfügung stehen,
desto änlicher wird das Simulated Annealing dem mathematisch idealisierten Verfahren
mit unendlich vielen Schritten, dass bekanntlich voraussetzt, dass fast alle Schritte in
jeder Umgebung von Null durchgeführt werden. Insofern kann dies auch erklären, warum
Fahrpläne, die die meisten Schritte bei kleinen Temperaturen machen, ihr Optimum der
Performanz bei mehr als 1000 Schritten haben.
Über den Bereich zwischen diesen beiden Regimen lässt sich keine Erklärung für das
Verhalten der verschiedenen Verteilungen angeben. Interessanterweise liegt aber der optimale Fahrplan in diesem Bereich und nutzt eine Gleichverteilung von 300 Schritten auf
dem gesamten Intervall.
Nach Optimierung von Schrittzahl und Schrittverteilung, die sowohl Rechenzeit als
auch den Wert von pmax betrafen, soll im Folgenden eine Methodik beschrieben werden,
die nur versucht, die Rechenzeit zu reduzieren.
4.1.2
I120 -Eichfixierung
Eine Reduktion der Rechenzeit lässt sich durch Vereinfachung der aufwändigen Matrixmultiplikationen und durch eine Reduktion der im Speicher zu bewegenden Daten erzielen.
Beiden Ansprüchen wird versucht mit der Projektion der SU (2) auf die ikosaedrale Untergruppe I120 entgegenzukommen (Abschnitt 3.3.7, Seite 36). Die häufig auszurechnenden
Produkte der Form g(x)Uµ (x)g † (x + eµ ) lassen sich hier mit einer Multiplikationstabelle deutlich schneller bestimmen und, da diese Gruppe nur 120 Elemente enthält, lassen
sich sämtliche Elemente der Transformationen und Konfigurationen durch natürliche Zahl
kleiner als 127 codieren.
4.1 SU (2) Eichfixierung
59
Das setzt voraus, dass die Eichkonfiguration zunächst auf die Ikosaeder Untergruppe
I120 projiziert wird. Für diese projizierte Konfiguration wird mit der Methode des Simulated Annealings die Landau-Eichung so gut wie möglich auf der Untergruppe fixiert.
Die so gewonnene I120 Eichtransformation dient dann als präkonditionierte Eichtransformation für die abschließende Überrelaxation. Diese wird wieder auf der ursprünglichen
Eichkonfiguration durchgeführt. Der Erfolg der Präkonditionierung auf dem Ikosaeder ist
in Abbildung 4.14 dargestellt.
Funktionalwertverteilung
Rechenzeiten
0.5
0.5
P [F = F i ]
0.4
P [F = F max ]
RLX
Ikosaeder
SU(2)
0.3
0.4
0.3
0.2
0.2
0.1
0.1
0
0
5
10
15
i – durchnum m erierte Funktio na lwerte
0
0.5
1
1.5
2
2.5
3
3.5
m ittlere R echenzeit T
Abbildung 4.14: Vergleich der Rechenzeiten und Performanzen für Simulated Annealing mit mikrokanonischen Schritten auf der SU (2) und für Simulated Annealing auf dem Ikosaeder. Die abschließende
Überrelaxation wurde wieder auf der vollen SU (2) ausgeführt. Gemittelt wurde über ein Ensemble von
83 Konfigurationen mit jeweils 50 Eichkopien auf einem 164 Gitter bei β = 2.4. Als Simulated Annealing
Intervall wurde [0.4, 1.2] gewählt.
Die Wahrscheinlichkeitsverteilung über den ersten 15 gefundenen Funktionalwerten
für Überrelaxation, Simulated Annealing mit mikrokanonischen Schritten (SU (2)) und
Simulated Annealing auf dem Ikosaeder im linken Bild werden den mittleren Rechenzeiten im rechten Bild gegenübergestellt. Die Fahrpläne für das Simulated Annealing senkten die Temperatur im Intervall [0.4, 1.2] ab11 . Auf dem Ikosaeder bestand der Fahrplan
aus 3000 Schritten. Das Simulated Annealing mit mikrokanonischen Schritten senkte die
Temperatur in 1000 Schritten ab. Auf jeden Simulated Annealing Schritt folgten drei
mikrokanonische.
Eine Gegenüberstellung der wichtigsten Kenngrößen (Rechenzeit, Wahrscheinlichkeit
für das Erreichen des Maximums und Performanz) erfolgt in Tabelle 4.3. Zum Vergleich
wurden die Werte aus Abschnitt 4.1.1, Seite 46 für das Simulated Annealing ohne mikrokanonische Schritte mit angegeben, da es den gleichen Fahrplan wie Simulated Annealing
auf dem Ikosaeder nutzte.
11
Da es sich um eine ältere Untersuchung zur qualitativen Wirkung der Ikosaeder Projektion handelt,
sind noch nicht alle Verbesserungen, wie das Absenken der Temperatur bis auf 0.01 in den Fahrplänen
enthalten.
60
Kapitel 4
Methode
Ikosaeder SA
gewöhliches SA
mikrokan. SA
Resultate
tr
pmax
Performanz
2.103 ± 0.006 0.25 ± 0.02 0.14 ± 0.02
3.367 ± 0.003 0.32 ± 0.03 0.11 ± 0.01
2.318 ± 0.003 0.50 ∓ 0.03 0.29 ± 0.03
Tabelle 4.3: Vergleich von Simulated Annealing, Simulated Annealing mit mikrokanonischer Optimierung und Simulated Annealing auf dem Ikosaeder. Die mittleren Rechenzeiten sind in Einheiten der
Rechenzeit für die Überrelaxation angegeben.
Während gewöhnliches Simulated Annealing mit 3000 Schritten ohne mikrokanonische
Schritte etwas mehr als die dreifache Rechenzeit der Überrelaxation benötigt (Abbildung
4.4), reduziert sich diese auf die zweifache Rechenzeit unter Nutzung des I120 (rechtes
Bild). Allerdings wird auch das Maximum mit einer geringeren Wahrscheinlichkeit angenommen, was vermutlich darauf zurückzuführen ist, dass auf der I120 nicht die ursprüngliche Konfiguration optimiert wird, sondern eine projizierte. Von größerer Bedeutung als der
Vergleich mit gewöhnlichem Simulated Annealing ist jedoch der durchgeführte Vergleich
mit dem mikrokanonisch verbesserten Simulated Annealing. Im rechten Bild ist deutlich
zu erkennen, dass dieses Simulated Annealing nur geringfügig mehr Rechenzeit benötigt,
dafür aber das Maximum mit einer wesentlich höheren Wahrscheinlichkeit findet.
Prinzipiell ist es möglich, dass die Rechnungen auf der I120 noch nicht optimal umgesetzt wurden und der Algorithmus deutlich schneller laufen könnte. Aber auch, wenn
von einem Algorithmus ausgegangen wird, der für das reine Simulated Anneling auf der
Untergruppe keine Zeit benötigt, ist mindestens die Rechenzeit für die abschließende Überrelaxation tr = 1 notwendig. Das Maximum wird trotzdem mit der gleichen Wahrscheinlichkeit P [F = Fmax = 0.25 ± 0.02] angenommen und die Performanz des UntergruppenSimulated-Annealings kann also bestenfalls G = 0.29 ± 0.03 werden, was in diesem Beispiel genau der Performanz des Simulated Annealings mit mikrokanonischen Schritten
entspricht. Ein Algorithmus, der keine Rechenzeit beansprucht, ist jedoch nur ein hypothetischer Grenzfall.
Nicht präsentiert, weil ohne sichtbaren Erfolg, ist ein Versuch, mikrokanonische Schritte auch auf der I120 umzusetzen. Es war kein Unterschied zu einem Algorithmus ohne diese
Schritte sichtbar. Auch die Präkonditionierung mittels eines Relaxationsalgorithmus innerhalb der I120 war nicht dazu geeignet, Rechenzeit für die abschließende Überrelaxation
einzusparen und wurde deshalb nicht weiter dargestellt.
4.1.3
Simulated Annealing auf großen Gittern
Abschließend wird auf den deutlichen Vorteil von Simulated Annealing eingegangen, der
bei der Auswertung von Konfigurationen auf einem großen 244 Gitter sichtbar wurde.
4.1 SU (2) Eichfixierung
61
16 4 Überrelaxation
1
24 4 Überrelaxation
0.8
0.8
P [F ∈ bin]
P [F ∈ bin]
0.6
0.6
0.4
0.4
0.2
0.2
0
0
2
4
0
6
−Frel
0
2
4
6
−Frel
−4
x 10
16 4 Sim. Annealing
−4
x 10
24 4 Sim. Annealing
1
0.8
0.8
P [F ∈ bin]
P [F ∈ bin]
0.6
0.6
0.4
0.4
0.2
0.2
0
0
2
4
−Frel
0
6
−4
x 10
0
2
4
−Frel
6
−4
x 10
Abbildung 4.15: Verteilung der relativen Funktionalwerte Frel nach alleiniger Überrelaxation und nach
mikrokanonisch verbessertem Simulated Annealing mit anschließender Überrelaxation für ein 164 und ein
244 Gitter. Die Simulated Annealing Fahrpläne nutzten Gleichverteilungen der Temperaturschritte im
Temperaturintervall [0.4, 1.2]. Bei jeder Temperatur wurde ein Thermalisierungsschritt und 3 mikrokanonische Schritte durchgeführt. Die Gesamtzahl der Simulated Annealing Schritte betrug 1000 auf dem
164 Gitter und 2600 auf dem 244 Gitter. Gemittelt wurde bei β = 2.4 über 39 Konfigurationen mit je
150 Kopien auf dem 164 Gitter und über 7 Konfigurationen mit je 150 Kopien auf dem 244 Gitter. Da
Überrelaxation und Simulated Annealing auf den gleichen Konfigurationen simuliert wurde, bezieht sich
Fmax auf den größten von einem der beiden Algorithmen gefundenen Funktionalwerte.
Zunächst ist in Abbildung 4.15 die Verteilung der relativen Funktionalwerte (Gleichung
4.2) nach kompletter Eichfixierung einmal nach alleiniger Überrelaxation und einmal nach
vorherigem Simulated Annealing mit mikrokanonischen Schritten im Intervall [0.4, 1.2] für
die beiden Gittergrößen 164 und 244 dargestellt. Da die Messungen aus einem früheren
Stadium der Untersuchung stammen, ist die Endtemperatur noch auf 0.4 festgelegt. In
den oberen Bildern ist die Verteilung zu sehen, wie sie nach Eichfixierung mittels Überrelaxation (ω = 1.63) zu erwarten ist. Während auf einem 164 Gitter noch eine stärkere
Häufung der Werte in der Nähe des Maximums erkennbar ist, liegt das Maximum der
Verteilung auf einem 244 bei einem deutlich von Null verschiedenen Wert. In den unteren
Bildern sind die Verteilungen nach Präkonditionierung der Transformationen durch Simulated Annealing zu sehen. Hier liegt der Schwerpunkt der Verteilung klar in der Nähe
des Maximums.
62
Kapitel 4
Resultate
P [−Frel ≤ 2.5 · 10−5 ]
164
244
0.30
0.02
0.89
0.66
Methode
Überrelaxation
mikrokan. SA
Tabelle 4.4: Vergleich der Wahrscheinlichkeit P [Frel ≤ 2.5 · 10−5 ] mit und ohne Präkonditionierung
durch Simulated Annealing auf verschiedenen Gittergrößen.
Die Wahrscheinlichkeiten für Eichfixierungen mit relativen Funktionalwerten im ersten Bin sind in Tabelle 4.4 zusammengetragen. Auffällig ist, dass für Überrelaxation die
Wahrscheinlichkeit für Funktionalwerte in diesem Bin für das größere Gitter stark abnimmt. Dieser Trend war bereits auf kleineren Gittern bemerkbar, ist aber auf einem 244
Gitter mit 2% besonders deutlich.
Die Wahrscheinlichkeitsverteilug der durchnummerierten Funktionalwerte für Überrelaxation und Simulated Annealing auf den beiden Gittern ist in Abbildung 4.16 dargestellt, da man in diesem Bild deutlicher erkennen kann, mit welcher Wahrscheinlichkeit
das größte Maximum gefunden wird.
16 4 Überrelaxation
0.5
24 4 Überrelaxation
0.12
0.1
P [F = Fi ]
P [F = Fi ]
0.4
0.3
0.2
0.1
0
0.08
0.06
0.04
0.02
0
10
20
30
40
0
50
0
50
100
i
i
16 4 Sim. Annealing
24 4 Sim. Annealing
150
0.5
0.12
0.1
P [F = Fi ]
P [F = Fi ]
0.4
0.3
0.2
0.1
0
0.08
0.06
0.04
0.02
0
10
20
30
i
40
50
0
0
50
100
150
i
Abbildung 4.16: Wahrscheinlichkeitsverteilung der durchnummerierten Funktionalwerte für reines
Überrelaxieren und für Simulated Annealing auf verschiedenen Gittern. Die Parameter für Simulated
Annealing Fahrpläne und statistische Angaben können Abbildung 4.15 entnommen werden.
Hier tritt die ungenügende Eichfixierung durch Überrelaxation besonders dadurch hervor, dass der im Rahmen der Untersuchungen maximale gefundene Funktionalwert nicht
mehr angenommen wurde, Simulated Annealing ihn aber immerhin noch mit 12% Wahrscheinlichkeit gefunden hat.
4.1 SU (2) Eichfixierung
63
Auch aus Untersuchungen kleinerer Gitter deutet sich der Trend an, dass das Auffinden einer Eichtransformation mit maximalem Funktionalwert bei zunehmender Gittergröße immer unwahrscheinlicher wird und Simulated Annealing bei der Eichfixierung
an Bedeutung gewinnt, wenn auch bei großen Gittern das Maximum des Eichfunktionals
gefunden werden soll.
4.1.4
Zusammenfassung
Die Untersuchungen in der SU (2)-Gittereichtheorie haben gezeigt, dass sich Simulated
Annealing deutlich verbessern lässt, wenn neben den gewöhnlichen Heatbath Aktualisierungen auch mikrokanonische Schritte eingebaut werden. Die Bedeutung eines so verbesserten Algorithmusses beim Auffinden des Maximums des Eichfunktionals wächst mit
der Gittergröße. Eine Optimierung der Performanz mikrokanonisch erweiterter Simulated
Annealing Fahrpläne lässt sich mittels Variation der Schrittzahl und der Schrittverteilung
erreichen. Zumindest der Parameter der Schrittzahl muss für jedes Gitter einzeln angepasst werden. Die Ergebnisse dieser Untersuchung sind in die Optimierung des Simulated
Annealings für die SU (3) Eichtheorie des nächsten Abschnittes eingeflossen.
64
4.2
Kapitel 4
Resultate
SU(3) Eichfixierung
Zur Fixierung der Landau-Eichung in der SU (3)-Eichtheorie werden nun Überrelaxation, fourierbeschleunigte Eichfixierung und Simulated Annealing verglichen. Zunächst
wird für die Überrelaxation die Abhängigkeit der mittleren Rechenzeit vom Parameter
ω qualitativ beschrieben. Danach wird die Konvergenz der fourierbeschleunigten Eichfixierung in Abhängigkeit vom Parameter α untersucht. In einem weiteren Schritt wird
das Skalierungsverhalten der Zahl von Iterationsschritten bis zur Konvergenz für diese beiden Methoden verglichen. Im letzten und größten Teil dieses Abschnittes werden
Optimierungsansätze für den Simulated Annealing Algorithmus dargestellt. Anhand der
Ergebnisse wird versucht, einen optimalen Fahrplan des Simulated Annealing Algorithmus auch für so große Gitter zu erstellen, auf denen es zu aufwändig wäre, mittels einer
großen Statistik die gewünschte Optimierung durchzuführen.
4.2.1
Überrelaxation
Die Überrelaxation ist ein modifizierter Relaxationsalgorithmus. Der lokale Iterationsschritt der Relaxationen g(x) → r(x)g(x) wird im Überrelaxationsalgorithmus zu einem
Iterationssschritt der Form g(x) → rω (x)g(x) abgewandelt. Diese Modifikation führt zu
einer beschleunigten Konvergenz. Die Geschwindigkeit der Konvergenz ist dabei abhängig
von der Wahl des Parameters ω (Abschnitt 3.3.2, S. 29).
Überrelaxationsparameter
2400
2200
Itera tio nen
2000
1800
1600
1400
1200
1000
1.5
1.55
1.6
1.65
ω
1.7
1.75
1.8
Abbildung 4.17: Abhängigkeit der mittleren Zahl von Iterationsschritten bis zur Konvergenz in
Abhängigkeit vom Überrelaxationsparameter ω. Gemittelt wurde auf einem 164 Gitter bei β = 6.0 über
29 Konfigurationen
mit jeweils
5 Eichkopien. Eine Konfiguration wurde als eichfixiert angesehen, sobald
£
¤
−13
max tr ∂µ Agµ (x)∂µ Ag†
galt.
µ (x) < 10
x
In Abbildung 4.17 ist die Zahl der Iterationsschritte bis zur Konvergenz über ω aufgetragen. Deutlich zu erkennen ist eine Reduktion der für die Konvergenz nötigen Schritte
bei größer werdendem ω. Auch wenn die Abbildung den Anschein erweckt, setzt sich dieser Trend nicht uneingeschränkt fort. Hierzu ist anzumerken, dass der Aufwand für die
4.2 SU(3) Eichfixierung
65
Überrelaxation durch die Anzahl der maximal durchführbaren Schritte beschränkt wurde.
Gitterabhängig lag diese Zahl zwischen 15000 und 30000 Schritten. Ist der Algorithmus
nicht innerhalb dieser Schrittzahl konvergiert, so wurde er als nicht konvergent betrachtet.
Für den ebenfalls untersuchten Parameter ω = 1.8 wurde in diesem Sinne für einige Konfigurationen keine Konvergenz mehr erreicht. Bei Tests auf einem 244 -Gitter zeigte sich
außerdem, dass der Überrelaxationsalgorithmus auch für ω = 1.75 nicht mehr in jedem
Fall konvergierte.
4.2.2
Fourierbeschleunigte Eichfixierung
Als weitere Methode, die zur Fixierung der Landau-Eichung benutzt wird, soll nun auf
die fourierbeschleunigte Eichfixierung eingegangen werden. Sie ist eine Modifikation des
Gradientenverfahrens. Die Konvergenzgeschwindigkeit der fourierbeschleunigten Eichfixierung hängt dabei vom Parameter α ab (Abschitt 3.3.4, Seite 30). Die fourierbeschleunigte Eichfixierung gewinnt insbesondere bei Simulationen auf großen Gittern an Bedeutung, da hier der Aufwand für die Iteration des Algorithmusses mit der Gittergröße besser
skaliert, also langsamer wächst, als bei Überrelaxation [D+ 88, CM03].
Optimierung des Fourierparameters
Fourierparameter α
1400
1300
1200
Itera tio nen
1100
1000
900
800
700
600
500
0.2
0.3
0.4
α
0.5
0.6
0.7
Abbildung 4.18: Abhängigkeit der mittleren Zahl von Iterationsschritten bis zur Konvergenz vom Fourierparameter α. Gemittelt wurde auf einem 124 Gitter bei β = 6.0 über 5 Konfigurationen
mit jeweils¤ 50
£
Eichkopien. Eine Konfiguration wurde als eichfixiert angesehen, sobald galt max tr ∂µ Agµ (x)∂µ Ag†
µ (x) <
x
10−13 .
Die Zahl der Iterationsschritte bis zum Erreichen des Konvergenzkriteriums und ihre
Abhängigkeit vom Parameter α ist in Abbildung 4.18 für die fourierbeschleunigte Eichfixierung grafisch dargestellt. Es ist zu erkennen, dass mit wachsendem α die mittlere Zahl
der für die Konvergenz notwendigen Schritte abnimmt. Allerdings bestand auch hier, wie
bei der Überrelaxation das Problem, dass bei α = 0.7 auf einigen Konfigurationen das
66
Kapitel 4
Resultate
Konvergenzkriterium nicht mehr in jedem Fall erreicht werden konnte, da die Zahl der
maximal durchführbaren Iterationen durch 30000 Schritte nach oben beschränkt wurde.
Für die im weiteren untersuchte Skalierung der Zahl der Iterationsschritte mit größer
werdendem Gittervolumen wurde α ≈ 0.6 gewählt. Die mittlere Zahl von Iterationen unterscheidet sich nur unwesentlich von der für α = 0.65. Dafür liegt der Wert jedoch weiter
vom kritischen Wert α = 0.7 entfernt, bei dem die Konvergenz nicht mehr gewährleistet
werden konnte.
In Abbildung 4.19 ist zur Vervollständigung des Bildes über die fourierbeschleunigte
Eichfixierung die normierte Häufigkeitsverteilung der 50 Kopien über den größten 14
durchnummerierten Funktionalwerten dargestellt.
Verteilung der Funktionalwerte
0.35
ω = 1.63 (RLX)
α = 0.3
α = 0.4
α = 0.5
α = 0.6
α = 0.65
0.3
i
P[F=F ]
0.25
0.2
0.15
0.1
0.05
0
2
4
6
8
10
12
14
i
Abbildung 4.19: Häufigkeitsverteilung über den durchnummerierten Funktionalwerten nach fourierbeschleunigter Eichfixierung mit verschiedenen Werten des Parameters α und nach Überrelaxation mit
ω = 1.63. Gemittelt wurde auf einem 124 Gitter bei β = 6.0 über 5 Konfigurationen mit jeweils 50
Eichkopien.
Da 5 betrachtete Konfigurationen eine recht kleine Statistik sind, ist das Ergebnis
dieser Darstellung nur als Bestätigung dafür anzusehen, dass Überrelaxation und fourierbeschleunigte Eichfixierung zu ähnlichen Verteilungen der Funktionalwerte nach der
Eichfixierung führen.
Neben der Optimierung des Fourierparameters spielt auch das Verhalten der Rechenzeit für größer werdende Gitter eine entscheidende Rolle bei der Wahl der Eichfixierung.
4.2.3
Skalierung der Iterationszahl für Überrelaxation und fourierbeschleunigte Eichfixierung
Die Art und Weise, wie die Zahl der notwendigen Iterationsschritte mit der Gittergröße
V = Ld skaliert12 , soll im Folgenden für Überrelaxation und die fourierbeschleunigte
12
L ist die Gitterlänge. d ist die Zahl der Dimensionen des Gitters
4.2 SU(3) Eichfixierung
67
Eichfixierung verglichen werden. Beide Algorithmen starteten jeweils mit Eichtransformationen, die bei T = ∞ erzeugt wurden.
mittlere Zahl von Aktualisierungen
Rechenzeitskalierung
FBE, α = 0.6
RLX, ω = 1.63
FBE, α = 0.63
RLX, ω = 1.68
3
10
8
12
16
24
32
Gitterlänge
Abbildung 4.20: Mittlere Zahl von Iterationsschritten bis zur Erfüllung des Konvergenzkriteriums,
£
¤
−13
max tr ∂µ Agµ (x)∂µ Ag†
, für fourierbeschleunigte Eichfixierung (FBE) und Überrelaxation
µ (x) < 10
x
(RLX) in Abhängigkeit von der Gitterlänge eines symmetrischen Gitters bei β = 6.0 in einer doppelt
logarithmischen Darstellung.
Das Skalierungsverhalten der Zahl der Iterationsschritte bis zur Konvergenz ist für
Überrelaxation mit ω = 1.63 und für fourierbeschleunigte Eichfixierung mit α = 0.6
in Abbildung 4.20 dargestellt. Das Verhalten wurde für Gitter bis zu einer Größe von
244 durch einen Potenzgesetz der Form Iterationszahl ∝ Lc approximiert, wobei c der
Skalierungsexponent ist. Die Zahl der Schritte bis zur Konvergenz Nkonv ist für die Überrelaxation demnach proportional zu L2.19±0.01 . Für die fourierbeschleunigte Eichfixierung
ergibt sich eine Propotionalität von Nkonv (L) ∝ L1.53±0.01 .
Methode
FBE (α = 0.6)
RLX (ω = 1.63)
c
1.53 ± 0.01
2.19 ± 0.01
Tabelle 4.5: Skalierungsexponent der Iterationszahl für fourierbeschleunigte Eichfixierung (FBE) und
Überrelaxation (RLX)
Der Aufwand für einen Iterationsschritt wächst für die Überrelaxation mit dem
Gittervolumen V , so dass die Gesamtrechenzeit proportional zu V · L2.19±0.01 = V 1.54±0.01
wächst. In den Iterationsschritt der fourierbeschleunigten Eichfixierung geht ein Anteil
ein, der mit V log V wächst [D+ 88] und ein Anteil, der proportional zu V ist. Die für
große Gitter dominierende Proportionalität ist V log V , so dass die Gesamtrechenzeit
für große Gitter proportional zu log V V 1.38 zunimmt. Der logarithmische Anteil kann im
Grenzwert großer Gitter vernachlässigt werden, so dass geschlussfolgert werden kann,
dass für die fourierbeschleunigte Eichfixierung der Aufwand mit größer werdendem Gitter
68
Kapitel 4
Resultate
schwächer wächst, als für die Überrelaxation.
Ist man nur an einer Fixierung der Landaueichung interessiert, die die Gribovmehrdeutigkeit nicht berücksichtigt, so ist das Ergebnis dieses Abschnittes, dass bei
zunehmender Gittergröße die fourierbeschleunigte Eichfixierung gegenüber der Überrelaxation zu bevorzugen ist, da sie die Eichung für große Gitter schneller fixieren kann.
Die Hoffnung für zukünftige Untersuchungen ist, dass sich nach dem Simulated Annealing die Überrelaxation durch die fourierbeschleunigte Eichfixierung als abschließende
Eichfixierung ersetzen lässt. Dazu muss jedoch untersucht werden, inwieweit die beiden
Algorithmen auch nach dem Simulated Annealing zu gleichen Häufigkeitsverteilungen
führen.
Für die folgenden Untersuchungen des Simulated Annealings wurde die abschließende
Eichung mit Hilfe der Überrelaxation und ω = 1.63 durchgeführt13 .
4.2.4
Simulated Annealing
Es wird nun der Simulated Annealing Algorithmus für die SU (3)-Eichfixierung auf seine
Abhängigkeit von den Parametern Tmin , Tmax , µ und der Gesamtschrittzahl N hin untersucht. Dies geschieht in analoger Weise zum Vorgehen bei der SU (2)-Eichtheorie in
Abschnitt 4.1. Zunächst wird die Temperaturabhängigkeit der Mobilität betrachtet um
daraus die Starttemperatur Tmax für das Simulated Annealing abzuleiten. Im zweiten
Teilabschnitt werden drei qualitativ verschiedene Schrittverteilungen auf dem Simulated
Annealing Temperaturintervall betrachtet, um die Wahl des Verteilungsparameters µ zu
begründen. Abschließend wird für den so gefundenen Parameter die Gesamtschrittzahl
für verschiedene Gittergrößen optimiert und eine Voraussage für das vermutete Verhalten
auf noch größeren Gittern getroffen.
Die wichtigste Erkenntnis aus SU (2)-Simulationen, die auch in die folgenden Simulated Annealing Algorithmen eingeflossen ist, war, dass die Verwendung von mikrokanonischen Schritten zwischen den Simulated Annealing Schritten die Perfomanz des Simulated
Annealings vergrößerte. Diese Verbesserung konnte in einfachen Tests auch für die SU (3)Gittereichtheorie bestätigt werden und führte zur Verwendung von 3 mikrokanonischen
Schritten nach jedem Simulated Annealing Schritt.
Bestimmung der Starttemperatur Tmax
Die Festlegung der Starttemperatur Tmax erfolgt wie in der SU (2)-Eichtheorie durch die
Bestimmung des Übergangs, bei der die Mobilität ihr Verhalten wechselt. Oberhalb dieser Temperatur hat man es mit einer großen, nahezu temperaturunabhängigen Mobilität
zu tun, während die Mobilität unterhalb dieser Temperatur stark von der Temperatur
abhängt und mit T → 0 ebenfalls gegen null konvergiert. Abbildung 4.21 zeigt die Mobilität und den mittleren Wert des Eichfunktionals in Abhängigkeit von der Eichtemperatur.
Beide Größen hängen nur von der Eichtemperatur und der Kopplung ab. Die Gittergröße
13
Es wurde kein größerer Wert gewählt, da zu Beginn der Untersuchung die Ergebnisse des letzten
Abschnittes noch nicht zur Verfügung standen.
4.2 SU(3) Eichfixierung
69
hat nur einen geringen Einfluß auf den Verlauf der Kurven, weshalb für die Funktionen
ein 84 -Gitter nicht dargestellt ist.
Mobilitat
Funktional
0.9
0.8
0.8
0.7
®
0.9
0.7
g oldg new )
1
0.6
β = 5.80
β = 6.00
β = 6.20
0.6
hF i
0.5
1
3 tr(1 −
0.5
0.4

0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0
0
0.1
T
0.2
0.3
0.4
0.5
0.6
T
Abbildung 4.21: Mobilität und Eichfunktional auf einem 164 -Gitter in Abhängigkeit von der Eichtemperatur für verschiedene Werte von β, gemittelt über 50 Konfigurationen mit jeweils 20 Kopien. Die Varianz
ist für alle Messpunkte kleiner als 0.02. Die Kurven für 84 -Gitter unterscheiden sich nicht wesentlich von
den dargestellten Kurvenverläufen und sind, um die Übersichtlichkeit zu wahren, nicht dargestellt.
Bei Absenken der Temperatur findet der Übergang von einem Bereich mit großer
Mobilität, die sich bei hoher Eichtemperatur zunächst kaum änderte, zu einem Bereich
mit stark fallender Mobiliät ab Tmax ≈ 0.45 statt. Dieser Übergang wird als Startpunkt
des Simulated Annealings gewählt. Die Wahl der Endtemperatur von Tmin = 0.01 wird
durch die Beobachtung auf der SU (2) motiviert, wo kleine Endtemperaturen einen Vorteil hinsichtlich der Performanz brachten. Insgesamt ergibt sich für Simulated Annealing
Algorithmen, die bei β = 6.0 erzeugte SU (3)-Konfigurationen fixieren sollen, folgendes
Temperaturintervall:
β
[Tmin , Tmax ]
6.0 [≤ 0.01, 0.45]
Eine Besonderheit, die für den analogen Fall der Eichgruppe SU (2) nicht zu beobachten war, ist der sehr starke Abfall der Mobilität bei T ≈ 0.415 über einen relativ kleinen
Temperaturbereich14 von T = 0.425 bis T = 0.405. Im gleichen Temperaturbereich ist bei
sinkender Temperatur auch im rechten Bild ein rascher Anstieg des Funktionalwertes zu
beobachten. Für den Simulated Annealing Algorithmus in der SU (3)-Eichtheorie bedeutet
dies, dass beim Abkühlen in diesem Temperaturbereich sehr schnell kleinere Mobilitäten
erreicht werden. Entsprechend sollte der Aufwand, eine Quasigleichgewichtsverteilung zu
erzeugen, beim Absenken der Temperatur über diesen Bereich relativ schlagartig wachsen.
Inwieweit dieser zusätzliche Aufwand (Rechenzeit), den Simulated Annealing bei kleinen
Temperaturen benötigt, durch die damit erzielten Resultate rechtfertigen lässt, wird auch
Gegenstand des folgenden Abschnittes sein.
14
Die Größe des Temperaturintervalls orientierte sich am Differenzenquotienten der Mobilität.
70
Kapitel 4
Resultate
Bestimmung einer optimierten Schrittverteilung
Es wurden drei Schrittverteilungen für Simulated Annealing Fahrpläne untersucht.
Fa hrplä ne verschiedener Verteilung en
0.45
0.4
0.35
T(i)
0.3
0.25
µ = 0.3
µ = −1
µ = −5
0.2
0.15
0.1
0.05
0
0
200
400
600
800
1000
i - Simula ted A nnea ling Schritt
Abbildung 4.22: Temperaturfahrpläne im Intervall [0.01, 0.45] für µ ∈ {−5, −1, 0.3}. Für Fahrpläne mit
einer anderen Gesamtschrittzahl wird nur die Abzisse entsprechend skaliert.
Wie in Abbildung 4.22 dargestellt, sind dies wieder ein Simulated Annealing Fahrplan
mit einem abgebremsten Kühlvorgang (µ = 0.3), einer mit konstantem Abkühlen (µ =
−1) und ein Fahrplan, bei dem das Abkühlen zum Ende hin beschleunigt wird (µ = −5).
Für jede Schrittverteilung wurde zunächst auf einem 164 -Gitter bei β = 6.0 die in Bezug
auf die Performanz optimale Gesamtschrittzahl ermittelt.
Die Ergebnisse sind in Abbildung 4.23 dargestellt. Im linken Bild ist für jeden Simulated Annealing Fahrplan die Wahrscheinlichkeit, mit dem zugehörigen Algorithmus
das Maximum zu finden, über der mittleren Gesamtrechenzeit aufgetragen. Im rechten
Bild ist die daraus berechnete Performanz über der Schrittzahl des Fahrplans aufgetragen. Da für jede Schrittzahl (150, 350, 800, 1500 und 2500 Schritte) alle drei Verteilungen
getestet wurden, erscheinen in beiden Bildern Dreiergruppen von Fahrplänen mit gleicher Schrittzahl und daher nahezu gleicher Rechenzeit. Da im linken Bild die Schrittzahl
nicht direkt ablesbar ist, muss sie aus der Gesamtrechenzeit geschlossen werden. Die drei
Fahrpläne mit der kleinsten Gesamtschrittzahl 150 benötigen die kleinste mittlere Gesamtrechenzeit, die mit der größten Gesamtschrittzahl 2500 benötigen entsprechend die
meiste Rechenzeit. Im linken Bild lässt sich erkennen, dass mit zunehmender Schrittzahl
auch die Wahrscheinlichkeit wächst, das Maximum zu finden. Dieses Verhalten hängt
dabei nicht von der Wahl der Verteilung der Schritte auf dem Temperaturintervall ab.
Vergleicht man nun die verwendeten Verteilungen miteinander. so wird mit Fahrplänen,
die den Verteilungsparameter µ = −5 nutzen, die größte Wahrscheinlichkeit für das Auffinden des Maximums erzielt. Dieser Zusammenhang ist wiederum unabhängig von den
untersuchten Gesamtschrittzahlen.
Im Vergleich zur Überrelaxation zeigen die verwendeten Simulated Annealing Fahrpläne auf einem 164 -Gitter keine oder kaum Vorteile. So kann zwar mit den meisten Fahrplänen eine größere Wahrscheinlichkeit erzielt werden, das Maximum zu finden, als es mit
einem reinen Überrelaxationsalgorithmus möglich wäre. Allerdings wird hierfür soviel Zeit
4.2 SU(3) Eichfixierung
71
Vergleich der Performanzen
Vergleich der Rechenzeiten
0.8
0.3
µ = −5
0.7
µ = −1
0.25
µ = 0.3
0.6
Perfo rm a nz
P [F = F max ]
RLX
0.5
0.4
0.2
0.15
0.3
0.1
0.2
0.05
0.1
1
2
3
4
5
6
Zeit in Einheiten der Ü berrela xa tio nsrechenzeit
150
350
800
1500 2500
Schrittza hl
Abbildung 4.23: Vergleich von Rechenzeit, Wahrscheinlichkeit das Maximum zu finden und Performanz
für Simulated Annealing Fahrpläne in Abhängigkeit von der Verteilung der Temperaturschritte (µ =
−5, −1, 0.3) und der Zahl der Simulated Annealing Schritte. Simuliert wurde auf einem 164 -Gitter bei
β = 6.0 über 16 Konfigurationen mit je 50 Kopien. Der Wert des Schrittverteilungsparameters µ lässt
sich anhand des Symbols erkennen. Die Gesamtschrittzahlen N = 150, 350, 800, 1500, 2500 wurden im
rechten Bild mit einer kleinen Variation dargestellt, um eine gegenseitige Überlagerung der Fehlerbalken
zu vermeiden. Im linken Bild lässt sich die Schrittzahl aus der Rechenzeit ableiten. Fahrpläne mit gleicher
Schrittzahl sind durch die gleiche Farbe gekennzeichnet um eine optische Unterscheidung der Gruppen
zu ermöglichen. Als Referenzkurve wurde die Mehrfachanwendung der Überrelaxation (RLX) und, hell
unterlegt, ihr Fehlerintervall mit eingetragen.
benötigt, dass für µ = −1 und µ = 0.3 in der gleichen Zeit durch mehrfache Anwendung
der Überrelaxation ein besseres Ergebnis erzielt werden kann (durchgezogene Vergleichskurve im linken Bild). Einzig durch die Verwendung des Fahrplans mit vielen Schritten
bei hohen Temperaturen (µ = −5) scheint der Simulated Annealing Algorithmus einen
Vorteil gegenüber der Mehrfachanwendung der Überrelaxation zu bringen.
Diese Beobachtung lässt sich deutlicher im rechten Bild erkennen, wo für die einzelnen
Fahrpläne die Performanz über der Schrittzahl aufgetragen ist. Die Überrelaxation erzielt
zum Vergleich eine Performanz von G = 0.15 ± 0.04. Mit keinem der untersuchten Fahrpläne lässt sich auf einem 164 -Gitter eine deutliche Verbesserung gegenüber diesem Wert
erzielen. Allerdings kann mit einem Fahrplan, der 800 Schritte verwendet und die meisten
davon bei hohen Temperaturen ansiedelt, zumindest eine geringfügig größere Performanz
erzielt werden.
Zusammenfassend lässt sich aus dieser Untersuchung schließen, dass zumindest auf
einem 164 -Gitter Simulated Annealing Algorithmen von Vorteil sind, die den Großteil der
Schritte bei hohen Temperaturen machen. Eine Erklärung ist vielleicht im Verhalten der
Mobilität zu finden. Wie bereits beobachtet, fällt sie beim Absenken der Temperatur bereits im oberen Bereich des Temperaturintervalls [0.01, 0.45] bei T ≈ 0.415±0.01 stark ab.
Die Interpretation der Mobilität als Maß für die Autokorrelation lässt folgende Erklärung
zu. Oberhalb von T ≈ 0.41 ist die Konvergenz zu einer quasithermalisierten Wahrscheinlichkeitsverteilung der Eichtransformation “schnell” möglich. Wird die Temperatur zu
weit unter diese Schwelle abgesenkt, verläuft die Konvergenz zu einer quasithermalisierten Verteilung auf Grund der großen Autokorrelation deutlich “langsamer”. Oder anders
72
Kapitel 4
Resultate
ausgedrückt, es kann mit zu wenigen Schritten Quasithermalisiertheit bei diesen Temperaturen nicht mehr erreicht werden. Dieses Verhalten könnte begründen, warum ein
Fahrplan für das Simulated Annealing von Vorteil ist, der die überwiegende Zahl der
Schritte im oberen Temperaturbereich15 (T > 0.4) vorsieht (Tabelle 4.6).
µ
−5
−1
0.3
|T −1 ([0.4,0.45])|
|T −1 ([0.01,0.45])|
0.445
0.114
0.017
Tabelle 4.6: Relativer Anteil der Schritte im Fahrplan T , die Aktualisierungen bei T ≥ 0.4 durchführen.
Für µ = −5 liegen 44.5 Prozent der Schritte oberhalb dieser Temperatur, während es
für eine gleichmäßige Schrittverteilung nur noch 11.4 Prozent sind. Wird die Temperatur
zu schnell heruntergesetzt, kommt dies einem Festlegen auf eine schlecht thermalisierte
Verteilung gleich, da mit der fest vorgegebenen Schrittzahl keine Quasithermalisierung
mehr erreicht werden kann. Denn diese Festlegung geschieht auf eine Verteilung, die noch
zu dicht an einer bei T = ∞ erzeugten Verteilung des Ensembles liegt.
In Folge dieser Überlegung stellt sich die Frage, inwieweit auch in SU (3)-Simulationen
ein Absenken der Endtemperatur Tmin bei konstant gehaltener Gesamtschrittzahl16 zu
einer besseren Performanz führt. In einer SU (2)-Gittereichtheorie konnte dies beobachtet
werden (Abschnitt 4.1.1, Seite 52). Nun soll dies auch für die SU (3)-Gittereichtheorie
untersucht werden.
Variation der Endtemperatur
Zur Bestimmung der Abhängigkeit von der Endtemperatur wurden auf einem 124 -Gitter,
bei β = 6.0, Fahrpläne mit konstanter Schrittweite (µ = −1) betrachtet. Dabei wurden zum einen Fahrpläne miteinander verglichen, die die Temperatur in 200 Schritten
(Abbildung 4.24) absenkten und solche, die 400 Schritte (Abildung 4.25) dafür benötigt.
15
Die Inverse Abbildung T −1 wird hier als Mengenabbildung verstanden und |T −1 (M )| als Mächtigkeit
des Urbildes. Die obige Formel ergibt insofern nur Sinn, falls der Definitionsbereich von T von endlicher
Mächtigkeit ist.
16
Die konstant gehaltene Gesamtschrittzahl sichert, wie schon bei SU (2)-Eichfixierungen, dass die
Fahrpläne gleiche Rechenzeiten benötigen und so direkt vergleichbar werden.
4.2 SU(3) Eichfixierung
Performanz vs. T
73
Performanz vs. T
min
0.6
0.65
0.55
0.6
0.55
Perfo rm a nz
Perfo rm a nz
0.5
0.45
0.4
0.35
0.5
0.45
0.4
0.35
0.3
0.25
−0.1
min
0.3
0
0.1
0.2
0.3
0.4
0.5
T min
Abbildung 4.24: Performanz in Abhängigkeit
von der Endtemperatur Tmin für verschiedene
Endtemperaturen bei konstant gehaltener Gesamtschrittzahl N = 200. Jeder Simulated Annealing Schritt wurde um 3 mikrokanonische
Schritte ergänzt. Gemittelt wurde über 50 Konfigurationen mit je 19 Kopien auf einem 124 Gitter bei β = 6.0
0.25
−0.1
0
0.1
0.2
0.3
0.4
0.5
T min
Abbildung 4.25: Performanz in Abhängigkeit
von der Endtemperatur Tmin für verschiedene
Endtemperaturen bei konstant gehaltener Gesamtschrittzahl N = 400. Jeder Simulated Annealing Schritt wurde um 3 mikrokanonische
Schritte ergänzt. Gemittelt wurde über 50 Konfigurationen mit je 19 Kopien auf einem 124 Gitter bei β = 6.0
.
Wie sich zeigt, hängt die optimale Endtemperatur Tmin für solche Fahrpläne von der
Gesamtschrittzahl ab. Bei vorgegebener Gesamtschrittzahl von 200 Simulated Annealing
Schritten scheint es zur Optimierung der Performanz am besten zu sein, Simulated Annealing bei einer recht hohen Temperatur im Bereich von T = 0.26 abzubrechen und mit der
Überrelaxation zu beginnen. Wird die größere Gesamtschrittzahl 400 vorgegeben, so wird
die größte Performanz erzielt, wenn der Simulated Annealing Algorithmus die Temperaur
bis in den Bereich von T = 0.13 absenkt.
Bei vorgegebener Gesamtschrittzahl findet man das Maximum demnach nicht dann
am besten, wenn die Eichtemperatur bis auf T = 0 herabgesetzt wird, sondern wenn
man alle Schritte bei höheren Temperaturen macht und dann zur weniger aufwendigen
Überrelaxation übergeht. Dieses Resultat deckt sich recht gut mit dem Ergebnis auf dem
164 -Gitter. wo solche Fahrpläne am besten abschnitten, die nur wenige Aktualisierungen
bei kleinen Temperaturen durchführen. Weiterhin lässt sich diese Beobachtung recht gut
erklären, wenn angenommen wird, das mit wenigen Schritten eine Quasithermalisiertheit eher bei großen Temperaturen erreicht werden kann. Iterationsschritte bei geringeren
Temperaturen ändern in diesem Falle die Wahrscheinlichkeitsverteilung im Ensemble der
Eichkopien nicht mehr stark genug und die bereits erfolgte Präkonditionierung lässt sich
durch einen Überrelaxationsalgorithmus mit geringerem Aufwand zu Ende führen.
Als Hauptresultat dieses Abschnittes kann betrachtet werden, dass ein Fahrplan mit
hinreichend großer Zahl von Simulated Annealing Schritten bei großen Temperaturen
die größere Performanz erzielt. Weitere Untersuchungen wurden daher mit Fahrplänen
durchgeführt, die den Verteilungsparameter µ = −5 nutzen.
74
Kapitel 4
Resultate
Simulated Annealing auf großen Gittern
Bei der Anwendung von Simulated Annealing auf großen Gittern lassen sich die statistischen Voruntersuchungen der vergangenen Abschnitte nicht mehr ohne weiteres
durchführen. Da der Rechenaufwand mit dem Gittervolumen wächst, wird es notwendig, aus den Untersuchungen auf kleinen Gittern Schlussfolgerungen ziehen zu können,
die die Abhängigkeit zu optimierender Parameter von der Gittergröße auch für große
Gitter vorhersagen.
Um die Zahl der veränderlichen Parameter klein zu halten, soll für einen Fahrplan
mit Schrittverteilung µ = −5 und Temperaturintervall [0.01, 0.45] nur die Gesamtschrittzahl für größer werdende Gitter optimiert werden. Aus der Abhängigkeit der optimalen
Schrittzahl von der Gittergröße wird dann versucht, einen allgemeinen Zusammenhang
abzuleiten.
Zur Bestimmung der optimalen Schrittzahl wurden auf jedem Gitter Fahrpläne mit
variabler Schrittzahl getestet. Für ein 124 -Gitter sind die Ergebnisse dieser Simulation in
Abbildung 4.26 dargestellt.
0.5
0.75
0.7
0.45
Perfo rm a nz
P [F = F max ]
0.65
0.6
0.55
0.5
0.4
0.35
1
2
3
4
0.35
0.3
100 Schritte
300 Schritte
600 Schritte
1200 Schritte
0.45
0.4
0.25
5
Zeit in Einheiten der Ü berrela xa tio nsrechenzeit
0.2
0
500
1000
1500
Schrittza hl
Abbildung 4.26: Wahrscheinlichkeit, das Maximum zu finden, über der Rechenzeit und die Performanz
von Fahrplänen mit fixem Verteilungsparameter µ = −5 und variabler Schrittzahl auf einem 124 -Gitter.
Gemittelt wurde über 53 Konfigurationen mit je 50 Kopien.
Im linken Bild ist die Wahrscheinlichkeit, das Maximum zu finden, gegen die Gesamtrechenzeit t der Fahrpläne aufgetragen. Die Punkte sind durch einen approximierten
Kurvenverlauf der Form p(t) = c1 + c2 ec3 t miteinander verbunden, wobei die ci anzupassende Parameter sind. Im rechten Bild ist die Performanz als Funktion der Schrittzahl
aufgetragen. Die einzelnen Punkte sind mit Hilfe der approximierten Kurve p(t) ebenfalls
verbunden. Bevor G(t) = ln(1−p(t))
berechnet werden konnte, ist noch die Abhängigkeit
t
der Rechenzeit von der Gesamtschrittzahl N durch eine stückweise lineare Funktion t(N )
abgeschätzt worden17 . Das Maximum dieser approximierten Performanz G(N ) entspricht
der optimalen Schrittzahl und durch Variation der ci lässt sich ihr Fehler bestimmen.
17
Stückweise linear bedeutet, dass t(N ) für N ∈ {100, 300, 600, 1200} gerade den gemessenen Rechenzeiten entspricht und die Rechenzeiten für andere Werte von N linear approximiert wurden.
4.2 SU(3) Eichfixierung
75
Die so bestimmten optimalen Gesamtschrittzahlen und die Zahl der für eine statistischen Untersuchung zur Verfügung stehenden Konfigurationen ist in Tabelle 4.7 zusammengetragen. Dabei wurde nur über Konfigurationen gemittelt, auf denen mehr als ein
Wert für das Eichfunktional vorgefunden wurde.
L
8
12
16
Nopt
+5
70−21
+29
225−78
+200
1500−800
Statistik
37
53
9
Tabelle 4.7: Optimale Schrittzahl Nopt für Simulated Annealing Fahrpläne mit Verteilungsparameter
µ = −5 und Temperaturintervall [0.01, 0.45] auf symmetrischen Gittern mit Gitterkantenlänge L
Die optimalen Gesamtschrittzahlen als Funktion der Gittergröße sind in Abbildung
4.27 aufgetragen.
4
10
3
N opt
10
2
10
1
10
8
12
16
K a ntenlä ng e
Abbildung 4.27: Optimale Schrittzahl Nopt von Fahrplänen mit Verteilungsparameter µ = −5 für
verschiedene Gittergrößen. Die approximierte Gerade ist durch Nopt (L) = e(0.37±0.03)L+1.05±0.3 parametrisiert.
Zumindest im Rahmen der drei untersuchten Gittergrößen scheint die optimale Zahl
von Simulated Annealing Schritten exponentiell mit der Gitterkantenlänge zu wachsen, Nopt (L) = e(0.37±0.03)L+1.05±0.3 . Um dieses Verhalten zu bestätigen, wäre eine recht
aufwändige Untersuchung auf einem 244 -Gitter hilfreich. Bis hinreichend viele Untersuchungen mit dieser Gittergröße durchgeführt wurden, ist es wichtig, die Statistik für
164 -Gitter zu erhöhen und die Annahme eines exponentiellen Wachstums der optimalen
Schrittzahl zu prüfen. Sollte sich der Trend bestätigen, liegt die optimale Schrittzahl auf
einem 244 -Gitter bereits im Bereich von Nopt ≈ 2 · 104 .
Im Rahmen der Untersuchung konnten bereits auf vier Konfigurationen eines 244 Gitter eine Reihe von Simulated Annealing Algorithmen getestet werden. Da zu Beginn
76
Kapitel 4
Resultate
der Untersuchung für die Volumenabhängigkeit der optimalen Schrittzahl ein Potenzgesetz
angenommen wurde18 , sind nur Fahrpläne mit vermutlich zu kleinen Schrittzahlen (N ≤
3500) betrachtet worden. Auf jeder Konfiguration wurden 50 zufällige Kopien erzeugt und
auf jede dieser Kopien 4 Simulated Annealing Fahrpläne mit variabler Schrittzahl (200,
700, 1500 und 3500) angewendet. Zusätzlich wurde jede Kopie einmal mit gewöhnlicher
Überrelaxation eichfixiert. Insgesamt wurde demnach auf jeder Konfiguration 250-mal eine
Eichfixierung durchgeführt. Dabei sind zwei Dinge aufgefallen. Zum einen wurde auf jeder
Konfiguration der größte gefundene Funktionalwert nur genau einmal angenommen und
auch die anderen gefundenen Funktionalwerte wurden selten wiedergefunden. Dadurch
bedingt sind die bisher verwendeten Analyseverfahren, die sich an der Häufigkeit des
Wiederauffindens des größten Funktionalwertes orientieren, wenig aufschlussreich und das
Nichtauffinden des Maximums hat zur Folge, dass pmax verschwindet und der Performanz
in diesem Fall keinerlei Bedeutung zukommt, da nur noch G ∝ 1t gilt. Zum anderen ist
bemerkenswert, dass auf allen vier Konfigurationen dieser maximale Funktionalwert nur
vom Simulated Annealing Algorithmus mit der größten Schrittzahl aufgefunden wurde.
Da die Häufigkeitsverteilung über den durchnummerierten Funktionalwerten wenig
aufschlussreich ist19 , wurde die Verteilung der Funktionalwerte als Histogramm ausgewertet. Zur Vergleichbarkeit der Konfigurationen wurden die relativen Funktionalwerte aus
Gleichung 4.2 verwendet, wobei Fmax den größten der Funktionalwerte bezeichnet, die auf
einer Konfiguration in irgendeiner der 250 Eichfixierungen gefundenen wurden.
18
Die Annahme gründete sich auf der Beobachtung eines Potenzgesetzes für die Schrittzahl der Überrelaxation und der fourierbeschleunigten Eichfixierung bis zur Konvergenz. Auch für die Abhängigkeit der
optimalen Schrittzal des Simulated-Annealing-Algorithmus vom Volumen erschien es sinnvoll, ein solches
Potenzgesetz anzunehmen.
19
Die meisten Häufigkeiten sind kleiner oder gleich 0.02, da die einzelnen Funktionalwerte selten öfter
als einmal gefunden wurden.
4.2 SU(3) Eichfixierung
77
SA - 200 Schritte
Überrelaxation
0.25
P [F ∈ bin]
P [F ∈ bin]
0.25
0.2
0.15
0.15
0.1
0.05
0
0.2
0.1
0.05
0
0.5
1
−Frel
0
1.5
0
1.5
−3
x 10
SA - 3500 Schritte
0.25
P [F ∈ bin]
0.25
P [F ∈ bin]
1
−Frel
SA - 1500 Schritte
0.2
0.15
0.2
0.15
0.1
0.05
0
0.5
−3
x 10
0.1
0.05
0
0.5
1
−Frel
1.5
−3
x 10
0
0
0.5
1
−Frel
1.5
−3
x 10
Abbildung 4.28: Histogramm über den relativen Funktionalwerten Frel (Gl. 4.2) für Fahrpläne mit
Verteilungsparameter µ = −5 und variabler Schrittzahl auf einem 244 -Gitter. In die Histogramme flossen
die Ergebnisse ein, die auf vier bei β = 6.0 erzeugten Konfigurationen mit jeweils 50 Kopien gesammelt
wurden. Auf jeder Kopie wurden alle Fahrpläne getestet.
In Abbildung 4.28 ist die Häufigkeitsverteilung über den relativen Funktionalwerten in
Form von Histogrammen dargestellt. Es wurden drei Fahrpläne mit den Gesamtschrittzahlen 200, 1500 und 3500 mit einem Überrelaxationsalgorithmus verglichen. Was zunächst
auffällt ist, dass für alle Eichfixierungsalgorithmen die erzielte Häufigkeitsverteilung das
Maximum nicht bei Frel = 0 aufweist. Der signifikanteste Unterschied ist im Vergleich der
Häufigkeitsverteilungen von Überrelaxation und Simulated Annealing Algorithmus mit
3500 Schritten zu beobachten. So führt Simulated Annealing zu einer stärkeren Häufung
der Funktionalwerte bei großen Funktionalwerten, als dies für Überrelaxation zu beobachten ist20 . Diese Häufung macht sich auch bemerkbar, wenn für die verschiedenen Algorithmen der Mittelwert der relativen Funktionalwerte über der Zahl der Simulated Annealing
Schritte21 aufgetragen wird (Abbildung 4.29).
20
Dies ist sehr gut daran zu sehen, dass die Verteilung für Simulated Annealing deutlich stärker in
Richtung von Frel = 0 verschoben ist und auch deutlich mehr Funktionalwerte im Bereich des Maximums
liegen.
21
Die reine Überrelaxation ist bei null Schritten eingetragen, da vorher auch kein Simulated Annealing
stattgefunden hat.
78
Kapitel 4
−4
−1.5
x 10
Resultate
mittleres relatives Funktional
−2
−2.5
−hFrel i
−3
−3.5
−4
−4.5
−5
−5.5
−6
0
500
1000 1500 2000 2500 3000 3500 4000
SA-Schritte
Abbildung 4.29: Mittleres relatives Funktional über der Schrittzahl für Simulated Annealing Fahrpläne
mit µ = −5. Null Schritte stehen für die reine Überrelaxation. Gemittelt wurde auf einem 244 -Gitter über
vier bei β = 6.0 erzeugte Konfigurationen mit jeweils 50 Kopien
Hier ist zu erkennen, dass der mittlere, relative Funktionalwert mit der Schrittzahl
deutlich zunimmt. Zusammenfassend lässt sich sagen, dass der Simulated Annealing
Algorithmus zumindest auf den vier betrachteten Konfigurationen zu einer verbesserten
Häufigkeitsverteilung der relativen Funktionalwerte führt.
Es soll im Weiteren die Rechenzeit in die Betrachtungen mit einbezogen werden. In
Tabelle 4.8 sind die Rechenzeiten von Überrelaxation und Simulated Annealing mit 3500
Schritten in Einheiten der mittleren Überrelaxationsrechenzeit angegeben.
Algorithmus
Überrelaxation
SA mit 3500 Schritten
Gesamtrechenzeit
1
2.45 ± 0.02
Tabelle 4.8: Vergleich der Gesamtrechenzeiten
Es wird sofort deutlich, dass sichin der Zeit, die Simulated Annealing und abschließende Überrelaxation benötigen, der einfache Überrelaxationsalgorithmus mindestens zweimal ausführen ließe. Im weiteren soll die Auswirkung auf die Häufigkeitsverteilung der aufgefundenen Funktionalwerte betrachtet werden, wenn Überrelaxation n-fach angewandt
wird, um dann aus den n Kopien diejenige mit dem größten Funktionalwert Fbest auszuwählen.
Auch für die n-fache Anwendung der Überrelaxation lässt sich die Häufigkeitsverteilung Pn approximieren, wenn man die Häufigkeitsverteilung P1 für die einfache Anwen-
4.2 SU(3) Eichfixierung
79
dung kennt (vgl. Anhang A.5). Als P1 für die Überrelaxation wird die Häufigkeitsverteilung der Klassen im Histogramm (Abb. 4.28) angenommen. Die approximierte Häufigkeitsverteilung Pn für n-fache Anwendung ergibt sich dann zu
Ã
! Ã
Ã
!n !
X
P1 [F ∈ Ki ]
Pn [F ∈ Ki ] = 1 −
Pn [F ∈ Kj ] · 1 − 1 − P
.
(4.4)
j≥i P1 [F ∈ Kj ]
j<i
Sie ist in Abbildung 4.30 dargestellt. Augenscheinlich ist die durch Simulated Annealing
P [Frel ∈ bin]
SA - 3500 Schritte
0.2
0.1
0
1
1.5
−3
−Frel
x 10
Überrelaxation 2-fach
0.3
P2 [Frel ∈ bin]
P1 [Frel ∈ bin]
0.2
0.2
0.1
0
0.5
0.2
0.1
0
0.5
−Frel
1
1.5
−3
x 10
0
Überrelaxation 3-fach
0.3
P3 [Frel ∈ bin]
Überrelaxation 1-fach
0.3
0
0.1
0
0.5
−Frel
1
1.5
−3
x 10
0
0
0.5
−Frel
1
1.5
−3
x 10
Abbildung 4.30: berechnete Histogramme über den relativen Funktionalwerten Frel (Gl. 4.2) für mehrfache Anwendung der Relaxation. Verglichen wird es mit Simulated Annealing, das einen Fahrplan mit
3500 Schritten und µ = −5 verwendet. Gemittelt wurde auf vier bei β = 6.0 erzeugten Konfigurationen
über 50 Kopien.
erzeugte Verteilung der Funktionalwerte optimaler, als jede der Verteilungen, die in
diesem Beispiel durch 2- oder 3-fache Anwendung der Überrelaxation erzeugt werden
kann. An dieser Stelle soll noch einmal darauf hingewiesen werden, dass sich aus der
reinen Betrachtung des größten gefundenen Maximums und der Wahrscheinlichkeit dieses
zu finden, keine so deutliche Aussage treffen ließ.
Das Hauptresultat der Untersuchung des Simulated Annealings in einer SU (3)Gittereichtheorie ist daher eine Modifikation der Eichfixierungsaufgabe. Da es immer
schwerer wird, das vermutete absolute Maximum des Eichfunktionals tatsächlich zu finden, ist es unter Umständen einfacher, nur nach lokalen Maxima mit möglichst großen
Funktionalwerten zu suchen. Diese Aufgabenstellung scheint von einem Simulated Annealing Algorithmus auch in einer SU (3)-Gittereichtheorie besser gelöst zu werden als durch
die Überrelaxation.
4.2.5
Zusammenfassung
Im letzten Abschnitt wurden drei Methoden zur Fixierung der Landau-Eichung in einer
SU (3)-Gittereichtheorie verglichen. Dies waren die Überrelaxation, die fourierbeschleunigte Eichfixierung und ein Simulated Annealing Algorithmus mit abschließender Überrelaxation. Die Hoffnung bestand darin, mit Hilfe des Simulated Annealing Algorithmus eine
80
Kapitel 4
Resultate
Möglichkeit zu haben, beim Auffinden des Maximums des Eichfunktionals eine deutlich
größere Performanz zu erzielen als mit den anderen beiden Algorithmen. Dies ließ sich
nicht zeigen. Für die untersuchten Gittergrößen scheint ein Simulated Annealing Algorithmus mit den untersuchten Fahrplänen nur einen geringfügigen oder gar keinen Vorteil
in Bezug auf die Performanz zu erzielen. Die beste Performanz erzielten dabei Simulated
Annealing Fahrpläne mit µ = −5 für die Schrittverteilung auf dem Temperaturintervall
[0.01, 0.45]. Die optimale Schrittzahl Nopt in Abhängigkeit von der Gittergröße V = L4
scheint für diese Fahrpläne einem exponentiellen Gesetz der Form
Nopt (L) = e(0.37±0.03)L+1.05±0.3
zu folgen.
In ersten Untersuchungen auf einem 244 -Gitter deutet sich jedoch an, dass die Aufgabe, ein möglichst großes lokales Maximum des Eichfunktionals zu finden22 , von einem
Simulated Annealing Algorithmus besser gelöst werden kann als von einem Überrelaxationsalgorithmus oder der fourierbeschleunigten Eichfixierung.
22
Man beachte, dass sich die Aufgabenstellung ändert. Es soll nicht mehr die Kopie mit dem größten
Funktionalwert gefunden werden, sondern nur noch eine Kopie mit möglichst großem Funktionalwert.
Kapitel 5
Zusammenfassung und Ausblick
5.1
Zusammenfassung
Mit dem Ziel, einen effektiven Algorithmus zur Fixierung der Landau-Eichung zu finden,
der zudem die Forderung nach der Maximierung des Landau-Eichfunktionals optimal
erfüllt, wurden eine Reihe von Eichfixierungsalgorithmen miteinander verglichen. Dies
waren der Überrelaxationsalgorithmus, die fourierbeschleunigte Eichfixierung und der Simulated Annealing Algorithmus mit abschließender Überrelaxation. Von wesentlicher Bedeutung war dabei die Optimierung des Simulated Annealing Fahrplans. Im Rahmen
dieser Optimierung wurden verschiedene Parameter variiert, die die Eigenschaften der
Algorithmen bestimmen. Für den Simulated Annealing Algorithmus wurde desweiteren
der Einschub von mikrokanonischen Schritten untersucht und im Rahmen einer SU (2)Gittereichtheorie der Versuch unternommen, eine Reduktion des Rechenaufwandes durch
Projektion auf eine SU (2)-Untergruppe zu erreichen.
Als Kriterium zum Vergleich der verschiedenen Algorithmen diente die anfangs
eingeführte Performanz, in die die Rechenzeit eines Algorithmus eingeht und die Wahrscheinlichkeit, die Gribov-Kopie mit maximalem Funktionalwert wiederzufinden.
Es zeigte sich, dass die Projektion und Präkonditionierung der Eichtransformation
mittels Simulated Annealing in der I120 -Untergruppe der SU (2) für eine SU (2)Eichtheorie in der Tat zu einer Reduktion des Rechenaufwandes führte und die
Rechenzeit entsprechend verkürzte. Allerdings wurde im Vergleich zu einem Simulated
Annealing Algorithmus, der mit den gleichen Parametern die gesamte SU (2) in die
Berechnungen einbezog, das Problem der Gribov-Mehrdeutigkeit schlechter gelöst, d.h.
Gribov-Kopien mit maximalem Funktionalwert seltener wiedergefunden. Im Sinne der
Performanz wurde daher keine Verbesserung erzielt.
Eine deutlich größere Performanz ließ sich für den Simulated Annealing Algorithmus
durch das Einfügen von mikrokanonischen Schritten sowohl in einer SU (2)- als auch in
einer SU (3)-Theorie erreichen. In der SU (2)-Theorie führte dies zudem dazu, dass mit
Simulated Annealing eine deutlich größere Performanz erzielt werden konnte, als mit
dem parallel untersuchten Überrelaxationsalgorithmus.
Das Ergebnis der Untersuchungen in einer SU (2)-Gittereichtheorie bei β = 2.4 ist,
dass der beste in der Arbeit gefundene Simulated Annealing Algorithmus einen Fahrplan
81
82
Kapitel 5
Zusammenfassung und Ausblick
benutzt, der die Temperatur im Intervall [Tmin , Tmax ] = [0.01, 1.4] absenkt. Dies konnte
bis zur Gittergröße 244 bestätigt werden. Mit einem solchen Fahrplan konnte insbesondere
die Performanz gegenüber der einfachen Relaxation auf den untersuchten Gittern deutlich
gesteigert werden.
Auch in der SU (3)-Gittereichtheorie wurde auf bei β = 6.0 erzeugten Konfigurationen
eine Optimierung des Simulated Annealing Algorithmus durchgeführt. Hier zeigte sich,
das der beste gefundene Fahrplan die Temperatur im Intervall [Tmin , Tmax ] = [0.01, 0.45]
mit einem nicht linearen Temperaturfahrplan absenkt. Die Mehrzahl der Schritte sollte
dabei im oberen Temperaturbereich gemacht werden. Bei der Untersuchung verschiedener
Gittergrößen deutete sich zudem an, dass die optimale Schrittzahl für den Simulated
Annealing Fahrplan exponentiell mit dem Gittervolumen wächst. Allerdings erzielte das
so optimierte Simulated Annealing keine deutlich größere Performanz als ein Überrelaxationsalgorithmus.
In Simulationen auf einem 244 -Gitter nimmt die Zahl der Gribov-Kopien deutlich zu.
Bei dieser Gittergröße zeigte sich, dass durch die Verwendung des Simulated Annealing
Gribov-Kopien mit großen Funktionalwerten deutlich häufiger angenommen werden als
bei der Verwendung der Überrelaxation. Das Maximum selbst wird bei dieser Gittergröße
jedoch seltener angenommen als auf kleinen Gittern. In einer SU (3)-Eichtheorie wurde
der maximale Funktionalwert so selten gefunden, dass die Performanz nicht mehr sinnvoll
anzugeben war. Da anzunehmen ist, dass sich dieser Effekt mit zunehmender Gittergröße
verstärkt, wurde in der SU (3)-Gittereichtheorie anhand von 4 Konfigurationen gezeigt,
dass sich Simulated Annealing und die Überrelaxation auch anhand der Verteilung
über den Funktionalwerten vergleichen lassen, die durch sie gefunden werden. Diese
Verteilung konnte für die mehrfache Anwendung der Überrelaxation berechnet werden
und es stellte sich heraus, dass in vergleichbaren Zeiten ein Simulated Annealing Algorithmus mit 3500 Schritten besser abschnitt als die mehrmals angewandte Überrelaxation.
Für die SU (3)-Gittereichtheorie wurde außerdem die fourierbeschleunigte Eichfixierung mit der Überrelaxation verglichen. Die Wahrscheinlichkeitsverteilungen, mit denen
die Funktionalwerte am Ende der Eichfixierung gefunden wurden, stimmte für beide Algorithmen nahezu überein. Daraus läßt sich zunächst schlussfolgern, dass beide die Landaueichung ähnlich gut fixieren. Dabei skaliert die Zahl der Iterationsschritte in Abhängigkeit
von der Gitterkantenlänge sowohl für die Überrelaxation als auch für die fourierbeschleunigte Eichfixierung mit einem Potenzgesetz. Die Zahl der Iterationen skaliert auf symmetrischen Gittern für die fourierbeschleunigte Eichfixierung mit einem etwas kleineren
Exponenten von c = 1.53 ± 0.01 als für die Überrelaxation mit c = 2.19 ± 0.01.
5.2
Schlussfolgerung
Ist man daran interessiert, für die Landau-Eichung in einer SU (3)-Eichtheorie möglichst
große Werte des Eichfunktionals zu finden, so ist das Ergebnis dieser Arbeit, dass von
den untersuchten Algorithmen ein Simulated Annealing Algorithmus mit nichtlinearem
Abkühlverhalten im Temperaturintervall [0.01, 0.45] zu favorisieren ist. Die Effektivität
des Simulated Annealings läßt sich dabei deutlich durch das Einfügen mikrokanonischer
Schritte steigern und es kann sogar gesagt werden, dass die Vorteile gegenüber der
5.3 Ausblick
83
Überrelaxation zu einem wesentlichen Anteil auf diesen Schritten basieren.
Unabhängig von der Untersuchung des Simulated Annealings zeigte sich im Vergleich
von fourierbeschleunigter Eichfixierung und Überrelaxation, dass auf sehr großen Gittern
die fourierbeschleunigte Eichfixierung der Relaxation als reiner Eichfixierungsalgorithmus
vorzuziehen ist. Inwieweit sie auch die Überrelaxation nach dem Simulated Annealing
ersetzen kann, muss sich in zukünftigen Untersuchungen zeigen.
5.3
Ausblick
Im Weiteren wird zu untersuchen sein, wie groß die Auswirkung der Wahl der GribovKopie auf die Messung der Propagatoren ist und ob es tatsächlich notwendig ist, die
Landau-Eichung auf die Gribov-Kopie mit maximalem Funktionalwert zu fixieren oder
ob es gegebenenfalls genügt, nur eine Kopie mit möglichst großem Funktionalwert zu
finden.
Für das Simulated Annealing in SU (3)-Eichtheorien steht zudem die Optimierung der
Zahl von mikrokanonischen Schritten aus. Es wäre möglich, dass ein anderes Verhältnis
aus der Zahl von mikrokanonischen und Simulated Annealing Schritten zu einem verbesserten Algorithmus führt. Weiterhin lassen sich mit der in dieser Arbeit gegebenen
Funktion für die Verteilung der Temperaturschritte auch andere Fahrpläne studieren und
die Untersuchung weiter systematisieren.
Im Zusammenhang mit der Untersuchung des Simulated Annealing bleibt auch
zu klären, ob die Ersetzung der abschließenden Überrelaxation durch eine fourierbeschleunigte Eichfixierung gleich gute Resultate beim Auffinden von Gribov-Kopien mit
großen Funktionalwerten liefert. Bleibt die Verteilung der gefundenen Kopien bei dieser
Ersetzung erhalten, böte sich die Verwendung eines solchen Algorithmus insbesondere
auf deutlich größeren Gittern an.
Weiterhin ist für die Überrelaxation und die fourierbeschleunigte Eichfixierung in der
SU (3)-Gittereichtheorie der exponentielle Zusammenhang zwischen Gittergröße und Rechenaufwand für große Gitter zu bestätigen, falls dies möglich ist.
Und auch wenn die Projektion auf die I120 -Untergruppe in SU (2)Gittereichfeldtheorien keine Vorteile gebracht hat, bleibt es interessant zu untersuchen,
inwieweit sich auch für die SU (3) eine solche diskrete Untergruppe finden lässt und ob
sich durch deren Verwendung vielleicht die SU (3)-Algorithmen beschleunigen lassen.
84
Kapitel 5
Zusammenfassung und Ausblick
Anhang A
Anhang
A.1
Das Ikosaeder
Das Ikosaeder, von dem die Gruppe ihren Namen herleitet, ist ein Polyeder, das nach
Definition von 20 regulären Dreiecken begrenzt wird. Daraus ergibt sich ein Gebilde mit
12 Ecken und 30 Kanten. Von der Konstruktion des Ikosaeders werden wir zur Darstellung der Drehgruppe des Ikosaeders übergehen und uns am Ende dieses Abschnittes
ansehen, wie sich diese Untergruppe der speziellen orthogonalen Transformationen SO(3)
homomorph auf die speziellen unitären Transformationen SU (2) übertragen läßt.
Eine sehr anschauliche Konstruktion des Ikosaeders geht von zwei regelmäßigen Fünfecken aus, die um den Winkel π/5 gegeneinander verdreht sind[Bai99]. Nun werden die
Eckpunkte der beiden Fünfecke so miteinander verbunden, dass die entstehenden Flächen
regelmäßige Dreiecke ergeben (Abb. A.1 links). Wir erhalten das fünfseitige Antiprisma
(Abb. A.1 mittig). Nun brauchen wir nur noch über jedem Fünfeck eine durch gleichseitige Dreiecke begrenzte Pyramide konstruieren und haben so das Ikosaeder konstruiert
(Abb. A.1 rechts).
Abbildung A.1: geometrische Konstruktion des Ikosaeders
Die Eckpunkte des Ikosaeders liegen dabei auf der Oberfläche einer einhüllenden Kugel.
A.1.1
Konstruktion der Ikosaedergruppe
Im folgenden interessieren uns jene linearen Transformationen, die einen regulären Körper
wieder mit sich selbst zur Deckung bringen. Sie wurden ausführlich Ende des 19. Jahrhunderts von Felix Klein behandelt [Kle84]. Betrachten wir zunächst die Drehungen. Da
85
86
Kapitel A
Anhang
zwei hintereinander ausgeführte Drehungen wieder eine Drehung ergeben, kann man sofort schlußfolgern, dass Drehungen, welche einen regulären Körper mit sich sich selbst zur
Deckung bringen, in ihrer Gesamtheit eine Gruppe bilden. Anders verhält es sich mit den
Spiegelungen, die es vermögen einen regulären Körper in sich selbst zu überführen. Zwei
Spiegelungen hintereinander ausgeführt bilden nicht notwendig eine Spiegelung, aber eine Drehung. Die Gesamtheit der Spiegelungen bildet also für sich genommen noch keine
Gruppe. Nimmt man jedoch die Drehungen, die Spiegelungen und die aus den Kombinationen entstehenden Operationen zusammen, so erhält man wieder eine Gruppe, die wir
ihrer Konstruktion wegen erweiterte Gruppe nennen wollen.
Das Ikosaeder besitzt keinerlei Spiegelsymmetrie und lässt sich nur durch Drehungen in sich selbst überführen. Überzeugen wir uns zunächst davon, dass es 60 derartige
Drehungen gibt. Die Drehungen lassen sich dazu in 3 Klassen einteilen (siehe Abbildung).
1. Drehungen der Periode 5: Sind Drehungen um die Ikosaederdiagonalen mit ganzen Vielfachen von 2π
als Drehwinkel. Jeder der 12 gleichberechtigten Ikosaedereck5
punkte bleibt im Ganzen bei 5 Drehungen um diese Diagonalen unverändert. Bei
6 Diagonalen und unter Vernachlässigung der Identität erhält man so 4 · 6 = 24
Drehungen
2. Drehungen der Periode 3: Die 10 Diagonalen des dem Ikosaeder einbeschriebenen Petagondodekaeders liefern analog 2 · 10 = 20 Drehungen mit ganzzahligen
als Drehwinkel.
Vielfachen von 2π
3
3. Drehungen der Periode 2: Die 15 Querlinien liefern die verbleibenden 15 Drehungen der Periode 2.
Abbildung A.2: Klassen der Ikosaederdrehungen
Unter Hinzunahme der Identität erhält man so die
24 + 20 + 15 + 1 = 60
Drehgruppe des Ikosaeders1 .
Jede Drehung wird durch eine normierte Drehachse n = (n1 , n2 , n3 ) und einen Drehwinkel
φ charakterisiert. Wenn wir nun noch den Kosinus des Winkels mit c = cos(φ) bezeichnen,
1
Die Eins kommt von der identischen Abbildung, die keine echte Drehung ist.
A.1 Das Ikosaeder
87
können wir die zugehörige Drehmatrix durch die Abbildung S : (R)3 ∩ S 2 → SO(3) sofort
angeben:
S(n, φ) =
"
n21 + c(n22 +√n23 )
n1 n2 − cn1 n2 + √1 − c2 n3
n3 n1 − cn3 n1 − 1 − c2 n2
√
n1 n2 − cn1 n2 − 1 − c2 n3
n22 + c(n23 +√n21 )
n2 n3 − cn2 n3 + 1 − c2 n1
√
#
n3 n1 − cn3 n1 + √1 − c2 n2
n2 n3 − cn2 n3 − 1 − c2 n1
n23 + c(n21 + n22 )
Nutzen wir nun unser Wissen über die Ikosaederdrehungen, so läßt sich die gesamte Gruppe durch Angabe der einzelnen Drehwinkel und Drehachsen konstruieren. Es ist jedoch
etwas umständlich, alle Drehachsen und Drehwinkel einzeln zu berechnen, um daraus die
Drehungen zu berechnen.
A.1.2
Die elegante Methode
Eine etwas elegante Methode ist es, die gesamte Gruppe aus zwei beliebigen Drehungen
der Periode 5 zu erzeugen. Um für diese beiden Drehung besonders einfache Darstellungen
der Drehachse zu bekommen, wählen wir zuvor das Koordinatensystem in geeigneter
Weise. Dazu erinnern wir uns daran, dass sämtliche Ecken des Ikosaeders auf einer
einhüllenden Kugel liegen. Das Zentrum dieser Kugel soll der Koordinatenursprung sein.
Desweiteren legen wir das Ikosaeder genau so in das Koordinatensystem, dass die Spitzen
der beiden aufgesetzten Pyramiden auf der z-Achse liegen und eine Spitze des oberen
Fünfecks über der x-Achse zu liegen kommt.
Abbildung A.3: Erzeugende der Ikosaedergruppe
Das Ikosaeders besitzt nun für die in Abbildung A.3 dargestellten Drehachsen eine
besonders “einfache” Koordinatendarstellung und wir nutzen sie als Drehachsen für die
88
Kapitel A
Erzeugenden A und C der Drehgruppe des Ikosaeders2 .


p
√
√
1
1
(1
−
(
5)
−
10
+
2
5)
0
4
4
√
√
 1 p

1
)
=
A = S([001], 2π


(
(−1
+
10
+
2
5)
5)
0
5
4
4
0
0
1



C = S([10 21 ], 2π
)
=

5

1
2
1
(15
20
q
+
√
5)
√
1
(5 + 5)
10
√
1
(5
−
5)
10
− 12
q
1
(5
10
√
und
1
(5
10
q
+ 5)
√
1
(−1 + 5)
−
4
q
√
1
(5 + 5)
10
Anhang
−
1
(5
10
√1
5
√
+
5)
√



5) 

Wir bilden nun die Matrizen T = Ai C j Ak C l für i, j, k, l = 0..4 und streichen aus der entstehenden Menge alle wiederkehrenden Matrizen aus. Das Resultat ist die 60-elementige
Menge T60 der Zahlentupel (i, j, k, l). Diese Menge ist eine mögliche Darstellung der Drehgruppe des Ikosaeders und wir wollen sie hier angeben3 :


(1,
1,
1,
1),
(1,
1,
1,
2),
(1,
1,
1,
3),
(1,
1,
1,
4),
(1,
1,
1,
5),
(1,
1,
2,
1),








(1,
1,
2,
2),
(1,
1,
2,
3),
(1,
1,
2,
4),
(1,
1,
2,
5),
(1,
1,
3,
1),
(1,
1,
3,
2),








(1,
1,
3,
3),
(1,
1,
3,
4),
(1,
1,
3,
5),
(1,
1,
4,
1),
(1,
1,
4,
2),
(1,
1,
4,
3),








(1,
1,
4,
4),
(1,
1,
4,
5),
(1,
1,
5,
1),
(1,
1,
5,
2),
(1,
1,
5,
3),
(1,
1,
5,
4),






(1, 1, 5, 5), (1, 2, 1, 1), (1, 2, 1, 2), (1, 2, 1, 3), (1, 2, 1, 4), (1, 2, 1, 5),
T60 =
(1, 2, 3, 1), (1, 2, 3, 2), (1, 2, 3, 3), (1, 2, 3, 4), (1, 2, 3, 5), (1, 2, 4, 1), 







(1,
2,
4,
2),
(1,
2,
4,
3),
(1,
2,
4,
4),
(1,
2,
4,
5),
(1,
3,
3,
1),
(1,
3,
3,
2),








(1,
3,
3,
3),
(1,
3,
3,
4),
(1,
3,
3,
5),
(1,
3,
4,
1),
(1,
3,
4,
2),
(1,
3,
4,
3),








(1,
3,
4,
4),
(1,
3,
4,
5),
(1,
4,
3,
1),
(1,
4,
3,
2),
(1,
4,
3,
3),
(1,
4,
3,
4),






(1, 4, 3, 5), (2, 3, 3, 1), (2, 3, 3, 2), (2, 3, 3, 3), (2, 3, 3, 4), (2, 3, 3, 5)
In dieser Darstellung entspricht das Tupel (1, 2, 1, 2) der Identität. Im weiteren sind wir
an der Fortsetzung der Drehgruppe des Ikosaeders auf die ikosaedrale Untergruppe I120
der SU (2) interessiert.
A.1.3
Fortsetzung auf SU (2)
Bisher haben wir nur Drehungen im dreidimensionalen euklidischen Raum betrachtet.
Von Interesse ist nun eine Fortsetzung der Ikosaedergruppe auf die SU (2).
Hierfür nutzen wir das beiden Gruppen lokal isomorph zueinander sind. Dieser Isomorphismus ist nicht global, aber es gibt einen globalen Homomorphismus SU (2) ∼
= SO(3)
der dafür sorgt, dass die SO(3) von der SU (2) zweimal überdeckt wird. Wir wollen
uns der Fortsetzung nähern, indem wir von der Theorie der kontinuierlichen Gruppen
Gebrauch machen [Jon90].
Darstellung und Parameter
Die SU (2) hat als niedrigstdimensionale treue Dartellung, die sogenannte fundamentale
Darstellung, d.h. unitäre 2 × 2 Matrizen, deren Determinante den Wert 1 hat. Die Gruppe
√
1
Da die Erzeugenden von der Periode 5 sind, wählen wir als Drehwinkel 2π
5 , sodass c = 4 ( 5 − 1) ist.
3
Da das wegstreichen der mehrfach enthaltenen Tupel recht willkürlich geschehen kann, ist dies nur
eine mögliche Tupelmenge
2
A.1 Das Ikosaeder
89
der Raumdrehungen SO(3) hat als Darstellung orthogonale 3 × 3 Matrizen, deren Determinante ebenfalls den Wert 1 hat. Als wichtiger Unterschied zur SU (2) bemerken wir,
dass in der SO(3) die Spiegelung (− id) nicht in der Gruppe enthalten ist.
Wir betrachten nun die Darstellung der beiden Gruppen als Lie-Gruppen mit
übereinstimmender Lie-Algebra.
Gruppe
SO(3)
´
,
³ 0 0 −1 ´
iX2 = 0 0 0 ,
1 0 0
³ 0 1 0´
iX3 = −1 0 0
iX1 =
Generatoren der
Lie-Algebra
³0
0 0
0 0 1
0 −1 0
0 0 0
Kommutatoren
[iXi , iXj ] = −i²ijk Xk
SU(2)
X1 = 21 σ1 = 12 ( 01 10 ),
X2 = 12 σ2 =
1
2
¡ 0 −i ¢
i 0
,
0
X3 = 12 σ3 = 12 ( 10 −1
)
[iXi , iXj ] = −i²ijk Xk
Beide Gruppen haben die gleichen Strukturkonstanten, sind also in der Umgebung
der Eins isomorph. Eine Drehung um eine Drehachse mit Richtung n mit dem Winkel φ
hat die Darstellungsmatrix
Ã
!
X
S(n, φ) = exp iφ
nk Xk
(A.1)
k
Auch für die SU (2) stimmt diese Darstellung, nur dass hier nicht mehr S(n, φ) = S(−n, φ)
gilt. Wir wollen im folgenden zwei Parameterabbildungen SSO(3) und SSU (2) je nach Wertebereich unterscheiden
SSO(3) : (R)3 ∩ S 2 → SO(3)
und
(A.2)
2
SSU (2) :
S
→ SU (2),
wobei beide Abbildungen durch die Exponentialabbildung aus Gleichung A.1 definiert
sind, aber unterschiedliche Generatoren verwenden.
Die Ikosaedergruppe I120
Mit Hilfe dieser Darstellung können wir nun recht einfach die Erzeugenden der Drehgruppe
des Ikosaeders von der SO(3) auf die SU (2) abbilden. Formal läßt sich nun ein Homo−1
morphismus HSO(3),SU (2) : SO(3) → SU (2) durch die Verknüpfung H = SSU (2) ◦ SSO(3)
definieren. So ließe sich die gesamte Drehgruppe des Ikosaeders in die SU (2) abbilden.
Durch Multiplikation erhielte man die übrigen 60 Elemente der I120 . Wir wollen an dieser
Stelle wieder einen etwas einfacheren Weg gehen, da das Inverse der Abbildung SSO(3)
nicht ohne weiteres zu berechnen ist. Dazu erinnern wir uns, dass wir bereits die Parameter der Erzeugenden der Drehgruppe des Ikosaeders angegeben haben. Wir nutzen diese
Parameter, um die Erzeugenden der I120 direkt zu bestimmen.
" iπ
#
5
0
e
und
) =
A = SSU (2) ([001], 2π
iπ
5
0 e− 5
) =
C = SSU (2) ([10 21 ], 2π
5
"
1
20
³
p
√
√ ´
5 + 5 5 − i 50 − 10 5
q
√
1
(5 − 5)
−i 10
q
#
√
1
(5 − 5)
−i 10
³
p
√ ´
√
1
5
−
i
50
−
10
5
5
+
5
20
90
Kapitel A
Anhang
Diese beiden Matrizen erzeugen nun eine Untergruppe der SU (2) mit 120 Elementen, die
Ikosaedergruppe I120 . Analog wie auf der SO(3) ergeben sich sich alle Elemente aus den
Matrizen
t = Ai C j Ak C l für i, j, k = 0, .., 4; l = 0, .., 9.
Man beachte, dass ein Index bis 9 laufen muss, um die vollständige Untergruppe zu
erzeugen. Denn im Gegensatz zur SO(3), in der die Erzeugenden von der Periode 5 sind
(also A5 = C 5 = id), sind sie in der SU (2) von der Periode 10 (mit A5 = C 5 = −id). Am
Ende entfernen wir alle doppelt vorkommenden Elemente und erhalten die I120 .
A.1.4
Diskretisierung der SU (2)
Die Ikosaedergruppe bietet hervorragende Eigenschaften. Alle ihre Elemente haben die
gleichen Charakteristika und sind bezüglich der Frobeniusnorm gleichmäßig über die
SU (2) verteilt. Anstelle der Matrixmultiplikation kann man ihre Elemente auch über eine Gruppentabelle multiplizieren, was sich besonders in der Computeralgebra als äußerst
nützlich erweisen kann.
A.2 Konvergenz einer Markov-Kette
A.2
91
Konvergenz einer Markov-Kette
Eine Markov-Kette ist ein spezieller stochastischer Prozess, also eine Sequenz von zufälligen Variablen X1 , X2 , X3 , . . . . In Anlehnung an die Markov-Ketten in dieser Arbeit wollen
wir die zufälligen Variablen Konfigurationen nennen. Falls die Wahrscheinlichkeitsverteilung der Konfiguration Xi+1 nur vom Vorgänger Xi abhängt, dann gilt
P (Xi+1 = x | X1 , ...., Xi ) = P (Xi+1 = x | Xi ),
(A.3)
wobei x ein möglicher Zustand der Konfiguration ist. Diese Eigenschaft wird auch als
Gedächtnislosigkeit der Markov-Kette bezeichnet. Die Eigenschaft nur von einer begrenzten Anzahl der letzten Vorgänger abzuhängen, wird Markov-Bedingung oder Gedächtnislosigkeit der Markov-Kette genannt. Eine Markov-Kette besitzt immer eine Anfangswahrscheinlichkeit V , die die Wahrscheinlichkeitsverteilung für das erste Glied der MarkovKette festlegt. Eine Markov-Kette kann verschiedene Eigenschaften aufweisen.
Definition: (Eigenschaften einer Markov-Kette)
Periodizität ist die Eigenschaft einer Markov-Kette periodisch zu sein.
Rekurrenz ist die Eigenschaft einer Markov-Kette, von jeder Konfiguration aus zu
dieser innerhalb von unendlich vielen Schritten mit der Wahrscheinlichkeit Eins
zurückzukehren.
Die statistischen Eigenschaften einer Markov-Kette werden vollständig durch Festlegung
einer Übergangswahrscheinlichkeit P (Xi+1 , Xi ) beschrieben. Die für die Konvergenz des
Markov-Prozesses notwendigen Eigenschaften an die Übergangswahrscheinlichkeit sind
Definition: (Eigenschaften der Übergangswahrscheinlichkeit)
X
P (Y, X) = 1
Normiertheit
Y
X
P (Y, X) > 0
Ergodizität
P (Y, X)F (X) = F (Y ) Existenz eines Fixpunktes F (Stabilität )
X
Dem in der Arbeit beschriebenen Metropolis-Algorithmus liegt eine Markov-Kette
zugrunde, die als Fixpunkt F gerade die Boltzmannverteilung p(X) ∝ exp −βE(X) hat,
wobei E eine Energiefunktion ist und β = kB1T . Wir wollen nun für einen allgemeinen
Markov-Prozess zeigen, dass er gegen seinen Fixpunkt konvergiert. Aus dieser Konvergenz
folgt im übrigen auch die Tatsache, dass er als stabil bezeichnet wird.
Die Entwicklung der Anfangswahrscheinlichketisverteilung V =: V1 zu den Verteilungen der Folgekonfigurationen Vi soll ebenfalls mit Indizes versehen werden. Für jede
Wahrscheinlichkeitsverteilung V gilt die
Definition: (Normiertheit)
X
X
V (X) = 1
(A.4)
92
Kapitel A
Anhang
Weiterhin kann für Wahrscheinlichkeitsverteilungen eine Metrik angegeben werden, mit
der der Abstand zweier Verteilungen gemessen werden kann
Definition: Sind V und W zwei Wahrscheinlichkeitsverteilungen, dann wird durch
kV − W k :=
X
X
kV (X) − W (X)k
(A.5)
ihr Abstand definiert.
Nun sind alle nötigen Definitionen gegeben und wir können das erste Lemma auf dem
Weg zum Beweis der Konvergenz der Markov-Kette formulieren.
Lemma A.2.1. (Existenz und Eindeutigkeit des Fixpunktes)
Sei {Xi } eine aperiodische, rekurrente Markov-Kette und erfülle die Überganswahrscheinlichkeit P (Y, X) die Eigenschaft der Ergodizität, dann hat P (Y, X) einen Fixpunkt F und
dieser ist eindeutig. In diesem Falle gilt für alle X, dass lim P n (Y, X) = F (Y ) und
n→∞
F (Y ) > 0
Bevor wir uns an den Beweis machen, wollen wir zumindest noch bemerken, dass sich
eine umgekehrte Richtung beweisen läßt. Es kann nämlich aus der Existenz eines Fixpunktes für eine aperiodische Markov-Kette mit ergodischer Übergangswahrscheinlichkeit
auch auf die Eigenschaft der Rekurrenz geschlossen werden. Der Beweis kann zum Beispiel
in [Bil95] nachgelesen werden. Wichtig ist, dass der Metropolis Algorithmus die geforderten Eigenschaften aufweist und wir also einen eindeutigen Fixpunkt finden können, die
Boltzmanverteilung.
Das nächste Lemma beschreibt die Eigenschaft der Übergangswahrscheinlichkeit auf
die Wahrscheinlichkeitsverteilung als kontrahierende Abbildung zu wirken.
Lemma A.2.2. Seien {Vi } die Wahrscheinlichkeitsverteilungen einer Markov-Kette, deren Übergangswahrscheinlichkeit P (X, Y ) die Eigenschaften Normiertheit, Ergodizität und
Stabilität erfüllt. Ferner sei F der einzige Fixpunkt der Markov-Kette. Dann gibt es ein
α mit 1 ≥ α > 0, sodass gilt
kVi+1 − pk ≤ (1 − α)kVi − pk
Beweis:. Zunächst machen wir folgende Ersetzung:
Pe(X, Y ) = P (X, Y ) − Pmin ,
(A.6)
wobei Pmin = minP (Y, X) die minimale Übergangswahrscheinlichkeit zwischen zwei
X,Y
Zuständen bezeichnet. Auf Grund der Ergodizität gilt Pmin > 0 und weiter
Pe(X, Y ) ≥ 0.
(A.7)
A.2 Konvergenz einer Markov-Kette
93
Nun läßt sich die Behauptung des Satzes wie folgt beweisen.
X
kVi+1 − F k
=
kVi+1 (X) − F (X)k
X
=
Stabilität
=
(A.6)
=
(A.4)
=
∆−Ungleichung
≤
A.7
=
°
°
°
X°
°X
°
P (X, Y )Vi (Y ) − F (X)°
°
°
°
X
° Y
°
°
X°
°X
°
P (X, Y ) (Vi (Y ) − F (Y ))°
°
°
°
X
°
° Y
°
X
X°
°
°X e
P (X, Y ) (Vi (Y ) − F (Y )) + Pmin
(Vi (Y ) − F (Y ))°
°
°
°
Y
X
°
° Y
°
X°
°
°X e
P (X, Y ) (Vi (Y ) − F (Y )) + Pmin · 0°
°
°
°
X
Y
°
XX°
°
°e
°P (X, Y ) (Vi (Y ) − F (Y ))°
X
X
Normiertheit
=
=
=
Y
XX
Y
Pe(X, Y ) kVi (Y ) − F (Y )k
(1 − N Pmin )
X
Y
kVi (Y ) − F (Y )k
(1 − N Pmin )kVi+1 − F k
(1 − α)kVi+1 − F k
¥
Im letzten Schritt des Beweises ist in dieser Darstellung der Markov-Kette vorausgesetzt worden, dass der Raum der möglichen Konfiguration endlich ist. In diesem Falle
ist die Mächtigkeit des Konfigurationsraumes eine natürliche Zahl N . Für kontinuierliche
Markov-Ketten sind Beweis und Voraussetzungen in eine integrale Formulierung zu bringen. Mit diesem Hilfssatz lä3t sich nun auch verhältnismäßig einfach der Satz über die
Konvergenz einer Markov-Kette formulieren und beweisen.
Satz A.2.3. Sei durch P (X, Y ) ein Markov-Prozess mit den Voraussetzungen des Hilfssatzes gegeben und F ein Fixpunkt. Weiter sei Vt = P i V die Wahrscheinlichkeitsverteilung
der Markov-Kette nach t Schritten. Dann gilt
lim kVi − F k = 0
i→∞
(A.8)
und man spricht in diesem Sinne von der Konvergenz der Markov-Kette.
Beweis:. Aus dem Hilfssatz entnimmt man
kVi+1 − F k ≤ (1 − α)kVi − F k
. Es handelt sich also um eine kontrahierende Abbildung. Beginnt man mit einer Startverteilung V , so gilt nach i Schritten
kVi − F k ≤ (1 − α)i kV − F k
In diesem Sinne konvergiert Die Markov-Kette Vi im Limes großer t gegen die Boltzmannverteilung.
¥
94
Kapitel A
Anhang
Für einen konkreten Algorithmus, der die Eigenschaften der Markov-Kette ausnutzt,
sind also die Eigenschaften des Satzes zu zeigen. Die Stabilität ist dabei im allgemeinen
schwer nachzuweisen. Allerdings genügt es in den meisten Fällen, die stärkere Bedingung
der detailed balance für eine Markov-Ketter nachzuweisen:
P (Y, X)
P (Y )
=
P (X, Y )
P (X)
detailed balance
Denn aus dem folgenden Satz geht hervor, dass eine Kette, die detailed balance erfüllt
automatisch die Eigenschaft der Stabilität besitzt.
Satz A.2.4. Erfüllt eine normierte Übergangswahrscheinlichkeit P (Y, X), die die Bedingung der detailed balance für eine Wahrscheinlichkeitsverteilung P (X), so ist P (X) ein
Fixpunkt dieser Übergangswahrscheinlichkeit.
Beweis:. Für den Beweis ist nur die Bedingung der Stabilität zu zeigen. Dazu schreiben
wir die Bedingung der detailed balance etwas um und summieren am Ende über X
P (Y, X)
P (Y )
=
detailed balance
P (X, Y )
P (X)
P (Y, X)P (X) = P (X, Y )P (Y )
X
X
P (Y, X)P (X) =
P (X, Y )P (Y )
X
X
X
X
P (Y, X)P (X) = P (Y )
X
X
P (X, Y )
⇔
(A.9)
⇒
(A.10)
⇒
(A.11)
Normiertheit
(A.12)
=⇒
X
P (Y, X)P (X) = P (Y )
(A.13)
X
Die letzte Zeile ist die Stabilitätsbedingung.
¥
A.3 Haarsches Maß
A.3
95
Haarsches Maß
Die Einführung des Haarschen Maßes beginnen wir mit einigen fundamentalen Definitionen und Sätzen
Definition: Sei G eine kompakte Liegruppe. Ein Maß µ auf G ordnet jeder Funktion
f : G → , g 7→ f (g) eine komplexe Zahl
Z
E[f ] := dµ(g)f (g)
(A.14)
G
Ein Maß heißt Haarsches Maß falls es die folgenden beiden Bedingungen erfüllt
(i) E[Lh F ] = E[f ]
(ii)
E[1] = 1
∀h ∈ G (Linksinvarianz)
(Normiertheit).
(A.15)
wobei Lh f für h ∈ G durch (Lh f )(g) = f (h−1 g) definiert ist
Definition: Eine Funktion m :
n
n
×
→
n
heißt Gruppenmultiplikation, falls gilt
g(m(x, y)) = g(x)g(y).
(A.16)
Sei nun die Gruppe G durch reellen Koordinaten x ∈ n parametrisiert (für die Gruppenelemente wird in diesem Falle g(x) geschrieben) und gelte g(0) = e, das Einselement
der Gruppe. Dann sind wir nun auf der Suche nach dem ∆(x), für das gilt
Z
E[f ] = dn x∆(x)f (g(x)) .
(A.17)
Bevor wir das Haarsche Maß der Gruppe SU (2) konstruieren können müssen wir noch
eine Identität zeigen
Satz A.3.1. Ist g : n → G eine Parametrisierung der Liegruppe G und m :
die Gruppenmultiplikation dann gilt für das oben definierte Haarsche Maß
¯
¯ ¶¯
µ
¯
¯
¯
∂m
i
¯
∆(0) = ∆(y) ¯¯det
(y, x)¯¯
¯
∂xj
n
×
n
→
n
(A.18)
x=0
Beweis:. Mit Bedingung A.15(i) ¯der Linksinvarianz
und der Koordinatentransformation
¯
¯ ∂mi (y,x) ¯ 4
n
z = m(y, x) folgt zunächst d z = ¯ ∂xj ¯ d x, was dann zu folgender Umstellung führt:
¯
¯
Z
Z
¯
¯
n
n ¯ ∂mi
d z∆(z)f (g(z))
=
d x¯
(y, x)¯¯ ∆(m(y, x))f (g(y)g(x))
∂xj
G
G
¯
¯
Z
¯
¯
A.15(i)
n ¯ ∂mi
(y, x)¯¯ ∆(m(y, x))f (g(x))
=
d x¯
∂xj
G
An dieser Stelle können wir ∆(x) mit dem Term vor f (g(x)) identifizieren und erhalten:
¯
µ
¶¯
¯
¯
∂m
i
(A.19)
∆(x) = ∆ (m(y, x)) ¯¯det
(y, x) ¯¯
∂xj
Beachten wir nun noch, dass für x = 0 aus den Bedingungen für die Gruppenmultiplikation
g (m(y, x = 0)) = g(y)g(0) = g(y) gilt, so folgt wegen der Eindeutigkeit der Darstellung
der Gruppe, dass m(y, x = 0) = m(y) gelten muss, woraus durch Einsetzen von x = 0 in
Gleichung A.19 die Behauptung folgt.
¥
96
Kapitel A
Anhang
Der letzte Satz gilt allgemein und ist nicht auf jede Liegruppe anwendbar. In unserem
Spezialfall brauchen wir nun aber nur noch eine Parametrisierung der SU (2) auszuwählen
und können mit Gleichung A.18 das Haarsche Maß in dieser Parametrisierung ausrechnen.
Wir wählen die Cayley-Klein-Parametrisierung
µ
¶
x0 + ix1 x2 + ix3
g(x) =
,
x ∈ S3
(A.20)
−x2 + ix3 x0 − ix1
In dieser Darstellung berechnet sich die Gruppenmultiplikation zu


x 0 y 0 − x1 y 1 − x2 y 2 − x3 y 3
 x 0 y 1 + y 0 x 1 + x 2 y 3 − x3 y 2 

m(x, y) = 
 x 0 y 2 + y 0 x 2 − x1 y 3 + x 3 y 1  ,
x 0 y 3 + y 0 x 3 + x 1 y 2 − x2 y 1
(A.21)
Betrachten wir zunächst alle vier Komponenten von x als unabhängige Parameter, so
erhält man mit Satz A.18
¯ ¶
µ
¯
∂mi
y∈S 3
(A.22)
(y, x)¯¯
det
= y02 + y12 + y22 + y32 = 1.
∂xj
x=0
Auf der Kugeloberfläche, über die zu integrieren ist, sind alle Punkte y mit dem gleichen
Maß ∆(0) versehen. Dies bedeutet, dass die Integration im Parameterraum der gewöhnlichen Integration auf der Kugeloberfläche entspricht, sodass sich für das normierte Haarsche Maß dU der Gruppe SU (2)
q
1
dG = 2 1 − x20 dx0 dΩ,
(A.23)
4π
als Lösung ergibt. Hier ist dΩ das Oberflächenmaß der S 2 in einer geeigneten Parametrisierung für x1 , x2 und x3 . Prinzipiell kann auf analoge Weise auch das Haarsche Maß
anderer SU (N ) Gruppen bestimmt werden. Für alle SU (N )-Liegruppen lässt sich eine Eulerwinkel-Parametrisierung berechnen. Eine umfassende Zusammenfassung ist zum
Beispiel in [Til] gegeben. Die einfachsten Parametrisierungen sind die der SU (2) und der
SU (3) mit
2 −1
NY
U=
eiXi xi ,
(A.24)
i=1
wobei Xi die Generatoren der zugrundeliegenden Gruppe sind und xi die generierenden
Eulerwinkel. Für Gruppen mit N > 3 ist diese Parametrisierung komplizierter, läßt sich
aber prinzipiell angeben.
A.4 Aktualisierungsalgorithmen
A.4
A.4.1
97
Aktualisierungsalgorithmen
Heatbath Aktualisierung in SU (N ) Yang-Mills-Theorien
Im Rahmen des Simulated Annealings ist es notwendig, Aktualisierungsschritte der Form
g(x) → r(x)g(x) = g 0 (x)
auszuführen, wobei die neuen g 0 (x) mit der Wahrscheinlichkeitsverteilung e−1/T FU [g;x] dg
erzeugt werden sollen. Wir wollen uns zunächst auf SU (2)-Aktualisierungen beschränken,
sodass dg das Haarsche Maß der SU (2) ist. Auch für den Thermalisierungsprozess der
Konfigurationen ist ein solcher Heatbath-Schritt notwendig. Hier ist das Gewicht der lokale
l
lok
Wirkung SW
(U ; x) durch die Verteilung e−βSW ok(U ;x) dU gegeben. In beiden Fällen haben
wir letztenendes ein neues SU (2)-Element u0 mit dem Gewicht der Boltzmannverteilung
1
0
dP (g 0 ) ∝ e− T tr(g K) dg
(A.25)
†
K
zu wählen. Die Invarianz des Haarschen Maßes unter einer Multiplikation mit K̃ = √det
K†
führt zu
ρ
0
dP (g 0 K̃) ∝ e 2 tr(g ) dg 0
(A.26)
√
mit ρ = T2 det K † . Mit dem Haarschen Maß der SU (2) (A.23) in der Caylay-KleinParametriesierung A.20 lässt sich nun das Wahrscheinlichkeitsmaß des neu zu generierenden Elements als
q
ρ
tr(g 0 (x))
0
2
1 − x20 dx0 dΩ
(A.27)
dP (g K̃) ∝ e
q
(A.28)
= eρx0 1 − x20 dx0 dΩ
aufschreiben. Die so erzeugte Verteilung entspricht einer Boltzmannverteilung mit dem
Maximum bei der Identität. Die Heatbath Aktualisierung g(x) → r(x)g(x) = g 0 (x) besteht
nun aus zwei Schritten
p
1. Erzeugung eines Elementes z mit der Verteilung dP (z) ∝ eρz0 1 − z02 dz0 dΩ und
2. Berechnung der Änderung r(x) = g(z)K̃.
Der zweite Schritt ist unproblematisch, daher wollen wir uns im Folgenden die Erzeugung von z genauer anschauen. Zunächst müssen wir den Parameter z0 ∈ [−1, 1] mit der
Verteilung
q
dP (z0 ) ∝
1 − z02 dz0
(A.29)
erzeugen. Dazu kann ein Algorithmus verwendet werden, wie er in [FH84] und [KP85]
eingeführt wurde, mit einer kleinen Veränderung, die in [Kne99] und [Geh02]p
beschrieben
ist. Nun müssen noch die Parameter z1 , z2 und z3 auf der Kugeloberfläche 1 − z02 · S 2
mit dem Gewicht dΩ erzeugt werden.
Dazu werden zwei auf dem Intervall [0, 1) gleichverteilte Zufallsvariablen ζ1 und ζ2 generiert und aus diesen ein Punkt s auf der Einheitssphäre S 2 wie folgt berechnet:


p 1 − 2ζ1
(A.30)
s =  p1 − ζ12 cos(2πζ2 )
2
1 − ζ1 sin(2πζ2 )
98
Kapitel A
Anhang
p
Damit ergibt sich (z1 , z2 , z3 ) als Multiplikation von s mit der Wurzel 1 − z02 . Aus dem
Parametertupel z = (z0 , z1 , z2 , z3 ) lässt sich nun in der Caylay-Klein-Parametriesierung
das gesuchte g(z) berechnen.
Für Heatbathschritte in SU (3)-Gittereichtheorien wird ein iteratives Vervahren, bei
dem die Heatbath Aktualisierung sukzessive in den Untergruppen durchgeführt wird.
A.4.2
Maximierung von Re tr(gK)
Wir wollen nun das Maximierungsproblem maxg gK, mit g ∈ SU (N ) und K ∈ Gl (N )
lösen, welches insbesondere für die lokalen Aktualisierungen in der Relaxation und Überrelaxation von Bedeutung ist. Zuerst werden wir uns eine explizite Lösung für die SU (2)
angeben, um daraus einen iterativen Algorithmus für die SU (3) zu gewinnen.
Zunächst bemerken wir, dass wir das Problem auf der SU (2) nicht für eine beliebige invertierbare Matrix zu lösen haben, sondern für Matrizen aus einem Untervektorraum mit reeller Dimension Vier. Der Grund liegt in der Bildung der K als Summe von
SU (2)-Matrizen. Den Ergebnisraum dieser Summen finden wir durch eine Erweiterung der
Cayley-Klein-Parametrisierung (A.20) der SU (2). Denn auch die Summe K von SU (2)Elementen besitzt wieder eine Cayley-Klein-Parametrisierung (k0 , k1 , k2 , k3 ), auch wenn
nicht mehr k ∈ S 3 gilt. Wir dehnen den Definitionsbereich der Parametrisierung4
P (k0 , k1 , k2 , d3 ) = k1 + i
3
X
xi σi
(A.31)
i=1
daher von der Sphäre S 3 auf den gesamten 4 aus. Der Raum P ( 4 ) wird so zu einem
Vektorraum mit reeller Dimension Vier. Mit dieser Parametrisierung gelten nun folgende
Eigenschaften
(i)
(ii)
(iii)
(iv)
tr(P (x))
tr(P (x)P (y))
tr(P (x)P (y)† )
det(P (x))
= x0
∀x ∈
= x 0 y 0 − x1 y 1 − x2 y 2 − x3 y 4
= x0 y0 + x1 y1 + x2 y2 + x3 y4 = hx, yi
= tr(P (x)P (x)† ) = kxk2
4
Die letzte Eigenschaft ist nicht sofort zu sehen, ergibt sich aber durch Ausrechenen der
Determinante und der Spur in der entsprechenden Parametrisierung. Das Maximierungsproblem hat daher im Parameterraum die Form
max3 (x0 y0 − x1 y1 − x2 y2 − x3 y4 ).
x∈S
Die Lösung lässt sich durch folgendes Lemma angeben.
Lemma A.4.1. Ist y ∈ 4 gegeben, dann hat das Maximierungsproblem maxx∈S 3 (x0 y0 −
x1 y1 − x2 y2 − x3 y4 ) die Lösung
x=
und es gilt
4
Die σi sind die Paulimatrizen
1
(y0 , −y1 , −y2 , −y3 )
kyk
1
P (x) = p
P (y)
det(P (y))
A.4 Aktualisierungsalgorithmen
99
Beweis:. Der Beweis des zweiten Teils folgt unmittelbar aus der Feststellung, dass durch
tr(P (x)P (y)† ) ein Skalarprodukt in P ( 4 ) definiert ist. Die Maximierung bedeutet in
diesem Falle nur, die Parallelität zwischen P (x) und P (y) herzustellen. Der Beweis
des ersten Teils erfolgt analog, durch die Verkettung der Abbildung (y0 , y1 , y2 , y3 ) 7→
(y0 , −y1 , −y2 , −y3 ) = y 0 mit dem Skalarprodukt im 4 dass nun maxx∈S 3 (hx, yi) zu lösen
ist. Diese Aufgabe wird offensichtlich gelöst, falls x und y 0 parallel sind.
¥
Das ursprüngliche Maximierungsproblem wird nun durch
1
K † ∈ SU (2)
g=p
†
det(K )
gelöst.
(A.32)
Das Problem verändert sich etwas, wenn K tatsächlich eine allgemeine invertierbare
Matrix ist. Auch in diesem Fall kann eine Abwandlung der Calay-Klein-Parametrisierung
über einem komplexen Vektorraum genutzt werden, da die Identiät und die Pauli-Matrizen
eine orthogonale Basis der GL (2) sind.
P (k0 , k1 , k2 , d3 ) = k1 + i
3
X
i=1
xi σi
mit k ∈ 4
(A.33)
Bisher war für das Maximierungsproblem maxg Re tr(gK) nicht relevant, ob der Realteil
gebildet wurde, da sowohl g, als auch K in P ( 4 ) lagen. Ist jedoch K ∈ P ( 4 ) mit der
Parametrisierung P (k) = K, so gelten folgende Eigenschaft.
Lemma A.4.2. (Eigenschaften)
Ist g ∈ P ( 4 ) und K ∈ P ( 4 ), so gilt:
(i) Re tr(P (g)P (K)) = g0 Re(k0 ) + g1 Re(k1 ) + g2 Re(k2 ) + g3 Re(k3 )
⇒ (ii) Re tr(P (g)P (K)) = tr {P (g)P (Re(K))}
Beweis:. Der Beweis der Eigenschaften erfolgt durch Realteil- und Spurbildung.
(A.34)
¥
Da mit nun mit A.34 wieder Re(K) ∈ 4 gilt, ist das allgemeinere Maximierungsproblem auf das spezielle zurückgeführt worden und wir können Lemma A.4.1 anwenden.
Das allgemeinere Maximierungsproblem max Re tr(gK) mit K = P (k) ∈ GL (2) wird
g∈SU (2)
daher durch
gelöst.
g=p
1
det(P (Re(k))† )
P (Re(k))† ∈ SU (2)
(A.35)
Mit dieser Lösung läßt sich nun eine iterative Methode für dass Maximierungsproblem
auf der SU (3) angeben. Sie wurde von N. Cabibbo und E. Marinari vorgeschlagen und
sieht die sukzessive Lösung des Problems in den SU (2)-Untergruppen vor [CM82]. Dazu
wird zunächst eine Startmatrix K1 = K gewählt. Danach erfolgt eine sich auf den SU (2)Untergruppen wiederholende Prozedur.
100
Kapitel A
1. Löse
Anhang
max Re tr(gi Ki ) in der Untergruppe, wobei gi in der betrachteten Unter-
g 0 ∈SU (2)
0
gruppe die Gestalt
¡ g0 0g¢ ∈ SU (2) hat und sonst die Identitát ist, also zum Beispiel mit
der Wahl gi = 0 1 ∈ SU (3). Da die Untergruppenanteile der Ki in P ( ) liegen,
ist in dieser Maximierung Gleichung A.35 als Lösungsansatz notwendig.
2. Berechnung von Ki+1 = gi Ki . Durch weiterzählen i = i + 1 wird nun zur nächsten
Untergruppe und zum nächsten Iterationsschritt übergegangen.
Diese Iteration führt man bis zur numerischen Konvergenz fort. Die Lösung ergibt sich
dann aus dem Produkt der SU (2)-Untergruppenabbildungen als g = ... · g3 · g2 · g1 .
A.4.3
Polarzerlegung von M ∈ GL(N )
Definition: Über einem Körper heißt für eine invertierbare Matrix M ∈ Gl (N ) die
Zerlegung
U ∈ U (N ) unitär und
M = UH
mit
(A.36)
H hermitesch
die Polarzerlegung von M .
Diese Zerlegung existiert, da M invertierbar ist. Die Zerlegung ergibt sich dann aus folgender Definition
H = (M † M )1/2 ,
U = M H −1 .
(A.37)
(A.38)
Eine weitere wichtige Folgerung ist die Zerlegung in eine spezielle unitäre Matrix und eine
hermitesche Matrix, die sich hieraus berechnen läßt.
Bemerkung A.4.3. Hieraus läßt sich unmittelbar eine Zerlegung, M = SR, in eine
spezielle unitäre Matrix S ∈ SU (N ) und eine diagonalisierbare5 Matrix R berechnen.
Beweis:. Zum Beweis ist in Gleichung A.36 nur noch die n-te Wurzel der Determinante
einzuschieben M = U (det U )−1/n (det U )1/n H, sodass für die gesuchte Zerlegung gilt
R = (det U )1/n (M † M )1/2
1
−N
S = (det U )
MH
mit den Bezeichnungen aus der Polarzerlegung.
5
Die Diagonalisierbarkeit folgt aus der Hermitizität von H
−1
,
(A.39)
(A.40)
¥
A.5 Änderung der Wahrscheinlichkeitsverteilung bei Mehrfachanwendung
einer Eichfixierungsmethode
101
A.5
Änderung der Wahrscheinlichkeitsverteilung bei
Mehrfachanwendung einer Eichfixierungsmethode
Nun wird dargelegt, wie sich die Häufigkeitsverteilung über den relativen Funktionalwerten für einen Algorithmus ändert, wenn er n-fach angewendet wird und aus den gefundenen relativen Funktionalwerten der größte ausgewählt wird. Dabei gehen wir davon
aus, dass wir die Wahrscheinlichkeitsverteilung über den relativen Funktionalwerten für
einfache Anwendung der Eichfixierungsmethode kennen.
Wir teilen zunächst die Menge der möglichen Funktionalwerte in disjunkte Klassen
Ki ein. Hier entspricht K1 der Klasse mit den größten relativen Funktionalwerten. Die
übrigen Klassen sind nach absteigenden Funktionalwerten geordnet. Mit Pn [F ∈ Ki ] wird
die Wahrscheinlichkeit bezeichnet, mit der der größte in n Versuchen gefundene relative
Funktionalwert, hier mit F abgekürzt, in der Klasse Ki liegt. Sie ist das Produkt von zwei
Wahrscheinlichkeiten. Zum einen ist dies die Wahrscheinlichkeit für die Bedingung, dass in
n Versuchen keine
kleinerem Index gefunden
S Kopie mit Funktionalwert in einer Klasse mit S
/ j<i Kj ] ist die bedingte
wird6 Pn [F ∈
/ j<i Kj ]. Der zweite Faktor Pn [F ∈ Ki |F ∈
Wahrscheinlichkeit dafür, dass in n Versuchen unter der eben formulierten Bedingung
einer der gefundene Funktionalwerte in der Klasse Ki liegt. Es gilt also
¯
#
"
#
"
¯
[
[
¯
(A.41)
Kj
/
Kj · Pn F ∈ Ki ¯F ∈
/
Pn [F ∈ Ki ] = Pn F ∈
¯
j<i
j<i
Dabei gilt
"
/
Pn F ∈
[
j<i
#
"
Kj = 1 − Pn F ∈
[
j<i
#
Kj = 1 −
X
j<i
Pn [F ∈ Kj ]
und
Pn
6
"
¯
¯
#
"
#
¯
¯
[
[
¯
¯
Kj
= Pn F ∈ Ki ¯F ∈
Kj
F ∈ Ki ¯ F ∈
/
¯
¯
j<i
j≥i
¯
#
"
¯
[
¯
/ Ki ¯ F ∈
Kj
= 1 − Pn F ∈
¯
j≥i
¯
#!n
Ã "
¯
[
¯
Kj
/ Ki ¯ F ∈
= 1 − P1 F ∈
¯
j≥i
¯
#!n
"
Ã
¯
[
¯
Kj
= 1 − 1 − P1 F ∈ Ki ¯F ∈
¯
j≥i
Ã
!n
P1 [F ∈ Ki ]
= 1− 1− P
j≥i P1 [F ∈ Kj ]
...mit anderen Worten, dass keine Kopie mit größerem Funktionalwert gefunden wird.
(A.42)
102
Kapitel A
Anhang
P
!
Es lässt sich zeigen, dass die notwendige Bedingung der Normiertheit j Pn [F ∈ Kj ] = 1
erfüllt ist. Im Idealfall ist die Wahrscheinlichkeitsverteilung der Eichfixierungmethode für
einfache Anwendung bekannt und man kann sie für P1 einsetzen. In realistischen Situationen muss man sie aus der gemessenen Häufigkeitsverteilung gewinnen und dann diese
für P1 einsetzen. Durch Pn ist nun die Häufigkeitsverteilungen für die n-fache Anwendung
bereitgestellt.
Index
Gleichgewichtsverteilung, 34
Gluonpropagator, 13, 18
Gradientenverfahren, 30
Greensfunktion, 9
Gribov-Kopie, 25
Gribov-Mehrdeutigkeit, 10, 25
Gribov-Rauschen, 27
Gribovgebiet, 26
Gribovhorizont, 26
Überrelaxation, 29
Überrelaxationsparameter, 29, 64
Akzeptanzkriterium, 33
Cayley-Klein-Parametrisierung, 96
charakteristische Funktion, 34
Confinement, 3
Coulomb-Eichung, 24
Critical Slowing Down, 29
Haarsches Maß, 17
Heatbath Aktualisierung, 97
detailed balance, 94
Eichfixierung, 10
Coulomb-Eichung, 24
Gribov-Kopie, 25
kovariante Eichung, 20
Landau-Eichung, 24
Laplace-Eichung, 21
maximal abelsche Eichung, 22
Zentrumseichung, 23
Eichorbit, 25
Eichpotential, 7
Eichtemperatur, 33
Ergodizität, 91
erzeugendes Funktional
Gitter, 17
Kontinuum, 9
Importance Sampling, 17
kombinatorisches Optimierungsproblem,
32
kovariante Ableitung, 8
kovariante Eichung, 20
Lagrangedichte, 9
Landau-Eichung, 24
Laplace-Eichung, 21
Markov-Bedingung, 91
Markov-Kette, 91
detailed balance, 94
Ergodizität, 91
Normiertheit, 91
Stabilität, 91
maximal abelsche Eichung, 22
Metropolis-Algorithmus, 32
Akzeptanzkriterium, 33
mikrokanonische Schritte, 29
Multigrid-Algorithmus, 31
Faddeev-Popov Trick, 9
Faddeev-Popov-Geistfeld, 11
Faddeev-Popov-Operator, 26
Farbladung, 7
Feldstärketensor, 8
Flavour, 7
fourierbeschleunigte Eichfixierung, 30
SU (3) Simulation, 65
Fundamental Modular Region, 26
Funktionalintegral
Integrationsmaß, 9
Performanz, 42
Plaquette, 16
Polarzerlegung, 100
Quarkpropagator, 13
Quasithermalisiertheit, 36
Ghostpropagator, 13, 19
103
104
Rekurrenz, 91
relativer Funktionalwert, 54
Relaxation, 28
Simulated Annealing, 31
SU (2) Simulation, 43
SU (3) Simulation, 68
Fahrplan, 35
Kostenfunktion, 34
Optimierungskriterien, 43
Parameter, 43
Quasiethermalisiertheit, 36
Schritte, 35
Schrittverteilung, 49
Temperatur, 33
Temperaturschritt, 35
Thermalisierungsschritt, 33
Stabilität, 91
Temperaturschritt, 35
thermisches Gleichgewicht, 32
Wahrscheinlichkeitsverteilung
Abstand, 92
Wick-Rotation, 13
Wilson-Wirkung, 16
Wirkung
effektive, 11
Yang-Mills-Lagrangedichte, 8
Zentrumseichung, 23
INDEX
Literaturverzeichnis
[Adl81]
Adler, S.L.: Overrelaxation method for the Monte Carlo evaluation of the
partition function for multiquadratic actions. In: Phys. Rev. D 23 (1981),
S. 2901
[AK89]
Aarts, E. ; Korst, J.: Simulated Annealing and Boltzmann Machines.
John Wiley & Sons, Inc., 1989
[AL73]
Abers, E. S. ; Lee, B. W.: Gauge Theories. In: Phys. Rept. 9 (1973), S.
1–141
[B+ 85]
Batrouni, G. G. u. a.: Langevin simulations of lattice field theories. In:
Phys. Rev. D32 (1985), S. 2736
[B+ 91]
Bornyakov, V. G. u. a.: The Density of monopoles in SU(2) lattice gauge
theory. In: Phys. Lett. B261 (1991), S. 116–122
[Bai99]
Baierl, R. H.: Konvexe Polyeder. Klassische und hybride numerische Generierungsmethoden. 1999
[BBMPS96] Bali, G. S. ; Bornyakov, V. ; Müller-Preussker, M. ; Schilling,
K.: Dual Superconductor Scenario of Confinement: A Systematic Study of
Gribov Copy Effects. In: Phys. Rev. D54 (1996), S. 2863–2875
[BCLM03]
Bloch, J. C. R. ; Cucchieri, A. ; Langfeld, K. ; Mendes, T.: Running
coupling constant and propagators in SU(2) Landau gauge. In: Nucl. Phys.
Proc. Suppl. 119 (2003), S. 736–738
[Ber66]
Berezin, F. A.: Method of Second Quantization. Academic Press, 1966
[BFGM72]
Bardeen, W. A. ; Fritzsch, H. ; Gell-Mann, Murray: Light-cone current
algebra, π0 decay, and e+ e− annihilation. (1972)
[BH76]
Barker, J. A. ; Henderson, D.: What ist ”liquid”? Understanding the
states of matter. In: Rev. Mod. Phys. 48 (1976), S. 587–671
[Bil95]
Billingsley, P.: Probability and Measure. John Wiley & Sons, 1995
[BIMMP04] Bakeev, T. D. ; Ilgenfritz, E.-M. ; Mitrjushkin, V. K. ; MüllerPreussker, M.: On practical problems to compute the ghost propagator
in SU(2) lattice gauge theory. In: Phys. Rev. D69 (2004), S. 074507
105
106
LITERATURVERZEICHNIS
[BW87]
Brown, F. R. ; Woch, T. J.: Overrelaxed heat bath and Metropolis algorithms for accelerating pure gauge Monte Carlo calculations. In: Phys. Rev.
Lett. 58 (1987), S. 2394
[CFIS04]
Chernodub, M. N. ; Feldmann, R. ; Ilgenfritz, E.-M. ; Schiller,
A.: Phase structure and gauge boson propagator in the radially active 3D
compact Abelian Higgs model. In: Phys. Rev. D 70 (2004), S. 074501
[CM82]
Cabibbo, N. ; Marinari, E.: A new method for updating SU(N) matrices
in computer simulations fo gauge theories. In: Phys. Lett. B119 (1982), S.
387–390
[CM98]
Cucchieri, A. ; Mendes, T.: A multigrid implementation of the Fourier
acceleration method for Landau gauge fixing. In: Phys. Rev. D57 (1998), S.
3822–3826
[CM03]
Cucchieri, A. ; Mendes, T.: Critical slowing-down in SU(2) Landaugauge-fixing algorithms at β = ∞. In: Comput. Phys. Commun. 154 (2003),
S. 1–48
[Cuc97]
Cucchieri, A.: Gribov copies in the minimal Landau gauge: The influence
on gluon and ghost propagators. In: Nucl. Phys. B508 (1997), S. 353–370
[Cuc99]
Cucchieri, A.: Infrared behavior of the gluon propagator in lattice Landau
gauge: The three-dimensional case. In: Phys. Rev. D60 (1999), S. 034508
[D+ 88]
Davies, C. T. H. u. a.: Fourier acceleration in lattice gauge theories. 1.
Landau gauge fixing. In: Phys. Rev. D 37 (1988), S. 1581
[DDFGO97] Del Debbio, L. ; Faber, M. ; Greensite, J. ; Olejnik, S.: Center
dominance and Z(2) vortices in SU(2) lattice gauge theory. In: Phys. Rev.
D55 (1997), S. 2298–2306
[DF90]
Decker, K. M. ; Forcrand, P.: Pure SU (2) lattice gauge theory on 324
lattices. In: Nucl. Phys. Proc. Suppl. 17 (1990), S. 567
[DG05]
Di Giacomo, Adriano: Confinement in QCD: Results and open problems.
(2005)
[Die03]
Dietrich, D.D.: Produktion von Partonen in Anwesenheit klassischer Felder in ultrarelativistischen Schwerionenkollisionen. (2003). – Disertationsarbeit im Fach Physik an der Goethe-Universität in Frankfurt am Main
[ELRT00]
Engelhardt, M. ; Langfeld, K. ; Reinhardt, H. ; Tennert, O.: Deconfinement in SU(2) Yang-Mills theory as a center vortex percolation transition. In: Phys. Rev. D61 (2000), S. 054504
[Fey48]
Feynman, R. P.: Space-time approach to nonrelativistic quantum mechanics. In: Rev. Mod. Phys. 20 (1948), S. 367–387
[FGML73]
Fritzsch, H. ; Gell-Mann, Murray ; Leutwyler, H.: Advantages of the
color octet gluon picture. In: Phys. Lett. B47 (1973), S. 365–368
LITERATURVERZEICHNIS
107
[FH65]
Feynman, R. P. ; Hibbs, A. R.: Quantum Mechanics and Path Integrals.
McGraw-Hill, 1965
[FH84]
Fabricius, K. ; Haan, O.: Heat bath method for the weisted Eguchi-Kawai
model. In: Phys. Lett. B143 (1984), S. 459
[For89]
Forcrand, P. de: Multigrid techniques for quarik propagator. In: Nucl.
Phys. Proc. Suppl. 9 (1989), S. 516–520
[FP67]
Faddeev, L. D. ; Popov, V. N.: Feynman diagrams for the Yang-Mills
field. In: Phys. Lett. B25 (1967), S. 29–30
[Geh02]
Gehrmann, B.: The step scaling function of QCD at negative flavor number.
(2002)
[GG84]
Geman, S. ; Geman, D.: Stochastic relaxation, Gibbs distributions, and the
bayesian restoration of images. In: IEEE Transactions on Pattern Analysis
and Machine Intelligence 6 (1984), S. 721
[Giu97]
Giusti, L.: Lattice gauge-fixing for generic covariant gauges. In: Nucl. Phys.
B498 (1997), S. 331–344
[GLR04]
Gattnar, Jochen ; Langfeld, Kurt ; Reinhardt, Hugo: Signals of confinement in Green functions of SU(2) Yang- Mills theory. In: Phys. Rev. Lett.
93 (2004), S. 061601
[GM64]
Gell-Mann, Murray: A schematic model of baryons and mesons. In: Phys.
Lett. 8 (1964), S. 214–215
[GM84]
Gutbrod, F. ; Montvay, I.: Scaling of the quark - anti-quark potential
and improved actions in SU(2) lattice gauge theoriy. In: Phys. Lett. B136
(1984), S. 411
[GPP+ 01]
Giusti, L. ; Paciello, M. L. ; Parrinello, C. ; Petrarca, S. ; Taglienti, B.: Problems on lattice gauge fixing. In: Int. J. Mod. Phys. A16
(2001), S. 3487–3534
[Gri78]
Gribov, V. N.: Quantization of non-Abelian gauge theories. In: Nucl. Phys.
B139 (1978), S. 1
[Gro05]
Gross, D. J.: The discovery of asymptotic freedom and the emergence of
QCD. In: Proc. Nat. Acad. Sci. 102 (2005), S. 9099–9108
[GS89]
Goodman, J. ; Sokal, A. D.: Multigrid Monte Carlo method: conceptual
foundations. In: Phys. Rev. D 40 (1989), S. 2035–2071
[Gut96]
Gutbrod, F.: A study of the gluon propagator in SU(2) lattice gauge
theory. (1996). – DESY-96-252
[HLS92]
Hulsebos, A. ; Laursen, M. L. ; Smit, J.: SU(N) multigrid Landau gauge
fixing. In: Phys. Lett. B291 (1992), S. 431–436
108
LITERATURVERZEICHNIS
[Jon90]
Jones, H. F.: Goups, Representations and Physics. Adam Hilger, 1990
[KGJV83]
Kirkpatrick, S. ; Gelatt Jr., C. D. ; Vecchi, M. P.: Optimization by
Simulated Annealing. In: Science 220 (1983), S. 671
[Kle84]
Klein, F.: Vorlesung über das Ikosaeder. B. G. Teubner Verlag, 1884
[Kne99]
Knechtli, F.: The static potential in the SU(2) Higgs model. (1999)
[KP85]
Kennedy, A. D. ; Pendleton, B. J.: Improved heat bath method for
Monte Carlo calculations in lattice guge theories. In: Phys. Lett. B156 (1985),
S. 393–399
[KPSZ05]
Kovalenko, A. V. ; Polikarpov, M. I. ; Syritsyn, S. N. ; Zakharov,
V. I.: Properties of P-vortex and monopole clusters in lattice SU(2) gauge
theory. In: Phys. Rev. D71 (2005), S. 054511
[KSW87]
Kronfeld, Andreas S. ; Schierholz, G. ; Wiese, U. J.: Topology and
dynamics of the confinement mechanism. In: Nucl. Phys. B293 (1987), S.
461
[Lee75]
Lee, B. W.: Lecture notes at Les Houches Summer School. (1975)
[LRG02]
Langfeld, K. ; Reinhardt, H. ; Gattnar, J.: Gluon propagators and
quark confinement. In: Nucl. Phys. B621 (2002), S. 131–156
[LRT98]
Langfeld, Kurt ; Reinhardt, Hugo ; Tennert, Oliver: Confinement and
scaling of the vortex vacuum of SU(2) lattice gauge theory. In: Phys. Lett.
B419 (1998), S. 317–321
[LSWP98]
Leinweber, Derek B. ; Skullerud, Jon I. ; Williams, Anthony G. ;
Parrinello, Claudio: Gluon propagator in the infrared region. In: Phys.
Rev. D58 (1998), S. 031501
[Man76]
Mandelstam, S.: Vortices and quark confinement in non-Abelian gauge
theories. In: Phys. Rept. 23 (1976), S. 245–249
[Man99]
Mandula, Jeffrey E.: The gluon propagator. In: Phys. Rept. 315 (1999),
S. 273–284
[MO87]
Mandula, J. E. ; Ogilvie, M.: The gluon is massive: A lattice calculation
of the gluon propagator in the Landau gauge. In: Phys. Lett. B185 (1987),
S. 127–132
[Mon00]
Montero, A.: SU(3) vortex-like configurations in the maximal center gauge. In: Nucl. Phys. Proc. Suppl. 83 (2000), S. 518–520
[MRR+ 53]
Metropolis, N. ; Rosenbluth, A. W. ; Rosenbluth, M. N. ; Teller,
A. H. ; Teller, E.: Equation of state calculations by fast computing machines. In: J. Chem. Phys. 21 (1953), S. 1087–1092
[Nam74]
Nambu, Yoichiro: Strings, monopoles, and gauge fields. In: Phys. Rev. D10
(1974), S. 4262
LITERATURVERZEICHNIS
109
[NF04]
Nakajima, H. ; Furui, S.: Infrared features of the lattice Landau gauge
QCD. In: Nucl. Phys. Proc. Suppl. 129 (2004), S. 730–732
[Pag75]
Pagels, H.: Departures from Chiral Symmetry: a Review. In: Phys. Rept.
16 (1975), S. 219
[Rot97]
Rothe, H. J.: Lattice Gauge Theories. Bd. Vol. 59. World Scientific Lecture
Notes in Physics, 1997
[SIMPS05a] Sternbeck, A. ; Ilgenfritz, E. M. ; Muller-Preussker, M. ; Schiller, A.: The influence of Gribov copies on the gluon and ghost propagator.
In: AIP Conf. Proc. 756 (2005), S. 284–286
[SIMPS05b] Sternbeck, A. ; Ilgenfritz, E.-M. ; Müller-Preussker, M. ; Schiller, A.: Towards the infrared limit in SU(3) Landau gauge lattice gluodynamics. In: Phys. Rev. D72 (2005), S. 014507
[Sin78]
Singer, I. M.: Some remarks on the Gribov ambiguity. In: Commun. Math.
Phys. 60 (1978), S. 7–12
[SO04]
Silva, P. J. ; Oliveira, O.: Gribov copies, lattice QCD and the gluon
propagator. In: Nucl. Phys. B690 (2004), S. 177–198
[SS96]
Suman, H. ; Schilling, K.: First Lattice Study of Ghost Propagators in
SU(2) and SU(3) Gauge Theories. In: Phys. Lett. B373 (1996), S. 314–318
[Sta93]
Stals, L.: Parallel Implementation of Multigrid Methods. In: Proceedings
of the Sixth Biennial Conference on Computational Techniques and Applications, Canberra (1993)
[STW02]
Stack, J. D. ; Tucker, W. W. ; Wensley, R. J.: Confinement in SU(3):
Simple and generalized maximal Abelian gauge. (2002)
[SW01]
Stack, J. D. ; Wensley, R. J.: The maximal Abelian gauge, monopoles,
and vortices in SU(3) lattice gauge theory. (2001)
[’t 71]
’t Hooft, G.: Renormalization of massless Yang-Mills fields. In: Nucl.
Phys. B33 (1971), S. 173–199
[’t 78]
’t Hooft, G.: On the phase transition towards permanent quark confinement. In: Nucl. Phys. B138 (1978), S. 1
[’t 81]
’t Hooft, G.: Topology of the gauge condition and new confinement phases
in non-Abelian gauge theories. In: Nucl. Phys. B190 (1981), S. 455
[Til]
Tilma, T. E.: SU(N) and U(N) Euler angle parametrization with applications for multiparticle entanglement modeling. . – UMI-31-10593
[Wil74]
Wilson, K. G.: Confinement of quarks. In: Phys. Rev. D10 (1974), S.
2445–2459
[Wol90]
Wolff, U.: Critical slowing down. In: Nucl. Phys. Proc. Suppl. 17 (1990),
S. 93–102
110
LITERATURVERZEICHNIS
[Zwa91]
Zwanziger, D.: Vanishing of zero momentum lattice gluon propagator and
color confinement. In: Nucl. Phys. B364 (1991), S. 127–161
[Zwa04]
Zwanziger, D.: Nonperturbative Faddeev-Popov formula and infrared limit
of QCD. In: Phys. Rev. D69 (2004), S. 016002
Danksagung
Ich danke Herrn Prof. Michael Müller-Preußker für die Bereitstellung dieses sehr
interessanten Themas als Diplomarbeit, für seine anhaltende Geduld und die zahlreichen
klärenden und den Horizont erweiternden Diskussionen, die die Entstehung dieser
Diplomarbeit begleiteten.
Michael Ilgenfritz danke ich für die Anregungen und die Unterstützung insbesonders in
hektischen und unübersichtlichen Phasen des Dimplomierens. Ich habe auch sehr den
erheiternden, informativen Gedankenaustausch mit ihm und Andre Sternbeck über die
deutsche Rechtschreibung und Grammatik genossen.
Andre Sternbeck danke ich für die Bereitstellung des Programmpaketes mit dem ich
die Gittereichfixierung durchführen konnte und in dass ich die Ikosaeder-Eichfixierung
einbinden durfte. Ich danke ihm außerdem für die erleuchtenden Diskussionen und
Hinweise und für die Bereitstellung des Bildes zum Ghost-Propagator.
Insbesonder danke ich auch Dirk Peschka für die hilfreiche Diskussion meiner Arbeit und
die zahlreichen Denkanstöße.
Ich danke dem Rechenzentrum der Humboldt-Universität und dem “Norddeutschen
Verbund für Hoch- und Höchstleistungsrechnen” für die Bereitstellung von Rechenzeit
auf den rechenstarken Rechner-Clustern.
Abschließend möchte ich meinen Freunden und meiner Familie für den sozialen und emotionalen Rückhalt und die moralische Unterstützung während der Zeit der Diplomarbeit
danken.
111
Eidesstattliche Versicherung
Hiermit erkläre ich an Eides statt, daß ich die vorliegende Diplomarbeit selbstständig
verfaßt und keine anderen als die angegebenen Hilfsmittel verwendet habe.
Peter Schemel
Berlin, den 19.12.2005
verwendete Hilfsmittel:
• Matlab: für die Auswertung der Daten und die Erstellung der Grafiken
• Latex: für die Formatierung des vorliegenden Textes
• Fortran90: für die numerischen Berechnungen

Zugehörige Unterlagen

ppt Version

Direktes Problem

Beispiel 4 Das Kanban-Zuordnungsproblem (KZP)

Vergleich verschiedener Methoden zur Fixierung der Landau

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können