Stabilität und Instabilität des relativistischen Elektronen

Werbung
Stabilität und Instabilität
des relativistischen
Elektronen-Positronen-Felds
in Hartree-Fock-Näherung
Dissertation an der Fakultät für
Mathematik und Informatik der
Ludwig-Maximilians-Universität München
von
Norbert Röhrl
eingereicht im Oktober 2000
Erster Berichterstatter: Prof. Dr. H. Siedentop
Zweiter Berichterstatter: Prof. Dr. V. Bach
Tag der mündlichen Prüfung: 22.12.2000
1
Inhaltsverzeichnis
Zusammenfassung
2
0. Notationen
4
1. Einleitung
1.1 Von Atomen zur Quantenmechanik
1.2 Stabilität der Materie
1.3 Relativistische Materie
5
5
7
9
2. Das Elektronen-Positronen-Feld
2.1 Der Diracoperator mit Coulombpotential
2.2 Der Fockraum
2.3 Quantenelektrodynamik
2.4 Die Hartree-Fock-Näherung
2.5 Resultate
13
13
15
21
23
31
3. Das Infimum der Energie des Vakuums
3.1 Stabilität des Vakuums
3.2 Implementation translationsinvarianter Dichtematrizen
3.3 Das Infimum der Energie für α > 4/π
3.4 Das Infimum der Energie mit chemischem Potential
3.5 Folgerungen für die Energie ohne chemisches Potential
3.6 Hilfssätze
33
33
34
40
47
51
53
4. Stabilität von Atomen
4.1 Eine Ungleichung für Diracoperatoren
√
4.2 Der Fall Zα = 3/2
57
57
62
5. Anhang
5.1 Hilbert-Schmidt-Operatoren
5.2 Die Matrixelemente des Coulombpotentials
64
65
66
Literatur
71
2
Zusammenfassung
Diese Arbeit ist ein Beitrag zur Untersuchung der Stabilität der Materie in
einem Modell, das durch einige Näherungen aus der Quantenelektrodynamik (QED)
abgeleitet ist.
Materie in unserem Sinne besteht aus beweglichen Elektronen und Positronen
und unbeweglichen Atomkernen mit Coulombwechselwirkung zwischen allen Paaren
von Teilchen. Man nennt Materie stabil, wenn ihre Energie nach unten durch ein
negatives Vielfaches der Anzahl der Elektronen, Positronen und Kerne beschränkt
ist, unabhängig von der Konfiguration der Kerne.
Die Frage, warum Wasserstoff stabil ist, oder in anderen Worten, warum das
Elektron des Wasserstoffs nicht in den Kern stürzt, ist klassisch nicht zu klären
und spielte eine bedeutende Rolle bei der Entstehung der Quantenmechanik. Es
handelt sich daher bei der Stabilität der Materie um ein rein quantenmechanisches
Phänomen. Im nichtrelativistischen Fall wurde sie zuerst im Jahre 1967 von Dyson
und Lenard [18, 19] bewiesen.
Wir beschreiben das relativistische Elektronen-Positronen-Feld in zweiter Quantisierung und Hartree-Fock-Näherung mit Coulombwechselwirkung im externen
Coulombfeld eines Atomkerns (Abschnitt 2). Von Bach, Barbaroux, Helffer und
Siedentop [4] wurde für dieses Modell ein exaktes Energiefunktional hergeleitet. Es
basiert auf dem QED-Hamiltonoperator, wie man ihn in dem Standardwerk von
Bjorken und Drell [17] findet, ohne die Beiträge des magnetischen Vektorpotentials.
Das Modell ohne externes Potential wurde zuvor in der Physik von Chaix, Iracane
und Lions [12, 13] untersucht.
Bach et al. zeigten in ihrer Arbeit unter anderem, dass die Energie des Systems
ohne externes Potential nichtnegativ ist, falls für den Wert der Feinstrukturkonstante
α ≤ 4/π gilt, und dass die Energie des Systems mit dem Coulombpotential eines
Atomkerns bis Kernladungszahl Z = 68 (Erbium) für den physikalischen Wert von
α ≈ 1/137 nichtnegativ ist.
In einer gemeinsamen Arbeit mit Hundertmark und Siedentop [16] konnten wir
die Optimalität des Stabilitätsresultats ohne externes Potential zeigen: Die Energie
pro Teilchen ist nach unten unbeschränkt für α > 4/π ≈ 1, 27 (Abschnitt 3.3).
Chaix et al. haben in ihrer Arbeit [13] bereits einen Hinweis für die Instabilität des
Elektronen-Positronen-Felds für α > π/ log 4 ≈ 2, 27 gegeben. Sie argumentierten
für die Instabilität des Modells in einem Einheitsvolumen mit Hilfe eines translationsinvarianten Zustands γC . Da ein solcher Zustand aber in jedem Einheitsvolumen
die gleiche Energie und die gleiche Teilchenzahl besitzt, sind diese Größen auf dem
ganzen Raum R3 entweder Null, nicht definiert oder unendlich. Wir fanden eine universelle Methode, durch geeignetes Abschneiden translationsinvariante Zustände zu
approximieren (Abschnitt 3.2) und konnten so mit γC die Existenz von Zuständen
beliebig negativer Energie pro Teilchen im ganzen Raum zeigen. Die richtige Wahl
eines Parameters in γC führt schließlich zum optimalen Resultat.
Mit Brummelhuis und Siedentop [11] ist es uns gelungen, das Stabilitätsresultat für Atome zu verbessern (Abschnitt 4). Die Energie ist im physikalischen Fall
3
α ≈ 1/137 für Atome mit Kernladungszahl Z ≤ 117 nichtnegativ; in dem Modell sind also alle bekannten Elemente stabil. Bach et al. zeigen in ihrem kurzen
und eleganten Beweis eine Ungleichung zwischen den Beträgen des freien Diracoperators und des Diracoperators mit Coulombpotential. Dazu quadrieren sie diese
und wenden die Dreiecksungleichung an. Wir jedoch erzielen durch ein aufwendigeres
Argument die optimale Konstante der quadrierten Ungleichung: Mit der Streckungshomogenität des Diracoperators für masselose Teilchen können wir das Problem
auf eine Ungleichung für Multiplikationsoperatoren reduzieren. Die Zusatzterme im
massiven Fall werden durch den bekannten positiven Wert des Grundzustands des
Diracoperators mit Coulombpotential kontrolliert.
Da die Energie im Stabilitätsfall immer nichtnegativ ist, hat das Modell das
Hartree-Fock-Vakuum als Grundzustand. Unterhalb der kritischen Werte der Parameter α und Z ist dieser auch eindeutig. Kerne ziehen es folglich vor, alleine zu
bleiben, anstatt sich mit Elektronen zu umgeben, wie wir es in der Natur beobachten.
Um die Erzeugung von Teilchen zu begünstigen, subtrahieren wir ein so genanntes
chemisches Potential, ein Vielfaches der Ruheenergie der Teilchen, von der Gesamtenergie. Die Stabilität wird dadurch nicht beeinflusst, da die Energie nur proportional zur Teilchenzahl geändert wird. Ohne externes Potential kann für α = 1/137
das 0, 999983-fache der Ruheenergie abgezogen werden, ohne den Grundzustand zu
verändern. Subtrahiert man die ganze Ruheenergie oder mehr, so ist das Infimum
der Energie −∞ und es gibt keinen Grundzustand (Abschnitt 3.4).
Für Atome ist die Zahl der Teilchen eines Zustands ungleich schwieriger zu bestimmen. Es gibt aber ein von der Natur motiviertes Potential, welches die Bestimmung
der Teilchenzahl nicht erfordert und realistischere Resultate verspricht. G.M. Graf
wies uns auf die Asymmetrie zwischen Elektronen und Positronen in der Natur hin:
Elektronen sind vorhanden und um ein Positron zu erhalten muss man ein ElektronPositron-Paar erzeugen. Diese Beobachtung entspricht einem Potential proportional
zur Ladung des Zustands. Es begünstigt Elektronen und belastet Positronen doppelt. Die Untersuchung eines solchen Potentials wird Gegenstand unserer zukünftigen Forschung an diesem Modell sein.
4
Notationen
Eine Zahl nennen wir positiv, falls sie größer als Null ist. Ist sie größer gleich Null,
so heißt sie nichtnegativ. Den Realteil einer komplexen Zahl bezeichnen wir mit <
und den Imaginärteil mit =. Vektoren im Rn schreiben wir als x und Vektoren mit
”
Spin“ aus G := R3 × {1, . . . , 4} als x = (x, τ ), τ = 1, . . . , 4. Wir verwenden auf
R3 × {1, . . . , 4} das Produktmaß aus dem Lebesguemaß auf R3 und dem Zählmaß
auf {1, . . . , 4}.
Die Kugel mit Radius r um den Punkt x bezeichnen wir mit B(x, r) und mit
Br die charakteristische Funktion von B(0, r). Die charakteristische Funktion des
Intervalls [c, d] ⊆ R schreiben wir als I[c,d] (·).
Der Einheitsvektor zu einem x ∈ Rn \ {0} ist ω x := x/|x| mit Komponenten
(ω x )i , i = 1, . . . , n; der Einheitsvektor des Nullvektors ist der Nullvektor. Für die
Einheitsmatrix in n Dimensionen verwenden wir In .
Außer den üblichen Ls -Räumen mit den Normen
Z
s
kf ks :=
|f (x)|s d x
n
C0∞
benutzen wir die Symbole
für glatte Funktionen mit kompaktem Träger, C0 für
stetige Funktion mit kompaktem Träger und H 1 bzw. H 1/2 für die L2 -Funktionen
mit endlicher Norm:
Z
kf k2H 1 :=
kf k2H 1/2
:=
Z
n
2
ˆ
(1 + |p|2 )|f(p)|
dp < ∞ ,
n
2
ˆ
(1 + |p|)|f(p)|
dp < ∞ .
Wir verwenden ausschließlich die Fouriertransformation
Z
−n/2
(0.1)
fˆ(p) := (2π)
e−ipx f (x) d x ;
n
bei Integralkernen γ(x, y) verzichten wir auf die explizite Kennzeichnung der Fouriertransformierten und schreiben einfach γ(p, q). Beträge von Differentialoperatoren
und Ausdrücke in p sind als die entsprechenden Multiplikationsoperatoren im Fourierraum definiert.
Operatoren nennen wir positiv, wenn sie die Ungleichung A ≥ 0 erfüllen und
den zu einem Operator B adjungierten Operator bezeichnen wir mit B ∗ . Für den
Definitionsbereich von B verwenden wir das Symbol D(B). Der Antikommutator
zweier beschränkter Operatoren A und B ist schließlich durch
gegeben.
{A, B} := AB + BA
5
Einleitung
Von Atomen zur Quantenmechanik
Die Vorstellung, dass die Natur aus kleinsten Bausteinen, so genannten Atomen
(griechisch atomos“, unteilbar), aufgebaut ist, geht auf den griechischen
”
Philosophen Demokrit (ca. 460-370 v.Chr.) zurück. Sie ist eine Synthese aus den
Positionen von Parmenides (ca. 540-480 v.Chr.), nichts verändert sich“, und von
”
Heraklit (ca. 540-480 v.Chr.), alles fließt“. Demokrit nahm an, dass die Atome ewig
”
und unveränderlich seien und es unendlich viele verschieden geformte gebe, die zu
der schier unendlichen Vielfalt an Körpern zusammengesetzt werden könnten.
Bis zu ersten quantitativen Hinweisen auf die Existenz von Atomen sollte es aber
noch über 2000 Jahre dauern. Dalton und Prout beobachteten um 1800, dass verschiedene Elemente nur in bestimmten Gewichtsverhältnissen miteinander reagieren,
was sich gut mit der Existenz von Atomen erklären lässt.
Dem ersten Atommodell (Prout, 1815) lag die Annahme zu Grunde, Atome aller
Elemente seien aus Wasserstoff aufgebaut. Diese Vorstellung führte schließlich zu
einer Klassifikation der Atome nach ihren chemischen Eigenschaften, dem Peri”
odischen System“ von Meyer und Mendelejeff (1869).
Etwa zur gleichen Zeit wurde die elektrische Ladung quantitativ gemessen. Die
Untersuchung der Elektrolyse veranlasste Faraday 1833 zur Vermutung einer atomaren Grundeinheit der Ladung. Thomson entdeckte 1897 die Elektronen, die Träger
der negativen Ladung, als Kathodenstrahlen einer Vakuumröhre und bestimmte ihre
Masse auf 1/1837 der Masse des Wasserstoffatoms. Er schlug 1904 das so genannte
Puddingmodell für Atome vor, in welchem die positive Ladung gleichmäßig über
das ganze kugelförmige Atom verteilt ist und die Elektronen, wie Rosinen in einem
Pudding, um eine feste Ruhelage schwingen können. Weitgehend unbekannt ist, dass
im gleichen Jahr von Nagaoka [36] schon ein viel realistischeres Modell diskutiert
wurde, bestehend aus einer großen Anzahl negativ geladener Teilchen, angeordnet
auf einem Kreis in gleichen Abständen, und einer positiven Ladung großer Masse in
der Mitte.
Aus Streuversuchen von Geiger und Marsden mit α-Teilchen durch dünne Goldfolien im Jahre 1909 schloss Rutherford 1911, dass sich im Zentrum von Atomen
eine positive Ladung zusammen mit dem Großteil der Masse auf einem Raum
von 10−14 m befinden müsse. Den vergleichsweise sehr großen Atomradius von etwa 10−10 m erklärte er durch die Elektronen, die in diesen Abständen vom Zentrum
den Kern umkreisen. Das Modell wird deshalb auch Planetenmodell genannt.
Bei den Umläufen um den Kern müsste das Elektron nach den Gesetzen der
klassischen Elektrodynamik ständig Strahlung emittieren; damit würde es Energie
verlieren und in den Atomkern stürzen. Stattdessen findet man in der Strahlung
angeregter Atome scharfen Spektrallinien, die sich mit dem Modell nicht erklären
lassen. Auch die chemische, optische und mechanische Gleichheit aller Atome des
leichtesten Elements, des Wasserstoffs, ist mit einem Modell, das dem Elektron so
viele verschiedene Möglichkeiten des Umlaufs um den Kern lässt, nur schwer in
Einklang zu bringen.
6
Bohr postulierte daraufhin 1913 im Widerspruch zur klassischen Mechanik und
Elektrodynamik, dass es stationäre Energiezustände gibt, in denen Atome nicht
strahlen: Sie strahlen nur, wenn ein Elektron von einem stationären Zustand in einen
tieferer Energie springt. Durch Energieabsorbtion kann ein Elektron auch in einen
Zustand höherer Energie springen. Die Frequenz ν der ausgesendeten Strahlung
ergibt sich mit dem Planckschen Wirkungsquantum h nach folgender Formel aus
der Differenz der stationären Energieniveaus:
hν = E1 − E2 .
Er postulierte auch eine Auswahlbedingung für die erlaubten Bahnen, die den stationären Energiezuständen entsprechen. Es sind Kreisbahnen, deren Drehimpuls ein
ganzzahliges Vielfaches von ~ = h/2π ist:
L = n~ .
Der Radius der engsten sich daraus ergebende Bahn für das Elektron, der so genannte Bohrradius, liegt mit 0, 529 · 10−10 m in der Größenordnung des Wasserstoffradiuses und die aus den Postulaten errechenbaren Übergangsfrequenzen für Wasserstoff
stimmen sehr gut mit den Messungen überein.
Die Auswahlhypothese von Bohr ist eine echte Quantenbedingung. Die erste
Quantenhypothese wurde schon im Jahre 1900 von Max Planck zur Beschreibung
der Strahlung eines schwarzen Körpers aufgestellt. Danach strahlt jener nur Energiequanten proportional zur Frequenz ν der Strahlung aus:
= hν .
Die Proportionalitätskonstante ist wieder das Plancksche Wirkungsquantum h.
Diese Gleichung konnte man vielleicht noch als mathematischen Kunstgriff interpretieren, aber die Hinweise auf die Existenz diskreter Energiequanten traten in den
folgenden Jahren immer deutlicher hervor.
In seiner berühmten Arbeit über den photoelektrischen Effekt 1905 postulierte
Einstein, dass Licht aus Strahlen von Korpuskeln, den Photonen, die sich mit Lichtgeschwindigkeit fortbewegen und deren Energie mit der Formel hν von der Frequenz
des Lichts abhängt. Mit dieser Hypothese konnte er mehrere Phänomene erklären,
von denen der Photoeffekt, für den er auch den Nobelpreis bekam, der bekannteste
ist. Auch der Compton-Effekt (Compton, 1924) lässt sich in Übereinstimmung damit
als Stoßvorgang zwischen einem Elektron und einem Photon deuten.
Den Zusammenhang zwischen diesen diskreten Abläufen und den bekannten
kontinuierlichen Vorgängen formulierte erstmals Bohr 1923 für die Strahlung von
Atomen in seinem Korrespondenzprinzip. Er konstatierte, dass es im Grenzfall
großer Quantenzahlen eine asymptotische Übereinstimmung der statistischen Resultate der klassischen Physik und der Quantentheorie gibt.
Die Matrizenmechanik von Heisenberg, Born und Jordan (1925) und die Wellenmechanik von Schrödinger (1926) begründeten die moderne Quantenmechanik.
Schrödinger zeigte in seiner Arbeit 1926 auch die Äquivalenz beider Theorien. Die
relativistische Quantentheorie von Elektronen wurde von Dirac im Jahre 1928 in
zwei Artikeln publiziert. Der erste enthält bereits den berühmten Diracoperator,
der im Folgenden eine zentrale Rolle spielen wird.
7
Grundlegend wird auch das 1925 von Pauli formulierte Ausschlussprinzip oder
auch Pauliprinzip sein, welches besagt, dass keine zwei Fermionen, also insbesondere
Elektronen, im gleichen Zustand sein dürfen. Ohne dieses Naturgesetz würden alle
Elektronen eines Atoms auf den niedrigsten Energiezustand stürzen; die Chemie,
und damit unsere Welt, wäre ohne die Existenz der Elektronenschalen eine völlig
andere.
Stabilität der Materie
Das einfachste quantenmechanische Modell der Materie besteht aus K ruhenden,
positiv geladenen Atomkernen und N beweglichen, negativ geladenen Elektronen
und Coulombwechselwirkung zwischen allen Paaren von Teilchen. Die Annahme,
die Kerne seien unbeweglich, wird auch als Born-Oppenheimer Näherung bezeichnet
und begründet sich durch den großen Unterschied der Massen von Elektronen und
Kernen.
Stabilität eines physikalischen Systems ist eine Eigenschaft der Grundzustandsenergie. In der Physik strebt jedes System zu Zuständen niedrigerer Energie. Das
Infimum der Energie heißt Grundzustandsenergie E und wenn es einen Zustand mit
dieser Energie gibt, so heißt dieser Grundzustand.
Wir unterscheiden zwei Begriffe der Stabilität:
• Stabilität der ersten Art: Die Grundzustandsenergie ist endlich.
• Stabilität der zweiten Art: Die Grundzustandsenergie pro Teilchen ist nach
unten beschränkt.
Unter Stabilität der Materie versteht man Stabilität der zweiten Art. In obigem
Modell bedeutet dies
E ≥ −C(N + K)
mit einer positiven Konstante C, die nicht von der Konfiguration der Kerne abhängt.
Die Energie wird also auch über alle möglichen Konfigurationen der Kerne minimiert.
Es gibt ein einfaches Beispiel, welches wir frei aus dem Überblicksartikel von Lieb
[29] entnehmen, um die Notwendigkeit der Stabilität zu verdeutlichen. In der bayerischen Fassung denkt man an zwei gleiche Bierflaschen. Ist ihr Abstand groß genug,
so ist die (Grundzustands-) Energie des Biers jeder Flasche in guter Näherung E(N),
wobei N die Anzahl der Teilchen des Biers ist. Werden diese zusammengebracht und
in einen Maßkrug gefüllt, so hat der Liter Bier nun die Energie E(2N) und die Energiedifferenz berechnet sich zu δE = 2E(N) − E(2N). Ist Bier stabil, so ist mit
δE = o(N) die Energieänderung gering; wäre E(N) aber proportional zu −N k mit
einem k > 1, ergäbe sich δE = −(2k − 2)E(N) und es würde sich Energie in der
Ordnung der gesamten (atomaren) Energie des Biers freisetzten und zu einer starken
Explosion führen.
Um konkreter zu werden, führen wir jetzt die genauen Formeln für die Energie des
nichtrelativistischen Modells ein, das auch historisch zuerst untersucht wurde. Wir
bezeichen die festen Positionen der Kerne mit Rj ∈ R3 , ihre Kernladungszahl mit
Zj > 0, j = 1, . . . , K und die Positionen der Elektronen mit xi ∈ R3 , i = 1, . . . , N.
Des weiteren schreiben wir m und e für Masse bzw. Ladung der Elektronen und ∆i
für den Laplaceoperator auf den 3 Komponenten des i-ten Elektrons. Damit ist der
8
Hamiltonoperator der nichtrelativistischen Materie gegeben durch
N
K
N X
K
N
X
X
X
X
e2
e2 Zi Zj
e2 Zj
~2
∆i +
+
−
.
−
2m
|xi − xj | i,j=1 |Ri − Rj | i=1 j=1 |xi − Rj |
i,j=1
i=1
i<j
i<j
Die Erwartungswerte der Terme sind der Reihe nach die (nichtrelativistische) kinetische Energie der Elektronen, die Coulombenergie der Elektronenpaare, die Coulombenergie der Kernpaare und die Coulombenergie zwischen Elektronen und Kernen.
Den Coulombteil des Operators, der die gesamte Energie der elektrostatischen Wechselwirkung der Teilchen darstellt, bezeichnen wir mit e2 VC .
Für N = 1 ist der Zustandsraum dieses Operators H := L2 (R3 ) ⊗ Cs , der Raum
der quadratintegrierbaren Funktionen im R3 mit s komplexen Komponenten. Der
Parameter s steht für die Anzahl der verschiedenen Spinzustände des Elektrons;
der physikalische Fall ist also s = 2. Ist N > 1, so ist der N-Teilchenraum wegen
des Pauliprinzips nicht einfach das N-fache Produkt, sondern das (total) antisymV
metrische Tensorprodukt H(N ) := N H.
An dieser Stelle wird zur Verringerung der Komplexität in der Quantenchemie gerne die Hartree-Fock-Näherung eingeführt. Sie ist eine der ältesten
Näherungsmethoden bei Mehrteilchenproblemen in der Quantenmechanik und eine
der wenigen, deren Genauigkeit sich rigoros abschätzen lässt [2, 5]. Dabei beschränkt
man die Zustände in H(N ) auf so genannte Slaterdeterminanten
f1 (x1 ) . . . fn (x1 ) .
.. det ..
...
. f (x ) . . . f (x )
1 n
n n
mit fi ∈ H, i = 1, . . . , n orthonormal. Bis auf Weiteres werden wir ohne diese
Näherung auskommen; eine Verallgemeinerung davon werden wir erst wieder im
Hauptteil der Arbeit aufgreifen.
Stabilität der nichtrelativistischen Materie wurde zuerst 1967 von Dyson und
Lenard [18, 19] bewiesen und 1975 von Federbush nach einer anderen Methode [21].
In [32] und [33] wurde 1975 und 1976 von Lieb und Thirring die untere Schranke für
die Energie pro Teilchen nochmal wesentlich verbessert und der Beweis stark vereinfacht. Das Resultat der letzten Arbeit für N Elektronen mit s Spinkomponenten
und K Kernen, in Einheiten mit 2m = e = ~ = 1 ist

!1/2 2
K
X 7/3
 .
E ≥ −1, 31s2/3 N 1 +
Zj /N
j=1
Dies ist ein großer Fortschritt im Vergleich zum ersten Beweis von Dyson und Lenard,
der ungefähr E ≥ −1014 N lieferte.
In vielen Fällen gibt es auch Stabilitätsresultate unter Berücksichtigung eines
klassischen Magnetfeldes. Da in dieser Arbeit keine Magnetfelder behandelt werden,
zitieren wir nur die wichtigsten Resultate. Einen guten Überblick geben die Artikel
[31] und [35].
9
Relativistische Materie
Für die Beschreibung von inneren Elektronen in Atomen größerer Kernladungszahl
spielen relativistische Effekte eine nicht mehr zu vernachlässigende Rolle. Mit dem
Bohrschen Postulat mvr = n~ und der nichtrelativistischen Gleichung für die Zentrifugalkraft Ze2 /r 2 = mv 2 /r erhalten wir für die Geschwindigkeit auf der innersten
(n = 1) Bahn v = Ze2 /~. Wir vereinfachen den Ausdruck mit Hilfe der Sommerfeldschen Feinstrukturkonstante α := e2 (~c)−1 ≈ 1/137. Damit ist die Geschwindigkeit
gleich Zαc und es ist ersichtlich, dass das innerste Elektron in Atomen großer Kernladungzahlen den Kern in Geschwindigkeiten umkreist, die eine relativistische Behandlung nahelegen. In der theoretischen Chemie wird oft Gold (Z = 79) als erstes
Element genannt, dessen chemische Eigenschaften sich klassisch nicht mehr ausreichend genau berechnen lassen.
In der mathematischen Beschreibung ändert sich der Coulombteil e2 VC des
Hamiltonoperators gegenüber dem nichtrelativistischen Fall nicht, da wir die
Coulombeichung wählen. Von den relativistischen Operatoren für die kinetische Energie werden wir in diesem Abschnitt zwei vorstellen.
Ein pseudorelativistischer Hamiltonoperator ist
N p
X
−~2 c2 ∆i + m2 c4 + e2 VC ,
i=1
wobei die Wurzel des negativen Laplaceoperators über die Fouriertransformation
p
definiert ist. Er gibt die korrekte relativistische kinetische Energie p2 c2 + m2 c4
wieder, vernachlässigt aber die Spineffekte und enthält im Ortsraum alle Potenzen
des Differentialoperators, beschreibt also eine nichtlokale Theorie.
Im Gegensatz zum nichtrelativistischen Fall skalieren kinetische Energie und
Coulombenergie wie die inverse
Länge:√ Skaliert man die Längeneinheiten x → λx
√
mit einem λ > 0, so folgt −∆ → λ−1 −∆ und |x|−1 → λ−1 |x|−1 . Insbesondere ist
das Infimum der Energie im masselosen Fall entweder 0 oder −∞, da man jede beliebige positive Energie zu 0 skalieren kann und jede negative zu −∞. Für negative
Energien lässt man λ gegen 0 streben: Man kontrahiert also alles auf den Ursprung.
Im nichtrelativistischen Fall skaliert die kinetische Energie wie λ−2 und da sie positiv
ist, verhindert das den Kollaps.
Skaliert man mit λ = ~c und ersetzt mc2 durch m, erhält man den Operator in
der gebräuchlichen Form
(1.1)
N q
X
p2i + m2 + αVC
i=1
mit p = −i∇ und der Vereinbarung, dass ein Ausdruck mit p in einem Operator als
Multiplikation im Fourierraum bezüglich der gewöhnlichen Fouriertransformation
(0.1) gemeint ist. Die Feinstrukturkonstante α ist dimensionslos und kann nicht
wegskaliert werden.
Wegen der Operatorungleichung
p
|p| ≤ p2 + m2 ≤ |p| + m ,
10
gilt für die Energie Em des Modells mit Masse m die Ungleichung
E0 ≤ Em ≤ E0 + Nm .
Die Masse hat also auf die Stabilität keinen Einfluss.
Die Stabilität eines wasserstoffartigen Atoms (K = N = 1) zeigt man mit der
Kato-Ungleichung, die auf Herbst [25] und Kato [27] zurückgeht:
Z
Z
π
−1
2
|x| |u(x)| d x ≤
|p||û(p)|2 d p ∀ u ∈ L2 (R3 ) .
(1.2)
2 3
3
Die Energie des Atoms mit einem Elektron im normierten Zustand endlicher Energie
u ∈ H 1/2 (R3 ) ist also
(1.3)
Z
E(u) =
u(x) d x
u(x) |p| − α
|x|
3
Z
Z
Z
π
|u(x)|2
2
d x ≥ 1 − Zα
=
|p||û(p)| d p − Zα
|x|
2
3
3
Z
Da die Konstante
π
2
3
|p||û(p)|2 d p .
in der Ungleichung scharf ist, folgt unmittelbar
2
und
π
2
inf E(u) = −∞ für Zα > .
π
Die Stabilität hängt also im Unterschied zum nichtrelativistischen Fall von Zα ab.
Wir werden sehen, dass dies eine generelle Eigenschaft relativistischer Materie ist
und wir bei mehreren Atomkernen zusätzlich noch eine Schranke für die Feinstrukturkonstante α bekommen. Abschätzungen der Form (1.3) und die Kato-Ungleichung
werden uns später noch öfter begegnen.
Die Geschichte dieses Modells begann mit dem oben besprochenen wasserstoffartigen Fall (K = N = 1), der 1975 von Weder [44] und 1977 von Herbst [25] studiert
wurde. Trotz des späteren Erscheinens des Artikels von Herbst wird der Operator
p
Zα
p2 + m2 −
|x|
inf E(u) = 0
für Zα ≤
oft als Herbstoperator bezeichnet. Im Jahr 1983 bewiesen Daubechies und Lieb [15]
die Stabilität eines Moleküls mit einem Elektron (N = 1, K beliebig). Stabilität der
Materie wurde schließlich zuerst 1984 von Conlon [14] gezeigt und die Konstanten
1986 von Fefferman und de la Llave [22] und nochmals 1988 von Lieb und Yau [34]
verbessert.
In der letzten Arbeit wird für Elektronen mit s Spinkomponenten und Kerne mit
maximaler Kernladungszahl Z = maxj=1,...,K Zj die Stabilität unter den Bedingungen
2
1
≈ 0, 0213s−1 und Zα ≤
α≤
47s
π
gezeigt. Im physikalischen Fall, s = 2 und α ≈ 1/137, bedeutet das Stabilität bis
Z = 87 (Francium). Das Modell ist instabil falls Zα > 2/π, was wir oben schon
11
anhand des wasserstoffartigen Atoms sehen konnten, oder α > 128/(15π) ≈ 2, 72
bei beliebigem Z > 0.
Im Jahre 1996 wurde von Lieb, Loss und Siedentop ein einfacher Beweis der Stabilität mit Hilfe der Thomas-Fermi-von-Weizsäcker-Theorie und einiger, größtenteils
in den oben genannten Artikeln bewiesenen, Ungleichungen gegeben. Das Ergebnis
ist Stabilität für α ≤ 0, 77 und Z hinreichend klein; im physikalischen Fall gilt
Z ≤ 59 (Praseodym). Neben der Verbesserung der Schranke für α gilt dieses Resultat auch unter Berücksichtigung von magnetischen Feldern.
Die Stabilität dieses Modells impliziert auch Stabilität der nichtrelativistischen
Materie. Wie wir durch das Skalierungsargument am Anfang zeigten, ist im stabilen
masselosen Fall das Infimum der Energie gleich 0 und es gilt somit
N
X
i=1
−1
|pi | ≥ −αVC .
Die Ungleichung 0 ≤ (|p| − α /2)2 impliziert α−1 |p| ≤ p2 + α−2 /4 und damit gilt
für die nichtrelativistische Energie in Einheiten mit 2m = e = ~ = 1
N
X
i=1
p2i
+ VC ≥
N
X
i=1
p2i − α−1 |p| ≥ −Nα−2 /4 .
Wegen der restriktiven Bedingungen an α und Zα für relativistische Stabilität kann
das die Beweise für nichtrelativistische Stabilität aber nicht ersetzen.
Der relativistische Hamiltonoperator für die kinetische Energie ist der freie Diracoperator
1
~c α · ∇ + mc2 β
i
2
3
auf dem Hilbertraum H := L (R ) ⊗ C4 mit den 4 × 4-Matrizen α1 , α2 , α3 , β und der
Notation
3
X
∂
αi
α · ∇ :=
.
∂x
i
i=1
Nach Skalierung mit ~c und Substitution der Masse mc2 → m erhält man
D 0 := α · p + mβ .
Die kinetische Energie soll wie beim Herbstoperator eine Wurzel aus dem Quadrat
der relativistischen kinetischen Energie p2 + m2 sein. Dies erreicht man durch die
Relationen
{αi , αj } := αi αj + αj αi = 2δij ,
{αi , β} = 0 und β 2 = I4 für i, j ∈ {1, 2, 3} .
Interessanter Weise ist 4 die kleinste Dimension, in der man obige Relationen realisieren kann. Darüber hinaus will man einen selbstadjungierten Operator und fordert
deshalb zusätzlich, dass die Matrizen hermitesch sind. Eine Möglichkeit der Darstellung der Matrizen, sind die von Dirac gewählten so genannten Diracmatrizen
I2 0
0 σi
β :=
,
αi :=
,
0 −I2
σi 0
12
mit den Paulimatrizen
0 1
0 −i
1 0
σ1 :=
, σ2 :=
, σ3 :=
.
1 0
i 0
0 −1
Die Anzahl der Komponenten der Zustände ist also wegen der Struktur auf 4
festgelegt. Das Spektrum des Diracoperators ist (−∞, −mc2 ) ∪ (mc2 , ∞) und daher
lassen sich seine Erwartungswerte nicht mehr unmittelbar als kinetische Energie
interpretieren.
Eine Möglichkeit, dieses Problem zu umgehen, ist der Brown-Ravenhall-Operator
[10], die Einschränkung des Diracoperators mit Coulombpotential auf den positiven
Spektralraum von D 0 . Eine physikalische Diskussion dieser Näherung findet sich
in den Artikeln [39, 40] von Sucher. Mathematisch untersucht wurde der Operator
aber erst in den letzten Jahren. Die erste Arbeit von Evans, Perry und Siedentop
[20] behandelte den Fall eines Atoms der Kernladungszahl Z mit einem einzigen
Elektron. Sie zeigten, dass die Energie durch eine nichtpositive Konstante nach unten
beschränkt ist, falls Z ≤ Zc := 2/[(2/π + π/2)α], und nach unten unbeschränkt für
Z > Zc . Die kritische Kernladungszahl wurde zuvor von Hardekopf und Sucher [23]
aufgrund numerischer Untersuchungen vermutet. Im physikalischen Fall α ≈ 1/137
bedeutet dies Stabilität bis Z = 114, was alle bekannten Elemente abdeckt. Die
untere Schranke ist tatsächlich positiv, wie in zwei Arbeiten von Tix [42, 43] gezeigt
wurde.
Von Balinsky und Evans [6] wurde die Stabilität von Molekülen mit einem Elektron (N = 1, K beliebig) gezeigt, falls alle Kernladungszahlen kleiner gleich der kritischen sind und α ≤ αc ≈ 0, 1257. Stabilität der Materie mit masselosen Elektronen
wurde in diesem Kontext schließlich von Hoever und Siedentop [26] für Z ≤ 88 (bei
α = 1/137) gezeigt.
Die so genannte Methode der zweite Quantisierung bietet eine grundsätzlich andere Möglichkeit den freien Diracoperator als kinetische Energie zu interpretieren.
Sie beschreibt Elektronen und Positronen, deren Antiteilchen, und macht die
Beschränkung auf eine feste Teilchenzahl überflüssig. Die Methode wurde fast gleichzeitig zur mathematischen Formulierung der Quantenmechanik um 1930 von
Dirac, Fock, Jordan und Wigner entwickelt. Wegen der damit verbundenen, für
die Physik damals neuen mathematischen Probleme, verzögerte sich jedoch ihre Entwicklung. Wir werden diese Methode in der vorliegenden Arbeit für das ElektronenPositronen-Feld vorstellen.
13
Das Elektronen-Positronen-Feld
Unser Modell soll ein Atom mit ruhendem Kern der Ladungszahl Z und relativistischen Elektronen und Positronen beschreiben. Wir verwenden das Wort Teilchen“
”
als Oberbegriff für Elektronen und Positronen. Der Kern wird als externes Potential
realisiert und nicht wie die Teilchen quantisiert.
−
−
b
m
Coulo
Z
+
v
Die Energie besteht aus der relativistischen
kinetischen Energie der Elektronen und Positronen, der Coulombenergie zwischen den Teilchen
und dem Atomkern und der Coulombenergie der
Teilchen untereinander.
Man fasst die kinetische und die Coulombenergie bezüglich des Kerns eines
Teilchens zur Einteilchenenergie zusammen, weil sie ein Attribut jedes einzelnen
Teilchens ist und nicht von anderen Teilchen abhängt. Die Coulombenergie zwischen den Teilchen wird als Wechselwirkungsenergie bezeichnet.
In diesem Abschnitt stellen wir zuerst den Diracoperator mit Coulombpotential
vor. Es folgt die Definition des Fockraums und der Erzeugungs- und Vernichtungsoperatoren. Wir führen dann den QED-Hamiltonoperator auf dem Fockraum ein und
diskutieren einige seiner Eigenschaften. Unter anderem geben wir einen lückenlosen
Beweis für die Beobachtung von J.P. Solovej, dass der vollständig normalgeordnete
QED-Hamiltonoperator nicht stabil ist. Dieses Problem kann eliminiert werden,
indem man sich auf Hartree-Fock-Zustände beschränkt. Über die Verträglichkeit
der Normalordnung mit der Definition der Hartree-Fock-Zustände werden wir eine
Verallgemeinerung eines Lemmas von D. Hundertmark beweisen. Diese Zustände
lassen sich durch so genannte Ladungsdichtematrizen charakterisieren und auf einer
Teilmenge der Zustände können wir ein vom QED-Hamiltonoperator motiviertes,
endliches Energiefunktional definieren.
Wir bedanken uns an dieser Stelle für die Erlaubnis beider Autoren, ihre Resultate
verwenden zu dürfen.
Im Folgenden halten wir uns zum großen Teil an die Artikel [4], [1] und das
Buch von Thaller über Diracoperatoren [41]. Wir werden jedoch die Ladungsdichtematrizen anders definieren, um eine präzise Übereinstimmung mit den Hartree-FockZuständen zu erreichen. Daraus ergibt sich eine leichte Verschiebung der Definitionen der verschiedenen Energien. Zusätzlich werden wir explizit die Endlichkeit des
Energiefunktionals beweisen.
Der Diracoperator mit Coulombpotential
Die Einteilchenenergie jedes einzelnen Elektrons oder Positrons, also seine relativistische kinetische Energie und seine Coulombenergie bezüglich des Kerns, ist gegeben
durch den Diracoperator mit Coulombpotential
1
Z
~c α · ∇ + mc2 β − e2
i
|x|
14
auf dem Hilbertraum H := L2 (R3 ) ⊗ C4 = L2 (G), wobei G := R3 × {1, . . . , 4}. Wie
bei (1.1) skalieren wir die Längeneinheiten mit λ = ~c, ersetzen mc2 durch m und
erhalten
Z
D Z := −iα · ∇ + mβ − α
.
|x|
√
Für Zα < 3/2 ist D Z√selbstadjungiert auf seinem Definitionsbereich D(D Z ) =
H 1 (R3 ) ⊗ C4 , für Zα ≤ 3/2 ist er wesentlich selbstadjungiert auf C0∞ (R3 \ {0})
[41, Beispiel 4.17, Theorem 4.4] und für Zα < 1 gibt es genau eine selbstadjungierte
Erweiterung, deren Definitionsbereich D(D Z ) in H 1/2 (R3 ) ⊗ C4 enthalten ist [37].
Funktionen in H 1/2 (R3 )⊗C4 sind genau
p die Zustände u endlicher kinetischer Energie:
0
Der Erwartungswert von |D | = p2 + m2 in u ist endlich. Mit der Ungleichung
von Kato (1.2) folgt auch, dass (u, D Z u) endlich ist; H 1/2 (R3 ) ⊗ C4 ist also der
Formbereich von D Z . Um im selbstadjungierten Fall zu bleiben, setzten wir in der
ganzen Arbeit Zα < 1 voraus.
Der Diracoperator mit Coulombpotential beschreibt die Energie des Wasserstoffatoms in fast perfekter Übereinstimmung mit dem Experiment. Sein Spektrum
besteht wie im freien Fall (Z = 0) aus dem wesentlichen Spektrum (−∞, −m) ∪
(m, ∞) [41, Theorem 4.7] und aus den positiven Eigenwerten En in der Lücke [41,
Abschnitt 7.4] mit
−1/2
Z 2 α2
√
En = m 1 +
, n = 0, 1, . . . .
(n + 1 − Z 2 α2 )2
Letztere werden durch das negative Coulombpotential des Kerns aus dem positiven
Teil des wesentlichen Spektrums gezogen. Physikalisch entspricht das der Bindung
von Elektronen durch den Kern.
Um eine Interpretation der negativen Energien zu geben, unterteilen wir den
Hilbertraum H in den positiven und den negativen Spektralraum H+ und H− von
D Z . Die zugehörigen orthogonalen Spektralprojektionen bezeichnen wir mit P+ bzw.
P− . Die Zustände in H+ interpretiert man als Elektronen und die in H− mittels einer
so genannten Ladungskonjugation als Positronen, den Antiteilchen der Elektronen.
Der Ladungskonjugationsoperator ist eine antiunitäre Abbildung C : H → H mit
(Cg)(x) = iβα2 g(x). Zur Illustration betrachten wir formal einen Diracoperator mit
einem skalaren externen elektrostatischen Potential V und Teilchenladung e:
D(e) := −iα · ∇ + mβ + eV .
Es gilt
(Cf, D(e)Cg) =
Z
(Cf )(x)D(e)(Cg)(x) d x
G
=
Z
G
−if (x)α2 βD(e)iβα2 g(x) d x = (f, α2 βD(e)βα2 g) ,
und α2 βDβα2 berechnet sich mit Hilfe der folgenden Gleichungen
α2 β βα2 = 1 ,
α2 β α2 βα2 = −α2 ,
α2 β β βα2 = −β ,
α2 β αi βα2 = αi , i ∈ {1, 3} ,
15
zu
−i(α1 , −α2 , α3 ) · ∇ − mβ − eV .
Die komplexe Konjugation liefert schließlich
iα · ∇ − mβ − eV .
Der Diracoperator ist also (antiunitär) äquivalent zu −D(−e). Mittels C wird somit
der negative Spektralraum von D(e) auf den positiven Spektralraum von D(−e)
abgebildet, dem Diracoperator eines Teilchens mit entgegengesetzter Ladung, des
Antiteilchens.
Es wären natürlich theoretisch auch andere Aufspaltungen von H in zwei orthogonale Teilräume H+ und H− denkbar. Unsere Wahl zeichnet sich aber gegenüber
allen anderen dadurch aus, dass das Infimum der Energie in dem hier betrachteten
Modell am höchsten liegt. Wir geben den Beweis dieser Tatsache aus dem Artikel
[4, Theorem 6] in Satz 5.1 im Anhang.
Der Fockraum
Um über beliebige Elektronen- und Positronenzahlen sprechen zu können, führen wir
einen speziellen Hilbertraum ein, den Fockraum. Seine normierten Vektoren stellen
die reinen Zustände des Modells dar. Wir setzen den Einteilchen-Elektronenraum
gleich
(1)
F+ := H+ .
Der Einteilchen-Positronenraum ist dann
(1)
F− := CH− ,
wobei C der Ladungskonjugationsoperator ist. Wir bemerken, dass für die algebraische Struktur des Fockraums nur die Antiunitarität von C ausschlaggebend ist:
Nimmt man eine andere antiunitäre Abbildung C 0 , so ist der resultierende Fockraum
zu unserem isomorph. Die n-Teilchenräume sind wegen der Fermistatistik durch das
(total) antisymmetrische Tensorprodukt der Einteilchenräume gegeben:
(n)
F± :=
n
^
ν=1
(1)
(0)
(0)
F± für n ≥ 1 und F+ := F− := C .
Der n-Elektronen- und m-Positronenraum ist das Tensorprodukt
(n)
(m)
F(n,m) := F+ ⊗ F− ,
und der Fockraum ist die Summe über alle Teilchenzahlen,
∞
M
F(n,m) .
F :=
n,m=0
Jeder Vektor in F(n,m) schreibt sich als Linearkombination aus (nicht notwendigerweise endlich vielen) so genannten einfachen Vektoren
(2.1) (f1 ∧ f2 ∧ · · · ∧ fn ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm ) ,
(1)
fi ∈ F+ , i = 1, . . . , n ,
(1)
gj ∈ F− , j = 1, . . . , m .
16
Das Skalarprodukt zweier Elemente aus F(n,m) ist auf einfachen Vektoren gegeben
durch
0
h(f1 ∧ f2 ∧ · · · ∧ fn ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm ), (f10 ∧ f20 ∧ · · · ∧ fn0 ) ⊗ (g10 ∧ g20 ∧ · · · ∧ gm
)i
= n!m! det[(fi , fj0 )]1≤i,j≤n det[(gi , gj0 )]1≤i,j≤m .
Es verschwindet für zwei Vektoren aus Räumen mit verschiedener Positronen- oder
Elektronenzahl, und für 1 ∈ F(0,0) = C definieren wir h1 , 1i := 1. Wir unterscheiden
das Skalarprodukt auf F von dem auf H durch spitze Klammern h· , ·i anstatt der
runden (· , ·). Der Vektor (2.1) wird mittels
ψ (n,m) (x1 , . . . , xn ; y1, . . . , ym ) :=
X
σ∈
n
sgn(σ)fσ(1) (x1 ) · · · fσ(n) (xn )
!
X
τ∈
m
sgn(τ )gτ (1) (y1 ) · · · gτ (m) (ym )
!
als Funktion aufgefasst, wobei Sn die Permutationsgruppe von n Elementen und
sgn(τ ) für τ ∈ Sn das Signum der Permutation τ ist. Das Skalarprodukt in dieser
Darstellung ist
hψ (n,m) , φ(n,m) i
Z
=
Gn ×Gm
ψ (n,m) (x1 , . . . , ym )φ(n,m) (x1 , . . . , ym ) d x1 · · · d xn d y1 · · · d ym .
Im Formalismus der zweiten Quantisierung spielen Erzeugungs- und Vernichtungsoperatoren eine zentrale Rolle. Wir definieren nun diese für Elektronen und Positronen in unserer Repräsentation des Fockraums.
Für ein f ∈ H und m, n ≥ 0 ist der Elektronen-Vernichtungsoperator a(f ) : F → F
auf dem Teilraum F(n+1,m) gegeben durch
(a(f )ψ)(n,m) (x1 , . . . , xn ; y1 , . . . , ym ) :=
Z
√
n + 1 d x (P+ f )(x) ψ (n+1,m) (x, x1 , . . . , xn ; y1 , . . . , ym ) .
G
Dies definiert durch lineare Fortsetzung einen, wie wir unten sehen werden
beschränkten, Operator auf ganz F, welcher antilinear von f abhängt. Sind
(1)
f1 , . . . , fn+1 ∈ F+ linear unabhängig, so ist seine Wirkung auf einen einfachen Vektor
a(f1 ) (f1 ∧ f2 ∧ · · · ∧ fn+1 ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm )
√
= n + 1 (f1 ∧ · · · ∧ fn+1 ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm ) ;
er vernichtet also das Elektron f1 .
17
Der adjungierte Operator dazu ist der Elektronen-Erzeugungsoperator a∗ (f ) :
F → F. Er ist auf F(n,m) definiert durch
(a∗ (f )ψ)(n+1,m) (x1 , . . . , xn+1 ; y1 , . . . , ym ) :=
n+1
X
1
√
(−1)j+1 (P+ f )(xj )ψ (n,m) (x1 , . . . , x̂j , . . . , xn+1 ; y1 , . . . , ym ) ,
n + 1 j=1
und (a∗ (f )ψ)(0,0) := 0. Hierbei bedeutet x̂j , dass wir die j-te Komponente auslassen.
Der Operator a∗ (f ) hängt linear von f ab und auf einfachen Vektoren wirkt er in
der naheliegenden Weise,
a∗ (f ) (f1 ∧ f2 ∧ · · · ∧ fn ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm )
1
=√
(f ∧ f1 ∧ f2 ∧ · · · ∧ fn ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm ) .
n+1
Mit g ∈ H folgen die kanonischen Antikommutationsrelationen (CAR)
{a(f ), a(g)} = {a∗ (f ), a∗ (g)} = 0 ,
{a(f ), a∗ (g)} = (f, P+ g)
und damit auch die Beschränktheit der Operatoren
ka∗ (f )ψk2 + ka(f )ψk2 = hψ, {a(f ), a∗ (f )}ψi = kP+ f k2 kψk2 .
Der Positronen-Vernichtungsoperator b(f ) : F → F ist definiert durch
(b(f )ψ)(n,m) (x1 , . . . , xn ; y1, . . . , ym ) :=
Z
√
n
(−1) m + 1 d y (CP− f )(y) ψ (n,m+1) (x1 , . . . , xn ; y, y1, . . . , ym ) .
G
Wegen der Antilinearität der Ladungskonjugation C hängt er linear von f ab.
Schließlich ist der Positronen-Erzeugungsoperator b∗ (f ) : F → F mit
(b∗ (f )ψ)(n,m+1) (x1 , . . . , xn ; y1 , . . . , ym+1 ) :=
m+1
(−1)n X
√
(−1)k+1 (CP− f )(yk ) ψ (n,m) (x1 , . . . , xn ; y1 , . . . , ŷk , . . . , ym+1 )
m + 1 k=1
und (b∗ (f )ψ)(0,0) := 0 gegeben. Er hängt wiederum antilinear von f ab. Es ergeben
sich ähnlich wie oben die Antikommutatoren
{b(f ), b(g)} = {b∗ (f ), b∗ (g)} = 0 ,
{b∗ (f ), b(g)} = (f, P− g)
und die analoge Beziehung für die Normen
kb∗ (f )ψk2 + kb(f )ψk2 = hψ, {b(f ), b∗ (f )}ψi = kP− f k2 kψk2 .
Wie man leicht aus den Definitionen entnehmen kann, antikommutieren alle Paare
aus Elektronen- und Positronen-Erzeugungs- und Vernichtungsoperatoren: Mit der
Notation a# (f ) für sowohl a(f ) als auch a∗ (f ) gilt
{b# (g), a# (f )} = 0 .
18
Der Feldoperator auf dem Fockraum ist
Ψ(f ) = a(f ) + b∗ (f )
mit adjungiertem
Ψ∗ (f ) = a∗ (f ) + b(f );
Er ist beschränkt und hängt antilinear von f ab. Es gelten die Antikommutatorbeziehungen
{Ψ(f ), Ψ(g)} = {Ψ∗ (f ), Ψ∗ (g)} = 0 ,
{Ψ∗ (f ), Ψ(g)} = (f, g)
und daraus folgt wiederum
kΨ∗ (f )ψk2 + kΨ(f )ψk2 = hψ, {Ψ(f ), Ψ∗(f )}ψi = kf k2kψk2 .
Den Feldoperator Ψ kann man als Vernichtungsoperator bezüglich des Diracsees
betrachten. In diesem Bild sind im Vakuum alle negativen Energiezustände des
Diracoperators aufgefüllt. Ein Loch“ im Diracsee wird als Positron interpretiert, es
”
hat positive Einteilchenenergie und positive Ladung. Deshalb entspricht der Erzeugungsoperator b∗ (f ) dem Füllen eines Lochs bzw. dem Vernichten eines Positrons
im Diracsee.
Der normierte Vektor Ω := 1 ∈ F(0,0) wird von allen Vernichtungsoperatoren auf
die Null abgebildet, d.h. a(f )Ω = b(f )Ω = 0 ∀f ∈ H. Er entspricht also einem
normierten Zustand ohne Teilchen, dem Vakuum. Diese Eigenschaften charakterisieren das Vakuum bis auf eine komplexe Phase eindeutig.
Definition 2.1. Wir nennen eine Orthonormalbasis (ei )i∈ von H verträglich mit
der Zerlegung H+ ⊕ H− , falls ei ∈ H+ ∩ H 1/2 (R3 ) ⊗ C4 für i ≥ 0 und ei ∈
H− ∩ H 1/2 (R3 ) ⊗ C4 für alle anderen i. Damit schreiben wir kurz
ai := a(ei ) ,
a∗i :=a∗ (ei ) ,
Ψi :=ai + b∗i ,
Ψ∗i :=a∗i + bi .
bi := b(ei ) ,
b∗i :=b∗ (ei ) ,
Eine Hilbertraumbasis von F(n,m) ist gegeben durch
a∗i1 · · · a∗in b∗j1 · · · b∗jm Ω , 0 ≤ i1 < · · · < in , 0 > j1 > · · · > jm ,
und so schreibt sich ein allgemeines Element des Fockraums als
X
Y Y
ϕ=
cI,J
a∗i
b∗j Ω
I⊆{0,1,... }
J⊆{−1,−2,... }
i∈I
j∈J
mit cI,J ∈ C und endlichen geordneten Mengen I und J, d.h. der Betrag jedes
Elements der Menge ist kleiner als der des folgenden.
Mit Hilfe der Erzeugungs- und Vernichtungsoperatoren und den zugehörigen
Antikommutatorbeziehungen ist das Skalarprodukt im Fockraum eindeutig durch
hΩ, Ωi = 1 festgelegt.
Da beim Übergang von klassischen zu quantenmechanischen Systemen aus komplexen Größen Operatoren werden, birgt dieser immer das Problem der Anordnung.
In der zweiten Quantisierung gibt es eine ausgezeichnete Anordnung, die so genannte Normalordnung. Auch diese hängt mit dem Diracsee zusammen, wie wir später
19
sehen werden. Bei der Normalordnung werden alle Erzeugungsoperatoren nach links
antikommutiert. Also zum Beispiel
: a(g)a∗ (f ) := −a∗ (f )a(g) ;
es wird der eigentlich nichttriviale Antikommutator {a(g), a∗(f )} = (g, P+ f ) weggelassen. Man kann sich leicht überlegen, dass der Vakuumerwartungswert eines normalgeordneten Ausdrucks immer verschwindet.
Definition 2.2. Wir bezeichen die von der Identität und den Erzeugern und Vernichtern erzeugte C ∗ -Algebra mit A(F). Die Menge der Zustände von A(F) ist
definiert als die Menge aller stetigen Linearformen auf A(F) mit den Eigenschaften
(1) ρ(A∗ A) ≥ 0 ∀A ∈ A(F) (Positivität),
(2) ρ(1) = 1 (Normierung).
Aus 1. folgt für A ∈ A(F) und λ ∈ C
0 ≤ ρ (A + λ1)(A∗ + λ1) = ρ(AA∗ ) + λρ(A) + λρ(A∗ ) + 1 .
Mit λ = 1 und λ = i ergeben sich die Aussagen ρ(A) + ρ(A∗ ) ∈ R bzw. i(ρ(A) −
ρ(A∗ )) ∈ R, und somit
ρ(A∗ ) = ρ(A) .
Man kann auch zeigen, dass die Stetigkeit einer Linearform bereits aus ihrer Positivität folgt [8, Proposition 2.3.11]. Darüber hinaus sind zwei Zustände bereits gleich,
wenn sie auf der Menge der Monome in Erzeugern und Vernichtern
Y Y Y Y
(2.2)
a∗i
aj
b∗k
bl
i∈I
j∈J
k∈K
l∈L
mit geordneten endlichen Mengen I, J ⊆ {0, 1, . . . } und K, L ⊆ {−1, −2, . . . }
übereinstimmen (vergleiche [9, Abschnitt 5.2]). Die Menge der Zustände enthält die
die reinen Zustände mittels der Zuordnung ρψ (A) := hψ, Aψi für einen beliebigen
normierten Vektor ψ aus dem Fockraum.
Der Fockraum ist eine irreduzible Darstellung der Algebra A(F). Unsere Wahl der
Zustände mittels der Algebra ergibt direkt die Eindeutigkeitsaussage (2.2), die wir
später für die Sätze über die Darstellung von Hartree-Fock-Zuständen benötigen.
Die Teilchenzahl N(ρ) bzw. Ladung Q(ρ) eines Zustandes ρ sind gegeben durch
!
!
X
X
N(ρ) := ρ
(a∗i ai + b∗i bi ) , bzw. Q(ρ) := ρ
(a∗i ai − b∗i bi ) .
i∈
i∈
Für reine Zustände kann man die Definitionen leicht plausibel machen. Ein Zustand
mit einem Elektron ist gegeben durch a∗0 Ω und es gilt N(ρ) = Q(ρ) = 1. Für ein
Elektron-Positron Paar a∗0 b∗−1 Ω gilt N(ρ) = 2 und Q(ρ) = 0.
Es werden auch häufig die formal äquivalenten Erzeugungs- und Vernichtungsoperatoren a∗ (x), a(x) bzw. b∗ (x), b(x) verwendet. Sie erzeugen oder vernichten sie ein
20
Elektron bzw. Positron an der Stelle x. Formal gelten die folgenden Beziehungen:
X
X
(2.3)
a(x) =
ei (x)ai ,
a∗ (x) =
ei (x)a∗i ,
i≥0
(2.4)
a(f ) =
Z
i≥0
d x f (x)a(x) , a∗ (f ) =
G
Z
d x f (x)a∗ (x) .
G
Zum Beweis der Beziehungen setzten wir (2.4) in (2.3) ein und umgekehrt.
Z
X
a(x) =
ei (x) d y ei (y)a(y) = a(x) ,
G
i≥0
a∗ (x) =
X
ei (x)
a(f ) =
∗
a (f ) =
Z
d y ei (y)a∗ (y) = a∗ (x) ,
G
i≥0
Z
Z
d x f (x)
G
X
ei (x)ai =
i≥0
d x f (x)
G
X
X
(ei , f )ai = a(f ) ,
i≥0
ei (x)a∗i =
i≥0
X
(ei , f )a∗i = a∗ (f ) .
i≥0
Analoges gilt für die positronischen Operatoren:
X
X
ei (x)bi ,
b∗ (x) =
ei (x)b∗i ,
b(x) =
i<0
i<0
b(f ) =
Z
d x f (x)b(x) , b∗ (f ) =
G
Es ergeben sich die Antikommutatoren
Z
d x f (x)b∗ (x) .
G
{a(x), a(y)} ={a∗ (x), a∗ (y)} = {b(x), b(y)} = {b∗ (x), b∗ (y)}
={a# (x), b# (y)} = 0
und
{a(x), a∗ (y)} = P+ (x, y) , {b∗ (x), b(y)} = P− (x, y) ,
wobei P± (x, y) der Integralkern des Projektors P± ist. Wir beweisen lediglich die
nichttriviale Antikommutatorbeziehung für Elektronen:
X
X
{a(x), a∗ (y)} =
ei (x)ej (y){ai , a∗j } =
ei (x)ei (y) = P+ (x, y) .
i,j≥0
i≥0
Die Feldoperatoren definiert man ebenfalls analog als
Ψ(x) := a(x) + b∗ (x) und Ψ(x)∗ := a∗ (x) + b(x) .
Die Antikommutationsrelationen der Feldoperatoren ergeben sich leicht aus dem
bereits Gesagten:
{Ψ∗ (x), Ψ∗ (y)} = {Ψ(x), Ψ(y)} = 0 ,
{Ψ(x), Ψ∗ (y)} = P+ (x, y) + P− (x, y) = δ(x, y) ,
mit dem Integralkern der Identität δ(x, y).
21
Quantenelektrodynamik
Ausgangspunkt ist der QED-Hamiltonoperator nach Bjorken und Drell [17,
Formel 15.28]. Mit dem Coulomb-Diracoperator D Z und unter Vernachlässigung
des magnetischen Vektorpotentials lautet er
Z
bare
H
:=
d x : Ψ∗ (x)D Z Ψ(x) :
G
Z
Z
α
1
: Ψ∗ (x)Ψ(x) :: Ψ∗ (y)Ψ(y) : .
+
dx dy
2 G
|x − y|
G
Der erste Term ist die Einteilchenenergie, also die kinetische Energie und die
Coulombenergie bezüglich des Atomkerns. DerPzweite ist die Energie der Coulombwechselwirkung zwischen den Teilchen, wobei 4τ =1 : Ψ∗ (x, τ )Ψ(x, τ ) : die Ladungsdichte am Punkt x ist.
Der Hamiltonoperator ist mittels (2.3) formal äquivalent zu
XZ
d x ei (x)D Z ej (x) : Ψ∗i Ψj :
i,j∈
G
Z
Z
1
α X
dx dy
+
ei (x)ej (y)ek (x)el (y) : Ψ∗i Ψk :: Ψ∗j Ψl : .
2 i,j,k,l∈ G
|x
−
y|
G
Für die auftretenden Matrixelemente verwenden wir die Abkürzungen
Z
Z
ei (x)ej (y)ek (x)el (y)
Z
Z
.
Di,j := (ei , D ej ) und Wi,j;k,l :=
dx dy
|x − y|
G
G
Man beachte, dass wegen der Wahl der Orthonormalbasis (ei ∈ H 1/2 ) alle Matrixelemente endlich sind (zum Beweis siehe Lemma 5.4 im Anhang). Somit erhalten
wir
X
α X
Z
Hbare =
Di,j
: Ψ∗i Ψj : +
Wi,j;k,l : Ψ∗i Ψk :: Ψ∗j Ψl :
2 i,j,k,l∈
i,j∈
und der Erwartungswert der Energie im Zustand ρ ist folglich
X
α X
bare
Z
(2.5)
EZ,α
(ρ) =
Di,j
ρ(: Ψ∗i Ψj :) +
Wi,j;k,l ρ(: Ψ∗i Ψk :: Ψ∗j Ψl :) .
2 i,j,k,l∈
i,j∈
Wir werden der Frage nach der Konvergenz dieser Summen keine große Aufmerksamkeit schenken, da sie im Allgemeinen von der gewählten Basis abhängt. Relevant
für die Energie sollte allerdings nur die Zerlegung von H in H+ und H− sein. Eine
Möglichkeit (2.5) basisunabhängig zu schreiben wäre, die Summen als Spuren der
zugehörigen Operatoren aufzufassen. Da das jedoch auch ein willkürlicher Schritt
ist, wollen die Summen vorerst nur formal betrachten und sie als Motivation zur
Definition des Energiefunktionals (2.24) benutzen.
An der Einteilchenenergie (vergleiche (2.5)) sieht man deutlich den Effekt der
Normalordnung. Es ist
: Ψ∗i Ψj : = : a∗i + bi aj + b∗j : = : a∗i aj + a∗i b∗j + bi aj + bi b∗j :
= a∗i aj + a∗i b∗j + bi aj − b∗j bi ,
22
und die Differenz zu dem nicht normalgeordneten Ausdruck ist
(
1 i=j<0
.
Ψ∗i Ψj − : Ψ∗i Ψj : = bi b∗j + b∗j bi = {bi , b∗j } =
0 sonst
Man erkennt hier unter anderem noch einmal die generelle Tatsache, dass der
Vakuumerwartungswert von normalgeordneten Ausdrücken verschwindet. Die Einteilchenenergie des Vakuums ohne Normalordnung wäre aber
X
Di,i = −∞ ,
i<0
die Einteilchenenergie des Diracsees.
Untersuchen wir die Coulombenergie näher, so stellen wir fest, dass diese im Allgemeinen im Vakuum einen nicht verschwindenden Erwartungswert hat. Der nicht
verschwindende Beitrag kommt von dem Term
(
1 i = l < 0, k = j ≥ 0
∗ ∗
hΩ, bi ak aj bl Ωi =
0 sonst
und ist gleich
X
Wi,j;j,i =
i<0,j≥0
X Z
i<0,j≥0
G
dx
Z
dy
G
ei (x)ej (x)ei (y)ej (y)
.
|x − y|
Der Vakuumerwartungswert hängt also von der gewählten Zerlegung von H ab;
wählt man zum Beispiel als H+ die ersten beiden Spinkomponenten, verschwinden
die Integranden bereits punktweise, und somit auch der Erwartungswert. Allgemein
gilt für die Matrixelemente (wegen ei ∈ H 1/2 ) Wi,j;j,i ≥ 0, da sie Diagonalelemente
des so genannten Coulombskalarprodukts
Z
1
f (x)g(y)|x − y|−1 d x d y
D(f, g) :=
2 6
sind. Dies sieht man für C0∞ -Funktionen mit der Fouriertransformation von D(f, g)
(vergleiche Lemma 5.5); unser Fall folgt mit der Endlichkeit der Matrixelemente
(Lemma 5.4) und einem Stetigkeitsargument analog zum Beweis von Lemma 5.6
oder nach einer anderen Methode mit [30, Theorem 9.8]. Damit kann man leicht
zeigen, dass obiger Vakuumerwartungswert für den masselosen freien Diracoperator
unendlich oder nicht basisunabhängig ist. In diesem Fall sind die Teilräume H+ und
H− streckungsinvariant, und wegen des Skalierungsverhaltens der Summanden reicht
es damit einen nicht verschwindenden Term zu finden. Wir führen diese instruktive
Rechnung in Abschnitt 5.2 im Anhang durch.
Bach et al. [4] haben deshalb den Wechselwirkungsterm
X
Wi,j;k,l : Ψ∗i Ψk :: Ψ∗j Ψl :
i,j,k,l∈
vollständig normalgeordnet:
X
i,j,k,l∈
Wi,j;k,l : Ψ∗i Ψ∗j Ψl Ψk : .
23
Es wurde später von Lieb und Siedentop [28] gezeigt, dass dieser Übergang im
Fall Z = 0 und bei Einführung eines Ultraviolett-Cutoffs im Impulsraum einer Renormierung des Diracoperators entspricht. Der Vakuumerwartungswert verschwindet bei dieser Ordnung wiederum automatisch, unabhängig von der gewählten
Zerlegung von H. Die Energie eines Zustands ρ ist also
X
α X
Z
Di,j
ρ(: Ψ∗i Ψj :) +
Wi,j;k,l ρ(: Ψ∗i Ψ∗j Ψl Ψk :) .
(2.6)
Eα (ρ) =
2
i,j∈
i,j,k,l∈
Unser Modell in dieser Arbeit basiert auf diesem Ausdruck, aber auch er hat
noch ein Problem: er ist nicht stabil. Falls man für D Z den masselosen freien Diracoperator −iα·∇ einsetzt, kann man durch einen einfachen Zustand nach J. P. Solovej
[unveröffentlicht] Instabilität zeigen. Wir berechnen die Energie des Zustands
√
1 − ε2 Ω + εa∗1 a∗2 b∗−2 b∗−1 Ω
mit Basiselementen e−1 , e−2 , e1 und e2 , die wir unten genauer festlegen werden. Die
kinetische Energie des Zustands ist
0
0
0
0
ε2 (D1,1
+ D2,2
− D−1,−1
− D−2,−2
).
Zu der Wechselwirkung tragen nur die beiden Terme
bi bj al ak und a∗i a∗j b∗l b∗k
bei und daher ergibt sich die Wechselwirkungsenergie zu
√
2 1 − ε2 ε<(W−1,−2;1,2 + W−2,−1;2,1 − W−2,−1;1,2 − W−1,−2;2,1 )
√
= 4 1 − ε2 ε<(W−1,−2;1,2 − W−2,−1;1,2 ) .
Wählt man nun e1 , e2 ∈ H+ und e−1 , e−2 ∈ H− nach Lemma 5.7, so dass obiger Term
nicht verschwindet, ist mit einem kleinen ε des richtigen Vorzeichens die Energie
negativ. Da diese im masselosen Fall wie inverse Länge skaliert und die Teilräume H+
und H− streckungsinvariant sind, kann man durch zusammenziehen des Zustands auf
einen Punkt bei gleich bleibender Teilchenzahl beliebig negative Energien erreichen.
Dieses Problem kann man umgehen, indem man die Menge der Zustände auf
verallgemeinerte Hartree-Fock-Zustände beschränkt.
Die Hartree-Fock-Näherung
Wir definieren zuerst die Menge der Hartree-Fock-Zustände.
Definition 2.3. Ein verallgemeinerter Hartree-Fock-Zustand ist ein Zustand ρ
endlicher Teilchenzahl (N(ρ) < ∞) mit folgender Eigenschaft: Für alle endlichen
Folgen d1 , d2 , . . . , d2K von Operatoren aus der Menge aller Erzeugungs- und Vernichtungsoperatoren {a(f ), a∗ (f ), b(f ), b∗ (f )|f ∈ H} gilt
ρ(d1 d2 · · · d2K−1) = 0
und
ρ(d1 d2 · · · d2K ) =
X
σ∈S
sgn(σ)ρ(dσ(1) dσ(2) ) · · · ρ(dσ(2K−1) dσ(2K) ) ,
wobei S ⊆ S2K die Menge der Permutationen mit σ(1) < σ(3) < · · · < σ(2K − 1)
und σ(2i − 1) < σ(2i) für 1 ≤ i ≤ K bezeichnet.
24
Insbesondere ist das Vakuum ein Hartree-Fock-Zustand und obige Darstellung
seines Erwartungswerts wird auch als Wick-Theorem bezeichnet. Hartree-FockZustände vertragen sich gut mit der Normalordnung. Folgendes Lemma wurde
uns von D. Hundertmark [unveröffentlicht] vorgeschlagen und für den für uns
wesentlichen Zweiteilchenfall (K = 2) auch bewiesen.
Lemma 2.4. Für einen Hartree-Fock-Zustand ρ gilt mit obigen Bezeichnungen
X
(2.7)
ρ(: d1 d2 · · · d2K :) =
sgn(σ)ρ(: dσ(1) dσ(2) :) · · · ρ(: dσ(2K−1) dσ(2K) :) .
σ∈S
Beweis. Nehmen wir an, die Folge d1 d2 · · · d2K sei bereits normalgeordnet. Dann sind
auch alle Paare normalgeordnet, die auf der rechten Seite von (2.7) auftreten. Somit
gilt die Behauptung nach der Definition von Hartree-Fock-Zuständen.
Für den allgemeinen Fall stellen wir zuerst fest, dass : d1 d2 · · · d2K : ein antikommutierender Ausdruck ist, also das Vertauschen zweier Operatoren das Vorzeichen
des Ausdrucks ändert. Die rechte Seite von (2.7) lässt sich somit auch als Summe
über die Menge S2K aller Permutationen von {1, . . . , 2K} schreiben:
X
1
sgn(σ)ρ(: dσ(1) dσ(2) :) · · · ρ(: dσ(2K−1) dσ(2K) :) .
K!2K σ∈
2K
Dies zeigt aber, dass das Vertauschen zweier Operatoren auf beiden Seiten von (2.7)
lediglich das Vorzeichen ändert. Damit ist das Problem auf den anfangs behandelten
Fall zurückgeführt.
Mit anderen Worten sind die Mehrteilchendichten eines Hartree-Fock-Zustands
eine Summe aus Produkten seiner Einteilchendichten; sie sind insbesondere durch
diese bereits eindeutig bestimmt, da Zustände durch ihre Werte auf den Monomen
von Erzeugungs- und Vernichtungsoperatoren festgelegt sind. Für die Zweiteilchendichte in der QED-Energie (2.6) folgt die Gleichung
(2.8) ρ(: Ψ∗i Ψ∗j Ψl Ψk :) = ρ(: Ψ∗i Ψ∗j :)ρ(: Ψl Ψk :) − ρ(: Ψ∗i Ψl :)ρ(: Ψ∗j Ψk :)
+ ρ(: Ψ∗i Ψk :)ρ(: Ψ∗j Ψl :) .
Aus (2.7) sieht man allgemein, dass sich Hartree-Fock-Zustände aus den beiden
Matrizen
γi,j = ρ(: Ψ∗j Ψi :) und υi,j = ρ(: Ψj Ψi :)
zusammensetzen. Dies veranlasst uns zu folgender Definition.
Definition 2.5. Eine Ladungsdichtematrix ist ein selbstadjungierter Operator Γ auf
H × H mit den Eigenschaften:
(1)
γ υ
Γ=
,
υ ∗ −γ
wobei υ ∗ = −υ und die Spuren Sp P+ γP+ und Sp P− γP− endlich sind.
(2)
P− 0
P+ 0
−
≤Γ≤
.
0 P+
0 P−
25
Unter der komplexen Konjugation einer Matrix verstehen wir die komplexe Konjugation aller Elemente: γ i,j := γi,j . Aus der Definition folgen unmittelbar die Eigenschaften γ = γ ∗ , 0 ≤ P+ γP+ ≤ 1 und −1 ≤ P− γP− ≤ 0. Wir betrachten die
Zerlegung von Γ bezüglich H+ und H− ,


γ++ γ+− υ++
υ+−
γ−+ γ−− υ−+
υ−− 
 ,
Γ=
∗
∗
υ++
υ−+
−γ̄++ −γ̄+− 
∗
∗
υ+−
υ−−
−γ̄−+ −γ̄−−
∗
mit γ++ := P+ γP+ , γ+− := P+ γP− , γ−+ := P− γP+ = γ+−
und γ−− := P− γP− .
Analoges gilt für die Blöcke von υ. Die Matrixelemente sind
(2.9)
γi,j = ρ(: Ψ∗j Ψi :), (γ++ )i,j = ρ(a∗j ai ), (γ+− )i,j = ρ(bj ai ), (γ−− )i,j = −ρ(b∗i bj )
υi,j = ρ(: Ψj Ψi :), (υ++ )i,j = ρ(aj ai ), (υ+− )i,j = ρ(b∗j ai ), (υ−− )i,j = ρ(b∗j b∗i ) .
Den Zusammenhang von Γ mit den Zuständen zeigt folgendes Lemma aus [4].
Lemma 2.6. Jeder Zustand endlicher Teilchenzahl definiert eine Ladungsdichtematrix Γρ durch
(2.10)
(h, Γρ g) = ρ : [Ψ∗ (g1 ) + Ψ(g̃2 )][Ψ(h1 ) + Ψ∗ (h̃2 )] :
P
mit h := (h1 , h2 ) ∈ H2 , g := (g1 , g2 ) ∈ H2 und für f =
k∈ λk ek sei
P
f˜ = k∈ λk ek . Die komplexe Konjugation dient dazu, die rechte Seite von (2.10)
in g linear und in h antilinear zu machen.
Beweis. Wir werden aus Gründen der besseren Übersicht auf den Index ρ bei der
Ladungsdichtematrix verzichten, und im Folgenden frei zwischen Γ und ρ wechseln.
Durch Einsetzen der Basis erhält man für den oberen linken Block
γi,j = ρ(: Ψ∗j Ψi :) = ρ(a∗j ai + a∗j b∗i + bj ai − b∗i bj ) ,
und wegen der Eigenschaft ρ(A∗ ) = ρ(A) der Zustände gilt
γj,i = ρ(a∗j ai + a∗j b∗i + bj ai − b∗i bj ) = γi,j ,
was die Selbstadjungiertheit von γ impliziert. Rechts unten steht die Matrix mit
Elementen
ρ(: Ψj Ψ∗i :) = ρ(−a∗i aj + aj bi + b∗j a∗i + b∗j bi )
und wegen
ρ(: Ψ∗j Ψi :) = ρ(ai a∗j + bi aj + a∗i b∗j − b∗j bi )
sind diese durch ρ(: Ψj Ψ∗i :) = −γi,j gegeben.
Der obere rechte Block ergibt sich zu
υi,j = ρ(: Ψj Ψi :) = ρ(aj ai − b∗i aj + b∗j ai − b∗j b∗i ) = ρ(Ψj Ψi ) ;
die Normalordnung hat hier keine Auswirkung, da alle Terme antikommutieren.
Deshalb gilt auch
υj,i = ρ(Ψi Ψj ) = −ρ(Ψj Ψi ) = −υi,j .
Die Matrixelemente links unten sind
ρ(: Ψ∗j Ψ∗i :) = ρ(Ψ∗j Ψ∗i ) = −ρ(Ψi Ψj ) = υj,i ,
26
also steht dort der zu υ adjungierte Operator.
Ließe man in (2.10) die Normalordnung weg, ergäbe sich die nicht renormierte
Matrix
γ + P−
υ
,
(2.11)
Γur =
υ∗
−γ + P+
wie man den vorangegangenen Ausführungen leicht entnehmen kann. Von ihr kann
man zeigen, dass sie die übliche Ungleichung für Einteilchen-Dichtematrizen 0 ≤
Γur ≤ 1 erfüllt (vergleiche (2.14)). Mit g = (g1 , g2 ) ∈ H2 normiert, 1 = kgk2 =
kg1 k2 + kg2 k2 , berechnen wir
0 ≤ (g, Γur g) = ρ ([Ψ∗ (g1 ) + Ψ(g̃2 )][Ψ(g1 ) + Ψ∗ (g̃2 )])
= (kg1 k2 + kg2 k2 )ρ(1) − ρ ([Ψ(g1 ) + Ψ∗ (g̃2 )][Ψ∗ (g1 ) + Ψ(g̃2 )]) ≤ 1 .
Daher kann man Ladungsdichtematrizen als das normalgeordnete Gegenstück zu
Einteilchen-Dichtematrizen auffassen. Hieraus folgt auch sofort die Ungleichung für
Ladungsdichtematrizen.
Es bleibt noch zu zeigen, dass die Spuren von γ++ und γ−− endlich sind. Dies
folgt aus der endlichen Teilchenzahl des Zustands und der Positivität von γ++ und
−γ−− . Überträgt man die Teilchenzahl von ρ auf die Ladungsdichtematrix Γ erhält
man
!
!
!
X
X
X
N(ρ) = ρ
(a∗i ai + b∗i bi ) = ρ :
Ψ∗i Ψi : − ρ :
Ψ∗i Ψi :
(2.12)
i≥0
i<0
i∈
= Sp γ++ − Sp γ−− =: N(Γ) = N(γ) .
Satz 2.7. Mittels (2.10) wird die Menge der Hartree-Fock-Zustände bijektiv auf die
Menge der Ladungsdichtematrizen abgebildet.
Beweis. Noch zu zeigen ist hierbei, dass es zu jeder Ladungsdichtematrix auch
einen Hartree-Fock-Zustand gibt. Dies führen wir mit einem Beweis aus [4] auf den
entsprechenden Satz [1, Theorem 2.3] für Hartree-Fock-Zustände mit nur einer Art
von Teilchen zurück.
Wir konjugieren Γur mit der orthogonalen Matrix


1 0 0 0
 0 0 0 1

W = W ∗ = W −1 := 
 0 0 1 0
0 1 0 0
und erhalten
Γur,W := W Γur W ∗

γ++ υ+−
υ++
γ+−
∗

υ ∗
−γ −+
υ−−
+− −γ −−
 .
= 
∗
∗
υ++ −γ +− 1 − γ ++
υ−+ 
γ−+ υ−−
υ−+
1 + γ−−

27
Mit den Matrizen
γur,W :=
γ++ υ+−
∗
υ+−
−γ −−
und υur,W :=
υ++ γ+−
∗
−γ −+ υ−−
schreibt sich die konjugierte Matrix in der gewohnten Form
γur,W
υur,W
Γur,W =
.
∗
υur,W
1 − γ ur,W
∗
Wegen γ = γ ∗ und υ ∗ = −υ gelten für die transformierten Matrizen γur,W = γur,W
∗
und υur,W = −υ ur,W . Aus 0 ≤ Γur ≤ 1 folgt 0 ≤ Γur,W ≤ 1 und somit auch, dass
γur,W mit γ++ und γ−− endliche Spur hat.
Wie man an den Matrixelementen (2.9) sieht, entspricht der Verzicht auf die
Normalordnung und die Konjugation mit W dem Wechsel in einen Fockraum mit
nur einer Sorte von Teilchen mit Erzeugern c∗i und Vernichtern ci für i ∈ Z und
(
(
a∗i i ≥ 0
ai i ≥ 0
.
und c∗i := Ψ∗i =
(2.13)
ci := Ψi = ∗
bi i < 0
bi i < 0
Da die CAR für Ψ und Ψ∗ gelten, folgen sie auch unmittelbar für c. In unserem
Modell ist dieser Fockraum als der Spezialfall H+ = H enthalten. Daraus ergibt
sich mit (2.11) die Definition der Einteilchen-Dichtematrizen als selbstadjungierte
Operatoren Γc mit den Eigenschaften:
γc
υc
(2.14)
Γc =
mit 0 ≤ Γc ≤ 1 und υc∗ = −υc .
υc∗ 1 − γc
Die Teilchenzahl ist analog durch die Spur von γc gegeben.
Die Konjugation mit W ist also eine Bijektion zwischen den nicht normalgeordneten Ladungsdichtematrizen Γur und den Einteilchen-Dichtematrizen Γc endlicher
Teilchenzahl. Letztere sind wegen ihrer einfacheren Struktur leichter zu handhaben.
Aus der Definition der Hartree-Fock-Zustände sieht man auch, dass die Menge der
Hartree-Fock-Zustände unter der Transformation (2.13) zwischen Ψ und c gleich
bleibt.
In [1, Theorem 2.3] wird zu jeder Einteilchen-Dichtematrizen Γc endlicher
Teilchenzahl die Existenz eines zugehörigen Hartree-Fock-Zustands gezeigt. Daraus
folgt mit der Transformation (2.13) auch die Existenz eines Zustands ρ mit nicht normalgeordneter Ladungsdichtematrix Γur . Die Ladungsdichtematrix von ρ ist dann
Γ, was den Beweis abschließt.
Aus der Ungleichung 0 ≤ Γur ≤ 1 (vergleiche (2.11)) folgt Γ2ur ≤ Γur , und dies
ausgewertet für den oberen linken Block gibt (γ + P− )2 + υυ ∗ ≤ γ + P− oder
(2.15)
γ 2 + P− γ + γP− + υυ ∗ ≤ γ .
Die beiden Diagonalelemente dieser Ungleichung bezüglich H+ und H− sind
(2.16a)
(2.16b)
2
∗
∗
∗
γ++
+ γ+− γ+−
+ υ++ υ++
+ υ+− υ+−
≤ γ++
2
∗
∗
∗
γ−−
+ γ+−
γ+− + υ−− υ−−
+ υ−+ υ−+
≤ −γ−−
und somit folgt aus der endlichen Spur von γ++ und γ−− , dass γ und υ HilbertSchmidt-Operatoren sind.
28
Wir sagen, die Ladungsdichtematrix Γ bzw. der zugehörige Hartree-Fock-Zustand
habe endliche kinetische Energie, falls γ die Bedingung
p
p
γ++
0
]
]
T0 (γ) := Sp |p|γ |p| < ∞ mit γ :=
0 −γ−−
erfüllt. Mit Lemma p
5.3 ist dann auch die kinetische Energie massiver Teilchen (zur
0
Erinnerung: |D | = p2 + m2 ) endlich:
p
p p
Sp (p2 + m2 )1/4 γ ] (p2 + m2 )1/4 = Sp γ ] p2 + m2 γ ]
p
p
≤ Sp γ ] (|p| + m) γ ]
≤ T0 (γ) + mN(γ) .
Wir definieren die Einteilchenenergie von Zuständen endlicher kinetischer Energie
durch
p
p
p
p
(2.17)
T (γ) := Sp γ ] |D Z | γ ] = Sp |D Z |γ ] |D Z |
und da
(2.18)
π
π
0
Z
0
0
|D | ≤ P+ |D |P+ + P− |D |P− + P− |p|P− ≤ P+ |D |P+ + 1 +
P− |D 0 |P− ,
2
2
ist diese auch endlich. Die Betragsungleichung beweist man mit (f, g) ∈ (H+ ⊕H− )∩
(H 1/2 (R3 ) ⊗ C4 ) und
Zα
0 ≤ (f, |D Z |f ) = (f, D0 f ) − (f,
f ) ≤ (f, |D 0 |f ) ,
|x|
π
Zα
g) ≤ (g, |D 0|g) + (g, |p|g) .
0 ≤ (g, |D Z |g) = −(g, D 0 g) + (g,
|x|
2
Ist darüber hinaus D Z γ Spurklasse, so gilt
Sp D Z γ = Sp |D Z |(γ++ − γ−− ) ,
und nach Lemma 5.3 stimmt dieser Ausdruck mit der Einteilchenenergie T (γ)
überein.
Wir definieren nun die zu der QED-Energie (2.6) äquivalente Energie für Ladungsdichtematrizen. Die Einteilchenenergie T (γ) ist offensichtlich formal die gleiche wie
in (2.6) und der Wechselwirkungsterm zerfällt für Hartree-Fock-Zustände nach (2.8)
in drei Terme:
X
Wi,j;k,l ρ(: Ψ∗i Ψ∗j :)ρ(: Ψl Ψk :) − ρ(: Ψ∗i Ψl :)ρ(: Ψ∗j Ψk :)
i,j,k,l∈
(2.19)
=
X
i,j,k,l∈
+ρ(: Ψ∗i Ψk :)ρ(: Ψ∗j Ψl :)
Wi,j;k,l (υi,j υk,l − γl,iγk,j + γk,iγl,j ) .
Der erste,
Z
X Z
X
ei (x)ej (y)ek (x)el (y)
Wi,j;k,l υi,j υk,l =
(ei , υej )(ek , υel ) ,
dx dy
|x
−
y|
G
G
i,j,k,l∈
i,j,k,l∈
29
führt zur Paarenergie.
Da υ ein Hilbert-Schmidt-Operator ist, können wir die FunkP
tion υ(x, y) := i,j∈ (ei , υej )ei (x)ej (y) auf dem Produktraum L2 (G × G) definieren
und mit dem unitären Basiswechsel B : H → H, ei 7→ ei , ist υ(x, y) der Integralkern von υB (vergleiche Abschnitt 5.1 über Hilbert-Schmidt-Operatoren). Damit
definieren wir die Paarenergie als
Z
|υ(x, y)|2
(2.20)
WP (Γ) = WP (υ) :=
dxdy
,
|x − y|
G×G
das Betragsquadrat der Funktion |x − y|−1/2 υ(x, y) in L2 (G × G). Für Ladungsdichtematrizen endlicher kinetischer Energie ist dieser Ausdruck endlich. Mit der
Ungleichung von Kato (1.2) erhalten wir
Z
Z
π
|υ(x, y)|2
dxdy ≤
υ(x, y)|∇x |υ(x, y) d x d y
WP (υ) =
2 G×G
G×G |x − y|
4 Z
π X
=
υ(p, τ ; q, σ)|p|υ(p, τ ; q, σ) d p d q .
2 σ,τ =1 6
Der obige Ausdruck
ist bis auf den Faktor das Quadrat der Hilbert-Schmidt-Norm
p
des Operators |p|υB und damit gleich
p
p
π
Sp |p|υυ ∗ |p| .
2
An dieser Stelle benötigen wir ein elementares Lemma für beschränkte Operatoren, das wir auch kurz beweisen werden:
υυ ∗ ≤ 2 P+ (υυ ∗)P+ + P− (υυ ∗)P− .
Das Produkt υυ ∗ schreibt sich in Blockform als
∗
∗
∗
∗
υ++ υ++
+ υ+− υ+−
υ++ υ−+
+ υ+− υ−−
∗
(2.21)
υυ =
.
∗
∗
∗
∗
υ−+ υ++
+ υ−− υ+−
υ−− υ−−
+ υ−+ υ−+
Wir betrachten die Summe von zwei positiven Operatoren,
∗
∗
∗
∗
0 ≤ (υ++ − υ−+ )(υ++
− υ−+
) + (υ−− − υ+− )(υ−−
− υ+−
),
und formen diese zu folgender Ungleichung um:
∗
∗
∗
∗
υ++ υ−+
+ υ+− υ−−
+ υ−+ υ++
+ υ−− υ+−
∗
∗
∗
∗
≤ υ++ υ++
+ υ+− υ+−
+ υ−− υ−−
+ υ−+ υ−+
.
Somit sind die Diagonalelemente von (2.21) größer gleich den Nebendiagonalelementen und es folgt die Behauptung.
Verwenden wir nun noch die Ungleichung (2.16), so bekommen wir die obere
Schranke
p
p
π Sp |p|γ ] |p| = πT0 (γ) .
Die Austauschenergie ist motiviert durch den zweiten Term von (2.19),
Z
X Z
X
ei (x)ej (y)ek (x)el (y)
Wi,j;k,l γl,iγk,j =
(ei , γel )(ek , γej ) ,
dx dy
|x
−
y|
G
G
i,j,k,l∈
i,j,k,l∈
30
und mit γ(x, y) :=
(2.22)
P
(ei , γej )ei (x)ej (y) definieren wir sie als
Z
|γ(x, y)|2
.
WX (Γ) = WX (γ) :=
dxdy
|x − y|
G×G
i,j∈
Ihre Endlichkeit wird im Beweis der Stabilität des Elektronen-Positronen-Felds ohne
externes Potential (Abschnitt 3.1) analog zur Endlichkeit der Paarenergie gezeigt.
Etwas anders behandeln wir die klassische elektrostatische oder auch direkte Energie, die zum dritten Term in (2.19) gehört. Um die Ladungsdichte definieren zu
können, müssen wir voraussetzen, dass γ Spurklasse ist. Mit den linear unabhängigen Eigenfunktionen fi zu den nicht verschwindenden Eigenwerten λi von γ ist die
Ladungsdichte gegeben durch
ργ (x) :=
4 X
X
τ =1
i
λi |fi (x, τ )|2 .
Wegen der Voraussetzung ist sie eine wohldefinierte L1 (R3 )-Funktion. Bezüglich der
gewählten Basis ist der dritte Term gleich
X
Wi,j;k,l γk,iγl,j ;
i,j,k,l∈
wechselt man zu einer Basis aus Eigenfunktionen von γ, so kann man diesen durch
die Ladungsdichte ausdrücken. Wir definieren also die direkte Energie als
Z
ργ (x)ργ (y)
= 2D(ργ , ργ ) .
(2.23)
WD (Γ) = WD (γ) :=
dxdy
|x − y|
3× 3
p
p
P
Sie ist endlich, wenn wir zusätzlich Sp |γ||∇| |γ| = i |λi|(fi , |p|fi ) < ∞ fordern:
P
P
Z
2
2
i |λi | |fi (x)|
j |λj | |fj (y)|
WD (γ) ≤
dxdy
|x − y|
G×G
Z
X
X
π
≤
dxdy
|λi | fi (x) |∇x | fi (x)
|λj | |fj (y)|2
2 G×G
j
i∈
p
p
π
= Sp |γ| Sp |γ||∇| |γ| < ∞ .
2
p
p
Und falls Sp |γ||∇| |γ| < ∞, so hat die Ladungsdichtematrix auch endliche Einteilchenenergie. Mit Ungleichung (2.18) haben wir
p
p
p
p π
T (γ) = Sp γ ] |D Z | γ ] ≤ Sp γ ] P+ |D 0|P+ + 1 +
P− |D 0 |P−
γ] ,
2
und jeder dieser Terme ist beschränkt; z.B. gilt
p
p
p
p
p
p
Sp γ ] P+ |D 0 |P+ γ ] = Sp |D 0 |P+ γ ] P+ |D 0 | ≤ Sp |D 0 |P+ |γ|P+ |D 0 | ,
da für alle f ∈ H+ und g ∈ H− folgende Ungleichungen gelten:
(f, |γ|f ) ≥ |(f, γf )| = (f, γ++ f ) ,
(g, |γ|g) ≥ |(g, γg)| = (g, −γ−− g) .
Mit dieser Vorarbeit können wir schließlich das Energiefunktional definieren.
31
Definition 2.8 (Das Hartree-Fock-Funktional). Wir schreiben X für die Menge
aller Ladungsdichtematrizen Γ mit
p
p
Sp |γ||∇| |γ| < ∞ und Sp |γ| < ∞ ,
und DHF für die mittels der Zuordnung (2.10) äquivalente Menge von HartreeFock-Zuständen. Die Elemente von X und DHF heißen Ladungsdichtematrizen bzw.
Hartree-Fock-Zustände endlicher Energie. Die Energie einer Ladungsdichtematrix
aus der Menge X ist gegeben durch das Hartree-Fock-Funktional EZ,α : X → R,
(2.24)
Z
Z
α
|υ(x, y)|2
|γ(x, y)|2
α
EZ,α(Γ) = T (γ) +
dxdy
dxdy
+ αD(ργ , ργ ) −
.
2
|x − y|
2
|x − y|
Da wir aber in dieser Arbeit nur am Infimum der Energie interessiert sind, stellen
wir fest, dass die Paarenergie für unsere Betrachtungen unwesentlich ist. Sie ist
nichtnegativ und mit
γ 0
γ υ
0
erfüllt auch Γ :=
Γ=
0 −γ
υ ∗ −γ
die Bedingungen an eine Ladungsdichtematrix. Es gilt also
EZ,α(Γ) ≥ EZ,α(Γ0 ) bei N(Γ) = N(Γ0 ) .
Darum werden wir im Folgenden ausschließlich mit dem Energiefunktional
Z
α
|γ(x, y)|2
EZ,α(γ) = T (γ) + αD(ργ , ργ ) −
dxdy
2
|x − y|
arbeiten und γ, in Missbrauch der Notation, auch als Ladungsdichtematrix bezeichnen.
Resultate
In Artikel [4] zeigten Bach, Barbaroux, Helffer und Siedentop, dass die Energie im
Falle Z = 0 und α ≤ 4/π nichtnegativ ist (Abschnitt 3.1). Von Hundertmark, Röhrl
und Siedentop wurde in [16] (Abschnitt 3.3) gezeigt, dass für größeres α die Energie
pro Teilchen nach unten unbeschränkt ist. Die kritische Konstante für Stabilität der
zweiten Art ist also α = 4/π.
Für Atome (Z 6= 0) ist im physikalischen Fall (α ≈ 1/137) die Energie nach
[4] nichtnegativ für Z ≤ 68. Von Brummelhuis, Röhrl und Siedentop wurde das
Resultat in [11] bis Z = 117 gezeigt (Abschnitt 4). Letzteres umfasst alle in der
Natur vorkommenden Elemente.
Mit einem klassischen elektromagnetischen Feld konnten Bach et al. Stabilität von
Atomen bis Z = 67 (Holmium) beweisen [4]. Die Stabilität der Materie in diesem
Kontext wurde in [3] für den physikalischen Fall ebenfalls für Z ≤ 67 gezeigt. In
beiden Resultaten ist die Energie wiederum nichtnegativ.
Die Tatsache, dass die Energie in all diesen Modellen im Stabilitätsfall nichtnegativ ist, kann man von einem ästhetischen Standpunkt aus begrüßen. Da bei allen in
vorliegender Arbeit betrachteten Systemen die Energie des Hartree-Fock-Vakuums
verschwindet, folgt damit dass dieses ein Grundzustand ist. Für Z und α kleiner als
die kritischen Werte (z.B. α < 4/π bei Z = 0) ist er zudem eindeutig.
32
Betrachtet man das Elektronen-Positronen-Feld ohne externes Potential, so ist
das Hartree-Fock-Vakuum als Grundzustand naheliegend. Für ein Atom (Z 6= 0)
würde man aber einen neutralen Grundzustand erwarten, also etwa Q(γ) = Z.
Um die Existenz zusätzlicher Teilchen zu begünstigen, führen wir ein so genanntes
chemisches Potential ein, d.h. wir subtrahieren ein µ-faches der Ruheenergie mN(γ).
Dies hat den Effekt, dass die Erzeugung eines Teilchens um µm weniger Energie
kostet. Man beachte, dass ein solcher Term die Stabilität des Modells unberührt lässt.
Wenn man allerdings, wie im atomaren Fall, die Elektronen- und Positronenräume
nicht explizit kennt, kann man auch die Teilchenzahl (vergleiche (2.12)) nicht einfach
ausrechnen. Wir beschränken unsere Betrachtungen deshalb auf den Fall Z = 0. Wir
zeigen in Abschnitt 3.4, dass der Grundzustand für α = 1/137 bis µ ≈ 0, 999983
unverändert das Hartree-Fock-Vakuum bleibt und die Energie für µ ≥ 1 nach unten
unbeschränkt ist.
Eine andere Möglichkeit, das Vakuum als Grundzustand zu vermeiden, ist, die
Zahl der Teilchen N(γ) vorzuschreiben. Im Fall Z = 0 folgt aus den Resultaten für
chemische Potentiale eine gute Abschätzung für das Infimum der Energie bei fester
Teilchenzahl (Abschnitt 3.5).
Es wurde von G.M. Graf auf einer Tagung in Sønderborg, Dänemark, zu diesem
Thema angemerkt, dass man in der Natur Elektronen bereits vorfindet, um ein
Positron zu erhalten aber ein Elektron-Positron-Paar erzeugen muss. Dies entspricht
einem Potential der Form µmQ(γ) = µm Sp γ; Elektronen werden begünstigt und
Positronen doppelt belastet. Diese Wahl verspricht realistischere Resultate und ist
zudem auch technisch einfacher, da die Ladung die Spur der Ladungsdichtematrix ist
und somit die Elektronen- und Positronenräume nicht direkt eingehen. Der Einfluss
eines solchen Potentials auf den Grundzustand des Atoms wird Gegenstand unserer
künftiger Forschung auf diesem Gebiet sein.
33
Das Infimum der Energie des Vakuums
In diesem Abschnitt bestimmen wir in zwei Fällen das Infimum der Energie des
Elektronen-Positronen-Felds ohne externes Potential in Hartree-Fock-Näherung.
Zuerst stellen wir den Beweis für die Stabilität des Elektronen-Positronen-Felds
aus [4] vor. Er zeigt, dass die Energie für α ≤ 4/π nichtnegativ ist. Für größere
Werte der Feinstrukturkonstante α wurde das Infimum zuerst von Chaix, Iracane
und Lions [13] untersucht, aber nur unvollständig behandelt. Wir werden in diesem
Fall Ladungsdichtematrizen mit beliebig negativer Energie pro Teilchen konstruieren. Damit ist insbesondere die Optimalität des Stabilitätsresultats gezeigt. Im
zweiten Teil führen wir das chemische Potential −µmN(γ) ein und
puntersuchen den
Grundzustand in Abhängigkeit von µ. Wir zeigen, dass für µ ≤ 1 − (πα/4)2 das
Hartree-Fock-Vakuum der Grundzustand bleibt und dass die Energie für µ ≥ 1 nach
unten unbeschränkt
p ist. Daraus folgt für die Energie ohne chemisches Potential die
untere Schranke 1 − (πα/4)2 mN(γ) und ein Intervall für das Infimum der Energie
der Ladungsdichtematrizen mit fester Teilchenzahl N. Am Ende stellen wir einige
technische Hilfssätze für die Abschätzungen bereit, die den Fluss der Beweise stören
würden.
Stabilität des Vakuums
Satz 3.1 ([4]). Ist α ≤ 4/π, so gilt für alle Hartree-Fock-Zustände ρ ∈ DHF
E0,α (ρ) ≥ 0 .
Beweis. Wir passen den Beweis aus [4] an unsere Definitionen an. Zuerst schätzen
wir mit der Ungleichung von Kato (1.2) die Austauschenergie nach oben ab:
Z
Z
|γ(x, y)|2
π
dxdy ≤
WX (γ) =
γ(y, x)|∇x|γ(x, y) d x d y
2 G×G
G×G |x − y|
(3.1)
p
p
π
π
π
= Sp γ|∇|γ ≤ Sp γ|D 0 |γ = Sp |D 0 |γ 2 |D 0 | .
2
2
2
p
Das zweite Integral ist das Quadrat der Hilbert-Schmidt-Norm von |p|γ und somit
gleich der darauf folgenden Spur. Unter Verwendung der Ungleichungen (2.16a) und
(2.16b) erhalten wir eine Abschätzung gegen die kinetische Energie:
p
p
Sp |D 0|γ 2 |D 0 |
p
p
p
p
= Sp P+ |D 0|P+ γ 2 P+ |D 0 |P+ + Sp P− |D 0 |P− γ 2 P− |D 0|P−
2
∗
p
p
γ++ + γ+− γ+−
0
(3.2)
0
= Sp |D |
|D 0 |
2
∗
0
γ−− + γ+− γ+−
p
p
γ++
0
0
|D 0 | = T (γ) .
≤ Sp |D |
0 −γ−−
Für die Gesamtenergie folgt
falls α ≤ 4/π.
α π
E0,α (γ) ≥ T (γ) 1 −
≥0,
22
34
Da die Einteilchenenergie für γ 6= 0 wegen ihrer Definition (2.17) und der Ungleichung (2.16) positiv ist, gilt dies auch für die Gesamtenergie bei α < 4/π; das
Hartree-Fock-Vakuum ist somit für diese α der einzige Grundzustand.
Implementation translationsinvarianter Dichtematrizen
Zuerst stellen wir das unseren Rechnungen zugrunde liegende Prinzip vor. Aus praktischen Gründen weichen wir etwas von unserer Notation ab, indem wir die Spinkomponenten nicht in das Argument x = (x, τ ) schreiben, sondern Objekte mit Spin als
Vektoren in C4 bzw. Matrizen in C4 × C4 auffassen.
Ohne externes Potential ist der Diracoperator im Impulsraum gegeben durch die
4 × 4 Matrix
m σ·p
0
,
D (p) =
σ · p −m
welche mit Hilfe von
cos θp
− sin θp σ · ω p
R(p) :=
sin θp σ · ω p
cos θp
diagonalisiert werden kann. Wir benutzen die Abkürzungen ωp := p/|p| für Vektoren
p ∈ R3 \ {0}, E(p) := (p2 + m2 )1/2 für die relativistische kinetische Energie, cp =
1/2
1/2
cos θp := (E(p) + m)/2E(p)
und sp = sin θp := (E(p) − m)/2E(p)
für die
Winkelfunktionen von θp . Hiermit gilt
E(p)
0
∗
0
R (p)D (p)R(p) =
.
0
−E(p)
Ohne externes Potential können wir also Elektronen- und Positronenraum explizit
angeben. Mit der Zerlegung von H in die beiden ersten und letzten Komponenten
H̃+ := {f ∈ H|f3 = f4 = 0} und H̃− := {f ∈ H|f1 = f2 = 0} ist R∗ eine
unitäre Transformation auf H mit R∗ (H+ ) = H̃+ und R∗ (H− ) = H̃− . Die notwendige
Ungleichung −P− ≤ γ ≤ P+ für Ladungsdichtematrizen aus Definition 2.5 hat nun
die Form
0 0
1 0
∗
−
≤ R γR ≤
,
0 1
0 0
und P− ist gegeben durch
0 0
P− = R
R∗ .
0 1
Wegen der Translationsinvarianz und der Symmetrie zwischen Elektronen und
Positronen des Modells ohne externes Potential setzten Chaix et al. für die minimierende Folge translationsinvariante neutrale Zustände an. Ein solcher Zustand
hat aber keine von Null verschiedene endliche Teilchenzahl in R3 , da sich in jedem
Einheitswürfel gleich viele Teilchen befinden. Er ist also entweder das Vakuum oder
kein Zustand im Sinne unserer Definition 2.5.
Unter einer Dichtematrix“ wollen wir im Folgenden einen Operator γC : H → H
”
mit −P− ≤ γC ≤ P+ verstehen; insbesondere ist eine Ladungsdichtematrix auch
eine Dichtematrix. Die Dichtematrix γC eines translationsinvarianten Zustands
ist ein Multiplikationsoperator im Impulsraum. Formal ist ihr Integralkern durch
35
γC (p)δ(p − q) gegeben und in Anlehnung an die Tatsache, dass die Spur eines Operators unter bestimmten Voraussetzungen das Integral über die Diagonale seines
Integralkerns ist (vergleiche Lemma 5.2), kann man für die Teilchenzahl von γC in
einem endlichen Volumen V folgenden Ausdruck schreiben:
Z
d p Sp 4 (γC )++ (p) − (γC )−− (p) δ(0)
N(γC ) : =
3
Z
= |V |
d p Sp 4 (γC )++ (p) − (γC )−− (p) .
3
Dabei setzt man δ(0) = |V |, weil die Fouriertransformierte der δ-Funktion die konstante Funktion 1 und der Funktionswert einer Funktion an der Stelle 0 das Integral
über ihre Fouriertransformierte ist.
Der Weg, den Chaix et al. in [13] einschlugen, war, mit γC das Infimum der Energie
pro Einheitsvolumen abzuschätzen. Dabei sind kinetische- und Austauschenergie im
Einheitsvolumen formal gegeben durch
Z
d q Sp 4 |D 0 |(q) (γC )++ (q) − (γC )−− (q)
T (γC ) :=
3
bzw.
Z
γC (p) γC (q)
1
dq dp
WX (γC ) := 2
,
2π
|p − q|2
3
P
wobei AB := i,j aij bij für zwei Matrizen A und B der gleichen Dimension. Wegen
der Neutralität von γC verschwindet die Ladungsdichte punktweise, und somit auch
die direkte Energie. Wir motivieren diese Formeln nicht weiter, da sie durch Analogie
aus unseren exakten Berechnungen folgen werden.
Wir implementieren dieselbe Dichtematrix γC mittels einer glatten,
näherungsweise charakteristischen Abschneidefunktion χa,r im Ortsraum mit
Radius r im ganzen Raum R3 .
Für a → 0 nähert sich diese an die charakteristische Funktion Br der Kugel B(0, r)
an. Genauer wählen wir eine kugelsymmetrische Funktion h ∈ C0∞ (R3 , R) mit
supp h = B(0, 21 ), g := (ĥ/kĥk2 )2 und ga (x) := a−3 g(x/a) für a ∈ R+ . Dann gilt
||ga ||1 = 1 und ga ist nichtnegativ, da die Fouriertransformierte ĥ von h wegen der
Symmetrie reell ist. Schließlich definieren wir die Abschneidefunktion als
χa,r := Br ∗ gar .
Damit setzen wir unsere Ladungsdichtematrix gleich
γ := Rχa,r F χa,r R∗ ,
mit F := R∗ γC R .
Um wirklich eine Ladungsdichtematrix zu erhalten, muss γC natürlich einige Bedingungen erfüllen, auf die wir später eingehen werden. Wesentlich bei der Konstruktion von γ sind sowohl die genaue Form von χa,r , als auch die Platzierung der
36
Abschneidefunktion zwischen R und F . Letztere sorgt dafür, dass wir in Koordinaten abschneiden, in denen Elektronen und Positronen in die ersten bzw. letzten
beiden Spinkomponenten getrennt sind. Dadurch werden sie nicht vermischt und aus
−P− ≤ γC ≤ P+ folgt −P− ≤ γ ≤ P+ . Wir verwenden folgende Eigenschaften von
χa,r :
Lemma 3.2.
(1) Die Abschneidefunktion χa,r und damit auch ihre Fouriertransformation χ
d
a,r
sind kugelsymmetrisch, d.h. ihr Funktionswert hängt nur von dem Betrag des
Arguments ab.
(2) Für alle r > 0, 1 ≤ s < ∞ gilt 0 ≤ χa,r ≤ 1 und ||χa,r ||ss = r 3 ||χa,1 ||ss < ∞.
(3) Der Bruch Q := kχa,r k44 /kχa,r k22 ist kleiner oder gleich 1, unabhängig von r,
und sein Grenzwert für a → 0 ist 1.
(4) Im Impulsraum ist die Abschneidefunktion χa,r stetig, beschränkt und hat
−1
kompakten Träger, genauer gilt supp χ
d
a,r ⊂ B(0, %) mit % := (ar) .
Beweis.
1. Es gilt allgemein, dass Fouriertransformation und Faltung kugelsymmetrischer
Funktionen wieder kugelsymmetrisch sind.
2. Die Skalierung der Normen in r folgt durch Substitution, da χa,r (x) = χa,1 (x/r).
Die Werte von χa,r liegen zwischen 0 und 1, weil das Integral von ga über eine beliebige (messbare) Teilmenge von R3 zwischen diesen Zahlen liegt. Nach der Ungleichung von Young gilt schließlich für s ≥ 1
4
kB1 ∗ ga kss ≤ kB1 kss kga ks1 = π .
3
3. Es gilt Q ≤ 1 wegen kχa,r k44 ≤ kχa,r k22 und darüber hinaus gilt
r 3 kB1 ∗ ga k44
kχa,r k44
=
,
kχa,r k22
r 3 kB1 ∗ ga k22
was die Unabhängigkeit von r zeigt. Der Bruch konvergiert gegen 1, da ga gegen die
δ-Funktion strebt. Zum Beweis müssen wir nur zeigen, dass kB1 ∗ ga k44 → 4π/3 für
a → 0. Der Funktionswert von B1 ∗ ga an der Stelle x ist
Z
Z
B1 ∗ ga (x) =
g(x/a − y) d y =
g(y) d y
B(0,1/a)
B(x/a,1/a)
1
und da g eine nichtnegative L -Funktion ist, gibt es für jedes ε > 0 ein k ∈ N mit
Z
g(y) d y > 1 − ε .
B(0,k)
Für jedes l mit 0 < l < 1 existiert deshalb ein a mit B1 ∗ ga (x) > 1 − ε für alle x
mit |x| ≤ l. Es ist also kB1 ∗ ga k44 > (1 − ε)4 34 πl3 .
4. Die Fouriertransformation von χa,r ist
3/2 c
−1
−3/2
χ
d
Br gc
h∗h.
a,r = (2π)
ar mit ĝ = kĥĥk1 (2π)
cr das Integral einer, auf
Beide Funktionen sind stetig nach der Wahl von h, und da B
ihrem Träger gleichmäßig stetigen Funktion ist. Der Träger von gc
ar berechnet sich
37
mit supp ĝ ⊂ B(0, 1) und der elementaren Eigenschaft der Fouriertransformation
(3.3)
Z
Z
x
1
1
−ipx
e−iarpx g(x)dx = ĝ(arp)
e
g
gc
dx =
ar (p) =
(ar)3 (2π)3/2 3
ar
(2π)3/2
−1
zu supp gc
ar ⊂ B(0, (ar) ).
Wir bestimmen jetzt die Energie der Ladungsdichtematrix γ und vergleichen sie mit
der von γC .
Der Integralkern von γ im Impulsraum ist
Z
−3/2
(3.4)
γ(p, q) =
d ξ(2π)−3/2 χ
d
χ
d
a,r (p − ξ)M(ξ, p, q)(2π)
a,r (ξ − q) ,
3
wobei
M(ξ, p, q) := R(p)F (ξ)R∗ (q) .
Wir setzen nun zusätzlich voraus, dass F (ξ) beschränkt ist und kompakten Träger
in B(0, d) \ B(0, c) für c, d mit 0 ≤ c < d hat. Dann folgt aus der gleichmäßigen
Stetigkeit von χ
d
d
a,r die Stetigkeit von γ(p, q). Der Träger des Integranden χ
a,r (p −
ξ)M(ξ, p, q)d
χa,r (ξ − q) liegt in der kompakten Menge
D% := {(ξ, p, q) ∈ R9 |ξ|, |p|, |q| ∈ [c − 2%, d + 2%], |p − ξ| ≤ %, |q − ξ| ≤ %} ,
die wir mit Bedacht derartig wählen. Insbesondere hat auch der Integralkern γ(p, q)
kompakten Träger.
Um zu zeigen daß γ Spurklasse ist, betrachten wir den positiven Hilbert-SchmidtOperator B mit stetigem Integralkern
Z
∗
−3/2
B(p, q) :=
d ξ(2π)−3/2 χ
d
χ
d
a,r (p − ξ)R(p)|F (ξ)|R (q)(2π)
a,r (ξ − q) ,
3
der für alle u ∈ H folgende Ungleichung erfüllt:
∗
|(u, γu)| = |(2π)−3 (R∗ u) ∗ χ
d
d
a,r , F (R u) ∗ χ
a,r |
Damit gilt insbesondere
∗
≤ (2π)−3 (R∗ u) ∗ χ
d
d
a,r , |F |(R u) ∗ χ
a,r = (u, Bu) .
Sp |γ| ≤ Sp B ,
was sich durch Ausrechnen der Spur mit Hilfe der Eigenfunktionen von γ leicht
einsehen lässt. Nach Lemma 5.2 ist die Spur eines positiven Operators mit stetigem
Integralkern B(p, q) durch das Integral über die Diagonale B(p, p) gegeben,
Z
Sp B =
B(p, p) d p .
G
Unter unseren Voraussetzungen ist dieses Integral endlich und somit γ also Spurklasse und schließlich eine Ladungsdichtematrix.
Mit den Gleichungen
1 0
0 0
∗
∗
∗
R P+ =
R und R P− =
R∗
0 0
0 1
38
sehen wir, dass
1 0
1 0
M++ (ξ, p, q) := P+ R(p)F (ξ)R (q)P+ = R(p)
F (ξ)
R∗ (q)
0 0
0 0
∗
=: R(p)F++ (ξ)R∗ (q)
gilt, und somit der Integralkern von γ++ durch
Z
−3/2
γ++ (p, q) =
d
χ
d
d ξ(2π)−3/2 χ
a,r (p − ξ)M++ (ξ, p, q)(2π)
a,r (ξ − q)
3
gegeben ist. Analog definieren wir M−− und F−− .
Mit dem Ansatz (3.4) und Lemma 5.2 ergibt sich für die Teilchenzahl von γ der
endliche Ausdruck
N(γ) = Sp(γ++ − γ−− )
Z
−3
d q Sp
= (2π)
3
4
γ++ (q, q) − γ−− (q, q) ,
was sich auch in folgender Form schreiben lässt:
(3.5)
N(γ) = Sp χa,r (F++ − F−− )χa,r
Z
2
−3
d
d q d ξ Sp 4 F++ (ξ) − F−− (ξ) χ
= (2π)
a,r (q − ξ)
6
Z
−3
2
d ξ Sp 4 F++ (ξ) − F−− (ξ) .
= (2π) kd
χa,r k2
3
In gleicher Weise erhalten wir für die kinetische Energie
p
p
T (γ) = Sp |D 0|(γ++ − γ−− ) |D 0 |
Z
p
−3
d q q2 + m2 Sp 4 γ++ (q, q) − γ−− (q, q) ,
= (2π)
3
bzw.
(3.6)
T (γ) = Sp(p2 + m2 )1/4 χa,r (F++ − F−− )χa,r (p2 + m2 )1/4
Z
p
−3
2
= (2π)
d q d ξ q2 + m2 Sp 4 F++ (ξ) − F−− (ξ) χ
d
a,r (q − ξ) .
6
Da der Integralkern γ(p, q) im Impulsraum beschränkt ist und kompakten Träger
hat, ergibt sich mit Lemma 5.6 seine Austauschenergie zu
(3.7)
WX (γ) = k|x − y|−1/2 γ(x, y)k22
Z
1
d q d q0 d p|q − q0 |−2 γ(q0 + p, q0 ) γ(q + p, q)
= 2
2π
9
Z
1
1
=
d q d q0 d ξ d ξ 0 d p|q − q0 |−2 M(ξ 0 , p + q0 , q0 ) M(ξ, p + q, q)
6
2
(2π) 2π
15
0
0
·χ
d
χa,r (q0 − ξ 0 )d
χa,r (p + q − ξ)d
χa,r (q − ξ) .
a,r (p + q − ξ )d
39
Zwischen den beiden Dichtematrizen γC und γ gelten die Beziehungen
γC (q) = M(q, q, q) , (γC )++ (q) = M++ (q, q, q) , (γC )−− (q) = M−− (q, q, q)
und mit geeignetem γC bzw. F gilt elementweise M(ξ, p, q) − M(q, q, q) = O(%) für
% = (ar)−1 → 0 auf D% mit Ausnahme einer kleinen Teilmenge, deren Beitrag von
der Ordnung O(r 2 ) ist. Es folgt für r → ∞
Z
p
−3
2 3
T (γ) = (2π) kd
χa,1 k2 r
Sp 4 q2 + m F++ (q) − F−− (q) d q + O(r 2)
6
(3.8a)
−3
2 3
= (2π) kχa,1 k2 r T (γC ) + O(r 2)
und
WX (γ) =
(3.8b)
1
1
2 3
kd
χa,1 ∗ χ
d
a,1 k2 r
6
2
(2π) 2π
Z
·
|q − q0 |−2 M(q0 , q0 , q0 ) M(q, q, q) d q d q0 + O(r 2)
6
−3
= (2π) kχa,1 k44 r 3 WX (γC ) + O(r 2) .
Hat F (ξ) und damit M(ξ, p, q) bezüglich der 4 Spinkomponenten die Form
a b
(3.9)
,
b −a
so gilt dies auch für γ und die Ladungsdichte, und damit die direkte Energie, verschwindet nach elementarer Linearer Algebra: Ist fi = (gi , hi ) ∈ H eine Eigenfunktion von γ zum Eigenwert λi , so ist fi0 = (−hi , gi) eine Eigenfunktion zum Eigenwert
−λi . Die Ladungsdichte berechnet sich also zu
X
ργ (x) =
λi (|gi(x)|2 + |hi (x)|2 − |hi (x)|2 − |gi (x)|2 ) = 0 ,
i,λi >0
wobei wir g und h als Funktionen mit 2 Komponenten auf R3 aufgefasst haben.
Zum Schluss bemerken wir, dass einfachere Abschneidefunktionen wie zum
Beispiel eine charakteristische Funktion im Impulsraum auch die wesentlichen Eigenschaften besäßen. Aber jede Abschneidefunktion hat die Eigenschaft 0 ≤ χa,r ≤ 1,
also auch kχa,r k44 ≤ kχa,r k22 . Für unsere spezielle Wahl strebt dieses Verhältnis für
a → 0 gegen 1, liefert also wegen der Vorfaktoren in (3.8) die niedrigste mögliche
Energie in dritter Ordnung in r. Auch ist dadurch das Verhältnis der beiden Energien für a → 0 und r → ∞ das gleiche wie für die Energien von γC pro Einheitsvolumen. Es ist uns also gelungen, durch die Abschneidefunktion die Energie
pro Einheitsvolumen der translationsinvarianten Dichte im ganzen Raum mit einer
Ladungsdichtematrix zu reproduzieren.
Das Infimum der Energie für α > 4/π
Hier zeigen wir die Instabilität des Elektronen-Positronen-Felds ohne externes
Potential für α > 4/π. Der Beweis ist in Zusammenarbeit mit Hundertmark
und Siedentop entstanden und wurde in einer ähnlichen Fassung in der Zeitschrift
Communications in Mathematical Physics“ veröffentlicht [16].
”
40
Satz 3.3. Ist α > 4/π, so ist die Energie pro Teilchen in der Menge der HartreeFock-Zustände endlicher Energie DHF nach unten unbeschränkt.
E0,α (ρ)
inf
= −∞
ρ∈ HF N(ρ)
Wir unterteilen den Beweis der Übersichtlichkeit halber in 4 Schritte.
Definition der Ladungsdichtematrix
Jeder unitäre Operator T auf H̃+ ⊕ H̃− definiert ein angezogenes“ Vakuum mittels
”
der Projektion
∗ 0 0
P̃− := RT
T R∗ .
0 1
Wir benutzen den Rotationsoperator
cos η(p)
sin η(p)(σ · ω p )
T (p) :=
,
− sin η(p)(σ · ω p )
cos η(p)
dessen Winkel η(p) durch die reelle Funktion η : R3 → R von p abhängt. Im
Folgenden schreiben wir abkürzend s̃p für sin η(p) und c̃p für cos η(p).
Chaix et al. [13] benutzten die Dichtematrix
γC := P̃− − P− ,
um für die Instabilität in einem Einheitsvolumen zu argumentieren. Sie wussten aber
nicht, welcher Winkel zum optimalen Ergebnis 4/π ≈ 1, 27 führt, und konnten nur
die obere Schranke π/ ln 4 ≈ 2, 27 zeigen. Motiviert durch eine Arbeit von Evans,
Perry und Siedentop [20] definieren wir den Winkel als
(3.10)
η = ηλ,c,d : R3 → [0, π/2], λ, c, d ∈ R+ mit 2λ−1 ≤ c < d, λ ≤ 1 und
(
arcsin (|ξ|λ)−2 c ≤ |ξ| ≤ d
.
ηλ,c,d(ξ) =
0
sonst
Insbesondere gilt s̃ ≤ 1/4. Der tiefere Grund für diese Wahl ist, dass die Ungleichung von Kato, die in dem Stabilitätsbeweis des Elektronen-Positronen-Felds
(Satz 3.1) verwendet wird, für die Funktion |p|−2 I[c,d](p) mit c, d, d/c → ∞ scharf
ist. Ein Beweis hierfür basiert, wie auch unsere obere Schranke für die Energie der
Ladungsdichtematrix, auf Formel (3.19) und verwendet eine ähnliche Rechnung.
Der Operator F = R∗ γC R ist gegeben durch
s̃2p
−s̃p c̃p σ · ω p
0 0
0 0
∗
,
F (p) = T (p)
T (p) −
=
0 1
0 1
−s̃p c̃p σ · ω p
−s̃2p
und ist somit beschränkt und hat den kompakten Träger B(0, d) \ B(0, c). Folglich
liegt der Träger von χ
d
χa,r (ξ − q), des Integranden aus der Defa,r (p − ξ)M(ξ, p, q)d
inition des Integralkerns von γ (3.4), in der Menge
D% := {(ξ, p, q) ∈ R9 |ξ|, |p|, |q| ∈ [c − 2%, d + 2%], |p − ξ| ≤ %, |q − ξ| ≤ %} .
Wir setzen % ≤ %max := 1/3 voraus. Eigentlich benötigen wir nur, dass % beschränkt
ist, damit wir später Konstanten Ci unabhängig von % wählen können. Der Wert ist
(fast) willkürlich.
41
Wegen der Wahl von F können wir die Vorbemerkungen aus Abschnitt 3.2 anwenden und erhalten, dass γ eine Ladungsdichtematrix mit Teilchenzahl
(3.11)
−3 3
N(γ) = 4(2π) r
kχa,1 k22
Z
3
d ξ s̃ = 2π −2 r 3 kχa,1 k22 λ−4 (c−1 − d−1 )
ist.
Wir zeigen jetzt, dass die Differenz zwischen
M(ξ, p, q) und M(q, q, q), außer im
Komplement der Menge V := {(ξ, p, q) |ξ|, |q| ∈ [c, d]} ∩ D% , von Ordnung O(%) für
% → 0 ist. Dazu benötigen wir die Abschätzungen |σ · ωp − σ · ωq | = O(%), cp − cq =
O(%) und sp − sq = O(%) aus Lemma 3.6. Zusätzlich treten die beiden Differenzen
s̃q − s̃ und c̃q − c̃ auf. Hier kommt die Ausnahmemenge, das Komplement von V
in D% , ins Spiel. Mit der charakteristischen Funktion IV der Menge V zerlegen wir
beide Funktionen in
fs1 (ξ, p, q) : = (s̃q − s̃ )IV (ξ, p, q) , fs2 (ξ, p, q) : = (s̃q − s̃ ) 1 − IV (ξ, p, q) ,
fc1 (ξ, p, q) : = (c̃q − c̃ )IV (ξ, p, q) , fc2 (ξ, p, q) : = (c̃q − c̃ ) 1 − IV (ξ, p, q) .
Die Funktionen mit Träger in V , fs1 und fc1 , sind von Ordnung O(%). Zum Beweis
berechnen wir
λ2 (s̃q − s̃ ) = q−2 I[c,d] (|q|) − ξ−2 I[c,d](|ξ|)
=
(|ξ|I[c,d] (|q|) − |q|I[c,d](|ξ|))(|ξ|I[c,d](|q|) + |q|I[c,d](|ξ|))
.
q2 ξ 2
Sind nun |ξ|, |q| ∈ [c, d], was in V erfüllt ist, so gilt |ξ − q| = O(%). Da s̃ ≤ 1/4
erhalten wir dies auch für fc1 :
q
q
(s̃q − s̃ )(s̃q + s̃ )
2
q
c̃q − c̃ = 1 − s̃q − 1 − s̃2 = − p
2
1 − s̃q + 1 − s̃2
≤ −(s̃q − s̃ )(s̃q + s̃ ) = O(%).
42
Die Anwendung dieser Abschätzungen auf M ergibt eine Zerlegung von M(ξ, p, q)
in M(q, q, q) und zwei Fehlerterme. Die Matrix M(ξ, p, q) ist gleich
(3.12)
−s̃ c̃ σ · ω s̃2
cp
−sp σ · ω p
cq
sq σ · ω q
−s̃ c̃ σ · ω −s̃2
sp σ · ω p
cp
−sq σ · ω q
cq
2
s̃ (c c − sp sq σ · ω p σ · ω q ) + s̃ c̃ (cp sq σ · ω σ · ω q + sp cq σ · ω p σ · ω )
= 2 p q
s̃ (sp cq σ · ω p + cp sq σ · ω q ) + s̃ c̃ (sp sq σ · ω p σ · ω σ · ω q − cp cq σ · ω )
s̃2 (sp cq σ · ω p + cp sq σ · ω q ) + s̃ c̃ (sp sq σ · ω p σ · ω σ · ω q − cp cq σ · ω )
−s̃2 (cp cq − sp sq σ · ω p σ · ω q ) − s̃ c̃ (cp sq σ · ω σ · ω q + sp cq σ · ω p σ · ω )
2
2
2
2 2
2
2s̃
s
c
−
s̃
c̃
(c
−
s
)
σ
·
ω
s̃
(c
−
s
)
+
2s̃
c̃
s
c
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
= 2
2s̃q sq cq − s̃q c̃q (c2q − s2q ) σ · ω q
−s̃2q (c2q − s2q ) − 2s̃q c̃q sq cq
+ N1 (ξ, p, q) + N2 (ξ, p, q)
s̃q sin(η(q) + 2θq )
−s̃q cos(η(q) + 2θq )σ · ω q
=
−s̃q cos(η(q) + 2θq )σ · ω q
−s̃q sin(η(q) + 2θq )
+ N1 (ξ, p, q) + N2 (ξ, p, q)
= M(q, q, q) + N1 (ξ, p, q) + N2 (ξ, p, q) .
Alle Terme der Ordnung O(%) fassen wir in N1 zusammen und die restlichen, die fs2
oder fc2 enthalten, in N2 . Es folgt N1 = O(%) und supp N2 ⊆ D% \ V .
Die Energie der Ladungsdichtematrix
Die direkte Energie WP = 2D(ργ , ργ ) verschwindet, da unser F die Form (3.9) hat
und somit die Ladungsdichte ργ schon punktweise gleich 0 ist.
Die kinetische Energie (3.6) zerfällt nach (3.12) in 3 Terme. Der Beitrag von
M(q, q, q) ist
(2π)
−3
(3.13)
Z
p
2
q2 + m2 F++ (ξ) − F−− (ξ) χ
d
a,r (q − ξ)
Z
p
−3 3
2
d q q2 + m2 s̃2q .
= (2π) r kχa,1 k2 4
d q d ξ Sp
6
4
3
Die anderen zwei Beiträge sind von niedrigerer Ordnung in r. Wir definieren zu ihrer
Abschätzung die folgenden Konstanten:
C1 : = sup %−1
%≤%max
C2 : =
sup
sup
( ,q,q)∈D%
( ,q,q)∈D%max
{Sp
4
{Sp
4
p
q2 + m2 (N1 )++ (ξ, q, q) − (N1 )−− (ξ, q, q) } ,
p
q2 + m2 (N2 )++ (ξ, q, q) − (N2 )−− (ξ, q, q) } .
Beide sind unabhängig von % und endlich, da N1 und N2 keine Singularitäten haben
und N1 auf dem Definitionsbereich D% von Ordnung O(%) ist. Für den zweiten Term
43
der Zerlegung (3.12) erhalten wir unter Berücksichtigung von supp N1 (ξ, q, q) ⊆ D%
Z
p
2
2
2
(2π)−3
d
d q d ξ Sp 4 q + m (N1 )++ (ξ) − (N1 )−− (ξ) χ
a,r (q − ξ) 6
Z
−3
2
≤ (2π) %C1 c−2%≤|q|≤d+2% d q d ξ χ
d
a,r (q − ξ)
ξ∈
3
4
= (2π)−3 %C1 π (d + 2%)3 − (c − 2%)3 kχa,r k22
3
2
4
r
= (2π)−3 C1 π (d + 2%)3 − (c − 2%)3 kχa,1 k22 = O(r 2) .
a 3
Für alle (ξ, q, q) ∈ D% \ V sind die ξ eingeschränkt auf |ξ| ∈ [c − 2%, c + %] ∪ [d −
%, d + 2%], da entweder |ξ| oder |q| nicht in dem Intervall [c, d] liegen dürfen und ihr
Abstand voneinander kleiner als % ist. Damit kontrollieren wir den dritten Term
Z
p
−3
2
2 + m2 (N )
(2π)
d
q
d
ξ
Sp
q
(ξ)
−
(N
)
(ξ)
χ
d
(q
−
ξ)
4
2
++
2
−−
a,r
6
Z
2
≤ (2π)−3 C2 | |<c+% oder | |>d−% d q d ξ χ
d
a,r (q − ξ)
q∈
3
4
χa,1 k22 = O(r 2) .
= (2π)−3C2 π (c + %)3 − (c − 2%)3 + (d + 2%)3 − (d − %)3 r 3 kd
3
Wir verfahren ähnlich mit der Austauschenergie (3.7) und wählen die Zerlegung
(3.14)
M(ξ 0 , p0 , q0 )M(ξ, p, q) =: M(q0 , q0 , q0 ) M(q, q, q)
0
+Ñ1 (ξ, p, q, ξ0 , p0 , q0 ) + Ñ2 (ξ, p, q, ξ0 , p0 , q0 ) + Ñ2 (ξ, p, q, ξ0 , p0 , q0 ) ,
die alle Produkte mit N1 in Ñ1 , alle anderen mit N2 (ξ, p, q) in Ñ2 , und den Rest –
0
mit N2 (ξ 0 , p0 , q0 ) – in Ñ2 zusammenfasst. Es folgen die Eigenschaften N1 = O(%),
0
supp Ñ2 = (D% \ V ) × D% und supp Ñ2 = D% × (D% \ V ). Den wesentlichen Beitrag
liefert, wie durch die Notation angedeutet, der Term M(q0 , q0 , q0 )M(q, q, q). Unter
Verwendung von Lemma 3.7 erhalten wir
M(q0 , q0 , q0 ) M(q, q, q) =
4s̃q s̃q0 (sin(η(q) + 2θq ) sin(η(q0 ) + 2θq0 ) + cos(η(q) + 2θq ) cos(η(q0 ) + 2θq0 )ω q ω q0 )
und die zugehörige Energie ist nach Formel (3.7) gleich
Z
4
1
d q d q0 |q − q0 |−2 s̃q s̃q0
(3.15)
(2π)6 2π 2 6
· sin(η(q) + 2θq ) sin(η(q0 ) + 2θq0 ) + cos(η(q) + 2θq ) cos(η(q0 ) + 2θq0 )ω q ω 0q
Z
·
d ξ d ξ0 d pd
χa,r (p + q − ξ)d
χa,r (q − ξ)d
χa,r (p + q0 − ξ 0 )d
χa,r (q0 − ξ0 )
9
44
Z
8
2
=
kd
χa,r ∗ χ
d
d q d q0 |q − q0 |−2 s̃q s̃q0
a,r k2
(2π)8
6
· sin(η(q) + 2θq ) sin(η(q0 ) + 2θq0 ) + cos(η(q) + 2θq ) cos(η(q0 ) + 2θq0 )ω q ω 0q
Z
8 3
4
d q d q0 |q − q0 |−2 s̃q s̃q0
r kχa,1 k4
=
5
(2π)
6
· sin(η(q) + 2θq ) sin(η(q0 ) + 2θq0 ) + cos(η(q) + 2θq ) cos(η(q0 ) + 2θq0 )ω q ω 0q .
Der Definitionsbereich D% wurde inklusive des Randes von Breite 2% gewählt, damit
er den obigen Integranden vollständig enthält: Wegen der Definition des Winkels
(3.10) ist s̃q auf c ≤ |q| ≤ d beschränkt und es folgt c − % ≤ |ξ| ≤ d + % und
c − 2% ≤ |p| ≤ d + 2%. Analog zu der kinetischen Energie sind die anderen beiden
Terme von niedrigerer Ordnung in r. Wir definieren
C3 : = sup %−1
%≤%max
C4 : =
{Ñ1 (ξ, p + q, q, ξ 0 , p + q0 , q0 )},
sup
0
0
0
2
( ,p+q,q, ,p+q ,q )∈D%
sup
( ,p+q,q, 0 ,p+q0 ,q0 )∈D%2max
{Ñ2 (ξ, p + q, q, ξ0 , p + q0 , q0 )},
und schätzen damit die Austauschenergie der restlichen Terme der Zerlegung (3.14)
ab:
Z
2
0
0
0 −2
0
0
(2π)8 6 d q d q |q − q | Ñ1 (ξ, p + q, q, ξ , p + q , q )
Z
0
0
0 0
0
·
d ξ d ξ d pd
χa,r (p + q − ξ)d
χa,r (q − ξ)d
χa,r (p + q − ξ )d
χa,r (q − ξ )
9
Z
Z
2
2
≤
%C3 k χ
d
d
dq
d q0 |q − q0 |−2
a,r ∗ χ
a,r k2
(2π)8
0
|q|∈[c−2%,d+2%]
|q |∈[c−2%,d+2%]
= O(r 2)
und
Z
2
(3.16) d q d q0 |q − q0 |−2 Ñ2 (ξ, p + q, q, ξ 0 , p + q0 , q0 )
8
(2π)
6
Z
0
0
0 0
0
·
d ξ d ξ d pd
χa,r (p + q − ξ)d
χa,r (q − ξ)d
χa,r (p + q − ξ )d
χa,r (q − ξ )
9
Z
Z
2
2
≤
C4 k χ
d
d
dq
d q0 |q − q0 |−2
a,r ∗ χ
a,r k2
(2π)8
0
|q|<c+% oder |q|>d−%
|q |∈[c−2%,d+2%]
Z
Z
2
2
d
≤
C4 kχ
d
dq
d q0 |q0 |−2
a,r ∗ χ
a,r k2
(2π)8
|q|<c+% oder |q|>d−%
q 0 ∈B(0,2d+4%)
1
3
3
3
3
d
24
= 7 8 r 3 C4 kχ
d
a,1 ∗ χ
a,1 k2 π (c + %) − (c − 2%) + (d + 2%) − (d − %) 4π(2d + 4%)
2π
3
= O(r 2 ) .
0
Die Rechnung für Ñ2 führen wir nicht durch, da sie im Prinzip die gleiche ist.
45
Reduktion auf den masselosen Fall
Wir bezeichnen die Koeffizienten führender, also dritter, Ordnung in r der
Teilchenzahl, der Gesamt-, kinetischen und Austauschenergie als Funktionen der
Masse m und des Winkels ηλ,c,d mit N3 (ηλ,c,d ), (E0,α )3 (m, ηλ,c,d), T3 (m, ηλ,c,d) und
(WX )3 (m, ηλ,c,d). Wir untersuchen die Skalierung von (E0,α )3 (m, ηλ,c,d ) in m um das
Problem auf den masselosen Fall zu reduzieren.
Für die kinetische Energie (3.13) gilt mit einem λ ∈ (0, 1]
Z
p
−3
2
T3 (λm, η1,c,d ) = (2π) kχa,1 k2 4
d p p2 + λ2 m2 sin2 (η(p))
3
Z
p
d p p2 + m2 sin2 (η(λp))
= (2π)−3 kχa,1 k22 λ4 4
3
4
= λ T3 (m, ηλ,c/λ,d/λ ) ,
und ηλ,c/λ,d/λ erfüllt mit η1,c,d die Bedingungen der Definition des Winkels η (3.10).
Von der Austauschenergie müssen wir zuerst die Massenabhänigkeit der Winkelfunktionen untersuchen. Wir haben
sin(η(q) + 2θq ) = sin(η(q)) cos(2θq ) + cos(η(q)) sin(2θq ) ,
cos(η(q) + 2θq ) = cos(η(q)) cos(2θq ) − sin(η(q)) sin(2θq )
und
sin(2θq ) = |q|/E(q) ,
cos(2θq ) = m/E(q) .
Die Masse tritt also in folgender Form auf:
m2
,
E(q)E(q0 )
|q|m
,
E(q)E(q0 )
|q0 |m
,
E(q)E(q0 )
|q||q0|
.
E(q)E(q0 )
Alle diese Ausdrücke skalieren gleich in m, z.B.
λ2 m2
m2
p
p
p
.
=p
(q/λ)2 + m2 (q0 /λ)2 + m2
q2 + λ2 m2 (q0 )2 + λ2 m2
Genau wie für die kinetische Energie bekommen wir also auch hier
(WX )3 (λm, η1,c,d ) = λ4 (WX )3 (m, ηλ,c/λ,d/λ ) ,
und zusammen ergibt dies
(3.17)
(E0,α )3 (λm, η1,c,d ) = λ4 (E0,α )3 (m, ηλ,c/λ,d/λ ) .
Außerdem ist (E0,α )3 stetig bei m = 0, da sowohl die kinetische als auch die Austauschenergie von der Form
Z
f (m, x)g(x) d x
mit stetigem f (m, x) und einem g ∈ L1 von kompaktem Träger sind. Falls wir nun
ein Paar c, d und ein positives a0 mit (E0,α )3 (0, η1,c,d) < −a0 < 0 finden, dann gibt es
wegen der Stetigkeit ein m0 > 0 mit (E0,α)3 (m, η1,c,d) < −a0 für alle m < m0 . Also ist
mit beliebigem m ≥ 0 und λ < max{m0 /m, 1} nach (3.17) und der Formel für die
46
Teilchenzahl (3.11) die Energie pro Teilchen in führender Ordnung in r beschränkt
durch
(E0,α )3 (m, ηλ,c/λ,d/λ )
−λ−4 a0
≤ −2
N3 (ηλ,c/λ,d/λ )
2π kχa,1 k22 λ−4 λ(c−1 − d−1 )
(3.18)
=−
a0
.
2π −2 kχa,1 k22 λ(c−1 − d−1 )
Mit λ → 0 wird die Energie pro Teilchen beliebig negativ und damit bleibt
im masselosen Fall die Existenz eines Paares c und d mit zugehöriger Energie
(E0,α )3 (0, η1,c,d) < a0 < 0 zu zeigen.
Instabilität
Wir setzen jetzt m = 0 und den Winkel gleich η = η1,c,d . Es folgten θq = π/4,
s̃q = |q|−2 und die kinetische Energie (3.13) ist mit den Bezeichnungen τ := d/c,
p := |p| und q := |q| gleich
T3 = (2π)
−3
kd
χa,1 k22 4
Z
pdp
= 2π −2 kχa,1 k22
4
p∈[c,d] p
Z
d
c
dp
= 2π −2 kχa,1 k22 log τ .
p
Für die Austauschenergie (3.15) erhalten wir in Kugelkoordinaten und p anstatt von
q 0 den Ausdruck
8
kχa,1 k44
(WX )3 =
5
(2π)
Z dZ dZ
· 4π2π
c
c
p
p
du
−2
−4 p−2
q
1
−
q
1 − p−4 q 2 p2 d p d q
2 + p2 − 2qpu
q
−1
Z dZ dZ 1 udu
−4 −4 2 2
+4π2π
q p q p dpdq ,
q 2 + p2 − 2qpu
c
c
−1
1
wobei die u-Integrale Legendrefunktionen der zweiten Art sind:
Z
1
−1
Z
1
−1
du
1
=
2
2
q + p − 2qpu
2pq
udu
1
=
q 2 + p2 − 2qpu
2pq
Z
Z
1
−1
1
−1
1 p q
≥0,
+
2 q p
udu
1 p q
1
+
:= Q1
≥0.
q
1 p
pq
2 q p
+
−
u
2 q
p
1
du
:= Q0
p
q
1
pq
+ p −u
2 q
Da die Austauschenergie negativ in die Gesamtenergie eingeht, müssen wir sie nach
unten abschätzen.
Zuerst lassen wir den Q1 -Term weg, und verwenden die Ungle√
ichung 1 − z ≥ 1 − z (z ∈ [0, 1]). Im zweiten Schritt vernachlässigen wir (pq)−5
47
und schätzen p−4 + q −4 nach oben durch 2/c4 ab. Wir erhalten also
2
(WX )3 ≥ 3 kχa,1 k44
π
Z dZ d
1 p q
Q0
·
+
((pq)−1 − p−1 q −5 − q −1 p−5 + (pq)−5 ) d p d q
2 q p
c
c
Z dZ d
1 p q
2
2
4
Q0
≥ 3 kχa,1 k4 (1 − 4 )
(pq)−1 d p d q .
+
π
c
2
q
p
c
c
Für c, d, τ → ∞ gilt Formel 17 aus [20],
Z dZ d
π2
1 p q
+
log τ + O(1) ,
(3.19)
(pq)−1 =
Q0
2 q p
2
c
c
und damit bekommen wir das gewünschte Ergebnis
α
(E0,α )3 = T3 − (WX )3
2 log τ
α 1 π2
4
−2
2
kχa,1 k4 + C 4 + O(1)
≤ 2π log τ kχa,1 k2 −
2π 2
c
π
log τ
= 2π −2 log τ kχa,1 k22 − α kχa,1 k44 + C 4 + O(1) .
4
c
2
4
Ist α > (4/π)kχa,1 k2 /kχa,1 k4 , so finden wir ein Paar c, τ mit dem (Eα )3 (0, η1,c,d) <
−a0 für ein a0 > 0. Das Skalierungsargument (3.18) zeigt somit Instabilität für
beliebiges m > 0 und mit dem Lemma 3.2 gilt dies schließlich für jedes α > 4/π, da
a > 0 beliebig.
Das Infimum der Energie mit chemischem Potential
Das Energiefunktional mit chemischem Potential µmN(γ) ist im freien Fall (Z = 0)
auf der Menge X der Ladungsdichtematrizen endlicher Energie gegeben durch das
Funktional E µ0,α : X → R,
Z
|γ(x, y)|2
α
µ
.
dxdy
E 0,α (γ) = T (γ) − µmN(γ) + αD(ργ , ργ ) −
2
|x − y|
Wir setzen in diesem Abschnitt m 6= 0 voraus, da der Fall m = 0 nichts Neues bringt
und bemerken, dass ein chemisches Potential als Vielfaches der Teilchenzahl zwar
sicherlich das Infimum der Energie beeinflussen kann, aber an der Stabilität nichts
ändert. Wir werden folgenden Satz beweisen:
Satz 3.4. Für massive Elektronen und Positronen gelten die zwei Aussagen:
p
(1) Das Hartree-Fock-Vakuum ist ein Grundzustand für µ ≤
1 − (πα/4)2 .
Dieser ist eindeutig, falls µ kleiner als der ebengenannte kritische Wert ist.
In einer Formel ausgedrückt heißt dies
p
E µ0,α (ρ) ≥ 0 für µ ≤ 1 − (πα/4)2 und ρ ∈ DHF .
(2) Für µ ≥ 1 kann die Energie beliebig negative Werte annehmen:
inf
ρ∈
HF
E µ0,α (ρ) = −∞ .
48
Beweis. Die Einteilchenenergie, also die Energie, die ein einzelnes Teilchen besitzt,
ist in diesem Modell durch
p p
p
T (γ) − µmN(γ) = Sp γ ] ( p2 + m2 − µm) γ ]
p
mit γ ] := γ++ − γ−− gegeben. Für µ ≤ 1 lässt sich das wegen p2 + m2 − m ≥ 0
auch als
p
p
Sp( p2 + m2 − µm)1/2 γ ] ( p2 + m2 − µm)1/2
schreiben. Die Cauchy-Schwarz Ungleichung in zwei Dimensionen liefert die Ungleichung
p
(3.20)
p2 + m2 − µm ≥ d|p|
für µ, d ≥ 0 mit µ2 + d2 ≤ 1. Damit erhalten wir analog zum Stabilitätsbeweis für
das Elektronen-Positronen-Feld (vergleiche Abschnitt 3.1):
p
p
π
π
WX ≤ Sp γ|∇|γ ≤ d−1 Sp( p2 + m2 − µm)1/2 γ 2 ( p2 + m2 − µm)1/2
2
2
p
p
π
Sp( p2 + m2 − µm)1/2 γ ] ( p2 + m2 − µm)1/2 )
≤
2d
π
=
T (γ) − µmN(γ) ,
2d
wobei wir die definitionsgemäße Gleichheit von |∇| und |p| benutzt haben. Es gilt
also
π α
E µ0,α (γ) ≥ T (γ) − µmN(γ) 1 −
2d 2
und damit ist die Energie nichtnegativ, solange α ≤ 4d/π.
p Aus der Bedingung
2
2
µ +d ≤ 1 erhalten wir die oben angegebene Schranke µ ≤ 1 − (πα/4)2 . Ist µ echt
kleiner als dieser Wert, so ist das Hartree-Fock-Vakuum der einzige Grundzustand,
da T (γ) − µmN(γ) > 0 für µ ≤ 1 und γ 6= 0. Setzt man den physikalischen Wert der
Feinstrukturkonstante α = 1/137, gilt somit obige Abschätzung bis µ = 0, 999983.
Man kann also fast die gesamte Ruheenergie abziehen, ohne den Grundzustand zu
ändern.
49
Der Graph stellt die beiden Seiten der Ungleichung (3.20) für drei Werte von µ und
d gegenüber. Er illustriert, dass man für µ = 1 die Einteilchenenergie nicht mehr
durch
einen Bruchteil von |p| nach unten Abschätzen kann, weil die Ableitung von
p
2
p + m2 bei p = 0 verschwindet. Der Schwachpunkt liegt bei kleinen Impulsen
und das werden wir im Folgenden ausnutzen um eine Ladungsdichtematrix mit der
Methode von Abschnitt 3.2 zu konstruieren, deren Energie negativ ist.
Wir setzen
1 0
F (ξ) := f (ξ)
0 −1
mit einer beschränkten kugelsymmetrischen Funktion f von kompaktem Träger in
B(0, d) und können so wieder die Vorbemerkungen aus Abschnitt 3.2 verwenden.
In diesem Fall haben wir an die Abschneidefunktion keine so hohen Ansprüche und
vereinfachen den Beweis dadurch, dass wir ihren Betrag im Impulsraum verwenden.
Der Integralkern von γ ist mit (3.4) gegeben durch
Z
1 0
−3
γ(p, q) = (2π)
|d
χa,r (ξ − q)|R∗ (q) ,
d ξR(p)|d
χa,r (p − ξ)|f (ξ)
0 −1
3
und der Integrand hat seinen Träger in der Menge
D% := {(ξ, p, q) ∈ R9 |ξ|, |p|, |q| ∈ [0, d + 2%], |p − ξ| ≤ %, |q − ξ| ≤ %} .
Wir wollen nun zeigen, dass das Verhältnis von kinetischer zu Austauschenergie
für r → ∞ gegen 0 strebt. Also müssen wir die kinetische Energie von oben und die
Austauschenergie von unten abschätzen. Für das gewünschte Resultat genügt es, für
f die charakteristische Funktion I[0,d] (| · |) der Kugel B(0, d) zu wählen.
Wir beginnen mit der Austauschenergie WX (3.7) und weichen von unserer Notation ab, indem wir M(ξ, p, q) in I[0,d] (|ξ|)M(p, q) zerlegen, wobei M(p, q) das
Produkt der Matrizen bezeichnet:
1 0
M(p, q) : = R(p)
R∗ (q)
0 −1
cp
sp σ · ω p
cq
sq σ · ω q
=
sp σ · ω p
−cp
−sq σ · ω q
cq
cp cq − sp sq σ · ω p σ · ω q cp sq σ · ω q + cq sp σ · ω p
=
.
cp sq σ · ω q + cq sp σ · ω p −cp cq + sp sq σ · ω p σ · ω q
Wie man aus der Formel (2.22) für die Austauschenergie im Ortsraum leicht
sieht, sind die Beiträge jedes Terms des elementweisen Produkts “ nichtnegativ
”
(die Komponenten der Matrizen entsprechen den Spinzuständen). Es genügt deshalb
sich im Folgenden auf die diagonalen Einträge zu beschränken.
Das “ Produkt der Diagonalelemente von M(p0 , q0 ) und M(p, q) ist mit
”
Lemma 3.7 das Vierfache des Ausdrucks
cp0 cq0 cp cq + sp0 sq0 sp sq [(ω p0 ω q0 )(ω p ω q ) + (ω p0 × ω q0 )(ω p × ω q )]
− cp cq sp0 sq0 (ω p0 ω q0 ) − cp0 cq0 sp sq (ω p ω q )
= cp cq −sp sq (ω p ω q ) cp0 cq0 −sp0 sq0 (ω p0 ω q0 ) +(ωp0 ×ω q0 )(ω p ×ω q )sp0 sq0 sp sq .
50
Lemma 3.8 im√
Anhang zeigt, dass dies größer oder gleich m2 E(d + 2%)−2 + O(%) ist,
wobei E(d) = d2 + m2 der relativistischen kinetischen Energie eines Teilchens mit
Impuls d entspricht.
Wir erhalten als untere Schranke der Austauschenergie WX
Z
1
4m2
1
0
0
0 −2
d q d q d ξ d ξ d p|q − q |
+ O(%) I[0,d] (|ξ|)I[0,d] (|ξ0 |)
(2π)6 2π 2 15
E(d + 2%)2
· |d
χa,r (p + q0 − ξ 0 )d
χa,r (q0 − ξ 0 )d
χa,r (p + q − ξ)d
χa,r (q − ξ)| ,
und es gilt
I[0,d] (|ξ|)I[0,d] (|ξ0 |) − I[0,d] (|q|)I[0,d] (|q0 |) = 0
außer unter einer der beiden Bedingungen |q|, |ξ| ∈ [d − %, d + %] bzw. |q0 |, |ξ0 | ∈
[d − %, d + %]. Denn wenn die Gleichung nicht erfüllt ist, folgt o.E. |ξ| ∈ [0, d] und
|q| > d und die Bedingung ergibt sich aus der Beschränkung des Abstands der
beiden Variablen auf %.
Es ist aber ähnlich wie in (3.16) der Betrag des Integrals dieser Menge beschränkt
durch das (m2 E(d + 2%)−2 + O(%))-fache des Ausdrucks
Z
Z
1
0
dqdq
d p d ξ d ξ0
0 |2
d−%≤|q|≤d+%
|q
−
q
9
3
0
|q |∈
· |d
χa,r (p + q − ξ)d
χa,r (q − ξ)d
χa,r (p + q0 − ξ 0 )d
χa,r (q0 − ξ 0 )|
Z
Z
2
d
≤ kχ
d
dq
d q0 |q0 |−2
a,r ∗ χ
a,r k2
d−%≤|q|≤d%
|q0 |≤2d+2%
24
3
3
2
d
= r 3 kχ
d
a,1 ∗ χ
a,1 k2 π (d + %) − (d − %) 4π(2d + 2%) = O(r ) .
3
Damit gilt für die Komponente in dritter Ordnung von r der Austauschenergie
Z
2
1 1
4m2
1
(WX )3 ≥
kχ
d
d
d q d q0
a,r ∗ χ
a,r k2
6
2
2
2
(2π) 2π
(d + 2%) + m 0≤|q0 |,|q|≤d
|q − q0 |2
2
m2 d4
8 =
k
χ
d
∗
χ
d
k
,
a,1
a,1 2
(2π)3
(d + 2%)2 + m2
da der Wert des Integrals 4π 2 d4 ist. Die Einteilchenenergie ist analog zu (3.6) einfacher zu bestimmen:
Z p
4
( p2 + m2 − m)I[0,d] (|ξ|)d
χa,r 2 (p − ξ) d ξ d p
3
(2π)
6
Z
p
4
2
=
I
(|p|)(
p2 + m2 − m) d p + O(r 2)
kχ
k
a,r
[0,d]
2
(2π)3
3
5
4
2 4πd
≤
kχ
k
+ O(r 2 )
a,r 2
(2π)3
10m
5
1 3
2d
= 2 r kχa,1 k2 + O(r 2) ,
5π
m
wobei die erste Abschätzung analog zu oben benutzt, dass I[0,d] (ξ) − I[0,d] (p) = 0
außer im Falle |p|, |ξ| ∈ [d − %, d + %] und das Integral einer beschränkten Funktion
51
über diese Menge gleichp
O(r 2) ist. Die letzte Abschätzung beruht auf der elementaren
Ungleichung p2 /2m ≥ p2 + m2 − m.
Die dritte Komponente der Energie ist also mit geeigneten Konstanten c1 und c2
nach oben durch
(3.21)
E µ0,α (γ) 3 ≤ c1 d5 − c2 d4
beschränkt. Es gibt also ein d0 , so dass die Komponente für alle d < d0 negativ ist.
Wählt man nun r genügend groß, ist die Energie der Ladungsdichtematrix negativ,
und für r → ∞ strebt diese gegen −∞.
Eine andere Möglichkeit, die Ladungsdichtematrix zu wählen, wäre mit f := I[c,d]
statt f = √
I[0,d] . Dafür ist der schwierigere Teil des Beweises von Lemma 3.8 für den
Fall b ≤ 2 2m nicht nötig, aber die beiden Grenzen bringen mehr Schreibarbeit in
den anderen Abschätzungen. Wollte man jedoch ausrechnen, wie negativ die Energie
pro Teilchen werden kann, würde das, wegen der 2 Freiheitsgrade, die bessere Wahl
darstellen.
Folgerungen für die Energie ohne chemisches Potential
Satz 3.5.
(1) Für die Energie der Hartree-Fock Zustände aus DHF gilt
p
E0,α (ρ) ≥ 1 − (πα/4)2 mN(ρ) .
(2) Das Infimum der Energie über die Hartree-Fock-Zustände endlicher Energie
und Teilchenzahl N befindet sich für m > 0 in folgendem Intervall:
hp
E0,α (ρ) ∈
inf
1 − (πα/4)2mN, mN .
ρ∈
HF ,N (ρ)=N
Im masselosen Fall ist das Infimum Null.
Beweis. Die erste Aussage folgt sofort aus Satz 3.4 des vorherigen Abschnitts und
für die zweite bestimmen wir die Teilchenzahl (3.6) des Zustands aus jenem Beweis:
N(γ) = Sp χa,r (F++ − F−− )χa,r
Z
4
=
I[0,d] (|ξ|)χ2a,r (ξ − q) d q d ξ
(2π)3 6
2
4
4
=
kχa,1 k22 r 3 πd3 = 2 kχa,1 k22 r 3 d3 .
3
(2π)
3
3π
Für jede beliebige Teilchenzahl N gewinnt man also durch Wahl von
(3.22)
d = N(
2
kχa,1 k22 )−1/3 r −1
3π 2
eine Ladungsdichtematrix der Teilchenzahl N.
52
Wir beginnen mit dem masselosen Fall und wählen d nach (3.22) proportional zu
r . Die kinetische Energie T (γ) ist dann proportional zu
−1
Z
Z
1
|q|I[0,r−1 ] (|ξ|)d
χa,r (q − ξ) d q d ξ = 3 |q|d
χa,r 2 (q − ξ/r) d q d ξ
|≤1
|
r
6
|q|∈
Z
Z
1
1
2
= 7 |q|d
χa,r (q/r − ξ/r) d q d ξ =
|q|d
χa,1 2 (q − ξ) d q d ξ .
r | |≤1
r | |≤1
2
|q|∈
|q|∈
3/2 c
3c
c
Beim letzten Schritt benutzen wir χ
d
Br gc
a,r = (2π)
ar , Br (p) = r B1 (rp) und
gbr (p) = gb1 (rp) (vergleiche Lemma 3.2 und (3.3)). Für r → ∞ konvergiert somit die
kinetische Energie bei gleich bleibender Teilchenzahl gegen 0. Da für die Gesamtenergie T (γ) − αWX /2 ≥ 0 bei nichtnegativem WX gilt, ist also auch ihr Infimum
gleich 0. Zusätzlich bemerken wir, dass für α < 4/π das Hartree-Fock-Vakuum der
einzige Zustand verschwindender Energie ist, und es somit im masselosen Fall bei
fester Teilchenzahl keinen Grundzustand gibt.
Im massiven Fall betrachten wir analog die Skalierung der kinetischen und der
Austauschenergie. Wegen d ∼ r −1 gilt E(d + 2%) ≤ 3m für große r und somit ist
nach Lemma 3.8 die Austauschenergie größer oder gleich
Z
1
1
4m2
0
0
0 −2
I[0,d] (|ξ|)I[0,d] (|ξ0 |)
d
q
d
q
d
ξ
d
ξ
d
p|q
−
q
|
(2π)6 2π 2 15
E(d + 2%)2
· |d
χa,r (p + q0 − ξ 0 )d
χa,r (q0 − ξ0 )d
χa,r (p + q − ξ)d
χa,r (q − ξ)| .
Unter obiger Voraussetzung ist der Term aus dem Lemma beschränkt
4
4m2
4m2
≤
=
≤4
9
E(d + 2%)2
(d + 2%)2 + m2
und spielt bei der Skalierung keine Rolle. Bei der Substitution aller Variablen q →
q/r erhalten wir von der Integration den Faktor r −15 und von |q − q0 |−2 den Faktor
12
−1
r 2 . Die Skalierung von χ
d
a,r liefert r . Insgesamt also r .
Die kinetische Energie ist
Z p
4
( p2 + m2 − m)I[0,d] (|ξ|)d
χa,r 2 (p − ξ) d ξ d p
3
(2π)
6
Z
p2
4
≤
I[0,d] (|ξ|)d
χa,r 2 (p − ξ) d ξ d p .
(2π)3 6 2m
In der gleichen Reihenfolge wie oben erhalten wir die Faktoren r −6 , r −2 und r 6 ;
insgesamt r −2 .
Es folgt
E µ0,α (γ) = E 0,α (γ) − µmN(γ) ≤ c1 r −2 − c2 r −1
und somit existiert für große r eine Ladungsdichtematrix der Teilchenzahl N, deren
Energie unter der Ruheenergie der Teilchen Nm liegt.
53
Hilfssätze
Lemma 3.6. Sei c > 0, |p−q| ≤ 2% und |p|, |q| ≥ c. Dann gelten die Abschätzungen
(1) |σ · ωp − σ · ωq | = O(%),
(2) cp − cq = O(%) und sp − sq = O(%),
elementweise für % → 0. Für den Winkel β zwischen p und q gilt sin β = O(%) und
cos β = 1 + O(%).
Beweis.
1. Der Betrag jedes Elements von σ · p ist sicherlich kleiner gleich |p|. Es genügt
daher, |ω p −ω q | = O(%) zu zeigen. Dazu bezeichnen wir den Winkel ∠(p, q) zwischen
p und q mit β, und stellen folgende elementare geometrische Fakten zusammen:
• 2% ≥ |p − q| ≥ min{|p|, |q|} sin β,
• |ω p − ω q | = 2 sin(β/2),
• sin(β/2) ≤ sin β falls β ≤ 2π/3.
Für β ≤ 2π/3 ist also |ω p − ω q | ≤ 4%/c = O(%). Der größte Winkel β tritt auf, wenn
|p|, |q| = c und |p − q| = 2%. Dies bedeutet sin(β/2) = %/c und garantiert, dass die
der Winkel β für kleine % kleiner als 2π/3 ist. Insbesondere gilt also sin β = O(%)
und damit auch cos β = 1 + O(%).
2. Die Aussage ist richtig für m = 0, da in diesem Fall cp und sp konstante
Funktionen sind. Für m 6= 0 zeigen die Richtigkeit folgende Rechnungen:
q
q
√
2
−1/2
2(cmp − cmq ) = 1 + (1 + p )
− 1 + (1 + q2 )−1/2
(1 + q2 )1/2 − (1 + p2 )1/2
p
p
(1 + q2 )1/2 (1 + p2 )1/2
1 + (1 + p2 )−1/2 + 1 + (1 + q2 )−1/2
−1
(q − p)(q + p) (1 + q2 )1/2 + (1 + p2 )1/2
p
= O(%) ,
=
p
2
1/2
2
1/2
2
−1/2
2
−1/2
(1 + q ) (1 + p )
1 + (1 + p )
+ 1 + (1 + q )
=
√
1 + (1 + p2 )−1/2 − 1 − (1 + q2 )−1/2
p
=p
1 + (1 + p2 )−1/2 + 1 + (1 + q2 )−1/2
2(smp − smq ) =
q
1 − (1 +
p2 )−1/2
−
q
1 − (1 + q2 )−1/2
−1
−(q − p)(q + p) (1 + q2 )1/2 + (1 + p2 )1/2
p
=
p
2
1/2
2
1/2
2
−1/2
2
−1/2
(1 + q ) (1 + p )
1 − (1 + p )
+ 1 − (1 + q )
q
−1
2 1/2
2 1/2 −1
2 1 − (1 + r 2 )−1/2
≤ −(q−p)(q+p) (1 + q ) + (1 + p )
= O(%) .
Lemma 3.7. Für das σ · p“-Produkt eines Vektors mit den Paulimatrizen gelten
”
folgende Regeln:
(1) (σ · p)(σ · q) = pqI2 + iσ · (p × q),
54
(2) σ · p σ · q = 2pq,
(3) σ · p I2 = Sp σ · p = 0,
(4) [(σ · p)(σ · q)] [(σ · p0 )(σ · q0 )] = 2 [(pq)(p0 q0 ) + (p × q)(p0 × q0 )]. Falls
die Beträge |p|, |q|, |p0|, |q0| ≤ 1, so ist der Betrag obigen Ausdrucks kleiner
oder gleich 2.
Beweis. Wir wiederholen die Paulimatrizen
1 0
0 −i
0 1
(3.23)
;
, σ3 =
, σ2 =
σ1 =
0 −1
i 0
1 0
die Aussagen folgen leicht aus ihren grundlegenden Eigenschaften:
σi2 = I2 ,
wobei
σi σj = −σj σi für i 6= j ,
σi σj = iεijk σk ,


ijk gerade Permutation von 123
1
ijk
ε = −1 ijk ungerade Permutation von 123

0
sonst
der total antisymmetrische Tensor ist. Die erste Regel ist eine unmittelbare Konsequenz hieraus. Für die zweite Aussage benutzt man die Repräsentation (3.23):
σ · p σ · q = (p1 σ1 − p2 σ2 + p3 σ3 ) σ · q =
(p1 + ip2 )(q1 − iq2 ) + (p1 − ip2 )(q1 + iq2 ) + 2p3 q3 = 2pq .
Die dritte ist unmittelbar einsichtig und um die letzte zu zeigen, verwenden wir alle
vorangegangenen Formeln:
[(σ · p)(σ · q)] [(σ · p0 )(σ · q0 )]
= pqI2 − iσ · (p × q) p0 q0 I2 + iσ · (p0 × q0 )
= 2 [(pq)(p0 q0 ) + (p × q)(p0 × q0 )] .
Die Behauptung für die Beträge beweisen wir durch Bestimmung der Extremalwerte
von
f (ϑ, ϑ0 ) = cos ϑ cos ϑ0 + d sin ϑ sin ϑ0 ,
mit ϑ = ∠(p, q), ϑ0 = ∠(p0 , q0 ) und |d| ≤ 1. Dazu berechnen wir die erste Ableitung
von f in ϑ:
∂f (ϑ, ϑ0 )
= − sin ϑ cos ϑ0 + d cos ϑ sin ϑ0 .
∂ϑ
Die Nullstellen sind, neben den Nullstellen der Winkelfunktionen, für die |f | ≤ 1
leicht ersichtlich ist, gegeben durch die Bedingung
tan ϑ = d tan ϑ0 .
Setzt man diese in f ein, so erhält man für die Extremalwerte fext (ϑ0 ) von f die
Gleichung
cos ϑfext (ϑ0 )
= cos2 ϑ + sin2 ϑ .
cos ϑ0
Es folgt
cos ϑ0
, und wegen cos ϑ = ±(1 + tan2 ϑ)−1/2 = ±(1 + d2 tan2 ϑ0 )−1/2 ,
fext (ϑ0 ) =
cos ϑ
55
und wegen |d| ≤ 1 gilt
|fext (ϑ0 )| =
p
d2 sin2 ϑ0 + cos2 ϑ0 ≤ 1 .
Da f eine beschränkte periodische Funktion ist, durchläuft fext in jedem Fall sowohl
das globale Maximum als auch das globale Minimum.
Lemma 3.8. Sei√b := max{|p|, |q|, |p0|, |q0 |}, |p − q| ≤ 2% und |p0 − q0 | ≤ 2%. Dann
gilt mit E(b) := b2 + m2
(3.24)
cp cq − sp sq (ω p ω q ) cp0 cq0 − sp0 sq0 (ω p0 ω q0 ) + (ω p0 × ω q0 )(ω p × ω q )sp0 sq0 sp sq
≥ m2 E(b)−2 + O(%)
√
für % → 0. Ist b ≤ 2 2m, so gilt obige Ungleichung auch ohne den O(%)-Term.
√
Beweis. Wir betrachten zuerst den Fall b > 2 2m (Für diesen√Schritt benötigen wir
nur, dass
√ b größer als eine Konstante ist). Hier ist o.E. |p| ≥ 2 2m und folglich auch
|q| ≥ 2 2m − 2%. Nach Lemma 3.6 gilt cos ∠(p, q) = 1 + O(%) und sin ∠(p, q) =
O(%). Deshalb schreibt sich (3.24) bis auf einen Term der Ordnung O(%) als
(cp cq − sp sq ) cp0 cq0 − sp0 sq0 (ω p0 ω q0 ) ,
und wegen cp ≥ sp ≥ 0 ist dies ist offensichtlich größer oder gleich
(3.25)
(cp cq − sp sq )(cp0 cq0 − sp0 sq0 ) .
Da cp monoton fallend und sp monoton steigend sind, haben wir die Ungleichungen
(3.26a)
(3.26b)
cp :=
sp :=
E(p) + m
2E(p)
E(p) − m
2E(p)
1/2
1/2
≥
≤
E(b) + m
2E(b)
E(b) − m
2E(b)
1/2
1/2
und
.
Damit ist (3.25) durch
2
1 m2
E(b)
+
m
−
E(b)
−
m
=
4E(b)2
E(b)2
nach unten beschränkt.
√
Im anderen Fall garantiert die Bedingung b ≤ 2 2m, dass E(b) ≤ 3m ist. Hier
parametrisieren wir (3.24) mit den Winkeln ϑ := ∠(p, q), ϑ0 := ∠(p0 , q0 ) und d mit
|d| ≤ 1:
(3.27)
(cp cq − sp sq cos ϑ)(cp0 cq0 − sp0 sq0 cos ϑ0 ) + d sin ϑ sin ϑ0 sp0 sq0 sp sq .
Die kleinsten Werte werden wegen cp ≥ sp offensichtlich für 0 ≤ ϑ, ϑ0 ≤ π/2 und
d = −1 angenommen. Die Abschätzungen (3.26) geben somit eine untere Schranke
56
für (3.27):
4E(b)2
(3.28)
−1 E(b) + m − cos ϑ(E(b) − m) E(b) + m − cos ϑ0 (E(b) − m)
2 − sin ϑ sin ϑ0 E(b) − m
2
−1 = 4E(b)2
E(b) + m − E(b)2 − m2 (cos ϑ + cos ϑ0 )
2
+ E(b) − m (cos ϑ cos ϑ0 − sin ϑ sin ϑ0 ) .
Hier müssen wir die Funktion f mit
f (ϑ, ϑ0 ) := − cos ϑ − cos ϑ0 + e cos(ϑ + ϑ0 )
und e := E(b) − m / E(b) + m minimieren. Wegen der Bedingung E(b) ≤ 3m gilt
0 ≤ e ≤ 1/2. Die beiden Ableitungen von f sind
∂f (ϑ, ϑ0 )
∂f (ϑ, ϑ0 )
= sin ϑ − e sin(ϑ + ϑ0 ) und
= sin ϑ0 − e sin(ϑ + ϑ0 ) .
0
∂ϑ
∂ϑ
Für die Extremalwerte folgt hieraus sin ϑ0 = sin ϑ, und da beide Winkel aus dem Intervall [0, π/2] sind, gilt schließlich ϑ0 = ϑ. Es genügt also den einfacheren Ausdruck
g(ϑ) = −2 cos ϑ + e cos 2ϑ = −2 cos ϑ + e(cos2 ϑ − sin2 ϑ)
zu minimieren. Seine Ableitung ist
∂g(ϑ)
= 2 sin ϑ − 4e sin ϑ cos ϑ ,
∂ϑ
also hat g Extremalwerte für sin ϑ = 0 und cos ϑ = (2e)−1 . Die erste Bedingung
impliziert ϑ = 0 oder ϑ = π, die zweite wegen 0 ≤ e ≤ 1/2 bestenfalls ϑ = 0. Davon
liegt aber nur ϑ = 0 in unserem Intervall [0, π/2], und die Randwerte von g sind
−2 + e bzw. −e. Es gilt also f ≥ −2 + e, und folglich lässt sich der Ausdruck (3.28)
auch in diesem Fall durch
−1
m2
4E(b)2
(E(b) + m)2 − 2(E(b)2 − m2 ) + (E(b) − m)2 =
E(b)2
nach unten abschätzen.
57
Stabilität von Atomen
Von Bach et al. wurde bereits im ersten Artikel über dieses Modell [4] die Stabilität von Atomen der Kernladungszahl Z ≤ 68 (Erbium) gezeigt. Wir ersetzen
die Dreiecksungleichung in ihrem Beweis durch ein exaktes Argument und erhalten so im physikalischen Fall Stabilität bis Z = 117, was alle bekannten Elemente
einschließt.
Der Beweis entstand in Zusammenarbeit mit Brummelhuis und Siedentop [11]
und wurde bei der Zeitschrift Documenta Mathematica“ zur Veröffentlichung ein”
gereicht.
Wir folgen Bach et al., indem wir auf den Stabilitätsbeweis für das ElektronenPositronen-Feld (Abschnitt 3.1) aufbauen. In diesem wird die Austauschenergie mit
der Ungleichung von Kato durch die kinetische Energie abgeschätzt (3.1):
π
WX ≤ Sp γ|∇|γ .
2
Mit einer Ungleichung der Form
(4.1)
|D Z | ≥ d|∇|
kann man die erste Ungleichung fortführen und dann WX analog zu (3.2) durch die
Einteilchenenergie abschätzen:
p
p
π
π
π
WX ≤ Sp γ|∇|γ ≤ d−1 Sp γ|D Z |γ ≤ d−1 Sp |D Z |(γ++ − γ−− ) |D Z | .
2
2
2
Wir erhalten
π α
EZ,α(γ) ≥ T (γ) 1 −
,
2d 2
also Stabilität für α ≤ 4d/π und mit g := Zα ist die Konstante d der Ungleichung
(4.1) gegeben durch
p
1 p
d = 1 − g 2 ( 4g 2 + 9 − 4g) .
3
Im Fall α = 1/137 benötigen wir für Stabilität d ≥ απ/4 = π/548, was mit obiger
Gleichung numerisch einem Wert von g ≤ 0, 85498 und somit Z ≤ 117.13 liefert.
Wir beweisen Ungleichung (4.1) mit der Konstante d in folgendem Abschnitt. Aus
Gründen der Übersichtlichkeit benutzen wir eine weitere Notation für den Diracoperator mit Coulombpotential,
g
.
Dg,m := −iα · ∇ + mβ +
|x|
Eine Ungleichung für Diracoperatoren
√
Lemma 4.1. Sei g ∈ [0, 3/2], m ≥ 0 und
(
p
1
(
4g 2 + 9 − 4g) m = 0
3 p
.
d= p
1 − g 2 31 ( 4g 2 + 9 − 4g) m > 0
Dann gilt die Ungleichung
(4.2)
|Dg,m | ≥ d|D0,0 | = d|∇| .
58
Der folgende Graph gibt einen Überblick der Abhängigkeit von d von der Kopplungskonstante g.
Den Operator |Dg,0 | kann man nicht explizit hinschreiben und so beweisen wir
wie in [4] die stärkere Ungleichung
2
2
Dg,0
≥ d2 D0,0
(4.3)
√
für g < 3/2. Da die Definitionsbereiche der beiden Operatoren unter der Einschränkung an g identisch sind, folgt die behauptete Ungleichung (4.2) mit [24,
Satz 3]. Wir werden zwar die scharfe Konstante d2 für (4.3) zeigen, aber wegen
des Quadrierens ist nicht zu erwarten, dass d auch die scharfe Konstante für die
Ungleichung (4.2) des Lemmas ist. In [4] wurde an dieser Stelle die Dreiecksungleichung angewandt; wir werden die Streckungshomogenität des masselosen CoulombDiracoperators ausnutzen um das Problem auf eine Ungleichung von Multiplikationsoperatoren zu reduzieren.
Wie bereits bei√der Einführung des Diracoperators mit Coulombpotential erwähnt,
ist Dg,m für g ≤ 3/2 wesentlich selbstadjungiert auf D := C0∞ (R3 \ {0}) ⊗ C4 und
somit impliziert
kDg,0 f k22 − d2 kD0,0 f k22 ≥ 0
für alle f ∈ D schon die Ungleichung (4.3).
Er ist auf auf D unitär äquivalent zu seiner Drehimpulszerlegung
mit
∞
M
j
M
j= 21 , 23 ,...
mj =−j
hg,m,κ :=
M
hg,m,κj
κj =±(j+ 12 )
m − gr − ddr + κr
d
+ κr −m − gr
dr
,
definiert auf C0∞ (0, ∞) ⊗ C2 ⊆ L2 (0, ∞) ⊗ C2 [41, Satz 4.14]. Dabei sind j(j + 1),
mj und −κj die Eigenwerte der Drehimpulsoperatoren J 2 , J3 bzw. des Spin-BahnOperators K.
Wir verwenden nun die Mellintransformation. Sie ist für Streckungen, was
die Fouriertransformation für Verschiebungen ist: Operatoren, die homogen unter
59
Streckungen sind, werden zu Multiplikationsoperatoren. Der Operator hg,0,κ ist jedoch homogen vom Grad −1 unter Streckungen und wird auf glatten Funktionen
mit kompaktem Träger zu einer Multiplikation der um die Imaginäre Einheit verschobenen Funktion.
Die unitäre Mellintransformation M : L2 (0, ∞) → L2 (R), f 7→ Mf ist definiert
durch
Z ∞
1
r −1/2−is f (r) d r .
Mf (s) = √
2π 0
Sie ist unitär und wohldefiniert, da sie aus der Fouriertransformation und der
unitären Abbildung
ι:
L2 (0, ∞)
−→
L2 (−∞, ∞)
f : r 7→ f (r) 7→ h : z 7→ ez/2 f (ez )
zusammengesetzt ist, wie man leicht durch Substitution mit r = ez sieht:
Z ∞
Z ∞
1
1
−isz z/2
z
√
e e f (e ) d z = √
r −1/2−is f (r) d r .
2π 0
2π 0
Wir aber werden die Mellintransformation als Abbildung der glatten Funktionen
mit kompaktem Träger in die holomorphen Funktionen auf ganz C betrachten,
MH : C0∞ (0, ∞) → H(C). Die Transformierte ist trivialerweise auf ganz C definiert
und holomorph, da Differentiation und Integration vertauschen. Ähnlich wie bei der
Fouriertransformation gelten folgende Regeln:
M (r a f ) (s) = Mf (s + ia) ,
1
d
f (s) = (is + )Mf (s − i) .
M
dr
2
Wir beweisen die zweite durch partielle Integration, wobei wegen des kompakten
Trägers von f die Limiten von r −1/2−is f (r) für r → 0 und r → ∞ verschwinden:
Z ∞
Z ∞
1
−1/2−is d
r
f (r) d r = 0 −
(− − is)r 1/2−is f (r) d r .
dr
2
r=0
r=0
Wegen der Unitarität der Mellintransformation ist (4.3) äquivalent zu
kMDg,0 f k22 − d2 kMD0,0f k22 ≥ 0
und der masselose Diracoperator im Kanal κ wird für f + , f − ∈ C0∞ (0, ∞) unter der
Transformation zu
+ Mf + (s − i)
f (s)
−g
−is − 21 + κ
.
Mhg,0,κ
=
Mf − (s − i)
f − (s)
−g
+is + 21 + κ
Wenn wir die obige Matrix mit hM
g,0,κ bezeichnen, ist (4.3) gleichbedeutend mit
Z ∞
∗ M
2 M
∗ M
(Mf )∗(s − i) (hM
g,0,κ ) hg,0,κ − d (h0,0,κ ) h0,0,κ Mf (s − i) d s ,
−∞
60
und dafür ist hinreichend, dass die Matrix in eckigen Klammern für κ = ±1, ±2, . . .
nichtnegativ ist:
∗ M
2 M
∗ M
(hM
g,0,κ ) hg,0,κ − d (h0,0,κ ) h0,0,κ =
2
g + (1 − d2 )(s2 + (κ + 12 )2 )
−2(κ − is)g
≥0.
−2(κ + is)g
g 2 + (1 − d2 )(s2 + (κ − 21 )2 )
Diese Bedingung ist auch notwendig, da für alle f ∈ C0∞ (R3 ) die Funktion Mf (s−i)
das Bild von f (r)/r unter der unitären Mellintransformation und die Abbildung
f (r) 7→ r a f (r) eine Bijektion auf C0∞ (R3 ) ist. Damit folgt, dass die Menge
{Mf (s − i)|f ∈ C0∞ (R3 )} ⊆ L2 (R3 )
dicht ist.
Die Bedingung ist genau dann erfüllt, wenn die Eigenwerte dieser Matrix für alle
s ∈ R und κ = ±1, ±2, . . . nichtnegativ sind. Die Eigenwerte sind die Lösungen des
quadratischen Polynoms
1 1 2
λ2 − 2λ g 2 + (1 − d2 )(s2 + κ2 + ) + g 2 + (1 − d2 )(s2 + κ2 + )
4
4
2 2 2
− (1 − d ) κ − 4g 2 (s2 + κ2 ) .
Die kleinere davon ist
p
1
λ1 = g 2 + (1 − d2 )(s2 + κ2 + ) − (1 − d2 )2 κ2 + 4g 2(s2 + κ2 ) .
4
Hier sieht man schon, dass d nicht größer als 1 sein kann und dass d = 1 nur für
g = 0 möglich ist. Im Folgenden können wir also ohne weiteres d < 1 voraussetzen.
Zuerst behandeln wir die notwendige Bedingung λ1 (s = 0) ≥ 0, die sich am Ende
als die restriktivste herausstellen wird. Der kleinere Eigenwert an der Stelle s = 0,
p
1
λ1 (s = 0) = g 2 + (1 − d2 )(κ2 + ) − |κ| (1 − d2 )2 + 4g 2 ,
4
ist nichtnegativ, falls |κ| nicht in dem offenen Intervall zwischen den beiden Werten
p
p
(1 − d2 )2 + 4g 2 ± (1 − d2 )2 + 4g 2 − 4(1 − d2 )(g 2 + (1 − d2 )/4)
2(1 − d2 )
p
(1 − d2 )2 + 4g 2 ± 2gd
=
2(1 − d2 )
liegt. Da aber nur ganzzahlige |κ| ≥ 1 relevant sind, können wir das Intervall unter
1 drücken oder es darüber ziehen. Sei zuerst das obere Ende des Intervalls kleiner
gleich 1:
p
(1 − d2 )2 + 4g 2 + 2gd
≤1,
2(1 − d2 )
oder umgeformt,
p
(4.4)
(1 − d2 )2 + 4g 2 ≤ 2(1 − d2 ) − 2gd .
Wenn wir jetzt die Gleichung quadrieren, könnte das zu zusätzlichen Lösungen
führen. Da sich aber herausstellen wird, dass für die Lösung die rechte Seite obiger
61
Ungleichung nichtnegativ ist, machen wir mit dem Quadrieren keinen Fehler. Wir
bekommen
(1 − d2 )2 + 4g 2 ≤ 4(1 − d2 )2 + 4g 2d2 − 8gd(1 − d2 )
und durch Kürzen von 1 − d2
4g 2 + 8dg − 3(1 − d2 ) ≤ 0 .
Die Lösungen für d und g sind
p
1
− 8g + 64g 2 − 4 · 3(−3 + 4g 2 )
d≤
6
(4.5)
p
1 p
1
− 8g + 16g 2 + 36 =
4g 2 + 9 − 4g ,
=
6
3
bzw.
(4.6)
p
1 − d2
1 √
3
1
g ≤ (−8d + 64d2 + 4 · 4 · 3(1 − d2 )) = ( 3 + d2 − 2d) = √
.
8
2
2 3 + d2 + 2d
Insbesondere gilt g ≤ (1 − d2 )/d, womit die rechte Seite von (4.4) wie vorher behauptet nichtnegativ ist. Der andere Fall, in dem das Intervall über 1 liegt, führt zu
folgender Ungleichung:
4g 2 − 8dg − 3(1 − d2 ) ≥ 0 .
Diese sagt, dass g nicht zwischen den Zahlen
p
√
8d ± 64d2 + 16 · 3(1 − d2 )
1
= (2d ± d2 + 3)
8
2
liegen darf. Die kleinere von beiden
√ ist aber kleiner als 0 für d < 1 und die größere
für positives d immer größer als 3/2. Die
√ einzig erlaubten Werte wären die trivialen
Kombinationen: g = 0, d = 1 und g = 3/2, d = 0.
Die Ableitung des kleineren Eigenwerts nach s liefert
−1/2
∂λ1
= 2s[1 − d2 − 2g 2 (1 − d2 )2 κ2 + 4g 2 (s2 + κ2 )
].
∂s
Die möglichen Extremalwerte sind s = 0 und die Nullstellen des Ausdrucks in eckigen
Klammern. Wir werden zeigen, dass unter der Bedingung (4.5) bei s = 0 der einzige
Extremalwert ist. Es ist notwendigerweise ein Minimum, da λ1 (s = ±∞) = ∞. Die
Bedingung (4.5) garantiert aber gerade λ1 (s = 0) ≥ 0, womit das Lemma bewiesen
ist.
Wir zeigen nun die Positivität des Ausdrucks in eckigen Klammern. Dazu stellen
wir zuerst fest, dass dieser für κ2 = 1 und s = 0 am kleinsten ist. Es genügt daher
4g 4 − (1 − d2 )2 ((1 − d2 )2 + 4g 2) < 0
zu zeigen. Löst man die Ungleichung, so erhält man
√
1+ 2
2
(1 − d2 )2 .
g <
2
62
Wegen Bedingung (4.6) ist obige Ungleichung erfüllt falls
s
√
2
1−d
1+ 2
3
√
(1 − d2 )
<
2 3 + d2 + 2d
2
und da d < 1 ist dies äquivalent zu
q
√
√ √
3 < 2 1 + 2( 3 + d2 + 2d) .
Aber die rechte Seite ist monoton steigend in d und größer als 3 für d = 0. Damit
ist die Positivität gezeigt und λ1 hat bei s = 0 sein globales Minimum.
Wir reduzieren jetzt den massiven Fall auf den bereits bewiesenen masselosen. Es
gilt die folgende Beziehung zwischen den Quadraten des massiven und masselosen
Diracoperators:
2
2
Dg,m
= Dg,0
+ m2 − 2mβg/|x| .
Dieser Operator ist offensichtlich nichtnegativ. Wir werden aber zeigen, dass man
2
nur einen Bruchteil von Dg,0
benötigt, um die Massenterme zu kontrollieren.
Es gilt
(4.7)
2
Dg,0
+ m2 − 2mβg/|x| ≥ 0
genau dann, wenn ≥ g 2 .
p
Um dies einzusehen, verwenden wir den bekannten kleinsten Eigenwert m 1 − g 2
des Diracoperators mit Coulombpotential [41, Abschnitt 7.4]. Wir bekommen die
2
Operatorungleichung Dg,m
≥ m2 (1−g 2 ). Multiplizieren wir diese mit und skalieren
die Masse mit 1/, so erhalten wir
Es folgt
2
Dg,0
1 2
m2 (1 − g 2 )
2
2
≤
D
=
D
+
m − 2mβg/|x| .
g,m/
g,0
2
1 − g2
g2
2
+ m − 2mβg/|x| ≥ 1 − 1/ +
m = 1−
m2
2
und somit auch (4.7) falls ≥ g 2 . Diese Bedingung ist auch notwendig, da für den
Grundzustand des Diracoperators überall die Gleichheit gilt.
Mit (4.7) lässt sich die massive Ungleichung nun in einer Zeile zeigen:
2
2
2
2
Dg,m
= (1 − g 2 )Dg,0
+ g 2 Dg,0
+ m2 − 2mβg/|x| ≥ (1 − g 2 )d2 D0,0
.
Der Grund für den Sprung zwischen den Fällen m = 0 und m 6= 0 liegt darin, dass
wir im zweiten Fall zwei, für sich scharfe, Ungleichungen verwendet haben. Eine
solche Zusammensetzung ist aber im Allgemeinen nicht mehr scharf.
√
Der Fall Zα = 3/2
√
Wir zeigen, dass wir für g = 3/2 in der quadrierten“ Ungleichung
”
2
2
(4.8)
Dg,m
≥ d2 D0,m
nur die Konstante d2 = 0 bekommen können. Der tiefere Grund ist die Existenz
von Funktionen im Definitionsbereich von D√3/2,m , deren Ableitung nicht quadratintegrierbar ist. Ein Beispiel ist die Eigenfunktion zum niedrigsten Eigenwert.
63
Für allgemeines g ∈ [0,
gegeben durch
√
3/2] ist diese Funktion in dem Drehimpulskanal κ = −1
−g
ng
r s e−gmr ,
1−s
p
1 − g 2 und ng der Normierungsfaktor für die L2 -Norm ist.√ Ihre
wobei s =
Ableitung ist quadratintegrierbar, falls s > 1/2, oder gleichbedeutend g < 3/2,
ist.
Zum Beweis berechnen wir die L2 -Norm von h√3/2,m,−1 Ψβ und h0,m,−1 Ψβ mit
p
β ∈ (1, 2), g = 3/2, s = 1/2, m0 > 0 und
0
−g
Ψβ := nβ
r βs e−gm r .
−(s − 1)
Wir werden sehen, dass mit β → 1 die erste beschränkt
bleibt und die zweite nach
√
unendlich strebt. Es folgt also d2 = 0 für g = 3/2 in (4.8). Der Wert von m0 ist
nicht weiter relevant, er darf nur nicht verschwinden, damit Ψβ quadratintegrabel
bleibt.
d
−gm + g 2 /r + (s − 1) dr
+ (s − 1)/r β/2 −gm0 r
hg,m,−1 Ψβ = nβ
r e
d
−g dr
+ g/r + (s − 1)m + (s − 1)g/r
2
g + (βs + 1)(s − 1) + r(−gm − (s − 1)gm0 ) β/2−1 −gm0 r
r
e
.
= nβ
−gβs + g + (s − 1)g + r(g 2m0 + (s − 1)m)
Schreibt man obige Funktion als
f1 (β) + r · h1 β/2−1 −gm0 r
nβ
r
e
,
f2 (β) + r · h2
so ergibt sich für die Norm
Z ∞
0
2
nβ
(f1 (β) + r · h1 )2 + (f2 (β) + r · h2 )2 r β−2 e−2gm r d r .
r=0
Wegen β > 1 könnten nur die Terme mit fi2 unbeschränkt sein. Da aber
√
f1 (β) = (1 − β)/4 , f2 (β) = (1 − β) 3/2
und für a ∈ (−1, 0) und b > 0 die einfache Ungleichung
Z ∞
Z 1
Z ∞
a −br
a
r e dr ≤
r dr +
e−br d r =
r=0
r=0
r=1
e−b
1
+
a+1
b
gilt, verschwindet der Grenzwert dieser Terme.
Wie oben bekommen wir für den anderen Fall
d
−gm + (s − 1) dr
+ (s − 1)/r βs −gm0 r
h0,m,−1 Ψβ = nβ
r e
d
−g dr
+ g/r + (s − 1)m
(βs + 1)(s − 1) + r(−gm − (s − 1)gm0 ) βs−1 −gm0 r
= nβ
r
e
.
−gβs + g + r(g 2 m0 + (s − 1)m)
Aber hier verschwinden die Terme der Ordnung r βs−1 nicht für β → 1, die L2 -Norm
ist also unbeschränkt.
64
Anhang
Zuerst geben wir den Beweis für die Optimalität unserer Wahl des Elektronenraums
(vergleiche Abschnitt 2).
Satz 5.1 (Optimalität der Wahl von H+ [4, Theorem 6]). Sei P+Z die orthogonale
Projektion auf den positiven Spektralraum von D Z und S die Menge aller orthogonalen Projektionen P auf H mit P (D(D Z )) ⊆ D(D Z ). Bezeichne mit H+ den Raum
P H für eine Projektion P ∈ S und mit E(H+ ) das Infimum der Energie (2.6) des
Modells mit Elektronenraum H+ . Ist E(P+Z H) = 0, was jeder bewiesene Stabilitätsfall
erfüllt, so gilt
E(H+ ) < 0 = E(P+Z H)
für alle H+ 6= P+Z H.
Beweis. Der Beweis hat zwei Teile; zuerst nehmen wir an, dass zwei normierte VekZ
Z
toren p ∈ H+ ∩ D(D Z ) und n ∈ H⊥
+ ∩ D(D ) mit <(p, D n) 6= 0 existieren. Wir
wählen unsere Basis von H mit den Elementen e−1 = n und e1 = p und die Ladungsdichtematrix
γ 0
Γ=
0 −γ
mit
γi,j
Die Energie von Γ ist

ε2


 2

−ε
√
=

ε 1 − ε2



0
i=j=1
i = j = −1
.
i = −j ∈ {−1, 1}
sonst
Z
Z
EZ,α (Γ) = ε(D1,−1
+ D−1,1
) + O(ε2)
und mit einem kleinen ε richtigen Vorzeichens ist sie negativ.
Z
Gilt umgekehrt (p, D Z n) = 0 für alle p ∈ H+ ∩D(D Z ) und n ∈ H⊥
+ ∩D(D ), dann
Z
Z
kommutieren P und D und somit nach dem Spektralsatz auch P und P+ . Daher
Z
ist eine der Mengen D(D Z ) ∩ H+ ∩ (1 − P+Z )(H) und D(D Z ) ∩ H⊥
+ ∩ (1 − P+ )(H) nicht
leer. Nehmen wir an, es gibt ein normiertes u in der ersten und unsere Orthonormalbasis hat als nulltes Element e0 = u. Die Energie der Ladungsdichtematrix zu
dem Zustand ϕ = a∗0 Ω ∈ F,
(
1 i=j=0
γ 0
Γ=
mit γi,j =
,
0 −γ
0 sonst
ist
Z
EZ,α (Γ) = D0,0
<0.
65
Hilbert-Schmidt-Operatoren
Hier werden kurz die in der Arbeit benötigten Resultate über Hilbert-Schmidt- und
Spurklasseoperatoren vorgestellt.
Sei M := Rn ×{1, . . . , m} für natürliche Zahlen m und n und L2 (M) versehen mit
dem Produktmaß aus Lebesgue- und Zählmaß. Wir fixieren
eine Orthonormalbasis
2
(ei )i∈ von L (M) und die Orthonormalbasis ei (x)ej (y) i,j∈ des Produktraums
L2 (M × M). Ein Operator γ : L2 (M) → L2 (M) ist ein Hilbert-Schmidt-Operator
genau dann, wenn es eine Funktion γ(x, y) ∈ L2 (M × M) mit
Z
(γf )(x) =
γ(x, y)f (y) d y
M
2
für alle f ∈ L (M) gibt [7, Theorem 3.6.5]. Diese ist in L2 (M × M) eindeutig, da
ihre Koeffizienten bezüglich der Basis durch (ei , γej ) gegeben sind. Das Quadrat der
Hilbert-Schmidt-Norm ist definiert als
X
|(ei , γej )|2 = Sp γ ∗ γ = Sp γγ ∗ = kγ(x, y)k22 .
i,j∈
Es gilt also allgemein
γ(x, y) =
X
(ei , γej )ei (x)ej (y) ,
i,j∈
oder, falls γ normal ist und man als Basis seine Eigenfunktionen wählt,
X
γ(x, y) =
(ei , γei )ei (x)ei (y) .
i∈
Im Fourierraum schließlich schreibt sich der Integralkern als
X
γ(p, q) =
(ei , γej )eˆi (p)eˆj (q) .
i,j∈
Lemma 5.2 ([38, §XI.4]). Sei K eine stetige Funktion auf M × M mit folgenden
Eigenschaften:
• Für alle f ∈ C0 (M) gilt
Z Z
f (x)K(x, y)f (y) d x d y ≥ 0
M
M
Rund somit K(x, x) ≥ 0.
• M K(x, x) d x < ∞.
Dann gibt es einen Spurklasseoperator A mit Integralkern K und
Z
Sp A =
K(x, x) d x .
M
Ist umgekehrt
A ein positiver Operator endlicher Spur mit stetigem Integralkern K,
R
so ist M K(x, x) d x endlich und seine Spur durch obige Formel gegeben.
Lemma 5.3. Sei G ein Hilbertraum, γ : G → G ein Hilbert-Schmidt-Operator und
A : G → G ein positiver selbstadjungierter Operator. Dann gilt
√
√
Sp Aγ ∗ γ A = Sp γAγ ∗ ,
66
in dem Sinne, dass wenn eine Seite unendlich ist, so auch die andere. Ist darüber
hinaus noch Aγ ∗ γ Spurklasse, so sind obige Terme auch gleich Sp Aγ ∗ γ.
√
Beweis. Mit B := γ A schreibt sich die Behauptung als Sp B ∗ B = Sp BB ∗ . Dies
sind aber die identischen Hilbert-Schmidt-Normen von B und B ∗ .
Ist Aγ ∗ γ Spurklasse, so ist seine Spur mit den Eigenfunktionen fi zu den nicht verschwindenden Eigenwerten λi von γ ∗ γ durch die Summe der nichtnegativen Terme
X
(5.1)
λi (fi , Afi )
i
gegeben. Sei E das zu A gehörige Spektralmaß und An := E(−∞, n]A = E[0, n]A
für n > 0 die Einschränkung von A auf den numerischen Wertebereich [0, n]. Die
∗
steigend
Folge (Sp An γ ∗ γ)n∈ ist mit
√ ∗ und
√ konvergiert gegen Sp Aγ γ
√ (5.1)∗ monoton
√
und gleichermaßen gilt Sp An γ γ An → Sp Aγ γ A. Für alle endlichen n sind
die Folgeglieder aber identisch.
Die Matrixelemente des Coulombpotentials
In diesem Abschnitt stellen wir ein paar Hilfssätze für den Umgang mit dem
Coulombpotential zusammen.
Lemma 5.4. Für ei , ej , ek , el ∈ H 1/2 (R3 ) ⊗ C4 ist das Matrixelement
Z
Z
ei (x)ej (y)ek (x)el (y)
Wi,j;k,l =
dx dy
|x − y|
G
G
der Coulombwechselwirkung endlich.
Beweis. Es gilt |ei (x)ek (x)| ≤ |ei (x)|2 + |ek (x)|2 , also genügt es den Fall ei = ek und
ej = el zu behandeln. Durch Anwendung der Ungleichung von Kato (1.2) in einer
Variablen erhalten wir
Z
Z
Z
Z
π
|ei (x)|2 |ej (y)|2
≤
d x d y ei (x) |∇x | ei(x)|ej (y)|2
dx dy
|x
−
y|
2
G
G
G
G
π
2
≤ kei kH 1/2 kej k2H 1/2 .
2
Lemma 5.5 (Fouriertransformation des Coulompotentials). Seien i, j, k, l ∈ Z fix
und ei , ej , ek , el ∈ L12/5 (R3 )⊗C4 . Dann ist das Matrixelement Wi,j;k,l im Fourierraum
gegeben durch
Z
Z
ei (x)ej (y)ek (x)el (y)
Wi,j;k,l =
dx dy
|x − y|
G
G
4 Z
1 X
= 2
d q d q0 d p|q|−2 ebj (q − p, σ)b
el (−p, σ)b
ei (−q + q0 , τ )ebk (q0 , τ )
2π σ,τ =1 9
4 Z
1 X
d q d q0 d p|q − q0 |−2 ebj (q0 + p, σ)b
= 2
el (p + q, σ)b
ei (q, τ )ebk (q0 , τ ) .
2π σ,τ =1 9
67
Beweis. Aus [30, Korollar 5.10] nehmen wir die Formel (nach Polarisation, für die
gewöhnliche Fouriertransformation (0.1))
Z
Z
2a−n
2a
fb2 (q)|q|−2a fb1 (q) d q,
f2 (x)|x − y|
f1 (y) d y d x = c2a (2π)
cn−2a
n
n
mit ca := π −a/2 Γ(a/2), 0 < a < n/2 und f1 , f2 ∈ L2n/(n+2a) . In unserem Fall ist
n = 3, a = 1, f1 (x) := ei (x)ek (x) und f2 (y) := ej (y)el (y). Wir benötigen die
−3/2
Konstanten c1 = 1 und c2 = π −1 , und wegen ed
ebi ∗ ebj ergibt sich für
i ej = (2π)
das Matrixelement Wi,j;k,l
4 Z
1 X
2π 2 σ,τ =1
9
d q d q0 d p|q|−2 ebj (q − p, σ)b
el (−p, σ)b
ei (−q + q0 , τ )ebk (q0 , τ )
4 Z
1 X
= 2
2π σ,τ =1
4 Z
1 X
= 2
2π σ,τ =1
9
9
el (p, σ)b
ei (q, τ )ebk (q0 , τ )
d q d q0 d p|q − q0 |−2 ebj (−q + q0 + p, σ)b
d q d q0 d p|q − q0 |−2 ebj (q0 + p, σ)b
el (p + q, σ)b
ei (q, τ )ebk (q0 , τ ) ,
wobei wir von der zweiten zur dritten Zeile q → −q + q0 und p → −p substituieren
und zur letzten noch p → p + q.
Als unmittelbare Folge erhalten wir eine Formel für die Austauschenergie im Impulsraum.
Lemma 5.6 (Die Austauschenergie im Impulsraum). Ist γ(x, y) ∈ G := H 1/2 (G ×
G), so ist die Austauschenergie im Fourierraum gleich
WX = kγ(x, y)|x − y|−1/2 k22
4 Z
1 X
= 2
d q d q0 d p|q − q0 |−2 γ(q0 + p, σ; q0 , τ )γ(q + p, σ; q, τ ) .
2π σ,τ =1 9
Beweis. Mit der Kato-Ungleichung gilt für f (x, y) ∈ G, wie im Beweis der
Endlichkeit der Matrixelemente,
Z
G×G
|f (x, y)|2
π
≤
|x − y|
2
Z
G×G
|p||f (p, q)|2 ≤
π
kf k2H 1/2 .
2
Die Abbildung G → R, f (x, y) 7→ kf (x, y)|x − y|−1/2 k22 ist also stetig. Mit der KatoUngleichung im Fourierraum,
1
2π 2
Z
π
u(p)u(q)
dpdq
≤
|p − q|2
2
6
Z
d p|p||u(p)|2 ,
3
68
erhalten wir für die rechte Seite der Behauptung die analoge Abschätzung
4 Z
1 X
d q d q0 d p|q − q0 |−2 f (q0 + p, σ; q0 , τ )f (q + p, σ; q, τ )
2
2π σ,τ =1 9
4 Z
π X
π
≤
d p d q|q||f (p, σ; q, τ )|2 ≤ kf k2H 1/2 .
2 σ,τ =1 6
2
Damit hängt auch die rechte Seite stetig von f (x, y) ab und es genügt, die Behauptung auf einer dichten Teilmenge von G zu zeigen. Da C0∞ (G) in H 1/2 (G) dicht ist,
können wireine Orthonormalbasis (fi )i∈ von H 1/2 (G) aus C0∞ (G) wählen. Dann ist
fi (x)fj (y) i,j∈ eine Orthonormalbasis von G, und für diese wurde die Behauptung
in Lemma 5.5 bewiesen. Folglich gilt sie auch auf allen endlichen Linearkombinationen der Basis, einer dichten Teilmenge.
In den folgenden beiden Lemmas beweisen wir zwei Behauptungen aus Abschnitt 2.3 über die Matrixelemente des Coulombpotentials mit der Zerlegung von
H in H+ und H− bezüglich des masselosen freien Diracoperators.
Der masselose freie Diracoperator hat im Impulsraum die Gestalt
0
σ·p
0
,
D =
σ·p
0
und daher eine besonders einfache Zerlegung von H in H+ und H− . Für jedes u ∈
L2 (R3 ) ⊗ C2 definieren wir die Vektoren
u
u
+
−
und u :=
(5.2)
u :=
σ · ωpu
−σ · ω p u
und erhalten
D 0 u+ = |p|u+ und D 0 u− = −|p|u− .
Darüber hinaus ist wegen (σ·ω p )2 = I2 jedes Element von H eine Linearkombination
von Vektoren der Form (5.2):
1 u + (σ · ω p )v
1 u − (σ · ω p )v
u
=
+
.
v
2 (σ · ω p u) + v
2 −(σ · ω p )u + v
Es folgt also, dass H+ gleich der Menge der Vektoren u+ und H− gleich der Menge
der Vektoren u− ist. An der Form von u+ und u− sieht man die Invarianz der
Räume H+ und H− unter Streckung der Koordinaten. Dies gilt, wie man sich leicht
anhand elementarer Eigenschaften der Fouriertransformation überlegen kann, auch
im Ortsraum. Die Zerlegung in H+ und H− im massiven Fall ist auch nicht viel
komplizierter; man findet sie in [20] oder implizit in Abschnitt 3.2.
Lemma 5.7. Sind H+ und H− bezüglich des masselosen freien Diracoperators
gewählt, dann gibt es orthonormale Vektoren e1 , e2 , e−1 , e−2 mit e1 , e2 ∈ H+ ,
e−1 , e−2 ∈ H− , deren Matrixelemente des Coulombpotentials die Eigenschaften
W−1,−2;1,2 > 0 und W−2,−1;1,2 = 0 haben.
69
Beweis. Mit der Bezeichnung (ω p )i für die i-te Komponente des Einheitsvektors von
p gilt
(ω p )3
(ω p )1 − i(ω p )2
σ · ωp =
.
(ω p )1 + i(ω p )2
−(ω p )3
Wir wählen eine kugelsymmetrische C0∞ (R3 \ {0})-Funktion e und definieren mit
Hilfe obiger Darstellung von H+ und H− zwei orthogonale Elektronen f1 , f2 und
zwei orthogonale Positronen g1 , g2 im Impulsraum:




e(p)
e(p)




0
0
 ,
 , g1 (p) := 
f1 (p) := 




−(ω p )3 e(p)
(ω p )3 e(p)
−((ω p )1 + i(ω p )2 )e(p)
((ω p )1 + i(ω p )2 )e(p)




0
0




e(p)
e(p)



f2 (p) := 
((ω p )1 − i(ω p )2 )e(p) , g2 (p) := −((ω p )1 − i(ω p )2 )e(p) .
−(ω p )3 e(p)
(ω p )3 e(p)
Aufgrund der beabsichtigten hohen Symmetrie lassen sich die Komponenten aller
vier Vektoren durch die des ersten ausdrücken,



 



0
0
f11
f11



0



 , g1 =  0  , f2 =  f11  , g2 =  f11  .
f1 = 
−f14 
f13 
−f13 
 f14 
f14
−f14
−f13
f13
Damit ergibt sich das erste Matrixelement, W−1,−2;1,2 , zu
4 Z
1 X
d q d q0 d p|q|−2 g2 (q − p, σ)f2 (−p, σ)g1 (−q + q0 , τ )f1 (q0 , τ )
2
2π σ,τ =1 9
Z
1
= 2
d q d q0 d p|q|−2
2π
9
· f11 (q − p)f11 (−p) − f14 (q − p)f14 (−p) − f13 (q − p)f13 (−p)
· f11 (−q + q0 )f11 (q0 ) − f13 (−q + q0 )f13 (q0 ) − f14 (−q + q0 )f14 (q0 ) .
Da aber die Komponenten von f1 die Spiegelungssymmetrien f11 (−p) = f11 (p),
f13 (−p) = −f13 (p) und f14 (−p) = −f14 (p) erfüllen, und die Faltung einer Funktion
mit seiner komplexen Konjugation eine reellwertige Funktion ist, kann man den
Ausdruck wie folgt vereinfachen:
Z
1
d q d q0 d p|q|−2
2π 2 9
· f11 (q − p)f11 (p) + f14 (q − p)f14 (p) + f13 (q − p)f13 (p)
· f11 (q − q0 )f11 (q0 ) + f13 (q − q0 )f13 (q0 ) + f14 (q − q0 )f14 (q0 )
Z
2
1
d q|q|−2 f11 ∗ f11 (q) + f13 ∗ f13 (q) + f14 ∗ f14 (q)
= 2
2π
3
70
Für die Positivität des Matrixelements bleibt zu zeigen, dass die Funktion in Klammern nicht fast überall verschwindet. Es gilt aber
f11 ∗ f11 (q) + f13 ∗ f13 (q) + f14 ∗ f14 (q)
=
Z
3
d p(1 + ω q−p ω p )f11 (q − p)f11 (p) ,
und die Funktion 1+ω q−p ω p hat ihre Nullstellen in der Nullmenge {p = λq|λ ∈ R}.
Da f11 nichtnegativ und als nicht fast überall verschwindend vorausgesetzt war, folgt
die Behauptung für das erste Matrixelement.
Das zweite Matrixelement, W−2,−1;1,2 , ist gegeben durch
4 Z
1 X
d q d q0 d p|q|−2 g1 (q − p, σ)f2 (−p, σ)g2 (−q + q0 , τ )f1 (q0 , τ )
2π 2 σ,τ =1 9
Z
1
= 2
d q d q0 d p|q|−2 − f13 (q − p)f14 (−p) + f14 (q − p)f13 (−p)
2π
9
· − f14 (−q + q0 )f13 (q0 ) + f13 (−q + q0 )f14 (q0 ) = 0 ,
da der Integrand punktweise verschwindet. Dies folgt leicht aus den oben genannten
Symmetrien von f13 und f14 und der Tatsache, dass f13 reell ist.
Lemma 5.8. Der Vakuumerwartungswert der nicht vollständig normalgeordneten
Coulombwechselwirkung bezüglich des masselosen freien Diracoperators
Z
X
X Z
ei (x)ej (x)ei (y)ej (y)
(5.3)
Wi,j;j,i =
dx dy
|x − y|
G
i<0,j≥0
i<0,j≥0 G
ist unendlich oder basisabhängig.
Beweis. Aus dem Beweis des vorangegangenen Lemmas kann man entnehmen,
dass es ein normiertes Elektron-Positron-Paar e−1 , e1 mit W−1,1;1,−1 > 0 gibt. Wir
ergänzen diese zwei Vektoren zu einer mit der Zerlegung H+ ⊕ H− verträglichen
Basis (siehe Definition 2.1) (ei )i∈ von H. Wegen der Skalierungsinvarianz von H+
und H− ist (e0i )i∈ mit e0i (x) := λ3/2 ei (λx) für ein λ > 0 wieder eine solche Basis. Das neue Matrixelement bezüglich (e0i )i∈ ist λW−1,1;1,−1 , und da alle Terme in
(5.3) nichtnegativ sind, folgt die Divergenz der Summe, falls diese basisunabhängig
ist.
71
Literatur
[1] V. Bach, E. H. Lieb und J. P. Solovej. Generalized Hartree-Fock theory and the Hubbard
model. J. Stat. Phys., 76(1&2):3–89, 1994.
[2] V. Bach. Error bound for the Hartree-Fock energy of atoms and molecules. Commun. Math.
Phys., 147:527–548, 1992.
[3] V. Bach, J-M. Barbaroux, B. Helffer und H. Siedentop. Stability of matter for the Hartree-Fock
functional of the relativistic electron-positron field. Doc. Math., 3:353–364, 1998.
[4] V. Bach, J-M. Barbaroux, B. Helffer und H. Siedentop. On the stability of the relativistic
electron-positron field. Commun. Math. Phys., 1999.
[5] V. Bach und J. Poelchau. Accuracy of the Hartree-Fock approximation for the Hubbard model.
J. Math. Phys., 38(4):2072–2083, 1997.
[6] A. A. Balinsky und W. D. Evans. Stability of one-electron molecules in the Brown-Ravenhall
model. Commun. Math. Phys., 202(2):481–500, 1999.
[7] J. Blank, P. Exner und M. Havlı́ček. Hilbert space operators in quantum physics. American
Institute of Physics, New York, 1994.
[8] O. Bratteli und D. W. Robinson. Operator algebras and quantum statistical mechanics. 1.
Springer-Verlag, New York, 2. Auflage, 1987.
[9] O. Bratteli und D. W. Robinson. Operator algebras and quantum statistical mechanics. 2.
Springer-Verlag, Berlin, 2. Auflage, 1997.
[10] G. E. Brown und D. G. Ravenhall. On the interaction of two electrons. Proc. Roy. Soc. London
A, 208(A 1095):552–559, 1951.
[11] R. Brummelhuis, N. Röhrl und H. Siedentop. Stability of relativistic electron-positron fields
of atoms in Hartree-Fock approximation: heavy elements. Eingereicht bei Documenta Mathematica, 2000.
[12] P. Chaix und D. Iracane. From quantum electrodynamics to mean-field theory: I. The
Bogoliubov-Dirac-Fock formalism. J. Phys. B., 22(23):3791–3814, 1989.
[13] P. Chaix, D. Iracane und P. L. Lions. From quantum electrodynamics to mean-field theory:
II. Variational stability of the vacuum of quantum electrodynamics in the mean-field approximation. J. Phys. B., 22(23):3815–3828, 1989.
[14] J. G. Conlon. The ground state energy of a classical gas. Commun. Math. Phys, 94(4):439–458,
1984.
[15] I. Daubechies und E. H. Lieb. One-electron relativistic molecules with Coulomb interaction.
Comm. Math. Phys., 90(4):497–510, 1983.
[16] D. Hundertmark, N. Röhrl und H. Siedentop. The sharp bound on the stability of the relativistic electron-positron field in Hartree-Fock approximation. Commun. Math. Phys., 211(3):629–
642, 2000.
[17] J. D. Drell und S. D. Drell. Relativistic quantum fields. International Series in Pure and Applied
Physics. McGraw-Hill, New York, 1. Auflage, 1965.
[18] F. J. Dyson and A. Lenard. Stability of matter I. J. Math. Phys., 8:423–434, 1967.
[19] F. J. Dyson and A. Lenard. Stability of matter II. J. Math. Phys., 9:698–711, 1968.
[20] W. D. Evans, P. Perry und H. Siedentop. The spectrum of relativistic one-electron atoms
according to Bethe and Salpeter. Commun. Math. Phys., 178(3):733–746, 1996.
[21] P. Federbush. A new approach to the stability of matter problem. I. J. Math. Phys., 16:347–
351, 1975.
[22] C. L. Fefferman und R. de la Llave. Relativistic stability of matter – I. Revista Matematica
Iberoamericana, 2(1, 2):119–161, 1986.
[23] G. Hardekopf und J. Sucher. Relativistic wave equations in momentum space. Phys. Rev. A,
30(2):703–711, 1984.
[24] E. Heinz. Beiträge zur Störungstheorie der Spektralzerlegung. Math. Ann., 123:415–438, 1951.
[25] I. W. Herbst. Spectral theory of the operator (p2 + m2 )1/2 − Ze2 /r. Commun. Math. Phys.,
53:285–294, 1977.
72
[26] G. Hoever und H. Siedentop. Stability of the Brown-Ravenhall operator. Math. Phys. Electron.
J., 5:Arbeit 6, 11 Seiten, 1999.
[27] T. Kato. Perturbation theory for linear operators, Band 132 der Grundlehren der mathematischen Wissenschaften. Springer-Verlag, Berlin, 1. Auflage, 1966.
[28] E. H. Lieb und H. Siedentop. Renormalization of the regularized relativistic electron-positron
field. mp arc, 00-98, 2000.
[29] E. H. Lieb. The stability of matter: from atoms to stars. Bull. Amer. Math. Soc. (N.S.),
22(1):1–49, 1990.
[30] E. H. Lieb und M. Loss. Analysis. Band 14 der Serie Graduate Studies in Mathematics. American Mathematical Society, Providence, 2. Auflage, 1997.
[31] E. H. Lieb, H. Siedentop und J. P. Solovej. Stability and instability of relativistic electrons in
classical electromagnetic fields. J. Statist. Phys., 89(1-2):37–59, 1997.
[32] E. H. Lieb und W. E. Thirring. Bound for the kinetic energy of Fermions which proves
the stability of matter. Phys. Rev. Lett., 35(11):687–689, 1975. Erratum: Phys. Rev. Lett.,
35(16):1116, 1975.
[33] E. H. Lieb und W. E. Thirring. Inequalities for the moments of the eigenvalues of the
Schrödinger Hamiltonian and their relation to Sobolev inequalities. In Elliott H. Lieb, Barry
Simon und Arthur S. Wightman, Herausgeber, Studies in Mathematical Physics: Essays in
Honor of Valentine Bargmann. Princeton University Press, Princeton, 1976.
[34] E. H. Lieb und H-T. Yau. The stability and instability of relativistic matter. Commun. Math.
Phys., 118:177–213, 1988.
[35] M. Loss. The stability of matter interacting with fields. Notices Amer. Math. Soc.,
44(10):1288–1293, 1997.
[36] H. Nagaoka. Kinetics of a system of particles illustrating the line and the band spectrum and
the phenomena of radioactivity. Phil. Mag., 7:445–455, 1904.
[37] G. Nenciu. Self-adjointness and invariance of the essential spectrum for Dirac operators defined
as quadratic forms. Commun. Math. Phys., 48:235–247, 1976.
[38] M. Reed and B. Simon. Methods of modern mathematical physics. III. Academic Press, New
York, 1979.
[39] J. Sucher. Foundations of the relativistic theory of many-electron atoms. Phys. Rev. A,
22(2):348–362, 1980.
[40] J. Sucher. Relativistic many-electron Hamiltonians. Phys. Scripta, 36:271–281, 1987.
[41] B. Thaller. The Dirac Equation. Texts and Monographs in Physics. Springer-Verlag, Berlin,
1. Auflage, 1992.
[42] C. Tix. Lower bound for the ground state energy of the no-pair Hamiltonian. Phys. Lett. B,
405(3-4):293–296, 1997.
[43] C. Tix. Strict positivity of a relativistic Hamiltonian due to Brown and Ravenhall. Bull.
London Math. Soc., 30(3):283–290, 1998.
[44] R. Weder. Spectral analysis of pseudodifferential operators. J. Funct. Anal., 20:319–337, 1975.
Herunterladen