Stabilität und Instabilität des relativistischen Elektronen

Stabilität und Instabilität
des relativistischen
Elektronen-Positronen-Felds
in Hartree-Fock-Näherung
Dissertation an der Fakultät für
Mathematik und Informatik der
Ludwig-Maximilians-Universität München
von
Norbert Röhrl
eingereicht im Oktober 2000
Erster Berichterstatter: Prof. Dr. H. Siedentop
Zweiter Berichterstatter: Prof. Dr. V. Bach
Tag der mündlichen Prüfung: 22.12.2000
1
Inhaltsverzeichnis
Zusammenfassung
2
0. Notationen
4
1. Einleitung
1.1 Von Atomen zur Quantenmechanik
1.2 Stabilität der Materie
1.3 Relativistische Materie
5
5
7
9
2. Das Elektronen-Positronen-Feld
2.1 Der Diracoperator mit Coulombpotential
2.2 Der Fockraum
2.3 Quantenelektrodynamik
2.4 Die Hartree-Fock-Näherung
2.5 Resultate
13
13
15
21
23
31
3. Das Infimum der Energie des Vakuums
3.1 Stabilität des Vakuums
3.2 Implementation translationsinvarianter Dichtematrizen
3.3 Das Infimum der Energie für α > 4/π
3.4 Das Infimum der Energie mit chemischem Potential
3.5 Folgerungen für die Energie ohne chemisches Potential
3.6 Hilfssätze
33
33
34
40
47
51
53
4. Stabilität von Atomen
4.1 Eine Ungleichung für Diracoperatoren
√
4.2 Der Fall Zα = 3/2
57
57
62
5. Anhang
5.1 Hilbert-Schmidt-Operatoren
5.2 Die Matrixelemente des Coulombpotentials
64
65
66
Literatur
71
2
Zusammenfassung
Diese Arbeit ist ein Beitrag zur Untersuchung der Stabilität der Materie in
einem Modell, das durch einige Näherungen aus der Quantenelektrodynamik (QED)
abgeleitet ist.
Materie in unserem Sinne besteht aus beweglichen Elektronen und Positronen
und unbeweglichen Atomkernen mit Coulombwechselwirkung zwischen allen Paaren
von Teilchen. Man nennt Materie stabil, wenn ihre Energie nach unten durch ein
negatives Vielfaches der Anzahl der Elektronen, Positronen und Kerne beschränkt
ist, unabhängig von der Konfiguration der Kerne.
Die Frage, warum Wasserstoff stabil ist, oder in anderen Worten, warum das
Elektron des Wasserstoffs nicht in den Kern stürzt, ist klassisch nicht zu klären
und spielte eine bedeutende Rolle bei der Entstehung der Quantenmechanik. Es
handelt sich daher bei der Stabilität der Materie um ein rein quantenmechanisches
Phänomen. Im nichtrelativistischen Fall wurde sie zuerst im Jahre 1967 von Dyson
und Lenard [18, 19] bewiesen.
Wir beschreiben das relativistische Elektronen-Positronen-Feld in zweiter Quantisierung und Hartree-Fock-Näherung mit Coulombwechselwirkung im externen
Coulombfeld eines Atomkerns (Abschnitt 2). Von Bach, Barbaroux, Helffer und
Siedentop [4] wurde für dieses Modell ein exaktes Energiefunktional hergeleitet. Es
basiert auf dem QED-Hamiltonoperator, wie man ihn in dem Standardwerk von
Bjorken und Drell [17] findet, ohne die Beiträge des magnetischen Vektorpotentials.
Das Modell ohne externes Potential wurde zuvor in der Physik von Chaix, Iracane
und Lions [12, 13] untersucht.
Bach et al. zeigten in ihrer Arbeit unter anderem, dass die Energie des Systems
ohne externes Potential nichtnegativ ist, falls für den Wert der Feinstrukturkonstante
α ≤ 4/π gilt, und dass die Energie des Systems mit dem Coulombpotential eines
Atomkerns bis Kernladungszahl Z = 68 (Erbium) für den physikalischen Wert von
α ≈ 1/137 nichtnegativ ist.
In einer gemeinsamen Arbeit mit Hundertmark und Siedentop [16] konnten wir
die Optimalität des Stabilitätsresultats ohne externes Potential zeigen: Die Energie
pro Teilchen ist nach unten unbeschränkt für α > 4/π ≈ 1, 27 (Abschnitt 3.3).
Chaix et al. haben in ihrer Arbeit [13] bereits einen Hinweis für die Instabilität des
Elektronen-Positronen-Felds für α > π/ log 4 ≈ 2, 27 gegeben. Sie argumentierten
für die Instabilität des Modells in einem Einheitsvolumen mit Hilfe eines translationsinvarianten Zustands γC . Da ein solcher Zustand aber in jedem Einheitsvolumen
die gleiche Energie und die gleiche Teilchenzahl besitzt, sind diese Größen auf dem
ganzen Raum R3 entweder Null, nicht definiert oder unendlich. Wir fanden eine universelle Methode, durch geeignetes Abschneiden translationsinvariante Zustände zu
approximieren (Abschnitt 3.2) und konnten so mit γC die Existenz von Zuständen
beliebig negativer Energie pro Teilchen im ganzen Raum zeigen. Die richtige Wahl
eines Parameters in γC führt schließlich zum optimalen Resultat.
Mit Brummelhuis und Siedentop [11] ist es uns gelungen, das Stabilitätsresultat für Atome zu verbessern (Abschnitt 4). Die Energie ist im physikalischen Fall
3
α ≈ 1/137 für Atome mit Kernladungszahl Z ≤ 117 nichtnegativ; in dem Modell sind also alle bekannten Elemente stabil. Bach et al. zeigen in ihrem kurzen
und eleganten Beweis eine Ungleichung zwischen den Beträgen des freien Diracoperators und des Diracoperators mit Coulombpotential. Dazu quadrieren sie diese
und wenden die Dreiecksungleichung an. Wir jedoch erzielen durch ein aufwendigeres
Argument die optimale Konstante der quadrierten Ungleichung: Mit der Streckungshomogenität des Diracoperators für masselose Teilchen können wir das Problem
auf eine Ungleichung für Multiplikationsoperatoren reduzieren. Die Zusatzterme im
massiven Fall werden durch den bekannten positiven Wert des Grundzustands des
Diracoperators mit Coulombpotential kontrolliert.
Da die Energie im Stabilitätsfall immer nichtnegativ ist, hat das Modell das
Hartree-Fock-Vakuum als Grundzustand. Unterhalb der kritischen Werte der Parameter α und Z ist dieser auch eindeutig. Kerne ziehen es folglich vor, alleine zu
bleiben, anstatt sich mit Elektronen zu umgeben, wie wir es in der Natur beobachten.
Um die Erzeugung von Teilchen zu begünstigen, subtrahieren wir ein so genanntes
chemisches Potential, ein Vielfaches der Ruheenergie der Teilchen, von der Gesamtenergie. Die Stabilität wird dadurch nicht beeinflusst, da die Energie nur proportional zur Teilchenzahl geändert wird. Ohne externes Potential kann für α = 1/137
das 0, 999983-fache der Ruheenergie abgezogen werden, ohne den Grundzustand zu
verändern. Subtrahiert man die ganze Ruheenergie oder mehr, so ist das Infimum
der Energie −∞ und es gibt keinen Grundzustand (Abschnitt 3.4).
Für Atome ist die Zahl der Teilchen eines Zustands ungleich schwieriger zu bestimmen. Es gibt aber ein von der Natur motiviertes Potential, welches die Bestimmung
der Teilchenzahl nicht erfordert und realistischere Resultate verspricht. G.M. Graf
wies uns auf die Asymmetrie zwischen Elektronen und Positronen in der Natur hin:
Elektronen sind vorhanden und um ein Positron zu erhalten muss man ein ElektronPositron-Paar erzeugen. Diese Beobachtung entspricht einem Potential proportional
zur Ladung des Zustands. Es begünstigt Elektronen und belastet Positronen doppelt. Die Untersuchung eines solchen Potentials wird Gegenstand unserer zukünftigen Forschung an diesem Modell sein.
4
Notationen
Eine Zahl nennen wir positiv, falls sie größer als Null ist. Ist sie größer gleich Null,
so heißt sie nichtnegativ. Den Realteil einer komplexen Zahl bezeichnen wir mit <
und den Imaginärteil mit =. Vektoren im Rn schreiben wir als x und Vektoren mit
”
Spin“ aus G := R3 × {1, . . . , 4} als x = (x, τ ), τ = 1, . . . , 4. Wir verwenden auf
R3 × {1, . . . , 4} das Produktmaß aus dem Lebesguemaß auf R3 und dem Zählmaß
auf {1, . . . , 4}.
Die Kugel mit Radius r um den Punkt x bezeichnen wir mit B(x, r) und mit
Br die charakteristische Funktion von B(0, r). Die charakteristische Funktion des
Intervalls [c, d] ⊆ R schreiben wir als I[c,d] (·).
Der Einheitsvektor zu einem x ∈ Rn \ {0} ist ω x := x/|x| mit Komponenten
(ω x )i , i = 1, . . . , n; der Einheitsvektor des Nullvektors ist der Nullvektor. Für die
Einheitsmatrix in n Dimensionen verwenden wir In .
Außer den üblichen Ls -Räumen mit den Normen
Z
s
kf ks :=
|f (x)|s d x
n
C0∞
benutzen wir die Symbole
für glatte Funktionen mit kompaktem Träger, C0 für
stetige Funktion mit kompaktem Träger und H 1 bzw. H 1/2 für die L2 -Funktionen
mit endlicher Norm:
Z
kf k2H 1 :=
kf k2H 1/2
:=
Z
n
2
ˆ
(1 + |p|2 )|f(p)|
dp < ∞ ,
n
2
ˆ
(1 + |p|)|f(p)|
dp < ∞ .
Wir verwenden ausschließlich die Fouriertransformation
Z
−n/2
(0.1)
fˆ(p) := (2π)
e−ipx f (x) d x ;
n
bei Integralkernen γ(x, y) verzichten wir auf die explizite Kennzeichnung der Fouriertransformierten und schreiben einfach γ(p, q). Beträge von Differentialoperatoren
und Ausdrücke in p sind als die entsprechenden Multiplikationsoperatoren im Fourierraum definiert.
Operatoren nennen wir positiv, wenn sie die Ungleichung A ≥ 0 erfüllen und
den zu einem Operator B adjungierten Operator bezeichnen wir mit B ∗ . Für den
Definitionsbereich von B verwenden wir das Symbol D(B). Der Antikommutator
zweier beschränkter Operatoren A und B ist schließlich durch
gegeben.
{A, B} := AB + BA
5
Einleitung
Von Atomen zur Quantenmechanik
Die Vorstellung, dass die Natur aus kleinsten Bausteinen, so genannten Atomen
(griechisch atomos“, unteilbar), aufgebaut ist, geht auf den griechischen
”
Philosophen Demokrit (ca. 460-370 v.Chr.) zurück. Sie ist eine Synthese aus den
Positionen von Parmenides (ca. 540-480 v.Chr.), nichts verändert sich“, und von
”
Heraklit (ca. 540-480 v.Chr.), alles fließt“. Demokrit nahm an, dass die Atome ewig
”
und unveränderlich seien und es unendlich viele verschieden geformte gebe, die zu
der schier unendlichen Vielfalt an Körpern zusammengesetzt werden könnten.
Bis zu ersten quantitativen Hinweisen auf die Existenz von Atomen sollte es aber
noch über 2000 Jahre dauern. Dalton und Prout beobachteten um 1800, dass verschiedene Elemente nur in bestimmten Gewichtsverhältnissen miteinander reagieren,
was sich gut mit der Existenz von Atomen erklären lässt.
Dem ersten Atommodell (Prout, 1815) lag die Annahme zu Grunde, Atome aller
Elemente seien aus Wasserstoff aufgebaut. Diese Vorstellung führte schließlich zu
einer Klassifikation der Atome nach ihren chemischen Eigenschaften, dem Peri”
odischen System“ von Meyer und Mendelejeff (1869).
Etwa zur gleichen Zeit wurde die elektrische Ladung quantitativ gemessen. Die
Untersuchung der Elektrolyse veranlasste Faraday 1833 zur Vermutung einer atomaren Grundeinheit der Ladung. Thomson entdeckte 1897 die Elektronen, die Träger
der negativen Ladung, als Kathodenstrahlen einer Vakuumröhre und bestimmte ihre
Masse auf 1/1837 der Masse des Wasserstoffatoms. Er schlug 1904 das so genannte
Puddingmodell für Atome vor, in welchem die positive Ladung gleichmäßig über
das ganze kugelförmige Atom verteilt ist und die Elektronen, wie Rosinen in einem
Pudding, um eine feste Ruhelage schwingen können. Weitgehend unbekannt ist, dass
im gleichen Jahr von Nagaoka [36] schon ein viel realistischeres Modell diskutiert
wurde, bestehend aus einer großen Anzahl negativ geladener Teilchen, angeordnet
auf einem Kreis in gleichen Abständen, und einer positiven Ladung großer Masse in
der Mitte.
Aus Streuversuchen von Geiger und Marsden mit α-Teilchen durch dünne Goldfolien im Jahre 1909 schloss Rutherford 1911, dass sich im Zentrum von Atomen
eine positive Ladung zusammen mit dem Großteil der Masse auf einem Raum
von 10−14 m befinden müsse. Den vergleichsweise sehr großen Atomradius von etwa 10−10 m erklärte er durch die Elektronen, die in diesen Abständen vom Zentrum
den Kern umkreisen. Das Modell wird deshalb auch Planetenmodell genannt.
Bei den Umläufen um den Kern müsste das Elektron nach den Gesetzen der
klassischen Elektrodynamik ständig Strahlung emittieren; damit würde es Energie
verlieren und in den Atomkern stürzen. Stattdessen findet man in der Strahlung
angeregter Atome scharfen Spektrallinien, die sich mit dem Modell nicht erklären
lassen. Auch die chemische, optische und mechanische Gleichheit aller Atome des
leichtesten Elements, des Wasserstoffs, ist mit einem Modell, das dem Elektron so
viele verschiedene Möglichkeiten des Umlaufs um den Kern lässt, nur schwer in
Einklang zu bringen.
6
Bohr postulierte daraufhin 1913 im Widerspruch zur klassischen Mechanik und
Elektrodynamik, dass es stationäre Energiezustände gibt, in denen Atome nicht
strahlen: Sie strahlen nur, wenn ein Elektron von einem stationären Zustand in einen
tieferer Energie springt. Durch Energieabsorbtion kann ein Elektron auch in einen
Zustand höherer Energie springen. Die Frequenz ν der ausgesendeten Strahlung
ergibt sich mit dem Planckschen Wirkungsquantum h nach folgender Formel aus
der Differenz der stationären Energieniveaus:
hν = E1 − E2 .
Er postulierte auch eine Auswahlbedingung für die erlaubten Bahnen, die den stationären Energiezuständen entsprechen. Es sind Kreisbahnen, deren Drehimpuls ein
ganzzahliges Vielfaches von ~ = h/2π ist:
L = n~ .
Der Radius der engsten sich daraus ergebende Bahn für das Elektron, der so genannte Bohrradius, liegt mit 0, 529 · 10−10 m in der Größenordnung des Wasserstoffradiuses und die aus den Postulaten errechenbaren Übergangsfrequenzen für Wasserstoff
stimmen sehr gut mit den Messungen überein.
Die Auswahlhypothese von Bohr ist eine echte Quantenbedingung. Die erste
Quantenhypothese wurde schon im Jahre 1900 von Max Planck zur Beschreibung
der Strahlung eines schwarzen Körpers aufgestellt. Danach strahlt jener nur Energiequanten proportional zur Frequenz ν der Strahlung aus:
= hν .
Die Proportionalitätskonstante ist wieder das Plancksche Wirkungsquantum h.
Diese Gleichung konnte man vielleicht noch als mathematischen Kunstgriff interpretieren, aber die Hinweise auf die Existenz diskreter Energiequanten traten in den
folgenden Jahren immer deutlicher hervor.
In seiner berühmten Arbeit über den photoelektrischen Effekt 1905 postulierte
Einstein, dass Licht aus Strahlen von Korpuskeln, den Photonen, die sich mit Lichtgeschwindigkeit fortbewegen und deren Energie mit der Formel hν von der Frequenz
des Lichts abhängt. Mit dieser Hypothese konnte er mehrere Phänomene erklären,
von denen der Photoeffekt, für den er auch den Nobelpreis bekam, der bekannteste
ist. Auch der Compton-Effekt (Compton, 1924) lässt sich in Übereinstimmung damit
als Stoßvorgang zwischen einem Elektron und einem Photon deuten.
Den Zusammenhang zwischen diesen diskreten Abläufen und den bekannten
kontinuierlichen Vorgängen formulierte erstmals Bohr 1923 für die Strahlung von
Atomen in seinem Korrespondenzprinzip. Er konstatierte, dass es im Grenzfall
großer Quantenzahlen eine asymptotische Übereinstimmung der statistischen Resultate der klassischen Physik und der Quantentheorie gibt.
Die Matrizenmechanik von Heisenberg, Born und Jordan (1925) und die Wellenmechanik von Schrödinger (1926) begründeten die moderne Quantenmechanik.
Schrödinger zeigte in seiner Arbeit 1926 auch die Äquivalenz beider Theorien. Die
relativistische Quantentheorie von Elektronen wurde von Dirac im Jahre 1928 in
zwei Artikeln publiziert. Der erste enthält bereits den berühmten Diracoperator,
der im Folgenden eine zentrale Rolle spielen wird.
7
Grundlegend wird auch das 1925 von Pauli formulierte Ausschlussprinzip oder
auch Pauliprinzip sein, welches besagt, dass keine zwei Fermionen, also insbesondere
Elektronen, im gleichen Zustand sein dürfen. Ohne dieses Naturgesetz würden alle
Elektronen eines Atoms auf den niedrigsten Energiezustand stürzen; die Chemie,
und damit unsere Welt, wäre ohne die Existenz der Elektronenschalen eine völlig
andere.
Stabilität der Materie
Das einfachste quantenmechanische Modell der Materie besteht aus K ruhenden,
positiv geladenen Atomkernen und N beweglichen, negativ geladenen Elektronen
und Coulombwechselwirkung zwischen allen Paaren von Teilchen. Die Annahme,
die Kerne seien unbeweglich, wird auch als Born-Oppenheimer Näherung bezeichnet
und begründet sich durch den großen Unterschied der Massen von Elektronen und
Kernen.
Stabilität eines physikalischen Systems ist eine Eigenschaft der Grundzustandsenergie. In der Physik strebt jedes System zu Zuständen niedrigerer Energie. Das
Infimum der Energie heißt Grundzustandsenergie E und wenn es einen Zustand mit
dieser Energie gibt, so heißt dieser Grundzustand.
Wir unterscheiden zwei Begriffe der Stabilität:
• Stabilität der ersten Art: Die Grundzustandsenergie ist endlich.
• Stabilität der zweiten Art: Die Grundzustandsenergie pro Teilchen ist nach
unten beschränkt.
Unter Stabilität der Materie versteht man Stabilität der zweiten Art. In obigem
Modell bedeutet dies
E ≥ −C(N + K)
mit einer positiven Konstante C, die nicht von der Konfiguration der Kerne abhängt.
Die Energie wird also auch über alle möglichen Konfigurationen der Kerne minimiert.
Es gibt ein einfaches Beispiel, welches wir frei aus dem Überblicksartikel von Lieb
[29] entnehmen, um die Notwendigkeit der Stabilität zu verdeutlichen. In der bayerischen Fassung denkt man an zwei gleiche Bierflaschen. Ist ihr Abstand groß genug,
so ist die (Grundzustands-) Energie des Biers jeder Flasche in guter Näherung E(N),
wobei N die Anzahl der Teilchen des Biers ist. Werden diese zusammengebracht und
in einen Maßkrug gefüllt, so hat der Liter Bier nun die Energie E(2N) und die Energiedifferenz berechnet sich zu δE = 2E(N) − E(2N). Ist Bier stabil, so ist mit
δE = o(N) die Energieänderung gering; wäre E(N) aber proportional zu −N k mit
einem k > 1, ergäbe sich δE = −(2k − 2)E(N) und es würde sich Energie in der
Ordnung der gesamten (atomaren) Energie des Biers freisetzten und zu einer starken
Explosion führen.
Um konkreter zu werden, führen wir jetzt die genauen Formeln für die Energie des
nichtrelativistischen Modells ein, das auch historisch zuerst untersucht wurde. Wir
bezeichen die festen Positionen der Kerne mit Rj ∈ R3 , ihre Kernladungszahl mit
Zj > 0, j = 1, . . . , K und die Positionen der Elektronen mit xi ∈ R3 , i = 1, . . . , N.
Des weiteren schreiben wir m und e für Masse bzw. Ladung der Elektronen und ∆i
für den Laplaceoperator auf den 3 Komponenten des i-ten Elektrons. Damit ist der
8
Hamiltonoperator der nichtrelativistischen Materie gegeben durch
N
K
N X
K
N
X
X
X
X
e2
e2 Zi Zj
e2 Zj
~2
∆i +
+
−
.
−
2m
|xi − xj | i,j=1 |Ri − Rj | i=1 j=1 |xi − Rj |
i,j=1
i=1
i<j
i<j
Die Erwartungswerte der Terme sind der Reihe nach die (nichtrelativistische) kinetische Energie der Elektronen, die Coulombenergie der Elektronenpaare, die Coulombenergie der Kernpaare und die Coulombenergie zwischen Elektronen und Kernen.
Den Coulombteil des Operators, der die gesamte Energie der elektrostatischen Wechselwirkung der Teilchen darstellt, bezeichnen wir mit e2 VC .
Für N = 1 ist der Zustandsraum dieses Operators H := L2 (R3 ) ⊗ Cs , der Raum
der quadratintegrierbaren Funktionen im R3 mit s komplexen Komponenten. Der
Parameter s steht für die Anzahl der verschiedenen Spinzustände des Elektrons;
der physikalische Fall ist also s = 2. Ist N > 1, so ist der N-Teilchenraum wegen
des Pauliprinzips nicht einfach das N-fache Produkt, sondern das (total) antisymV
metrische Tensorprodukt H(N ) := N H.
An dieser Stelle wird zur Verringerung der Komplexität in der Quantenchemie gerne die Hartree-Fock-Näherung eingeführt. Sie ist eine der ältesten
Näherungsmethoden bei Mehrteilchenproblemen in der Quantenmechanik und eine
der wenigen, deren Genauigkeit sich rigoros abschätzen lässt [2, 5]. Dabei beschränkt
man die Zustände in H(N ) auf so genannte Slaterdeterminanten
f1 (x1 ) . . . fn (x1 ) .
.. det ..
...
. f (x ) . . . f (x )
1 n
n n
mit fi ∈ H, i = 1, . . . , n orthonormal. Bis auf Weiteres werden wir ohne diese
Näherung auskommen; eine Verallgemeinerung davon werden wir erst wieder im
Hauptteil der Arbeit aufgreifen.
Stabilität der nichtrelativistischen Materie wurde zuerst 1967 von Dyson und
Lenard [18, 19] bewiesen und 1975 von Federbush nach einer anderen Methode [21].
In [32] und [33] wurde 1975 und 1976 von Lieb und Thirring die untere Schranke für
die Energie pro Teilchen nochmal wesentlich verbessert und der Beweis stark vereinfacht. Das Resultat der letzten Arbeit für N Elektronen mit s Spinkomponenten
und K Kernen, in Einheiten mit 2m = e = ~ = 1 ist

!1/2 2
K
X 7/3
 .
E ≥ −1, 31s2/3 N 1 +
Zj /N
j=1
Dies ist ein großer Fortschritt im Vergleich zum ersten Beweis von Dyson und Lenard,
der ungefähr E ≥ −1014 N lieferte.
In vielen Fällen gibt es auch Stabilitätsresultate unter Berücksichtigung eines
klassischen Magnetfeldes. Da in dieser Arbeit keine Magnetfelder behandelt werden,
zitieren wir nur die wichtigsten Resultate. Einen guten Überblick geben die Artikel
[31] und [35].
9
Relativistische Materie
Für die Beschreibung von inneren Elektronen in Atomen größerer Kernladungszahl
spielen relativistische Effekte eine nicht mehr zu vernachlässigende Rolle. Mit dem
Bohrschen Postulat mvr = n~ und der nichtrelativistischen Gleichung für die Zentrifugalkraft Ze2 /r 2 = mv 2 /r erhalten wir für die Geschwindigkeit auf der innersten
(n = 1) Bahn v = Ze2 /~. Wir vereinfachen den Ausdruck mit Hilfe der Sommerfeldschen Feinstrukturkonstante α := e2 (~c)−1 ≈ 1/137. Damit ist die Geschwindigkeit
gleich Zαc und es ist ersichtlich, dass das innerste Elektron in Atomen großer Kernladungzahlen den Kern in Geschwindigkeiten umkreist, die eine relativistische Behandlung nahelegen. In der theoretischen Chemie wird oft Gold (Z = 79) als erstes
Element genannt, dessen chemische Eigenschaften sich klassisch nicht mehr ausreichend genau berechnen lassen.
In der mathematischen Beschreibung ändert sich der Coulombteil e2 VC des
Hamiltonoperators gegenüber dem nichtrelativistischen Fall nicht, da wir die
Coulombeichung wählen. Von den relativistischen Operatoren für die kinetische Energie werden wir in diesem Abschnitt zwei vorstellen.
Ein pseudorelativistischer Hamiltonoperator ist
N p
X
−~2 c2 ∆i + m2 c4 + e2 VC ,
i=1
wobei die Wurzel des negativen Laplaceoperators über die Fouriertransformation
p
definiert ist. Er gibt die korrekte relativistische kinetische Energie p2 c2 + m2 c4
wieder, vernachlässigt aber die Spineffekte und enthält im Ortsraum alle Potenzen
des Differentialoperators, beschreibt also eine nichtlokale Theorie.
Im Gegensatz zum nichtrelativistischen Fall skalieren kinetische Energie und
Coulombenergie wie die inverse
Länge:√ Skaliert man die Längeneinheiten x → λx
√
mit einem λ > 0, so folgt −∆ → λ−1 −∆ und |x|−1 → λ−1 |x|−1 . Insbesondere ist
das Infimum der Energie im masselosen Fall entweder 0 oder −∞, da man jede beliebige positive Energie zu 0 skalieren kann und jede negative zu −∞. Für negative
Energien lässt man λ gegen 0 streben: Man kontrahiert also alles auf den Ursprung.
Im nichtrelativistischen Fall skaliert die kinetische Energie wie λ−2 und da sie positiv
ist, verhindert das den Kollaps.
Skaliert man mit λ = ~c und ersetzt mc2 durch m, erhält man den Operator in
der gebräuchlichen Form
(1.1)
N q
X
p2i + m2 + αVC
i=1
mit p = −i∇ und der Vereinbarung, dass ein Ausdruck mit p in einem Operator als
Multiplikation im Fourierraum bezüglich der gewöhnlichen Fouriertransformation
(0.1) gemeint ist. Die Feinstrukturkonstante α ist dimensionslos und kann nicht
wegskaliert werden.
Wegen der Operatorungleichung
p
|p| ≤ p2 + m2 ≤ |p| + m ,
10
gilt für die Energie Em des Modells mit Masse m die Ungleichung
E0 ≤ Em ≤ E0 + Nm .
Die Masse hat also auf die Stabilität keinen Einfluss.
Die Stabilität eines wasserstoffartigen Atoms (K = N = 1) zeigt man mit der
Kato-Ungleichung, die auf Herbst [25] und Kato [27] zurückgeht:
Z
Z
π
−1
2
|x| |u(x)| d x ≤
|p||û(p)|2 d p ∀ u ∈ L2 (R3 ) .
(1.2)
2 3
3
Die Energie des Atoms mit einem Elektron im normierten Zustand endlicher Energie
u ∈ H 1/2 (R3 ) ist also
(1.3)
Z
E(u) =
u(x) d x
u(x) |p| − α
|x|
3
Z
Z
Z
π
|u(x)|2
2
d x ≥ 1 − Zα
=
|p||û(p)| d p − Zα
|x|
2
3
3
Z
Da die Konstante
π
2
3
|p||û(p)|2 d p .
in der Ungleichung scharf ist, folgt unmittelbar
2
und
π
2
inf E(u) = −∞ für Zα > .
π
Die Stabilität hängt also im Unterschied zum nichtrelativistischen Fall von Zα ab.
Wir werden sehen, dass dies eine generelle Eigenschaft relativistischer Materie ist
und wir bei mehreren Atomkernen zusätzlich noch eine Schranke für die Feinstrukturkonstante α bekommen. Abschätzungen der Form (1.3) und die Kato-Ungleichung
werden uns später noch öfter begegnen.
Die Geschichte dieses Modells begann mit dem oben besprochenen wasserstoffartigen Fall (K = N = 1), der 1975 von Weder [44] und 1977 von Herbst [25] studiert
wurde. Trotz des späteren Erscheinens des Artikels von Herbst wird der Operator
p
Zα
p2 + m2 −
|x|
inf E(u) = 0
für Zα ≤
oft als Herbstoperator bezeichnet. Im Jahr 1983 bewiesen Daubechies und Lieb [15]
die Stabilität eines Moleküls mit einem Elektron (N = 1, K beliebig). Stabilität der
Materie wurde schließlich zuerst 1984 von Conlon [14] gezeigt und die Konstanten
1986 von Fefferman und de la Llave [22] und nochmals 1988 von Lieb und Yau [34]
verbessert.
In der letzten Arbeit wird für Elektronen mit s Spinkomponenten und Kerne mit
maximaler Kernladungszahl Z = maxj=1,...,K Zj die Stabilität unter den Bedingungen
2
1
≈ 0, 0213s−1 und Zα ≤
α≤
47s
π
gezeigt. Im physikalischen Fall, s = 2 und α ≈ 1/137, bedeutet das Stabilität bis
Z = 87 (Francium). Das Modell ist instabil falls Zα > 2/π, was wir oben schon
11
anhand des wasserstoffartigen Atoms sehen konnten, oder α > 128/(15π) ≈ 2, 72
bei beliebigem Z > 0.
Im Jahre 1996 wurde von Lieb, Loss und Siedentop ein einfacher Beweis der Stabilität mit Hilfe der Thomas-Fermi-von-Weizsäcker-Theorie und einiger, größtenteils
in den oben genannten Artikeln bewiesenen, Ungleichungen gegeben. Das Ergebnis
ist Stabilität für α ≤ 0, 77 und Z hinreichend klein; im physikalischen Fall gilt
Z ≤ 59 (Praseodym). Neben der Verbesserung der Schranke für α gilt dieses Resultat auch unter Berücksichtigung von magnetischen Feldern.
Die Stabilität dieses Modells impliziert auch Stabilität der nichtrelativistischen
Materie. Wie wir durch das Skalierungsargument am Anfang zeigten, ist im stabilen
masselosen Fall das Infimum der Energie gleich 0 und es gilt somit
N
X
i=1
−1
|pi | ≥ −αVC .
Die Ungleichung 0 ≤ (|p| − α /2)2 impliziert α−1 |p| ≤ p2 + α−2 /4 und damit gilt
für die nichtrelativistische Energie in Einheiten mit 2m = e = ~ = 1
N
X
i=1
p2i
+ VC ≥
N
X
i=1
p2i − α−1 |p| ≥ −Nα−2 /4 .
Wegen der restriktiven Bedingungen an α und Zα für relativistische Stabilität kann
das die Beweise für nichtrelativistische Stabilität aber nicht ersetzen.
Der relativistische Hamiltonoperator für die kinetische Energie ist der freie Diracoperator
1
~c α · ∇ + mc2 β
i
2
3
auf dem Hilbertraum H := L (R ) ⊗ C4 mit den 4 × 4-Matrizen α1 , α2 , α3 , β und der
Notation
3
X
∂
αi
α · ∇ :=
.
∂x
i
i=1
Nach Skalierung mit ~c und Substitution der Masse mc2 → m erhält man
D 0 := α · p + mβ .
Die kinetische Energie soll wie beim Herbstoperator eine Wurzel aus dem Quadrat
der relativistischen kinetischen Energie p2 + m2 sein. Dies erreicht man durch die
Relationen
{αi , αj } := αi αj + αj αi = 2δij ,
{αi , β} = 0 und β 2 = I4 für i, j ∈ {1, 2, 3} .
Interessanter Weise ist 4 die kleinste Dimension, in der man obige Relationen realisieren kann. Darüber hinaus will man einen selbstadjungierten Operator und fordert
deshalb zusätzlich, dass die Matrizen hermitesch sind. Eine Möglichkeit der Darstellung der Matrizen, sind die von Dirac gewählten so genannten Diracmatrizen
I2 0
0 σi
β :=
,
αi :=
,
0 −I2
σi 0
12
mit den Paulimatrizen
0 1
0 −i
1 0
σ1 :=
, σ2 :=
, σ3 :=
.
1 0
i 0
0 −1
Die Anzahl der Komponenten der Zustände ist also wegen der Struktur auf 4
festgelegt. Das Spektrum des Diracoperators ist (−∞, −mc2 ) ∪ (mc2 , ∞) und daher
lassen sich seine Erwartungswerte nicht mehr unmittelbar als kinetische Energie
interpretieren.
Eine Möglichkeit, dieses Problem zu umgehen, ist der Brown-Ravenhall-Operator
[10], die Einschränkung des Diracoperators mit Coulombpotential auf den positiven
Spektralraum von D 0 . Eine physikalische Diskussion dieser Näherung findet sich
in den Artikeln [39, 40] von Sucher. Mathematisch untersucht wurde der Operator
aber erst in den letzten Jahren. Die erste Arbeit von Evans, Perry und Siedentop
[20] behandelte den Fall eines Atoms der Kernladungszahl Z mit einem einzigen
Elektron. Sie zeigten, dass die Energie durch eine nichtpositive Konstante nach unten
beschränkt ist, falls Z ≤ Zc := 2/[(2/π + π/2)α], und nach unten unbeschränkt für
Z > Zc . Die kritische Kernladungszahl wurde zuvor von Hardekopf und Sucher [23]
aufgrund numerischer Untersuchungen vermutet. Im physikalischen Fall α ≈ 1/137
bedeutet dies Stabilität bis Z = 114, was alle bekannten Elemente abdeckt. Die
untere Schranke ist tatsächlich positiv, wie in zwei Arbeiten von Tix [42, 43] gezeigt
wurde.
Von Balinsky und Evans [6] wurde die Stabilität von Molekülen mit einem Elektron (N = 1, K beliebig) gezeigt, falls alle Kernladungszahlen kleiner gleich der kritischen sind und α ≤ αc ≈ 0, 1257. Stabilität der Materie mit masselosen Elektronen
wurde in diesem Kontext schließlich von Hoever und Siedentop [26] für Z ≤ 88 (bei
α = 1/137) gezeigt.
Die so genannte Methode der zweite Quantisierung bietet eine grundsätzlich andere Möglichkeit den freien Diracoperator als kinetische Energie zu interpretieren.
Sie beschreibt Elektronen und Positronen, deren Antiteilchen, und macht die
Beschränkung auf eine feste Teilchenzahl überflüssig. Die Methode wurde fast gleichzeitig zur mathematischen Formulierung der Quantenmechanik um 1930 von
Dirac, Fock, Jordan und Wigner entwickelt. Wegen der damit verbundenen, für
die Physik damals neuen mathematischen Probleme, verzögerte sich jedoch ihre Entwicklung. Wir werden diese Methode in der vorliegenden Arbeit für das ElektronenPositronen-Feld vorstellen.
13
Das Elektronen-Positronen-Feld
Unser Modell soll ein Atom mit ruhendem Kern der Ladungszahl Z und relativistischen Elektronen und Positronen beschreiben. Wir verwenden das Wort Teilchen“
”
als Oberbegriff für Elektronen und Positronen. Der Kern wird als externes Potential
realisiert und nicht wie die Teilchen quantisiert.
−
−
b
m
Coulo
Z
+
v
Die Energie besteht aus der relativistischen
kinetischen Energie der Elektronen und Positronen, der Coulombenergie zwischen den Teilchen
und dem Atomkern und der Coulombenergie der
Teilchen untereinander.
Man fasst die kinetische und die Coulombenergie bezüglich des Kerns eines
Teilchens zur Einteilchenenergie zusammen, weil sie ein Attribut jedes einzelnen
Teilchens ist und nicht von anderen Teilchen abhängt. Die Coulombenergie zwischen den Teilchen wird als Wechselwirkungsenergie bezeichnet.
In diesem Abschnitt stellen wir zuerst den Diracoperator mit Coulombpotential
vor. Es folgt die Definition des Fockraums und der Erzeugungs- und Vernichtungsoperatoren. Wir führen dann den QED-Hamiltonoperator auf dem Fockraum ein und
diskutieren einige seiner Eigenschaften. Unter anderem geben wir einen lückenlosen
Beweis für die Beobachtung von J.P. Solovej, dass der vollständig normalgeordnete
QED-Hamiltonoperator nicht stabil ist. Dieses Problem kann eliminiert werden,
indem man sich auf Hartree-Fock-Zustände beschränkt. Über die Verträglichkeit
der Normalordnung mit der Definition der Hartree-Fock-Zustände werden wir eine
Verallgemeinerung eines Lemmas von D. Hundertmark beweisen. Diese Zustände
lassen sich durch so genannte Ladungsdichtematrizen charakterisieren und auf einer
Teilmenge der Zustände können wir ein vom QED-Hamiltonoperator motiviertes,
endliches Energiefunktional definieren.
Wir bedanken uns an dieser Stelle für die Erlaubnis beider Autoren, ihre Resultate
verwenden zu dürfen.
Im Folgenden halten wir uns zum großen Teil an die Artikel [4], [1] und das
Buch von Thaller über Diracoperatoren [41]. Wir werden jedoch die Ladungsdichtematrizen anders definieren, um eine präzise Übereinstimmung mit den Hartree-FockZuständen zu erreichen. Daraus ergibt sich eine leichte Verschiebung der Definitionen der verschiedenen Energien. Zusätzlich werden wir explizit die Endlichkeit des
Energiefunktionals beweisen.
Der Diracoperator mit Coulombpotential
Die Einteilchenenergie jedes einzelnen Elektrons oder Positrons, also seine relativistische kinetische Energie und seine Coulombenergie bezüglich des Kerns, ist gegeben
durch den Diracoperator mit Coulombpotential
1
Z
~c α · ∇ + mc2 β − e2
i
|x|
14
auf dem Hilbertraum H := L2 (R3 ) ⊗ C4 = L2 (G), wobei G := R3 × {1, . . . , 4}. Wie
bei (1.1) skalieren wir die Längeneinheiten mit λ = ~c, ersetzen mc2 durch m und
erhalten
Z
D Z := −iα · ∇ + mβ − α
.
|x|
√
Für Zα < 3/2 ist D Z√selbstadjungiert auf seinem Definitionsbereich D(D Z ) =
H 1 (R3 ) ⊗ C4 , für Zα ≤ 3/2 ist er wesentlich selbstadjungiert auf C0∞ (R3 \ {0})
[41, Beispiel 4.17, Theorem 4.4] und für Zα < 1 gibt es genau eine selbstadjungierte
Erweiterung, deren Definitionsbereich D(D Z ) in H 1/2 (R3 ) ⊗ C4 enthalten ist [37].
Funktionen in H 1/2 (R3 )⊗C4 sind genau
p die Zustände u endlicher kinetischer Energie:
0
Der Erwartungswert von |D | = p2 + m2 in u ist endlich. Mit der Ungleichung
von Kato (1.2) folgt auch, dass (u, D Z u) endlich ist; H 1/2 (R3 ) ⊗ C4 ist also der
Formbereich von D Z . Um im selbstadjungierten Fall zu bleiben, setzten wir in der
ganzen Arbeit Zα < 1 voraus.
Der Diracoperator mit Coulombpotential beschreibt die Energie des Wasserstoffatoms in fast perfekter Übereinstimmung mit dem Experiment. Sein Spektrum
besteht wie im freien Fall (Z = 0) aus dem wesentlichen Spektrum (−∞, −m) ∪
(m, ∞) [41, Theorem 4.7] und aus den positiven Eigenwerten En in der Lücke [41,
Abschnitt 7.4] mit
−1/2
Z 2 α2
√
En = m 1 +
, n = 0, 1, . . . .
(n + 1 − Z 2 α2 )2
Letztere werden durch das negative Coulombpotential des Kerns aus dem positiven
Teil des wesentlichen Spektrums gezogen. Physikalisch entspricht das der Bindung
von Elektronen durch den Kern.
Um eine Interpretation der negativen Energien zu geben, unterteilen wir den
Hilbertraum H in den positiven und den negativen Spektralraum H+ und H− von
D Z . Die zugehörigen orthogonalen Spektralprojektionen bezeichnen wir mit P+ bzw.
P− . Die Zustände in H+ interpretiert man als Elektronen und die in H− mittels einer
so genannten Ladungskonjugation als Positronen, den Antiteilchen der Elektronen.
Der Ladungskonjugationsoperator ist eine antiunitäre Abbildung C : H → H mit
(Cg)(x) = iβα2 g(x). Zur Illustration betrachten wir formal einen Diracoperator mit
einem skalaren externen elektrostatischen Potential V und Teilchenladung e:
D(e) := −iα · ∇ + mβ + eV .
Es gilt
(Cf, D(e)Cg) =
Z
(Cf )(x)D(e)(Cg)(x) d x
G
=
Z
G
−if (x)α2 βD(e)iβα2 g(x) d x = (f, α2 βD(e)βα2 g) ,
und α2 βDβα2 berechnet sich mit Hilfe der folgenden Gleichungen
α2 β βα2 = 1 ,
α2 β α2 βα2 = −α2 ,
α2 β β βα2 = −β ,
α2 β αi βα2 = αi , i ∈ {1, 3} ,
15
zu
−i(α1 , −α2 , α3 ) · ∇ − mβ − eV .
Die komplexe Konjugation liefert schließlich
iα · ∇ − mβ − eV .
Der Diracoperator ist also (antiunitär) äquivalent zu −D(−e). Mittels C wird somit
der negative Spektralraum von D(e) auf den positiven Spektralraum von D(−e)
abgebildet, dem Diracoperator eines Teilchens mit entgegengesetzter Ladung, des
Antiteilchens.
Es wären natürlich theoretisch auch andere Aufspaltungen von H in zwei orthogonale Teilräume H+ und H− denkbar. Unsere Wahl zeichnet sich aber gegenüber
allen anderen dadurch aus, dass das Infimum der Energie in dem hier betrachteten
Modell am höchsten liegt. Wir geben den Beweis dieser Tatsache aus dem Artikel
[4, Theorem 6] in Satz 5.1 im Anhang.
Der Fockraum
Um über beliebige Elektronen- und Positronenzahlen sprechen zu können, führen wir
einen speziellen Hilbertraum ein, den Fockraum. Seine normierten Vektoren stellen
die reinen Zustände des Modells dar. Wir setzen den Einteilchen-Elektronenraum
gleich
(1)
F+ := H+ .
Der Einteilchen-Positronenraum ist dann
(1)
F− := CH− ,
wobei C der Ladungskonjugationsoperator ist. Wir bemerken, dass für die algebraische Struktur des Fockraums nur die Antiunitarität von C ausschlaggebend ist:
Nimmt man eine andere antiunitäre Abbildung C 0 , so ist der resultierende Fockraum
zu unserem isomorph. Die n-Teilchenräume sind wegen der Fermistatistik durch das
(total) antisymmetrische Tensorprodukt der Einteilchenräume gegeben:
(n)
F± :=
n
^
ν=1
(1)
(0)
(0)
F± für n ≥ 1 und F+ := F− := C .
Der n-Elektronen- und m-Positronenraum ist das Tensorprodukt
(n)
(m)
F(n,m) := F+ ⊗ F− ,
und der Fockraum ist die Summe über alle Teilchenzahlen,
∞
M
F(n,m) .
F :=
n,m=0
Jeder Vektor in F(n,m) schreibt sich als Linearkombination aus (nicht notwendigerweise endlich vielen) so genannten einfachen Vektoren
(2.1) (f1 ∧ f2 ∧ · · · ∧ fn ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm ) ,
(1)
fi ∈ F+ , i = 1, . . . , n ,
(1)
gj ∈ F− , j = 1, . . . , m .
16
Das Skalarprodukt zweier Elemente aus F(n,m) ist auf einfachen Vektoren gegeben
durch
0
h(f1 ∧ f2 ∧ · · · ∧ fn ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm ), (f10 ∧ f20 ∧ · · · ∧ fn0 ) ⊗ (g10 ∧ g20 ∧ · · · ∧ gm
)i
= n!m! det[(fi , fj0 )]1≤i,j≤n det[(gi , gj0 )]1≤i,j≤m .
Es verschwindet für zwei Vektoren aus Räumen mit verschiedener Positronen- oder
Elektronenzahl, und für 1 ∈ F(0,0) = C definieren wir h1 , 1i := 1. Wir unterscheiden
das Skalarprodukt auf F von dem auf H durch spitze Klammern h· , ·i anstatt der
runden (· , ·). Der Vektor (2.1) wird mittels
ψ (n,m) (x1 , . . . , xn ; y1, . . . , ym ) :=
X
σ∈
n
sgn(σ)fσ(1) (x1 ) · · · fσ(n) (xn )
!
X
τ∈
m
sgn(τ )gτ (1) (y1 ) · · · gτ (m) (ym )
!
als Funktion aufgefasst, wobei Sn die Permutationsgruppe von n Elementen und
sgn(τ ) für τ ∈ Sn das Signum der Permutation τ ist. Das Skalarprodukt in dieser
Darstellung ist
hψ (n,m) , φ(n,m) i
Z
=
Gn ×Gm
ψ (n,m) (x1 , . . . , ym )φ(n,m) (x1 , . . . , ym ) d x1 · · · d xn d y1 · · · d ym .
Im Formalismus der zweiten Quantisierung spielen Erzeugungs- und Vernichtungsoperatoren eine zentrale Rolle. Wir definieren nun diese für Elektronen und Positronen in unserer Repräsentation des Fockraums.
Für ein f ∈ H und m, n ≥ 0 ist der Elektronen-Vernichtungsoperator a(f ) : F → F
auf dem Teilraum F(n+1,m) gegeben durch
(a(f )ψ)(n,m) (x1 , . . . , xn ; y1 , . . . , ym ) :=
Z
√
n + 1 d x (P+ f )(x) ψ (n+1,m) (x, x1 , . . . , xn ; y1 , . . . , ym ) .
G
Dies definiert durch lineare Fortsetzung einen, wie wir unten sehen werden
beschränkten, Operator auf ganz F, welcher antilinear von f abhängt. Sind
(1)
f1 , . . . , fn+1 ∈ F+ linear unabhängig, so ist seine Wirkung auf einen einfachen Vektor
a(f1 ) (f1 ∧ f2 ∧ · · · ∧ fn+1 ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm )
√
= n + 1 (f1 ∧ · · · ∧ fn+1 ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm ) ;
er vernichtet also das Elektron f1 .
17
Der adjungierte Operator dazu ist der Elektronen-Erzeugungsoperator a∗ (f ) :
F → F. Er ist auf F(n,m) definiert durch
(a∗ (f )ψ)(n+1,m) (x1 , . . . , xn+1 ; y1 , . . . , ym ) :=
n+1
X
1
√
(−1)j+1 (P+ f )(xj )ψ (n,m) (x1 , . . . , x̂j , . . . , xn+1 ; y1 , . . . , ym ) ,
n + 1 j=1
und (a∗ (f )ψ)(0,0) := 0. Hierbei bedeutet x̂j , dass wir die j-te Komponente auslassen.
Der Operator a∗ (f ) hängt linear von f ab und auf einfachen Vektoren wirkt er in
der naheliegenden Weise,
a∗ (f ) (f1 ∧ f2 ∧ · · · ∧ fn ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm )
1
=√
(f ∧ f1 ∧ f2 ∧ · · · ∧ fn ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm ) .
n+1
Mit g ∈ H folgen die kanonischen Antikommutationsrelationen (CAR)
{a(f ), a(g)} = {a∗ (f ), a∗ (g)} = 0 ,
{a(f ), a∗ (g)} = (f, P+ g)
und damit auch die Beschränktheit der Operatoren
ka∗ (f )ψk2 + ka(f )ψk2 = hψ, {a(f ), a∗ (f )}ψi = kP+ f k2 kψk2 .
Der Positronen-Vernichtungsoperator b(f ) : F → F ist definiert durch
(b(f )ψ)(n,m) (x1 , . . . , xn ; y1, . . . , ym ) :=
Z
√
n
(−1) m + 1 d y (CP− f )(y) ψ (n,m+1) (x1 , . . . , xn ; y, y1, . . . , ym ) .
G
Wegen der Antilinearität der Ladungskonjugation C hängt er linear von f ab.
Schließlich ist der Positronen-Erzeugungsoperator b∗ (f ) : F → F mit
(b∗ (f )ψ)(n,m+1) (x1 , . . . , xn ; y1 , . . . , ym+1 ) :=
m+1
(−1)n X
√
(−1)k+1 (CP− f )(yk ) ψ (n,m) (x1 , . . . , xn ; y1 , . . . , ŷk , . . . , ym+1 )
m + 1 k=1
und (b∗ (f )ψ)(0,0) := 0 gegeben. Er hängt wiederum antilinear von f ab. Es ergeben
sich ähnlich wie oben die Antikommutatoren
{b(f ), b(g)} = {b∗ (f ), b∗ (g)} = 0 ,
{b∗ (f ), b(g)} = (f, P− g)
und die analoge Beziehung für die Normen
kb∗ (f )ψk2 + kb(f )ψk2 = hψ, {b(f ), b∗ (f )}ψi = kP− f k2 kψk2 .
Wie man leicht aus den Definitionen entnehmen kann, antikommutieren alle Paare
aus Elektronen- und Positronen-Erzeugungs- und Vernichtungsoperatoren: Mit der
Notation a# (f ) für sowohl a(f ) als auch a∗ (f ) gilt
{b# (g), a# (f )} = 0 .
18
Der Feldoperator auf dem Fockraum ist
Ψ(f ) = a(f ) + b∗ (f )
mit adjungiertem
Ψ∗ (f ) = a∗ (f ) + b(f );
Er ist beschränkt und hängt antilinear von f ab. Es gelten die Antikommutatorbeziehungen
{Ψ(f ), Ψ(g)} = {Ψ∗ (f ), Ψ∗ (g)} = 0 ,
{Ψ∗ (f ), Ψ(g)} = (f, g)
und daraus folgt wiederum
kΨ∗ (f )ψk2 + kΨ(f )ψk2 = hψ, {Ψ(f ), Ψ∗(f )}ψi = kf k2kψk2 .
Den Feldoperator Ψ kann man als Vernichtungsoperator bezüglich des Diracsees
betrachten. In diesem Bild sind im Vakuum alle negativen Energiezustände des
Diracoperators aufgefüllt. Ein Loch“ im Diracsee wird als Positron interpretiert, es
”
hat positive Einteilchenenergie und positive Ladung. Deshalb entspricht der Erzeugungsoperator b∗ (f ) dem Füllen eines Lochs bzw. dem Vernichten eines Positrons
im Diracsee.
Der normierte Vektor Ω := 1 ∈ F(0,0) wird von allen Vernichtungsoperatoren auf
die Null abgebildet, d.h. a(f )Ω = b(f )Ω = 0 ∀f ∈ H. Er entspricht also einem
normierten Zustand ohne Teilchen, dem Vakuum. Diese Eigenschaften charakterisieren das Vakuum bis auf eine komplexe Phase eindeutig.
Definition 2.1. Wir nennen eine Orthonormalbasis (ei )i∈ von H verträglich mit
der Zerlegung H+ ⊕ H− , falls ei ∈ H+ ∩ H 1/2 (R3 ) ⊗ C4 für i ≥ 0 und ei ∈
H− ∩ H 1/2 (R3 ) ⊗ C4 für alle anderen i. Damit schreiben wir kurz
ai := a(ei ) ,
a∗i :=a∗ (ei ) ,
Ψi :=ai + b∗i ,
Ψ∗i :=a∗i + bi .
bi := b(ei ) ,
b∗i :=b∗ (ei ) ,
Eine Hilbertraumbasis von F(n,m) ist gegeben durch
a∗i1 · · · a∗in b∗j1 · · · b∗jm Ω , 0 ≤ i1 < · · · < in , 0 > j1 > · · · > jm ,
und so schreibt sich ein allgemeines Element des Fockraums als
X
Y Y
ϕ=
cI,J
a∗i
b∗j Ω
I⊆{0,1,... }
J⊆{−1,−2,... }
i∈I
j∈J
mit cI,J ∈ C und endlichen geordneten Mengen I und J, d.h. der Betrag jedes
Elements der Menge ist kleiner als der des folgenden.
Mit Hilfe der Erzeugungs- und Vernichtungsoperatoren und den zugehörigen
Antikommutatorbeziehungen ist das Skalarprodukt im Fockraum eindeutig durch
hΩ, Ωi = 1 festgelegt.
Da beim Übergang von klassischen zu quantenmechanischen Systemen aus komplexen Größen Operatoren werden, birgt dieser immer das Problem der Anordnung.
In der zweiten Quantisierung gibt es eine ausgezeichnete Anordnung, die so genannte Normalordnung. Auch diese hängt mit dem Diracsee zusammen, wie wir später
19
sehen werden. Bei der Normalordnung werden alle Erzeugungsoperatoren nach links
antikommutiert. Also zum Beispiel
: a(g)a∗ (f ) := −a∗ (f )a(g) ;
es wird der eigentlich nichttriviale Antikommutator {a(g), a∗(f )} = (g, P+ f ) weggelassen. Man kann sich leicht überlegen, dass der Vakuumerwartungswert eines normalgeordneten Ausdrucks immer verschwindet.
Definition 2.2. Wir bezeichen die von der Identität und den Erzeugern und Vernichtern erzeugte C ∗ -Algebra mit A(F). Die Menge der Zustände von A(F) ist
definiert als die Menge aller stetigen Linearformen auf A(F) mit den Eigenschaften
(1) ρ(A∗ A) ≥ 0 ∀A ∈ A(F) (Positivität),
(2) ρ(1) = 1 (Normierung).
Aus 1. folgt für A ∈ A(F) und λ ∈ C
0 ≤ ρ (A + λ1)(A∗ + λ1) = ρ(AA∗ ) + λρ(A) + λρ(A∗ ) + 1 .
Mit λ = 1 und λ = i ergeben sich die Aussagen ρ(A) + ρ(A∗ ) ∈ R bzw. i(ρ(A) −
ρ(A∗ )) ∈ R, und somit
ρ(A∗ ) = ρ(A) .
Man kann auch zeigen, dass die Stetigkeit einer Linearform bereits aus ihrer Positivität folgt [8, Proposition 2.3.11]. Darüber hinaus sind zwei Zustände bereits gleich,
wenn sie auf der Menge der Monome in Erzeugern und Vernichtern
Y Y Y Y
(2.2)
a∗i
aj
b∗k
bl
i∈I
j∈J
k∈K
l∈L
mit geordneten endlichen Mengen I, J ⊆ {0, 1, . . . } und K, L ⊆ {−1, −2, . . . }
übereinstimmen (vergleiche [9, Abschnitt 5.2]). Die Menge der Zustände enthält die
die reinen Zustände mittels der Zuordnung ρψ (A) := hψ, Aψi für einen beliebigen
normierten Vektor ψ aus dem Fockraum.
Der Fockraum ist eine irreduzible Darstellung der Algebra A(F). Unsere Wahl der
Zustände mittels der Algebra ergibt direkt die Eindeutigkeitsaussage (2.2), die wir
später für die Sätze über die Darstellung von Hartree-Fock-Zuständen benötigen.
Die Teilchenzahl N(ρ) bzw. Ladung Q(ρ) eines Zustandes ρ sind gegeben durch
!
!
X
X
N(ρ) := ρ
(a∗i ai + b∗i bi ) , bzw. Q(ρ) := ρ
(a∗i ai − b∗i bi ) .
i∈
i∈
Für reine Zustände kann man die Definitionen leicht plausibel machen. Ein Zustand
mit einem Elektron ist gegeben durch a∗0 Ω und es gilt N(ρ) = Q(ρ) = 1. Für ein
Elektron-Positron Paar a∗0 b∗−1 Ω gilt N(ρ) = 2 und Q(ρ) = 0.
Es werden auch häufig die formal äquivalenten Erzeugungs- und Vernichtungsoperatoren a∗ (x), a(x) bzw. b∗ (x), b(x) verwendet. Sie erzeugen oder vernichten sie ein
20
Elektron bzw. Positron an der Stelle x. Formal gelten die folgenden Beziehungen:
X
X
(2.3)
a(x) =
ei (x)ai ,
a∗ (x) =
ei (x)a∗i ,
i≥0
(2.4)
a(f ) =
Z
i≥0
d x f (x)a(x) , a∗ (f ) =
G
Z
d x f (x)a∗ (x) .
G
Zum Beweis der Beziehungen setzten wir (2.4) in (2.3) ein und umgekehrt.
Z
X
a(x) =
ei (x) d y ei (y)a(y) = a(x) ,
G
i≥0
a∗ (x) =
X
ei (x)
a(f ) =
∗
a (f ) =
Z
d y ei (y)a∗ (y) = a∗ (x) ,
G
i≥0
Z
Z
d x f (x)
G
X
ei (x)ai =
i≥0
d x f (x)
G
X
X
(ei , f )ai = a(f ) ,
i≥0
ei (x)a∗i =
i≥0
X
(ei , f )a∗i = a∗ (f ) .
i≥0
Analoges gilt für die positronischen Operatoren:
X
X
ei (x)bi ,
b∗ (x) =
ei (x)b∗i ,
b(x) =
i<0
i<0
b(f ) =
Z
d x f (x)b(x) , b∗ (f ) =
G
Es ergeben sich die Antikommutatoren
Z
d x f (x)b∗ (x) .
G
{a(x), a(y)} ={a∗ (x), a∗ (y)} = {b(x), b(y)} = {b∗ (x), b∗ (y)}
={a# (x), b# (y)} = 0
und
{a(x), a∗ (y)} = P+ (x, y) , {b∗ (x), b(y)} = P− (x, y) ,
wobei P± (x, y) der Integralkern des Projektors P± ist. Wir beweisen lediglich die
nichttriviale Antikommutatorbeziehung für Elektronen:
X
X
{a(x), a∗ (y)} =
ei (x)ej (y){ai , a∗j } =
ei (x)ei (y) = P+ (x, y) .
i,j≥0
i≥0
Die Feldoperatoren definiert man ebenfalls analog als
Ψ(x) := a(x) + b∗ (x) und Ψ(x)∗ := a∗ (x) + b(x) .
Die Antikommutationsrelationen der Feldoperatoren ergeben sich leicht aus dem
bereits Gesagten:
{Ψ∗ (x), Ψ∗ (y)} = {Ψ(x), Ψ(y)} = 0 ,
{Ψ(x), Ψ∗ (y)} = P+ (x, y) + P− (x, y) = δ(x, y) ,
mit dem Integralkern der Identität δ(x, y).
21
Quantenelektrodynamik
Ausgangspunkt ist der QED-Hamiltonoperator nach Bjorken und Drell [17,
Formel 15.28]. Mit dem Coulomb-Diracoperator D Z und unter Vernachlässigung
des magnetischen Vektorpotentials lautet er
Z
bare
H
:=
d x : Ψ∗ (x)D Z Ψ(x) :
G
Z
Z
α
1
: Ψ∗ (x)Ψ(x) :: Ψ∗ (y)Ψ(y) : .
+
dx dy
2 G
|x − y|
G
Der erste Term ist die Einteilchenenergie, also die kinetische Energie und die
Coulombenergie bezüglich des Atomkerns. DerPzweite ist die Energie der Coulombwechselwirkung zwischen den Teilchen, wobei 4τ =1 : Ψ∗ (x, τ )Ψ(x, τ ) : die Ladungsdichte am Punkt x ist.
Der Hamiltonoperator ist mittels (2.3) formal äquivalent zu
XZ
d x ei (x)D Z ej (x) : Ψ∗i Ψj :
i,j∈
G
Z
Z
1
α X
dx dy
+
ei (x)ej (y)ek (x)el (y) : Ψ∗i Ψk :: Ψ∗j Ψl : .
2 i,j,k,l∈ G
|x
−
y|
G
Für die auftretenden Matrixelemente verwenden wir die Abkürzungen
Z
Z
ei (x)ej (y)ek (x)el (y)
Z
Z
.
Di,j := (ei , D ej ) und Wi,j;k,l :=
dx dy
|x − y|
G
G
Man beachte, dass wegen der Wahl der Orthonormalbasis (ei ∈ H 1/2 ) alle Matrixelemente endlich sind (zum Beweis siehe Lemma 5.4 im Anhang). Somit erhalten
wir
X
α X
Z
Hbare =
Di,j
: Ψ∗i Ψj : +
Wi,j;k,l : Ψ∗i Ψk :: Ψ∗j Ψl :
2 i,j,k,l∈
i,j∈
und der Erwartungswert der Energie im Zustand ρ ist folglich
X
α X
bare
Z
(2.5)
EZ,α
(ρ) =
Di,j
ρ(: Ψ∗i Ψj :) +
Wi,j;k,l ρ(: Ψ∗i Ψk :: Ψ∗j Ψl :) .
2 i,j,k,l∈
i,j∈
Wir werden der Frage nach der Konvergenz dieser Summen keine große Aufmerksamkeit schenken, da sie im Allgemeinen von der gewählten Basis abhängt. Relevant
für die Energie sollte allerdings nur die Zerlegung von H in H+ und H− sein. Eine
Möglichkeit (2.5) basisunabhängig zu schreiben wäre, die Summen als Spuren der
zugehörigen Operatoren aufzufassen. Da das jedoch auch ein willkürlicher Schritt
ist, wollen die Summen vorerst nur formal betrachten und sie als Motivation zur
Definition des Energiefunktionals (2.24) benutzen.
An der Einteilchenenergie (vergleiche (2.5)) sieht man deutlich den Effekt der
Normalordnung. Es ist
: Ψ∗i Ψj : = : a∗i + bi aj + b∗j : = : a∗i aj + a∗i b∗j + bi aj + bi b∗j :
= a∗i aj + a∗i b∗j + bi aj − b∗j bi ,
22
und die Differenz zu dem nicht normalgeordneten Ausdruck ist
(
1 i=j<0
.
Ψ∗i Ψj − : Ψ∗i Ψj : = bi b∗j + b∗j bi = {bi , b∗j } =
0 sonst
Man erkennt hier unter anderem noch einmal die generelle Tatsache, dass der
Vakuumerwartungswert von normalgeordneten Ausdrücken verschwindet. Die Einteilchenenergie des Vakuums ohne Normalordnung wäre aber
X
Di,i = −∞ ,
i<0
die Einteilchenenergie des Diracsees.
Untersuchen wir die Coulombenergie näher, so stellen wir fest, dass diese im Allgemeinen im Vakuum einen nicht verschwindenden Erwartungswert hat. Der nicht
verschwindende Beitrag kommt von dem Term
(
1 i = l < 0, k = j ≥ 0
∗ ∗
hΩ, bi ak aj bl Ωi =
0 sonst
und ist gleich
X
Wi,j;j,i =
i<0,j≥0
X Z
i<0,j≥0
G
dx
Z
dy
G
ei (x)ej (x)ei (y)ej (y)
.
|x − y|
Der Vakuumerwartungswert hängt also von der gewählten Zerlegung von H ab;
wählt man zum Beispiel als H+ die ersten beiden Spinkomponenten, verschwinden
die Integranden bereits punktweise, und somit auch der Erwartungswert. Allgemein
gilt für die Matrixelemente (wegen ei ∈ H 1/2 ) Wi,j;j,i ≥ 0, da sie Diagonalelemente
des so genannten Coulombskalarprodukts
Z
1
f (x)g(y)|x − y|−1 d x d y
D(f, g) :=
2 6
sind. Dies sieht man für C0∞ -Funktionen mit der Fouriertransformation von D(f, g)
(vergleiche Lemma 5.5); unser Fall folgt mit der Endlichkeit der Matrixelemente
(Lemma 5.4) und einem Stetigkeitsargument analog zum Beweis von Lemma 5.6
oder nach einer anderen Methode mit [30, Theorem 9.8]. Damit kann man leicht
zeigen, dass obiger Vakuumerwartungswert für den masselosen freien Diracoperator
unendlich oder nicht basisunabhängig ist. In diesem Fall sind die Teilräume H+ und
H− streckungsinvariant, und wegen des Skalierungsverhaltens der Summanden reicht
es damit einen nicht verschwindenden Term zu finden. Wir führen diese instruktive
Rechnung in Abschnitt 5.2 im Anhang durch.
Bach et al. [4] haben deshalb den Wechselwirkungsterm
X
Wi,j;k,l : Ψ∗i Ψk :: Ψ∗j Ψl :
i,j,k,l∈
vollständig normalgeordnet:
X
i,j,k,l∈
Wi,j;k,l : Ψ∗i Ψ∗j Ψl Ψk : .
23
Es wurde später von Lieb und Siedentop [28] gezeigt, dass dieser Übergang im
Fall Z = 0 und bei Einführung eines Ultraviolett-Cutoffs im Impulsraum einer Renormierung des Diracoperators entspricht. Der Vakuumerwartungswert verschwindet bei dieser Ordnung wiederum automatisch, unabhängig von der gewählten
Zerlegung von H. Die Energie eines Zustands ρ ist also
X
α X
Z
Di,j
ρ(: Ψ∗i Ψj :) +
Wi,j;k,l ρ(: Ψ∗i Ψ∗j Ψl Ψk :) .
(2.6)
Eα (ρ) =
2
i,j∈
i,j,k,l∈
Unser Modell in dieser Arbeit basiert auf diesem Ausdruck, aber auch er hat
noch ein Problem: er ist nicht stabil. Falls man für D Z den masselosen freien Diracoperator −iα·∇ einsetzt, kann man durch einen einfachen Zustand nach J. P. Solovej
[unveröffentlicht] Instabilität zeigen. Wir berechnen die Energie des Zustands
√
1 − ε2 Ω + εa∗1 a∗2 b∗−2 b∗−1 Ω
mit Basiselementen e−1 , e−2 , e1 und e2 , die wir unten genauer festlegen werden. Die
kinetische Energie des Zustands ist
0
0
0
0
ε2 (D1,1
+ D2,2
− D−1,−1
− D−2,−2
).
Zu der Wechselwirkung tragen nur die beiden Terme
bi bj al ak und a∗i a∗j b∗l b∗k
bei und daher ergibt sich die Wechselwirkungsenergie zu
√
2 1 − ε2 ε<(W−1,−2;1,2 + W−2,−1;2,1 − W−2,−1;1,2 − W−1,−2;2,1 )
√
= 4 1 − ε2 ε<(W−1,−2;1,2 − W−2,−1;1,2 ) .
Wählt man nun e1 , e2 ∈ H+ und e−1 , e−2 ∈ H− nach Lemma 5.7, so dass obiger Term
nicht verschwindet, ist mit einem kleinen ε des richtigen Vorzeichens die Energie
negativ. Da diese im masselosen Fall wie inverse Länge skaliert und die Teilräume H+
und H− streckungsinvariant sind, kann man durch zusammenziehen des Zustands auf
einen Punkt bei gleich bleibender Teilchenzahl beliebig negative Energien erreichen.
Dieses Problem kann man umgehen, indem man die Menge der Zustände auf
verallgemeinerte Hartree-Fock-Zustände beschränkt.
Die Hartree-Fock-Näherung
Wir definieren zuerst die Menge der Hartree-Fock-Zustände.
Definition 2.3. Ein verallgemeinerter Hartree-Fock-Zustand ist ein Zustand ρ
endlicher Teilchenzahl (N(ρ) < ∞) mit folgender Eigenschaft: Für alle endlichen
Folgen d1 , d2 , . . . , d2K von Operatoren aus der Menge aller Erzeugungs- und Vernichtungsoperatoren {a(f ), a∗ (f ), b(f ), b∗ (f )|f ∈ H} gilt
ρ(d1 d2 · · · d2K−1) = 0
und
ρ(d1 d2 · · · d2K ) =
X
σ∈S
sgn(σ)ρ(dσ(1) dσ(2) ) · · · ρ(dσ(2K−1) dσ(2K) ) ,
wobei S ⊆ S2K die Menge der Permutationen mit σ(1) < σ(3) < · · · < σ(2K − 1)
und σ(2i − 1) < σ(2i) für 1 ≤ i ≤ K bezeichnet.
24
Insbesondere ist das Vakuum ein Hartree-Fock-Zustand und obige Darstellung
seines Erwartungswerts wird auch als Wick-Theorem bezeichnet. Hartree-FockZustände vertragen sich gut mit der Normalordnung. Folgendes Lemma wurde
uns von D. Hundertmark [unveröffentlicht] vorgeschlagen und für den für uns
wesentlichen Zweiteilchenfall (K = 2) auch bewiesen.
Lemma 2.4. Für einen Hartree-Fock-Zustand ρ gilt mit obigen Bezeichnungen
X
(2.7)
ρ(: d1 d2 · · · d2K :) =
sgn(σ)ρ(: dσ(1) dσ(2) :) · · · ρ(: dσ(2K−1) dσ(2K) :) .
σ∈S
Beweis. Nehmen wir an, die Folge d1 d2 · · · d2K sei bereits normalgeordnet. Dann sind
auch alle Paare normalgeordnet, die auf der rechten Seite von (2.7) auftreten. Somit
gilt die Behauptung nach der Definition von Hartree-Fock-Zuständen.
Für den allgemeinen Fall stellen wir zuerst fest, dass : d1 d2 · · · d2K : ein antikommutierender Ausdruck ist, also das Vertauschen zweier Operatoren das Vorzeichen
des Ausdrucks ändert. Die rechte Seite von (2.7) lässt sich somit auch als Summe
über die Menge S2K aller Permutationen von {1, . . . , 2K} schreiben:
X
1
sgn(σ)ρ(: dσ(1) dσ(2) :) · · · ρ(: dσ(2K−1) dσ(2K) :) .
K!2K σ∈
2K
Dies zeigt aber, dass das Vertauschen zweier Operatoren auf beiden Seiten von (2.7)
lediglich das Vorzeichen ändert. Damit ist das Problem auf den anfangs behandelten
Fall zurückgeführt.
Mit anderen Worten sind die Mehrteilchendichten eines Hartree-Fock-Zustands
eine Summe aus Produkten seiner Einteilchendichten; sie sind insbesondere durch
diese bereits eindeutig bestimmt, da Zustände durch ihre Werte auf den Monomen
von Erzeugungs- und Vernichtungsoperatoren festgelegt sind. Für die Zweiteilchendichte in der QED-Energie (2.6) folgt die Gleichung
(2.8) ρ(: Ψ∗i Ψ∗j Ψl Ψk :) = ρ(: Ψ∗i Ψ∗j :)ρ(: Ψl Ψk :) − ρ(: Ψ∗i Ψl :)ρ(: Ψ∗j Ψk :)
+ ρ(: Ψ∗i Ψk :)ρ(: Ψ∗j Ψl :) .
Aus (2.7) sieht man allgemein, dass sich Hartree-Fock-Zustände aus den beiden
Matrizen
γi,j = ρ(: Ψ∗j Ψi :) und υi,j = ρ(: Ψj Ψi :)
zusammensetzen. Dies veranlasst uns zu folgender Definition.
Definition 2.5. Eine Ladungsdichtematrix ist ein selbstadjungierter Operator Γ auf
H × H mit den Eigenschaften:
(1)
γ υ
Γ=
,
υ ∗ −γ
wobei υ ∗ = −υ und die Spuren Sp P+ γP+ und Sp P− γP− endlich sind.
(2)
P− 0
P+ 0
−
≤Γ≤
.
0 P+
0 P−
25
Unter der komplexen Konjugation einer Matrix verstehen wir die komplexe Konjugation aller Elemente: γ i,j := γi,j . Aus der Definition folgen unmittelbar die Eigenschaften γ = γ ∗ , 0 ≤ P+ γP+ ≤ 1 und −1 ≤ P− γP− ≤ 0. Wir betrachten die
Zerlegung von Γ bezüglich H+ und H− ,


γ++ γ+− υ++
υ+−
γ−+ γ−− υ−+
υ−− 
 ,
Γ=
∗
∗
υ++
υ−+
−γ̄++ −γ̄+− 
∗
∗
υ+−
υ−−
−γ̄−+ −γ̄−−
∗
mit γ++ := P+ γP+ , γ+− := P+ γP− , γ−+ := P− γP+ = γ+−
und γ−− := P− γP− .
Analoges gilt für die Blöcke von υ. Die Matrixelemente sind
(2.9)
γi,j = ρ(: Ψ∗j Ψi :), (γ++ )i,j = ρ(a∗j ai ), (γ+− )i,j = ρ(bj ai ), (γ−− )i,j = −ρ(b∗i bj )
υi,j = ρ(: Ψj Ψi :), (υ++ )i,j = ρ(aj ai ), (υ+− )i,j = ρ(b∗j ai ), (υ−− )i,j = ρ(b∗j b∗i ) .
Den Zusammenhang von Γ mit den Zuständen zeigt folgendes Lemma aus [4].
Lemma 2.6. Jeder Zustand endlicher Teilchenzahl definiert eine Ladungsdichtematrix Γρ durch
(2.10)
(h, Γρ g) = ρ : [Ψ∗ (g1 ) + Ψ(g̃2 )][Ψ(h1 ) + Ψ∗ (h̃2 )] :
P
mit h := (h1 , h2 ) ∈ H2 , g := (g1 , g2 ) ∈ H2 und für f =
k∈ λk ek sei
P
f˜ = k∈ λk ek . Die komplexe Konjugation dient dazu, die rechte Seite von (2.10)
in g linear und in h antilinear zu machen.
Beweis. Wir werden aus Gründen der besseren Übersicht auf den Index ρ bei der
Ladungsdichtematrix verzichten, und im Folgenden frei zwischen Γ und ρ wechseln.
Durch Einsetzen der Basis erhält man für den oberen linken Block
γi,j = ρ(: Ψ∗j Ψi :) = ρ(a∗j ai + a∗j b∗i + bj ai − b∗i bj ) ,
und wegen der Eigenschaft ρ(A∗ ) = ρ(A) der Zustände gilt
γj,i = ρ(a∗j ai + a∗j b∗i + bj ai − b∗i bj ) = γi,j ,
was die Selbstadjungiertheit von γ impliziert. Rechts unten steht die Matrix mit
Elementen
ρ(: Ψj Ψ∗i :) = ρ(−a∗i aj + aj bi + b∗j a∗i + b∗j bi )
und wegen
ρ(: Ψ∗j Ψi :) = ρ(ai a∗j + bi aj + a∗i b∗j − b∗j bi )
sind diese durch ρ(: Ψj Ψ∗i :) = −γi,j gegeben.
Der obere rechte Block ergibt sich zu
υi,j = ρ(: Ψj Ψi :) = ρ(aj ai − b∗i aj + b∗j ai − b∗j b∗i ) = ρ(Ψj Ψi ) ;
die Normalordnung hat hier keine Auswirkung, da alle Terme antikommutieren.
Deshalb gilt auch
υj,i = ρ(Ψi Ψj ) = −ρ(Ψj Ψi ) = −υi,j .
Die Matrixelemente links unten sind
ρ(: Ψ∗j Ψ∗i :) = ρ(Ψ∗j Ψ∗i ) = −ρ(Ψi Ψj ) = υj,i ,
26
also steht dort der zu υ adjungierte Operator.
Ließe man in (2.10) die Normalordnung weg, ergäbe sich die nicht renormierte
Matrix
γ + P−
υ
,
(2.11)
Γur =
υ∗
−γ + P+
wie man den vorangegangenen Ausführungen leicht entnehmen kann. Von ihr kann
man zeigen, dass sie die übliche Ungleichung für Einteilchen-Dichtematrizen 0 ≤
Γur ≤ 1 erfüllt (vergleiche (2.14)). Mit g = (g1 , g2 ) ∈ H2 normiert, 1 = kgk2 =
kg1 k2 + kg2 k2 , berechnen wir
0 ≤ (g, Γur g) = ρ ([Ψ∗ (g1 ) + Ψ(g̃2 )][Ψ(g1 ) + Ψ∗ (g̃2 )])
= (kg1 k2 + kg2 k2 )ρ(1) − ρ ([Ψ(g1 ) + Ψ∗ (g̃2 )][Ψ∗ (g1 ) + Ψ(g̃2 )]) ≤ 1 .
Daher kann man Ladungsdichtematrizen als das normalgeordnete Gegenstück zu
Einteilchen-Dichtematrizen auffassen. Hieraus folgt auch sofort die Ungleichung für
Ladungsdichtematrizen.
Es bleibt noch zu zeigen, dass die Spuren von γ++ und γ−− endlich sind. Dies
folgt aus der endlichen Teilchenzahl des Zustands und der Positivität von γ++ und
−γ−− . Überträgt man die Teilchenzahl von ρ auf die Ladungsdichtematrix Γ erhält
man
!
!
!
X
X
X
N(ρ) = ρ
(a∗i ai + b∗i bi ) = ρ :
Ψ∗i Ψi : − ρ :
Ψ∗i Ψi :
(2.12)
i≥0
i<0
i∈
= Sp γ++ − Sp γ−− =: N(Γ) = N(γ) .
Satz 2.7. Mittels (2.10) wird die Menge der Hartree-Fock-Zustände bijektiv auf die
Menge der Ladungsdichtematrizen abgebildet.
Beweis. Noch zu zeigen ist hierbei, dass es zu jeder Ladungsdichtematrix auch
einen Hartree-Fock-Zustand gibt. Dies führen wir mit einem Beweis aus [4] auf den
entsprechenden Satz [1, Theorem 2.3] für Hartree-Fock-Zustände mit nur einer Art
von Teilchen zurück.
Wir konjugieren Γur mit der orthogonalen Matrix


1 0 0 0
 0 0 0 1

W = W ∗ = W −1 := 
 0 0 1 0
0 1 0 0
und erhalten
Γur,W := W Γur W ∗

γ++ υ+−
υ++
γ+−
∗

υ ∗
−γ −+
υ−−
+− −γ −−
 .
= 
∗
∗
υ++ −γ +− 1 − γ ++
υ−+ 
γ−+ υ−−
υ−+
1 + γ−−

27
Mit den Matrizen
γur,W :=
γ++ υ+−
∗
υ+−
−γ −−
und υur,W :=
υ++ γ+−
∗
−γ −+ υ−−
schreibt sich die konjugierte Matrix in der gewohnten Form
γur,W
υur,W
Γur,W =
.
∗
υur,W
1 − γ ur,W
∗
Wegen γ = γ ∗ und υ ∗ = −υ gelten für die transformierten Matrizen γur,W = γur,W
∗
und υur,W = −υ ur,W . Aus 0 ≤ Γur ≤ 1 folgt 0 ≤ Γur,W ≤ 1 und somit auch, dass
γur,W mit γ++ und γ−− endliche Spur hat.
Wie man an den Matrixelementen (2.9) sieht, entspricht der Verzicht auf die
Normalordnung und die Konjugation mit W dem Wechsel in einen Fockraum mit
nur einer Sorte von Teilchen mit Erzeugern c∗i und Vernichtern ci für i ∈ Z und
(
(
a∗i i ≥ 0
ai i ≥ 0
.
und c∗i := Ψ∗i =
(2.13)
ci := Ψi = ∗
bi i < 0
bi i < 0
Da die CAR für Ψ und Ψ∗ gelten, folgen sie auch unmittelbar für c. In unserem
Modell ist dieser Fockraum als der Spezialfall H+ = H enthalten. Daraus ergibt
sich mit (2.11) die Definition der Einteilchen-Dichtematrizen als selbstadjungierte
Operatoren Γc mit den Eigenschaften:
γc
υc
(2.14)
Γc =
mit 0 ≤ Γc ≤ 1 und υc∗ = −υc .
υc∗ 1 − γc
Die Teilchenzahl ist analog durch die Spur von γc gegeben.
Die Konjugation mit W ist also eine Bijektion zwischen den nicht normalgeordneten Ladungsdichtematrizen Γur und den Einteilchen-Dichtematrizen Γc endlicher
Teilchenzahl. Letztere sind wegen ihrer einfacheren Struktur leichter zu handhaben.
Aus der Definition der Hartree-Fock-Zustände sieht man auch, dass die Menge der
Hartree-Fock-Zustände unter der Transformation (2.13) zwischen Ψ und c gleich
bleibt.
In [1, Theorem 2.3] wird zu jeder Einteilchen-Dichtematrizen Γc endlicher
Teilchenzahl die Existenz eines zugehörigen Hartree-Fock-Zustands gezeigt. Daraus
folgt mit der Transformation (2.13) auch die Existenz eines Zustands ρ mit nicht normalgeordneter Ladungsdichtematrix Γur . Die Ladungsdichtematrix von ρ ist dann
Γ, was den Beweis abschließt.
Aus der Ungleichung 0 ≤ Γur ≤ 1 (vergleiche (2.11)) folgt Γ2ur ≤ Γur , und dies
ausgewertet für den oberen linken Block gibt (γ + P− )2 + υυ ∗ ≤ γ + P− oder
(2.15)
γ 2 + P− γ + γP− + υυ ∗ ≤ γ .
Die beiden Diagonalelemente dieser Ungleichung bezüglich H+ und H− sind
(2.16a)
(2.16b)
2
∗
∗
∗
γ++
+ γ+− γ+−
+ υ++ υ++
+ υ+− υ+−
≤ γ++
2
∗
∗
∗
γ−−
+ γ+−
γ+− + υ−− υ−−
+ υ−+ υ−+
≤ −γ−−
und somit folgt aus der endlichen Spur von γ++ und γ−− , dass γ und υ HilbertSchmidt-Operatoren sind.
28
Wir sagen, die Ladungsdichtematrix Γ bzw. der zugehörige Hartree-Fock-Zustand
habe endliche kinetische Energie, falls γ die Bedingung
p
p
γ++
0
]
]
T0 (γ) := Sp |p|γ |p| < ∞ mit γ :=
0 −γ−−
erfüllt. Mit Lemma p
5.3 ist dann auch die kinetische Energie massiver Teilchen (zur
0
Erinnerung: |D | = p2 + m2 ) endlich:
p
p p
Sp (p2 + m2 )1/4 γ ] (p2 + m2 )1/4 = Sp γ ] p2 + m2 γ ]
p
p
≤ Sp γ ] (|p| + m) γ ]
≤ T0 (γ) + mN(γ) .
Wir definieren die Einteilchenenergie von Zuständen endlicher kinetischer Energie
durch
p
p
p
p
(2.17)
T (γ) := Sp γ ] |D Z | γ ] = Sp |D Z |γ ] |D Z |
und da
(2.18)
π
π
0
Z
0
0
|D | ≤ P+ |D |P+ + P− |D |P− + P− |p|P− ≤ P+ |D |P+ + 1 +
P− |D 0 |P− ,
2
2
ist diese auch endlich. Die Betragsungleichung beweist man mit (f, g) ∈ (H+ ⊕H− )∩
(H 1/2 (R3 ) ⊗ C4 ) und
Zα
0 ≤ (f, |D Z |f ) = (f, D0 f ) − (f,
f ) ≤ (f, |D 0 |f ) ,
|x|
π
Zα
g) ≤ (g, |D 0|g) + (g, |p|g) .
0 ≤ (g, |D Z |g) = −(g, D 0 g) + (g,
|x|
2
Ist darüber hinaus D Z γ Spurklasse, so gilt
Sp D Z γ = Sp |D Z |(γ++ − γ−− ) ,
und nach Lemma 5.3 stimmt dieser Ausdruck mit der Einteilchenenergie T (γ)
überein.
Wir definieren nun die zu der QED-Energie (2.6) äquivalente Energie für Ladungsdichtematrizen. Die Einteilchenenergie T (γ) ist offensichtlich formal die gleiche wie
in (2.6) und der Wechselwirkungsterm zerfällt für Hartree-Fock-Zustände nach (2.8)
in drei Terme:
X
Wi,j;k,l ρ(: Ψ∗i Ψ∗j :)ρ(: Ψl Ψk :) − ρ(: Ψ∗i Ψl :)ρ(: Ψ∗j Ψk :)
i,j,k,l∈
(2.19)
=
X
i,j,k,l∈
+ρ(: Ψ∗i Ψk :)ρ(: Ψ∗j Ψl :)
Wi,j;k,l (υi,j υk,l − γl,iγk,j + γk,iγl,j ) .
Der erste,
Z
X Z
X
ei (x)ej (y)ek (x)el (y)
Wi,j;k,l υi,j υk,l =
(ei , υej )(ek , υel ) ,
dx dy
|x
−
y|
G
G
i,j,k,l∈
i,j,k,l∈
29
führt zur Paarenergie.
Da υ ein Hilbert-Schmidt-Operator ist, können wir die FunkP
tion υ(x, y) := i,j∈ (ei , υej )ei (x)ej (y) auf dem Produktraum L2 (G × G) definieren
und mit dem unitären Basiswechsel B : H → H, ei 7→ ei , ist υ(x, y) der Integralkern von υB (vergleiche Abschnitt 5.1 über Hilbert-Schmidt-Operatoren). Damit
definieren wir die Paarenergie als
Z
|υ(x, y)|2
(2.20)
WP (Γ) = WP (υ) :=
dxdy
,
|x − y|
G×G
das Betragsquadrat der Funktion |x − y|−1/2 υ(x, y) in L2 (G × G). Für Ladungsdichtematrizen endlicher kinetischer Energie ist dieser Ausdruck endlich. Mit der
Ungleichung von Kato (1.2) erhalten wir
Z
Z
π
|υ(x, y)|2
dxdy ≤
υ(x, y)|∇x |υ(x, y) d x d y
WP (υ) =
2 G×G
G×G |x − y|
4 Z
π X
=
υ(p, τ ; q, σ)|p|υ(p, τ ; q, σ) d p d q .
2 σ,τ =1 6
Der obige Ausdruck
ist bis auf den Faktor das Quadrat der Hilbert-Schmidt-Norm
p
des Operators |p|υB und damit gleich
p
p
π
Sp |p|υυ ∗ |p| .
2
An dieser Stelle benötigen wir ein elementares Lemma für beschränkte Operatoren, das wir auch kurz beweisen werden:
υυ ∗ ≤ 2 P+ (υυ ∗)P+ + P− (υυ ∗)P− .
Das Produkt υυ ∗ schreibt sich in Blockform als
∗
∗
∗
∗
υ++ υ++
+ υ+− υ+−
υ++ υ−+
+ υ+− υ−−
∗
(2.21)
υυ =
.
∗
∗
∗
∗
υ−+ υ++
+ υ−− υ+−
υ−− υ−−
+ υ−+ υ−+
Wir betrachten die Summe von zwei positiven Operatoren,
∗
∗
∗
∗
0 ≤ (υ++ − υ−+ )(υ++
− υ−+
) + (υ−− − υ+− )(υ−−
− υ+−
),
und formen diese zu folgender Ungleichung um:
∗
∗
∗
∗
υ++ υ−+
+ υ+− υ−−
+ υ−+ υ++
+ υ−− υ+−
∗
∗
∗
∗
≤ υ++ υ++
+ υ+− υ+−
+ υ−− υ−−
+ υ−+ υ−+
.
Somit sind die Diagonalelemente von (2.21) größer gleich den Nebendiagonalelementen und es folgt die Behauptung.
Verwenden wir nun noch die Ungleichung (2.16), so bekommen wir die obere
Schranke
p
p
π Sp |p|γ ] |p| = πT0 (γ) .
Die Austauschenergie ist motiviert durch den zweiten Term von (2.19),
Z
X Z
X
ei (x)ej (y)ek (x)el (y)
Wi,j;k,l γl,iγk,j =
(ei , γel )(ek , γej ) ,
dx dy
|x
−
y|
G
G
i,j,k,l∈
i,j,k,l∈
30
und mit γ(x, y) :=
(2.22)
P
(ei , γej )ei (x)ej (y) definieren wir sie als
Z
|γ(x, y)|2
.
WX (Γ) = WX (γ) :=
dxdy
|x − y|
G×G
i,j∈
Ihre Endlichkeit wird im Beweis der Stabilität des Elektronen-Positronen-Felds ohne
externes Potential (Abschnitt 3.1) analog zur Endlichkeit der Paarenergie gezeigt.
Etwas anders behandeln wir die klassische elektrostatische oder auch direkte Energie, die zum dritten Term in (2.19) gehört. Um die Ladungsdichte definieren zu
können, müssen wir voraussetzen, dass γ Spurklasse ist. Mit den linear unabhängigen Eigenfunktionen fi zu den nicht verschwindenden Eigenwerten λi von γ ist die
Ladungsdichte gegeben durch
ργ (x) :=
4 X
X
τ =1
i
λi |fi (x, τ )|2 .
Wegen der Voraussetzung ist sie eine wohldefinierte L1 (R3 )-Funktion. Bezüglich der
gewählten Basis ist der dritte Term gleich
X
Wi,j;k,l γk,iγl,j ;
i,j,k,l∈
wechselt man zu einer Basis aus Eigenfunktionen von γ, so kann man diesen durch
die Ladungsdichte ausdrücken. Wir definieren also die direkte Energie als
Z
ργ (x)ργ (y)
= 2D(ργ , ργ ) .
(2.23)
WD (Γ) = WD (γ) :=
dxdy
|x − y|
3× 3
p
p
P
Sie ist endlich, wenn wir zusätzlich Sp |γ||∇| |γ| = i |λi|(fi , |p|fi ) < ∞ fordern:
P
P
Z
2
2
i |λi | |fi (x)|
j |λj | |fj (y)|
WD (γ) ≤
dxdy
|x − y|
G×G
Z
X
X
π
≤
dxdy
|λi | fi (x) |∇x | fi (x)
|λj | |fj (y)|2
2 G×G
j
i∈
p
p
π
= Sp |γ| Sp |γ||∇| |γ| < ∞ .
2
p
p
Und falls Sp |γ||∇| |γ| < ∞, so hat die Ladungsdichtematrix auch endliche Einteilchenenergie. Mit Ungleichung (2.18) haben wir
p
p
p
p π
T (γ) = Sp γ ] |D Z | γ ] ≤ Sp γ ] P+ |D 0|P+ + 1 +
P− |D 0 |P−
γ] ,
2
und jeder dieser Terme ist beschränkt; z.B. gilt
p
p
p
p
p
p
Sp γ ] P+ |D 0 |P+ γ ] = Sp |D 0 |P+ γ ] P+ |D 0 | ≤ Sp |D 0 |P+ |γ|P+ |D 0 | ,
da für alle f ∈ H+ und g ∈ H− folgende Ungleichungen gelten:
(f, |γ|f ) ≥ |(f, γf )| = (f, γ++ f ) ,
(g, |γ|g) ≥ |(g, γg)| = (g, −γ−− g) .
Mit dieser Vorarbeit können wir schließlich das Energiefunktional definieren.
31
Definition 2.8 (Das Hartree-Fock-Funktional). Wir schreiben X für die Menge
aller Ladungsdichtematrizen Γ mit
p
p
Sp |γ||∇| |γ| < ∞ und Sp |γ| < ∞ ,
und DHF für die mittels der Zuordnung (2.10) äquivalente Menge von HartreeFock-Zuständen. Die Elemente von X und DHF heißen Ladungsdichtematrizen bzw.
Hartree-Fock-Zustände endlicher Energie. Die Energie einer Ladungsdichtematrix
aus der Menge X ist gegeben durch das Hartree-Fock-Funktional EZ,α : X → R,
(2.24)
Z
Z
α
|υ(x, y)|2
|γ(x, y)|2
α
EZ,α(Γ) = T (γ) +
dxdy
dxdy
+ αD(ργ , ργ ) −
.
2
|x − y|
2
|x − y|
Da wir aber in dieser Arbeit nur am Infimum der Energie interessiert sind, stellen
wir fest, dass die Paarenergie für unsere Betrachtungen unwesentlich ist. Sie ist
nichtnegativ und mit
γ 0
γ υ
0
erfüllt auch Γ :=
Γ=
0 −γ
υ ∗ −γ
die Bedingungen an eine Ladungsdichtematrix. Es gilt also
EZ,α(Γ) ≥ EZ,α(Γ0 ) bei N(Γ) = N(Γ0 ) .
Darum werden wir im Folgenden ausschließlich mit dem Energiefunktional
Z
α
|γ(x, y)|2
EZ,α(γ) = T (γ) + αD(ργ , ργ ) −
dxdy
2
|x − y|
arbeiten und γ, in Missbrauch der Notation, auch als Ladungsdichtematrix bezeichnen.
Resultate
In Artikel [4] zeigten Bach, Barbaroux, Helffer und Siedentop, dass die Energie im
Falle Z = 0 und α ≤ 4/π nichtnegativ ist (Abschnitt 3.1). Von Hundertmark, Röhrl
und Siedentop wurde in [16] (Abschnitt 3.3) gezeigt, dass für größeres α die Energie
pro Teilchen nach unten unbeschränkt ist. Die kritische Konstante für Stabilität der
zweiten Art ist also α = 4/π.
Für Atome (Z 6= 0) ist im physikalischen Fall (α ≈ 1/137) die Energie nach
[4] nichtnegativ für Z ≤ 68. Von Brummelhuis, Röhrl und Siedentop wurde das
Resultat in [11] bis Z = 117 gezeigt (Abschnitt 4). Letzteres umfasst alle in der
Natur vorkommenden Elemente.
Mit einem klassischen elektromagnetischen Feld konnten Bach et al. Stabilität von
Atomen bis Z = 67 (Holmium) beweisen [4]. Die Stabilität der Materie in diesem
Kontext wurde in [3] für den physikalischen Fall ebenfalls für Z ≤ 67 gezeigt. In
beiden Resultaten ist die Energie wiederum nichtnegativ.
Die Tatsache, dass die Energie in all diesen Modellen im Stabilitätsfall nichtnegativ ist, kann man von einem ästhetischen Standpunkt aus begrüßen. Da bei allen in
vorliegender Arbeit betrachteten Systemen die Energie des Hartree-Fock-Vakuums
verschwindet, folgt damit dass dieses ein Grundzustand ist. Für Z und α kleiner als
die kritischen Werte (z.B. α < 4/π bei Z = 0) ist er zudem eindeutig.
32
Betrachtet man das Elektronen-Positronen-Feld ohne externes Potential, so ist
das Hartree-Fock-Vakuum als Grundzustand naheliegend. Für ein Atom (Z 6= 0)
würde man aber einen neutralen Grundzustand erwarten, also etwa Q(γ) = Z.
Um die Existenz zusätzlicher Teilchen zu begünstigen, führen wir ein so genanntes
chemisches Potential ein, d.h. wir subtrahieren ein µ-faches der Ruheenergie mN(γ).
Dies hat den Effekt, dass die Erzeugung eines Teilchens um µm weniger Energie
kostet. Man beachte, dass ein solcher Term die Stabilität des Modells unberührt lässt.
Wenn man allerdings, wie im atomaren Fall, die Elektronen- und Positronenräume
nicht explizit kennt, kann man auch die Teilchenzahl (vergleiche (2.12)) nicht einfach
ausrechnen. Wir beschränken unsere Betrachtungen deshalb auf den Fall Z = 0. Wir
zeigen in Abschnitt 3.4, dass der Grundzustand für α = 1/137 bis µ ≈ 0, 999983
unverändert das Hartree-Fock-Vakuum bleibt und die Energie für µ ≥ 1 nach unten
unbeschränkt ist.
Eine andere Möglichkeit, das Vakuum als Grundzustand zu vermeiden, ist, die
Zahl der Teilchen N(γ) vorzuschreiben. Im Fall Z = 0 folgt aus den Resultaten für
chemische Potentiale eine gute Abschätzung für das Infimum der Energie bei fester
Teilchenzahl (Abschnitt 3.5).
Es wurde von G.M. Graf auf einer Tagung in Sønderborg, Dänemark, zu diesem
Thema angemerkt, dass man in der Natur Elektronen bereits vorfindet, um ein
Positron zu erhalten aber ein Elektron-Positron-Paar erzeugen muss. Dies entspricht
einem Potential der Form µmQ(γ) = µm Sp γ; Elektronen werden begünstigt und
Positronen doppelt belastet. Diese Wahl verspricht realistischere Resultate und ist
zudem auch technisch einfacher, da die Ladung die Spur der Ladungsdichtematrix ist
und somit die Elektronen- und Positronenräume nicht direkt eingehen. Der Einfluss
eines solchen Potentials auf den Grundzustand des Atoms wird Gegenstand unserer
künftiger Forschung auf diesem Gebiet sein.
33
Das Infimum der Energie des Vakuums
In diesem Abschnitt bestimmen wir in zwei Fällen das Infimum der Energie des
Elektronen-Positronen-Felds ohne externes Potential in Hartree-Fock-Näherung.
Zuerst stellen wir den Beweis für die Stabilität des Elektronen-Positronen-Felds
aus [4] vor. Er zeigt, dass die Energie für α ≤ 4/π nichtnegativ ist. Für größere
Werte der Feinstrukturkonstante α wurde das Infimum zuerst von Chaix, Iracane
und Lions [13] untersucht, aber nur unvollständig behandelt. Wir werden in diesem
Fall Ladungsdichtematrizen mit beliebig negativer Energie pro Teilchen konstruieren. Damit ist insbesondere die Optimalität des Stabilitätsresultats gezeigt. Im
zweiten Teil führen wir das chemische Potential −µmN(γ) ein und
puntersuchen den
Grundzustand in Abhängigkeit von µ. Wir zeigen, dass für µ ≤ 1 − (πα/4)2 das
Hartree-Fock-Vakuum der Grundzustand bleibt und dass die Energie für µ ≥ 1 nach
unten unbeschränkt
p ist. Daraus folgt für die Energie ohne chemisches Potential die
untere Schranke 1 − (πα/4)2 mN(γ) und ein Intervall für das Infimum der Energie
der Ladungsdichtematrizen mit fester Teilchenzahl N. Am Ende stellen wir einige
technische Hilfssätze für die Abschätzungen bereit, die den Fluss der Beweise stören
würden.
Stabilität des Vakuums
Satz 3.1 ([4]). Ist α ≤ 4/π, so gilt für alle Hartree-Fock-Zustände ρ ∈ DHF
E0,α (ρ) ≥ 0 .
Beweis. Wir passen den Beweis aus [4] an unsere Definitionen an. Zuerst schätzen
wir mit der Ungleichung von Kato (1.2) die Austauschenergie nach oben ab:
Z
Z
|γ(x, y)|2
π
dxdy ≤
WX (γ) =
γ(y, x)|∇x|γ(x, y) d x d y
2 G×G
G×G |x − y|
(3.1)
p
p
π
π
π
= Sp γ|∇|γ ≤ Sp γ|D 0 |γ = Sp |D 0 |γ 2 |D 0 | .
2
2
2
p
Das zweite Integral ist das Quadrat der Hilbert-Schmidt-Norm von |p|γ und somit
gleich der darauf folgenden Spur. Unter Verwendung der Ungleichungen (2.16a) und
(2.16b) erhalten wir eine Abschätzung gegen die kinetische Energie:
p
p
Sp |D 0|γ 2 |D 0 |
p
p
p
p
= Sp P+ |D 0|P+ γ 2 P+ |D 0 |P+ + Sp P− |D 0 |P− γ 2 P− |D 0|P−
2
∗
p
p
γ++ + γ+− γ+−
0
(3.2)
0
= Sp |D |
|D 0 |
2
∗
0
γ−− + γ+− γ+−
p
p
γ++
0
0
|D 0 | = T (γ) .
≤ Sp |D |
0 −γ−−
Für die Gesamtenergie folgt
falls α ≤ 4/π.
α π
E0,α (γ) ≥ T (γ) 1 −
≥0,
22
34
Da die Einteilchenenergie für γ 6= 0 wegen ihrer Definition (2.17) und der Ungleichung (2.16) positiv ist, gilt dies auch für die Gesamtenergie bei α < 4/π; das
Hartree-Fock-Vakuum ist somit für diese α der einzige Grundzustand.
Implementation translationsinvarianter Dichtematrizen
Zuerst stellen wir das unseren Rechnungen zugrunde liegende Prinzip vor. Aus praktischen Gründen weichen wir etwas von unserer Notation ab, indem wir die Spinkomponenten nicht in das Argument x = (x, τ ) schreiben, sondern Objekte mit Spin als
Vektoren in C4 bzw. Matrizen in C4 × C4 auffassen.
Ohne externes Potential ist der Diracoperator im Impulsraum gegeben durch die
4 × 4 Matrix
m σ·p
0
,
D (p) =
σ · p −m
welche mit Hilfe von
cos θp
− sin θp σ · ω p
R(p) :=
sin θp σ · ω p
cos θp
diagonalisiert werden kann. Wir benutzen die Abkürzungen ωp := p/|p| für Vektoren
p ∈ R3 \ {0}, E(p) := (p2 + m2 )1/2 für die relativistische kinetische Energie, cp =
1/2
1/2
cos θp := (E(p) + m)/2E(p)
und sp = sin θp := (E(p) − m)/2E(p)
für die
Winkelfunktionen von θp . Hiermit gilt
E(p)
0
∗
0
R (p)D (p)R(p) =
.
0
−E(p)
Ohne externes Potential können wir also Elektronen- und Positronenraum explizit
angeben. Mit der Zerlegung von H in die beiden ersten und letzten Komponenten
H̃+ := {f ∈ H|f3 = f4 = 0} und H̃− := {f ∈ H|f1 = f2 = 0} ist R∗ eine
unitäre Transformation auf H mit R∗ (H+ ) = H̃+ und R∗ (H− ) = H̃− . Die notwendige
Ungleichung −P− ≤ γ ≤ P+ für Ladungsdichtematrizen aus Definition 2.5 hat nun
die Form
0 0
1 0
∗
−
≤ R γR ≤
,
0 1
0 0
und P− ist gegeben durch
0 0
P− = R
R∗ .
0 1
Wegen der Translationsinvarianz und der Symmetrie zwischen Elektronen und
Positronen des Modells ohne externes Potential setzten Chaix et al. für die minimierende Folge translationsinvariante neutrale Zustände an. Ein solcher Zustand
hat aber keine von Null verschiedene endliche Teilchenzahl in R3 , da sich in jedem
Einheitswürfel gleich viele Teilchen befinden. Er ist also entweder das Vakuum oder
kein Zustand im Sinne unserer Definition 2.5.
Unter einer Dichtematrix“ wollen wir im Folgenden einen Operator γC : H → H
”
mit −P− ≤ γC ≤ P+ verstehen; insbesondere ist eine Ladungsdichtematrix auch
eine Dichtematrix. Die Dichtematrix γC eines translationsinvarianten Zustands
ist ein Multiplikationsoperator im Impulsraum. Formal ist ihr Integralkern durch
35
γC (p)δ(p − q) gegeben und in Anlehnung an die Tatsache, dass die Spur eines Operators unter bestimmten Voraussetzungen das Integral über die Diagonale seines
Integralkerns ist (vergleiche Lemma 5.2), kann man für die Teilchenzahl von γC in
einem endlichen Volumen V folgenden Ausdruck schreiben:
Z
d p Sp 4 (γC )++ (p) − (γC )−− (p) δ(0)
N(γC ) : =
3
Z
= |V |
d p Sp 4 (γC )++ (p) − (γC )−− (p) .
3
Dabei setzt man δ(0) = |V |, weil die Fouriertransformierte der δ-Funktion die konstante Funktion 1 und der Funktionswert einer Funktion an der Stelle 0 das Integral
über ihre Fouriertransformierte ist.
Der Weg, den Chaix et al. in [13] einschlugen, war, mit γC das Infimum der Energie
pro Einheitsvolumen abzuschätzen. Dabei sind kinetische- und Austauschenergie im
Einheitsvolumen formal gegeben durch
Z
d q Sp 4 |D 0 |(q) (γC )++ (q) − (γC )−− (q)
T (γC ) :=
3
bzw.
Z
γC (p) γC (q)
1
dq dp
WX (γC ) := 2
,
2π
|p − q|2
3
P
wobei AB := i,j aij bij für zwei Matrizen A und B der gleichen Dimension. Wegen
der Neutralität von γC verschwindet die Ladungsdichte punktweise, und somit auch
die direkte Energie. Wir motivieren diese Formeln nicht weiter, da sie durch Analogie
aus unseren exakten Berechnungen folgen werden.
Wir implementieren dieselbe Dichtematrix γC mittels einer glatten,
näherungsweise charakteristischen Abschneidefunktion χa,r im Ortsraum mit
Radius r im ganzen Raum R3 .
Für a → 0 nähert sich diese an die charakteristische Funktion Br der Kugel B(0, r)
an. Genauer wählen wir eine kugelsymmetrische Funktion h ∈ C0∞ (R3 , R) mit
supp h = B(0, 21 ), g := (ĥ/kĥk2 )2 und ga (x) := a−3 g(x/a) für a ∈ R+ . Dann gilt
||ga ||1 = 1 und ga ist nichtnegativ, da die Fouriertransformierte ĥ von h wegen der
Symmetrie reell ist. Schließlich definieren wir die Abschneidefunktion als
χa,r := Br ∗ gar .
Damit setzen wir unsere Ladungsdichtematrix gleich
γ := Rχa,r F χa,r R∗ ,
mit F := R∗ γC R .
Um wirklich eine Ladungsdichtematrix zu erhalten, muss γC natürlich einige Bedingungen erfüllen, auf die wir später eingehen werden. Wesentlich bei der Konstruktion von γ sind sowohl die genaue Form von χa,r , als auch die Platzierung der
36
Abschneidefunktion zwischen R und F . Letztere sorgt dafür, dass wir in Koordinaten abschneiden, in denen Elektronen und Positronen in die ersten bzw. letzten
beiden Spinkomponenten getrennt sind. Dadurch werden sie nicht vermischt und aus
−P− ≤ γC ≤ P+ folgt −P− ≤ γ ≤ P+ . Wir verwenden folgende Eigenschaften von
χa,r :
Lemma 3.2.
(1) Die Abschneidefunktion χa,r und damit auch ihre Fouriertransformation χ
d
a,r
sind kugelsymmetrisch, d.h. ihr Funktionswert hängt nur von dem Betrag des
Arguments ab.
(2) Für alle r > 0, 1 ≤ s < ∞ gilt 0 ≤ χa,r ≤ 1 und ||χa,r ||ss = r 3 ||χa,1 ||ss < ∞.
(3) Der Bruch Q := kχa,r k44 /kχa,r k22 ist kleiner oder gleich 1, unabhängig von r,
und sein Grenzwert für a → 0 ist 1.
(4) Im Impulsraum ist die Abschneidefunktion χa,r stetig, beschränkt und hat
−1
kompakten Träger, genauer gilt supp χ
d
a,r ⊂ B(0, %) mit % := (ar) .
Beweis.
1. Es gilt allgemein, dass Fouriertransformation und Faltung kugelsymmetrischer
Funktionen wieder kugelsymmetrisch sind.
2. Die Skalierung der Normen in r folgt durch Substitution, da χa,r (x) = χa,1 (x/r).
Die Werte von χa,r liegen zwischen 0 und 1, weil das Integral von ga über eine beliebige (messbare) Teilmenge von R3 zwischen diesen Zahlen liegt. Nach der Ungleichung von Young gilt schließlich für s ≥ 1
4
kB1 ∗ ga kss ≤ kB1 kss kga ks1 = π .
3
3. Es gilt Q ≤ 1 wegen kχa,r k44 ≤ kχa,r k22 und darüber hinaus gilt
r 3 kB1 ∗ ga k44
kχa,r k44
=
,
kχa,r k22
r 3 kB1 ∗ ga k22
was die Unabhängigkeit von r zeigt. Der Bruch konvergiert gegen 1, da ga gegen die
δ-Funktion strebt. Zum Beweis müssen wir nur zeigen, dass kB1 ∗ ga k44 → 4π/3 für
a → 0. Der Funktionswert von B1 ∗ ga an der Stelle x ist
Z
Z
B1 ∗ ga (x) =
g(x/a − y) d y =
g(y) d y
B(0,1/a)
B(x/a,1/a)
1
und da g eine nichtnegative L -Funktion ist, gibt es für jedes ε > 0 ein k ∈ N mit
Z
g(y) d y > 1 − ε .
B(0,k)
Für jedes l mit 0 < l < 1 existiert deshalb ein a mit B1 ∗ ga (x) > 1 − ε für alle x
mit |x| ≤ l. Es ist also kB1 ∗ ga k44 > (1 − ε)4 34 πl3 .
4. Die Fouriertransformation von χa,r ist
3/2 c
−1
−3/2
χ
d
Br gc
h∗h.
a,r = (2π)
ar mit ĝ = kĥĥk1 (2π)
cr das Integral einer, auf
Beide Funktionen sind stetig nach der Wahl von h, und da B
ihrem Träger gleichmäßig stetigen Funktion ist. Der Träger von gc
ar berechnet sich
37
mit supp ĝ ⊂ B(0, 1) und der elementaren Eigenschaft der Fouriertransformation
(3.3)
Z
Z
x
1
1
−ipx
e−iarpx g(x)dx = ĝ(arp)
e
g
gc
dx =
ar (p) =
(ar)3 (2π)3/2 3
ar
(2π)3/2
−1
zu supp gc
ar ⊂ B(0, (ar) ).
Wir bestimmen jetzt die Energie der Ladungsdichtematrix γ und vergleichen sie mit
der von γC .
Der Integralkern von γ im Impulsraum ist
Z
−3/2
(3.4)
γ(p, q) =
d ξ(2π)−3/2 χ
d
χ
d
a,r (p − ξ)M(ξ, p, q)(2π)
a,r (ξ − q) ,
3
wobei
M(ξ, p, q) := R(p)F (ξ)R∗ (q) .
Wir setzen nun zusätzlich voraus, dass F (ξ) beschränkt ist und kompakten Träger
in B(0, d) \ B(0, c) für c, d mit 0 ≤ c < d hat. Dann folgt aus der gleichmäßigen
Stetigkeit von χ
d
d
a,r die Stetigkeit von γ(p, q). Der Träger des Integranden χ
a,r (p −
ξ)M(ξ, p, q)d
χa,r (ξ − q) liegt in der kompakten Menge
D% := {(ξ, p, q) ∈ R9 |ξ|, |p|, |q| ∈ [c − 2%, d + 2%], |p − ξ| ≤ %, |q − ξ| ≤ %} ,
die wir mit Bedacht derartig wählen. Insbesondere hat auch der Integralkern γ(p, q)
kompakten Träger.
Um zu zeigen daß γ Spurklasse ist, betrachten wir den positiven Hilbert-SchmidtOperator B mit stetigem Integralkern
Z
∗
−3/2
B(p, q) :=
d ξ(2π)−3/2 χ
d
χ
d
a,r (p − ξ)R(p)|F (ξ)|R (q)(2π)
a,r (ξ − q) ,
3
der für alle u ∈ H folgende Ungleichung erfüllt:
∗
|(u, γu)| = |(2π)−3 (R∗ u) ∗ χ
d
d
a,r , F (R u) ∗ χ
a,r |
Damit gilt insbesondere
∗
≤ (2π)−3 (R∗ u) ∗ χ
d
d
a,r , |F |(R u) ∗ χ
a,r = (u, Bu) .
Sp |γ| ≤ Sp B ,
was sich durch Ausrechnen der Spur mit Hilfe der Eigenfunktionen von γ leicht
einsehen lässt. Nach Lemma 5.2 ist die Spur eines positiven Operators mit stetigem
Integralkern B(p, q) durch das Integral über die Diagonale B(p, p) gegeben,
Z
Sp B =
B(p, p) d p .
G
Unter unseren Voraussetzungen ist dieses Integral endlich und somit γ also Spurklasse und schließlich eine Ladungsdichtematrix.
Mit den Gleichungen
1 0
0 0
∗
∗
∗
R P+ =
R und R P− =
R∗
0 0
0 1
38
sehen wir, dass
1 0
1 0
M++ (ξ, p, q) := P+ R(p)F (ξ)R (q)P+ = R(p)
F (ξ)
R∗ (q)
0 0
0 0
∗
=: R(p)F++ (ξ)R∗ (q)
gilt, und somit der Integralkern von γ++ durch
Z
−3/2
γ++ (p, q) =
d
χ
d
d ξ(2π)−3/2 χ
a,r (p − ξ)M++ (ξ, p, q)(2π)
a,r (ξ − q)
3
gegeben ist. Analog definieren wir M−− und F−− .
Mit dem Ansatz (3.4) und Lemma 5.2 ergibt sich für die Teilchenzahl von γ der
endliche Ausdruck
N(γ) = Sp(γ++ − γ−− )
Z
−3
d q Sp
= (2π)
3
4
γ++ (q, q) − γ−− (q, q) ,
was sich auch in folgender Form schreiben lässt:
(3.5)
N(γ) = Sp χa,r (F++ − F−− )χa,r
Z
2
−3
d
d q d ξ Sp 4 F++ (ξ) − F−− (ξ) χ
= (2π)
a,r (q − ξ)
6
Z
−3
2
d ξ Sp 4 F++ (ξ) − F−− (ξ) .
= (2π) kd
χa,r k2
3
In gleicher Weise erhalten wir für die kinetische Energie
p
p
T (γ) = Sp |D 0|(γ++ − γ−− ) |D 0 |
Z
p
−3
d q q2 + m2 Sp 4 γ++ (q, q) − γ−− (q, q) ,
= (2π)
3
bzw.
(3.6)
T (γ) = Sp(p2 + m2 )1/4 χa,r (F++ − F−− )χa,r (p2 + m2 )1/4
Z
p
−3
2
= (2π)
d q d ξ q2 + m2 Sp 4 F++ (ξ) − F−− (ξ) χ
d
a,r (q − ξ) .
6
Da der Integralkern γ(p, q) im Impulsraum beschränkt ist und kompakten Träger
hat, ergibt sich mit Lemma 5.6 seine Austauschenergie zu
(3.7)
WX (γ) = k|x − y|−1/2 γ(x, y)k22
Z
1
d q d q0 d p|q − q0 |−2 γ(q0 + p, q0 ) γ(q + p, q)
= 2
2π
9
Z
1
1
=
d q d q0 d ξ d ξ 0 d p|q − q0 |−2 M(ξ 0 , p + q0 , q0 ) M(ξ, p + q, q)
6
2
(2π) 2π
15
0
0
·χ
d
χa,r (q0 − ξ 0 )d
χa,r (p + q − ξ)d
χa,r (q − ξ) .
a,r (p + q − ξ )d
39
Zwischen den beiden Dichtematrizen γC und γ gelten die Beziehungen
γC (q) = M(q, q, q) , (γC )++ (q) = M++ (q, q, q) , (γC )−− (q) = M−− (q, q, q)
und mit geeignetem γC bzw. F gilt elementweise M(ξ, p, q) − M(q, q, q) = O(%) für
% = (ar)−1 → 0 auf D% mit Ausnahme einer kleinen Teilmenge, deren Beitrag von
der Ordnung O(r 2 ) ist. Es folgt für r → ∞
Z
p
−3
2 3
T (γ) = (2π) kd
χa,1 k2 r
Sp 4 q2 + m F++ (q) − F−− (q) d q + O(r 2)
6
(3.8a)
−3
2 3
= (2π) kχa,1 k2 r T (γC ) + O(r 2)
und
WX (γ) =
(3.8b)
1
1
2 3
kd
χa,1 ∗ χ
d
a,1 k2 r
6
2
(2π) 2π
Z
·
|q − q0 |−2 M(q0 , q0 , q0 ) M(q, q, q) d q d q0 + O(r 2)
6
−3
= (2π) kχa,1 k44 r 3 WX (γC ) + O(r 2) .
Hat F (ξ) und damit M(ξ, p, q) bezüglich der 4 Spinkomponenten die Form
a b
(3.9)
,
b −a
so gilt dies auch für γ und die Ladungsdichte, und damit die direkte Energie, verschwindet nach elementarer Linearer Algebra: Ist fi = (gi , hi ) ∈ H eine Eigenfunktion von γ zum Eigenwert λi , so ist fi0 = (−hi , gi) eine Eigenfunktion zum Eigenwert
−λi . Die Ladungsdichte berechnet sich also zu
X
ργ (x) =
λi (|gi(x)|2 + |hi (x)|2 − |hi (x)|2 − |gi (x)|2 ) = 0 ,
i,λi >0
wobei wir g und h als Funktionen mit 2 Komponenten auf R3 aufgefasst haben.
Zum Schluss bemerken wir, dass einfachere Abschneidefunktionen wie zum
Beispiel eine charakteristische Funktion im Impulsraum auch die wesentlichen Eigenschaften besäßen. Aber jede Abschneidefunktion hat die Eigenschaft 0 ≤ χa,r ≤ 1,
also auch kχa,r k44 ≤ kχa,r k22 . Für unsere spezielle Wahl strebt dieses Verhältnis für
a → 0 gegen 1, liefert also wegen der Vorfaktoren in (3.8) die niedrigste mögliche
Energie in dritter Ordnung in r. Auch ist dadurch das Verhältnis der beiden Energien für a → 0 und r → ∞ das gleiche wie für die Energien von γC pro Einheitsvolumen. Es ist uns also gelungen, durch die Abschneidefunktion die Energie
pro Einheitsvolumen der translationsinvarianten Dichte im ganzen Raum mit einer
Ladungsdichtematrix zu reproduzieren.
Das Infimum der Energie für α > 4/π
Hier zeigen wir die Instabilität des Elektronen-Positronen-Felds ohne externes
Potential für α > 4/π. Der Beweis ist in Zusammenarbeit mit Hundertmark
und Siedentop entstanden und wurde in einer ähnlichen Fassung in der Zeitschrift
Communications in Mathematical Physics“ veröffentlicht [16].
”
40
Satz 3.3. Ist α > 4/π, so ist die Energie pro Teilchen in der Menge der HartreeFock-Zustände endlicher Energie DHF nach unten unbeschränkt.
E0,α (ρ)
inf
= −∞
ρ∈ HF N(ρ)
Wir unterteilen den Beweis der Übersichtlichkeit halber in 4 Schritte.
Definition der Ladungsdichtematrix
Jeder unitäre Operator T auf H̃+ ⊕ H̃− definiert ein angezogenes“ Vakuum mittels
”
der Projektion
∗ 0 0
P̃− := RT
T R∗ .
0 1
Wir benutzen den Rotationsoperator
cos η(p)
sin η(p)(σ · ω p )
T (p) :=
,
− sin η(p)(σ · ω p )
cos η(p)
dessen Winkel η(p) durch die reelle Funktion η : R3 → R von p abhängt. Im
Folgenden schreiben wir abkürzend s̃p für sin η(p) und c̃p für cos η(p).
Chaix et al. [13] benutzten die Dichtematrix
γC := P̃− − P− ,
um für die Instabilität in einem Einheitsvolumen zu argumentieren. Sie wussten aber
nicht, welcher Winkel zum optimalen Ergebnis 4/π ≈ 1, 27 führt, und konnten nur
die obere Schranke π/ ln 4 ≈ 2, 27 zeigen. Motiviert durch eine Arbeit von Evans,
Perry und Siedentop [20] definieren wir den Winkel als
(3.10)
η = ηλ,c,d : R3 → [0, π/2], λ, c, d ∈ R+ mit 2λ−1 ≤ c < d, λ ≤ 1 und
(
arcsin (|ξ|λ)−2 c ≤ |ξ| ≤ d
.
ηλ,c,d(ξ) =
0
sonst
Insbesondere gilt s̃ ≤ 1/4. Der tiefere Grund für diese Wahl ist, dass die Ungleichung von Kato, die in dem Stabilitätsbeweis des Elektronen-Positronen-Felds
(Satz 3.1) verwendet wird, für die Funktion |p|−2 I[c,d](p) mit c, d, d/c → ∞ scharf
ist. Ein Beweis hierfür basiert, wie auch unsere obere Schranke für die Energie der
Ladungsdichtematrix, auf Formel (3.19) und verwendet eine ähnliche Rechnung.
Der Operator F = R∗ γC R ist gegeben durch
s̃2p
−s̃p c̃p σ · ω p
0 0
0 0
∗
,
F (p) = T (p)
T (p) −
=
0 1
0 1
−s̃p c̃p σ · ω p
−s̃2p
und ist somit beschränkt und hat den kompakten Träger B(0, d) \ B(0, c). Folglich
liegt der Träger von χ
d
χa,r (ξ − q), des Integranden aus der Defa,r (p − ξ)M(ξ, p, q)d
inition des Integralkerns von γ (3.4), in der Menge
D% := {(ξ, p, q) ∈ R9 |ξ|, |p|, |q| ∈ [c − 2%, d + 2%], |p − ξ| ≤ %, |q − ξ| ≤ %} .
Wir setzen % ≤ %max := 1/3 voraus. Eigentlich benötigen wir nur, dass % beschränkt
ist, damit wir später Konstanten Ci unabhängig von % wählen können. Der Wert ist
(fast) willkürlich.
41
Wegen der Wahl von F können wir die Vorbemerkungen aus Abschnitt 3.2 anwenden und erhalten, dass γ eine Ladungsdichtematrix mit Teilchenzahl
(3.11)
−3 3
N(γ) = 4(2π) r
kχa,1 k22
Z
3
d ξ s̃ = 2π −2 r 3 kχa,1 k22 λ−4 (c−1 − d−1 )
ist.
Wir zeigen jetzt, dass die Differenz zwischen
M(ξ, p, q) und M(q, q, q), außer im
Komplement der Menge V := {(ξ, p, q) |ξ|, |q| ∈ [c, d]} ∩ D% , von Ordnung O(%) für
% → 0 ist. Dazu benötigen wir die Abschätzungen |σ · ωp − σ · ωq | = O(%), cp − cq =
O(%) und sp − sq = O(%) aus Lemma 3.6. Zusätzlich treten die beiden Differenzen
s̃q − s̃ und c̃q − c̃ auf. Hier kommt die Ausnahmemenge, das Komplement von V
in D% , ins Spiel. Mit der charakteristischen Funktion IV der Menge V zerlegen wir
beide Funktionen in
fs1 (ξ, p, q) : = (s̃q − s̃ )IV (ξ, p, q) , fs2 (ξ, p, q) : = (s̃q − s̃ ) 1 − IV (ξ, p, q) ,
fc1 (ξ, p, q) : = (c̃q − c̃ )IV (ξ, p, q) , fc2 (ξ, p, q) : = (c̃q − c̃ ) 1 − IV (ξ, p, q) .
Die Funktionen mit Träger in V , fs1 und fc1 , sind von Ordnung O(%). Zum Beweis
berechnen wir
λ2 (s̃q − s̃ ) = q−2 I[c,d] (|q|) − ξ−2 I[c,d](|ξ|)
=
(|ξ|I[c,d] (|q|) − |q|I[c,d](|ξ|))(|ξ|I[c,d](|q|) + |q|I[c,d](|ξ|))
.
q2 ξ 2
Sind nun |ξ|, |q| ∈ [c, d], was in V erfüllt ist, so gilt |ξ − q| = O(%). Da s̃ ≤ 1/4
erhalten wir dies auch für fc1 :
q
q
(s̃q − s̃ )(s̃q + s̃ )
2
q
c̃q − c̃ = 1 − s̃q − 1 − s̃2 = − p
2
1 − s̃q + 1 − s̃2
≤ −(s̃q − s̃ )(s̃q + s̃ ) = O(%).
42
Die Anwendung dieser Abschätzungen auf M ergibt eine Zerlegung von M(ξ, p, q)
in M(q, q, q) und zwei Fehlerterme. Die Matrix M(ξ, p, q) ist gleich
(3.12)
−s̃ c̃ σ · ω s̃2
cp
−sp σ · ω p
cq
sq σ · ω q
−s̃ c̃ σ · ω −s̃2
sp σ · ω p
cp
−sq σ · ω q
cq
2
s̃ (c c − sp sq σ · ω p σ · ω q ) + s̃ c̃ (cp sq σ · ω σ · ω q + sp cq σ · ω p σ · ω )
= 2 p q
s̃ (sp cq σ · ω p + cp sq σ · ω q ) + s̃ c̃ (sp sq σ · ω p σ · ω σ · ω q − cp cq σ · ω )
s̃2 (sp cq σ · ω p + cp sq σ · ω q ) + s̃ c̃ (sp sq σ · ω p σ · ω σ · ω q − cp cq σ · ω )
−s̃2 (cp cq − sp sq σ · ω p σ · ω q ) − s̃ c̃ (cp sq σ · ω σ · ω q + sp cq σ · ω p σ · ω )
2
2
2
2 2
2
2s̃
s
c
−
s̃
c̃
(c
−
s
)
σ
·
ω
s̃
(c
−
s
)
+
2s̃
c̃
s
c
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
= 2
2s̃q sq cq − s̃q c̃q (c2q − s2q ) σ · ω q
−s̃2q (c2q − s2q ) − 2s̃q c̃q sq cq
+ N1 (ξ, p, q) + N2 (ξ, p, q)
s̃q sin(η(q) + 2θq )
−s̃q cos(η(q) + 2θq )σ · ω q
=
−s̃q cos(η(q) + 2θq )σ · ω q
−s̃q sin(η(q) + 2θq )
+ N1 (ξ, p, q) + N2 (ξ, p, q)
= M(q, q, q) + N1 (ξ, p, q) + N2 (ξ, p, q) .
Alle Terme der Ordnung O(%) fassen wir in N1 zusammen und die restlichen, die fs2
oder fc2 enthalten, in N2 . Es folgt N1 = O(%) und supp N2 ⊆ D% \ V .
Die Energie der Ladungsdichtematrix
Die direkte Energie WP = 2D(ργ , ργ ) verschwindet, da unser F die Form (3.9) hat
und somit die Ladungsdichte ργ schon punktweise gleich 0 ist.
Die kinetische Energie (3.6) zerfällt nach (3.12) in 3 Terme. Der Beitrag von
M(q, q, q) ist
(2π)
−3
(3.13)
Z
p
2
q2 + m2 F++ (ξ) − F−− (ξ) χ
d
a,r (q − ξ)
Z
p
−3 3
2
d q q2 + m2 s̃2q .
= (2π) r kχa,1 k2 4
d q d ξ Sp
6
4
3
Die anderen zwei Beiträge sind von niedrigerer Ordnung in r. Wir definieren zu ihrer
Abschätzung die folgenden Konstanten:
C1 : = sup %−1
%≤%max
C2 : =
sup
sup
( ,q,q)∈D%
( ,q,q)∈D%max
{Sp
4
{Sp
4
p
q2 + m2 (N1 )++ (ξ, q, q) − (N1 )−− (ξ, q, q) } ,
p
q2 + m2 (N2 )++ (ξ, q, q) − (N2 )−− (ξ, q, q) } .
Beide sind unabhängig von % und endlich, da N1 und N2 keine Singularitäten haben
und N1 auf dem Definitionsbereich D% von Ordnung O(%) ist. Für den zweiten Term
43
der Zerlegung (3.12) erhalten wir unter Berücksichtigung von supp N1 (ξ, q, q) ⊆ D%
Z
p
2
2
2
(2π)−3
d
d q d ξ Sp 4 q + m (N1 )++ (ξ) − (N1 )−− (ξ) χ
a,r (q − ξ) 6
Z
−3
2
≤ (2π) %C1 c−2%≤|q|≤d+2% d q d ξ χ
d
a,r (q − ξ)
ξ∈
3
4
= (2π)−3 %C1 π (d + 2%)3 − (c − 2%)3 kχa,r k22
3
2
4
r
= (2π)−3 C1 π (d + 2%)3 − (c − 2%)3 kχa,1 k22 = O(r 2) .
a 3
Für alle (ξ, q, q) ∈ D% \ V sind die ξ eingeschränkt auf |ξ| ∈ [c − 2%, c + %] ∪ [d −
%, d + 2%], da entweder |ξ| oder |q| nicht in dem Intervall [c, d] liegen dürfen und ihr
Abstand voneinander kleiner als % ist. Damit kontrollieren wir den dritten Term
Z
p
−3
2
2 + m2 (N )
(2π)
d
q
d
ξ
Sp
q
(ξ)
−
(N
)
(ξ)
χ
d
(q
−
ξ)
4
2
++
2
−−
a,r
6
Z
2
≤ (2π)−3 C2 | |<c+% oder | |>d−% d q d ξ χ
d
a,r (q − ξ)
q∈
3
4
χa,1 k22 = O(r 2) .
= (2π)−3C2 π (c + %)3 − (c − 2%)3 + (d + 2%)3 − (d − %)3 r 3 kd
3
Wir verfahren ähnlich mit der Austauschenergie (3.7) und wählen die Zerlegung
(3.14)
M(ξ 0 , p0 , q0 )M(ξ, p, q) =: M(q0 , q0 , q0 ) M(q, q, q)
0
+Ñ1 (ξ, p, q, ξ0 , p0 , q0 ) + Ñ2 (ξ, p, q, ξ0 , p0 , q0 ) + Ñ2 (ξ, p, q, ξ0 , p0 , q0 ) ,
die alle Produkte mit N1 in Ñ1 , alle anderen mit N2 (ξ, p, q) in Ñ2 , und den Rest –
0
mit N2 (ξ 0 , p0 , q0 ) – in Ñ2 zusammenfasst. Es folgen die Eigenschaften N1 = O(%),
0
supp Ñ2 = (D% \ V ) × D% und supp Ñ2 = D% × (D% \ V ). Den wesentlichen Beitrag
liefert, wie durch die Notation angedeutet, der Term M(q0 , q0 , q0 )M(q, q, q). Unter
Verwendung von Lemma 3.7 erhalten wir
M(q0 , q0 , q0 ) M(q, q, q) =
4s̃q s̃q0 (sin(η(q) + 2θq ) sin(η(q0 ) + 2θq0 ) + cos(η(q) + 2θq ) cos(η(q0 ) + 2θq0 )ω q ω q0 )
und die zugehörige Energie ist nach Formel (3.7) gleich
Z
4
1
d q d q0 |q − q0 |−2 s̃q s̃q0
(3.15)
(2π)6 2π 2 6
· sin(η(q) + 2θq ) sin(η(q0 ) + 2θq0 ) + cos(η(q) + 2θq ) cos(η(q0 ) + 2θq0 )ω q ω 0q
Z
·
d ξ d ξ0 d pd
χa,r (p + q − ξ)d
χa,r (q − ξ)d
χa,r (p + q0 − ξ 0 )d
χa,r (q0 − ξ0 )
9
44
Z
8
2
=
kd
χa,r ∗ χ
d
d q d q0 |q − q0 |−2 s̃q s̃q0
a,r k2
(2π)8
6
· sin(η(q) + 2θq ) sin(η(q0 ) + 2θq0 ) + cos(η(q) + 2θq ) cos(η(q0 ) + 2θq0 )ω q ω 0q
Z
8 3
4
d q d q0 |q − q0 |−2 s̃q s̃q0
r kχa,1 k4
=
5
(2π)
6
· sin(η(q) + 2θq ) sin(η(q0 ) + 2θq0 ) + cos(η(q) + 2θq ) cos(η(q0 ) + 2θq0 )ω q ω 0q .
Der Definitionsbereich D% wurde inklusive des Randes von Breite 2% gewählt, damit
er den obigen Integranden vollständig enthält: Wegen der Definition des Winkels
(3.10) ist s̃q auf c ≤ |q| ≤ d beschränkt und es folgt c − % ≤ |ξ| ≤ d + % und
c − 2% ≤ |p| ≤ d + 2%. Analog zu der kinetischen Energie sind die anderen beiden
Terme von niedrigerer Ordnung in r. Wir definieren
C3 : = sup %−1
%≤%max
C4 : =
{Ñ1 (ξ, p + q, q, ξ 0 , p + q0 , q0 )},
sup
0
0
0
2
( ,p+q,q, ,p+q ,q )∈D%
sup
( ,p+q,q, 0 ,p+q0 ,q0 )∈D%2max
{Ñ2 (ξ, p + q, q, ξ0 , p + q0 , q0 )},
und schätzen damit die Austauschenergie der restlichen Terme der Zerlegung (3.14)
ab:
Z
2
0
0
0 −2
0
0
(2π)8 6 d q d q |q − q | Ñ1 (ξ, p + q, q, ξ , p + q , q )
Z
0
0
0 0
0
·
d ξ d ξ d pd
χa,r (p + q − ξ)d
χa,r (q − ξ)d
χa,r (p + q − ξ )d
χa,r (q − ξ )
9
Z
Z
2
2
≤
%C3 k χ
d
d
dq
d q0 |q − q0 |−2
a,r ∗ χ
a,r k2
(2π)8
0
|q|∈[c−2%,d+2%]
|q |∈[c−2%,d+2%]
= O(r 2)
und
Z
2
(3.16) d q d q0 |q − q0 |−2 Ñ2 (ξ, p + q, q, ξ 0 , p + q0 , q0 )
8
(2π)
6
Z
0
0
0 0
0
·
d ξ d ξ d pd
χa,r (p + q − ξ)d
χa,r (q − ξ)d
χa,r (p + q − ξ )d
χa,r (q − ξ )
9
Z
Z
2
2
≤
C4 k χ
d
d
dq
d q0 |q − q0 |−2
a,r ∗ χ
a,r k2
(2π)8
0
|q|<c+% oder |q|>d−%
|q |∈[c−2%,d+2%]
Z
Z
2
2
d
≤
C4 kχ
d
dq
d q0 |q0 |−2
a,r ∗ χ
a,r k2
(2π)8
|q|<c+% oder |q|>d−%
q 0 ∈B(0,2d+4%)
1
3
3
3
3
d
24
= 7 8 r 3 C4 kχ
d
a,1 ∗ χ
a,1 k2 π (c + %) − (c − 2%) + (d + 2%) − (d − %) 4π(2d + 4%)
2π
3
= O(r 2 ) .
0
Die Rechnung für Ñ2 führen wir nicht durch, da sie im Prinzip die gleiche ist.
45
Reduktion auf den masselosen Fall
Wir bezeichnen die Koeffizienten führender, also dritter, Ordnung in r der
Teilchenzahl, der Gesamt-, kinetischen und Austauschenergie als Funktionen der
Masse m und des Winkels ηλ,c,d mit N3 (ηλ,c,d ), (E0,α )3 (m, ηλ,c,d), T3 (m, ηλ,c,d) und
(WX )3 (m, ηλ,c,d). Wir untersuchen die Skalierung von (E0,α )3 (m, ηλ,c,d ) in m um das
Problem auf den masselosen Fall zu reduzieren.
Für die kinetische Energie (3.13) gilt mit einem λ ∈ (0, 1]
Z
p
−3
2
T3 (λm, η1,c,d ) = (2π) kχa,1 k2 4
d p p2 + λ2 m2 sin2 (η(p))
3
Z
p
d p p2 + m2 sin2 (η(λp))
= (2π)−3 kχa,1 k22 λ4 4
3
4
= λ T3 (m, ηλ,c/λ,d/λ ) ,
und ηλ,c/λ,d/λ erfüllt mit η1,c,d die Bedingungen der Definition des Winkels η (3.10).
Von der Austauschenergie müssen wir zuerst die Massenabhänigkeit der Winkelfunktionen untersuchen. Wir haben
sin(η(q) + 2θq ) = sin(η(q)) cos(2θq ) + cos(η(q)) sin(2θq ) ,
cos(η(q) + 2θq ) = cos(η(q)) cos(2θq ) − sin(η(q)) sin(2θq )
und
sin(2θq ) = |q|/E(q) ,
cos(2θq ) = m/E(q) .
Die Masse tritt also in folgender Form auf:
m2
,
E(q)E(q0 )
|q|m
,
E(q)E(q0 )
|q0 |m
,
E(q)E(q0 )
|q||q0|
.
E(q)E(q0 )
Alle diese Ausdrücke skalieren gleich in m, z.B.
λ2 m2
m2
p
p
p
.
=p
(q/λ)2 + m2 (q0 /λ)2 + m2
q2 + λ2 m2 (q0 )2 + λ2 m2
Genau wie für die kinetische Energie bekommen wir also auch hier
(WX )3 (λm, η1,c,d ) = λ4 (WX )3 (m, ηλ,c/λ,d/λ ) ,
und zusammen ergibt dies
(3.17)
(E0,α )3 (λm, η1,c,d ) = λ4 (E0,α )3 (m, ηλ,c/λ,d/λ ) .
Außerdem ist (E0,α )3 stetig bei m = 0, da sowohl die kinetische als auch die Austauschenergie von der Form
Z
f (m, x)g(x) d x
mit stetigem f (m, x) und einem g ∈ L1 von kompaktem Träger sind. Falls wir nun
ein Paar c, d und ein positives a0 mit (E0,α )3 (0, η1,c,d) < −a0 < 0 finden, dann gibt es
wegen der Stetigkeit ein m0 > 0 mit (E0,α)3 (m, η1,c,d) < −a0 für alle m < m0 . Also ist
mit beliebigem m ≥ 0 und λ < max{m0 /m, 1} nach (3.17) und der Formel für die
46
Teilchenzahl (3.11) die Energie pro Teilchen in führender Ordnung in r beschränkt
durch
(E0,α )3 (m, ηλ,c/λ,d/λ )
−λ−4 a0
≤ −2
N3 (ηλ,c/λ,d/λ )
2π kχa,1 k22 λ−4 λ(c−1 − d−1 )
(3.18)
=−
a0
.
2π −2 kχa,1 k22 λ(c−1 − d−1 )
Mit λ → 0 wird die Energie pro Teilchen beliebig negativ und damit bleibt
im masselosen Fall die Existenz eines Paares c und d mit zugehöriger Energie
(E0,α )3 (0, η1,c,d) < a0 < 0 zu zeigen.
Instabilität
Wir setzen jetzt m = 0 und den Winkel gleich η = η1,c,d . Es folgten θq = π/4,
s̃q = |q|−2 und die kinetische Energie (3.13) ist mit den Bezeichnungen τ := d/c,
p := |p| und q := |q| gleich
T3 = (2π)
−3
kd
χa,1 k22 4
Z
pdp
= 2π −2 kχa,1 k22
4
p∈[c,d] p
Z
d
c
dp
= 2π −2 kχa,1 k22 log τ .
p
Für die Austauschenergie (3.15) erhalten wir in Kugelkoordinaten und p anstatt von
q 0 den Ausdruck
8
kχa,1 k44
(WX )3 =
5
(2π)
Z dZ dZ
· 4π2π
c
c
p
p
du
−2
−4 p−2
q
1
−
q
1 − p−4 q 2 p2 d p d q
2 + p2 − 2qpu
q
−1
Z dZ dZ 1 udu
−4 −4 2 2
+4π2π
q p q p dpdq ,
q 2 + p2 − 2qpu
c
c
−1
1
wobei die u-Integrale Legendrefunktionen der zweiten Art sind:
Z
1
−1
Z
1
−1
du
1
=
2
2
q + p − 2qpu
2pq
udu
1
=
q 2 + p2 − 2qpu
2pq
Z
Z
1
−1
1
−1
1 p q
≥0,
+
2 q p
udu
1 p q
1
+
:= Q1
≥0.
q
1 p
pq
2 q p
+
−
u
2 q
p
1
du
:= Q0
p
q
1
pq
+ p −u
2 q
Da die Austauschenergie negativ in die Gesamtenergie eingeht, müssen wir sie nach
unten abschätzen.
Zuerst lassen wir den Q1 -Term weg, und verwenden die Ungle√
ichung 1 − z ≥ 1 − z (z ∈ [0, 1]). Im zweiten Schritt vernachlässigen wir (pq)−5
47
und schätzen p−4 + q −4 nach oben durch 2/c4 ab. Wir erhalten also
2
(WX )3 ≥ 3 kχa,1 k44
π
Z dZ d
1 p q
Q0
·
+
((pq)−1 − p−1 q −5 − q −1 p−5 + (pq)−5 ) d p d q
2 q p
c
c
Z dZ d
1 p q
2
2
4
Q0
≥ 3 kχa,1 k4 (1 − 4 )
(pq)−1 d p d q .
+
π
c
2
q
p
c
c
Für c, d, τ → ∞ gilt Formel 17 aus [20],
Z dZ d
π2
1 p q
+
log τ + O(1) ,
(3.19)
(pq)−1 =
Q0
2 q p
2
c
c
und damit bekommen wir das gewünschte Ergebnis
α
(E0,α )3 = T3 − (WX )3
2 log τ
α 1 π2
4
−2
2
kχa,1 k4 + C 4 + O(1)
≤ 2π log τ kχa,1 k2 −
2π 2
c
π
log τ
= 2π −2 log τ kχa,1 k22 − α kχa,1 k44 + C 4 + O(1) .
4
c
2
4
Ist α > (4/π)kχa,1 k2 /kχa,1 k4 , so finden wir ein Paar c, τ mit dem (Eα )3 (0, η1,c,d) <
−a0 für ein a0 > 0. Das Skalierungsargument (3.18) zeigt somit Instabilität für
beliebiges m > 0 und mit dem Lemma 3.2 gilt dies schließlich für jedes α > 4/π, da
a > 0 beliebig.
Das Infimum der Energie mit chemischem Potential
Das Energiefunktional mit chemischem Potential µmN(γ) ist im freien Fall (Z = 0)
auf der Menge X der Ladungsdichtematrizen endlicher Energie gegeben durch das
Funktional E µ0,α : X → R,
Z
|γ(x, y)|2
α
µ
.
dxdy
E 0,α (γ) = T (γ) − µmN(γ) + αD(ργ , ργ ) −
2
|x − y|
Wir setzen in diesem Abschnitt m 6= 0 voraus, da der Fall m = 0 nichts Neues bringt
und bemerken, dass ein chemisches Potential als Vielfaches der Teilchenzahl zwar
sicherlich das Infimum der Energie beeinflussen kann, aber an der Stabilität nichts
ändert. Wir werden folgenden Satz beweisen:
Satz 3.4. Für massive Elektronen und Positronen gelten die zwei Aussagen:
p
(1) Das Hartree-Fock-Vakuum ist ein Grundzustand für µ ≤
1 − (πα/4)2 .
Dieser ist eindeutig, falls µ kleiner als der ebengenannte kritische Wert ist.
In einer Formel ausgedrückt heißt dies
p
E µ0,α (ρ) ≥ 0 für µ ≤ 1 − (πα/4)2 und ρ ∈ DHF .
(2) Für µ ≥ 1 kann die Energie beliebig negative Werte annehmen:
inf
ρ∈
HF
E µ0,α (ρ) = −∞ .
48
Beweis. Die Einteilchenenergie, also die Energie, die ein einzelnes Teilchen besitzt,
ist in diesem Modell durch
p p
p
T (γ) − µmN(γ) = Sp γ ] ( p2 + m2 − µm) γ ]
p
mit γ ] := γ++ − γ−− gegeben. Für µ ≤ 1 lässt sich das wegen p2 + m2 − m ≥ 0
auch als
p
p
Sp( p2 + m2 − µm)1/2 γ ] ( p2 + m2 − µm)1/2
schreiben. Die Cauchy-Schwarz Ungleichung in zwei Dimensionen liefert die Ungleichung
p
(3.20)
p2 + m2 − µm ≥ d|p|
für µ, d ≥ 0 mit µ2 + d2 ≤ 1. Damit erhalten wir analog zum Stabilitätsbeweis für
das Elektronen-Positronen-Feld (vergleiche Abschnitt 3.1):
p
p
π
π
WX ≤ Sp γ|∇|γ ≤ d−1 Sp( p2 + m2 − µm)1/2 γ 2 ( p2 + m2 − µm)1/2
2
2
p
p
π
Sp( p2 + m2 − µm)1/2 γ ] ( p2 + m2 − µm)1/2 )
≤
2d
π
=
T (γ) − µmN(γ) ,
2d
wobei wir die definitionsgemäße Gleichheit von |∇| und |p| benutzt haben. Es gilt
also
π α
E µ0,α (γ) ≥ T (γ) − µmN(γ) 1 −
2d 2
und damit ist die Energie nichtnegativ, solange α ≤ 4d/π.
p Aus der Bedingung
2
2
µ +d ≤ 1 erhalten wir die oben angegebene Schranke µ ≤ 1 − (πα/4)2 . Ist µ echt
kleiner als dieser Wert, so ist das Hartree-Fock-Vakuum der einzige Grundzustand,
da T (γ) − µmN(γ) > 0 für µ ≤ 1 und γ 6= 0. Setzt man den physikalischen Wert der
Feinstrukturkonstante α = 1/137, gilt somit obige Abschätzung bis µ = 0, 999983.
Man kann also fast die gesamte Ruheenergie abziehen, ohne den Grundzustand zu
ändern.
49
Der Graph stellt die beiden Seiten der Ungleichung (3.20) für drei Werte von µ und
d gegenüber. Er illustriert, dass man für µ = 1 die Einteilchenenergie nicht mehr
durch
einen Bruchteil von |p| nach unten Abschätzen kann, weil die Ableitung von
p
2
p + m2 bei p = 0 verschwindet. Der Schwachpunkt liegt bei kleinen Impulsen
und das werden wir im Folgenden ausnutzen um eine Ladungsdichtematrix mit der
Methode von Abschnitt 3.2 zu konstruieren, deren Energie negativ ist.
Wir setzen
1 0
F (ξ) := f (ξ)
0 −1
mit einer beschränkten kugelsymmetrischen Funktion f von kompaktem Träger in
B(0, d) und können so wieder die Vorbemerkungen aus Abschnitt 3.2 verwenden.
In diesem Fall haben wir an die Abschneidefunktion keine so hohen Ansprüche und
vereinfachen den Beweis dadurch, dass wir ihren Betrag im Impulsraum verwenden.
Der Integralkern von γ ist mit (3.4) gegeben durch
Z
1 0
−3
γ(p, q) = (2π)
|d
χa,r (ξ − q)|R∗ (q) ,
d ξR(p)|d
χa,r (p − ξ)|f (ξ)
0 −1
3
und der Integrand hat seinen Träger in der Menge
D% := {(ξ, p, q) ∈ R9 |ξ|, |p|, |q| ∈ [0, d + 2%], |p − ξ| ≤ %, |q − ξ| ≤ %} .
Wir wollen nun zeigen, dass das Verhältnis von kinetischer zu Austauschenergie
für r → ∞ gegen 0 strebt. Also müssen wir die kinetische Energie von oben und die
Austauschenergie von unten abschätzen. Für das gewünschte Resultat genügt es, für
f die charakteristische Funktion I[0,d] (| · |) der Kugel B(0, d) zu wählen.
Wir beginnen mit der Austauschenergie WX (3.7) und weichen von unserer Notation ab, indem wir M(ξ, p, q) in I[0,d] (|ξ|)M(p, q) zerlegen, wobei M(p, q) das
Produkt der Matrizen bezeichnet:
1 0
M(p, q) : = R(p)
R∗ (q)
0 −1
cp
sp σ · ω p
cq
sq σ · ω q
=
sp σ · ω p
−cp
−sq σ · ω q
cq
cp cq − sp sq σ · ω p σ · ω q cp sq σ · ω q + cq sp σ · ω p
=
.
cp sq σ · ω q + cq sp σ · ω p −cp cq + sp sq σ · ω p σ · ω q
Wie man aus der Formel (2.22) für die Austauschenergie im Ortsraum leicht
sieht, sind die Beiträge jedes Terms des elementweisen Produkts “ nichtnegativ
”
(die Komponenten der Matrizen entsprechen den Spinzuständen). Es genügt deshalb
sich im Folgenden auf die diagonalen Einträge zu beschränken.
Das “ Produkt der Diagonalelemente von M(p0 , q0 ) und M(p, q) ist mit
”
Lemma 3.7 das Vierfache des Ausdrucks
cp0 cq0 cp cq + sp0 sq0 sp sq [(ω p0 ω q0 )(ω p ω q ) + (ω p0 × ω q0 )(ω p × ω q )]
− cp cq sp0 sq0 (ω p0 ω q0 ) − cp0 cq0 sp sq (ω p ω q )
= cp cq −sp sq (ω p ω q ) cp0 cq0 −sp0 sq0 (ω p0 ω q0 ) +(ωp0 ×ω q0 )(ω p ×ω q )sp0 sq0 sp sq .
50
Lemma 3.8 im√
Anhang zeigt, dass dies größer oder gleich m2 E(d + 2%)−2 + O(%) ist,
wobei E(d) = d2 + m2 der relativistischen kinetischen Energie eines Teilchens mit
Impuls d entspricht.
Wir erhalten als untere Schranke der Austauschenergie WX
Z
1
4m2
1
0
0
0 −2
d q d q d ξ d ξ d p|q − q |
+ O(%) I[0,d] (|ξ|)I[0,d] (|ξ0 |)
(2π)6 2π 2 15
E(d + 2%)2
· |d
χa,r (p + q0 − ξ 0 )d
χa,r (q0 − ξ 0 )d
χa,r (p + q − ξ)d
χa,r (q − ξ)| ,
und es gilt
I[0,d] (|ξ|)I[0,d] (|ξ0 |) − I[0,d] (|q|)I[0,d] (|q0 |) = 0
außer unter einer der beiden Bedingungen |q|, |ξ| ∈ [d − %, d + %] bzw. |q0 |, |ξ0 | ∈
[d − %, d + %]. Denn wenn die Gleichung nicht erfüllt ist, folgt o.E. |ξ| ∈ [0, d] und
|q| > d und die Bedingung ergibt sich aus der Beschränkung des Abstands der
beiden Variablen auf %.
Es ist aber ähnlich wie in (3.16) der Betrag des Integrals dieser Menge beschränkt
durch das (m2 E(d + 2%)−2 + O(%))-fache des Ausdrucks
Z
Z
1
0
dqdq
d p d ξ d ξ0
0 |2
d−%≤|q|≤d+%
|q
−
q
9
3
0
|q |∈
· |d
χa,r (p + q − ξ)d
χa,r (q − ξ)d
χa,r (p + q0 − ξ 0 )d
χa,r (q0 − ξ 0 )|
Z
Z
2
d
≤ kχ
d
dq
d q0 |q0 |−2
a,r ∗ χ
a,r k2
d−%≤|q|≤d%
|q0 |≤2d+2%
24
3
3
2
d
= r 3 kχ
d
a,1 ∗ χ
a,1 k2 π (d + %) − (d − %) 4π(2d + 2%) = O(r ) .
3
Damit gilt für die Komponente in dritter Ordnung von r der Austauschenergie
Z
2
1 1
4m2
1
(WX )3 ≥
kχ
d
d
d q d q0
a,r ∗ χ
a,r k2
6
2
2
2
(2π) 2π
(d + 2%) + m 0≤|q0 |,|q|≤d
|q − q0 |2
2
m2 d4
8 =
k
χ
d
∗
χ
d
k
,
a,1
a,1 2
(2π)3
(d + 2%)2 + m2
da der Wert des Integrals 4π 2 d4 ist. Die Einteilchenenergie ist analog zu (3.6) einfacher zu bestimmen:
Z p
4
( p2 + m2 − m)I[0,d] (|ξ|)d
χa,r 2 (p − ξ) d ξ d p
3
(2π)
6
Z
p
4
2
=
I
(|p|)(
p2 + m2 − m) d p + O(r 2)
kχ
k
a,r
[0,d]
2
(2π)3
3
5
4
2 4πd
≤
kχ
k
+ O(r 2 )
a,r 2
(2π)3
10m
5
1 3
2d
= 2 r kχa,1 k2 + O(r 2) ,
5π
m
wobei die erste Abschätzung analog zu oben benutzt, dass I[0,d] (ξ) − I[0,d] (p) = 0
außer im Falle |p|, |ξ| ∈ [d − %, d + %] und das Integral einer beschränkten Funktion
51
über diese Menge gleichp
O(r 2) ist. Die letzte Abschätzung beruht auf der elementaren
Ungleichung p2 /2m ≥ p2 + m2 − m.
Die dritte Komponente der Energie ist also mit geeigneten Konstanten c1 und c2
nach oben durch
(3.21)
E µ0,α (γ) 3 ≤ c1 d5 − c2 d4
beschränkt. Es gibt also ein d0 , so dass die Komponente für alle d < d0 negativ ist.
Wählt man nun r genügend groß, ist die Energie der Ladungsdichtematrix negativ,
und für r → ∞ strebt diese gegen −∞.
Eine andere Möglichkeit, die Ladungsdichtematrix zu wählen, wäre mit f := I[c,d]
statt f = √
I[0,d] . Dafür ist der schwierigere Teil des Beweises von Lemma 3.8 für den
Fall b ≤ 2 2m nicht nötig, aber die beiden Grenzen bringen mehr Schreibarbeit in
den anderen Abschätzungen. Wollte man jedoch ausrechnen, wie negativ die Energie
pro Teilchen werden kann, würde das, wegen der 2 Freiheitsgrade, die bessere Wahl
darstellen.
Folgerungen für die Energie ohne chemisches Potential
Satz 3.5.
(1) Für die Energie der Hartree-Fock Zustände aus DHF gilt
p
E0,α (ρ) ≥ 1 − (πα/4)2 mN(ρ) .
(2) Das Infimum der Energie über die Hartree-Fock-Zustände endlicher Energie
und Teilchenzahl N befindet sich für m > 0 in folgendem Intervall:
hp
E0,α (ρ) ∈
inf
1 − (πα/4)2mN, mN .
ρ∈
HF ,N (ρ)=N
Im masselosen Fall ist das Infimum Null.
Beweis. Die erste Aussage folgt sofort aus Satz 3.4 des vorherigen Abschnitts und
für die zweite bestimmen wir die Teilchenzahl (3.6) des Zustands aus jenem Beweis:
N(γ) = Sp χa,r (F++ − F−− )χa,r
Z
4
=
I[0,d] (|ξ|)χ2a,r (ξ − q) d q d ξ
(2π)3 6
2
4
4
=
kχa,1 k22 r 3 πd3 = 2 kχa,1 k22 r 3 d3 .
3
(2π)
3
3π
Für jede beliebige Teilchenzahl N gewinnt man also durch Wahl von
(3.22)
d = N(
2
kχa,1 k22 )−1/3 r −1
3π 2
eine Ladungsdichtematrix der Teilchenzahl N.
52
Wir beginnen mit dem masselosen Fall und wählen d nach (3.22) proportional zu
r . Die kinetische Energie T (γ) ist dann proportional zu
−1
Z
Z
1
|q|I[0,r−1 ] (|ξ|)d
χa,r (q − ξ) d q d ξ = 3 |q|d
χa,r 2 (q − ξ/r) d q d ξ
|≤1
|
r
6
|q|∈
Z
Z
1
1
2
= 7 |q|d
χa,r (q/r − ξ/r) d q d ξ =
|q|d
χa,1 2 (q − ξ) d q d ξ .
r | |≤1
r | |≤1
2
|q|∈
|q|∈
3/2 c
3c
c
Beim letzten Schritt benutzen wir χ
d
Br gc
a,r = (2π)
ar , Br (p) = r B1 (rp) und
gbr (p) = gb1 (rp) (vergleiche Lemma 3.2 und (3.3)). Für r → ∞ konvergiert somit die
kinetische Energie bei gleich bleibender Teilchenzahl gegen 0. Da für die Gesamtenergie T (γ) − αWX /2 ≥ 0 bei nichtnegativem WX gilt, ist also auch ihr Infimum
gleich 0. Zusätzlich bemerken wir, dass für α < 4/π das Hartree-Fock-Vakuum der
einzige Zustand verschwindender Energie ist, und es somit im masselosen Fall bei
fester Teilchenzahl keinen Grundzustand gibt.
Im massiven Fall betrachten wir analog die Skalierung der kinetischen und der
Austauschenergie. Wegen d ∼ r −1 gilt E(d + 2%) ≤ 3m für große r und somit ist
nach Lemma 3.8 die Austauschenergie größer oder gleich
Z
1
1
4m2
0
0
0 −2
I[0,d] (|ξ|)I[0,d] (|ξ0 |)
d
q
d
q
d
ξ
d
ξ
d
p|q
−
q
|
(2π)6 2π 2 15
E(d + 2%)2
· |d
χa,r (p + q0 − ξ 0 )d
χa,r (q0 − ξ0 )d
χa,r (p + q − ξ)d
χa,r (q − ξ)| .
Unter obiger Voraussetzung ist der Term aus dem Lemma beschränkt
4
4m2
4m2
≤
=
≤4
9
E(d + 2%)2
(d + 2%)2 + m2
und spielt bei der Skalierung keine Rolle. Bei der Substitution aller Variablen q →
q/r erhalten wir von der Integration den Faktor r −15 und von |q − q0 |−2 den Faktor
12
−1
r 2 . Die Skalierung von χ
d
a,r liefert r . Insgesamt also r .
Die kinetische Energie ist
Z p
4
( p2 + m2 − m)I[0,d] (|ξ|)d
χa,r 2 (p − ξ) d ξ d p
3
(2π)
6
Z
p2
4
≤
I[0,d] (|ξ|)d
χa,r 2 (p − ξ) d ξ d p .
(2π)3 6 2m
In der gleichen Reihenfolge wie oben erhalten wir die Faktoren r −6 , r −2 und r 6 ;
insgesamt r −2 .
Es folgt
E µ0,α (γ) = E 0,α (γ) − µmN(γ) ≤ c1 r −2 − c2 r −1
und somit existiert für große r eine Ladungsdichtematrix der Teilchenzahl N, deren
Energie unter der Ruheenergie der Teilchen Nm liegt.
53
Hilfssätze
Lemma 3.6. Sei c > 0, |p−q| ≤ 2% und |p|, |q| ≥ c. Dann gelten die Abschätzungen
(1) |σ · ωp − σ · ωq | = O(%),
(2) cp − cq = O(%) und sp − sq = O(%),
elementweise für % → 0. Für den Winkel β zwischen p und q gilt sin β = O(%) und
cos β = 1 + O(%).
Beweis.
1. Der Betrag jedes Elements von σ · p ist sicherlich kleiner gleich |p|. Es genügt
daher, |ω p −ω q | = O(%) zu zeigen. Dazu bezeichnen wir den Winkel ∠(p, q) zwischen
p und q mit β, und stellen folgende elementare geometrische Fakten zusammen:
• 2% ≥ |p − q| ≥ min{|p|, |q|} sin β,
• |ω p − ω q | = 2 sin(β/2),
• sin(β/2) ≤ sin β falls β ≤ 2π/3.
Für β ≤ 2π/3 ist also |ω p − ω q | ≤ 4%/c = O(%). Der größte Winkel β tritt auf, wenn
|p|, |q| = c und |p − q| = 2%. Dies bedeutet sin(β/2) = %/c und garantiert, dass die
der Winkel β für kleine % kleiner als 2π/3 ist. Insbesondere gilt also sin β = O(%)
und damit auch cos β = 1 + O(%).
2. Die Aussage ist richtig für m = 0, da in diesem Fall cp und sp konstante
Funktionen sind. Für m 6= 0 zeigen die Richtigkeit folgende Rechnungen:
q
q
√
2
−1/2
2(cmp − cmq ) = 1 + (1 + p )
− 1 + (1 + q2 )−1/2
(1 + q2 )1/2 − (1 + p2 )1/2
p
p
(1 + q2 )1/2 (1 + p2 )1/2
1 + (1 + p2 )−1/2 + 1 + (1 + q2 )−1/2
−1
(q − p)(q + p) (1 + q2 )1/2 + (1 + p2 )1/2
p
= O(%) ,
=
p
2
1/2
2
1/2
2
−1/2
2
−1/2
(1 + q ) (1 + p )
1 + (1 + p )
+ 1 + (1 + q )
=
√
1 + (1 + p2 )−1/2 − 1 − (1 + q2 )−1/2
p
=p
1 + (1 + p2 )−1/2 + 1 + (1 + q2 )−1/2
2(smp − smq ) =
q
1 − (1 +
p2 )−1/2
−
q
1 − (1 + q2 )−1/2
−1
−(q − p)(q + p) (1 + q2 )1/2 + (1 + p2 )1/2
p
=
p
2
1/2
2
1/2
2
−1/2
2
−1/2
(1 + q ) (1 + p )
1 − (1 + p )
+ 1 − (1 + q )
q
−1
2 1/2
2 1/2 −1
2 1 − (1 + r 2 )−1/2
≤ −(q−p)(q+p) (1 + q ) + (1 + p )
= O(%) .
Lemma 3.7. Für das σ · p“-Produkt eines Vektors mit den Paulimatrizen gelten
”
folgende Regeln:
(1) (σ · p)(σ · q) = pqI2 + iσ · (p × q),
54
(2) σ · p σ · q = 2pq,
(3) σ · p I2 = Sp σ · p = 0,
(4) [(σ · p)(σ · q)] [(σ · p0 )(σ · q0 )] = 2 [(pq)(p0 q0 ) + (p × q)(p0 × q0 )]. Falls
die Beträge |p|, |q|, |p0|, |q0| ≤ 1, so ist der Betrag obigen Ausdrucks kleiner
oder gleich 2.
Beweis. Wir wiederholen die Paulimatrizen
1 0
0 −i
0 1
(3.23)
;
, σ3 =
, σ2 =
σ1 =
0 −1
i 0
1 0
die Aussagen folgen leicht aus ihren grundlegenden Eigenschaften:
σi2 = I2 ,
wobei
σi σj = −σj σi für i 6= j ,
σi σj = iεijk σk ,


ijk gerade Permutation von 123
1
ijk
ε = −1 ijk ungerade Permutation von 123

0
sonst
der total antisymmetrische Tensor ist. Die erste Regel ist eine unmittelbare Konsequenz hieraus. Für die zweite Aussage benutzt man die Repräsentation (3.23):
σ · p σ · q = (p1 σ1 − p2 σ2 + p3 σ3 ) σ · q =
(p1 + ip2 )(q1 − iq2 ) + (p1 − ip2 )(q1 + iq2 ) + 2p3 q3 = 2pq .
Die dritte ist unmittelbar einsichtig und um die letzte zu zeigen, verwenden wir alle
vorangegangenen Formeln:
[(σ · p)(σ · q)] [(σ · p0 )(σ · q0 )]
= pqI2 − iσ · (p × q) p0 q0 I2 + iσ · (p0 × q0 )
= 2 [(pq)(p0 q0 ) + (p × q)(p0 × q0 )] .
Die Behauptung für die Beträge beweisen wir durch Bestimmung der Extremalwerte
von
f (ϑ, ϑ0 ) = cos ϑ cos ϑ0 + d sin ϑ sin ϑ0 ,
mit ϑ = ∠(p, q), ϑ0 = ∠(p0 , q0 ) und |d| ≤ 1. Dazu berechnen wir die erste Ableitung
von f in ϑ:
∂f (ϑ, ϑ0 )
= − sin ϑ cos ϑ0 + d cos ϑ sin ϑ0 .
∂ϑ
Die Nullstellen sind, neben den Nullstellen der Winkelfunktionen, für die |f | ≤ 1
leicht ersichtlich ist, gegeben durch die Bedingung
tan ϑ = d tan ϑ0 .
Setzt man diese in f ein, so erhält man für die Extremalwerte fext (ϑ0 ) von f die
Gleichung
cos ϑfext (ϑ0 )
= cos2 ϑ + sin2 ϑ .
cos ϑ0
Es folgt
cos ϑ0
, und wegen cos ϑ = ±(1 + tan2 ϑ)−1/2 = ±(1 + d2 tan2 ϑ0 )−1/2 ,
fext (ϑ0 ) =
cos ϑ
55
und wegen |d| ≤ 1 gilt
|fext (ϑ0 )| =
p
d2 sin2 ϑ0 + cos2 ϑ0 ≤ 1 .
Da f eine beschränkte periodische Funktion ist, durchläuft fext in jedem Fall sowohl
das globale Maximum als auch das globale Minimum.
Lemma 3.8. Sei√b := max{|p|, |q|, |p0|, |q0 |}, |p − q| ≤ 2% und |p0 − q0 | ≤ 2%. Dann
gilt mit E(b) := b2 + m2
(3.24)
cp cq − sp sq (ω p ω q ) cp0 cq0 − sp0 sq0 (ω p0 ω q0 ) + (ω p0 × ω q0 )(ω p × ω q )sp0 sq0 sp sq
≥ m2 E(b)−2 + O(%)
√
für % → 0. Ist b ≤ 2 2m, so gilt obige Ungleichung auch ohne den O(%)-Term.
√
Beweis. Wir betrachten zuerst den Fall b > 2 2m (Für diesen√Schritt benötigen wir
nur, dass
√ b größer als eine Konstante ist). Hier ist o.E. |p| ≥ 2 2m und folglich auch
|q| ≥ 2 2m − 2%. Nach Lemma 3.6 gilt cos ∠(p, q) = 1 + O(%) und sin ∠(p, q) =
O(%). Deshalb schreibt sich (3.24) bis auf einen Term der Ordnung O(%) als
(cp cq − sp sq ) cp0 cq0 − sp0 sq0 (ω p0 ω q0 ) ,
und wegen cp ≥ sp ≥ 0 ist dies ist offensichtlich größer oder gleich
(3.25)
(cp cq − sp sq )(cp0 cq0 − sp0 sq0 ) .
Da cp monoton fallend und sp monoton steigend sind, haben wir die Ungleichungen
(3.26a)
(3.26b)
cp :=
sp :=
E(p) + m
2E(p)
E(p) − m
2E(p)
1/2
1/2
≥
≤
E(b) + m
2E(b)
E(b) − m
2E(b)
1/2
1/2
und
.
Damit ist (3.25) durch
2
1 m2
E(b)
+
m
−
E(b)
−
m
=
4E(b)2
E(b)2
nach unten beschränkt.
√
Im anderen Fall garantiert die Bedingung b ≤ 2 2m, dass E(b) ≤ 3m ist. Hier
parametrisieren wir (3.24) mit den Winkeln ϑ := ∠(p, q), ϑ0 := ∠(p0 , q0 ) und d mit
|d| ≤ 1:
(3.27)
(cp cq − sp sq cos ϑ)(cp0 cq0 − sp0 sq0 cos ϑ0 ) + d sin ϑ sin ϑ0 sp0 sq0 sp sq .
Die kleinsten Werte werden wegen cp ≥ sp offensichtlich für 0 ≤ ϑ, ϑ0 ≤ π/2 und
d = −1 angenommen. Die Abschätzungen (3.26) geben somit eine untere Schranke
56
für (3.27):
4E(b)2
(3.28)
−1 E(b) + m − cos ϑ(E(b) − m) E(b) + m − cos ϑ0 (E(b) − m)
2 − sin ϑ sin ϑ0 E(b) − m
2
−1 = 4E(b)2
E(b) + m − E(b)2 − m2 (cos ϑ + cos ϑ0 )
2
+ E(b) − m (cos ϑ cos ϑ0 − sin ϑ sin ϑ0 ) .
Hier müssen wir die Funktion f mit
f (ϑ, ϑ0 ) := − cos ϑ − cos ϑ0 + e cos(ϑ + ϑ0 )
und e := E(b) − m / E(b) + m minimieren. Wegen der Bedingung E(b) ≤ 3m gilt
0 ≤ e ≤ 1/2. Die beiden Ableitungen von f sind
∂f (ϑ, ϑ0 )
∂f (ϑ, ϑ0 )
= sin ϑ − e sin(ϑ + ϑ0 ) und
= sin ϑ0 − e sin(ϑ + ϑ0 ) .
0
∂ϑ
∂ϑ
Für die Extremalwerte folgt hieraus sin ϑ0 = sin ϑ, und da beide Winkel aus dem Intervall [0, π/2] sind, gilt schließlich ϑ0 = ϑ. Es genügt also den einfacheren Ausdruck
g(ϑ) = −2 cos ϑ + e cos 2ϑ = −2 cos ϑ + e(cos2 ϑ − sin2 ϑ)
zu minimieren. Seine Ableitung ist
∂g(ϑ)
= 2 sin ϑ − 4e sin ϑ cos ϑ ,
∂ϑ
also hat g Extremalwerte für sin ϑ = 0 und cos ϑ = (2e)−1 . Die erste Bedingung
impliziert ϑ = 0 oder ϑ = π, die zweite wegen 0 ≤ e ≤ 1/2 bestenfalls ϑ = 0. Davon
liegt aber nur ϑ = 0 in unserem Intervall [0, π/2], und die Randwerte von g sind
−2 + e bzw. −e. Es gilt also f ≥ −2 + e, und folglich lässt sich der Ausdruck (3.28)
auch in diesem Fall durch
−1
m2
4E(b)2
(E(b) + m)2 − 2(E(b)2 − m2 ) + (E(b) − m)2 =
E(b)2
nach unten abschätzen.
57
Stabilität von Atomen
Von Bach et al. wurde bereits im ersten Artikel über dieses Modell [4] die Stabilität von Atomen der Kernladungszahl Z ≤ 68 (Erbium) gezeigt. Wir ersetzen
die Dreiecksungleichung in ihrem Beweis durch ein exaktes Argument und erhalten so im physikalischen Fall Stabilität bis Z = 117, was alle bekannten Elemente
einschließt.
Der Beweis entstand in Zusammenarbeit mit Brummelhuis und Siedentop [11]
und wurde bei der Zeitschrift Documenta Mathematica“ zur Veröffentlichung ein”
gereicht.
Wir folgen Bach et al., indem wir auf den Stabilitätsbeweis für das ElektronenPositronen-Feld (Abschnitt 3.1) aufbauen. In diesem wird die Austauschenergie mit
der Ungleichung von Kato durch die kinetische Energie abgeschätzt (3.1):
π
WX ≤ Sp γ|∇|γ .
2
Mit einer Ungleichung der Form
(4.1)
|D Z | ≥ d|∇|
kann man die erste Ungleichung fortführen und dann WX analog zu (3.2) durch die
Einteilchenenergie abschätzen:
p
p
π
π
π
WX ≤ Sp γ|∇|γ ≤ d−1 Sp γ|D Z |γ ≤ d−1 Sp |D Z |(γ++ − γ−− ) |D Z | .
2
2
2
Wir erhalten
π α
EZ,α(γ) ≥ T (γ) 1 −
,
2d 2
also Stabilität für α ≤ 4d/π und mit g := Zα ist die Konstante d der Ungleichung
(4.1) gegeben durch
p
1 p
d = 1 − g 2 ( 4g 2 + 9 − 4g) .
3
Im Fall α = 1/137 benötigen wir für Stabilität d ≥ απ/4 = π/548, was mit obiger
Gleichung numerisch einem Wert von g ≤ 0, 85498 und somit Z ≤ 117.13 liefert.
Wir beweisen Ungleichung (4.1) mit der Konstante d in folgendem Abschnitt. Aus
Gründen der Übersichtlichkeit benutzen wir eine weitere Notation für den Diracoperator mit Coulombpotential,
g
.
Dg,m := −iα · ∇ + mβ +
|x|
Eine Ungleichung für Diracoperatoren
√
Lemma 4.1. Sei g ∈ [0, 3/2], m ≥ 0 und
(
p
1
(
4g 2 + 9 − 4g) m = 0
3 p
.
d= p
1 − g 2 31 ( 4g 2 + 9 − 4g) m > 0
Dann gilt die Ungleichung
(4.2)
|Dg,m | ≥ d|D0,0 | = d|∇| .
58
Der folgende Graph gibt einen Überblick der Abhängigkeit von d von der Kopplungskonstante g.
Den Operator |Dg,0 | kann man nicht explizit hinschreiben und so beweisen wir
wie in [4] die stärkere Ungleichung
2
2
Dg,0
≥ d2 D0,0
(4.3)
√
für g < 3/2. Da die Definitionsbereiche der beiden Operatoren unter der Einschränkung an g identisch sind, folgt die behauptete Ungleichung (4.2) mit [24,
Satz 3]. Wir werden zwar die scharfe Konstante d2 für (4.3) zeigen, aber wegen
des Quadrierens ist nicht zu erwarten, dass d auch die scharfe Konstante für die
Ungleichung (4.2) des Lemmas ist. In [4] wurde an dieser Stelle die Dreiecksungleichung angewandt; wir werden die Streckungshomogenität des masselosen CoulombDiracoperators ausnutzen um das Problem auf eine Ungleichung von Multiplikationsoperatoren zu reduzieren.
Wie bereits bei√der Einführung des Diracoperators mit Coulombpotential erwähnt,
ist Dg,m für g ≤ 3/2 wesentlich selbstadjungiert auf D := C0∞ (R3 \ {0}) ⊗ C4 und
somit impliziert
kDg,0 f k22 − d2 kD0,0 f k22 ≥ 0
für alle f ∈ D schon die Ungleichung (4.3).
Er ist auf auf D unitär äquivalent zu seiner Drehimpulszerlegung
mit
∞
M
j
M
j= 21 , 23 ,...
mj =−j
hg,m,κ :=
M
hg,m,κj
κj =±(j+ 12 )
m − gr − ddr + κr
d
+ κr −m − gr
dr
,
definiert auf C0∞ (0, ∞) ⊗ C2 ⊆ L2 (0, ∞) ⊗ C2 [41, Satz 4.14]. Dabei sind j(j + 1),
mj und −κj die Eigenwerte der Drehimpulsoperatoren J 2 , J3 bzw. des Spin-BahnOperators K.
Wir verwenden nun die Mellintransformation. Sie ist für Streckungen, was
die Fouriertransformation für Verschiebungen ist: Operatoren, die homogen unter
59
Streckungen sind, werden zu Multiplikationsoperatoren. Der Operator hg,0,κ ist jedoch homogen vom Grad −1 unter Streckungen und wird auf glatten Funktionen
mit kompaktem Träger zu einer Multiplikation der um die Imaginäre Einheit verschobenen Funktion.
Die unitäre Mellintransformation M : L2 (0, ∞) → L2 (R), f 7→ Mf ist definiert
durch
Z ∞
1
r −1/2−is f (r) d r .
Mf (s) = √
2π 0
Sie ist unitär und wohldefiniert, da sie aus der Fouriertransformation und der
unitären Abbildung
ι:
L2 (0, ∞)
−→
L2 (−∞, ∞)
f : r 7→ f (r) 7→ h : z 7→ ez/2 f (ez )
zusammengesetzt ist, wie man leicht durch Substitution mit r = ez sieht:
Z ∞
Z ∞
1
1
−isz z/2
z
√
e e f (e ) d z = √
r −1/2−is f (r) d r .
2π 0
2π 0
Wir aber werden die Mellintransformation als Abbildung der glatten Funktionen
mit kompaktem Träger in die holomorphen Funktionen auf ganz C betrachten,
MH : C0∞ (0, ∞) → H(C). Die Transformierte ist trivialerweise auf ganz C definiert
und holomorph, da Differentiation und Integration vertauschen. Ähnlich wie bei der
Fouriertransformation gelten folgende Regeln:
M (r a f ) (s) = Mf (s + ia) ,
1
d
f (s) = (is + )Mf (s − i) .
M
dr
2
Wir beweisen die zweite durch partielle Integration, wobei wegen des kompakten
Trägers von f die Limiten von r −1/2−is f (r) für r → 0 und r → ∞ verschwinden:
Z ∞
Z ∞
1
−1/2−is d
r
f (r) d r = 0 −
(− − is)r 1/2−is f (r) d r .
dr
2
r=0
r=0
Wegen der Unitarität der Mellintransformation ist (4.3) äquivalent zu
kMDg,0 f k22 − d2 kMD0,0f k22 ≥ 0
und der masselose Diracoperator im Kanal κ wird für f + , f − ∈ C0∞ (0, ∞) unter der
Transformation zu
+ Mf + (s − i)
f (s)
−g
−is − 21 + κ
.
Mhg,0,κ
=
Mf − (s − i)
f − (s)
−g
+is + 21 + κ
Wenn wir die obige Matrix mit hM
g,0,κ bezeichnen, ist (4.3) gleichbedeutend mit
Z ∞
∗ M
2 M
∗ M
(Mf )∗(s − i) (hM
g,0,κ ) hg,0,κ − d (h0,0,κ ) h0,0,κ Mf (s − i) d s ,
−∞
60
und dafür ist hinreichend, dass die Matrix in eckigen Klammern für κ = ±1, ±2, . . .
nichtnegativ ist:
∗ M
2 M
∗ M
(hM
g,0,κ ) hg,0,κ − d (h0,0,κ ) h0,0,κ =
2
g + (1 − d2 )(s2 + (κ + 12 )2 )
−2(κ − is)g
≥0.
−2(κ + is)g
g 2 + (1 − d2 )(s2 + (κ − 21 )2 )
Diese Bedingung ist auch notwendig, da für alle f ∈ C0∞ (R3 ) die Funktion Mf (s−i)
das Bild von f (r)/r unter der unitären Mellintransformation und die Abbildung
f (r) 7→ r a f (r) eine Bijektion auf C0∞ (R3 ) ist. Damit folgt, dass die Menge
{Mf (s − i)|f ∈ C0∞ (R3 )} ⊆ L2 (R3 )
dicht ist.
Die Bedingung ist genau dann erfüllt, wenn die Eigenwerte dieser Matrix für alle
s ∈ R und κ = ±1, ±2, . . . nichtnegativ sind. Die Eigenwerte sind die Lösungen des
quadratischen Polynoms
1 1 2
λ2 − 2λ g 2 + (1 − d2 )(s2 + κ2 + ) + g 2 + (1 − d2 )(s2 + κ2 + )
4
4
2 2 2
− (1 − d ) κ − 4g 2 (s2 + κ2 ) .
Die kleinere davon ist
p
1
λ1 = g 2 + (1 − d2 )(s2 + κ2 + ) − (1 − d2 )2 κ2 + 4g 2(s2 + κ2 ) .
4
Hier sieht man schon, dass d nicht größer als 1 sein kann und dass d = 1 nur für
g = 0 möglich ist. Im Folgenden können wir also ohne weiteres d < 1 voraussetzen.
Zuerst behandeln wir die notwendige Bedingung λ1 (s = 0) ≥ 0, die sich am Ende
als die restriktivste herausstellen wird. Der kleinere Eigenwert an der Stelle s = 0,
p
1
λ1 (s = 0) = g 2 + (1 − d2 )(κ2 + ) − |κ| (1 − d2 )2 + 4g 2 ,
4
ist nichtnegativ, falls |κ| nicht in dem offenen Intervall zwischen den beiden Werten
p
p
(1 − d2 )2 + 4g 2 ± (1 − d2 )2 + 4g 2 − 4(1 − d2 )(g 2 + (1 − d2 )/4)
2(1 − d2 )
p
(1 − d2 )2 + 4g 2 ± 2gd
=
2(1 − d2 )
liegt. Da aber nur ganzzahlige |κ| ≥ 1 relevant sind, können wir das Intervall unter
1 drücken oder es darüber ziehen. Sei zuerst das obere Ende des Intervalls kleiner
gleich 1:
p
(1 − d2 )2 + 4g 2 + 2gd
≤1,
2(1 − d2 )
oder umgeformt,
p
(4.4)
(1 − d2 )2 + 4g 2 ≤ 2(1 − d2 ) − 2gd .
Wenn wir jetzt die Gleichung quadrieren, könnte das zu zusätzlichen Lösungen
führen. Da sich aber herausstellen wird, dass für die Lösung die rechte Seite obiger
61
Ungleichung nichtnegativ ist, machen wir mit dem Quadrieren keinen Fehler. Wir
bekommen
(1 − d2 )2 + 4g 2 ≤ 4(1 − d2 )2 + 4g 2d2 − 8gd(1 − d2 )
und durch Kürzen von 1 − d2
4g 2 + 8dg − 3(1 − d2 ) ≤ 0 .
Die Lösungen für d und g sind
p
1
− 8g + 64g 2 − 4 · 3(−3 + 4g 2 )
d≤
6
(4.5)
p
1 p
1
− 8g + 16g 2 + 36 =
4g 2 + 9 − 4g ,
=
6
3
bzw.
(4.6)
p
1 − d2
1 √
3
1
g ≤ (−8d + 64d2 + 4 · 4 · 3(1 − d2 )) = ( 3 + d2 − 2d) = √
.
8
2
2 3 + d2 + 2d
Insbesondere gilt g ≤ (1 − d2 )/d, womit die rechte Seite von (4.4) wie vorher behauptet nichtnegativ ist. Der andere Fall, in dem das Intervall über 1 liegt, führt zu
folgender Ungleichung:
4g 2 − 8dg − 3(1 − d2 ) ≥ 0 .
Diese sagt, dass g nicht zwischen den Zahlen
p
√
8d ± 64d2 + 16 · 3(1 − d2 )
1
= (2d ± d2 + 3)
8
2
liegen darf. Die kleinere von beiden
√ ist aber kleiner als 0 für d < 1 und die größere
für positives d immer größer als 3/2. Die
√ einzig erlaubten Werte wären die trivialen
Kombinationen: g = 0, d = 1 und g = 3/2, d = 0.
Die Ableitung des kleineren Eigenwerts nach s liefert
−1/2
∂λ1
= 2s[1 − d2 − 2g 2 (1 − d2 )2 κ2 + 4g 2 (s2 + κ2 )
].
∂s
Die möglichen Extremalwerte sind s = 0 und die Nullstellen des Ausdrucks in eckigen
Klammern. Wir werden zeigen, dass unter der Bedingung (4.5) bei s = 0 der einzige
Extremalwert ist. Es ist notwendigerweise ein Minimum, da λ1 (s = ±∞) = ∞. Die
Bedingung (4.5) garantiert aber gerade λ1 (s = 0) ≥ 0, womit das Lemma bewiesen
ist.
Wir zeigen nun die Positivität des Ausdrucks in eckigen Klammern. Dazu stellen
wir zuerst fest, dass dieser für κ2 = 1 und s = 0 am kleinsten ist. Es genügt daher
4g 4 − (1 − d2 )2 ((1 − d2 )2 + 4g 2) < 0
zu zeigen. Löst man die Ungleichung, so erhält man
√
1+ 2
2
(1 − d2 )2 .
g <
2
62
Wegen Bedingung (4.6) ist obige Ungleichung erfüllt falls
s
√
2
1−d
1+ 2
3
√
(1 − d2 )
<
2 3 + d2 + 2d
2
und da d < 1 ist dies äquivalent zu
q
√
√ √
3 < 2 1 + 2( 3 + d2 + 2d) .
Aber die rechte Seite ist monoton steigend in d und größer als 3 für d = 0. Damit
ist die Positivität gezeigt und λ1 hat bei s = 0 sein globales Minimum.
Wir reduzieren jetzt den massiven Fall auf den bereits bewiesenen masselosen. Es
gilt die folgende Beziehung zwischen den Quadraten des massiven und masselosen
Diracoperators:
2
2
Dg,m
= Dg,0
+ m2 − 2mβg/|x| .
Dieser Operator ist offensichtlich nichtnegativ. Wir werden aber zeigen, dass man
2
nur einen Bruchteil von Dg,0
benötigt, um die Massenterme zu kontrollieren.
Es gilt
(4.7)
2
Dg,0
+ m2 − 2mβg/|x| ≥ 0
genau dann, wenn ≥ g 2 .
p
Um dies einzusehen, verwenden wir den bekannten kleinsten Eigenwert m 1 − g 2
des Diracoperators mit Coulombpotential [41, Abschnitt 7.4]. Wir bekommen die
2
Operatorungleichung Dg,m
≥ m2 (1−g 2 ). Multiplizieren wir diese mit und skalieren
die Masse mit 1/, so erhalten wir
Es folgt
2
Dg,0
1 2
m2 (1 − g 2 )
2
2
≤
D
=
D
+
m − 2mβg/|x| .
g,m/
g,0
2
1 − g2
g2
2
+ m − 2mβg/|x| ≥ 1 − 1/ +
m = 1−
m2
2
und somit auch (4.7) falls ≥ g 2 . Diese Bedingung ist auch notwendig, da für den
Grundzustand des Diracoperators überall die Gleichheit gilt.
Mit (4.7) lässt sich die massive Ungleichung nun in einer Zeile zeigen:
2
2
2
2
Dg,m
= (1 − g 2 )Dg,0
+ g 2 Dg,0
+ m2 − 2mβg/|x| ≥ (1 − g 2 )d2 D0,0
.
Der Grund für den Sprung zwischen den Fällen m = 0 und m 6= 0 liegt darin, dass
wir im zweiten Fall zwei, für sich scharfe, Ungleichungen verwendet haben. Eine
solche Zusammensetzung ist aber im Allgemeinen nicht mehr scharf.
√
Der Fall Zα = 3/2
√
Wir zeigen, dass wir für g = 3/2 in der quadrierten“ Ungleichung
”
2
2
(4.8)
Dg,m
≥ d2 D0,m
nur die Konstante d2 = 0 bekommen können. Der tiefere Grund ist die Existenz
von Funktionen im Definitionsbereich von D√3/2,m , deren Ableitung nicht quadratintegrierbar ist. Ein Beispiel ist die Eigenfunktion zum niedrigsten Eigenwert.
63
Für allgemeines g ∈ [0,
gegeben durch
√
3/2] ist diese Funktion in dem Drehimpulskanal κ = −1
−g
ng
r s e−gmr ,
1−s
p
1 − g 2 und ng der Normierungsfaktor für die L2 -Norm ist.√ Ihre
wobei s =
Ableitung ist quadratintegrierbar, falls s > 1/2, oder gleichbedeutend g < 3/2,
ist.
Zum Beweis berechnen wir die L2 -Norm von h√3/2,m,−1 Ψβ und h0,m,−1 Ψβ mit
p
β ∈ (1, 2), g = 3/2, s = 1/2, m0 > 0 und
0
−g
Ψβ := nβ
r βs e−gm r .
−(s − 1)
Wir werden sehen, dass mit β → 1 die erste beschränkt
bleibt und die zweite nach
√
unendlich strebt. Es folgt also d2 = 0 für g = 3/2 in (4.8). Der Wert von m0 ist
nicht weiter relevant, er darf nur nicht verschwinden, damit Ψβ quadratintegrabel
bleibt.
d
−gm + g 2 /r + (s − 1) dr
+ (s − 1)/r β/2 −gm0 r
hg,m,−1 Ψβ = nβ
r e
d
−g dr
+ g/r + (s − 1)m + (s − 1)g/r
2
g + (βs + 1)(s − 1) + r(−gm − (s − 1)gm0 ) β/2−1 −gm0 r
r
e
.
= nβ
−gβs + g + (s − 1)g + r(g 2m0 + (s − 1)m)
Schreibt man obige Funktion als
f1 (β) + r · h1 β/2−1 −gm0 r
nβ
r
e
,
f2 (β) + r · h2
so ergibt sich für die Norm
Z ∞
0
2
nβ
(f1 (β) + r · h1 )2 + (f2 (β) + r · h2 )2 r β−2 e−2gm r d r .
r=0
Wegen β > 1 könnten nur die Terme mit fi2 unbeschränkt sein. Da aber
√
f1 (β) = (1 − β)/4 , f2 (β) = (1 − β) 3/2
und für a ∈ (−1, 0) und b > 0 die einfache Ungleichung
Z ∞
Z 1
Z ∞
a −br
a
r e dr ≤
r dr +
e−br d r =
r=0
r=0
r=1
e−b
1
+
a+1
b
gilt, verschwindet der Grenzwert dieser Terme.
Wie oben bekommen wir für den anderen Fall
d
−gm + (s − 1) dr
+ (s − 1)/r βs −gm0 r
h0,m,−1 Ψβ = nβ
r e
d
−g dr
+ g/r + (s − 1)m
(βs + 1)(s − 1) + r(−gm − (s − 1)gm0 ) βs−1 −gm0 r
= nβ
r
e
.
−gβs + g + r(g 2 m0 + (s − 1)m)
Aber hier verschwinden die Terme der Ordnung r βs−1 nicht für β → 1, die L2 -Norm
ist also unbeschränkt.
64
Anhang
Zuerst geben wir den Beweis für die Optimalität unserer Wahl des Elektronenraums
(vergleiche Abschnitt 2).
Satz 5.1 (Optimalität der Wahl von H+ [4, Theorem 6]). Sei P+Z die orthogonale
Projektion auf den positiven Spektralraum von D Z und S die Menge aller orthogonalen Projektionen P auf H mit P (D(D Z )) ⊆ D(D Z ). Bezeichne mit H+ den Raum
P H für eine Projektion P ∈ S und mit E(H+ ) das Infimum der Energie (2.6) des
Modells mit Elektronenraum H+ . Ist E(P+Z H) = 0, was jeder bewiesene Stabilitätsfall
erfüllt, so gilt
E(H+ ) < 0 = E(P+Z H)
für alle H+ 6= P+Z H.
Beweis. Der Beweis hat zwei Teile; zuerst nehmen wir an, dass zwei normierte VekZ
Z
toren p ∈ H+ ∩ D(D Z ) und n ∈ H⊥
+ ∩ D(D ) mit <(p, D n) 6= 0 existieren. Wir
wählen unsere Basis von H mit den Elementen e−1 = n und e1 = p und die Ladungsdichtematrix
γ 0
Γ=
0 −γ
mit
γi,j
Die Energie von Γ ist

ε2


 2

−ε
√
=

ε 1 − ε2



0
i=j=1
i = j = −1
.
i = −j ∈ {−1, 1}
sonst
Z
Z
EZ,α (Γ) = ε(D1,−1
+ D−1,1
) + O(ε2)
und mit einem kleinen ε richtigen Vorzeichens ist sie negativ.
Z
Gilt umgekehrt (p, D Z n) = 0 für alle p ∈ H+ ∩D(D Z ) und n ∈ H⊥
+ ∩D(D ), dann
Z
Z
kommutieren P und D und somit nach dem Spektralsatz auch P und P+ . Daher
Z
ist eine der Mengen D(D Z ) ∩ H+ ∩ (1 − P+Z )(H) und D(D Z ) ∩ H⊥
+ ∩ (1 − P+ )(H) nicht
leer. Nehmen wir an, es gibt ein normiertes u in der ersten und unsere Orthonormalbasis hat als nulltes Element e0 = u. Die Energie der Ladungsdichtematrix zu
dem Zustand ϕ = a∗0 Ω ∈ F,
(
1 i=j=0
γ 0
Γ=
mit γi,j =
,
0 −γ
0 sonst
ist
Z
EZ,α (Γ) = D0,0
<0.
65
Hilbert-Schmidt-Operatoren
Hier werden kurz die in der Arbeit benötigten Resultate über Hilbert-Schmidt- und
Spurklasseoperatoren vorgestellt.
Sei M := Rn ×{1, . . . , m} für natürliche Zahlen m und n und L2 (M) versehen mit
dem Produktmaß aus Lebesgue- und Zählmaß. Wir fixieren
eine Orthonormalbasis
2
(ei )i∈ von L (M) und die Orthonormalbasis ei (x)ej (y) i,j∈ des Produktraums
L2 (M × M). Ein Operator γ : L2 (M) → L2 (M) ist ein Hilbert-Schmidt-Operator
genau dann, wenn es eine Funktion γ(x, y) ∈ L2 (M × M) mit
Z
(γf )(x) =
γ(x, y)f (y) d y
M
2
für alle f ∈ L (M) gibt [7, Theorem 3.6.5]. Diese ist in L2 (M × M) eindeutig, da
ihre Koeffizienten bezüglich der Basis durch (ei , γej ) gegeben sind. Das Quadrat der
Hilbert-Schmidt-Norm ist definiert als
X
|(ei , γej )|2 = Sp γ ∗ γ = Sp γγ ∗ = kγ(x, y)k22 .
i,j∈
Es gilt also allgemein
γ(x, y) =
X
(ei , γej )ei (x)ej (y) ,
i,j∈
oder, falls γ normal ist und man als Basis seine Eigenfunktionen wählt,
X
γ(x, y) =
(ei , γei )ei (x)ei (y) .
i∈
Im Fourierraum schließlich schreibt sich der Integralkern als
X
γ(p, q) =
(ei , γej )eˆi (p)eˆj (q) .
i,j∈
Lemma 5.2 ([38, §XI.4]). Sei K eine stetige Funktion auf M × M mit folgenden
Eigenschaften:
• Für alle f ∈ C0 (M) gilt
Z Z
f (x)K(x, y)f (y) d x d y ≥ 0
M
M
Rund somit K(x, x) ≥ 0.
• M K(x, x) d x < ∞.
Dann gibt es einen Spurklasseoperator A mit Integralkern K und
Z
Sp A =
K(x, x) d x .
M
Ist umgekehrt
A ein positiver Operator endlicher Spur mit stetigem Integralkern K,
R
so ist M K(x, x) d x endlich und seine Spur durch obige Formel gegeben.
Lemma 5.3. Sei G ein Hilbertraum, γ : G → G ein Hilbert-Schmidt-Operator und
A : G → G ein positiver selbstadjungierter Operator. Dann gilt
√
√
Sp Aγ ∗ γ A = Sp γAγ ∗ ,
66
in dem Sinne, dass wenn eine Seite unendlich ist, so auch die andere. Ist darüber
hinaus noch Aγ ∗ γ Spurklasse, so sind obige Terme auch gleich Sp Aγ ∗ γ.
√
Beweis. Mit B := γ A schreibt sich die Behauptung als Sp B ∗ B = Sp BB ∗ . Dies
sind aber die identischen Hilbert-Schmidt-Normen von B und B ∗ .
Ist Aγ ∗ γ Spurklasse, so ist seine Spur mit den Eigenfunktionen fi zu den nicht verschwindenden Eigenwerten λi von γ ∗ γ durch die Summe der nichtnegativen Terme
X
(5.1)
λi (fi , Afi )
i
gegeben. Sei E das zu A gehörige Spektralmaß und An := E(−∞, n]A = E[0, n]A
für n > 0 die Einschränkung von A auf den numerischen Wertebereich [0, n]. Die
∗
steigend
Folge (Sp An γ ∗ γ)n∈ ist mit
√ ∗ und
√ konvergiert gegen Sp Aγ γ
√ (5.1)∗ monoton
√
und gleichermaßen gilt Sp An γ γ An → Sp Aγ γ A. Für alle endlichen n sind
die Folgeglieder aber identisch.
Die Matrixelemente des Coulombpotentials
In diesem Abschnitt stellen wir ein paar Hilfssätze für den Umgang mit dem
Coulombpotential zusammen.
Lemma 5.4. Für ei , ej , ek , el ∈ H 1/2 (R3 ) ⊗ C4 ist das Matrixelement
Z
Z
ei (x)ej (y)ek (x)el (y)
Wi,j;k,l =
dx dy
|x − y|
G
G
der Coulombwechselwirkung endlich.
Beweis. Es gilt |ei (x)ek (x)| ≤ |ei (x)|2 + |ek (x)|2 , also genügt es den Fall ei = ek und
ej = el zu behandeln. Durch Anwendung der Ungleichung von Kato (1.2) in einer
Variablen erhalten wir
Z
Z
Z
Z
π
|ei (x)|2 |ej (y)|2
≤
d x d y ei (x) |∇x | ei(x)|ej (y)|2
dx dy
|x
−
y|
2
G
G
G
G
π
2
≤ kei kH 1/2 kej k2H 1/2 .
2
Lemma 5.5 (Fouriertransformation des Coulompotentials). Seien i, j, k, l ∈ Z fix
und ei , ej , ek , el ∈ L12/5 (R3 )⊗C4 . Dann ist das Matrixelement Wi,j;k,l im Fourierraum
gegeben durch
Z
Z
ei (x)ej (y)ek (x)el (y)
Wi,j;k,l =
dx dy
|x − y|
G
G
4 Z
1 X
= 2
d q d q0 d p|q|−2 ebj (q − p, σ)b
el (−p, σ)b
ei (−q + q0 , τ )ebk (q0 , τ )
2π σ,τ =1 9
4 Z
1 X
d q d q0 d p|q − q0 |−2 ebj (q0 + p, σ)b
= 2
el (p + q, σ)b
ei (q, τ )ebk (q0 , τ ) .
2π σ,τ =1 9
67
Beweis. Aus [30, Korollar 5.10] nehmen wir die Formel (nach Polarisation, für die
gewöhnliche Fouriertransformation (0.1))
Z
Z
2a−n
2a
fb2 (q)|q|−2a fb1 (q) d q,
f2 (x)|x − y|
f1 (y) d y d x = c2a (2π)
cn−2a
n
n
mit ca := π −a/2 Γ(a/2), 0 < a < n/2 und f1 , f2 ∈ L2n/(n+2a) . In unserem Fall ist
n = 3, a = 1, f1 (x) := ei (x)ek (x) und f2 (y) := ej (y)el (y). Wir benötigen die
−3/2
Konstanten c1 = 1 und c2 = π −1 , und wegen ed
ebi ∗ ebj ergibt sich für
i ej = (2π)
das Matrixelement Wi,j;k,l
4 Z
1 X
2π 2 σ,τ =1
9
d q d q0 d p|q|−2 ebj (q − p, σ)b
el (−p, σ)b
ei (−q + q0 , τ )ebk (q0 , τ )
4 Z
1 X
= 2
2π σ,τ =1
4 Z
1 X
= 2
2π σ,τ =1
9
9
el (p, σ)b
ei (q, τ )ebk (q0 , τ )
d q d q0 d p|q − q0 |−2 ebj (−q + q0 + p, σ)b
d q d q0 d p|q − q0 |−2 ebj (q0 + p, σ)b
el (p + q, σ)b
ei (q, τ )ebk (q0 , τ ) ,
wobei wir von der zweiten zur dritten Zeile q → −q + q0 und p → −p substituieren
und zur letzten noch p → p + q.
Als unmittelbare Folge erhalten wir eine Formel für die Austauschenergie im Impulsraum.
Lemma 5.6 (Die Austauschenergie im Impulsraum). Ist γ(x, y) ∈ G := H 1/2 (G ×
G), so ist die Austauschenergie im Fourierraum gleich
WX = kγ(x, y)|x − y|−1/2 k22
4 Z
1 X
= 2
d q d q0 d p|q − q0 |−2 γ(q0 + p, σ; q0 , τ )γ(q + p, σ; q, τ ) .
2π σ,τ =1 9
Beweis. Mit der Kato-Ungleichung gilt für f (x, y) ∈ G, wie im Beweis der
Endlichkeit der Matrixelemente,
Z
G×G
|f (x, y)|2
π
≤
|x − y|
2
Z
G×G
|p||f (p, q)|2 ≤
π
kf k2H 1/2 .
2
Die Abbildung G → R, f (x, y) 7→ kf (x, y)|x − y|−1/2 k22 ist also stetig. Mit der KatoUngleichung im Fourierraum,
1
2π 2
Z
π
u(p)u(q)
dpdq
≤
|p − q|2
2
6
Z
d p|p||u(p)|2 ,
3
68
erhalten wir für die rechte Seite der Behauptung die analoge Abschätzung
4 Z
1 X
d q d q0 d p|q − q0 |−2 f (q0 + p, σ; q0 , τ )f (q + p, σ; q, τ )
2
2π σ,τ =1 9
4 Z
π X
π
≤
d p d q|q||f (p, σ; q, τ )|2 ≤ kf k2H 1/2 .
2 σ,τ =1 6
2
Damit hängt auch die rechte Seite stetig von f (x, y) ab und es genügt, die Behauptung auf einer dichten Teilmenge von G zu zeigen. Da C0∞ (G) in H 1/2 (G) dicht ist,
können wireine Orthonormalbasis (fi )i∈ von H 1/2 (G) aus C0∞ (G) wählen. Dann ist
fi (x)fj (y) i,j∈ eine Orthonormalbasis von G, und für diese wurde die Behauptung
in Lemma 5.5 bewiesen. Folglich gilt sie auch auf allen endlichen Linearkombinationen der Basis, einer dichten Teilmenge.
In den folgenden beiden Lemmas beweisen wir zwei Behauptungen aus Abschnitt 2.3 über die Matrixelemente des Coulombpotentials mit der Zerlegung von
H in H+ und H− bezüglich des masselosen freien Diracoperators.
Der masselose freie Diracoperator hat im Impulsraum die Gestalt
0
σ·p
0
,
D =
σ·p
0
und daher eine besonders einfache Zerlegung von H in H+ und H− . Für jedes u ∈
L2 (R3 ) ⊗ C2 definieren wir die Vektoren
u
u
+
−
und u :=
(5.2)
u :=
σ · ωpu
−σ · ω p u
und erhalten
D 0 u+ = |p|u+ und D 0 u− = −|p|u− .
Darüber hinaus ist wegen (σ·ω p )2 = I2 jedes Element von H eine Linearkombination
von Vektoren der Form (5.2):
1 u + (σ · ω p )v
1 u − (σ · ω p )v
u
=
+
.
v
2 (σ · ω p u) + v
2 −(σ · ω p )u + v
Es folgt also, dass H+ gleich der Menge der Vektoren u+ und H− gleich der Menge
der Vektoren u− ist. An der Form von u+ und u− sieht man die Invarianz der
Räume H+ und H− unter Streckung der Koordinaten. Dies gilt, wie man sich leicht
anhand elementarer Eigenschaften der Fouriertransformation überlegen kann, auch
im Ortsraum. Die Zerlegung in H+ und H− im massiven Fall ist auch nicht viel
komplizierter; man findet sie in [20] oder implizit in Abschnitt 3.2.
Lemma 5.7. Sind H+ und H− bezüglich des masselosen freien Diracoperators
gewählt, dann gibt es orthonormale Vektoren e1 , e2 , e−1 , e−2 mit e1 , e2 ∈ H+ ,
e−1 , e−2 ∈ H− , deren Matrixelemente des Coulombpotentials die Eigenschaften
W−1,−2;1,2 > 0 und W−2,−1;1,2 = 0 haben.
69
Beweis. Mit der Bezeichnung (ω p )i für die i-te Komponente des Einheitsvektors von
p gilt
(ω p )3
(ω p )1 − i(ω p )2
σ · ωp =
.
(ω p )1 + i(ω p )2
−(ω p )3
Wir wählen eine kugelsymmetrische C0∞ (R3 \ {0})-Funktion e und definieren mit
Hilfe obiger Darstellung von H+ und H− zwei orthogonale Elektronen f1 , f2 und
zwei orthogonale Positronen g1 , g2 im Impulsraum:




e(p)
e(p)




0
0
 ,
 , g1 (p) := 
f1 (p) := 




−(ω p )3 e(p)
(ω p )3 e(p)
−((ω p )1 + i(ω p )2 )e(p)
((ω p )1 + i(ω p )2 )e(p)




0
0




e(p)
e(p)



f2 (p) := 
((ω p )1 − i(ω p )2 )e(p) , g2 (p) := −((ω p )1 − i(ω p )2 )e(p) .
−(ω p )3 e(p)
(ω p )3 e(p)
Aufgrund der beabsichtigten hohen Symmetrie lassen sich die Komponenten aller
vier Vektoren durch die des ersten ausdrücken,



 



0
0
f11
f11



0



 , g1 =  0  , f2 =  f11  , g2 =  f11  .
f1 = 
−f14 
f13 
−f13 
 f14 
f14
−f14
−f13
f13
Damit ergibt sich das erste Matrixelement, W−1,−2;1,2 , zu
4 Z
1 X
d q d q0 d p|q|−2 g2 (q − p, σ)f2 (−p, σ)g1 (−q + q0 , τ )f1 (q0 , τ )
2
2π σ,τ =1 9
Z
1
= 2
d q d q0 d p|q|−2
2π
9
· f11 (q − p)f11 (−p) − f14 (q − p)f14 (−p) − f13 (q − p)f13 (−p)
· f11 (−q + q0 )f11 (q0 ) − f13 (−q + q0 )f13 (q0 ) − f14 (−q + q0 )f14 (q0 ) .
Da aber die Komponenten von f1 die Spiegelungssymmetrien f11 (−p) = f11 (p),
f13 (−p) = −f13 (p) und f14 (−p) = −f14 (p) erfüllen, und die Faltung einer Funktion
mit seiner komplexen Konjugation eine reellwertige Funktion ist, kann man den
Ausdruck wie folgt vereinfachen:
Z
1
d q d q0 d p|q|−2
2π 2 9
· f11 (q − p)f11 (p) + f14 (q − p)f14 (p) + f13 (q − p)f13 (p)
· f11 (q − q0 )f11 (q0 ) + f13 (q − q0 )f13 (q0 ) + f14 (q − q0 )f14 (q0 )
Z
2
1
d q|q|−2 f11 ∗ f11 (q) + f13 ∗ f13 (q) + f14 ∗ f14 (q)
= 2
2π
3
70
Für die Positivität des Matrixelements bleibt zu zeigen, dass die Funktion in Klammern nicht fast überall verschwindet. Es gilt aber
f11 ∗ f11 (q) + f13 ∗ f13 (q) + f14 ∗ f14 (q)
=
Z
3
d p(1 + ω q−p ω p )f11 (q − p)f11 (p) ,
und die Funktion 1+ω q−p ω p hat ihre Nullstellen in der Nullmenge {p = λq|λ ∈ R}.
Da f11 nichtnegativ und als nicht fast überall verschwindend vorausgesetzt war, folgt
die Behauptung für das erste Matrixelement.
Das zweite Matrixelement, W−2,−1;1,2 , ist gegeben durch
4 Z
1 X
d q d q0 d p|q|−2 g1 (q − p, σ)f2 (−p, σ)g2 (−q + q0 , τ )f1 (q0 , τ )
2π 2 σ,τ =1 9
Z
1
= 2
d q d q0 d p|q|−2 − f13 (q − p)f14 (−p) + f14 (q − p)f13 (−p)
2π
9
· − f14 (−q + q0 )f13 (q0 ) + f13 (−q + q0 )f14 (q0 ) = 0 ,
da der Integrand punktweise verschwindet. Dies folgt leicht aus den oben genannten
Symmetrien von f13 und f14 und der Tatsache, dass f13 reell ist.
Lemma 5.8. Der Vakuumerwartungswert der nicht vollständig normalgeordneten
Coulombwechselwirkung bezüglich des masselosen freien Diracoperators
Z
X
X Z
ei (x)ej (x)ei (y)ej (y)
(5.3)
Wi,j;j,i =
dx dy
|x − y|
G
i<0,j≥0
i<0,j≥0 G
ist unendlich oder basisabhängig.
Beweis. Aus dem Beweis des vorangegangenen Lemmas kann man entnehmen,
dass es ein normiertes Elektron-Positron-Paar e−1 , e1 mit W−1,1;1,−1 > 0 gibt. Wir
ergänzen diese zwei Vektoren zu einer mit der Zerlegung H+ ⊕ H− verträglichen
Basis (siehe Definition 2.1) (ei )i∈ von H. Wegen der Skalierungsinvarianz von H+
und H− ist (e0i )i∈ mit e0i (x) := λ3/2 ei (λx) für ein λ > 0 wieder eine solche Basis. Das neue Matrixelement bezüglich (e0i )i∈ ist λW−1,1;1,−1 , und da alle Terme in
(5.3) nichtnegativ sind, folgt die Divergenz der Summe, falls diese basisunabhängig
ist.
71
Literatur
[1] V. Bach, E. H. Lieb und J. P. Solovej. Generalized Hartree-Fock theory and the Hubbard
model. J. Stat. Phys., 76(1&2):3–89, 1994.
[2] V. Bach. Error bound for the Hartree-Fock energy of atoms and molecules. Commun. Math.
Phys., 147:527–548, 1992.
[3] V. Bach, J-M. Barbaroux, B. Helffer und H. Siedentop. Stability of matter for the Hartree-Fock
functional of the relativistic electron-positron field. Doc. Math., 3:353–364, 1998.
[4] V. Bach, J-M. Barbaroux, B. Helffer und H. Siedentop. On the stability of the relativistic
electron-positron field. Commun. Math. Phys., 1999.
[5] V. Bach und J. Poelchau. Accuracy of the Hartree-Fock approximation for the Hubbard model.
J. Math. Phys., 38(4):2072–2083, 1997.
[6] A. A. Balinsky und W. D. Evans. Stability of one-electron molecules in the Brown-Ravenhall
model. Commun. Math. Phys., 202(2):481–500, 1999.
[7] J. Blank, P. Exner und M. Havlı́ček. Hilbert space operators in quantum physics. American
Institute of Physics, New York, 1994.
[8] O. Bratteli und D. W. Robinson. Operator algebras and quantum statistical mechanics. 1.
Springer-Verlag, New York, 2. Auflage, 1987.
[9] O. Bratteli und D. W. Robinson. Operator algebras and quantum statistical mechanics. 2.
Springer-Verlag, Berlin, 2. Auflage, 1997.
[10] G. E. Brown und D. G. Ravenhall. On the interaction of two electrons. Proc. Roy. Soc. London
A, 208(A 1095):552–559, 1951.
[11] R. Brummelhuis, N. Röhrl und H. Siedentop. Stability of relativistic electron-positron fields
of atoms in Hartree-Fock approximation: heavy elements. Eingereicht bei Documenta Mathematica, 2000.
[12] P. Chaix und D. Iracane. From quantum electrodynamics to mean-field theory: I. The
Bogoliubov-Dirac-Fock formalism. J. Phys. B., 22(23):3791–3814, 1989.
[13] P. Chaix, D. Iracane und P. L. Lions. From quantum electrodynamics to mean-field theory:
II. Variational stability of the vacuum of quantum electrodynamics in the mean-field approximation. J. Phys. B., 22(23):3815–3828, 1989.
[14] J. G. Conlon. The ground state energy of a classical gas. Commun. Math. Phys, 94(4):439–458,
1984.
[15] I. Daubechies und E. H. Lieb. One-electron relativistic molecules with Coulomb interaction.
Comm. Math. Phys., 90(4):497–510, 1983.
[16] D. Hundertmark, N. Röhrl und H. Siedentop. The sharp bound on the stability of the relativistic electron-positron field in Hartree-Fock approximation. Commun. Math. Phys., 211(3):629–
642, 2000.
[17] J. D. Drell und S. D. Drell. Relativistic quantum fields. International Series in Pure and Applied
Physics. McGraw-Hill, New York, 1. Auflage, 1965.
[18] F. J. Dyson and A. Lenard. Stability of matter I. J. Math. Phys., 8:423–434, 1967.
[19] F. J. Dyson and A. Lenard. Stability of matter II. J. Math. Phys., 9:698–711, 1968.
[20] W. D. Evans, P. Perry und H. Siedentop. The spectrum of relativistic one-electron atoms
according to Bethe and Salpeter. Commun. Math. Phys., 178(3):733–746, 1996.
[21] P. Federbush. A new approach to the stability of matter problem. I. J. Math. Phys., 16:347–
351, 1975.
[22] C. L. Fefferman und R. de la Llave. Relativistic stability of matter – I. Revista Matematica
Iberoamericana, 2(1, 2):119–161, 1986.
[23] G. Hardekopf und J. Sucher. Relativistic wave equations in momentum space. Phys. Rev. A,
30(2):703–711, 1984.
[24] E. Heinz. Beiträge zur Störungstheorie der Spektralzerlegung. Math. Ann., 123:415–438, 1951.
[25] I. W. Herbst. Spectral theory of the operator (p2 + m2 )1/2 − Ze2 /r. Commun. Math. Phys.,
53:285–294, 1977.
72
[26] G. Hoever und H. Siedentop. Stability of the Brown-Ravenhall operator. Math. Phys. Electron.
J., 5:Arbeit 6, 11 Seiten, 1999.
[27] T. Kato. Perturbation theory for linear operators, Band 132 der Grundlehren der mathematischen Wissenschaften. Springer-Verlag, Berlin, 1. Auflage, 1966.
[28] E. H. Lieb und H. Siedentop. Renormalization of the regularized relativistic electron-positron
field. mp arc, 00-98, 2000.
[29] E. H. Lieb. The stability of matter: from atoms to stars. Bull. Amer. Math. Soc. (N.S.),
22(1):1–49, 1990.
[30] E. H. Lieb und M. Loss. Analysis. Band 14 der Serie Graduate Studies in Mathematics. American Mathematical Society, Providence, 2. Auflage, 1997.
[31] E. H. Lieb, H. Siedentop und J. P. Solovej. Stability and instability of relativistic electrons in
classical electromagnetic fields. J. Statist. Phys., 89(1-2):37–59, 1997.
[32] E. H. Lieb und W. E. Thirring. Bound for the kinetic energy of Fermions which proves
the stability of matter. Phys. Rev. Lett., 35(11):687–689, 1975. Erratum: Phys. Rev. Lett.,
35(16):1116, 1975.
[33] E. H. Lieb und W. E. Thirring. Inequalities for the moments of the eigenvalues of the
Schrödinger Hamiltonian and their relation to Sobolev inequalities. In Elliott H. Lieb, Barry
Simon und Arthur S. Wightman, Herausgeber, Studies in Mathematical Physics: Essays in
Honor of Valentine Bargmann. Princeton University Press, Princeton, 1976.
[34] E. H. Lieb und H-T. Yau. The stability and instability of relativistic matter. Commun. Math.
Phys., 118:177–213, 1988.
[35] M. Loss. The stability of matter interacting with fields. Notices Amer. Math. Soc.,
44(10):1288–1293, 1997.
[36] H. Nagaoka. Kinetics of a system of particles illustrating the line and the band spectrum and
the phenomena of radioactivity. Phil. Mag., 7:445–455, 1904.
[37] G. Nenciu. Self-adjointness and invariance of the essential spectrum for Dirac operators defined
as quadratic forms. Commun. Math. Phys., 48:235–247, 1976.
[38] M. Reed and B. Simon. Methods of modern mathematical physics. III. Academic Press, New
York, 1979.
[39] J. Sucher. Foundations of the relativistic theory of many-electron atoms. Phys. Rev. A,
22(2):348–362, 1980.
[40] J. Sucher. Relativistic many-electron Hamiltonians. Phys. Scripta, 36:271–281, 1987.
[41] B. Thaller. The Dirac Equation. Texts and Monographs in Physics. Springer-Verlag, Berlin,
1. Auflage, 1992.
[42] C. Tix. Lower bound for the ground state energy of the no-pair Hamiltonian. Phys. Lett. B,
405(3-4):293–296, 1997.
[43] C. Tix. Strict positivity of a relativistic Hamiltonian due to Brown and Ravenhall. Bull.
London Math. Soc., 30(3):283–290, 1998.
[44] R. Weder. Spectral analysis of pseudodifferential operators. J. Funct. Anal., 20:319–337, 1975.

Zugehörige Unterlagen

Blatt 4 - Universität Tübingen

U.48 Es sei S ≡ x 1 + x2 + ··· + x n mit xi > 0 (i = 1, 2,...,n). Man zeige

Stabilität und Instabilität des relativistischen Elektronen

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können