Stabilität und Instabilität des relativistischen Elektronen-Positronen-Felds in Hartree-Fock-Näherung Dissertation an der Fakultät für Mathematik und Informatik der Ludwig-Maximilians-Universität München von Norbert Röhrl eingereicht im Oktober 2000 Erster Berichterstatter: Prof. Dr. H. Siedentop Zweiter Berichterstatter: Prof. Dr. V. Bach Tag der mündlichen Prüfung: 22.12.2000 1 Inhaltsverzeichnis Zusammenfassung 2 0. Notationen 4 1. Einleitung 1.1 Von Atomen zur Quantenmechanik 1.2 Stabilität der Materie 1.3 Relativistische Materie 5 5 7 9 2. Das Elektronen-Positronen-Feld 2.1 Der Diracoperator mit Coulombpotential 2.2 Der Fockraum 2.3 Quantenelektrodynamik 2.4 Die Hartree-Fock-Näherung 2.5 Resultate 13 13 15 21 23 31 3. Das Infimum der Energie des Vakuums 3.1 Stabilität des Vakuums 3.2 Implementation translationsinvarianter Dichtematrizen 3.3 Das Infimum der Energie für α > 4/π 3.4 Das Infimum der Energie mit chemischem Potential 3.5 Folgerungen für die Energie ohne chemisches Potential 3.6 Hilfssätze 33 33 34 40 47 51 53 4. Stabilität von Atomen 4.1 Eine Ungleichung für Diracoperatoren √ 4.2 Der Fall Zα = 3/2 57 57 62 5. Anhang 5.1 Hilbert-Schmidt-Operatoren 5.2 Die Matrixelemente des Coulombpotentials 64 65 66 Literatur 71 2 Zusammenfassung Diese Arbeit ist ein Beitrag zur Untersuchung der Stabilität der Materie in einem Modell, das durch einige Näherungen aus der Quantenelektrodynamik (QED) abgeleitet ist. Materie in unserem Sinne besteht aus beweglichen Elektronen und Positronen und unbeweglichen Atomkernen mit Coulombwechselwirkung zwischen allen Paaren von Teilchen. Man nennt Materie stabil, wenn ihre Energie nach unten durch ein negatives Vielfaches der Anzahl der Elektronen, Positronen und Kerne beschränkt ist, unabhängig von der Konfiguration der Kerne. Die Frage, warum Wasserstoff stabil ist, oder in anderen Worten, warum das Elektron des Wasserstoffs nicht in den Kern stürzt, ist klassisch nicht zu klären und spielte eine bedeutende Rolle bei der Entstehung der Quantenmechanik. Es handelt sich daher bei der Stabilität der Materie um ein rein quantenmechanisches Phänomen. Im nichtrelativistischen Fall wurde sie zuerst im Jahre 1967 von Dyson und Lenard [18, 19] bewiesen. Wir beschreiben das relativistische Elektronen-Positronen-Feld in zweiter Quantisierung und Hartree-Fock-Näherung mit Coulombwechselwirkung im externen Coulombfeld eines Atomkerns (Abschnitt 2). Von Bach, Barbaroux, Helffer und Siedentop [4] wurde für dieses Modell ein exaktes Energiefunktional hergeleitet. Es basiert auf dem QED-Hamiltonoperator, wie man ihn in dem Standardwerk von Bjorken und Drell [17] findet, ohne die Beiträge des magnetischen Vektorpotentials. Das Modell ohne externes Potential wurde zuvor in der Physik von Chaix, Iracane und Lions [12, 13] untersucht. Bach et al. zeigten in ihrer Arbeit unter anderem, dass die Energie des Systems ohne externes Potential nichtnegativ ist, falls für den Wert der Feinstrukturkonstante α ≤ 4/π gilt, und dass die Energie des Systems mit dem Coulombpotential eines Atomkerns bis Kernladungszahl Z = 68 (Erbium) für den physikalischen Wert von α ≈ 1/137 nichtnegativ ist. In einer gemeinsamen Arbeit mit Hundertmark und Siedentop [16] konnten wir die Optimalität des Stabilitätsresultats ohne externes Potential zeigen: Die Energie pro Teilchen ist nach unten unbeschränkt für α > 4/π ≈ 1, 27 (Abschnitt 3.3). Chaix et al. haben in ihrer Arbeit [13] bereits einen Hinweis für die Instabilität des Elektronen-Positronen-Felds für α > π/ log 4 ≈ 2, 27 gegeben. Sie argumentierten für die Instabilität des Modells in einem Einheitsvolumen mit Hilfe eines translationsinvarianten Zustands γC . Da ein solcher Zustand aber in jedem Einheitsvolumen die gleiche Energie und die gleiche Teilchenzahl besitzt, sind diese Größen auf dem ganzen Raum R3 entweder Null, nicht definiert oder unendlich. Wir fanden eine universelle Methode, durch geeignetes Abschneiden translationsinvariante Zustände zu approximieren (Abschnitt 3.2) und konnten so mit γC die Existenz von Zuständen beliebig negativer Energie pro Teilchen im ganzen Raum zeigen. Die richtige Wahl eines Parameters in γC führt schließlich zum optimalen Resultat. Mit Brummelhuis und Siedentop [11] ist es uns gelungen, das Stabilitätsresultat für Atome zu verbessern (Abschnitt 4). Die Energie ist im physikalischen Fall 3 α ≈ 1/137 für Atome mit Kernladungszahl Z ≤ 117 nichtnegativ; in dem Modell sind also alle bekannten Elemente stabil. Bach et al. zeigen in ihrem kurzen und eleganten Beweis eine Ungleichung zwischen den Beträgen des freien Diracoperators und des Diracoperators mit Coulombpotential. Dazu quadrieren sie diese und wenden die Dreiecksungleichung an. Wir jedoch erzielen durch ein aufwendigeres Argument die optimale Konstante der quadrierten Ungleichung: Mit der Streckungshomogenität des Diracoperators für masselose Teilchen können wir das Problem auf eine Ungleichung für Multiplikationsoperatoren reduzieren. Die Zusatzterme im massiven Fall werden durch den bekannten positiven Wert des Grundzustands des Diracoperators mit Coulombpotential kontrolliert. Da die Energie im Stabilitätsfall immer nichtnegativ ist, hat das Modell das Hartree-Fock-Vakuum als Grundzustand. Unterhalb der kritischen Werte der Parameter α und Z ist dieser auch eindeutig. Kerne ziehen es folglich vor, alleine zu bleiben, anstatt sich mit Elektronen zu umgeben, wie wir es in der Natur beobachten. Um die Erzeugung von Teilchen zu begünstigen, subtrahieren wir ein so genanntes chemisches Potential, ein Vielfaches der Ruheenergie der Teilchen, von der Gesamtenergie. Die Stabilität wird dadurch nicht beeinflusst, da die Energie nur proportional zur Teilchenzahl geändert wird. Ohne externes Potential kann für α = 1/137 das 0, 999983-fache der Ruheenergie abgezogen werden, ohne den Grundzustand zu verändern. Subtrahiert man die ganze Ruheenergie oder mehr, so ist das Infimum der Energie −∞ und es gibt keinen Grundzustand (Abschnitt 3.4). Für Atome ist die Zahl der Teilchen eines Zustands ungleich schwieriger zu bestimmen. Es gibt aber ein von der Natur motiviertes Potential, welches die Bestimmung der Teilchenzahl nicht erfordert und realistischere Resultate verspricht. G.M. Graf wies uns auf die Asymmetrie zwischen Elektronen und Positronen in der Natur hin: Elektronen sind vorhanden und um ein Positron zu erhalten muss man ein ElektronPositron-Paar erzeugen. Diese Beobachtung entspricht einem Potential proportional zur Ladung des Zustands. Es begünstigt Elektronen und belastet Positronen doppelt. Die Untersuchung eines solchen Potentials wird Gegenstand unserer zukünftigen Forschung an diesem Modell sein. 4 Notationen Eine Zahl nennen wir positiv, falls sie größer als Null ist. Ist sie größer gleich Null, so heißt sie nichtnegativ. Den Realteil einer komplexen Zahl bezeichnen wir mit < und den Imaginärteil mit =. Vektoren im Rn schreiben wir als x und Vektoren mit ” Spin“ aus G := R3 × {1, . . . , 4} als x = (x, τ ), τ = 1, . . . , 4. Wir verwenden auf R3 × {1, . . . , 4} das Produktmaß aus dem Lebesguemaß auf R3 und dem Zählmaß auf {1, . . . , 4}. Die Kugel mit Radius r um den Punkt x bezeichnen wir mit B(x, r) und mit Br die charakteristische Funktion von B(0, r). Die charakteristische Funktion des Intervalls [c, d] ⊆ R schreiben wir als I[c,d] (·). Der Einheitsvektor zu einem x ∈ Rn \ {0} ist ω x := x/|x| mit Komponenten (ω x )i , i = 1, . . . , n; der Einheitsvektor des Nullvektors ist der Nullvektor. Für die Einheitsmatrix in n Dimensionen verwenden wir In . Außer den üblichen Ls -Räumen mit den Normen Z s kf ks := |f (x)|s d x n C0∞ benutzen wir die Symbole für glatte Funktionen mit kompaktem Träger, C0 für stetige Funktion mit kompaktem Träger und H 1 bzw. H 1/2 für die L2 -Funktionen mit endlicher Norm: Z kf k2H 1 := kf k2H 1/2 := Z n 2 ˆ (1 + |p|2 )|f(p)| dp < ∞ , n 2 ˆ (1 + |p|)|f(p)| dp < ∞ . Wir verwenden ausschließlich die Fouriertransformation Z −n/2 (0.1) fˆ(p) := (2π) e−ipx f (x) d x ; n bei Integralkernen γ(x, y) verzichten wir auf die explizite Kennzeichnung der Fouriertransformierten und schreiben einfach γ(p, q). Beträge von Differentialoperatoren und Ausdrücke in p sind als die entsprechenden Multiplikationsoperatoren im Fourierraum definiert. Operatoren nennen wir positiv, wenn sie die Ungleichung A ≥ 0 erfüllen und den zu einem Operator B adjungierten Operator bezeichnen wir mit B ∗ . Für den Definitionsbereich von B verwenden wir das Symbol D(B). Der Antikommutator zweier beschränkter Operatoren A und B ist schließlich durch gegeben. {A, B} := AB + BA 5 Einleitung Von Atomen zur Quantenmechanik Die Vorstellung, dass die Natur aus kleinsten Bausteinen, so genannten Atomen (griechisch atomos“, unteilbar), aufgebaut ist, geht auf den griechischen ” Philosophen Demokrit (ca. 460-370 v.Chr.) zurück. Sie ist eine Synthese aus den Positionen von Parmenides (ca. 540-480 v.Chr.), nichts verändert sich“, und von ” Heraklit (ca. 540-480 v.Chr.), alles fließt“. Demokrit nahm an, dass die Atome ewig ” und unveränderlich seien und es unendlich viele verschieden geformte gebe, die zu der schier unendlichen Vielfalt an Körpern zusammengesetzt werden könnten. Bis zu ersten quantitativen Hinweisen auf die Existenz von Atomen sollte es aber noch über 2000 Jahre dauern. Dalton und Prout beobachteten um 1800, dass verschiedene Elemente nur in bestimmten Gewichtsverhältnissen miteinander reagieren, was sich gut mit der Existenz von Atomen erklären lässt. Dem ersten Atommodell (Prout, 1815) lag die Annahme zu Grunde, Atome aller Elemente seien aus Wasserstoff aufgebaut. Diese Vorstellung führte schließlich zu einer Klassifikation der Atome nach ihren chemischen Eigenschaften, dem Peri” odischen System“ von Meyer und Mendelejeff (1869). Etwa zur gleichen Zeit wurde die elektrische Ladung quantitativ gemessen. Die Untersuchung der Elektrolyse veranlasste Faraday 1833 zur Vermutung einer atomaren Grundeinheit der Ladung. Thomson entdeckte 1897 die Elektronen, die Träger der negativen Ladung, als Kathodenstrahlen einer Vakuumröhre und bestimmte ihre Masse auf 1/1837 der Masse des Wasserstoffatoms. Er schlug 1904 das so genannte Puddingmodell für Atome vor, in welchem die positive Ladung gleichmäßig über das ganze kugelförmige Atom verteilt ist und die Elektronen, wie Rosinen in einem Pudding, um eine feste Ruhelage schwingen können. Weitgehend unbekannt ist, dass im gleichen Jahr von Nagaoka [36] schon ein viel realistischeres Modell diskutiert wurde, bestehend aus einer großen Anzahl negativ geladener Teilchen, angeordnet auf einem Kreis in gleichen Abständen, und einer positiven Ladung großer Masse in der Mitte. Aus Streuversuchen von Geiger und Marsden mit α-Teilchen durch dünne Goldfolien im Jahre 1909 schloss Rutherford 1911, dass sich im Zentrum von Atomen eine positive Ladung zusammen mit dem Großteil der Masse auf einem Raum von 10−14 m befinden müsse. Den vergleichsweise sehr großen Atomradius von etwa 10−10 m erklärte er durch die Elektronen, die in diesen Abständen vom Zentrum den Kern umkreisen. Das Modell wird deshalb auch Planetenmodell genannt. Bei den Umläufen um den Kern müsste das Elektron nach den Gesetzen der klassischen Elektrodynamik ständig Strahlung emittieren; damit würde es Energie verlieren und in den Atomkern stürzen. Stattdessen findet man in der Strahlung angeregter Atome scharfen Spektrallinien, die sich mit dem Modell nicht erklären lassen. Auch die chemische, optische und mechanische Gleichheit aller Atome des leichtesten Elements, des Wasserstoffs, ist mit einem Modell, das dem Elektron so viele verschiedene Möglichkeiten des Umlaufs um den Kern lässt, nur schwer in Einklang zu bringen. 6 Bohr postulierte daraufhin 1913 im Widerspruch zur klassischen Mechanik und Elektrodynamik, dass es stationäre Energiezustände gibt, in denen Atome nicht strahlen: Sie strahlen nur, wenn ein Elektron von einem stationären Zustand in einen tieferer Energie springt. Durch Energieabsorbtion kann ein Elektron auch in einen Zustand höherer Energie springen. Die Frequenz ν der ausgesendeten Strahlung ergibt sich mit dem Planckschen Wirkungsquantum h nach folgender Formel aus der Differenz der stationären Energieniveaus: hν = E1 − E2 . Er postulierte auch eine Auswahlbedingung für die erlaubten Bahnen, die den stationären Energiezuständen entsprechen. Es sind Kreisbahnen, deren Drehimpuls ein ganzzahliges Vielfaches von ~ = h/2π ist: L = n~ . Der Radius der engsten sich daraus ergebende Bahn für das Elektron, der so genannte Bohrradius, liegt mit 0, 529 · 10−10 m in der Größenordnung des Wasserstoffradiuses und die aus den Postulaten errechenbaren Übergangsfrequenzen für Wasserstoff stimmen sehr gut mit den Messungen überein. Die Auswahlhypothese von Bohr ist eine echte Quantenbedingung. Die erste Quantenhypothese wurde schon im Jahre 1900 von Max Planck zur Beschreibung der Strahlung eines schwarzen Körpers aufgestellt. Danach strahlt jener nur Energiequanten proportional zur Frequenz ν der Strahlung aus: = hν . Die Proportionalitätskonstante ist wieder das Plancksche Wirkungsquantum h. Diese Gleichung konnte man vielleicht noch als mathematischen Kunstgriff interpretieren, aber die Hinweise auf die Existenz diskreter Energiequanten traten in den folgenden Jahren immer deutlicher hervor. In seiner berühmten Arbeit über den photoelektrischen Effekt 1905 postulierte Einstein, dass Licht aus Strahlen von Korpuskeln, den Photonen, die sich mit Lichtgeschwindigkeit fortbewegen und deren Energie mit der Formel hν von der Frequenz des Lichts abhängt. Mit dieser Hypothese konnte er mehrere Phänomene erklären, von denen der Photoeffekt, für den er auch den Nobelpreis bekam, der bekannteste ist. Auch der Compton-Effekt (Compton, 1924) lässt sich in Übereinstimmung damit als Stoßvorgang zwischen einem Elektron und einem Photon deuten. Den Zusammenhang zwischen diesen diskreten Abläufen und den bekannten kontinuierlichen Vorgängen formulierte erstmals Bohr 1923 für die Strahlung von Atomen in seinem Korrespondenzprinzip. Er konstatierte, dass es im Grenzfall großer Quantenzahlen eine asymptotische Übereinstimmung der statistischen Resultate der klassischen Physik und der Quantentheorie gibt. Die Matrizenmechanik von Heisenberg, Born und Jordan (1925) und die Wellenmechanik von Schrödinger (1926) begründeten die moderne Quantenmechanik. Schrödinger zeigte in seiner Arbeit 1926 auch die Äquivalenz beider Theorien. Die relativistische Quantentheorie von Elektronen wurde von Dirac im Jahre 1928 in zwei Artikeln publiziert. Der erste enthält bereits den berühmten Diracoperator, der im Folgenden eine zentrale Rolle spielen wird. 7 Grundlegend wird auch das 1925 von Pauli formulierte Ausschlussprinzip oder auch Pauliprinzip sein, welches besagt, dass keine zwei Fermionen, also insbesondere Elektronen, im gleichen Zustand sein dürfen. Ohne dieses Naturgesetz würden alle Elektronen eines Atoms auf den niedrigsten Energiezustand stürzen; die Chemie, und damit unsere Welt, wäre ohne die Existenz der Elektronenschalen eine völlig andere. Stabilität der Materie Das einfachste quantenmechanische Modell der Materie besteht aus K ruhenden, positiv geladenen Atomkernen und N beweglichen, negativ geladenen Elektronen und Coulombwechselwirkung zwischen allen Paaren von Teilchen. Die Annahme, die Kerne seien unbeweglich, wird auch als Born-Oppenheimer Näherung bezeichnet und begründet sich durch den großen Unterschied der Massen von Elektronen und Kernen. Stabilität eines physikalischen Systems ist eine Eigenschaft der Grundzustandsenergie. In der Physik strebt jedes System zu Zuständen niedrigerer Energie. Das Infimum der Energie heißt Grundzustandsenergie E und wenn es einen Zustand mit dieser Energie gibt, so heißt dieser Grundzustand. Wir unterscheiden zwei Begriffe der Stabilität: • Stabilität der ersten Art: Die Grundzustandsenergie ist endlich. • Stabilität der zweiten Art: Die Grundzustandsenergie pro Teilchen ist nach unten beschränkt. Unter Stabilität der Materie versteht man Stabilität der zweiten Art. In obigem Modell bedeutet dies E ≥ −C(N + K) mit einer positiven Konstante C, die nicht von der Konfiguration der Kerne abhängt. Die Energie wird also auch über alle möglichen Konfigurationen der Kerne minimiert. Es gibt ein einfaches Beispiel, welches wir frei aus dem Überblicksartikel von Lieb [29] entnehmen, um die Notwendigkeit der Stabilität zu verdeutlichen. In der bayerischen Fassung denkt man an zwei gleiche Bierflaschen. Ist ihr Abstand groß genug, so ist die (Grundzustands-) Energie des Biers jeder Flasche in guter Näherung E(N), wobei N die Anzahl der Teilchen des Biers ist. Werden diese zusammengebracht und in einen Maßkrug gefüllt, so hat der Liter Bier nun die Energie E(2N) und die Energiedifferenz berechnet sich zu δE = 2E(N) − E(2N). Ist Bier stabil, so ist mit δE = o(N) die Energieänderung gering; wäre E(N) aber proportional zu −N k mit einem k > 1, ergäbe sich δE = −(2k − 2)E(N) und es würde sich Energie in der Ordnung der gesamten (atomaren) Energie des Biers freisetzten und zu einer starken Explosion führen. Um konkreter zu werden, führen wir jetzt die genauen Formeln für die Energie des nichtrelativistischen Modells ein, das auch historisch zuerst untersucht wurde. Wir bezeichen die festen Positionen der Kerne mit Rj ∈ R3 , ihre Kernladungszahl mit Zj > 0, j = 1, . . . , K und die Positionen der Elektronen mit xi ∈ R3 , i = 1, . . . , N. Des weiteren schreiben wir m und e für Masse bzw. Ladung der Elektronen und ∆i für den Laplaceoperator auf den 3 Komponenten des i-ten Elektrons. Damit ist der 8 Hamiltonoperator der nichtrelativistischen Materie gegeben durch N K N X K N X X X X e2 e2 Zi Zj e2 Zj ~2 ∆i + + − . − 2m |xi − xj | i,j=1 |Ri − Rj | i=1 j=1 |xi − Rj | i,j=1 i=1 i<j i<j Die Erwartungswerte der Terme sind der Reihe nach die (nichtrelativistische) kinetische Energie der Elektronen, die Coulombenergie der Elektronenpaare, die Coulombenergie der Kernpaare und die Coulombenergie zwischen Elektronen und Kernen. Den Coulombteil des Operators, der die gesamte Energie der elektrostatischen Wechselwirkung der Teilchen darstellt, bezeichnen wir mit e2 VC . Für N = 1 ist der Zustandsraum dieses Operators H := L2 (R3 ) ⊗ Cs , der Raum der quadratintegrierbaren Funktionen im R3 mit s komplexen Komponenten. Der Parameter s steht für die Anzahl der verschiedenen Spinzustände des Elektrons; der physikalische Fall ist also s = 2. Ist N > 1, so ist der N-Teilchenraum wegen des Pauliprinzips nicht einfach das N-fache Produkt, sondern das (total) antisymV metrische Tensorprodukt H(N ) := N H. An dieser Stelle wird zur Verringerung der Komplexität in der Quantenchemie gerne die Hartree-Fock-Näherung eingeführt. Sie ist eine der ältesten Näherungsmethoden bei Mehrteilchenproblemen in der Quantenmechanik und eine der wenigen, deren Genauigkeit sich rigoros abschätzen lässt [2, 5]. Dabei beschränkt man die Zustände in H(N ) auf so genannte Slaterdeterminanten f1 (x1 ) . . . fn (x1 ) . .. det .. ... . f (x ) . . . f (x ) 1 n n n mit fi ∈ H, i = 1, . . . , n orthonormal. Bis auf Weiteres werden wir ohne diese Näherung auskommen; eine Verallgemeinerung davon werden wir erst wieder im Hauptteil der Arbeit aufgreifen. Stabilität der nichtrelativistischen Materie wurde zuerst 1967 von Dyson und Lenard [18, 19] bewiesen und 1975 von Federbush nach einer anderen Methode [21]. In [32] und [33] wurde 1975 und 1976 von Lieb und Thirring die untere Schranke für die Energie pro Teilchen nochmal wesentlich verbessert und der Beweis stark vereinfacht. Das Resultat der letzten Arbeit für N Elektronen mit s Spinkomponenten und K Kernen, in Einheiten mit 2m = e = ~ = 1 ist !1/2 2 K X 7/3 . E ≥ −1, 31s2/3 N 1 + Zj /N j=1 Dies ist ein großer Fortschritt im Vergleich zum ersten Beweis von Dyson und Lenard, der ungefähr E ≥ −1014 N lieferte. In vielen Fällen gibt es auch Stabilitätsresultate unter Berücksichtigung eines klassischen Magnetfeldes. Da in dieser Arbeit keine Magnetfelder behandelt werden, zitieren wir nur die wichtigsten Resultate. Einen guten Überblick geben die Artikel [31] und [35]. 9 Relativistische Materie Für die Beschreibung von inneren Elektronen in Atomen größerer Kernladungszahl spielen relativistische Effekte eine nicht mehr zu vernachlässigende Rolle. Mit dem Bohrschen Postulat mvr = n~ und der nichtrelativistischen Gleichung für die Zentrifugalkraft Ze2 /r 2 = mv 2 /r erhalten wir für die Geschwindigkeit auf der innersten (n = 1) Bahn v = Ze2 /~. Wir vereinfachen den Ausdruck mit Hilfe der Sommerfeldschen Feinstrukturkonstante α := e2 (~c)−1 ≈ 1/137. Damit ist die Geschwindigkeit gleich Zαc und es ist ersichtlich, dass das innerste Elektron in Atomen großer Kernladungzahlen den Kern in Geschwindigkeiten umkreist, die eine relativistische Behandlung nahelegen. In der theoretischen Chemie wird oft Gold (Z = 79) als erstes Element genannt, dessen chemische Eigenschaften sich klassisch nicht mehr ausreichend genau berechnen lassen. In der mathematischen Beschreibung ändert sich der Coulombteil e2 VC des Hamiltonoperators gegenüber dem nichtrelativistischen Fall nicht, da wir die Coulombeichung wählen. Von den relativistischen Operatoren für die kinetische Energie werden wir in diesem Abschnitt zwei vorstellen. Ein pseudorelativistischer Hamiltonoperator ist N p X −~2 c2 ∆i + m2 c4 + e2 VC , i=1 wobei die Wurzel des negativen Laplaceoperators über die Fouriertransformation p definiert ist. Er gibt die korrekte relativistische kinetische Energie p2 c2 + m2 c4 wieder, vernachlässigt aber die Spineffekte und enthält im Ortsraum alle Potenzen des Differentialoperators, beschreibt also eine nichtlokale Theorie. Im Gegensatz zum nichtrelativistischen Fall skalieren kinetische Energie und Coulombenergie wie die inverse Länge:√ Skaliert man die Längeneinheiten x → λx √ mit einem λ > 0, so folgt −∆ → λ−1 −∆ und |x|−1 → λ−1 |x|−1 . Insbesondere ist das Infimum der Energie im masselosen Fall entweder 0 oder −∞, da man jede beliebige positive Energie zu 0 skalieren kann und jede negative zu −∞. Für negative Energien lässt man λ gegen 0 streben: Man kontrahiert also alles auf den Ursprung. Im nichtrelativistischen Fall skaliert die kinetische Energie wie λ−2 und da sie positiv ist, verhindert das den Kollaps. Skaliert man mit λ = ~c und ersetzt mc2 durch m, erhält man den Operator in der gebräuchlichen Form (1.1) N q X p2i + m2 + αVC i=1 mit p = −i∇ und der Vereinbarung, dass ein Ausdruck mit p in einem Operator als Multiplikation im Fourierraum bezüglich der gewöhnlichen Fouriertransformation (0.1) gemeint ist. Die Feinstrukturkonstante α ist dimensionslos und kann nicht wegskaliert werden. Wegen der Operatorungleichung p |p| ≤ p2 + m2 ≤ |p| + m , 10 gilt für die Energie Em des Modells mit Masse m die Ungleichung E0 ≤ Em ≤ E0 + Nm . Die Masse hat also auf die Stabilität keinen Einfluss. Die Stabilität eines wasserstoffartigen Atoms (K = N = 1) zeigt man mit der Kato-Ungleichung, die auf Herbst [25] und Kato [27] zurückgeht: Z Z π −1 2 |x| |u(x)| d x ≤ |p||û(p)|2 d p ∀ u ∈ L2 (R3 ) . (1.2) 2 3 3 Die Energie des Atoms mit einem Elektron im normierten Zustand endlicher Energie u ∈ H 1/2 (R3 ) ist also (1.3) Z E(u) = u(x) d x u(x) |p| − α |x| 3 Z Z Z π |u(x)|2 2 d x ≥ 1 − Zα = |p||û(p)| d p − Zα |x| 2 3 3 Z Da die Konstante π 2 3 |p||û(p)|2 d p . in der Ungleichung scharf ist, folgt unmittelbar 2 und π 2 inf E(u) = −∞ für Zα > . π Die Stabilität hängt also im Unterschied zum nichtrelativistischen Fall von Zα ab. Wir werden sehen, dass dies eine generelle Eigenschaft relativistischer Materie ist und wir bei mehreren Atomkernen zusätzlich noch eine Schranke für die Feinstrukturkonstante α bekommen. Abschätzungen der Form (1.3) und die Kato-Ungleichung werden uns später noch öfter begegnen. Die Geschichte dieses Modells begann mit dem oben besprochenen wasserstoffartigen Fall (K = N = 1), der 1975 von Weder [44] und 1977 von Herbst [25] studiert wurde. Trotz des späteren Erscheinens des Artikels von Herbst wird der Operator p Zα p2 + m2 − |x| inf E(u) = 0 für Zα ≤ oft als Herbstoperator bezeichnet. Im Jahr 1983 bewiesen Daubechies und Lieb [15] die Stabilität eines Moleküls mit einem Elektron (N = 1, K beliebig). Stabilität der Materie wurde schließlich zuerst 1984 von Conlon [14] gezeigt und die Konstanten 1986 von Fefferman und de la Llave [22] und nochmals 1988 von Lieb und Yau [34] verbessert. In der letzten Arbeit wird für Elektronen mit s Spinkomponenten und Kerne mit maximaler Kernladungszahl Z = maxj=1,...,K Zj die Stabilität unter den Bedingungen 2 1 ≈ 0, 0213s−1 und Zα ≤ α≤ 47s π gezeigt. Im physikalischen Fall, s = 2 und α ≈ 1/137, bedeutet das Stabilität bis Z = 87 (Francium). Das Modell ist instabil falls Zα > 2/π, was wir oben schon 11 anhand des wasserstoffartigen Atoms sehen konnten, oder α > 128/(15π) ≈ 2, 72 bei beliebigem Z > 0. Im Jahre 1996 wurde von Lieb, Loss und Siedentop ein einfacher Beweis der Stabilität mit Hilfe der Thomas-Fermi-von-Weizsäcker-Theorie und einiger, größtenteils in den oben genannten Artikeln bewiesenen, Ungleichungen gegeben. Das Ergebnis ist Stabilität für α ≤ 0, 77 und Z hinreichend klein; im physikalischen Fall gilt Z ≤ 59 (Praseodym). Neben der Verbesserung der Schranke für α gilt dieses Resultat auch unter Berücksichtigung von magnetischen Feldern. Die Stabilität dieses Modells impliziert auch Stabilität der nichtrelativistischen Materie. Wie wir durch das Skalierungsargument am Anfang zeigten, ist im stabilen masselosen Fall das Infimum der Energie gleich 0 und es gilt somit N X i=1 −1 |pi | ≥ −αVC . Die Ungleichung 0 ≤ (|p| − α /2)2 impliziert α−1 |p| ≤ p2 + α−2 /4 und damit gilt für die nichtrelativistische Energie in Einheiten mit 2m = e = ~ = 1 N X i=1 p2i + VC ≥ N X i=1 p2i − α−1 |p| ≥ −Nα−2 /4 . Wegen der restriktiven Bedingungen an α und Zα für relativistische Stabilität kann das die Beweise für nichtrelativistische Stabilität aber nicht ersetzen. Der relativistische Hamiltonoperator für die kinetische Energie ist der freie Diracoperator 1 ~c α · ∇ + mc2 β i 2 3 auf dem Hilbertraum H := L (R ) ⊗ C4 mit den 4 × 4-Matrizen α1 , α2 , α3 , β und der Notation 3 X ∂ αi α · ∇ := . ∂x i i=1 Nach Skalierung mit ~c und Substitution der Masse mc2 → m erhält man D 0 := α · p + mβ . Die kinetische Energie soll wie beim Herbstoperator eine Wurzel aus dem Quadrat der relativistischen kinetischen Energie p2 + m2 sein. Dies erreicht man durch die Relationen {αi , αj } := αi αj + αj αi = 2δij , {αi , β} = 0 und β 2 = I4 für i, j ∈ {1, 2, 3} . Interessanter Weise ist 4 die kleinste Dimension, in der man obige Relationen realisieren kann. Darüber hinaus will man einen selbstadjungierten Operator und fordert deshalb zusätzlich, dass die Matrizen hermitesch sind. Eine Möglichkeit der Darstellung der Matrizen, sind die von Dirac gewählten so genannten Diracmatrizen I2 0 0 σi β := , αi := , 0 −I2 σi 0 12 mit den Paulimatrizen 0 1 0 −i 1 0 σ1 := , σ2 := , σ3 := . 1 0 i 0 0 −1 Die Anzahl der Komponenten der Zustände ist also wegen der Struktur auf 4 festgelegt. Das Spektrum des Diracoperators ist (−∞, −mc2 ) ∪ (mc2 , ∞) und daher lassen sich seine Erwartungswerte nicht mehr unmittelbar als kinetische Energie interpretieren. Eine Möglichkeit, dieses Problem zu umgehen, ist der Brown-Ravenhall-Operator [10], die Einschränkung des Diracoperators mit Coulombpotential auf den positiven Spektralraum von D 0 . Eine physikalische Diskussion dieser Näherung findet sich in den Artikeln [39, 40] von Sucher. Mathematisch untersucht wurde der Operator aber erst in den letzten Jahren. Die erste Arbeit von Evans, Perry und Siedentop [20] behandelte den Fall eines Atoms der Kernladungszahl Z mit einem einzigen Elektron. Sie zeigten, dass die Energie durch eine nichtpositive Konstante nach unten beschränkt ist, falls Z ≤ Zc := 2/[(2/π + π/2)α], und nach unten unbeschränkt für Z > Zc . Die kritische Kernladungszahl wurde zuvor von Hardekopf und Sucher [23] aufgrund numerischer Untersuchungen vermutet. Im physikalischen Fall α ≈ 1/137 bedeutet dies Stabilität bis Z = 114, was alle bekannten Elemente abdeckt. Die untere Schranke ist tatsächlich positiv, wie in zwei Arbeiten von Tix [42, 43] gezeigt wurde. Von Balinsky und Evans [6] wurde die Stabilität von Molekülen mit einem Elektron (N = 1, K beliebig) gezeigt, falls alle Kernladungszahlen kleiner gleich der kritischen sind und α ≤ αc ≈ 0, 1257. Stabilität der Materie mit masselosen Elektronen wurde in diesem Kontext schließlich von Hoever und Siedentop [26] für Z ≤ 88 (bei α = 1/137) gezeigt. Die so genannte Methode der zweite Quantisierung bietet eine grundsätzlich andere Möglichkeit den freien Diracoperator als kinetische Energie zu interpretieren. Sie beschreibt Elektronen und Positronen, deren Antiteilchen, und macht die Beschränkung auf eine feste Teilchenzahl überflüssig. Die Methode wurde fast gleichzeitig zur mathematischen Formulierung der Quantenmechanik um 1930 von Dirac, Fock, Jordan und Wigner entwickelt. Wegen der damit verbundenen, für die Physik damals neuen mathematischen Probleme, verzögerte sich jedoch ihre Entwicklung. Wir werden diese Methode in der vorliegenden Arbeit für das ElektronenPositronen-Feld vorstellen. 13 Das Elektronen-Positronen-Feld Unser Modell soll ein Atom mit ruhendem Kern der Ladungszahl Z und relativistischen Elektronen und Positronen beschreiben. Wir verwenden das Wort Teilchen“ ” als Oberbegriff für Elektronen und Positronen. Der Kern wird als externes Potential realisiert und nicht wie die Teilchen quantisiert. − − b m Coulo Z + v Die Energie besteht aus der relativistischen kinetischen Energie der Elektronen und Positronen, der Coulombenergie zwischen den Teilchen und dem Atomkern und der Coulombenergie der Teilchen untereinander. Man fasst die kinetische und die Coulombenergie bezüglich des Kerns eines Teilchens zur Einteilchenenergie zusammen, weil sie ein Attribut jedes einzelnen Teilchens ist und nicht von anderen Teilchen abhängt. Die Coulombenergie zwischen den Teilchen wird als Wechselwirkungsenergie bezeichnet. In diesem Abschnitt stellen wir zuerst den Diracoperator mit Coulombpotential vor. Es folgt die Definition des Fockraums und der Erzeugungs- und Vernichtungsoperatoren. Wir führen dann den QED-Hamiltonoperator auf dem Fockraum ein und diskutieren einige seiner Eigenschaften. Unter anderem geben wir einen lückenlosen Beweis für die Beobachtung von J.P. Solovej, dass der vollständig normalgeordnete QED-Hamiltonoperator nicht stabil ist. Dieses Problem kann eliminiert werden, indem man sich auf Hartree-Fock-Zustände beschränkt. Über die Verträglichkeit der Normalordnung mit der Definition der Hartree-Fock-Zustände werden wir eine Verallgemeinerung eines Lemmas von D. Hundertmark beweisen. Diese Zustände lassen sich durch so genannte Ladungsdichtematrizen charakterisieren und auf einer Teilmenge der Zustände können wir ein vom QED-Hamiltonoperator motiviertes, endliches Energiefunktional definieren. Wir bedanken uns an dieser Stelle für die Erlaubnis beider Autoren, ihre Resultate verwenden zu dürfen. Im Folgenden halten wir uns zum großen Teil an die Artikel [4], [1] und das Buch von Thaller über Diracoperatoren [41]. Wir werden jedoch die Ladungsdichtematrizen anders definieren, um eine präzise Übereinstimmung mit den Hartree-FockZuständen zu erreichen. Daraus ergibt sich eine leichte Verschiebung der Definitionen der verschiedenen Energien. Zusätzlich werden wir explizit die Endlichkeit des Energiefunktionals beweisen. Der Diracoperator mit Coulombpotential Die Einteilchenenergie jedes einzelnen Elektrons oder Positrons, also seine relativistische kinetische Energie und seine Coulombenergie bezüglich des Kerns, ist gegeben durch den Diracoperator mit Coulombpotential 1 Z ~c α · ∇ + mc2 β − e2 i |x| 14 auf dem Hilbertraum H := L2 (R3 ) ⊗ C4 = L2 (G), wobei G := R3 × {1, . . . , 4}. Wie bei (1.1) skalieren wir die Längeneinheiten mit λ = ~c, ersetzen mc2 durch m und erhalten Z D Z := −iα · ∇ + mβ − α . |x| √ Für Zα < 3/2 ist D Z√selbstadjungiert auf seinem Definitionsbereich D(D Z ) = H 1 (R3 ) ⊗ C4 , für Zα ≤ 3/2 ist er wesentlich selbstadjungiert auf C0∞ (R3 \ {0}) [41, Beispiel 4.17, Theorem 4.4] und für Zα < 1 gibt es genau eine selbstadjungierte Erweiterung, deren Definitionsbereich D(D Z ) in H 1/2 (R3 ) ⊗ C4 enthalten ist [37]. Funktionen in H 1/2 (R3 )⊗C4 sind genau p die Zustände u endlicher kinetischer Energie: 0 Der Erwartungswert von |D | = p2 + m2 in u ist endlich. Mit der Ungleichung von Kato (1.2) folgt auch, dass (u, D Z u) endlich ist; H 1/2 (R3 ) ⊗ C4 ist also der Formbereich von D Z . Um im selbstadjungierten Fall zu bleiben, setzten wir in der ganzen Arbeit Zα < 1 voraus. Der Diracoperator mit Coulombpotential beschreibt die Energie des Wasserstoffatoms in fast perfekter Übereinstimmung mit dem Experiment. Sein Spektrum besteht wie im freien Fall (Z = 0) aus dem wesentlichen Spektrum (−∞, −m) ∪ (m, ∞) [41, Theorem 4.7] und aus den positiven Eigenwerten En in der Lücke [41, Abschnitt 7.4] mit −1/2 Z 2 α2 √ En = m 1 + , n = 0, 1, . . . . (n + 1 − Z 2 α2 )2 Letztere werden durch das negative Coulombpotential des Kerns aus dem positiven Teil des wesentlichen Spektrums gezogen. Physikalisch entspricht das der Bindung von Elektronen durch den Kern. Um eine Interpretation der negativen Energien zu geben, unterteilen wir den Hilbertraum H in den positiven und den negativen Spektralraum H+ und H− von D Z . Die zugehörigen orthogonalen Spektralprojektionen bezeichnen wir mit P+ bzw. P− . Die Zustände in H+ interpretiert man als Elektronen und die in H− mittels einer so genannten Ladungskonjugation als Positronen, den Antiteilchen der Elektronen. Der Ladungskonjugationsoperator ist eine antiunitäre Abbildung C : H → H mit (Cg)(x) = iβα2 g(x). Zur Illustration betrachten wir formal einen Diracoperator mit einem skalaren externen elektrostatischen Potential V und Teilchenladung e: D(e) := −iα · ∇ + mβ + eV . Es gilt (Cf, D(e)Cg) = Z (Cf )(x)D(e)(Cg)(x) d x G = Z G −if (x)α2 βD(e)iβα2 g(x) d x = (f, α2 βD(e)βα2 g) , und α2 βDβα2 berechnet sich mit Hilfe der folgenden Gleichungen α2 β βα2 = 1 , α2 β α2 βα2 = −α2 , α2 β β βα2 = −β , α2 β αi βα2 = αi , i ∈ {1, 3} , 15 zu −i(α1 , −α2 , α3 ) · ∇ − mβ − eV . Die komplexe Konjugation liefert schließlich iα · ∇ − mβ − eV . Der Diracoperator ist also (antiunitär) äquivalent zu −D(−e). Mittels C wird somit der negative Spektralraum von D(e) auf den positiven Spektralraum von D(−e) abgebildet, dem Diracoperator eines Teilchens mit entgegengesetzter Ladung, des Antiteilchens. Es wären natürlich theoretisch auch andere Aufspaltungen von H in zwei orthogonale Teilräume H+ und H− denkbar. Unsere Wahl zeichnet sich aber gegenüber allen anderen dadurch aus, dass das Infimum der Energie in dem hier betrachteten Modell am höchsten liegt. Wir geben den Beweis dieser Tatsache aus dem Artikel [4, Theorem 6] in Satz 5.1 im Anhang. Der Fockraum Um über beliebige Elektronen- und Positronenzahlen sprechen zu können, führen wir einen speziellen Hilbertraum ein, den Fockraum. Seine normierten Vektoren stellen die reinen Zustände des Modells dar. Wir setzen den Einteilchen-Elektronenraum gleich (1) F+ := H+ . Der Einteilchen-Positronenraum ist dann (1) F− := CH− , wobei C der Ladungskonjugationsoperator ist. Wir bemerken, dass für die algebraische Struktur des Fockraums nur die Antiunitarität von C ausschlaggebend ist: Nimmt man eine andere antiunitäre Abbildung C 0 , so ist der resultierende Fockraum zu unserem isomorph. Die n-Teilchenräume sind wegen der Fermistatistik durch das (total) antisymmetrische Tensorprodukt der Einteilchenräume gegeben: (n) F± := n ^ ν=1 (1) (0) (0) F± für n ≥ 1 und F+ := F− := C . Der n-Elektronen- und m-Positronenraum ist das Tensorprodukt (n) (m) F(n,m) := F+ ⊗ F− , und der Fockraum ist die Summe über alle Teilchenzahlen, ∞ M F(n,m) . F := n,m=0 Jeder Vektor in F(n,m) schreibt sich als Linearkombination aus (nicht notwendigerweise endlich vielen) so genannten einfachen Vektoren (2.1) (f1 ∧ f2 ∧ · · · ∧ fn ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm ) , (1) fi ∈ F+ , i = 1, . . . , n , (1) gj ∈ F− , j = 1, . . . , m . 16 Das Skalarprodukt zweier Elemente aus F(n,m) ist auf einfachen Vektoren gegeben durch 0 h(f1 ∧ f2 ∧ · · · ∧ fn ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm ), (f10 ∧ f20 ∧ · · · ∧ fn0 ) ⊗ (g10 ∧ g20 ∧ · · · ∧ gm )i = n!m! det[(fi , fj0 )]1≤i,j≤n det[(gi , gj0 )]1≤i,j≤m . Es verschwindet für zwei Vektoren aus Räumen mit verschiedener Positronen- oder Elektronenzahl, und für 1 ∈ F(0,0) = C definieren wir h1 , 1i := 1. Wir unterscheiden das Skalarprodukt auf F von dem auf H durch spitze Klammern h· , ·i anstatt der runden (· , ·). Der Vektor (2.1) wird mittels ψ (n,m) (x1 , . . . , xn ; y1, . . . , ym ) := X σ∈ n sgn(σ)fσ(1) (x1 ) · · · fσ(n) (xn ) ! X τ∈ m sgn(τ )gτ (1) (y1 ) · · · gτ (m) (ym ) ! als Funktion aufgefasst, wobei Sn die Permutationsgruppe von n Elementen und sgn(τ ) für τ ∈ Sn das Signum der Permutation τ ist. Das Skalarprodukt in dieser Darstellung ist hψ (n,m) , φ(n,m) i Z = Gn ×Gm ψ (n,m) (x1 , . . . , ym )φ(n,m) (x1 , . . . , ym ) d x1 · · · d xn d y1 · · · d ym . Im Formalismus der zweiten Quantisierung spielen Erzeugungs- und Vernichtungsoperatoren eine zentrale Rolle. Wir definieren nun diese für Elektronen und Positronen in unserer Repräsentation des Fockraums. Für ein f ∈ H und m, n ≥ 0 ist der Elektronen-Vernichtungsoperator a(f ) : F → F auf dem Teilraum F(n+1,m) gegeben durch (a(f )ψ)(n,m) (x1 , . . . , xn ; y1 , . . . , ym ) := Z √ n + 1 d x (P+ f )(x) ψ (n+1,m) (x, x1 , . . . , xn ; y1 , . . . , ym ) . G Dies definiert durch lineare Fortsetzung einen, wie wir unten sehen werden beschränkten, Operator auf ganz F, welcher antilinear von f abhängt. Sind (1) f1 , . . . , fn+1 ∈ F+ linear unabhängig, so ist seine Wirkung auf einen einfachen Vektor a(f1 ) (f1 ∧ f2 ∧ · · · ∧ fn+1 ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm ) √ = n + 1 (f1 ∧ · · · ∧ fn+1 ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm ) ; er vernichtet also das Elektron f1 . 17 Der adjungierte Operator dazu ist der Elektronen-Erzeugungsoperator a∗ (f ) : F → F. Er ist auf F(n,m) definiert durch (a∗ (f )ψ)(n+1,m) (x1 , . . . , xn+1 ; y1 , . . . , ym ) := n+1 X 1 √ (−1)j+1 (P+ f )(xj )ψ (n,m) (x1 , . . . , x̂j , . . . , xn+1 ; y1 , . . . , ym ) , n + 1 j=1 und (a∗ (f )ψ)(0,0) := 0. Hierbei bedeutet x̂j , dass wir die j-te Komponente auslassen. Der Operator a∗ (f ) hängt linear von f ab und auf einfachen Vektoren wirkt er in der naheliegenden Weise, a∗ (f ) (f1 ∧ f2 ∧ · · · ∧ fn ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm ) 1 =√ (f ∧ f1 ∧ f2 ∧ · · · ∧ fn ) ⊗ (g1 ∧ g2 ∧ · · · ∧ gm ) . n+1 Mit g ∈ H folgen die kanonischen Antikommutationsrelationen (CAR) {a(f ), a(g)} = {a∗ (f ), a∗ (g)} = 0 , {a(f ), a∗ (g)} = (f, P+ g) und damit auch die Beschränktheit der Operatoren ka∗ (f )ψk2 + ka(f )ψk2 = hψ, {a(f ), a∗ (f )}ψi = kP+ f k2 kψk2 . Der Positronen-Vernichtungsoperator b(f ) : F → F ist definiert durch (b(f )ψ)(n,m) (x1 , . . . , xn ; y1, . . . , ym ) := Z √ n (−1) m + 1 d y (CP− f )(y) ψ (n,m+1) (x1 , . . . , xn ; y, y1, . . . , ym ) . G Wegen der Antilinearität der Ladungskonjugation C hängt er linear von f ab. Schließlich ist der Positronen-Erzeugungsoperator b∗ (f ) : F → F mit (b∗ (f )ψ)(n,m+1) (x1 , . . . , xn ; y1 , . . . , ym+1 ) := m+1 (−1)n X √ (−1)k+1 (CP− f )(yk ) ψ (n,m) (x1 , . . . , xn ; y1 , . . . , ŷk , . . . , ym+1 ) m + 1 k=1 und (b∗ (f )ψ)(0,0) := 0 gegeben. Er hängt wiederum antilinear von f ab. Es ergeben sich ähnlich wie oben die Antikommutatoren {b(f ), b(g)} = {b∗ (f ), b∗ (g)} = 0 , {b∗ (f ), b(g)} = (f, P− g) und die analoge Beziehung für die Normen kb∗ (f )ψk2 + kb(f )ψk2 = hψ, {b(f ), b∗ (f )}ψi = kP− f k2 kψk2 . Wie man leicht aus den Definitionen entnehmen kann, antikommutieren alle Paare aus Elektronen- und Positronen-Erzeugungs- und Vernichtungsoperatoren: Mit der Notation a# (f ) für sowohl a(f ) als auch a∗ (f ) gilt {b# (g), a# (f )} = 0 . 18 Der Feldoperator auf dem Fockraum ist Ψ(f ) = a(f ) + b∗ (f ) mit adjungiertem Ψ∗ (f ) = a∗ (f ) + b(f ); Er ist beschränkt und hängt antilinear von f ab. Es gelten die Antikommutatorbeziehungen {Ψ(f ), Ψ(g)} = {Ψ∗ (f ), Ψ∗ (g)} = 0 , {Ψ∗ (f ), Ψ(g)} = (f, g) und daraus folgt wiederum kΨ∗ (f )ψk2 + kΨ(f )ψk2 = hψ, {Ψ(f ), Ψ∗(f )}ψi = kf k2kψk2 . Den Feldoperator Ψ kann man als Vernichtungsoperator bezüglich des Diracsees betrachten. In diesem Bild sind im Vakuum alle negativen Energiezustände des Diracoperators aufgefüllt. Ein Loch“ im Diracsee wird als Positron interpretiert, es ” hat positive Einteilchenenergie und positive Ladung. Deshalb entspricht der Erzeugungsoperator b∗ (f ) dem Füllen eines Lochs bzw. dem Vernichten eines Positrons im Diracsee. Der normierte Vektor Ω := 1 ∈ F(0,0) wird von allen Vernichtungsoperatoren auf die Null abgebildet, d.h. a(f )Ω = b(f )Ω = 0 ∀f ∈ H. Er entspricht also einem normierten Zustand ohne Teilchen, dem Vakuum. Diese Eigenschaften charakterisieren das Vakuum bis auf eine komplexe Phase eindeutig. Definition 2.1. Wir nennen eine Orthonormalbasis (ei )i∈ von H verträglich mit der Zerlegung H+ ⊕ H− , falls ei ∈ H+ ∩ H 1/2 (R3 ) ⊗ C4 für i ≥ 0 und ei ∈ H− ∩ H 1/2 (R3 ) ⊗ C4 für alle anderen i. Damit schreiben wir kurz ai := a(ei ) , a∗i :=a∗ (ei ) , Ψi :=ai + b∗i , Ψ∗i :=a∗i + bi . bi := b(ei ) , b∗i :=b∗ (ei ) , Eine Hilbertraumbasis von F(n,m) ist gegeben durch a∗i1 · · · a∗in b∗j1 · · · b∗jm Ω , 0 ≤ i1 < · · · < in , 0 > j1 > · · · > jm , und so schreibt sich ein allgemeines Element des Fockraums als X Y Y ϕ= cI,J a∗i b∗j Ω I⊆{0,1,... } J⊆{−1,−2,... } i∈I j∈J mit cI,J ∈ C und endlichen geordneten Mengen I und J, d.h. der Betrag jedes Elements der Menge ist kleiner als der des folgenden. Mit Hilfe der Erzeugungs- und Vernichtungsoperatoren und den zugehörigen Antikommutatorbeziehungen ist das Skalarprodukt im Fockraum eindeutig durch hΩ, Ωi = 1 festgelegt. Da beim Übergang von klassischen zu quantenmechanischen Systemen aus komplexen Größen Operatoren werden, birgt dieser immer das Problem der Anordnung. In der zweiten Quantisierung gibt es eine ausgezeichnete Anordnung, die so genannte Normalordnung. Auch diese hängt mit dem Diracsee zusammen, wie wir später 19 sehen werden. Bei der Normalordnung werden alle Erzeugungsoperatoren nach links antikommutiert. Also zum Beispiel : a(g)a∗ (f ) := −a∗ (f )a(g) ; es wird der eigentlich nichttriviale Antikommutator {a(g), a∗(f )} = (g, P+ f ) weggelassen. Man kann sich leicht überlegen, dass der Vakuumerwartungswert eines normalgeordneten Ausdrucks immer verschwindet. Definition 2.2. Wir bezeichen die von der Identität und den Erzeugern und Vernichtern erzeugte C ∗ -Algebra mit A(F). Die Menge der Zustände von A(F) ist definiert als die Menge aller stetigen Linearformen auf A(F) mit den Eigenschaften (1) ρ(A∗ A) ≥ 0 ∀A ∈ A(F) (Positivität), (2) ρ(1) = 1 (Normierung). Aus 1. folgt für A ∈ A(F) und λ ∈ C 0 ≤ ρ (A + λ1)(A∗ + λ1) = ρ(AA∗ ) + λρ(A) + λρ(A∗ ) + 1 . Mit λ = 1 und λ = i ergeben sich die Aussagen ρ(A) + ρ(A∗ ) ∈ R bzw. i(ρ(A) − ρ(A∗ )) ∈ R, und somit ρ(A∗ ) = ρ(A) . Man kann auch zeigen, dass die Stetigkeit einer Linearform bereits aus ihrer Positivität folgt [8, Proposition 2.3.11]. Darüber hinaus sind zwei Zustände bereits gleich, wenn sie auf der Menge der Monome in Erzeugern und Vernichtern Y Y Y Y (2.2) a∗i aj b∗k bl i∈I j∈J k∈K l∈L mit geordneten endlichen Mengen I, J ⊆ {0, 1, . . . } und K, L ⊆ {−1, −2, . . . } übereinstimmen (vergleiche [9, Abschnitt 5.2]). Die Menge der Zustände enthält die die reinen Zustände mittels der Zuordnung ρψ (A) := hψ, Aψi für einen beliebigen normierten Vektor ψ aus dem Fockraum. Der Fockraum ist eine irreduzible Darstellung der Algebra A(F). Unsere Wahl der Zustände mittels der Algebra ergibt direkt die Eindeutigkeitsaussage (2.2), die wir später für die Sätze über die Darstellung von Hartree-Fock-Zuständen benötigen. Die Teilchenzahl N(ρ) bzw. Ladung Q(ρ) eines Zustandes ρ sind gegeben durch ! ! X X N(ρ) := ρ (a∗i ai + b∗i bi ) , bzw. Q(ρ) := ρ (a∗i ai − b∗i bi ) . i∈ i∈ Für reine Zustände kann man die Definitionen leicht plausibel machen. Ein Zustand mit einem Elektron ist gegeben durch a∗0 Ω und es gilt N(ρ) = Q(ρ) = 1. Für ein Elektron-Positron Paar a∗0 b∗−1 Ω gilt N(ρ) = 2 und Q(ρ) = 0. Es werden auch häufig die formal äquivalenten Erzeugungs- und Vernichtungsoperatoren a∗ (x), a(x) bzw. b∗ (x), b(x) verwendet. Sie erzeugen oder vernichten sie ein 20 Elektron bzw. Positron an der Stelle x. Formal gelten die folgenden Beziehungen: X X (2.3) a(x) = ei (x)ai , a∗ (x) = ei (x)a∗i , i≥0 (2.4) a(f ) = Z i≥0 d x f (x)a(x) , a∗ (f ) = G Z d x f (x)a∗ (x) . G Zum Beweis der Beziehungen setzten wir (2.4) in (2.3) ein und umgekehrt. Z X a(x) = ei (x) d y ei (y)a(y) = a(x) , G i≥0 a∗ (x) = X ei (x) a(f ) = ∗ a (f ) = Z d y ei (y)a∗ (y) = a∗ (x) , G i≥0 Z Z d x f (x) G X ei (x)ai = i≥0 d x f (x) G X X (ei , f )ai = a(f ) , i≥0 ei (x)a∗i = i≥0 X (ei , f )a∗i = a∗ (f ) . i≥0 Analoges gilt für die positronischen Operatoren: X X ei (x)bi , b∗ (x) = ei (x)b∗i , b(x) = i<0 i<0 b(f ) = Z d x f (x)b(x) , b∗ (f ) = G Es ergeben sich die Antikommutatoren Z d x f (x)b∗ (x) . G {a(x), a(y)} ={a∗ (x), a∗ (y)} = {b(x), b(y)} = {b∗ (x), b∗ (y)} ={a# (x), b# (y)} = 0 und {a(x), a∗ (y)} = P+ (x, y) , {b∗ (x), b(y)} = P− (x, y) , wobei P± (x, y) der Integralkern des Projektors P± ist. Wir beweisen lediglich die nichttriviale Antikommutatorbeziehung für Elektronen: X X {a(x), a∗ (y)} = ei (x)ej (y){ai , a∗j } = ei (x)ei (y) = P+ (x, y) . i,j≥0 i≥0 Die Feldoperatoren definiert man ebenfalls analog als Ψ(x) := a(x) + b∗ (x) und Ψ(x)∗ := a∗ (x) + b(x) . Die Antikommutationsrelationen der Feldoperatoren ergeben sich leicht aus dem bereits Gesagten: {Ψ∗ (x), Ψ∗ (y)} = {Ψ(x), Ψ(y)} = 0 , {Ψ(x), Ψ∗ (y)} = P+ (x, y) + P− (x, y) = δ(x, y) , mit dem Integralkern der Identität δ(x, y). 21 Quantenelektrodynamik Ausgangspunkt ist der QED-Hamiltonoperator nach Bjorken und Drell [17, Formel 15.28]. Mit dem Coulomb-Diracoperator D Z und unter Vernachlässigung des magnetischen Vektorpotentials lautet er Z bare H := d x : Ψ∗ (x)D Z Ψ(x) : G Z Z α 1 : Ψ∗ (x)Ψ(x) :: Ψ∗ (y)Ψ(y) : . + dx dy 2 G |x − y| G Der erste Term ist die Einteilchenenergie, also die kinetische Energie und die Coulombenergie bezüglich des Atomkerns. DerPzweite ist die Energie der Coulombwechselwirkung zwischen den Teilchen, wobei 4τ =1 : Ψ∗ (x, τ )Ψ(x, τ ) : die Ladungsdichte am Punkt x ist. Der Hamiltonoperator ist mittels (2.3) formal äquivalent zu XZ d x ei (x)D Z ej (x) : Ψ∗i Ψj : i,j∈ G Z Z 1 α X dx dy + ei (x)ej (y)ek (x)el (y) : Ψ∗i Ψk :: Ψ∗j Ψl : . 2 i,j,k,l∈ G |x − y| G Für die auftretenden Matrixelemente verwenden wir die Abkürzungen Z Z ei (x)ej (y)ek (x)el (y) Z Z . Di,j := (ei , D ej ) und Wi,j;k,l := dx dy |x − y| G G Man beachte, dass wegen der Wahl der Orthonormalbasis (ei ∈ H 1/2 ) alle Matrixelemente endlich sind (zum Beweis siehe Lemma 5.4 im Anhang). Somit erhalten wir X α X Z Hbare = Di,j : Ψ∗i Ψj : + Wi,j;k,l : Ψ∗i Ψk :: Ψ∗j Ψl : 2 i,j,k,l∈ i,j∈ und der Erwartungswert der Energie im Zustand ρ ist folglich X α X bare Z (2.5) EZ,α (ρ) = Di,j ρ(: Ψ∗i Ψj :) + Wi,j;k,l ρ(: Ψ∗i Ψk :: Ψ∗j Ψl :) . 2 i,j,k,l∈ i,j∈ Wir werden der Frage nach der Konvergenz dieser Summen keine große Aufmerksamkeit schenken, da sie im Allgemeinen von der gewählten Basis abhängt. Relevant für die Energie sollte allerdings nur die Zerlegung von H in H+ und H− sein. Eine Möglichkeit (2.5) basisunabhängig zu schreiben wäre, die Summen als Spuren der zugehörigen Operatoren aufzufassen. Da das jedoch auch ein willkürlicher Schritt ist, wollen die Summen vorerst nur formal betrachten und sie als Motivation zur Definition des Energiefunktionals (2.24) benutzen. An der Einteilchenenergie (vergleiche (2.5)) sieht man deutlich den Effekt der Normalordnung. Es ist : Ψ∗i Ψj : = : a∗i + bi aj + b∗j : = : a∗i aj + a∗i b∗j + bi aj + bi b∗j : = a∗i aj + a∗i b∗j + bi aj − b∗j bi , 22 und die Differenz zu dem nicht normalgeordneten Ausdruck ist ( 1 i=j<0 . Ψ∗i Ψj − : Ψ∗i Ψj : = bi b∗j + b∗j bi = {bi , b∗j } = 0 sonst Man erkennt hier unter anderem noch einmal die generelle Tatsache, dass der Vakuumerwartungswert von normalgeordneten Ausdrücken verschwindet. Die Einteilchenenergie des Vakuums ohne Normalordnung wäre aber X Di,i = −∞ , i<0 die Einteilchenenergie des Diracsees. Untersuchen wir die Coulombenergie näher, so stellen wir fest, dass diese im Allgemeinen im Vakuum einen nicht verschwindenden Erwartungswert hat. Der nicht verschwindende Beitrag kommt von dem Term ( 1 i = l < 0, k = j ≥ 0 ∗ ∗ hΩ, bi ak aj bl Ωi = 0 sonst und ist gleich X Wi,j;j,i = i<0,j≥0 X Z i<0,j≥0 G dx Z dy G ei (x)ej (x)ei (y)ej (y) . |x − y| Der Vakuumerwartungswert hängt also von der gewählten Zerlegung von H ab; wählt man zum Beispiel als H+ die ersten beiden Spinkomponenten, verschwinden die Integranden bereits punktweise, und somit auch der Erwartungswert. Allgemein gilt für die Matrixelemente (wegen ei ∈ H 1/2 ) Wi,j;j,i ≥ 0, da sie Diagonalelemente des so genannten Coulombskalarprodukts Z 1 f (x)g(y)|x − y|−1 d x d y D(f, g) := 2 6 sind. Dies sieht man für C0∞ -Funktionen mit der Fouriertransformation von D(f, g) (vergleiche Lemma 5.5); unser Fall folgt mit der Endlichkeit der Matrixelemente (Lemma 5.4) und einem Stetigkeitsargument analog zum Beweis von Lemma 5.6 oder nach einer anderen Methode mit [30, Theorem 9.8]. Damit kann man leicht zeigen, dass obiger Vakuumerwartungswert für den masselosen freien Diracoperator unendlich oder nicht basisunabhängig ist. In diesem Fall sind die Teilräume H+ und H− streckungsinvariant, und wegen des Skalierungsverhaltens der Summanden reicht es damit einen nicht verschwindenden Term zu finden. Wir führen diese instruktive Rechnung in Abschnitt 5.2 im Anhang durch. Bach et al. [4] haben deshalb den Wechselwirkungsterm X Wi,j;k,l : Ψ∗i Ψk :: Ψ∗j Ψl : i,j,k,l∈ vollständig normalgeordnet: X i,j,k,l∈ Wi,j;k,l : Ψ∗i Ψ∗j Ψl Ψk : . 23 Es wurde später von Lieb und Siedentop [28] gezeigt, dass dieser Übergang im Fall Z = 0 und bei Einführung eines Ultraviolett-Cutoffs im Impulsraum einer Renormierung des Diracoperators entspricht. Der Vakuumerwartungswert verschwindet bei dieser Ordnung wiederum automatisch, unabhängig von der gewählten Zerlegung von H. Die Energie eines Zustands ρ ist also X α X Z Di,j ρ(: Ψ∗i Ψj :) + Wi,j;k,l ρ(: Ψ∗i Ψ∗j Ψl Ψk :) . (2.6) Eα (ρ) = 2 i,j∈ i,j,k,l∈ Unser Modell in dieser Arbeit basiert auf diesem Ausdruck, aber auch er hat noch ein Problem: er ist nicht stabil. Falls man für D Z den masselosen freien Diracoperator −iα·∇ einsetzt, kann man durch einen einfachen Zustand nach J. P. Solovej [unveröffentlicht] Instabilität zeigen. Wir berechnen die Energie des Zustands √ 1 − ε2 Ω + εa∗1 a∗2 b∗−2 b∗−1 Ω mit Basiselementen e−1 , e−2 , e1 und e2 , die wir unten genauer festlegen werden. Die kinetische Energie des Zustands ist 0 0 0 0 ε2 (D1,1 + D2,2 − D−1,−1 − D−2,−2 ). Zu der Wechselwirkung tragen nur die beiden Terme bi bj al ak und a∗i a∗j b∗l b∗k bei und daher ergibt sich die Wechselwirkungsenergie zu √ 2 1 − ε2 ε<(W−1,−2;1,2 + W−2,−1;2,1 − W−2,−1;1,2 − W−1,−2;2,1 ) √ = 4 1 − ε2 ε<(W−1,−2;1,2 − W−2,−1;1,2 ) . Wählt man nun e1 , e2 ∈ H+ und e−1 , e−2 ∈ H− nach Lemma 5.7, so dass obiger Term nicht verschwindet, ist mit einem kleinen ε des richtigen Vorzeichens die Energie negativ. Da diese im masselosen Fall wie inverse Länge skaliert und die Teilräume H+ und H− streckungsinvariant sind, kann man durch zusammenziehen des Zustands auf einen Punkt bei gleich bleibender Teilchenzahl beliebig negative Energien erreichen. Dieses Problem kann man umgehen, indem man die Menge der Zustände auf verallgemeinerte Hartree-Fock-Zustände beschränkt. Die Hartree-Fock-Näherung Wir definieren zuerst die Menge der Hartree-Fock-Zustände. Definition 2.3. Ein verallgemeinerter Hartree-Fock-Zustand ist ein Zustand ρ endlicher Teilchenzahl (N(ρ) < ∞) mit folgender Eigenschaft: Für alle endlichen Folgen d1 , d2 , . . . , d2K von Operatoren aus der Menge aller Erzeugungs- und Vernichtungsoperatoren {a(f ), a∗ (f ), b(f ), b∗ (f )|f ∈ H} gilt ρ(d1 d2 · · · d2K−1) = 0 und ρ(d1 d2 · · · d2K ) = X σ∈S sgn(σ)ρ(dσ(1) dσ(2) ) · · · ρ(dσ(2K−1) dσ(2K) ) , wobei S ⊆ S2K die Menge der Permutationen mit σ(1) < σ(3) < · · · < σ(2K − 1) und σ(2i − 1) < σ(2i) für 1 ≤ i ≤ K bezeichnet. 24 Insbesondere ist das Vakuum ein Hartree-Fock-Zustand und obige Darstellung seines Erwartungswerts wird auch als Wick-Theorem bezeichnet. Hartree-FockZustände vertragen sich gut mit der Normalordnung. Folgendes Lemma wurde uns von D. Hundertmark [unveröffentlicht] vorgeschlagen und für den für uns wesentlichen Zweiteilchenfall (K = 2) auch bewiesen. Lemma 2.4. Für einen Hartree-Fock-Zustand ρ gilt mit obigen Bezeichnungen X (2.7) ρ(: d1 d2 · · · d2K :) = sgn(σ)ρ(: dσ(1) dσ(2) :) · · · ρ(: dσ(2K−1) dσ(2K) :) . σ∈S Beweis. Nehmen wir an, die Folge d1 d2 · · · d2K sei bereits normalgeordnet. Dann sind auch alle Paare normalgeordnet, die auf der rechten Seite von (2.7) auftreten. Somit gilt die Behauptung nach der Definition von Hartree-Fock-Zuständen. Für den allgemeinen Fall stellen wir zuerst fest, dass : d1 d2 · · · d2K : ein antikommutierender Ausdruck ist, also das Vertauschen zweier Operatoren das Vorzeichen des Ausdrucks ändert. Die rechte Seite von (2.7) lässt sich somit auch als Summe über die Menge S2K aller Permutationen von {1, . . . , 2K} schreiben: X 1 sgn(σ)ρ(: dσ(1) dσ(2) :) · · · ρ(: dσ(2K−1) dσ(2K) :) . K!2K σ∈ 2K Dies zeigt aber, dass das Vertauschen zweier Operatoren auf beiden Seiten von (2.7) lediglich das Vorzeichen ändert. Damit ist das Problem auf den anfangs behandelten Fall zurückgeführt. Mit anderen Worten sind die Mehrteilchendichten eines Hartree-Fock-Zustands eine Summe aus Produkten seiner Einteilchendichten; sie sind insbesondere durch diese bereits eindeutig bestimmt, da Zustände durch ihre Werte auf den Monomen von Erzeugungs- und Vernichtungsoperatoren festgelegt sind. Für die Zweiteilchendichte in der QED-Energie (2.6) folgt die Gleichung (2.8) ρ(: Ψ∗i Ψ∗j Ψl Ψk :) = ρ(: Ψ∗i Ψ∗j :)ρ(: Ψl Ψk :) − ρ(: Ψ∗i Ψl :)ρ(: Ψ∗j Ψk :) + ρ(: Ψ∗i Ψk :)ρ(: Ψ∗j Ψl :) . Aus (2.7) sieht man allgemein, dass sich Hartree-Fock-Zustände aus den beiden Matrizen γi,j = ρ(: Ψ∗j Ψi :) und υi,j = ρ(: Ψj Ψi :) zusammensetzen. Dies veranlasst uns zu folgender Definition. Definition 2.5. Eine Ladungsdichtematrix ist ein selbstadjungierter Operator Γ auf H × H mit den Eigenschaften: (1) γ υ Γ= , υ ∗ −γ wobei υ ∗ = −υ und die Spuren Sp P+ γP+ und Sp P− γP− endlich sind. (2) P− 0 P+ 0 − ≤Γ≤ . 0 P+ 0 P− 25 Unter der komplexen Konjugation einer Matrix verstehen wir die komplexe Konjugation aller Elemente: γ i,j := γi,j . Aus der Definition folgen unmittelbar die Eigenschaften γ = γ ∗ , 0 ≤ P+ γP+ ≤ 1 und −1 ≤ P− γP− ≤ 0. Wir betrachten die Zerlegung von Γ bezüglich H+ und H− , γ++ γ+− υ++ υ+− γ−+ γ−− υ−+ υ−− , Γ= ∗ ∗ υ++ υ−+ −γ̄++ −γ̄+− ∗ ∗ υ+− υ−− −γ̄−+ −γ̄−− ∗ mit γ++ := P+ γP+ , γ+− := P+ γP− , γ−+ := P− γP+ = γ+− und γ−− := P− γP− . Analoges gilt für die Blöcke von υ. Die Matrixelemente sind (2.9) γi,j = ρ(: Ψ∗j Ψi :), (γ++ )i,j = ρ(a∗j ai ), (γ+− )i,j = ρ(bj ai ), (γ−− )i,j = −ρ(b∗i bj ) υi,j = ρ(: Ψj Ψi :), (υ++ )i,j = ρ(aj ai ), (υ+− )i,j = ρ(b∗j ai ), (υ−− )i,j = ρ(b∗j b∗i ) . Den Zusammenhang von Γ mit den Zuständen zeigt folgendes Lemma aus [4]. Lemma 2.6. Jeder Zustand endlicher Teilchenzahl definiert eine Ladungsdichtematrix Γρ durch (2.10) (h, Γρ g) = ρ : [Ψ∗ (g1 ) + Ψ(g̃2 )][Ψ(h1 ) + Ψ∗ (h̃2 )] : P mit h := (h1 , h2 ) ∈ H2 , g := (g1 , g2 ) ∈ H2 und für f = k∈ λk ek sei P f˜ = k∈ λk ek . Die komplexe Konjugation dient dazu, die rechte Seite von (2.10) in g linear und in h antilinear zu machen. Beweis. Wir werden aus Gründen der besseren Übersicht auf den Index ρ bei der Ladungsdichtematrix verzichten, und im Folgenden frei zwischen Γ und ρ wechseln. Durch Einsetzen der Basis erhält man für den oberen linken Block γi,j = ρ(: Ψ∗j Ψi :) = ρ(a∗j ai + a∗j b∗i + bj ai − b∗i bj ) , und wegen der Eigenschaft ρ(A∗ ) = ρ(A) der Zustände gilt γj,i = ρ(a∗j ai + a∗j b∗i + bj ai − b∗i bj ) = γi,j , was die Selbstadjungiertheit von γ impliziert. Rechts unten steht die Matrix mit Elementen ρ(: Ψj Ψ∗i :) = ρ(−a∗i aj + aj bi + b∗j a∗i + b∗j bi ) und wegen ρ(: Ψ∗j Ψi :) = ρ(ai a∗j + bi aj + a∗i b∗j − b∗j bi ) sind diese durch ρ(: Ψj Ψ∗i :) = −γi,j gegeben. Der obere rechte Block ergibt sich zu υi,j = ρ(: Ψj Ψi :) = ρ(aj ai − b∗i aj + b∗j ai − b∗j b∗i ) = ρ(Ψj Ψi ) ; die Normalordnung hat hier keine Auswirkung, da alle Terme antikommutieren. Deshalb gilt auch υj,i = ρ(Ψi Ψj ) = −ρ(Ψj Ψi ) = −υi,j . Die Matrixelemente links unten sind ρ(: Ψ∗j Ψ∗i :) = ρ(Ψ∗j Ψ∗i ) = −ρ(Ψi Ψj ) = υj,i , 26 also steht dort der zu υ adjungierte Operator. Ließe man in (2.10) die Normalordnung weg, ergäbe sich die nicht renormierte Matrix γ + P− υ , (2.11) Γur = υ∗ −γ + P+ wie man den vorangegangenen Ausführungen leicht entnehmen kann. Von ihr kann man zeigen, dass sie die übliche Ungleichung für Einteilchen-Dichtematrizen 0 ≤ Γur ≤ 1 erfüllt (vergleiche (2.14)). Mit g = (g1 , g2 ) ∈ H2 normiert, 1 = kgk2 = kg1 k2 + kg2 k2 , berechnen wir 0 ≤ (g, Γur g) = ρ ([Ψ∗ (g1 ) + Ψ(g̃2 )][Ψ(g1 ) + Ψ∗ (g̃2 )]) = (kg1 k2 + kg2 k2 )ρ(1) − ρ ([Ψ(g1 ) + Ψ∗ (g̃2 )][Ψ∗ (g1 ) + Ψ(g̃2 )]) ≤ 1 . Daher kann man Ladungsdichtematrizen als das normalgeordnete Gegenstück zu Einteilchen-Dichtematrizen auffassen. Hieraus folgt auch sofort die Ungleichung für Ladungsdichtematrizen. Es bleibt noch zu zeigen, dass die Spuren von γ++ und γ−− endlich sind. Dies folgt aus der endlichen Teilchenzahl des Zustands und der Positivität von γ++ und −γ−− . Überträgt man die Teilchenzahl von ρ auf die Ladungsdichtematrix Γ erhält man ! ! ! X X X N(ρ) = ρ (a∗i ai + b∗i bi ) = ρ : Ψ∗i Ψi : − ρ : Ψ∗i Ψi : (2.12) i≥0 i<0 i∈ = Sp γ++ − Sp γ−− =: N(Γ) = N(γ) . Satz 2.7. Mittels (2.10) wird die Menge der Hartree-Fock-Zustände bijektiv auf die Menge der Ladungsdichtematrizen abgebildet. Beweis. Noch zu zeigen ist hierbei, dass es zu jeder Ladungsdichtematrix auch einen Hartree-Fock-Zustand gibt. Dies führen wir mit einem Beweis aus [4] auf den entsprechenden Satz [1, Theorem 2.3] für Hartree-Fock-Zustände mit nur einer Art von Teilchen zurück. Wir konjugieren Γur mit der orthogonalen Matrix 1 0 0 0 0 0 0 1 W = W ∗ = W −1 := 0 0 1 0 0 1 0 0 und erhalten Γur,W := W Γur W ∗ γ++ υ+− υ++ γ+− ∗ υ ∗ −γ −+ υ−− +− −γ −− . = ∗ ∗ υ++ −γ +− 1 − γ ++ υ−+ γ−+ υ−− υ−+ 1 + γ−− 27 Mit den Matrizen γur,W := γ++ υ+− ∗ υ+− −γ −− und υur,W := υ++ γ+− ∗ −γ −+ υ−− schreibt sich die konjugierte Matrix in der gewohnten Form γur,W υur,W Γur,W = . ∗ υur,W 1 − γ ur,W ∗ Wegen γ = γ ∗ und υ ∗ = −υ gelten für die transformierten Matrizen γur,W = γur,W ∗ und υur,W = −υ ur,W . Aus 0 ≤ Γur ≤ 1 folgt 0 ≤ Γur,W ≤ 1 und somit auch, dass γur,W mit γ++ und γ−− endliche Spur hat. Wie man an den Matrixelementen (2.9) sieht, entspricht der Verzicht auf die Normalordnung und die Konjugation mit W dem Wechsel in einen Fockraum mit nur einer Sorte von Teilchen mit Erzeugern c∗i und Vernichtern ci für i ∈ Z und ( ( a∗i i ≥ 0 ai i ≥ 0 . und c∗i := Ψ∗i = (2.13) ci := Ψi = ∗ bi i < 0 bi i < 0 Da die CAR für Ψ und Ψ∗ gelten, folgen sie auch unmittelbar für c. In unserem Modell ist dieser Fockraum als der Spezialfall H+ = H enthalten. Daraus ergibt sich mit (2.11) die Definition der Einteilchen-Dichtematrizen als selbstadjungierte Operatoren Γc mit den Eigenschaften: γc υc (2.14) Γc = mit 0 ≤ Γc ≤ 1 und υc∗ = −υc . υc∗ 1 − γc Die Teilchenzahl ist analog durch die Spur von γc gegeben. Die Konjugation mit W ist also eine Bijektion zwischen den nicht normalgeordneten Ladungsdichtematrizen Γur und den Einteilchen-Dichtematrizen Γc endlicher Teilchenzahl. Letztere sind wegen ihrer einfacheren Struktur leichter zu handhaben. Aus der Definition der Hartree-Fock-Zustände sieht man auch, dass die Menge der Hartree-Fock-Zustände unter der Transformation (2.13) zwischen Ψ und c gleich bleibt. In [1, Theorem 2.3] wird zu jeder Einteilchen-Dichtematrizen Γc endlicher Teilchenzahl die Existenz eines zugehörigen Hartree-Fock-Zustands gezeigt. Daraus folgt mit der Transformation (2.13) auch die Existenz eines Zustands ρ mit nicht normalgeordneter Ladungsdichtematrix Γur . Die Ladungsdichtematrix von ρ ist dann Γ, was den Beweis abschließt. Aus der Ungleichung 0 ≤ Γur ≤ 1 (vergleiche (2.11)) folgt Γ2ur ≤ Γur , und dies ausgewertet für den oberen linken Block gibt (γ + P− )2 + υυ ∗ ≤ γ + P− oder (2.15) γ 2 + P− γ + γP− + υυ ∗ ≤ γ . Die beiden Diagonalelemente dieser Ungleichung bezüglich H+ und H− sind (2.16a) (2.16b) 2 ∗ ∗ ∗ γ++ + γ+− γ+− + υ++ υ++ + υ+− υ+− ≤ γ++ 2 ∗ ∗ ∗ γ−− + γ+− γ+− + υ−− υ−− + υ−+ υ−+ ≤ −γ−− und somit folgt aus der endlichen Spur von γ++ und γ−− , dass γ und υ HilbertSchmidt-Operatoren sind. 28 Wir sagen, die Ladungsdichtematrix Γ bzw. der zugehörige Hartree-Fock-Zustand habe endliche kinetische Energie, falls γ die Bedingung p p γ++ 0 ] ] T0 (γ) := Sp |p|γ |p| < ∞ mit γ := 0 −γ−− erfüllt. Mit Lemma p 5.3 ist dann auch die kinetische Energie massiver Teilchen (zur 0 Erinnerung: |D | = p2 + m2 ) endlich: p p p Sp (p2 + m2 )1/4 γ ] (p2 + m2 )1/4 = Sp γ ] p2 + m2 γ ] p p ≤ Sp γ ] (|p| + m) γ ] ≤ T0 (γ) + mN(γ) . Wir definieren die Einteilchenenergie von Zuständen endlicher kinetischer Energie durch p p p p (2.17) T (γ) := Sp γ ] |D Z | γ ] = Sp |D Z |γ ] |D Z | und da (2.18) π π 0 Z 0 0 |D | ≤ P+ |D |P+ + P− |D |P− + P− |p|P− ≤ P+ |D |P+ + 1 + P− |D 0 |P− , 2 2 ist diese auch endlich. Die Betragsungleichung beweist man mit (f, g) ∈ (H+ ⊕H− )∩ (H 1/2 (R3 ) ⊗ C4 ) und Zα 0 ≤ (f, |D Z |f ) = (f, D0 f ) − (f, f ) ≤ (f, |D 0 |f ) , |x| π Zα g) ≤ (g, |D 0|g) + (g, |p|g) . 0 ≤ (g, |D Z |g) = −(g, D 0 g) + (g, |x| 2 Ist darüber hinaus D Z γ Spurklasse, so gilt Sp D Z γ = Sp |D Z |(γ++ − γ−− ) , und nach Lemma 5.3 stimmt dieser Ausdruck mit der Einteilchenenergie T (γ) überein. Wir definieren nun die zu der QED-Energie (2.6) äquivalente Energie für Ladungsdichtematrizen. Die Einteilchenenergie T (γ) ist offensichtlich formal die gleiche wie in (2.6) und der Wechselwirkungsterm zerfällt für Hartree-Fock-Zustände nach (2.8) in drei Terme: X Wi,j;k,l ρ(: Ψ∗i Ψ∗j :)ρ(: Ψl Ψk :) − ρ(: Ψ∗i Ψl :)ρ(: Ψ∗j Ψk :) i,j,k,l∈ (2.19) = X i,j,k,l∈ +ρ(: Ψ∗i Ψk :)ρ(: Ψ∗j Ψl :) Wi,j;k,l (υi,j υk,l − γl,iγk,j + γk,iγl,j ) . Der erste, Z X Z X ei (x)ej (y)ek (x)el (y) Wi,j;k,l υi,j υk,l = (ei , υej )(ek , υel ) , dx dy |x − y| G G i,j,k,l∈ i,j,k,l∈ 29 führt zur Paarenergie. Da υ ein Hilbert-Schmidt-Operator ist, können wir die FunkP tion υ(x, y) := i,j∈ (ei , υej )ei (x)ej (y) auf dem Produktraum L2 (G × G) definieren und mit dem unitären Basiswechsel B : H → H, ei 7→ ei , ist υ(x, y) der Integralkern von υB (vergleiche Abschnitt 5.1 über Hilbert-Schmidt-Operatoren). Damit definieren wir die Paarenergie als Z |υ(x, y)|2 (2.20) WP (Γ) = WP (υ) := dxdy , |x − y| G×G das Betragsquadrat der Funktion |x − y|−1/2 υ(x, y) in L2 (G × G). Für Ladungsdichtematrizen endlicher kinetischer Energie ist dieser Ausdruck endlich. Mit der Ungleichung von Kato (1.2) erhalten wir Z Z π |υ(x, y)|2 dxdy ≤ υ(x, y)|∇x |υ(x, y) d x d y WP (υ) = 2 G×G G×G |x − y| 4 Z π X = υ(p, τ ; q, σ)|p|υ(p, τ ; q, σ) d p d q . 2 σ,τ =1 6 Der obige Ausdruck ist bis auf den Faktor das Quadrat der Hilbert-Schmidt-Norm p des Operators |p|υB und damit gleich p p π Sp |p|υυ ∗ |p| . 2 An dieser Stelle benötigen wir ein elementares Lemma für beschränkte Operatoren, das wir auch kurz beweisen werden: υυ ∗ ≤ 2 P+ (υυ ∗)P+ + P− (υυ ∗)P− . Das Produkt υυ ∗ schreibt sich in Blockform als ∗ ∗ ∗ ∗ υ++ υ++ + υ+− υ+− υ++ υ−+ + υ+− υ−− ∗ (2.21) υυ = . ∗ ∗ ∗ ∗ υ−+ υ++ + υ−− υ+− υ−− υ−− + υ−+ υ−+ Wir betrachten die Summe von zwei positiven Operatoren, ∗ ∗ ∗ ∗ 0 ≤ (υ++ − υ−+ )(υ++ − υ−+ ) + (υ−− − υ+− )(υ−− − υ+− ), und formen diese zu folgender Ungleichung um: ∗ ∗ ∗ ∗ υ++ υ−+ + υ+− υ−− + υ−+ υ++ + υ−− υ+− ∗ ∗ ∗ ∗ ≤ υ++ υ++ + υ+− υ+− + υ−− υ−− + υ−+ υ−+ . Somit sind die Diagonalelemente von (2.21) größer gleich den Nebendiagonalelementen und es folgt die Behauptung. Verwenden wir nun noch die Ungleichung (2.16), so bekommen wir die obere Schranke p p π Sp |p|γ ] |p| = πT0 (γ) . Die Austauschenergie ist motiviert durch den zweiten Term von (2.19), Z X Z X ei (x)ej (y)ek (x)el (y) Wi,j;k,l γl,iγk,j = (ei , γel )(ek , γej ) , dx dy |x − y| G G i,j,k,l∈ i,j,k,l∈ 30 und mit γ(x, y) := (2.22) P (ei , γej )ei (x)ej (y) definieren wir sie als Z |γ(x, y)|2 . WX (Γ) = WX (γ) := dxdy |x − y| G×G i,j∈ Ihre Endlichkeit wird im Beweis der Stabilität des Elektronen-Positronen-Felds ohne externes Potential (Abschnitt 3.1) analog zur Endlichkeit der Paarenergie gezeigt. Etwas anders behandeln wir die klassische elektrostatische oder auch direkte Energie, die zum dritten Term in (2.19) gehört. Um die Ladungsdichte definieren zu können, müssen wir voraussetzen, dass γ Spurklasse ist. Mit den linear unabhängigen Eigenfunktionen fi zu den nicht verschwindenden Eigenwerten λi von γ ist die Ladungsdichte gegeben durch ργ (x) := 4 X X τ =1 i λi |fi (x, τ )|2 . Wegen der Voraussetzung ist sie eine wohldefinierte L1 (R3 )-Funktion. Bezüglich der gewählten Basis ist der dritte Term gleich X Wi,j;k,l γk,iγl,j ; i,j,k,l∈ wechselt man zu einer Basis aus Eigenfunktionen von γ, so kann man diesen durch die Ladungsdichte ausdrücken. Wir definieren also die direkte Energie als Z ργ (x)ργ (y) = 2D(ργ , ργ ) . (2.23) WD (Γ) = WD (γ) := dxdy |x − y| 3× 3 p p P Sie ist endlich, wenn wir zusätzlich Sp |γ||∇| |γ| = i |λi|(fi , |p|fi ) < ∞ fordern: P P Z 2 2 i |λi | |fi (x)| j |λj | |fj (y)| WD (γ) ≤ dxdy |x − y| G×G Z X X π ≤ dxdy |λi | fi (x) |∇x | fi (x) |λj | |fj (y)|2 2 G×G j i∈ p p π = Sp |γ| Sp |γ||∇| |γ| < ∞ . 2 p p Und falls Sp |γ||∇| |γ| < ∞, so hat die Ladungsdichtematrix auch endliche Einteilchenenergie. Mit Ungleichung (2.18) haben wir p p p p π T (γ) = Sp γ ] |D Z | γ ] ≤ Sp γ ] P+ |D 0|P+ + 1 + P− |D 0 |P− γ] , 2 und jeder dieser Terme ist beschränkt; z.B. gilt p p p p p p Sp γ ] P+ |D 0 |P+ γ ] = Sp |D 0 |P+ γ ] P+ |D 0 | ≤ Sp |D 0 |P+ |γ|P+ |D 0 | , da für alle f ∈ H+ und g ∈ H− folgende Ungleichungen gelten: (f, |γ|f ) ≥ |(f, γf )| = (f, γ++ f ) , (g, |γ|g) ≥ |(g, γg)| = (g, −γ−− g) . Mit dieser Vorarbeit können wir schließlich das Energiefunktional definieren. 31 Definition 2.8 (Das Hartree-Fock-Funktional). Wir schreiben X für die Menge aller Ladungsdichtematrizen Γ mit p p Sp |γ||∇| |γ| < ∞ und Sp |γ| < ∞ , und DHF für die mittels der Zuordnung (2.10) äquivalente Menge von HartreeFock-Zuständen. Die Elemente von X und DHF heißen Ladungsdichtematrizen bzw. Hartree-Fock-Zustände endlicher Energie. Die Energie einer Ladungsdichtematrix aus der Menge X ist gegeben durch das Hartree-Fock-Funktional EZ,α : X → R, (2.24) Z Z α |υ(x, y)|2 |γ(x, y)|2 α EZ,α(Γ) = T (γ) + dxdy dxdy + αD(ργ , ργ ) − . 2 |x − y| 2 |x − y| Da wir aber in dieser Arbeit nur am Infimum der Energie interessiert sind, stellen wir fest, dass die Paarenergie für unsere Betrachtungen unwesentlich ist. Sie ist nichtnegativ und mit γ 0 γ υ 0 erfüllt auch Γ := Γ= 0 −γ υ ∗ −γ die Bedingungen an eine Ladungsdichtematrix. Es gilt also EZ,α(Γ) ≥ EZ,α(Γ0 ) bei N(Γ) = N(Γ0 ) . Darum werden wir im Folgenden ausschließlich mit dem Energiefunktional Z α |γ(x, y)|2 EZ,α(γ) = T (γ) + αD(ργ , ργ ) − dxdy 2 |x − y| arbeiten und γ, in Missbrauch der Notation, auch als Ladungsdichtematrix bezeichnen. Resultate In Artikel [4] zeigten Bach, Barbaroux, Helffer und Siedentop, dass die Energie im Falle Z = 0 und α ≤ 4/π nichtnegativ ist (Abschnitt 3.1). Von Hundertmark, Röhrl und Siedentop wurde in [16] (Abschnitt 3.3) gezeigt, dass für größeres α die Energie pro Teilchen nach unten unbeschränkt ist. Die kritische Konstante für Stabilität der zweiten Art ist also α = 4/π. Für Atome (Z 6= 0) ist im physikalischen Fall (α ≈ 1/137) die Energie nach [4] nichtnegativ für Z ≤ 68. Von Brummelhuis, Röhrl und Siedentop wurde das Resultat in [11] bis Z = 117 gezeigt (Abschnitt 4). Letzteres umfasst alle in der Natur vorkommenden Elemente. Mit einem klassischen elektromagnetischen Feld konnten Bach et al. Stabilität von Atomen bis Z = 67 (Holmium) beweisen [4]. Die Stabilität der Materie in diesem Kontext wurde in [3] für den physikalischen Fall ebenfalls für Z ≤ 67 gezeigt. In beiden Resultaten ist die Energie wiederum nichtnegativ. Die Tatsache, dass die Energie in all diesen Modellen im Stabilitätsfall nichtnegativ ist, kann man von einem ästhetischen Standpunkt aus begrüßen. Da bei allen in vorliegender Arbeit betrachteten Systemen die Energie des Hartree-Fock-Vakuums verschwindet, folgt damit dass dieses ein Grundzustand ist. Für Z und α kleiner als die kritischen Werte (z.B. α < 4/π bei Z = 0) ist er zudem eindeutig. 32 Betrachtet man das Elektronen-Positronen-Feld ohne externes Potential, so ist das Hartree-Fock-Vakuum als Grundzustand naheliegend. Für ein Atom (Z 6= 0) würde man aber einen neutralen Grundzustand erwarten, also etwa Q(γ) = Z. Um die Existenz zusätzlicher Teilchen zu begünstigen, führen wir ein so genanntes chemisches Potential ein, d.h. wir subtrahieren ein µ-faches der Ruheenergie mN(γ). Dies hat den Effekt, dass die Erzeugung eines Teilchens um µm weniger Energie kostet. Man beachte, dass ein solcher Term die Stabilität des Modells unberührt lässt. Wenn man allerdings, wie im atomaren Fall, die Elektronen- und Positronenräume nicht explizit kennt, kann man auch die Teilchenzahl (vergleiche (2.12)) nicht einfach ausrechnen. Wir beschränken unsere Betrachtungen deshalb auf den Fall Z = 0. Wir zeigen in Abschnitt 3.4, dass der Grundzustand für α = 1/137 bis µ ≈ 0, 999983 unverändert das Hartree-Fock-Vakuum bleibt und die Energie für µ ≥ 1 nach unten unbeschränkt ist. Eine andere Möglichkeit, das Vakuum als Grundzustand zu vermeiden, ist, die Zahl der Teilchen N(γ) vorzuschreiben. Im Fall Z = 0 folgt aus den Resultaten für chemische Potentiale eine gute Abschätzung für das Infimum der Energie bei fester Teilchenzahl (Abschnitt 3.5). Es wurde von G.M. Graf auf einer Tagung in Sønderborg, Dänemark, zu diesem Thema angemerkt, dass man in der Natur Elektronen bereits vorfindet, um ein Positron zu erhalten aber ein Elektron-Positron-Paar erzeugen muss. Dies entspricht einem Potential der Form µmQ(γ) = µm Sp γ; Elektronen werden begünstigt und Positronen doppelt belastet. Diese Wahl verspricht realistischere Resultate und ist zudem auch technisch einfacher, da die Ladung die Spur der Ladungsdichtematrix ist und somit die Elektronen- und Positronenräume nicht direkt eingehen. Der Einfluss eines solchen Potentials auf den Grundzustand des Atoms wird Gegenstand unserer künftiger Forschung auf diesem Gebiet sein. 33 Das Infimum der Energie des Vakuums In diesem Abschnitt bestimmen wir in zwei Fällen das Infimum der Energie des Elektronen-Positronen-Felds ohne externes Potential in Hartree-Fock-Näherung. Zuerst stellen wir den Beweis für die Stabilität des Elektronen-Positronen-Felds aus [4] vor. Er zeigt, dass die Energie für α ≤ 4/π nichtnegativ ist. Für größere Werte der Feinstrukturkonstante α wurde das Infimum zuerst von Chaix, Iracane und Lions [13] untersucht, aber nur unvollständig behandelt. Wir werden in diesem Fall Ladungsdichtematrizen mit beliebig negativer Energie pro Teilchen konstruieren. Damit ist insbesondere die Optimalität des Stabilitätsresultats gezeigt. Im zweiten Teil führen wir das chemische Potential −µmN(γ) ein und puntersuchen den Grundzustand in Abhängigkeit von µ. Wir zeigen, dass für µ ≤ 1 − (πα/4)2 das Hartree-Fock-Vakuum der Grundzustand bleibt und dass die Energie für µ ≥ 1 nach unten unbeschränkt p ist. Daraus folgt für die Energie ohne chemisches Potential die untere Schranke 1 − (πα/4)2 mN(γ) und ein Intervall für das Infimum der Energie der Ladungsdichtematrizen mit fester Teilchenzahl N. Am Ende stellen wir einige technische Hilfssätze für die Abschätzungen bereit, die den Fluss der Beweise stören würden. Stabilität des Vakuums Satz 3.1 ([4]). Ist α ≤ 4/π, so gilt für alle Hartree-Fock-Zustände ρ ∈ DHF E0,α (ρ) ≥ 0 . Beweis. Wir passen den Beweis aus [4] an unsere Definitionen an. Zuerst schätzen wir mit der Ungleichung von Kato (1.2) die Austauschenergie nach oben ab: Z Z |γ(x, y)|2 π dxdy ≤ WX (γ) = γ(y, x)|∇x|γ(x, y) d x d y 2 G×G G×G |x − y| (3.1) p p π π π = Sp γ|∇|γ ≤ Sp γ|D 0 |γ = Sp |D 0 |γ 2 |D 0 | . 2 2 2 p Das zweite Integral ist das Quadrat der Hilbert-Schmidt-Norm von |p|γ und somit gleich der darauf folgenden Spur. Unter Verwendung der Ungleichungen (2.16a) und (2.16b) erhalten wir eine Abschätzung gegen die kinetische Energie: p p Sp |D 0|γ 2 |D 0 | p p p p = Sp P+ |D 0|P+ γ 2 P+ |D 0 |P+ + Sp P− |D 0 |P− γ 2 P− |D 0|P− 2 ∗ p p γ++ + γ+− γ+− 0 (3.2) 0 = Sp |D | |D 0 | 2 ∗ 0 γ−− + γ+− γ+− p p γ++ 0 0 |D 0 | = T (γ) . ≤ Sp |D | 0 −γ−− Für die Gesamtenergie folgt falls α ≤ 4/π. α π E0,α (γ) ≥ T (γ) 1 − ≥0, 22 34 Da die Einteilchenenergie für γ 6= 0 wegen ihrer Definition (2.17) und der Ungleichung (2.16) positiv ist, gilt dies auch für die Gesamtenergie bei α < 4/π; das Hartree-Fock-Vakuum ist somit für diese α der einzige Grundzustand. Implementation translationsinvarianter Dichtematrizen Zuerst stellen wir das unseren Rechnungen zugrunde liegende Prinzip vor. Aus praktischen Gründen weichen wir etwas von unserer Notation ab, indem wir die Spinkomponenten nicht in das Argument x = (x, τ ) schreiben, sondern Objekte mit Spin als Vektoren in C4 bzw. Matrizen in C4 × C4 auffassen. Ohne externes Potential ist der Diracoperator im Impulsraum gegeben durch die 4 × 4 Matrix m σ·p 0 , D (p) = σ · p −m welche mit Hilfe von cos θp − sin θp σ · ω p R(p) := sin θp σ · ω p cos θp diagonalisiert werden kann. Wir benutzen die Abkürzungen ωp := p/|p| für Vektoren p ∈ R3 \ {0}, E(p) := (p2 + m2 )1/2 für die relativistische kinetische Energie, cp = 1/2 1/2 cos θp := (E(p) + m)/2E(p) und sp = sin θp := (E(p) − m)/2E(p) für die Winkelfunktionen von θp . Hiermit gilt E(p) 0 ∗ 0 R (p)D (p)R(p) = . 0 −E(p) Ohne externes Potential können wir also Elektronen- und Positronenraum explizit angeben. Mit der Zerlegung von H in die beiden ersten und letzten Komponenten H̃+ := {f ∈ H|f3 = f4 = 0} und H̃− := {f ∈ H|f1 = f2 = 0} ist R∗ eine unitäre Transformation auf H mit R∗ (H+ ) = H̃+ und R∗ (H− ) = H̃− . Die notwendige Ungleichung −P− ≤ γ ≤ P+ für Ladungsdichtematrizen aus Definition 2.5 hat nun die Form 0 0 1 0 ∗ − ≤ R γR ≤ , 0 1 0 0 und P− ist gegeben durch 0 0 P− = R R∗ . 0 1 Wegen der Translationsinvarianz und der Symmetrie zwischen Elektronen und Positronen des Modells ohne externes Potential setzten Chaix et al. für die minimierende Folge translationsinvariante neutrale Zustände an. Ein solcher Zustand hat aber keine von Null verschiedene endliche Teilchenzahl in R3 , da sich in jedem Einheitswürfel gleich viele Teilchen befinden. Er ist also entweder das Vakuum oder kein Zustand im Sinne unserer Definition 2.5. Unter einer Dichtematrix“ wollen wir im Folgenden einen Operator γC : H → H ” mit −P− ≤ γC ≤ P+ verstehen; insbesondere ist eine Ladungsdichtematrix auch eine Dichtematrix. Die Dichtematrix γC eines translationsinvarianten Zustands ist ein Multiplikationsoperator im Impulsraum. Formal ist ihr Integralkern durch 35 γC (p)δ(p − q) gegeben und in Anlehnung an die Tatsache, dass die Spur eines Operators unter bestimmten Voraussetzungen das Integral über die Diagonale seines Integralkerns ist (vergleiche Lemma 5.2), kann man für die Teilchenzahl von γC in einem endlichen Volumen V folgenden Ausdruck schreiben: Z d p Sp 4 (γC )++ (p) − (γC )−− (p) δ(0) N(γC ) : = 3 Z = |V | d p Sp 4 (γC )++ (p) − (γC )−− (p) . 3 Dabei setzt man δ(0) = |V |, weil die Fouriertransformierte der δ-Funktion die konstante Funktion 1 und der Funktionswert einer Funktion an der Stelle 0 das Integral über ihre Fouriertransformierte ist. Der Weg, den Chaix et al. in [13] einschlugen, war, mit γC das Infimum der Energie pro Einheitsvolumen abzuschätzen. Dabei sind kinetische- und Austauschenergie im Einheitsvolumen formal gegeben durch Z d q Sp 4 |D 0 |(q) (γC )++ (q) − (γC )−− (q) T (γC ) := 3 bzw. Z γC (p) γC (q) 1 dq dp WX (γC ) := 2 , 2π |p − q|2 3 P wobei AB := i,j aij bij für zwei Matrizen A und B der gleichen Dimension. Wegen der Neutralität von γC verschwindet die Ladungsdichte punktweise, und somit auch die direkte Energie. Wir motivieren diese Formeln nicht weiter, da sie durch Analogie aus unseren exakten Berechnungen folgen werden. Wir implementieren dieselbe Dichtematrix γC mittels einer glatten, näherungsweise charakteristischen Abschneidefunktion χa,r im Ortsraum mit Radius r im ganzen Raum R3 . Für a → 0 nähert sich diese an die charakteristische Funktion Br der Kugel B(0, r) an. Genauer wählen wir eine kugelsymmetrische Funktion h ∈ C0∞ (R3 , R) mit supp h = B(0, 21 ), g := (ĥ/kĥk2 )2 und ga (x) := a−3 g(x/a) für a ∈ R+ . Dann gilt ||ga ||1 = 1 und ga ist nichtnegativ, da die Fouriertransformierte ĥ von h wegen der Symmetrie reell ist. Schließlich definieren wir die Abschneidefunktion als χa,r := Br ∗ gar . Damit setzen wir unsere Ladungsdichtematrix gleich γ := Rχa,r F χa,r R∗ , mit F := R∗ γC R . Um wirklich eine Ladungsdichtematrix zu erhalten, muss γC natürlich einige Bedingungen erfüllen, auf die wir später eingehen werden. Wesentlich bei der Konstruktion von γ sind sowohl die genaue Form von χa,r , als auch die Platzierung der 36 Abschneidefunktion zwischen R und F . Letztere sorgt dafür, dass wir in Koordinaten abschneiden, in denen Elektronen und Positronen in die ersten bzw. letzten beiden Spinkomponenten getrennt sind. Dadurch werden sie nicht vermischt und aus −P− ≤ γC ≤ P+ folgt −P− ≤ γ ≤ P+ . Wir verwenden folgende Eigenschaften von χa,r : Lemma 3.2. (1) Die Abschneidefunktion χa,r und damit auch ihre Fouriertransformation χ d a,r sind kugelsymmetrisch, d.h. ihr Funktionswert hängt nur von dem Betrag des Arguments ab. (2) Für alle r > 0, 1 ≤ s < ∞ gilt 0 ≤ χa,r ≤ 1 und ||χa,r ||ss = r 3 ||χa,1 ||ss < ∞. (3) Der Bruch Q := kχa,r k44 /kχa,r k22 ist kleiner oder gleich 1, unabhängig von r, und sein Grenzwert für a → 0 ist 1. (4) Im Impulsraum ist die Abschneidefunktion χa,r stetig, beschränkt und hat −1 kompakten Träger, genauer gilt supp χ d a,r ⊂ B(0, %) mit % := (ar) . Beweis. 1. Es gilt allgemein, dass Fouriertransformation und Faltung kugelsymmetrischer Funktionen wieder kugelsymmetrisch sind. 2. Die Skalierung der Normen in r folgt durch Substitution, da χa,r (x) = χa,1 (x/r). Die Werte von χa,r liegen zwischen 0 und 1, weil das Integral von ga über eine beliebige (messbare) Teilmenge von R3 zwischen diesen Zahlen liegt. Nach der Ungleichung von Young gilt schließlich für s ≥ 1 4 kB1 ∗ ga kss ≤ kB1 kss kga ks1 = π . 3 3. Es gilt Q ≤ 1 wegen kχa,r k44 ≤ kχa,r k22 und darüber hinaus gilt r 3 kB1 ∗ ga k44 kχa,r k44 = , kχa,r k22 r 3 kB1 ∗ ga k22 was die Unabhängigkeit von r zeigt. Der Bruch konvergiert gegen 1, da ga gegen die δ-Funktion strebt. Zum Beweis müssen wir nur zeigen, dass kB1 ∗ ga k44 → 4π/3 für a → 0. Der Funktionswert von B1 ∗ ga an der Stelle x ist Z Z B1 ∗ ga (x) = g(x/a − y) d y = g(y) d y B(0,1/a) B(x/a,1/a) 1 und da g eine nichtnegative L -Funktion ist, gibt es für jedes ε > 0 ein k ∈ N mit Z g(y) d y > 1 − ε . B(0,k) Für jedes l mit 0 < l < 1 existiert deshalb ein a mit B1 ∗ ga (x) > 1 − ε für alle x mit |x| ≤ l. Es ist also kB1 ∗ ga k44 > (1 − ε)4 34 πl3 . 4. Die Fouriertransformation von χa,r ist 3/2 c −1 −3/2 χ d Br gc h∗h. a,r = (2π) ar mit ĝ = kĥĥk1 (2π) cr das Integral einer, auf Beide Funktionen sind stetig nach der Wahl von h, und da B ihrem Träger gleichmäßig stetigen Funktion ist. Der Träger von gc ar berechnet sich 37 mit supp ĝ ⊂ B(0, 1) und der elementaren Eigenschaft der Fouriertransformation (3.3) Z Z x 1 1 −ipx e−iarpx g(x)dx = ĝ(arp) e g gc dx = ar (p) = (ar)3 (2π)3/2 3 ar (2π)3/2 −1 zu supp gc ar ⊂ B(0, (ar) ). Wir bestimmen jetzt die Energie der Ladungsdichtematrix γ und vergleichen sie mit der von γC . Der Integralkern von γ im Impulsraum ist Z −3/2 (3.4) γ(p, q) = d ξ(2π)−3/2 χ d χ d a,r (p − ξ)M(ξ, p, q)(2π) a,r (ξ − q) , 3 wobei M(ξ, p, q) := R(p)F (ξ)R∗ (q) . Wir setzen nun zusätzlich voraus, dass F (ξ) beschränkt ist und kompakten Träger in B(0, d) \ B(0, c) für c, d mit 0 ≤ c < d hat. Dann folgt aus der gleichmäßigen Stetigkeit von χ d d a,r die Stetigkeit von γ(p, q). Der Träger des Integranden χ a,r (p − ξ)M(ξ, p, q)d χa,r (ξ − q) liegt in der kompakten Menge D% := {(ξ, p, q) ∈ R9 |ξ|, |p|, |q| ∈ [c − 2%, d + 2%], |p − ξ| ≤ %, |q − ξ| ≤ %} , die wir mit Bedacht derartig wählen. Insbesondere hat auch der Integralkern γ(p, q) kompakten Träger. Um zu zeigen daß γ Spurklasse ist, betrachten wir den positiven Hilbert-SchmidtOperator B mit stetigem Integralkern Z ∗ −3/2 B(p, q) := d ξ(2π)−3/2 χ d χ d a,r (p − ξ)R(p)|F (ξ)|R (q)(2π) a,r (ξ − q) , 3 der für alle u ∈ H folgende Ungleichung erfüllt: ∗ |(u, γu)| = |(2π)−3 (R∗ u) ∗ χ d d a,r , F (R u) ∗ χ a,r | Damit gilt insbesondere ∗ ≤ (2π)−3 (R∗ u) ∗ χ d d a,r , |F |(R u) ∗ χ a,r = (u, Bu) . Sp |γ| ≤ Sp B , was sich durch Ausrechnen der Spur mit Hilfe der Eigenfunktionen von γ leicht einsehen lässt. Nach Lemma 5.2 ist die Spur eines positiven Operators mit stetigem Integralkern B(p, q) durch das Integral über die Diagonale B(p, p) gegeben, Z Sp B = B(p, p) d p . G Unter unseren Voraussetzungen ist dieses Integral endlich und somit γ also Spurklasse und schließlich eine Ladungsdichtematrix. Mit den Gleichungen 1 0 0 0 ∗ ∗ ∗ R P+ = R und R P− = R∗ 0 0 0 1 38 sehen wir, dass 1 0 1 0 M++ (ξ, p, q) := P+ R(p)F (ξ)R (q)P+ = R(p) F (ξ) R∗ (q) 0 0 0 0 ∗ =: R(p)F++ (ξ)R∗ (q) gilt, und somit der Integralkern von γ++ durch Z −3/2 γ++ (p, q) = d χ d d ξ(2π)−3/2 χ a,r (p − ξ)M++ (ξ, p, q)(2π) a,r (ξ − q) 3 gegeben ist. Analog definieren wir M−− und F−− . Mit dem Ansatz (3.4) und Lemma 5.2 ergibt sich für die Teilchenzahl von γ der endliche Ausdruck N(γ) = Sp(γ++ − γ−− ) Z −3 d q Sp = (2π) 3 4 γ++ (q, q) − γ−− (q, q) , was sich auch in folgender Form schreiben lässt: (3.5) N(γ) = Sp χa,r (F++ − F−− )χa,r Z 2 −3 d d q d ξ Sp 4 F++ (ξ) − F−− (ξ) χ = (2π) a,r (q − ξ) 6 Z −3 2 d ξ Sp 4 F++ (ξ) − F−− (ξ) . = (2π) kd χa,r k2 3 In gleicher Weise erhalten wir für die kinetische Energie p p T (γ) = Sp |D 0|(γ++ − γ−− ) |D 0 | Z p −3 d q q2 + m2 Sp 4 γ++ (q, q) − γ−− (q, q) , = (2π) 3 bzw. (3.6) T (γ) = Sp(p2 + m2 )1/4 χa,r (F++ − F−− )χa,r (p2 + m2 )1/4 Z p −3 2 = (2π) d q d ξ q2 + m2 Sp 4 F++ (ξ) − F−− (ξ) χ d a,r (q − ξ) . 6 Da der Integralkern γ(p, q) im Impulsraum beschränkt ist und kompakten Träger hat, ergibt sich mit Lemma 5.6 seine Austauschenergie zu (3.7) WX (γ) = k|x − y|−1/2 γ(x, y)k22 Z 1 d q d q0 d p|q − q0 |−2 γ(q0 + p, q0 ) γ(q + p, q) = 2 2π 9 Z 1 1 = d q d q0 d ξ d ξ 0 d p|q − q0 |−2 M(ξ 0 , p + q0 , q0 ) M(ξ, p + q, q) 6 2 (2π) 2π 15 0 0 ·χ d χa,r (q0 − ξ 0 )d χa,r (p + q − ξ)d χa,r (q − ξ) . a,r (p + q − ξ )d 39 Zwischen den beiden Dichtematrizen γC und γ gelten die Beziehungen γC (q) = M(q, q, q) , (γC )++ (q) = M++ (q, q, q) , (γC )−− (q) = M−− (q, q, q) und mit geeignetem γC bzw. F gilt elementweise M(ξ, p, q) − M(q, q, q) = O(%) für % = (ar)−1 → 0 auf D% mit Ausnahme einer kleinen Teilmenge, deren Beitrag von der Ordnung O(r 2 ) ist. Es folgt für r → ∞ Z p −3 2 3 T (γ) = (2π) kd χa,1 k2 r Sp 4 q2 + m F++ (q) − F−− (q) d q + O(r 2) 6 (3.8a) −3 2 3 = (2π) kχa,1 k2 r T (γC ) + O(r 2) und WX (γ) = (3.8b) 1 1 2 3 kd χa,1 ∗ χ d a,1 k2 r 6 2 (2π) 2π Z · |q − q0 |−2 M(q0 , q0 , q0 ) M(q, q, q) d q d q0 + O(r 2) 6 −3 = (2π) kχa,1 k44 r 3 WX (γC ) + O(r 2) . Hat F (ξ) und damit M(ξ, p, q) bezüglich der 4 Spinkomponenten die Form a b (3.9) , b −a so gilt dies auch für γ und die Ladungsdichte, und damit die direkte Energie, verschwindet nach elementarer Linearer Algebra: Ist fi = (gi , hi ) ∈ H eine Eigenfunktion von γ zum Eigenwert λi , so ist fi0 = (−hi , gi) eine Eigenfunktion zum Eigenwert −λi . Die Ladungsdichte berechnet sich also zu X ργ (x) = λi (|gi(x)|2 + |hi (x)|2 − |hi (x)|2 − |gi (x)|2 ) = 0 , i,λi >0 wobei wir g und h als Funktionen mit 2 Komponenten auf R3 aufgefasst haben. Zum Schluss bemerken wir, dass einfachere Abschneidefunktionen wie zum Beispiel eine charakteristische Funktion im Impulsraum auch die wesentlichen Eigenschaften besäßen. Aber jede Abschneidefunktion hat die Eigenschaft 0 ≤ χa,r ≤ 1, also auch kχa,r k44 ≤ kχa,r k22 . Für unsere spezielle Wahl strebt dieses Verhältnis für a → 0 gegen 1, liefert also wegen der Vorfaktoren in (3.8) die niedrigste mögliche Energie in dritter Ordnung in r. Auch ist dadurch das Verhältnis der beiden Energien für a → 0 und r → ∞ das gleiche wie für die Energien von γC pro Einheitsvolumen. Es ist uns also gelungen, durch die Abschneidefunktion die Energie pro Einheitsvolumen der translationsinvarianten Dichte im ganzen Raum mit einer Ladungsdichtematrix zu reproduzieren. Das Infimum der Energie für α > 4/π Hier zeigen wir die Instabilität des Elektronen-Positronen-Felds ohne externes Potential für α > 4/π. Der Beweis ist in Zusammenarbeit mit Hundertmark und Siedentop entstanden und wurde in einer ähnlichen Fassung in der Zeitschrift Communications in Mathematical Physics“ veröffentlicht [16]. ” 40 Satz 3.3. Ist α > 4/π, so ist die Energie pro Teilchen in der Menge der HartreeFock-Zustände endlicher Energie DHF nach unten unbeschränkt. E0,α (ρ) inf = −∞ ρ∈ HF N(ρ) Wir unterteilen den Beweis der Übersichtlichkeit halber in 4 Schritte. Definition der Ladungsdichtematrix Jeder unitäre Operator T auf H̃+ ⊕ H̃− definiert ein angezogenes“ Vakuum mittels ” der Projektion ∗ 0 0 P̃− := RT T R∗ . 0 1 Wir benutzen den Rotationsoperator cos η(p) sin η(p)(σ · ω p ) T (p) := , − sin η(p)(σ · ω p ) cos η(p) dessen Winkel η(p) durch die reelle Funktion η : R3 → R von p abhängt. Im Folgenden schreiben wir abkürzend s̃p für sin η(p) und c̃p für cos η(p). Chaix et al. [13] benutzten die Dichtematrix γC := P̃− − P− , um für die Instabilität in einem Einheitsvolumen zu argumentieren. Sie wussten aber nicht, welcher Winkel zum optimalen Ergebnis 4/π ≈ 1, 27 führt, und konnten nur die obere Schranke π/ ln 4 ≈ 2, 27 zeigen. Motiviert durch eine Arbeit von Evans, Perry und Siedentop [20] definieren wir den Winkel als (3.10) η = ηλ,c,d : R3 → [0, π/2], λ, c, d ∈ R+ mit 2λ−1 ≤ c < d, λ ≤ 1 und ( arcsin (|ξ|λ)−2 c ≤ |ξ| ≤ d . ηλ,c,d(ξ) = 0 sonst Insbesondere gilt s̃ ≤ 1/4. Der tiefere Grund für diese Wahl ist, dass die Ungleichung von Kato, die in dem Stabilitätsbeweis des Elektronen-Positronen-Felds (Satz 3.1) verwendet wird, für die Funktion |p|−2 I[c,d](p) mit c, d, d/c → ∞ scharf ist. Ein Beweis hierfür basiert, wie auch unsere obere Schranke für die Energie der Ladungsdichtematrix, auf Formel (3.19) und verwendet eine ähnliche Rechnung. Der Operator F = R∗ γC R ist gegeben durch s̃2p −s̃p c̃p σ · ω p 0 0 0 0 ∗ , F (p) = T (p) T (p) − = 0 1 0 1 −s̃p c̃p σ · ω p −s̃2p und ist somit beschränkt und hat den kompakten Träger B(0, d) \ B(0, c). Folglich liegt der Träger von χ d χa,r (ξ − q), des Integranden aus der Defa,r (p − ξ)M(ξ, p, q)d inition des Integralkerns von γ (3.4), in der Menge D% := {(ξ, p, q) ∈ R9 |ξ|, |p|, |q| ∈ [c − 2%, d + 2%], |p − ξ| ≤ %, |q − ξ| ≤ %} . Wir setzen % ≤ %max := 1/3 voraus. Eigentlich benötigen wir nur, dass % beschränkt ist, damit wir später Konstanten Ci unabhängig von % wählen können. Der Wert ist (fast) willkürlich. 41 Wegen der Wahl von F können wir die Vorbemerkungen aus Abschnitt 3.2 anwenden und erhalten, dass γ eine Ladungsdichtematrix mit Teilchenzahl (3.11) −3 3 N(γ) = 4(2π) r kχa,1 k22 Z 3 d ξ s̃ = 2π −2 r 3 kχa,1 k22 λ−4 (c−1 − d−1 ) ist. Wir zeigen jetzt, dass die Differenz zwischen M(ξ, p, q) und M(q, q, q), außer im Komplement der Menge V := {(ξ, p, q) |ξ|, |q| ∈ [c, d]} ∩ D% , von Ordnung O(%) für % → 0 ist. Dazu benötigen wir die Abschätzungen |σ · ωp − σ · ωq | = O(%), cp − cq = O(%) und sp − sq = O(%) aus Lemma 3.6. Zusätzlich treten die beiden Differenzen s̃q − s̃ und c̃q − c̃ auf. Hier kommt die Ausnahmemenge, das Komplement von V in D% , ins Spiel. Mit der charakteristischen Funktion IV der Menge V zerlegen wir beide Funktionen in fs1 (ξ, p, q) : = (s̃q − s̃ )IV (ξ, p, q) , fs2 (ξ, p, q) : = (s̃q − s̃ ) 1 − IV (ξ, p, q) , fc1 (ξ, p, q) : = (c̃q − c̃ )IV (ξ, p, q) , fc2 (ξ, p, q) : = (c̃q − c̃ ) 1 − IV (ξ, p, q) . Die Funktionen mit Träger in V , fs1 und fc1 , sind von Ordnung O(%). Zum Beweis berechnen wir λ2 (s̃q − s̃ ) = q−2 I[c,d] (|q|) − ξ−2 I[c,d](|ξ|) = (|ξ|I[c,d] (|q|) − |q|I[c,d](|ξ|))(|ξ|I[c,d](|q|) + |q|I[c,d](|ξ|)) . q2 ξ 2 Sind nun |ξ|, |q| ∈ [c, d], was in V erfüllt ist, so gilt |ξ − q| = O(%). Da s̃ ≤ 1/4 erhalten wir dies auch für fc1 : q q (s̃q − s̃ )(s̃q + s̃ ) 2 q c̃q − c̃ = 1 − s̃q − 1 − s̃2 = − p 2 1 − s̃q + 1 − s̃2 ≤ −(s̃q − s̃ )(s̃q + s̃ ) = O(%). 42 Die Anwendung dieser Abschätzungen auf M ergibt eine Zerlegung von M(ξ, p, q) in M(q, q, q) und zwei Fehlerterme. Die Matrix M(ξ, p, q) ist gleich (3.12) −s̃ c̃ σ · ω s̃2 cp −sp σ · ω p cq sq σ · ω q −s̃ c̃ σ · ω −s̃2 sp σ · ω p cp −sq σ · ω q cq 2 s̃ (c c − sp sq σ · ω p σ · ω q ) + s̃ c̃ (cp sq σ · ω σ · ω q + sp cq σ · ω p σ · ω ) = 2 p q s̃ (sp cq σ · ω p + cp sq σ · ω q ) + s̃ c̃ (sp sq σ · ω p σ · ω σ · ω q − cp cq σ · ω ) s̃2 (sp cq σ · ω p + cp sq σ · ω q ) + s̃ c̃ (sp sq σ · ω p σ · ω σ · ω q − cp cq σ · ω ) −s̃2 (cp cq − sp sq σ · ω p σ · ω q ) − s̃ c̃ (cp sq σ · ω σ · ω q + sp cq σ · ω p σ · ω ) 2 2 2 2 2 2 2s̃ s c − s̃ c̃ (c − s ) σ · ω s̃ (c − s ) + 2s̃ c̃ s c q q q q q q q q q q q q q q q = 2 2s̃q sq cq − s̃q c̃q (c2q − s2q ) σ · ω q −s̃2q (c2q − s2q ) − 2s̃q c̃q sq cq + N1 (ξ, p, q) + N2 (ξ, p, q) s̃q sin(η(q) + 2θq ) −s̃q cos(η(q) + 2θq )σ · ω q = −s̃q cos(η(q) + 2θq )σ · ω q −s̃q sin(η(q) + 2θq ) + N1 (ξ, p, q) + N2 (ξ, p, q) = M(q, q, q) + N1 (ξ, p, q) + N2 (ξ, p, q) . Alle Terme der Ordnung O(%) fassen wir in N1 zusammen und die restlichen, die fs2 oder fc2 enthalten, in N2 . Es folgt N1 = O(%) und supp N2 ⊆ D% \ V . Die Energie der Ladungsdichtematrix Die direkte Energie WP = 2D(ργ , ργ ) verschwindet, da unser F die Form (3.9) hat und somit die Ladungsdichte ργ schon punktweise gleich 0 ist. Die kinetische Energie (3.6) zerfällt nach (3.12) in 3 Terme. Der Beitrag von M(q, q, q) ist (2π) −3 (3.13) Z p 2 q2 + m2 F++ (ξ) − F−− (ξ) χ d a,r (q − ξ) Z p −3 3 2 d q q2 + m2 s̃2q . = (2π) r kχa,1 k2 4 d q d ξ Sp 6 4 3 Die anderen zwei Beiträge sind von niedrigerer Ordnung in r. Wir definieren zu ihrer Abschätzung die folgenden Konstanten: C1 : = sup %−1 %≤%max C2 : = sup sup ( ,q,q)∈D% ( ,q,q)∈D%max {Sp 4 {Sp 4 p q2 + m2 (N1 )++ (ξ, q, q) − (N1 )−− (ξ, q, q) } , p q2 + m2 (N2 )++ (ξ, q, q) − (N2 )−− (ξ, q, q) } . Beide sind unabhängig von % und endlich, da N1 und N2 keine Singularitäten haben und N1 auf dem Definitionsbereich D% von Ordnung O(%) ist. Für den zweiten Term 43 der Zerlegung (3.12) erhalten wir unter Berücksichtigung von supp N1 (ξ, q, q) ⊆ D% Z p 2 2 2 (2π)−3 d d q d ξ Sp 4 q + m (N1 )++ (ξ) − (N1 )−− (ξ) χ a,r (q − ξ) 6 Z −3 2 ≤ (2π) %C1 c−2%≤|q|≤d+2% d q d ξ χ d a,r (q − ξ) ξ∈ 3 4 = (2π)−3 %C1 π (d + 2%)3 − (c − 2%)3 kχa,r k22 3 2 4 r = (2π)−3 C1 π (d + 2%)3 − (c − 2%)3 kχa,1 k22 = O(r 2) . a 3 Für alle (ξ, q, q) ∈ D% \ V sind die ξ eingeschränkt auf |ξ| ∈ [c − 2%, c + %] ∪ [d − %, d + 2%], da entweder |ξ| oder |q| nicht in dem Intervall [c, d] liegen dürfen und ihr Abstand voneinander kleiner als % ist. Damit kontrollieren wir den dritten Term Z p −3 2 2 + m2 (N ) (2π) d q d ξ Sp q (ξ) − (N ) (ξ) χ d (q − ξ) 4 2 ++ 2 −− a,r 6 Z 2 ≤ (2π)−3 C2 | |<c+% oder | |>d−% d q d ξ χ d a,r (q − ξ) q∈ 3 4 χa,1 k22 = O(r 2) . = (2π)−3C2 π (c + %)3 − (c − 2%)3 + (d + 2%)3 − (d − %)3 r 3 kd 3 Wir verfahren ähnlich mit der Austauschenergie (3.7) und wählen die Zerlegung (3.14) M(ξ 0 , p0 , q0 )M(ξ, p, q) =: M(q0 , q0 , q0 ) M(q, q, q) 0 +Ñ1 (ξ, p, q, ξ0 , p0 , q0 ) + Ñ2 (ξ, p, q, ξ0 , p0 , q0 ) + Ñ2 (ξ, p, q, ξ0 , p0 , q0 ) , die alle Produkte mit N1 in Ñ1 , alle anderen mit N2 (ξ, p, q) in Ñ2 , und den Rest – 0 mit N2 (ξ 0 , p0 , q0 ) – in Ñ2 zusammenfasst. Es folgen die Eigenschaften N1 = O(%), 0 supp Ñ2 = (D% \ V ) × D% und supp Ñ2 = D% × (D% \ V ). Den wesentlichen Beitrag liefert, wie durch die Notation angedeutet, der Term M(q0 , q0 , q0 )M(q, q, q). Unter Verwendung von Lemma 3.7 erhalten wir M(q0 , q0 , q0 ) M(q, q, q) = 4s̃q s̃q0 (sin(η(q) + 2θq ) sin(η(q0 ) + 2θq0 ) + cos(η(q) + 2θq ) cos(η(q0 ) + 2θq0 )ω q ω q0 ) und die zugehörige Energie ist nach Formel (3.7) gleich Z 4 1 d q d q0 |q − q0 |−2 s̃q s̃q0 (3.15) (2π)6 2π 2 6 · sin(η(q) + 2θq ) sin(η(q0 ) + 2θq0 ) + cos(η(q) + 2θq ) cos(η(q0 ) + 2θq0 )ω q ω 0q Z · d ξ d ξ0 d pd χa,r (p + q − ξ)d χa,r (q − ξ)d χa,r (p + q0 − ξ 0 )d χa,r (q0 − ξ0 ) 9 44 Z 8 2 = kd χa,r ∗ χ d d q d q0 |q − q0 |−2 s̃q s̃q0 a,r k2 (2π)8 6 · sin(η(q) + 2θq ) sin(η(q0 ) + 2θq0 ) + cos(η(q) + 2θq ) cos(η(q0 ) + 2θq0 )ω q ω 0q Z 8 3 4 d q d q0 |q − q0 |−2 s̃q s̃q0 r kχa,1 k4 = 5 (2π) 6 · sin(η(q) + 2θq ) sin(η(q0 ) + 2θq0 ) + cos(η(q) + 2θq ) cos(η(q0 ) + 2θq0 )ω q ω 0q . Der Definitionsbereich D% wurde inklusive des Randes von Breite 2% gewählt, damit er den obigen Integranden vollständig enthält: Wegen der Definition des Winkels (3.10) ist s̃q auf c ≤ |q| ≤ d beschränkt und es folgt c − % ≤ |ξ| ≤ d + % und c − 2% ≤ |p| ≤ d + 2%. Analog zu der kinetischen Energie sind die anderen beiden Terme von niedrigerer Ordnung in r. Wir definieren C3 : = sup %−1 %≤%max C4 : = {Ñ1 (ξ, p + q, q, ξ 0 , p + q0 , q0 )}, sup 0 0 0 2 ( ,p+q,q, ,p+q ,q )∈D% sup ( ,p+q,q, 0 ,p+q0 ,q0 )∈D%2max {Ñ2 (ξ, p + q, q, ξ0 , p + q0 , q0 )}, und schätzen damit die Austauschenergie der restlichen Terme der Zerlegung (3.14) ab: Z 2 0 0 0 −2 0 0 (2π)8 6 d q d q |q − q | Ñ1 (ξ, p + q, q, ξ , p + q , q ) Z 0 0 0 0 0 · d ξ d ξ d pd χa,r (p + q − ξ)d χa,r (q − ξ)d χa,r (p + q − ξ )d χa,r (q − ξ ) 9 Z Z 2 2 ≤ %C3 k χ d d dq d q0 |q − q0 |−2 a,r ∗ χ a,r k2 (2π)8 0 |q|∈[c−2%,d+2%] |q |∈[c−2%,d+2%] = O(r 2) und Z 2 (3.16) d q d q0 |q − q0 |−2 Ñ2 (ξ, p + q, q, ξ 0 , p + q0 , q0 ) 8 (2π) 6 Z 0 0 0 0 0 · d ξ d ξ d pd χa,r (p + q − ξ)d χa,r (q − ξ)d χa,r (p + q − ξ )d χa,r (q − ξ ) 9 Z Z 2 2 ≤ C4 k χ d d dq d q0 |q − q0 |−2 a,r ∗ χ a,r k2 (2π)8 0 |q|<c+% oder |q|>d−% |q |∈[c−2%,d+2%] Z Z 2 2 d ≤ C4 kχ d dq d q0 |q0 |−2 a,r ∗ χ a,r k2 (2π)8 |q|<c+% oder |q|>d−% q 0 ∈B(0,2d+4%) 1 3 3 3 3 d 24 = 7 8 r 3 C4 kχ d a,1 ∗ χ a,1 k2 π (c + %) − (c − 2%) + (d + 2%) − (d − %) 4π(2d + 4%) 2π 3 = O(r 2 ) . 0 Die Rechnung für Ñ2 führen wir nicht durch, da sie im Prinzip die gleiche ist. 45 Reduktion auf den masselosen Fall Wir bezeichnen die Koeffizienten führender, also dritter, Ordnung in r der Teilchenzahl, der Gesamt-, kinetischen und Austauschenergie als Funktionen der Masse m und des Winkels ηλ,c,d mit N3 (ηλ,c,d ), (E0,α )3 (m, ηλ,c,d), T3 (m, ηλ,c,d) und (WX )3 (m, ηλ,c,d). Wir untersuchen die Skalierung von (E0,α )3 (m, ηλ,c,d ) in m um das Problem auf den masselosen Fall zu reduzieren. Für die kinetische Energie (3.13) gilt mit einem λ ∈ (0, 1] Z p −3 2 T3 (λm, η1,c,d ) = (2π) kχa,1 k2 4 d p p2 + λ2 m2 sin2 (η(p)) 3 Z p d p p2 + m2 sin2 (η(λp)) = (2π)−3 kχa,1 k22 λ4 4 3 4 = λ T3 (m, ηλ,c/λ,d/λ ) , und ηλ,c/λ,d/λ erfüllt mit η1,c,d die Bedingungen der Definition des Winkels η (3.10). Von der Austauschenergie müssen wir zuerst die Massenabhänigkeit der Winkelfunktionen untersuchen. Wir haben sin(η(q) + 2θq ) = sin(η(q)) cos(2θq ) + cos(η(q)) sin(2θq ) , cos(η(q) + 2θq ) = cos(η(q)) cos(2θq ) − sin(η(q)) sin(2θq ) und sin(2θq ) = |q|/E(q) , cos(2θq ) = m/E(q) . Die Masse tritt also in folgender Form auf: m2 , E(q)E(q0 ) |q|m , E(q)E(q0 ) |q0 |m , E(q)E(q0 ) |q||q0| . E(q)E(q0 ) Alle diese Ausdrücke skalieren gleich in m, z.B. λ2 m2 m2 p p p . =p (q/λ)2 + m2 (q0 /λ)2 + m2 q2 + λ2 m2 (q0 )2 + λ2 m2 Genau wie für die kinetische Energie bekommen wir also auch hier (WX )3 (λm, η1,c,d ) = λ4 (WX )3 (m, ηλ,c/λ,d/λ ) , und zusammen ergibt dies (3.17) (E0,α )3 (λm, η1,c,d ) = λ4 (E0,α )3 (m, ηλ,c/λ,d/λ ) . Außerdem ist (E0,α )3 stetig bei m = 0, da sowohl die kinetische als auch die Austauschenergie von der Form Z f (m, x)g(x) d x mit stetigem f (m, x) und einem g ∈ L1 von kompaktem Träger sind. Falls wir nun ein Paar c, d und ein positives a0 mit (E0,α )3 (0, η1,c,d) < −a0 < 0 finden, dann gibt es wegen der Stetigkeit ein m0 > 0 mit (E0,α)3 (m, η1,c,d) < −a0 für alle m < m0 . Also ist mit beliebigem m ≥ 0 und λ < max{m0 /m, 1} nach (3.17) und der Formel für die 46 Teilchenzahl (3.11) die Energie pro Teilchen in führender Ordnung in r beschränkt durch (E0,α )3 (m, ηλ,c/λ,d/λ ) −λ−4 a0 ≤ −2 N3 (ηλ,c/λ,d/λ ) 2π kχa,1 k22 λ−4 λ(c−1 − d−1 ) (3.18) =− a0 . 2π −2 kχa,1 k22 λ(c−1 − d−1 ) Mit λ → 0 wird die Energie pro Teilchen beliebig negativ und damit bleibt im masselosen Fall die Existenz eines Paares c und d mit zugehöriger Energie (E0,α )3 (0, η1,c,d) < a0 < 0 zu zeigen. Instabilität Wir setzen jetzt m = 0 und den Winkel gleich η = η1,c,d . Es folgten θq = π/4, s̃q = |q|−2 und die kinetische Energie (3.13) ist mit den Bezeichnungen τ := d/c, p := |p| und q := |q| gleich T3 = (2π) −3 kd χa,1 k22 4 Z pdp = 2π −2 kχa,1 k22 4 p∈[c,d] p Z d c dp = 2π −2 kχa,1 k22 log τ . p Für die Austauschenergie (3.15) erhalten wir in Kugelkoordinaten und p anstatt von q 0 den Ausdruck 8 kχa,1 k44 (WX )3 = 5 (2π) Z dZ dZ · 4π2π c c p p du −2 −4 p−2 q 1 − q 1 − p−4 q 2 p2 d p d q 2 + p2 − 2qpu q −1 Z dZ dZ 1 udu −4 −4 2 2 +4π2π q p q p dpdq , q 2 + p2 − 2qpu c c −1 1 wobei die u-Integrale Legendrefunktionen der zweiten Art sind: Z 1 −1 Z 1 −1 du 1 = 2 2 q + p − 2qpu 2pq udu 1 = q 2 + p2 − 2qpu 2pq Z Z 1 −1 1 −1 1 p q ≥0, + 2 q p udu 1 p q 1 + := Q1 ≥0. q 1 p pq 2 q p + − u 2 q p 1 du := Q0 p q 1 pq + p −u 2 q Da die Austauschenergie negativ in die Gesamtenergie eingeht, müssen wir sie nach unten abschätzen. Zuerst lassen wir den Q1 -Term weg, und verwenden die Ungle√ ichung 1 − z ≥ 1 − z (z ∈ [0, 1]). Im zweiten Schritt vernachlässigen wir (pq)−5 47 und schätzen p−4 + q −4 nach oben durch 2/c4 ab. Wir erhalten also 2 (WX )3 ≥ 3 kχa,1 k44 π Z dZ d 1 p q Q0 · + ((pq)−1 − p−1 q −5 − q −1 p−5 + (pq)−5 ) d p d q 2 q p c c Z dZ d 1 p q 2 2 4 Q0 ≥ 3 kχa,1 k4 (1 − 4 ) (pq)−1 d p d q . + π c 2 q p c c Für c, d, τ → ∞ gilt Formel 17 aus [20], Z dZ d π2 1 p q + log τ + O(1) , (3.19) (pq)−1 = Q0 2 q p 2 c c und damit bekommen wir das gewünschte Ergebnis α (E0,α )3 = T3 − (WX )3 2 log τ α 1 π2 4 −2 2 kχa,1 k4 + C 4 + O(1) ≤ 2π log τ kχa,1 k2 − 2π 2 c π log τ = 2π −2 log τ kχa,1 k22 − α kχa,1 k44 + C 4 + O(1) . 4 c 2 4 Ist α > (4/π)kχa,1 k2 /kχa,1 k4 , so finden wir ein Paar c, τ mit dem (Eα )3 (0, η1,c,d) < −a0 für ein a0 > 0. Das Skalierungsargument (3.18) zeigt somit Instabilität für beliebiges m > 0 und mit dem Lemma 3.2 gilt dies schließlich für jedes α > 4/π, da a > 0 beliebig. Das Infimum der Energie mit chemischem Potential Das Energiefunktional mit chemischem Potential µmN(γ) ist im freien Fall (Z = 0) auf der Menge X der Ladungsdichtematrizen endlicher Energie gegeben durch das Funktional E µ0,α : X → R, Z |γ(x, y)|2 α µ . dxdy E 0,α (γ) = T (γ) − µmN(γ) + αD(ργ , ργ ) − 2 |x − y| Wir setzen in diesem Abschnitt m 6= 0 voraus, da der Fall m = 0 nichts Neues bringt und bemerken, dass ein chemisches Potential als Vielfaches der Teilchenzahl zwar sicherlich das Infimum der Energie beeinflussen kann, aber an der Stabilität nichts ändert. Wir werden folgenden Satz beweisen: Satz 3.4. Für massive Elektronen und Positronen gelten die zwei Aussagen: p (1) Das Hartree-Fock-Vakuum ist ein Grundzustand für µ ≤ 1 − (πα/4)2 . Dieser ist eindeutig, falls µ kleiner als der ebengenannte kritische Wert ist. In einer Formel ausgedrückt heißt dies p E µ0,α (ρ) ≥ 0 für µ ≤ 1 − (πα/4)2 und ρ ∈ DHF . (2) Für µ ≥ 1 kann die Energie beliebig negative Werte annehmen: inf ρ∈ HF E µ0,α (ρ) = −∞ . 48 Beweis. Die Einteilchenenergie, also die Energie, die ein einzelnes Teilchen besitzt, ist in diesem Modell durch p p p T (γ) − µmN(γ) = Sp γ ] ( p2 + m2 − µm) γ ] p mit γ ] := γ++ − γ−− gegeben. Für µ ≤ 1 lässt sich das wegen p2 + m2 − m ≥ 0 auch als p p Sp( p2 + m2 − µm)1/2 γ ] ( p2 + m2 − µm)1/2 schreiben. Die Cauchy-Schwarz Ungleichung in zwei Dimensionen liefert die Ungleichung p (3.20) p2 + m2 − µm ≥ d|p| für µ, d ≥ 0 mit µ2 + d2 ≤ 1. Damit erhalten wir analog zum Stabilitätsbeweis für das Elektronen-Positronen-Feld (vergleiche Abschnitt 3.1): p p π π WX ≤ Sp γ|∇|γ ≤ d−1 Sp( p2 + m2 − µm)1/2 γ 2 ( p2 + m2 − µm)1/2 2 2 p p π Sp( p2 + m2 − µm)1/2 γ ] ( p2 + m2 − µm)1/2 ) ≤ 2d π = T (γ) − µmN(γ) , 2d wobei wir die definitionsgemäße Gleichheit von |∇| und |p| benutzt haben. Es gilt also π α E µ0,α (γ) ≥ T (γ) − µmN(γ) 1 − 2d 2 und damit ist die Energie nichtnegativ, solange α ≤ 4d/π. p Aus der Bedingung 2 2 µ +d ≤ 1 erhalten wir die oben angegebene Schranke µ ≤ 1 − (πα/4)2 . Ist µ echt kleiner als dieser Wert, so ist das Hartree-Fock-Vakuum der einzige Grundzustand, da T (γ) − µmN(γ) > 0 für µ ≤ 1 und γ 6= 0. Setzt man den physikalischen Wert der Feinstrukturkonstante α = 1/137, gilt somit obige Abschätzung bis µ = 0, 999983. Man kann also fast die gesamte Ruheenergie abziehen, ohne den Grundzustand zu ändern. 49 Der Graph stellt die beiden Seiten der Ungleichung (3.20) für drei Werte von µ und d gegenüber. Er illustriert, dass man für µ = 1 die Einteilchenenergie nicht mehr durch einen Bruchteil von |p| nach unten Abschätzen kann, weil die Ableitung von p 2 p + m2 bei p = 0 verschwindet. Der Schwachpunkt liegt bei kleinen Impulsen und das werden wir im Folgenden ausnutzen um eine Ladungsdichtematrix mit der Methode von Abschnitt 3.2 zu konstruieren, deren Energie negativ ist. Wir setzen 1 0 F (ξ) := f (ξ) 0 −1 mit einer beschränkten kugelsymmetrischen Funktion f von kompaktem Träger in B(0, d) und können so wieder die Vorbemerkungen aus Abschnitt 3.2 verwenden. In diesem Fall haben wir an die Abschneidefunktion keine so hohen Ansprüche und vereinfachen den Beweis dadurch, dass wir ihren Betrag im Impulsraum verwenden. Der Integralkern von γ ist mit (3.4) gegeben durch Z 1 0 −3 γ(p, q) = (2π) |d χa,r (ξ − q)|R∗ (q) , d ξR(p)|d χa,r (p − ξ)|f (ξ) 0 −1 3 und der Integrand hat seinen Träger in der Menge D% := {(ξ, p, q) ∈ R9 |ξ|, |p|, |q| ∈ [0, d + 2%], |p − ξ| ≤ %, |q − ξ| ≤ %} . Wir wollen nun zeigen, dass das Verhältnis von kinetischer zu Austauschenergie für r → ∞ gegen 0 strebt. Also müssen wir die kinetische Energie von oben und die Austauschenergie von unten abschätzen. Für das gewünschte Resultat genügt es, für f die charakteristische Funktion I[0,d] (| · |) der Kugel B(0, d) zu wählen. Wir beginnen mit der Austauschenergie WX (3.7) und weichen von unserer Notation ab, indem wir M(ξ, p, q) in I[0,d] (|ξ|)M(p, q) zerlegen, wobei M(p, q) das Produkt der Matrizen bezeichnet: 1 0 M(p, q) : = R(p) R∗ (q) 0 −1 cp sp σ · ω p cq sq σ · ω q = sp σ · ω p −cp −sq σ · ω q cq cp cq − sp sq σ · ω p σ · ω q cp sq σ · ω q + cq sp σ · ω p = . cp sq σ · ω q + cq sp σ · ω p −cp cq + sp sq σ · ω p σ · ω q Wie man aus der Formel (2.22) für die Austauschenergie im Ortsraum leicht sieht, sind die Beiträge jedes Terms des elementweisen Produkts “ nichtnegativ ” (die Komponenten der Matrizen entsprechen den Spinzuständen). Es genügt deshalb sich im Folgenden auf die diagonalen Einträge zu beschränken. Das “ Produkt der Diagonalelemente von M(p0 , q0 ) und M(p, q) ist mit ” Lemma 3.7 das Vierfache des Ausdrucks cp0 cq0 cp cq + sp0 sq0 sp sq [(ω p0 ω q0 )(ω p ω q ) + (ω p0 × ω q0 )(ω p × ω q )] − cp cq sp0 sq0 (ω p0 ω q0 ) − cp0 cq0 sp sq (ω p ω q ) = cp cq −sp sq (ω p ω q ) cp0 cq0 −sp0 sq0 (ω p0 ω q0 ) +(ωp0 ×ω q0 )(ω p ×ω q )sp0 sq0 sp sq . 50 Lemma 3.8 im√ Anhang zeigt, dass dies größer oder gleich m2 E(d + 2%)−2 + O(%) ist, wobei E(d) = d2 + m2 der relativistischen kinetischen Energie eines Teilchens mit Impuls d entspricht. Wir erhalten als untere Schranke der Austauschenergie WX Z 1 4m2 1 0 0 0 −2 d q d q d ξ d ξ d p|q − q | + O(%) I[0,d] (|ξ|)I[0,d] (|ξ0 |) (2π)6 2π 2 15 E(d + 2%)2 · |d χa,r (p + q0 − ξ 0 )d χa,r (q0 − ξ 0 )d χa,r (p + q − ξ)d χa,r (q − ξ)| , und es gilt I[0,d] (|ξ|)I[0,d] (|ξ0 |) − I[0,d] (|q|)I[0,d] (|q0 |) = 0 außer unter einer der beiden Bedingungen |q|, |ξ| ∈ [d − %, d + %] bzw. |q0 |, |ξ0 | ∈ [d − %, d + %]. Denn wenn die Gleichung nicht erfüllt ist, folgt o.E. |ξ| ∈ [0, d] und |q| > d und die Bedingung ergibt sich aus der Beschränkung des Abstands der beiden Variablen auf %. Es ist aber ähnlich wie in (3.16) der Betrag des Integrals dieser Menge beschränkt durch das (m2 E(d + 2%)−2 + O(%))-fache des Ausdrucks Z Z 1 0 dqdq d p d ξ d ξ0 0 |2 d−%≤|q|≤d+% |q − q 9 3 0 |q |∈ · |d χa,r (p + q − ξ)d χa,r (q − ξ)d χa,r (p + q0 − ξ 0 )d χa,r (q0 − ξ 0 )| Z Z 2 d ≤ kχ d dq d q0 |q0 |−2 a,r ∗ χ a,r k2 d−%≤|q|≤d% |q0 |≤2d+2% 24 3 3 2 d = r 3 kχ d a,1 ∗ χ a,1 k2 π (d + %) − (d − %) 4π(2d + 2%) = O(r ) . 3 Damit gilt für die Komponente in dritter Ordnung von r der Austauschenergie Z 2 1 1 4m2 1 (WX )3 ≥ kχ d d d q d q0 a,r ∗ χ a,r k2 6 2 2 2 (2π) 2π (d + 2%) + m 0≤|q0 |,|q|≤d |q − q0 |2 2 m2 d4 8 = k χ d ∗ χ d k , a,1 a,1 2 (2π)3 (d + 2%)2 + m2 da der Wert des Integrals 4π 2 d4 ist. Die Einteilchenenergie ist analog zu (3.6) einfacher zu bestimmen: Z p 4 ( p2 + m2 − m)I[0,d] (|ξ|)d χa,r 2 (p − ξ) d ξ d p 3 (2π) 6 Z p 4 2 = I (|p|)( p2 + m2 − m) d p + O(r 2) kχ k a,r [0,d] 2 (2π)3 3 5 4 2 4πd ≤ kχ k + O(r 2 ) a,r 2 (2π)3 10m 5 1 3 2d = 2 r kχa,1 k2 + O(r 2) , 5π m wobei die erste Abschätzung analog zu oben benutzt, dass I[0,d] (ξ) − I[0,d] (p) = 0 außer im Falle |p|, |ξ| ∈ [d − %, d + %] und das Integral einer beschränkten Funktion 51 über diese Menge gleichp O(r 2) ist. Die letzte Abschätzung beruht auf der elementaren Ungleichung p2 /2m ≥ p2 + m2 − m. Die dritte Komponente der Energie ist also mit geeigneten Konstanten c1 und c2 nach oben durch (3.21) E µ0,α (γ) 3 ≤ c1 d5 − c2 d4 beschränkt. Es gibt also ein d0 , so dass die Komponente für alle d < d0 negativ ist. Wählt man nun r genügend groß, ist die Energie der Ladungsdichtematrix negativ, und für r → ∞ strebt diese gegen −∞. Eine andere Möglichkeit, die Ladungsdichtematrix zu wählen, wäre mit f := I[c,d] statt f = √ I[0,d] . Dafür ist der schwierigere Teil des Beweises von Lemma 3.8 für den Fall b ≤ 2 2m nicht nötig, aber die beiden Grenzen bringen mehr Schreibarbeit in den anderen Abschätzungen. Wollte man jedoch ausrechnen, wie negativ die Energie pro Teilchen werden kann, würde das, wegen der 2 Freiheitsgrade, die bessere Wahl darstellen. Folgerungen für die Energie ohne chemisches Potential Satz 3.5. (1) Für die Energie der Hartree-Fock Zustände aus DHF gilt p E0,α (ρ) ≥ 1 − (πα/4)2 mN(ρ) . (2) Das Infimum der Energie über die Hartree-Fock-Zustände endlicher Energie und Teilchenzahl N befindet sich für m > 0 in folgendem Intervall: hp E0,α (ρ) ∈ inf 1 − (πα/4)2mN, mN . ρ∈ HF ,N (ρ)=N Im masselosen Fall ist das Infimum Null. Beweis. Die erste Aussage folgt sofort aus Satz 3.4 des vorherigen Abschnitts und für die zweite bestimmen wir die Teilchenzahl (3.6) des Zustands aus jenem Beweis: N(γ) = Sp χa,r (F++ − F−− )χa,r Z 4 = I[0,d] (|ξ|)χ2a,r (ξ − q) d q d ξ (2π)3 6 2 4 4 = kχa,1 k22 r 3 πd3 = 2 kχa,1 k22 r 3 d3 . 3 (2π) 3 3π Für jede beliebige Teilchenzahl N gewinnt man also durch Wahl von (3.22) d = N( 2 kχa,1 k22 )−1/3 r −1 3π 2 eine Ladungsdichtematrix der Teilchenzahl N. 52 Wir beginnen mit dem masselosen Fall und wählen d nach (3.22) proportional zu r . Die kinetische Energie T (γ) ist dann proportional zu −1 Z Z 1 |q|I[0,r−1 ] (|ξ|)d χa,r (q − ξ) d q d ξ = 3 |q|d χa,r 2 (q − ξ/r) d q d ξ |≤1 | r 6 |q|∈ Z Z 1 1 2 = 7 |q|d χa,r (q/r − ξ/r) d q d ξ = |q|d χa,1 2 (q − ξ) d q d ξ . r | |≤1 r | |≤1 2 |q|∈ |q|∈ 3/2 c 3c c Beim letzten Schritt benutzen wir χ d Br gc a,r = (2π) ar , Br (p) = r B1 (rp) und gbr (p) = gb1 (rp) (vergleiche Lemma 3.2 und (3.3)). Für r → ∞ konvergiert somit die kinetische Energie bei gleich bleibender Teilchenzahl gegen 0. Da für die Gesamtenergie T (γ) − αWX /2 ≥ 0 bei nichtnegativem WX gilt, ist also auch ihr Infimum gleich 0. Zusätzlich bemerken wir, dass für α < 4/π das Hartree-Fock-Vakuum der einzige Zustand verschwindender Energie ist, und es somit im masselosen Fall bei fester Teilchenzahl keinen Grundzustand gibt. Im massiven Fall betrachten wir analog die Skalierung der kinetischen und der Austauschenergie. Wegen d ∼ r −1 gilt E(d + 2%) ≤ 3m für große r und somit ist nach Lemma 3.8 die Austauschenergie größer oder gleich Z 1 1 4m2 0 0 0 −2 I[0,d] (|ξ|)I[0,d] (|ξ0 |) d q d q d ξ d ξ d p|q − q | (2π)6 2π 2 15 E(d + 2%)2 · |d χa,r (p + q0 − ξ 0 )d χa,r (q0 − ξ0 )d χa,r (p + q − ξ)d χa,r (q − ξ)| . Unter obiger Voraussetzung ist der Term aus dem Lemma beschränkt 4 4m2 4m2 ≤ = ≤4 9 E(d + 2%)2 (d + 2%)2 + m2 und spielt bei der Skalierung keine Rolle. Bei der Substitution aller Variablen q → q/r erhalten wir von der Integration den Faktor r −15 und von |q − q0 |−2 den Faktor 12 −1 r 2 . Die Skalierung von χ d a,r liefert r . Insgesamt also r . Die kinetische Energie ist Z p 4 ( p2 + m2 − m)I[0,d] (|ξ|)d χa,r 2 (p − ξ) d ξ d p 3 (2π) 6 Z p2 4 ≤ I[0,d] (|ξ|)d χa,r 2 (p − ξ) d ξ d p . (2π)3 6 2m In der gleichen Reihenfolge wie oben erhalten wir die Faktoren r −6 , r −2 und r 6 ; insgesamt r −2 . Es folgt E µ0,α (γ) = E 0,α (γ) − µmN(γ) ≤ c1 r −2 − c2 r −1 und somit existiert für große r eine Ladungsdichtematrix der Teilchenzahl N, deren Energie unter der Ruheenergie der Teilchen Nm liegt. 53 Hilfssätze Lemma 3.6. Sei c > 0, |p−q| ≤ 2% und |p|, |q| ≥ c. Dann gelten die Abschätzungen (1) |σ · ωp − σ · ωq | = O(%), (2) cp − cq = O(%) und sp − sq = O(%), elementweise für % → 0. Für den Winkel β zwischen p und q gilt sin β = O(%) und cos β = 1 + O(%). Beweis. 1. Der Betrag jedes Elements von σ · p ist sicherlich kleiner gleich |p|. Es genügt daher, |ω p −ω q | = O(%) zu zeigen. Dazu bezeichnen wir den Winkel ∠(p, q) zwischen p und q mit β, und stellen folgende elementare geometrische Fakten zusammen: • 2% ≥ |p − q| ≥ min{|p|, |q|} sin β, • |ω p − ω q | = 2 sin(β/2), • sin(β/2) ≤ sin β falls β ≤ 2π/3. Für β ≤ 2π/3 ist also |ω p − ω q | ≤ 4%/c = O(%). Der größte Winkel β tritt auf, wenn |p|, |q| = c und |p − q| = 2%. Dies bedeutet sin(β/2) = %/c und garantiert, dass die der Winkel β für kleine % kleiner als 2π/3 ist. Insbesondere gilt also sin β = O(%) und damit auch cos β = 1 + O(%). 2. Die Aussage ist richtig für m = 0, da in diesem Fall cp und sp konstante Funktionen sind. Für m 6= 0 zeigen die Richtigkeit folgende Rechnungen: q q √ 2 −1/2 2(cmp − cmq ) = 1 + (1 + p ) − 1 + (1 + q2 )−1/2 (1 + q2 )1/2 − (1 + p2 )1/2 p p (1 + q2 )1/2 (1 + p2 )1/2 1 + (1 + p2 )−1/2 + 1 + (1 + q2 )−1/2 −1 (q − p)(q + p) (1 + q2 )1/2 + (1 + p2 )1/2 p = O(%) , = p 2 1/2 2 1/2 2 −1/2 2 −1/2 (1 + q ) (1 + p ) 1 + (1 + p ) + 1 + (1 + q ) = √ 1 + (1 + p2 )−1/2 − 1 − (1 + q2 )−1/2 p =p 1 + (1 + p2 )−1/2 + 1 + (1 + q2 )−1/2 2(smp − smq ) = q 1 − (1 + p2 )−1/2 − q 1 − (1 + q2 )−1/2 −1 −(q − p)(q + p) (1 + q2 )1/2 + (1 + p2 )1/2 p = p 2 1/2 2 1/2 2 −1/2 2 −1/2 (1 + q ) (1 + p ) 1 − (1 + p ) + 1 − (1 + q ) q −1 2 1/2 2 1/2 −1 2 1 − (1 + r 2 )−1/2 ≤ −(q−p)(q+p) (1 + q ) + (1 + p ) = O(%) . Lemma 3.7. Für das σ · p“-Produkt eines Vektors mit den Paulimatrizen gelten ” folgende Regeln: (1) (σ · p)(σ · q) = pqI2 + iσ · (p × q), 54 (2) σ · p σ · q = 2pq, (3) σ · p I2 = Sp σ · p = 0, (4) [(σ · p)(σ · q)] [(σ · p0 )(σ · q0 )] = 2 [(pq)(p0 q0 ) + (p × q)(p0 × q0 )]. Falls die Beträge |p|, |q|, |p0|, |q0| ≤ 1, so ist der Betrag obigen Ausdrucks kleiner oder gleich 2. Beweis. Wir wiederholen die Paulimatrizen 1 0 0 −i 0 1 (3.23) ; , σ3 = , σ2 = σ1 = 0 −1 i 0 1 0 die Aussagen folgen leicht aus ihren grundlegenden Eigenschaften: σi2 = I2 , wobei σi σj = −σj σi für i 6= j , σi σj = iεijk σk , ijk gerade Permutation von 123 1 ijk ε = −1 ijk ungerade Permutation von 123 0 sonst der total antisymmetrische Tensor ist. Die erste Regel ist eine unmittelbare Konsequenz hieraus. Für die zweite Aussage benutzt man die Repräsentation (3.23): σ · p σ · q = (p1 σ1 − p2 σ2 + p3 σ3 ) σ · q = (p1 + ip2 )(q1 − iq2 ) + (p1 − ip2 )(q1 + iq2 ) + 2p3 q3 = 2pq . Die dritte ist unmittelbar einsichtig und um die letzte zu zeigen, verwenden wir alle vorangegangenen Formeln: [(σ · p)(σ · q)] [(σ · p0 )(σ · q0 )] = pqI2 − iσ · (p × q) p0 q0 I2 + iσ · (p0 × q0 ) = 2 [(pq)(p0 q0 ) + (p × q)(p0 × q0 )] . Die Behauptung für die Beträge beweisen wir durch Bestimmung der Extremalwerte von f (ϑ, ϑ0 ) = cos ϑ cos ϑ0 + d sin ϑ sin ϑ0 , mit ϑ = ∠(p, q), ϑ0 = ∠(p0 , q0 ) und |d| ≤ 1. Dazu berechnen wir die erste Ableitung von f in ϑ: ∂f (ϑ, ϑ0 ) = − sin ϑ cos ϑ0 + d cos ϑ sin ϑ0 . ∂ϑ Die Nullstellen sind, neben den Nullstellen der Winkelfunktionen, für die |f | ≤ 1 leicht ersichtlich ist, gegeben durch die Bedingung tan ϑ = d tan ϑ0 . Setzt man diese in f ein, so erhält man für die Extremalwerte fext (ϑ0 ) von f die Gleichung cos ϑfext (ϑ0 ) = cos2 ϑ + sin2 ϑ . cos ϑ0 Es folgt cos ϑ0 , und wegen cos ϑ = ±(1 + tan2 ϑ)−1/2 = ±(1 + d2 tan2 ϑ0 )−1/2 , fext (ϑ0 ) = cos ϑ 55 und wegen |d| ≤ 1 gilt |fext (ϑ0 )| = p d2 sin2 ϑ0 + cos2 ϑ0 ≤ 1 . Da f eine beschränkte periodische Funktion ist, durchläuft fext in jedem Fall sowohl das globale Maximum als auch das globale Minimum. Lemma 3.8. Sei√b := max{|p|, |q|, |p0|, |q0 |}, |p − q| ≤ 2% und |p0 − q0 | ≤ 2%. Dann gilt mit E(b) := b2 + m2 (3.24) cp cq − sp sq (ω p ω q ) cp0 cq0 − sp0 sq0 (ω p0 ω q0 ) + (ω p0 × ω q0 )(ω p × ω q )sp0 sq0 sp sq ≥ m2 E(b)−2 + O(%) √ für % → 0. Ist b ≤ 2 2m, so gilt obige Ungleichung auch ohne den O(%)-Term. √ Beweis. Wir betrachten zuerst den Fall b > 2 2m (Für diesen√Schritt benötigen wir nur, dass √ b größer als eine Konstante ist). Hier ist o.E. |p| ≥ 2 2m und folglich auch |q| ≥ 2 2m − 2%. Nach Lemma 3.6 gilt cos ∠(p, q) = 1 + O(%) und sin ∠(p, q) = O(%). Deshalb schreibt sich (3.24) bis auf einen Term der Ordnung O(%) als (cp cq − sp sq ) cp0 cq0 − sp0 sq0 (ω p0 ω q0 ) , und wegen cp ≥ sp ≥ 0 ist dies ist offensichtlich größer oder gleich (3.25) (cp cq − sp sq )(cp0 cq0 − sp0 sq0 ) . Da cp monoton fallend und sp monoton steigend sind, haben wir die Ungleichungen (3.26a) (3.26b) cp := sp := E(p) + m 2E(p) E(p) − m 2E(p) 1/2 1/2 ≥ ≤ E(b) + m 2E(b) E(b) − m 2E(b) 1/2 1/2 und . Damit ist (3.25) durch 2 1 m2 E(b) + m − E(b) − m = 4E(b)2 E(b)2 nach unten beschränkt. √ Im anderen Fall garantiert die Bedingung b ≤ 2 2m, dass E(b) ≤ 3m ist. Hier parametrisieren wir (3.24) mit den Winkeln ϑ := ∠(p, q), ϑ0 := ∠(p0 , q0 ) und d mit |d| ≤ 1: (3.27) (cp cq − sp sq cos ϑ)(cp0 cq0 − sp0 sq0 cos ϑ0 ) + d sin ϑ sin ϑ0 sp0 sq0 sp sq . Die kleinsten Werte werden wegen cp ≥ sp offensichtlich für 0 ≤ ϑ, ϑ0 ≤ π/2 und d = −1 angenommen. Die Abschätzungen (3.26) geben somit eine untere Schranke 56 für (3.27): 4E(b)2 (3.28) −1 E(b) + m − cos ϑ(E(b) − m) E(b) + m − cos ϑ0 (E(b) − m) 2 − sin ϑ sin ϑ0 E(b) − m 2 −1 = 4E(b)2 E(b) + m − E(b)2 − m2 (cos ϑ + cos ϑ0 ) 2 + E(b) − m (cos ϑ cos ϑ0 − sin ϑ sin ϑ0 ) . Hier müssen wir die Funktion f mit f (ϑ, ϑ0 ) := − cos ϑ − cos ϑ0 + e cos(ϑ + ϑ0 ) und e := E(b) − m / E(b) + m minimieren. Wegen der Bedingung E(b) ≤ 3m gilt 0 ≤ e ≤ 1/2. Die beiden Ableitungen von f sind ∂f (ϑ, ϑ0 ) ∂f (ϑ, ϑ0 ) = sin ϑ − e sin(ϑ + ϑ0 ) und = sin ϑ0 − e sin(ϑ + ϑ0 ) . 0 ∂ϑ ∂ϑ Für die Extremalwerte folgt hieraus sin ϑ0 = sin ϑ, und da beide Winkel aus dem Intervall [0, π/2] sind, gilt schließlich ϑ0 = ϑ. Es genügt also den einfacheren Ausdruck g(ϑ) = −2 cos ϑ + e cos 2ϑ = −2 cos ϑ + e(cos2 ϑ − sin2 ϑ) zu minimieren. Seine Ableitung ist ∂g(ϑ) = 2 sin ϑ − 4e sin ϑ cos ϑ , ∂ϑ also hat g Extremalwerte für sin ϑ = 0 und cos ϑ = (2e)−1 . Die erste Bedingung impliziert ϑ = 0 oder ϑ = π, die zweite wegen 0 ≤ e ≤ 1/2 bestenfalls ϑ = 0. Davon liegt aber nur ϑ = 0 in unserem Intervall [0, π/2], und die Randwerte von g sind −2 + e bzw. −e. Es gilt also f ≥ −2 + e, und folglich lässt sich der Ausdruck (3.28) auch in diesem Fall durch −1 m2 4E(b)2 (E(b) + m)2 − 2(E(b)2 − m2 ) + (E(b) − m)2 = E(b)2 nach unten abschätzen. 57 Stabilität von Atomen Von Bach et al. wurde bereits im ersten Artikel über dieses Modell [4] die Stabilität von Atomen der Kernladungszahl Z ≤ 68 (Erbium) gezeigt. Wir ersetzen die Dreiecksungleichung in ihrem Beweis durch ein exaktes Argument und erhalten so im physikalischen Fall Stabilität bis Z = 117, was alle bekannten Elemente einschließt. Der Beweis entstand in Zusammenarbeit mit Brummelhuis und Siedentop [11] und wurde bei der Zeitschrift Documenta Mathematica“ zur Veröffentlichung ein” gereicht. Wir folgen Bach et al., indem wir auf den Stabilitätsbeweis für das ElektronenPositronen-Feld (Abschnitt 3.1) aufbauen. In diesem wird die Austauschenergie mit der Ungleichung von Kato durch die kinetische Energie abgeschätzt (3.1): π WX ≤ Sp γ|∇|γ . 2 Mit einer Ungleichung der Form (4.1) |D Z | ≥ d|∇| kann man die erste Ungleichung fortführen und dann WX analog zu (3.2) durch die Einteilchenenergie abschätzen: p p π π π WX ≤ Sp γ|∇|γ ≤ d−1 Sp γ|D Z |γ ≤ d−1 Sp |D Z |(γ++ − γ−− ) |D Z | . 2 2 2 Wir erhalten π α EZ,α(γ) ≥ T (γ) 1 − , 2d 2 also Stabilität für α ≤ 4d/π und mit g := Zα ist die Konstante d der Ungleichung (4.1) gegeben durch p 1 p d = 1 − g 2 ( 4g 2 + 9 − 4g) . 3 Im Fall α = 1/137 benötigen wir für Stabilität d ≥ απ/4 = π/548, was mit obiger Gleichung numerisch einem Wert von g ≤ 0, 85498 und somit Z ≤ 117.13 liefert. Wir beweisen Ungleichung (4.1) mit der Konstante d in folgendem Abschnitt. Aus Gründen der Übersichtlichkeit benutzen wir eine weitere Notation für den Diracoperator mit Coulombpotential, g . Dg,m := −iα · ∇ + mβ + |x| Eine Ungleichung für Diracoperatoren √ Lemma 4.1. Sei g ∈ [0, 3/2], m ≥ 0 und ( p 1 ( 4g 2 + 9 − 4g) m = 0 3 p . d= p 1 − g 2 31 ( 4g 2 + 9 − 4g) m > 0 Dann gilt die Ungleichung (4.2) |Dg,m | ≥ d|D0,0 | = d|∇| . 58 Der folgende Graph gibt einen Überblick der Abhängigkeit von d von der Kopplungskonstante g. Den Operator |Dg,0 | kann man nicht explizit hinschreiben und so beweisen wir wie in [4] die stärkere Ungleichung 2 2 Dg,0 ≥ d2 D0,0 (4.3) √ für g < 3/2. Da die Definitionsbereiche der beiden Operatoren unter der Einschränkung an g identisch sind, folgt die behauptete Ungleichung (4.2) mit [24, Satz 3]. Wir werden zwar die scharfe Konstante d2 für (4.3) zeigen, aber wegen des Quadrierens ist nicht zu erwarten, dass d auch die scharfe Konstante für die Ungleichung (4.2) des Lemmas ist. In [4] wurde an dieser Stelle die Dreiecksungleichung angewandt; wir werden die Streckungshomogenität des masselosen CoulombDiracoperators ausnutzen um das Problem auf eine Ungleichung von Multiplikationsoperatoren zu reduzieren. Wie bereits bei√der Einführung des Diracoperators mit Coulombpotential erwähnt, ist Dg,m für g ≤ 3/2 wesentlich selbstadjungiert auf D := C0∞ (R3 \ {0}) ⊗ C4 und somit impliziert kDg,0 f k22 − d2 kD0,0 f k22 ≥ 0 für alle f ∈ D schon die Ungleichung (4.3). Er ist auf auf D unitär äquivalent zu seiner Drehimpulszerlegung mit ∞ M j M j= 21 , 23 ,... mj =−j hg,m,κ := M hg,m,κj κj =±(j+ 12 ) m − gr − ddr + κr d + κr −m − gr dr , definiert auf C0∞ (0, ∞) ⊗ C2 ⊆ L2 (0, ∞) ⊗ C2 [41, Satz 4.14]. Dabei sind j(j + 1), mj und −κj die Eigenwerte der Drehimpulsoperatoren J 2 , J3 bzw. des Spin-BahnOperators K. Wir verwenden nun die Mellintransformation. Sie ist für Streckungen, was die Fouriertransformation für Verschiebungen ist: Operatoren, die homogen unter 59 Streckungen sind, werden zu Multiplikationsoperatoren. Der Operator hg,0,κ ist jedoch homogen vom Grad −1 unter Streckungen und wird auf glatten Funktionen mit kompaktem Träger zu einer Multiplikation der um die Imaginäre Einheit verschobenen Funktion. Die unitäre Mellintransformation M : L2 (0, ∞) → L2 (R), f 7→ Mf ist definiert durch Z ∞ 1 r −1/2−is f (r) d r . Mf (s) = √ 2π 0 Sie ist unitär und wohldefiniert, da sie aus der Fouriertransformation und der unitären Abbildung ι: L2 (0, ∞) −→ L2 (−∞, ∞) f : r 7→ f (r) 7→ h : z 7→ ez/2 f (ez ) zusammengesetzt ist, wie man leicht durch Substitution mit r = ez sieht: Z ∞ Z ∞ 1 1 −isz z/2 z √ e e f (e ) d z = √ r −1/2−is f (r) d r . 2π 0 2π 0 Wir aber werden die Mellintransformation als Abbildung der glatten Funktionen mit kompaktem Träger in die holomorphen Funktionen auf ganz C betrachten, MH : C0∞ (0, ∞) → H(C). Die Transformierte ist trivialerweise auf ganz C definiert und holomorph, da Differentiation und Integration vertauschen. Ähnlich wie bei der Fouriertransformation gelten folgende Regeln: M (r a f ) (s) = Mf (s + ia) , 1 d f (s) = (is + )Mf (s − i) . M dr 2 Wir beweisen die zweite durch partielle Integration, wobei wegen des kompakten Trägers von f die Limiten von r −1/2−is f (r) für r → 0 und r → ∞ verschwinden: Z ∞ Z ∞ 1 −1/2−is d r f (r) d r = 0 − (− − is)r 1/2−is f (r) d r . dr 2 r=0 r=0 Wegen der Unitarität der Mellintransformation ist (4.3) äquivalent zu kMDg,0 f k22 − d2 kMD0,0f k22 ≥ 0 und der masselose Diracoperator im Kanal κ wird für f + , f − ∈ C0∞ (0, ∞) unter der Transformation zu + Mf + (s − i) f (s) −g −is − 21 + κ . Mhg,0,κ = Mf − (s − i) f − (s) −g +is + 21 + κ Wenn wir die obige Matrix mit hM g,0,κ bezeichnen, ist (4.3) gleichbedeutend mit Z ∞ ∗ M 2 M ∗ M (Mf )∗(s − i) (hM g,0,κ ) hg,0,κ − d (h0,0,κ ) h0,0,κ Mf (s − i) d s , −∞ 60 und dafür ist hinreichend, dass die Matrix in eckigen Klammern für κ = ±1, ±2, . . . nichtnegativ ist: ∗ M 2 M ∗ M (hM g,0,κ ) hg,0,κ − d (h0,0,κ ) h0,0,κ = 2 g + (1 − d2 )(s2 + (κ + 12 )2 ) −2(κ − is)g ≥0. −2(κ + is)g g 2 + (1 − d2 )(s2 + (κ − 21 )2 ) Diese Bedingung ist auch notwendig, da für alle f ∈ C0∞ (R3 ) die Funktion Mf (s−i) das Bild von f (r)/r unter der unitären Mellintransformation und die Abbildung f (r) 7→ r a f (r) eine Bijektion auf C0∞ (R3 ) ist. Damit folgt, dass die Menge {Mf (s − i)|f ∈ C0∞ (R3 )} ⊆ L2 (R3 ) dicht ist. Die Bedingung ist genau dann erfüllt, wenn die Eigenwerte dieser Matrix für alle s ∈ R und κ = ±1, ±2, . . . nichtnegativ sind. Die Eigenwerte sind die Lösungen des quadratischen Polynoms 1 1 2 λ2 − 2λ g 2 + (1 − d2 )(s2 + κ2 + ) + g 2 + (1 − d2 )(s2 + κ2 + ) 4 4 2 2 2 − (1 − d ) κ − 4g 2 (s2 + κ2 ) . Die kleinere davon ist p 1 λ1 = g 2 + (1 − d2 )(s2 + κ2 + ) − (1 − d2 )2 κ2 + 4g 2(s2 + κ2 ) . 4 Hier sieht man schon, dass d nicht größer als 1 sein kann und dass d = 1 nur für g = 0 möglich ist. Im Folgenden können wir also ohne weiteres d < 1 voraussetzen. Zuerst behandeln wir die notwendige Bedingung λ1 (s = 0) ≥ 0, die sich am Ende als die restriktivste herausstellen wird. Der kleinere Eigenwert an der Stelle s = 0, p 1 λ1 (s = 0) = g 2 + (1 − d2 )(κ2 + ) − |κ| (1 − d2 )2 + 4g 2 , 4 ist nichtnegativ, falls |κ| nicht in dem offenen Intervall zwischen den beiden Werten p p (1 − d2 )2 + 4g 2 ± (1 − d2 )2 + 4g 2 − 4(1 − d2 )(g 2 + (1 − d2 )/4) 2(1 − d2 ) p (1 − d2 )2 + 4g 2 ± 2gd = 2(1 − d2 ) liegt. Da aber nur ganzzahlige |κ| ≥ 1 relevant sind, können wir das Intervall unter 1 drücken oder es darüber ziehen. Sei zuerst das obere Ende des Intervalls kleiner gleich 1: p (1 − d2 )2 + 4g 2 + 2gd ≤1, 2(1 − d2 ) oder umgeformt, p (4.4) (1 − d2 )2 + 4g 2 ≤ 2(1 − d2 ) − 2gd . Wenn wir jetzt die Gleichung quadrieren, könnte das zu zusätzlichen Lösungen führen. Da sich aber herausstellen wird, dass für die Lösung die rechte Seite obiger 61 Ungleichung nichtnegativ ist, machen wir mit dem Quadrieren keinen Fehler. Wir bekommen (1 − d2 )2 + 4g 2 ≤ 4(1 − d2 )2 + 4g 2d2 − 8gd(1 − d2 ) und durch Kürzen von 1 − d2 4g 2 + 8dg − 3(1 − d2 ) ≤ 0 . Die Lösungen für d und g sind p 1 − 8g + 64g 2 − 4 · 3(−3 + 4g 2 ) d≤ 6 (4.5) p 1 p 1 − 8g + 16g 2 + 36 = 4g 2 + 9 − 4g , = 6 3 bzw. (4.6) p 1 − d2 1 √ 3 1 g ≤ (−8d + 64d2 + 4 · 4 · 3(1 − d2 )) = ( 3 + d2 − 2d) = √ . 8 2 2 3 + d2 + 2d Insbesondere gilt g ≤ (1 − d2 )/d, womit die rechte Seite von (4.4) wie vorher behauptet nichtnegativ ist. Der andere Fall, in dem das Intervall über 1 liegt, führt zu folgender Ungleichung: 4g 2 − 8dg − 3(1 − d2 ) ≥ 0 . Diese sagt, dass g nicht zwischen den Zahlen p √ 8d ± 64d2 + 16 · 3(1 − d2 ) 1 = (2d ± d2 + 3) 8 2 liegen darf. Die kleinere von beiden √ ist aber kleiner als 0 für d < 1 und die größere für positives d immer größer als 3/2. Die √ einzig erlaubten Werte wären die trivialen Kombinationen: g = 0, d = 1 und g = 3/2, d = 0. Die Ableitung des kleineren Eigenwerts nach s liefert −1/2 ∂λ1 = 2s[1 − d2 − 2g 2 (1 − d2 )2 κ2 + 4g 2 (s2 + κ2 ) ]. ∂s Die möglichen Extremalwerte sind s = 0 und die Nullstellen des Ausdrucks in eckigen Klammern. Wir werden zeigen, dass unter der Bedingung (4.5) bei s = 0 der einzige Extremalwert ist. Es ist notwendigerweise ein Minimum, da λ1 (s = ±∞) = ∞. Die Bedingung (4.5) garantiert aber gerade λ1 (s = 0) ≥ 0, womit das Lemma bewiesen ist. Wir zeigen nun die Positivität des Ausdrucks in eckigen Klammern. Dazu stellen wir zuerst fest, dass dieser für κ2 = 1 und s = 0 am kleinsten ist. Es genügt daher 4g 4 − (1 − d2 )2 ((1 − d2 )2 + 4g 2) < 0 zu zeigen. Löst man die Ungleichung, so erhält man √ 1+ 2 2 (1 − d2 )2 . g < 2 62 Wegen Bedingung (4.6) ist obige Ungleichung erfüllt falls s √ 2 1−d 1+ 2 3 √ (1 − d2 ) < 2 3 + d2 + 2d 2 und da d < 1 ist dies äquivalent zu q √ √ √ 3 < 2 1 + 2( 3 + d2 + 2d) . Aber die rechte Seite ist monoton steigend in d und größer als 3 für d = 0. Damit ist die Positivität gezeigt und λ1 hat bei s = 0 sein globales Minimum. Wir reduzieren jetzt den massiven Fall auf den bereits bewiesenen masselosen. Es gilt die folgende Beziehung zwischen den Quadraten des massiven und masselosen Diracoperators: 2 2 Dg,m = Dg,0 + m2 − 2mβg/|x| . Dieser Operator ist offensichtlich nichtnegativ. Wir werden aber zeigen, dass man 2 nur einen Bruchteil von Dg,0 benötigt, um die Massenterme zu kontrollieren. Es gilt (4.7) 2 Dg,0 + m2 − 2mβg/|x| ≥ 0 genau dann, wenn ≥ g 2 . p Um dies einzusehen, verwenden wir den bekannten kleinsten Eigenwert m 1 − g 2 des Diracoperators mit Coulombpotential [41, Abschnitt 7.4]. Wir bekommen die 2 Operatorungleichung Dg,m ≥ m2 (1−g 2 ). Multiplizieren wir diese mit und skalieren die Masse mit 1/, so erhalten wir Es folgt 2 Dg,0 1 2 m2 (1 − g 2 ) 2 2 ≤ D = D + m − 2mβg/|x| . g,m/ g,0 2 1 − g2 g2 2 + m − 2mβg/|x| ≥ 1 − 1/ + m = 1− m2 2 und somit auch (4.7) falls ≥ g 2 . Diese Bedingung ist auch notwendig, da für den Grundzustand des Diracoperators überall die Gleichheit gilt. Mit (4.7) lässt sich die massive Ungleichung nun in einer Zeile zeigen: 2 2 2 2 Dg,m = (1 − g 2 )Dg,0 + g 2 Dg,0 + m2 − 2mβg/|x| ≥ (1 − g 2 )d2 D0,0 . Der Grund für den Sprung zwischen den Fällen m = 0 und m 6= 0 liegt darin, dass wir im zweiten Fall zwei, für sich scharfe, Ungleichungen verwendet haben. Eine solche Zusammensetzung ist aber im Allgemeinen nicht mehr scharf. √ Der Fall Zα = 3/2 √ Wir zeigen, dass wir für g = 3/2 in der quadrierten“ Ungleichung ” 2 2 (4.8) Dg,m ≥ d2 D0,m nur die Konstante d2 = 0 bekommen können. Der tiefere Grund ist die Existenz von Funktionen im Definitionsbereich von D√3/2,m , deren Ableitung nicht quadratintegrierbar ist. Ein Beispiel ist die Eigenfunktion zum niedrigsten Eigenwert. 63 Für allgemeines g ∈ [0, gegeben durch √ 3/2] ist diese Funktion in dem Drehimpulskanal κ = −1 −g ng r s e−gmr , 1−s p 1 − g 2 und ng der Normierungsfaktor für die L2 -Norm ist.√ Ihre wobei s = Ableitung ist quadratintegrierbar, falls s > 1/2, oder gleichbedeutend g < 3/2, ist. Zum Beweis berechnen wir die L2 -Norm von h√3/2,m,−1 Ψβ und h0,m,−1 Ψβ mit p β ∈ (1, 2), g = 3/2, s = 1/2, m0 > 0 und 0 −g Ψβ := nβ r βs e−gm r . −(s − 1) Wir werden sehen, dass mit β → 1 die erste beschränkt bleibt und die zweite nach √ unendlich strebt. Es folgt also d2 = 0 für g = 3/2 in (4.8). Der Wert von m0 ist nicht weiter relevant, er darf nur nicht verschwinden, damit Ψβ quadratintegrabel bleibt. d −gm + g 2 /r + (s − 1) dr + (s − 1)/r β/2 −gm0 r hg,m,−1 Ψβ = nβ r e d −g dr + g/r + (s − 1)m + (s − 1)g/r 2 g + (βs + 1)(s − 1) + r(−gm − (s − 1)gm0 ) β/2−1 −gm0 r r e . = nβ −gβs + g + (s − 1)g + r(g 2m0 + (s − 1)m) Schreibt man obige Funktion als f1 (β) + r · h1 β/2−1 −gm0 r nβ r e , f2 (β) + r · h2 so ergibt sich für die Norm Z ∞ 0 2 nβ (f1 (β) + r · h1 )2 + (f2 (β) + r · h2 )2 r β−2 e−2gm r d r . r=0 Wegen β > 1 könnten nur die Terme mit fi2 unbeschränkt sein. Da aber √ f1 (β) = (1 − β)/4 , f2 (β) = (1 − β) 3/2 und für a ∈ (−1, 0) und b > 0 die einfache Ungleichung Z ∞ Z 1 Z ∞ a −br a r e dr ≤ r dr + e−br d r = r=0 r=0 r=1 e−b 1 + a+1 b gilt, verschwindet der Grenzwert dieser Terme. Wie oben bekommen wir für den anderen Fall d −gm + (s − 1) dr + (s − 1)/r βs −gm0 r h0,m,−1 Ψβ = nβ r e d −g dr + g/r + (s − 1)m (βs + 1)(s − 1) + r(−gm − (s − 1)gm0 ) βs−1 −gm0 r = nβ r e . −gβs + g + r(g 2 m0 + (s − 1)m) Aber hier verschwinden die Terme der Ordnung r βs−1 nicht für β → 1, die L2 -Norm ist also unbeschränkt. 64 Anhang Zuerst geben wir den Beweis für die Optimalität unserer Wahl des Elektronenraums (vergleiche Abschnitt 2). Satz 5.1 (Optimalität der Wahl von H+ [4, Theorem 6]). Sei P+Z die orthogonale Projektion auf den positiven Spektralraum von D Z und S die Menge aller orthogonalen Projektionen P auf H mit P (D(D Z )) ⊆ D(D Z ). Bezeichne mit H+ den Raum P H für eine Projektion P ∈ S und mit E(H+ ) das Infimum der Energie (2.6) des Modells mit Elektronenraum H+ . Ist E(P+Z H) = 0, was jeder bewiesene Stabilitätsfall erfüllt, so gilt E(H+ ) < 0 = E(P+Z H) für alle H+ 6= P+Z H. Beweis. Der Beweis hat zwei Teile; zuerst nehmen wir an, dass zwei normierte VekZ Z toren p ∈ H+ ∩ D(D Z ) und n ∈ H⊥ + ∩ D(D ) mit <(p, D n) 6= 0 existieren. Wir wählen unsere Basis von H mit den Elementen e−1 = n und e1 = p und die Ladungsdichtematrix γ 0 Γ= 0 −γ mit γi,j Die Energie von Γ ist ε2 2 −ε √ = ε 1 − ε2 0 i=j=1 i = j = −1 . i = −j ∈ {−1, 1} sonst Z Z EZ,α (Γ) = ε(D1,−1 + D−1,1 ) + O(ε2) und mit einem kleinen ε richtigen Vorzeichens ist sie negativ. Z Gilt umgekehrt (p, D Z n) = 0 für alle p ∈ H+ ∩D(D Z ) und n ∈ H⊥ + ∩D(D ), dann Z Z kommutieren P und D und somit nach dem Spektralsatz auch P und P+ . Daher Z ist eine der Mengen D(D Z ) ∩ H+ ∩ (1 − P+Z )(H) und D(D Z ) ∩ H⊥ + ∩ (1 − P+ )(H) nicht leer. Nehmen wir an, es gibt ein normiertes u in der ersten und unsere Orthonormalbasis hat als nulltes Element e0 = u. Die Energie der Ladungsdichtematrix zu dem Zustand ϕ = a∗0 Ω ∈ F, ( 1 i=j=0 γ 0 Γ= mit γi,j = , 0 −γ 0 sonst ist Z EZ,α (Γ) = D0,0 <0. 65 Hilbert-Schmidt-Operatoren Hier werden kurz die in der Arbeit benötigten Resultate über Hilbert-Schmidt- und Spurklasseoperatoren vorgestellt. Sei M := Rn ×{1, . . . , m} für natürliche Zahlen m und n und L2 (M) versehen mit dem Produktmaß aus Lebesgue- und Zählmaß. Wir fixieren eine Orthonormalbasis 2 (ei )i∈ von L (M) und die Orthonormalbasis ei (x)ej (y) i,j∈ des Produktraums L2 (M × M). Ein Operator γ : L2 (M) → L2 (M) ist ein Hilbert-Schmidt-Operator genau dann, wenn es eine Funktion γ(x, y) ∈ L2 (M × M) mit Z (γf )(x) = γ(x, y)f (y) d y M 2 für alle f ∈ L (M) gibt [7, Theorem 3.6.5]. Diese ist in L2 (M × M) eindeutig, da ihre Koeffizienten bezüglich der Basis durch (ei , γej ) gegeben sind. Das Quadrat der Hilbert-Schmidt-Norm ist definiert als X |(ei , γej )|2 = Sp γ ∗ γ = Sp γγ ∗ = kγ(x, y)k22 . i,j∈ Es gilt also allgemein γ(x, y) = X (ei , γej )ei (x)ej (y) , i,j∈ oder, falls γ normal ist und man als Basis seine Eigenfunktionen wählt, X γ(x, y) = (ei , γei )ei (x)ei (y) . i∈ Im Fourierraum schließlich schreibt sich der Integralkern als X γ(p, q) = (ei , γej )eˆi (p)eˆj (q) . i,j∈ Lemma 5.2 ([38, §XI.4]). Sei K eine stetige Funktion auf M × M mit folgenden Eigenschaften: • Für alle f ∈ C0 (M) gilt Z Z f (x)K(x, y)f (y) d x d y ≥ 0 M M Rund somit K(x, x) ≥ 0. • M K(x, x) d x < ∞. Dann gibt es einen Spurklasseoperator A mit Integralkern K und Z Sp A = K(x, x) d x . M Ist umgekehrt A ein positiver Operator endlicher Spur mit stetigem Integralkern K, R so ist M K(x, x) d x endlich und seine Spur durch obige Formel gegeben. Lemma 5.3. Sei G ein Hilbertraum, γ : G → G ein Hilbert-Schmidt-Operator und A : G → G ein positiver selbstadjungierter Operator. Dann gilt √ √ Sp Aγ ∗ γ A = Sp γAγ ∗ , 66 in dem Sinne, dass wenn eine Seite unendlich ist, so auch die andere. Ist darüber hinaus noch Aγ ∗ γ Spurklasse, so sind obige Terme auch gleich Sp Aγ ∗ γ. √ Beweis. Mit B := γ A schreibt sich die Behauptung als Sp B ∗ B = Sp BB ∗ . Dies sind aber die identischen Hilbert-Schmidt-Normen von B und B ∗ . Ist Aγ ∗ γ Spurklasse, so ist seine Spur mit den Eigenfunktionen fi zu den nicht verschwindenden Eigenwerten λi von γ ∗ γ durch die Summe der nichtnegativen Terme X (5.1) λi (fi , Afi ) i gegeben. Sei E das zu A gehörige Spektralmaß und An := E(−∞, n]A = E[0, n]A für n > 0 die Einschränkung von A auf den numerischen Wertebereich [0, n]. Die ∗ steigend Folge (Sp An γ ∗ γ)n∈ ist mit √ ∗ und √ konvergiert gegen Sp Aγ γ √ (5.1)∗ monoton √ und gleichermaßen gilt Sp An γ γ An → Sp Aγ γ A. Für alle endlichen n sind die Folgeglieder aber identisch. Die Matrixelemente des Coulombpotentials In diesem Abschnitt stellen wir ein paar Hilfssätze für den Umgang mit dem Coulombpotential zusammen. Lemma 5.4. Für ei , ej , ek , el ∈ H 1/2 (R3 ) ⊗ C4 ist das Matrixelement Z Z ei (x)ej (y)ek (x)el (y) Wi,j;k,l = dx dy |x − y| G G der Coulombwechselwirkung endlich. Beweis. Es gilt |ei (x)ek (x)| ≤ |ei (x)|2 + |ek (x)|2 , also genügt es den Fall ei = ek und ej = el zu behandeln. Durch Anwendung der Ungleichung von Kato (1.2) in einer Variablen erhalten wir Z Z Z Z π |ei (x)|2 |ej (y)|2 ≤ d x d y ei (x) |∇x | ei(x)|ej (y)|2 dx dy |x − y| 2 G G G G π 2 ≤ kei kH 1/2 kej k2H 1/2 . 2 Lemma 5.5 (Fouriertransformation des Coulompotentials). Seien i, j, k, l ∈ Z fix und ei , ej , ek , el ∈ L12/5 (R3 )⊗C4 . Dann ist das Matrixelement Wi,j;k,l im Fourierraum gegeben durch Z Z ei (x)ej (y)ek (x)el (y) Wi,j;k,l = dx dy |x − y| G G 4 Z 1 X = 2 d q d q0 d p|q|−2 ebj (q − p, σ)b el (−p, σ)b ei (−q + q0 , τ )ebk (q0 , τ ) 2π σ,τ =1 9 4 Z 1 X d q d q0 d p|q − q0 |−2 ebj (q0 + p, σ)b = 2 el (p + q, σ)b ei (q, τ )ebk (q0 , τ ) . 2π σ,τ =1 9 67 Beweis. Aus [30, Korollar 5.10] nehmen wir die Formel (nach Polarisation, für die gewöhnliche Fouriertransformation (0.1)) Z Z 2a−n 2a fb2 (q)|q|−2a fb1 (q) d q, f2 (x)|x − y| f1 (y) d y d x = c2a (2π) cn−2a n n mit ca := π −a/2 Γ(a/2), 0 < a < n/2 und f1 , f2 ∈ L2n/(n+2a) . In unserem Fall ist n = 3, a = 1, f1 (x) := ei (x)ek (x) und f2 (y) := ej (y)el (y). Wir benötigen die −3/2 Konstanten c1 = 1 und c2 = π −1 , und wegen ed ebi ∗ ebj ergibt sich für i ej = (2π) das Matrixelement Wi,j;k,l 4 Z 1 X 2π 2 σ,τ =1 9 d q d q0 d p|q|−2 ebj (q − p, σ)b el (−p, σ)b ei (−q + q0 , τ )ebk (q0 , τ ) 4 Z 1 X = 2 2π σ,τ =1 4 Z 1 X = 2 2π σ,τ =1 9 9 el (p, σ)b ei (q, τ )ebk (q0 , τ ) d q d q0 d p|q − q0 |−2 ebj (−q + q0 + p, σ)b d q d q0 d p|q − q0 |−2 ebj (q0 + p, σ)b el (p + q, σ)b ei (q, τ )ebk (q0 , τ ) , wobei wir von der zweiten zur dritten Zeile q → −q + q0 und p → −p substituieren und zur letzten noch p → p + q. Als unmittelbare Folge erhalten wir eine Formel für die Austauschenergie im Impulsraum. Lemma 5.6 (Die Austauschenergie im Impulsraum). Ist γ(x, y) ∈ G := H 1/2 (G × G), so ist die Austauschenergie im Fourierraum gleich WX = kγ(x, y)|x − y|−1/2 k22 4 Z 1 X = 2 d q d q0 d p|q − q0 |−2 γ(q0 + p, σ; q0 , τ )γ(q + p, σ; q, τ ) . 2π σ,τ =1 9 Beweis. Mit der Kato-Ungleichung gilt für f (x, y) ∈ G, wie im Beweis der Endlichkeit der Matrixelemente, Z G×G |f (x, y)|2 π ≤ |x − y| 2 Z G×G |p||f (p, q)|2 ≤ π kf k2H 1/2 . 2 Die Abbildung G → R, f (x, y) 7→ kf (x, y)|x − y|−1/2 k22 ist also stetig. Mit der KatoUngleichung im Fourierraum, 1 2π 2 Z π u(p)u(q) dpdq ≤ |p − q|2 2 6 Z d p|p||u(p)|2 , 3 68 erhalten wir für die rechte Seite der Behauptung die analoge Abschätzung 4 Z 1 X d q d q0 d p|q − q0 |−2 f (q0 + p, σ; q0 , τ )f (q + p, σ; q, τ ) 2 2π σ,τ =1 9 4 Z π X π ≤ d p d q|q||f (p, σ; q, τ )|2 ≤ kf k2H 1/2 . 2 σ,τ =1 6 2 Damit hängt auch die rechte Seite stetig von f (x, y) ab und es genügt, die Behauptung auf einer dichten Teilmenge von G zu zeigen. Da C0∞ (G) in H 1/2 (G) dicht ist, können wireine Orthonormalbasis (fi )i∈ von H 1/2 (G) aus C0∞ (G) wählen. Dann ist fi (x)fj (y) i,j∈ eine Orthonormalbasis von G, und für diese wurde die Behauptung in Lemma 5.5 bewiesen. Folglich gilt sie auch auf allen endlichen Linearkombinationen der Basis, einer dichten Teilmenge. In den folgenden beiden Lemmas beweisen wir zwei Behauptungen aus Abschnitt 2.3 über die Matrixelemente des Coulombpotentials mit der Zerlegung von H in H+ und H− bezüglich des masselosen freien Diracoperators. Der masselose freie Diracoperator hat im Impulsraum die Gestalt 0 σ·p 0 , D = σ·p 0 und daher eine besonders einfache Zerlegung von H in H+ und H− . Für jedes u ∈ L2 (R3 ) ⊗ C2 definieren wir die Vektoren u u + − und u := (5.2) u := σ · ωpu −σ · ω p u und erhalten D 0 u+ = |p|u+ und D 0 u− = −|p|u− . Darüber hinaus ist wegen (σ·ω p )2 = I2 jedes Element von H eine Linearkombination von Vektoren der Form (5.2): 1 u + (σ · ω p )v 1 u − (σ · ω p )v u = + . v 2 (σ · ω p u) + v 2 −(σ · ω p )u + v Es folgt also, dass H+ gleich der Menge der Vektoren u+ und H− gleich der Menge der Vektoren u− ist. An der Form von u+ und u− sieht man die Invarianz der Räume H+ und H− unter Streckung der Koordinaten. Dies gilt, wie man sich leicht anhand elementarer Eigenschaften der Fouriertransformation überlegen kann, auch im Ortsraum. Die Zerlegung in H+ und H− im massiven Fall ist auch nicht viel komplizierter; man findet sie in [20] oder implizit in Abschnitt 3.2. Lemma 5.7. Sind H+ und H− bezüglich des masselosen freien Diracoperators gewählt, dann gibt es orthonormale Vektoren e1 , e2 , e−1 , e−2 mit e1 , e2 ∈ H+ , e−1 , e−2 ∈ H− , deren Matrixelemente des Coulombpotentials die Eigenschaften W−1,−2;1,2 > 0 und W−2,−1;1,2 = 0 haben. 69 Beweis. Mit der Bezeichnung (ω p )i für die i-te Komponente des Einheitsvektors von p gilt (ω p )3 (ω p )1 − i(ω p )2 σ · ωp = . (ω p )1 + i(ω p )2 −(ω p )3 Wir wählen eine kugelsymmetrische C0∞ (R3 \ {0})-Funktion e und definieren mit Hilfe obiger Darstellung von H+ und H− zwei orthogonale Elektronen f1 , f2 und zwei orthogonale Positronen g1 , g2 im Impulsraum: e(p) e(p) 0 0 , , g1 (p) := f1 (p) := −(ω p )3 e(p) (ω p )3 e(p) −((ω p )1 + i(ω p )2 )e(p) ((ω p )1 + i(ω p )2 )e(p) 0 0 e(p) e(p) f2 (p) := ((ω p )1 − i(ω p )2 )e(p) , g2 (p) := −((ω p )1 − i(ω p )2 )e(p) . −(ω p )3 e(p) (ω p )3 e(p) Aufgrund der beabsichtigten hohen Symmetrie lassen sich die Komponenten aller vier Vektoren durch die des ersten ausdrücken, 0 0 f11 f11 0 , g1 = 0 , f2 = f11 , g2 = f11 . f1 = −f14 f13 −f13 f14 f14 −f14 −f13 f13 Damit ergibt sich das erste Matrixelement, W−1,−2;1,2 , zu 4 Z 1 X d q d q0 d p|q|−2 g2 (q − p, σ)f2 (−p, σ)g1 (−q + q0 , τ )f1 (q0 , τ ) 2 2π σ,τ =1 9 Z 1 = 2 d q d q0 d p|q|−2 2π 9 · f11 (q − p)f11 (−p) − f14 (q − p)f14 (−p) − f13 (q − p)f13 (−p) · f11 (−q + q0 )f11 (q0 ) − f13 (−q + q0 )f13 (q0 ) − f14 (−q + q0 )f14 (q0 ) . Da aber die Komponenten von f1 die Spiegelungssymmetrien f11 (−p) = f11 (p), f13 (−p) = −f13 (p) und f14 (−p) = −f14 (p) erfüllen, und die Faltung einer Funktion mit seiner komplexen Konjugation eine reellwertige Funktion ist, kann man den Ausdruck wie folgt vereinfachen: Z 1 d q d q0 d p|q|−2 2π 2 9 · f11 (q − p)f11 (p) + f14 (q − p)f14 (p) + f13 (q − p)f13 (p) · f11 (q − q0 )f11 (q0 ) + f13 (q − q0 )f13 (q0 ) + f14 (q − q0 )f14 (q0 ) Z 2 1 d q|q|−2 f11 ∗ f11 (q) + f13 ∗ f13 (q) + f14 ∗ f14 (q) = 2 2π 3 70 Für die Positivität des Matrixelements bleibt zu zeigen, dass die Funktion in Klammern nicht fast überall verschwindet. Es gilt aber f11 ∗ f11 (q) + f13 ∗ f13 (q) + f14 ∗ f14 (q) = Z 3 d p(1 + ω q−p ω p )f11 (q − p)f11 (p) , und die Funktion 1+ω q−p ω p hat ihre Nullstellen in der Nullmenge {p = λq|λ ∈ R}. Da f11 nichtnegativ und als nicht fast überall verschwindend vorausgesetzt war, folgt die Behauptung für das erste Matrixelement. Das zweite Matrixelement, W−2,−1;1,2 , ist gegeben durch 4 Z 1 X d q d q0 d p|q|−2 g1 (q − p, σ)f2 (−p, σ)g2 (−q + q0 , τ )f1 (q0 , τ ) 2π 2 σ,τ =1 9 Z 1 = 2 d q d q0 d p|q|−2 − f13 (q − p)f14 (−p) + f14 (q − p)f13 (−p) 2π 9 · − f14 (−q + q0 )f13 (q0 ) + f13 (−q + q0 )f14 (q0 ) = 0 , da der Integrand punktweise verschwindet. Dies folgt leicht aus den oben genannten Symmetrien von f13 und f14 und der Tatsache, dass f13 reell ist. Lemma 5.8. Der Vakuumerwartungswert der nicht vollständig normalgeordneten Coulombwechselwirkung bezüglich des masselosen freien Diracoperators Z X X Z ei (x)ej (x)ei (y)ej (y) (5.3) Wi,j;j,i = dx dy |x − y| G i<0,j≥0 i<0,j≥0 G ist unendlich oder basisabhängig. Beweis. Aus dem Beweis des vorangegangenen Lemmas kann man entnehmen, dass es ein normiertes Elektron-Positron-Paar e−1 , e1 mit W−1,1;1,−1 > 0 gibt. Wir ergänzen diese zwei Vektoren zu einer mit der Zerlegung H+ ⊕ H− verträglichen Basis (siehe Definition 2.1) (ei )i∈ von H. Wegen der Skalierungsinvarianz von H+ und H− ist (e0i )i∈ mit e0i (x) := λ3/2 ei (λx) für ein λ > 0 wieder eine solche Basis. Das neue Matrixelement bezüglich (e0i )i∈ ist λW−1,1;1,−1 , und da alle Terme in (5.3) nichtnegativ sind, folgt die Divergenz der Summe, falls diese basisunabhängig ist. 71 Literatur [1] V. Bach, E. H. Lieb und J. P. Solovej. Generalized Hartree-Fock theory and the Hubbard model. J. Stat. Phys., 76(1&2):3–89, 1994. [2] V. Bach. Error bound for the Hartree-Fock energy of atoms and molecules. Commun. Math. Phys., 147:527–548, 1992. [3] V. Bach, J-M. Barbaroux, B. Helffer und H. Siedentop. Stability of matter for the Hartree-Fock functional of the relativistic electron-positron field. Doc. Math., 3:353–364, 1998. [4] V. Bach, J-M. Barbaroux, B. Helffer und H. Siedentop. On the stability of the relativistic electron-positron field. Commun. Math. Phys., 1999. [5] V. Bach und J. Poelchau. Accuracy of the Hartree-Fock approximation for the Hubbard model. J. Math. Phys., 38(4):2072–2083, 1997. [6] A. A. Balinsky und W. D. Evans. Stability of one-electron molecules in the Brown-Ravenhall model. Commun. Math. Phys., 202(2):481–500, 1999. [7] J. Blank, P. Exner und M. Havlı́ček. Hilbert space operators in quantum physics. American Institute of Physics, New York, 1994. [8] O. Bratteli und D. W. Robinson. Operator algebras and quantum statistical mechanics. 1. Springer-Verlag, New York, 2. Auflage, 1987. [9] O. Bratteli und D. W. Robinson. Operator algebras and quantum statistical mechanics. 2. Springer-Verlag, Berlin, 2. Auflage, 1997. [10] G. E. Brown und D. G. Ravenhall. On the interaction of two electrons. Proc. Roy. Soc. London A, 208(A 1095):552–559, 1951. [11] R. Brummelhuis, N. Röhrl und H. Siedentop. Stability of relativistic electron-positron fields of atoms in Hartree-Fock approximation: heavy elements. Eingereicht bei Documenta Mathematica, 2000. [12] P. Chaix und D. Iracane. From quantum electrodynamics to mean-field theory: I. The Bogoliubov-Dirac-Fock formalism. J. Phys. B., 22(23):3791–3814, 1989. [13] P. Chaix, D. Iracane und P. L. Lions. From quantum electrodynamics to mean-field theory: II. Variational stability of the vacuum of quantum electrodynamics in the mean-field approximation. J. Phys. B., 22(23):3815–3828, 1989. [14] J. G. Conlon. The ground state energy of a classical gas. Commun. Math. Phys, 94(4):439–458, 1984. [15] I. Daubechies und E. H. Lieb. One-electron relativistic molecules with Coulomb interaction. Comm. Math. Phys., 90(4):497–510, 1983. [16] D. Hundertmark, N. Röhrl und H. Siedentop. The sharp bound on the stability of the relativistic electron-positron field in Hartree-Fock approximation. Commun. Math. Phys., 211(3):629– 642, 2000. [17] J. D. Drell und S. D. Drell. Relativistic quantum fields. International Series in Pure and Applied Physics. McGraw-Hill, New York, 1. Auflage, 1965. [18] F. J. Dyson and A. Lenard. Stability of matter I. J. Math. Phys., 8:423–434, 1967. [19] F. J. Dyson and A. Lenard. Stability of matter II. J. Math. Phys., 9:698–711, 1968. [20] W. D. Evans, P. Perry und H. Siedentop. The spectrum of relativistic one-electron atoms according to Bethe and Salpeter. Commun. Math. Phys., 178(3):733–746, 1996. [21] P. Federbush. A new approach to the stability of matter problem. I. J. Math. Phys., 16:347– 351, 1975. [22] C. L. Fefferman und R. de la Llave. Relativistic stability of matter – I. Revista Matematica Iberoamericana, 2(1, 2):119–161, 1986. [23] G. Hardekopf und J. Sucher. Relativistic wave equations in momentum space. Phys. Rev. A, 30(2):703–711, 1984. [24] E. Heinz. Beiträge zur Störungstheorie der Spektralzerlegung. Math. Ann., 123:415–438, 1951. [25] I. W. Herbst. Spectral theory of the operator (p2 + m2 )1/2 − Ze2 /r. Commun. Math. Phys., 53:285–294, 1977. 72 [26] G. Hoever und H. Siedentop. Stability of the Brown-Ravenhall operator. Math. Phys. Electron. J., 5:Arbeit 6, 11 Seiten, 1999. [27] T. Kato. Perturbation theory for linear operators, Band 132 der Grundlehren der mathematischen Wissenschaften. Springer-Verlag, Berlin, 1. Auflage, 1966. [28] E. H. Lieb und H. Siedentop. Renormalization of the regularized relativistic electron-positron field. mp arc, 00-98, 2000. [29] E. H. Lieb. The stability of matter: from atoms to stars. Bull. Amer. Math. Soc. (N.S.), 22(1):1–49, 1990. [30] E. H. Lieb und M. Loss. Analysis. Band 14 der Serie Graduate Studies in Mathematics. American Mathematical Society, Providence, 2. Auflage, 1997. [31] E. H. Lieb, H. Siedentop und J. P. Solovej. Stability and instability of relativistic electrons in classical electromagnetic fields. J. Statist. Phys., 89(1-2):37–59, 1997. [32] E. H. Lieb und W. E. Thirring. Bound for the kinetic energy of Fermions which proves the stability of matter. Phys. Rev. Lett., 35(11):687–689, 1975. Erratum: Phys. Rev. Lett., 35(16):1116, 1975. [33] E. H. Lieb und W. E. Thirring. Inequalities for the moments of the eigenvalues of the Schrödinger Hamiltonian and their relation to Sobolev inequalities. In Elliott H. Lieb, Barry Simon und Arthur S. Wightman, Herausgeber, Studies in Mathematical Physics: Essays in Honor of Valentine Bargmann. Princeton University Press, Princeton, 1976. [34] E. H. Lieb und H-T. Yau. The stability and instability of relativistic matter. Commun. Math. Phys., 118:177–213, 1988. [35] M. Loss. The stability of matter interacting with fields. Notices Amer. Math. Soc., 44(10):1288–1293, 1997. [36] H. Nagaoka. Kinetics of a system of particles illustrating the line and the band spectrum and the phenomena of radioactivity. Phil. Mag., 7:445–455, 1904. [37] G. Nenciu. Self-adjointness and invariance of the essential spectrum for Dirac operators defined as quadratic forms. Commun. Math. Phys., 48:235–247, 1976. [38] M. Reed and B. Simon. Methods of modern mathematical physics. III. Academic Press, New York, 1979. [39] J. Sucher. Foundations of the relativistic theory of many-electron atoms. Phys. Rev. A, 22(2):348–362, 1980. [40] J. Sucher. Relativistic many-electron Hamiltonians. Phys. Scripta, 36:271–281, 1987. [41] B. Thaller. The Dirac Equation. Texts and Monographs in Physics. Springer-Verlag, Berlin, 1. Auflage, 1992. [42] C. Tix. Lower bound for the ground state energy of the no-pair Hamiltonian. Phys. Lett. B, 405(3-4):293–296, 1997. [43] C. Tix. Strict positivity of a relativistic Hamiltonian due to Brown and Ravenhall. Bull. London Math. Soc., 30(3):283–290, 1998. [44] R. Weder. Spectral analysis of pseudodifferential operators. J. Funct. Anal., 20:319–337, 1975.