Theoretische Physik V Höhere Quantentheorie Skritpum o.Univ.-Prof. Urbaan M. Titulaer Institut für Theoretische Physik Universität Linz SS 2009 Version vom 1. Oktober 2009 Vorwort Dieses Skriptum basiert auf den Unterlagen zu Vorlesung ”Höhere Quantentheorie” von o.Univ.-Prof. Urbaan M. Titulaer. Im Laufe der Zeit wurde dieses Skriptum um zwei Teilkapitel (”Verborgene Variablen und die Bell’sche Ungleichung” und ”Die Dichtefunktionalmethode”) erweitert, welche nun an den entsprechenden Stellen in diesen Text eingearbeitet wurden. Sämtliche Abbildungen wurden neu erstellt und ersetzen die vorhandenen. Der Inhalt ist weiterhin geistiges Eigentum des Urhebers der Originalversion, o.Univ.-Prof. Urbaan M. Titulaer. Die digitale Version wurde von Oskar Armbruster ([email protected]), Johannes Gall ([email protected]) und Philipp Kolmhofer ([email protected]) erstellt. Dieses Skriptum wurde mit größter Sorgfalt erstellt und mehrfach auf Fehler kontrolliert. Trotzdem kann nicht für die Fehlerfreiheit garantiert werden. Sollten Sie einen Fehler entdecken, so teilen Sie uns diesen bitte mit. Linz, am 23. Juni 2009 Oskar Armbruster, Johannes Gall, Philipp Kolmhofer Inhaltsverzeichnis 1 Zielsetzung und Inhaltsübersicht 4 2 Quantentheorie des Strahlungsfeldes 2.1 Die klassischen Feldgleichungen und die Feldoszillatoren . . . . . . . . . . . 2.1.1 Entwicklung nach Modenfunktionen . . . . . . . . . . . . . . . . . . 2.1.2 Das Vektorpotential; Ankoppelung an eine Stromdichte . . . . . . . 2.2 Quantisierung der Feldoszillatoren . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Der Hilbertraum des Strahlungsfeldes . . . . . . . . . . . . . . . . . 2.2.2 Superposition von Zuständen . . . . . . . . . . . . . . . . . . . . . 2.2.3 Einstein-Podolsky-Rosen Korrelationen . . . . . . . . . . . . . . . . 2.2.4 Verborgene Variablen und die Bell’sche Ungleichung . . . . . . . . . 2.2.5 Erwartungswerte von Feldoperatoren; Kohärente Zustände . . . . . 2.2.6 Regularisierung der Feldoperatoren . . . . . . . . . . . . . . . . . . 2.3 Das Strahlungsfeld in Wechselwirkung mit Atomen . . . . . . . . . . . . . 2.3.1 Wahl der störungstheoretischen Behandlung . . . . . . . . . . . . . 2.3.2 Die Matrixelemente der Störung; Die Dipolnäherung . . . . . . . . 2.3.3 Kurze Rekapitulation der zeitabhängigen Störungstheorie . . . . . . 2.3.4 Emission und Absorption von Strahlung . . . . . . . . . . . . . . . 2.3.5 Streuung von Photonen . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Das Atom im Strahlungsfeld: Spezielle Probleme . . . . . . . . . . . . . . . 2.4.1 Idealisierte Photodetektoren . . . . . . . . . . . . . . . . . . . . . . 2.4.2 Die Koinzidenz zweier Detektoren . . . . . . . . . . . . . . . . . . . 2.4.3 Ein Atom in einem Resonator . . . . . . . . . . . . . . . . . . . . . 2.4.4 Energieverschiebungen durch Ankopplung an die Vakuumfluktuationen (die Lamb-Verschiebung) . . . . . . . . . . . . . . . . . . . . . 2.4.5 Intermezzo: Die Selbstenergie freier Elektronen . . . . . . . . . . . . 6 6 8 9 10 12 13 16 18 19 22 23 24 25 26 27 29 33 33 35 37 3 Quantentheorie von Fermionfeldern 3.1 Hilbertraum und Feldoperatoren . . . . . . . . . . . 3.1.1 Feldoperatoren . . . . . . . . . . . . . . . . 3.1.2 Der Hamiltonoperator für Fermionfelder . . 3.2 Die Hartree-Fock-Näherung . . . . . . . . . . . . . 3.2.1 Die Bedeutung der Hartree-Fock Eigenwerte 48 48 50 51 52 57 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 43 3 INHALTSVERZEICHNIS 3.3 3.4 4 Die 4.1 4.2 4.3 4.4 4.5 3.2.2 Beispiel: Das Elektronengas . . . . . . . . . . . . . . . 3.2.3 Die Austauschenergie des Elektronengases . . . . . . . 3.2.4 Die Korrelationsfunktion (das Austauschloch) . . . . . 3.2.5 Die Dichtefunktionalmethode . . . . . . . . . . . . . . Die Elektron-Phononwechselwirkung; Polaronen . . . . . . . . 3.3.1 Gitterschwingungen und ihre Quantisierung; Phononen 3.3.2 Die Elektron-Phonon-Wechselwirkung . . . . . . . . . . Die BCS-Theorie der Supraleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dirac-Gleichung Die ”Herleitung” der Dirac-Gleichung Nichtrelativistische Näherungen . . . Lösungen der freien Dirac-Gleichung Die Löchertheorie . . . . . . . . . . . Quantisierung des Diracfeldes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 . 87 . 92 . 97 . 105 . 109 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 60 63 64 66 66 70 74 Kapitel 1 Zielsetzung und Inhaltsübersicht In dieser Vorlesung werden wir einige Themen und Methoden behandeln, die über den Stoff der Kursvorlesungen ”Quantenmechanik” und ”Thermodynamik und Statistische Physik” hinausgehen, aber andererseits von genügend allgemeinem Interesse sind und in verschiedenen Teilbereichen der Physik ihre Anwendung finden. Es wird dabei ein gewisser Überlapp mit den Vorlesungen ”Theoretische Atom- und Kernphysik” und ”Theoretische Festkörperphysik” auftreten, aber der Akzent wird in dieser Vorlesung eher auf der allgemeinen Methodik als auf den spezifischen Anwendungen liegen. Andererseits werde ich versuchen, bei jedem neu eingeführten Formalismus auch einige Anwendungen zu diskutieren; nur so kann die Motivation zur Einführung des Formalismus einsichtig gemacht werden. Das wichtigste Thema der Vorlesung ist die Beschreibung von Vielteilchensystemen, insbesondere auch von solchen, in denen Teilchen erzeugt und vernichtet werden können. Für solche Systeme reicht die in der Vorlesung Quantenmechanik verwendete Beschreibung nicht aus; dort wurde die Zahl der Teilchen bei der Spezifizierung des Hilbertraumes (Zahl der Freiheitsgrade sowie Festlegung des Symmetriecharakters bezüglich Vertauschung identischer Teilchen) (ein für allemal) festgelegt. Als Einstieg in die Behandlung von Vielteilchensystemen behandeln wir in Kap. II die Quantentheorie des Strahlungsfeldes. Aus der Elektrodynamik ist bekannt, dass das Strahlungsfeld sich dynamisch verhält wie ein System harmonischer Oszillatoren, und es liegt nahe, auf diesen Feldoszillatoren die Quantisierungsvorschrift für ”normale” Oszillatoren anzuwenden. Dies führt auf natürliche Weise zu einer für Bosonen angemessenen Beschreibung; nach Einbeziehung der Wechselwirkung mit einem Atom können auch Absorption und (spontane und stimulierte) Emission von Strahlung auf recht natürliche Weise erklärt werden. (Der für das Strahlungsfeld entwickelte Formalismus kann auch für sonstige Oszillatoren verwendet werden; als Beispiel werden wir in Kap. III kurz die Beschreibung von Gitterschwingungen diskutieren.) Aufgrund der unendlichen Zahl der Feldoszillatoren treten in der Theorie Divergenzen auf; wir werden an einigen Beispielen zeigen, wie man diese, wenigstens formal, durch Renormierungsverfahren beseitigen kann. In Kap. III zeigen wir, wie der Formalismus für die Behandlung von Systemen aus vielen Fermionen modifiziert werden muss. Dies ist von Interesse für die Beschreibung von Atom, Molekül und Festkörper. Als erstes diskutieren wir die Hartree-Fock-Näherung, 4 KAPITEL 1. ZIELSETZUNG UND INHALTSÜBERSICHT 5 und illustrieren sie am Beispiel des Elektronengases. Es erweist sich dabei als nützlich, auch für die Elektronen einen Formalismus mit Erzeugungs- und Vernichtungsoperatoren einzuführen. Dieser Formalismus wird wohl etwas irreführend ”zweite Quantisierung” genannt. Der so erhaltene Formalismus erweist sich als besonders geeignet für die Formulierung der BCS-Theorie der Supraleitung. Wir werden auch kurz auf die Herleitung der in der BCS-Theorie auftretenden anziehenden Elektron-Elektron Wechselwirkung aus der Elektron-Phonon Wechselwirkung eingehen. In Kap. IV diskutieren wir die von Dirac vorgeschlagene relativistische Wellengleichung für ein Teilchen mit Spin 12 . Die physikalische Interpretation dieser Gleichung weist einige Schwierigkeiten auf, welche auf das Auftreten von Lösungen mit negativer Energie zurückzuführen sind. Diese Schwierigkeiten lassen sich weitgehend dadurch beseitigen, dass man annimmt, dass sämtliche Zustände mit negativer Energie im energetisch niedrigsten zugänglichen Zustand des Systems besetzt sind. Durch diese Annahme ist aber auch die Dirac-Theorie nicht länger eine reine Ein-Teilchen-Theorie; eine Umformulierung in eine Viel-Teilchen-Theorie erscheint angebracht, aber wir werden diese Umformulierung in dieser Vorlesung nicht explizit durchführen. Literatur Bisher habe ich kein Buch gefunden, in dem sämtliche Themen der Vorlesung behandelt werden. Viele der Themenkreise werden behandelt in: A. Messiah, Quantum Mechanics, Teil II. J. J. Sakurai, Advanced Quantum Mechanics. H. A. Bethe und R. W. Jackiw, Intermediate Quantum Mechanics. W. Greiner, Theoretische Physik 4A: Quantentheorie, Spezielle Kapitel. Insbesondere für Probleme der Festkörpertheorie: C. Kittel, Quantum Theory of Solids. J.M. Ziman, Electrons and Phonons. Kapitel 2 Quantentheorie des Strahlungsfeldes 2.1 Die klassischen Feldgleichungen und die Feldoszillatoren Ausgehend von den Maxwellgleichungen im freien Raum ∂B = −c ∇×E ∂t ∇·B = 0 ∂E = c ∇×B ∂t ∇·E = 0 suchen wir zuerst nach speziellen Lösungen vom Typ E(r, t) = e(r)q(t) B(r, t) = b(r)p(t). (1.1) Substitution in die Maxwellgleichungen liefert e(r)q̇(t) = c p(t) ∇×b(r); b(r)ṗ(t) = −c q(t) ∇×e(r). In beiden Gleichungen steht auf beiden Seiten jeweils ein Produkt einer reinen Ortsfunktion und einer reinen Zeitfunktion. Gleichheit für alle r und t ist nur möglich, falls es zwei Konstanten α und β gibt, so dass q̇ = αp; ṗ = −βq; c ∇×b = αe; c ∇×e = βb. (1.2) Das ineinander Substituieren dieser Gleichungen ergibt p̈ = −ω 2 p q̈ = −ω 2 q ω 2 = αβ, also die typischen Oszillatorgleichungen, sowie ∇×( ∇×b) = ω2 α ∇×e = 2 b. c c 6 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 7 Aus letzterer Gleichung kann man über ∇×( ∇×b) = ∇( ∇·b) − ∇2 b und ∇·b = 0, sowie die analogen Beziehungen für e, auf die Eigenwertgleichungen ∇2 b = − ω2 b c2 ∇2 e = − ω2 e c2 schließen. Diese Gleichungen sind formal analog zur zeitunabhängigen Schrödingergleichung für ein freies Teilchen. Im unendlichen Raum sind die Lösungen ebene Wellen vom Typ eik (r) ≈ êi eikr , wobei êi ein Einheitsvektor ist mit êi ⊥ k. Die zugehörige Frequenz ist ω = ck. Der Wellenvektor k kann alle reellen Werte annehmen; bei jedem Wert von k gibt es zwei linear unabhängige Polarisationsvektoren êi . Weil das Arbeiten mit einem überabzählbaren Satz nicht konventionell normierbarer Funktionen etwas unbequem ist, legt man oft periodische Randbedingungen auf einem Kubus mit Kantenlänge L fest: e(x + lx L, y + ly L, z + lz L) = e(x, y, z) für alle ganze Zahlen lx , ly und lz . Dadurch werden die zulässigen Werte von k eingeschränkt auf k= 2π (nx , ny , nz ) L mit nx , ny und nz ganze Zahlen. Für das Feld in einem Hohlraum mit spiegelnden Wänden sind die zulässigen Werte von ω diskret (siehe Vorlesung Elektrodynamik). Dafür sind dann aber die sog. Modenfunktionen en (r) und bn (r) von etwas komplizierterer Gestalt; sie können aber immer reell gewählt werden. Auch für den Fall periodischer Randbedingungen kann man wegen der Entartung zwischen k und −k, das Paar Modenfunktionen êi eikr und êi e−ikr durch êi sin kr und êi cos kr ersetzen. So erhält man für alle Fälle einen Satz reeller Modenfunktionen, was für die weitere formale Entwicklung einige Vorteile bietet. [Wir werden im weiteren die Modenfunktionen mit einem einfachen Index k (für Wellenvektor und Polarisation!) durchnummerieren.] Am Schluss unserer Herleitung werden die für komplexe Modenfunktionen erforderlichen Modifikationen ohne explizite Rechnung erwähnt werden. KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 8 Normierung: Weil die Aufspaltung (1.1) nur bis auf Konstanten eindeutig ist, können wir für die Modenfunktionen eine im Prinzip beliebige Normierung wählen. Auch die Konstanten α und β können unter Beibehaltung von αβ = ω 2 frei gewählt werden; die Wahl α = β = ω liegt nahe. Mit dieser Wahl gilt dann aufgrund von (1.2): Z Z c2 ( ∇×ek ) ( ∇×ek ) dr bk (r)bk (r)dr = 2 ω V V (1.3) Z c2 = 2 ek ( ∇× ( ∇×ek )) dr + Oberflächenterm. ω V Dabei bezeichnet V das Periodizitäts- oder Hohlraumvolumen. (Das auf den ersten Blick anomale Vorzeichen des partiell integrierten Terms kann durch Ausschreiben in Komponenten überprüft werden; siehe Skriptum Elektrodynamik.) Der Oberflächenterm ist proportional zu I I 2 d O (n̂×ek )bk = d2 O n̂ (ek ×bk ) , also proportional zum Oberflächenintegral der Normalkomponente des Poyntingvektors, d.h. der Energiestromdichte. Für reelle Modenfunktionen verschwindet diese Größe; hätten wir komplexe Modenfunktionen gewählt, so hätten sich aufgrund der periodischen Randbedingungen die Beiträge der Kantenflächen der Kuben jeweils paarweise kompensiert. Aus (1.3) schließt man jetzt nach Einsetzen der Eigenwertgleichung Z Z bk (r)bk (r)dr = ek (r)ek (r)dr Weiters sind natürlich Modenfunktionen mit verschiedenen Indizes orthogonal zueinander. Wir wählen jetzt als Normierungsbedingung Z e∗k (r)ek0 (r)dr = 4πωk δkk0 , (wobei die Verallgemeinerung auf komplexe Modenfunktionen miteingeschlossen wurde). Für den Fall eines kontinuierlichen Modenindex wählt man auf analoge Weise Z e∗ki (r)ek0 j (r)dr = 4 πωk δ 3 (k − k0 )δij . 2.1.1 Entwicklung nach Modenfunktionen Aus der Vollständigkeit der Modenfunktionen ek (r) oder bk (r) folgt, dass man jedes transversale Feld nach ihnen entwickeln kann: Z X 1 E ek dr E(r, t) = ek (r)qk (t) mit qk (t) = 4πω k k KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES B(r, t) = X bk (r)pk (t) k 1 mit pk (t) = 4πωk 9 Z B bk dr Einsetzen dieser Entwicklungen in den Ausdruck für die Feldenergie liefert Z 1 W (t) = dr |E(r, t)|2 + |B(r, t)|2 8π Z Z 1 X = qk qk 0 dr ek ek0 + pk pk0 dr bk bk0 8π kk0 V V 1X 2 = ωk pk (t) + qk2 (t) . 2 k Wenn man diesen Ausdruck als Hamiltonfunktion auffasst: W (t) = H({pk , qk }), so erhält man als die Hamilton’schen Bewegungsgleichungen ṗk = − ∂H = −ωk qk ∂qk q̇k = ∂H = ωk pk , ∂pk also genau die vorher aus dem Separationsansatz erhaltenen Ausdrücke. 2.1.2 Das Vektorpotential; Ankoppelung an eine Stromdichte Wie aus der Elektrodynamik bekannt ist, können die Felder E und B mittels B = ∇×A E=− 1 ∂A − ∇φ c ∂t in einem Vektorpotential A und einem skalaren Potential φ ausgedrückt werden. Die oben angegebenen allgemeinen Ausdrücke für rein transversale Felder E und B können hergeleitet werden aus X c φ(r, t) = 0 A(r, t) = pk (t)ek (r). ω k k Diese Wahl ist nicht eindeutig; sie entspricht der Coulomb-Eichung ∇·A = 0; diese Eichung ist für den Übergang zur Quantentheorie die bequemste; sie hat aber den Nachteil, dass sie nicht relativistisch kovariant ist. In Anwesenheit von Ladungen und Strömen werden zwei der Maxwellgleichungen abgeändert in ∂E = c ∇×B − 4πj ∂t ∇·E = 4πρ. KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 10 Aus der ersten Gleichung erhält man durch skalare Multiplikation mit ek (r), Einsetzen der Modenentwicklungen für E und B, Einsetzen von ∇×bk = ωck ek , und Integration über r: Z 1 dr j(r, t)ek (r). q̇k = ωk pk + gk (t) mit gk (t) = − ωk Die Feldoszillatoren führen jetzt also erzwungene Schwingungen aus. Die obige Gleichung kann auch aus dem Hamilton’schen Formalismus erhalten werden; dazu nimmt man in H einen Zusatzterm Z X 1 H1 = − dr j(r, t)A(r, t) = pk (t)gk (t) c k auf. Für den longitudinalen Anteil von E erhält man keine Bewegungsgleichung, sondern lediglich die Bestimmungsgleichung ∇·Ek = 4πρ mit der Lösung Z ρ(r0 , t) Ek = −∇φ φ(r, t) = dr0 |r − r0 | Im Hamilton’schen Formalismus spielen also, wenigstens in der Coulomb-Eichung, die Größen A und φ recht unterschiedliche Rollen: A ist eine Linearkombination von Impulsen von Feldoszillatoren und wird in der Quantentheorie zu einem Operator; φ ist ein Integral über die Ladungsverteilung und hat mit den Feldoszillatoren nichts zu tun; es bleibt auch in der Quantentheorie eine reine Zahlenfunktion, wenigstens bezüglich der Freiheitsgrade des elektromagnetischen Feldes. (Die Ladungsverteilung ρ kann, wie wir später sehen werden, unter Umständen selbst Operatorcharakter haben; wenn φ(r, t) in einer Schrödingergleichung vorkommt, muss weiters r als der Ortsoperator des beschriebenen Teilchens interpretiert werden. Dies sind übrigens ”Komplikationen” die bei der Interpretation von A(r, t) genauso auftreten.) 2.2 Quantisierung der Feldoszillatoren Wie zuerst von Dirac vorgeschlagen wurde, kann man aus der im vorherigen Abschnitt behandelten Hamilton’schen Theorie des Strahlungsfeldes dadurch eine Quantentheorie erhalten, dass man die Koordinaten qk und die Impulse pk der Feldoszillatoren ersetzt durch Operatoren Qk und Pk , die die Vertauschungsrelationen [Pk , Qk0 ] = ~ δkk0 i erfüllen. Man erhält so für die Hamiltonoperatoren H= 1X 2 ωk Pk + Q2k 2 k H1 = X k Pk gk (t). KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 11 Zur Diskussion des Spektrums von H führen wir, wie für ”normale” Oszillatoren, Leiteroperatoren ein: 1 a†k = √ (Qk − iPk ) 2~ r ~ Pk = −i (ak − a†k ). 2 1 ak = √ (Qk + iPk ) 2~ r ~ (ak + a†k ) Qk = 2 Hieraus folgen die Vertauschungsrelationen h i † ak , ak0 = δkk0 und der Ausdruck für den freien Hamiltonoperator X 1 † H= ~ωk ak ak + . 2 k Die Eigenwerte dieses Operators sind, wie für ”normale” Oszillatoren, X 1 E{nk } = ~ωk nk + 2 k mitP willkürlichen nk ≥ 0. Dies sieht auf den ersten Blick wegen der Divergenz der Summe 1 ~ k ωk ziemlich beunruhigend aus. Weil aber nur Energieunterschiede physikalisch 2 relevant sind, können wir den divergenten Term in H genausogut weglassen und schreiben X X ~ωk a†k ak ~ωk nk . H= E{nk } = k k Das heißt aber nicht, dass die sogenannte ”Nullpunktsenergie” physikalisch völlig ohne Bedeutung ist; sie spielt eine Rolle, wenn wir Änderungen der Randbedingungen vornehmen. Dazu betrachten wir z.B. einen kubischen Hohlraum, der durch eine bewegliche Metallplatte in zwei Teile geteilt ist. a L−a Die Eigenschwingungen des geteilten Hohlraumes hängen von der Position der Platte ab. Die damit zusammenhängende Änderung der Nullpunktsenergie führt zu einer Kraft auf die Platte, die von Casimir berechnet werden konnte. Seine Ergebnisse konnten später 12 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES experimentell genau bestätigt werden. Dies ist ein typisches Phänomen für die Quantentheorie von Systemen mit unendlich vielen Freiheitsgraden: In einer solchen Theorie treten oft formal divergente Ausdrücke auf, die man zuerst wegen ihrer prinzipiellen Nichtbeobachtbarkeit außer Acht lassen kann. Bei genauerer Betrachtung ergibt aber die Änderung eines solchen Ausdrucks bei Änderung irgendeines Systemparameters (eine Größe, die nur mit Hilfe recht abenteuerlicher mathematischer Verfahren überhaupt berechnet werden kann) einen interessanten beobachtbaren physikalischen Effekt. Die quantitative Vorhersage, erhalten durch solche abenteuerliche Manipulationen mit divergenten Größen, stimmt dann typischerweise sehr genau mit den experimentellen Beobachtungen überein. 2.2.1 Der Hilbertraum des Strahlungsfeldes Bisher haben wir zwar die Operatoren H, B und E eingeführt, aber noch nicht den Hilbertraum spezifiziert, in dem sie arbeiten. Die Analogie mit der herkömmlichen Quantenmechanik legt es aber nahe, die Eigenzustände von H als Basiszustände (Basis-Eigenvektoren) des Hilbertraumes zu verwenden. Eine zentrale Rolle spielt der Vakuumzustand |{0} , definiert durch ak |{0} = 0 für alle k, der dem Grundzustand von H entspricht. Durch mehrfaches Anwenden von Erzeugungsoperatoren erhält man die Zustände nk † Y ak |{0} √ (2.1) |{nk } = n ! k k (mit nur endlich vielen nk 6= 0!), die den Energieeigenwerten X E{nk } = ~ωk nk k entsprechen. Als neue Sprachregelung führen wir ein, dass sich im Strahlungsfeld im Zustand |{nk } jeweils nk Photonen der Sorte k befinden. Dabei ist die ”Sorte” durch die Modenfunktion spezifiziert. Der von den Basisvektoren aufgespannte Raum (2.1) heißt Fockraum. Er besteht aus allen Linearkombinationen X X |φ = c{nk } |{nk } mit |c{nk } |2 = 1. {nk } {nk } Dabei läuft die Summation über alle Reihen ganzer Zahlen nk , bei denen ist. P k nk endlich KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 2.2.2 13 Superposition von Zuständen Aus der Definition (2.1) und den Vertauschungsrelationen zwischen ak und a†k kann man leicht herleiten, dass der Zustand |{nk } zugleich ein Eigenzustand des Operators X † N= ak ak k mit dem Eigenwert X n{nk } = nk k ist. Der Operator N heißt Photonenzahloperator; N hat wesentlich mehr Eigenzustände als die |{nk } . So ist z. B. auch der Zustand |α, β = αa†k + βa†l |{0} |α|2 + |β|2 = 1 ein Eigenzustand von N mit dem Eigenwert 1. Er entspricht einem Feld, in dem ein einzelnes Photon in irgendeiner (gleich genauer zu bestimmenden) linearen Superposition der Moden ek (r) und el (r) angeregt ist. Die Zeitentwicklung des obigen Zustandes ist −iωk t † −iωl t † ak + βe al |{0} ; |α, β t = αe der Zustand ist also nur für den Spezialfall ωk = ωl ein stationärer Zustand. Der obige Zustand beschreibt also eine ganz andere Situation als der Zustand |1k , 1l = a†k a†l |{0} . Letzterer ist immer stationär; er entspricht der Situation, in der das Feld genau zwei Photonen enthält, eins der Sorte k und eins der Sorte l. Um die physikalische Bedeutung von Zuständen des Typs |α, β etwas genauer zu bestimmen, betrachten wir den Operator des elektrischen Feldes, der geschrieben werden kann als r h i ~X ek (r) ak (t) + a†k (t) . (2.2) E(r, t) = 2 k Eine ähnliche Darstellung sollte es natürlich für jede Wahl eines vollständigen Systems {ek (r)} geben. Wir betrachten insbesondere eine unitäre Basistransformation Ukl , die nur energetisch entartete Eigenfunktionen miteinander vermischt: Ukl = 0 falls ωk 6= ωl . (2.3) Man überprüft leicht, dass man mit Hilfe der Transformationen X X X ẽk = Ukl el ãk = Ukl∗ al ã†k = Ukl a†l l l l KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES die Darstellung r E(r, t) = 14 i ~ Xh † ∗ ẽk (r)ãk (t) + ẽk (r)ãk (t) 2 k erreicht. Für den Hamiltonoperator erhält man X H=~ ωk ã†k ãk , k und es liegt nahe, ã†k als Erzeuger eines Photons mit der Modenfunktion ẽk zu interpretieren. (Für die Wahl von ẽk anstelle von ẽ∗k werden wir gleich ein Argument geben.) Beispiel 1: e1 ∼ êx cos kz ẽ1,2 ∼ êx e±ikz e2 ∼ êx sin kz Die entsprechenden ã†1,2 erzeugen Photonen mit den Wellenvektoren +kêz bzw −kêz . Dieses Beispiel gestattet es, die obige Mehrdeutigkeit zwischen ẽk und ẽ∗k zu entscheiden. Falls wir jedem Photon mit Wellenvektor k einen Impuls ~k zuordnen, so liegt es nahe, als Operator für den Gesamtimpuls P des Feldes den Ausdruck X † k ak,i ak,i P=~ k,i anzusetzen. Nur für die oben festgelegte Identifikation stimmt dies mit dem Ausdruck Z 1 P= dr E(r)×B(r) 4πc V aus der Maxwelltheorie überein. Beispiel 2: e1 ∼ êx eikz e2 ∼ êy eikz Linearkombinationen von a†1 und a†2 mit reellen Koeffizienten erzeugen linear polarisierte Photonen mit einem Polarisationsvektor in der x-y-Ebene. Für ein komplexes Verhältnis α/β erhält man elliptische Polarisation; insbesondere für α/β = ±i links oder rechts zirkular polarisierte Photonen. KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 15 Wellenpakete Wenn man im obigen Formalismus die Nebenbedingung (2.3) fallen lässt, so geht die Diagonalform von H in der Transformation verloren. Die ã†k erzeugen dann Photonen, die keinen stationären Zuständen des Strahlungsfeldes entsprechen, sondern Wellenpaketen. Bei der Definition der Amplitude eines solchen Wellenpaketes tritt allerdings eine Komplikation auf. Das Betragsquadrat der Größe X ẽl (r) = Ulk ek (r) k hängt mit der Energiedichte zusammen. Die entsprechende Größe für die Teilchendichte setzen wir an als X 1 √ Ulk ek (r). f̃l (r) = 4πωk k Aus der Normierung der ek folgt, dass |f̃l |2 immer auf eins normiert ist; sein Betragsquadrat kann also als Aufenthaltswahrscheinlichkeit des Photons interpretiert werden. Diese Interpretation wird unterstützt vom folgenden Lemma: Seien X b†1 = U1k a†k k b†2 = X U2k a†k k und entsprechend fi (r) = X k 1 √ Uik ek (r) 4πωk so gilt Z h i X † ∗ b1 , b2 = U1k U2k = dr f1∗ (r)f2 (r). k V Insbesondere verschwindet also der Kommutator, falls die Funktionen f1 (r) und f2 (r) nicht überlappen: Man ”kann kein Photon vernichten an einem Punkt, wo das Photon sich nicht aufhält”. Die obige Betrachtung ist recht plausibel, aber genau gesehen wurde die intuitive Bedeutung der Bezeichnung ”Erzeuger” oder ”Vernichter” etwas überstrapaziert! In einer vernünftigen Theorie sollte man eigentlich überhaupt nicht von ”Aufenthaltswahrscheinlichkeiten” für Photonen reden, sondern nur von Nachweiswahrscheinlichkeiten für ganz bestimmte Detektoren (mit ggf. frequenzabhängigen Empfindlichkeiten). Weiters sollte man im Auge behalten, dass die Wellenausbreitung des Lichtes im Vakuum nicht-dispersiv KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 16 ist. Das Auseinanderlaufen von Wellenpaketen ist also lediglich auf Unschärfe in der Richtung von k zurückzuführen. Für ein zur Zeit t = 0 scharf lokalisiertes Wellenpaket sind also auch für spätere Zeiten ẽl (r, t) und f̃l (r, t) in den gleichen Teilen des Raumes konzentriert. (Die zeitabhängigen Amplituden erhält man dadurch, dass man in der Entwicklung nach den stationären Modenfunktionen jedem ek (r) einen Zeitfaktor e−iωk t gibt.) Schließlich enthalten die meisten in der Praxis auftretenden Wellenpakete nur Komponenten aus einem relativ schmalen k-Bereich (d.h. sie haben eine relativ wohldefinierte Energie). Auch deshalb ist der Unterschied zwischen ẽl und f̃l für die Praxis eher unwichtig. 2.2.3 Einstein-Podolsky-Rosen Korrelationen Ein spezieller Typ von Zuständen mit typisch quantenmechanischen Eigenschaften tritt z.B. beim Zerfall eines ruhenden Positronium-Atoms aus dem Grundzustand in zwei γ-Quanten auf. Aufgrund der Erhaltung von Impuls und Drehimpuls weiß man, dass der gebildete Zwei-Photonzustand einen Gesamtimpuls und einen Gesamtdrehimpuls gleich Null haben muss. Impuls und Drehimpuls der einzelnen Photonen sind aber völlig unbestimmt. Ein Zustand der diese Anforderungen erfüllt ist h i X g(|k|) a†k,+ a†−k,− + a†k,− a†−k,+ |{0} ; |pos ∼ k hier bezeichnen die a†k,± die Erzeuger für Photonen mit Impuls k und positive, bzw negative zirkulare Polarisation. Die Funktion g(k) ist so gewählt, dass f (r) = X k √ 1 g(k)eikr 4πωk in der Nähe des Ursprungs lokalisiert ist. Die entsprechende Amplitude zur Zeit t ist dann auf einer Kugelschale mit dem Radius R = ct lokalisiert. Für genügend großes R in Richtung (θ, φ) tragen zur Amplitude in R nur Partialwellen mit k in Richtung (θ, φ) bei. Ein Detektor in (R, θ, φ) spricht also im Zustand |pos nur auf Photonen mit k in Richtung (θ, φ) an. Wie man leicht nachprüft, hat der Zustand |pos die Eigenschaft aki a−k0 j |pos = 0 falls k 6= −k0 . Mit der ”intuitiven” Deutung der Vernichter heißt dies für den Fall, dass die Kugel mit Radius R mit vielen Detektoren besetzt ist: Wenn ich im Punkt (R, θ, φ) ein Photon aus dem Zustand |pos detektiere, so weiß ich damit auch, dass zu etwa der gleichen Zeit nur der Detektor im Punkt (R, π − θ, 2π − φ) ein Photon detektieren kann; alle anderen Detektoren sehen mit Sicherheit nichts. Ich erhalte also Information über Ereignisse, die in der Relativitätstheorie als zu mir raumartig bezeichnet werden. Dieser Aspekt der Quantentheorie, der zuerst von Einstein, in KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 17 Zusammenarbeit mit Podolsky und Rosen bemerkt wurde, war für ihn Anlass, die Quantentheorie trotz ihrer Erfolge abzulehnen oder zumindest als eine unvollständige Theorie zu bezeichnen. Auf den ersten Blick erscheint ein Ausweg möglich, wobei man den Photonen ”verborgene Parameter” zuschreibt, die von der Quantentheorie nicht erfasst werden. Das obige Experiment wäre dann vergleichbar mit einem Versuch, in dem ich zwei Hälften einer Banknote an zwei weit auseinander wohnende Freunde mit perfekt synchronisierter Postzustellung zuschicke; in dem Fall würde sich niemand über Informationen mit Überlichtgeschwindigkeit bezüglich gelesener Seriennummern usw. aufregen. Erklärungsversuche dieser Art scheitern aber, wenn man auch die Polarisationsfreiheitsgrade mit ins Spiel bringt. Wenn man sich auf die Komponenten mit k in der z-Richtung beschränkt, so überprüft man leicht, dass man für |pos die zwei äquivalenten Darstellungen † † † † |pos ∼ ak,+ a−k,− + ak,− a−k,+ |{0} und |pos ∼ a†k,x a†−k,x + a†k,y a†−k,y |{0} angeben kann. (Der Beweis benützt die oben in Beispiel 2 gegebenen Beziehungen.) Mit einem Argument wie oben schließt man, dass aus Information über entweder die lineare oder die zirkulare Polarisation des einen Photons sofortige Information über die entsprechende Polarisation des anderen Photons folgt. Weil ich weiters mit der Entscheidung, ob ich lineare oder zirkulare Filter vor meine Detektoren setze, warten kann bis die Photonen schon emittiert sind, müssen die Photonen in einer Verborgenen-Parameter-Theorie also genaue Information sowohl über ihre zirkulare als auch über ihre lineare Polarisation mit sich führen. Da dies genaue Kenntnisse über die Werte zweier nicht-vertauschenden Operatoren [für etwas explizitere Angabe dieser Operatoren siehe Kap. II des Skriptums Quantenmechanik] bedeuten würde, impliziert eine solche Vorstellung eine Verletzung der Heisenberg’schen Unschärferelationen; letztere sind aber in Experimenten vom Stern-Gerlach Typ vielfach bestätigt worden! Bemerkung 1: Bei der praktischen Durchführung von Experimenten, in denen die Filter erst nach der Emission der Photonen eingestellt werden (delayed choice experiments), muss vom obigen Schema etwas abgewichen werden; die Photonen müssen durch Spiegel umgeleitet und ”aufgehalten” werden, damit eine synchrone Einstellung rechtzeitig stattfinden kann. Bemerkung 2: Ein quantitativer Test von Theorien mit verborgenem Parameter kann mittels der sog. Bell’schen Ungleichungen erfolgen. Dies sind Ungleichungen über Koinzidenzraten zwischen Photonen-Detektoren mit verschieden geneigten Polarisationsfiltern; sie sind erfüllt in Theorien mit verborgenen Parametern (und ohne instantane Wechselwirkungen), aber verletzt für Quantenzustände vom Typ |pos . Experimente von Clauser und Shimony, und KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 18 später von Aspect, zeigten klare Verletzungen der Bell’schen Ungleichungen, und widerlegten damit klar die ”natürliche” Theorie mit verborgenen Parametern. 2.2.4 Verborgene Variablen und die Bell’sche Ungleichung Wir betrachten für die Einstein-Podolsky-Rosen-Anordnung den Operator A+ (θ), der die Werte +1 bzw. −1 annimmt, falls das Photon mit Impuls +~k einen unter dem Winkel θ zur x-Achse geneigten Polarisationsfilter passiert, bzw. nicht passiert. Ähnlich definiert man den Operator A− (θ) für das Photon mit dem Impuls −~k. Die Korrelation P(θ1 , θ2 ) ist definiert als Erwartungswert des Produktes dieser Operatoren P(θ1 , θ2 ) = hA+ (θ1 )A− (θ2 )i . Die Quantenmechanik macht für P(θ1 , θ2 ) die Vorhersage P(θ1 , θ2 ) = cos [2 (θ1 − θ2 )] . (2.4) In einer Theorie mit verborgenen Variablen macht man die Annahme, dass das Ergebnis der Messung sämtlicher Operatoren A± (θ) festgelegt ist durch einen ”verborgenen Parameter” λ, der bei der Präparation des Systems gemäß einer Wahrscheinlichkeitsverteilung ρ(λ) gesetzt wird. (Der Wertebereich von λ kann dabei willkürlich sein.) Es existieren also Funktionen A± (θ; λ) die die Werte ±1 annehmen können, und es gilt Z P(θ1 , θ2 ) = dλ ρ(λ)A+ (θ1 ; λ) A− (θ2 ; λ). Aus dem experimentellen Ergebnis P(θ, θ) = 1 folgt (mindestens für fast alle λ) A+ (θ; λ) = A− (θ; λ), und daher werden wir weiters die Indizes ± weglassen. Wir betrachten jetzt Z P(θ0 , θ1 ) − P(θ0 , θ2 ) = dλ ρ(λ) [A(θ0 ; λ)A(θ1 ; λ) − A(θ0 ; λ)A(θ2 ; λ)] Z dλ ρ(λ)A(θ0 ; λ)A(θ1 ; λ) [1 − A(θ1 ; λ)A(θ2 ; λ)] , wobei wir die Identität A2 (θ; λ) = 1 ausgenutzt haben. Der Ausdruck in den eckigen Klammern ist positiv semidefinit; es gilt also die Ungleichung Z |P(θ0 , θ1 ) − P(θ0 , θ2 )| 6 dλ ρ(λ) [1 − A(θ1 ; λ)A(θ2 ; λ)] , oder |P(θ0 , θ1 ) − P(θ0 , θ2 )| 6 1 − P(θ1 , θ2 ). (2.5) KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 19 Dies ist die Bell’sche Ungleichung. Sie ist mit der (experimentell bestätigten) Vorhersage (2.4) der Quantenmechanik unverträglich. Dazu betrachtet man z.B. die Umgebung des Punktes θ1 = θ2 . Die linke Seite ist linear in |θ1 − θ2 |, falls man θ0 nicht so wählt, dass die Ableitung von P nach θ0 verschwindet. Die rechte Seite dagegen ist quadratisch in θ1 − θ2 für den (experimentell bestätigten) Ausdruck (2.4); es gibt also sicher einen Bereich, wo die Ungleichung (2.5) verletzt ist! Unser Schluss ist: Eine Theorie mit verborgenen Zuständen kann die Ergebnisse der Quantenmechanik für EPR-Zustände nie voll reproduzieren. Im Experiment wählt man Werte von θ0 , θ1 und θ2 für die die Verletzung der Ungleichung möglichst groß ist, und auf jeden Fall größer als der experimentelle Messfehler. 2.2.5 Erwartungswerte von Feldoperatoren; Kohärente Zustände Da die Feldoperatoren E(r, t) und B(r, t)in den ak und a†k linear sind, verschwinden ihre Erwartungswerte in den Zuständen |{nk } : {nk }|E(r, t)|{nk } = {nk }|B(r, t)|{nk } = 0 Zustände mit nicht-verschwindenden Erwartungswerten von E und B müssen Linearkombi nationen von |{nk } mit unterschiedlichen Besetzungszahlen sein. Die wichtigsten Beispiele solcher Zustände sind die kohärenten Zustände. Diese erhält man auf natürliche Weise durch Betrachtung des Hamiltonoperators für das Strahlungsfeld in Wechselwirkung mit einer klassischen Stromdichte j(r, t). Wie im vorherigen Abschnitt gezeigt wurde, gilt: r X ~ X † ak − a†k gk (t). ~ωk ak ak − i H(t) = 2 k k Die Heisenberg’schen Bewegungsgleichungen für die ak (t) lauten i ih d ak (t) = Ĥ(t), ak (t) , dt ~ wobei Ĥ(t) den Hamiltonoperator im Heisenbergbild (d.h. mit zeitabhängigen ak und a†k darstellt. Der obige Ausdruck liefert d 1 ak (t) = −iωk ak (t) + √ gk (t) dt 2~ oder d 1 ak (t)eiωk t = √ eiωk t gk (t). dt 2~ Die Lösung ist ak (t)e iωk t Z t 1 0 dt0 eiωk t gk (t0 ) = ak + √ 2~ 0 = ak + αk (t), KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 20 oder (2.6) ak (t) = [ak + αk (t)] e−iωk t und, auf völlig analoge Weise h i a†k (t) = a†k + αk∗ (t) eiωk t . Jetzt nehmen wir zusätzlich an, dass die Stromdichte j(r, t), und damit gk (t), für t < 0 verschwindet. Weiters soll das System für t = 0 im Vakuumzustand |{0} sein. Damit ist der Zustand im Heisenbergbild also auch auf |{0} festgelegt. Den Schrödingerzustand bezeichnen wir mit |{0}; t . Aus der Invarianz sämtlicher Matrixelemente für den Übergang zwischen Schrödinger- und Heisenbergbild erhält man für willkürliches |ψ ψ|ak (t)|{0} = ψ; t|ak |{0}; t . Andererseits folgt mit Hilfe von (2.6) ψ|ak (t)|{0} = e−iωk t αk (t) ψ|{0} = e−iωk t αk (t) ψ; t|{0}; t . Aus der Gleichheit der beiden Ausdrücke für willkürliches |ψ , also auch für willkürliches |ψ; t , folgt ak |{0}; t = αk (t)e−iωk t |{0}; t . Der Zustand |{0}; t ist also ein Eigenzustand sämtlicher {ak } mit Eigenwerten αk (t)e−iωk t . Solche Eigenzustände für normale Oszillatoren haben wir im Skriptum Quantenmechanik diskutiert. Sie heißen kohärente Zustände und werden mit |α bezeichnet. Der Zusammenhang mit den Energieeigenzuständen ist X αn 1 2 √ |n . |α = e− 2 |α| n! n Insbesondere gilt in diesem Zustand eine Poissonverteilung der Zahl der Energiequanten: 2n 2 |α| | n|α |2 = e−|α| . n! Die Verallgemeinerung für das Strahlungsfeld ist " # # " X Y (αk )nk 1X √ |{αk } = exp − |αk |2 |{nk } . 2 k nk ! k {nk } KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 21 −iωk t Der Zustand |{0}; t ist also, bis auf einen Phasenfaktor, mit dem Zustand |{α (t)e k identisch. Insbesondere gibt es im Zustand |{0}; t nichtverschwindende Erwartungswerte für E und B: {0}; t|E(r, t)|{0}; t = Re{E(r, t)} mit E(r, t) = √ 2~ X ek (r)αk (t)e−iωk t . k Dieser Erwartungswert ist genau die Lösung des entsprechenden klassischen Problems. Die kohärenten Zustände eines Oszillators haben die zusätzliche Eigenschaft, dass die Schwankungen von Energie und Impuls in ihnen genauso groß sind wie im Grundzustand. Auch diese Eigenschaft lässt sich auf das Strahlungsfeld übertragen. Allerdings erhält man für die Schwankungen im Grundzustand einen unendlichen Beitrag. Bei der Ausarbeitung von X ~ ek (r)ek0 (r) ak + a†k ak0 + a†k0 |{0} {0}| |E(r)|2 |{0} = {0}| 2 kk0 liefern nur die Terme mit {0}|ak a†k0 |{0} = δkk0 einen Beitrag; alle sonstigen Terme verschwinden wegen ak |{0} = {0}|a†k = 0. Die nichtverschwindenden Terme sind alle aber etwa von der Größe ωk V −1 und führen zu einer Divergenz. Der Operator |E(r)|2 ist also nicht wohldefiniert. Aus schlechtdefinierten Operatoren dieser Art kann man wieder wohldefinierte machen durch Subtraktion des divergenten Anteils, also hier des Vakuumerwartungswertes. Für einen Operator A definiert man den nichtdivergenten Anteil : A : symbolisch als : A : = A − {0}|A|{0} . Eine etwas präzisere Vorschrift ist: a) Schreibe A als ein Polynom in den {ak } und {a†k0 } b) Ändere in jedem Term die Reihenfolge der Faktoren so, dass alle ak rechts von allen a†k0 , stehen. Durch diesen letzten Schritt ist das Verschwinden des Vakuumerwartungswertes gesichert. Der Operator : A : heißt die normalgeordnete Version von A. Als Beispiel betrachten wir h i ~X ek (r)ek0 (r) ak ak0 + a†k a†k0 + a†k ak0 + a†k0 ak . : |E(r)|2 : = 2 kk0 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 22 Es lässt sich leicht zeigen, dass gilt 2 {αk }| : |E(r)|2 : |{αk } = {αk }| E(r) |{αk } , also das Feld E hat im Zustand |{αk } keine größeren Schwankungen als im Vakuumzustand. Dasselbe lässt sich für das B-Feld auf gänzlich analoge Weise zeigen. Die Zustände |{αk } sind also so klassisch wie in der Quantentheorie nur möglich. 2.2.6 Regularisierung der Feldoperatoren Die oben aufgetretenen Schwierigkeiten (Divergenzen des Schwankungsquadrats) können darauf zurückgeführt werden, dass wir uns wieder etwas zu weit von der physikalischen Realität entfernt haben. In der Praxis misst man nie das Feld an einem scharfen Punkt, sondern höchstens den Mittelwert des Feldes über ein Gebiet der Größe z.B. eines Licht absorbierenden oder stimuliert emittierenden Atoms. Mathematisch kann man dies darstellen durch eine Verschmierungsfunktion φ(r − r0 ) und daran anschließend die sog. regularisierten Operatoren Z Eφ (r) = dr0 φ(r − r0 )E(r0 ) einführen, wobei φ(r) eine glatte, positive Funktion mit beschränkter Reichweite ist, die im übrigen ziemlich frei gewählt werden kann. Für das Schwankungsquadrat dieser Größe im Vakuum erhält man Z 2 X ~ X 0 0 0 2 dr φ(r − r )ek (r ) ≡ |φ̃k |2 . {0}| |Eφ (r)| |{0} = 2 k k Da φ glatt ist, nehmen die Entwicklungskoeffizienten φ̃k , die im wesentlichen Fourierkomponenten sind, mit zunehmendem k sehr rasch ab, und das Schwankungsquadrat der regularisierten Feldoperatoren ist endlich, aber natürlich von der genauen Wahl von φ(r) abhängig. Regularisierungsmethoden sind fast unumgänglich, falls wir die Unschärferelation zwischen den Feldern E und B diskutieren wollen. Für die Operatoren Ei (r) und Aj (r0 ) erhält man aus den Modenentwicklungen den Kommutator X c [Ei (r), Aj (r0 )] = eki (r) [Qk , Pk0 ] ek0 j (r0 ) 0 ω k kk0 X = i~c ωk−1 eki (r)ekj (r0 ). k Die Funktionen ek (r) bilden aber einen vollständigen Satz von Funktionen im Raum der rein transversalen Vektorfelder: X 1 ⊥ eki (r)ekj (r0 ) = θij (r − r0 ), 4πω k k KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 23 ⊥ wobei θij den Projektionsoperator auf die transversalen Felder darstellt. Dessen Fouriertransformierte ist bekanntlich ⊥ (k) ∼ δij − θij ki kj ; k2 die r-Darstellung werden wir nicht brauchen, weil wir letztendlich am Kommutator zwischen Ei und Bj interessiert sind: [Ei (r), Bj (r0 )] = 4πi~c jkl ∇0k θil⊥ (r − r0 ). In dem Ausdruck für θil⊥ (k) ist der Zusatzterm rein longitudinal, und seine Rotation verschwindet. Der erste Term ist die Fouriertransformierte von δij δ(r − r0 ), so dass wir letztendlich erhalten [Ei (r), Bj (r0 )] = 4πi~c ijk ∇0k δ(r − r0 ). Dieser Ausdruck ist nur für verschmierte Felder sinnvoll: Z 0 0 [Eφi (r), Bψj (r )] = 4πi~c ijk ∇k dr00 φ(r − r00 )ψ(r0 − r00 ). Aus diesem Kommutator erhält man mit der üblichen Prozedur Unschärferelationen zwischen Eφi (r) und Bψj (r0 ). Wie zuerst von Bohr und Rosenfeld analysiert wurde, sind die Verhältnisse recht subtil: Um Eφ (r) scharf bestimmen zu können, muss ich die Funktion φ ziemlich breit wählen. Dies impliziert aber, dass es auch ein relativ großes Gebiet gibt, in dem ich Bψ (r0 ) nicht gleichzeitig scharf bestimmen kann. Die obige Analyse erweist sich aber trotz ihrer Subtilität als für die Praxis nicht allzu bedeutsam; wie wir im nächsten Abschnitt sehen werden, messen die meisten Detektoren nicht E oder B, sondern den nichtdivergenten Anteil irgendeines quadratischen Ausdrucks in den Feldern. Gerade weil die Vakuumfluktuationen so stark sind, empfiehlt es sich, Detektoren so zu konstruieren, dass sie auf die Vakuumfluktuationen überhaupt nicht reagieren. Die obigen Überlegungen dienen lediglich dazu, klar zu machen, dass die Messung der Felder Eφ und Bψ nicht zu prinzipiellen Schwierigkeiten in der Theorie führt. 2.3 Das Strahlungsfeld in Wechselwirkung mit Atomen In diesem Abschnitt betrachten wir ein Atom in Wechselwirkung mit dem Strahlungsfeld. Der Einfachheit halber werden wir das Atom meistens durch ein Ein-Elektron-System ersetzen (Leuchtelektron-Näherung), und auch seine Schwerpunktsbewegung vernachlässigen. Diese Einschränkungen lassen sich alle ohne viel Schwierigkeiten aufheben, allerdings auf Kosten einer weiteren Komplizierung der Notation. Die Güte der Leuchtelektronnäherung wird insbesondere auch im nächsten Kapitel noch zur Sprache kommen. Wir werden annehmen, dass die Engergieeigenwerte und Eigenzustände des Atoms, ggf. in hinreichender Näherung, bekannt sind, und sie mit dem Label A bezeichnen: Hat |A = EA |A . KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 24 Der Hilbertraum des Gesamtsystems ist das direkte Produkt des Hilbertraumes für das Atom und desjenigen für das Strahlungsfeld. Seine Basiszustände werden wir mit |A; {nk } bezeichnen. Für die Physik spielen auch Superpositionen mit Korrelationen zwischen Atom und Strahlungsfeld oft eine wesentliche Rolle. Für die Einführung der Wechselwirkung zwischen Atom und Strahlungsfeld gibt es, solange wir die Spinfreiheitsgrade außer Betracht lassen, eine universelle Vorschrift: Man ersetze im atomaren Hamiltonoperator den Impulsoperator pi eines Teilchens mit der Ladung ei durch pi − ei A(ri ), c wobei ri den Ortsoperator des betreffenden Teilchens darstellt. Weil man es in der Praxis meist mit Elektronen zu tun hat, werden wir für ei auch e schreiben; diese Größe wird dann negativ sein. Mit der obigen Substitution erhält man für die kinetische Energie des Elektrons 2 1 e e e2 p2i p − A(r ) − [p A(r ) + A(r )p ] + |A(ri )|2 . = i i i i i i 2m c 2m 2mc 2mc2 In störungstheoretischen Rechnungen niedrigster Ordnung kann man den letzten Term weglassen, weil seine Effekte in erster Ordnung mit den Effekten des ersten Terms in zweiter Ordnung vergleichbar sind. Weiters kommutieren in Coulomb-Eichung die Operatoren pi und A(ri ); der Kommutator in Ortsdarstellung enthält nämlich ∇·A(r). Der Wechselwirkungs-Hamiltonoperator beträgt also in niedrigster Ordnung HI = − e pi A(ri ). mc Weil (e/m)pi als der vom Teilchen getragene Strom interpretiert werden kann, ist dieser Ausdruck mit unserem Ausdruck für die Ankopplung an eine klassische Stromdichte analog. Für ein Teilchen mit Spin hat man den Zusatzterm HI0 = − e~ ~σi B(ri ), 2mc auf dessen Herleitung wir in Zusammenhang mit der Dirac-Gleichung noch zurückkommen werden. 2.3.1 Wahl der störungstheoretischen Behandlung In der Quantenmechanik kennt man zwei theoretische Verfahren, die stationäre und die zeitabhängige Störungstheorie. Für einen zeitunabhängigen Hamiltonoperator, wie er in unserem Fall vorliegt, sind im Prinzip beide anwendbar. Für die Anwendung haben aber beide ihre Vor- und Nachteile: Die stationäre Störungsrechnung ist im Prinzip leistungsfähiger, aber sie wird recht schwerfällig, wenn Entartung vorliegt. Dies ist für die von uns betrachteten Systeme immer KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 25 der Fall; der Zustand |A; {0} ist z.B. entartet mit allen |B; 1k mit EB < EA und ~ωk = EA − EB . Die stationäre Störungsrechnung findet denn auch kaum Anwendung in der Theorie des Strahlungsfeldes. Die zeitabhängige Störungsrechnung beruht auf einer Störungsentwicklung für den Evolutionsoperator im Wechselwirkungsbild. Sie ist insbesondere zugeschnitten auf die Behandlung von Prozessen, bei denen der Endzustand im kontinuierlichen Spektrum des ungestörten Hamiltonoperators liegt. Allerdings ist dies eine Entwicklung nach der Zahl der Male, die die Störung wirksam wird; der Formalismus ist also vor allem für kurz andauernde Prozesse geeignet, z. B. Zerfalls- oder Streuprozesse, bei denen das Photon sich räumlich rasch vom Atom trennt. Für Atome in Hohlräumen oder Laserresonatoren trifft dies nicht zu; dort werden wir einen Teil des Wechselwirkungsoperators in den ungestörten Hamiltonoperator herüberholen müssen. Auch für die Beschreibung der Wechselwirkung eines Atoms mit den Vakuumfluktationen des Strahlungsfeldes, die zur sog. Lamb-Verschiebung Anlass gibt, muss die zeitabhängige Störungsrechnung etwas modifiziert werden. 2.3.2 Die Matrixelemente der Störung; Die Dipolnäherung Der Hamiltonoperator ie e HI = − p·A(r) = − mc m r ~ X ek (r) p· ak − a†k 2 ωk k bewirkt in erster Ordnung Störungstheorie Übergänge unter Emission oder Absorption eines einzelnen Photons. Die Matrixelemente von HI zwischen Basiszuständen sind aufgebaut aus Atom- und Feldanteilen: r 1 ie ~ X A; {nk }|HI |B; {n0k } = − A|p·ek (r)|B {nk }| ak − a†k |{n0k } . m 2 k ωk In erster Ordnung tragen nur Matrixelemente zwischen energetisch entarteten Zuständen bei, d.h. solche in denen sich {nk } und {n0k } nur unterscheiden um eine einzelne Einheit für eine einzelne Mode, für die weiters noch gilt ~ωk = |EB − EA |. Die Photonen dieser Mode haben relativ zur Ausdehnung des Atoms lange Wellenlängen. Falls A|p|B nicht verschwindet, kann also ek (r) im Matrixelement durch ek (r0 ) ersetzt werden, wobei r0 die Lage des Atomschwerpunktes ist; ek (r0 ) kann außerhalb des Matrixelements gebracht werden, weil es die Elektronenkoordinate nicht enthält. Für das verbleibende Matrixelement gilt im im(EA − EB ) A|p|B = A| [Hat , r] |B = − A|r|B . ~ ~ (3.1) Einsetzen dieses Ausdrucks in das obige Matrixelement liefert (unter Ausnützung von ~ωk = ±(EB − EA ), wobei das Vorzeichen für den ak - und den a†k -Beitrag unterschied- KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 26 lich zu wählen ist) r X ~ −e A|r|B · ek (r0 ) {nk }|(ak + a†k )|{n0k } = −e A|r|B · {nk }|E(r0 )|{n0k } . 2 k Ein Übergang mit A|r|B 6= 0 heißt elektrischer Dipolübergang; die Näherung, in der ek (r) durch ek (r0 ) ersetzt wird, heißt Dipolnäherung. In dieser Näherung bewirken, wie man leicht nachprüft, der A2 -Term und der B·~σ -Term überhaupt keine elektronischen Übergänge mehr (sie enthalten weder r noch p). Die Äquivalenz e − A(r)·p ≈ −eE(r)·r, mc welche hier nur in Störungstheorie erster Ordnung bewiesen wurde [Ersetzen von ~ωk durch ±(EB − EA )] lässt sich innerhalb der Dipolnäherung zu einer Ersetzung der gesamten Störung durch −eE(r)·r verallgemeinern (ohne Beweis!). 2.3.3 Kurze Rekapitulation der zeitabhängigen Störungstheorie Wir betrachten ein System mit einem Hamiltonoperator H = H0 + HI , wobei die Eigenwerte und Eigenvektoren von H0 bekannt sind: H0 |i = Ei |i . Wenn wir den Zustand des Systems darstellen durch X i |ψ; t = ci (t)e− ~ Ei t |i , i so erhält man durch Substitution in die Schrödingergleichung den Satz gekoppelter Gleichungen i 1 X i|HI |j e ~ (Ei −Ej )t cj (t). ċi (t) = i~ j Diese Gleichungen können iterativ gelöst werden. Für die Anfangsbedingung ci (0) = δia erhält man in erster Ordnung Z i 1 t 0 0 (1) dt f |HI |a e ~ (Ef −Ea )t . cf (t) = i~ 0 Gelegentlich werden wir auch die zweite Ordnung brauchen: Z i 1 X t 00 00 (1) (2) cf (t) = dt f |HI |i e ~ (Ef −Ei )t ci (t00 ) i~ i 0 Z Z 00 i i 1 X t 00 t 0 00 0 =− 2 dt dt f |HI |i e ~ (Ef −Ei )t i|HI |a e ~ (Ei −Ea )t . ~ i 0 0 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES Die Wahrscheinlichkeit, das System zur Zeit t im Zustand |f Ordnung gegeben durch Z 2 t 0 i (E −Ea )t0 2 1 (1) 2 . |cf (t)| = 2 f |HI |a dt e ~ f ~ 0 27 anzutreffen, ist in erster Für großes t erhält man mit Hilfe der Formel sin2 tx = πδ(x) t→∞ tx2 lim den Ausdruck (1) |cf (t)|2 = 2 2π f |HI |a δ(Ef − Ea )t. ~ Ein solcher Ausdruck ist nur dann sinnvoll, wenn der Zustand |f in einem Kontinuum (oder Gebiet sehr dichter Zustände) liegt. Falls weiters noch das Matrixelement in einem Energiebereich um Ef nur schwach von Ef abhängt, so erhält man für die Übergangswahrscheinlichkeit pro Zeiteinheit wf nach der Fermi’schen goldenen Regel wf = 2 2π f |HI |a ρf , ~ wobei ρf die Zahl der Zustände vom Typ f pro Energieintervall um Ef bezeichnet. Wenn es neben Ef noch einen kontinuierlichen Parameter des Endzustandes gibt, wie z.B. den Raumwinkel dΩ, in den ein Photon emittiert oder gestreut wird, so definiert man entsprechende differentielle Übergangsraten wf,dΩ und Zustandsdichten ρf,dΩ . 2.3.4 Emission und Absorption von Strahlung Wir betrachten jetzt als Anfangszustand den Zustand |A; {0} , wobei |A ein angeregter atomarer Zustand ist, der Einfachheit halber ein s-Zustand. Wegen der Auswahlregeln für das Matrixelement B|r|A sind Dipolübergänge nur nach p-Zuständen möglich. Als Modenfunktionen für die Photonen wählen wir die ebenen Wellen r 4πωk ik·r êi e , eki (r) = V wobei wir die êi so wählen, dass êi in der (k, êz )-Ebene liegt und ê2 darauf senkrecht steht. Beim Übergang vom Zustand |A nach |B, lz = 0 kann dann nur ein Photon der Polarisation êi emittiert werden. Wir werden weiters das Atom immer im Ursprung des Koordinatensystems platzieren. Das Matrixelement für diesen Übergang beträgt r 2πωk ~ B, 0; 1k1 |HI |A; {0} = −e B, 0|z|A sin θ, (3.2) V wobei θ den Winkel zwischen k und êz darstellt. KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 28 Zur Berechnung der Zerfallsrate brauchen wir noch die Zahl der Modenfunktionen mit Energie zwischen ~ω und ~ω + dE im Raumwinkel dΩ um die Richtung k. Die Dichte der erlaubten k-Werte im k-Raum ist 3 V L dk = dk. ρk dk = 2π 8π 3 In einem Ausschnitt dΩ einer Kugelschale um ω = ck mit der Dicke dE = d(~ck) befinden sich also V ω2 ρE,dΩ dEdΩ = 3 3 dEdΩ 8π ~c erlaubte k-Werte. Für die Zerfallsrate erhalten wir also mit Hilfe der goldenen Regel wE,dΩ = 2 e2 ω 3 sin2 θ B, 0|z|A . 3 2π~c Weil e2 /~c die dimensionslose Feinstrukturkonstante α ≈ 1/137 ist, hat dieser Ausdruck die Dimension einer inversen Zeit, wie für eine Rate zu erwarten war. Um die Lebensdauer des Zustandes |A zu berechnen müssen wir R a) integrieren über alle Richtungen von k; dies liefert einen Faktor dΩ sin2 θ = 8π/3 b) summieren über die 3 Subniveaus von |B : ein Faktor 3 B c) summieren über alle p-Niveaus |B mit EB < EA . Dabei soll ω durch ωAB = EA −E ~ ersetzt werden. Das Ergebnis ist wA = 0 2 3 1 4e2 X = 3 B|z|A ωAB . τA ~c B (3.3) Für Absorption und stimulierte Emission ist dasselbe atomare Matrixelement (3.2) verantwortlich (oder dessen komplex konjugiertes). Bei der Auswertung der goldenen Regel muss jetzt aber beachtet werden, dass der Endzustand diskret ist, während der Anfangszu √ stand im Kontinuum liegt. Das relevante Feld-Matrixelement ist {nl −δkl }|ak |{nl } = nk ; Die Rate (3.3) geht also über in die Rate für die Absorption oder stimulierte Emission durch Multiplikation mit der Zahl hnk i, der mittleren Zahl der Photonen pro Mode. Betrachte jetzt einen Hohlraum, in dem sich ein Atom befindet. Im thermischen Gleichgewicht müssen die Raten für Absorption und (stimulierte + spontane) Emission einander die Waage halten. Wenn wir die Wahrscheinlichkeiten, dass sich das Atom im Zustand |C befindet, mit pC bezeichnen, so muss gelten: hnk i pB = (hnk i + 1)pA . KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 29 Weil im thermischen Gleichgewicht pA = e−β(EA −EB ) pB = e−β~ωk pB gelten muss, erhalten wir also für hnk iβ , der mittleren Quantenzahl pro Mode, den für Bosonen bekannten Wert hnk iβ = 1 eβ~ω −1 . Mit diesem Argument wurde zuerst von Einstein die Planck’sche Formel für die Energiedichte der Hohlraumstrahlung U (ω)dω = ~ω 3 1 dω 3 β~ω πc e −1 hergeleitet (vgl. Skriptum Thermodynamik). 2.3.5 Streuung von Photonen Als nächstes betrachten wir die Streuung eines Photons an einem Atom. Das relevante Matrixelement ist B; 1k0 j |HI |A; 1ki . In diesem Matrixelement kommt nur der A2 -Term zum Tragen, weil wenigstens ein Erzeuger und ein Vernichter auftreten muss. In der Dipolnäherung erhält man √ e2 4π ωk ωk0 c2 ~ † † 0 j |a 0 aki + aki a 0 |1ki B; 1k0 j |HI |A; 1ki = B|A êj êi 1 k kj kj 2mc2 V 2ωk ωk0 2πe2 ~ = δAB êj êi √ mV ωk ωk0 Der A2 -Term führt also nur zu elastischer Streuung. In derselben Ordnung der Störungstheorie müssen aber auch Terme mitgenommen werden, in denen der Term erster Ordnung zweimal wirkt: t00 t0 |A; 1ki − → |C; {0} − → |B; 1k0 ,j und t00 t0 |A; 1ki − → |C; 1ki 1k0 j − → |B; 1k0 ,j Der intermediäre Zustand wird i.a. nicht mit Anfangs- und Endzustand energetisch entartet sein (dieser Ausnahmefall der resonanten Streuung bedarf einer separaten Diskussion). 30 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES Salopp gesagt darf das System diesen Zustand aber für eine kurze Zeit ∆t ∼ ~/∆E innehaben; solange ”bemerkt” das System die Verletzung der Energieerhaltung wegen der EnergieZeit-Unschärferelation nicht (eine genauere mathematische Begründung folgt gleich). Die drei Beiträge zur Streuung werden oft wie folgt graphisch dargestellt: B k! , j B k! , j C k, i A A B k! , j C k, i A k, i Graphen eines ähnlichen Typs wurden zuerst von Feynman zur Veranschaulichung von Rechnungen in der (relativistischen) Quantenelektrodynamik eingeführt; sie werden deshalb als Feynmangraphen bezeichnet. Feynman führte auch Regeln ein, die es erlauben, an Hand des Graphen sofort das zugehörige Matrixelement zu bestimmen. Wir werden statt dessen die Matrixelemente auf konventionelle Art bestimmen. Der Beitrag des ersten Diagramms zur Übergangsamplitude beträgt, wie man durch (1) Substitution des Matrixelements in den allgemeinen Ausdruck für cf sieht, Z t i 2πe2 0 (1) δAB êj ·êi dt0 e ~ (EB +~ωk0 −EA −~ωk )t cf,I (t) = − √ imV ωk ωk0 0 i 2πe2 ~ e ~ (EB +~ωk0 −EA −~ωk )t − 1 δAB êj ·êi . = √ mV ωk ωk0 EB + ~ωk0 − EA − ~ωk Die mit dem zweiten Diagramm assoziierte Amplitude beträgt √ 1 4π ωk ωk0 c2 ~ e2 X (2) cf,II = − 2 êj ·pBC pCA ·êi ~ V 2ωk ωk0 m2 c2 C Z t Z t00 i 00 i 0 00 dt dt0 e ~ (EB +~ωk0 −EC )t e ~ (EC −EA −~ωk )t , × 0 0 wobei wir die Abkürzungen pBC = B|p|C usw. eingeführt haben. Das Doppelintegral ist elementar auswertbar: Z t Z t00 Z i 00 ~ t 00 i (EB +~ωk0 −EC )t00 e ~ (EC −EA −~ωk )t − 1 00 0 ~ dt e dt dt . . . = i 0 EC − EA − ~ωk 0 0 " i # i e ~ (EB +~ωk0 −EA −~ωk )t − 1 e ~ (EB +~ωk0 −EC )t − 1 ~2 =− − . EC − EA − ~ωk EB + ~ωk0 − EA − ~ωk EB + ~ωk0 − EC Bei der Auswertung der Übergangsrate liefert der zweite Term (im Limes t → ∞) einen Beitrag proportional zu δ(EB + ~ωk0 − EC ); dieser trägt nur bei, falls der Endzustand mit KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 31 einem intermediären Zustand |C; {0} entartet ist. Dies ist der Fall resonanter Streuung, den wir ausgeschlossen haben. Es gibt einen zweiten, etwas subtileren Grund, weshalb der zweite Term physikalisch nicht relevant ist. Ein Indiz dafür ist dieoffensichtliche Nichterhaltung der Energie, sowie der Umstand, dass der Übergang |A; 1ki → |C; {0} unmittelbar zur Zeit t = 0 stattzufinden scheint. Das Auftreten dieses Terms hat damit zu tun, dass der Ausgangszustand |A;1ki nur in niedrigster Ordnung dem physikalisch gemeinten Zustand (Atom im Zustand |A + ein Photon der Sorte ki) entspricht. [Der physikalische Anfangszustand ist genau betrachtet nicht der Eigenzustand |A; 1ki des ungestörten Operators, sondern der Zustand der daraus nach ”sanftem” Einschalten der Störung H1 entsteht. Letzterer enthält u.a. eine Beimischung des Zustandes |C; {0} , deren Berücksichtigung zu einem Beitrag führt, welcher denjenigen des zweiten Terms in der obigen Formel genau aufhebt. Da diese Effekte bei den nichtresonanten Beiträgen bis zur betrachteten Ordnung aber ohnehin keine Rolle spielen, werden wir den dazu benötigten Formalismus nicht näher diskutieren.] (2) Mit einer ähnlichen Rechnung lässt sich auch der Beitrag cf,III des dritten Diagramms berechnen. Das Doppelintegral liefert " i # i ~2 e ~ (EB +~ωk0 −EA −~ωk )t − 1 e ~ (EB −EC −~ωk )t − 1 − . − EC + ~ωk0 − EA EB + ~ωk0 − EA − ~ωk EB − EC − ~ωk Der zweite Term trägt nur dann bei, wenn |B; {0} mit |C; 1ki entartet ist, also wieder nur für den bereits ausgeschlossenen Resonanzfall; wir werden ihn weiters weglassen. Wir erhalten also für sämtliche Beiträge zu cf (t) denselben Zeitfaktor: " # X êj ·pBC pCA ·êi 2πe2 ~ êj ·pCA pBC ·êi cf (t) = − 2 √ mδAB êj ·êi − + m V ωk ωk 0 E EC + ~ωk0 − EA C − EA − ~ωk C i e ~ (EB +~ωk0 −EA −~ωk )t − 1 × . EB + ~ωk0 − EA − ~ωk Aus dem Betragsquadrat dieses Ausdrucks erhält man mittels einer Rechnung, die der Herleitung der Zerfallsrate völlig analog ist, für die Übergangsrate in einen Endzustand mit dem Photon k0 j in einem Raumwinkel dΩ 2 2π 4π 2 e4 ~2 V ωk20 . . . dΩ wf dΩ = ~ m2 V 2 ωk ωk0 8π 3 ~c3 2 c ωk0 e4 = 2 4 2 . . . dΩ. m c m V ωk Üblicherweise gibt man statt der Übergangsrate den Streuquerschnitt an, definiert als die Übergangsrate dividiert durch die einfallende Photonenstromdichte. Weil sich im Zustand |1ki ein Photon im Volumen V befindet, welches sich natürlich mit der Lichtgeschwindigkeit bewegt, ist die Stromdichte in unserem Fall c/V . Falls man weiters noch den KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 32 klassischen Elektronenradius r0 = e2 /mc2 einführt, erhält man für den differentiellen Streuquerschnitt 2 X 0 ω dσ 1 ê ·p p ·ê ê ·p p ·ê k j BC CA i j CA BC i = r02 + δAB êj ·êi − . dΩ ωk m C EC − EA − ~ωk EC + ~ωk0 − EA Diese Formel wurde zuerst von Kramers und Heisenberg mit Hilfe der alten Quantentheorie hergeleitet; die in dieser Formel auftretende Struktur hat Heisenberg zur Idee der Matrixmechanik geführt. Bei der Streuung eines Photons muss immer Energieerhaltung gelten: Falls A = B gilt auch ωk = ωk0 ; man spricht dann von elastischer Streuung. Streuung mit Änderung des atomaren Zustandes (oder allgemeiner, des Zustandes des Systems, an welchem gestreut wird) heißt Raman-Streuung. Je nachdem ob das Photon seine Energie erniedrigt oder erhöht, spricht man von Stokes oder Anti-Stokes-Linien im Streuspektrum. Rayleigh-Streuung Wir betrachten jetzt insbesondere die elastische Streuung eines Photons an einem Atom im Grundzustand. Weiters soll die Energie des Photons klein sein gegenüber sämtlichen atomaren Anregungsenergien EC − EA . Wir können dann die Resonanznenner entwickeln gemäß: 1 ~ω 1 = + ... . + EC − EA − ~ω EC − EA (EC − EA )2 Falls wir weiters noch die in Gleichung (3.1) hergeleitete Beziehung pAC = im(EA − EC ) rAC ~ verwenden, so erhält man für den Streuquerschnitt 2 " # X dσ i 2 = r0 êj ·êi − êj · (pAC rCA − rAC pCA ) ·êi + . . . . dΩ ~ C Aus der Vollständigkeit der Zustände |C kann man schließen, dass der Ausdruck in eckigen Klammern der Kommutatorausdruck ~~ A| [p, r] |A = I~ i ist. Die oben angegebenen Terme heben sich also auf; das gleiche gilt für die Terme der Ordnung (~ω)2 , und der Streuquerschnitt ist bestimmt von der dritten Ordnung in ~ω: " # 2 r 2 X dσ 1 0 = ~4 ωk4 êj · (p p + p p ) ·ê AC CA AC CA i . 3 dΩ m (EC − EA ) C KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 33 In niedrigster Ordnung in ω erhalten wir also die bekannte ω 4 -Abhängigkeit, die zuerst von Lord Rayleigh für die Streuung an einem harmonisch gebundenen Elektron hergeleitet wurde. Der Effekt erklärt die blaue Farbe des Himmels, sowie die rote Farbe der untergehenden Sonne. Weil der aus den pAC gebildete Tensor bei Summation über alle C-Zustände (und, falls |A kein s-Zustand ist, bei Mittelung über die lz -Unterzustände von |A ) zur Einheitsmatrix proportional ist, ist auch der Polarisationszustand des Streulichtes und seine Winkelverteilung leicht anzugeben (siehe Skriptum Elektrodynamik für eine Ausarbeitung). 2.4 Das Atom im Strahlungsfeld: Spezielle Probleme 2.4.1 Idealisierte Photodetektoren In diesem Abschnitt betrachten wir als idealisiertes Modell eines Photodetektors ein Atom, in dem die im Feld vorhandenen Photonen immer Übergänge ins Kontinuum, also Photoionisation erwirken. Weiters erweist es sich als zweckhaft, die Wechselwirkung HI in Dipolnäherung und im Wechselwirkungsbild zu betrachten: HI (t) = −eE(r0 , t)·r(t). Das Matrixelement zwischen einem Anfangszustand |A; a und einem Endzustand |F ; f beträgt dann F ; f |HI (t)|A; a = −e F |r(t)|A · f |E(r0 , t)|a = −e eiωF A t rF A · f |E(r0 , t)|a . In niedrigster Ordnung trägt nur der Vernichter-Anteil von E, weiters mit E(+) (r0 , t) bezeichnet, bei. Für die Wahrscheinlichkeit p1 (t), dass im Intervall (0, t) überhaupt ein Übergang dieser Art stattfindet, erhält man X X ie Z t 2 0 iωF A t0 (+) 0 dt e rF A · f |E (r0 , t )|a p1 (t) = ~ 0 F f (4.1) Z e 2 X t Z t 00 0 = dt00 eiωF A (t −t ) r∗F A ·G1a (r0 , t0 ; r0 , t00 )·rF A , dt0 ~ 0 0 F wobei wir die Abkürzung G1a (r0 , t0 ; r1 , t00 ) = a|E(−) (r0 , t0 )E(+) (r1 , t00 )|a eingeführt haben; E(−) bezeichnet den Anteil von E. Bei der Herleitung von (4.1) wurden der Ausdruck für cf (t) und die Vollständigkeit der Zustände |f benutzt. Man überprüft leicht, dass für G1a die alternative Darstellung G1a (r1 , t1 ; r2 , t2 ) = 1 a| : E(r1 , t1 )E(r2 , t2 ) : |a 2 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 34 gilt. Dies bestätigt die auf S. 20 gemachte Aussage, dass in ”vernünftigen” Messanordnungen nur normal geordnete Produkte von Feldoperatoren gemessen werden. Der Ausdruck (4.1) lässt sich noch etwas umschreiben durch Einführung des Empfindlichkeitstensors e 2 X r∗F A rF A δ(ω − ωF A ); (4.2) S(ω) = 2π ~ F Substitution in (4.1) ergibt Z t Z t Z +∞ 1 00 0 0 00 p1 (t) = dt dt dω eiω(t −t ) S(ω) : G1a (r0 , t0 ; r0 , t00 ) 2π 0 0 −∞ Eine weitere Vereinfachung erfolgt über die Fourier-Transformierte Z +∞ 1 S(t) ≡ dω eiωt S(ω); 2π −∞ Einsetzen dieser Größe liefert Z t Z t p1 (t) = dt0 dt00 S(t00 − t0 ) : G1a (r0 , t0 ; r0 , t00 ). 0 0 Zwischenbemerkung Der S-Tensor-Formalismus erlaubt auch die Berücksichtigung weiterer experimentell relevanter Faktoren: man kann hinter der Summation in (4.2) einen Faktor RF einführen, der die Nachweiswahrscheinlichkeit des in |F enthaltenen Photoelektrons repräsentiert. Dadurch wird p1 (t) zur Wahrscheinlichkeit, dass ein Photon (über den Prozess der Photoionisation) detektiert wird. Auch der Effekt von vor dem Detektor platzierten Frequenzoder Polarisationsfiltern lässt sich durch eine Abänderung von S(ω) berücksichtigen. In der Praxis wird man für Detektion von Licht bevorzugt solche Atome wählen, die im für das Experiment relevanten Frequenzbereich eine möglichst konstante Empfindlichkeit haben und die weiters nicht polarisationsselektiv sind: S(ω) ' s0 I; S(t) ' s0 I δ(t). In dieser Näherung gilt Z t p1 (t) = s0 dt0 I : G1a (r0 , t0 ; r0 , t0 ). 0 Die Detektionsrate w1 (t) = |E(r0 , t)|2 : proportional! d p (t) dt 1 ist dann tatsächlich zum Erwartungswert von : KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 2.4.2 35 Die Koinzidenz zweier Detektoren Als Nächstes betrachten wir die Situation, dass sich im Feld zwei Ein-Atom-Detektoren (mit gleichen Atomen) an den Orten r10 und r20 befinden. Wir suchen die Wahrscheinlichkeit dafür, dass im Zeitintervall (0, t) beide Detektoren ein Photon detektieren. Die Basiszustände des Hilbertraumes haben die Form |B1 ; C2 ; i , wobei B1 z.B. andeutet, dass Atom 1 sich im Zustand B befindet, und wir suchen nach Übergängen vom Typ |A1 ; A2 ; a → |F1 ; G2 ; f . Solche Übergänge erfordern zwei ”Eingriffe” von HI (der A2 -Term bewirkt keine Übergänge und kann vernachlässigt werden) und zwar jeweils einen von den beiden Termen in die HI zerlegt werden kann: HI (t) = HI1 (t) + HI2 (t), wobei HIi (t) nur die Wechselwirkung zwischen Feld und Atom i enthält. Die Übergansamplitude für den obigen Übergang beträgt also Z 0 Z −1 t 0 t 00 dt [HI1 (t0 )HI2 (t00 ) + HI2 (t0 )HI1 (t00 )] |A1 ; A2 ; a . (4.3) dt cF Gf (t) = F1 ; G2 ; f | 2 ~ 0 0 (+) (−) Jedes der HI,i (t) kann wieder geschrieben werden als HIi (t)+HIi (t), wobei die ±-Anteile die Vernichter bzw. Erzeuger von Photonen enthalten. Weil für den gesamten Übergang Energieerhaltung gelten muss, und der atomare Anteil der Energie auf jeden Fall zunimmt, (+) muss im obigen Ausdruck jeder Term mindestens ein HIi enthalten. Beiträge, bei denen im anderen Faktor der Anteil H (−) eine Rolle spielt, treten auf, aber sie sind, relativ zu Termen, in denen von beiden HIi der (+)-Anteil auftritt, von der Ordnung (ωF A t)−1 (Der Beweis (+) wird dem Leser als Übungsaufgabe überlassen). Weil die HIi miteinander kommutieren (sie enthalten als Feldoperatoren nur Vernichter; die auftretenden atomaren Operatoren wirken auf verschiedene atomare Freiheitsgrade), kann der so erhaltene dominante Anteil von cF Gf (t) auch geschrieben werden als Z Z −1 t 0 t 00 (+) 0 (+) 00 dt dt HI1 (t )HI2 (t )|A1 ; A2 ; a F1 ; G2 ; f | 2 ~ 0 0 [zum Beweis: abgesehen von der Reihenfolge der Operatoren ist die Differenz zwischen den Termen in (4.3), dass im ersten Term HI2 und im zweiten Term HI1 zuerst wirkt. Eine Umbenennung der Integrationsvariablen führt sofort zum obigen Ausdruck]. Eine Ausarbeitung des Matrixelements liefert e 2 Z t Z t 0 00 dt0 dt00 eiωF A t eiωGA t (rF A rGA ) : f |E(+) (r20 , t00 )E(+) (r10 , t0 )|a . ~ 0 0 Die mit Hilfe dieses Ausdrucks berechnete Wahrscheinlichkeit p2 (t) für das Auftreten von Ionisation in beiden Detektoren XXX |cF Gf (t)|2 p2 (t) = F G f KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 36 kann jetzt genauso wie p1 (t) umgeformt werden durch Einführung der Empfindlichkeitstensoren und Ausnützung der Vollständigkeit der Feldzustände |f . Das Ergebnis ist Z t Z t XZ t Z t 0 00 000 p2 (t) = dt dt dt dt0000 Sil (t0000 − t0 )Sjk (t000 − t00 ) 0 ijkl 0 0 0 0000 000 00 0 × G2,a ijkl (r10 , t ; r20 , t ; r20 , t ; r10 , t ), mit der Definition (−) (−) (+) (+) G2,a ijkl (xi ; xj ; xk ; xl ) ≡ a|Ei (xi )Ej (xj )Ek (xk )El (xl )|a , wobei xi für das Paar (ri0 , ti ) steht. Man überprüft leicht, dass auch G2,a als Erwartungswert eines normal geordneten Operators aufgefasst werden kann. Für breitbandige, isotrope Detektoren vereinfacht sich der Ausdruck für p2 (t): XZ t Z t 0 00 00 0 2 dt0 dt00 G2,a p2 (t) = s0 ijji (r10 , t ; r20 , t ; r20 , t ; r10 , t ). ij 0 0 Für diesen Fall lässt sich also eine Koinzidenzrate X 2,a w2 (t1 , t2 ) = s20 Gijji (x1 ; x2 ; x2 ; x1 ) ij definieren. Im allgemeinen sind die zwei Prozesse, trotz der dynamischen Unabhängigkeit der beiden Detektoren, korreliert: w2 (t1 , t2 ) 6= w1 (t1 )w2 (t2 ). Der Bosecharakter der Photonen Die Größe G2,a ijji (x1 ; x2 ; x2 ; x1 ) lässt sich für Breitbanddetektoren also definieren als die Rate, womit sowohl ein Photon mit Polarisation i zur Zeit t1 in der Nähe von r10 als auch ein Photon mit Polarisation j zur Zeit t2 in der Nähe von r20 detektiert wird. Es ist instruktiv, diese Größe für den Zwei-Photonen-Zustand |k, l ≡ |1k 1l = a†k a†l |{0} zu berechnen. Das Ergebnis ist (beachte, dass in der Mitte des Ausdruckes für G2,kl der Projektor |{0} {0}| hineingeschoben werden darf) G2,a ijji = ~2 |eki (r10 , t1 )elj (r20 , t2 ) + eli (r10 , t1 )ekj (r20 , t2 )|2 , 2 also dem entsprechenden Betragsquadrat einer symmetrisierten Zwei-Teilchen-Wellenfunktion, wie sie für Bosonen üblich ist, recht analog. Wir sehen insbesondere, dass neben den räumlichen und den Polarisationsindizes auch die Zeitpunkte in den beiden Termen miteinander KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 37 vertauscht werden müssen; in dieser Hinsicht geht der hier behandelte Formalismus über den aus der Vorlesung Quantenmechanik bekannten hinaus. Ein weiterer Unterschied zu dem bekannten Formalismus ist noch, dass hier nicht die Ein-Teilchen-Wellenfunktionen fk (r), eingeführt auf S. 15, auftreten, sondern die Feldamplitudenfunktionen ek (r); dies hat damit zu tun, dass der hier beschriebene Photodetektor mit konstantem S(ω) auf die Größe : |E(r, t)|2 : anspricht. Für die Wahl S(ω) ∼ ω −1 wären in der obigen Formel die fk vorgekommen; dies wäre aber eine recht spezielle, praktisch nicht leicht realisierbare Wahl (sogar falls die Bedingung nur über einen beschränkten Frequenzbereich zu gelten braucht). Kohärente Zustände des Feldes sind Eigenzustände der E(+) (r, t). Für solche Zustände faktorisieren also die Feldkorrelationsfunktionen G 1 und G 2 , und es treten keinerlei Korrelationen zwischen unterschiedlichen Detektoren auf. Mit einer maximalen Bestimmtheit dieser Zustände vom Wellenaspekt her korrespondiert also eine maximale Stochastizität des Teilchenaspektes des Feldes. Mehrfachkoinzidenzen von mehr als zwei Detektoren können auf völlig ähnliche Weise diskutiert werden. Eine ausführlichere Behandlung von Photodetektion und der Statistik von Photoelektronen findet man in den Vorlesungen von Glauber in der Sommerschule von 1964 in Les Houches (Quantum Optics and Electronics, C. DeWitt et al., Hrsg., Gordon and Breach, New York, 1965). 2.4.3 Ein Atom in einem Resonator In diesem Abschnitt betrachten wir ein Atom in einem Laser- oder Hohlraumresonator, der eine Eigenfrequenz besitzt, welche mit einem erlaubten Übergang des Atoms fast resonant ist. Ein im angeregten Zustand in den Resonator hineingebrachtes Atom wird rasch zerfallen, aber das emittierte Photon wird dann von den Spiegeln oder Wänden auf das Atom zurückreflektiert und mit einer gewissen Wahrscheinlichkeit wieder reabsorbiert. Zur Beschreibung dieser Situation nehmen wir die Terme, die am effektivsten zu den atomaren Übergängen beitragen, im ungestörten Hamiltonoperator auf, und berechnen dann die Eigenzustände des so geänderten H0 . Es zeigt sich, dass diese Zusatzterme immer nur die Zustände |A; n0 und |B; n0 − 1 miteinander mischt, wobei | A und | B die beteiligten atomaren Zustände sind, und m0 der Zustand mit genau m Photonen in der fast resonanten Feldmode, dessen Erzeuger und Modenfunktion wir mit a†0 bzw. e0 (r) bezeichnen werden. Es reicht deshalb aus, den reduzierten Hamiltonoperator 1 † 0 H0 =EA |A A| + EB |B B| + ~ω0 a0 a0 + 2 r (4.4) h i ~ −e e0 (r0 )·rAB a†0 |A B| + a0 |B A| 2 zu betrachten, wobei wir uns einfachheitshalber auf den Fall reeller e0 (r) und rAB be- schränkt haben. Die Matrixelemente von H00 bezüglich der Basisvektoren |e1 = |A; n0 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 38 und |e2 = |B; n0 − 1 bilden die 2x2 Matrix √ 1 ~ω√ −~g n 0 EA + n − . ~ω0 I + ~ωat −~g n 2 Dabei haben wir die Abkürzungen ~ωat = EB − EA ; e g = − √ e0 (r0 )·rAB 2~ eingeführt und die Bezeichnung I für die Einheitsmatrix verwendet. Die obige Matrix hat die Eigenwerte 1 1 1 p ~ωn± = EA + n − ~ω0 + ~(ω0 + ωat ) ± ~ (ωat − ω0 )2 + 4ng 2 2 2 2 1 1 p = (EA + EB ) + n~ω0 ± ~ (∆ω)2 + 4ng 2 . 2 2 Die zugehörigen Eigenzustände sind |n + = cos θn |A; n − sin θn |B; n − 1 ; |n − = sin θn |A; n − cos θn |B; n − 1 , wobei # "p √ (∆ω)2 + 4ng 2 − ∆ω 1 2g n √ = arctan θn = arctan . 2 ∆ω 2g n Für genaue Resonanz (∆ω = 0) gilt immer θn = 45◦ . Die hier diskutierte Hamiltonfunktion kann auch für ein Atom in einem sehr intensiven Laserstrahl benutzt werden. Der Sonderstatus einer einzelnen Mode des Feldes folgt dann aus der sehr hohen Besetzungszahl, nicht aus der Diskretheit des Spektrums. Betrachte jetzt den Fall, dass sich das System zur Zeit t = 0 im Zustand |B, n − 1 befindet. Wegen |B, n − 1 = − sin θn |n + + cos θn |n − gilt für den Zustand |t zur Zeit t bis auf einen Phasenfaktor |t = − sin θn e−iωRn t |n + + cos θn eiωRn t |n − = i sin 2θn sin ωRn t|A; n + [cos ωRn t + i cos 2θn sin ωRn t]|B; n − 1 . Der Zustand oszilliert also mit der Rabi-Frequenz ωRn = 1/2 1 (∆ω)2 + 4ng 2 2 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 39 zwischen den zwei Komponenten |A; n und |B; n − 1 , und zwar für exakte Resonanz (∆ω = 0) vollständig, für endliche Verstimmung nur mit der Amplitude sin2 2θn . Die RabiOszillatoren können dadurch experimentell beobachtet werden, dass man einen Strahl von Atomen quer durch einen starken Laserstrahl schießt und die Fluoreszenz beobachtet, d.h. spontane Zerfälle unter Emission eines Photons, deren k-Vektor nicht parallel zum Laserstrahl zeigt. Die Intensität des Fluoreszenzlichtes ist dann entlang des Strahls räumlich moduliert mit einer Wellenlänge λ = 2π vat , ωRn wobei vat die Geschwindigkeit der Atome im Strahl darstellt. Laser Atome Im Spektrum der Fluoreszenzstrahlung sind die vier Kombinationsfrequenzen ω0 ± ωRn ± ωR,n−1 im Prinzip alle vertreten. Dabei ist die Differenz zwischen ωRn und ωR,n−1 experimentell nie auflösbar, wenn ωRn selbst hinreichend groß ist. Man erhält also drei Komponenten mit den Intensitätsverhältnissen sin4 θn : 2 sin2 θn cos2 θn : cos4 θn . √ Für |∆ω|√ g n gilt θn ' 45◦ und das Intensitätsverhältnis ist näherungsweise 1:2:1. Für ∆ω g n gilt 1 1 ωn− ' EB + n − ~ω0 ; ωn−1,+ = EA + n − ~ω0 ; 2 2 √ g n θn ' 1, ∆ω also die Intensität liegt fast vollständig bei der Frequenz ωn− −√ ωn−1,+ ' ωat , der unverschobenen atomaren Frequenz. Für allgemeine Werte von 2g n/∆ω findet man ein Intensitätsverhältnis zwischen den beiden Extremen; für den gewichteten Mittelwert der Emissionsfrequenz erhält man mit Hilfe einiger trigonometrischer Beziehungen immer die unverschobene atomare Frequenz ωat . 40 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES Bemerkung Für die obige Betrachtung ist wesentlich, dass jeweils nur ein Atom mit dem Feld wechselwirkt. Falls mehrere Atome vorhanden sind, so wird i.a. die Modenfunktion an den verschiedenen Orten einen etwas anderen Wert haben, und auch die Verstimmung wird auf Grund der Dopplerverschiebung leicht unterschiedliche Werte haben; die Rabi-Oszillationen verschiedener Atome geraten also rasch außer Takt. 2.4.4 Energieverschiebungen durch Ankopplung an die Vakuumfluktuationen (die Lamb-Verschiebung) In diesem letzten Abschnitt des Kapitels über die Quantentheorie des Strahlungsfeldes betrachten wir den Einfluss der Ankopplung an das Strahlungsfeld auf die Lage der atomaren Niveaus. Eine quantitativ zuverlässige Behandlung dieser Effekte kann nur im Rahmen einer voll-relativistischen Theorie gegeben werden. Die nachfolgende nicht-relativistische Beschreibung liefert aber schon eine Erläuterung der grundlegenden physikalischen Ideen, sowie eine überraschend gute vorläufige Abschätzung der Größenordnung des zu erwartenden Effekts. Konkret betrachten wir das System (Atom + Feld) im Zustand |A; {0} . Die Wech- selwirkung HI bewirkt, dass dieser Zustand für eine kurze Zeit in einen Zustand |B; 1k übergehen kann, und sich dann, ”ehe die entsprechende Verletzung der Energieerhaltung auf Grund der Energie-Zeit-Unschärfe bemerkt werden kann”, wieder in den Zustand |A; {0} zurückverwandelt. Auch kompliziertere Szenarien sind möglich; einige davon sind in der untenstehenden Reihe von Graphen dargestellt. A A A A A D D C C C B B D B k A (I) k A (II) A (III) k! k k! k A (IV) B k! k A (V) Diese Umwandlungen haben zur Folge, dass die mittlere Energie eines Systems, das sich zu den Zeiten t = 0 und t = t1 im Zustand |A; {0} befindet, sich von der ungestörten Energie EA etwas unterscheidet. Wir werden diesen Effekt in niedrigster Ordnung in e2 berechnen, d.h. wir betrachten nur die Graphen I und II, und zwar zuerst nur den Graphen I; wir werden später ein Argument geben, weshalb der Graph II nicht zu beobachtbaren Effekten führt. KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 41 Zum skizzierten Vorgehen betrachten wir also einen Zustand der allgemeinen Form X |t = cA (t)|A; {0} + cBk (t)|B; 1k . B,k Wir vernachlässigen also Beimischungen von weiteren Zuständen. Weiters wissen wir aus den Betrachtungen über den atomaren Zerfall (S. 27), dass für vorgegebene A, B und k immer nur ein Polarisationszustand des Photons k ankoppelt. Für die Entwicklungskoeffizienten erhält man die Bewegungsgleichungen (hergeleitet auf S. 26) i (−) i~ċBk (t) = B; 1k |HI |A; {0} e ~ (EB +~ωk −EA )t cA (t) X i (+) (4.5) i~ċ (t) = A; {0}|H |B; 1 e ~ (EA −EB −~ωk )t c (t), A I k Bk B,k wobei in Dipolnäherung gilt (vgl. S. 25 und 27) ∗ ie (−) (+) B; 1k |HI |A; {0} = A; {0}|HI |B; 1k = − m r 2π~ ∗ 0 ê ·pBA ≡ HBkA . V ωk k1 Die Elimination von pBA zugunsten von rBA ist hier nicht möglich, weil die Zustände |A; {0} und |B; 1k nicht energetisch entartet zu sein brauchen! Wir suchen jetzt eine Lösung des Systems (4.5) mittels des Ansatzes i cA (t) = e− ~ ∆EA t . Dies ergibt H0 cBk (t) = BkA i~ 0 = HBkA Z t i 0 dt0 e ~ (EB +~ωk −EA −∆EA )t 0 i (EB +~ωk −EA −∆EA )t ~ −1 e . (EA + ∆EA − EB − ~ωk i Substitution in die Gleichung (4.5) für cA , und Division durch e− ~ ∆EA t , liefert i ∆EA = X B,k 2 0 |HBkA | 1 − e ~ (EA −EB −~ωk )t . (EA − EB − ~ωk ) Im obigen Ausdruck haben wir auf der rechten Seite ∆EA gegenüber EA vernachlässigt, weil wir ohnehin ∆EA nur bis zur Ordung e2 berechnen wollen (Mitnehmen von ∆EA , aber nicht von ∆EB , wäre überdies auch inkonsistent). Die Zeitabhängigkeit im obigen Ausdruck ist natürlich unphysikalisch; die Zeitfunktion soll durch ihren Grenzwert für t → ∞ ersetzt werden. Um für das zugrundeliegende Integral einen wohldefinierten Wert zu erhalten, fügt man im Exponenten einen kleinen Imaginärteil hinzu: Z ∞ 1 − eixt 0 lim ≡ − lim i dt0 ei(x+iη)t t→∞ η&0 x 0 1 x iη 1 = lim = lim 2 − 2 = − iπδ(x). 2 η&0 x + iη η&0 x + η 2 x +η x KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 42 Wir erhalten für ∆EA also einen komplexen Wert: 0 |HBkA |2 EA − EB − ~ωk B,k X 2 0 Im(∆EA ) = −π |HBkA | δ(EA − EB − ~ωk ). Re(∆EA ) = X B,k Der Imaginärteil liefert (wegen ωk > 0) nur für angeregte Zustände einen Beitrag; in dem Ausdruck 2π X 0 2 2 |H | δ(EA − EB − ~ωk ) = wA − Im(∆EA ) = ~ ~ B,k BkA erkennt man die mit Hilfe der Fermi’schen goldenen Regel berechnete totale Zerfallsrate des Zustandes |A , die auf S. 28 explizit berechnet wurde, wieder. Diese Interpretation wird unterstützt durch das Ergebnis |cA (t)|2 = e+2Im(∆EA )t/~ |cA (0)|2 = e−wA t |cA (0)|2 . 0 Im Ausdruck für Re(∆EA ) substituieren wir jetzt den Wert des Matrixelements HBkA . 3 Weiters ersetzen wir die Summe über k durch ein Integral, was den Faktor V /(2π) (gleich der Dichte der zulässigen Werte im k-Raum) mit sich bringt: Z |ê∗k1 ·pBA |2 2π~e2 V X 1 dk . Re(∆EA ) = 2 m V 8π 3 B ωk EA − EB − ~ωk Als nächstes führen wir die Integration über die Winkel im k-Raum durch; dabei können wir wie auf S. 28 die Beziehung Z Z 2 2 2 ∗ dΩ |êk1 ·pBA | = |pBA | dΩ sin2 θ = |pBA |2 4π 3 einsetzen. Falls wir weiters noch von der Integrationsvariablen |k| auf Eγ = ~ωk = ~ck übergehen, erhalten wir Z 2 e2 1 X ∞ Eγ |pBA |2 Re(∆EA ) = dEγ . 3π ~c (mc)2 B 0 EA − EB − Eγ Dieser Ausdruck beruht auf einer nicht relativistischen Beschreibung des Elektrons und auf der Dipolnäherung, die nur gilt, falls die Wellenlänge des Photons klein ist gegenüber den sonstigen relevanten Längen im Matrixelement pBA . Beide Näherungen werden schlecht für hohe Werte von Eγ (Beachte, dass bei vorgegebenem Eγ sämtliche Zustände |B , für die gilt EB − EA ∼ Eγ , noch beachtliche Beiträge liefern können; für hohe Werte von Eγ sind dies ionisierte Zustände mit relativistischen Geschwindigkeiten des Elektrons). Sowohl die Korrekturen zur Dipolnäherung als auch die relativistischen Korrekturen führen zu einer KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 43 starken Unterdrückung der Beiträge hoher Eγ . (Für die Korrekturen zur Dipolnäherung ist dies evident: die Substitution Z Z ∂ ∂ ∗ ψB (r) ψA (r)dr −→ ψB∗ (r)e−ik·r ψA (r)dr ∂r ∂r führt zum Verschwinden des Matrixelements im Limes |k| → ∞!) Wir bringen diese Korrekturen jetzt ganz grob in Rechnung durch ein Abschneiden des (max) obigen Integrals bei einem, vorerst noch recht willkürlichen, Wert Eγ . Zur Abschät(max) zung von Eγ kann folgende Überlegung dienen: Die Reduktion des Matrixelements −ik·r durch e wird effektiv, sobald der Wellenvektor des Photons vergleichbar wird mit dem Wellenvektor ke des Photoelektrons, der ohnehin in ψB∗ (r) vorkommt. Dies bedeutet konkret r 2mEγ Eγ ke ∼ =⇒ Eγ ∼ 2mc2 . ∼ 2 ~ ~c (Der Faktor 2 ist natürlich nicht ernst zu nehmen, weil für E ∼ mc2 die nichtrelativistische Beziehung zwischen E und ke längst nicht mehr gilt!) Auch nach diesem Abschneiden ist der Ausdruck für Re(∆EA ) noch nicht wohldefiniert; er hängt noch sehr sensitiv von (max) Eγ ab. Um zu einer vernünftigen Interpretation zu kommen, brauchen wir eine neue physikalische Idee, die Massenrenormierung. 2.4.5 Intermezzo: Die Selbstenergie freier Elektronen Die obige Rechnung für ein in einem Atom gebundenes Elektron kann auch für ein freies Elektron durchgeführt werden. Die Zustände |A und |B müssen dann durch die Zustände |p und |p0 mit den Wellenfunktionen 1 i r|p = √ e ~ p·r V ersetzt werden, und für das Matrixelement erhält man r Z i e 2π~ 0 0 dr e ~ (p−p )·r e−ik·r (p·êk1 ) Hp0 kp = − 3 m ωk V r e 2π~ =− p·êk1 δp0 ,p−~k . m ωk V Im Ausdruck für die Größe Re(∆Ep ), die auch als die Selbstenergie des Elektrons bezeichnet wird, tritt weiters noch der Energienenner Ep − Ep0 − ~ωk = p2 |p − ~k|2 − − ~ωk ≈ −~ωk 2m 2m KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 44 auf, wobei die Abschätzung für nichtrelativistische Werte von k gültig ist: p2 |p − ~k|2 p·~k ~2 k2 v ~ωk − = + = ·k̂ + ~ωk . 2m 2m m 2m c 2mc2 Einsetzen des Ausdrucks für Hp0 0 kp und der Näherung für den Energienenner im Ausdruck für ∆Ep0 Ausführen der Winkelintegration, sowie ein Übergang zur Integrationsvariablen Eγ , liefert einen rein reellen Ausdruck (gleichzeitige Erhaltung von Energie und Impuls beim Übergang |p; {0} → |p0 ; 1k ist nicht möglich), und zwar e2 2p2 ∆Ep = − ~c 3π(mc)2 Z 0 (max) Eγ (max) e2 2 Eγ dEγ = − p2 . ~c 3π (mc)2 Dieser Beitrag zur Energie eines freien Elektrons kann genauso behandelt werden wie der Beitrag der potentiellen Energie zur Energie des Elektrons in einem periodischen Potential. Dafür erhält man z.B. im Kronig-Penney-Modell, und für genügend kleine p, einen Ausdruck vom Typ hV ip = c0 + c1 p2 . In der Festkörperphysik ist es üblich, diesen Term über eine effektive Masse m∗ in Rechnung zu bringen: p2 p2 + hV i = c0 + 2m 2m∗ mit m∗ = m . 1 + 2mc1 Auf ähnliche Weise können wir jetzt schreiben # " (max) 2 p2 e 4 E γ m, Ep − ∆Ep = mit m∗ ∼ = 1+ 2m∗ ~c 3π mc2 (max) was für die Wahl Eγ = mc2 eine Korrektur von 0,3% bedeutet. Die Masse m∗ heißt in diesem Zusammenhang auch renormierte Masse. Die für die weitere Rechnung entscheidende, von Kramers stammende Idee ist jetzt: Eine experimentelle Messung der Elektronenmasse bestimmt immer in m∗ und nicht die im Hamiltonoperator aufscheinende ”nackte” Masse m. Auch die oben berechnete Niveauverschiebung ∆EA ist prinzipiell nicht beobachtbar; beobachtbar ist nur der Unterschied zwischen der Niveauverschiebung des im Zustand |A gebundenen Elektrons und der soeben bestimmten Absenkung der kinetischen Energie: (obs) ∆EA p2 p2 − |A . ≡ ∆EA − A| 2m∗ 2m Ehe wir diesen Ausdruck für die Niveaus des Wasserstoffatoms auswerten, diskutieren wir noch kurz den Einfluss des Graphen II auf S. 40. Dieser führt zu einem Zusatzterm in der Gleichung für ċA : i~ċA = . . . + e2 ~2 2 A; {0}|A (r)|A; {0} . 2mc2 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 45 In der Dipolnäherung kann A2 (r) durch A2 (r0 ) ersetzt werden. Letzterer Operator wirkt nicht mehr auf die Elektronenkoordinaten, und man erhält e2 ~2 2 A|A {0}|A (r )|{0} , 0 2mc2 also einen Beitrag zur Selbstenergie, der zwar ohne Abschneidung der k-Integration divergent ist, aber für alle Zustände gleich, und der deshalb prinzipiell nicht beobachtbar ist. Man überzeugt sich leicht, dass auch für freie Elektronen (ohne Dipolnäherung!) ein p-unabhängiger Beitrag, analog zur Größe c0 in der Festkörperanalogie, entsteht. i~ċA = . . . + Bethe’s Berechnung der Lamb-Verschiebung Einsetzen der schon berechneten Werte für Re(∆EA ) und m∗ in den obigen Ausdruck (obs) (obs) für ∆EA liefert (wir werden weiters unter ∆EA ohne nähere Angabe den Realteil verstehen) # " Z Eγ(max) 2 2 X 2 e E |p | γ BA (obs) + (p2 )AA dEγ ∆EA = ~c 3π(mc)2 0 E − E − E A B γ B (max) Z Eγ X |pBA |2 (EA − EB ) e2 2 = dEγ ~c 3π(mc)2 0 EA − EB − Eγ B ! (max) 2 X e 2 Eγ . |pBA |2 (EB − EA ) ln = 2 ~c 3π(mc) B |EB − EA | 2 Bei P dieser2 Herleitung wurde im ersten Schritt die Vollständigkeitsbeziehung (p )AA = B |pBA | verwendet; im zweiten Schritt wurde für den Fall EB < EA die Singularität bei Eγ = EB − EA behoben durch Ausschneiden eines kleinen symmetrischen Intervalls (genaueres Studium des Grenzübergangs auf S. 41 zeigt, dass dies die korrekte Behandlung ist); die Integrale über (0, EBA − η) und (EBA + η, 2EBA ) heben sich dann genau auf, und (max) das Endergebnis folgt nach Vernachlässigung von EAB relativ zu Eγ ∼ mc2 im Beitrag der oberen Integrationsgrenze. (obs) Der erhaltene Ausdruck für ∆EA ist für die Niveaus des Wasserstoffatoms ohne weiteres exakt auswertbar, weil sämtliche Eigenwerte EA und Eigenzustände |A exakt bekannt sind. Die Summe erweist sich als konvergent; sie hängt natürlich noch logarithmisch (max) vom Abschneideparameter Eγ ab. Zur näheren Auswertung schreiben wir das Ergebnis in der Form ! (max) X e2 2 Eγ (obs) ∆EA = ln |pBA |2 (EB − EA ), 2 ~c 3π(mc) h|EB − EA |iav B was lediglich einer Definition von h|EB − EA |iav entspricht. Als nächstes betrachten wir die Identität pHat − Hat p = −i~∇V, KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 46 P die für jedes Ein-Elektron-Atom gilt. Die zu berechnende Summe B |pBA |2 (EB − EA ) erhält man entweder durch Nehmen des (BA)-Matrixelements der Identität, Multiplikation mit pAB und Summation über B, oder durch das ”gespiegelte” Verfahren: X X X |pBA |2 (EB − EA ) = −i~ pAB ·(∇V )BA = i~ (∇V )AB ·pBA . B B B Der ”Mittelwert” der zwei äquivalenten Ausdrücke liefert X B |pBA |2 (EB − EA ) = − i~ ~2 ([p, ∇V ])AA = − (∇2 V )AA . 2 2 Für das Coulombpotential gilt ∇2 V (r) = 4πe2 δ(r), also X B |pBA |2 (EB − EA ) = −2πe2 ~2 |ψA (0)|2 . Diese Größe ist nur für s-Zustände nichtverschwindend; für diese gilt die Beziehung |ψns (0)|2 = 1 πn3 a30 mit a0 = ~ ~c . mc e2 Für die Verschiebung der s-Niveaus des Wasserstoffatoms erhalten wir also letztendlich ! 2 3 2 (max) E 8 e e 1 γ (obs) ∆Ens ln = . 3 3π ~c 2a0 n h|EB − EA |iav Die Größe e2 /(2a0 ) ist die Rydbergenergie, die natürliche Einheit für atomare Energieabstände. Für Niveaus mit l 6= 0 erhalten wir in dieser Ordnung keine Energieverschiebung. Eine numerische Rechnung liefert für h|EB − E2s |i den Wert 17,8 Ry. Einsetzen dieses (max) Wertes liefert für die Wahl Eγ = mc2 die ”Vorhersage” 1 (obs) (obs) ∆E2s − ∆E2p1/2 = 1040 M hz, ~ in erstaunlich guter Übereinstimmung mit dem experimentellen Wert 1060 M Hz. Ände(max) rung von Eγ um einen Faktor 2 würde eine Änderung der Vorhersage um etwa 9% mit sich bringen. Die genaue Übereinstimmung ist also eher ein glücklicher Zufall, aber die Größenordnung des Ergebnisses wird durch unsere sehr grobe Theorie recht gut vorhergesagt. Die oben durchgeführte Rechnung hat also folgendes Ergebnis gebracht: Der nichtrelativistische Ausdruck für ∆EA ist in niedrigster Ordnung der Störungstheorie divergent KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES (max) 47 und hängt linear von der Abschneideenergie Eγ ab; der Massenrenormierungsterm di(max) vergiert auch linear mit Eγ , aber die beobachtbare Niveauverschiebung ist nur noch logarithmisch divergent. Die Abhängigkeit von der Abschneideenergie bedeutet, dass die Rechnung eigentlich überhaupt keine quantitative Vorhersage gebracht hat! Andererseits ist die Rechtfertigung für das Abschneiden der Integrale keineswegs problematisch: Die nicht relativistische Rechnung reicht nun einmal für hohe Eγ nicht aus, und man weiß im Prinzip, was man besser machen soll. In der relativistischen Theorie sind, wie sich herausstellt, sowohl ∆EA als auch die (max) Massenrenormierung nur noch logarithmisch divergent mit Eγ und für deren Differenz (max) erhält man einen endlichen, von Eγ unabhängigen Wert. Es gibt in der relativistischen Theorie noch einen zweiten Effekt, die Vakuumpolarisation. Wie wir in unserer Diskussion der Diracgleichung sehen werden, kann aus dem Vakuumzustand vorübergehend ein Elektron-Positron-Paar entstehen, das wegen Nichterhaltung der Energie natürlich wieder schnell verschwinden muss. Während der kurzen Existenz des Paares werden die beiden aber durch ein etwaiges äußeres Feld ein wenig auseinander gezogen, was zu einer Abschirmung sämtlicher Ladungen führt, genau wie für eine Ladung in einem Dielektrikum. Diese sogenannte Ladungsrenormierung ist wieder formal divergent, aber prinzipiell unbeobachtbar. Im Wasserstoffatom gibt es aber beobachtbare Effekte, weil sowohl Elektron als auch Proton in die ”Abschirmungswolke” aus Vakuumfluktuationen des jeweilig anderen Teilchens kommen. Dieser Nettoeffekt ist wieder endlich, und die Summe der beiden so (obs) berechneten Beiträge zu ∆EA stimmt innerhalb der inzwischen sehr kleinen Messungenauigkeiten mit dem Experiment überein. Die einschlägigen Rechnungen wurden in den vierziger Jahren von Tomonaga, Schwinger und Feynman unabhängig voneinander durchgeführt. Der Beweis, dass die entwickelten Formalismen auch in höheren Ordnungen endliche Ergebnisse liefern, stammt von Dyson. Um diese Übereinstimmung zu erhalten, müssen auch Terme höherer Ordnung in der Störungstheorie betrachtet werden, aber bei diesen treten keine neuen Divergenzen auf. Eine Theorie, in der nur endlich viele divergente Graphen auftreten, heißt renormierbar. Während die relativistische Quantenelektrodynamik also quantitativ sehr genaue Vorhersagen machen kann, wird die Rechtfertigung der formalen Vorgehensweise um einiges diffiziler: Das Auftreten divergenter Ausdrücke für Massen- und Ladungsrenormierung ist ein Indiz dafür, dass auch die relativistische Theorie im Bereich extrem hoher Energien nicht korrekt sein kann. Es ist aber noch nicht klar, welche neuen physikalischen Effekte die Massen- und Ladungsrenormierung zustande bringen (Effekte der Gravitation, Supersymmetrie, Superstrings, . . . ). Der wesentliche Vorteil einer renormierbaren Theorie ist aber, dass man die Antwort auf diese Frage nicht zu wissen braucht, um mit der Theorie selbst weiterarbeiten zu können. Viele Physiker halten sogar das ”Problem der Behebung der Divergenzen” eher für ein psychologisches Problem der Theoretiker. In dieser Betrachtungsweise reicht es völlig aus, dass ein wohldefinierter Algorithmus zur Berechnung sämtlicher beobachtbarer Effekte existiert, und es wird als eine Anmaßung empfunden, der Natur vorzuschreiben, welcher Art von Mathematik sie sich zu bedienen hat. Kapitel 3 Quantentheorie von Fermionfeldern 3.1 Hilbertraum und Feldoperatoren für identische Fermionen In diesem Kapitel werden wir auch für Fermionen einen Besetzungszahlformalismus entwickeln, der demjenigen für Photonen möglichst analog ist. Als erstes brauchen wir dazu einen Satz von Modenfunktionen. Diese können ziemlich willkürlich gewählt werden; die einzige Bedingung ist, dass sie vollständig sein müssen. Eine mögliche Wahl sind die stationären Zustände irgendeines Referenz-Hamiltonoperators Href , Href φk (r, sz ) = Ek φk (r, sz ) mit Href = p2 + Vref (r) 2m und der Normierung XZ dr |φk (r, sz )|2 = 1. sz Weil Fermionen immer einen Spin haben, haben wir auch den Spinfreiheitsgrad explizit angegeben. In der obigen Definition ist Vref spinunabhängig gewählt; eine Verallgemeinerung auf spinabhängige Potentiale bereitet keine Schwierigkeiten, wird aber für unsere Zwecke nicht gebraucht. Unsere Wahl impliziert, dass jeder Eigenwert mindenstens (2s + 1)-fach entartet ist; diese Entartung muss natürlich beim Abzählen der Eigenzustände berücksichtigt werden. Als Basiszustände des Hilbertraumes wählen wir wieder die Besetzungszahl-Eigen zustände |{nk } , wobei jetzt aber die nk nur dieP Werte 0 und 1 annehmen können (Pauliverbot!). Weiters gilt wieder die Nebenbedingung k nk < ∞. In Folge führen wir Erzeuger c†k und Vernichter ck ein, die die Besetzungszahl nk um eins erhöhen bzw. erniedrigen, falls dies erlaubt ist. Diese Vorschrift legt die ck und c†k noch nicht fest; die allgemeinste noch zugelassene Form, für die ck und c†k hermitesch konjugiert sind, ist c†k |{nl } = [1 − nk ]eiφk ({nl +δkl }) |{nl + δkl } (1.1) ck |{nl } = nk e−iφk ({nl }) |{nl − δkl } , 48 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 49 wobei die Phasen φk ({nl }) im Prinzip noch frei wählbar sind. Insbesondere könnte man sie alle, wie im analogen Bose-Fall, gleich Null wählen; dies führt aber zu einem recht schwerfälligen Formalismus. Um zur Festlegung der φk ({nl }) zu gelangen, betrachten wir zuerst die Identität † † ck ck + ck ck |{nl } = (1 − nk + nk )|{nl } = |{nl } , oder n o c†k , ck ≡ c†k ck + ck c†k = 1. Statt einer charakteristischen Vertauschungsbeziehung, wie für Bosonen, haben wir also hier eine charakteristische Antivertauschungsbeziehung. Es liegt jetzt nahe, diese Antikommutatorstruktur auszubauen und zu fordern o n o n (1.2) c†k , cl = δkl ; c†k , c†l = {ck , cl } = 0. Dies wird ermöglicht durch die von Jordan und Wigner vorgeschlagene Phasenkonvention X φk ({nl }) = π nl0 ; l0 <k für diese Konvention ist es also notwendig, die Indizes k auf irgendeine, weitgehend willkürliche, aber ein für allemal festzulegende, Weise zu ordnen. Der formale Beweis, dass diese Vorschrift nach Substitution in (1.1) zu den Beziehungen (1.2) führt, ist nicht sehr schwierig, aber etwas mühsam, und wir beschränken uns auf einige Beispiele: c†1 c†2 |{0} = c†1 |01 ; 12 = |11 ; 12 ; c†2 c†1 |{0} = c†2 |11 ; 02 = −|11 ; 12 ; c†1 c3 |01 ; 12 ; 13 = −c†1 |01 ; 12 ; 03 = −|11 ; 12 ; 03 ; c3 c†1 |01 ; 12 ; 13 = c3 |11 ; 12 ; 13 = |11 ; 12 ; 03 . Wir bemerken noch nebenbei, dass der Operator Nk = c†k ck der Zähloperator für die Zahl der Fermionen im Zustand φk (r, sz ) ist: Nk |{nl } = nk |{nl } . Der Operator X N= Nk k ist offensichtlich der Operator für die Gesamtzahl der Fermionen. KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 3.1.1 50 Feldoperatoren Wir führen jetzt den Feldoperator ψ(r, sz ) ein mittels X ψ(r, sz ) = ck φk (r, sz ) k und betrachten den Kommutator h i X [N, ψ(r, sz )] = φl (r, sz ) c†k ck , cl . k,l Aus der Beziehung h i n o † † † † † † ck ck , cl = ck ck cl − cl ck ck = ck ck cl + ck cl ck − ck , cl ck = c†k ck cl + c†k cl ck − δkl ck = −δkl ck folgt [N, ψ(r, sz )] = −ψ(r, sz ), also der Operator ψ(r, sz ) erniedrigt die Fermionenzahl um eins. Aufgrund der Identität ψ(r, sz )|{δlk } = φk (r, sz )|{0} , gilt zusätzlich noch, dass ψ(r, sz ) nur ein Fermion vernichten kann, falls eines am Ort r mit Spin sz vorhanden ist. Auf ähnliche Weise kann man den adjungierten Operator X † ψ † (r, sz ) = ck φ∗k (r, sz ) k interpretieren als den Erzeuger eines Fermions mit Spin sz am Ort r. Aufgrund der Vollständigkeit der φk (r, sz ) gilt die Antikommutatorbeziehung n o † X ∗ ψ (r, sz ), ψ(r0 , s0z ) = φk (r, sz )φl (r0 , s0z ) c†k , cl k,l = X k φ∗k (r, sz )φk (r0 , s0z ) = δ(r − r0 )δsz s0z . Es liegt jetzt nahe, den Operator ρ(r, sz ) = ψ † (r, sz )ψ(r, sz ) als die Teilchendichte am Ort r für den Spin sz zu interpretieren. Aufgrund der Orthonormalität der φk gilt XZ XXXZ † drψ (r, sz )ψ(r, sz ) = drc†k cl φ∗k (r, sz )φl (r, sz ) sz sz = k XX k l l δkl c†k cl = X c†k ck = N, k also die integrierte Teilchendichte liefert die Teilchenzahl, wie es sich gehört. KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 51 Bemerkung Bei der obigen Formulierung ist es eher nebensächlich, dass wir die Modenfunktionen in der (r, sz )-Darstellung spezifiziert haben. Man erhält einen völlig äquivalenten Formalismus mit ψ † (p, sz ) und ψ(p, sz ), falls man statt dessen die (p, sz )-Darstellung wählt. Als nächstes betrachten wir die Paardichte, d.h. den Operator, dessen Erwartungswert die Wahrscheinlichkeit dafür angibt, dass sich sowohl am Ort r ein Teilchen mit Spin sz als auch am Ort r0 ein Teilchen mit Spin s0z befindet. Dieser Operator ist 1 ρ2 (x0 , x) = ψ † (x0 )ψ † (x)ψ(x)ψ(x0 ), 2 wobei wir die kompakte Notation x für das Paar (r, sz ) eingeführt haben. (Eine Integration über x wird im folgenden auch immer als Integration über r und Summation über sz aufzufassen sein.) Wir berechnen als Beispiel den Erwartungswert von ρ2 (x0 , x) im Zweiteilchenzustand |1k , 1l : 0 1k , 1l |ρ2 (x , x)|1k , 1l 2 1 0 † † = {0}|ψ(x)ψ(x )ck cl |{0} 2 2 1 † † 0 † 0 = − {0}|ψ(x)ck ψ(x )cl |{0} + φk (x ) {0}|ψ(x)cl |{0} 2 1 2 = |−φk (x)φl (x0 ) + φk (x0 )φl (x)| . 2 Wir erhalten also das Betragsquadrat einer antisymmetrisierten Zwei-Teilchen-Wellenfunktion. Die Normierungsbedingung lautet Z Z dx dx0 1k , 1l |ρ2 (x0 , x)|1k , 1l = 1. wie aus der Orthonormalität der Modenfunktionen φk leicht hergeleitet werden kann. Für einen n-Teilchen-Zustand erhält man auf ähnliche Weise Z Z n 0 0 dx dx n|ρ2 (x , x)|n = . 2 also die Zahl der Paare, die aus den Modenindizes gebildet werden können. 3.1.2 Der Hamiltonoperator für Fermionfelder Wir betrachten jetzt ein System aus identischen Teilchen, die sich in einem gemeinsamen äußeren Potential V (r) bewegen und weiters eine Paarwechselwirkung W (ri − rj ) miteinander haben. Für den Erwartungswert der potentiellen Energie erhält man so in einem Zustand |χ den Ausdruck Z Z Z χ|Hpot |χ = dx V (r) χ|ρ(x)|χ + dx dx0 W (r − r0 ) χ|ρ2 (x, x0 )|χ . KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 52 Die kinetische Energie hat eine entsprechend einfache Form in der Impulsdarstellung: Z X p2 χ|Hkin |χ = dp χ|ψ † (p, sz )ψ(p, sz )|χ . 2m s z Weil ψ(p, sz ), wie in der normalen Quantentheorie, als Fouriertransformierte von ψ(r, sz ) geschrieben werden kann, lässt sich dies umformen zu Z X ~2 2 † χ|Hkin |χ = dr χ|ψ (r, sz ) − ∇ ψ(r, sz )|χ . 2m s z Für den gesamten Hamiltonoperator erhalten wir also Z ~2 2 † H = dx ψ (x) − ∇ + V (r) ψ(x) 2m Z Z 1 + dx dx0 ψ † (x0 )ψ † (x)W (r − r0 )ψ(x)ψ(x0 ). 2 (1.3) Verallgemeinerungen, die spinabhängige Wechselwirkungen und/oder Mehrteilchenwechselwirkungen enthalten, sind leicht hinzuschreiben, aber für uns nicht weiters von Interesse. 3.2 Die Hartree-Fock-Näherung Eine der Aufgaben der Atom-, Kern- und Festkörperphysik ist es, die stationären Zustände des Hamiltonoperators (1.3) für ein n-Teilchen-System zu bestimmen. Um eine Idee für die dabei auftretenden Schwierigkeiten zu erhalten, leiten wir zuerst die Bewegungsgleichung für den Feldoperator ψ(x) , betrachtet als ein Operator im Heisenbergbild, ab. Insbesondere betrachten wir den Kommutator [H, ψ(x)] = [H0 + Hw , ψ(x)] , wobei H0 den Ein-Teilchen-Anteil und Hw den Wechselwirkungsanteil bezeichnet: Z H0 = dx0 ψ † (x0 )H10 ψ(x0 ) mit ~2 02 ∇ + V (r0 ). 2m Für den ersten Teil des Kommutators erhalten wir so Z [H0 , ψ(x)] = dx0 ψ † (x0 )H10 ψ(x0 ), ψ(x) Z = dx0 −ψ † (x0 )ψ(x)H10 ψ(x0 ) − ψ(x)ψ † (x0 )H10 ψ(x0 ) Z = − dx0 δ(x − x0 )H10 ψ(x0 ) = −H1 ψ(x). H10 = − 53 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN Bei dieser Herleitung wurde im ersten Schritt das ”Antivertauschen” von ψ(x) mit ψ(x0 ), sowie das Vertauschen von H10 und ψ(x) ausgenutzt (H10 wirkt auf x0 , aber nicht auf x). Im zweiten Schritt wurde der Antikommutator von ψ † (x0 ) und ψ(x) eingesetzt. Das Ergebnis ist nicht sonderbar aufregend; ohne Wechselwirkung erhält man ψ(x, t) dadurch, dass man ψ(x) entwickelt nach den Eigenfunktionen φ̃l (x) von H1 mit Eigenwerten Ẽk , X ψ(x) = c̃l φ̃l (x), l und dann jedem c̃l seinen Zeitfaktor gibt: X i ψ(x, t) = c̃l φ̃l (x)e− ~ Ẽl t . l Der Kommutator mit dem Wechselwirkungsterm ergibt Z Z 1 0 [Hw , ψ(x)] = dx dx00 ψ † (x0 )ψ † (x00 )W (r0 − r00 )ψ(x00 )ψ(x0 ), ψ(x) 2 Z Z 1 0 = dx dx00 W (r0 − r00 ) ψ † (x0 ) ψ(x), ψ † (x00 ) ψ(x00 )ψ(x0 )− 2 δ(x − x0 )ψ † (x00 )ψ(x00 )ψ(x0 ) 1 = 2 Z =− Z dx0 W (r0 − r)ψ † (x0 )ψ(x)ψ(x0 )− Z 00 00 † 00 00 dx W (r − r )ψ (x )ψ(x )ψ(x) dx0 W (r0 − r)ψ † (x0 )ψ(x0 )ψ(x). Die Wechselwirkung verknüpft also die Zeitentwicklung des Feldoperators ψ(x) mit derjenigen eines Produktes aus drei Feldoperatoren. Die Bestimmung der Zeitentwicklung dieser letzteren Größe erfordert Kenntnisse über Produkte aus 5 Feldoperatoren usw. Es bestehen also kaum Aussichten, ohne recht drastische Näherungen irgendwelchen Fortschritt zu machen. Die auf Hartree und Fock zurückgehende Idee zur Erhaltung einer Näherungslösung ist jetzt folgende: 1) Man nehme an, es existiert ein Satz von n Basisfunktionen φl (x), welche näherungsweise harmonisch von der Zeit abhängen (als Heisenbergbild-Operatoren betrachtet). Für die Entwicklungskoeffizienten von ψ(x, t) nach diesen speziellen Basisfunktionen soll also gelten i cl (t) = e− ~ l t cl (2.1) KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 54 2) Nehme in dem Ausdruck Z [Hw , ψ(x)] = − dx0 W (r0 − r)ψ † (x0 , t)ψ(x0 , t)ψ(x, t) Z X † =− ck (t)cl (t)cm (t) dx0 W (r0 − r)φ∗k (x0 )φl (x0 )φm (x) k,l,m nur diejenigen Terme mit, die mit irgendeiner der in ψ(x, t) schon vorkommenden Frequenzen resonant sind. Dies sind sicher die wichtigsten Terme; der Effekt der sonstigen Terme wird sich bei der Ausintegration der Bewegungsgleichungen weitgehend ausmitteln. Nach dieser Näherung bleiben (in Abwesenheit zufälliger Entartungen) nur noch die Terme mit k = l oder k = m übrig. 3) Ersetze in den übriggebliebenen Termen den Operator c†k ck durch seinen Erwartungswert hnk i im gesuchten stationären n-Teilchenzustand. Man erhält so Z X hnk i cm (t) dx0 W (r0 − r)φ∗k (x0 )φk (x0 )φm (x) [Hw , ψ(x, t)] = − k,m + X k,l =− hnk i cl (t) Z dx0 W (r0 − r)φ∗k (x0 )φk (x)φl (x0 ) Z dx0 W (r0 − r) ψ † (x0 )ψ(x0 ) ψ(x) Z + dx0 ψ(x0 )W (r0 − r) ψ † (x0 )ψ(x) , wobei wir die Summen für ψ(y) und ψ † (y) zurückgebildet haben, und benutzt haben, dass in einem stationären Zustand im Rahmen der Näherung (2.1) gelten muss D E c†k cl = δkl hnk i . Wenn wir jetzt den Ausdruck für [Hw , ψ(x, t)] bilden und nach den (immer noch gesuchten) φl (x) zerlegen, und weiters die Bedingung (2.1) einsetzen, erhalten wir die Eigenwertgleichung Z † 0 0 0 0 l φl (x) = H1 + dx W (r − r) ψ (x )ψ(x ) φl (x) Z − dx0 φl (x0 )W (r0 − r) ψ † (x0 )ψ(x) , oder Z l φl (x) = H1 + − Z ! 0 0 dx W (r − r) X dx0 φl (x0 )W (r0 − r) k hnk i φ∗k (x0 )φk (x0 ) X k hnk i φ∗k (x0 )φk (x). φl (x) KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 55 Es treten also zu H0 zwei zusätzliche Terme auf: ein von der gemittelten Teilchendichte erzeugtes direktes Wechselwirkungspotential und ein zusätzliches, nichtlokales Austauschpotential. Zum letzteren tragen nur dieRZustände bei, die denselben Spin wie das gesuchte φl (x) [d.h. φl (r, sz )] haben; das Symbol dx0 bedeutet auch eine Summation über s0z , und wenn φl (x0 ) und φm (x) bezüglich ihrer Spinabhängigkeit zueinander orthogonal stehen, trägt der Term l = m zum Austauschpotential nicht bei. Die oben hergeleiteten Gleichungen heißen Hartree-Fock Gleichungen. Sie sind nichtlinear und implizit; die gesuchten Funktionen φl (x0 ) kommen auch an der rechten Seite vor, und die Gleichungen müssen selbstkonsistent gelöst werden. In der Praxis geht man iterativ vor: Man nimmt zuerst n einigermaßen plausibel erscheinende Versuchsfunktionen φ0k (x), setzt die zugehörigen hnk i gleich eins und berechnet direktes und Austauschpotential. Als nächstes löst man das so entstandene lineare Eigenwertproblem und nimmt die n Lösungen mit niedrigstem l als neue Versuchsfunktionen φ1k (x). Man wiederholt dieses Verfahren, bis sich die φik (x) von den φi−1 k (x) nicht mehr nennenswert unterscheiden. In der Praxis konvergiert das Verfahren recht ordentlich. Es ist aber nicht gesichert, dass die Lösung eindeutig (d.h. von der Wahl der φ0k unabhängig) ist; man kennt Beispiele, in denen es mehrere Lösungen gibt. Bemerkung 1 Durch Weglassen des Austauschtermes erhält man aus den Hartree-Fock-Gleichungen die sog. Hartree-Gleichungen. Dabei lässt man allerdings den Term k = l im direkten Potential (der im Hartree-Fock-Formalismus vom entsprechenden Term im Austauschpotential genau kompensiert wird) weg. Historisch wurden die Hartree-Gleichungen zuerst hergeleitet; man erhält sie, wenn man zu den vorhergehenden ähnliche Betrachtungen durchführt in der ”normalen” n-Teilchen-Quantenmechanik unter Berücksichtigung des Pauliverbotes, aber ohne Antisymmetrisierung der Wellenfunktion. Hartree zeigte, dass man zu den Hartree-Gleichungen geführt wird, falls man mit Hilfe der Variationsrechnung versucht, den Erwartungswert des Hamiltonoperators H= n X (i) H1 + i=1 n 1 X W (ri − rj ) 2 i6=j=1 innerhalb der Klasse der Versuchswellenfunktionen vom Typ φ(x1 , . . . , xn ) = n Y φi (xi ) i=1 zu minimieren, wobei die {φi } einen Satz orthonormaler Funktionen bilden. (Im obigen (i) Ausdruck bezeichnet H1 den Operator H1 wirkend auf die Variablen des i-ten Teilchens). Die Hartree-Fock-Gleichungen erhält man auf ähnliche Weise durch Minimierung innerhalb der Klasse von antisymmetrisierten Produktwellenfunktionen (oder Slaterdeterminan- KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 56 ten) n Y 1 X p √ (−1) φi (xpi ), φ(x1 , . . . , xn ) = n! p i=1 wobei über alle Permutationen P der Indizes 1 bis n summiert wird. Bemerkung 2 Der wichtigste Mangel der Hartree-Fock-Zustände ist die völlig unzureichende Beschreibung der Korrelationen in den Positionen der Elektronen. Für die Zweiteilchendichte im Hartree-Fock-Grundzustand gilt X 0 0 ρ2 (r, sz ; r , sz ) = φ∗k (r, sz )φk (r, sz )φ∗l (r0 , s0z )φl (r0 , s0z ) k<l − φ∗k (r, sz )φk (r0 , s0z )φ∗l (r0 , s0z )φl (r, sz ) . Falls sz 6= s0z gibt der zweite Term keinen Beitrag (dies ist sofort klar, wenn die {φl } Eigenfunktionen von sz sind; aber auch sonst ist dies leicht zu zeigen), und man erhält z.B. 1 1 1 1 ρ2 (r, + ; r0 , − ) = ρ(r, + )ρ(r0 , − ), 2 2 2 2 ein für ein System mit Coulombabstoßung völlig unrealistisches Ergebnis. Für sz = s0z erhält man schon Korrelationen; insbesondere gilt auch im Hartree-Fock-Grundzustand ρ2 (r, sz ; r, sz ) = 0, wie es aufgrund des Pauliverbots sein soll, aber sonst ist auch hier das Hartree-FockErgebnis für die Korrelationsfunktion g2 (x, x0 ) ≡ ρ2 (x, x0 ) − ρ(x)ρ(x0 ) weit von der Realität entfernt. Die Berechnung von Korrelationseffekten ist wegen der langen Reichweite des Coulombpotentials recht diffizil; eine ”normale” Störungsentwicklung um das Hartree-Fock-Ergebnis konvergiert schlecht und führt für ausgedehnte Systeme (Festkörper) sogar zu Divergenzen oder unphysikalischen Formabhängigkeiten in den einzelnen Ordnungen. Erst eine Resummation der Störungsreihe, die dem Phänomen der Abschirmung der Coulombkräfte Rechnung trägt, führt zu einigermaßen akzeptablen Ergebnissen (siehe Kap. 6 im Buch von Kittel für eine Einführung in die Problematik). Die Korrelationsfunktion kann insbesondere durch Streuung polarisierter Neutronen gemessen werden; Experimente dieser Art wurden in letzter Zeit am Hochflussreaktor in Grenoble an einigen Materialien durchgeführt. KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 3.2.1 57 Die Bedeutung der Hartree-Fock Eigenwerte Die Hartree-Fock Eigenwertgleichung besitzt viele der Eigenschaften einer normalen Schrödingergleichung; insbesondere kann sie geschrieben werden als 1 φl (x), l φl (x) = HHF 1 wobei HHF ein effektiver hermitescher Ein-Teilchen-Hamiltonoperator ist, der zwar von dem gesuchten Vielteilchenzustand, aber nicht vom Modenindex l abhängt. (Wegen des Weglassens des Terms k = l ist dies in der Hartree-Näherung nicht der Fall!) Letztere Unabhängigkeit bringt mit sich, dass der übliche Beweis der Orthogonalität der φl mit unterschiedlichen l ohne weiteres auch auf die Hartree-Fock Eigenfunktionen anwendbar ist; es ist also möglich, die φl (x) orthonormal zu wählen. Andererseits gilt nicht, dass die Hartree-Fock Grundzustandsenergie geschrieben werden kann als Summe der l für die besetzten Ein-Teilchen-Zustände: E0,HF 6= n X (2.2) l . l=1 Zur Überprüfung der obigen Ungleichheit berechnen wir zuerst einen Ausdruck für l durch Multiplikation der Eigenwertgleichung mit φ∗l (x) und Integration über x: Z l = dx φ∗l (x)H1 φl (x) + n Z X k=1 − n Z X k=1 Z dx Z dx dx0 |φl (x)|2 W (r − r0 )|φk (x0 )|2 dx0 φ∗l (x)φ∗k (x0 )W (r − r0 )φl (x0 )φk (x). Andererseits erhält man für den Erwartungswert des Vielteilchen-Hamiltonoperators (1.3) im Hartree-Fock-Grundzustand |11 , . . . , 1n ; 0n+1 , . . . ≡ |0HF das Ergebnis Z X E0,HF = 0HF |H|0HF = dx φ∗l (x)H1 φl (x) l Z n n Z 1 XX dx dx0 |φk (x)|2 W (r − r0 )|φl (x0 )|2 + 2 k=1 l=1 Z n n Z 1 XX − dx dx0 φ∗l (x)φ∗k (x0 )W (r − r0 )φl (x0 )φk (x). 2 k=1 l=1 Die Wechseiwirkungsterme treten also in den zwei in (2.2) verglichenen Ausdrücken mit unterschiedlichen Vorfaktoren auf. Die Energien l − l0 (l0 ≤ n, l > n) sind genau die Energien, die man brauchen würde, um ein Elektron aus dem Zustand l0 in den Zustand l zu bringen ohne Änderung der Zustände der sonstigen Elektronen. Für große Atome und Kerne (und erst recht für Festkörper) kann die Änderung der Zustände der 58 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN verbliebenen Elektronen (Konfigurationsrelaxation) vernachlässigt werden, und die l − l0 können dann mit den experimentellen Anregungsenergien für Elektronen verglichen werden. Als Beispiel der so erhaltenen Ergebnisse werden in der nachfolgenden Tabelle die mit der Hartree-Fock-Näherung errechneten lonisationsenergien für die verschiedenen Zustände mit dem Experiment verglichen. Dabei ist zu berücksichtigen, dass die L·S-Kopplung in der Rechnung nicht berücksichtigt wurde, im Experiment aber nicht abzuschalten ist. 1s 1828 HF exp n Fehler j = l + 1/2 j = l − 1/2 2s 270 2p 3s 3p 3d 251 52,2 44,3 29,8 260,1 46,0 27,8 1879,7 282,0 53,4 247,2 43,6 27,4 −2,8% −4,4% −1,1% −2,3% −1,1% +7,4% 4d 1,69 1,57 +7,1% (Energien in Rydberg.) Für Näheres siehe Bethe-Jackiw. Zwischenbemerkung: Die Symmetrie der Orbitale In der obigen Tabelle wurden die Funktionen φl (x) (weiters auch Orbitale genannt) charakterisiert durch Quantenzahlen, wie sie für ein Zentralfeldproblem üblich sind. Genau betrachtet ist aber das effektive Potential nicht exakt zentralsymmetrisch, außer für ein Atom mit abgeschlossenen Schalen (Edelgasekonfiguration); im letzteren Fall ist sofort klar, dass das direkte Potential zentralsymmetrisch ist, und eine relativ mühsame Rechnung zeigt, dass auch das Austauschpotential eine so symmetrische Form hat, dass Lösungen vom Typ φk (x) = φnlmσ (r, sz ) = Rnl (r) Ylm (θ, φ)χσ (sz ) r möglich sind (siehe Bethe-Jackiw, S.64, für Einzelheiten). Für nicht-Edelgas-Atome ist die obige Überlegung nicht mehr exakt gültig; sie bleibt aber aufrecht für den Beitrag ge1 , und für die sonstigen Beiträge erweist es sich als eine nicht schlossener Schalen zu HHF zu schlechte Näherung, auch diese durch ihr Mittel über die Winkel zu ersetzen; die so gemachten Fehler sind klein gegenüber den ohnehin schon in der Hartree-Fock-Näherung enthaltenen. Die sphärische Mittelung bringt einen zweifachen Vorteil: Erstens sind die Rechnungen um Größenordnungen einfacher, weil eindimensionale statt dreidimensionale gekoppelte Integro-Differentialgleichungen selbstkonsistent zu lösen sind. Zweitens sind auch die Ergebnisse einfacher zu deuten, und insbesondere lässt sich das Periodensystem relativ leicht anhand eines Hartree-Fock Schalenbildes diskutieren. Ähnliche Überlegungen können für Festkörper gemacht werden. Das effektive Potential V (r), das in der Theorie der Bandstruktur von Festkörpern auftritt, soll eigentlich auch als selbstkonsistentes Potential im Sinne einer Hartree-Fock-Theorie aufgefasst werden. Auch hier kann nur für die Beiträge vollständig gefüllter Bände gezeigt werden, dass sie strenge Gitterperiodizität besitzen. Die Beiträge teilweise gefüllter Bände brauchen nicht die Symmetrie des Gitterpotentials zu haben (Gegenbeispiel: Für von Leitungselektronen KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 59 verursachten Ferromagnetismus ist das effektive Potential, im Gegensatz zum Gitterpotential, spinabhängig). In ”normalen” Materialien stellt der Ansatz einer Bloch-Form für die Orbitale: φl (x) = eik·r ukn (r)χσ (sz ), mit gitterperiodischem ukn (r), noch eine der harmlosesten Näherungen in einer Bandstrukturrechnung dar. Insbesondere bei genau halbgefüllten Bändern muss man aber auf das Auftreten von Strukturen mit dem inversen Fermi-Wellenvektor (Elektrondichtewellen) gefasst sein. Solche Strukturen in der Elektronendichte führen aber i.a. wieder zu Gitterverzerrungen, womit dann wieder Gitter und Elektronen ”in Gleichschritt” gebracht worden sind. 3.2.2 Beispiel: Das Elektronengas Ein einfaches Beispiel, wofür die Hartree- und Hartree-Fock-Gleichungen exakt gelöst werden können, ist das Elektronengas, d.h. ein Modell, in dem das Potential der lonenrümpfe ersetzt wird durch das Potential einer homogenen über das Kristallvolumen ausgeschmier(+) ten Ladungsverteilung ρ0 = N |e|/V . Die Hartree-Gleichung lautet dann # " Z Z n 0 (+) 2 X |e| ρ e p2 − dx0 0 0 + dx0 φ∗ (x0 )φk (x0 ) φl (x), l φl (x) = 2m |r − r | |r − r0 | k=1 k wobei der Strich bei der Summation bedeutet, dass der Term k = l entfällt. Wir versuchen den Lösungsansatz 1 φkσ (r, sz ) = √ eik·r χσ (sz ), V wobei der Wellenvektor k so gewählt werden soll, dass die periodischen Randbedingungen an den Grenzen des kubisch gewählten Volumens erfüllt sind. Mit dieser Wahl erhält man für die Ladungsdichte im direkten Potential 0 N X0 X N −1 1 (−) ∗ e e= e. φk (r)φk (r) = eρ0 = V V k k=1 Bis auf einen Fehler der Ordnung 10−23 hebt also das direkte Potential das äußere Potential der verschmierten Rumpfladungen genau auf, und man erhält für die Hartree-Energien genau die Werte für freie Teilchen ~2 k2 . 2m Im Grundzustand sind sämtliche k-Werte bis zu einem Wert kF mit jeweils zwei Elektronen (zwei Spinrichtungen) besetzt. kF bestimmt man aus der Beziehung r Z kF Z V V 1 N 3 2 3 k 2 dk dΩ = 2 kF3 = N −→ kF = 3π 2 . 8π 0 π 3 V kσ = KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN Für die mittlere Energie pro Teilchen R 3 ~2 kF2 ~2 k 2 k 2 dk R = = hl i = 2m 5 2m k 2 dk 60 erhält man 3 F , 5 wobei auch F wieder in der Dichte auszudrücken ist. Oft wählt man eine etwas andere Darstellung und drückt kF aus in dem Radius r0 des mittleren Volumens pro Teilchen: r V 4 3 1 4 3 πr0 = −→ kF = mit α0 = = 0,521 . . . . 3 N α0 r0 9π Ein vernünftiger dimensionsloser Parameter ist das Verhältnis rs von r0 zum Bohr’schen Radius a0 = ~2 /(me2 ) = 0,529 Å. Ausgedrückt in diesem Parameter erhält man hl i = 3 me4 1 2,210 = Ry. 2 5 2~2 α0 rs2 rs2 Zwischenbemerkung Der obige Ausdruck ist nicht mit der Energie pro Teilchen im Hartree-Grundzustand identisch. Bei der Berechnung der letzteren Größe geht die Wechselwirkung der Elektronen mit dem Hintergrund voll ein, die Wechselwirkung der Elektronen untereinander aber nur mit dem Faktor 1/2. Die physikalisch interessante Größe ist aber nicht diese Grundzustandsenergie, sondern die Kohäsionsenergie in der auch noch die elektrostatische Energie der Hintergrundladung in Betracht gezogen wird. Letztere ist wieder genau gleich der Wechselwirkungsenergie der Elektronen und die Bilanz stimmt wieder! Man kann dieses Ergebnis auch dadurch erreichen, dass man das Elektronengas so aufbaut, dass man abwechselnd ein Elektron in das Volumen V hineinbringt und den positiven Hintergrund um eine Einheitsladung aufstockt. Weil man so immer Ladungen an fast-neutralen Systemen hinzufügt, braucht man (bis zu Ordnung N −1 ) keine elektrostatische Arbeit zu leisten. 3.2.3 Die Austauschenergie des Elektronengases Es wird sich jetzt herausstellen, dass die ebenen Wellen auch Eigenfunktionen des Austauschterms in der Hartree-Fock Eigenwertgleichung sind. Da die Austauschkräfte nur zwischen Orbitalen gleicher Spins wirken, gilt X 0 1 Z 1 ik·r ~2 k2 1 ik·r 0 0 0 √ e − √ = dr0 ei(k−k )·r W (r − r0 )eik ·r kσ √ e 3 2m V V V |k0 |<kF Z X 0 1 0 0 √ = ... − dr0 ei(k−k )·(r −r) W (r − r0 )eik·r , V3 |k0 |<kF und durch Übergehen auf die Integrationsvariable r0 − r = s erhält man ~2 k2 1 X0 kσ = − G(k − k0 ), 2m V k0 <k F 61 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN wobei G(q) für das Coulombpotential den Wert Z Z e−iq·s 4πe2 −iq·s 2 G(q) = ds e W (s) = e ds = 2 s q annimmt. Substitution dieses Ausdruckes ergibt Z 4πe2 X 0 1 ~2 k2 4πe2 V =− kσ − =− 2m V k0 <k |k − k0 |2 V 8π 3 F 2 Z kF k<kF Z dk0 1 |k − k0 |2 +1 e 1 dµ 2 2π k 02 dk 0 2 02 2π k + k − 2kk 0 µ −1 0 Z e2 kF 0 0 e2 kF2 − k 2 kF + k k + k0 =− =− ln k dk ln + kF . πk 0 |k − k 0 | π 2k kF − k =− Im Punkt k = kF hat die Funktion kσ eine senkrechte Tangente: für k = kF (1 + x) gilt 2 ~2 k2 e2 kF 2 − 1 + x ln + O(x ) . kσ = 2m π |x| ΡHΕL ΕF Ε −1 Weil die Zustandsdichte einen Faktor ∂∂kkσ enthält (die erlaubten k-Werte sind im k-Raum gleichmäßig verteilt), bedeutet dies eine verschwindende Zustandsdichte an der Fermikante, was für die Transporteigenschaften bei niedriger Temperatur und für das thermodynamische Verhalten bedeutsam wäre. Allerdings ist die Einschneidung in der Zustandsdichte sehr schmal (siehe Skizze): um auf einen Bruchteil p−1 der Hintergrundsdichte herunterzukommen, muss man bis auf einen Bruchteil π(p − 1) x = 2 exp − α 0 rs KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 62 an die Fermienergie herangehen. Für rs = 3 und p = 10 ist dies 3 · 10−8 . Auch in der Theorie ist der Effekt sehr delikat; die Einschneidung kann leicht durch Korrelationseffekte (Abschirmung des Coulomb-Potentials) verschmiert werden. Experimentell gibt es, z.B. in Metallen, nicht den geringsten Hinweis auf eine verschwindende Zustandsdichte an der Fermikante. Die mittlere Energie pro Elektron kann im Prinzip durch Summation aller kσ erhalten werden (man braucht einen Faktor 21 weil es sich um eine Wechselwirkungsenergie handelt, siehe S. 57, und einen Faktor 2 für die beiden Spinrichtungen). Eine direkte Rechnung ist aber einfacher 1 4πe2 X 0 1 Eex = − 2 2 V k ,k <k |ki − kj |2 i j F 2 Z 2 V 4πe 1 =− dk dk . 1 2 V 8π 3 |k1 − k2 |2 k1 ,k2 <kF Der Integrand kann umgeschrieben werden als 1 1 1 1 ≡ 2 ≡ 2 . 2 2 2 |k1 − k2 | k1 + k2 − 2k1 k2 µ k1 1 + s − 2sµ Der zweite Faktor kann für s < 1 in den Legendre-Polynomen ausgedrückt werden: " #2 ∞ X X 1 0 L = s P (µ) sL+L PL (µ)PL0 (µ). = L 2 1 + s − 2sµ L L,L0 =0 Das gesamte Integral setzt sich zusammen aus Beiträgen der Bereiche k2 < k1 (s < 1) und k1 < k2 (s > 1), welche aus Symmetriegründen gleich sein müssen. Das erste Teilintegral lässt sich mit Hilfe der obigen Formeln berechnen; für das Gesamtintegral I erhält man so Z I=2 Z 2πk22 dk1 k1 <kF k2 <k1 Z = 8π Z dk2 dk1 k1 <kF 0 Z = 8π k1 <kF k1 dk1 k1 L+L0 ∞ X k2 1 P (µ)PL0 (µ) dk2 dµ 2 L k k 1 1 0 L,L =0 2L+2 ∞ X k2 L=0 X L k1 1 2L + 1 ∞ X 1 1 2 4 = 8π kF . (2L + 1)(2L + 3) (2L + 1)(2L + 3) L=0 Wegen ∞ X ∞ 1 1X 1 1 1 = − = (2L + 1)(2L + 3) 2 L=0 2L + 1 2L + 3 2 L=0 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 63 erhält man letztendlich für die Austauschenergie Eex = − e2 V e2 kF4 V 2 4 4π k = − . F 16π 5 4π 3 Einsetzen der Beziehung zwischen kF und der Dichte liefert für die mittlere Austauschenergie pro Teilchen ex = − 0,916 3e3 =− Ry, 4πα0 r0 rs und für die Kohäsionsenergie pro Teilchen in Hartree-Fock Näherung 2,21 0,916 koh HF = Ry. − rs2 rs Anders als in der Hartree-Näherung erhält man also einen Ausdruck, der wenigstens für genügend großes rs (für Metalle gilt typischerweise 2 < rs < 5) negativ werden kann (Echte metallische Kohäsion würde übrigens erfordern, dass koh die atomare lonisationsenergie übersteigt). Nähere Diskussion des obigen Ergebnisses lohnt sich aber kaum, weil die Hartree-Fock Näherung viel zu grob ist, um realistische Werte für die Kohäsionsenergie zu liefern. Weiters haben wir durch Einsetzen der ebenen Wellen zwar eine Lösung der Hartree-Fock-Gleichungen bestimmt, aber keineswegs gezeigt, dass dies auch die energetisch günstigste Lösung ist. Overhauser konnte zeigen, dass man Lösungen mit niedrigerer Energie erhält durch das Ansetzen von Spindichtewellen; in diesen Lösungen ist die Gesamtladungsdichte konstant, aber es gibt lokal Überschüsse der einen oder anderen Spinrichtung. Dies kostet zwar kinetische Energie, aber die potentielle Energie wird abgesenkt, weil Teilchen gleichen Spins einander aus dem Wege gehen, wie wir gleich im Detail sehen werden. Auch die Overhauser-Lösung liefert aber noch keinen realistischen Wert für die Kohäsionsenergie. 3.2.4 Die Korrelationsfunktion (das Austauschloch) Zum Schluss unserer Diskussion der Hartree-Fock Näherung bestimmen wir noch die Paardichte ρ2 (r, +; r0 , +) für Elektronen gleichen Spins (die - triviale - Struktur für ungleiche Spinrichtungen wurde schon auf S. 56 bestimmt). Aus dem Ausdruck von S. 56 für parallele Spins folgt i 1 Xh 0 0 1 − e−i(k−k )·(r−r ) ρ2 (r, +; r0 , +) = 2 V kk0 Z 2 2 1 N 1 −ik·(r−r0 ) = − dk e 4 V (8π 3 )2 k<kF = 1 4 N V 2 1 − F 2 (kF |r − r0 |) . KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 64 Das Integral in F (y) ist der Formfaktor der Einheitskugel; mit Hilfe der Beziehung V 4π 3 1 kF = N 2 (2π) 3 2 erhält man für F (y) das Ergebnis F (y) = 3 (sin y − y cos y). y3 1 2 Die Funktion F (y) verhält sich für kleine y wie 1− 10 y und hat seinen ersten Nulldurchgang π π π bei y = 4 , d.h. bei r = 4 kF = 4 α0 r0 = 0,409 r0 . Das Loch in der Elektronendichte um jedes Elektron heißt Fermi- oder Austauschloch. In einem ”reellen” Elektronengas gibt es natürlich zusätzliche Effekte aufgrund der Coulomb-Abstoßung, die in der Hartree-Fock Näherung nur äußerst unzureichend berücksichtigt worden sind. 3.2.5 Die Dichtefunktionalmethode Zu einer Verbesserung des Ergebnisses der Hartree-Fock-Methode kann man durch Störungstheorie oder durch Variationsrechnung geraten. In den letzten Jahren hat sich aber ein alternativer Zugang durchgesetzt: die Dichtefunktionalmethode. Ausgangspunkt ist ein bemerkenswertes Theorem von Hohenberg und Kohn: Der Grundzustand der N-TeilchenSchrödingergleichung für ein System von N Elektronen in einem vorgegebenen äußeren Potential V(r) ist im Prinzip durch die Teilchendichte ρ(1) (r) = n(r) eindeutig festgelegt. Der Beweis erfolgt durch ”reductio ad absurdum”: Nehme an, es gäbe zwei Potentiale V1 (r) und V2 (r), die zur selben Dichte im Grundzustand führen. Falls wir die entsprechenden Grundzustände mit Ψ1 (r1 , . . . , rN ) und Ψ2 (r1 , . . . , rN ) bezeichnen, so gilt nach dem Ritzschen Variationsprinzip: E10 = Ψ1 |H1 |Ψ1 < Ψ2 |H1 |Ψ2 Z = Ψ2 |H2 |Ψ2 + dr [V2 (r) − V1 (r)] n(r), wobei das <-Zeichen nur durch ein = ersetzt werden kann, falls V1 (r) und V2 (r) sich nur um eine Konstante unterscheiden. Aus der obigen Ungleichung folgt Z E10 − E20 < dr [V2 (r) − V1 (r)] n(r). Durch Vertauschen der Indizes 1 und 2 erhält man aber Z E20 − E10 < dr [V1 (r) − V2 (r)] n(r), was einen Widerspruch ergibt. Die Annahme, zwei verschiedene V (r) führen zum selben n(r), ist also nicht haltbar. KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 65 Es muss also ein Funktional E0 [n(r)] geben, das die Grundzustandsenergie in der zum Grundzustand gehörenden Dichte n(r) ausdrückt. Das Funktional kann geschrieben werden als Z ZZ 2 0 1 0 e n(r)n(r ) E0 [n] = T [n] + dr V (r)n(r) + + EXC [n], dr dr 2 |r − r0 | wobei T [n] die kinetische Energie und EXC [n] die Austausch- und Korrelationskorrekturen darstellt. Sowohl T [n] als auch EXC [n] sind aber bisher noch unbekannte Funktionale. Der Vorteil des neuen Formalismus ist aber, dass er als Ausgangspunkt für neuartige Näherungen dienen kann. Die lokale-Dichte-Näherung Die einfachste Näherung besteht darin, dass wir die Ergebnisse für das homogene Elektronengas nützen. Für dieses System (Jellium) gibt es recht gute Näherungen für E0J (n), das wegen der Homogenität kein ”echtes” Funktional, sondern lediglich eine Funktion von J n ist, und deshalb auch für EXC (n). Wir ersetzen nun das exakte Funktional EXC [n] durch Z J EXC [n] ' dr EXC (n(r)) , also durch einen gewichteten Mittelwert der Werte für homogenes Jellium. Die nächste Beobachtung ist, dass das Funktional E0 [n] einem Variationsprinzip ähnlich dem Rayleigh-Ritz-Prinzip gehorcht (weil Ψ|H1 |Ψ sein Minimum für Ψ1 annimmt und Ψ1 durch n(r) bestimmt ist). Die Variation von E0 [n] nach n lautet in der lokalen-DichteNäherung: δT δE0 = + V (r) + Φdir (r) + µXC (r) = 0, δn δn wobei Z Φdir (r) = dr0 e2 n(r0 ) ; |r − r0 | µXC (r) = J dEXC (n(r)) . dn Dieses Variationsprinzip ist identisch zu demjenigen für ein Gas aus nichtwechselwirkenden Teilchen im effektiven Potential Vef f (r) = V (r) + Φdir (r) + µXC (r). Für dieses äquivalente System ist der Grundzustand gegeben als eine Slaterdeterminante aus den N niedrigsten Eigenfunktionen der sog. Kohn-Sham-Gleichung: ~2 2 ∇ + Vef f Φ(r) = KS Φ(r); (2.3) − 2m KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 66 diese Gleichung ist, wie die Hartree-Gleichung, bei vorgegebenem n(r) numerisch lösbar. Wie bei der Hartree-Gleichung kann man also iterativ vorgehen: Zuerst löst man (2.3) für eine Versuchsfunktion n0 (r); aus den N niedrigsten Eigenfunktionen konstruiert man dann über die Slater-Determinante ein n1 (r), bestimmt daraus ein neues Vef f (r) und wiederholt das Verfahren, bis man in genügender Näherung Konsistenz erreicht hat. Die Dichtefunktionalmethode in der lokalen-Dichte-Näherung hat zu einem Durchbruch bei der Berechnung der Struktur von Atomen, Molekülen und Festkörpern geführt. Gegenüber einer direkten Lösung der Schrödingergleichung hat sie aber den Nachteil, dass sie nicht systematisch ist (Variationsrechnung: untere Grenze; Störungsrechnung: fester Algorithmus). Seit den ersten Arbeiten von Kohn et a. hat es weitere Entwicklungen gegeben; insbesondere sind Korrekturen zur lokalen-Dichte-Näherung vorgeschlagen worden, in denen auch Ortsabhängigkeiten über die Ableitungen von n(r) mitgenommen werden. Auch diese Varianten bilden aber noch keine voll systematische Theorie. Literatur ∗ Einführend: → Physics Today, December 1998, p 21 ∗ Originalarbeiten: → P. Hohenberg, W. Kohn, Phys. Rev. B 136, 864 (1964) → W. Kohn, L.J. Sham, Phys. Rev. A 140, 1133 (1965) 3.3 Die Elektron-Phononwechselwirkung; Polaronen In diesem Abschnitt werden wir die Elektron-Phonon-Wechselwirkung in einem Festkörper diskutieren. Unser wichtigstes Ziel dabei ist es, die Diskussion der BCS-Theorie der Supraleitung vorzubereiten. Weil in der BCS-Theorie nur die niedrigfrequenten Phononen eine Rolle spielen, und deren Verhalten von Einzelheiten der Gitterstruktur weitgehend unabhängig ist, werden wir uns in der Diskussion der Phononen auf einfache hochsymmetrische Kristalle beschränken, sofern die Diskussion und die Formeln dadurch einfacher werden. 3.3.1 Gitterschwingungen und ihre Quantisierung; Phononen Im vorhergehenden Kapitel wurde skizziert, wie man im Prinzip die elektronische Grundzustandsenergie für ein System von Elektronen in einem vorgegebenen äußeren Potential berechnet, insbesondere im Potential einer vorgegebenen Anordnung von lonenrümpfen. Für eine vorgegebene Zahl von Ionenrümpfen (oder sogar von Kernen) in einem vorgegebenem Volumen wird diese Grundzustandsenergie von der Anordnung der Rümpfe abhängen, und i.a. ihr Minimum für irgendeine periodische Anordnung erreichen, wobei jedes Ion auf KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 67 einem Gitterplatz Rnα sitzt, mit Rnα = Rn + cα = n1 a1 + n2 a2 + n3 a3 + cα ; dabei sind die ai drei Gittervektoren; die ni sind ganze Zahlen mit 0 ≤ ni ≤ Ni ; N1 N2 N3 = N/s, und die Zahl s bezeichnet die Zahl der Plätze, charakterisiert durch die Vektoren cα mit 1 ≤ α ≤ s, innerhalb einer Gitterzelle. Gitterplätze verschiedener cα können mit Ionen verschiedener Art besetzt sein. Wir betrachten im weiteren Konfigurationen des Gitters, in denen jedes Ion sich nahe ”seinem” Gitterpunkt befindet: rnα = Rnα + snα , und betrachten die potentielle Energie nur bis zu quadratischen Termen in den snα : 1 X E ({snα }) = E0 + Φnαi 0 0 snαi sn0 α0 j 2 nn0 αα0 ij n α j mit E0 = E({0}); die Entwicklungskoeffizienten Φnαi n0 α0 j heißen Kraftkonstanten. Zwischen den Kraftkonstanten existieren viele strukturabhängige Symmetriebedingungen. Die wichtigsten sind: a) Symmetrie 0 0 nαj Φnαi n0 α0 j = Φnαi b) Invarianz gegenüber Gittertranslationen: (n−n0 )αi Φnαi n0 α0 j = Φoα0 j (d.h. der Energieaufwand für eine Auslenkung zweier Ionen hängt nur vom Abstand der Gleichgewichtspositionen, nicht aber von deren absoluten Orten ab.) c) Invarianz gegenüber starren Verschiebungen des Gitters X n0 α0 j Φnαi = 0. nα Die Hamiltonfunktion für die Gitterschwingungen kann jetzt geschrieben werden als HG = 1X 1 X mα (ṡnα )2 + Φnαi 0 0 snαi sn0 α0 j . 2 nα 2 nn0 αα0 ij n α j (3.1) Dies ist die aus der Vorlesung Mechanik bekannte Form für kleine Schwingungen um ein Gleichgewicht. Es existieren zeitlich periodische Normalschwingungen vom Typ s(p) nα (t) = √ 1 u(p) e−iωp t mα nα KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 68 −1/2 (p) mit zeitunabhängigen unα . (Der Faktor mα bewirkt, dass die u(p) zu verschiedenen ωp (p) orthogonal zueinander stehen; für die s gilt mit mα gewichtete Orthogonalität; siehe Skriptum Mechanik). Die Eigenwerte ωp folgen aus der Eigenwertgleichung 0 0 (p) ωp2 unαi = X n0 α0 j (p) Dnαi un0 α0 j mit n0 α0 j Dnαi n0 α0 j Φn α j ≡ √ nαi . mα mα0 Wegen der Invarianz bezüglich Gittertranslationen lässt sich dieses (3N ×3N )-Eigenwertproblem in N/s unabhängige (3s × 3s)-Eigenwertprobleme zerlegen mit dem Ansatz r s qβ iq·Rn (p) qβ c e . 1 ≤ β ≤ 3s (3.2) unαi ≡ unαi = N αi Hierdurch reduziert sich die obige Eigenwertgleichung zu " # X X 0 −n)α0 j (n 2 qβ ωqβ cαi = Doαi eiq·(Rn −Rn0 ) cqβ α0 j α0 j ≡ X (3.3) n0 α0 j Dαi (q)cqβ α0 j . α0 j Die N/s Gittervektoren q haben die Gestalt qm = m1 m2 m3 b1 + b2 + b3 ; N1 N2 N3 0 < mi < Ni , (3.4) wobei bi die Basisvektoren des reziproken Gitters sind, charakterisiert durch bi ·aj = 2πδij . Die Lösungen (3.2) mit den q-Vektoren (3.4) erfüllen periodische Randbedingungen für ein Volumen bestehend aus N1 × N2 × N3 Einheitszellen. Die Einschränkung in (3.4) zur sogen. ersten Brillouin-Zone verhindert Doppelzählungen: Man überzeugt sich leicht, dass die Substitution q m → q m + Gp mit Gp = p1 b1 + p2 b2 + p3 b3 mit ganzzahligen pi die Eigenvektoren uqβ nαi unverändert lässt. Normalkoordinaten Wenn wir die Lösungen des Eigenwertproblems (3.3) gemäß X αi ∗ 0 qβ qβ cαi cαi = δββ 0 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 69 normieren, können wir die allgemeinste Lösung der aus (3.1) hergeleiteten Bewegungsgleichungen in der Form r X s qβ iq·Rn cαi e snαi (t) = Qqβ (t) N m α qβ schreiben. Falls wir weiters die cqβ αi so wählen, dass gilt ∗ , c−qβ = cqβ αi αi was aufgrund der Form der Eigenwertgleichung (3.3) erlaubt ist, und weiters die Identität X n 0 ei(q−q )·Rn = N ∆(q − q0 ) s benützen, wobei ∆(q) gleich eins ist für den Nullvektor oder jeden anderen Vektor des reziproken Gitters, und null für alle sonstigen Vektoren, so lässt sich die Hamiltonfunktion HG mittels einer etwas mühsamen Rechnung in 1X 1 X 2 2 HG = Q̇qβ Q̇−qβ + ωqβ Qqβ Q−qβ = Pqβ P−qβ + ωqβ Qqβ Q−qβ , 2 qβ 2 qβ umformen, wobei die Pqβ und Qq0 β 0 die üblichen Poisson-Klammern für Koordinaten und Impulse erfüllen. Die Quantisierung der Gitterschwingungen geschieht mittels der Substitution s ~ † aqβ + a−qβ ; Qqβ = 2ωqβ r ~ωqβ Pqβ = −i a−qβ − a†qβ , 2 wobei die aqβ und a†qβ Erzeuger und Vernichter für Bosonen sind. Die so erhaltenen Boseteilchen heißen Phononen. Die Hamiltonfunktion in diesen Variablen erhält die schon vertraute Form X 1 † ~ωqβ aqβ aqβ + , H= 2 qβ und wir können auch für die Phononen eine Besetzungszahldarstellung einführen. Die Nullpunktsenergie des Phononensystems liefert einen Beitrag zur Grundzustandsenergie und muss als solche neben der elektronischen Grundzustandsenergie beim Vergleich zweier ”konkurrierender” Kristallstrukturen berücksichtigt werden. Dynamisch spielt sie aber keine Rolle. KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 70 Optische und akustische Phononen 2 Aus der Struktur des Eigenwertproblems geht hervor, dass die ωqβ analytische Funktionen qβ von q sind, und dass die cαi analytisch gewählt werden können. Andererseits weiß man, dass es für q = 0 drei Eigenvektoren zu ω = 0 gibt, nämlich die starren Verschiebungen des Gitters. Es müssen sich also unter den 3s Funktionen ωqβ = ωβ (q) mindestens 3 befinden, die für q ↓ 0 nach Null gehen. Andererseits lässt sich zeigen, dass die Anwesenheit von mehr als 3 nach Null strebenden Frequenzen, sowie von ωβ (q), die langsamer als q ansteigen, mit der Stabilität der Kristallstruktur unvereinbar ist. Für Kristalle genügend hoher Symmetrie (z.B. kubische Kristalle) gibt es drei sog. akustische Zweige, einen longitudinalen mit cqβ α k q; ωβ (q) = cl q + O(q 2 ) und zwei entartete transversale mit ωβ (q) = ct q + O(q 2 ), cqβ α ⊥ q; wobei cl und ct die longitudinale, bzw transversale Schallgeschwindigkeit bezeichnen. Wenn wir uns vom Punkt q = 0 entfernen, so geht die strenge Trennung zwischen longitudinalen und transversalen Schwingungen, sowie die Entartung der zwei vorwiegend transversalen Zweige, außer in einigen hochsymmetrischen Richtungen im Kristall, allmählich verloren. Die 3(s − 1) weiteren Phononenzweige werden optische Zweige genannt. 3.3.2 Die Elektron-Phonon-Wechselwirkung Wir betrachten jetzt einen Kristall mit Ein-Elektron-Orbitalen vom Bloch-Typ 1 Φkνσ (x) = √ eikr ukν (r)χσ (sz ), V mit einer gitterperiodischen Funktion ukν (r), und untersuchen den Einfluss einer Auslenkung des Ions n, α. Diese Auslenkung hat einen direkten Einfluss auf das Potential der Ionen das auf die Elektronen am Ort r wirkt; in niedrigster Ordnung gilt V (r) = X nα vα (r − rnα ) = = V0 (r) − XX nαi qβ X nα r Qqβ [vα (r − Rnα ) − snα ∇vα (r − Rnα )] s qβ iqRn ∂ c e vα (r − Rnα ), N mα αi ∂ri wobei V0 (r) das äußere Potential des ungestörten Gitters darstellt. Im Hamiltonoperator für das Fermionfeld erhält man so einen zusätzlichen Term Z Hel-ph = dx ψ † (x) [V (r) − V0 (r)] ψ(x). KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 71 Substitution der Modenentwicklungen für ψ und ψ † liefert X qβ Hel-ph = − aqβ + a†−qβ c†k0 ν 0 σ ckνσ Mkνk 0ν0 kνk0 ν 0 σ qβ mit qβ Mkνk 0ν0 = XZ s ~s iqRn i(k−k0 )r ∗ e . cqβ αi uk0 ν 0 (r)ukν (r)∇i vα (r − Rnα ) × e 2 2N mα ωqβ V dr nαi Als nächstes setzen wir für vα (r − Rnα ) eine Fourierreihe ein. Dies liefert X 0 0 ∇i vα (r − Rnα ) = i e−iq Rn qi0 vαq0 eiq r , q0 wobei wir einen Faktor exp(−iq0 cα ) in vαq0 absorbiert haben. Ausführen der Summation über n liefert einen Faktor NX N 4(q − q0 ) = δq0 , q+Gp ; s s p das r-Integral enthält also außer gitterperiodischen Faktoren nur noch den Exponentialfaktor exp [i(k + q + Gp − k0 )r] , und es verschwindet, wenn nicht k0 = k + q + Gp + Gp0 . Für genügend glatte ukν (r) ist nur der Term mit Gp0 = 0 wichtig, und wir erhalten nach sämtlichen Substitutionen s Z X ~N qβ (q + Gp )cα dr u∗(k+q+Gp )ν 0 (r)ukν (r) Hel-ph = − i 2sm ω α qβ τ kνν 0 αGp qβ vα(q+Gp ) aqβ + a†−qβ c†(k+q+Gq )ν 0 σ ckνσ , wobei das r-Integral über eine Gitterzelle läuft. Der Wechselwirkungsterm beschreibt Prozesse, in denen ein Elektron vom Zustand kνσ in den Zustand (k + q + Gp )ν 0 σ übergeht und dabei ein Phonon mit Quasiimpuls q absorbiert oder ein Phonon mit Quasiimpuls −q emittiert. Ein Übergang ist natürlich nur möglich, wenn der Ausgangszustand besetzt und der Endzustand leer ist. Weil typische Phononenergien klein sind gegenüber der Breite typischer Bänder, spielen für Metalle nicht zu weit vom Gleichgewicht nur Übergänge innerhalb des Bandes, in dem das Fermi-Niveau liegt eine Rolle; wir werden einfachheitshalber annehmen, dass dieses Band nicht entartet ist, und dass die Fermioberfläche nicht zu nahe an die Ränder der Brillouin-Zone kommt, so dass man auch die Umklappprozesse mit KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 72 Gp 6= 0 vernachlässigen kann. Dies hat wieder zur Folge, dass nur longitudinal polarisierte Phononen für die Wechselwirkung eine Rolle spielen. Für Elementkristalle entfällt auch noch die Summation über α und nur der longitudinale akustische Phononzweig trägt bei. Nach allen diesen Vereinfachungen erhält man s Z X ~N † ql ∗ qc vq dr uk+q (r)uk (r) aq + a−q c†k+q,σ ckσ Hel-ph = −i 2mωql τ kqσ X ≡ Mkq aq + a†−q c†k+q,σ ckσ , (3.5) kqσ wobei wir den Index l bei den Phononen-Erzeugern und -Vernichtern weggelassen haben. Für breite Bänder ist auch die k-Abhängigkeit von Mkq , die auf die uk (r) zurückzuführen ist, sehr viel weniger ausgeprägt als die q-Abhängigkeit. Die Wechselwirkung (3.5) beschreibt den Einfluss der Phononen auf die Elektronenniveaus noch nicht vollständig; eine Änderung der Positionen der Ionen bringt eine Umverteilung der Dichte der Elektronen, und damit eine Änderung des selbstkonsistenten Elektron-Elektronpotentials mit sich. Effekte dieser Art führen aber zu Termen derselben Ordnung wie die in (3.5) enthaltenen (bis zur niedrigsten Ordnung in den Phononkoordinaten); lediglich die Interpretation der Mkq ändert sich. Abbremsung von Elektronen durch Phononenemission Unter Einfluss der Elektron-Phonon-Wechselwirkung kann ein Elektron mit Wellenvektor k in ein Elektron mit Wellenvektor k − q und ein longitudinales Phonon mit Wellenvektor q zerfallen. Dabei muss aber Energieerhaltung gelten: k − k−q − ~ωq = 0, was für parabolische Bänder und unter Vernachlässigung der Phonondispersion zu ~ 2kq − q 2 = cl q 2m∗ führt. Der Mindestwert von k, für den diese Gleichung erfüllt sein kann, ist 1 ~kmin = ~q + m∗ cl , 2 oder, weil q beliebig klein gewählt werden kann, ~kmin = m∗ cl . Dies bedeutet, dass nur Elektronen, deren Gruppengeschwindigkeit vg = ~k/m∗ die longitudinale Schallgeschwindigkeit übertrifft, durch Emission von Phononen zerfallen (akustische Cerenkov-Strahlung). KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 73 Virtuelle Phononen, das Polaron In unserer Diskussion der Lamb-Verschiebung haben wir gesehen, dass die Wechselwirkung eines Atoms mit dem zur Folge hat, dass das Atom dauernd zwischen den Strahlungsfeld Zuständen |A; {0} und |B; 1k hin und her pendelt. Auf ähnliche Weise befindet sich ein Elektron mit Wellenvektor k aufgrund der Elektron-Phonon-Wechselwirkung für einen Teil der Zeit in Zuständen |1k−q,σ ; 1q , |1k−q−q0 ,σ ; 1q 1q0 usw., wobei die angegebenen Zustände nicht energetisch mit |1kσ ; {0} entartet zu sein brauchen. Die Phononen können also nicht frei durch den Kristall laufen; sie müssen in der Nähe des Elektrons bleiben, um wieder reabsorbiert zu werden, ”ehe die Verletzung der Energieerhaltung bemerkt werden kann". Das Elektron schleppt also eine Wolke virtueller Phononen mit sich. Die kombinierte Anregung heißt Polaron. Für schwache Elektron-Phonon-Wechselwirkung lässt sich der Aufbau des Polarons mittels Störungsrechnung bestimmen. In niedrigster Ordnung gilt für den Ein Polaron-Zustand |1kσ ; {0} p der Ausdruck |1kσ ; {0} p X = |1kσ ; {0} + q Mkq |1k−q,σ ; 1q . k − k−q − ~ωql Genau wie bei der Lamb-Verschiebung führt die Beimischung von Zuständen mit virtuellen Phononen auch zu einer Verschiebung der Energieniveaus (allerdings hat man wegen der endlichen Zahl der Phononanregungen keinerlei Divergenzschwierigkeiten). Wir werden die Berechnung der Energieverschiebungen aber nicht weiter verfolgen. Elektron-Elektron-Wechselwirkung durch Phononaustausch In untenstehender Skizze wird ein Prozess veranschaulicht, der in zweiter Ordnung in Hel−ph auftritt und der zu einer effektiven Wechselwirkung zwischen den Elektronen führt. Das besondere daran ist, dass diese Wechselwirkung unter Umständen attraktiv sein kann; dies ist für die Erklärung der Supraleitung wesentlich. k+q k' - q k' - q k+q q k' k k' -q k (Nebenbei sei bemerkt, dass in der relativistischen Quantenelektrodynamik die Coulombwechselwirkung zwischen geladenen Teilchen auf völlig analoge Weise als eine Folge des Austausches eines Photons zwischen den Teilchen gedeutet wird.) Die Amplitude für den skizzierten Prozess erhält man genauso wie die Amplitude für die Streuung von Photonen an einem Atom (Kapitel 2.3.5, S. 29). Wenn wir die k-Abhängigkeit von Mkq KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 74 vernachlässigen und die Beziehung M−q = Mq∗ ausnützen, welche aus der Definition von Mkq und der Konvention auf S. 68 über die Polarisationsvektoren cqβ α folgt, so erhalten wir 1 1 2 + c(t) ∼ |Mq | . k0 − k0 −q − ~ωq k − k+q − ~ωq Die hieraus folgende Übergangswahrscheinlichkeit enthält einen Faktor t δ (k0 −q + k+q − k0 − k ); wenn man nur in der Übergangsrate in niedrigster Ordnung interessiert ist, kann man durch Substitution der δ-Funktion den Ausdruck in eckigen Klammern noch etwas umformen: 1 1 [. . . ] = − + ~ωq + (k − k+q ) ~ωq − (k − k+q ) +2~ωq = . (k − k+q )2 − ~2 ωq2 Dieselbe Übergangsamplitude würde man aus einer effektiven Wechselwirkung eff Hel-el 1 X +2 |Mq |2 ~ωq c†k0 −q,σ0 c†k+q,σ ckσ ck0 σ0 = 2 2 2 2 kk0 qσσ0 (k+q − k ) − ~ ωq erhalten. (Die Reihenfolge der Fermionoperatoren ist äquivalent mit den in dem Störungsausdruck zweiter Ordnung in den Amplituden auftretenden Reihenfolgen c†k+q,σ ckσ c†k0 −q,σ0 ck0 σ0 bzw c†k0 −q,σ0 ck0 σ0 c†k+q,σ ckσ ; der Faktor 21 tritt auf, weil der Übergang von q nach −q dasselbe bewirkt wie die Vertauschung der zwei Diagramme in der Skizze auf S. 73). Die obige Herleitung der effektiven Wechselwirkung kann auch etwas vornehmer durchgeführt werden, indem man die Erzeuger und Vernichter für die Elektronen zugunsten derjenigen für die Polaronen eliminiert. Dies kann mit Hilfe einer kanonischen Transformation geschehen, siehe Madelung, Festkörpertheorie II, §81; das Ergebnis ist aber dasselbe. Ein Vergleich mit der Fourierdarstellung des Ausdrucks (1.3) auf S. 52 ergibt, dass die oben hergeleitete Wechselwirkung repulsiv ist für |k+q − k | > ~ωq und attrativ für |k+q − k | < ~ωq . 3.4 Die BCS-Theorie der Supraleitung In diesem Abschnitt werden wir zeigen, dass die Elektron-Phonon-Wechselwirkung dazu führen kann, dass der Grundzustand des Elektronensystems sich radikal ändert. Wir werden dabei vom Hamiltonoperator X † 1 X Vkk0 q c†k0 −q,σ0 c†k+q,σ ckσ ck0 σ0 H= k ckσ ckσ + 2 kk0 σσ0 q kσ KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 75 ausgehen. Dabei haben wir vernachlässigt, dass die k nicht wirklich Ein-Teilchen-Energien sind. Dieser Fehler ist nicht sehr bedeutsam, solange wir nur Zustände betrachten, in denen nur eine kleine Zahl von Elektronen angeregt sind. Cooper-Paare Cooper betrachtete für den obigen Hamiltonoperator den Fall, dass alle Niveaus bis zum Fermi-Niveau besetzt sind, und dass zwei zusätzliche Elektronen in das System hineingebracht werden. Er suchte jetzt den niedrigsten Zustand für diese Zusatzelektronen; falls die Wechselwirkung zwischen den Elektronen vorwiegend attraktiv ist, kann man gebundene Zustände erwarten; insbesondere erwartet man den niedrigsten Wert für die Energie für einen verschwindenden Gesamtimpuls des Paares, und für antiparallele Spins (für die das Pauliverbot die Elektronen nicht daran hindert, das attraktive Potential auszunützen). Wir wählen also für den Zwei-Teilchen-Zustand den Ansatz X |ψ = α(k)c†k↑ c†−k↓ |0HF . |k|>kF Für die Energie dieses Zustandes erhält man E − E0,HF = 2 X k>kF k |α(k)|2 + 1X (Vk,−k,q + V−k,k,−q ) α∗ (k + q)α(k). 2 k,q Dieser Ausdruck muss unter der Nebenbedingung führt zu den Euler-Lagrange-Gleichungen 2k α(k) + P k |α(k)|2 = 1 minimiert werden. Dies 1X (Vk−q,−k+q,q + V−k+q,k−q,−q ) α(k − q) − λα(k) = 0. 2 q (4.1) (Bei der Ableitung des Potentialterms nach α∗ (k) muss eine Variablentransformation k ⇒ k − q durchgeführt werden.) Durch Multiplikation der oberen Gleichung mit α∗ (k) und Summation über k erhält man für λ die Interpretation λ = E − E0,HF . Um einen Eindruck der möglichen Lösungen von (4.1) zu erhalten, führen wir eine zuerst von Bardeen vorgeschlagene vereinfachte Form für die Wechselwirkung V ein. Wir wissen schon, dass der von Phononen vermittelte Teil von V attraktiv ist für |k+q − k | < ~ωq . Bardeen schlug als Näherung vor ( −W für |k − F | und |k+q − F | < ~ω0 ; Vk,−k,q = 0 für sonstige Werte von k und q. KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 76 Dabei ist ω0 eine typische Frequenz von der Größe der Debye-Frequenz. Mit dieser vereinfachten Wechselwirkung erhält man für die obige Gleichung X (2k − λ)α(k) = W α(k0 ) für F < k < F + ~ω0 ; F <k0 <F +~ω0 sonst. α(k) = 0 Diese Gleichung ist exakt lösbar, weil die Summe nicht mehr von k abhängt und durch eine Konstante A ersetzt werden kann. Die Lösung ist α(k) = AW 2k − λ für F < k < F + ~ω0 , und der Eigenwert λ folgt aus der Konsistenzbedingung A= X X α(k) = F <k <F +~ω0 k AW . 2k − λ Weil ~ω0 F können wir bei der Umformung der Summe über k in ein Integral über die Zustandsdichte im gesamten Integrationsintervall gleich der Zustandsdichte an der Fermienergie g(F ) setzen, und erhalten Z ~ω0 d 1 = g(F ) 0 W 2 − (λ − 2F ) mit der Lösung 1 W g(F ) ln 2 2~ω0 − (λ − 2F ) −(λ − 2F ) = 1, was für kleine Werte von W g(F ) geschrieben werden kann als −(λ − 2F ) = 2~ω0 e−2/W g(F ) . Wir haben also wirklich einen gebundenen Zustand der zwei Zusatzelektronen gefunden. Dies bedeutet aber zugleich eine Instabilität des Hartree-Fock-Grundzustands: auch für die schon anwesenden Elektronen in den oberen Niveaus ist es energetisch vorteilhaft, sich aus den Ebenen-Wellen-Zuständen zu entfernen und Cooper-Paare zu bilden. Diese können dann aber bei genügend hoher Dichte der Paare nicht länger als unabhängig betrachtet werden, und wir brauchen einen neuen Ansatz für die GrundzustandsWellenfunktion. Der neue Ansatz kann nicht mit Störungstheorie erhalten werden. Der Ausdruck für die Bindungsenergie eines Cooper-Paares enthält W −1 im Exponenten; er ist also nichtanalytisch in der Kopplungskonstanten W . Störungstheorie dagegen liefert immer Ausdrücke, die analytische Funktionen der Kopplungskonstante sind. 77 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN Ehe wir dieses Problem näher betrachten, werden wir noch zeigen, dass die BardeenWechselwirkung keine Triplett-Paare vom Typ X |ψ t = β(k)c†k↑ c†−k↑ |0HF |k|>kF zulässt. Wegen c†k↑ c†−k↑ |0HF = −c†−k↑ c†k↑ |0HF trägt nur der in k antisymmetrische Teil von β(k) zum Zustand |ψ β(−k) = −β(k) setzen. Dann verschwindet aber die Größe X B≡ β(k), t bei und wir können k und die Integralgleichung für λ − 2F hat nur die triviale Lösung λ = 2F mit β(k) = 0. Für allgemeinere Formen der Wechselwirkung sind aber Triplett-Paare durchaus möglich; für den suprafluiden Grundzustand von 3 He treten sie in gewissen Parameterbereichen auf und auch für Supraleiter gibt es diesbezügliche Spekulationen. Triplett-Paare würden insbesondere die Koexistenz von Supraleitung und Ferromagnetismus ermöglichen, wofür es allerdings im Experiment keinerlei Hinweise gibt. Der BCS-Grundzustand Wir versuchen jetzt einen alternativen Grundzustand zu konstruieren, in dem die attraktive Wechselwirkung so gut wie möglich ausgenützt wird. In einem System aus vielen Fermionen tritt dabei eine Komplikation auf: sogar für positives W haben die Matrixelemente der Wechselwirkung zwischen den Komponenten eines Zustandes X |ψ t = γ ({nkσ }) |{nkσ } (4.2) {nkσ } scheinbar regellos verteilte Vorzeichen aufgrund der auf S.49 eingeführten Jordan-WignerPhasen. Die von Bardeen, Cooper und Schrieffer vorgeschlagene Lösung für dieses Problem ist: 1 Nummeriere die Zustände so, dass die Orbitale für k und −k immer in der Reihenfolge k ↑; −k ↓; −k ↑; k ↓ vorkommen. 2 Lasse in der Superposition (4.2) nur solche {nkσ } zu, in denen die Orbitale k ↑ und −k ↓ entweder beide besetzt oder beide leer sind; wähle weiters alle γ ({nkσ }) reell und positiv. (Eine andere Nummerierung der Orbitale führt zu einer sehr komplizierten Wahl für die Vorzeichen der γ ({nkσ }).) KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 78 Hierdurch hat man erreicht, dass wenigstens alle Beiträge zum Erwartungswert des reduzierten Wechselwirkungsoperators I Hred = −W 0 X c†k↑ c†−k↓ c−k0 ↓ ck0 ↑ k,k0 positiv sind. (Der Faktor 21 ist verschwunden, weil wir alle Terme so umgeordnet haben, dass der erste Erzeuger mit dem Spin ↑ vorkommt.) Der Strich beschränkt die Summation auf ein Band der Breite 2~ω0 um F . Der zweite von BCS angewandte Trick ist, dass sie sich im Zustand (4.2) nicht P beschränken auf Komponenten mit einer vorgegebenen Gesamtteilchenzahl N = kσ nkσ . Diese Erweiterung des Raumes der erlaubten Zustände wird es, wie in der großkanonischen Gesamtheit der statistischen Physik, erlauben, die Besetzungswahrscheinlichkeiten für die Paare (k ↑, −k ↓) unabhängig voneinander zu wählen. Weiters führt es zu nichtverschwindenden Erwartungswerten der Erzeuger und Vernichter für Paare ψ|c−k↓ ck↑ |ψ = ψ|c†k↓ c†−k↑ |ψ = D(k). Die obigen Überlegungen dienten lediglich als Motivation für die nachfolgende formale Vorgangsweise: I Führe einen reduzierten Hamiltonoperator ein für die Orbitale F − ~ω0 < k < F + ~ω0 . (Die niedrigeren Orbitale sind alle besetzt; die höheren alle leer.) Wir verwenden weiters die Konvention, dass der Index k für k ↑ steht und der Index −k für −k ↓. Schließlich nehmen wir nur den oben angegebenen reduzierten Wechselwirkungsoperator mit: 0 0 X X † † Hred = k ck ck + c−k c−k − W c†k c†−k c−k0 ck0 . k,k0 k Wir rechnen weiters die k immer relativ zum Ferminiveau. Aus diesem Hamiltonoperator folgen die Bewegungsgleichungen i~ċk = k ck − i~ċ†−k = W c†−k −k c†−k 0 X c−k0 ck0 k0 − W ck X c†k0 c†−k0 k0 II Ersetze in diesen Bewegungsgleichungen die Summen durch ihre Erwartungswerte im gesuchten Grundzustand 0 X k 0 X k 0 0 X X c−k ck → c−k ck ≡ D(k) ≡ 4/W c†k c†−k → k 0 X k † † ck c−k ≡ k 0 X k D∗ (k) ≡ 4∗ /W. KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 79 Mit Hilfe dieser Variante des Hartree-Fock-Ansatzes erhält man aus dem obigen System die linearen, bezüglich k entkoppelten, Gleichungen (wir wählen 4 weiters reell) i~ċk = k ck − 4c†−k ; i~ċ†−k = −k c†−k − 4ck . Diese Gleichungen haben Operator-Lösungen vom Typ 1 1 αk = uk ck − vk c†−k ≡ cos θk ck − sin θk c†−k 2 2 1 1 † α−k = uk c†−k + vk ck ≡ cos θk c†−k + sin θk ck , 2 2 die von der Zeit abhängen gemäß αk (t) = αk (0)e−iλk t/~ (4.3) † † (0)e+iλk t/~ , (t) = α−k α−k wobei λk aus der Eigenwertgleichung λk − k 4 = λ2k − 2k − 42 = 0 4 λk + k folgt; die positive Wurzel ist also q λk = 2k + 42 . Die in (4.3) gewählte Normierung bewirkt, dass die αk und αk† die für Fermion-Erzeuger und -Vernichter charakteristischen Antikommutatoren besitzen: n o 1 1 † 2 2 2 2 αk , αk = uk + vk = sin θk + cos θk = 1; 2 2 {αk , α−k } = uk vk − vk uk = 0, usw. Die uk und vk bestimmt man durch Substitution in die Eigenwertgleichung: oder: bzw.: λk uk = k uk + 4vk λ2k u2k = 2k + 42 u2k = 2k u2k + 42 vk2 + 2k 4uk vk 42 u2k − vk2 = 2k 4uk vk . Einsetzen der trigonometrischen Darstellung liefert 4 4 cos θk = k sin θk ⇒ tan θk = , k oder auch " # 1 1 k 1 k 2 uk = (1 + cos θk ) = 1+ p 2 = 1+ 2 2 2 λk k + 42 1 1 k vk2 = (1 − cos θk ) = 1− , 2 2 λk (4.4) woraus klar hervorgeht, dass beim Übergang k → −k auch die uk und vk ihren Wert austauschen; die physikalische Bedeutung dieses Faktums wird gleich erläutert werden. KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 80 Die explizite Form des Grundzustandes Weil die αk die Energie eines Zustandes um λk erniedrigen, muss der Grundzustand des Systems von allen αk vernichtet werden. Diese Bedingung wird erfüllt vom Zustand |ψBCS ∼ = 0 Y k α−k αk |{0} , wie aus der Antivertauschung der {αk } und aus αk0 αk0 = 0 hervorgeht. Mit Hilfe der Ausdrücke (4.3) lässt sich dies umschreiben zu " 0 # Y (−vk ) uk + vk c†k c†−k |{0} , k wobei Terme mit einem auf |{0} wirkenden Vernichter weggelassen wurden. Der korrekt normierte Zustand ist " 0 # Y † † |ψBCS = uk + vk ck c−k |{0} , k wie aus 0 Y ψBCS |ψBCS = u2k + vk2 = 1 k sofort hervorgeht. Der Zustand |ψBCS kann auch aufgefasst werden als ein kohärenter Zustand für Cooperpaare mit dem Paarerzeuger † A ∼ 0 X k 1 tan θk c†k c†−k , 2 (weil kein Paar mehrfach besetzt werden kann, bleiben von exp αA† |{0} genau die in |ψBCS auftretenden Terme übrig; wir werden die korrekte Normierung von A† hier nicht explizit bestimmen). Ehe wir unsere Rechnung weiter verfolgen, und insbesondere den noch immer nicht festgelegten Parameter 4 selbstkonsistent bestimmen, müssen wir noch eine weitere Konsistenzbedingung kontrollieren: Damit der Zustand |ψBCS mit |0HF verglichen werden kann, muss er zumindest im Mittel die gleiche Teilchenzahl N/2 aufweisen. Um den P Erwartungswert von 0k c†k ck + c†−k c−k zu bestimmen, müssen die ck und c†k zuerst in den αk und αk† ausgedrückt werden. Aus den Beziehungen (4.3) schließt man sofort † ck = uk αk + vk α−k ; c−k = uk α−k − vk αk† , KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 81 woraus folgt † |ψBCS = vk2 . ψBCS |c†k ck |ψBCS = vk2 ψBCS |α−k α−k Weil die vk2 für k-Werte mit entgegengesetzten k sich zu eins summieren, erhält man in der Tat im Mittel den Wert 21 für den obigen Erwartungswert, vorausgesetzt, dass die Niveaudichte im betrachteten Energiebereich eine Konstante ist. (Für nichtkonstantes g() hätte man den Nullpunkt der Energieskala nicht in die Mitte des betrachteten Energiebereichs legen dürfen; wegen der vielen Näherungen, die ohnehin schon gemacht worden sind, lohnt sich die Diskussion solcher Feinheiten aber hier kaum mehr.) Die Bestimmung des Parameters 4 Ähnlich wie oben bestimmen wir jetzt † D(k) = ψBCS |c−k ck |ψBCS = uk vk ψBCS |α−k α−k |ψBCS = uk vk ; für 4 erhält man so die Konsistenzbedingung 4=W 0 X k 0 0 1 X 4 1 X p sin θk = W . D(k) = W 2 + 2 2 2 4 k k k Dies führt zu der Bestimmungsgleichung Z +~ω0 d 1 ~ω0 p 1 = W g(F ) = W g(F ) arsinh 2 4 42 + 2 −~ω0 mit der Lösung ~ω0 ≈ 2~ω0 e−1/W g(F ) , 1 sinh g(F )W 4= was bis auf den Faktor 2 im Exponenten mit dem Ausdruck für die Bindungsenergie eines Cooperpaares übereinstimmt; genaue Übereinstimmung wäre ohnehin nicht zu erwarten, weil der Zustand |ψBCS einen ganz anderen ”Hintergrund” für die Cooperpaare bildet als der Zustand |0HF . Bestimmung der Grundzustandsenergie Als letztes müssen wir noch verifizieren, dass der Zustand |ψBCS auch wirklich einen niedrigeren Erwartungswert der Energie hat als der Zustand |0HF . Dazu berechnen wir ψBCS |Hred |ψBCS = 0 0 X X † † c†k c†−k c−k0 ck0 |ψBCS = k ψBCS |ck ck + c−k c−k |ψBCS − W ψBCS | kk0 k =2 0 X k k vk2 −W 0 X kk0 uk vk u v = 2 k0 k0 0 X k k vk2 42 − , W (4.5) KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 82 wobei die obigen Zwischenergebnisse aus der Bestimmung von 4 und der mittleren Teilchenzahl benützt wurden. Der obige Ausdruck muss verglichen werden mit E0,HF = X k <0 2k = − 0 X k |k | . Für den ersten Term in (4.5) erhält man mit Hilfe des Ausdrucks für vk2 auf S. 79 2 0 X k vk2 = 0 X k k k k 1− λk = −g(F ) Z +~ω0 d p −~ω0 2 2 + 42 , weil der Mittelwert von k verschwindet. Für den Energieunterschied Eg = EBCS − E0,HF findet man Eg = 2g(F ) Z ( ~ω0 d − p 0 2 ) 2 + 42 − 42 . W Auswerten des Integrals und Einsetzen der obigen Beziehung zwischen 4 und W liefert letztendlich s ) ( 2 4 2g(F )~2 ω 2 1 − g(F )42 . Eg = g(F )~2 ω02 1 − 1 + 2 2 = − 2/g( )W 0 ∼ = F ~ ω0 e −1 2 Das Ergebnis ist also für alle Werte von W negativ! Nach der hier behandelten einfachen Theorie wird ein Metall also immer supraleitend, wenn für ein noch so kleines Energiegebiet die attraktive, von Phononen vermittelte, Wechselwirkung zwischen den Elektronen größer ist als die Coulombabstoßung. Angeregte Zustände; die Energielücke Die niedrigsten angeregten Zustände erhält man durch Anwendung der Erzeuger αk† für Quasiteilchen auf den Grundzustand |ψBCS . Der so erhaltene Zustand ist 00 Y αk† |ψBCS = uk c†k − vk c−k uk + vk c†k c†−k uk0 + vk0 c†k0 c†−k0 |{0} k0 = c†k 00 Y k0 uk0 + vk0 c†k0 c†−k0 |{0} , Q wobei das Symbol 00k0 ein Produkt über alle k0 6= k im betrachteten Band von Energiewerten bezeichnet. Die Energie des so erhaltenen Zustands liegt um λk oberhalb der KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 83 Grundzustandsenergie. Allerdings lässt sich der obige Zustand nicht über einen physikalischen Mechanismus anregen; jede Störung ist bilinear in den ck und c†k , und deshalb auch in den αk und αk† . Die tatsächlich anregbaren Zustände haben die Form αk† αk† 0 |ψBCS = c†k c†k0 000 Y vk00 c†k00 c†−k00 uk00 + k00 |{0} mit der Zusatzenergie λk + λk0 , bzw. † |ψBCS αk† α−k = uk c†k c†k − vk 00 Y u +v k0 k0 c†k0 c†−k0 k0 |{0} mit der Zusatzenergie 2λk . Die obige Rechnung überzeugt noch nicht ganz; eigentlich sollten wir nur Zustände mit derselben mittleren Teilchenzahl vergleichen. Dies lässt sich durch eine geringfügige Änderung der uk0 und vk0 , die einer Verschiebung des Referenzniveaus für die Energie der Ordnung N −1 entspricht, erreichen. (Vgl. die Änderung des chemischen Potentials mit der Temperatur für das ideale Fermigas im Skriptum Thermodynamik und Statistische Physik.) Es lässt sich zeigen, dass diese Korrektur nur zu Modifikationen der Ordnung N −1 in den Anregungsenergien führt. Wir haben also gesehen, dass Anregungen mit Energien kleiner als 24 nicht möglich sind. Diese so genannte Energielücke ist experimentell gut bestätigt, und sie ist wesentlich für das Verständnis der elektromagnetischen Eigenschaften des Supraleiters. Elektromagnetische Eigenschaften von Supraleitern Von den Brüdern F. und H. London wurden schon 1935 zur Beschreibung des elektromagnetischen Verhaltens von Supraleitern für T TC die Gleichungen E= ∂ (ΛJs ) ∂t B = −c ∇×(ΛJs ) (4.6) vorgeschlagen. Dabei bezeichnet Js den Strom und Λ ist eine Konstante, die wegen ∇×E + 1 ∂B =0 c ∂t in beiden Gleichungen gleich gewählt werden soll. Die erste der Gleichungen (4.6) besagt, dass der Strom ohne Dissipation fließt. Feld und Strom haben immer einen Phasenunterschied von 90◦ . Aus der zweiten Gleichung schließt man mit Hilfe der vierten Maxwellgleichung ∇×B = 4π Js c ⇒ ∇2 B = 4πB B ≡ 2; 2 Λc λL Diese Gleichung besagt, dass das B-Feld im Inneren des Supraleiters auf einer Längenskala λL abklingen muss (der Meißner-Ochsenfeld-Effekt). Weil λL experimentell die Größenordnung µm hat, heißt dies, dass ein Magnetfeld in einen Supraleiter kaum eindringen kann. KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 84 Andererseits kostet das Austreiben des Feldes (Kompression der Feldlinien) Energie, und es wird ersichtlich, dass genügend hohe Magnetfelder die Supraleitung zerstören. Für rein transversale Felder (und in der Coulomb-Eichung) lassen sich die Gleichungen (4.6) zusammenfassen zu Js (r) = − 1 A(r). Λc (4.7) Letztere Gleichung werden wir jetzt zum Schluss unseres Kapitels über Supraleitung aus der BCS-Theorie herleiten. Mikroskopische Herleitung der London-Gleichung Wir werden die London-Gleichung für langwellige stationäre transversale Felder herleiten A(r) = Aq eiqr ; qAq = 0. Die elektrische Stromdichte wird im Formalismus der quantisierten Felder dargestellt von dem Operator X e~ Js (r) = ψ † (r, σ)∇ψ(r, σ) − ψ(r, σ)∇ψ † (r, σ) 2mi σ 2 X e − ψ † (r, σ)A(r)ψ(r, σ) = JP (r) + JD (r), mc σ wobei die Operatoren JP und JD als paramagnetische bzw. diamagnetische Stromdichte bezeichnet werden. Die obige Form für den Stromdichteoperator folgt direkt aus dem Operator e e~ e2 e p− A = ∇− A j = ev = m c im mc der normalen Ein-Teilchen-Quantenmechanik. Durch Einsetzen der Modenentwicklungen für ψ und ψ † können wir JP und JD in den ckσ und c†kσ ausdrücken. Wir werden dabei die Blochfunktionen uk (r) durch eins ersetzen; durch diese Prozedur erhält man über die Einheitszelle gemittelte Stromdichten (das Überlappintegral der verschiedenen auftretenden uk (r) geht nach eins im Limes q → 0). Die so erhaltenen Ausdrücke sind JP (r) = e~ X † 0 ck+q0 ,σ ckσ e−iq r (2k + q0 ) ; 2mV kq0 σ JD (r) = − e2 X † 0 ck+q0 ,σ ckσ e−iq r A(r). mcV kq0 σ Die makroskopisch relevanten Größen sind die Erwartungswerte dieser Operatoren im (durch das äußere Feld möglicherweise geänderten) Vielteilchenzustand des Systems, ins besondere bei T = 0, wo das ungestörte System im Zustand |ψBCS ist. KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 85 Die diamagnetische Stromdichte ist selbst linear im äußeren Feld; zurBerechnung der im Feld linearen Antwort reicht es also aus, den Erwartungswert im |ψBCS zu bilden. Dies impliziert, dass nur Terme mit q0 = 0 in der Summe überleben, wie man durch Zerlegen † der c†kσ und ckσ nach den α±k und α±k leicht sieht. Das Ergebnis ist X † e2 Ns e2 A(r) ψBCS | A(r), jD (r) = ψBCS |JD |ψBCS = − ckσ ckσ |ψBCS = − mcV mcV kσ wobei Ns die Zahl der in Cooper-Paaren gebundenen Elektronen ist, also die Zahl der Niveaus zwischen F − ~ω0 und F . Die diamagnetische Stromdichte allein hat also genau die für die London-Gleichung erforderliche Form, wobei noch gilt Λ= m ns e2 oder λ2L = mc2 , 4πns e2 mit ns = NVs die Dichte der an der Supraleitung beteiligten Elektronen. Zur Berechnung der paramagnetischen Stromdichte brauchen wir zuerst die Änderung des Grundzustandes durch die Störung Z XZ e e~ X 0 † dr ψ (r) A(r)p ψ(r) = − dr c†k+q0 ,σ ckσ A(r)k e−iq r , H1 = − mc mcV kq0 σ σ wobei wir wieder die uk0 (r) durch eins ersetzt haben. Einsetzen der speziellen Form von A(r) ergibt H1 = − e~ X † c ckσ kAq . mc kσ k+q,σ (4.8) Weil dieser Störterm nicht auf die Spins wirkt, können nur Paare von Quasiteilchen mit entgegengesetzten Spins angeregt werden. (Der Operator αk† erhöht den Spin um ~/2, † während α−k ihn um ~/2 erniedrigt.) Der gestörte Zustand hat also die Form X † 2 |ψA = |ψBCS + e f (k0 )αk† 0 +q α−k 0 |ψBCS + O(e ), k0 und die stationäre Störungsrechnung ergibt für die Koeffizienten f (k) = 1 ψBCS |α−k αk+q H1 |ψBCS . e (λk + λk+q ) Zum Matrixelement tragen zwei Terme in (4.8) bei: † † c†k+q,↑ ck↑ |ψBCS = uk+q vk αk+q α−k |ψBCS und † † c†−k,↓ c−k−q,↓ |ψBCS = uk vk+q αk+q α−k |ψBCS , KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 86 wobei die Beziehungen u−k0 = uk0 ; v−k0 = −vk0 benützt wurden. Einsetzen dieser Beziehungen liefert f (k) = ~ [kAq uk+q vk − (k + q)Aq uk vk+q ] , mc (λk + λk+q ) was sich wegen qAq = 0 reduziert zu f (k) = ~kAq ~kAq 1 [uk+q vk − uk vk+q ] = sin (θk − θk+q ) . (4.9) mc (λk + λk+q ) mc (λk + λk+q ) 2 Für q → 0 geht also der Zähler des Ausdrucks für f (k) nach Null, während der Nenner endlich bleibt. Dies bedeutet aber, dass sämtliche f (k) für q → 0 verschwinden, und damit der Erwartungswert der paramagnetischen Stromdichte. (Der Erwartungswert von JP (r) in |ψBCS verschwindet, wie man leicht zeigt.) Damit ist gezeigt worden, dass der einzige Beitrag zur von einem Feld induzierten Stromdichte der diamagnetische Beitrag ist, der die Londongleichung erfüllt. Auf ähnliche Weise zeigt man, dass der B~σ -Term, der zu H1 noch hätte addiert werden müssen, und der in normalen Metallen zur paramagnetischen Antwort beiträgt, auch keine Paare von Quasiteilchen im Limes q → 0 anregen kann. In normalen Metallen gibt es elementare Anregungen mit beliebig niedriger Energie. Die zu f (k) analogen Ausdrücke verschwinden dann im Limes q → 0 nicht, weil sowohl Zähler als auch Nenner des betreffenden Ausdrucks verschwinden, und deren Quotient endlich bleibt. Man findet typischerweise, dass die paramagnetische Stromdichte die diamagnetische weitgehend kompensiert, und es bleiben nur kleine Nettoeffekte übrig. Zum Schluss dieser Ausführungen soll noch betont werden, dass sämtliche in diesem Abschnitt erhaltenen Ergebnisse auch in einer eichinvarianten Weise erhalten werden können. Das Verhalten der ganzen Theorie unter Eichtransformationen ist aber recht kompliziert, weil die Feldoperatoren, und damit auch die Größen D(k) auf S. 78 ortsabhängige Phasenfaktoren erhalten, und damit auch |ψBCS selbst keine eichinvariante Größe ist. Für eine Diskussion siehe z.B. G. Rickayzen, Theory of Superconductivity, §6.4, oder Kittel, S. 172-177. Kapitel 4 Die Dirac-Gleichung 4.1 Die ”Herleitung” der Dirac-Gleichung Die von Dirac vorgeschlagene relativistische Wellengleichung für das Elektron kann natürlich genausowenig ”hergeleitet” werden wie irgendeine andere fundamentale Gleichung in der Physik (Newton-, Maxwell- oder Schrödingergleichung). Man kann höchstens versuchen, die postulierte Gleichung plausibel zu machen. Dabei werden wir in dieser Vorlesung nicht den ursprünglich von Dirac gewählten Zugang nehmen, sondern eine von Feynman propagierte Alternative, die auch im Buch von Sakurai verwendet wird. Als Einführung betrachten wir zunächst eine zuerst von van der Waerden vorgeschlagene, alternative Form der nichtrelativistischen Schrödingergleichung für ein Teilchen mit Spin 21 . Ein übliches Argument zur Begründung der Schrödingergleichung geht aus von der Beziehung E= p2 + V (r) 2m und führt die Substitution E → i~ ∂ ∂t p → −i~∇ durch. Dies führt zur Schrödingergleichung ~2 2 ∂ ∇ + V (r) ψ. i~ ψ = Hψ = − ∂t 2m Für ein Teilchen mit Spin 1 2 gibt es aber die äquivalente Darstellung (~σ p)(~σ p) p2 = , 2m 2m die mittels der Identität (~σ A) (~σ B) = AB + i~σ (A × B) 87 KAPITEL 4. DIE DIRAC-GLEICHUNG 88 leicht zu überprüfen ist. Aus der obigen Identität geht aber auch hervor, dass die Äquivalenz verloren geht nach der Substitution p e → p − A(r); c die zweite Alternative führt dann zu 1 e e ~σ p − A ~σ p − A + V (r) 2m c c 1 i h e e i e 2 = p− A + ~σ p − A × p − A + V (r), 2m c 2m c c was mittels der Identität p × A + A × p = −i~( ∇×A) in der Form i2 1 h e e~ p − A(r) − ~σ B(r) + V (r) 2m c 2mc (1.1) geschrieben werden kann. Der Zusatzterm − e~ e ~σ B = − SB, 2mc mc der in der üblichen Behandlung ”von Hand” eingesetzt werden muss, wird also in der Formulierung von van der Waerden und Feynman automatisch mitgeliefert, inklusive des Wertes 2 für das gyromagnetische Verhältnis des Elektrons. Der Hamiltonoperator (1.1) wirkt selbstverständlich auf eine zweikomponentige Wellenfunktion des Elektrons. Die freie Dirac-Gleichung Ganz analog zum Vorhergehenden kann man für die relativistische Energie-Impuls-Beziehung eines freien Teilchens mit Spin 12 schreiben 2 E E E 2 −p = − ~σ p + ~σ p = m2 c2 . c c c Dies führt zu einer Wellengleichung für eine zweikomponentige Wellenfunktion ψ der Form i~ ∂ i~ ∂ + i~~σ ∇ − i~~σ ∇ ψ = (mc)2 ψ. c ∂t c ∂t Im Gegensatz zur nichtrelativistischen Schrödingergleichung ist dies eine Differentialgleichung zweiter Ordnung bezüglich der Zeit. Eine Reduktion auf Differentialgleichungen KAPITEL 4. DIE DIRAC-GLEICHUNG 89 erster Ordnung ist aber ohne weiteres möglich durch Verdopplung der Zahl der Variablen: Falls wir definieren ψ (L) ≡ ψ ψ (R) ≡ i~ (∂0 − ~σ ∇) ψ mc mit ∂0 ≡ 1∂ , c ∂t so gehorcht das Paar zweikomponentiger Wellenfunktionen ψ (R) , ψ (L) dem Gleichungssystem i~ [∂0 − ~σ ∇] ψ (L) = mcψ (R) ; (1.2) i~ [∂0 + ~σ ∇] ψ (R) = mcψ (L) . Für masselose Spin- 21 -Teilchen (Neutrinos) erweist sich die Variablenverdopplung als überflüssig; solche Teilchen können durch zweikomponentige Wellenfunktionen dargestellt werden, die einer Differentialgleichung erster Ordnung gehorchen. Es sind im Prinzip zwei Arten von Neutrinos denkbar: Solche vom Typ ψ (L) , für die Spin und Impuls immer antiparallel stehen, und solche vom Typ ψ (R) , für die Spin und Impuls immer parallel stehen. In der Natur kommen nur ”linkshändige” Neutrinos vom Typ ψ (L) vor (genauer gesagt, nur solche Neutrinos wechselwirken mit normaler Materie oder Antimaterie über die schwache Wechselwirkung. Rechtshändige Neutrinos würden im Prinzip über ihre Energiedichte zum Krümmungsradius des Weltalls beitragen, aber die Astrophysik ist noch weit davon entfernt, solche Effekte messen zu können). Um die Gleichungen (1.2) in die von Dirac angegebene Form zu bringen, bilden wir zuerst Summe und Differenz der Größen ψ (L) und ψ (R) : ψ (A) ≡ ψ (L) + ψ (R) ψ (B) ≡ ψ (R) − ψ (L) . Diese Größen erfüllen das Gleichungssystem i~ ~σ ∇ψ (B) + ∂0 ψ (A) = mcψ (A) i~ ~σ ∇ψ (A) + ∂0 ψ (B) = −mcψ (B) oder, zusammengefasst zu einem vierdimensionalen System (A) (A) −∂0 −σ∇ ψ ψ i~ = −mc . σ∇ ∂0 ψ (B) ψ (B) Eine etwas kompaktere Schreibweise entsteht mit Hilfe der Definitionen 0 −iσk I 0 γk = k = 1, 2, 3 γ4 = , iσk 0 0 −I 90 KAPITEL 4. DIE DIRAC-GLEICHUNG wobei I die zweidimensionale Einheitsmatrix und 0 die zweidimensionale Nullmatrix darstellt. Die obigen Definitionen führen zum Gleichungssystem ∂ mc ~γ ∇ + γ4 ψ+ ψ = 0; x4 = ict, ∂x4 ~ oder noch kompakter (mit Einstein-Konvention) ∂ mc γµ + ψ = 0. ∂xµ ~ (1.3) Hier ist die Größe ψ ein vierdimensionales Objekt, das als Spinor bezeichnet wird. Eine etwas explizitere Darstellung von (1.3) ist 4 X 4 X µ=1 β=1 (γµ )αβ ∂ mc + δαβ ψβ = 0. ∂xµ ~ (α = 1, . . . , 4). Die Matrizen γµ erfüllen die Antivertauschbeziehungen {γµ , γν } = 2δµν I4 , (1.4) die man aus der expliziten Darstellung leicht überprüfen kann (die Größe I4 bezeichnet die 4-dimensionale Einheitsmatrix): 0 −iσk 0 −iσl 0 −iσl 0 −iσk {γk , γl } = + iσk 0 iσl 0 iσl 0 iσk 0 {σk , σl } 0 I 0 = = 2δkl , 0 {σk , σl } 0 I usw. Wie zuerst von Pauli gezeigt wurde, bestimmen die Beziehungen (1.4) die 4-dimensionalen Matrizen γµ bis auf eine Ähnlichkeitstransformation: 0 0 γµ , γν = 2δµν I4 ⇐⇒ γµ0 = Sγµ S−1 mit irgendeiner nichtsingulären Matrix S. Aus diesem Theorem folgt sofort, dass man aus jeder Lösung ψ der Gleichung (1.3) eine Lösung ψ 0 ≡ Sψ der Gleichung mc 0 ∂ + ψ0 = 0 γµ ∂xµ ~ konstruieren kann. Der physikalische Inhalt der Dirac-Gleichung wird deshalb von einer Änderung der Darstellung der γ-Matrizen nicht beeinträchtigt, und man findet in der Literatur eine Menge solcher Darstellungen, worauf wir hier nicht näher eingehen werden. Wir bemerken weiters noch, dass mit unserer Wahl der γµ diese hermitesch und spurlos sind. Letztere Eigenschaft bleibt unter Ähnlichkeitstransformationen erhalten; die Hermitizität 91 KAPITEL 4. DIE DIRAC-GLEICHUNG ebenso, wenn S unitär gewählt wird. Zum Schluss erwähnen wir noch, dass die Darstellungsunabhängigkeit der Dirac-Gleichung in Anwesenheit eines elektromagnetischen Feldes erhalten bleibt, wie man nach der Substitution ~ ∂ ~ ∂ e −→ − Aµ , i ∂xµ i ∂xµ c leicht sieht. Die Gleichung (1.3) kann durch Multiplikation von links mit γ4 in die vertraute Form i~ ∂ ψ = HD ψ ∂t (1.5) gebracht werden. Für den Hamiltonoperator findet man so HD = −ic~~ α∇ + βmc2 (1.6) mit I 0 ; 0 −I β = γ4 = 0 σk . σk 0 αk = iγ4 γk = Die Form (1.6) ist die von Dirac ursprünglich vorgeschlagene. Wahrscheinlichkeitsdichte und Wahrscheinlichkeitsstrom Wir werden mit einer Diskussion der physikalischen Interpretation von ψ und seinen Komponenten noch etwas warten, bis wir einige einfache Lösungen der Dirac-Gleichung diskutiert haben. Es liegt aber nahe anzusetzen, dass die Größe X ψα∗ (r, t)ψα (r, t)d3 r ψ † (r, t)ψ(r, t)d3 r ≡ α die Wahrscheinlichkeit darstellt, zur Zeit t ein Teilchen im Volumen d3 r um r anzutreffen. Wir werden später sehen, dass diese Interpretation nicht ganz unproblematisch ist, aber wir zeigen jetzt als erstes, dass es in der Dirac-Theorie eine Kontinuitätsgleichung für die Größe ψ † ψ gibt. Aus der Dirac-Gleichung folgt für ψ † ∂ mc † ∂ † ψ γk + ∗ ψ † γ4 + ψ = 0. ∂xk ∂x4 ~ Multiplikation von rechts mit γ4 und Ausnützen von ∂ ∂ ∂ = =− ∗ ∗ ∂x4 ∂(ict) ∂x4 liefert für die Größe ψ̄ ≡ ψ † γ4 die adjungierte Gleichung mc ∂ ψ̄γµ + ψ̄ = 0, ∂xµ ~ KAPITEL 4. DIE DIRAC-GLEICHUNG 92 wobei wir noch die Beziehung γµ γ4 = −γ4 γµ benutzt haben. Aus der obigen Gleichung und der Dirac-Gleichung selbst folgt jetzt ∂ ψ̄γµ ψ = 0, ∂xµ also eine Erhaltungsgröße für den Stromvektor sµ = icψ̄γµ ψ = cψ † α ~ ψ, icψ † ψ . Es liegt also nahe, die Größe j = cψ † α ~ψ als Wahrscheinlichkeitsstromdichte und ψ † ψ als Wahrscheinlichkeitsdichte zu interpretieren. Zur Absicherung dieser Interpretation sollte eigentlich noch gezeigt werden, dass sich sµ unter Lorentztransformationen in der Tat wie eine Vektordichte transformiert. Dies ist tatsächlich der Fall, aber der Beweis kann hier nicht gegeben werden (siehe Sakurai oder Messiah). Weiters liegt es nahe, die Größe c~ α als Geschwindigkeitsoperator zu deuten, was sich mit gewissen Einschränkungen als möglich erweisen wird. Zum Schluss bemerken wir noch, dass die obige Form für sµ auch in Anwesenheit eines Viererpotentials Aµ ungeändert bleibt, wie man leicht nachprüft. Die Stromdichte in der Dirac-Theorie hat also keine manifest diamagnetischen Anteile! 4.2 Nichtrelativistische Näherungen In diesem Abschnitt diskutieren wir die Lösungen der Gleichung ∂ ie mc − Aµ γµ ψ + ψ=0 ∂xµ ~c ~ (2.1) die harmonisch von der Zeit abhängen gemäß ψ(r, t) = ψ(r, 0)e−iEt/~ , also stationäre Lösungen. Das Viererpotential Aµ ist dabei definiert als Aµ ≡ (A, iA0 ) = (A, iΦ) Die Gleichung (2.1) kann jetzt zerlegt werden in zwei Gleichungen für die Bestandteile ψ (A) und ψ (B) : h 1 e i E − eA0 − mc2 ψ (A) ; ~σ p − A ψ (B) = c c h e i (A) 1 ~σ p − A ψ = E − eA0 + mc2 ψ (B) . c c KAPITEL 4. DIE DIRAC-GLEICHUNG 93 Mit Hilfe der zweiten Gleichung kann man ψ (B) eliminieren; so erhält man h h (A) e i c2 e i (A) 2 ψ . ~σ p − A ~ σ p − A ψ = E − eA − mc 0 c E − eA0 + mc2 c Für nichtrelativistische Teilchen gilt E ≈ mc2 ; |eA0 | mc2 . Es liegt also nahe, die nichtrelativistische Energie zu definieren als E(NR) = E − mc2 und den Faktor in der Mitte der Gleichung für ψ (A) zu entwickeln gemäß " # 2mc2 1 1 E(NR) − eA0 c2 = = 1− + . . . . (2.2) E − eA0 + mc2 2m 2mc2 + E(NR) − eA0 2m 2mc2 Wenn man sich auf den ersten Term beschränkt, erhält man die Gleichung 1 e e ~σ p − A ~σ p − A ψ (A) = E(NR) − eA0 ψ (A) , 2m c c also genau die van-der-Waerden’sche Form der nichtrelativistischen stationären Schrödingergleichung für eine zweikomponentige Wellenfunktion; wie im vorhergehenden Abschnitt gezeigt wurde, lässt sie sich schreiben als e 2 e~ 1 p− A − ~σ B + eA0 ψ (A) = E(NR) ψ (A) . 2m c 2mc (Für eine lineare Superposition von stationären Lösungen, deren Eigenwerte alle die Ungleichung E(NR) mc2 erfüllen, gilt die zeitabhängige Schrödingergleichung für die Größe ψ (NR) (r, t) = ψ (A) (r, t)eimc 2 t/~ ; der zusätzliche Phasenfaktor ist für die physikalische Interpretation ohne Bedeutung; wir haben damit also aus der Dirac-Gleichung die Schrödingergleichung hergeleitet zusammen mit der Bedingung für ihre Gültigkeit.) Relativistische Korrekturen für den elektrostatischen Fall Als nächstes werden wir den Korrekturterm in (2.2) mit berücksichtigen; dabei werden wir uns aber der Einfachheit halber auf den Fall A = 0 beschränken. Die so entstandene Gleichung lässt sich schreiben als (NR) HA ψ (A) = E(NR) ψ (A) 94 KAPITEL 4. DIE DIRAC-GLEICHUNG mit (NR) HA 1 = (~σ p) 2m E(NR) − eA0 1− + ... 2mc2 ! (~σ p) + eA0 . Auf den ersten Blick sieht diese Gleichung ganz vernünftig aus; bei näherer Betrachtung sieht man aber (mindestens) drei Schwierigkeiten: (NR) 1 Der Operator HA (NR) enthält den Eigenwert EA . (NR) 2 Der Operator HA ist nicht hermitesch; beim Ausarbeiten der (~σ p) sieht man, dass (NR) neben hermiteschen Termen ein Term i~Ep entsteht. Die Nichthermitizität von HA ist nicht ohne weiteres fatal, aber sie macht lästige Umformulierungen der allgemeinen Theorie erforderlich. 3 Die zweikomponentige Wellenfunktion ψ (A) ist nicht korrekt normiert; die korrekte Normierung lautet Z dr ψ (A)† ψ (A) + ψ (B)† ψ (B) = 1. Bis zur betrachteten Ordnung gilt aber ψ (B) ≈ ~σ p (A) ψ , 2mc weshalb wir die Normierungsbedingungen für ψ (A) in der Form Z p2 (A)† (A) dr ψ 1+ ψ ≈1 4m2 c2 schreiben können. Wie wir gleich zeigen werden, lassen sich sämtliche Schwierigkeiten beheben, und zwar durch die Transformation p2 (A) ψ (A) . Ψ = Ωψ ≡ 1 + 8m2 c2 Die zweikomponentige Wellenfunktion Ψ ist offensichtlich bis zur betrachteten Ordnung korrekt normiert, und die Gleichung (NR) Ω−1 HA Ω−1 Ψ = E(NR) Ω−2 Ψ lautet bis auf Terme höherer Ordnung " 2 2 p2 p p ~σ p + eA0 − , + eA0 − 2 2 2m 8m c 2m 2m E(NR) − eA0 2mc2 ! # ~σ p Ψ = E (NR) 1− p2 4m2 c2 Ψ. KAPITEL 4. DIE DIRAC-GLEICHUNG 95 oder o p2 p4 1 n 2 (NR) + eA0 − p , E − eA + 0 2m 8m3 c2 8m2 c2 i −2 (~σ p) E(NR) − eA0 (~σ p) Ψ = E(NR) Ψ. Der letzte Term in den eckigen Klammern lässt sich umformen mittels der Identität 2ABA = A2 , B − [A, [A, B]] (mit A = ~σ p und B = E(NR) − eA0 ). Der erste Term kompensiert genau den vierten Term in den eckigen Klammern. Weil die Zahl E(NR) zum Doppelkommutator nicht beiträgt, ist damit auch die Abhängigkeit vom Eigenwert E(NR) eliminiert worden. Der Doppelkommutator lässt sich weiter vereinfachen mit Hilfe der Identitäten [~σ p, −eA0 ] = −ie~~σ E [~σ p, −ie~~σ E] = −e~2 ∇E − 2e~~σ (E × p) bei deren Herleitung auch ∇A0 = −E und ∇×E = 0 verwendet wurden. Einsetzen der Ergebnisse sämtlicher Umformungen liefert 2 p4 e~~σ (E × p) e~2 p + eA0 − − − ∇E Ψ = E(NR) Ψ. (2.3) 2m 8m3 c2 4m2 c2 8m2 c2 Die ersten zwei Terme in (2.3) sind bekannt; der dritte Terme ist die erste Korrektur zur kinetischen Energie, die man auch erhalten würde mittels der Taylorentwicklung q p2 p4 (mc2 )2 + p2 c2 − mc2 = − + ... . 2m 8m3 c2 Der vierte Term liefert die Spin-Bahn-Kopplung: Ein Elektron, das sich im Feld E bewegt, ”sieht” in seinem Ruhesystem infolge der Lorentztransformation ein Magnetfeld, welches an seinen Spin ankoppelt. Für ein zentralsymmetrisches Potential eA0 = V (r) erhält man die vertraute Form e~ ~ 1 dV 1 dV − 2 2 ~σ (E × p) = − 2 2 − ~σ (r × p) = S L. 4m c 4m c r dr 2m2 c2 r dr Der letzte Term − e~2 e~2 ∇E = ∇2 A0 , 8m2 c2 8m2 c2 der als Darwin-Term bezeichnet wird, kann mit der potentiellen Energie eA0 zusammen genommen werden. Er besagt dann, dass das Elektron nicht das Potential am genauen Ort ~ r spürt, sondern den Mittelwert über einen Bereich der Abmessung mc = 3, 9 · 10−11 cm. 96 KAPITEL 4. DIE DIRAC-GLEICHUNG Auf dieses Phänomen werden wir später im Zusammenhang mit der so genannten Zitterbewegung des Dirac-Elektrons noch zurückkommen. Für das Wasserstoffatom gilt ∇E = 4πeδ(r) und der Darwin-Term trägt nur für s-Zustände bei (im Gegensatz zur Spin-Bahn-Kopplung, die nur für l 6= 0-Zustände von Bedeutung ist). Der Einfluss der Zusatzterme in (2.3) in erster Ordnung Störungstheorie lässt sich für das Wasserstoffatom explizit berechnen (Rechnungen in zweiter und höherer Ordnung sind nur sinnvoll, wenn auch höhere Korrekturen (NR) zu HA berücksichtigt werden). Die Energiewerte hängen nur von den Quantenzahlen n und j ab und betragen −e2 1 α2 1 3 , Enj = + − 2a0 n2 n3 j + 12 4n wobei a0 den Bohr’schen Radius und α0 die Feinstrukturkonstante darstellt. Ohne Beweis erwähnen wir noch, dass sich die volle Dirac-Gleichung für das Wasserstoffatom auch exakt lösen lässt; das Ergebnis ist (für Kernladung Z) Enj − 21 Z 2 α2 = mc 1 + 2 q 2 j + 12 − Z 2 α2 n − j + 21 + 2 . Wegen der Beziehung 1 2 2 e2 α mc = 2 2a0 liefert die Taylorentwicklung nach Potenzen von α2 bis auf einen additiven Faktor mc2 das nichtrelativistische Ergebnis. Es ist bemerkenswert, dass in der Dirac-Theorie neben der jz -Entartung auch noch ein Teil der l-Entartung erhalten bleibt. So sind z.B. die Zustände 2s1/2 und 2p1/2 immer noch entartet; diese Entartung wird erst durch die Wechselwirkung mit dem Strahlungsfeld aufgehoben (siehe unsere Diskussion der Lamb-Verschiebung in Kapitel 2.4). Weiters ist noch zu bemerken, dass der exakte Ausdruck nur für Z ≤ 137 gilt; für höhere Werte von Z treten formal komplexe Eigenwerte auf (instabile Niveaus). Stabile Kerne mit Z > 137 kommen zwar in der Natur nicht vor, aber die Ergebnisse haben trotzdem eine gewisse Relevanz für die Beschreibung von Experimenten, in denen hochenergetische schwere Kerne aufeinandergeschossen werden. Auf die physikalische Bedeutung der komplexen Eigenwerte werden wir kurz näher eingehen im Zusammenhang mit unserer Diskussion des Klein’schen Paradoxons im nächsten Abschnitt. 97 KAPITEL 4. DIE DIRAC-GLEICHUNG 4.3 Lösungen der freien Dirac-Gleichung In diesem Abschnitt diskutieren wir Lösungen der freien Dirac-Gleichung (Aµ = 0) der Form einer ebenen Welle: (A) ψ i(pr−Et)/~ uA (p) , ψ(r, t) = = Ne uB (p) ψ (B) wobei N ein noch zu bestimmender Normierungsfaktor ist. Substitution in die Gleichungen für ψ (A) und ψ (B) ergibt uA (p) = c (~σ p) uB (p); E − mc2 uB (p) = c (~σ p) uA (p). E + mc2 (3.1) Die Größen E und p erfüllen selbstverständlich die Beziehung q E = ± p2 c2 + (mc2 )2 . Für jede Wahl des Vorzeichens existieren zwei linear unabhängige Lösungen. Insbesondere für p2 m2 c2 gilt: uA (p) uB (p) > für E 0 . < Um zur korrekten Wahl des Vorzeichens für E zu gelangen, betrachten wir zuerst den Fall p = 0. Dann muss gelten γ4 ∂ mc ψ=− ψ ∂(ict) ~ oder expliziter E I 0 mc uA (0) uA (0) − =− . uB (0) c~ 0 -I ~ uB (0) Aus dieser Gleichung folgt sofort, dass gelten muss E = mc2 ⇐⇒ uB (0) = 0; E = −mc2 ⇐⇒ uA (0) = 0 Der vollständige Satz von Eigenspinoren 0 1 0 1 0 (3) (2) 0 u = u(1) = u = 0 1 0 0 0 0 u(4) 0 0 = 0 1 hat als zusätzliche Eigenschaft, dass er aufgebaut ist aus Eigenvektoren des Operators γ1 γ2 − γ2 γ1 σ3 0 Σ3 = = , 0 σ3 2i KAPITEL 4. DIE DIRAC-GLEICHUNG 98 der bis auf den Faktor ~2 den Spin des Dirac-Elektrons beschreibt. (Diese intuitiv plausible Interpretation kann abgesichert werden durch Betrachtung des Transformationscharakters der Dirac-Gleichung unter Drehungen. Dies wird in dieser Vorlesung nicht durchgeführt.) Man wählt jetzt die Eigenspinoren u(1) (p) und u(2) (p) für E > 0 auch für p 6= 0 so, dass gilt (2) (1) 0 0 0 1 ; ; uA (p) = N uA (p) = N 1 0 für die Eigenspinoren u(3) (p) und u(4) (p) für E < 0 wählt man dagegen (4) (3) 0 0 0 1 . ; uB (p) = N uB (p) = N 1 0 Mit Hilfe der Darstellung p3 p1 − ip2 ~σ p = p1 + ip2 −p3 erhält man so aus (3.1) für die vollständigen Eigenspinoren 1 0 0 1 u(1) (p) = N 0 u(2) (p) = N 0 p3 c/(E+mc2 ) ; (p1 −ip2 )c/(E+mc2 ) ; (p1 +ip2 )c/(E+mc2 ) −p3 c/(E+mc2 ) −(p1 −ip2 )c/(|E|+mc2 ) −p3 c/(|E|+mc2 ) −(p1 +ip2 )c/(|E|+mc2 ) p3 c/(|E|+mc2 ) (4) 0 ; . u(3) (p) = N 0 u (p) = N 1 0 0 1 Man prüft leicht nach, dass für die so konstruierten Eigenspinoren gilt u(r)† (p) u(s) (p) = 0 für r 6= s. Die Normierung der Eigenspinoren ist weitgehend eine Konventionssache. Die am häufigsten verwendete Konvention ist r |E| |E| + mc2 (r)† (r) 0 ⇒ N = ; u (p)u (p) = mc2 2mc2 dies bedeutet, dass sich die Norm des Eigenspinors wie die vierte Komponente eines Vierervektors transformiert. Mit dieser Definition sind die normierten Eigenlösungen der DiracGleichung s mc2 (r) ψ (r) (r, t) = u (p) ei(pr−ηr |E|t)/~ |E| V 99 KAPITEL 4. DIE DIRAC-GLEICHUNG mit ( +1 für r = 1, 2; ηr = −1 für r = 3, 4. Die Korrektheit der Wahl der Vorzeichen ηr für die Energie, die bisher nur über die Analogie mit dem Fall p = 0 plausibel gemacht wurde, lässt sich auch mittels Substitution in die Dirac-Gleichung überprüfen. Wir bemerken noch, dass die Eigenspinoren u(r) (p) nur im Spezialfall p1 = p2 = 0 auch Eigenvektoren von Σ3 sind. Wie wir gleich sehen werden, ist nur die Komponente des Spins parallel zu p eine Bewegungskonstante der freien Dirac-Gleichung. Dies stellt einen wichtigen Unterschied zur nichtrelativistischen Theorie dar. Im Limes V → ∞ erhält man für das Eigenwertspektrum der freien Dirac-Hamiltonfunktion ein (zweifach) entartetes Kontinuum mit den zwei getrennten Bereichen −∞ < E < −mc2 und mc2 < E < ∞. Das Fehlen einer unteren Schranke für die möglichen E-Werte stellt die größte Schwierigkeit bei der Interpretation der Dirac-Gleichung als Einteilchengleichung dar; eine nicht sehr speziell gewählte Störung würde ein unbeschränktes Absinken der Energie des Elektrons zur Folge haben. Damit würde die Stabilität der Materie, die gerade durch die Einführung der ”normalen” Quantentheorie wiederhergestellt wurde, wieder verloren gehen. Ehe wir im nächsten Abschnitt auf die Vorschläge zur Beseitigung dieser Schwierigkeit eingehen, diskutieren wir kurz noch einige weitere Folgerungen aus der Dirac-Gleichung. Observable und Bewegungskonstanten Die Observablen für ein Diracteilchen lassen sich genauso wie für ein Schrödingerteilchen aus den Basisoperatoren r, p und S konstruieren; lediglich für die Komponenten von S ist in der Diractheorie eine andere Darstellung notwendig; auf S. 97 wurde die Darstellung ~1 ~ σi 0 ~ ijk γj γk = Si = Σi = 2 2 2i 2 0 σi vorgeschlagen, allerdings mit einer recht dürftigen Begründung. In der nachfolgenden Betrachtung werden wir die Dynamik dieser Observablen (im Heisenbergbild) etwas näher betrachten. Die Bewegungsgleichung für eine Observable A lautet dA ∂A i = + [H, A] dt ∂t ~ mit H = c~ αp + βmc2 . Die Observable p vertauscht offensichtlich mit H und ist also auch in der Diractheorie für ein freies Teilchen eine Bewegungskonstante. KAPITEL 4. DIE DIRAC-GLEICHUNG 100 Die erste Überraschung tritt bei der Betrachtung des Drehimpulses auf. Dafür gilt [H, L] = [c~ αp, r × p] = ~ cα ~ ×p i oder dL =cα ~ × p. dt Anders als in der Schrödingertheorie eines freien Teilchens mit Spin 12 ist der Drehimpuls also keine Bewegunskonstante. Auch der Spin ist, wie schon aus der Konstruktion der Eigenspinoren hervorging, keine Bewegungskonstante. Wegen 0 σi σj 0 0 σk [αi , Σj ] = , = 2iijk ; σi 0 0 σj σk 0 I 0 σi 0 [β, Σi ] = , =0 0 -I 0 σi gilt i i ic h d ~ = −c α S = [H, S] = α ~ p, Σ ~ × p. dt ~ 2 Wir sehen also, dass wenigstens der Gesamtdrehimpuls J=L+S auch für das freie Diracteilchen eine Bewegungskonstante ist; dies gilt übrigens auch für die Größe S · p oder für S p̂ = S·p |p| die sog. Helizität des Elektrons. Die Tatsache, dass J = L + S für unsere Wahl von S eine Bewegungskonstante ist, ist natürlich umgekehrt ein starkes Argument für die Wahl von ~~ Σ als Darstellung für den Spinoperator S. 2 Als nächstes betrachten wir die Zeitentwicklung des Ortsoperators: dr i ic = [H, r] = [~ αp, r] = c α ~. dt ~ ~ Für den Geschwindigkeitsoperator erhalten wir also nicht etwa p/m, sondern c~ α. Weil jede Komponente von α ~ nur die Eigenwerte ±1 hat, ist klar, dass ein Elektron nie in einem Eigenzustand einer Komponente von α ~ sein kann (Lichtgeschwindigkeiten sind für Teilchen mit endlicher Masse nicht erlaubt!). Formal betrachtet: die Eigenvektoren von αi haben keinen endlichen Erwartungswert der Energie und können nicht experimentell präpariert werden. Für den Operator α ~ erhält man die Bewegungsgleichung d~ α i i i = [H, α ~ ] = (−2~ αH + {H, α ~ }) = (−2~ αH + 2cp) , dt ~ ~ ~ KAPITEL 4. DIE DIRAC-GLEICHUNG 101 wie man aus {αi , αj } = 2δij und {αi , β} = 0 sofort sieht. Die obige Operator-Differentialgleichung hat die Lösung cp cp −2iHt/~ α ~ (t) = + α ~ (0) − e , H H wie man durch direkte Substitution sieht (bedenke [H, p] = 0). Der erste Term ist für einen Eigenzustand von p genau die Gruppengeschwindigkeit dividiert durch c: q dE(p) d c2 p 2 vg ≡ = ± p2 c2 + (mc2 ) = dp dp E(p) (bemerke, dass für Zustände negativer Energie vg und p antiparallel stehen!). Der Zusatzterm stellt eine sehr hochfrequente, oszillierende Bewegung dar (minimale Frequenz 2mc2 /~ ' 1, 5 · 10+21 sec−1 ), die Zitterbewegung genannt wird. Der Erwartungswert der Amplitude der Zitterbewegung verschwindet für Eigenzustände von p; z.B. gilt Z dr ψp(1)† (r)αi ψp(1) (r) = † 1 1 E + mc2 0 0 0 σi V = cpi . 1 1 σ 0 2E V E i c c ~σ p σp 2 ~ E+mc2 E+mc 0 0 Auf analoge Weise errechnet man die Erwartungswerte in den übrigen Eigenfunktionen. Matrixelemente von αi zwischen Eigenfunktionen mit unterschiedlichem p verschwinden trivialerweise (r-Integration), und man zeigt auch leicht Z Z (1)† (2) dr ψp (r) αi ψp (r) = dr ψp(3)† (r) αi ψp(4) (r) = 0 Um eine nichtverschwindende Amplitude der Zitterbewegung zu erhalten, braucht man also eine Linearkombination von Lösungen der freien Diracgleichung mit unterschiedlichen Vorzeichen von E; durch Betrachten der führenden Komponenten sieht man z.B. 2 Z p (3)† (1) . dr ψp (r) α3 ψ (r) = 1 + O m2 c2 Eng mit dem Phänomen der Zitterbewegung verknüpft ist die Unmöglichkeit, ein Diracteilchen beliebig genau zu lokalisieren. Die Konstruktion einer Wellenfunktion vom Typ ψ † (r) = (Φ∗ (r), 0, 0, 0) führt nicht zum Ziel; in einer Zerlegung nach ebenen Wellen gemäß Z ψ(r) = dp c1 (p)u(1) (p) + c3 (p)u(3) (p) + c4 (p)u(4) (p) eipr/~ KAPITEL 4. DIE DIRAC-GLEICHUNG 102 muss gelten c3 (p) −p3 c = ; c1 (p) |E(p)| + mc2 − (p1 − ip2 ) c c4 (p) = . c1 (p) |E(p)| + mc2 Das Auftreten von Wellenvektoren mit p ∼ mc, die für eine Lokalisierung auf Gebiete 4x ∼ ~/mc notwendig sind, hat also automatisch eine starke Beimischung von Komponenten mit negativen Energien, also eine ausgeprägte Zitterbewegung, zur Folge; letztere zerstört dann sofort wieder die Lokalisierung. Newton und Wigner konnten zeigen, dass auch die Bildung eines Wellenpaketes, welches nur Komponenten positiver Energie enthält, nie zu einer Lokalisierung schärfer als 4x ∼ ~/mc führen kann. Weil die Eigenfunktionen der freien Diracgleichung mit E > 0 nicht vollständig sind, ist auch nicht zu erwarten, dass die Eigenfunktionen zu E > 0 eines Diracteilchens in einem äußeren Potential aus einer linearen Superposition von Ebenen-Wellen-Lösungen mit E > 0 aufzubauen sind. Dies erklärt das Auftreten des Darwin-Terms in der ersten relativistischen Korrektur zur Schrödingergleichung, der ja als eine Verschmierung der Position des Elektrons über einen Bereich ~/mc gedeutet werden konnte. Stückweise konstante Potentiale; das Klein’sche Paradoxon Der Fall eines stückweise konstanten Potentials, welches nur von einer Raumkoordinate abhängt, ist auch für die Diracgleichung der nächst einfache exakt lösbare Fall. Weil die Diracgleichung eine Gleichung erster Ordnung in den Raumableitungen ist, braucht man nur Stetigkeit der vierkomponentigen Wellenfunktionen zu verlangen, nicht aber deren Ableitungen. Wegen der Verdopplung der Komponentenzahl gegenüber der nichtrelativistischen Theorie bleibt aber die Zahl der so erhaltenen Anschlussbedingungen die gleiche. Die Energie-Impuls-Beziehung in einem Bereich mit Potential V = eA0 folgt z.B. aus der Beziehung (~σ p) und lautet (A) c2 (A) 2 (~ σ p) ψ = E − V − mc ψ E − V + mc2 p2 c2 = E − V + mc2 E − V − mc2 . Diese Gleichung hat reelle Lösungen für E > V + mc2 oder E < V − mc2 . und imaginäre Lösungen (evaneszente Wellen) für die ”Bandlücke” V − mc2 < E < V + mc2 . Wir werden hier keine expliziten Rechnungen durchführen. Diese sind im Prinzip nicht schwierig, dafür aber etwas langwierig; explizite Rechnungen findet man z.B. in W. Greiner, Theoretische Physik, Band 6. Das qualitative Verhalten ist aber aus den obigen Ergebnissen leicht einsichtig zu machen. 103 KAPITEL 4. DIE DIRAC-GLEICHUNG Kastenpotentiale ( V0 für |z| < a V= 0 für |z| > a. Für |V| < 2mc2 ergibt sich folgende Situation (Skizze für V<0) E mc2 mc2 +V -a a Z -mc2 -mc2 -V • Im Energiebereich E > mc2 hat man ein kontinuierliches Spektrum (Streuzustände) • Im Bereich mc2 + V < E < mc2 hat man einige diskrete, in dem Kasten lokalisierte, Niveaus. • Im Bereich −mc2 < E < mc2 + V gibt es keine Zustände. • Im Bereich E < −mc2 gibt es wieder nur ein kontinuierliches Spektrum. Für −mc2 − V < E < −mc2 sind die verallgemeinerten Eigenfunktionen im Bereich |z| < a evaneszent: Die ebenen Wellen negativer Energie tunneln durch das für sie abstoßend wirkende Potential hindurch. Beim Anwachsen von |V| spalten sich die gebundenen Zustände vom Kontinuum der Zustände mit E > 0 ab. Für V > 0 ”entstehen” hingegen gebundene Zustände aus dem Kontinuum der Zustände mit negativer Energie. Für |V| > 2mc2 wird das Verhalten qualitativ anders: 104 KAPITEL 4. DIE DIRAC-GLEICHUNG E Z=-a Z=a Z mc2 -mc2 mc2 +V -mc2 +V Für mc2 + V < E < −mc2 hat man jetzt ein kontinuierliches Spektrum, allerdings mit Resonanzen im Reflexionskoeffizienten, deren Lagen in Abhängigkeit von V sich stetig mit den Lagen gebundener Zustände verbinden lässt; die gebundenen Zustände werden instabil beim ”Eintauchen” in das Kontinuum der Zustände negativer Energie (vgl. das Ergebnis für das Coulombproblem mit Zα > 1; dort tritt aber ein ”Zusammenbruch” auf für den Energiewert E1,1/2 = 0; dies ist aber eine Besonderheit des singulären Potentials. Nach Abschneiden des Potentials tritt die Instabilität erst bei E1,1/2 = −mc2 auf). Ähnlich paradoxe Ergebnisse erhält man für Streuung an einer Potentialstufe: V(z) = V0 θ(z). Für V0 < 2mc2 erhält man teilweise Reflexion für E(p) > V0 + mc2 und Totalreflexion für E(p) < V0 + mc2 . Für V0 > 2mc2 tritt aber die skizzierte Lage auf: 105 KAPITEL 4. DIE DIRAC-GLEICHUNG E V_0+mc2 V_0-mc2 mc2 0 Z Für E(p) < V0 − mc2 wird das Potential wieder transparent; es lässt sich eine Lösung konstruieren aus einer einlaufenden und einer reflektierten Welle für z < 0 und einer nach rechts auslaufenden Welle (mit pZ < 0 wegen des anomalen Vorzeichens der Gruppengeschwindigkeit im unteren Kontinuum! Eine Lösung, die rechts eine Welle enthält, ist formal auch möglich, führt aber zu einem physikalisch inakzeptablen Wert R > 1 des Reflexionskoeffizienten). Dieses Verhalten wurde zuerst von Klein gefunden und ist unter dem Namen Klein’sches Paradoxon bekannt. 4.4 Die Löchertheorie Bisher haben wir drei physikalisch schwerverdauliche Konsequenzen aus der Diractheorie gefunden: 1: Die Instabilität der Zustände mit E > 0 gegenüber strahlendem Zerfall in Zustände des unteren Kontinuums 2: Das Instabilwerden von gebundenen Zuständen beim Eintauchen in das untere Kontinuum 3: Das Klein’sche Paradoxon Zur Beseitigung dieser Mängel stellte Dirac die Hypothese auf, dass sämtliche Zustände mit E < −mc2 (für den feldfreien Raum) besetzt sind, mit vielleicht sehr wenigen Ausnahmen. Ein fehlendes Elektron in einem Zustand negativer Energie verhält sich wie ein positiv geladenes Teilchen mit Energie, Impuls und Spin entgegengesetzt zu demjenigen des fehlenden Elektrons. Dieses Loch hat dieselbe Masse wie das Elektron; es wird Positron KAPITEL 4. DIE DIRAC-GLEICHUNG 106 genannt und wurde kurz nach dem Vorschlag von Dirac auch experimentell von Anderson in der kosmischen Strahlung gefunden. Positronen können dadurch erzeugt werden, dass ein γ-Quant ein Elektron aus einem Zustand mit E < 0 in einen mit E > 0 anhebt. In der neuen Sprachregelung heißt dies: Das Photon erzeugt ein Elektron-Positron-Paar. Der Einwand der Instabilität von Atomen und freien Elektronen ist durch die Dirachypothese beseitigt. (Dies zeigt übrigens, dass die Diracgleichung nur für Fermionen eine akzeptable Beschreibung darstellt.) Beim Eintauchen eines unbesetzten gebundenen Zustands in das Kontinuum wird er ”sofort” von einem Elektron aus dem ”Dirac-Meer” besetzt. Experimentell würde dies bedeuten, dass bei der Bildung eines ”überkritischen” Potentials (z.B. beim Zusammenstoß zweier hochgeladener Kerne) eine beachtliche Zahl von ungepaarten Positronen emittiert wird, was auch wieder der Beobachtung entspricht. Auf eine detaillierte Deutung des Klein’schen Paradoxons in der Löchertheorie werden wir verzichten, weil die dort vorausgesetzte Situation (zwei unendliche Halbräume mit unterschiedlichem Potential) unphysikalisch ist und höchstens als Grenzfall eines Kastenpotentials mit großer Breite von Bedeutung sein kann. Die in einem solchen Gebiet über die Schwelle E = mc2 hinausgehobenen besetzten Zustände entleeren sich (Bildung lokalisierter Positronen unter Emission freier Elektronen) und die so gebildete Raumladung bringt dann das überkritische Potential bis auf den Wert 2mc2 hinunter. Anwendung: Streuung von Licht an freien Elektronen Die Wechselwirkung eines Diracteilchens mit einem Strahlungsfeld kann analog zur Theorie in Kap. 2 aufgezogen werden, indem man A(r, t) in der Diracgleichung durch den Operator für das quantisierte Strahlungsfeld ersetzt. Wir werden als Beispiel für das Funktionieren der Löcherhypothese die Streuung von Licht an freien Elektronen studieren. Die klassische Theorie liefert hier den Streuquerschnitt dσ = r02 |êi · êj |2 dΩ 2 e wobei r0 = mc 2 der klassische Elektronenradius ist und êi bzw. êj die Polarisationsvektoren des einfallenden bzw. gestreuten Photons. (Dieses Ergebnis folgt aus der Formel auf S. 30, wenn man bedenkt, dass der Operator p keine Übergänge zwischen verschiedenen Zuständen eines freien Elektrons vermitteln kann; dann gilt auch ωk = ωk0 .) Der verbleibende Term im Ausdruck auf S. 30 kommt vom A2 -Term in der klassischen Wechselwirkung, der in der Diractheorie kein direktes Analogon hat. Die Wechselwirkung in der Diractheorie ist gegeben durch HI = −e~ αA(r, t). Für die Streuamplitude bis zur zweiten Ordnung gemäß dem zweiten und dritten Graphen auf S. 30: 107 KAPITEL 4. DIE DIRAC-GLEICHUNG p' r' p' r' k' j k' j p'' r'' + pr p'' r'' ki pr ki erhält man in Analogie mit der unteren Formel auf S. 31: 0 0 0 p r |~ α · êj e−ik r |p00 r00 p00 r00 |~ α · êi eikr |pr −2πe2 c2 ~ X X √ V ωk ωk0 p00 r00 =1,2 E” − E − ~ωk ! 0 0 0 α · êj e−ik r |pr p r |~ α · êi eikr |p00 r00 p00 r00 |~ + . E” − E + ~ωk0 Für p = 0 tragen nur die Zwischenzustände p00 = ~k bzw. p00 = −~k0 bei. Weil α ~ nur zwischen großen und kleinen Komponenten der Eigenspinoren nichtverschwindende Matrixelemente hat, erhält man für das Verhältnis des obigen Ausdrucks zum nichtrelativistischen Ausdruck auf S. 36 # " 2 ~ωk 1 mc2 X c~k 2 =O ... = O mc . (êi · êj ) r00 mc2 ~ck mc2 Dieser Ausdruck verschwindet für ωk → 0! Es gibt in der Diractheorie aber noch eine dritte Möglichkeit: Das einkommende Photon kann ein Elektron-Positron Paar erzeugen; das Positron vernichtet dann das ursprünglich anwesende Elektron unter Emission eines Photons. Diese und eine vierte Möglichkeit sind in den unten skizzierten Diagrammen angegeben: k' j k' j p'' r'' p' r' p'' r'' + pr pr ki ki p' r' 108 KAPITEL 4. DIE DIRAC-GLEICHUNG Die zugehörige Amplitude ist 00 00 0 p r |~ α · êj e−ik r |pr p0 r0 |~ α · êi eikr |p00 r00 −2πe2 c2 ~ X X √ V ωk ωk0 p00 r00 =3,4 E’ + |E”| − ~ωk 00 00 ! 0 p r |~ α · êi eikr |pr p0 r0 |~ α · êj e−ik r |p00 r00 + . E’ + |E”| + ~ωk0 Für p = 0 und ~ωk mc2 gilt in guter Näherung u(r) (p0 ) ≈ u(r) (p00 ) ≈ u(r) (0) 0 eikr ≈ e−ik r ≈ 1 und E’ + |E”| − ~ωk ≈ E’ + |E”| + ~ωk0 ≈ 2mc2 . Falls man weiters noch schreibt (r) χ+ (r) u (0) = für r = 1, 2 0 (r) u (0) = 0 (r) χ− für r = 3, 4 , so erhält man für die obige Summe 0 00 0 1 X (r00 )† (r) (r )† (r00 ) (r )† (r) (r )† (r00 ) χ ~σ · êj χ+ χ+ ~σ · êi χ− + χ− ~σ · êi χ+ χ+ ~σ · êj χ− , 2mc2 r00 =3,4 − (r) was sich wegen der Vollständigkeit der χ− schreiben lässt als 1 1 (r0 )† (r) χ+ [~σ êj ~σ êi + ~σ êi ~σ êj ] χ+ = êi êj δrr0 , 2 2mc mc2 also genau das zur Erhaltung des klassischen Resultats benötigte Ergebnis. Das obige Ergebnis zeigt auf recht beeindruckende Weise, dass die Diractheorie erst mit Berücksichtigung der Zustände negativer Energie und der Löcherhypothese zu Übereinstimmung mit den bekannten experimentellen Ergebnissen führt. In den obigen Diagrammen wurde gemäß einer von Feynman vorgeschlagenen Konvention das Positron als ein sich rückwärts in der Zeit bewegendes Elektron gezeichnet. Der in den Diagrammen auftretende Zwischenzustand ist weiters für nichtrelativistische Ausgangsteilchen mit einem riesigen Energieexzess behaftet, also extrem kurzlebig. Das könnte man dadurch zum Ausdruck bringen, dass man die beiden Vertizes extrem nahe zusammenzeichnet; damit ist der Übergang zum nichtrelativistischen A2 -Graphen auch ”anschaulich” plausibel zu machen! Zum Schluss: Mit der Löcherhypothese hört die Diractheorie auf, eine echte Einteilchentheorie zu sein. Sie ist eigentlich nur als Vielteilchentheorie konsisten interpretierbar, und es liegt nahe, auch das Diracfeld als Operatorfeld umzudefinieren. In einer solchen Feldtheorie 109 KAPITEL 4. DIE DIRAC-GLEICHUNG kann man auch einige etwas beunruhigende Aspekte der Löchertheorie (unendliche Massenund Ladungsdichte des Vakuums) durch Renomierung wegdefinieren. Die Quantenelektrodynamik, d.h. die Theorie der gekoppelten quantisierten Dirac- und Maxwellfelder, ist trotz der in ihr notwendigen, formal sehr abenteuerlichen, Renormierungsverfahren, die wohl erfolgreichste fundamentale Theorie der heutigen Physik; sie erlaubt z.B. eine sehr präzise Berechnung der Lambverschiebung und des, in der Vorlesung nicht diskutierten, anomalen magnetischen Moments von Elektron und Myon. Weiters ist sie das Vorbild weiterer in der Elementarteilchenphysik benützter Feldtheorien für starke und schwache Wechselwirkungen. Lehrbücher, die die Quantenelektrodynamik behandeln, sind z.B. Sakurai und Messiah; siehe auch R. P. Feynman, Quantum Elektrodynamics, sowie sein für Laien verfasstes QED, The Strange Theory of Light and Matter. 4.5 Quantisierung des Diracfeldes Ganz analog zur Vorgangsweise bei dem Maxwell- bzw. Schrödingerfeld führen wir einen Feldoperator für das Diracfeld ein mittels der Definition r 4 mc2 X X 1 p b(r) (t)u(r) (p) eipr/~ (5.1) ψ(r, t) = V p r=1 |E| p (r) und interpretieren die bp (t) als Vernichter eines Elektrons im Zustand (p, r). Sie erfüllen also die Antivertauschungsbeziehungen n o n o n o (s)† (r) (s) (r)† (s)† 0 b(r) , b = δ δ ; b , b = b , b = 0. rs pp p p p p0 p0 p0 Der Hamiltonoperator für das freie Diracfeld lautet dann Z H = dr H(r) H(r) = ψ † (r) HD ψ(r) mit HD = −i~c α ~ ∇ + βmc2 . Einsetzen der Entwicklung (5.1) in H liefert H = ··· = XXXX p p0 r r0 XX mc2 E (r)† (r0 ) (r)† 0 (r) bp bp0 u (p) u(r ) (p0 ) = ηr |E|b(r)† δpp0 p p bp |EE’| p r mit η1 = η2 = 1; η3 = η4 = −1, E = Ep = ± p p2 c2 + m2 c4 . 110 KAPITEL 4. DIE DIRAC-GLEICHUNG (r) Mit Hilfe dieses Hamiltonoperators erhalten wir als Bewegungsgleichung für die bp und (r)† bp i i d (r) = −ηr |E| bp(r) bp = H, b(r) p dt ~ ~ d (r)† i i b = H, b(r)† = ηr |E| b(r)† p p dt p ~ ~ Die Lösungen dieser Gleichung können verwendet werden, um in (5.1) die Heisenbergope(r) (r) (r) ratoren bp (t) zugunsten der Schrödingeroperatoren bp ≡ bp (0) zu eliminieren: r i mc2 X X 1 (r) (r) p bp u (p)e ~ (pr−ηr |E|t) . ψ(r, t) = V p r |E| Neben der Gesamtenergie H benötigen wir später noch Ausdrücke für die Gesamtladung Z X (r) e b(r)† Q = e dr ψ † (r)ψ(r) = p bp p,r und für den Gesamtimpuls Z X (r) P = −i~ dr ψ † (r)∇ψ(r) = p b(r)† p bp p,r Der Grundzustand (oder Vakuumzustand) des freien Diracfeldes entspricht gemäß der Löchertheorie dem Zustand, in dem alle ”Orbitale” mit r = 1, 2 leer und alle ”Orbitale” mit r = 3, 4 besetzt sind: b(r) b(r)† p |vac = 0, r = 1, 2 p |vac = 0, r = 3, 4 . (r) Für r = 3, 4 hebt der Operator bp die Energie des Vakuums um E an, und erniedrigt gleichzeitig den Impuls um p und die Ladung um e. Diese Operatoren verhalten sich also gewissermaßen als Erzeuger für positiv geladene Teilchen, die Positronen. Wir definieren die Erzeuger für Positronen mittels: (4) d(1)† = −b−p ; p (3) d(2)† = b−p p Die Korrespondenz 1 ↔ 4, 2 ↔ 3 sorgt dafür, dass für p ≈ 0 die Erzeuger mit Index 1 die z-Komponente des Spins um ~2 erhöhen. Die Vorzeichen sorgen dafür, dass die JordanWigner Phasenkonventionen erhalten bleiben, falls wir das Vakuum neu definieren als den Zustand, in dem sämtliche Elektron- und Positron-Orbitale leer sind: b(r) d(r) p |vac = 0, p |vac = 0, r = 1, 2 . Die Antikommutatoren lauten, wie erwartet, n o (r0 )† d(r) , d = δrr0 δpp0 ; 0 p p 111 KAPITEL 4. DIE DIRAC-GLEICHUNG Antikommutatoren vom Typ {d, d}, d† , d† , sowie {d, b}, d† , b usw. verschwinden alle. Falls wir weiters Positron-Spinoren einführen mittels: v (1) (p) = −u(4) (−p) v (2) (p) = u(3) (−p) , so können wir den Feldoperator ψ umschreiben als r X X mc2 (s) i(pr−Et)/~ (s) −i(pr−Et)/~ b(s) + d(s)† , ψ(r, t) = p u (p) e p v (p) e E V p s=1,2 p wobei E ab jetzt immer dem positiven Ausdruck E(p) = + p2 c2 + m2 c4 entspricht. Bei der obigen Umformung haben wir benutzt, dass die Summation in (5.1) sämtliche p umfasst, sodass p unter der Summation durch −p ersetzt werden kann. Der Hamiltonperator in den neuen Operatoren lautet XX XX (s) (s)† (s) (s) (s)† (s) EP b(s)† b − d d = EP b(s)† H= −p −p p p p bp + d p d p − 1 , p s=1,2 p s wobei wir die Antivertauschungsrelation ausgenützt und im zweiten Term den Summationsindex von p in −p umbenannt haben. Der Term −1 im Summanden ist eine (divergente) Konstante und wird üblicherweise weggelassen. Für die Gesamtladung erhält man analogerweise X (s) (s)† (s)† (s) bp bp + d−p d−p Q=e ps =e X ps (s) (s)† (s) b(s)† p b p − dp dp + 1 Hier sieht man also explizit, dass die Positronen positive Ladung tragen (e = −|e|). Weiters tritt hier eine unübliche ”Hintergrundladung des Dirac-Sees” auf; dieser Term wird üblicherweise auch ohne viel Kommentar gestrichen. Allerdings bietet sich in jüngster Zeit eine attraktive Alternative an: in den erfolgreicheren modernen Theorien der Elementarteilchen treten diese in ”Generationen” auf. Zu dem Elektron mit Ladung −|e| (und dem ungeladenen Elektronneutrino) gehören in einer Generation zwei Quarks mit Ladung 32 |e| und − 31 |e|, die auch Spin 12 haben und weiters noch in drei Varianten (Farben) vorkommen. Die 2 1 Gesamtladung der Orbitale mit Impuls p ist also: 2 −|e| + 3 3 − 3 |e| = 0, und auch die Hintergrundladungen der Diracseen addieren sich innerhalb der Generation zu Null. Wechselwirkungen In einer relativistisch invarianten Theorie ist es unschön, ein Wechselwirkungspotential V (r1 − r2 ) zwischen zwei Fermionen einzuführen: eine instantane Wechselwirkung zwischen zwei zueinander raumartig gelegenen Teilchen verträgt sich schlecht mit der relativistischen Kausalität (nur zueinander raumartig gelegene Ereignisse können einander beeinflussen). 112 KAPITEL 4. DIE DIRAC-GLEICHUNG Stattdessen lässt man sich inspirieren von der Methode der Ankopplung von geladenen Teilchen an das Maxwellfeld (oder von den Elektronen an den Phononen in der Festkörperphysik). Der Wechselwirkungsterm (in der Hamiltondichte, oder, auf etwas fundamentalerem Niveau, in der Lagrangedichte) hat die Form wobei LI = G J A, G eine Zahl (Kopplungskonstante) ist, J ein ”Strom” bilinear in den Fermionenfeldern, und A ein Kraftfeld (Bosonfeld) ist (in komplizierteren Theorien treten auch Ströme aus Bosonenfeldern auf). Weiters soll LI eine skalare Dichte sein; dies heißt, dass J und A unter Lorentztransformationen ähnlich transformieren müssen. Weil das Maxwellfeld Aµ ein Vektorfeld ist, darf es nur an einen Vektorstrom ankoppeln; wir haben in der Tat gesehen, dass die Stromdichte Jµ = ψ̄γµ ψ = ψ † αψ, ψ † ψ wie ein Vektor p, Ec transformiert. Die schwache Wechselwirkung sollte z.B. imstande sein, Zerfälle wie µ− −→ e− + ν̄e + νµ zu beschreiben. Dies geschieht durch Ankopplung an ein intermediäres Vektorboson W± ; der obige Prozess wird zerlegt in µ− −→ W− + νµ W− −→ ν̄e + e− oder auch (vgl. die Thomsonstreuung) |0 −→ W+ + e− + ν̄e µ− + W+ −→ νµ νµ µ− e− W± ν̄e KAPITEL 4. DIE DIRAC-GLEICHUNG 113 Der schwache Strom muss also Terme enthalten, die ein Myon vernichten und ein MyonNeutrino erzeugen (oder ein Elektron und ein Elektron-Antineutrino erzeugen). Ein Ansatz wäre ? Jµw = ψ̄νe γµ ψe + ψ̄νµ γµ ψm + h.c. (5.2) wobei der Myonspinor mit ψm bezeichnet wurde. Da das W± -Teilchen sehr massiv ist, führt es in dem skizzierten Prozess zu sehr großen Energienennern, also zu sehr schwacher Wechselwirkungen, sogar falls die Kopplungskonstante mit derjenigen der elektromagnetischen Wechselwirkung vergleichbar ist. (Allerdings nicht mehr, falls die Energie des einfallenden Teilchens mit mW c2 vergleichbar ist.) Der obige Ansatz kann aber nicht richtig sein, weil das Neutrino nur zwei Komponenten hat; das Neutrino kommt nur als linkshändiges Teilchen vor! Wir müssen im Stromoperator also auf linkshändige Teilchen projizieren. Für masselose Teilchen hat der Diracspinor die Form (+) χ χ(+) = wegen E = c|p|. σ·pc (+) χ σ · p̂ χ(+) |E| Wegen [σ · p̂]2 = I gilt also χ(+) σ · p̂ 0 χ(+) σ · p̂ χ(+) Σ · p̂ = = , 0 σ · p̂ σ · p̂ χ(+) σ · p̂ χ(+) χ(+) d.h. Σ · p̂ = −γ5 mit γ5 = γ1 γ2 γ3 γ4 = 0 −I . −I 0 Der Projektor auf die linkshändigen Teilchen hat also die Form 21 (1 + γ5 ). Weiters sieht man, dass γ5 mit einem Pseudoskalar (Vektorprodukt eines axialen mit einem polaren Vektor) zusammenhängt; dies wird bestätigt durch eine Analyse des Verhaltens der γ-Matrizen unter Lorentztransformationen, die ergibt, dass γ5 mit eigentlichen Lorentztransformationen kommutiert, aber mit Raumspiegelungen antikommutiert. Durch Überlegungen dieser Art wird man dazu geführt, statt (5.2) anzusetzen Jµw = ψ̄νe γµ (1 + γ5 ) ψe + ψ̄νµ γµ (1 + γ5 ) ψm + . . . , wobei benützt wurde, dass γ5 mit allen γµ antivertauscht. Aus dieser Form geht hervor, dass in der schwachen Wechselwirkung, d.h. beim Zerfall des W− -Teilchens, nur linkshändige Elektronen produziert werden (auch beim Zerfall des Neutrons, wobei das W− durch ein Nukleon- (oder Quark-)-Anteil in Jµw produziert wurde). Diese Vermutung wurde schon 1958 durch Wu et al. experimentell bestätigt. In der vereinheitlichten Theorie der elektromagnetischen und schwachen Wechselwirkungen kann zusätzlich zum Photon und zum W± noch ein viertes Teilchen, das Z0 , ausgetauscht werden. Der zugehörige Strom enthält neben einem reinen ψ̄νe γµ (1 + γ5 )ψν Term 114 KAPITEL 4. DIE DIRAC-GLEICHUNG auch neutrale (ladungserhaltende) Ströme aus geladenen Teilchen (mit irgendeiner Kombination aus γµ und γµ γ5 ). Dieser Term führt zu e − ν-Streuung. e− ν Z0 e− ν Durch Drehung dieses Diagramms sieht man, dass das Z0 durch e+ − e− Vernichtung erzeugt werden kann, und dann in alle möglichen Teilchen-Antiteilchen Paare zerfallen kann. Aus der Lebensdauer des Z0 -Teilchens kann man dementsprechend die gesamte Zahl der Elementarteilchen (mit Masse kleiner als 12 MZ0 ) bestimmen. Die im letzten Jahr angelaufenen Experimente zeigen, dass es neben den bisher bekannten Teilchen keine weiteren zu geben scheint, also insbesondere keine weiteren masselosen Neutrinos (neben νe , νµ und ντ ).