Vielteilchentheorie C. Timm Technische Universität Dresden, Institut für Theoretische Physik Satz: K. Schmidt Wintersemester 2008/2009 Stand 23. Februar 2010 Inhaltsverzeichnis 1 Einleitung 1.1 Wozu Vielteilchentheorie? . . . . . 1.2 Vielteilchensysteme und Emergenz 1.3 Überblick . . . . . . . . . . . . . . 1.4 Danksagung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 4 5 6 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Feldes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 10 12 12 13 14 16 16 18 20 21 22 22 22 23 26 28 31 32 32 35 37 37 39 40 43 44 46 47 3 Vielteilchentheorie bei T = 0 3.1 Wechselwirkungsfreie Elektronen . . . . . . . . . . . . . 3.2 Elektron-Elektron-Wechselwirkung . . . . . . . . . . . . 3.2.1 Störungstheorie für die Coulomb-Wechselwirkung 3.3 Gitterschwingungen und Phononen . . . . . . . . . . . . 3.4 Elektron-Phonon-Wechselwirkung . . . . . . . . . . . . . 3.5 Zeitabhängige Störungstheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 49 55 57 62 64 67 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Quantenfeldtheorie 2.1 Lineare Kette . . . . . . . . . . . . . . . . . . . . 2.2 Quantenmechanik der linearen Kette . . . . . . . 2.3 Erste Quantisierung . . . . . . . . . . . . . . . . 2.3.1 Einteilchensysteme . . . . . . . . . . . . . 2.3.2 Vielteilchensysteme . . . . . . . . . . . . . 2.3.3 Ununterscheidbarkeit . . . . . . . . . . . . 2.4 Zweite Quantisierung . . . . . . . . . . . . . . . . 2.4.1 Bosonen . . . . . . . . . . . . . . . . . . . 2.4.2 Fermionen . . . . . . . . . . . . . . . . . . 2.4.3 Operatoren in zweiter Quantisierung . . . 2.4.4 Quantenfeldoperatoren . . . . . . . . . . . 2.4.5 Impulsdarstellung . . . . . . . . . . . . . 2.5 Relativistisches skalares Feld . . . . . . . . . . . 2.5.1 Klein-Gordon-Gleichung . . . . . . . . . . 2.5.2 Quantisierung des relativistischen skalaren 2.6 Komplexes skalares Feld . . . . . . . . . . . . . . 2.7 Feynman-Propagator . . . . . . . . . . . . . . . . 2.8 φ4 -Theorie . . . . . . . . . . . . . . . . . . . . . . 2.9 Dirac-Feld . . . . . . . . . . . . . . . . . . . . . . 2.9.1 Erinnerung an die Dirac-Gleichung . . . . 2.9.2 Dirac-Feldtheorie . . . . . . . . . . . . . . 2.9.3 Feynman-Propagator für das Dirac-Feld . 2.10 Elektromagnetismus . . . . . . . . . . . . . . . . 2.10.1 Viervektor-Notation . . . . . . . . . . . . 2.10.2 Quantentheorie des Elektromagnetismus . 2.10.3 Transversaler Propagator . . . . . . . . . 2.10.4 Impuls und Spin . . . . . . . . . . . . . . 2.11 Quantenelektrodynamik (QED) . . . . . . . . . . 2.11.1 Kopplung an geladene Felder . . . . . . . 1 . . . . . . . . . . . . 3.6 3.7 3.5.1 Bildwechsel in der Quantentheorie . . . . . . . . . . . . . 3.5.2 Fermis Goldene Regel . . . . . . . . . . . . . . . . . . . . 3.5.3 Die T -Matrix . . . . . . . . . . . . . . . . . . . . . . . . . Green-Funktionen bei T = 0 . . . . . . . . . . . . . . . . . . . . . 3.6.1 Green-Funktion für die Einteilchen-Schrödinger-Gleichung 3.6.2 Einteilchen-Green-Funktionen für das Vielteilchensystem . 3.6.3 Spektralfunktion . . . . . . . . . . . . . . . . . . . . . . . Bewegungsgleichung für die Green-Funktion . . . . . . . . . . . . 3.7.1 Wechselwirkungsfreier Fall . . . . . . . . . . . . . . . . . . 3.7.2 Resonantes Niveau (resonant-level model) . . . . . . . . . 3.7.3 Anderson-Modell für magnetische Störstellen . . . . . . . 4 Vielteilchentheorie bei T > 0 4.1 Wechselwirkungsfreie Teilchen . . . . . . . . . . . . . . . . . 4.2 Mean-Field-Theorie . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Hartree-Fock-Näherung . . . . . . . . . . . . . . . . 4.2.2 Stoner-Theorie des Ferromagnetismus in Metallen . 4.3 Lineare-Antwort-Theorie . . . . . . . . . . . . . . . . . . . . 4.3.1 Kubo-Formel für die dielektrische Funktion . . . . . 4.3.2 Bewegungsgleichung für Lineare-Antwort-Funktionen 4.4 Matsubara-Green-Funktion . . . . . . . . . . . . . . . . . . 4.4.1 Imaginäre-Zeit-Formalismus . . . . . . . . . . . . . . 4.4.2 Einteilchen-Matsubara-Green-Funktionen . . . . . . 4.4.3 Rechnungen mit Matsubara-Green-Funktionen . . . (a) Isolierte Singularitäten . . . . . . . . . . . . . . . (b) Schnitte . . . . . . . . . . . . . . . . . . . . . . . 4.4.4 Bewegungsgleichungen . . . . . . . . . . . . . . . . . 4.5 Wicks Theorem . . . . . . . . . . . . . . . . . . . . . . . . . 4.6 Potential-Streuung . . . . . . . . . . . . . . . . . . . . . . . 4.6.1 Feynman-Diagramme . . . . . . . . . . . . . . . . . 4.6.2 Elastische Streuung . . . . . . . . . . . . . . . . . . 4.6.3 Störstellen-Streuung . . . . . . . . . . . . . . . . . . 4.6.4 Selbstenergie . . . . . . . . . . . . . . . . . . . . . . 4.6.5 Erste Bornsche Näherung . . . . . . . . . . . . . . . (a) Die volle Bornsche Näherung . . . . . . . . . . . (b) Die selbstkonsistente Bornsche Näherung . . . . 4.7 Elektron-Elektron-Wechselwirkung . . . . . . . . . . . . . . 4.7.1 Selbstenergie . . . . . . . . . . . . . . . . . . . . . . 4.7.2 Die Hartree-Selbstenergie . . . . . . . . . . . . . . . 4.7.3 Die Fock-Selbstenergie . . . . . . . . . . . . . . . . . 4.8 Das wechselwirkende Elektronengas . . . . . . . . . . . . . . 4.9 Landau-Theorie der Fermi-Flüssigkeiten . . . . . . . . . . . 4.10 Elektron-Phonon-Wechselwirkung . . . . . . . . . . . . . . . 4.10.1 Einschub: Jellium-Phononen . . . . . . . . . . . . . . 4.10.2 Coulomb- und Elektron-Phonon-Wechselwirkung . . 4.10.3 Abschirmung der effektiven Wechselwirkung . . . . . 4.11 Supraleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 4.11.1 Cooper-Instabilität . . . . . . . . . . . . . . . . . . . 4.11.2 Der BCS-Grundzustand . . . . . . . . . . . . . . . . 4.11.3 BCS-Theorie . . . . . . . . . . . . . . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 70 72 73 74 76 80 84 85 86 87 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 91 92 94 95 98 101 102 104 104 109 110 110 112 113 115 116 118 119 120 125 126 128 128 129 134 135 135 136 141 142 143 145 145 147 147 150 151 5 Statistische Physik im Nichtgleichgewicht 5.1 Elektronischer Transport . . . . . . . . . . . . . . . . . . . . . 5.1.1 Lineare-Antwort-Theorie für die Leitfähigkeit . . . . . 5.1.2 Anwendung: Störstellenstreuung . . . . . . . . . . . . 5.2 Brownsche Bewegung und Diffusion . . . . . . . . . . . . . . . 5.3 Die Langevin-Gleichung . . . . . . . . . . . . . . . . . . . . . 5.4 Die Boltzmann-Gleichung . . . . . . . . . . . . . . . . . . . . 5.4.1 Relaxationszeitansatz . . . . . . . . . . . . . . . . . . 5.4.2 Wigner-Funktion und Quanten-Boltzmann-Gleichung . A Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 155 155 157 161 162 164 165 165 168 3 Kapitel 1 Einleitung 1.1 Wozu Vielteilchentheorie? Es ist nicht zu bestreiten, dass die Welt um uns herum aus vielen Teilchen besteht. Ein Mol einer Substanz enthält bekanntlich ungefähr NL = 6 × 1023 Atome oder Moleküle. Diese Loschmidt-Zahl gibt an, was wir hier mit „vielen Teilchen“ meinen. Die Atome und Moleküle bestehen ihrerseits aus Atomkernen und Elektronen. Wir wollen verstehen, wie sich Systeme aus vielen Teilchen verhalten. Wie üblich in der Physik betrachten wir zunächst relativ einfache Systeme, z.B. saubere Kristalle. Selbst diese sind aber nicht einfach. Dazu ein Beispiel: Wir betrachten ein System bestehend aus N = NL schweren Teilchen mit Ladung +6e und Spin Null und 6N leichten Teilchen mit der Ladung −e und Spin 1/2. (Was für ein System ist das? Ein Modell für Kohlenstoff: N Kohlenstoff-12-Kerne und 6N Elektronen. Die innere Struktur der Kerne ist hier unerheblich, es sind für uns einfach Teilchen mit der Ladung +6e und der Masse 12u.) Wir lassen diese Teilchen bei einer bestimmten Temperatur T und einem bestimmten Druck p ins Gleichgewicht kommen, d.h. wir warten lange genug. Das System ist einfach in dem Sinne, dass es nur aus zwei Arten von Teilchen besteht, die jeweils identisch und nur durch drei Größen charakterisiert sind: Masse, Ladung und Spin. Wir müssten doch voraussagen können, welche Eigenschaften das System im Gleichgewicht aufweist, oder? Aber abhängig von p und T ist es entweder Graphit (geschichteter Kristall, weich, schlechtes Metall, opak) oder Diamant (kubischer Kristall, sehr hart, Isolator, durchsichtig). War das vorauszusehen? Was passiert, wenn wir stattdessen N schwere Teilchen der Ladung +7e und 7N leichte Teilchen der Ladung −e haben? Offenbar ergeben sich für Systeme mit vielen Teilchen neue Effekte, die aus den Eigenschaften der Konstituenten nicht unmittelbar abzulesen waren. Das Ganze ist mehr als die Summe seiner Teile. Wir wollen also Systeme mit vielen Teilchen verstehen können. Das führt auf eine zweite Frage: Benötigen wir dafür wirklich neue Werkzeuge? Reichen die bisher betrachteten Methoden, v.a. der Quantenmechanik, nicht aus? In der Physik der kondensierten Materie kennen wir, anders als in der Hochenergiephysik, den Hamiltonian genau, jedenfalls in der für die allermeisten Eigenschaften relevanten Vereinfachung. Er lautet für das Beispiel von Kohlenstoff-12 H = N 6N 1 X 2 1 X 2 (6e)2 X 1 Pi + p + 2M12 i=1 2me j=1 j 4πε0 0 0 |Ri − Ri0 | ii ,i<i 2 + e 4πε0 X jj 0 ,j<j 0 2 6e 1 − |rj − rj 0 | 4πε0 X ij 1 |Ri − rj | (1.1) in einer offensichtlichen Notation für die Orte und Impulse der Kerne und der Elektronen. (Welche Effekte sind hier vernachlässigt? Relativistische Effekte [siehe unten] wie z.B. Spin-Bahn-Kopplung, wir haben 4 auch kein externes elektromagnetisches Feld eingebaut.) Um zu sehen, ob wir ein Vielteilchensystem mit den Methoden der Quantenmechanik-Vorlesung lösen können, untersuchen wir ein sehr viel einfacheres Vielteilchensystem: Wir betrachten ein Schachbrett (8 × 8 Plätze) mit einem elektronischen Orbital auf jedem Feld. Welche Zustände eines einzelnen Feldes sind dann möglich? Wieso? Auf jedem Feld kann entweder kein Elektron sitzen oder eines mit Spin auf oder eines mit Spin ab oder zwei mit Spins auf und ab. Andere Konfigurationen sind durch das Pauli-Prinzip für Fermionen ausgeschlossen (siehe unten). Wieviele Zustände hat also das Gesamtsystem? Das Schachbrett-Modell hat 464 = 2128 Zustände. D.h. der Hilbertraum hat 2128 Dimensionen. Das ist eine große Zahl! Den Hamilton-Operator kann man als Matrix der Dimension 2128 × 2128 schreiben – oder auch nicht, weil man nicht genug Papier und Zeit dafür hat. Um die Eigenzustände des Systems zu erhalten, müssten wir diese Matrix diagonalisieren. Das ist offensichtlich unmöglich, selbst wenn wir aus allen Teilchen im beobachtbaren Universum einen Computer bauen würden. Das Schachbrett ist ein sehr bescheidenes Modell für ein Vielteilchensystem und dennoch i.A. viel zu groß für eine exakte Lösung. Wir werden sehen, dass man in manchen Fällen solche Systeme dennoch exakt diagonalisieren kann, z.B. wenn die Elektronen nicht wechselwirken (ziemlich einfach) oder in einer eindimensionalen Kette mit nur lokaler Wechselwirkung (schwierig). Da dies offensichtlich nicht mit roher Gewalt erfolgen kann, erfordert die Lösung Einsicht in die Physik des Systems. In den allermeisten Fällen können wir aber keine exakte Lösung finden. Wir benötigen also Methoden, die 1. Näherungen beinhalten und 2. es umgehen, alle Zustände des Systems explizit behandeln zu müssen. Welcher Zweig der Physik behandelt das zweite Problem? Die Statistische Physik, daher benötigen wir einige Konzepte aus dieser Vorlesung. Es stellt sich heraus, dass Methoden der Quantenfeldtheorie, die überwiegend zur Beschreibung von Elementarteilchen entwickelt wurde, auch für Vielteilchensysteme sehr nützlich sind. (Dass das kein Zufall ist, wird kurz im folgenden Abschnitt diskutiert.) Wir beginnen die Vorlesung daher mit einer Einführung in die Quantenfeldtheorie. 1.2 Vielteilchensysteme und Emergenz Wir wollen das Thema „Das Ganze ist mehr als die Summe seiner Teile“ noch etwas weiter diskutieren, in Anlehnung an das Buch von X.-G. Wen. Wir betrachten einen Kristall, sagen wir Diamant, bei niedrigen und bei hohen Energien. Ein Experiment bei hohen Energien, z.B. Beschuss der Probe mit schnellen Ionen, wird Atome aus dem Kristall herausbrechen. Dafür sind offenbar die Bindungen zwischen den Atomen, also Physik auf atomaren Längenskalen, entscheidend. Bei Streuung hochenergetischer elektromagnetischer (Röntgen-) Strahlung bleibt der Kristall intakt, aber die Strahlung „sieht“ das Kristallgitter, da die Wellenlänge kürzer ist als der atomare Abstand. Die Röntgen-Strahlung wird am Gitter gestreut. Eigenschaften auf atomarer Skala sind wiederum wichtig. Diese werden bestimmt von stark miteinander wechselwirkenden Atomkernen und Elektronen und sind kompliziert und systemabhängig. Ganz anders bei niedrigen Energien oder niedrigen Temperaturen. Die einzigen Anregungen von Diamant bei niedrigen Temperaturen sind Gitterschwingungen des Kristalls. Es zeigt sich, dass diese quantisiert sind; die Quanten der Gitterschwingungen sind die Phononen (in Analogie zu den Quanten des elektromagnetischen Feldes, den Photonen). Phononen sind spin-lose (skalare) Bosonen (siehe unten) mit, bei niedrigen Energien, linearer Energie-Impuls-Relation, E = cS |k| (k ist der Wellenvektor, cS ist die Schallgeschwindigkeit). Die Wechselwirkung zwischen Phononen ist schwach. Die Physik ist einfach und universell; wenn wir Silizium oder Schwefel oder (festen) Sauerstoff statt Diamant betrachten, finden wir ebensolche Phononen, nur cS ist systemabhängig. Die niederenergetischen Phononen sind also einfache kollektive Anregungen eines komplexen Vielteilchensystems. Wen diskutiert die interessante Idee, dass die uns bekannten Elementarteilchen ebenfalls 5 kollektive Anregungen eines komplexen fundamentaleren Systems sind. Wens Hauptbeitrag zu dieser Forschungsrichtung ist, dass er nicht nur skalare Bosonen (wie die Phononen), sondern auch Fermionen und ein elektromagnetisches Feld als kollektive Anregungen erklären kann. Das in diesem Fall zu Grunde liegende System, um dessen kollektive Anregungen es geht, ist ein ziemlich kompliziertes Spin-Gitter. Wichtiger ist der prinzipielle Nachweis, dass die Elementarteilchen kollektive Anregungen sein könnten – und damit nicht elementar. Für uns wichtig ist die Erkenntnis, dass die Eigenschaften von Vielteilchensystemen bei niedrigen Energien und Temperaturen teilweise universell sind. Wir können daher mit einer einheitlichen Theorie z.B. die Gitterschwingungen aller Kristalle beschreiben. 1.3 Überblick Diese Vorlesung wird folgende Themen behandeln: Einführung in die Quantenfeldtheorie Es wird zunächst besprochen, was überhaupt eine klassische Feldtheorie ausmacht. Dann werden wesentliche Ideen der Quantisierung von Feldtheorien vorgestellt, vom einfachsten Fall, der linearen Kette, fortschreitend über skalare Felder und das Dirac-Feld zum elektromagnetischen Feld. Dieser Abschnitt endet mit der Behandlung von Grundlagen der Quantenelektrodynamik (QED). Als Literatur ist v.a. Huangs Buch zu empfehlen. Vielteilchentheorie bei der Temperatur Null Dieser Abschnitt behandelt Vielteilchentheorie für Festkörper, zunächst bei Temperatur T = 0. Die wichtige Methode der Green-Funktionen wird eingeführt. Als Literatur sind die Bücher von Bruus/Flensberg, Mahan und Nolting zu empfehlen. Vielteilchentheorie bei endlichen Temperaturen Hier gehen wir zu Systemen bei Temperaturen T > 0 über, in denen thermische Anregungen vorhanden sind. Dies wird voraussichtlich der umfangreichste Abschnitt sein. Dieselben Lehrbücher sind geeignet. Statistische Physik im Nichtgleichgewicht In diesem letzten Abschnitt geht es um Phänomene, die in Vielteilchensystemen auftreten, die sich nicht im thermischen Gleichgewicht befinden. Zunächst betrachten wir die Anwendung von Green-FunktionsMethoden aus dem vorigen Abschnitt auf elektronische Leitung. Danach werden Brownsche Bewegung und wichtige Grundgleichungen der semiklassischen (oder klassischen) Transporttheorie diskutiert. Als Literatur sind für den ersten Teil die genannten Bücher über Vielteilchentheorie und für den zweiten Kubo/Toda/Hashitsume zu empfehlen. 1.4 Danksagung Ich möchte nicht versäumen, Herrn Konrad Schmidt für die Erstellung der LaTeX-Version dieses Skripts zu danken. Weiterhin danke ich Herrn André Dankert für den Hinweis auf mehrere Fehler. 6 Kapitel 2 Quantenfeldtheorie Zunächst betrachten wir die klassische Feldtheorie. • Was ist das eigentlich? Eine Feldtheorie ist eine Theorie für die Dynamik von Feldern. • Was ist ein Feld? Allgemein eine Funktion des Ortes r und oft auch der Zeit t. Beispiele: Temperatur (skalares Feld), elektrisches Feld (Vektorfeld). 2.1 Lineare Kette Wir betrachten ein einfaches Beispiel: die lineare Kette. Die Teilchen (Kugeln) haben die Masse m, die Federn besitzen die Federkonstante κ. Wir betrachten nur Schwingungen in einer Raumrichtung, z.B. entlang der Kette (longitudinal). Wie in der klassischen Mechanik wählen wir auch hier für die Beschreibung den Lagrange-Formalismus, da dieser auch in der QFT wichtig ist, ¸ X ·1 1 2 L= mq̇i2 − κ (qi+1 − qi ) , (2.1) 2 2 i mit qi = Auslenkung von Teilchen i (eindimensional). Periodische Randbedingungen (Warum sind periodische Randbedingungen sinnvoll? Großes System → Randeffekte irrelevant): qi+N = qi ∀i. (2.2) Euler-Lagrange-Gleichung für qj : ∂L d ∂L − =0 dt ∂ q̇j ∂qj d ⇒ mq̇j + κ (qj − qj−1 ) + κ (qj − qj+1 ) = 0 dt κ κ (qj − qj+1 ) ⇒ q̈j = − (qj − qj−1 ) − m m κ ⇒ q̈j = (qj+1 + qj−1 − 2qi ) . m 7 (2.3) (2.4) (2.5) (2.6) Lösung: Fourier-Reihe (da periodisch), 1 X qj = √ Q (p) eipj . N p (2.7) Welche p sind erlaubt? Alle Terme müssen Randbedingung erfüllen: ! eip(j+N ) = eipj (2.8) eipN = 1 ⇒ pN = 2πn , n ∈ Z 2πn p= N ⇒ ⇒ (2.9) (2.10) Weiter ist qj diskret, daher ist die Fourier-Transformierte Q (p) periodisch, ipj ei(p+2π)j = eipj e|i2πj {z } = e (2.11) =1 ergibt keine neuen Lösungen, daher können wir p beschränken auf [0, 2π[ oder [−π, π[ beschränken. Also: N qj = 1 √ N 2 X Qn ei 2πn N j (2.12) n=− N 2 +1 (N gerade) Einsetzen in Bewegungsgleichung: ³ 2πn ´ 2πn 2πn 2πn 1 X κ 1 X √ √ Q̈n ei N j = Qn ei N j ei N j + e−i N j − 2 m N n N n für alle j ⇒ gilt für jeden Term: Q̈n = = = ´ 2πn κ ³ i 2πn j e N + e−i N j − 2 Qn mµ ¶ κ 2πn 2 cos − 2 Qn m N 4κ πn − sin2 Qn m N (2.13) (2.14) (2.15) (2.16) Wir erhalten entkoppelte Gleichungen für die Eigenmoden Qn (t). Die Lösung erfolgt durch den Ansatz Qn = e−iωt , 4κ πn ⇒ −ω 2 Qn = − sin2 Qn m N r ¯ κ ¯ πn ¯¯ ⇒ ω=2 ¯sin ¯ =: ωn m N (2.17) (2.18) (Eigenfrequenzen). Der Ansatz funktioniert also. Die Dispersionsrelation für ωn ist hier gezeigt: −N/2 nichts Neues nichts Neues ωn 0 12 1. Brillouin−Zone 8 N /2 n Bemerkung: physikalische Eigenmoden sind reell: µ Re e i 2πn N j−iωt Im ei ¶ 2πn cos j − ωt N µ ¶ 2πn cos j − ωt . N = 2πn N j−iωt = (2.19) (2.20) Kontinuums-Limes (Saite): N → ∞ und Gitterkonstante a → 0, so dass N a = R = Gesamtlänge fest. q (x, t) := qi (t) mit x = ia. (2.21) In der Lagrange-Funktion: qi (t) → q̇i (t) → qi+1 − qi X → ... → i Definiere eindimensionale Massendichte % := q (x, t) q̇ (x, t) ∂q (x, t) a ∂x ˆ 1 R dx . . . a 0 (2.22) (2.23) (2.24) (2.25) m a und Spannung σ := κa, dann ist " µ ¶2 µ ¶2 # ˆ 1 R ∂q ∂q L= dx % −σ 2 0 ∂t ∂x (2.26) =⇒ Bewegungsgleichung ∂2q ∂2q − σ = ∂t2 ∂x2 ∂2q 1 ∂2q ⇒ 2 − = ∂t cS ∂x2 % mit cS := 0 0 q (2.27) σ % Wellengleichung (2.28) Schallgeschwindigkeit (2.29) In Kürze: Lösungen sind die Eigenmoden ei(kx−ωt) mit ω = cS |k| und k = 2πn R , n ∈ Z. Da das System nicht diskret ist, gibt es keine 1. Brillouin-Zone, beliebig große k sind erlaubt und beschreiben unabhängige Moden. ω k 0 Für n ¿ N erhalten wir für die diskrete Kette ebenfalls r ¯ r ¯ ¯ κ ¯ κ ¯ πn ¯ πn ¯¯ ∼ ω = 2 ¯sin ¯=2 ¯ ¯ m N m N ¯ ¯ r ¯ 2πn ¯ σ ¯¯ πn ¯¯ ¯. = 2 ¯ ¯ = cS ¯¯ 2 %a N R ¯ Für kleine n ⇔ niedrige Frequenzen ω (und kleine k) ⇔ große Wellenlängen λ = wie eine kontinuierliche Saite. 9 (2.30) (2.31) 2π k verhält sich die Kette 2.2 Quantenmechanik der linearen Kette Gibt es ein eindeutiges Verfahren, ein klassisches System zu „quantisieren“, d.h., das entsprechende quantenmechanische System zu finden? Nein! Das kann nicht allgemein möglich sein, da die Quantenmechanik die allgemeinere Theorie ist und die klassische Mechanik ihr Grenzfall. (Umgekehrt geht es: Im Limes ~ → 0 erhält man aus einer Quantentheorie ihren klassischen Grenzfall.) Im Falle der linearen Kette „wissen“ wir aus Erfahrung, dass wir Ort qj und Impuls pj = mq̇j durch Operatoren ersetzen sollen, die die Vertauschungsrelation [pj , qk ] = −iδjk erfüllen. Wir setzen hier ~ = 1! Aus der Lagrange-Funktion L können wir die klassische Hamilton-Funktion ableiten: ¸ X · p2 1 2 i + κ (qi+1 − qi ) (2.32) H= 2m 2 i Quantisierung: [pj , qk ] = [pj , pk ] = [qj , qk ] = −iδjk 0 0 (2.33) (2.34) (2.35) pj , qj sind nun Operatoren auf dem Hilbertraum des Systems. Aus qj = pj = Qn = Pn = 2πn 1 X √ Qn ei N j N n 2πn 1 X √ Pn ei N j N n (2.36) (2.37) folgt die Umkehrtransformation 2πn 1 X √ qj e−i N j N j 2πn 1 X √ pj e−i N j . N n (2.38) (2.39) Man kann zeigen, dass Qn und Pn† die folgenden Vertauschungsrelationen erfüllen: £ † ¤ Pn , Qm = 1 X h (†) i +i 2πn j −i 2πm j pj , qk e N e N N jk | {z } = 1 X i 2π(n−m) j i N −i e = N δnm N j N (2.41) = −iδnm (2.42) (2.40) −iδjk Man findet auch Pn† = P−n und Q†n = Q−n . 10 Der Hamiltonian lautet " # ´ X p†j pj 1 ³ † † H = + κ qj+1 − qj (qj+1 − qj ) 2m 2 j = = = = = = (2.43) da pj , qj hermitesch · ³ 2πn ´ 2πn 2πn 1 X X Pn† Pn0 −i 2πn j+i 2πn0 j 1 N + κQ†n Qn0 e−i N j e−i N − e−i N j e N N n,n0 j 2m 2 ³ 2πn0 2πn0 ´i 2πn0 × ei N j ei N − ei N j · ³ ´¸ 2π(n−n0) 1 X X Pn† Pn0 −i 2π(n−n0) j 1 † −i j −i 2πn i 2πn0 N N N N e + κQn Qn0 e 1−e −e +1 N n,n0 j 2m 2 · † ³ ´¸ 2πn0 2πn 1 X 1 Pn Pn0 N δnn0 + κQ†n Qn0 2 − ei N − e−i N N n,n0 2m 2 · ¸ X P † Pn πn † n + 2κ sin2 Qn Qn 2m N n · ¸ X 1 1 Pn† Pn + mωn2 Q†n Qn 2m 2 n Sind die Gleichungen nun entkoppelt? Nicht ganz: n und − n mischen noch. ¸ X· 1 1 2 1 1 1 1 2 2 † 2 † † 2 † P + mω0 Q0 + P Pn + mωn Qn Qn + Pn Pn + mωn Qn Qn 2m 0 2 2m n 2 2m 2 n>0 (2.44) (2.45) (2.46) (2.47) (2.48) (2.49) da Q−n = Q†n etc. und somit Q0 , P0 hermitesch. Seien Qn =: Pn =: Q1,n + iQ2,n √ 2 P1,n + iP2,n √ 2 für n > 0 (2.50) mit Qα,n , Pα,n hermitesch. Dann gilt Q1,n = Q2,n = P1,n = P2,n = Qn + Q†n √ , 2 Qn − Q†n √ , i 2 Pn + Pn† √ , 2 Pn − Pn† √ . i 2 Dies entspricht der klassischen Abbildung auf reelle (sin, cos) Lösungen. ¸ X· 1 ¡ ¢ 1 ¡ 2 ¢ 1 2 1 2 2 2 2 2 2 ⇒H= P + mω0 Q0 + P + P2,n + mωn Q1,n + Q2,n . 2m 0 2 2m 1,n 2 n>0 (2.51) (2.52) (2.53) (2.54) (2.55) Man zeigt auch, dass [Pα,n , Qβ,m ] = −iδαβ δnm für n, m > 0. (Hier α, β = 1, 2.) Wir erhalten nun einen Satz entkoppelter harmonischer Oszillatoren. Die Lösung ist bekannt: Die Eigenenergien lauten µ ¶ X µ ¶ X µ ¶ 1 1 1 E = ω0 n0 + + ωn n1,n + + ωn n2,n + (2.56) |{z} 2 2 2 n>0 n>0 =0 mit n0 , n11 , n12 , . . . , n21 , . . . = 0, 1, 2, . . . 11 Jede Mode kann 0, 1, 2, . . .-fach angeregt sein. Diese quantisierten (diskreten) Anregungen sind die Phononen. Jede der reellen klassischen Moden ist 0, 1, 2, . . .-fach angeregt. Im Kontinuums-Limes wird ˆ R H= 0 " 1 2 1 dx p (x, t) + σ 2% 2 µ ∂q ∂x ¶2 # (2.57) mit [p (x, t) , q(x0 , t)] = −iδ (x − x0 ). Ansonsten ist die Diskussion analog. 2.3 Erste Quantisierung Wir wiederholen zunächst Material aus der Quantentheorie und wenden es dann systematischer als in der früheren Vorlesung auf Vielteilchensysteme an. Das ganze dient der Vorbereitung auf die wichtige Idee der „zweiten Quantisierung“. 2.3.1 Einteilchensysteme Der Zustand eines Quantensystems wird beschrieben durch einen Vektor |ψi aus einem Hilbertraum H. Die Zeitentwicklung des Zustandes wird durch die Schrödinger-Gleichung bestimmt: i d |ψi = H |ψi dt (2.58) mit dem Hamilton-Operator (Hamiltonian) H. H ist ein hermitescher linearer Operator auf H. Wie lautet die formale Lösung |ψ (t)i? |ψ (t)i = e−iHt |ψ (0)i , (2.59) wie man durch Einsetzen sieht. Man wählt |ψi normiert: ³ ´ † hψ|ψi ≡ |ψi · |ψi = 1. (2.60) Sind |ri die Eigenzustände des Ortsoperators rop , rop |ri = r |ri , (2.61) ψ (r) := hr|ψi . (2.62) so ist die zu |ψi gehörende Wellenfunktion Dies ist die Darstellung der Zustände in der Basis der |ri. Man kann jede Basis nehmen, z.B. von Impulseigenzuständen |ki, pop |ki = k |ki . (2.63) Die Vollständigkeitsrelationen lauten für diese Darstellungen: ˆ d3 r |ri hr| = 1, ˆ d3 k |ki hk| = 1. 12 (2.64) (2.65) Mit hr|ki = √1 V eik·r (V : Volumen) folgt ˆ ˆ 1 3 hk|ψi = d r hk|ri hr|ψi = d3 r √ e−ik·r ψ (r) V (2.66) Eine nützliche Basis ist die von Eigenzuständen des Hamiltonians H: H |νi = Eν |νi (2.67) (ν sind irgendwelche Quantenzahlen). Die |νi sind (unter Annahme eines diskreten Spektrums) vollständig: X |νi hν| = 1. (2.68) ν Die Eigenfunktionen von H sind uν (r) = hr|νi . (2.69) Darstellung eines beliebigen Zustands: |ψi = X |νi hν|ψi = X ν ν oder auch ψ (r) = X hν|ψi hr|νi = (2.70) Zahlen X ν hν|ψi |νi | {z } hν|ψi uν (r) . (2.71) ν Die Eigenzustände ändern sich mit der Zeit nur in ihrer Phase: νt |ν (t)i = e−iHt |ν (0)i = e|−iE {z } |ν (0)i , (2.72) Zahl so dass sich die Form der Wellenfunktion nicht ändert: uν (r, t) = νt e|−iE {z } uν (r, 0) (2.73) unabh. von r 2 Interpretation: |hν|ψi| ist die Wahrscheinlichkeit, dass sich das Teilchen im Zustand |νi befindet. 2 2 |hr|ψi| d3 r = |ψ (r)| d3 r (2.74) ist die Wahrscheinlichkeit, dass sich das Teilchen im Volumenelement d3 r um den Punkt r befindet. Für Eigenzustände von H ist ¯ ¯2 2 2 2 |uν (r, t)| = ¯e−iEν t ¯ |uν (r, 0)| = |uν (r, 0)| (2.75) zeitunabhängig. 2.3.2 Vielteilchensysteme Für mehr als ein Teilchen brauchen wir eine zusätzliche Annahme darüber, wie wir Zustände beschreiben wollen. Formal: Was ist der Hilbert-Raum für mehrere Teilchen? Für zwei Teilchen ist H2 = H ⊗ H (äußeres Produkt) – d.h. jedes der Teilchen kann in jedem Einteilchenzustand (aus H) sein, egal was alle anderen Teilchen tun. Jedes Teilchen hat einen vollständigen Einteilchen-Raum H zur Verfügung. HN = H ⊗ . . . ⊗ H . {z } | (2.76) N -mal Da |ri eine Basis von H bilden, ist die Ortsbasis von HN : |r1 i |r2 i |r1 i |r2 i |r3 i · · · |rN i ≡ . =: |r1 , r2 , . . . , rN i ∈ HN . |{z} |{z} .. im im 1. H 2. H |rN i 13 (2.77) Ortsdarstellung von Zuständen: ψ (r1 , r2 , . . . , rN ) := hr1 , r2 , . . . , rN |ψi und 2 |ψ (r1 , r2 , . . . , rN )| d3 r1 · · · d3 rN 3 (2.78) (2.79) 3 ist die Wahrscheinlichkeit, Teilchen 1 in d r1 um r1 , Teilchen 2 in d r2 um r2 usw. zu finden. Wir können eine beliebige Basis von Einteilchenzuständen |νi verwenden: |ν1 , ν2 , . . . νN i := |ν1 i |ν2 i · · · |νN i X |ν1 , ν2 , . . . νN i hν1 , ν2 , . . . νN |ψi |ψi = (2.80) (2.81) ν1 ,ν2 ,...,νN X = hν1 , ν2 , . . . νN |ψi |ν1 , ν2 , . . . νN i (2.82) ν1 ,...,νN ⇒ ψ (r1 , r2 , . . . , rN ) = = hr1 , r2 , . . . , rN |ψi X hν1 , ν2 , . . . νN |ψi uν1 (r1 ) uν2 (r2 ) · · · uνN (rN ) . | {z } ν ,...,ν 1 2.3.3 N (2.83) (2.84) Zahlen Ununterscheidbarkeit Wir haben es oft mit ununterscheidbaren Teilchen zu tun: Alle Elektronen sind identisch. Man kann bei einem Streuexperiment nicht entscheiden, welches herauskommende Elektron welches war. Nicht nur nicht in der Praxis, sondern prinzipiell nicht. Für ununterscheidbare Teilchen muss der Zustand gleich bleiben, wenn zwei Teilchen vertauscht werden. |ψi darf sich also nur um einen konstanten Faktor ändern: ψ (r1 , . . . , rj , . . . rk , . . . , rN ) = λψ (r1 , . . . , rk , . . . rj , . . . , rN ) (2.85) Zweimalige Vertauschung ist die Identitätsoperation: ψ (r1 , . . . , rj , . . . rk , . . . , rN ) = λ2 ψ (r1 , . . . , rj , . . . rk , . . . , rN ) ⇒ λ2 = 1 ⇒ λ = ±1 als einzige Möglichkeiten. Für λ = +1 nennen wir Teilchen Bosonen, für λ = −1 Fermionen. Die oben gefundene Darstellung X hν1 , ν2 , . . . νN |ψi uν1 (r1 ) · · · uνN (rN ) ψ (r1 , r2 , . . . , rN ) = (2.86) (2.87) (2.88) ν1 ,...,νN ist für identische Teilchen problematisch. Wieso? Diese Wellenfunktion erfüllt i.A. nicht die fermionische oder bosonische Relation für Vertauschung der rj . Diese Relationen führen auf Zusatzbedingungen für die Koeffizienten hν1 , ν2 , . . . νN |ψi. Es ist wünschenswert, diese Bedingungen gleich in die Basis einzubauen. Das kann man durch (Anti-) Symmetrisierung erreichen: Definiere ¯ ¯ ¯ uν1 (r1 ) uν1 (r2 ) · · · uν1 (rN ) ¯ ¯ ¯ ¯ uν2 (r1 ) uν2 (r2 ) · · · uν2 (rN ) ¯ ¯ ¯ Ŝ± uν1 (r1 ) · · · uνN (rN ) := ¯ (2.89) ¯ .. .. .. .. ¯ ¯ . . . . ¯ ¯ ¯ uν (r1 ) uν (r2 ) · · · uν (rN ) ¯ N N N ± 14 wobei |. . .|− die Determinante ist: Ŝ− uν1 (r1 ) · · · uνN (rN ) = X sgn (p) uν1 (rp1 ) · · · uνN (rpN ) , (2.90) p∈SN wobei SN die Gruppe aller Permutationen (p (1) , p (2) , . . . , p (N )) der N Elemente (1, 2, . . . , N ) ist („Symmetrische Gruppe“) und sgn (p) das Vorzeichen der Permutation p. (Bsp.: sgn (2, 1, 3) = −1, da eine Verp tauschung nötig und eins ungerade ist. Man schreibt auch (−1) .) Dies trifft für Fermionen zu, |. . .|− heißt Slater-Determinante. Wir sehen sofort, dass für zwei Fermionen in gleichen Einteilchenzuständen, z.B. νj = νk , die j-te und k-te Zeile der Determinante gleich sind. Was wissen wir über die Determinante in diesem Fall? Die Zeilen sind linear abhängig. ⇒ |. . .|− = 0 ist kein Zustand! Es gibt also keine Zustände mit νj = νk für j 6= k. Das ist die übliche Formulierung des Pauli-Prinzips. Sie folgt aus der fundamentalen Bedingung der Antisymmetrie der Wellenfunktion. Andererseits ist |. . .|+ die sog. Permanente: Ŝ+ uν1 (r1 ) · · · uνN (rN ) = X uν1 (rp1 ) · · · uνN (rpN ) (2.91) p∈SN d.h. die „vorzeichenlose Determinante“. Diese gilt für Bosonen. Wir können jetzt in diesen (anti-) symmetrisierten Basiszuständen entwickeln: X ψ (r1 , r2 , . . . , rN ) = Cν1 ,...,νN Ŝ± uν1 (r1 ) · · · uνN (rN ) | {z } ν ,...,ν 1 N (2.92) Zahlen Bemerkung: Ŝ± uν1 (r1 ) · · · uνN (rN ) sind noch nicht normiert. Wir betrachten den Hamiltonian jetzt konkreter: H T = T +V = N X p2i 2m i=1 (2.93) in Ortsdarstellung ↓ mit pi = −i∇i ≡ −i ∂/∂r (2.94) Für identische Teilchen muss V symmetrisch unter Vertauschung von Teilchen sein (sonst wären sie experimentell unterscheidbar). V kann i.A. Beiträge enthalten, die von 1, 2, 3, . . . Einteilchenzuständen abhängen. Wir schreiben V = V1 + V2 + V3 + . . . (2.95) Physikalisch ist V1 das äußere Potential, V2 ist die 2-Teilchen Wechselwirkung. Am besten in Ortsdarstellung: V (r1 , . . . , rN ) := = hr1 , . . . , rN |V |r1 , . . . , rN i X 1X 1 Vi (ri ) + V2 (ri , rj ) + 2 3! i ij i6=j X (2.96) V3 (ri , rj , rk ) + . . . , (2.97) ijk i6=j6=k6=i was explizit symmetrisch ist. Beachte, dass wir z.B. Terme der Art V2 (ri , ri ) ausschließen. Solche sind bereits in V1 enthalten. Beispiel: Die Coulomb-Wechselwirkung lautet V2 (ri , rj ) = 1 e2 . 4πε0 |ri − rj | Es ist nützlich für später, den Hamiltonian durch die Einteilchenzustände |νi auszudrücken: X (1) X X X (1) 0 0 V1 = Vi = |ν1 , . . . , νN i hν1 , . . . , νN | Vi |ν10 , . . . , νN i hν10 , . . . , νN |. i i ν1 ,...,νN 0 ν10 ,...,νN 15 (2.98) (2.99) (1) Vi wirkt nur auf |νi i , |νi0 i, die anderen Summen können ausgeführt werden: XX X (1) |νi i hνi | Vi |νi0 i hνi0 | . ... = νi i (2.100) νi0 (1) Unsere Notation ist hier ein bisschen unsauber; Vi ist jetzt plötzlich ein Operator auf H, nicht mehr auf HN . D E XX (1) |νi i νi |Vi |νi0 hνi0 | . ... = (2.101) | {z } i νi νi0 ´ = d3 r u ∗ ν (r)V1 (r)uν 0 (r)=:Vν i i 0 i νi Das funktioniert für alle Einteilchen-Terme, z.B. auch für die kinetische Energie XX Tνi νi0 |νi i hνi0 | . T = | {z } i ν ν0 i i (2.102) ´ = d3 r u∗ ν (r)T (r,−i∇)uν 0 (r) i i Für 2, 3, . . .-Teilchen-Terme bleiben 2, 3, . . . bras bzw. kets übrig: z.B. V2 = ¯ ®­ ¯ 1X X (1) |νi i |νj i hνj | hνi | Vi |νi0 i ¯νj0 νj0 ¯ hνi0 | . 2 ij {z } | 0 0 i6=j νi νj νi νj (2.103) ´ ∗ = d3 ri d3 rj u∗ ν (rj )uν (ri )V2 (ri rj )uν 0 (ri )uν 0 (rj ) =: Vν j i i j 0 0 i νj νi νj ↑ Beachte Reihenfolge (Konvention) 2.4 Zweite Quantisierung Die bisherige Notation ist ungünstig, wenn sich die Teilchenzahl ändern kann. In diesem Fall wäre eine Darstellung nützlich, die explizit die Zahl von Teilchen in bestimmten (Einteilchen-) Zuständen angibt. Das ist die „Zweite Quantisierung“, in der im Übrigen gar nichts zweimal quantisiert wird (historische Bezeichnung). Sie ist auch nützlich, wenn sich die Teilchenzahl nicht ändert. Der Zustandsraum soll Zustände mit Teilchenzahlen N = 0, 1, . . . enthalten, HN reicht also nicht. Wir führen den Fock-Raum ein: (2.104) F := H0 ⊕ H1 ⊕ H2 ⊕ . . . ↑ direkte Summe, d.h. die Basis von S∞ F ist N =0 (Basis von HN ) Definiere Teilchenzahloperatoren nop ν für Einteilchenzustände |νi, so dass nop ν Ŝ± uν1 (r1 ) · · · uνN (rN ) = nν Ŝ± uν1 (r1 ) · · · uνN (rN ) (2.105) und nν ist die Anzahl von ν in der Folge {ν1 , . . . , νN }, d.h. nν gibt an, wie oft ν in {ν1 , . . . , νN } enthalten ist. Wegen der (Anti-) Symmetrisierung ist der Basiszustand Ŝ± uν1 (r1 ) · · · uνN (rN ) durch Angabe der Besetzungszahlen für alle Einteilchenzustände bis auf die Phase eindeutig bestimmt. Wir schreiben für die (normierten) Basiszustände |n1 , n2 , . . .i mit n1 + n2 + . . . = N. (2.106) Es ist sinnvoll, Operatoren einzuführen, die die Teilchenzahlen ändern. 2.4.1 Bosonen Definiere den Erzeugungsoperator b†n durch b†ν |. . . , nν , . . .i = Bn∗ ν +1 |. . . , nν + 1, . . .i | {z } ↑ Proportionalitätskonstante noch zu bestimmen 16 (2.107) ¡ ¢† dann ist der Vernichtungsoperator b†ν = bν , mit Es folgt bν |. . . , nν + 1, . . .i = Bnν +1 |. . . , nν , . . .i . (2.108) b†ν bν |. . . , nν , . . .i = Bn∗ ν Bnν |. . . , nν , . . .i . (2.109) b†ν bν |. . . , nν , . . .i ist ein Eigenzustand von mit Eigenwert kein Teilchen im Einteilchenzustand |νi ist: Bn∗ ν Bnν . bν muss den Zustand zerstören, wenn bν |. . . , nν = 0, . . .i = 0 ⇒ B0 = 0 (2.110) √ Es ist nützlich zu verlangen, dass Bn∗ Bn := n und Bn ∈ R ⇒ Bn = n (das ist ein Teil der Definition von bν , b†ν ). Also √ b†ν |. . . , nν , . . .i = nν + 1 |. . . , nν + 1, . . .i (2.111) √ bν |. . . , nν , . . .i = nν |. . . , nν − 1, . . .i (2.112) b†ν bν |. . . , nν , . . .i = nν |. . . , nν , . . .i (2.113) b†ν bν ist der Teilchenzahloperator nop ν ! Weiter folgt £ ¤ ¡ ¢ bν , b†ν |. . . , nν , . . .i ≡ bν b†ν − b†ν bν |. . . , nν , . . .i Da dies für alle Zustände gilt, ist = ((nν + 1) − nν ) |. . . , nν , . . .i = |. . . , nν , . . .i £ ¤ bν , b†ν = 1 (2.114) (2.115) (2.116) Operatoren, für verschiedene Einteilchenzustände ν, ν 0 kommutieren, da der Vielteilchenzustand symmetrisch unter Vertauschung von Teilchen ist. Um die Kommutatoren von z.B. b†ν und b†ν 0 zu finden, müssen wir uns an die Symmetrie des Vielteilchenzustandes unter Vertauschung erinnern: Wir hatten ψ (. . . , rj , . . . , rk , . . .) = ψ (. . . , rk , . . . , rj , . . .) (2.117) für Bosonen. Das können wir auch schreiben als h. . . , rj , . . . , rk , . . . |ψi = h. . . , rk , . . . , rj , . . . |ψi . (2.118) Aber diese Symmetrie gilt für jede Basis (die Ortsbasis ist nicht bevorzugt), also auch für die Produktbasis gebildet aus einem vollständigen Satz von Einteilchenzuständen |νi. Die Basisvektoren sind (Vgl. S. 13) |ν1 i |ν1 i |ν2 i · · · |νN i ≡ ... = |ν1 , ν2 , . . . , νN i ∈ HN (2.119) |νN i Für Bosonen gilt also h. . . , νj , . . . , νk , . . . |ψi = h. . . , νk , . . . , νj , . . . |ψi (2.120) Nun beachte, dass b†ν |ν1 , . . . , νN i = = = und b† |ν1 i · · · |νN i √ν nν + 1 |νi |ν1 i · · · |νN i √ nν + 1 |ν, ν1 , . . . , νN i b†ν b†ν 0 |ν1 , . . . , νN i = √ (2.121) (∈ HN +1 ) √ nν + 1 nν 0 + 1 |ν, ν 0 , ν1 , . . . , νN i 17 (2.122) (2.123) (2.124) aber für Bosonen kommt es nicht auf die Reihenfolge der ν an √ √ ... = nν 0 + 1 nν + 1 |ν 0 , ν, ν1 , . . . , νN i = b†ν b†ν 0 ⇒ = h i = ⇒ b†ν , b†ν 0 b†ν 0 b†ν b†ν 0 b†ν |ν1 , . . . , νN i ∀ |ν1 , . . . , νN i (2.125) (2.126) (2.127) 0. (2.128) h i Ähnlich für [bν , bν 0 ] und bν , b†ν 0 . Wir haben daher h i bν , b†ν 0 = δνν 0 , (2.129) [bν , bν 0 ] = 0, h i b†ν , b†ν 0 = 0. 2.4.2 (2.130) (2.131) Fermionen Für Fermionen hatten wir gesehen, dass jeder Einteilchenzustand ν höchstens einfach besetzt sein kann. Also nν = 0, 1 ∀ν. (2.132) Wir definieren zunächst wie für Bosonen c†ν |. . . , nν , . . .i ⇒ cν |. . . , nν + 1, . . .i ⇒ c†ν cν |. . . , nν , . . .i = Cn∗ν +1 |. . . , nν + 1, . . .i = Cnν +1 |. . . , nν , . . .i = Cn∗ν Cnν |. . . , nν , . . .i (2.133) (2.134) (2.135) Offenbar ist C0 = 0. Für Fermionen gilt aber außerdem c†ν |. . . , nν = 1, . . .i ⇒ C2∗ = 0 = 0 (2.136) (2.137) Wir können praktischerweise definieren C1 = 1 und erhalten: c†ν |. . . , nν c†ν |. . . , nν cν |. . . , nν cν |. . . , nν = 0, . . .i = 1, . . .i = 0, . . .i = 1, . . .i ⇒ c†ν cν = |. . . , nν = 1, . . .i = 0 = 0 = |. . . , nν = 0, . . .i = nop wie für Bosonen. ν (2.138) (2.139) (2.140) (2.141) (2.142) Es folgt ¡ ¢ ª cν , c†ν |. . . , nν , . . .i := cν c†ν + c†ν cν |. . . , nν , . . .i | {z } Antikommutator einer der Terme ergibt 1, der andere 0 © ⇒ © cν , c†ν ª = |. . . , nν , . . .i = 1 ∀ |. . . , nν , . . .i (2.143) (2.144) (2.145) Für Fermionen macht es aber einen Unterschied, welches Teilchen zuerst erzeugt wird. Mit der Produktbasis |ν1 , . . . , νN i := |ν1 i |ν2 i · · · |νN i (2.146) gilt nämlich h. . . , νj , . . . , νk , . . . |ψi = − h. . . , νk , . . . , νj , . . . |ψi ↑ (2.147) (Antisymmetrie) da |. . . , νj , . . . , νk , . . .i = 18 − |. . . , νk , . . . , νj , . . .i . (2.148) Also folgt c†ν c†ν 0 |ν1 , . . . , νN i = Cn∗ν +1 Cn∗ν 0 +1 |ν, ν 0 , ν1 , . . . , νN i (2.149) = −Cn∗ν 0 +1 Cn∗ν +1 ↑ (2.150) = c†ν 0 c†ν |ν1 , . . . , νN i c†ν c†ν 0 ⇒ = n o ⇒ c†ν , c†ν 0 = 0 |ν , ν, ν1 , . . . , νN i ∀ |ν1 , . . . , νN i (2.151) −c†ν 0 c†ν (2.152) 0. (2.153) n o Analog für {cν , cν 0 } und cν , c†ν 0 . Insgesamt erhalten wir die Anti -Vertauschungsrelationen n o cν , c†ν 0 = δνν 0 , (2.154) {cν , cν 0 } = 0, n o c†ν , c†ν 0 = 0. (2.155) (2.156) © ª Es folgt sofort c†ν c†ν = 21 c†ν , c†ν = 0 – man kann keine zwei Fermionen im selben Zustand |νi erzeugen (Pauli-Prinzip). Für Bosonen und Fermionen definieren wir den Vakuum-Zustand |0i ≡ |vaci dadurch, dass er von allen bν bzw. cν vernichtet wird: bν |0i = 0 cν |0i = 0 ∀ν (2.157) Beachte: |0i ist nicht mit der Null 0 des Fock-Raums zu verwechseln! |0i ist der einzige Basisvektor des „Null-Teilchen-Hilbert-Raums“ H0 , h0|0i = 1 (normiert). (2.158) In der Vielteilchentheorie wird |0i oft nicht das echte Vakuum ohne Teilchen bezeichnen, sondern den Grundzustand eines Systems. Z.B. für die lineare Kette ist |0i der Zustand ohne Phononen, nicht der Zustand ohne Kette! Damit schreiben wir nun ³ ´n1 ³ ´n2 |n1 , n2 , . . .i = b†1 b†2 · · · |0i (Bosonen), (2.159) ³ ´n1 ³ ´n2 |n1 , n2 , . . .i = c†1 c†2 · · · |0i (Fermionen). (2.160) (Für Fermionen kommt es auf die Reihenfolge an, wir müssen eine Ordnung von Einteilchenzuständen festlegen und dann konsistent verwenden.) Achtung: diese Zustände sind noch nicht normiert. Die Eigenschaften der bν , cν stellen sicher, dass diese Zustände die korrekten (Anti-) Symmetrie-Eigenschaften haben. Nun war die Teilchenzahldarstellung |n1 , n2 , . . .i per Konstruktion eine Abkürzung für die Permanente bzw. Slater-Determinante (d.h. die Ortsdarstellung). Wir können daher für Bosonen schreiben ¯ ¯ ® ­ r1 , r2 , . . . , rN ¯b†ν1 b†ν2 · · · b†νN ¯ 0 = Ŝ+ uν1 (r1 ) uν2 (r2 ) · · · uνN (rN ) (2.161) = Ŝ+ hr1 |ν1 i hr2 |ν2 i · · · hrN |νN i (2.162) und damit D Teilchenzahldarstellung z }| {E r1 , r2 , . . . , rN | n1 , n2 , . . . D = ¯³ ´n1 ³ ´n2 ¯ E ¯ ¯ r1 , r2 , . . . , rN ¯ b†1 b†2 ···¯0 = Ŝ+ u1 (r1 ) u1 (r2 ) · · · u2 (rn1 +1 ) u2 (rn1 +2 ) · · · · · · {z }| {z } | n1 Terme Für Fermionen gilt entsprechend ¯ ¯ ® ­ r1 , r2 , . . . , rN ¯c†ν1 c†ν2 · · · c†νN ¯ 0 = = 19 (2.163) (2.164) n2 Terme Ŝ− uν1 (r1 ) uν2 (r2 ) · · · uνN (rN ) (2.165) Ŝ+ hr1 |ν1 i hr2 |ν2 i · · · hrN |νN i (2.166) und hr1 , r2 , . . . , rN |n1 , n2 , . . .i = = ¯³ ´n1 ³ ´n2 ¯ E D ¯ ¯ r1 , r2 , . . . , rN ¯ c†1 c†2 ···¯0 (2.167) Ŝ− u1 (r1 ) u2 (rn1 +1 ) · · · | {z } | {z } (2.168) wenn n1 =1 wenn n2 =1 2.4.3 Operatoren in zweiter Quantisierung Wir wollen den Hamiltonian durch Erzeugungs- bzw. Vernichtungsoperatoren ausdrücken. Wir schreiben ( bν für Bosonen aν := (2.169) cν für Fermionen. Zunächst für Einteilchen-Terme (T und V1 ): Wir hatten (s. S. 16) XX V1 = Vνν 0 |νi hν 0 | | {z } 0 i νν (2.170) wirkt auf Teilchen i Offenbar trägt dies nur bei, wenn Teilchen i im Zustand |ν 0 i war, der Operator verschiebt es dann in den Zustand |νi. Demnach gilt für Bosonen XX (2.171) Vνν 0 b†ν1 · · · b†ν · · · b†νN |0i V1 b†ν1 b†ν2 · · · b†νi · · · b†νN |0i = |{z} 0 i νν i-tes Teilchen Wir betrachten den Zustand νi . Dieser sei in b†ν1 · · · b†νN |0i ni -fach besetzt (ni = 1, 2, 3, . . . ; ni = 0 ergibt ¡ ¢ni −1 Null). Der Summand in (2.171) enthält dagegen b†ν b†νi . Dies wollen wir auf dieselbe Form bringen: ¡ ¢ni −1 b†ν b†νi = b†ν bνi b†νi ¡ † ¢ni −1 bνi n | {zi } (2.172) eins! = ⇒ ... = 1 † ¡ † ¢ni b bν b ni ν i νi X X 1 δν 0 νi b†ν bνi b†ν1 · · · b†νN |0i Vνν 0 ni 0 i (2.173) (2.174) νν P Ist νi ni -fach besetzt, enthält die Summe i aber ni identische Terme, die den Faktor 1/ni wegheben. Also X ... = Vνν 0 b†ν bν 0 b†ν1 · · · b†νN |0i (2.175) νν 0 gilt ∀ Zustände b†ν1 · · · b†νN |0i: X V1 = Vνν 0 b†ν bν 0 (2.176) Tνν 0 b†ν bν 0 (2.177) νν 0 Ebenso T = X νν 0 Entsprechend zeigt man V2 = 1 X Vν1 ν2 ν3 ν4 b†ν1 b†ν2 bν4 bν3 |{z} | {z } 2ν ν ν ν 1 2 3 4 (2.178) beachte Konvention Dieselben Darstellungen (mit b → c) ergeben sich für Fermionen, wenn man die Antikommutatoren korrekt behandelt. 20 2.4.4 Quantenfeldoperatoren Das bisher gesagte gilt im Wesentlichen für jede beliebige Basis {|νi} von Einteilchenzuständen. Ein wichtiger Spezialfall ist die Ortsbasis {|ri}. (Erinnerung: rop |ri = r |ri.) Definiere den Quantenfeldoperator X X Ψ(r) := hr|νi aν = uν (r) aν . (2.179) ↑ ↑ ν ν (großer Buchstabe Ψ) Vernichtungsoperator Dies hat die normale Form eines Basiswechsels. X X ∗ u∗ν (r) a†ν ⇔ Ψ† (r) = hr|νi a†ν = (2.180) ν ν Wir finden (a) für Bosonen: X £ ¤ Ψ (r1 ) , Ψ† (r2 ) = £ ¤ uν1 (r1 ) u∗ν2 (r2 ) bν1 , b†ν2 | {z } ν1 ν2 X = (2.181) =δν1 ν2 uν1 (r1 ) u∗ν1 (r2 ) (2.182) ν1 = δ (r1 − r2 ) (Vollständigkeit). (2.183) (b) für Fermionen: © ª Ψ (r1 ) , Ψ† (r2 ) = = X © ª uν1 (r1 ) u∗ν2 (r2 ) cν1 , c†ν2 | {z } ν1 ν2 X (2.184) =δν1 ν2 uν1 (r1 ) u∗ν1 (r2 ) (2.185) ν1 = δ (r1 − r2 ) . (2.186) Das oben für die Darstellung von Operatoren durch a, a† gesagte gilt entsprechend auch für die Ortsdarstellung, z.B. X p2 0 T = Tνν 0 a†ν aν 0 mit Tνν 0 = hν| |ν i (2.187) 2m 0 νν wird zu ˆ T = d3 rd3 r0 T (r, r0 ) Ψ† (r) Ψ (r0 ) mit T (r, r0 ) = hr| p2 0 |r i. 2m Was ist die kinetische Einteilchenenergie in Ortsdarstellung? ¶ µ 1 0 . . . = δ (r − r ) − ∇2r0 2m µ ¶ ˆ ∇2 3 † ⇒ T = d rΨ (r) − Ψ (r) . 2m (2.188) (2.189) (2.190) Analog gilt ˆ V1 = V2 = d3 r Ψ† (r) V1 (r) Ψ (r) , ˆ 1 d3 r1 d3 r2 Ψ† (r1 ) Ψ† (r2 ) V2 (r1 , r2 ) Ψ (r2 ) Ψ (r1 ) . 2 (2.191) (2.192) Das sieht so aus wie die Erwartungswerte von T usw. in erster Quantisierung. Was ist anders? Ψ ist jetzt ein Operator! Es scheint, dass wir die Wellenfunktion ψ (r) zu Ψ (r) „quantisiert“ haben. Daher die Bezeichung „2. Quantisierung“. Wir haben aber nur einmal quantisiert (nämlich als wir [x, p] = 0 → −i ersetzt haben), der Rest folgte aus der Konstruktion des Fock-Raumes und linearer Algebra. 21 2.4.5 Impulsdarstellung Für translationsinvariante Systeme ist, wie in der Einteilchen-Quantenmechanik, der Übergang zu FourierTransformierten nützlich. Wir führen zur späteren Verwendung ein: Ψ (r) = 1 X ik·r √ e ak V k (2.193) ↑ Volumen ⇒ ak = ˆ 1 √ V d3 r eik·r Ψ (r) (2.194) Dann folgt z.B. für die bilinearen Terme T µ ¶ ˆ 0 1X ∇2 d3 r a†k e−ik·r − eik ·r ak0 V 2m kk0 ˆ 0 2 X 0 1 )·r (k ) a 0 d3 r a†k e|−i(k−k {z } 2m k V 0 kk | {z } = = ,→ = (2.195) (2.196) =V δkk0 2 1X † (k0 ) ak Vδkk0 ak0 V 0 2m (2.197) X k2 † a ak0 2m k (2.198) kk = k und analog ˆ 0 1X V1 = d3 re−i(k−k )·r V1 (r) a†k ak0 . V 0 kk | {z } (2.199) 1 =:Vkk 0 2.5 2.5.1 Relativistisches skalares Feld Klein-Gordon-Gleichung Erinnerung an die Vorlesung Quantentheorie 2: man motiviert die Klein-Gordon- (KG-) Gleichung durch die Ersetzung p → −i∇, E → i ∂/∂t in der relativistischen Relation E 2 = p2 + m2 (das stellt sicher, dass der klassische Grenzfall korrekt herauskommt): − ¶ µ ⇔ ∂2 ψ ∂t2 ∂2 − ∇2 ψ + m 2 ψ ∂t2 | {z } −∇2 ψ + m2 ψ = = 0 (c = ~ = 1!) (2.200) Klein-Gordon-Gleichung. (2.201) =: ¤ Relativistische Notation: ψ-Vektoren v mit kovarianten Komponenten vµ , µ = 0, 1, 2, 3 und kontravarianten Komponenten v µ , µ = 0, 1, 2, 3. Diese hängen zusammen über X g µν vν ≡ g µν vν (2.202) vµ = ↑ ν (Einsteinsche Summenkonvention) und g µν bzw. gµν bilden die Matrix 1 0 g= 0 0 0 −1 0 0 22 0 0 −1 0 0 0 0 −1 (2.203) (die Metrik ). xµ hat die Komponenten (t, x). xµ hat dann die Komponenten (t, −x). Der Gradient ∂ ∂xµ ∂ µ := ⇒ wird so definiert, dass gilt ∂ µ xµ = X ∂xµ ¤= und die KG-Gleichung lautet: ∂ ∂xµ (2.204) = 4. (2.205) ∂2 − ∇2 = ∂ µ ∂µ ∂t2 (2.206) ∂xµ µ Dann ist ∂µ = ¢ ¡ µ ∂ ∂µ + m2 ψ = 0 (2.207) Ohne Beweis sei hier wiederholt, dass die KG-Gleichung einen erhaltenen Strom j µ := i (ψ ∗ ∂ µ ψ − ψ∂ µ ψ ∗ ) 2 (2.208) hat, d.h. es gilt ∂j 0 = −∇ · j. (2.209) ∂t (Kontinuitätsgleichung). Aber anders als in der nicht relativistischen Schrödinger-QM ist die 0-Komponente nicht positiv semidefinit: µ ¶ i ∂ψ ∗ 0 ∗ ∂ψ j = ψ − ψ (2.210) 2 ∂t ∂t ∂µ j µ = 0 ⇒ kann kleiner als Null werden. (j 0 ist erster Ordnung in ∂/∂t, aber die Klein-Gordon-Gleichung ist eine Differentialgleichung 2. Ordnung, sie erlaubt daher beliebige ψ(r) und ∂ψ(r)/∂t zu fester Zeit t.) Wie in der Quantentheorie 2 sicherlich erwähnt wurde, macht dieses Problem eine Einteilchen-KG-Theorie inkonsistent. Die Lösung liegt im Übergang zur Vielteilchentheorie, am besten mittels zweiter Quantisierung. 2.5.2 Quantisierung des relativistischen skalaren Feldes Wir gehen nach demselben Schema vor wie oben im nicht relativistischen Fall, d.h. wir bestimmen zunächst eine geeignete Einteilchenbasis und bauen daraus eine Basis des Fock-Raums auf. Für die Lösung der KG-Gleichung eignet sich die Fouriertransformation, da das System translationsinvariant ist: 1 X ik·r ψ (r, t) = √ e ψk (t) (2.211) V k wobei ψk∗ = ψ−k (t), da ψ (r, t) ∈ R. Mit der KG-Gleichung erhalten wir ψ̈k + k 2 ψk + m2 ψk = 0 (2.212) ωk2 ψk = 0 (2.213) ⇒ ψ̈k + mit ωk2 := k 2 + m2 . Dies ist die Gleichung √ für klassische, unabhängige harmonische Oszillatoren. Lösung mittels Ansatz ψk = e∓iωk t mit ωk = k 2 + m2 : ψ̈k + ωk2 ψk = −ωk2 ψk + ωk2 ψk = 0 (2.214) Wir sehen hier, dass die Energie positive und negative Werte ±ωk annehmen kann. ωk wächst aber für k → ∞ unbeschränkt an, so dass das Energiespektrum der Klein-Gordon-Gleichung betragsmäßig beliebig große negative Eigenwerte enthält. Es existiert daher kein Grundzustand. Das ist ein weiterer Punkt, an dem die Einteilchen-Klein-Gordon-Theorie versagt, und der den Übergang zur Vielteilchentheorie erfordert. 23 Wir benötigen reelle Lösungen. Schreibe à 1 √ 2ωk | {z } ψk = ! iωk t konventionelle Normierung Ak e + A∗−k e−iωk t ↑ ↑ komplexe Amplituden , (2.215) da dann ¢ 1 ¡ ∗ iωk t Ak e + A−k e−iωk t = ψ−k , 2ωk wie gefordert. Die ψk sind die Eigenzustände der KG-Gleichung in Impulsdarstellung: ψk∗ = √ ψk ≡ hk|ψi . (2.216) (2.217) Wir konstruieren eine Vielteilchen-Basis aus diesen Zuständen: |ψ1 i |ψ2 i · · · |ψN i (2.218) oder in Impulsdarstellung ψk1 ψk2 · · · ψkN . Bei der zweiten Quantisierung führen wir Erzeugungs- und Vernichtungsoperatoren teilchenzustände ein, d.h. |ψk i = Ψ†k |0i etc. (2.219) Ψ†k , Ψk Wegen der Forderung ψ (r, t) ∈ R schreiben wir ´ 1 ³ Ψk = √ ak e−iωk t + a†−k eiωk t , 2ωk für die Ein(2.220) (2.221) wobei ak , a†−k jetzt Operatoren sind. Bemerkung: daraus folgt Ψ (r, t) = = = = ´ 1 X ik·r 1 ³ √ √ e ak e−iωk t + a†−k eiωk t 2ωk V k ´ X 1 ³ 1 √ √ ak eik·r−iωk t + a†k e−ik·r+iωk t 2ωk V k ´ X 1 ³ 1 √ e−ik·r √ a−k e−iωk t + a†k e+iωk t 2ωk V k Ψ† (r, t) (2.222) (2.223) (2.224) (2.225) Ψ (r, t) ist hermitesch! (Entspricht der Realität der Einteilchenfunktion ψ.) Wir müssen jetzt noch über die Vertauschungseigenschaften von Ψk bzw. ak entscheiden – beschreiben wir Bosonen oder Fermionen? Gleichung (2.213) ist die Bewegungsgleichung für unabhängige klassische harmonische Oszillatoren. Identifiziere qk = ψk als Auslenkung und pk = ψ̇k als Impuls. qk und pk sind kanonisch konjugierte Variablen im Sinne der klassischen Mechanik. In Analogie mit der Einteilchen-QM fordern wir daher (s. S. 10!) h i h i p†k , qk0 = Ψ̇†k , Ψk0 = −iδkk0 . (2.226) Analog zu S. 21 folgt für das Quantenfeld Ψ (r, t) im Ortsraum h i Ψ̇(†) (r, t) , Ψ (r0 , t) = −iδ (r − r0 ) h i (beachte: gleiche Zeit-Argumente). Wir suchen den Kommutator ak , a†k0 . Zunächst gilt Ψ̇k = Ψ̇†k = 1 2ωk 1 √ 2ωk √ (2.227) ´ ³ −iωk ak e−iωk t + iωk a†−k eiωk t (2.228) ´ ³ iωk a†k eiωk t − iωk a−k e−iωk t (2.229) 24 Wir haben damit ein lineares Gleichungssystem von 4 Gleichungen für ak , a†k , a−k , a†−k das wir lösen können: r ωk iωk t 1 ak = e Ψk + i √ eiωk t Ψ̇k (2.230) 2 2ωk r 1 ωk −iωk t † e Ψk − i √ a†k = e−iωk t Ψ̇†k (2.231) 2 2ωk Es folgt h ak , a†k0 i = 1 iωk t−iωk0 t √ e ωk ωk0 2 r ωk0 +i ωk r i ωk h −i Ψk , Ψ̇†k0 ωk0 | {z } h i Ψk , Ψ†k | {z } =[Ψk ,Ψ−k ]=0 (unter Vernachlässigung der uniformen Mode k=0) h i 1 Ψ̇k , Ψ†k0 +√ ω k ωk0 | {z } † † =[Ψk ,Ψ̇k0 ] =(iδkk0 )† =−iδkk0 h i Ψk , Ψ†k | {z } =iδkk0 (2.232) =0 siehe 1. Term 1 (−i (iδkk0 ) + i (−iδkk0 )) 2 = δkk0 . = (2.233) (2.234) Also erfüllen ak , a†k0 die kanonischen Vertauschungsrelationen für Bosonen. Das ist vielleicht nicht überraschend wegen der Analogie zum harmonischen Oszillator, die wir für die heuristische Begründung benutzt 3 haben. Das System ist in diesem Bild analog zu einem √ elastischen dreidimensionalen Körper (r ∈ R ), 2 2 aber mit p einer etwas anderen Dispersionsrelation ωk = k + m , oder mit restaurierten Naturkonstanten ωk = k 2 c2 + m2 c4 /~2 . Beachte, dass sich für m → 0 die lineare Dispersion ωk = kc von Phononen im Kontinuum ergibt. Von der linearen Kette bzw. dem harmonischen Oszillator kennen wir bereits einen Hamiltonian, der die gefundene Dynamik beschreibt: ´ 1 X³ † H= pk pk + ωk2 qk† qk . (2.235) 2 k Also ausgedrückt durch das Feld Ψ: H= µ ¶ 1X Ψ̇†k Ψ̇k + ωk2 Ψ†k Ψk |{z} 2 k In Ortsdarstellung ist dann . (2.236) =k2 +m2 ˆ H= d3 r H (r) | {z } (2.237) Hamilton-Dichte mit H (r) = i 1h 2 2 Ψ̇ (r) + |∇Ψ| + m2 Ψ2 (r) 2 25 (2.238) ¡ ¢2 ¡ ∂Ψ ¢2 ³ ∂Ψ ´2 ¡ ∂Ψ ¢2 (Erinnerung: Ψ ist hermitesch). Beachte: die Hamilton-Dichte H enthält ∂Ψ + ∂x + ∂y + ∂z . ∂t Ist das Lorentz-invariant? Nein! Lorentz-invariant ist nur µ ¶2 µ ¶2 µ ¶2 µ ¶2 ∂Ψ ∂Ψ ∂Ψ ∂Ψ µ ∂ Ψ∂µ Ψ = − − − . (2.239) ∂t ∂x ∂y ∂z Der Lagrangian (Lagrange-Operator) ˆ d3 r L= L (r) | {z } (2.240) Lagrange-Dichte ist gegeben durch die Legendre-Transformation X L [qk , q̇k ] := pk q̇k − H [pk , qk ] (2.241) k ⇒ L (r) = ⇒ L = i 1h 2 2 Ψ̇ (r) − |∇Ψ| − m2 Ψ2 (r) 2 ¢ 1¡ µ ∂ Ψ∂µ Ψ − m2 Ψ2 . 2 (2.242) (2.243) Der Lagrangian ist offenbar Lorentz-invariant. Daher werden relativistische Feldtheorien üblicherweise mittels ihrer Lagrange-Dichte L beschrieben, nicht mittels H. Zurück zum Hamiltonian: Wir finden ´ 1 X³ † Ψ̇k Ψ̇k + ωk2 Ψ†k Ψk (2.244) H = 2 k ´³ ´ 1 X 1 h³ † S. 24 = ak iωk eiωk t + a−k (−iωk ) e−iωk t ak (−iωk ) e−iωk t + a†−k iωk e−iωk t 2 2ωk k ³ ´³ ´i +ωk2 a†k eiωk t + a−k e−iωk t ak e−iωk t + a†−k e−iωk t (2.245) 1X 1 2 † 2 −2iωk t 2 † † 2iω t +ωk2 a−k a†−k = ωk ak ak −ωk ak a−k e k −ωk a−k ak e | {z } 2 2ωk {z } | k −β −α +ωk2 a†k ak +ωk2 a†k a†−k e2iωk t +ωk2 a−k ak e−2iωk t +ωk2 a−k a†−k {z } | {z }| +β +α = = (2.246) ´ 1X ³ † ωk ak ak + ak a†k 2 k ¶ X µ † 1 ωk ak ak + , 2 (2.247) (2.248) k also entkoppelte harmonische Oszillatoren, wie erwartet. Beachte: H ist positiv definit. Wir haben dank des Übergangs zur Vielteilchentheorie (Feldtheorie) kein Problem mehr mit negativen Energieeigenwerten. 2.6 Komplexes skalares Feld Wir hatten im vorigen Abschnitt verlangt, dass die Einteilchenwellenfunktionen ψ (r, t) reell seien. Wir hatten gesehen, dass dann der Feldoperator Ψ (r, t) hermitesch ist. Es gab aber keine überzeugende Begründung dafür, dass ψ ∈ R sein soll. Das ist keine natürliche Forderung in der Quantenmechanik. Wir lassen sie jetzt fallen. (Wir werden aber sehen, dass es im Rahmen der QFT eine sinnvolle Forderung ist.) Ein komplexes Feld ψ (r, t) ist einfach 1 ψ = √ (φ1 + iφ2 ) , 2 26 (2.249) wobei φ1,2 reelle Felder sind. Wir schreiben in Analogie zum reellen Feld die Lagrange-Dichte L = ∂ µ Ψ∗ ∂µ Ψ − m2 Ψ∗ Ψ (2.250) und finden L = 1 µ ∂ φ1 ∂µ φ1 +i∂ µ φ1 ∂µ φ2 − i∂ µ φ2 ∂µ φ1 2 | {z } =0 (2.251) +∂ µ φ2 ∂µ φ2 − m2 φ21 −im2 φ1 φ2 + im2 φ2 φ1 −m2 φ21 | {z } (2.252) =0 2 = ¢ 1 X¡ µ ∂ φj ∂µ φj − m2 φ2j . 2 j=1 (2.253) Das ist einfach die Summe von Lagrange-Dichten für zwei reelle Felder, die nicht miteinander wechselwirken. Beim Übergang zur QFT ist es naheliegend zu fordern (φ → Φ, ψ → Ψ) h i Φ̇i (r, t) , Φj (r0 , t) = −iδij δ (r − r0 ) (2.254) h i [Φi (r, t) , Φj (r0 , t)] = Φ̇i (r, t) , Φ̇j (r0 , t) = 0 (2.255) √ daraus folgt mit Ψ = (Φ1 + iΦ2 ) / 2: h i Ψ̇† (r, t) , Ψ (r0 , t) h i und Ψ̇ (r, t) , Ψ (r0, t) = −iδ (r − r0 ) £ ¤ = Ψ† (r, t) , Ψ (r0 , t) = [Ψ (r, t) , Ψ (r0 , t)] = 0. (2.256) (2.257) Wir drücken Φ1,2 wie oben durch Erzeugungs- und Vernichtungsoperatoren a†1,2 , a1,2 aus, so dass Φ1,2 hermitesche Operatoren sind: ´ 1 X 1 ³ √ ajk ei(k·r−ωk t) + a†jk e−i(k·r−ωk t) Φj (r, t) = √ 2ωk V k mit h i aik , a†jk0 = δij δkk0 (j = 1, 2) etc. (2.258) (2.259) Wir könnten nun Ψ durch aj , a†j ausdrücken. Es ist aber praktischer, neue Operatoren bk , ck einzuführen: bk = ck = a1k + ia2k √ 2 a1k − ia2k √ . 2 (2.260) (2.261) h i h i Damit findet man bk , b†k0 = ck , c†k0 = δkk0 usw. Weiter gilt ´ 1 X 1 ³ i(k·r−ωk t) √ Ψ (r, t) = √ bk e + a†k e−i(k·r−ωk t) 2ωk V k (2.262) und der Hamiltonian lautet H= X ³ ´ X ³ ´ ωk b†k bk + ck c†k = ωk b†k bk + c†k ck + 1 k k Wie zu erwarten war, erhalten wir zwei Sätze von entkoppelten harmonischen Oszillatoren. 27 (2.263) Man kann jetzt den Stromoperator j µ := ¢ i ¡ † µ Ψ ∂ Ψ − Ψ∂ µ Ψ† 2 (2.264) definieren. Man findet, dass j µ ein erhaltener Strom ist: ∂µ j µ = 0 (dies folgt, da ψ∂ µ ψ ∗ − ψ ∗ ∂ µ ψ erhalten ist, wenn ψ eine Lösung der KG-Gleichung ist) ∂ 0 j + ∇ · j = 0. ∂t ⇒ (2.265) Integration über den Ortsraum ergibt d dt ˆ ˆ 3 0 d r j (r) + d3 r ∇ · j = 0. | {z } (2.266) =0 j 0 ist die zeitliche Komponente des Stromdichtevektors, also eine Dichte. Wir können damit eine erhaltene Ladung Q definieren: ˆ Q := d3 r j 0 (r) (2.267) ˆ h i i = d3 r Ψ† (r) Ψ̇ (r) − Ψ (r) Ψ̇† (r) (2.268) 2 ¶ Xµ † = bk bk − c†k ck . (2.269) ↑ k ! b†k Wir finden, dass die von erzeugten Feldquanten (Teilchen) alle Ladung +1 tragen, während die von c†k erzeugten Quanten die Ladung −1 haben. (j µ ist nur bis auf einen Zahlenfaktor festgelegt, insbesondere könnten wir die Vorzeichen auch umgekehrt wählen.) Wir nennen die c-Quanten Antiteilchen der bQuanten. Wir sehen, dass Ψ† Teilchen (b) erzeugt und Antiteilchen (c) vernichtet. √ Beachte, dass Teilchen und Antiteilchen beide positive Energie ωk = k 2 + m2 und positive Masse m haben, s. S. 27. Somit ist das Energiespektrum nun von unten beschränkt und ein Grundzustand existiert, nämlich der Vakuumzustand ohne Teilchen b und c. 2.7 Feynman-Propagator Wir kennen im Prinzip die Dynamik des Feldes Ψ, die durch die Lagrange-Funktion ˆ ¡ ¢ 1 L= d3 r ∂ µ Ψ† ∂µ Ψ − m2 Ψ† Ψ 2 (2.270) festgelegt wird. Aus der Lagrange Funktion folgt als Euler-Lagrange-Gleichung die KG-Gleichung ∂ µ ∂µ Ψ − m2 Ψ = 0. (2.271) Wir wollen aber nun die Dynamik im Teilchenbild beschreiben. Wir wollen dazu angeben, mit welcher Wahrscheinlichkeit (genauer Wahrscheinlichkeitsamplitude) ein Teilchen zur Zeit t2 am Ort r2 (im Volumenelement d3 r2 ) ist, wenn es zur Zeit t1 am Ort r1 war. Diese bedingte Wahrscheinlichkeitsamplitude wird durch die Green-Funktion (den Propagator ) 4-Vektoren ↓ ↓ ∆(+) (x1 , x2 ) := = ¯ ® ­ ¯ −i 0 ¯Ψ(x2 )Ψ† (x1 )¯ 0 ¯ ® ­ ¯ −i 0 ¯Ψ(r2 , t2 )Ψ† (r1 , t1 )¯ 0 beschrieben. Erinnerung: der Feldoperator lautet ´ 1 X 1 ³ i(k·r−ωk t) √ bk e + c†k e−i(k·r−ωk t) . Ψ(r, t) = √ 2ωk V k 28 (2.272) (2.273) (2.274) Da nach Definition und daher gilt ∆ (+) bk |0i = ck |0i = 0 (2.275) h0| b†k = h0| c†k = 0, (2.276) ¯ + * ¯ ¯1 X ¯ 1 ¯ i(k·r2 −ωk t2 ) † −i(k0 ·r1 −ωk0 t1 ) ¯ (x1 , x2 ) := −i 0 ¯ bk e bk0 e √ ¯0 . ¯ V 0 2 ωk ωk0 ¯ (2.277) kk Ein nicht verschwindender Beitrag existiert nur für k = k0 : ¯ + * ¯ ¯1 X 1 ¯ ¯ †¯ ik(r2 −r1 )−iωk (t2 −t1 ) e . . . = −i 0 ¯ bk bk ¯ 0 =: ∆(+) (x2 − x1 ) ¯V ¯ 2ωk (2.278) k Wir sehen: 1. ∆(+) hängt nur von x2 − x1 ab, da das System translationsinvariant in Raum und Zeit ist und 2. ∆(+) beschreibt die Propagation eines Teilchens b von x1 nach x2 . Physikalisch wollen wir oft (nicht immer) kausale Prozesse beschreiben, d.h. solche, bei denen die Ursache (Erzeugung von b aus dem Vakuum) der Wirkung (Vernichtung von b) vorausgeht. Das erfordert offenbar t2 > t1 . Analog definieren wir ¯ ® ­ ¯ ∆(−) (x1 , x2 ) := −i 0 ¯Ψ† (x2 )Ψ(x1 )¯ 0 (2.279) ¯ + * ¯ ¯ ¯1 X 1 ¯ ¯ e−ik(r2 −r1 )+iωk (t2 −t1 ) ck c†k ¯ 0 = −i 0 ¯ (2.280) ¯ ¯V 2ωk k =: ∆ (−) (x2 − x1 ), (2.281) dies beschreibt die Propagation eines Antiteilchens c von x2 nach x1 . Dieser Prozess ist kausal, wenn t1 > t2 . Der kausale oder Feynman-Propagator ist definiert als der für gegebene t1 , t2 kausale Propagator ∆(±) : ( ­ ¯ ¯ ® −i 0 ¯Ψ(x2 )Ψ† (x1 )¯ 0 für t2 > t1 ¯ ® ­ ¯ † ∆F (x2 − x1 ) : = (2.282) −i 0 ¯Ψ (x1 )Ψ(x2 )¯ 0 für t2 < t1 ¯ ® ­ ¯ ≡ −i 0 ¯T Ψ(x2 )Ψ† (x1 )¯ 0 . (2.283) Hier ist T der Zeit-Ordnungs-Operator. T ist kein Operator schrift, wie die nachfolgenden Operatoren zu ordnen sind: T Zeitargumente von rechts nach links zunehmen, ( A(t2 )B(t1 ) T A(t2 )B(t1 ) := A(t1 )B(t2 ) auf dem Hilbert-Raum, sondern eine Vorarrangiert diese Operatoren so, dass deren für t2 > t1 für t2 < t1 . (2.284) Für das komplexe skalare Feld ohne Wechselwirkungen, das wir bisher beschrieben haben, können wir ∆F ausrechnen: (­ ¯ ¯ ® 0 ¯Ψ(x)Ψ† (0)¯ 0 für x0 = t > 0 ¯ ¯ ® ­ ∆F (x) = −i (2.285) 0 ¯Ψ† (0)Ψ(x)¯ 0 für x0 = t < 0 eik·r−iωk t bk b†k ¯ + * ¯ |{z} ¯ ¯1 X 1 ¯ ¯ =1 (2.286) = −i 0¯ ¯0 . † −ik·r+iωk t ¯ ¯V 2ωk e c c k k k |{z} =1 29 Im Fall t > 0 ersetzen wir k → −k, ½ −ik·r−iω t k 1 X 1 e . . . = −i −ik·r+iωk t . e V 2ωk (2.287) k Übergang zum unendlich großen System: ˆ 1X d3 k → , V (2π)3 (2.288) k ergibt ˆ . . . = −i d3 k 1 −ik·r−iωk |t| e . (2π)3 2ωk (2.289) Nun sieht dies nicht Lorentz-invariant aus, da nur über 3-Vektoren k integriert wird. Wir benutzen folgende Identität, um ein Integral über 4-Vektoren k µ zu erhalten: ˆ iω ∞ eik0 t e−iω|t| = dk0 2 mit η → 0+ (2.290) π −∞ k0 − ω 2 + iη wobei +iη angibt, auf welcher Seite wir am Pol bei k02 = ω 2 vorbei integrieren sollen. dies ist dasselbe wie ˆ ⇒ ∆F (x) = −i ˆ = d3 k 1 iωk (2π)3 2ωk π ˆ 0 dk 0 eik t−ik·r 2 k0 − ωk2 +iη | {z } (2.291) =k02 −k·k−m2 ¯ ¯ d k e ¯ 4 µ 2 (2π) k kµ − m + iη ¯η→0+ ikµ xµ 4 (2.292) Dies ist der gesuchte Propagator. Er ist explizit Lorentz-invariant. Um zu sehen, dass wir ∆F zu Recht als Green-Funktion bezeichnet haben, untersuchen wir µ 2 ¶ ¢ ¡ µ ∂ 2 2 2 ∂ ∂µ + m ∆F (x) = − ∇ + m ∆F (x) (2.293) ∂t2 ¯ ¯ ¯ ˆ ´ ³ ikµ xµ 4 ¯ ¢ ¡ e d k 2 0 2 ¯ + k · k − m − k = (2.294) ¯ µ 2 (2π)4 | {z } k kµ − m + iη ¯¯ µ 2 ˆ =−(k kµ −m ) η→0+ 4 d k ikµ xµ e (2π)4 ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ 1 = − (2π)4 δ x0 δ x1 δ x2 δ x3 4 (2π) = − 4-Vektor ↓ = −δ(r) δ(t) = −δ(x). 30 (2.295) (2.296) (2.297) ∆F ist also tatsächlich die Green-Funktion der KG-Gleichung, also die Lösung der Gleichung für die Inhomogenität −δ(x) (das Vorzeichen ist konventionell). Wir können das 4-Integral in ∆F (x) explizit ausführen. Wir geben nur das Ergebnis an: ³ √ ´ m √ H1(1) m x2 für x2 ≡ t2 − r2 > 0 (zeitartig) ∆F (x) = (2.298) 8π x2 ³ p ´ im ∆F (x) = − √ K1 m −x2 für x2 < 0 (raumartig). (2.299) 4π −x2 (1) K1 und H1 sind Bessel-Funktionen. Zusätzlich enthält ∆F noch eine δ-Funktions-Singularität bei x2 = 0 (auf dem Lichtkegel): 1 ¡ 2¢ ∆F (x) ∼ δ x für x2 → 0 (2.300) =− 4π Wieso ist ∆F (x) 6= 0 für raumartige x? Ist hier nicht die Kausalität verletzt? Schließlich müsste sich eine Wirkung von 0 schneller als mit der Lichtgeschindigkeit ausbreiten, um den Punkt x zu erreichen. Antwort: Dies drückt aus, dass ein Teilchen nicht beliebig scharf in der Raumzeit lokalisiert werden kann. Die Heisenbergsche Unschärferelation lautet ∆E∆t ≥ ~ 1 = 2 2 (weil ~ = 1), (2.301) wobei für ∆E eine typische Skala m ist und ∆t im relativistischen Fall durch eine Lorentz-invariante Größe, −∆x2 = ∆r2 − ∆t2 , ersetzt wird, ⇒m 2.8 p −∆x2 ≥ 1 . 2 (2.302) φ4 -Theorie Wir wollen zum Abschluss des Abschnitts zu bosonischen Feldern kurz eine einfache QFT erwähnen, die Wechselwirkungen enthält. Es ist die φ4 -Theorie, die durch die Lagrange-Dichte (für reelles Feld) L= 1 1 1 µ ∂ Ψ∂µ Ψ − m2 Ψ2 − g Ψ4 2 2 | 4{z } (2.303) neu definiert wird. Diese ergibt als Bewegungsgleichung ¢ ¡ µ ∂ ∂µ + m2 Ψ + gΨ3 = 0, (2.304) die offenbar nichtlinear ist. Dies 1. macht die Theorie sehr viel schwieriger (und interessanter) und 2. kommt vom Term Ψ4 vierter Ordnung (daher „φ4 -Theorie“). In den Kapiteln zur Vielteilchentheorie werden Wechselwirkungen eine zentrale Rolle spielen. Wir verschieben die Diskussion von Methoden für wechselwirkende Felder bis dahin. 31 2.9 2.9.1 Dirac-Feld Erinnerung an die Dirac-Gleichung Wir hatten gesehen, dass die KG-Gleichung keine konsistente Einteilchentheorie beschreibt. Der Grund ist, dass sie von 2. Ordnung in der Zeit ist, und daher beliebige (Orts-) Funktionen ψ(r, t) und ψ̇(r, t) zu festen t erlaubt (vgl. Anfangsbedingungen für Dgl. 2. Ordnung: man kann ψ und ψ̇ vorgeben). Daher kann j 0 (r, t) beliebig reell sein, insbesondere auch negativ. Um dieses Problem zu lösen, sind wir oben zur Vielteilchentheorie bzw. QFT übergegangen. Dirac versuchte dagegen, eine relativistische Einteilchen-QM zu retten, indem er zu einer Gleichung 1. Ordnung in der Zeit überging. Aufgrund der Lorentz-Invarianz muss sie dann auch 1. Ordnung in den räumlichen Koordinaten sein. Also schrieb Dirac i ∂ψ = Hψ ∂t mit H = α · p+ βm (2.305) ↑ Impulsoperator −i∇ Dies ist die Dirac-Gleichung. Hier sind α1 , α2 , α3 und β hermitesche Operatoren, die nicht auf den Ort r wirken (damit die Gleichung von 1. Ordnung in ∇ ist) und nicht von r abhängen (Translationsinvarianz). Sie wirken daher nur auf innere Freiheitsgrade. Es folgt X X X H2 = αj pj αk pk + αj pj βm + βmαk pk + β 2 m2 (2.306) jk = X¡ α ¢ j 2 j X p2j + αj αk j = X¡ j α ¢ j 2 jk j6=k p2j + X¡ k pj pk |{z} + X¡ ¢ αj β + βαj pj m + β 2 m2 (2.307) j vertauschen X¡ ¢ ¢ αj αk + αk αj pj pk + αj β + βαj pj m + β 2 m2 . (2.308) j jk j<k Wir fordern zusätzlich, dass H 2 = p2 + m2 gilt. Dies stellt sicher, dass der klassische Grenzfall korrekt ist. Das bedeutet übrigens, dass ψ zugleich auch die KG-Gleichung erfüllen soll. ¡ j ¢2 ⇒ α = 1 (2.309) ∧ αj α k + α k α j ∧ β2 ∧ αj β + βαj = 0 = 1 = 0. für j 6= k (2.310) (2.311) (2.312) Eine einfache Umschreibung lässt uns besser erkennen, dass die Dirac-Gleichung Lorentz-invariant ist. Wir multiplizieren ∂ψ i − Hψ = 0 (2.313) ∂t von links mit β: ∂ψ iβ + iβα · ∇ψ − β 2 mψ = 0, (2.314) |{z} ∂t =1 definieren vier Operatoren γ0 γ j := := β, βα (2.315) j (j = 1, 2, 3) (2.316) und bilden daraus einen 4-Vektor γ µ (µ = 0, 1, 2, 3). Dann lautet die Dirac-Gleichung iγ µ ∂µ ψ − mψ = 0. (2.317) Schreibweise: für jeden 4-Vektor vµ sei v/ := γ µ vµ („Feynman dagger“). Dann ist i∂/ψ − mψ = 0. 32 (2.318) Die Bedingungen an β, αj implizieren γµγν + γν γµ µ 2 ∧ (γ ) ¡ ¢† ∧ γ0 ¡ ¢† ∧ γj ³ ⇒ µ † γ 0 (γ ) γ 0 = 2g µν (2.319) = 1 (2.320) 0 = γ = −γ j ´ γµ . = (2.321) (j = 1, 2, 3) (2.322) (2.323) Wir suchen eine Darstellung der γ µ , d.h. wir wollen sie als Matrizen mit diesen Eigenschaften schreiben. Dafür gibt es unendlich viele Möglichkeiten. Es zeigt sich (vgl. z.B. Messiah, Quantenmechanik, Bd. 2), dass man die γ µ nicht durch kleinere als 4 × 4 Matrizen darstellen kann. Die Standard-Darstellung beinhaltet mit den Pauli-Matrizen µ ¶ µ ¶ µ ¶ µ ¶ 0 1 0 −i 1 0 1 0 σ 1 := , σ 2 := , σ 3 := und σ 0 := (2.324) 1 0 i 0 0 −1 0 1 folgende 4 × 4 Matrizen: µ γ 0 = µ γj = σ0 0 0 −σ 0 0 −σ j σj 0 ¶ (2.325) ¶ (j = 1, 2, 3). (2.326) In dieser 4-dimensionalen Darstellung muss ψ(r, t) ein 4-komponentiger Vektor sein, da die γ µ auf ψ wirken. Also ψ1 ψ2 ψ= (2.327) ψ3 ψ4 („Dirac-Spinor“). Bemerkung: ψ ist kein relativistischer 4-Vektor! Der 4-dimensionale Spinor-Raum der ψ hat nichts mit der 4-dimensionalen Raumzeit zu tun. Der hermitesch adjungierte (oder konjungierte) Vektor ist ψ † = (ψ1∗ , ψ2∗ , ψ3∗ , ψ4∗ ) . (2.328) Man führt noch den Pauli-adjungierten Vektor ψ := ψ † γ 0 = (ψ1∗ , ψ2∗ , −ψ3∗ , −ψ4∗ ) (2.329) ein. (In der relativistischen QM und QFT nennt man letzteren einfach den „adjungierten“ Vektor.) Man kann zeigen, dass (2.330) j µ := ψγ µ ψ = ψ † γ 0 γ µ ψ eine erhaltene Stromdichte ist: ∂µ j µ = 0. (2.331) Ihre 0-Komponente, die Teilchenzahldichte, lautet j0 = = ψ† γ 0 γ 0 ψ ψ† ψ (2.332) (2.333) = ψ1∗ ψ1 + ψ2∗ ψ2 + ψ3∗ ψ3 + ψ4∗ ψ4 ≥ 0 (2.334) und ist offenbar positiv semidefinit. In dieser Hinsicht führt die Dirac-Gleichung, anders als die KGGleichung nicht zu einem Problem. 33 Wir lösen nun die Dirac-Gleichung ψ1 ψ2 ψ= ψ3 ψ4 iγ µ ∂µ ψ − mψ = 0, mittels des Ansatzes ebener Wellen, wobei (2.335) ν ψ = u(p)e−ipν x , (2.336) u1 (p) u2 (p) u(p) = u3 (p) u4 (p) (2.337) ein 4-komponentiger Dirac-Spinor ist. ν ν ⇒ iγ µ (−ipµ )u(p)e−ipν x − mu(p)e−ipν x = 0 ⇒ γ µ pµ u(p) − mu(p) = 0 (2.338) (2.339) multipliziere von links mit der 4 × 4 Matrix pν γ ν + m: pν γ ν γ µ pµ u(p) +mγ µ pµ u(p) − pν γ ν mu(p) −m2 u(p) = {z } | 0 (2.340) 0 (2.341) =0 ⇒ pµ pµ u(p) − m2 u(p) = Um eine Lösung zu erhalten, muss also ¡ ¢2 pµ pµ ≡ p0 − p · p ≡ E 2 − p2 = m2 (2.342) sein. Das folgt auch schon aus der Beobachtung, dass ψ auch die KG-Gleichung erfüllt. Es ist der übliche relativistische Energie-Ausdruck. Also hängt u(p) nur vom 3-Vektor p ab und p p0 = ± p2 + m2 (2.343) ist dann bis auf das Vorzeichen festgelegt. Sei E := p p2 + m2 > 0. Die Matrix in der Dirac-Gleichung (2.339) lautet 0 p −m 0 µ γ pµ − m ≡ β − m = p3 p1 + p2 0 p0 − m p1 − p2 −p3 34 −p3 −p1 − p2 −p0 − m 0 (2.344) −p1 + p2 p3 . 0 0 −p − m (2.345) Daraus erhalten wir die Lösungen r u+ (p, 1) := 1 0 m+E 2m | {z } ↑ u+ (p, 2) := m+E 2m r u− (p, 1) := m+E 2m r u− (p, 2) := mit p0 p3 m+E p1 +p2 m+E konventioneller Normierungsfaktor r m+E 2m 0 1 p1 −p2 m+E −p3 m+E −p3 m+E −p1 −p2 m+E 1 0 −p1 +p2 m+E p3 m+E 0 1 =E (2.346) mit p0 = E (2.347) mit p0 = −E (2.348) mit p0 = −E, (2.349) wie man durch einsetzen in 2.339 prüft. Die Dispersionsrelation sieht nun so aus: Wir sehen, dass die Dirac-Gleichung wie die KG-Gleichung Lösungen mit negativen Energien von beliebig großem Betrag hat. (Das Spektrum ist unbeschränkt von unten.) Diese Eigenschaft macht eine EinteilchenDirac-Theorie inkonsistent und erfordert wieder den Übergang zur QFT. Diracs ursprüngliches Programm zur Konstruktion einer relativistischen Einteilchen-QM ist also gescheitert. Allerdings können wir wie zuvor die Lösungen der Dirac-Gleichung zur Konstruktion von Vielteilchenzuständen benutzen. 2.9.2 Dirac-Feldtheorie Wie gesehen erfordert Diracs Idee Zustandsvektoren mit (mindestens) vier Komponenten. Dies entspricht inneren Freiheitsgraden der beschriebenen Teilchen, die vier verschiedene Werte annehmen können. Ohne Beweis geben wir an, dass es sich hier um einen Spin- 12 -Freiheitsgrad und um den Teilchen/AntiteilchenFreihetsgrad handelt. Die möglichen Zustände sind also |Teilchen, ↑i , |Antiteilchen, ↑i , |Teilchen, ↓i , |Antiteilchen, ↓i . Ebenfalls ohne Beweis sei mitgeteilt, dass halbzahlige Spins fermionische Symmetrie der Wellenfunktion erfordern und umgekehrt (Spin-Statistik-Theorem). 35 Beim Übergang zur QFT wollen wir also das Feld ψ(x) durch einen Feldoperator Ψ(x) mit fermionischen Antivertauschungsrelationen ersetzen. (Bemerkung: Genauer müssten wir jetzt wieder eine Basis von Vielteilchenzuständen aus den Eigenzuständen der Einteilchen-Dirac-Gleichung konstruieren usw.) Die Dirac-Gleichung folgt als Euler-Lagrange-Gleichung aus der („klassischen“) Lagrange-Dichte ψ1 ψ2 L = ψ(i∂/ − m)ψ, ψ= (2.350) ψ3 . ψ4 Die kanonisch konjugierte Größe πa zu ψa finden wir wie in der Mechanik: πa = ∂L ∂L 0 = iψ b γba = ∂(∂0 ψa ) ∂ ψ̇a % Erinnerung: ψ ⇒ ψγ 0 = iψa† (2.351) = = ψ† γ 0 ψ† γ 0 γ 0 = ψ† . (2.352) (2.353) Also sollten beim Übergang zur QFT Ψa und Ψ†a fermionische Antivertauschungsrelationen erfüllen: n o Ψa (r, t), Ψ†b (r0 , t) = δab δ (r − r0 ) (2.354) {Ψa (r, t), Ψb (r0 , t)} = 0 usw. (2.355) Wir können Ψ wie zuvor nach Einteilchenzuständen (Lösungen der Dirac-Gleichung) entwickeln. Dazu ist es nützlich zu setzen u(p, s) v(p, s) := := u+ (p, s) u− (−p, s) (2.356) (2.357) (physikalisch drückt das aus, dass die Abwesenheit eines Teilchens mit Impuls p einem Antiteilchen mit Impuls −p entspricht). Wir schreiben 2 r i 1 XX m h Ψ(p, t) = √ aks u(k, s) ei(k·r−Ek t) + b†ks v(k, s) e−i(k·r−Ek t) . V k s=1 Ek (2.358) Man kann zeigen, dass dann fermionische Antivertauschungsrelationen für a, b folgen: n o n o aks , a†k0 s0 = bks , b†k0 s0 = δkk0 δss0 , (2.359) © † †ª © † †ª © †ª {a, a} = a , a = {b, b} = b , b = {a, b} = a, b = 0 für beliebige Indizes. (2.360) In Ψ vernichtet a ein Teilchen und b† erzeugt ein Antiteilchen. Bis auf den fermionischen Charakter ist alles analog zum komplexen (bosonischen) Feld im vorigen Abschnitt. Insbesondere erhalten wir für den Hamiltonian (Gesamtenergie) ´ X ³ † Ek aks aks + b†ks bks −1 . (2.361) H= |{z} ks irrelevante Konstante Dies ist jetzt beschränkt von unten. Die Ladung wird wieder über die 0-Komponente der Stromdichte definiert: ˆ ˆ ˆ Q = d3 r j 0 = d3 r Ψγ 0 Ψ = d3 r Ψ† Ψ (2.362) ´ X³ † (2.363) aks aks − b†ks bks +1 . = |{z} ks irrelevant Wie bei Bosonen haben Teilchen und Antiteilchen beide positive Energie aber entgegengesetzte Ladung. 36 2.9.3 Feynman-Propagator für das Dirac-Feld Die Definition des Feynman-Propagators erfolgt im Prinzip wie für das komplexe Feld, bis auf folgende Unterschiede: • Ψ ist jetzt ein vierkomponentiger Vektor, der Propagator wird daher eine 4 × 4 Matrix. • Werden zwei fermionische Faktoren vertauscht, so ändert sich das Vorzeichen. • Ψ† wird durch das Pauli-adjungierte Feld Ψ ersetzt. Also: ¯ E D ¯ ¯ ¯ SF (x) := −i 0¯ T Ψ(x)Ψ(0)¯0 ↑ Zeitordnungsoperator wobei , (2.364) ( Ψ(x)Ψ(0) für x0 > 0 T Ψ(x)Ψ(0) = −Ψ(0)Ψ(x) für x0 < 0 und Ψ(x)Ψ(0) ist das äußere (Tensor-) Produkt der beiden Vektoren: ¯ E D ¯ ¯ ¯ [SF (x)]ab = −i 0¯T Ψa (x)Ψb (0)¯0 . (2.365) (2.366) Wie im bosonischen Fall tragen für x0 > 0 nur die (a-) Teilchen und für x0 < 0 nur die (b-) Antiteilchen bei. Aus der expliziten Darstellung von Ψ erhalten wir analog ¯ ˆ ¯ d4 k −ikµ xµ 1 ¯ SF (x) = e . (2.367) ¯ µ (2π)4 γ kµ −m + iη ¯ η→0+ | {z } k / Beachte, dass k/ eine 4 × 4-Matrix ist, der Bruch ist also als Matrix-Inversion zu verstehen. Wir erkennen einen Zusammenhang zwischen der Bewegungsgleichung (KG bzw. Dirac) im FourierRaum und dem Fourier-transformierten Propagator: Gleichung: Propagator: 2.10 KG¢ ¡ µ 2 ∂ ∂ + m ψ(x) ¡ µµ ¢ =0 ⇒ −k kµ + m2 ψ(x) = 0 1 kµ kµ −m2 +iη Dirac (iγ µ ∂µ − m) ψ(x) = 0 ⇒ (γ µ kµ − m) ψ(k) = 0 1 γ µ kµ −m+iη Elektromagnetismus Nach dem skalaren Feld (Spin 0) und dem Dirac-Feld (Spin 1/2) kommen wir nun zum elektromagnetischen Feld mit Spin 1. Hier kommen einige neue Ideen ins Spiel, denn das elektromagnetische Feld ist nicht einfach ein bosonisches Feld, nur mit Spin 1 statt 0, sondern ist zusätzlich masselos und – noch wichtiger – ein Eichfeld. Wir erinnern uns zunächst am die klassische Elektrodynamik und formulieren deren Grundgleichungen dann in relativistischer Form. Das elektrische und das magnetische Feld sind, in Gegenwart von Ladungen und Strömen, durch die Maxwell-Gleichungen ∇·E = ∇·B = ∇×E = ∇×B = 37 4π% 0 ∂B − ∂t 4πj + (2.368) (2.369) (2.370) ∂E ∂t (2.371) bestimmt. Wir verwenden hier Gauss’sche Einheiten und setzen weiterhin c = 1. (In späteren Abschnitten werden wir zu SI-Einheiten übergehen, aber hier sind Gauss’sche Einheiten zunächst praktischer.) Wir können zwei der vier Gleichungen lösen, indem wir Eichfelder φ, A einführen: B E = ∇×A (2.372) = ∂A . −∇φ − ∂t (2.373) Die Maxwell-Gleichungen werden zu ∂ ∇ · A = −4π% ∂t (0 = 0) µ ¶ ∂ ∂ − ∇×A = − ∇×A ∂t ∂t µ 2 ¶ µ ¶ ∂ ∂φ 2 − ∇ A = 4πj − ∇ ∇ · A + . ∂t2 ∂t ∇2 φ + (2.374) (2.375) Wir erkennen, dass zwei der Gleichungen trivial werden. Die Maxwell-Gleichungen ändern sich nicht unter der Eichtransformation A → A + ∇χ (2.376) ∂χ φ → φ − ∂t mit einer beliebigen Funktion χ(r, t). D.h. die physikalischen Eigenschaften sind invariant unter dieser Eichtransformation. Die Theorie muss das berücksichtigen. Interpretation: (φ, A) enthalten mehr Information, als zur eindeutigen Beschreibung des elektromagnetischen Feldes tatsächlich nötig ist. Das Feld hat gar nicht vier (φ, A1 , A2 , A3 ) oder gar sechs (E1 , E2 , E3 , B1 , B2 , B3 ) unabhängige Komponenten. Es ist wünschenswert, eine Theorie so zu formieren, dass sie in jeder Eichung gilt (d.h., so dass sie invariant unter Eichtransformationen ist). Andererseits kann man die Eichinvarianz auch ausnutzen: Wir erhalten garantiert dieselben Ergebnisse für beobachtbare Größen unabhängig von der Eichung. Wir können also χ so wählen, dass die Rechnung möglichst einfach wird. Zwei Eichungen sind hier wichtig: (a) Lorentz-Eichung: Wird festgelegt durch die Forderung ∇·A+ ∂φ =0 ∂t (2.377) (dies ist eine Gleichung, sie legt eine Größe, χ, fest). Dies führt zu symmetrischen Gleichungen µ 2 ¶ ∂ 2 − ∇ A ≡ ¤A = 4πj (2.378) ∂t2 µ 2 ¶ ∂ − ∇2 φ ≡ ¤φ = 4πρ, (2.379) ∂t2 verschleiert aber wichtige Eigenschaften, wie wir sehen werden. (b) Coulomb-Eichung: Wird festgelegt durch ∇ · A = 0. (2.380) Dann wird µ ¶ ∂2 2 − ∇ A ≡ ¤A ∂t2 = ∂ 4πj − ∇φ ∂t | {z } (2.381) =: 4πjT 2 ∇ φ = 38 −4π% (instantan!), (2.382) wobei jT „transversale Stromdichte“ genannt wird, da gilt 1 ∂ 2 ∇ φ 4π ∂t ∂% = ∇·j+ ∂t = 0. ∇ · jT = ∇·j− (2.383) (2.384) (2.385) Im Fourier-Raum entspricht dem k · jT = 0, also jT ⊥k. 2.10.1 Viervektor-Notation In der relativistischen kovarianten Formulierung führen wir ein 4-Vektorfeld Aµ = (φ, A) (2.386) ein. Die allgemeine Eichtransformation lautet dann Aµ → Aµ − ∂ µ χ. (2.387) ∂µ Aµ = 0 (2.388) ¤Aµ = 4πj µ (2.389) j µ = (%, j). (2.390) Die Lorentz-Eichung führt zu wobei Dies ist alles explizit Lorentz-invariant. Die Coulomb-Eichung und die resultierenden Gleichungen sind nicht explizit Lorentz-invariant, aber die beschriebene Physik ist es natürlich, da sie ja nicht von der speziellen Eichung abhängt. (Hier passiert folgendes: die Gleichungen ändern ihre Form unter Lorentz-Transformationen, aber man kann immer eine Eichtransformation finden, die sie wieder in die ursprüngliche Form bringt.) Die E, B Felder sind jetzt Komponenten des antisymmetrischen Tensors F µν := ∂ µ Aν − ∂ ν Aµ (Feld-Tensor): F µν 0 E1 = E2 E3 −E 1 0 B3 −B 2 −E 2 −B 3 0 B1 −E 3 B2 . −B 1 0 (2.391) (2.392) Man kann die beiden inhomogenen Maxwell-Gleichungen dann schreiben als ∂µ F µν = 4πj ν . (2.393) Die beiden homogenen Maxwell-Gleichungen folgen ja bereits aus der Darstellung durch das Eichfeld Aµ . Die Maxwell-Gleichungen lassen sich als Euler-Lagrange-Gleichungen zu einer Lagrange-Dichte L auffassen, die lautet L=− 1 1 µν F Fµν − 4πj µ Aµ ≡ (E · E − B · B) − 4π%φ + 4πj · A, 4 2 (2.394) verstanden als Funktion des Eichfeldes Aµ bzw. φ, A und von dessen Ableitungen. Wir zeigen dies anhand der inhomoenen Gleichungen: L 1 µ ν (∂ A − ∂ ν Aµ ) (∂µ Aν − ∂ν Aµ ) 4 1 = − (∂ µ Aν − ∂ ν Aµ ) ∂µ Aν 2 = − 39 (2.395) (2.396) daher ∂L ∂L − ∂ (∂µ Aν ) ∂Aν = −∂µ (∂ µ Aν − ∂ ν Aµ ) + 4πj ν = −∂µ F µν + 4πj ν = 4πj ν . 0 = ⇒ ∂µ F µν ∂µ (2.397) (2.398) (2.399) (2.400) Die zu Aν (unterer, d.h. kovarianter Index!) kanonisch konjugierte Größe ist ∂L = −F 0ν . ∂ (∂0 Aν ) (2.401) Insbesondere: (a) Zu A0 = φ konjugiert ist −F 00 = 0. Also ist A0 = φ gar keine dynamische Variable – der dazu gehörende Impuls ist exakt Null. Das versteht man am besten in der Coulomb-Eichung. In dieser gilt nämlich ∇2 A0 ≡ ∇2 φ = −4π%. (2.402) A0 ist also durch die äußere Ladungsträgerdichte (und Randbedingungen) eindeutig bestimmt und hat keine eigene Dynamik. (b) Zu Ak , k = 1, 2, 3 (also −A, Vorzeichen beachten!) konjugiert ist −F 0k = E k (2.403) (also +E). Zu A ist also −E konjugiert. Es scheint, als hätten wir noch drei Freiheitsgrade A1 , A2 , A3 an jedem Punkt. Das ist aber nicht der Fall: Da die Physik invariant ist unter Eichtransformationen Aµ → Aµ − ∂ µ χ, (2.404) kann man eine Größe pro Punkt beliebig wählen. Es bleiben noch zwei Freiheitsgrade. Wir hatten gesehen, dass wir z.B. ∇ · A = 0 fordern können (Coulomb-Eichung). Dann ist A rein transversal (wie man durch Fouriertransformation sieht: k · A = 0 ⇒ A ist senkrecht zur Ausbreitungsrichtung). Bemerkung: Wir haben die Coumlomb-Eichung verwendet, um zu zeigen, dass das elektromagnetische Feld nur zwei unabhängige, dynamische Komponenten hat. Da das eine Aussage über beobachtbare Physik ist, gilt sie aber unabhängig von der Eichung. Die Coulomb-Eichung war nur besonders günstig für die Herleitung. 2.10.2 Quantentheorie des Elektromagnetismus Wir wollen nun das elektromagnetische Feld quantisieren. Wir betrachten zunächst das freie Feld (% = 0, j = 0). Wir hatten 1 (2.405) L = (E · E − B · B) 2 und das zu A kanonisch konjugierte Feld ist −E. Wir verwenden die Coulomb-Eichung. Wir hatten gesehen, dass dann gilt ∇2 φ = 0 (2.406) (freies Feld). Mit der vernünftigen Forderung φ → 0 im unendlichen folgt A0 = φ = 0. 40 (2.407) Dann lautet die Hamiltonsche Dichte (Energiedichte) H = (−E) · ∂0 E − L |{z} (2.408) =Ȧ=−E = E·E− = 1 (E · E − B · B) 2 1 (E · E + B · B), 2 (2.409) (2.410) wie wir aus der Elektrodynamik-Vorlesung schon wissen. Wir müssen H durch das dynamische Feld („Koordinaten”) A (mit ∇ · A = 0) und das dazu konjugierte Feld („Impulse“) −E ausdrücken: H= ¢ 1 ¡ 2 E + (∇ × A)2 2 (2.411) also ˆ ¢ ¡ 1 d3 r E 2 + (∇ × A)2 . (2.412) 2 Da −E zu A konjugiert ist, würden wir in Analogie zu den bisher betrachteten Feldern gern schreiben H= ? (2.413) ? (2.414) [−E m (r, t), An (r0 , t)] = −iδmn δ (r − r0 ) , also [E m (r, t), An (r0 , t)] = iδmn δ (r − r0 ) , um zur QFT überzugehen. Das ist aber nicht konsistent: Fourier-Transformation ergibt ˆ 0 0 [E m (k, t), An (k0 , t)] = d3 r d3 r0 eik·r−ik ·r [E m (r, t), An (r0 , t)] ˆ 0 0 ? = iδmn d3 r d3 r0 eik·r−ik ·r δ (r − r0 ) = iδmn (2π)3 δ (k − k0 ) (2.415) (2.416) (2.417) Dann wäre ? [k · E(k, t), An (k0 , t)] = X km iδmn (2π)3 δ (k − k0 ) (2.418) m = ikn (2π)3 δ (k − k0 ) (2.419) Andererseits folgt aus ∇ · E = 0: Widerspruch! Analog k · E = 0. (2.420) 0 [E m (k, t), k0 A (k0 , t)] = ikm (2π)3 δ (k − k0 ) (2.421) im Widerspruch zu ∇ · A = 0 (Coulomb-Eichung). Also: der naive Kommutator enthält nichttriviale Beiträge für die longitudinalen Anteile von E und A die (aus verschiedenen Gründen) gar keine dynamischen Freiheitsgrade darstellen. Mit anderen Worten: [E m (k, t), An (k0 , t)] muss transversal in k und k0 sein, X X kn0 [E m (k, t), An (k0 , t)] = 0, (2.422) km [E m (k, t), An (k0 , t)] = m n aber iδmn (2π)3 δ (k − k0 ) ist es nicht. Lösung: Wir verwenden nur den transversalen Anteil der rechten Seite: µ ¶ km kn m n 0 [E (k, t), A (k , t)] = i δmn − (2π)3 δ (k − k0 ) . (2.423) |k|2 Jetzt ist X m µ ¶ µ ¶ km kn |k|2 k n 3 0 km i δmn − (2π) δ (k − k ) = i kn − (2π)3 δ (k − k0 ) = 0, |k|2 |k|2 41 (2.424) also ist die rechte Seite transversal. Im Ortsraum erhalten wir transversal m n ↓ T [E (r, t), A (r , t)] = iδmn (r − r0 ) mit ˆ T δmn (r) := 0 µ ¶ d3 k ik·r km kn e δ − . mn (2π)3 |k|2 (2.425) (2.426) Es gibt nun zwei orthogonale lineare Polarisationen von A, da A transversal ist. Diese werden durch zwei Einheitsvektoren ê1k , ê2k ausgedrückt. Die entsprechenden (klassischen) Lösungen der MaxwellGleichung sind proportional zu êsk ei(k·r−ωt) , s = 1, 2. Wir vereinbaren k , |k| ê1k × ê2k = (2.427) d.h., ê1k , ê2k , k bilden ein Rechtssystem. Beachte: 2 X (êsk )i (êsk )j = δij − s=1 ki kj |k|2 (2.428) (da man ê1k = x̂, ê2k = ŷ, k = k ẑ wählen kann. Dann ist 2 X (êsk )i (êsk )j = δi1 δj1 + δi2 δj2 = δij (δi1 + δi2 ). (2.429) ki kj = δij − δi3 δj3 = δij (1 − δi3 ) = δij (δi1 + δi2 ) |k|2 (2.430) s=1 und anderrseits δij − Wir schreiben den Feldoperator A (hier benutzen wir dasselbe Symbol für klassisches und Quanten-Feld!) als Superposition von klassischen („Einteilchen“-) Lösungen, d.h. von ebenen Wellen: 2 h i 1 X 1 X √ Aj (r, t) = √ (êsk )j aks e−i(k·r−ωk t) + a†ks ei(k·r−ωk t) 2ωk s=1 V k (2.431) mit ωk = c|k| = |k| (da c ≡ 1). (2.432) a†ks ? Warum diese Form mit aks und Vgl. reelles Feld, S. 24: A ist ein reelles Vektorfeld in der klassischen Elektrodynamik, es wird in der QFT zu einem hermiteschen Feldoperator. a†ks erzeugt ein Quant des elektromagnetischen Feldes. Dieses nennen wir Photon. Es folgt direkt Ȧj (r, t) = = −E j (r, t) r 2 i h 1 X ωk X √ (êsk )j aks e−i(k·r−ωk t) + a†ks ei(k·r−ωk t) . 2 s=1 V (2.433) (2.434) k Die Vertauschungsrelationen für E, A führen auf i h = δkk0 δss0 aks , a†k0 s0 [aks , ak0 s0 ] = 0 usw. (2.435) (2.436) Wir finden also, dass Photonen Bosonen sind. Wir fassen zusammen, wie wir darauf gekommen sind: 1. Die Lagrange-Formulierung der klassischen Elektrodynamik ergab, dass (der transversale Anteil von) A die dynamische Variable und −E der dazu konjugierte Impuls sind. 42 2. Standard-Quantisierung von konjugierten Variablen und Darstellung des Feldes durch ebene Wellen (also klassische Lösungen) ergab bosonische Vertauschungsrelationen für die Photonen-Erzeuger bzw. -Vernichter. Wir können A, E auch in H= einsetzen und erhalten 1 2 ˆ ¡ ¢ d3 r E 2 + (∇ × A)2 µ ¶ 2 1 XX 1 |k| a†ks aks + , |{z} 2 2 s=1 H= k (2.437) (2.438) =ωk was noch expliziter zeigt, dass Photonen mit Wellenvektor k die Energie |k| haben. Oder mit ~, c wiederhergestellt: Ek = ~c|k|. (2.439) Wir finden außerdem: das Photon hat kein Antiteilchen bzw. ist sein eigenes Antiteilchen. 2.10.3 Transversaler Propagator Wir schreiben schließlich noch den Propagator des elektromagnetischen Feldes in der Coulomb-Eichung auf. Wie zuvor ist das Erebnis nicht Lorentz-invariant, man kann aber zeigen, dass der nicht Lorentzinvariante Anteil nicht zu beobachtbaren Effekten (z.B. in Streuexperimenten) führt, siehe Huangs Buch. Der Propagator wird wie üblich definiert durch DTij (x) := −i h0| T Ai (x)Aj (0) |0i ↑ Zeitordnung ↑ transversal: ∇·A=0 (2.440) Wir verwenden die Darstellung von A durch die Operatoren a, a† , gehen aber zum unendlich großen System über: ˆ 1 X d3 k √ → . (2.441) (2π)3 V k Dann ˆ DTij (x) = −i ¯ E D ¯ 2 0 ¯¯ai aj†0 0 e−ikµ xµ ¯¯ 0 X für x0 > 0 1 d3 k d3 k 0 ks k s ¯ E D ¯ √ µ 0 ¯¯aj 0 0 ai† eik xµ ¯¯ 0 (2π)6 2 ωk ωk0 für x0 < 0 s,s0 =1 k s ks (2.442) ↑ Term mit a|0i verschwindet jeweils, da a das Vakuum vernichtet wobei aiks := (êsk )i aks . Nun ist ¯ E D ¯ ¯ −ikµ xµ ¯ 0 ¯aiks aj† e ¯ 0 = (2π)3 δss0 δ(k − k0 ) (êsk )i (ês0 k0 )j 0 0 ks also unter der Summe P ss0 (2.443) (vgl. S. 42): ˆ DTij (x) = −i µ ¶ d3 k 1 ik·r−iωk |t| ki kj e δ − ij (2π)3 2ωk |k|2 43 (2.444) Mit der Darstellung e−iωk |t| 1 =− 2πi erhalten wir schließlich ˆ DTij (x) = ˆ ¯ ¯ ¯ dk 0 2ω ¯ 2 2 0 ω − (k ) − iη ¯ −∞ ∞ e−ik µ d4 k eik xµ (2π)4 k µ kµ + iη 0 t (2.445) η→k0 µ ¶ ki kj δij − |k|2 (2.446) Die ganze Herleitung ist sehr ähnlich zum relativistischen (komplexen) Feld. 2.10.4 Impuls und Spin Als Anwendung wollen wir den Impuls und Eigendrehimpuls (Spin) eines Photons bestimmen. Die Impulsdichte des elektromagnetischen Feldes ist bekanntlich durch den Poynting-Vektor E×B gegeben. Naiv würden wir den Impuls nun schreiben ˆ p = d3 r E × (∇ × A). (2.447) Warum ist das nicht gut? p ist nicht hermitesch, da E und A nicht kommutieren. Also nehmen wir die symmetrische Form · ¸ ˆ 1 p= d3 r E × (∇ × A) − (∇ × A) × E , (2.448) 2 ! die zumindest den korrekten klassischen Grenzfall ergibt. Wir setzen die explizite Darstellung von A und E = −Ȧ ein: · ³ r ˆ i 1 X 1 ωk X 3 p = d r êsk aks ei(k·r−ωk t) 2 V 2 ωk0 0 0 ss kk ´ ³ 0 † −i(k·r−ωk t) −aks e × (ik0 × ês0 k0 ) ak0 s0 ei(k ·r−ωk0 t) ´ ³ 0 0 −a†k0 s0 e−i(k ·r−ωk0 t) − (ik0 × ês0 k0 ) ak0 s0 ei(k ·r−ωk0 t) ´ ³ ´¸ 0 −a†k0 s0 e−i(k ·r−ωk0 t) × êsk aks ei(k·r−ωk t) − a†ks e−i(k·r−ωk t) (2.449) ·³ r ˆ 1 1 X 1 ωk X = − , d3 r êsk × (k0 × ês0 k0 ) aks ak0 s0 2 V 2 ωk0 ss0 kk0 ´ 0 +ak0 s0 aks ei(k·r−ωk t) ei(k ·r−ωk0 t) ³ ´ 0 − aks a†k0 s0 + a†k0 s0 aks ei(k·r−ωk t) e−i(k ·r−ωk0 t) ³ ´ 0 − a†ks ak0 s0 + ak0 s0 a†ks e−i(k·r−ωk t) ei(k ·r−ωk0 t) ¸ ³ ´ † † † † −i(k·r−ωk t) −i(k0 ·r−ωk0 t) (2.450) + aks ak0 s0 + ak0 s0 aks e e · ¡ ¢ 1 XX = − −êsk × k0 × ês0 , −k aks a−k,s0 e−2iωk t 2 |{z} k ss0 ↑ k0 =−k hier µ ¶ ¡ ¢ † 1 aks0 aks + δss0 −êsk × k × ês0 k 2 |{z} ↑ k0 =+k hier ¶ µ ¡ ¢ † 1 0 0 0 −êsk × k × ês k aks aks + δss 2 ¸ ¡ ¢ † −êsk × k × ês0 ,−k aks a−k,s0 e2iωk t 44 (2.451) Im 1. und 4. Term: Diese Terme sind ungerade in k, daher verschwindet die Summe. (Beweis: 1. Term lautet · ¸ 1 XX (êsk · ês0 ,−k ) k − (êsk · k) ês0 ,−k aks a−k,s0 e−2iωk t | {z } 2 0 ss k =0 setze k → −k, s ↔ s0 : 1 XX = − (êsk · ês,−k ) kaks a−k,s0 e−2iωk t 2 0 k (2.452) ss Die Summe ist gleich ihrem Negativen, also ist sie gleich Null.) Es bleibt: ¸³ · ´ 1 XX p = (êsk · ês0 k ) k − (êsk · k) ês0 k a†ks0 aks + a†ks aks0 + δss0 | {z } | {z } 2 0 ss k =δss0 ¶ XX µ † 1 . k aks aks + 2 0 = k (2.453) =0 (2.454) ss Ein von a†ks erzeugtes Photon hat also wie erwartet den Impuls k (mit wiederhergestellten Einheiten: ~k). Nun zum interessanteren Fall des Eigendrehimpulses. Aus dem Poynting-Vektor erhalten wir die Drehimpulsdichte r × (E × B). Also für den Drehimpuls des Feldes, symmetrisiert: ˆ 1 J= d3 r [r × (E × (∇ × A)) − r × ((∇ × A) × E)], (2.455) 2 und in Komponenten: ¶ ˆ X µ 1 ∂ 3 o j i j l d r J = εijk r εklm E εmno n A − εijk r ε · · · 2 ∂r jklmno µ ¶ ˆ X 1 ∂Ao l j l ∂ 3 o = d r εijk εklm εmno r E A + E | {z } 2 ∂rn ∂rn jklmno = = ˆ d3 r (2.457) ↑ beachte εklm εmno =δkn δlo −δko δln µ ∂ ∂ ∂Al εijk rj E l k Al − E l l Ak + ∂r ∂r ∂rn jklm · µ ¶ ˆ l X 1 ∂Al l ∂ j l ∂A 3 d r εijk r E + E − l 2 ∂rk ∂rk ∂r 1 2 (2.456) X jklm ¡ ¢ +δjl E l Ak + Ak E l + rj El − ∂Ak l E ∂rl ¶ (2.458) ¡ j l k ¢ r E A + r j Ak E l {z } | =0 fällt weg wegen des Gauss’schen Satzes µ ¶¸ l ∂E l k k ∂E A +A . ∂rl ∂rl | {z } (2.459) =0, da ∇·E=0 Der 1. Term enthält r linear, hängt also von der Wahl des Koordinatenursprungs ab. Dieses Verhalten kennen wir aus der Mechanik für den Bahndrehimpuls. Es ist also vernünftig, diesen Term als Bahndrehimpuls L des Feldes zu identifizieren. Der 3. Term hängt dagegen nicht explizit von r ab. Dies ist der Eigendrehimpuls S des Feldes: ˆ X ¡ ¢ 1 i εijk E j Ak + Ak E j d3 r (2.460) S = 2 jk ˆ 1 ⇒ S = d3 r (E × A − A × E). (2.461) 2 Wir können wieder A, E einsetzen und erhalten nach einiger Rechnung ´ X k ³ † S=i ak2 ak1 − a†k1 ak2 . |k| k 45 (2.462) Dies ist nicht diagonal im Polarisationsindex s, d.h. a†ks erzeugt keinen Eigenzustand zu S. Wir können dies leicht reparieren: Wir führen Linearkombinationen ak± := Konvention ↓ ak1 ∓ iak2 √ 2 (2.463) ein. Dies lässt den Hamiltonian diagonal: H= ´ 1X ³ † |k| ak+ ak+ + a†k− ak− + 1 2 (2.464) k und diagonalisiert den Eigendrehimpuls: S= ´ X k ³ † ak+ ak+ − a†k− ak− . |k| (2.465) k Den Eigendrehimpuls nennen wir Spin. Der Spin des Photons hat also den Betrag 1 (mit Einheiten: ~). Es existieren jedoch nur zwei Einstellmöglichkeiten des Spins: parallel oder antiparallel zu k, also zum Impuls. oder „Helizität +1“ (Rechtsschraube) „Helizität -1“ (Linksschraube) Aus der elementaren Quantenmechanik hätten wir für den Spin 1 noch eine dritte Einstellmöglichkeit, nämlich mit k S· =0 (2.466) |k| erwartet. Dass diese hier nicht auftritt, ist eine Folge dessen, dass das elektromagnetische Feld wie gesehen nur zwei unabhängige, dynamische Komponenten hat, nicht drei. (Das lässt sich darauf zurückführen, dass das elektromagnetische Feld masselos ist. Führt man einen Masseterm m2 Aµ Aµ /2 in L ein, so erhält man drei unabhängige Komponenten und auch drei Erzeuger a†k1 , a†k0 , a†k,−1 .) 2.11 Quantenelektrodynamik (QED) Zum Abschluss der Einführung in die QFT wollen wir die QFT des Elektromagnetismus zumindest formulieren. Aus Zeitgründen können wir nicht viel damit rechnen. Die QED ist eine sehr erfolgreiche Theorie, die hochpräzise quantitative Ergebnisse liefert, z.B. für das magnetische Moment (oder äquivalent den g-Faktor) des Elektrons. Der Vergleich mit ebenfalls hochpräzisen Experimenten liefert hervorragende Bestätigungen der Gültigkeit der QED. Wieso ist die QED so erfolgreich? Zum einen ist sie offenbar korrekt innerhalb ihres Gültigkeitsbereichs, d.h. bei Vernachlässigbarkeit anderer Kräfte. Zum anderen zeigt die Beobachtung, dass die elektromagnetische Wechselwirkung relativ schwach ist: die Kopplungsstärke, gegeben durch e2 , in natürlichen Einheiten ist relativ klein gegen eins: 1 e2 ≡ α ≈ . (2.467) ↑ 4π |{z} ~c 137 =1 in unseren Einheiten Feinstrukturkonstante Dies erlaubt Störungsrechnung in α. Wäre α groß, könnte man das nicht machen und quantitative Ergebnisse wären viel schwieriger zu erhalten. Das ist ein Problem der Quantenchromodynamik (QCD), der Theorie der starken Wechselwirkung, in der die entsprechende Kopplungskonstante von der Größenordnung eins ist. 46 2.11.1 Kopplung an geladene Felder Wir betrachten Fermionen (Elektronen) im elektromagnetischen Feld, die Diskussion für ein geladenes skalares Feld (z.B. π + -Meson) ist ähnlich. Wir kennen bereits die Lagrange-Dichten für das Dirac-Feld und das elektromagnetische Feld: = Ψ (∂ µ ∂µ − m) Ψ, 1 = − F µν Fµν . 4 LDirac Lem (2.468) (2.469) Die Gleichung L = LDirac + Lem (2.470) würde ungeladene Fermionen im elektromagnetischen Feld beschreiben (Neutrinos) – die beiden Felder sind gar nicht gekoppelt. Für geladene Fermionen können wir nun auf verschiedenen Wegen vorgehen. Hier werden wir die Form der Kopplung physikalisch motivieren und die Konsequenzen für die Eichtheorie folgern. Wir wissen: j µ = Ψγ µ Ψ (mit Komponenten %, j) (2.471) beschreibt die (Teilchen-) Stromdichte der durch Ψ beschriebenen Fermionen und es gilt ∂µ j µ = 0 (Kontinuitätsgleichung), (2.472) d.h. j µ ist ein erhaltener Strom. Wir wissen auch, wie die Ladungen und Ströme in der klassischen Elektrodynamik an das elektromagnetische Feld koppeln. Um diesen klassischen Grenzfall zu gewährleisten, definieren wir zunächst j µ geringfügig um: j µ := qΨγ µ Ψ (Ladungsstromdichte) (2.473) mit der Ladung q eines Feldquants. Für Elektronen q = −e < 0. (2.474) (In der QFT-Literatur wird oft e als Ladung des Elektrons, also negativ, definiert, so auch von Huang und Itzykson/Zuber. In der Vielteilchen-Literatur und anderswo bezeichnet e die positive Elementarladung. So auch hier.) Natürlich gilt weiterhin ∂µ j µ = 0. In der klassischen Elektrodynamik lautet dann der Kopplungsterm Lint = −4π j µ Aµ , (2.475) vgl. Gleichung (2.394). Wir nehmen an, dass dieser auch in der QED gilt. Dann ist L = = = LDirac + Lem + Lint (2.476) 1 Ψ (iγ ∂µ − m) Ψ − F µν Fµν − 4πj µ Aµ 4 µ ¶ 1 µ µ Ψ iγ ∂µ − 4πγ qAµ −m Ψ − F µν Fµν . 4 | {z } µ (2.477) (2.478) Man fasst die Terme mit ∂µ und Aµ zusammen durch Definition der kovarianten Ableitung Dµ := ∂µ + 4πi qAµ , (2.479) was ergibt L = Ψ (iγ µ Dµ − m) Ψ − = Ψ (i D / − m) Ψ − 1 µν F Fµν 4 1 µν F Fµν . 4 Dies ist nun die Lagrange-Dichte der QED. Sie ist offenbar explizit Lorentz-invariant. 47 (2.480) (2.481) Es ist vielleicht bemerkenswert, dass aus diesem harmlos aussehenden Ausdruck Ergebnisse wie die präzise Berechnung des g-Faktors des Elektrons (g ≈ 2,00231930) folgen. Wie gesagt verwendet die Rechnung Störungstheorie in e2 (∼ α) als kleinem Parameter. Wir untersuchen noch die Eichsymmetrie der Theorie: Für das freie elektromagnetische Feld hatten wir die Invarianz unter Aµ → Aµ − ∂ µ χ (2.482) für beliebiges χ(x) ≡ χ(r, t) gefunden. F µν ist eichinvariant, da es nur E und B enthält, aber naiv finden wir Ψ (iγ µ D / − m) Ψ = → = Ψ (iγ µ ∂µ − 4πγ µ qAµ − m) Ψ Ψ (iγ µ ∂µ − 4πγ µ qAµ + 4πγ µ q∂µ χ − m) Ψ Ψ (iγ µ D / − m) Ψ + 4π Ψq∂/χΨ. (2.483) (2.484) (2.485) Dies ist nicht eichinvariant. Um das zu reparieren fordern wir, dass sich Ψ simultan gemäß Ψ → e4πi qχ Ψ transformiert. Dann folgt nämlich ³ ´ Ψ iγ µ ∂µ − 4πγ µ qAµ − m Ψ ³ ´ µ µ µ µ 4πiqχ iγ ∂ −4πqγ (∂ χ) + 4πγ q(∂ χ) −4πγ qA − m Ψ → Ψ e|−4πiqχ e µ µ µ µ {z } | {z } =1 =0 ³ ´ µ µ = Ψ iγ ∂µ − 4πγ qAµ − mΨ . (2.486) (2.487) (2.488) (2.489) Damit ist L insgesamt eichinvariant. Man kann sich natürlich fragen, warum wir auf die Eichinvarianz der Theorie so viel Wert legen. Die Erfahrung zeigt aber, dass die meisten (oder alle) fundamentalen Wechselwirkungen durch Eichfeldtheorien, d.h. Quantenfeldtheorien mit Eichinvarianz, beschrieben werden. 48 Kapitel 3 Vielteilchentheorie bei T = 0 Im vorigen Abschnitt haben wir einige Quantenfeldtheorien eingeführt und ihre Eigenschaften diskutiert. Man kann noch viele andere definieren. Eine Aufgabe der Hochenergie-/Elementarteilchenphysik ist es herauszufinden, welche QFT die beobachteten Teilchen am besten beschreibt. Wie in der Einführung erwähnt, ist der Ausgangspunkt in der Physik der kondensierten Materie ein anderer: Wir wissen, was die zu Grunde liegende Theorie ist, nämlich die QED mit einigen, ziemlich trivialen Erweiterungen für mehrere Sorten von geladenen Teilchen (Elektronen und Kernen). Das Augenmerk verschiebt sich auf Effekte aufgrund der (praktisch unendlich) großen Zahl von Teilchen. Dennoch kommen andere Quantenfeldtheorien in der Vielteilchentheorie schon bald durch die Hintertür wieder herein: Wir sind meist an Effekten bei niedrigen Energien/Temperaturen interessiert, die oft durch effektive Hamiltonians (oder Lagrangians) beschrieben werden, die z.B. ein reelles Feld (Phononen) oder masselose relativistische Fermionen (Elektronen in Graphit-Einzelschichten, sog. Graphen) darstellen. 3.1 Wechselwirkungsfreie Elektronen Wir betrachten als erstes nicht wechselwirkende Elektronen in einem starren Kristallgitter. Dieses System ist aus Sicht der Elektronen nicht Lorentz-invariant: das Gitter zeichnet ein Inertialsystem aus. Außerdem ist die Geschwindigkeit der Elektronen i.A. klein gegen c. Eine relativistische Formulierung ist daher weder angemessen noch notwendig. Relativistische Quantenfeldtheorien waren einfacher im LagrangeFormalismus zu formulieren. Hier ist dies nicht von Belang und man verwendet meist den Hamiltonian. Für nicht wechselwirkende Elektronen treten wie gesehen nur bilineare Terme auf (vgl. Abschnitt über 2. Quantisierung). Also ist H = = T + V1 µ ¶ ˆ ∇2 3 † d r Ψ (r) − + V1 (r) Ψ(r) ↑ 2m (3.1) (3.2) Index lassen wir fallen S. 22 = X k2 † 1X ck ck + Vk−k0 c†k ck0 . 2m V 0 k (3.3) ↑ kk Volumen (In diesem Abschnitt ignorieren wir den Elektronen-Spin.) Wir betrachten aber nicht irgendein Potential V (r), sondern ein starres Kristallgitter. Was bedeutet das für die Funktion V (r)? V (r) ist periodisch: V (r + R) = V (r) (3.4) für jeden Gittervektor R. Einige Gittervektoren sind in dieser Skizze (hier in zwei Dimensionen) dargestellt: 49 Daher gilt: ˆ Vq d3 r e−iq·r V (r) X ˆ d3 r e−iq·R e−iq·r V (R + r) . | {z } Zelle = (3.5) R3 = R∈ Gitter (3.6) =V (r)! An dieser Stelle ist es nützlich, zunächst folgende Summe zu betrachten: X e−iq·R = ? R∈ Gitter ¯ ¡¯ ¢ Für fast alle q nehmen die e−iq·R gleichverteilte Werte auf dem Einheitskreis ¯e−iq·R ¯ = 1 an. In der Summe heben sie sich weg: Das passiert nur dann nicht, wenn q · R = 2πn, denn dann sind alle Also ist in diesem Fall ∀ R, (3.7) ¡ ¢n e−iq·R = e−i2πn = e−2πi = 1. (3.8) X n∈Z X e−iq·R = 1=N (3.9) R∈ Gitter R∈ Gitter (N → ∞ ist die Zahl der Gitterpunkte). Man definiert das reziproke Gitter als Menge aller Q mit e−iQ·R Q·R (oder äquivalent: 2π Also erhalten wir X R∈ Gitter e−iq·R ( 0 = N 50 = 1 ∀R ∈ Z ∀ R). für q ∈ / rez. Gitter, für q ∈ rez. Gitter. (3.10) (3.11) Somit folgt: ½ ˆ 3 Vq = d re 0 N −iq·r Zelle für q ∈ / rez. Gitter für q ∈ rez. Gitter ¾ V (r) (3.12) ist nur von Null verschieden (und ist dann die übliche Fourier-Transformierte) wenn q ∈ rez. Gitter. Daher gilt auch X 1 1 X iq·r e Vq = eiQ·r VQ . (3.13) V (r) = V q V Q∈ rez. Gitter Wir definieren die Fourier-Transformation von V (r) geringfügig um: ˆ 1 d3 r e−iQ·r V (r) VQ := V R3 X ˆ 1 d3 r e−iQ·R e−iQ·r V (r) = V R∈ Gitter Zelle X wobei e−iQ·R = N = vZelle (3.15) R∈ Gitter ˆ 1 (3.14) d3 r e−iQ·r V (r) (3.16) Zelle ↑ Volumen der Einheitszelle ⇒ V (r) = X eiQ·r VQ (Rücktransformation). (3.17) Q Damit vermeiden wir ein explizites Auftreten der extensiven Größen N, V (→ ∞). Somit ist X k2 † X X H= ck ck + VQ c†k+Q ck . 2m k (3.18) k Q∈ rez. Gitter Wir sehen, dass der 2. Term Elektronen koppelt, deren Wellenvektor (Impuls) sich um reziproke Gittervektoren Q unterscheidet: Hier sind alle Punkte „◦“ aneinander gekoppelt und alle „ד sind ebenfalls aneinander gekoppelt, aber nicht die „◦“ an die „ד. 51 Die 1. Brillouin-Zone ist definiert als die Menge aller k, die näher an Q = 0 als an irgendeinem anderen reziproken Gittervektor Q liegen. Die 1. Brillouin-Zone ist eine spezielle Einheitszelle des reziproken Gitters. Jedes k lässt sich schreiben als Summe eines reziproken Gittervektors Q und eines q ∈ 1.BZ: k = Q + q. (3.19) Das tun wir jetzt für die Operatoren c, c† und schreiben X H= X (k + Q)2 † ck+Q ck+Q + VQ0 c†k+Q+Q0 ck+Q . 2m 0 (3.20) kQQ kQ k ∈ 1.BZ Q ∈ rez. Gitter Da H keine Wechselwirkungen enthält, reicht es hin, Einteilchenzustände zu betrachten. Vielteilchenzustände ergeben sich dann einfach durch Besetzung der entsprechenden Zahl von Einteilchenzuständen unter Beachtung des Pauli-Prinzips. Wir betrachten den Einteilchenzustand X |nki = unkQ c†k+Q |0i , k ∈ 1.BZ. (3.21) Q∈ rez. Gitter Dies ist eine Superposition der von H gekoppelten Einteilchenzustände. ⇒ H |nki = X k0 QQ00 (k0 + Q)2 † ck0 +Q ck0 +Q unkQ00 c†k+Q00 |0i 2m | {z } | {z } - % 0 erfordern k + Q = k + Q00 X + & . z }| { z }| { † VQ0 ck0 +Q+Q0 ck0 +Q unkQ00 c†k+Q00 |0i (3.22) k0 QQ0 Q00 beachte ck0 +Q c†k+Q00 = δkk0 δQQ00 − c†k+Q00 ck0 +Q | {z } vernichtet |0i ⇒ ... X (k + Q)2 † X = ck+Q unkQ |0i + VQ0 c†k+Q+Q0 unkQ |0i 2m 0 Q (3.23) QQ mit Q + Q0 → Q ⇒ Q → Q − Q0 X (k + Q)2 X unkQ c†k+Q |0i + = VQ0 unkQ−Q0 c†k+Q |0i . 2m 0 Q (3.24) QQ Wie müssen wir die unkQ wählen, damit |nki ein Eigenzustand von H ist? X ! . . . = Enk |nki = Enk unkQ c†k+Q |0i . (3.25) Q Dies erfordert X X (k + Q)2 unkQ + VQ0 unkQ−Q0 2m Q0 Q |P {z } = Q0 = Enk unkQ−Q0 (3.26) = Enk unkQ . (3.27) VQ−Q0 u∗ nkQ0 ¸ X· (k + Q)2 δQQ0 + VQ−Q0 unkQ0 ⇒ 2m 0 Q Wir erhalten eine Eigenwertgleichung für die Matrix H mit Komponenten HQQ0 = δQQ0 (k + Q)2 + VQ−Q0 2m 52 (3.28) für die Eigenwerte E1k , E2k , . . . und Eigenvektoren unk . H ist hermitesch, da V (r) reell ist. Daher können wir das Problem im Prinzip lösen. |nki mit den derart bestimmten unkQ ist ein Eigenzustand von H. In Ortsdarstellung lautet dieser ψnk (r) ≡ = hr|nki X unkQ ei(k+Q)·r Q ik·r e|{z} = ebene Welle ³ Beweis: unk (r + R) = X Q X Q | (3.29) (3.30) eiQ·r unkQ {z (3.31) } =: unk (r) ist gitterperiodisch ´ eiQ·r e|iQ·R u = u (r) . nk {z } nkQ (3.32) =1 Dies ist der Inhalt von Blochs Theorem: In einem periodischen Potential sind die Einteilchenwellenfunktionen Produkte aus einer ebenen Welle und einer gitterperiodischen Funktion. Beachte auch, dass das Spektrum von H, Enk nun durch eine diskrete Quantenzahl n („Bandindex“) und ein k ∈ 1. BZ aufgezählt wird. Da H eine stetige Funktion von k ist, erwarten wir, dass auch Enk stetig in k ist. Also bildet ein typisches Spektrum eine Bandstruktur, wie in der Skizze für eine Dimension gezeigt: Nahe bei k = 0 können wir entwickeln: k2 Enk ∼ = En0 + 2m∗n wobei m∗n die effektive Masse ist. Wir können zusätzliche Einsicht aus dem Grenzfall V (r) → 0 gewinnen. Wie sieht Enk dann aus? V ist auch hier periodisch (mit jeder Periode, also auch mit der uns interessierenden). Man kann zeigen, dass sich für ein schwaches Potential V zuerst dort Energielücken öffnen, wo sich zwei Bänder berühren: 53 Man kann dies als Streuung der Elektronen am periodischen Gitter verstehen. Wir definieren noch X a†nk := unkQ c†k+Q . (3.33) Q∈ rez. Gitter Dann ist einfach |nki = a†nk |0i , a†nk (3.34) a†nk erzeugt also einen Einteilchen-Eigenzustand. (Man zeigt, dass ebenfalls Fermionen beschreibt.) Für wechselwirkungsfreie Elektronen erhalten wir die Vielteilchenzustände wie erwähnt einfach durch Besetzung vieler Einteilchenzustände. Der Formalismus der Zweiten Quantisierung sorgt automatisch für die korrekte Antisymmetrie unter Vertauschung (Pauli-Prinzip). Ein Vielteilchenzustand ist also |n1 k1 , n2 k2 , . . .i = a†n1 k1 a†n2 k2 · · · |0i . (3.35) Der Grundzustand ist der Vielteilchenzustand mit der niedrigsten Energie bei der vorgegebenen Teilchenzahl. Wegen des Pauli-Prinzips kann jeder Einteilchenzustand (unter Berücksichtigung des Spins) nur einfach besetzt sein. Wir füllen also die Einteilchenzustände mit aufsteigender Energie auf, bis wir alle Elektronen untergebracht haben. Die höchste dabei erreichte Einteilchenenergie heißt Fermi-Energie EF : Die Menge aller k mit Enk = EF nennt man „Fermi-Fläche“ (eine Fläche im dreidimensionalen k-Raum). Es gibt zwei wichtige Fälle: (a) Fermi-Energie liegt in einem Band: elektrische Anregung mit niedrigen Energien sind möglich, insbesondere Transport (Strom) – ein Metall. (b) EF liegt in einer Energielücke ∆ zwischen zwei Bänderm: elektrische Anregungen benötigen Mindestenergie ∆, daher keine Leitfähigkeit bei T = 0 – ein Isolator (für großes ∆) oder Halbleiter (für kleinere ∆). Anregungen werden thermisch erzeugt für kB T & ∆, dann (intrinsische) Leitung im Halbleiter. 54 Ein Isolator oder Halbleiter hat also keine Fermi-Fläche. 3.2 Elektron-Elektron-Wechselwirkung In realen Kristallen wechselwirken die Elektronen aufgrund ihrer Coulomb-Abstoßung stark miteinander. Die Physik der elektromagnetischen Wechselwirkung von Elektronen wird durch die oben besprochene QED beschrieben, aber diese ist hier unnötig kompliziert, denn • Elektronen im Kristall sind i.A. nicht relativistisch (v ¿ c) und • für die Behandlung der Coulomb-Abstoßung reicht i.A. die klassische Elektrostatik hin. Das entsprechende Zweiteilchen-Potential ist (vgl. S. 21) ˆ 1 X e2 1 VC = d3 r1 d3 r2 Ψ† (r1 )Ψ†σ2 (r2 )Ψσ2 (r2 )Ψσ1 (r1 ) 2 σσ 4πε0 |r2 − r1 | σ1 1 (3.36) 2 (ab jetzt verwenden wir SI-Einheiten). Es ist oft praktisch, diese Wechselwirkung im Fourier-Raum zu schreiben. Mit 1 X ik·r Ψσ (r) = √ e ckσ (3.37) V k erhalten wir VC ˆ 1 1 X X X e2 1 d3 r1 d3 r2 2 2 V 4πε0 |r2 − r1 | 0 0 σ σ = k1 k2 k1 k2 1 2 0 0 ×e−ik1 ·r1 e−ik2 ·r2 eik2 ·r2 eik1 ·r1 c†k1 σ1 c†k2 σ2 ck02 σ2 ck01 σ1 ˆ 1 1 X X X e2 1 d3 r1 d3 ∆r 2 2 V 4πε0 ∆r k1 k2 k01 k02 σ1 σ2 = ×e−i(k1 +k2 −k2 −k1 )·r1 e−i(k2 −k2 )·∆r c†k1 σ1 c†k2 σ2 ck02 σ2 ck01 σ1 . 0 Hier ist ˆ 0 0 d3 r1 e−i(k1 +k2 −k2 −k1 )·r1 = V δk1 +k2 ,k01 +k02 0 0 (3.38) (3.39) (3.40) (Impulserhaltung!) und ˆ d3 ∆r ¡ ¢ e2 1 −i(k2 −k02 )·∆r e =: Vk2 −k02 = Vk02 −k2 4πε0 ∆r (3.41) (siehe unten). Mit q := k02 − k2 folgt k2 = k02 − q, (3.42) k1 = k01 + q, 1 1 X X Vq c†k0 +q,σ1 c†k0 −q,σ2 ck02 σ2 ck01 σ1 = 1 2 2 V 0 0 σσ (3.43) VC k1 k2 q 1 (3.44) 2 0 (wir lassen den Strich „ “ fallen) 1 1 X X Vq c†k1 +q,σ1 c†k2 −q,σ2 ck2 σ2 ck1 σ1 . = 2 V σ σ k1 k2 q 1 2 55 (3.45) Graphische Darstellung des Prozesses: Interpretation: zwei Elektronen mit Impulsen k1 und k2 streuen in Zustände mit Impulsen k1 + q, k2 − q (unter Beibehaltung des Spins) mit Wechselwirkungsamplitude proportional zu e2 /q 2 . Bemerkung zur Fourier-Transformierten des Coulomb-Potentials: Wir suchen ˆ e2 e−iq·r Vq = d3 r . (3.46) 4πε0 r Wir betrachten das Yukawa-Potential ˆ VqY = d3 r e2 e−iq·r e−κr 4πε0 r (3.47) (es beschreibt die abgeschirmte Coulomb-Wechselwirkung), VqY = = = ˆ e2 e−iqr cos θ e−κr dr dθ dϕ r2 sin θ 4πε0 r ˆ ∞ ˆ 1 e2 dr re−κr du e−iqru 2ε0 0 −1 {z } | e2 1 ε0 q = ˆ | ∞ 0 =2 (3.49) sin qr qr dr e−κr sin qr {z } = = e−iqr −eiqr −iqr (3.48) (3.50) q q 2 +κ 2 1 e2 . ε0 q 2 + κ 2 (3.51) Im Limes κ → 0: Vq = e2 1 ε0 q 2 (3.52) Diese 1/q 2 Form sieht man übrigens sofort aus der Poisson-Gleichung für eine Punktladung: ∇2 φ = − e δ(r). ε0 (3.53) Mit Fourier-Transformation folgt −q 2 φq e ε0 e 1 ε0 q 2 = − (3.54) ⇒ φq = (3.55) ⇒ Vq = eφq = e2 1 . ε0 q 2 (3.56) Dies ist in gewissem Sinn fundamentaler als das Coulomb-1/r-Gesetz, das speziell in drei Dimensionen gilt. 56 Bemerkung: die Terme mit q = 0 sind nicht wohldefiniert (1/0). Was bedeutet das? ˆ ˆ e2 1 3 Vq=0 = d r = d3 r VC (r) 4πε0 r = V VC . ↑ ↑ Volumen Mittelwert des Potentials (3.57) (3.58) Im Kristall müssen wir aber das gesamte Potential aufgrund der Kerne und der (übrigen) Elektronen berücksichtigen. Da der Kristall insgesamt neutral ist, ist Vges = Velectrons + Vnucleons = 0. (3.59) Der Vq=0 Term wird also vom Kernpotential exakt weggehoben. Wir schließen q = 0 aus den Summen aus. 3.2.1 Störungstheorie für die Coulomb-Wechselwirkung Die Coulomb-Wechselwirkung macht die Physik deutlich schwieriger, denn wir können die Vielteilchenzustände nicht mehr aus Einteilchenzuständen konstruieren, weil die Eigenschaften der Elektronen von den Zuständen aller anderen Elektronen abhängen. Daher wollen wir den Wechselwirkungsterm in H näherungsweise behandeln. Wir betrachten hier quantenmechanische Störungstheorie in VC , weil diese Methode ziemlich systematisch durchgeführt werden kann. Für die Störungstheorie müssen wir einen kleinen Parameter identifizieren. Die Kopplungsstärke der Coulomb-Wechselwirkung ist e2 /ε0 . Aber es macht keinen Sinn zu sagen: „e2 /ε0 ist klein.“ Wir müssen sagen, im Vergleich zu welcher Größe es klein ist. Oder besser, wir brauchen eine dimensionslose Größe. Dann bedeutet „klein” einfach „klein gegen eins“. Sinnvoll ist, als dimensionslose Größe das Verhältnis der Beiträge von Coulomb-Wechselwirkung und kinetischer Energie zur Grundzustandsenergie zu betrachten. Wir schätzen daher die beiden Energiebeiträge ab: (a) Kinetische Energie: Hier können wir die bekannte Lösung für wechselwirkungsfreie Elektronen verwenden (alle Einteilchenzustände bis EF werden aufgefüllt). hT i0 X = kσ |k|≤kF ⇔ k2 2m X = σ |{z} k2 2m (3.60) ≤EF ˆ V |k|≤kF =2 = 2V 1 1 3 (2π) 2m d3 k k 2 (2π)3 2m ˆ ˆ kF dk 0 (3.61) dΩ k 2 k 2 | {z } (3.62) Raumwinkel 1 1 k5 V 1 5 = 2V 4π F = k . 3 (2π) 2m 5 5π 2 2m F (3.63) Wir wollen die kinetische Energie pro Elektron ausrechnen, dazu brauchen wir die Elektronenzahl X X ˆ d3 k 1 4 3 V 3 V hN i0 = 1= 1 = 2V πkF = k (3.64) 3 3 3 2 F (2π) (2π) 3π |k|≤k F σ kσ | {z } |k|≤k F ¿ ⇒ T N À = 0 Kugelvolumen! kF2 3 3 = EF . 5 2m 5 57 (3.65) Es ist auch nützlich, dies durch die Elektronendichte statt durch EF auszudrücken: Die Dichte ist n := kF = und EF ¿ À T N 0 = ⇒ ⇒ = hN i0 k3 = F2 V 3π √ 3 3π 2 n 2 1 (3π 2 n) 3 2m 2 3 1 ¡ 2 ¢ 23 2 3π n3 ∼ n3 . 5 2m (3.66) (3.67) (3.68) (3.69) (b) Als nächstes wollen wir die Coulomb-Energie abschätzen. Bei einer Dichte n ist der typische Abstand zweier benachbarter Elektronen (betrachte die Dimensionen!) 1 d = n− 3 , (3.70) also ist die typische Coulomb-Energie pro Elektron ¿ À 1 VC e2 1 ≈ ∼ n3 N 0 4πε0 d (3.71) (eine sorgfältigere Rechnung folgt später). Zusammenfassend finden wir also 1 hVC i0 1 n3 ∼ 2 = n− 3 −→ 0 n→∞ hT i0 3 n Wir erhalten ein überraschendes Ergebnis: (3.72) • Für hohe Dichte wird die Coulomb-Wechselwirkung irrelevant, die kinetische Energie dominant. • Für niedrige Dichte wird die Wechselwirkung wichtig. Wieso ist das so? hVC i0 wächst mit der Dichte an, wie erwartet, aber hT i0 wächst schneller an, und zwar wegen des Pauli-Prinzips. Dieses zwingt Elektronen für höhere Konzentrationen in Einteilchenzustände mit immer höherer Energie. Aus der Elektronendichte erhalten wir eine nützliche dimensionslose Größe unter Verwendung des Bohr-Radius (typischer Elektron-Proton-Abstand im H-Atom) aB = 0, 053 nm: rS := = ¿ ⇒ T N À = 0 Radius einer Kugel, die im Mittel ein Elektron enthält aB r 9π 1 3 4 kF aB µ ¶2 3 9π 3 e2 1 1 = 2, 211 Ry 2 10 4 4πε0 aB rS2 rS (3.73) (3.74) (3.75) mit dem Rydberg definiert durch 1 Ry = 13, 6 eV (Bindungsenergie des H-Atoms). VC wird schwach im Vergleich zu T für hohe Dichten, also für kleine rS . Daher ist rS unser kleiner Parameter. Die führende Ordnung in der Störungstheorie in rS ist offenbar die Ordnung −2, denn bereits ohne Coulomb-Wechselwirkung erhalten wir ¿ À T 1 E (0) = = 2, 211 Ry 2 . (3.76) N N 0 rS Die nächsthöhere Ordnung ist die erste Ordnung in VC und erwartungsgemäß die Ordnung −1 in rS . Störungstheorie erster Ordnung in VC ergibt: E (1) N = = 1 hVC i0 N X 1 2N V k1 k2 q, q6=0 (3.77) X e2 1 hGZ|c†k1 +q,σ1 c†k2 −q,σ2 ck2 σ2 ck1 σ1 |GZi . 2 | {z } ε q 0 ↑ σ σ 1 2 Grundzustand (Fermi-See) ↑ nur nicht Null, wenn |k1 |,|k2 |≤kF 58 (3.78) Andererseits muss die Anwendung von c†k1 +q,σ1 c†k2 −q,σ2 wieder auf denselben Grundzustand führen, d.h. c†k1 +q,σ1 c†k2 −q,σ2 müssen zwei Elektronen in denselben Einteilchenzuständen erzeugen, in denen sie von ck2 σ2 ck1 σ1 vernichtet wurden. Dafür gibt es nur zwei Möglichkeiten: (a) k1 + q = k1 und k2 − q = k2 , also q = 0. Aber die q = 0 Terme haben wir oben schon ausgeschlossen, da sie vom Kernpotential weggehoben werden. (b) k1 + q = k2 und (äquivalent) k2 − q = k1 und σ1 = σ2 . Die Elektronen tauschen gewissermaßen ihre Plätze, daher nennt man dies Austausch-Wechselwirkung. Also ist E (1) N = 1 X X e2 1 hGZ| c†k1 +q,σ1 c†k1 σ1 ck1 +q,σ1 ck1 σ1 |GZi 2 2N V ε q 0 σ k1 q = da q 6= 0 folgt c†k1 σ1 ck1 +q,σ1 = −ck1 +q,σ1 c†k1 σ1 −1 X X e2 1 hGZ| n†k1 +q,σ1 nk1 σ1 |GZi 2 2N V ε q 0 ↑ ↑ σ k1 q (3.79) 1 (3.80) 1 (Teilchenzahloperator) = −1 X X e2 1 θ(kF − |k1 + q|)θ(kF − |k1 |) {z } 2N V ε0 q 2 | k1 q σ1 k1 und k1 +q=k2 müssen im Fermi-See liegen |{z} =2 59 (3.81) ˆ ˆ 1 d3 k1 e2 d3 q 1 θ(kF − |k1 + q|)θ(kF − |k1 |). 2 V2 3 2 2N V ε0 (2π) q (2π)3 Das Integral über k1 hängt nicht von der Richtung von q ab. Also folgt ˆ 2kF ˆ 1 q2 1 e2 4π ... = − dq d3 k θ(kF − |k1 + q|)θ(kF − |k1 |) 2 V2 2N V ε0 (2π)3 0 q 2 (2π)3 | {z } ... = − (3.82) (3.83) Volumen des doppelten Kugelabschnitts (Skizze) }| { 2kF π ³ 1 e2 4π 1 q ´2 ³ q´ 2 − V dq kF − 2kF + N ε0 (2π)3 0 (2π)3 3 2 2 2 4 V e 4π 2π 3kF − N ε0 (2π)6 3 2 e2 1 kF4 1 e2 1 kF3 − = − k a = −0, 916 Ry . F B 4πε0 n 4π 3 4πε0 2aB | {z } |2π{z3 n} rS | {z } ∼ 1 z ˆ = = = =1 Ry rS (3.84) (3.85) (3.86) Zahl Also sind die führenden Ordnungen in rS : E ∼ E (0) E (1) 1 1 + = 2, 211 Ry 2 − 0, 916 Ry . = N N N rS rS (3.87) Wir finden, dass die Korrektur erster Ordnung in VC negativ ist. Der Grund hierfür ist, dass die positive, d.h. abstoßende, direkte Coulomb-Wechselwirkung wie gesehen vom Kernpotential weggehoben wird. Es bleibt nur die Austauschwechselwirkung, die aufgrund der Antikommutation der Fermionoperatoren negativ ist. Sie beschreibt, dass die Coulomb-Abstoßung zwischen Elektronen abgesenkt ist, da sie sich wegen des Pauli-Prinzips nicht so nahe kommen wie klassische Teilchen es täten. Da der Term erster Ordnung in VC negativ ist, finden wir eine optimale Dichte des Elektronengases (d.h. ein optimales rS ), die die Energie minimiert. Es ist rS∗ = 4, 83 und E (rS∗ ) = −0, 095 Ry = −1, 29 eV. (3.88) N Es ist wichtig zu beachten, dass wir vom Kernpotential nur den Mittelwert berücksichtigt haben, nämlich um den q = 0 Anteil von VC zu kompensieren. Dies nennt man Jellium-Modell. Die gitterperiodische Struktur des Kernpotentials wurde vernachlässigt. Trotzdem ist das Ergebnis überraschend gut für einfache Metalle. Z.B. für Natrium: E = −1, 13 eV (3.89) experimentell rS = 3, 96 und N Es liegt nahe zu versuchen, das Ergebnis durch Betrachtung der 2. Ordnung weiter zu verbessern. Der Term 2. Ordnung in VC ist 1 E (2) = N N X hGZ| VC |Ψi hΨ| VC |GZi . E (0) − EΨ |Ψi6=|GZi ↑ Summe über alle Vielteilchenzustände 6=|GZi Es gibt wieder direkte und Austausch-Beiträge: 60 (3.90) direkt Austausch Wir betrachten den direkten Term, der sich hier nicht weghebt (es gibt keinen weiteren kompensierenden Term vom Kernpotential; dieses haben wir im Jellium-Modell bereits vollständig berücksichtigt, als wir Vq=0 weggelassen haben). Die möglichen Zwischenzustände sind c†k1 +q,σ1 c†k2 −q,σ2 ck2 σ2 ck1 σ1 |GZi |Ψi = ( mit k1 , k2 ≤ kF (∗) und |k1 + q|, |k2 − q| > kF Daher ist (2) Edir 1 = N N V2 (3.91) (besetzt im Grundzustand) (unbesetzt im Grundzustand). X X k1 k2 q σ1 σ2 | {z } ¡1 2 Vq E (0) − ¢2 EΨ . (3.92) mit Nebenbedingung (∗) Wir betrachten kleine q (6= 0): In diesem Grenzfall ist (a) (b) (c) Vq2 ∼ (3.93) ¤ 1 £ 2 1 k1 + k22 − |k1 + q|2 − |k2 − q|2 ∼ [−2k1 · q + 2k2 · q] ∼ q (3.94) E (0) − EΨ = = 2m 2m X θ(kF − k1 ) θ(|k1 + q| − kF ) ∼ q (3.95) | {z } | {z } k1 (d) 1 q4 im Fermi-See nicht im Fermi-See analog gilt X ··· ∼ q (3.96) k2 Also ist Kugelkoordinaten (2) Edir N zˆ }| qmax ∼ 0 { dq q 2 1 1 q q = q4 q ↑ ↑ ↑ ↑ (c)(d) (a) (b) ˆ qmax dq 0 ¯qmax 1 = ln q ¯0 = ∞. q (3.97) Der Term 2. Ordnung divergiert bei kleinen q (Infrarotdivergenz ). Man kann zeigen, dass die Austauschwechselwirkung das nicht beseitigt. Es bedarf Methoden der QFT, um diese IR-Divergenz zu beseitigen. 61 Wir werden sehen, dass wir Beiträge aller Ordnungen der Störungstheorie aufsummieren müssen, um dies zu erreichen. Bemerkung: Die obere Grenze qmax des q-Integrals ist formal nach der bisherigen Rechnung ∞, also divergiert das Integral auch für große q. Das ist aber harmlos, da wir immer einen Abschneideparameter für große q haben, nämlich die Größe der 1. Brillouin-Zone, qmax ∼ π/a. Dieser ergibt sich offenbar aufgrund der Gitterstruktur. 3.3 Gitterschwingungen und Phononen Wir hatten bereits in Kapitel 2 die lineare Kette betrachtet. Mit dem inzwischen eingeführten Formalismus der 2. Quantisierung lässt sie sich eleganter lösen. Wir hatten ¶ Xµ 1 1 † 2 † H= P Pn + mωn Qn Qn (3.98) 2m n 2 n mit r ωn = 2 κ ¯¯ πn ¯¯ ¯sin ¯. m N (3.99) Wir führen Erzeugungs- und Vernichtungsoperatoren ein: µ ¶ 1 Qn 1 bn := √ + iln Pn mit ln := √ l mω 2 n n µ † ¶ µ ¶ 1 Q 1 Q −n n † † ⇒ bn = √ − iln Pn = √ − iln P−n . ln ln 2 2 Man sieht durch Einsetzen, dass H= X n µ ¶ 1 ωn b†n bn + 2 (3.100) (3.101) (3.102) i h und findet bn , b†n0 = δnn0 , also beschreiben die b-Operatoren Bosonen: Phononen sind Bosonen. Üblicherweise benutzt man die Wellenzahlen k= 2π n a N mit n ∈ Z (3.103) ↑ Gitterkonstante zur Aufzählung der Moden: X k r µ ¶ 1 ωk b†nk bk + , 2 ωk = 2 62 ¯ ¯ κ ¯¯ ka ¯¯ sin . m ¯ 2 ¯ (3.104) Die Kette hat natürlich auch die Periode 2a (und auch 3a usw.): Was passiert, wenn wir diese zu Grunde legen? Die 1. Brillouin-Zone halbiert sich, wenn wir die Einheitszelle der Kette verdoppeln: Dadurch ist nichts gewonnen. Wenn aber die Kette zwei unterschiedliche Massen m1 , m2 abwechselnd enthält, müssen wir die 2a-Einheitszelle benutzen. Man findet, dass sich die Phononenbänder am Rand der 1. BZ abstoßen – dasselbe Phänomen hatten wir für die elektronische Bandstruktur gefunden. Somit kann man zwischen optischen Phononen (so bezeichnet, da sie stark an Licht koppeln) und akustischen Phononen (da sie für kleine k Schall beschreiben) unterscheiden. Die Dispersion von Licht ist auf der k- und Energie-Skala der Phononen sehr steil. Starke Kopplung zwischen Photonen und Phononen besteht, wo sich die Dispersionen schneiden. Dies ist für die optischen Phononen bei kleinen k der Fall. Wir geben noch an, wie die Auslenkung für kleine k aussehen: 63 π k ¿ 2a akustisch π k ¿ 2a optisch In der Verallgemeinerung auf drei Dimensionen findet man für NBasis Atome in der Einheitszelle drei akustische Bänder und 3(NBasis − 1) optische Bänder. In bestimmten Richtungen im (k-) Raum können einige Bänder entartet sein. Beispiel für NBasis = 3: 3.4 Elektron-Phonon-Wechselwirkung Klassisch ist die potentielle Energie der Elektronen im durch die Ionenrümpfe (= Kerne mit stark gebundenen Elektronen in inneren Schalen) gebildeten Kristallgitter ˆ VE-I = d3 r (−e)nel (r) ↑ Elektronenkonzentration N X j=1 VI (r − rj ) (3.105) ↑ Ort von Ion j VI ist hier das Potential eines Ionenrumpfes. (Der Einfachheit halber betrachten wir ein Kristallgitter mit einatomiger Basis, in dem also alle Ionenrümpfe äquivalent sind.) Nun schwingen die Ionen um ihre Gleichgewichtslage: rj = Rj + uj . (3.106) Die Rj bilden ein periodisches Gitter und die Auslenkungen uj sind klein gegenüber der Gitterkonstante, |uj | ¿ a. Wir können daher entwickeln: VI (r − rj ) = VI (r − Rj − uj ) (3.107) Taylor-Reihe bis zur 1. Ordnung ∼ = ⇒ VE-I = VI (r − Rj ) − ∇VI (r − Rj ) · uj (3.108) ˆ ˆ X X d3 r (−e)nel (r) VI (r − Rj ) − d3 r (−e)nel (r) ∇VI (r − Rj ) · uj . (3.109) j j Der erste Term beschreibt ein periodisches Potential und führt zur elektronischen Bandstruktur (BlochTheorie, s.o.). Der zweite Term beschreibt die Elektron-Gitterschwingungs-Wechselwirkung, ˆ X VE-Ph = d3 r (−e)nel (r) uj · ∇VI (r − Rj ). (3.110) j 64 Wir wollen eine quantenmechanische, oder vielmehr quantenfeldtheoretische, Beschreibung finden. Dazu müssen wir nel durch elektrische und uj durch phononische Erzeugungs-/Vernichtungsoperatoren ausdrücken. Es ist X nel (r) → Ψ†σ (r)Ψσ (r) (3.111) σ mit X 1 Ψσ (r) = √ V Also nel (r) → eik·r ckσ . (3.112) k∈ 1. BZ 1 X −i(k0 −k)·r e ck0 σ ckσ . V 0 (3.113) kk σ Für die Phononen erinnern wir uns an die lineare Kette, wo nach Gleichung (3.100) gilt µ ¶ uk 1 1 + ilk pk mit lk = √ bn := √ l mω 2 k k à ! µ ¶ † uk 1 1 u−k † † bn = √ − ilk pk = √ − ilk p−k lk lk 2 2 ⇒ uk l √k (bk + b†−k ). 2 = (3.114) (3.115) (3.116) In drei Dimensionen haben wir drei akustische Moden λ = 1, 2, 3 mit Polarisation beschrieben durch Einheitsvektoren êkλ (vergleiche das elektromagnetische Feld): ´ lkλ ³ ukλ = êkλ √ bkλ + b†−kλ 2 Also 1 uj = √ N X 3 X 1 eik·Rj → √ N k∈ 1. BZ λ=1 mit lkλ = √ X X k∈ 1. BZ λ 1 . mωkλ ´ lkλ ³ eik·Rj êkλ √ bkλ + b†−kλ 2 (3.117) (3.118) Das ionische Potential VI (r − Rj ) ist aus Sicht der Elektronen ein äußeres Potential und bedarf keiner Quantisierung. Es ist VI (r − Rj ) = ⇒ ∇VI (r − Rj ) = 1 X ip·(r−Rj ) e Vp V p 1 X ip eip·(r−Rj ) Vp . V p (3.119) (3.120) VI ist nicht gitterperiodisch, nur die Summe über alle Rj ist es. VI hat daher beliebige Fourier-Komponenten, d.h., p ist nicht auf die 1. BZ oder auf reziproke Gittervektoren beschränkt. Es ist nützlich p = G + q zu schreiben, wobei G ein reziproker Gittervektor und q ∈ 1. BZ sind. Also schreiben wir ∇VI (r − Rj ) ⇒ X uj · ∇VI (r − Rj ) = = j 1 V X X i(G + q)ei(G+q)·(r−Rj ) VG+q (3.121) G q∈ 1. BZ rez. Gitter √ ³ ´ 1 X N (G + q)êqλ VG+q ei(G+q)·r bqλ + b†−qλ (3.122) ip V 2mωqλ Gqλ | {z } “ ” 1 1 =: gqGλ ∼ |G+q| da VG+q ∼ |G+q| 2 = ³ ´ 1 X i(G+q)·r e gqGλ bqλ + b†−qλ V Gqλ wobei gqGλ die Kopplungsstärke ist. 65 (3.123) Alles zusammen ergibt VE-Ph = ³ ´ 1 XXX gqGλ c†k+q+Gσ ckσ bqλ + b†−qλ . V kσ qλ (3.124) G Interpretation: Ein Elektron aus dem Zustand |kσi kann durch Emission (b† ) oder Absorbtion (b) eines Phonons in den Zustand |k + q + Gσi gestreut werden. oder Wir sehen, dass das Elektron einen zusätzlichen Impuls G ∈ rez. Gitter erhalten kann. G ist groß (von der Ordnung π/a). Dies drückt im Wesentlichen aus, dass der reziproke Raum für Elektronen- und Phononenzustände periodisch ist: Streuprozess (1) scheint unterdrückt zu sein, da der Impulsübertrag q groß ist und Vq ∼ 1 1 ⇒ gq0λ ∼ . 2 q q (3.125) Aber Prozess (2) ist äquivalent zu (1), da er dieselben Ausgangs- und Endzustände hat. Prozess (2) hat einen kleinen Impulsübertrag G + q, dominiert also über (1). Wir müssen über alle G summieren, wobei die Beiträge mit kleinen G + q dominieren. Wir folgen dem Buch von Bruus und Flensberg und vernachlässigen Prozesse mit G 6= 0 (sogenannte Umklapp-Prozesse). Dies ist erlaubt, wenn wir nur Elektronen mit kleinen k betrachten und vereinfacht die Notation. Wir nehmen außerdem an, dass das Medium isotrop (in allen Richtungen gleich) ist – das ist für Kristalle nie exakt erfüllt, da sie immer gewisse Raumrichtungen auszeichnen, nämlich z.B. die durch die Gittervektoren a1 , a2 , a3 gegebenen. Dann sind alle drei akustischen Zweige entartet und wir können êq1 , êq2 , êq3 beliebig wählen, solange sie orthogonal sind. Physikalisch sinnvoll ist die Wahl q |q| êq2 , êq3 êq1 = Wegen des Faktors q · êqλ in gqλ ≡ q̂ (longitudinal), (3.126) ⊥ q (transversal). (3.127) √ N = ie p q · êqλ Vq 2mωq 66 (3.128) koppeln nur die longitudinalen Moden an die Elektronen. Wir können dann den Index λ = 1 weglassen und schreiben ³ ´ 1 XX VE-Ph = (3.129) gq c†k+qσ ckσ bq + b†−q . V q kσ Der einfachste Hamiltonian für das Elektron-Phonon-System ist schließlich (Jellium-Modell für Hel ): ¶ ³ ´ X k2 † X µ 1 1 XX † H= ck+qσ ckσ + ωq bq bq + + gq c†k+qσ ckσ bq + b†−q . (3.130) 2m 2 V q q kσ kσ Hier werden die Elektronen im Jellium-Modell beschrieben und – damit konsistent – die Phononen im Modell einen isotropen Mediums. Bemerkung: Ist VI ein Yukawa-Potential VI (r) = so ist Ze 1 ε0 q 2 + κ 2 Vq = und Ze e−κr , 4πε0 r (3.131) (3.132) √ gq = i √ N Ze 1 . mωq ε0 q 2 + κ 2 (3.133) Wir werden sehen, dass die Elektron-Phonon-Kopplung, am einfachsten beschrieben durch Gleichung (3.130), wesentlich ist für • die endliche Leitfähigkeit von normalen Metallen (Elektronen streuen an Phononen) • und – vielleicht überraschend – für den dem Anschein nach entgegengesetzten Effekt, die ideale (unendliche) Leitfähigkeit von Supraleitern. 3.5 3.5.1 Zeitabhängige Störungstheorie Bildwechsel in der Quantentheorie Es soll kurz an die Beziehungen zwischen Schrödinger-, Heisenberg- und Wechselwirkungs-Bild erinnert werden. Die einzigen beobachtbaren Größen in der Quantentheorie sind Matrixelemente von (hermiteschen) Operatoren, hϕ|A|ψi. Diese sind invariant unter unitären Transformationen |ϕi → U |ϕi, |ψi → U |ψi, A → U AU † da dann (U unitär), † † U |ψi = hϕ|A|ψi hϕ|A|ψi → hϕ| U | {z} | {zU} A U 1 (3.134) (3.135) (3.136) (3.137) 1 gilt. Dies kann man ausnutzen, um eine dem Problem angemessene Darstellung zu konstruieren. Im Schrödinger-Bild haben Operatoren höchstens eine explizite Zeitabhängigkeit (z.B. zeitabhängiges äußeres Potential). Zustände erfüllen die Schrödinger-Gleichung i d |ψ(t)i = H|ψ(t)i dt (3.138) Wir betrachten jetzt einen zeitunabhängigen Hamiltonian H. Das ist nicht konzeptionell notwendig, macht die Diskusion aber klarer. Dann ist die formale Lösung der Schrödinger-Gleichung |ψ(t)i = e−iHt |ψ(0)i. 67 (3.139) (Beweis: i d/dt e−iHt |ψ(0)i = i(−i)He−iHt |ψ(0)i = H|ψ(t)i.) Im Heisenberg-Bild verwenden wir eine unitäre Transformation, um die Zustände zeitunabhängig zu machen. Die gesamte Dynamik ist dann in den Operatoren enthalten. Dazu wählen wir, für zeitunabhängiges H, U = eiHt . Das dreht gerade die Zeitentwicklung der Zustände im Schrödinger-Bild zurück: |ψ(t)iH := eiHt |ψ(t)i = eiHt e−iHt |ψ(0)i = |ψ(0)i ↑ | {z } | {z } Heisenberg Schrödinger (ohne Index) (3.140) Schrödinger (zeitunabhängig). Andererseits werden Operatoren zu AH := eiHt |{z} A e−iHt . (3.141) Schrödinger, kann explizit zeitabhängig sein Dann folgt zum einen d |ψiH = 0 dt (3.142) und zum anderen d AH dt = d iHt −iHt e Ae dt (3.143) ∂A −iHt e + eiHt A(−iH)e−iHt ∂t −iHt iHt −iHt iHt ∂A −iHt = i(H e|iHt Ae e {z } − e| Ae {z } H) + e ∂t AH AH µ ¶ ∂A = i[H, AH ] + . ∂t H = eiHt iHAe−iHt + eiHt (3.144) (3.145) (3.146) Das ist die bekannte Heisenberg-Gleichung. Wie erwähnt ist sie äquivalent zur Schrödinger-Gleichung. Im Wechselwirkungsbild führen wir eine unitäre Transformation durch, die nur einen Teil des Hamiltonians enthält. Es sei H = H0 + V (t), (3.147) wobei dieser Formalismus nützlich ist, wenn H0 zeitunabhängig und einfach ist. V (t) kann explizit von der Zeit abhängen. Wir verwenden U = eiH0 t : |ψ(t)iI := eiH0 t |ψ(t)i | {z } (3.148) AI (t) := eiH0 t Ae−iH0 t . (3.149) ↑ „interaction picture“ Schrödinger und Es folgt i d |ψ(t)iI dt = = d iH0 t e |ψ(t)i dt −H0 eiH0 t |ψ(t)i +eiH0 t H(ψ(t)) | {z } i (3.150) (3.151) aus der Schrödinger-Gleichung =1 = −H0 e iH0 t |ψ(t)i + e iH0 t z }| { H e−iH0 t eiH0 t |ψ(t)i (3.152) ↑ H0 =eiH0 t H0 e−iH0 t =H0I = VI |ψiI (3.153) Wir erhalten eine Gleichung von der Form der Schrödinger-Gleichung für |ψ(t)iI , die nur die „Störung“ (den komplizierten Anteil) VI enthält. Die einfache Zeitentwicklung aufgrund von H0 steckt einzig in den Operatoren. Die Lösung ist von der Form |ψ(t)iI = UI (t, t0 )|ψ(t0 )iI 68 (3.154) mit einem unitären Operator UI (t, t0 ), der natürlich auch nur von VI abhängen kann. Offensichtlich ist UI (t0 , t0 ) = 1. (3.155) Fall 1: V ist zeitunabhängig. Dann ist es auch H und |ψ(t)iI = eiH0 t |ψ(t)i = eiH0 t e−iHt |ψ(0)i. (3.156) Beachte, dass H0 und H i.A. nicht kommutieren, daher gilt nicht eiH0 t e−iHt = ei(H0 −H)t = e−iV t . (3.157) (Bemerkung: eA eB ∼ = ∼ = ¶µ µ 1 1 + A + A2 1+B+ 2 1 1 + A + B + AB + A2 + 2 1 2 B 2 1 2 B 2 ¶ (3.158) (3.159) während eA+B ∼ = ∼ = 1 (A + B)2 2 1 1 1 1 1 + A + B + AB + BA + A2 + B 2 .) 2 2 2 2 1+A+B+ (3.160) (3.161) Es folgt auch |ψ(t0 )iI ⇒ |ψ(0)i also = eiH0 t0 e−iHt0 |ψ(0)i = eiHt0 e−iH0 t0 |ψ(t0 )iI , (3.162) (3.163) iHt0 −iH0 t0 |ψ(t0 )iI , |ψ(t)iI = eiH0 t e|−iHt {ze } e (3.164) UI (t, t0 ) = eiH0 t e−iH(t−t0 ) e−iH0 t0 . (3.165) so dass gilt Man sieht, dass dieser Operator explizit unitär ist. Fall 2: Allgemeines V (t). Wir setzen |ψ(t)iI = UI (t, t0 )|ψ(t0 )iI (3.166) in die Schrödinger-Gleichung ein: i d UI (t, t0 )|ψ(t0 )iI = VI (t)UI (t, t0 )|ψ(t0 )iI dt d ⇒ i UI (t, t0 ) = VI (t)UI (t, t0 ) dt ∀ |ψ(t0 )iI (3.167) (3.168) mit der Anfangsbedingung UI (t0 , t0 ) = 1. Dies ist eine Differentialgleichung für einen Operator. Integration liefert ˆ 1 t UI (t, t0 ) = 1 + dt1 VI (t1 )UI (t1 , t0 ). (3.169) i t0 Nun haben wir eine Integrationsgleichung erhalten. Was haben wir dadurch gewonnen? Wir können die Gleichung iterieren, indem wir UI (t, t0 ) immer wieder rechts einsetzen: UI (t, t0 ) = 1 + 1 i ˆ t dt1 VI (t1 ) + t0 1 i2 69 ˆ ˆ t t1 dt1 VI (t1 ) t0 dt2 VI (t2 ) + . . . t0 (3.170) Das können wir kompakter schreiben: Der Term n-ter Ordnung lautet ˆ tn−1 ˆ t ˆ t dt1 · · · dtn VI (t1 ) · · · VI (tn ) = dt1 dt2 · · · dtn VI (t1 )VI (t2 ) · · · VI (tn ) ←−−−−−−−−−−−−−−−− t0 t0 t0 | {z } anwachsende Argumente = 1 n! ˆ (3.171) nur t0 ≤tn ≤tn−1 ≤...≤t2 ≤t1 ≤t t dt1 dt2 · · · dtn T VI (t1 ) · · · VI (tn ) ↑ t0 ↑ Zeitordnungsoperator Anzahl der Permutationen (3.172) (es kommt nicht darauf an, wie wir die Zeitvariablen numerieren, nur dass sie der Größe nach sortiert sind). Wir hatten den Zeitordnungsoperator schon in Abschnitt 2.9.3 zum Feynman-Propagator kennen gelernt. Es folgt ˆ t ∞ X 1 n UI (t, t0 ) = (−i) dt1 · · · dtn T VI (t1 ) · · · VI (tn ) (3.173) n! t0 n=0 µ ˆ t ¶ 0 0 =: T exp −i dt VI (t ) . (3.174) t0 Dies definiert die zeitgeordnete Exponentialfunktion. Sie ist gegeben durch die Taylor-Reihe, wobei der T -Operator auf jeden Term unter dem Integral anzuwenden ist. Bemerkung: Vergleiche die Zeitentwicklung für zeitunabhängigen Hamiltonian im Schrödinger-Bild |ψ(t)i = e−iH(t−t0 ) |ψ(t0 )i, also (3.175) µ ˆ t ¶ µ ˆ t ¶ ¡ ¢ U (t, t0 ) = exp − iH(t − t0 ) ≡ exp −i dt0 H ≡ T exp −i dt0 H , t0 (3.176) t0 aber das ist für zeitunabhängiges H eine ziemlich obskure Schreibweise. Die Reihenentwicklung für UI (t, t0 ) in Potenzen der Störung VI lässt sich wie folgt mit Hilfe von Diagrammen veranschaulichen: Ist VI klein, so kann man die Reihe abbrechen. (Es wird oft erst nachträglich klar, ob man ein VI als klein ansehen kann.) Z.B. werden wir in der Linearen-Antwort-Theorie ˆ 1 t dt1 VI (t1 ) (3.177) UI (t, t0 ) ∼ 1 + = i t0 verwenden. 3.5.2 Fermis Goldene Regel Wir erinnern uns kurz an Fermis Goldene Regel für die Übergangsrate von einem Zustand |ii in einen Zustand |f i. Dies können insbesondere auch Vielteilchenzustände sein. Wir definieren die Rate wie folgt: Das System startet zur Zeit t0 im Zustand |ψ(t0 )i = |ii (3.178) H = H0 + V. (3.179) (Schrödinger-Bild!). Der Hamiltonian sei 70 Dieses H sei zeitunabhängig. Wir nehmen nun an, dass V langsam eingeschaltet wird. Dazu gehen wir über zu H = H0 + V eηt , (3.180) wobei η > 0 und klein ist. Dann ist |ψ(t0 )iI = eiH0 t0 |ψ(t0 )i = eiH0 t0 |ii. (3.181) Außerdem ist |ψ(t)iI |ψ(t)i | {z } ⇒ = = UI (t, t0 )|ψ(t0 )iI e−iH0 t UI (t, t0 )eiH0 t0 |ii. (3.182) (3.183) Schrödinger Die Wahrscheinlichkeitsamplitude dafür, das System zur Zeit t im Zustand |f i zu finden, ist hf |ψ(t)i = hf |e−iH0 t UI (t, t0 )eiH0 t0 |ii. (3.184) Wir betrachten o.B.d.A. Übergänge zwischen Eigenzuständen |ii, |f i von H0 mit Energien Ei , Ef und nehmen |ii 6= |f i an. In erster Ordnung in VI : µ ¶ ˆ 1 t −iH0 t ∼ . . . = hf |e 1+ dt1 VI (t1 ) eiH0 t0 |ii (3.185) i t0 ˆ 1 t = hf |e−iEf t 1/ + dt1 VI (t1 ) eiEi t0 |ii (3.186) |{z} i t0 da hf |ii=0 −iEf t = hf |e 1 i ˆ t t0 1 hf |V |iie−iEf t i = dt1 eiH0 t1 V (t1 ) e−iH0 t1 eiEi t0 |ii | {z } ˆ | V t t0 (3.187) eηt1 dt1 ei(Ef −Ei )t1 eηt1 eiEi t0 {z } (3.188) Dieses Integral ist ... |{z} = ¯t ei(Ef −Ei )t1 eηt1 ¯¯ i(Ef − Ei ) + η ¯t0 (3.189) = ei(Ef −Ei )t eiηt − ei(Ef −Ei )t0 eηt0 . i(Ef − Ei ) + η (3.190) Wir schicken nun t0 nach −∞, d.h. das System wurde vor beliebig langer Zeit präpariert. Es folgt hf |ψ(t)i = −hf |V |iie−iEf t = −hf |V |ii ei(Ef −Ei )t eηt iEi t0 e Ef − Ei − iη (3.191) eiEi (t−t0 ) eηt . Ef − Ei − iη Die Wahrscheinlichkeit, das System zur Zeit t im Zustand |f i zu finden, wenn es zur Zeit t0 → −∞ im Zustand |ii präpariert wurde, ist dann |hf |ψ(t)i|2 . Die Übergangsrate Γf i von |ii nach |f i ist die Änderungsrate dieser Wahrscheinlichkeit mit der Zeit: Γf i d |hf |ψ(t)i|2 dt ¯ ¯ e2ηt d ¯ = |hf |V |ii|2 2 2 dt (Ef − Ei ) + η ¯η→0+ ¯ ¯ 2ηe2ηt 2 ¯ = |hf |V |ii| . 2 2 (Ef − Ei ) + η ¯η→0+ = 71 (3.192) (3.193) (3.194) Dies ist eine Darstellung der δ-Funktion. Wir erhalten Fermis Goldene Regel Γf i = |hf |V |ii|2 2πδ(Ef − Ei ). (3.195) Bemerkung: Was wir eigentlich wollen, ist die Rate zur Zeit t für Übergänge nach |f i, unter der Bedingung, dass das System zur Zeit t (oder „t− “) im Zustand |ii ist. Was wir aber anscheinend ausgerechnet haben, ist die Rate unter der Bedingung, dass das System zur Zeit −∞ im Zustand |ii war. Ist das nicht etwas anderes? Im Allgemeinen schon, aber in 1. Ordnung in V in UI kommen wir damit durch, weil vor der Zeit t keine anderen Übergänge stattfinden können – wir brauchen den einen Faktor von V schon zur Zeit t: 3.5.3 Die T -Matrix Es ist im Prinzip klar, wie wir zu höheren Ordnungen in V übergehen können: Wir setzen die vollständige Reihenentwicklung für UI (t, t0 ) ein, ¯ À ¿ ¯ · ˆ ¸ ˆ t ˆ t1 ¯ iE t 1 t ¯ 1 iEi t0 ¯ f ¯ hf |ψ(t)i = f ¯e dt1 VI (t1 ) + 2 dt1 dt2 VI (t1 )VI (t2 ) + . . . e (3.196) ¯i . i t0 i t0 t0 Der Term n-ter Ordnung enthält, mit t0 → −∞, 1 in ˆ ˆ t ˆ t1 tn−1 dt1 −∞ ×e = vertauschen nicht . ↓ iH0 t1 ηt1 dt2 · · · dtn −∞ −∞ −iH0 t1 iH0 t2 ηt2 −iH0 t2 1 in−1 e ˆ t Ve e e Ve · · · eiH0 tn V eηtn e−iH0 tn ↑ Ei dt1 · · · eiH0 t1 V eηt1 −∞ × e−iH0 t1 · · · eiH0 tn−1 V eηtn−1 ©0 −Ei )tn1 +ηtn−1 H ei( © »» 0t e−iH ×» V. Ei − H0 + iη (3.197) Beachte, dass H0 hier ein Operator ist; dies ist eine Operatorinversion. Für tn−1 haben wir im Prinzip das gleiche Integral zu lösen, außer dass die obere Grenze tn−2 ist und dass η durch 2η ersetzt wird. Es geht weiter mit Iteration bis wir schließlich erhalten ... = 1 1 e−i(H0 −Ei )t+nηt V V ··· V. Ei − H0 + inη Ei − H0 + i(n − 1)η Ei − H0 + iη (3.198) Nun kommt es für η → 0+ nicht auch die Vorfaktoren von η in den Nennern an. Nur im ersten Faktor muss η im Exponenten und im Nenner denselben Vorfaktor haben, um die korrekt normierte δ-Funktion 72 zu erhalten. Wir schreiben also ¿ ¯ ∞ ©0 −Ei )t eηt H ¯ −iE»t X ei( © 1 V ··· hf |ψ(t)i = f ¯¯ » V e »f Ei − H0 + iη Ei − H0 + i0+ n=1 ↑ Ef = ¯À ¯ 1 iEi t0 ¯ × Ve ¯i + Ei − H0 + i0 ¯À ¿ ¯X ¯ ¯∞ e−iEi (t−t0 ) eηt 1 1 ¯i . ¯ f¯ V V · · · V Ei − Ef + iη Ei − H0 + i0+ Ei − H0 + i0+ ¯ n=1 {z } | (3.199) (3.200) definiere als T -Matrix Die hier definierte T -Matrix ist T (Ei ) := V + V 1 1 1 V +V V V + ... + + Ei − H0 + i0 Ei − H0 + i0 Ei − H0 + i0+ (3.201) Die Übergangsrate ist schließlich Γf i = = = d |hf |ψ(t)i|2 dt ¯ ¯ 2ηe2ηt ¯ |hf |T |ii|2 2 2 (Ei − Ef ) + η ¯η→0+ 2π|hf |T |ii|2 δ(Ef − Ei ). (3.202) (3.203) (3.204) Offenbar erhalten wir die Goldene Regel richtig als führende Ordnung in V : T ⇒ Γf i ∼ = ≡ V 2π|hf |V |ii|2 δ(Ef − Ei ) (3.205) (3.206) Bemerkungen: • T scheint merkwürdig asymmetrisch definiert zu sein, da Ei explizit auftritt, aber nicht Ef . Die beiden sind aber wegen der δ-Funktion gleich. Es ist ungünstig, aber üblich, die Abhängigkeit von T von Ei nicht explizit als T (Ei ) anzugeben. • Im T -Matrix-Formalismus beschreibt Γf i wirklich nicht die Übergangsrate von |ii zur Zeit t− nach |f i zur Zeit t, sondern die Änderungsrate der Wahrscheinlichkeit von |f i, unter der Bedingung, dass das System zur Zeit −∞ im Zustand |ii war. Vorsicht bei der Interpretation! 3.6 Green-Funktionen bei T = 0 Die bisher betrachtete zeitabhängige Störungstheorie (T -Matrix, Fermis Golgene Regel) gilt allgemein, für Einteilchen- und Vielteilchensysteme. Aber können wir die T -Matrix für ein Vielteilchensystem wirklich ausrechnen? Nehmen wir an, wir wollen ermitteln, wie sich die Elektronen in einem Silizium-Kristall bei Bestrahlung mit Licht verhalten. Dann wäre H0 der Hamiltonian der Elektronen ohne Licht und V die Dipolkopplung an das elektromagnetische Lichtfeld. Die T -Matrix enthält den inversen Operator (Ei − H0 + i0+ )−1 . Diesen können wir nicht ausrechnen, ohne H0 zu diagonalisieren. Das können wir aber wegen der Elektron-Elektron-Wechselwirkung nicht. Ebensowenig können wir U0 (t, t0 ) = e−iH0 (t−t0 ) (3.207) für ein wechselwirkendes Vielteilchensystem ausrechnen. Wir führen daher eine neue Betrachtungsweise ein, die – auch im Vielteilchensystem – von einem einzelnen Elektron ausgeht. Diese Betrachtungsweise verwendet Green-Funktionen. Diese haben eine einfache Interpretation: Sie geben die bedingte Wahrscheinlichkeitsamplitude an, ein Teilchen zur Zeit t am Ort r zu finden, wenn es zur Zeit t0 am Ort r0 war. Sie sind identisch mit den in Kapitel 2 eingeführten Propagatoren (in der QFT spricht man von Propagatoren, in der Vielteilchentheorie verwendet man beide Begriffe, aber häufiger den der Green-Funktion). 73 3.6.1 Green-Funktion für die Einteilchen-Schrödinger-Gleichung Um ein Gefühl für die Green-Funktion zu bekommen, führen wir sie zunächst für Einteilchen-Probleme ein. Wir betrachten den zeitunabhängigen Hamiltonian H = H0 + V . Zustände erfüllen die SchrödingerGleichung in Ortsdarstellung, d i ψ(r, t) = (H0 + V ) ψ(r, t), (3.208) | {z } dt H was wir i.A. nicht lösen können. Aber zumindest formal können wir die Lösung durch eine Green-Funktion ausdrücken, wie wir sehen werden. Zunächst schreiben wir die Schrödinger-Gleichung um: µ ¶ d i − H ψ(r, t) = 0. (3.209) dt Dann definieren wir die Green-Funktion durch µ ¶ d − H G(r, t; r0 , t0 ) = δ(r − r0 )δ(t − t0 ). i dt (3.210) Bemerkung: dies ist eine partielle Differentialgleichung für G als Funktion der ersten Argumente r, t. Die zweiten Argumente r0 , t0 sind Parameter der Gleichung. Man kann aber zeigen, dass wenn G(r, t; r0 , t0 ) eine Lösung der obigen Gleichung ist, auch G(r0 , t0 ; r, t) eine Lösung ist. Beide sind dann also GreenFunktionen. Wir können G explizit durch den Zeitentwicklungsoperator ausdrücken: eine Lösung ist ¯ E D ¯ 0 ¯ ¯ GR (r, t; r0 , t0 ) := −iθ(t − t0 ) r ¯e−iH(t−t ) ¯ r0 . (3.211) Beweis: für t > t0 ist µ i 0 ¶ ¯ E 0 für t>t D ¯ 0 ¯ d ¯ 0 − H(r) GR (r, t; r0 , t0 ) = » δ(t»−»t» ) r ¯e−iH(t−t ) ¯ r0 dt ¯ E D ¯ 0 ¯ ¯ +θ(t − t0 ) r ¯(−iH)e−iH(t−t ) ¯ r0 ¯ E D ¯ 0 ¯ ¯ +iθ(t − t0 )H(r) r ¯e−iH(t−t ) ¯ r0 ¯ E D ¯ 0 ¯ ¯ = −iθ(t − t0 ) r ¯He−iH(t−t ) ¯ r0 ¯ À ¿ ¯ ¯ d −iH(t−t0 ) ¯ 0 0 ¯r ¯ +iθ(t − t ) r¯i e ¯ dt | {z } (3.212) (3.213) He−iH(t−t0 ) = 0. (3.214) Für t < t0 ist GR eine triviale Lösung (GR = 0). Und für eine Umgebung von r = r0 , t = t0 gilt ¶ µ ˆ ˆ ˆ ˆ d R 0 0 (3.212) 3 3 d r dt δ(t − t0 ) hr|r0 i = 1. d r dt i − H(r) G (r, t; r , t ) = | {z } dt (3.215) δ(r−r0 ) Analog zeigt man, dass auch ¯ E D ¯ 0 ¯ ¯ GA (r, t; r0 , t0 ) := +iθ(t0 − t) r ¯e−iH(t−t ) ¯ r0 (3.216) eine Lösung ist. Beachte: • GR 6= 0 nur für t ≥ t0 , dies ist die retardierte Green-Funktion (sie beschreibt Prozesse vorwärts in der Zeit, daher auch kausale Green-Funktion genannt), • GA 6= 0 nur für t ≤ t0 , dies ist die avancierte Green-Funktion. 74 Nun können wir die Lösung der Schrödinger-Gleichung mit Hilfe der Green-Funktionen ausdrücken. Für t > t0 ist ⇒ |ψ(t)i ψ(r, t) 0 = e−iH(t−t ) |ψ(t0 )i ≡ hr|ψ(t)i (3.217) (3.218) 0 = hr|e−iH(t−t ) |ψ(t0 )i ↑ eins einschieben ˆ 0 d3 r0 hr|e−iH(t−t ) |r0 ihr0 |ψ(t0 )i = (3.219) (3.220) ˆ 0 = d3 r0 hr|e−iH(t−t ) |r0 iψ(r0 , t0 ) (3.221) d3 r0 GR (r, t; r0 , t0 )ψ(r0 , t0 ) (3.222) ˆ = i und für t < t0 ˆ d3 r0 GA (r, t; r0 , t0 )ψ(r0 , t0 ). ψ(r, t) = −i Analog können wir Green-Funktionen G0 für den ungestörten Hamiltonian H0 definieren. Wir bestimmen jetzt den Zusammenhang zwischen G und G0 . Es ist µ ¶ d i − H0 ψ0 (r, t) = 0 und dt µ ¶ d − H0 ψ(r, t) = V (r)ψ(r, t). i dt Wir zeigen zunächst, dass für t > t0 gilt ˆ ˆ ˆ 3 0 R 0 0 3 0 0 0 0 0 0 ψ(r, t) = i d r G0 (r, t; r , t0 )ψ(r , t0 ) + d r dt0 GR 0 (r, t; r , t )V (r )ψ(r , t ). (3.223) (3.224) (3.225) (3.226) Beweis: ¶ µ d − H0 ψ(r, t) = i dt ˆ d3 r0 δ(r − r0 )δ(t − t0 )ψ(r0 , t0 ) {z } i | ˆ d3 r 0 + = =0 für t>t0 ˆ dt0 δ(r − r0 )δ(t − t0 )V (r0 )ψ(r0 , t0 ) V (r)ψ(r, t). (3.227) (3.228) In Ordnung – dies ist die zweite Gleichung oben. Wir betrachten nun den Fall, dass ψ und ψ0 derselben Anfangsbedingung ψ(r, t0 ) = ψ0 (r, t0 ) gehorchen. Dann gilt für t > t0 : (a) ˆ ˆ 0 0 0 0 0 dt0 GR 0 (r, t; r , t )V (r )ψ(r , t ). 3 0 ψ(r, t) = ψ0 (r, t) + d r Beweis: Mit (3.229) ˆ 0 0 d3 r0 GR 0 (r, t; r , t0 )ψ(r , t0 ) ψ0 (r, t) = i (3.230) ergibt sich die eben bewiesene Gleichung. (b) ˆ ˆ ψ(r, t) = ψ0 (r, t) + nicht GR 0 ! ↓ R 0 0 dt0 G (r, t; r , t )V (r0 )ψ0 (r0 , t0 ). d3 r0 75 (3.231) Beweis: µ ¶ d i − H ψ(r, t) dt ⇔ µ ¶ d − H0 ψ0 (r, t) −V (r)ψ0 (r, t) dt | {z } =0 µ ¶ ˆ ˆ d 3 0 0 − H GR (r, t; r0 , t0 ) V (r0 )ψ(r0 , t0 ) (3.232) + d r dt i dt | {z } = i δ(r−r0 )δ(t−t0 ) = −V (r)ψ0 (r, t) + V (r)ψ0 (r, t) = 0 OK! (3.233) Wir können (a) iterieren und erhalten ˆ ˆ 3 ψ(r, t) = ψ0 (r, t) + d r1 dt1 GR 0 (r, t; r1 , t1 )V (r1 )ψ0 (r1 , t1 ) ˆ ˆ ˆ ˆ R + d3 r1 dt1 d3 r2 dt2 GR 0 (r, t; r1 , t1 )V (r1 )G0 (r1 , t1 ; r2 , t2 )V (r2 )ψ0 (r2 , t2 ) +... (3.234) Vergleich mit (b) ergibt ˆ R 0 0 G (r, t; r , t ) = 0 0 GR 0 (r, t; r , t ) + ˆ 3 d r1 R 0 0 dt1 GR 0 (r, t; r1 , t1 )V (r1 )G0 (r1 , t1 ; r , t ) + . . . , (3.235) vgl. die Herleitung der T -Matrix. Eine abgekürzte Schreibweise für dieses Ergebnis ist: R R R R R GR = GR 0 + G0 V G0 + G0 V G0 V G0 + . . . (3.236) (betrachte r, t als Matrix-Indizes). Dies ist GR R R R R = GR 0 + G0 V (G0 + G0 V G0 + . . .) | {z } (3.237) = GR ⇒ R G = GR 0 + GR 0V R G . Das ist die berühmte Dyson-Gleichung. Ausführlicher: ˆ ˆ R 0 0 R 0 0 3 R 0 0 G (r, t; r , t ) = G0 (r, t; r , t ) + d r1 dt1 GR 0 (r, t; r1 , t1 )V (r1 )G (r1 , t1 ; r , t ), (3.238) (3.239) diagrammatisch: Analoge Beziehungen gelten für GA vs. GA 0. 3.6.2 Einteilchen-Green-Funktionen für das Vielteilchensystem Wir definieren zunächst die (retardierte) Green-Funktion für ein Vielteilchensystem und zeigen dann, dass diese Definition mit der zuvor betrachteten Green-Funktion für das Einteilchensystem kompatibel ist. Die beiden Definitionen sollten im Wesentlichen übereinstimmen, wenn die Teilchen nicht wechselwirken. Die Green-Funktion für das Vielteilchensystem lautet, unter Berücksichtigung des Spins, i h (3.240) GR (rσt, r0 σ 0 t0 ) := −iθ(t − t0 )hGZ| Ψσ (r, t), Ψ†σ0 (r0 , t0 ) |GZi, | {z } | {z } ± Feldoperatoren im Heisenberg-Bild 76 wobei ( {A, B} ≡ AB + BA für Femionen [A, B]± := [A, B] ≡ AB − BA für Bosonen. (3.241) Wieso ist der Term hGZ|Ψ† Ψ|GZi überhaupt relevant? Ist er nicht Null, weil Ψ ein Teilchen vernichtet, das nicht vorhanden ist? Nein, denn |GZi ist der volle Vielteilchen-Grundzustand, nicht das Vakuum ohne Teilchen. Für Elektronen ohne Wechselwirkung beschreibt |GZi z.B. den Fermi-See. Bemerkung: außer für das wechselwirkungsfreie System kennen wir |GZi i.A. nicht exakt. Die Methode erweist sich dennoch als nützlich. Ganz allgemein können wir Ψ nach Einteilchenzuständen entwickeln, X ϕνσ (r) aνσ (t) (3.242) Ψσ (r, t) = | {z } ν Vernichtungsoperator von |νσi ⇒ R 0 0 0 G (rσt, r σ t ) = −iθ(t − t0 )hGZ| X h i ϕνσ (r)ϕ∗ν 0 σ0 (r0 ) aνσ (t)a†ν 0 σ0 (t0 ) |GZi. ± νν 0 (3.243) Die Zeitentwicklung von aνσ (t) wird, für einen zeitunabhängigen Hamiltonian, beschrieben durch aνσ (t) = eiHt aνσ e−iHt . (3.244) Wir arbeiten im Heisenberg-Bild, lassen aber hier den Index „H“ weg. Speziell für wechselwirkungsfreie Teilchen ist H von der Form X H= ενσ a†νσ aνσ . (3.245) νσ Dann ist à aνσ (t) = exp i X ! εν 0 σ0 a†ν 0 σ0 aν 0 σ0 t à aνσ exp −i ν 0 σ0 = = † n ! εν 00 σ00 a†ν 00 σ00 aν 00 σ00 t (3.246) ν 00 σ 00 † eiενσ aνσ aνσ t aνσ e−iενσ aνσ aνσ t X X ↑P (3.247) n |nihn| einschieben (n = 0, 1 für Fermionen, n = 0, 1, 2, . . . für Bosonen) √ |n − 1i ei(n−1)ενσ t ne−inενσ t hn|. | {z } √ = ne−iενσ t 77 (3.248) Es folgt GR (rσt, r0 σ 0 t0 ) = −iθ(t − t0 )hGZ| X h † ϕνσ (r)ϕ∗ν 0 σ0 (r0 ) eiενσ aνσ aνσ t aνσ νν 0 † −iενσ a†νσ aνσ t † 0 0 i = , eiεν 0 σ0 aν 0 σ0 aν 0 σ0 t a†ν 0 σ0 e−iεν 0 σ0 aν 0 σ0 aν 0 σ0 t ³ X † ϕνσ (r)ϕ∗ν 0 σ0 (r0 ) eiενσ aνσ aνσ t aνσ −iθ(t − t0 )δσσ0 = ×e−iενσ aνσ aνσ (t−t ) a†νσ e−iενσ aνσ aνσ t ± eiενσ aνσ aνσ t a†νσ ´ † 0 † ×e−iενσ aνσ aνσ (t −t) aνσ e−iενσ aνσ aνσ t |GZi ↑ P einschieben: 1 = n |nihn| (n = 0, 1 für Fermionen, n = 0, 1, 2, . . . für Bosonen) X X³ 0 −iθ(t − t0 )δσσ0 ϕνσ (r)ϕ∗ν 0 σ0 (r0 ) eiενσ n(t−t ) aνσ a†νσ ×e ± |GZi (3.249) ν † 0 † 0 ν ×e = −iενσ (n+1)(t−t0 ) † 0 n 0 0 eiενσ n(t −t) a†νσ aνσ e−iενσ (n−1)(t −t) ± X X 0 e−iενσ (t−t ) −iθ(t − t0 )δσσ0 ϕνσ (r)ϕ∗ν 0 σ0 (r0 ) × ¡ | aνσ a†νσ ± {z (3.250) ´ |nihn|GZi (3.251) n ν ¢ † aνσ aνσ |nihn|GZi (3.252) } =[aνσ ,a†νσ ]=1 = −iθ(t − t0 )δσσ0 X 0 hr| e−iενσ (t−t ) |νσihνσ|r0 i (3.253) kann durch Einteilchen-Hamiltonian H̃ ersetzen, da |νσi Eigenzustand von H̃ X 0 X −iθ(t − t0 )δσσ0 hr|e−iH(t−t ) |νσihνσ||r0 i. (3.254) ↑ ν = ν ν P Hier ist ν |νσihνσ| ein Projektions-Operator auf Spin-Zustand σ =↑, ↓. Das Ergebnis ist identisch mit der Green-Funktion für die Einteilchen-Schrödinger-Gleichung, abgesehen vom Spin. Wir haben also eine konsistente Verallgemeinerung der Green-Funktion für Vielteilchensysteme definiert. Wir definieren noch einige andere Green-Funktionen, die später nützlich sein werden: h i (3.255) GR (rσt, r0 σ 0 t0 ) := −iθ(t − t0 ) hGZ| Ψσ (r, t), Ψ†σ0 (r0 , t0 ) |GZi, ± (schon bekannt) GA (rσt, r0 σ 0 t0 ) := i h −iθ(t0 − t)hGZ| Ψσ (r, t), Ψ†σ0 (r0 , t0 ) |GZi, (3.256) G> (rσt, r0 σ 0 t0 ) := −ihGZ|Ψσ (r, t)Ψ†σ0 (r0 , t0 )|GZi, (3.257) −i(∓1)hGZ|Ψ†σ0 (r0 , t0 )Ψσ (r, t)|GZi. (3.258) < ± 0 0 0 G (rσt, r σ t ) := In G< gilt, wie für GR und GA , das obere Vorzeichen für Fermionen und das untere für Bosonen. G> bezeichnet man als „größere Green-Funktion“ (greater Green function). Sie beschreibt Propagation eines Elektrons von r0 , t0 nach r, t. G< bezeichnet man als „kleinere Green-Funktion“ (lesser Green function). Sie beschreibt Propagation eines Loches von r, t nach r0 , t0 . Wie finden GR A G = θ(t − t0 ) (G> − G< ), 0 < > = θ(t − t) (G − G ). (3.259) (3.260) Für translationsinvariante Systeme hängen die Green-Funktionen nur von r − r0 ab und wir können zu den Fourier-Transformierten übergehen: 1 X ik·(r−r0 ) R GR (r − r0 , σt, σ 0 t0 ) = e G (k, σt, σ 0 t0 ) (3.261) V k 78 mit h i GR (k, σt, σ 0 t0 ) = −iθ(t − t0 )hGZ| akσ (t), a†kσ0 (t0 ) |GZi. (3.262) 1 X ik·r Ψσ (r, t) = √ e akσ . V k (3.263) ± Erinnerung: Entsprechende Gleichungen gelten für GA , G> , G< . Da der Ausgangspunkt für die Störungstheorie meist freie Elektronen sind, ist es nützlich, P die diversen Green-Funktionen G0 für freie Elektronen aufzuschreiben. Wie oben finden wir für H = kσ ξkσ c†kσ ckσ : 0 GR 0 (kσ, t − t ) = GA 0 (kσ, t 0 −t) = 0 −iθ(t − t0 )e−ξkσ (t−t ) , 0 −ξkσ (t−t0 ) iθ(t − t )e (3.264) (3.265) (H ist diagonal im Spin σ). Entsprechend findet man D E 0 † 0 G> (kσ, t − t ) = −i c c e−iξkσ (t−t ) , kσ 0 kσ | {z GZ} (3.266) =1−nF (ξkσ ) 0 G< 0 (kσ, t − t ) = D E 0 e−iξkσ (t−t ) , i c†kσ ckσ {z GZ} | (3.267) =nF (ξkσ ) wobei die Fermi-Funktion nF für die Temperatur T = 0 einfach ( 1 für ξ ≤ 0 nF (ξ) = θ(−ξ) = 0 für ξ > 0 (3.268) < ist. Beachte, dass G> 0 , G0 eine einfache, harmonische Zeitabhängigkeit aufweisen. Daher ist die zeitliche Fourier-Transformierte eine δ-Funktion, z.B. G> 0 (kσ, ω) = −2πi[1 − nF (ξkσ )]δ(ω − ξkσ ). (3.269) A GR 0 und G0 sind aufgrund der Sprungfunktion θ nicht einfach harmonisch. Wir rechnen die FourierTransformierte von GR 0 aus: ˆ ∞ 0 0 GR (kσ, ω) = −i dt eiω(t−t ) θ(t − t0 )e−iξkσ (t−t ) (3.270) 0 −∞ ˆ ∞ 0 0 = −i dt eiω(t−t ) e−iξkσ (t−t ) . (3.271) t0 Dieses Integral konvergiert nicht, da der Integrand für t → ∞ mit konstanter Amplitude (eins) oszilliert. Für reale Systeme hat es aber ohnehin keinen Sinn, unendliche Zeiten zu betrachten. Wir können daher eine Änderung vornehmen, die nur sehr große Zeiten betrifft, und die das Konvergenzproblem behebt. Eine solche ist prinzipiell unbeobachtbar und daher eine erlaubte Änderung des Modells. Wir führen dazu einen konvergenz-erzeugenden Faktor ein: ¯ ˆ ∞ 0 0 0 ¯ . . . = −i dt eiω(t−t ) e−iξkσ (t−t ) e−η(t−t ) ¯¯ (3.272) t0 = ¯ ¯ ¯ ω − ξkσ + iη ¯ η>0 klein 1 (3.273) η>0 klein (vgl. Herleitung der T -Matrix). Es ist oft auch nützlich, den Propagator im Realraum zu kennen. Zur Erinnerung: G> 0 ist eine bedingte Wahrscheinlichkeitsamplitude für die Propagation eines wechselwirkungsfreien Elektrons. Es ist ˆ d3 k ik·r e [1 − nF (ξkσ )]δ(ω − ξkσ ) (3.274) G> (rσ, ω) = −2πi 0 (2π)3 ˆ d3 k ik·r = −2πi[1 − nF (ω)] e δ(ω − ξkσ ). (3.275) (2π)3 79 Wir betrachten den Spezialfall freier Elektronen mit ξkσ = k 2 /2m − µ, µ ¶ ˆ ∞ ˆ π 1 k2 2 ikr cos θ dk dθ k sin θe δ ω − ⇒ G> (rσ, ω) = −2πi[1 − n (ω)] + µ (3.276) F 0 4π 2 0 2m 0 ˆ ∞ ˆ π m dk dθ k 2 sin θeikr cos θ = −2πi[1 − nF (ω)] 2 2π 0 0 h³ ´³ ´i p p ×δ k + 2m(ω + µ) k − 2m(ω + µ) (3.277) | {z } nie =0 ¯ ˆ π ¯ m 1 ¯ (3.278) = −2πi[1 − nF (ω)] 2 p dθ ¢2m(ω + µ) sin θeikr cos θ ¯ ¯ k2 2π ¢2 2m(ω + µ) 0 −µ=ω 2m keine Vektoren . ¯ = −2πi[1 − nF (ω)] 3√ m 2 ω + µ 2¢ sin kr ¯¯ √ kr ¯ k2 −µ=ω 2¢ 2π 2 2m 3√ m2 ω + µ √ 2π 2 | {z } = −2πi [1 − nF (ω)] | {z } Zustandsdichte in 3D ist der Endzustand unbesetzt? (3.279) ¯ sin kr ¯¯ . kr ¯ k2 −µ=ω (3.280) 2m Was ist die physikalische Bedeutung dieser Funktion? Die Wahrscheinlichkeitsamplitude G> 0 ergibt sich aus der Interferenz vieler ebener Wellen mit verschiedenen k, aber derselben Energie ω. Wir sehen das resultierende Interferenzmuster. Wir haben G in der Impuls- und der Ortsdarstellung betrachtet. Natürlich können wir die in der Definition auftretenden Operatoren Ψ bzw. a in jeder beliebigen Basis schreiben. Wir schreiben z.B. G> (νt, ν 0 t0 ) := −ihGZ|cν (t)c†ν 0 (t0 )|GZi. (3.281) ↑ ↑ geeignete Quantenzahlen, z.B. kσ 3.6.3 Spektralfunktion Wir haben vier (komplexe) Green-Funktionen definiert, die aber alle dieselbe Idee der Propagation eines Teilchens ausdrücken. Außerdem zeigt der Spezialfall freier Elektronen, dass die verschiedenen GreenFunktionen ähnliche funktionale Formen haben. Wir werden nun sehen, dass sich alle vier Funktionen 80 durch eine einzige reelle Funktion, nämlich die sogenannte Spektralfunktion, ausdrücken lassen. Wir definieren diese zunächst: A(ν, ω) := −2 Im GR (ν , ω), (3.282) ↑ geeignete Einteilchen-Quantenzahlen, z.B. kσ wobei h i iθ(t − t0 )hGZ| aν (t), a†ν 0 (t0 ) |GZi, ± ˆ ∞ h i iω(t−t0 ) −i dt e hGZ| aν (t), a†ν 0 (t0 ) |GZi. GR (ν; t, t0 ) := GR (ν, ω) := ± t0 (3.283) (3.284) Also ist die Spektralfunktion, bis auf einen Zahlenfaktor, der Imaginärteil der retardierten Green-Funktion. Die Behauptung ist, dass sie die gesamte Information von GR , GA , G> , G< enthält (bis auf die Fermi/BoseBesetzungsfunktion). Wir finden ganz allgemein folgende Normierung der Spektralfunktion: ˆ ∞ ˆ ∞ ˆ ∞ £ ¤ dω dω A(ν, ω) = ¡ −2Im (¡ −i) dt eiωt hGZ| aν (t), a†ν (0) ± |GZi (t0 = 0) (3.285) 2π 2π −∞ −∞ 0 ˆ ∞ ˆ ∞ £ ¤ dω iωt = 2Re dt e hGZ| aν (t), a†ν (0) ± |GZi (3.286) 2π 0 −∞ | {z } δ(t) = Wir müssen jetzt annehmen, dass die δ-Funktion halb gezählt wird, da ihre Singularität am Rand des t-Integrals liegt. £ ¤ Re hGZ| aν (t), a†ν (0) ± |GZi = 1. | {z } (3.287) =1 Außerdem finden wir für freie Elektronen: A0 (kσ, ω) = −2Im GR 0 (kσ, ω) ¯ ¯ ¯ = −2Im . ω − ξkσ + iη ¯η→0+ 1 (3.288) Nun benutzen wir die wichtige Formel 1 1 =P −iπδ(E). ↑ E E + iη (3.289) Hauptwert Wir erhalten daher A0 (kσ, ω) = 2πδ(ω − ξkσ ). (3.290) Dies erfüllt natürlich die Normierung, die ganz allgemein gilt. Wir interpretieren die Spektralfunktion A(ν, ω) als die Verteilungsfunktion von möglichen Energien ω für ein Teilchen mit den Quantenzahlen ν. Für wechselwirkungsfreie Elektronen legen ν = (kσ) die Energie bereits fest, daher ist die Verteilung eine δ-Funktion. Wichtige Beziehungen zwischen A und den Green-Funktionen erhalten wir, hier für Fermionen, unter Verwendung von Methoden aus der Funktionentheorie. Dazu erlauben wir in GR (ν, ω) komplexe Frequenzen. 1. Zunächst zeigen wir, dass GR (ν, ω) keine Singularitäten für Im ω ≥ 0 hat: Die retardierte (kausale) Green-Funktion GR (ν, t − t0 ) ist nur für t ≥ t0 von Null verschieden. Dann ist ˆ ∞ ˆ ∞ R iω(t−t0 ) R 0 G (ν, ω) ≡ dt e G (ν, t − t ) = dt eiωt GR (ν, t) (3.291) t0 0 und ˆ GR (ν, t) = ∞ −∞ 81 dω eiωt GR (ν, ω). (3.292) Wir wollen dieses Integral mittels des Residuensatzes auswerten. Für t < 0 wird e−iωt für ω → +∞ klein. Wir können das ω-Integral daher in der oberen Halbebene schließen; der Beitrag vom Halbkreis verschwindet für große Radien: Wenn irgendwelche Pole oder Schnitte in der oberen ω-Halbebene lägen, wäre das Integral nach dem Residuensatz nicht Null. Es muss für die retardierte Green-Funktion aber Null sein. Also gibt es keine Pole oder Schnitte für Im ω > 0. (Für t > 0 müssen wir in der unteren Halbebene schließen. Das Ergebnis ist im Allgemeinen nicht Null, also liegen in der unteren Halbebene im Allgemeinen Pole/Schnitte vor.) 2. Nun ist ˆ dω 0 GR (ν, ω 0 ) =0 ω0 − ω (3.293) für diese Kontur: Beweis: Es liegen keine Pole/Schnitte innerhalb der Kontur. Der Beitrag vom Halbkreis im Unendlichen verschwindet, da GR schnell genug abfällt (das wäre noch zu zeigen). Wir zerlegen den Rest der Kontur: ˆ ˆ ∞ R 0 GR (ν, ω 0 ) 0 G (ν, ω ) 0 + dω = 0. (3.294) dω P ↑ ω0 − ω ω0 − ω y −∞ | Hauptwert {z ´∞ ≡−−∞ dω 0 } GR (ν,ω 0 ) ω 0 −ω (Schreibweise) Die halbkreisförmige Kontur in der Nähe des Pols bei ω 0 = ω sieht so aus: Hier können wir schreiben: |dω 0 | dω 0 = (−i) = (−i)dϕ. −ω r ω0 82 (3.295) Das Hauptwertintegral im ersten Term ist definiert durch µˆ ω−ε ¶ ˆ ∞ R 0 GR (ν, ω 0 ) 0 G (ν, ω ) lim+ dω 0 + dω . ω0 − ω ω0 − ω ε→0 −∞ ω+ε (3.296) Es folgt ˆ ∞ ˆ π GR (ν, ω 0 ) Á dω 0 − i dϕGR (ν, ω +reiϕ ) | {z } ω0 − ω −∞ 0 →0 ˆ ∞ R 0 G (ν, ω ) − iπGR (ν, ω) = Á dω 0 ω0 − ω −∞ ˆ 1 ∞ GR (ν, ω 0 ) GR (ν, ω) = Á dω 0 . iπ −∞ ω0 − ω 0 ⇒ = (3.297) (3.298) (3.299) Dies ist die Kramers-Kronig-Relation, sie gilt für beliebige kausale Funktionen. Real- und Imaginärteil dieser Beziehung lauten ˆ 1 ∞ Im GR (ν, ω 0 ) R Re G (ν, ω) = Á dω 0 (3.300) π −∞ ω0 − ω ˆ 1 ∞ Re GR (ν, ω 0 ) Im GR (ν, ω) = − Á dω 0 . (3.301) π −∞ ω0 − ω Kausalität erzwingt also, dass Re GR oder Im GR bereits allein die gesamte Information enthalten. 3. Insbesondere erhalten wir Re GR (ν, ω) = − ˆ 1 ∞ A(ν, ω 0 ) Á dω 0 0 . 2π −∞ ω −ω Die Darstellung von Im GR = −A/2 ist ohnehin einfach. Es ergibt sich ¯ · ¸ ˆ ˆ dω 0 A(ν, ω 0 ) ¯¯ 1 dω 0 0 0 A(ν, ω ) P − iπδ(ω − ω ) = 2π ω − ω 0 + iη ¯η→0+ 2π ω − ω0 ˆ ∞ dω 0 A(ν, ω 0 ) i = −Á − A(ν, ω) 0−ω 2π ω 2 −∞ oben Re GR (ν, ω) + i Im GR (ν, ω) = GR (ν, ω). = Also ist ˆ R G (ν, ω) = Analog erhält man ˆ A G (ν, ω) = Beachte, dass gilt (3.302) (3.303) (3.304) (3.305) ¯ dω 0 A(ν, ω 0 ) ¯¯ . 2π ω − ω 0 + iη ¯η→0 (3.306) ¯ A(ν, ω 0 ) ¯¯ dω 0 . 2π ω − ω 0 + −iη ¯η→0 (3.307) GA (ν, ω) = [GR (ν, ω)]∗ . (3.308) Man findet auch iG> (ν, ω) −iG< (ν, ω) = A(ν, ω)[1 − nF (ω)] = A(ν, ω)nF (ω). (3.309) (3.310) Bemerkungen: 1. Für wechselwirkende Systeme ist A im Vergleich zu A0 ∼ δ(ω − ξkσ ) verbreitert. Oft kann man aber ein klares Maximum identifizieren, dieses nennt man dann „Quasiteilchen-Peak“: 83 Man bezeichnet die durch eine Spektralfunktion dieser Form beschriebenen Objekte als Quasiteilchen. P 2. Die Summe ν A(ν, ω) =: D(ω) ist die Zustandsdichte bei der Energie ω, da die Beiträge aller Zustände bei der Energie ω aufsummiert werden. D(ω) ist durch Tunnelexperimente zugänglich. 3.7 Bewegungsgleichung für die Green-Funktion Wir wollen nun sehen, wie wir die Green-Funktion tatsächlich ausrechnen können. Dies wird für wechselwirkende Systeme im Allgemeinen nicht ohne Näherungen möglich sein. Wir betrachten einen zeitunabhängigen Hamiltonian H = H0 + Vint , wobei Vint die Wechselwirkungen beschreibt. Wir unterdrücken hier den Spin-Index. Zunächst wollen wir eine Bewegungsgleichung für GR herleiten. Die Definition der Green-Funktion ist GR (rt, r0 t0 ) = −iθ(t − t0 )hGZ|[Ψ(r, t), Ψ† (r0 , t0 )]± |GZi. (3.311) Es folgt ∂ R i G (rt, r0 t0 ) ∂t −−−−− −−−−−−−−−−−−− −→t0 =t 0 † 0 = δ (t − t )hGZ|[Ψ(r, t), Ψ (r , t0 )]± |GZi ∂ Ψ(r, t), Ψ† (r0 , t0 )]± |GZi ∂t ∂ Ψ(r, t), Ψ† (r0 , t0 )]± |GZi. = δ(t − t0 )δ(r − r0 ) − iθ(t − t0 )hGZ|[i ∂t −iθ(t − t0 )hGZ|[i (3.312) (3.313) Wir benötigen i ∂Ψ/∂t. Diese Ableitung ergibt sich aus der Heisenberg-Gleichung, da Ψ ein Operator ist: i ∂ Ψ(r, t) = −[H, Ψ(r, t)] ∂t = −[H0 , Ψ(r, t)] − [Vint , Ψ(r, t)]. (kein ±, immer der Kommutator) (3.314) Ist nun H0 einfach die kinetische Energie der Teilchen (Jellium-Modell, d.h. es existiert kein periodisches Potential), so können wir den ersten Term schreiben als ˆ 1 1 d3 r0 [Ψ† (r0 , t) (∇0 )2 Ψ(r0 , t), Ψ(r, t)] = − ∇2 Ψ(r, t). (3.315) −[H0 , Ψ(r, t)] = 2m 2m Dann folgt µ ¶ £ ¤ ∂ 1 i + ∇2 GR (r, t, r0 t0 ) = δ(t−t0 )δ(r−r0 )−iθ(t−t0 )hGZ| −[Vint , Ψ(r, t)], Ψ† (r0 , t0 ) ± |GZi. (3.316) ∂t 2m Dies ist die gesuchte Bewegungsgleichung für GR . Der zweite Term enthält offenbar die Korrekturen zur Gleichung für den wechselwirkungsfreien Fall, ¶ µ 1 ∂ 2 0 0 0 0 + ∇ GR (3.317) i 0 (r, t, r t ) = δ(t − t )δ(r − r ), ∂t 2m aufgrund der Wechselwirkungen in Vint . 84 Analog gilt in einer beliebigen Einteilchenbasis GR (ν, t, ν 0 t0 ) = −iθ(t − t0 )hGZ|[aν (t), a†ν 0 (t0 )]± |GZi. (3.318) Der ungestörte Hamiltonian H0 hat die Form H0 = X tνν 0 a†ν 0 aν . (3.319) νν 0 Dies liefert −[H0 , aν ] = X tνν 00 aν 00 (3.320) ν 00 und daher ¶ Xµ £ ¤ ∂ iδνν 00 − tνν 00 GR (ν 00 t, ν 0 t0 ) = δ(t − t0 )δνν 0 − iθ(t − t0 )hGZ| −[Vint , aν (t)], a†ν 0 (t0 ) ± |GZi. (3.321) ∂t 00 ν Für einen zeitunabhängigen Hamiltonian H hängt GR nur von t − t0 ab. Es bietet sich an, zur FourierTransformierten in der Frequenz überzugehen. Die Gleichung für GR lautet dann ˆ ∞ X £ ¤ 0 (δνν 00 ω − tνν 00 ) GR (ν 00 ν 0 , ω) = δνν 0 − i dt eiω(t−t ) hGZ| −[Vint , aν (t)], a†ν 0 (t0 ) ± |GZi. (3.322) t0 ν 00 Damit das Integral für große t konvergiert, geben wir ω einen kleinen positiven Imaginärteil, ω → ω + iη, und lassen η am Ende der Rechnung gegen Null gehen, η → 0+ 3.7.1 Wechselwirkungsfreier Fall In diesem Fall kennen wir das Ergebnis schon, siehe Gleichung (3.273). Wir lösen die Bewegungsgleichung, um sicherzustellen, dass sie sich korrekt verhält. Hier ist X H = H0 = tνν 0 a†ν 0 aν . (3.323) νν 0 Wir betrachten GR 0 (ω) als Matirx mit den Komponenten R 0 GR 0 (ω)νν 0 ≡ G0 (νν , ω). (3.324) Dann ist die Bewegungsgleichung X [δνν 00 (ω + iη) − tνν 00 ] GR 0 (ω)ν 00 ν 0 = δνν 0 (3.325) ν 00 R −1 eine Matrix-Gleichung. Wir sehen, dass GR mit den Komponenten 0 (ω) die inverse Matrix zu G0 (ω) −1 GR 0 (ω)νν 0 = δνν 0 (ω + iη) − tνν 0 (3.326) ist. Wenn wir die Matrix t̂ mit den Komponenten tνν 0 einführen, können wir schreiben −1 GR 0 (ω) ⇒ = GR 0 (ω) = ω − t̂ + iη 1 . ω − t̂ + iη Der Bruch ist hier als Matrix-Inversion zu verstehen. Ist H0 diagonal, H0 = 0 R GR 0 (νν , ω) = G0 (ω)νν 0 = δνν 0 wie wir schon wissen. 85 1 , ω − εν + iη (3.327) (3.328) P ν εν a†ν aν , so folgt (3.329) 3.7.2 Resonantes Niveau (resonant-level model) Wir betrachten ein nicht ganz so triviales Modell, in dem ein einzelnes Orbital an ein wechselwirkungsfreies Elektronengas gekoppelt ist. Der Hamiltonian lautet H = H0 + Hlokal + Hhyb (3.330) mit H0 = X ξν c†ν cν (wechselwirkungsfreies Elektronengas), (3.331) ν Hlokal Hhyb = ε0 c†0 c0 (lokales Orbital), X ∗ † (Hybridisierung/Hüpfen). = (tν cν c0 + tν c†0 cν ) (3.332) (3.333) ν Die Summen über ν laufen hier über alle Einteilchenzustände des Elektronengases, aber nicht das lokale Orbital. Wir können die retardierten Green-Funktionen GR (00, t − t0 ) = GR (0ν, t − t0 ) = R 0 G (ν0, t − t ) = GR (νν 0 , t − t0 ) = n o −iθ(t − t0 )hGZ| c0 (t), c†0 (t0 ) |GZi, ª © −iθ(t − t0 )hGZ| c0 (t), c†ν (t0 ) |GZi, n o −iθ(t − t0 )hGZ| cν (t), c†0 (t0 ) |GZi, o n −iθ(t − t0 )hGZ| cν (t), c†ν 0 (t0 ) |GZi (3.334) (3.335) (3.336) (3.337) einführen. Uns interessiert hier GR (00, t − t0 ). Zur Lösung beachten wir zunächst, dass dies ein wechselwirkungsfreies System ist – alle Terme im Hamiltonian sind bilinear. Also können wir die Lösung aus dem vorigen Abschnitt verwenden, müssen aber über alle Einteilchenzustände |νi und |0i summieren: X (−tν )GR (ν0, ω) = 1, (3.338) (ω + iη − ε0 )GR (00, ω) + ν ∧ R (ω + iη − ξν )G (ν0, ω) + (−t∗ν )GR (00, ω) = 0 (3.339) (und zwei weitere Gleichungen, die wir hier nicht benötigen). Aus der zweiten Gleichung folgt GR (ν0, ω) = t∗ν GR (00, ω). ω − ξν + iη (3.340) Einsetzen in Gl. (3.338) ergibt (ω − ε0 + iη)GR (00, ω) − X ν 86 |tν |2 GR (00, ω) = 1 ω − ξν + iη (3.341) ⇒ mit GR (00, ω) = ΣR (ω) := 1 ω − ε0 − ΣR (ω) + iη X |tν |2 . ω − ξν + iη ν (3.342) (3.343) GR (00, ω) hat beinahe die Form für H = Hlokal , nämlich 1/(ω − ε0 + iη), aber es tritt ein zusätzlicher Term −ΣR (ω) im Nenner auf. ΣR (ω) nennt man ganz allgemein die (retardierte) Selbstenergie. Wir erkennen, dass die Selbstenergie aufgrund der Ankopplung des lokalen Orbitals an das Elektronengas, also aufgrund von Hhyb , auftritt. Sie drückt hier aus, dass die Eigenzustände jetzt Superpositionen von |0i mit den |νi sind. Wir können weitere Einsicht durch Betrachtung der Spektralfunktion gewinnen. Sie lautet A(00, ω) = −2 Im GR (00, ω) © ω − ε0 − ΣR (ω)∗ © −iη = −2 Im R 2 © )2 (ω − ε0 − Re Σ ) + (− Im ΣR © +η Im ΣR = −2 , (ω − ε0 − Re ΣR )2 + (− Im ΣR )2 (3.344) (3.345) (3.346) wobei Re ΣR = Im ΣR = X |tν |2 ω − ξν ν X −π |tν |2 δ(ω − ξν ). P (3.347) (3.348) ν Wir betrachten ein einfaches Modell mit konstanter Zustandsdichte D und konstanter Hybridisierung t: ˆ X ... → dξ D . . . (3.349) ν |tν |2 → |t|2 . (3.350) Dann ist Re ΣR = 0 und Im ΣR = −πD|t|2 und es folgt A(00, ω) = −2 2πD|t|2 −πD|t|2 = . (ω − ε0 )2 + (πD|t|2 )2 (ω − ε0 )2 + (πD|t|2 )2 (3.351) (Lorentz-Kurve) Wir finden also, dass durch die Ankopplung an das Elektronengas der lokale Zustand verbreitert wird. Die Linie wird umso breiter, je größer D|t|2 ist. Seine Energie ist offenbar nicht mehr scharf definiert. Dies können wir mit Hilfe der Energie-Zeit-Unschärferelation deuten: Wegen der Superposition mit Zuständen |νi wird die Lebensdauer des lokalen Zustandes endlich und das führt zu einer endlichen Breite im Energiespektrum. 3.7.3 Anderson-Modell für magnetische Störstellen Wir wenden nun die Methode der Bewegungsgleichungen auf das wichtige Anderson-Modell an. Im Vergleich zum resonant-level model berücksichtigen wir noch den Spin-Freiheitsgrad und erlauben eine Coulomb-Wechselwirkung zwischen den (↑ und ↓) Elektronen im lokalen Orbital. Das Ganze ist ein 87 Modell für d- und f -Orbitale von Übergangsmetall- bzw. Seltenerd-Atomen in einem Metall. Die Frage, die wir hier untersuchen wollen, ist, unter welchen Bedingungen diese Störstelle ein magnetisches Moment entwickelt. Der Hamiltonian lautet H = Hc + Hd + HU + Hhyb (3.352) mit Hc = X ξk c†kσ ckσ (Metall) (3.353) εd c†dσ cdσ (lokales Orbital) (3.354) kσ Hd = X σ HU = Hhyb = U c†d↑ cd↑ c†d↓ cd↓ (Coulomb-Wechselwirkung) X † (tk cdσ ckσ + t∗k c†kσ cdσ ) (Hybridisierung). (3.355) (3.356) kσ Wir berücksichtigen die Coulomb-Abstoßung nur für das lokale Orbital, da sie für in den kleinen d- oder f -Orbitalen eingesperrte Elektronen sehr viel größer ist als für Bloch-Elektronen im Leitungsband von typischen Metallen. Das magnetische Moment in z-Richtung ist proportional zur z-Komponente des Spins der Störstelle, szd = c†d↑ cd↑ − c†d↓ cd↓ 2 . (3.357) Wir benötigen Erwartungswerte hGZ|c†dσ cdσ |GZi für σ =↑, ↓. Diese ergeben sich aus der geringeren GreenFunktion: ihGZ|c†dσ0 (t0 )cdσ (t)|GZi G< (dσ, dσ 0 , t − t0 ) = ⇒ hGZ|c†dσ cdσ |GZi ⇒ hGZ|c†dσ cdσ |GZi = < = −iG (dσ, dσ, t = 0) ˆ ∞ dω < −i G (dσ, dσ, ω) −∞ 2π ˆ ∞ dω A(dσ, dσ, ω) nF (ω). ↑ −∞ 2π = (3.358) (3.359) (3.360) (3.361) =θ(−ω) für T =0 Die Spektralfunktion A ergibt sich natürlich aus GR . Wir schreiben die Bewegungsgleichung für GR (dσ, dσ, ω) auf: X (−tk )GR (kσ, dσ, ω) (ω + iη − εd )GR (dσ, dσ, ω) + ˆ k ∞ =1−i t0 © ª dt ei(ω+iη)(t−t ) U hGZ| −[c†d↑ cd↑ c†d↓ cd↓ , cdσ ](t), c†dσ (t0 ) |GZi. 0 (3.362) Diese Gleichung enthält GR (kσ, dσ, ω), so dass wir hierfür ebenfalls die Bewegungsgleichung benötigen: (ω + iη − ξk )GR (kσ, dσ, ω) + (−t∗k )GR (dσ, dσ, ω) = 0. 88 (3.363) In Gleichung (3.362) ist [c†d↑ cd↑ c†d↓ cd↓ , cd↑ ] = c†d↓ cd↓ [c†d↑ cd↑ , cd↑ ] (3.364) = c†d↓ cd↓ (c†d↑ cd↑ cd↑ −cd↑ c†d↑ cd↑ ) | {z } | {z } (3.365) † =−cd↑ (1− cd↑© c© d↑ ) =0 ! (Fermionen) = und analog © −c†d↓ cd↓ cd↑ (3.366) [c†d↑ cd↑ c†d↓ cd↓ , cd↑ ] = −c†d↑ cd↑ cd↓ . (3.367) Also wird Gleichung (3.363), mit Gl. (3.362) eingesetzt, (ω + iη − εd )GR (dσ, dσ, ω) − X k ˆ ∞ = 1 − iU |tk |2 GR (dσ, dσ, ω) ω − ξk + iη 0 dt ei(ω+iη)(t−t ) hGZ| © t0 c†dσ̄ (t) ↑ wobei σ̄:=−σ ª cdσ̄ (t)cdσ (t), c†dσ (t0 ) |GZi. Wir erkennen, dass die rechte Seite eine kompliziertere Green-Funktion © ª DR (dσ, t − t0 ) = −iθ(t − t0 )hGZ| c†dσ̄ (t)cdσ̄ (t)cdσ (t), c†dσ (t0 ) |GZi (3.368) (3.369) enthält. Das ist typisch für die Methode der Bewegungsgleichungen. Wir könnten nun ähnlich wie oben die Bewegungsgleichung für DR herleiten. Diese Gleichung enthält eine noch kompliziertere Green-Funktion! Wir erhalten eine Hierarchie von Gleichungen, die nicht geschlossen ist. Wir müssen daher geeignete Näherungen finden, um die Hierarchie abzubrechen. Unter der Bedingung, dass die Teilchenzahl c†dσ cdσ näherungsweise erhalten ist, können wir diesen Operator in DR durch seinen Grundzustandserwartungswert hGZ|c†dσ cdσ |GZi =: hndσ i (3.370) ersetzen. Dann ist © ª DR (dσ, t − t0 ) ≈ −iθ(t − t0 )hndσ̄ ihGZ| cdσ (t), c†dσ (t0 ) |GZi = hndσ̄ iGR (dσ, dσ, t − t0 ). (3.371) Die komplizierte Green-Funktion DR wird also durch die einfachere GR ausgedrückt. Damit ist das Gleichungsssystem geschlossen. Die Bewegungsgleichung lautet nun à ! X |tk |2 ω + iη − εd − GR (dσ, dσ, ω) = 1 + U hndσ̄ iGR (dσ, dσ, ω), (3.372) ω − ξk + iη k mit der Lösung GR (dσ, ω) ΣR (ω) mit 1 ω − εd − U hndσ̄ i − ΣR (ω) + iη X |tk |2 . = ω − ξk + iη = (3.373) (3.374) k Die Selbstenergie ΣR führt wieder zu einer Verbreiterung des Maximums in A(dσ, ω). Der neue Term U hndσ̄ i führt zu einer zusätzlichen Verschiebung der Quasiteilchenenergie. Beachte, dass hnd↑ i und hnd↓ i verschieden sein können. Es ist hndσ i ≡ = T =0 = hGZ|c†dσ cdσ |GZi ˆ ∞ dω A(dσ, dσ, ω)nF (ω) −∞ 2π ˆ 0 dω 1 −2 Im . R 2π ω − ε − U hn −∞ d dσ̄ i − Σ (ω) +iη | {z } beachte: komplex! 89 (3.375) (3.376) (3.377) Das ist eine Selbstkonsistenz-Beziehung für hnd↑ i und hnd↓ i. In der Praxis nehmen wir einen Wert für hndσ̄ i an, z.B. hnd↑ i = 1, und iterieren die Gleichung, (3.377) (3.377) (3.377) hnd↑ i −→ hnd↓ i −→ hnd↑ i −→ · · · , bis Konvergenz erzielt ist. Für ein einfaches Modell mit D(ξ)|tk |2 = const (vgl. S. 87) können wir das Integral in Gl. (3.377) analytisch berechnen, ansonsten ist eine numerische Rechnung erforderlich. Das typische Ergebnis ist hier dargestellt: Die Näherung c†dσ cdσ → hGZ|c†dσ cdσ |GZi ist eine Mean-Field-Näherung, hier bei T = 0, die wir im folgenden Kapitel ausführlicher besprechen werden. Die Mean-Field-Näherung ist für das Anderson-Modell für eine einzelne Störstelle nicht angemessen. (Für große U ist der wahre Grundzustand ein Spin-Singulett, wie durch die Theorie des Kondo-Effekts beschrieben wird.) Sie ist aber für ein System mit vielen Störstellen, die nicht direkt miteinander wechselwirken, geeignet. Ein solches System kann eine endliche Magnetisierung aufweisen. Ein Beispiel sind verdünnte magnetische Halbleiter wie (Ga,Mn)As. 90 Kapitel 4 Vielteilchentheorie bei T > 0 Reale Systeme stehen meist in Kontakt mit ihrer Umwelt, d.h. sie können Energie und manchmal auch Teilchen mit der Umgebung austauschen. Ist die Umgebung näherungsweise im thermischen Gleichgewicht, können wir sie durch eine Temperatur T und ein chemisches Potential µ beschreiben. (Die Umgebung muss nicht im Gleichgewicht sein. Ein Gegenbeipiel sind zwei Zuleitungen mit zwischen ihnen angelegter Spannung. In diesem Fall können die Zuleitungen jeweils für sich im Gleichgewicht sein, ihr chemisches, oder vielmehr elektrochemisches, Potential ist aber verschieden.) Wie in der Statistischen Physik gezeigt wird, strebt das System dann dieselbe Temperatur und gegebenenfalls dasselbe chemische Potential wie die Umgebung an. Wir beschäftigen uns in diesem Kapitel mit Vielteilchensystemen, die diesen Gleichgewichtszustand erreicht haben. 4.1 Wechselwirkungsfreie Teilchen Zunächst erinnern wir uns an die Verteilungsfunktionen für nicht wechselwirkende Teilchen. Sei H = P † ε a a der Hamiltonian des Systems. Da die Teilchen nicht wechselwirken, können wir repräsentativ ν ν ν ν den Einteilchenzustand |νi betrachten. Wir stellen uns die Frage, wieviele Teilchen der Sorte ν es gibt. (a) Bosonen ohne Teilchenzahlerhaltung: Erzeugt a†ν ein Boson, dessen Teilchenzahl nicht erhalten ist, so kann es beliebig oft angeregt sein. Beispiel: Phononen. In der Statistischen Physik findet man, dass die Wahrscheinlichkeit eines Zustands mit der Energie εν bei der Temperatur T durch den Boltzmann-Faktor e−εν /kB T ≡ e−βεν gegeben ist. Die mittlere Zahl von Teilchen der Energie εν ist also n̄ 0 · e−0βεν + 1 · e−1βεν + 2 · e−2βεν + 3 · e−3βεν + . . .  e−0βεν +e−1βεν + e−2βεν + e−3βεν + . . . Normierung P∞ ne−nβεν = Pn=0 ∞ −nβεν n=0 e X ∂ e−nβεν = − ln ∂(βεν ) n = ∂ 1 ∂ ln = ln(1 − e−βεν ) ∂(βεν ) 1 − e−βεν ∂(βεν ) +e−βεν 1 = βεν =: nB (εν ). 1 − e−βεν e −1 (4.1) (4.2) (4.3) = − (4.4) = (4.5) Dies ist die sogenannte Planck-Verteilung, die aber oft unter der Bose-Einstein-Verteilung subsumiert wird. (b) Bosonen mit Teilchenzahlerhaltung: Ein Beispiel sind 4 He-Atome. Ist die Anzahl der Bosonen erhalten und können diese mit der Umgebung ausgetauscht werden, müssen wir ein chemisches Potential µ einführen. Das chemische Potential µ gibt an, um wieviel die Energie des Systems abnimmt, wenn ein 91 Teilchen P aus der Umgebung hinzugefügt wird. Wir betrachten also den großkanonischen Hamiltonian H = ν (εν − µ)a†ν aν . Die Verteilungsfunktion ist dann analog zu Fall (a) n̄ = 1 =: nB (εν − µ). eβ(εν −µ) − 1 (4.6) Dies ist die Bose-Einstein-Verteilung. (c) Fermionen: Die Teilchenzahl von Fermionen ist in für die Vielteilchentheorie relevanten Fällen immer P † erhalten. Der großkanonische Hamiltonian lautet wieder H = (ε − µ)a ν aν . Der Zustand |νi ν ν kann nun höchstens einfach besetzt sein. Daher ist n̄ = = = 0 · e−0β(εν −µ) + 1 · e−1β(εν −µ) e−0β(εν −µ) + e−1β(εν −µ) e−β(εν −µ) 1 + e−β(εν −µ) 1 =: nF (εν − µ). eβ(εν −µ) + 1 (4.7) (4.8) (4.9) Dies ist die Fermi-Dirac-Verteilung. Für Bosonen erfordert die Endlichkeit von n̄, dass µ ≤ min(εν ) ist. Für Fermionen existiert keine solche Einschränkung. 4.2 Mean-Field-Theorie Nach dieser Wiederholung wenden wir uns nun wechselwirkenden Vielteilchensystemen bei T > 0 zu. Eine sehr wichtige Klasse von Näherungen beruht auf der Idee, die Wechselwirkung eines Teilchens mit allen anderen durch ihren thermischen Mittelwert zu ersetzen. Diese Näherungen nennt man Mean-FieldTheorien. Beispiele sind die Hartree-Fock-Näherung, die Stoner-Theorie des Ferromagnetismus und die BCS-Theorie der Supraleitung. Wir betrachten den Hamiltonian H = H0 + Vint (4.10) mit H0 = X ξνa a†ν aν + ν Vint = X X ξµb b†µ bµ (4.11) µ Vνµν 0 µ0 a†ν b†µ bµ0 aν 0 (Wechselwirkung). (4.12) νν 0 µµ0 Offenbar liegen zwei Sorten von Teilchen vor. Wir können uns z.B. Spin-↑- und Spin-↓-Elektronen vorstellen. Wir nehmen nun an, dass wir aufgrund physikalischer Argumente wissen, dass Fluktuationen der verallgemeinerten Teilchenzahloperatoren a†ν aν 0 und b†µ bµ0 klein sind. Damit meinen wir folgendes: Sei a†ν aν 0 =: ha†ν aν 0 i + dνν 0 . 92 (4.13) Nun soll der Mittelwert hd2νν 0 i des Operators d2νν 0 klein gegen ha†ν aν 0 i2 sein. (Den Mittelwert hdνν 0 i können wir nicht für den Vergleich verwenden, da er verschwindet.) Sei also dνν 0 eµµ0 := a†ν aν 0 − ha†ν aν 0 i, := b†µ bµ0 − hb†µ bµ0 i, (4.14) (4.15) dann ist der Hamiltonian H = H0 + X ¡ ¢¡ ¢ Vνµν 0 µ0 ha†ν aν 0 i + dνν 0 hb†µ bµ0 i + eµµ0 (4.16) νν 0 µµ0 = ∼ = H0 + H0 + X ¢ ¡ Vνµν 0 µ0 ha†ν aν 0 ihb†µ bµ0 i + ha†ν aν 0 ieµµ0 + dνν 0 hb†µ bµ0 i + dνν 0 eµµ0 | {z } ↑ ↑ νν 0 µµ0 einsetzen: b†µ bµ0 −hb†µ bµ0 i X (4.17) a†ν aν 0 −ha†ν aν 0 i vernachlässigt, da klein! ¡ ¢ Vνµν 0 µ0 ha†ν aν 0 ib†µ bµ0 + a†ν aν 0 hb†µ bµ0 i − ha†ν aν 0 ihb†µ bµ0 i =: HMF . (4.18) νν 0 µµ0 Das allgemeine Schema der Mean-Field-Theorie sieht so aus: Für zwei Operatoren A, B schreiben wir AB ∼ = hAiB + AhBi − hAihBi. (4.19) Wir ersetzen also einmal den ersten und einmal den zweiten Operator durch ihre thermischen Mittelwerte. Um das korrekte Ergebnis zu erhalten, wenn A und B unabhängig sind (hABi = hAihBi), ziehen wir noch hAihBi ab. Der Mean-Field Hamiltonian HMF ist nun bilinear in den Operatoren a, a† , b, b† . Daher beschreibt HMF ein effektives wechselwirkungsfreies System, das im Prinzip eine exakte Lösung erlaubt. Insbesondere haben wir den Wechselwirkungsterm Vint durch ein Einteilchenpotential ersetzt. Dieses hängt jedoch von den Mittelwerten n̄aνν 0 := ha†ν aν 0 i und n̄bµµ0 := hb†µ bµ0 i ab. Wie sollen wir diese wählen? Wir können diese Mittelwerte für das durch HMF beschriebene effektive System ausrechnen. Die resultierenden Werte sollten mit den in HMF eingesetzten übereinstimmen. Dies ist eine Selbst-Konsistenz-Bedingung. Z.B. ist Tr a†ν aν 0 e−βHMF . Tr e−βHMF n̄aνν 0 = ha†ν aν 0 i = (4.20) ↑ „Trace“ = Spur über Basis des Hilbert-Raums Beispiele für die praktische Berechnung werden wir im Folgenden betrachten. Einige Bemerkungen: • Wir erhalten diese Gleichungen für n̄aνν 0 , n̄bµµ0 auch durch Minimierung der freien Energie FMF = − 1 ln ZMF β (4.21) mit der Zustandssumme ZMF = Tr e−βHMF : 0 = = = = d FMF dn̄bµµ0 1 ZMF 1 ZMF X νν 0 (4.22) d HMF dn̄bµµ0 X Tr e−βHMF Vνµν 0 µ0 (a†ν aν 0 − n̄aνν 0 ) Tr e−βHMF Vνµν 0 µ0 µ νν 0 1 ZMF Tr a†ν aν 0 e−βHMF (4.23) ¶ − n̄aνν 0 . (4.24) Da dies für alle µ, µ0 gelten muss, folgt, dass der Klammerausdruck verschwindet. Analog erhalten wir eine Gleichung für n̄bµµ0 . 93 • Es existieren i.A. sehr viele Mean-Field-Parameter n̄aνν 0 , n̄bµµ0 , die wir bestimmen müssen. In der Praxis nutzt man Symmetrien des Systems aus, um die Anzahl einzuschränken. Es ist jedoch zu beachten, dass manchmal die Symmetrie des Gleichgewichtszustandes geringer als die des Hamiltonians. Beispiele werden wir noch kennen lernen. 4.2.1 Hartree-Fock-Näherung In der obigen Einführung in die Mean-Field-Theorie haben wir mögliche nicht verschwindende Mittelwerte von a†ν bµ0 und b†µ aν 0 außer Acht gelassen. Dies ist nicht immer gerechtfertigt, wie man besonders leicht sieht, wenn a und b tatsächlich dieselben Teilchen beschreiben. Wir betrachten also den Hamiltonian H = H0 + Vint (4.25) mit H0 = X ξν cν c†ν (4.26) ν Vint = 1 X Vνµν 0 µ0 c†ν c†µ cµ0 cν 0 . 2 0 0 (4.27) νν µµ Jetzt sollten in der Mean-Field-Näherung die Mittelwerte hc†ν cν 0 i und hc†ν cµ0 i gleichberechtigt auftreten. Wir werden später das wichtige Wicksche Theorem beweisen, dass für nicht wechselwirkende Teilchen, wie sie die Mean-Field-Näherung annimmt, aussagt, dass gilt hc†ν c†µ cµ0 cν 0 i = hc†ν cν 0 ihc†µ cµ0 i ±hc†ν cµ0 ihc†µ cν 0 i | {z } (4.28) „Austausch-Term“ (das obere/untere Vorzeichen gilt für Bosonen/Fermionen – das Minus-Zeichen kommt von der Antikommutation von Fermionen). Die Mean-Field-Näherung muss mit dieser Gleichung verträglich sein. Also setzen wir c†ν c†µ cµ0 cν 0 ∼ = hc†ν cν 0 ic†µ cµ0 + c†ν cν 0 hc†µ cµ0 i − hc†ν cµ0 ihc†µ cν 0 i ±hc†ν cµ0 ic†µ cν 0 ± c†ν cµ0 hc†µ cν 0 i ∓ hc†ν cµ0 ihc†µ cν 0 i. (4.29) Damit erhalten wir den Mean-Field-Hamiltonian HMF = H0 + VHartree + VFock (4.30) mit, für den Fall von Elektronen, VHartree = 1 X 1 X 1 X Vνµν 0 µ0 n̄νν 0 c†µ cµ0 + Vνµν 0 µ0 n̄µµ0 c†ν cν 0 − Vνµν 0 µ0 n̄νν 0 n̄µµ0 2 0 0 2 0 0 2 0 0 νν µµ νν µµ (4.31) νν µµ (dies ist der Hartree-Term) und VFock = − 1 X 1 X 1 X Vνµν 0 µ0 n̄νµ0 c†µ cν 0 − Vνµν 0 µ0 n̄µν 0 c†ν cµ0 + Vνµν 0 µ0 n̄νµ0 n̄µν 0 2 0 0 2 0 0 2 0 0 νν µµ νν µµ (4.32) νν µµ (dies ist der Fock- oder Austausch-Term). Wir wenden diese Näherung jetzt auf das homogene Elektronengas an. Der Hamiltonian lautet H= X kσ ξk c†kσ ckσ + 1 2V X X V (q)c†k1 +q,σ1 c†k2 −q,σ2 ck2 σ2 ck1 σ1 . (4.33) k1 k2 q σ 1 σ 2 Das dieser Hamiltonian translationsinvariant ist und auch keine Spin-Richtung auszeichnet, nehmen wir zunächst an, dass auch der Gleichgewichtszustand homogen und unmagnetisch ist. Dann gilt n̄kσ,k0 σ0 ≡ hc†kσ ck0 σ0 i = δkk0 δσσ0 n̄k↑ = δkk0 δσσ0 n̄k↓ . 94 (4.34) Man kann dann den Mean-Field-Hamiltonian herleiten. Es ist X HMF = ξkHF c†kσ ckσ + const mit ξkHF = ξk + n̄V (q = 0) − ↑ | mittlere X V (k − k0 ) n̄k0 σ0 . k0 σ 0 {z (4.36) } Austausch-Korrektur zu ξk Elektronen- | (4.35) ↑ irrelevant kσ konzentration {z } dieser Term weggehoben durch Kernpotential Wir könnten jetzt recht einfach die Gesamtenergie in Hartree-Fock-Näherung ausrechnen. Im Grenzfall T → 0 erhält man r E ∼ 1 1 1 3 9π mit rS := , (4.37) = 2, 211 Ry 2 − 0, 916 Ry N rS rS 4 kF aB d.h. dasselbe Ergebnis wie in Störungstheorie 1. Ordnung, siehe Gl. (3.87). Diese Übereinstimmung ist eine spezielle Eigenschaft der Hartree-Fock-Näherung für das homogene Elektronengas und gilt nicht allgemein für Mean-Field-Theorien. 4.2.2 Stoner-Theorie des Ferromagnetismus in Metallen In Metallen schirmen die beweglichen Leitungselektronen die Coulomb-Wechselwirkung teilweise ab, wie wir später sehen werden. Die abgeschirmte Wechselwirkung hat näherungsweise die schon bekannte YukawaForm q1 q2 e−r/ξ 4πε0 r mit einer Abschirmlänge ξ. In guten Metallen ist ξ nicht viel größer als die Gitterkonstante. Wir können daher die wesentlichen Effekte mit einem Modell mit rein lokaler Wechselwirkung verstehen. Dies ist das Hubbard-Modell, beschrieben durch den Hamiltonian X X † H=− (4.38) tij c†iσ cjσ + U ci↑ ci↑ c†i↓ ci↓ , | ijσ {z } kinetische Energie | i {z } kurzreichweitige WW oder im Fourier-Raum H= X kσ ξk c†kσ ckσ + U XX † ck+q,σ c†k0 −q,σ0 ck0 σ0 ckσ . 2V 0 0 (4.39) kk q σσ Wir wenden die Hartree-Fock-Näherung an, um den Wechselwirkungsterm zu entkoppeln. Die entsprechenden Mittelwerte sind hc†kσ ck0 σ0 i. Wir schränken den Raum möglicher Lösungen ein, indem wir folgende Annahmen machen: • Die Lösung hat die volle Translationssymmetrie des Gitters, endliche Mittelwerte existieren nur für k = k0 (k ist erhalten). • Die Lösung hat möglicherweise nicht die Spin-Rotationssymmetrie von H, aber wenn eine Magnetisierung auftritt, dann in z-Richtung. (Mögliche andere Richtungen der Magnetisierungen können wir später erhalten, indem wir den Grundzustand im Spin-Raum drehen.) Endliche Mittelwerte existieren dann nur für σ = σ 0 , können aber von σ abhängen. 95 Also sind n̄kσ := hc†kσ ckσ i die einzigen nicht verschwindenden Mittelwerte. Die Hartree-Fock-Näherung ist nun † † † † ∼ = hck+q,σ ckσ ick0 −q,σ0 ck0 σ0 + ck+q,σ ckσ hck0 −q,σ0 ck0 σ0 i c†k+q,σ c†k0 −q,σ0 ck0 σ0 ckσ −hc†k+q,σ ckσ ihc†k0 −q,σ0 ck0 σ0 i − hc†k+q,σ ck0 σ0 ic†k0 −q,σ0 ckσ −c†k+q,σ ck0 σ0 hc†k0 −q,σ0 ckσ i + hc†k+q,σ ck0 σ0 ihc†k0 −q,σ0 ckσ i. Unter der Summe P HHF P kk0 q sind nach Umbenennung einige Terme gleich und wir erhalten σσ 0 X = (4.40) ξk c†kσ ckσ + U XX δq0 n̄k0 σ0 c†k+q,σ ckσ V 0 0 kk q σσ kσ U XX − δk+q,k0 δσσ0 n̄k0 σ0 c†k0 −q,σ0 ckσ V 0 0 kk q σσ U XX − [δq0 n̄kσ δq0 n̄k0 σ0 − δk+q,k0 δσσ0 n̄k0 σ0 δk+q,k0 δσσ0 n̄kσ ] 2V 0 0 (4.41) kk q σσ X = ξk c†kσ ckσ + U XX U XX n̄k0 σ0 c†kσ ckσ − n̄k0 σ c†kσ ckσ V V 0 0 0 σ kk σσ kσ kk q U XX U XX n̄kσ n̄k0 σ0 + n̄k0 σ n̄kσ . − 2V 2V 0 0 0 σ kk σσ (4.42) kk q Wir definieren die Konzentrationen von ↑ und ↓ Elektronen, n̄σ := 1X n̄kσ . V (4.43) k Damit wird einfach HHF = X ξk c†kσ ckσ + X kσ = X kσ U (n̄↑ + n̄↓ − n̄σ )c†kσ ckσ − UV X 2 UV X n̄σ n̄σ0 + n̄ 2 2 σ σ 0 (ξk + U n̄σ̄ ) c†kσ ckσ − U V n̄↑ n̄↓ . (4.45) ↑ | (4.44) σσ k σ̄ := −σ {z } HF =: ξkσ Nun müssen die Konzentrationen n̄↑ , n̄↓ selbstkonsistent bestimmt werden: n̄σ = 1 X † 1 X HF hckσ ckσ i = nF (ξkσ ). V V k (4.46) k Um explizite Ergebnisse zu erhalten, betrachten wir die parabolische Dispersion ξk = k 2 /2m − µ. (a) Für T = 0: µ ¶ k2 d3 k θ − + µ − U n̄ σ̄ (2π)3 2m ˆ kF σ 1 dk k 2 2π 2 0 ˆ n̄σ = = (4.48) k2 mit ⇒ = (4.47) Fσ − 2m + µ − U n̄σ̄ = 0 p kF σ = 2m(µ − U n̄σ̄ ) 3 1 [2m(µ − U n̄σ̄ )] 2 . 2 6π 96 (4.49) Es folgt 2 2 (6π 2 ) 3 n̄σ3 ⇒ 2 2 1 (6π 2 ) 3 n̄σ3 + U n̄σ̄ 2m = 2mµ − 2mU n̄σ̄ (4.50) = µ. (4.51) Wir erhalten zwei unabhängige Gleichungen für σ =↑ und σ =↓. Die Differenz dieser beiden Gleichungen ergibt ³ 2 ´ 2 2 1 (6π 2 ) 3 n̄↑3 − n̄↓3 + U (n̄↑ − n̄↓ ) = 0. (4.52) 2m Wir definieren ζ := γ := n̄↑ − n̄↓ n 1 2mU n 3 2 (3π 2 ) 3 (ein Maß für die M agnetisierung), (4.53) (ein Maß für die Wechselwirkungsstärke U ), (4.54) wobei n := n̄↑ + n̄↓ (4.55) die Elektronenkonzentration ist. Dann ist n̄↑ = n 1+ζ , 2 n̄↓ = n 1−ζ . 2 (4.56) Es folgt 2 i 2 2 n3 h 3 − (1 − ζ) 3 (1 + ζ) = 2 23 ⇒ 2 2 (1 + ζ) 3 − (1 − ζ) 3 = 2mU 2 (6π 2 ) 3 nζ γζ. (4.57) (4.58) Was für Lösungen dieser Gleichung für ζ existieren? Lösungen erhalten wir als Schnittpunkte der linken und der rechten Seite der Gleichung, aufgetragen als Funktionen von ζ: 1. γ < 2. 4 3 ⇒ nur Lösung ζ = 0 ⇒ n̄↑ = n̄↓ , keine Magnetisierung. 2 3 4 3 < γ < 2 ⇒ Lösungen ζ = 0 (instabil) und 0 < |ζ| < 1, teilweise Spin-Polarisation („schwacher Ferromagnetismus“). 2 ⇒ Lösungen ζ = 0 (instabil) und |ζ| = 1 (hier nicht gezeigt), vollständige Spin3. γ > 2 3 Polarisation („starker Ferromagnet“, ferromagnetisches Halbmetall – nur Elektronen einer SpinSorte liegen an der Fermi-Energie vor). Beispiele für die drei Fälle: 1. Platin (ist fast ein Ferromagnet) 2. Eisen, Kobalt, Nickel 97 3. CrO2 , EuB6 (b) Für T > 0: Hier ist nF (ξ) = 1/(eβξ +1) einzusetzen. Eine numerische Lösung ergibt folgenden Verlauf 2 von ζ = n̄↑ − n̄↓ /n für den Fall γ > 2 3 : Hier ist TC die Curie-Temperatur. Für T < TC finden wir zwei Lösungen ±|ζ|. Eine sorgfältige Rechnung zeigt, dass für T < TC Zustände mit beliebigen Spin-Richtungen, nicht nur ↑ und ↓, gleichermaßen möglich sind. Die Gleichgewichtszustände liegen also auf einer Kugeloberfläche im Spin-Raum: Für T < TC hat der Gleichgewichtszustand also niedrigere Symmetrie als der Hamiltonian H. H ist nämlich invariant unter Rotation aller Spins, der Gleichgewichtszustand zeichnet aber eine SpinRichtung aus. Dies ist ein Beispiel für spontane Symmetriebrechung. Spontane Symmetriebrechung ist ein sehr wichtiges Konzept nicht nur in der Festkörperphysik (die unten besprochene Supraleitung ist ein weiteres Beispiel), sondern auch in der Quantenfeldtheorie. Für spontane Symmetriebrechung in der Hochenergie-/Elementarteilchenphysik wurde der Physik-Nobel-Preis 2008 vergeben. Spontan gebrochene Symmetrien kann man in der Störungstheorie unter Annahme eines ungestörten Zustandes mit voller Symmetrie niemals erhalten. Die Terme der Störungsentwicklung mit beliebig hoher Ordnung haben nämlich alle die volle Symmetrie. In solchen Fällen versagt die Störungstheorie also, während Mean-Field-Theorie oft eine qualitativ richtige Beschreibung des Gleichgewichtszustandes ergibt. 4.3 Lineare-Antwort-Theorie Wir betrachten ein System beschrieben durch einen ungestörten Hamiltonian H0 und eine Störung V . Uns interessiert, wie der Messwert hAi einer Observablen A von V abhängt. Ist die Störung V klein, so ist im Allgemeinen hAi linear in V , hAi ∼ (4.59) = hAi(V = 0) + αV. Beispiele sind das Ohmsches Gesetz j = σE, die elektrische Polarisation im E-Feld und die Magnetisierung im B-Feld. Wir erhalten einen linearen Zusammenhang, indem wir hAi nach kleinen V in eine Taylor-Reihe entwickeln. Für eine allgemeine Abhängigkeit von hAi von V ist der führende nicht-triviale Term linear. 98 Nur für spezielle Funktionen hAi(V ) fällt der lineare Term weg und hAi ist von höherer Ordnung in V . Das muss einen physikalischen Grund haben. Unser Ziel in diesem Abschnitt ist, hAi in linearer Ordnung in V auszurechnen. Wir erinnern uns zunächst an einige Ergebnisse der Quantenstatistik: • Ein Ensemble wird durch den Dichte-Operator (Dichtematrix) % beschrieben. Treten Zustände |Ψi mit Wahrscheinlichkeiten PΨ auf, so ist X X PΨ |ΨihΨ| wobei PΨ = 1. (4.60) %= Ψ Ψ Die |Ψi können hier beliebig sein, sie sind im Allgemeinen nicht linear unabhängig oder gar orthogonal. • Im thermischen Gleichgewicht nimmt % eine besondere Form an: X %∼ e−βEn |nihn| ≡ e−βH , (4.61) n |ni sind hier Eigenzustände zu H mit Eigenenergien En . Die Proportionalitätskonstante ist durch die Normierungsbedingung Tr % = 1 festgelegt: ρ= e−βH . Tr e−βH (4.62) Der Nenner ist die Zustandssumme Z := Tr e−βH = X e−βEn . (4.63) X hn|%A|ni (4.64) n • Mittelwerte sind gegeben durch hAi = Tr %A = n = = 1 X hn|e−βH A|ni Z n 1 X hn|n0 ihn0 |e−βEn0 A|ni | {z } Z 0 nn = (4.65) (4.66) δnn0 1 X −βEn e hn|A|ni, Z n (4.67) wobei wir wieder angenommen haben, dass das System im Gleichgewicht ist. Nun betrachten wir eine Klasse von Systemen, die durch Hamiltonians der Form H(t) = H0 + V (t)θ(t − t0 ) (4.68) beschrieben werden. Wir schalten eine Störung V plötzlich zur Zeit t = t0 ein. Das System möge sich zur Zeit t0 im Gleichgewicht bezüglich H0 befinden. Wir suchen hA(t)i für t > t0 . Das System hat keine Zeit zu Übergängen in andere Zustände, da die Störung instantan eingeschaltet wird. Die Besetzungswahrscheinlichkeit der Zustände |ni bleibt also 1 −βEn0 e Z0 mit Z0 = Tr e−βH0 . (4.69) En0 sind hier die Eigenenergien von H0 . Durch die Störung erhalten diese Zustände aber eine zusätzliche Zeitabhängigkeit. Im Schrödinger-Bild wird %(t) = 1 X −βEn0 e |n(t)ihn(t)|, Z0 n 99 (4.70) also für eine explizit zeitunabhängige Observable A hAi(t) = Tr %(t)A = 1 X −βEn0 e hn(t)|A|n(t)i. Z0 n (4.71) Da V eine kleine Störung sein soll, ist das Wechselwirkungsbild günstig: |n(t)i | {z } = e−iH0 t |n(t)iI = e−iH0 t UI (t, t0 )|n(t0 )iI (4.72) = e−iH0 t UI (t, t0 )eiH0 t0 |n(t0 )i. (4.73) Schrödinger Wir hatten oben gesehen, dass zur 1. Ordnung in V gilt ˆ t UI (t, t0 ) ∼ dt0 VI (t0 ) = 1−i t0 ³ ´ 0 0 mit VI (t0 ) ≡ eiH0 t V (t0 )e−iH0 t Also folgt ˆ |n(t)i ∼ = e−iH0 (t−t0 ) |n(t0 )i − ie−iH0 t t dt0 VI (t0 )eiH0 t0 |n(t0 )i. (4.74) (4.75) t0 Damit wird hAi(t) ∼ = = ½ ˆ t 1 X −βEn0 e hn(t0 )|A|n(t0 )i − ihn(t0 )|e−iH0 t0 eiH0 t Ae−iH0 t dt0 VI (t0 )eiH0 t0 |n(t0 )i Z0 n t0 ¾ ˆ t » −iH0 t0 0 0 iH0 t −iH0 t iH0 t0 2 » + ihn(t0 )|e dt VI (t )e Ae e |n(t0 )i + » O(V ) (4.76) i hAi0 − |{z} Z0 ungestört ˆ t0 t t0 h dt0 Tr e−βH0 e−iH0 t0 eiH0 t Ae−iH0 t VI (t0 )eiH0 t0 | {z } zyklisch vertauschen − e−βH0 e−iH0 t0 VI (t0 )eiH0 t Ae−iH0 t eiH0 t0 {z } | ˆ = (4.77) zyklisch vertauschen t hAi0 − i t0 ˆ t = i hAi0 − i dt0 hAI (t)VI (t0 ) − VI (t0 )AI (t)i0 (4.78) dt0 h[AI (t), VI (t0 )]i0 . (4.79) t0 Hier bezeichnet h. . .i0 das thermische Mittel bzgl. H0 . Wir haben die Antwort des Systems auf eine Störung durch einen Mittelwert im Gleichgewicht bezüglich des ungestörten Systems ausgedrückt. Dies ist ein sehr nützliches Ergebnis. Wir schreiben es noch etwas um: ˆ t R δhAi(t) := hAi(t) − hAi0 = dt0 CAV (t, t0 ) (4.80) t0 mit R CAV (t, t0 ) := −iθ(t − t0 )h[AI (t), VI (t0 )]i0 . (4.81) R C heißt retardierte Korrelationsfunktion. Gleichung (4.80) mit Gl. (4.81) ist die sehr wichtige KuboFormel. Wir bemerken die Ähnlichkeit von C R mit der retardierten Green-Funktion GR . Diese ist tatsächlich ein Spezialfall von C R . Oft ist die Störung von der Form V (t) = B f (t), (4.82) d.h. die Zeitabhängigkeit steckt in einem Zahlenfaktor. Dann ist R R CAV (t, t0 ) = CAB (t − t0 )f (t0 ). 100 (4.83) Wenn wir nicht an transienten Effekten („Einschwingvorgängen“) interessiert sind, können wir t0 → −∞ setzen. Dann ist ˆ ∞ R δhAi(t) = dt0 CAB (t, t0 )f (t0 ) (4.84) −∞ und, da die Faltung unter Fourier-Transformation in ein gewöhnliches Produkt übergeht, R δhAi(ω) = CAB (ω)f (ω) 4.3.1 (Kubo-Formel im Frequenz-Raum). (4.85) Kubo-Formel für die dielektrische Funktion Als Anwendung betrachten wir die lineare Antwort eines Dielektrikums auf ein angelegtes elektrisches Feld. Außerhalb des Dielektrikums ist das Verschiebungsfeld D gegeben durch D = ε0 Eext . Für die skizzierte Geometrie ist D stetig, daher gilt D = ε0 Eext überall. Die Dielektrizitätskonstante des Dielektrikums ist definiert durch D = ε0 εEtot (4.86) für kleines Etot . Es folgt ⇒ Etot = φtot = 1 Eext ε 1 φext ε (4.87) (da E = −∇φ). Dies gilt nur für den statischen und homogenen Fall. Allgemein ist ˆ ˆ 3 0 φtot (r, t) = d r dt0 ε−1 (rt, r0 t0 ) φext (r0 , t0 ). (4.88) (4.89) Wir wollen ε−1 im Rahmen der Lineare-Antwort-Theorie berechnen. Wir müssen dazu zunächst die Störung identifizieren. Der Störoperator lautet ˆ V = d3 r %(r)φext (r, t). (4.90) ↑ hier: Ladungsdichte Die induzierte (Polarisations-) Ladungsdichte ist ˆ ˆ ∞ R 0 0 0 %ind (r, t) = d3 r0 dt0 C%(r)%(r 0 ) (t − t ) φext (r , t ) (4.91) −∞ ↑ Summiert über alle Störungen an allen Orten r 0 mit R 0 C%(r)%(r ≡ 0 ) (t − t ) = 0 0 χR e (rt, r t ) (4.92) −iθ(t − t0 )h[%I (r, t), %I (r0 , t0 )]i0 . (4.93) 101 Das induzierte Potential ist dann z 3 00 φind (r, t) = =:VC (r−r00 ) }| { 1 1 %ind (r00 , t) 4πε0 |r − r| ˆ d r (4.94) (in Coulomb-Eichung, vgl. Kapitel 2). Also ist ˆ φtot (r, t) = φext (r, t) + ˆ 3 00 d r ˆ +∞ 3 0 d r −∞ 00 0 0 0 0 dt0 VC (r − r00 )χR e (r t, r t )φext (r , t ). (4.95) 00 0 0 d3 r00 VC (r − r00 )χR e (r t, r t ). (4.96) Durch Vergleich mit (4.89) können wir ablesen, dass ˆ −1 ε 0 0 0 0 (rt, r t ) = δ(r − r )δ(t − t ) + Ist das System translationsinvariant, so können wir räumlich Fourier-transformieren. In der Zeit können wir dies ohnehin tun, da H0 nicht zeitabhängig ist. Dann folgt der einfache Zusammenhang wobei φtot (q, ω) = ε−1 (q, ω)φext (q, ω), (4.97) (q, ω) ε−1 (q, ω) = 1 + VC (q) χR | {z } e (4.98) 1 1 ε0 q 2 die Fouriertransformierte von ε−1 und nicht das Inverse der Transformierten von ε ist. Als nächstes wollen wir χR e berechnen. 4.3.2 Bewegungsgleichung für Lineare-Antwort-Funktionen Wir hatten gesehen, dass die retardierten Korrelationsfunktionen Verallgemeinerungen der retardierten Green-Funktion sind. Wie bei dieser kann man Bewegungsgleichungen finden, die man wieder im Allgemeinen nur näherungsweise lösen kann. Wir betrachten hier die retardierte Dichte-Dichte-Korrelationsfunktion χR (rt, r0 t0 ) = χR (q, t − t0 ) = −iθ(t − t0 ) h[% (r, t) , %(r0 , t0 )]i (4.99) 1 h[%(q, t), %(−q, t0 )]i V (4.100) ↑ ↑ lassen „I“ weg lassen „0“ weg −iθ(t − t0 ) mit dem Operator %(q) := 1 X † ck ck+q . V (4.101) k Der Hamiltonian lautet H= X k ξk c†k ck + 1 1 XX V (q) c†k+q c†k0 −q ck0 ck . 2 V 0 (4.102) kk q6=0 Der Spin ist hier unerheblich und wurde weggelaseen. Der Beitrag für q = 0 wird wie oben vom Kernpotential weggehoben. Es ist nützlich, die Bewegungsgleichung nicht direkt für χR (q, t−t0 ) herzuleiten, sondern für eine etwas allgemeinere Größe. Dazu schreiben wir χR (q, t − t0 ) = 1 X R χ (k, q, t − t0 ) V (4.103) k mit ­£ ¤® χR (k, q, t − t0 ) := −iθ(t − t0 ) (c†k ck+q )(t), %(−q, t0 ) . 102 (4.104) Für diese Größe erhalten wir durch Ableiten die Bewegungsgleichung i ­£ ¤® ­£ ¤® ∂ R χ (k, q, t−t0 ) = δ(t−t0 ) (c†k ck+q )(t), %(−q, t0 ) +θ(t−t0 ) i[H, c†k ck+q ](t), (t), %(−q, t0 ) . (4.105) ∂t Die Terme der Form [c† c, c† c] ergeben durch Ausnutzung des Antikommutators {ck , c†k0 } = δkk0 bilineare Ausdrücke der Form c† c. Der Wechselwirkungsterm in H führt jedoch auf einen Kommutator [c† c† cc, c† c], was sich nur zu einem Ausdruck vierter Ordnung vereinfachen lässt. Wie bei den elektronischen Green-Funktionen erhalten wir auf der rechten Seite Korrelationsfunktionen höherer Ordnung. Wir benötigen Näherungen, um die Hierarchie immer komplizierterer Funktionen abzubrechen. Wir verwenden eine Mean-Field-Näherung: Mit Vint := 1 1 X V (q)c†k+q c†k0 −q ck0 ck 2 V 0 (4.106) kk q ist [Vint , c†k ck+q ] = MF ∼ = ¡ 1 1 X V (q 0 ) c†k+q0 c†k0 −q0 ck0 ck+q + c†k0 +q0 c†k−q0 ck+q ck0 2 V 0 0 kq ¢ † −ck0 +q0 c†k0 ck0 +q+q0 ck0 − c†k c†k0 −q0 ck0 ck+q−q0 ¡ 1 1 X V (q 0 ) hc†k+q0 ck+q ic†k0 −q0 ck0 + c†k+q0 ck+q hc†k0 −q0 ck0 i − 2 V 0 0 − (4.107) kq +hc†k−q0 ck+q ic†k0 +q0 ck0 + c†k−q0 ck+q hc†k0 +q0 ck0 i −hc†k0 +q0 ck0 ic†k0 ck0 +q+q0 − c†k0 +q0 ck0 hc†k0 ck0 +q+q0 i ¢ » » −hc†k ck+q−q0 ic†k0 −q0 ck0 − c†k ck+q−q0 hc†k0 −q0 ck0 i + » const = − ¡ ¢X † 1 V (q) hnk+q i − hnk i ck0 −q0 ck0 , V 0 irrelevant (4.108) (4.109) k da hc†k ck0 i = hnk iδkk0 . Bei genauerem Hinsehen erkennt man, dass hier nur die Hartree-Terme berücksichtigt wurden. Man kann im Prinzip auch die Austausch-Terme berücksichtigen. Das ergibt eine andere Näherung. Im Frequenz-Raum erhalten wir (hier nicht im Detail gezeigt) · ¸ X ¡ ¢ 1 R 0 R ∼ χ (k , q, ω) . (4.110) (ω + iη + ξk − ξk+q ) χ (k, q, ω) = − hnk+q i − hnk i 1 + V (q) V k0 | {z } = V χR (q,ω) Es folgt χR (q, ω) = X 1 X R hnk i − hnk+q i ∼ 1 χ (k, q, ω) = [1 + V (q)χR (q, ω)] (4.111) V V ω + ξk − ξk+q + iη k k {z } | =: χR 0 (q,ω) ⇒ R χ (q, ω) = χR 0 (q, ω)[1 R + V (q)χ (q, ω)]. (4.112) χR 0 ist offenbar die Lösung zur Ordnung Null in der Elektron-Elektron-Wechselwirkung, d.h. das Ergebnis für freie Elektronen. Die letzte Gleichung kann man nach χR auflösen: χR (q, ω) = χR 0 (q, ω) =: χR RPA (q, ω). 1 − V (q)χR 0 (q, ω) (4.113) Die verwendete Näherung heißt aus historischen Gründen Random Phase Approximation (RPA). Mit 103 Gl. (4.98) folgt ε−1 RPA (q, ω) = 1 + V (q)χR RPA (q, ω) ((( V (q)χ ((( ( 1−( V (q)χ ( R ((R 0 (q, ω) + ( 0 (q, ω) = 1 − V (q)χR 0 (q, ω) 1 = 1 − V (q)χR 0 (q, ω) ⇒ 1 − V (q)χR 0 (q, ω) 1 X nF (ξk ) − nF (ξk+q ) = 1 − V (q) . V ω + ξk − ξk+q + iη εRPA (q, ω) = (4.114) (4.115) (4.116) (4.117) (4.118) k Dies ist die sogenannte Lindhard-Funktion. Wir werden später sehen, dass die Verwendung von FeynmanDiagrammen einen intuitiveren Zugang zur RPA erlaubt. 4.4 Matsubara-Green-Funktion Wir haben gesehen, dass in thermischen Mittelwerten der Operator e−βH auftritt. Ein Beispiel ist die Zustandssumme Z = Tr e−βH . Andererseits wird die Zeitentwicklung in der Quantentheorie durch Operatoren e−iHt beschrieben. Wir sehen, dass die inverse Temperatur β formal wie eine imaginäre Zeit erscheint. Das kann man ausnutzen, um thermische Mittelwerte in einem Wechselwirkungsbild in imaginärer Zeit auszurechnen. Insbesondere sind wir an Green-Funktionen oder allgemeiner an Korrelationsfunktionen interessiert. Bei T > 0 lautet die allgemeine retardierte Korrelationsfunktion zweier Observablen A und B R (t, t0 ) = −iθ(t − t0 )h[A(t), B (t0 ) ]∓ i, CAB ↑ ↑ im Heisenberg-Bild (4.119) ↑ 9 = bosonische Operatoren fermionische ; wobei h. . .i nun den thermischen Mittelwert bei der Temperatur T bezeichnet. (Im Abschnitt zur LineareR Antwort-Theorie hatten wir CAB durch Operatoren im Wechselwirkungsbild, nicht im Heisenberg-Bild, ausgedrückt. Das liegt daran, dass wir dort explizit in erster Ordnung in der Störung V gerechnet haben. Da V explizit auftrat, wurde die übrige Zeitentwicklung durch H0 beschrieben, also im Wechselwirkungsbild. Die gegenwärtige Definition mit Operatoren im Heisenberg-Bild ist die allgemeinere.) Es ist ¡ ¢ R CAB (t, t0 ) = iθ(t − t0 ) CAB (t − t0 ) ∓ CBA (t − t0 ) (4.120) mit CAB (t − t0 ) := = = −hA(t)B(t0 )i 1 − Tr e−βH A(t)B(t0 ) Z 1 − Tr e−βH UI (0, t)AI (t)UI (t, t0 )BI (t0 )UI (t0 , 0). | {z } Z (4.121) (4.122) (4.123) im Wechselwirkungsbild Jetzt müssten wir in der Störungstheorie für H = H0 + V die Operatoren e−βH , UI (0, t), UI (t, t0 ) und UI (t0 , 0) nach V entwickeln. Das würde auf eine vierfache Störungsreihe führen und wäre daher ziemlich unübersichtlich. Die Theorie vereinfacht sich, wenn wir die Idee mit der imaginären Zeit ausnutzen. 4.4.1 Imaginäre-Zeit-Formalismus Formal setzen wir t → −iτ , τ ∈ R. Das Heisenberg-Bild in imaginärer Zeit ist definiert durch AH (τ ) = eHτ A e−Hτ ↑ lassen wir weg 104 (4.124) und das Wechselwirkungsbild für H = H0 + V durch AI (τ ) = ⇒ A(τ ) = eH0 τ A e−H0 τ UI (0, τ )AI (τ )UI (τ, 0) (4.125) (4.126) mit, für zeitunabhängige H, H0 , 0 0 UI (τ, τ 0 ) = eH0 τ e−H(τ −τ ) e−H0 τ . (4.127) Dies folgt alles aus den Beziehungen für reelle Zeiten mittels t → −iτ . Weiter folgt ∂ UI (τ, τ 0 ) = ∂τ = 0 eH0 τ (H0 − H) e−H(τ −τ ) e−H0 τ 0 −VI (τ ) UI (τ, τ 0 ) (4.128) (4.129) und, immer analog zum Formalismus mit reellen Zeiten, ˆ τ ˆ τ ∞ X 1 UI (τ, τ 0 ) = (−1)n dτ1 · · · dτn Tτ VI (τ1 ) · · · VI (τn ) n! τ0 τ0 n=0 µ ˆ τ ¶ =: Tτ exp − dτ1 VI (τ1 ) , (4.130) (4.131) τ0 wobei Tτ der Zeitordnungsoperator in τ ist: ( A(τ )B(τ 0 ) für τ > τ 0 , Tτ A(τ )B(τ 0 ) := ±B(τ 0 )A(τ ) für τ 0 > τ. (4.132) Der Nutzen bei der Berechnung von thermischen Mittelwerten ergibt sich nun aus der Beziehung e−βH = −0H0 e−βH0 e|βH0 e−(β−0)H {z e } = e−βH0 UI (β, 0) à ˆ −βH0 e Tτ exp − = (4.133) ! β (4.134) dτ1 VI (τ1 ) . (4.135) 1 Tr e−βH Tτ A(τ )B(τ 0 ) Z (4.136) 0 Wir betrachten nun den zeitgeordneten Mittelwert −hTτ A(τ )B(τ 0 )i = − Für τ > τ 0 erhalten wir ... = = = 1 Tr e−βH0 UI (β, 0)UI (0, τ ) AI (τ )UI (τ, τ 0 )BI (τ 0 )UI (τ 0 , 0) | {z } Z 1 − Tr e−βH0 UI (β, τ )AI (τ )UI (τ, τ 0 )BI (τ 0 )UI (τ 0 , 0) Z à ˆ ! µ ˆ τ ¶ β 1 −βH0 − Tr e Tτ exp − dτ1 VI (τ1 ) AI (τ )Tτ exp − dτ2 VI (τ2 ) Z τ τ0 | {z } − (4.137) (4.138) nur Einfügungen von VI bei Zeiten zwischen τ und β à ˆ × BI (τ 0 ) Tτ exp − ! τ0 dτ3 VI (τ3 ) (4.139) 0 = " à ˆ ! # β 1 −βH0 0 − Tr e Tτ exp − dτ1 VI (τ1 ) AI (τ )BI (τ ) . Z 0 (4.140) Es ist zu beachten, dass sich das Integral im letzten Ausdruck über das gesamte Interval [0, β] erstreckt. Der Zeitordnungsoperator Tτ sorgt dafür, dass die Einfügungen von VI sowie AI (τ ) und BI (τ 0 ) in von 105 rechts nach links aufsteigender zeitlicher Reihenfolge sortiert werden. Der Ausdruck ist also tatsächlich identisch zum darüber stehenden. Wir erkennen hier nun den Vorteil des Formalismus: Die Störung VI tritt nur noch an einer Stelle auf. Die Störungsentwicklung ergibt sich als Taylor-Entwicklung der zeitgeordneten Exponentialfunktion. Diese können wir noch kompakter schreiben: ... = − 1 Tr e−βH0 Tτ [UI (β, 0)AI (τ )BI (τ 0 )]. Z (4.141) Für τ 0 > τ erhalten wir entsprechend −hTτ A(τ )B(τ 0 )i = = 1 Tr e−βH0 Tτ [UI (β, 0)BI (τ 0 )AI (τ )] Z 1 − Tr e−βH0 Tτ [UI (β, 0)AI (τ )BI (τ 0 )] Z ∓ (4.142) (4.143) (± verschwindet wieder, da wir A, B zweimal vertauscht haben). Also gilt allgemein −hTτ A(τ )B(τ 0 )i = = 1 Tr e−βH0 Tτ [UI (β, 0)AI (τ )BI (τ 0 )] Z Tr e−βH0 Tτ [UI (β, 0)AI (τ )BI (τ 0 )] − Tr e−βH0 UI (β, 0) − (4.144) (4.145) bzgl. H0 = hTτ [UI (β, 0)AI (τ )BI (τ 0 )]i↓0 − . hUI (β, 0)i0 (4.146) Der betrachtete Mittelwert wird als Matsubara-Green-Funktion bezeichnet: CAB (τ, τ 0 ) := −hTτ A(τ )B(τ 0 )i. (4.147) Wir untersuchen nun die mathematischen Eigenschaften dieser Funktion von τ, τ 0 : (a) CAB (τ, τ 0 ) ≡ CAB (τ − τ 0 ) hängt nur von τ − τ 0 ab. Beweis: CAB (τ, τ 0 ) für τ >τ 0 = = = = 0 0 1 Tr e−βH eτ H Ae−τ H eτ H Be−τ H Z 0 0 1 − Tr e−βH e−τ H eτ H Ae−τ H eτ H B Z 0 0 1 − Tr e−βH eH(τ −τ ) Ae−H(τ −τ ) B Z CAB (τ − τ 0 ) − (4.148) (4.149) (4.150) (4.151) und analog für τ 0 > τ . (b) Der Ausdruck (4.150) zeigt, dass wir für große τ − τ 0 im Allgemeinen divergente Ausdrücke erhalten, 0 da das Spektrum von H nach oben unbeschränkt ist. Für positive τ − τ 0 divergiert dann eH(τ −τ ) 0 und für negative τ − τ 0 divergiert e−H(τ −τ ) . Um Konvergenz zu gewährleisten, beschränken wir τ − τ 0 auf das Interval [−β, β]. Dann fällt der Faktor e−βH für große Eigenenergien schnell genug ab, um die Divergenz zu verhindern. (c) Es gilt CAB (τ ) = ±CAB (τ + β) für τ ∈ [−β, 0]. Der Beweis ist nicht schwierig. Da CAB (τ ) nur auf dem endlichen Interval [−β, β] definiert ist, ist die Fourier-Transformierte diskret. 106 Man definiert sie durch CAB (n) := ⇒ CAB (n) = = 1 2 1 2 1 2 ˆ β dτ ei πnτ /β CAB (τ ), −β ˆ 0 dτ e −β ˆ β 0 = 1 CAB (τ ) + 2 i πnτ /β ˆ β (4.152) dτ ei πnτ /β CAB (τ ) 0 1 dτ ei πnτ /β e−iπn CAB (τ − β) + {z } 2 | ˆ = n∈Z ˆ β dτ ei πnτ /β CAB (τ ) (4.153) (4.154) 0 ±CAB (τ ) β 1 (1 ± e−iπn ) dτ ei πnτ /β CAB (τ ) 2 0 ( ˆ β n gerade für Bosonen i πnτ /β dτ e CAB (τ ) mit n ungerade für Fermionen. 0 Due übliche Schreibweise lautet ˆ β CAB (iωn ) = dτ eiωn τ CAB (τ ) (4.155) (4.156) (4.157) 0 mit der Matsubara-Frequenz ωn = 2nπ β (Bosonen) (2n + 1)π β (Fermionen), (4.158) wobei n ∈ Z ist. ´β Bemerkung: Das Integral 0 dτ . . . ist im fermionischen Fall nicht eindeutig, falls sich eine δ-Funktion bei τ = 0 (und dann wegen Eigenschaft (c) auch bei τ = β) befindet. Wir vereinbaren, eine δ-Funktion bei τ = 0 vollständig zu berücksichtigen und bei τ = β gar nicht, d.h. wir verschieben die Singularitäten um ein kleines ε > 0. Z.B. für CAB (τ ) = ∞ X (−1)m δ(τ − mβ) (fermionisch) (4.159) m=−∞ vereinbaren wir ˆ β CAB (iωn ) = dτ eiωn τ δ(τ − 0+ ) = β. (4.160) 0 Wieso ist der Imaginäre-Zeit-Formalismus nützlich? Der Grund ist folgender: Die Matsubara-Funktion R CAB (iωn ) und die retardierte Funktion CAB (ω) sind tatsächlich dieselbe holomorphe Funktion eines komplexen Arguments ω in der oberen Halbebene (Im ω > 0), ausgewertet an speziellen ω: Z.B. für Fermionen 107 R Dass das möglich ist, ist plausibel, da in der Definition von CAB gegenüber CAB im Wesentlichen t durch −iτ ersetzt war. Praktisch ist das Ganze, weil wir nun aus der Matsubara-Funktion durch analytische Fortsetzung die retardierte Funktion erhalten können: R CAB (ω) = CAB (iωn → ω + iη), η → 0+ . (4.161) Beweis: Wir hatten R (t − t0 ) = CAB ⇒ R (ω) = CAB = −iθ(t − t0 )h[A(t), B(t0 )]∓ i ˆ ∞ −i dt eiωt−ηt h[A(t), B(0)]∓ i 0 ˆ ∞ −i dt eiωt−ηt heiHt Ae−iHt B ∓ BeiHt Ae−iHt i. (4.162) (4.163) (4.164) 0 Sei nun {|ni} eine Eigenbasis von H mit Eigenenergien En . Dann ist ˆ ∞ X 1 £ R CAB (ω) = −i dt eiωt−ηt e−βEn eiEn t hn|A|n0 ie−iEn0 t hn0 |B|ni Z 0 nn0 ¤ 0 −βEn0 hn |B|nieiEn t hn|A|n0 ie−iEn0 t ∓e 1 X hn|A|n0 ihn0 |B|ni = +i (e−βEn ∓ e−βEn0 ) 0 − η Z iω + iE − iE n n nn0 1 X hn|A|n0 ihn0 |B|ni −βEn = (e ∓ e−βEn0 ) 0 + iη Z ω + E − E n n 0 (4.165) (4.166) (4.167) nn R (Lehmann-Darstellung von CAB ). Andererseits ist CAB (τ ) ⇒ CAB (iωn ) 1 Tr e−βH eτ H Ae−τ H B Z 1 X −βEn τ En = − e e hn|A|n0 ie−τ En0 hn0 |B|ni Z nn0 ˆ β X 1 dτ eiωn τ e−βEn eτ (En −En0 ) hn|A|n0 ihn0 |B|ni = − Z 0 0 = − (4.168) (4.169) (4.170) nn ±1 z }| { 1 X −βEn eiωn β eβ(En −En0 ) − 1 = − hn|A|n0 ihn0 |B|ni e 0 Z iω + E − E n n n nn0 1 X −βEn hn|A|n0 ihn0 |B|ni −βEn = (e ∓ e−βEn0 ). e Z iωn + En − En0 0 nn R Offenbar erhalten wir hieraus CAB (ω) durch die Ersetzung iωn → ω + iη, wie behauptet. 108 (4.171) (4.172) Analog erhalten wir für die avancierte Funktion A CAB (ω) = CAB (iωn → ω − iη). (4.173) R A CAB , CAB und CAB sind Spezialfälle der Funktion CAB (z) := 1 X hn|A|n0 ihn0 |B|ni −βEn (e ∓ e−βEn0 ) 0 Z z + E − E n n 0 (4.174) nn mit z ∈ C. Diese Funktion ist holomorph in der oberen und unteren Halbebene, hat aber Singularitäten für z = En0 − En ∈ R, d.h. auf der reellen Achse. Im Grenzfall eines kontinuierlichen Spektrums, wie für Vielteilchensysteme typisch, hat man einen Schnitt auf der reellen Achse. 4.4.2 Einteilchen-Matsubara-Green-Funktionen Ein wichtiger Fall ist die Einteilchen-Green-Funktion G(rστ, r0 σ 0 τ 0 ) := −hTτ Ψσ (r, τ )Ψ†σ0 (r0 , τ 0 )i (4.175) bzw. G(ντ, ν 0 τ 0 ) := −hTτ cν (τ )cν 0 (τ 0 )i. P Für wechselwirkungsfreie Teilchen erhalten wir mit H = H0 = ν ξν c†ν cν : cν (τ ) c†ν (τ ) (4.176) ≡ eτ H0 cν e−τ H0 = e−ξν τ cν ≡ eτ H0 c†ν e−τ H0 = eξν τ c†ν . (4.177) (4.178) Es folgt G0 (ν, τ − τ 0 ) ≡ −hTτ cν (τ )c†ν (τ 0 )i = −θ(τ − τ 0 )hcν (τ )c†ν (τ 0 )i ∓ θ(τ 0 − τ )hc†ν (τ 0 )cν (τ )i 0 = −[θ(τ − τ 0 )hcν c†ν i ± θ(τ 0 − τ )hc†ν cν i]e−ξν (τ −τ ) ¤ £ 0 = − θ(τ − τ 0 )[1 ± n(ξν )] ± θ(τ 0 − τ )n(ξν ) e−ξν (τ −τ ) . nB ↑ bzw. nF 109 nB ↑ bzw. nF (4.179) (4.180) (4.181) (4.182) Hieraus erhalten wir ˆ G0 (ν, iωn ) = β dτ eiωn τ G0 (ν, τ ) 0 = ˆ −[1 ± n(ξν )] β dτ eiωn τ e−ξν τ (4.183) (4.184) 0 ±1 z }| { eiωn β e−βξν − 1 = −[1 ± n(ξν )] iωn − ξν · ¸ 1 1 ∓ e−βξν = 1 ± βξν e ∓1 iωn − ξν » ν »» eβξν (1 » ∓» e−βξ ) 1 1 = = » »»eβξν ∓ 1 iωn − ξν iωn − ξν für Bosonen und Fermionen (beachte aber die unterschiedlichen Mattsubara-Frequenzen). Wir erhalten durch iωn → ω + iη die schon bekannte retardierte Green-Funktion 1 GR . 0 (ν, ω) = ω − ξν + iη 4.4.3 (4.185) (4.186) (4.187) (4.188) Rechnungen mit Matsubara-Green-Funktionen Störungstheorie in V führt oft auf Ausdrücke, die ungestörte Matsubara-Green-Funktionen enthalten. In diesem Abschnitt verwenden wir Methoden aus der Funktionentheorie, v.a. den Residuensatz, um Frequenz-Summen in solchen Ausdrücken zu berechnen. Das einfachste Beispiel ist die Fourier-Transformation der Green-Funktionen, 1 X iωn τ G0 (ν, τ ) = e G0 (ν, iωn ). (4.189) β iω n Wir formulieren die Methode aber allgemeiner für Summen der Form 1X g(iωn ) eiωn τ S(τ ) := β iω (4.190) n ↑ bosonisch oder fermionisch für 0 < τ < β (Ergebnisse für −β < τ < 0 folgen aus der Periodizitätseigenschaft). (a) Isolierte Singularitäten Wir beginnen mit dem Fall, dass g(z) isolierte Singularitäten für komplexe Argumente z1 , z2 , . . . aufweist. Dies ist der Fall, wenn g ein Produkt von ungestörten Green-Funktionen 1/(z − ξν ) ist; g hat dann Pole erster Ordnung an den Stellen z = ξν . Wir betrachten die Kontur C: 110 Für |z| → ∞ umschließt C alle Pole von g und alle Matsubara-Frequenzen. Nun bemerken wir, dass die Verteilungsfunktionen ( nB (z) (Bosonen) n(z) = (4.191) nF (z) (Fermionen) Pole bei den Matsubara-Frequenzen (und nur dort) haben. Also hat n(z) g(z) Pole bei den iωn und den zj . Der Residuensatz lautet nun: ˛ X dz n(z) g(z) = 2πi Reszj [n(z) g(z)]. (4.192) C Pole zj in C In Worten: Das Integral über C ist 2πi mal der Summe der Residuen aller eingeschlossenen Singularitäten. Was ist das Residuum einer Singularität? Hat f (z) eine isolierte Singularität bei z0 , so können wir f (z) um z0 entwickeln (Laurent-Reihe, Verallgemeinerung der Taylor-Reihe): f (z) = . . . + a−1 (z − z0 )−1 + a0 (z − z0 )0 +a1 (z − z0 )1 + a2 (z − z0 )2 + . . . | {z } (4.193) =1 Dann ist der Koeffizient a−1 das Residuum. Wenn die Singularität ein Pol erster Ordnung ist, fallen alle höheren Koeffizienten a−2 , a−3 , . . . weg. In diesem Fall gilt a−1 = lim (z − z0 )f (z). (4.194) z→z0 Alternativ können wir das Residuum aus dem Integral ausrechnen: ˛ 1 Resz0 f (z) = dz f (z). 2πi (4.195) ↑ um z0 (und keine anderen Singularitäten) Was sind nun die Residuen der Pole von nF und nB ? Resiωn n(z) = lim (z − iωn ) z→iωn (L’Hospital) = lim z→iωn 1 eβz ∓ 1 (4.196) 1 ∂ βz ∂z (e (4.197) ∓ 1) 1 1 lim = βz βiω βe βe n z 1 1 = β exp(2πni) β 1 1 =− β exp((2n + 1)πi) β = (4.198) z→iωn = (Bosonen) (4.199) (Fermionen). Wir folgern ˛ dz n(z) g(z) = 2πi C X¡ ¢ Resiωn n(z) g(iωn ) + 2πi iωn = ± X n(zj ) Reszj g(z) (4.200) Pole zj von g 2πi X g(iωn ) + 2πi β iω n 111 X Pole zj von g n(zj ) Reszj g(z). (4.201) Fällt aber n(z) g(z) für |z| → ∞ schneller als 1/|z| ab, so ist ˛ lim dz n(z) g(z) = 0, |z|→∞ (4.202) C weil die Kontur ins Unendliche geschoben wird, wo der Integrand klein ist. Es folgt dann X X g(iωn ) = ∓β n(zj ) Reszj g(z). iωn (4.203) Pole zj von g Wir haben folgenden Trick verwendet: Wir haben g(z) mit einer Funktion, nämlich n(z), multipliziert, die Pole gerade dort hat, wo wir g benötigen, nämlich bei den Matsubara-Frequenzen. Dann pickt der Residuensatz gerade diese Punkte aus einem Kontur-Integral heraus, das trivial ist, nämlich Null. Es bleiben als nicht triviale Beiträge nur die übrigen Residuen, die von g(z) stammen. (b) Schnitte Oft treten Funktionen g(z) auf, die neben isolierten Singularitäten auch Schnitte aufweisen. Ein Beispiel war die volle Green-Funktion G(z) für ein wechselwirkendes Vielteilchensystem. G(z) ist holomorph für Im z > 0 und für Im z < 0, hat aber i.A. einen Schnitt auf der (oder auf Teilen der) reellen Achse. Der Residuensatz gilt nur, wenn die Kontur keine Singularitäten oder Schnitte enthält. Daher wählen wir sie wie folgt: ¸ Jetzt fällt C dz n(z)g(z) für |z| → ∞ nicht weg, sondern es bleiben die Beiträge von der reellen Achse übrig, da dort der Integrand i.A. nicht klein ist. Also: ˛ ˆ ∞ ˆ −∞ dz n(z)g(z) = dω n(ω)g(ω + iη) + dω n(ω)g(ω − iη) (4.204) C −∞ ∞ ˆ ∞ = dω n(ω)[g(ω + iη) − g(ω − iη)]. (4.205) −∞ Andererseits gilt ˛ dz n(z)g(z) = ± C 2πi X g(iωn ) + 2πi β iω n 112 X Pole zj von g n(zj ) Reszj g(z). (4.206) Es folgt X g(iωn ) ˆ β 2πi = ± iωn ∞ dω n(ω)[g(ω + iη) − g(ω − iη)] −∞ X ∓β n(zj ) Reszj g(z). (4.207) Pole zj von g Wir erhalten also den schon bekannten Beitrag von den Polen von g und einen neuen vom Schnitt auf der reellen Achse. Als Beispiel betrachten wir die Fourier-Transformation der Green-Funktion in der imaginären Zeit, G(ν, τ ) = 1 X iωn τ e G(ν, iωn ) β iω (0 < τ < β). (4.208) n In diesem Fall ist g(z) = 1 zτ e G(ν, z). β (4.209) Wir hatten gesehen, dass G(ν, z) einen Schnitt auf der reellen Achse hat. g(z) hat keine Pole. Also ist nach Gl. (4.207) ˆ ∞ β 1 1 X iωn τ e G(ν, iωn ) = ± ¢ dω n(ω)eωτ [G(ν, ω + iη) − G(ν, ω − iη)]. (4.210) β iω 2πi β¢ −∞ n Die Ausdrücke in den eckigen Klammern sind gerade die retardierte und avancierte Green-Funktion. Also folgt ˆ ∞ 1 ... = ± dω n(ω)eωτ [GR (ν, ω) − GA (ν, ω) ] (4.211) | {z } 2πi −∞ = ± 1 2π i¤ ˆ ∞ ˆ = ∓ −∞ =GR (ν,ω)∗ ∞ −∞ dω n(ω)eωτ 2 i¤ Im GR (ν, ω) dω n(ω) eωτ 2π A(ν, ω) | {z } . (4.212) (4.213) Spektralfunktion Die Spektralfunktion A ist offenbar proportional zur Differenz der Werte von G(ν, z) für komplexe Frequenzen z knapp oberhalb und knapp unterhalb der reellen Achse. A beschreibt also, wie unstetig G auf der reellen Achse ist. Für Fermionen gilt ⇒ G(ν, τ ) = −hTτ cν (τ )c†ν (0)i G(ν, 0− ) = +hc†ν (0)cν (0)i = hc†ν cν i. ↑ oder −η (4.214) (4.215) Besetzungszahl Wir erhalten also ˆ hc†ν cν i = ∞ −∞ dω nF (ω)A(ν, ω), 2π (4.216) die Besetzungszahlen der Einteilchenzustände |νi lassen sich auch im wechselwirkenden System durch die Fermi-Funktion und die Spektralfunktion ausdrücken. Eine analoge Aussage gilt für Bosonen. 4.4.4 Bewegungsgleichungen Die Methode der Bewegungsgleichungen überträgt sich direkt auf Matsubara-Funktionen: Mit A(τ ) = eτ H A e−τ H 113 (4.217) ist ∂ A(τ ) = ∂τ = eτ H HAe−τ H + eτ H A(−H)e−τ H (4.218) eτ H [H, A]e−τ H ≡ [H, A](τ ). | {z } (4.219) Heisenberg-Bild Mit CAB (τ − τ 0 ) = hTτ A(τ )B(τ 0 )i (4.220) folgt − ∂ CAB (τ − τ 0 ) = ∂τ = = ∂ [θ(τ − τ 0 )hA(τ )B(τ 0 )i ± θ(τ 0 − τ )hB(τ 0 )A(τ )i] ∂τ δ(τ − τ 0 )[hA(τ )B(τ 0 )i ∓ hB(τ 0 )A(τ )i] +θ(τ − τ 0 )h[H, A](τ )B(τ 0 )i ± θ(τ 0 − τ )hB(τ 0 )[H, A](τ )i δ(τ − τ 0 )h[A, B]∓ i + hTτ [H, A](τ )B(τ 0 )i. | {z } (4.221) (4.222) (4.223) höhere Green-Funktion Insbesondere erhalten wir für die bosonische oder fermionische Green-Funktion G(rτ, r0 τ 0 ) 0 0 G(ντ, ν τ ) = −hTτ Ψ(r, τ )Ψ† (r0 , τ 0 )i (4.224) −hTτ cν (τ )c†ν 0 (τ 0 )i (4.225) = die Bewegungsgleichungen ∂ G(rτ, r0 τ 0 ) = ∂τ ∂ G(ντ, ν 0 τ 0 ) = − ∂τ − δ(τ − τ 0 )δ(r − r0 ) + hTτ [H, Ψ(r)](τ )Ψ† (r0 , τ 0 )i (4.226) δ(τ − τ 0 )δνν 0 + hTτ [H, cν ](τ )c†ν 0 (τ 0 )i. (4.227) Z.B. finden wir für wechselwirkungsfreie Elektronen mit dem Hamiltonian X H = H0 = hνν 0 c†ν cν 0 (4.228) νν 0 die Gleichung ∂ − G0 (ντ, ν 0 τ 0 ) ∂τ * = δ(τ − τ 0 )δνν 0 + = δ(τ − τ 0 )δνν 0 + Tτ X X + hνν 00 cν 00 (τ )c†ν 0 (τ 0 ) (4.229) ν 00 hνν 00 G0 (ν 0 τ, ν 0 τ 0 ). (4.230) ν 00 In Matrixschreibweise lautet diese µ ¶ ∂ − − h G0 (τ − τ 0 ) = δ(τ − τ 0 ) 1. ∂τ (4.231) In diesem Sinne ist G0 (τ − τ 0 ) die inverse Matrix zu G0−1 ≡ − ∂ − h. ∂τ (4.232) Dies ist offenbar ein Differential-Operator. Mathematisch sauberer wird der Zusammenhang nach FourierTransformation nach der Zeit: (iωn 1 − h) G0 (iωn ) = 1. (4.233) 114 4.5 Wicks Theorem Wir betrachten nun ein Theorem, das für die Störungstheorie sehr wichtig ist, sie oft überhaupt praktikabel macht. Der Hamiltonian laute wieder H = H0 +V , wobei H0 wechselwirkungsfreie Bosonen oder Fermionen beschreibe. Oft haben wir es mit höheren Green-Funktionen der Form (n) G0 (ν1 τ1 , . . . , νn τn ; ν10 τ10 , . . . , νn0 τn0 ) := (−1)n hTτ cν1 (τ1 ) · · · cνn (τn )c†νn0 (τn0 ) · · · c†ν 0 (τ10 )i0 1 (4.234) zu tun, worin h. . .i0 die Mittelung bezüglich H0 bezeichnet. Ebenso ist die Zeitentwicklung die von H0 generierte (Wechselwirkungsbild): cν (τ ) = eτ H0 cν e−τ H0 . (4.235) (n) (n) Ausdrücke wie G0 treten z.B. in Bewegungsgleichungen für Green-Funktionen auf. G0 ist ein kompli(n) zierter Ausdruck, da aber H0 keine Wechselwirkungen enthält, können wir hoffen, G0 in EinteilchenGreen-Funktionen zu zerlegen. Das besorgt. . . Wicks Theorem: ¯ ¯ G0 (ν1 τ1 , ν10 τ10 ) ¯ ¯ (n) .. G0 (ν1 τ1 , . . . , νn τn ; ν10 τ10 , . . . , νn0 τn0 ) = ¯ . ¯ ¯ G0 (νn τn , ν 0 τ 0 ) 1 1 ··· .. . ··· ¯ ¯ ¯ ¯ ¯ ¯ G0 (νn τn , νn0 τn0 ) ¯± G0 (ν1 τ1 , νn0 τn0 ) .. . (4.236) Die rechte Seite enthält alle möglichen Paarungen G0 (νi τi , νj0 τj0 ) = −hTτ cνi (τi )c†ν 0 (τj0 )i0 , i, j = 1, . . . , n. j Varianten des Beweises finden sich in allen in der Literaturliste angegebenen Büchern, sind aber nicht sehr instruktiv und werden hier nicht reproduziert. Bemerkung: Andere Korrelationsfunktionen C, z.B. von Spin-Operatoren, erfüllen meist kein analoges Theorem. Dies macht Rechnungen für Spin-Systeme schwieriger als für Bosonen oder Fermionen. Anschaulich ist die Aussage von Wicks Theorem relativ klar, wenn man sich erinnert, was die Green(n) Funktion G0 eigentlich bedeutet: Sie ist die bedingte Wahrscheinlichkeitsamplitude, Teilchen in Zuständen νi zu Zeiten τi zu finden, wenn Teilchen in Zuständen νi0 zu Zeiten τi0 erzeugt wurden. Schematisch können wir dies so darstellen: Wicks Theorem sagt nun aus, dass dies für wechselwirkungfreie Teilchen gleich einer Summe über alle möglichen Paarungen von ein- und auslaufenden Teilchen, unter Beachtung der Antikommutation von Fermionen, ist: Da die Teilchen nicht wechselwirken, können sie höchsten vertauscht werden. Da sie ununterscheidbar sind, kann man aus Prinzip nicht sagen, welches herauskommende Teilchen welchem hineingehenden entspricht und alle Beiträge im obigen Diagramm tragen gleichermaßen bei. 115 Beispiel: Wir berechnen die Dichte-Dichte-Korrelationsfunktion für freie Elektronen, die wir aus dem Abschnitt über Lineare-Antwort-Theorie schon kennen, mit Hilfe von Wicks Theorem. Es ist χ0 (q, τ ) = 1 hTτ %(q, τ )%(−q, 0)i0 V 1 X − hTτ c †kσ (τ )ck+ q,σ (τ )c†k0 σ0 (0)ck0 − q,σ0 (0)i0 V − 0 kk σσ 0 −− −− −− −− −− −→ −−−−−−−−−−−−−−→ n X 1 † − hTτ ckσ (τ )ck+q,σ (τ )i0 hTτ c†k0 σ0 (0)ck0 −q,σ0 (0)i0 V | {z } 0 0 − = Wick = kk σσ =h%(q)i0 =0 für q6=0 (homogen!) +hTτ c†kσ (τ )ck0 −q,σ0 (0)i0 hTτ ck+qσ (τ )c†k0 σ0 (0)i0 q6=0 = + 1 V = 1 V X (4.238) o hTτ c†k+qσ (τ )c†k0 σ0 (0)i0 hTτ ck0 −q,σ0 (0)c†kσ (τ )i0 (4.239) (4.240) kk0 σσ 0 X (−)δk+q,k0 δσσ0 G0 (k + q, σ, τ )(−)δk0 −q,k δσ0 σ G0 (k0 − q, σ 0 , −τ ) (4.241) kk0 σσ 0 1 X G0 (k + q, σ, τ ) G0 (k, σ, −τ ). V = (4.237) (4.242) kσ Die Fourier-Transformierte lautet dann 1 X 1 X G0 (k + q, σ, iωn + iνn ) G0 (k, σ, iνn ). χ0 (q, iωn ) = β iν V (4.243) kσ n Wir kennen schon die ungestörte Green-Funktion G0 (k, σ, iνn ) = 1 iνn − ξk (4.244) und können den Residuensatz anwenden, um die Summe über iνn zu berechnen: ... = = 1 X 1 X 1 1 β iν V iνn + iωn − ξk+q iνn − ξk kσ n µ ¶ 1 1 X 1 » » β¢ nF (ξk+q » −iωn ) + β¢ nF (ξk ) β ξk+q − iωn − ξk ξk + iωn − ξk+q ↑ ¢V kσ (4.245) (4.246) Periodizität! 1 1 , Pole bei z1 = ξk+q − iωn und z2 = ξk z + iωn − ξk+q z − ξk 1 X nF (ξk ) − nF (ξk+q ) . (4.247) V iωn + ξk − ξk+q beachte g(z) = = kσ Wir erhalten also das schon bekannte Ergebnis auf einfacherem Weg. 4.6 Potential-Streuung Wir betrachten ein wichtiges Problem, nämlich wechselwirkungsfreie Elektronen in einem äußeren, statischen Potential V (r). Dieses Problem erscheint auf den ersten Blick einfach, da die Elektronen nicht wechselwirken. Also haben wir es im Prinzip mit einem Einteilchenproblem zu tun. Wir denken aber hier an ein Unordnungspotential, das kompliziert ist und das wir im Allgemeinen gar nicht genau kennen. Wir wollen daher über mögliche Unordnungspotentiale mitteln (Unordnungsmittel ). Dabei müssen wir aufpassen: einfach über V (r) in H = H0 + V zu mitteln, würde V durch ein konstantes mittleres Potential ersetzen, was in H irrelevant ist. Wir würden die gesamte von der Unordnung stammende Physik ignonieren. Das ist also keine sinnvolle Methode. 116 Wir starten vom Hamiltonian ˆ d3 r H = H0 + V = X ¡ ¢ Ψ†σ (r) H0 (r) + V (r) Ψσ (r). (4.248) σ H0 sei lösbar. Z.B. kann H0 Elektronen in einem periodischen Potential beschreiben. Dann können wir das ungestörte System mit Hilfe der Bloch-Theorie exakt beschreiben. Wir behandeln V störungstheoretisch. Wir führen die Abkürzung (r1 σ1 , τ1 ) =: 1 (4.249) usw. ein und schreiben ˆ ˆ β dτ1 d3 r1 X 0 ˆ =: d1, (4.250) σ1 um Schreibarbeit zu sparen. Wir führen Green-Funktionen G(b, a) = −hTτ Ψ(b)Ψ† (a)i G0 (b, a) = −hTτ Ψ(b)Ψ† (a)i0 bzgl. H bzgl. H0 ein. Hier ist wieder a ≡ (ra σa , τa ) usw. Es gilt ¶ µ ∂ − − H0 (b) G0 (b, a) = ∂τb µ ¶ ∂ ⇒ − − H(b) + V (b) G0 (b, a) = ∂τb und (4.251) (4.252) δ(b − a) (4.253) δ(b − a) (4.254) µ ¶ ∂ − − H(b) G(b, a) = δ(b − a). ∂τb Aus den letzten beiden Gleichungen folgt µ ¶ µ ¶ ∂ ∂ − − H(b) G(b, a) = − − H(b) + V (b) G0 (b, a) ∂τb ∂τb µ ¶ ∂ = − − H(b) G0 (b, a) + V (b)G0 (b, a) ∂τb µ ¶ ∂ = − − H(b) G0 (b, a) ∂τb ˆ + d1 δ(b − 1) V (1)G0 (1, a) | {z } (4.255) (4.256) (4.257) (4.258) (4.255) wieder einsetzen µ ¶ ∂ = − − H(b) G0 (b, a) ∂τb µ ¶ ˆ ∂ + d1 − − H(b) G(b, 1)V (1)G0 (1, a). ∂τb (4.259) Mit den Anfangsbedingung G(a, a) = G0 (a, a) folgt (4.260) ˆ G(b, a) = G0 (b, a) + d1 G(b, 1)V (1)G0 (1, a), (4.261) also eine Dyson-Gleichung. Setzen wir G von links wieder rechts ein und iterieren, so erhalten wir ˆ G(b, a) = G0 (b, a) + d1 G0 (b, 1)V (1)G0 (1, a) ˆ + d1d2 G0 (b, 1)V (1)G0 (1, 2)V (2)G0 (2, a) + . . . (4.262) Vgl. den Abschnitt über Green-Funktionen bei T = 0, Seite 76. 117 4.6.1 Feynman-Diagramme R. P. Feynman hat im Zusammenhang mit der QED eine diagrammatische Darstellung von Ausdrücken entwickelt, die in Rechnungen mit Green-Funktionen (Propagatoren) auftreten. Diese Darstellung ist einerseits eine Veranschaulichung der Ausdrücke, die nützlich für die Entwicklung von Intuition für die physikalischen Prozesse ist. Andererseits ist sie auch eine rigorose Übersetzung der komplizierten Integrale, d.h. wir können aus einem Diagramm eineindeutig den entsprechenden Ausdruck konstruieren. Die Übersetzung wird durch Feynman-Regeln beschrieben. Im vorliegenden Fall lauten sie: G(b, a) = (4.263) (Der Pfeil zeigt vom Punkt der Erzeugung [Ψ† (a)] zum Punkt der Vernichtung [Ψ(b)].) G0 (b, a) = (4.264) ´ d1 . . . V (1) . . . = (4.265) Damit lautet die Dyson-Gleichung (4.261) (4.266) und Gleichung (4.262) (4.267) Die anschauliche Bedeutung ist klar: beschreibt die ungestörte Propagation und die Streuung am Potential (der Störung) V (r). 118 4.6.2 Elastische Streuung Bis hier war V ein vollständig allgemeiner Einteilchenterm. Jetzt nehmen wir an, dass H0 und V und damit auch H zeitunabhängig sind. Dann hängen G0 und G nur von τ − τ 0 ab. Die Fourier-Darstellung ist also 1 X −iωn (τ −τ 0 ) G0 (rτ, r0 τ 0 ) = e G0 (r, r0 ; iωn ) (4.268) β iω n ˆ β 0 G0 (r, r0 ; iωn ) = d(τ − τ 0 ) eiωn (τ −τ ) G0 (rτ, r0 τ 0 ) (4.269) 0 und analoge Gleichungen für G. Wir unterdrücken hier die Spin-Argumente. Die Dyson-Gleichung (4.266) enthält ein Faltungsintegral über τ1 : kein τ1 ↓ ˆ dτ1 G0 (rb τb , r1 τ1 )V (r1 )G(r1 τ1 , ra τa ). (4.270) Dieses wird in der Fourier-Transformierten zu einem gewöhnlichen Produkt: ˆ G(rb , ra ; iωn ) = G0 (rb , ra ; iωn ) + d3 r1 G0 (rb , r1 ; iωn )V (r1 )G(r1 , ra ; iωn ). (4.271) Diese Gleichung ist lokal in der Matsubara-Frequenz iωn . Sie ist nicht lokal im Ort. Es ist auch nützlich, die Dyson-Gleichung in der Einteilchen-Eigenbasis von H0 auszudrücken. Sei also {|νi} eine Basis von Eigenzuständen des ungestörten Einteilchen-Hamiltonians. Wir definieren ˆ Gνν 0 (iωn ) := d3 rd3 r0 hν|ri G(r, r0 ; iωn ) hr0 |ν 0 i (4.272) | {z } | {z } u∗ ν (r) ⇒ G(r, r0 ; iωn ) X hr|νiGνν 0 (iωn )hν 0 |r0 i = uν 0 (r0 ) (4.273) νν 0 und entsprechend ˆ Vνν 0 := Gνν 0 (iωn ) erfüllt die Gleichung X d3 r hν|riV (r)hr|ν 0 i. [(iωn − ξν )δνν 00 ) − Vνν 00 ] Gν 00 ν 0 (iωn ) = δνν 0 (4.274) (4.275) ν 00 0 und Gνν 0 (iωn ) erfüllt entsprechend X (iωn − ξν )δνν 00 Gν000 ν 0 (iωn ) = δνν 0 , (4.276) ν 00 was sofort das bekannte Ergebnis 0 Gνν 0 (iωn ) = 1 δνν 0 iωn − ξν (4.277) liefert. Die Dyson-Gleichung lautet jetzt Gνb νa (iωn ) = δνb νa Gν0a νa (iωn ) + X Gν0b νb (iωn )Vνb ν1 Gν1 νa (iωn ). (4.278) ν1 Sie hat die einfache Struktur einer Matrix-Gleichung, G(iωn ) = G 0 (iωn ) + G 0 (iωn )V G(iωn ). Wir können auch Feynman-Regeln für Gνν 0 (iωn ) formulieren: 119 Gνb νa (iωn ) = (4.279) = Gνb νa (iωn ) = δνb νa iωn − ξνa (4.280) Vνb νa = (4.281) 4.6.3 Störstellen-Streuung Ein häufiger Fall betrifft eine endliche Konzentration von identischen Störstellen in einem Leiter. Für diesen Fall gilt V (r) = Anzahl der Störstellen ↓ Ort der Störstelle j Nst X ↓ u(r − Rj ). (4.282) j=1 Also lautet die Dyson-Gleichung G(rb , ra ; iωn ) nicht translationsinvariant = G0 (rb − ra ; iωn ) + translationsinvariant Nst ˆ X d3 r1 G0 (rb − r1 ; iωn )u(r1 − Rj )G(r1 , ra ; iωn ). (4.283) j=1 Entwicklung nach u ergibt G(rb , ra ; iωn ) = ∞ X G (n) (rb , ra ; iωn ) (4.284) n=0 mit G (n) (rb , ra ; iωn ) = Nst X j1 =1 ... Nst ˆ X d3 r1 · · · d3 rn G0 (rb − rn ; iωn )u(rn − Rjn )G0 (rn − rn−1 ; iωn ) jn =1 ×u(rn−1 − Rjn−1 ) · · · G0 (r1 − ra ; iωn ). 120 (4.285) Günstiger ist die Dartellung im k-Raum, wo gilt 1 X ik·(r−r0 ) G0 (r − r0 ; iωn ) = e G0 (k, iωn ) V k 1 X ikb ·rb −ika ·ra (n) e G (kb , ka ; iωn ). G (n) (rb , ra ; iωn ) = V2 (4.286) (4.287) ka kb Hier kennen wir schon G0 (k, iωn ) = 1/(iωn − ξk ). Es ist nun X X 1 G (n) (kb , ka ; iωn ) = e−i(kb −kn−1 )·Rjn · · · e−i(k1 −ka )·Rj1 G0 (kb ; iωn ) n−1 V j ...j 1 k1 ...kn−1 n ×ukb −kn−1 G0 (kn−1 , iωn ) · · · G0 (ka , iωn ) (4.288) oder als Diagramm: G (n) (kb , ka ; iωn ) X = j1 ...jn 1 V n−1 X e−i(kb −kn−1 )·Rjn · · · e−i(k1 −ka )·Rj1 k1 ...kn−1 × (4.289) Für den Fall der Störstellenstreuung können wir jetzt die Feynman-Regeln explizit aufschreiben: 1. Für jedes Streuereignis zeichne , dies entspricht dem Ausdruck uqi e−iqi ·Rji . 2. Für jede Green-Funktion zeichne , dies entspricht G0 (k, iωn ). 3. Sorge für Impulserhaltung an jedem Vertex . P 4. Summiere mittels 1/V ki über alle Impulse, außer den äußeren Impulsen ka , kb . 5. Summiere mittels PNst ji =1 über alle Störstellen, für jedes . Diese Regeln beschreiben die eineindeutige (bijektive) Abbildung zwischen dem Ausdruck und dem Diagramm, in diesem Fall für G (n) . Wörtlich genommen ist das Modell sehr kompliziert, da die Streuung an allen Nst Störstellen interferiert. Verschiebt man eine Störstelle um eine Strecke der Größenordnung der elektronischen Wellenlänge λF = 2π/kF , so ändert sich im Prinzip das Interferenzmuster überall. Solche Effekte kann man an kleinen, relativ sauberen Proben bei sehr tiefen Temperaturen (unterhalb von 1K) tatsächlich beobachten. An makroskopischen Proben, die nicht sehr sauber sind oder deren Temperatur nicht sehr niedrig ist, sind solche Interferenzeffekte nicht zu beobachten. Warum nicht? Wir haben wichtige Prozesse nicht im Modell berücksichtigt, nämlich die Elektron-Phonon- und die Elektron-Elektron-Wechselwirkung. Diese führen zu inelastischer Streuung der Elektronen. Daher sind die elektronischen (Einteilchen-) Zustände nur über eine endliche Länge Lϕ kohärent, d.h. sie können nur auf kleineren Längenskalen interferieren. Lϕ heißt Phasenkohärenzlänge. Makroskopische Messgrößen für Systeme der Ausdehnung L À Lϕ sind dann inkohärente (d.h. normale) Mittelwerte über viele Bereiche („Zellen“) der Größe Lϕ : 121 Da es viele Zellen gibt und die Störstellen in jeder Zelle zufällig und unabhängig verteilt sind, entspricht diesem Mittelwert der Mittelwert über alle möglichen Verteilungen der Nst Störstellen. Für die GreenFunktion sieht diese Mittelung so aus: 1 hG(kb , ka ; iωn )ist V ≡ δka kb Ḡ(ka , iωn ) ˆ ˆ ˆ 1 1 1 := δka kb d3 R1 d3 R2 · · · d3 RNst G(ka , ka ; iωn ) V V V ˆ ˆ ∞ X 1 1 = δ ka kb d3 R1 · · · d3 RNst G (n) (ka , ka ; iωn ). V V n=0 (4.290) (4.291) (4.292) Beachte, dass das Unordnungsmittel die Impulserhaltung wieder herstellt, da das System im Mittel wieder translationsinvariant wird. Daher hängt die gemittelte Green-Funktion Ḡ nur von einer Impulsvariablen ab. Wir müssen nun G (n) , Gl. (4.288), über alle Störstellenpositionen Rj mitteln. Die Rj tauchen in G (n) nur in den Exponentialfaktoren auf. Wir benötigen demnach ˆ ˆ 1 1 3 d R1 · · · d3 RNst e−i(kb −kn−1 )·Rjn e−i(kn−1 −kn−2 )·Rjn−1 · · · e−i(k1 −ka )·Rj1 . (4.293) V V Nun kann ein gegebenes Rj im Integranden 0, 1, 2, 3, . . .-mal auftreten. (a) Nullmal: wir erhalten einfach (b) Einmal: 1 V 1 V ˆ d3 Rj = 1. (4.294) d3 Rj e−i(kaus −kein )·Rj = δkaus −kein ,0 . (4.295) ˆ (c) Zweimal: 1 V ˆ d3 Rj e−i(kaus2 −kein2 )·Rj e−i(kaus1 −kein1 )·Rj = δkaus2 −kein2 +kaus1 −kein1 ,0 . 122 (4.296) (d) n-mal: 1 V ˆ d3 Rj e−i(kausn −keinn )·Rj · · · e−i(kaus1 −kein1 )·Rj = δkausn −keinn ±...+kaus1 −kein1 ,0 . (4.297) Also ist in jedem Fall die Summe der Impulsüberträge von der Störstelle j an die Elektronen Null. Jede Störstelle j führt also zu einem Faktor δP q,0 , der eine Impuls-Summe beseitigt. Es bleibt ein Vorfaktor 1/V dieser Impuls-Summe übrig. Außerdem kann j jede der Nst Störstellen sein; derselbe Beitrag erscheint also Nst -mal. Damit erhält jeder der genannten Prozesse, unabhängig von der Anzahl n der Streuungen an derselben Störstelle, einen Faktor Nst . (4.298) nst := V Schließlich müssen wir noch über alle Möglichkeiten von mehrfachem Auftreten von Störstellen summieren. Z.B. für G (3) : ˆ ˆ 1 1 d3 R1 · · · d3 RNst G (3) (ka , ka ; iωn ) (4.299) V V und damit Ḡ(ka , iωn ) 123 (4.300) Hier lauten die Feynman-Regeln: = uq (4.301) = nst (4.302) = G0 (k, iωn ) (4.303) und Impulserhaltung anP jedem Vertex und jedem sind impliziert. Über alle inneren Impulse ist zu summieren mittels 1/V kj . Als Beispiel übersetzen wir ein Diagramm vierter Ordnung in den entsprechenden mathematischen Ausdruck: = n2st 1 X 1 X G0 (ka , iωn )uk1 −ka V V k1 k2 × G0 (k1 , iωn )uk2 −k1 G0 (k2 , iωn )uka −k1 × G0 (ka + k2 − k1 , iωn )uk1 −k2 G0 (ka , iωn ). 124 (4.304) Hier führen wir noch einen wichtigen Begriff ein: lässt sich ein Diagramm in zwei Teile zerlegen, indem man eine innere G0 -Linie durchtrennt, so nennt man es reduzibel, andernfalls irreduzibel. Beispiel: das obige Diagramm ist irreduzibel. 4.6.4 Selbstenergie Die diagrammatische Darstellung gestattet eine sehr kompakte Definition der Selbstenergie: Σ(k, iωn ) ≡ (4.305) Summe über alle irreduziblen Diagramme Es folgt Ḡ(k, iωn ) = (4.306) Diese Reihe enthält alle (reduziblen und irreduziblen) Diagramme. Wir können wieder eine DysonGleichung herleiten: Ḡ(k, iωn ) = (4.307) = G0 (k, iωn ) + G0 (k, iωn )Σ(k, iωn )Ḡ(k, iωn ) (4.308) mit der Lösung Ḡ(k, iωn ) = = G0 (k, iωn ) 1 − G0 (k, iωn )Σ(k, iωn ) 1 1 = . iωn − ξk − Σ(k, iωn ) G0−1 (k, iωn ) − Σ(k, iωn ) (4.309) (4.310) Σ(k, iωn ) ist also eine additive Korrektur zur Energie ξk . Daher stammt die Bezeichnung. Das praktische Problem ist jedoch, dass die Selbstenergie von iωn abhängt, sie führt also nicht einfach zu einer Änderung der Dispersionsrelation (mit iωn → ω + iη) der Art ? ω = ξk + Σ(k). (4.311) Das Problem der Berechnung von Ḡ ist aber jedenfalls auf die Berechnung von Σ zurückgeführt. Σ können wir i.A. nicht exakt berechnen. Wir benötigen also eine Näherung. Die einfachste Näherung besteht sicherlich darin, nur den ersten Term in Σ mitzunehmen: Σnaiv (k, iωn ) = (4.312) 125 Aber dann ist Σnaiv (k, iωn ) = nst uq=0 ˆ = nst d3 r u(r) (4.313) = (4.315) ↑ Potential einer Störstelle const. (4.314) Dies ist nur eine konstante Verschiebung der Elektronenenergie ξk → ξk + nst u0 = εk − µ + nst u0 , (4.316) die wir von nun an in das chemische Potential absorbieren. Diese Näherung beschreibt keine interessante Physik. 4.6.5 Erste Bornsche Näherung Die einfachste nicht triviale Näherung ist dann ΣB1 (k, iωn ) := (4.317) = = 1 X uk0 −k G0 (k0 , iωn )uk−k0 V 0 k 1 X 1 nst |uk0 −k |2 . V 0 iωn − ξk0 nst (4.318) (4.319) k Diese nennt man die erste Bornsche Näherung. Sie führt auf Ḡ(k, iωn ) ≡ (4.320) Beachte, dass diese Näherung aufgrund der Dyson-Reihe bereits unendlich viele Terme enthält. Was ist der physikalische Gehalt der Näherung? 1. Elektronen streuen höchstens zweimal an derselben Störstelle und 2. sie kehren nicht zu derselben Störstelle zurück. Wir betrachten nun die mathematischen Eigenschaften von ΣB1 (k, iωn ). Wir setzen ΣB1 als Funktion der Frequenz analytisch fort und finden nst X 1 . ΣB1 (k, z) = |uk−k0 |2 V z − ξk0 0 k (4.321) ↑ reell ΣB1 ist also eine Summe (ein Integral im Limes V → ∞) von Termen mit Polen bei z = ξk0 ∈ R. Daher ist ΣB1 auf zumindest einem Teil der reellen Achse singulär. ΣB1 hat also einen Schnitt auf (einem Teil) der reellen Achse. 126 Für die retardierte/avancierte Green-Funktion benötigen wir die retardierte/avancierte Selbstenergie R/A ΣB1 (k, ω) = ΣB1 (k, iωn → ω ± iη) nst X 1 = |uk−k0 |2 V ω − ξ k0 ± iη k0 µ ¶ nst X 1 = |uk−k0 |2 P ∓ iπδ(ω − ξk0 ) . V ω − ξ k0 0 (4.322) (4.323) (4.324) k Dann ist die Green-Funktion 1 R/A ḠB1 (k, ω) = R/A ω − ξk − ΣB1 (k, ω) . (4.325) ḠR/A wird betragsmäßig groß, wenn ω ≈ ξk gilt (für eine kleine Störung V sollte Re ΣR/A hinreichend klein sein, so dass diese Aussage gilt). Daher können wir in ΣR/A näherungsweise ω ≈ ξk setzen. Falls ω und ξk nämlich nicht ähnlich sind, ist ḠR/A insgesamt klein und daher für die Physik nicht entscheident. Also gilt µ ¶ nst X 1 R/A 2 ΣB1 (k, ω) ≈ |uk−k0 | P ∓ iπδ(ξk − ξk0 ) . (4.326) V ξ k − ξ k0 0 k R/A Nun wird Ḡ von Zuständen nahe der Fermi-Energie (|ξk | . kB T ) dominiert. Wir nehmen an, dass |uk−k0 |2 in der Nähe der Fermi-Fläche schwach von k−k0 abhängt. Das ist für ein abgeschirmtes CoulombPotential u(r) = e−r/rs /4πε0 r erfüllt, wenn kB T nicht zu groß ist. Da 1/(ξk − ξk0 ) das Vorzeichen in der Nähe der Fermi-Fläche wechselt und |uk−k0 |2 ≈ const ist, ist der Realteil R/A Re ΣB1 (k, ω) ≈ nst X 1 |uk−k0 |2 P V ξ − ξk0 k 0 (4.327) k R/A klein. (Genauer findet man, dass Re ΣB1 zumindest nur schwach k-abhängig ist und daher in das chemische Potential absorbiert werden kann.) Der Imaginärteil bleibt übrig, da δ(ξk − ξk0 ) nicht das Vorzeichen wechselt: i nst X R/A |uk−k0 |2 δ(ξk − ξk0 ) = ∓ ΣB1 (k, ω) ≈ ∓iπ (4.328) V 2τk 0 k mit der Streurate 1 2π X nst |uk−k0 |2 δ(ξk − ξk0 ). := τk V 0 (4.329) k Damit ist die Green-Funktion R/A ḠB1 (k, ω) ≈ 1 ω − ξk ± i 2τk . (4.330) Wir sehen, dass Ḡ ebenfalls einen Schnitt auf der reellen Achse hat. Ḡ ist aber in der oberen und unteren komplexen Halbebene jeweils holomorph. Die Störstellenstreuung ersetzt also den infinitesimalen Imaginärteil ±iη in der Green-Funktion durch eine endliche Größe. Um zu sehen, was das bedeutet, betrachten wir die Fourier-Transformierte in der 127 Zeit: ˆ ḠR B1 (k, t) ∞ = −∞ = ∞ ˆ = −ie −iξk t −t/(2τk ) t e | −∞ i 2τk ´ i t 0 ↓ 0 0 (4.332) (4.333) 0 ↓ iξk t0 t0 /(2τk ) dt δ(t )e {z 8 > <0 = > :1 = (4.331) · µ ¶ ¸ i t exp i −ξ + k 2τk ω − ξk + 2τik −∞ 2π | {z } ←−−−−−−−−−−−−−−−−−−−−−−−−−−−−− ¶ ¸ · µ ˆ t z }| {ˆ ∞ dω i e−iξk t e−t/(2τk ) (−i) dt0 exp −i ω − ξk + t0 2π 2τ k −∞ −∞ ˆ = dω −iωt 1 e 2π ω − ξk + 2τik h ³ dω exp −i ω − ξk + e (4.334) } für t < 0 für t > 0 −iθ(t) e−iξk t e−t/(2τk ) . (4.335) Also fällt der Propagator auf der Zeitskala 2τk ab. Man sagt, die Streuung transformiert die freien Elektronen in Quasiteilchen mit endlicher Lebensdauer τk . Diese sind die fermionischen Moden des ungeordneten Systems. Ähnlich findet man durch räumliche Fourier-Transformation für ω ¿ EF : ∼ πd(EF ) eikF |r| e−|r|/2l ḠR B1 (r, ω) = − kF |r| (4.336) mit der Steulänge (mittleren freien Weglänge) l = vF τk . d(EF ) ist die Zustandsdichte pro Spin-Richtung an der Fermi-Energie. Es wurden eine isotrope Dispersion und eine k-unabhängige Streurate angenommen. Die Propagation der Elektronen ist also durch die Streuung gedämpft. Die Wahrscheinlichkeit, ein Elektron an einem entfernten Ort zu finden ist exponentiell unterdrückt. (a) Die volle Bornsche Näherung Wir erwähnen noch, dass mass man die erste Bornsche Näherung in zwei Schritten verbessern kann. Die volle Bornsche Näherung ist diagrammatisch gegeben durch ΣB∞ (k, iωn ) = (4.337) Die berücksichtigten Diagramme nennt man „Wigwam-Diagramme“. (b) Die selbstkonsistente Bornsche Näherung Diese ist gegeben durch ḠSCB ≡ (4.338) 128 und ΣSCB ≡ (4.339) nicht Ḡ0 , sondern selbstkonsistente Green-Funktion ḠSCB Was für Diagramme sind hier enthalten? Nicht enthalten ist z.B. (eine „Vertexkorrektur“). Also ist auch die selbstkonsistente Bornsche Näherung nicht exakt. Für weitere Diskussion siehe das Buch von Bruus und Flensberg. 4.7 Elektron-Elektron-Wechselwirkung Wir betrachten Elektronen mit einer Zwei-Teilchen- (z.B. Coulomb-) Wechselwirkung. Der Hamiltonian lautet H = H0 + V 2 , (4.340) wobei H0 = T + V1 alle Einteilchenterme enthält. Wir wissen schon aus Abschnitt 2.4, dass gilt ˆ 1 X d3 r1 d3 r2 Ψ†σ1 (r1 )Ψ†σ2 (r2 )V2 (r1 , r2 )Ψσ2 (r2 )Ψσ1 (r1 ). (4.341) V2 = 2 σσ 1 2 Wir schreiben den Spin-Index explizit hin, nehmen aber an, dass die Wechselwirkung den Spin eines Elektrons nicht ändert. Wir verwenden wieder die Abkürzung 1 ≡ (σ1 , r1 , τ1 ). Wir suchen die Green-Funktion G(b, a) = −hTτ Ψ(b)Ψ† (a)i. ↑ b≡(σb ,rb ,τb ) usw. 129 (4.342) Gemäß Abschnitt 4.4, insbesondere Gl. (4.146), ist bzgl. H0 hTτ UI (β, 0)ΨI (b)Ψ†I (a)i↓0 , G(b, a) = − hUI (β, 0)i0 (4.343) wobei UI der Zeitentwicklungsoperator im Wechselwirkungsbild ist. Wir hatte schon gesehen, siehe Gl. (4.130), dass gilt ˆ β ˆ β ∞ X 1 n dτ1 · · · dτn Tτ V2I (τ1 ) · · · V2I (τn ). (4.344) UI (β, 0) = (−1) n! 0 0 n=0 Dies ergibt ˆ β ∞ X (−1)n dτ1 · · · dτn hTτ V2I (τ1 ) · · · V2I (τn )ΨI (b)Ψ†I (a)i0 n! 0 G(b, a) = − n=0 ∞ . X (−1)n ˆ β dτ1 · · · dτn hTτ V2I (τ1 ) · · · V2I (τn )i0 n! 0 n=0 Hier steht V2I (τj ) = ˆ 1 X d3 r1 d3 r2 Ψ†σ1 I (r1 , τj )Ψ†σ2 I (r2 , τj )V2 (r1 , r2 )Ψσ2 I (r2 , τj )Ψσ1 I (r1 , τj ) 2 σσ 1 (4.345) (4.346) 2 innerhalb des zeitgeordneten Produkts Tτ . . . Da die Zeitargumente alle gleich sind, ist die Wirkung von Tτ mehrdeutig. V2 ist aber definiert mit der Reihenfolge Ψ† Ψ† ΨΨ. Damit diese unter Tτ bestehen bleibt, machen wir die Zeiten der Ψ† infinitesimal später als die der Ψ. (Im Prinzip müssen wir auch auf die Reihenfolge der ΨΨ und Ψ† Ψ† unter sich achten, da deren Vertauschung ein Minus-Zeichen ergeben würde. Es zeigt sich aber, dass hier kein Problem auftritt, wenn wir die Reihenfolge nicht „unnötig ändern“.) Wir schreiben: ˆ β ˆ 1 (2) 0 (4.347) dj dj 0 . . . Ψ†I (j+ )Ψ†I (j+ )Vjj 0 ΨI (j 0 )ΨI (j) . . . dτj · · · V2I (τj ) · · · = 2 0 mit ˆ j := dj := (σj , rj , τj ) und j+ := (σj , rj , τj + 0+ ), ˆ β Xˆ d3 rj dτj , σj (2) Vjj 0 := (4.348) (4.349) 0 V2 (rj , rj 0 ) δ(τj − τj 0 ) (4.350) (die Wechselwirkung ist instantan, d.h. lokal in der Zeit). Damit wird ˆ β ∞ X (−1)n (2) (2) ­ d1d10 · · · dndn0 V110 · · · Vnn0 Tτ Ψ†I (1+ )Ψ†I (10+ )ΨI (10 )ΨI (1) · · · n! 0 ··· G(b, a) = − n=0 ∞ n ˆ β X (−1) (2) ­ † † 0 0 0 0 (2) d1d1 · · · dndn V110 · · · Vnn0 Tτ ΨI (1+ )ΨI (1+ )ΨI (1 )ΨI (1) · · · n! 0 n=0 ® Ψ†I (n+ )Ψ†I (n0+ )ΨI (n0 )ΨI (n)ΨI (b)Ψ†I (a) 0 ··· † (4.351) ® ΨI (n+ )Ψ†I (n0+ )ΨI (n0 )ΨI (n) 0 (Achtung: fortgesetzter Bruchstrich). Zähler und Nenner enthalten höhere elektronische Greenfunktionen bzgl. des ungestörten Hamiltonians H0 : ˆ β ∞ X (−1/2)n » » (2) (2) 2n+1 »» d1d10 · · · dndn0 V110 · · · Vnn0 » (−1) ··· n! 0 n=0 ··· G(b, a) = ¡ − ∞ X (−1/2)n ˆ β (2) » 0 0 (2) 2n » » ··· d1d1 · · · dndn V110 · · · Vnn0 » (−1) n! 0 n=0 (2n+1) ··· G0 (2n) G0 (b, 1, 10 , . . . , n, n0 ; a, 1+ , 10+ , . . . , n+ , n0+ ) (1, 10 , . . . , n, n0 ; 1+ , 10+ , . . . , n+ , n0+ ) 130 , (4.352) (n) vgl. die Definition von G0 in Abschnitt 4.5. (2n+1) (2n) Hier können wir jetzt Wicks Theorem anwenden. Es sagt aus, dass wir die G0 , G0 als antisymmetrisierte Summen über Produkte von Einteilchen-Green-Funktionen G0 schreiben können: ∞ X n=0 G(b, a) = (−1/2)n n! ˆ ˛ ˛ ˛ ˛ β ˛ (2) ˛˛ 0 0 (2) d1d1 · · · dndn V110 · · · Vnn0 ˛ ˛ 0 ˛ ˛ ˛ G0 (b, a) G0 (1, a) .. . G0 (b, 1) G0 (1, 1+ ) .. . G0 (n0 , a) G0 (n0 , 1) ˛ ˛ ˛ G0 (1, 1+ ) · · · ∞ n ˆ β ˛ X (−1/2) (2) ˛˛ 0 0 (2) .. .. d1d1 · · · dndn V110 · · · Vnn0 ˛ . . ˛ n! 0 ˛ n=0 ˛ G0 (n0 , 1) ··· ··· ··· .. . G0 (b, n0 ) G0 (1, n0 ) .. . ˛ ˛ ˛ ˛ ˛ ˛ ˛ ˛ ˛ ˛ ˛ ˛ · · · G0 (n0 , n0+ ) ˛ . G0 (1, n0 ) ˛˛˛ ˛ .. ˛ ˛ . G0 (n0 , n0+ ) ˛ ˛ ˛ (4.353) Wie oben diskutiert haben alle Ψ† (außer Ψ† (a)) ein infinitesimal verschobenes Zeitargument τk + η. Das ist aber nur wichtig, wenn τj = τk . Der gefundene Ausdruck ist sehr unhandlich. Zähler und Nenner können aber viel anschaulicher durch Diagramme dargestellt werden. Ohne uns zunächst um Zahlenfaktoren zu kümmern, setzen wir G0 (j, k) = (wie schon bekannt) (4.354) (2) Vjj 0 = (4.355) und summieren über alle inneren Variablen j = (σj , rj , τj ). Dann ist der Nenner von G(b, a): 131 Z ≡ hUI (β, 0)i0 = 1+ + (720 Terme für n = 3) + · · · (4.356) Beachte, dass Z = hUI (β, 0)i0 nicht von den äußeren Variablen b, a abhängt. Dem entsprechend haben die Diagramme keine äußeren Beine. Solche Diagramme nennt man Vakuum-Diagramme. Entsprechend ist der Zähler von G(b, a): −hTτ UI (β, 0)ΨI (b)Ψ†I (a)i0 + (120 Terme für n = 2) + · · · 132 (4.357) Nun ist z.B. (−1/2)1 = G0 (b, a) | {z } 1! ˆ (2) d1d10 V110 G0 (1, 1+ ) G0 (10 , 10+ ), {z } | (4.358) d.h. nicht zusammenhängende Diagramme sind das Produkt der einzelnen zusammenhängenden Teildiagramme. Daher können wir die nicht mit den äußeren Vertices a, b verbundenen Teile im Zähler ausklammern. Das sind gerade die Vakuum-Diagramme, die auch im Nenner auftreten. Sie kürzen sich weg. (Für den sorgfältigen Beweis siehe die Bücher von Bruus/Flensberg oder Mahan.) Weiter beachten wir, dass topologisch identische Diagramme, d.h. solche, die durch Verformungen, Spiegelungen oder Drehungen ineinander überführt werden können, identische mathematische Ausdrücke ergeben, da die Benennung der inneren Vertices j, j 0 beliebig ist. Es zeigt sich, dass die resultierenden kombinatorischen Faktoren gerade die expliziten Faktoren (1/2)n /n! kürzen. Wir zeichnen jedes Diagramm daher nur einmal und lassen den Faktor (1/2)n /n! weg. Es ergibt sich G(b, a) (4.359) wobei die Reihe jetzt nur noch zusammenhängende Diagramme enthält. Wir können jetzt die Feynman-Regeln für die Elektron-Elektron-Wechselwirkung hinschreiben: G0 (j, k) = 1. (wobei τk → τk → η) (2) −Vjj 0 = 2. (Vorzeichen resultiert aus der Antivertauschungsrelation von fermionischen Operatoren, hier nicht gezeigt) 3. ´ dj δσjein σjaus = • (kein Spin-Flip) j 4. Multipliziere mit (−1)F , wobei F die Anzahl von geschlossenen Elektronen-Schleifen ist, z.B. (von der Antivertauschung, hier nicht gezeigt). 133 4.7.1 Selbstenergie In Analogie zum Fall der Störstellenstreuung können wir die Selbstenergie einführen: Σ(l, j) ≡ (4.360) Die Selbstenergie enthält immer nur die irreduziblen Diagramme. Damit lässt sich die volle Green-Funktion exakt als G(b, a) ≡ (4.361) schreiben. Diese Reihe können wir wieder aufsummieren und erhalten die Dyson-Gleichung G(b, a) ≡ (4.362) ˆ = G0 (b, a) + dl dj G0 (b, l) Σ(l, j) G(j, a). (4.363) Ist der Hamiltonian H translationsinvariant oder zumindest gitterperiodisch, so ist es wieder nützlich, zur Fourier-Transformierten überzugehen. Wir geben die Feynman-Regeln hierfür ohne weitere Herleitung an: 1. Gσ0 (k, iωn ) = , wobei iωn eine fermionische Matsubara-Frequenz ist. In Teildiagrammen der Form und multipliziere mit eiωn η |η→0+ (dies resultiert aus der infinitesimalen Verschiebung der Zeitargumente in den Ψ† ; in allen anderen Diagrammen darf man diesen ebenfalls einführen, er ändert dann aber nichts am mathematischen Resultat). −V (2) (q) = 2. , wobei iνn eine bosonische Matsubara-Frequenz ist. 3. Erhalte Impuls, Frequenz und Spin an jedem Vertex. 4. Summiere über die verbleibenden inneren Variablen mittels 1 XXX . βV q σ iν n 5. Multipliziere mit (−1)F , wobei F die Anzahl von geschlossenen Elektronen-Schleifen ist. Bemerkung: Die beiden Diagramme 134 sind nicht topologisch verschieden – der Pfeil für V (2) gibt nur an, in welcher Richtung q, iνn positiv gezählt werden. Aufgrund der Erhaltung von (k, iωn ) geht dasselbe (k, iωn ) in die Selbstenergie Σ in G hinein wie heraus. Die Dyson-Gleichung wird daher zu einer algebraischen Gleichung, Gσ (k, iωn ) = Gσ0 (k, iωn ) + Gσ0 (k, iωn )Σσ (k, iωn )Gσ (k, iωn ) (4.364) mit der Lösung Gσ (k, iωn ) = 1− Gσ0 (k, iωn ) 0 Gσ (k, iωn )Σσ (k, iωn ) (4.365) 1 . iωn − ξk − Σσ (k, iωn ) = (4.366) Diese hat dieselbe Form wie bei der Unordnungsstreuung und ist ebenfalls exakt. Das Problem wurde auf die Berechnung von Σσ (k, iωn ) zurück geführt. 4.7.2 Die Hartree-Selbstenergie Der einfachste Term in der Selbstenergie ist der sogenannte Hartree-Term: ΣH σ (k, iωn ) := (4.367) F =1 (eine Schleife) ↓ = (−1)1 0 1 XX nη [−V2 (0)] Gσ0 0 (k0 , iωn0 ) |eiω {z } βV 0 0 0 k σ iωn = von Operator-Ordnung 0 1 X 1 X eiωn η V2 (0) V 0 0 β 0 iωn0 − ξk0 V2 (0) 1 V X (4.369) iωn kσ = (4.368) nF (ξk0 ) k0 σ 0 | {z } = V2 (0) N . V (4.370) Elektronenzahl N Die Hartree-Selbstenergie beschreibt also die Wechselwirkung mit der gemitelten Elektronenkonzentration. Denselben Term hatten wir in Abschnitt 4.2 aus der Hartree- (Mean-Field-) Näherung erhalten. Wie dort besprochen, ist er formal divergent, wird aber vom Kernpotential kompensiert. 4.7.3 Die Fock-Selbstenergie Der Fock- oder Austausch-Term in der Selbstenergie ist ΣF σ (k, iωn ) := (4.371) 135 Dieser kann analog berechnet werden: ... = − 1 X V2 (k − k0 ) nF (ξk0 ). V 0 (4.372) k 4.8 Das wechselwirkende Elektronengas Wir hatten in Abschnitt 3.2 gesehen, dass die Energie des wechselwirkenden Elektronengases im JelliumModell in der 2. Ordnung der Störungstheorie in V2 divergiert. Wir wollen jetzt zeigen, dass sich diese Divergenz in der vollen Vielteilchentheorie weghebt. Zugleich erhalten wir eine bessere Näherungslösung für die Green-Funktion. Dazu werden wir eine unendliche Teilmenge aller Selbstenergiediagramme aufsummieren. Wir sind natürlich eigentlich an der Coulomb-Wechselwirkung interessiert, betrachten aber zunächst die Yukawa-Wechselwirkung e2 1 V2 (q) = , (4.373) 2 ε0 q + α 2 und lassen am Ende der Herleitung α → 0 gehen, was die Coulomb-Wechselwirkung wieder herstellt. Dieses Vorgehen erleichtert die Rechnung. Die erwähnte Korrektur 2. Ordnung divergiert in diesem Limes wie ˆ qmax 1 1 (2) E ∼ dq q 2 2 qq ∼ − ln α → ∞. (4.374) 2 2 (q + α ) q 0 Die hier betrachtete Näherung geht von der Selbstenergie aus: Σσ (k, iωn ) = (4.375) Der Hartree-Term ist hier bereits weggelassen, da er vom Kernpotential kompensiert wird. Die zentrale Idee unserer Näherung ist folgende: Wir wollen in jeder Ordnung in V2 die betragsmäßig größten Terme finden und nur diese aufsummieren. Wir erwarten nach unseren Erfahrungen mit der naiven Störungstheorie, dass einige Terme für α → 0 divergieren. Dann sind die am stärksten divergenten Terme diejenigen, die wir suchen. Welche Diagramme gegebener Ordnung n divergieren nun am stärksten für α → 0? Wir bemerken: • Für Wechselwirkungen V2 (q) mit unterschiedlichen Impulsen, V2 (q)V2 (q − p) · · · ∼ 1 1 ··· , q 2 + α2 |q − p|2 + α2 erhalten wir für α → 0 nur Pole 2. Ordnung: 1 1 2 2 q p ... ∼ = 1 1 2 p |q − p|2 (4.376) für q → 0 (4.377) für q → p, außer, wenn p = 0, was aber höchstens auf einer Menge vom Maß Null der Fall ist. • Für zwei Faktoren V2 (q) mit demselben Impuls erhalten wir dagegen einen Pol 4. Ordnung: 1 1 → 4 (q 2 + α2 )2 q für α → 0. (4.378) 1 1 → 2m (q 2 + α2 )m q für α → 0. (4.379) V2 (q)V2 (q) ∼ • Entsprechend ergibt sich [V2 (q)]m ∼ 136 Der für kleine q am stärksten divergierte Term der Ordnung n ist also derjenige, bei dem alle V2 dasselbe Impulsargument haben. (Wir erinnern daran, dass Divergenzen bei großen q in der Festkörpertheorie i.A. uninteressant sind, da wir für ein gitterperiodisches System nur über die 1. Brillouin-Zone integrieren.) Welche Terme sind das? Beispielhaft betrachten wir den Fall n = 3. Hier existieren 7 Diagramme: Das letztere Diagramm ist also am stärksten divergent. Die Random-Phase-Approximation (RPA) besteht nun darin, nur die am stärksten divergenten Diagramme in jeder Ordnung zu berücksichtigen: ΣRPA (k, iωn ) := σ (4.380) („RPA“ ist eine historische Bezeichnung. In unserer Herleitung ist nicht offensichtlich, welche Phase hier „zufällig“ ist.) Der wichtigste Teil aller RPA-Diagramme ist offenbar das Schleifen-Diagramm Π0 := . 137 (4.381) Gemäß der Feynman-Regeln aus Abschnitt 4.7 ist dies Spin-Summe ↓ ˆ Π0 (q, iνn ) = − ↑ 2 X β iω n d3 k 1 1 . (2π)3 iωn + iνn − ξk+q iωn − ξk (4.382) eine Schleife (F =1) Beachte, dass χ0 = −Π0 die in Abschnitt 4.5 berechnete Dichte-Dichte-Korrelationsfunktion (Suszeptibilität) ist. Die diagrammatische Methode erlaubt uns nun, die Reihe von RPA-Diagrammen aufzusummieren. Es ist ΣRPA = (4.383) renormierte Coulomb-Wechselwirkung VRPA oder auch ΣRPA = (4.384) Durch Vergleich der beiden Darstellungen von ΣRPA erhalten wir VRPA (q, iνn ) (4.385) dies ist offenbar vom Typ einer Dyson-Gleichung. Wir können sie lösen: −VRPA (q, iνn ) = (4.386) 1− = = = −V2 (q) 1 − V2 (q)χ0 (q, iνn ) e2 1 − ε0 q 2 + α2 e2 1 1− χ0 (q, iνn ) ε0 q 2 + α 2 e2 ε0 . − e2 2 2 χ0 (q, iνn ) q +α − ε0 138 (4.387) (4.388) (4.389) Für α → 0 ergibt sich e2 ε0 2 VRPA (q, iνn ) = e ε0 q2 − e2 χ0 (q, iνn ) ε0 . Hierin kennen wir schon die Dichte-Dichte-Korrelationsfunktion ˆ d3 k nF (ξk+q ) − nF (ξk ) χ0 (q, iνn ) = 2 (2π)3 −iνn + ξk+q − ξk (4.390) (4.391) des wechselwirkungsfreien Elektronengases. Wir betrachten einige Grenzfälle: (a) Der statische Grenzfall ergibt sich für iνn → ν + iη → 0 + iη zu ˆ d3 k nF (ξk+q ) − nF (ξk ) χR (q, 0) = 2 . 0 (2π)3 ξk+q − ξk − iη (4.392) Im Limes großer Längenskalen oder, äquivalent dazu, kleiner q, erhalten wir durch Taylor-Entwicklung ¯ ˆ ∂nF ¯ 3 (ξ − ξ ) k+q k d k ¯ ∂ξ k ∼ χR (4.393) ¯ 0 (q, 0) = 2 (2π)3 ξk+q − ξk + iη ¯ η→0+ ˆ d3 k ∂nF (4.394) = 2 (2π)3 ∂ξk ˆ ∂nF = dξ 2d(µ + ξ) . (4.395) ↑ ∂ξk Zustandsdichte pro Spin-Richtung Im typischen Fall kB T ¿ µ ≈ EF wird nF (ξ) eine Stufenfunktion und ∂nF /∂ξ = −δ(ξ). Dann ist ∼ χR 0 (q, 0) = −2d(µ) ≈ −2d(EF ). (4.396) Also lautet die renormierte Coulomb-Wechselwirkung R (q, 0) ∼ VRPA = e2 ε0 1 . 2 e 2 q + 2d(EF ) ε0 (4.397) Sie hat die Form der Yukawa-Wechselwirkung . . . =: e2 1 2 ε0 q + ks2 mit der inversen Thomas-Fermi-Abschirmlänge ks . Es ergibt sich also, in RPA, s e2 ks = 2d(EF ). ε0 (4.398) (4.399) p Für eine parabolische Dispersion ist dies ks = 4kF /πaB . Für Metalle ist typischerweise ks ≈ 0,1 nm−1 , also 1/ks ≈ 10 nm = 10−8 m. Im Ortsraum erhalten wir R VRPA (q, 0) ∼ = e2 1 −ks r e . 4πε0 r (4.400) Dies ist die durch die Polarisation des Elektronengases abgeschirmte Coulomb-Wechselwirkung, in RPA. Eine Testladung erzeugt eine Raumladungswolke von Elektronen oder Löchern, die die Testladung auf einer Längenskala 1/ks kompensiert. 139 (b) Instruktiv ist auch der Fall hoher Frequenzen ν → ∞: Hier ist ˆ d3 k nF (ξk+q ) − nF (ξk ) (q, ν → ∞) = lim 2 χR = 0. 0 ν→∞ (2π)3 −ν + ξk+q − ξk − iη Also erhalten wir R VRPA (q, ν → ∞) = e2 1 . ε0 q 2 (4.401) (4.402) Das ist die unabgeschirmte Coulomb-Wechselwirkung. Das Ergebnis können wir wie folgt verstehen: ν → ∞ entspricht sehr schnellen Prozessen. Aus kurzen Zeitskalen hat das Elektronengas nicht genug Zeit, eine Ladungswolke um die Testladung auszubilden. (c) Für beliebige q und ν lässt sich χR 0 (q, ν) ebenfalls in geschlossener Form angeben, wenn kB T → 0 und parabolische Dispersion angenommen werden. Die Rechnung ist etwas langwierig, aber alle Integrale über Komponenten von k sind elementar. Wir geben hier nur das Ergebnis an: Es ist nützlich, die dimensionslosen Größen q ν q̃ := , ν̃ := (4.403) 2kF 4EF zu definieren. Dann ist # " f (q̃, ν̃) + f (q̃, −ν̃) (4.404) Re χR 0 (q, ν) = −2d(EF ) 1 + ↑ 4q̃ dieser Term bleibt im Fall ν→0, q→0 mit " f (q̃, ν̃) := 1 − und µ ν̃ − q̃ q̃ ¶2 # " µ ¶2 # ν̃ π 1− − q̃ 8q̃ q̃ R Im χ0 (q, ν) = −d(EF ) π ν̃ 2 q̃ 0 ¯ ¯ ¯ q̃ + q̃ 2 − ν̃ ¯ ¯ ¯ ln ¯ q̃ − q̃ 2 + ν̃ ¯ (4.405) für |q̃ − q̃ 2 | < ν̃ < q̃ + q̃ 2 , für 0 < ν̃ < q̃ − q̃ 2 , (4.406) für ν̃ < q̃ + q̃ 2 . R Die Suszeptibilität und damit VRPA (q, ν) sind offenbar komplex. Der Imaginärteil beschreibt Dissipation – Energie wird vom Elektronengas absorbiert. 140 Eine Motivation für diesen Abschnitt war die Divergenz der elektronischen (Selbst-) Energie in der 2. Ordnung der Störungsentwicklung nach der Wechselwirkung V2 . Die Divergenz rührt von kleinen q her. Divergenzen erscheinen auch in allen höheren Ordnungen; wir haben ja in der RPA die am stärksten divergenten Terme in allen Ordnungen aufsummiert. Die RPA beschreibt die Abschirmung der CoulombWechselwirkung. Im Ergebnis tritt für q → 0 keine Divergenz mehr auf. Genauer hatten wir in Gl. (4.383) ˆ 1X d3 q ΣRPA (k, iω ) = − VRPA (q, iνn ) G0 (k − q, iωn − iνn ) n σ β iν (2π)3 n ˆ 1X d3 q e2 1 1 = − . (4.407) β iν (2π)3 ²0 2 e2 iωn − iνn − ξk−q n q − χ0 (q, iνn ) ²0 Der Integrand ist nun für q → 0 nicht mehr divergent. 4.9 Landau-Theorie der Fermi-Flüssigkeiten Wir können anhand der RPA die zentralen Ideen der wichtigen Landau-Theorie der Fermi-Flüssigkeiten verstehen. Sie sagt aus, dass die starke Coulomb-Wechselwirkung zwischen Elektronen in Festkörpern dazu führt, dass die Elektronen durch schwach wechselwirkende Quasiteilchen ersetzt werden, die weiterhin Fermionen mit Quantenzahlen k, σ sind. Das ist überraschend, da die typische Skala der CoulombWechselwirkung 1 Rydberg (einige eV) ist, während wir an der Physik auf Energieskalen der Größenordnung kB T ∼ 25 meV interessiert sind. Von fundamentaler Bedeutung für die Erklärung ist die Abschirmung der Coulomb-Wechselwirkung durch die Polarisation des Elektronengases, die von der RPA im Wesentlichen korrekt beschrieben wird. Das stark wechselwirkende Elektronensystem schwächt durch den Mechanismus der Abschirmung die Wechselwirkung selbst ab. Ebenfalls notwendig ist das Pauli-Prinzip. Es geht nicht nur in die RPA ein (es treten ja Fermi-Funktionen auf), sondern bewirkt auch, dass nur ein kleiner Teil der Elektronen in der Nähe der Fermi-Energie überhaupt „mitspielen“. Die Landau-Theorie erlaubt es, Methoden und Konzepte für wechselwirkungsfreie Elektronen auf reale Festkörper anzuwenden, z.B. die Bandstruktur. Die Landau-Theorie gilt jedoch nicht für alle Festkörper. Zum Beispiel ist CuO ein Isolator, obwohl die Bandtheorie voraussagt, dass es ein Metall sein sollte. Außerdem gilt die Landau-Theorie nur auf bestimmten Zeitskalen, wie wir jetzt sehen werden. (a) Die Spektralfunktion aus der RPA (oder aus besseren Näherungen) sieht so aus: Für wechselwirkungsfreie Elektronen ist sie eine δ-Funktion. Die Breite des Quasiteilchen-Peaks, also die Zerfallsrate der Quasiteilchen, ist von der Größenordnung der Streurate 1/τk , wobei τk die schon bekannte Streuzeit ist. Es ist allgemein 1 = −Im ΣR (k, ω). 2τk (4.408) Wir hatten dies für die Störstellenstreuung explizit hergeleitet. Das Quasiteilchen-Bild ist nur sinnvoll auf Zeitskalen t ¿ τk , da die Quasiteilchen andernfalls zerfallen. (b) Wir hatten gesehen, dass für große Frequenzen (kleine Zeiten) die Coulomb-Wechselwirkung nicht abgeschirmt wird. Dann müssen wir die stark wechselwirkenden Elektronen explizit betrachten, nicht 141 schwach wechselwirkende Quasiteilchen. Die typische Frequenzskala lässt sich aus ˆ d3 k nF (ξk+q ) − nF (ξk ) χR (q, ν) = 2 0 (2π)3 −ν + ξk+q − ξk − iη (4.409) ablesen: Die Unterdrückung von χR 0 für große Frequenzen setzt offenbar bei ν ∼ |ξk+q − ξk | ein. Wegen der Fermi-Funktionen ist die typische Energieskala |ξk+q − ξk | ∼ kB T . Von Quasiteilchen können wir also nur für 1 tÀ (4.410) kB T ausgehen. Ob wir in der Beschreibung eines Experiments vom Quasiteilchen-Bild ausgehen können, hängt also von der typischen Zeitskala des Experiments ab. Die Landau-Theorie gilt – falls sie überhaupt zutrifft – nur auf Zeitskalen 1 ¿ t ¿ τk . (4.411) kB T 4.10 Elektron-Phonon-Wechselwirkung Wir kennen den Hamiltonian für das gekoppelte Elektron-Phonon-System bereits aus Abschnitt 3.4: mit Hph X = qλ H = Hph + He−ph (4.412) µ ¶ 1 † Ωqλ bqλ bqλ + , 2 (4.413) ↑ Zweig der Phononendispersion He−ph 1 XX gqλ c† ckσ V |{z} k+q,σ = kσ qλ ↑ Kopplungsstärke (bqλ + b†−qλ ) | {z } . (4.414) =: Aqλ ∼ Auslenkung Gleichung (3.117) zeigt, dass der hier definierte Feldoperator Aqλ im Wesentlichen die Auslenkung der Kerne beschreibt. Wir gehen zum Wechselwirkungsbild in der imaginären Zeit über, Aqλ,I (τ ) = eτ Hph Aqλ e−τ Hph , (4.415) und führen die Matsubara-Green-Funktion für den Feldoperator A ein: Dλ0 (q, τ ) := ≡ −hTτ Aqλ,I (τ )A†qλ,I (0)i0 −hTτ Aqλ,I (τ )A−qλ,I (0)i0 . (4.416) (4.417) Die letzte Identität gilt, da Aqλ die Fourier-Transformierte eines hermiteschen Operators, nämlich der Auslenkung, ist. Für die transformierte Matsubara-Green-Funktion ˆ β Dλ0 (q, iνn ) = dτ eiνn τ Dλ0 (q, τ ) (4.418) 0 mit iνn = i 2πn/β erhalten wir (vgl. Abschnitt 4.4) Dλ0 (q, iνn ) = 1 1 2Ωqλ + = . iνn − Ωqλ −iνn − Ωqλ (iνn )2 − Ω2qλ Zur Untersuchung der Elektron-Phonon-Wechselwirkung schreiben wir H = H0 + He−ph mit ¶ µ X X 1 . H0 = εk c†kσ ckσ + Ωqλ b†qλ bqλ + 2 kσ qλ 142 (4.419) (4.420) Dieser ungestörte Hamiltonian beschreibt entkoppelte Elektronen und Phononen. Die Elektron-PhononWechselwirkung He−ph können wir perturbativ behandeln. In Analogie zum Fall der Coulomb-Wechselwirkung, die hier zunächst vernachlässigt wird, können wir die elektronische Green-Funktion als ˆ β ∞ X (−1)m dτ1 · · · dτm hTτ He−ph,I (τ1 ) · · · He−ph,I (τm )ckσ,I (τ )c†kσ,I (0)i0 m! 0 (4.421) Gσ (k, τ ) = − m=0 ˆ β ∞ X (−1)m dτ1 · · · dτm hTτ He−ph,I (τ1 ) · · · He−ph,I (τm )i0 m! 0 m=0 schreiben. Wie oben wollen wir diesen Ausdruck mit Hilfe von Feynman-Diagrammen in den Griff bekommen. h. . .i0 ist ein Gleichgewichtsmittelwert über sowohl fermionische als auch bosonische Felder. Für beide gilt das Wick-Theorem separat. Insbesondere zerfällt der bosonische Mittelwert in Faktoren gqi λi gqj λj hTτ Aqi λi ,I (τi )Aqj λj ,I (τj )i0 = −δqj ,−qi δλj λi |gqi λi |2 Dλ0 i (qi , τi − τj ). (4.422) Für ungerades m bleibt immer ein Term erster Ordnung gqi λi hAqi λi ,I (τi )i0 = 0 übrig. Also tragen nur gerade m bei und wir schreiben m = 2n. Nach Ausführung der bosonischen Mittelung erhalten wir Ausdrücke der Form ˆ β X XX 1 ... dτi dτj |g |2 Dλ0 (q, τi − τj ) 2 qλ 2V 0 k1 σ1 k2 σ2 qλ ˆ β ×c†k1 +q,σ1 ,I (τj )c†k2 −q,σ2 ,I (τi )ck2 σ2 ,I (τi )ck1 σ1 ,I (τj ) · · · =: . . . dτi PI (τi ) . . . (4.423) 0 P beschreibt die effektive Wechselwirkung zwischen den Elektronen aufgrund des Austausches von Phononen. Sie ist offenbar nicht instantan, da zwei Zeiten τi , τj auftreten. Wir können dennoch FeynmanDiagramme ganz analog zur Coulomb-Wechselwirkung definieren, indem wir die Coulomb-Wechselwirkung ≡ −V (2) (q) (4.424) 1 ≡ − |gqλ |2 Dλ0 (q, iνn ) V (4.425) q, iνn durch den Phononenaustausch qλ, iνn ersetzen. Der einzige wesentliche Unterschied ist, dass dieser Ausdruck im Gegensatz zu −V (2) von der Frequenz iνn abhängt, da die Wechselwirkung nicht instantan ist. 4.10.1 Einschub: Jellium-Phononen Wir benötigen ein konkretes, einfaches Modell für die Phononen, um weiter rechnen zu können. Wir diskutieren daher zunächst Phononen im Jellium-Modell. In diesem Modell werden die Kerne (oder Ionenrümpfe) durch eine glatte Ladungsdichte ρ+ (r, t) beschrieben, die im Gleichgewicht ρ+ (r, t) = ρ0+ = const ist. Wenn wir die Abschirmung durch die Elektronen zunächst vernachlässigen, ist die Rückstellkraft für Auslenkung von %+ aus dem Gleichgewicht die langreichweitige Coulomb-Kraft. Mit %+ (r, t) = %0+ + δ%+ (r, t) wird ∇·E= 1 δ%+ , ε0 (4.426) (4.427) da %0+ von der elektronischen Ladungsdichte kompensiert wird. Die Kraftdichte ist f = %+ E ∼ = %0+ E in führender Ordnung in δ%+ . Es folgt %0+ ∇·f ∼ δ%+ . (4.428) = ε0 143 Ladungserhaltung wird durch die Kontinuitätsgleichung ∂ %+ + ∇ · %+ v = 0 |{z} ∂t (4.429) j+ ausgedrückt. In führender Ordnung lautet diese ∂ δ%+ + %0+ ∇ · v ∂t ∂2 ⇒ δ%+ ∂t2 ∼ = 0 ∼ = ∂ v ∂t f −%0+ ∇ · %m −%0+ ∇ · Newton = (4.430) (4.431) (4.432) mit der Massendichte %m der Ionenrümpfe. Es folgt ∂2 δ%+ ∂t2 ¯ ¯ Ze = Ionenladung Ze ¯ ∇·f − ¯ M = Ionenmasse M Ze %0+ − δ%+ . M ε0 ∼ = ∼ = (4.433) (4.434) Die Lösung dieser Gleichung lautet δ%+ (r, t) ⇒ Ω2 ⇒ Ω = δ%+ (r)e−iΩt Ze %0+ ∼ = M ε s 0 s 0 Ze% Z 2 e2 n0+ + ∼ = = ε0 M ε0 M (4.435) (4.436) (4.437) mit der Ionenkonzentration n0+ . Wir finden eine konstante Frequenz, also eine optische Mode mit flacher Dispersion. Mit Methoden aus Abschnitt 3.4 erhalten wir auch die Elektron-Phonon-Kopplung ¯ µ ¶2 ¯ 0 1 1 Ze2 N 2 ¯n + = N |gq | = (4.438) ¯ V V ε0 q 2M Ω V 1 e2 Ω = V (2) (q) Ω. (4.439) = 2 ε0 q 2 2 | {z } Coulomb-WW e2 1 ε0 q 2 Damit ist die effektive Elektron-Elektron-Wechselwirkung aufgrund des Phononenaustausches 1 Ω2 |gq |2 D0 (q, iνn ) = V (2) (q) . V (iνn )2 − Ω2 (4.440) Sie ist also im Jellium-Modell proportional zur Coulomb-Wechselwirkung V (2) . Wir könnten nun die elektronische Selbstenergie aufgrund der Elektron-Phonon-Wechselwirkung hinschreiben Σσ = (4.441) g0λ = 0, siehe Abschnitt 3.4 Es ist aber im Allgemeinen nicht sinnvoll, die Coulomb-Wechselwirkung wegzulassen, wenn die ElektronPhonon-Wechselwirkung mitgenommen wird. Wir betrachten daher im Folgenden die Kombination beider Wechselwirkungen. 144 4.10.2 Coulomb- und Elektron-Phonon-Wechselwirkung Wir hatten gesehen, dass im Jellium-Modell die Elektron-Elektron-Wechselwirkung aufgrund der Phononen Ω2 = −V (2) (q) (4.442) (iνn )2 − Ω2 ist. Wir addieren noch die Coulomb-Wechselwirkung hinzu und erhalten := 0 (q, iνn ) −Veff := + 1 −V (2) (q) − |gq |2 D0 (q, iνn ). V (4.443) (4.444) Also ist die gesamte effektive Wechselwirkung 0 Veff (q, iνn ) = = V (2) (q) + V (2) (q) V (2) (q) Ω2 (iνn )2 − Ω2 (iνn )2 . (iνn )2 − Ω2 (4.445) (4.446) Die retardierte effektive Wechselwirkung ist dann (mit iνn → ω + iη wird (iνn )2 → ω 2 + 2iωη, was wir für infinitesimales η als ω 2 + iη 0 sgnω mit infinitesimalem η 0 schreiben können, schließlich benennen wir noch η 0 in η um) ω2 0 Veff (q, ω) = V (2) (q) 2 . (4.447) 2 ω − Ω + iη sgnω Wir finden, dass die effektive Wechselwirkung zwischen Elektronen für Frequenzen ω < Ω anziehend ist. Die Kopplung an die Phononen reicht also aus, um die starke Coulomb-Abstoßung zu überwinden. 4.10.3 Abschirmung der effektiven Wechselwirkung Die effektive Wechselwirkung polarisiert das Elektronengas analog zur oben betrachteten reinen CoulombWechselwirkung. Das führt zu ihrer Abschirmung. Bleibt die anziehende Wechselwirkung für kleine ω trotzdem erhalten? Wir untersuchen dies im Rahmen der RPA. Die RPA besteht einfach aus der Näherung, die exakte Wechselwirkung durch RPA −Veff (q, iνn ) ≡ (4.448) := (4.449) = + 145 (4.450) zu ersetzen. Diese Dyson-Gleichung hat die Lösung = , (4.451) 1− oder als mathematische Gleichung RPA (q, iνn ) = Veff 1− 0 (q, iνn ) Veff . 0 Veff (q, iνn )χ0 (q, iνn ) Wir kennen bereits 0 Veff (q, iνn ) = V (2) (q) (iνn )2 . (iνn )2 − Ω2 (4.452) (4.453) Daher ist RPA Veff (q, iνn ) = = (iνn )2 (iνn )2 − Ω2 V (2) (q) (iνn )2 1 − V (2) (q) χ0 (q, iνn ) (iνn )2 − Ω2 (iνn )2 V (2) (q) 2 2 (iνn ) − Ω − (iνn )2 V (2) (q)χ0 (q, iνn ) V (2) (q) (iνn )2 − (iνn )2 V (2) (q)χ0 (q, iνn ) 1 − V (2) (q)χ0 (q, iνn ) (iνn )2 − Ω2 − (iνn )2 V (2) (q)χ0 (q, iνn ) (iνn )2 RPA (q, iνn ) = VCoulomb Ω2 (iνn )2 − (2) 1 − V (q)χ0 (q, iνn ) (iνn )2 RPA =: VCoulomb (q, iνn ) 2 (iνn ) − ωq2 (iνn ) = s. Abschnitt 4.8→ (4.454) (4.455) (4.456) (4.457) (4.458) mit der renormierten Phononenfrequenz Ω Ω ωq2 (iνn ) = p ≡p . (2) ΣRPA (q, iνn ) 1 − V (q)χ0 (q, iνn ) (4.459) Im statischen Grenzfall und für kleine q hatten wir χ0 → −2d(EF ) gefunden. Daher folgt in diesem Limes Damit wird e2 1 k2 1 − V (2) (q)χ0 ∼ 2d(EF ) ≡ 2s . = 2 ε0 q q (4.460) Ω ωq ∼ q. = ks (4.461) Durch die elektronische Abschirmung erhalten wir eine akustische Dispersion der Jellium-Phononen. Das ist natürlich ein beruhigendes Ergebnis. Es zeigt, dass die Dispersion vom Jellium-Modell qualitativ korrekt beschrieben wird, wenn man die elektronische Abschirmung berücksichtigt. RPA folgende Allgemein, also nicht beschränkt auf den statischen Fall und kleine q, findet man für Re Veff Form: 146 Der Pol bei Ω wird verbreitert und nach Re ωq verschoben. Die Verbreiterung beruht darauf, dass ωq i.A. komplex ist. Wir erhalten also eine attraktive Wechselwirkung für Frequenzen ω < Re ωq ∼ |q|. Für ω À Re ωq können die Phononen der Elektronenbewegung nicht folgen und es bleibt nur die RPACoulomb-Wechselwirkung. Bei noch höheren Frequenzen können auch die Elektronen nicht mehr folgen und wir erhalten die unabgeschirmte Coulomb-Wechselwirkung V (2) zurück. Wir sehen, dass die anziehende Wechselwirkung nur auftritt, wenn q 6= 0 und ω 6= 0 ist. Es handelt sich also um einen dynamischen Effekt. Die Elektronen sind von einer Raumladungswolke umgeben, die auf der Polarisation des Elektronengases und der Ionenladung %+ beruht. Wenn sich das Elektron bewegt, kann insbesondere die Ionenladung nicht instantan folgen und bleibt daher etwas zurück. Diese zurückgelassene positive Raumladung wirkt anziehend auf ein zweites Elektron: Es ergibt sich die wichtige Frage, ob die anziehende Wechselwirkung zu gebundenen Zuständen von RPA Elektronen führen kann. Das ist nicht klar, da im statischen Grenzfall Veff (q, 0) = 0 gilt. Oder kollabiert gar das gesamte Elektronengas? Das Pauli-Prinzip sollte das i.A. verhindern. Gibt es dann einen neuen Grundzustand, der nicht von der Fermi-Flüssigkeits-Theorie beschrieben wird? 4.11 Supraleitung Wir haben im vorigen Abschnitt eine anziehende effektive Wechselwirkung zwischen Elektronen in einem Metall gefunden. Wäre diese Anziehung statisch, so könnten wir die Bildung von Elektronentröpfchen bei tiefen Temperaturen erwarten. Sie tritt aber nur bei Frequenzen ω > 0 auf, so dass stabile gebundene Zustände nicht auftreten können. Wir werden zunächst zeigen, dass und wie der metallische Fermi-Flüssigkeits-Grundzustand (FermiSee) zerstört wird und danach untersuchen, was an seine Stelle tritt. 4.11.1 Cooper-Instabilität In diesem Abschnitt werden wir mit Hilfe von Feynman-Diagrammen argumentieren. Die effektive Elektron-Elektron-Wechselwirkung hat die Form RPA (q, iνn ) −Veff ≡ q, iνn RPA = −VCoulomb (q, iνn ) (iνn )2 , (iνn )2 − ωq2 (iνn ) (4.462) 147 wie wir in Abschnitt 4.10 gesehen haben. Zwei Elektronen können aufgrund dieser Wechselwirkung aneinander streuen: k0 , iωn0 k0 + q, iωn0 + iνn k, iωn k − q, iωn − iνn Sie können auch mehrfach streuen: Eine Instabilität tritt bereits auf, wenn wir nur die Leiterdiagramme, nicht alle Diagramme, aufsummieren und nur die Streuung zweier Elektronen mit entgegengesetzem Impuls und Spin betrachten. Wir definieren den Streuvertex Λ durch (4.463) Hierfür finden wir die Dyson-Gleichung (4.464) Dies bedeutet Λ(k, iωn ; p, iΩn ) RPA (k − p, iωn − iΩn ) + = Veff ¤ 1 X 1 X£ RPA (k − q, iωn − iνn ) −Veff β iν V q n ×G↑0 (q, iνn ) G↓0 (−q, −iνn ) Λ(k, iνn ; p, iΩn ). (4.465) RPA Um weiter rechnen zu können, betrachten wir eine vereinfachte Form von Veff , die die wesentliche RPA Physik enthält. Wir haben gesehen, dass Veff für ω < ωq anziehend ist (wir vernachlässigen auch den Imaginärteil von ωq ). Die einfachste Wechselwirkung mit dieser Eigenschaft ist ( −V < 0 für |ω| < ωq RPA Veff (q, ω) ≈ (4.466) 0 sonst. Die typische Energieskala für die Phononendispersion ωq ist die Debye-Frequenz ωD . Also vereinfachen wir weiter zu ( −V für |ω| < ωD RPA Veff (q, ω) ≈ (4.467) 0 sonst. Für beliebige komplexe Frequenzen q0 setzten wir entsprechend ( −V für |q0 | < ωD RPA Veff (q, q0 ) ≈ 0 sonst. 148 (4.468) RPA Da unsere Näherung für Veff nun nicht mehr von den Impulsen abhängt, machen wir für den Streuvertex Λ einen analogen Ansatz: Λ ≈ Λ(iωn − iΩn ). Die Dyson-Gleichung (4.465) wird dann Λ(iωn − iΩn ) ≈ RPA −Veff (iωn − iΩn ) + ¤ 1 X 1 X£ RPA −Veff (iωn − iνn ) β iν V q n ×G↑0 (q, iνn ) G↓0 (−q, −iνn ) Λ(iνn − iΩn ). (4.469) RPA Während Veff eine Sprungfunktion der Frequenz ist, hängt die Lösung Λ(q0 ) wegen des zweiten Terms in komplizierterer Weise von der Frequenz ab. Λ(q0 ) ist aber jedenfalls eine fallende Funktion von |q0 |. Um eine Abschätzung für Λ zu erhalten, folgen wir der historischen Herleitung (Cooper 1956) und ersetzen ( −V Λ für |iνn − iΩn | < ωD Λ(iωn − iΩn ) ≈ (4.470) 0 sonst und RPA Veff (iωn − iνn ) Λ(iνn − iΩn ) ≈ ( Λ 0 für |iωn − iΩn | < ωD sonst. (4.471) Dann wird Λ ≈ V + 1 X 1X V G↑0 (q, iνn ) G↓0 (−q, −iνn ) Λ β V q (4.472) iνn |iνn |<ωD ⇒ Λ ≈ V . 1 X 1X 0 1−V G↑ (q, iνn ) G↓0 (−q, −iνn ) β V q (4.473) iνn |iνn |<ωD Wir erkennen, dass der Nenner zu Null wird, wenn V 1 X 1X 0 G (q, iνn ) G↓0 (−q, −iνn ) = 1 β V q ↑ (4.474) iνn |iνn |<ωD gilt. In diesem Fall divergiert der Streuvertex Λ offenbar, die Streuung zweiter Elektronen wird unendlich RPA stark. Dies zeigt an, dass die Störungsentwicklung in Veff oder V zusammenbricht. Das heißt, der wahre Gleichgewichtszustand kann aus dem ungestörten Gleichgewichtszustand für V = 0, dem wechselwirkungsfreien Fermi-Gas, nicht mehr durch Störungsrechnung erhalten werden. Also ist der wahre Gleichgewichtszustand nun keine Fermi-Flüssigkeit mehr, denn diese geht gemäß der Landau-Theorie durch eine kleine Störung aus dem wechselwirkungsfreien Fermi-Gas hervor. Diese Instabilität der Landau-Fermi-Flüssigkeit nennt man die Cooper-Instabilität. Der Ausdruck in Gl. (4.474) hängt von der Temperatur ab. Wann tritt die Cooper-Instabilität also auf? Die linke Seite von Gl. (4.474) ist X 1X X ˆ ∞ 1 1 1 V kB T = V kB T dξ d(ξ + µ) 2 (4.475) V q iνn − ξq −iνn − ξq νn − ξ 2 −∞ iνn iνn |iνn |<ωD |iνn |<ωD 149 mit der Zustandsdichte pro Spin-Richtung d(E). Unter der Annahme, dass diese in der Nähe der FermiEnergie näherungsweise konstant ist, ergibt sich ˆ ∞ X 1 . . . ≈ V kB T d(EF ) dξ 2 (4.476) νn − ξ 2 −∞ | {z } iνn =π/|νn | |iνn |<ωD βωD /2π = V kB T d(EF ) 2π X n=0 1 (2n + 1)π β (4.477) βωD /2π = ∼ = X 1 n + 1/2 n=0 µ µ ¶¶ βωD © © V© kB T d(EF ) β¢ C + ln 4 2π V kB T d(EF ) β (4.478) (4.479) für βωD À 1, also kB T ¿ ωD , was für relevante Temperaturen im Allgemeinen gilt. (C ≈ 0,577216 ist die Euler-Konstante.) Wir finden eine Temperaturabhängigkeit der Form − ln(kB T /ωD ), also nimmt dieser Ausdruck mit wachsender Temperatur ab. Senken wir die Temperatur von hohen Werten (aber noch kB T ¿ ωD ) kommend, so wächst der Ausdruck in Gl. (4.474) an und wird schließlich eins. Die entsprechende Temperatur nennt man kritische Temperatur Tc . Bei T → Tc+ divergiert Λ also. Für βc ≡ 1/kB Tc erhalten wir ln 2eC βc ωD π ⇒ kB Tc 1 V d(EF ) µ ¶ 2eC 1 ωD exp − . π V d(EF ) |{z} ≈ ≈ (4.480) (4.481) Zahl ∼ eins Wir diskutieren dieses Ergebnis noch etwas. Die hier auftretende Debye-Energie ωD entspricht typischerweise einer Temperatur ωD /kB von einigen hundert Kelvin. Der Exponentialfaktor ist aber von der Größenordnung ∼ 1/100, so dass Tc typischerweise einige Kelvin beträgt. Es ist zu beachten, dass kB Tc keine holomorphe Funktion von V bei V = 0 ist. Daher kann kB Tc , d.h. die typische Energieskala der Cooper-Instabilität, nicht in Störungstheorie endlicher Ordnung in V erhalten werden. Wir finden Tc > 0 für beliebig schwache anziehende Wechselwirkung V . Diese Folgerung muss mit Vorsicht betrachtet werden, da das Ergebnis, wie wir sehen werden, aus einer Mean-Field-Theorie stammt. Außerdem können andere Instabilitäten (z.B. Stoner-Ferromagnetismus) der Cooper-Instabilität zuvorkommen. 4.11.2 Der BCS-Grundzustand Wir hatten gesehen, dass die Streuung zwischen Elektronen in Zuständen |k, ↑i und | − k, ↓i für T → Tc+ divergiert. Hier wird der Fermi-See durch einen neuen Grundzustand ersetzt, für den Bardeen, Cooper und Schrieffer (BCS) einen Ansatz formuliert haben. Dieser geht davon aus, dass Elektronen in |k, ↑i, | − k, ↓i (Cooper-) Paare bilden und dass der Grundzustand aus solchen Paaren zusammengesetzt ist. Der Ansatz lautet daher Y |ψBCS i = (uk + vk c†k↑ c†−k↓ )|0i. (4.482) ↑ Vakuum k In diesem Zustand sind die Besetzungszahlen für die Einteilchenzustände |k ↑i und | − k ↓i offenbar maximal korreliert: Es sind entweder beide oder keiner von beiden besetzt. |ψBCS i ist offenbar eine Superposition von Zuständen mit unterschiedlich vielen Paaren. Die uk , vk sind noch unbekannte komplexe Koeffizienten. Diese können durch Minimierung der Energie hHiBCS = hψBCS |H|ψBCS i 150 (4.483) unter der Nebenbedingung hψBCS |ψBCS i = 1 bestimmt werden. |ψBCS i ist also ein Variationsansatz. Dies ist z.B. in Schrieffers Buch (siehe Bibliographie) dargestellt. Wir folgen hier jedoch einem anderen Weg, der dieselben Ergebnisse liefert und auch den BCS-Ansatz rechtfertigt. 4.11.3 BCS-Theorie Der BCS-Grundzustand |ψBCS i hat eine merkwürdige Eigenschaft: Er ist eine Superposition von Zuständen mit unterschiedlicher Elektronenzahl. Daher können Ausdrücke mit ungleicher Anzahl von Erzeugern und Vernichtern einen endlichen Erwartungswert haben. Insbesondere ist im Allgemeinen hc†k↑ c†−k↓ i 6= 0. Die BCS-Theorie beruht nun auf einer Mean-Field-Entkopplung (siehe Abschnitt 4.2) im Hamiltonian X X HBCS = ξk c†kσ ckσ + Vkk0 c†k↑ c†−k↓ c−k0 ↓ c†k0 ↑ . (4.484) kk0 kσ Hier ist Vkk0 die anziehende Wechselwirkung aufgrund der Elektron-Elektron- und Elektron-PhononWechselwirkung. Wir definieren X Vkk0 hc−k0 ↓ ck0 ↑ i. (4.485) ∆k := − k0 Diese Größe hat die Dimension einer Energie. Wir werden später sehen, welche physikalische Bedeutung ∆k hat. Damit entkoppeln wir nun HBCS und erhalten den Mean-Field-Hamiltonian X X X X MF = ξk c†kσ ckσ − (4.486) HBCS ∆k c†k↑ c†−k↓ − Vkk0 hc†k↑ c†−k↓ ihc−k0 ↓ ck0 ↑ i . ∆∗k c−k↓ ck↑ − kσ k k | kk0 {z } irrelevante Konstante MF HBCS ist bilinear in c, c† , enthält aber, anders als in Abschnitt 4.2, Terme der Form cc und c† c† . Daher MF kommutiert HBCS nicht mit der Teilchenzahl, diese ist also nicht erhalten. Daher erwarten wir, dass die Eigenzustände Superpositionen von Zuständen unterschiedlicher Teilchenzahl sind. (Der BCS-Ansatz für den Grundzustand hatte bereits diese Eigenschaft.) Das ist etwas merkwürdig, weil Superpositionen von Zuständen unterschiedlicher Teilchenzahl nie beobachtet werden. Man kann die Zustände aber auf feste Teilchenzahl einschränken, auf Kosten komplizierterer Notation. Wir tun dies hier nicht. Da Zustände unterschiedlicher Teilchenzahl mischen, führen wir neue Operatoren ein, die Linearkombinationen von Elektronenerzeugern und -vernichtern sind: µ ¶ µ ∗ ¶µ ¶ γk↑ ck↑ uk vk = . (4.487) † −vk∗ uk γ−k↓ c†−k↓ Dies nennt man Bogoliubov- (oder Bogoliubov-Valatin-) Transformation. Die Rücktransformation lautet µ ¶ µ ¶µ ¶ ck↑ γk↑ uk −vk = . (4.488) † vk∗ u∗k c†−k↓ γ−k↓ Man kann leicht zeigen, dass γ, γ † die fermionischen Antivertauschungsrelationen erfüllen, wenn man MF |uk |2 + |vk |2 = 1 fordert. Die neuen γ-Quasiteilchen sind also Fermionen. Einsetzen in HBCS ergibt Xn † † MF ξk (u∗k γk↑ − vk∗ γ−k↓ )(uk γk↑ − vk γ−k↓ ) HBCS = k † † ∗ + ξk (v−k γ−k↑ + u∗−k γk↓ )(v−k γ−k↑ + u−k γk↓ ) † † − ∆k (u∗k γk↑ − vk∗ γ−k↓ )(vk∗ γk↑ + −u∗k γ−k↓ ) o † † − ∆k (vk γk↑ + uk γ−k↓ )(uk γk↑ − vk γ−k↓ ) + const. Man zeigt, dass dieser Hamiltonian diagonal wird unter der Bedingung µ ¶ µ ¶ 1 ξk 1 ξk |uk |2 = 1+ ∧ |vk |2 = 1− ∧ ∆k u∗k vk∗ + ∆∗k uk vk < 0 | {z } 2 Ek 2 Ek ∈R 151 (4.489) (4.490) mit Ek := p ξk2 + |∆k |2 , denn dann ist MF HBCS = X † † Ek (γk↑ γk↑ + γk↓ γk↓ ) + const. (4.491) k Die Betrachtung der rechts skizzierten Dispersion der Quasiteilchen zeigt, dass die fermionischen Anregungen eines Supraleiters eine Energielücke der Größe |∆k | haben, wobei k auf der Fermi-Fläche des nicht wechselwirkenden Systems liegt (ξk = 0). Für parabolische Dispersion ist die Lücke |∆kF |. Aus der Dispersionsrelation Ek der Quasiteilchen erhalten wir unmittelbar die Zustandsdichte dsupra (ω) = = 1 X δ(ω − Ek ) N kσ µ ¶ ˆ q d3 k X 2 + |∆ |2 . vEZ δ ω − ξ k k (2π)3 σ |{z} (4.492) (4.493) =2 Ist die Zustandsdichte dnormal im normalleitenden Zustand näherungsweise konstant und ist ∆k unabhängig von k, so enthält man mit etwas Rechnung dsupra (ω) ω θ(ω − |∆|). =p 2 dnormal (0) ω − |∆|2 (4.494) Eine Bestimmungsgleichung für ∆k erhalten wir aus der Definition von ∆k durch Einsetzen der 152 Bogoliubov-Transformation: ∆k = − X Vkk0 hc−k0 ↓ ck0 ↑ i (4.495) † Vkk0 h(vk0 γk† 0 ↑ + uk0 γ−k0 ↓ )(uk0 γk0 ↑ − vk0 γ−k 0 ↓ )i (4.496) k0 = − X k0 = − X n † Vkk0 vk0 uk0 hγk† 0 ↑ γk0 ↑ i − vk2 0 hγk† 0 ↑ γ−k 0↓i k0 o † +u2k0 hγ−k0 ↓ γk0 ↑ i − uk0 vk0 hγ−k0 ↓ γ−k 0↓i X − Vkk0 uk0 vk0 [2nF (Ek0 ) − 1]. = (4.497) (4.498) k0 MF bilinear in γ † , γ ist und daher wechselwirkungsfreie Fermionen beDie letzte Gleichung gilt, da HBCS schreibt. Wir nehmen jetzt o.B.d.A. ∆k ≥ 0 reell an. Ein beliebiger Phasenfaktor eiϕ kann nachträglich wieder eingeführt werden, denn mit ∆k ist auch ∆k eiϕ eine Lösung. Dann gilt wegen ∆k uk vk < 0: q X ∆k 0 ∆k = − Vkk0 [2nF (Ek0 ) − 1] mit Ek0 = ξk2 0 + ∆2k0 . (4.499) 2Ek0 0 k Dies ist die MF-Gleichung, oder BCS-Gap-Gleichung, zur Bestimmung der Energielücke (des „Gaps“) ∆k . Wir verwenden nun das vereinfachte BCS-Modell für die Wechselwirkung: Wir hatten gesehen, dass sie nur für Energieüberträge kleiner als ωD anziehend ist, daher ist sie nur für Elektronen in einer Umgebung der Breite ∼ ωD um die Fermi-Energie effektiv. Wir schreiben daher näherungsweise ( −V für |ξk | < ωD ∧ |ξk0 | < ωD Vkk0 = (4.500) 0 sonst. RPA (Man kann die Theorie auch für die volle Wechselwirkung Veff durchführen, nur enthält man dann keine einfachen Ergebnisse.) Dann können wir schreiben X hc−k0 ↓ ck0 ↑ i. (4.501) ∆k = V k0 |ξk0 |≤ωD Mit der speziellen BCS-Wechselwirkung wird ∆ offenbar unabhängig von k. Damit erhalten wir X ∆ ∆=V [1 − 2nF (Ek0 )]. (4.502) 2Ek0 0 k |ξk0 |≤ωD Hier können wir ∆ 6= 0 herauskürzen und zu einem Integral über die Energie übergehen. Unter der Annahme konstanter Zustandsdichte d(EF + ξ) für −ωD ≤ ξ ≤ ωD ergibt sich βp 2 ˆ ωD tanh ξ + ∆2 p2 . (4.503) 1 = V d(EF ) dξ 2 ξ 2 + ∆2 −ωD Wir haben hier die Identität 1 − 2nF (E) = tanh(βE/2) verwendet. Diese BCS-Gap-Gleichung kann man numerisch lösen. Der typische Verlauf von ∆ als Funktion von T ist hier gezeigt: 153 Für T → 0 (β → ∞) ist eine analytische Lösung möglich: Es ergibt sich die Gleichung ˆ V d(EF ) ωD dξ ωD p 1= = V d(EF ) Arsinh . 2 + ∆2 2 ∆ ξ −ωD Im Grenzfall schwacher Kopplung, d.h. V d(EF ) ¿ 1, erhält man ¶ µ 1 ∼ ∆(T = 0) = 2ωD exp − . V d(EF ) (4.504) (4.505) Für T → Tc− erhalten wir ebenfalls eine analytische Lösung: Wegen T < Tc ist ∆ > 0 und wir können ∆ aus der BCS-Gleichung (4.502) herauskürzen. Gleichung (4.503) gilt also. Für T → Tc− wird aber ∆ klein und wir können ∆ in den Wurzeln vernachlässigen. Dies führt zu βc |ξ| 2 V d(EF ) dξ 2|ξ| −ωD βc ξ ˆ ωD tanh 2 . V d(EF ) dξ ξ 0 ˆ 1 = = ωD tanh mit βc := Das Integral kann analytisch ausgewertet werden und wir erhalten µ ¶ 2eC 1 kB Tc = ωD exp − π V d(EF ) 1 kb Tc (4.506) (4.507) (4.508) mit der Euler-Konstanten C ≈ 0,577216, wie wir schon im vorigen Abschnitt gefunden hatten. Die Energielücke bei Temperatur T = 0, ∆(T = 0), und die kritische Temperatur kB Tc haben also in der BCS-Theorie eine ähnliche mathematische Form und wir erhalten das universelle Verhältnis 2∆(0) ≈ 3,53 kB Tc (4.509) unabhängig von d(EF ), V und ωD . Dies ist für einfache Supraleiter im Grenzfall schwacher Kopplung gut erfüllt, z.B. für Zinn: 2∆(0)/kB Tc = 3,46. 154 Kapitel 5 Statistische Physik im Nichtgleichgewicht Bisher hatten wir Systeme im Grundzustand (Kapitel 3) und im thermischen Gleichgewicht (Kapitel 4) betrachtet. Im Gleichgewicht ist bekanntlich die Entropie maximal und der Zustand ändert sich nicht in der Zeit. Teilchen bewegen sich mit derselben Wahrscheinlichkeit von A nach B wie von B nach A. Oft interessieren uns Situationen, in denen diese Bedingungen nicht erfüllt sind. Das wohl wichtigste Beispiel ist der elektronische Transport, dem wir uns zunächst zuwenden werden. 5.1 Elektronischer Transport Wenn wir eine Spannung an einen Leiter anlegen, fließt ein Strom. Aus Sicht der Vielteilchentheorie ist das ein kompliziertes Problem, da wir die Elektron-Phonon-, Elektron-Störstellen- und Elektron-ElektronWechselwirkung berücksichtigen müssen. Außerdem ist das System natürlich nicht im Gleichgewicht. Wir hatten gesehen, dass wir das System im Gleichgewicht auch bei Anwesenheit von Wechselwirkungen oft als Fermi-See beschreiben können (Theorie der Fermi-Flüssigkeiten). Außerhalb des Gleichgewichts wissen wir dagegen fast nichts. Wir betrachten daher kleine angelegte Spannungen in der Hoffnung, sie als kleine Störung behandeln zu können. Dann können wir in der Beschreibung vom ungestörten System im Gleichgewicht ausgehen. Die Reaktion eines Systems auf eine kleine Störung ist der Gegenstand der Lineare-Antwort-Theorie (Abschnitt 4.3). Diese hatte uns auf die allgemeine Kubo-Formel (4.80) geführt, die wir jetzt auf den elektronischen Transport anwenden wollen. 5.1.1 Lineare-Antwort-Theorie für die Leitfähigkeit Für kleine elektrische Felder ist die Stromdichte i.A. linear im Feld: ˆ ˆ X 3 0 σαβ (rt, r0 t0 )Eβ (r0 , t0 ) jα (r, t) = d r dt0 (5.1) β mit dem Leitfähigkeitstensor σ(rt, r0 t0 ). Allgemein gilt E = −∇φ − ∂ A, ∂t (5.2) aber wir können eine Eichung wählen, in der φ ≡ 0 gilt, ohne die Ergebnisse zu beeinflussen. Dann gilt im Frequenz-Raum 1 E(r, ω) (5.3) E(r, ω) = iωA(r, ω) ⇒ A(r, ω) = iω und wir können ebensogut die Antwort auf A wie auf E ausrechnen. 155 Der Hamiltonian bei Anwesenheit eines Vektorpotentials lautet µ ¶2 ˆ 1 X 1 d3 r Ψ†σ (r) H = ∇ + eA Ψσ (r) + V ↑ 2m σ i (5.4) Ladung −e = = ˆ e X H(A = 0) + d3 r Ψ†σ (r)(∇ · A + A · ∇)Ψσ (r) 2mi σ ˆ e2 X + d3 r Ψ†σ (r)A2 (r)Ψσ (r) 2m σ ˆ i Xh ¡ ¢ e H(A = 0) + d3 r A(r) · Ψ†σ (r)∇Ψσ (r) − ∇Ψ†σ (r) Ψσ (r) 2mi σ ˆ X e2 + d3 r A2 (r) Ψ†σ (r)Ψσ (r). 2m σ Nun sei A = A0 + Aext , wobei A0 das Vektorpotential im Gleichgewicht ist. Dann folgt ˆ X e H = H(A = A0 ) + d3 r Aext (r) · [Ψ†σ ∇Ψσ − (∇Ψ†σ )Ψσ ] 2mi σ ˆ X e2 + d3 r A0 · Aext Ψ†σ Ψσ + O(A2ext ). m σ (5.5) (5.6) (5.7) In der Theorie der linearen Antwort vernachlässigen wir den Term zweiter Ordnung in Aext . Wir können ablesen, dass der Störoperator, der die Kopplung des Systems an Aext beschreibt, ˆ − d3 r j0 (r, t) · Aext (r, t) mit der Stromdichte j0 (r, t) := ≡ e X † [Ψσ ∇Ψσ − (∇Ψ†σ )Ψσ ] − 2mi σ e X † − [Ψσ ∇Ψσ − (∇Ψ†σ )Ψσ ] + 2mi σ − e2 X † Ψ Ψσ A0 (r) m σ σ e %(r)A0 (r) m (5.8) (5.9) lautet. Die Stromdichte, die wir messen, sieht etwas anders aus. Ohne Vektorpotential ist die Stromdichte e X † j=− [Ψσ ∇Ψσ − (∇Ψ†σ )Ψσ ], (5.10) 2mi σ in Analogie zur Einteilchen-Quantenmechanik. Mit A 6= 0 müssen wir den kinetischen Impuls p + eA = (1/i) ∇ + eA anstelle des kanonischen Impulses p = (1/i) ∇ verwenden. Dies führt zu · µ ¶ µ ¶ ¸ e X † 1 1 j = − Ψσ ∇ + eA Ψσ + ∇ + eA Ψ†σ Ψσ (5.11) 2m σ i i e X † [Ψσ ∇Ψσ − (∇Ψ†σ )Ψσ ] (paramagnetische Stromdichte) = − 2mi σ − e2 X † Ψ Ψσ A m σ σ = j0 − (diamagnetische Stromdichte) e2 X † e Ψ Ψσ Aext = j0 + %Aext . m σ σ m (5.12) (5.13) Die Bezeichnungen „para-“ bzw. „diamagnetisch“ geben an, dass diese Terme einen positiven bzw. negativen Beitrag zur magnetischen Suszeptibilität liefern. Wir suchen die lineare Antwort in j aufgrund der Störung Aext . Wir behandeln die beiden Terme in (5.13) getrennt: 156 (a) Der zweite Term (e/m) %Aext ist explizit von erster Ordnung in Aext . Daher müssen wir %(r, t) durch die Ladungsdichte %0 (r) im Gleichgewicht ersetzen. Wir erhalten den Beitrag e %0 (r)Aext (r, t) m zur Stromdichte j. (b) Der erste Term j0 ist komplizierter. Wir nehmen an, dass im Gleichgewicht kein Strom fließt, also j0 = 0 für A = A0 im Gleichgewicht. (In einem Supraleiter wird das keine gute Annahme sein.) Wir verwenden die allgemeine Kubo-Formel (4.80) aus Abschnitt 4.3. Die Störung Aext koppelt an −j0 und wir suchen die Antwort in +j0 . Also tritt eine j0 -j0 -Korrelationsfunktion auf: ˆ ˆ t X 3 0 j0α (r, t) = − d r dt0 CjR0α (r)j0β (r0 ) (t − t0 ) Aext,β (r0 , t0 ) (5.14) −∞ mit β CjR0α (r)j0β (r0 ) (t − t0 ) := −iθ(t − t0 ) h[j0α (r, t), j0β (r0 , t0 )]i0 , (5.15) wobei der Mittelwert im Gleichgewicht zu berechnen ist. Im Frequenzraum lautet die Beziehung entsprechend ˆ X j0α (r, ω) = − d3 r0 CjR0α (r)j0β (r0 ) (ω)Aext,β (r0 , ω). (5.16) β Mit Gl. (5.13) und Aext (r, ω) = (1/iω) Eext (r, ω) folgt ˆ X 1 e 1 CjR0α (r)j0β (r0 ) (ω) Eext,β (r0 , ω) + %0 (r) Eext,β (r, ω) jα (r, ω) = − d3 r0 iω m iω β ˆ X ! σαβ (r, r0 , ω) Eext,β (r, ω). = d3 r0 (5.17) (5.18) β Wir können nun die Leitfähigkeit ablesen: σαβ (r, r0 , ω) = − 1 R eρ0 (r) C δ(r − r0 )δαβ . 0 (ω) + iω j0α (r)j0β (r ) iωm (5.19) Das ist die Kubo-Formel für die Leitfähigkeit. 5.1.2 Anwendung: Störstellenstreuung Wir hatten in Abschnitt 4.6 gesehen, dass Störstellenstreuung in der ersten Bornschen Näherung zu einer endlichen Lebensdauer der Einteilchenzustände führt, die sich als Imaginärteil der Selbstenergie äußert: ḠR B1 (k, ω) = ḠA B1 (k, ω) = 1 ω − ξk + i/2τ 1 , ω − ξk − i/2τ (5.20) (5.21) wobei wir hier eine k-unabhängige Streurate 1/τ angenommen haben. Wir schreiben die Stromdichte als j0 = v%. Da nur Elektronen in der Nähe der Fermi-Energie nennenswert zum Transport beitragen, ist in guter Näherung |v| = vF := ∂εk /∂k|k=kF . Für ein isotropes Medium (nach Ausführung des Unordnungsmittels!) ist die Korrelationsfunktion CjR0α (r)j0β (r0 ) sicherlich diagonal in α, β und sogar proportional zu δαβ . Mit anderen Worten, die tensorwertige Korrelationsfunktion CjR0α (r)j0β (r0 ) ist proportional zur Einheitsmatrix: CjR0α (r)j0β (r0 ) (t − t0 ) = −iθ(t − t0 )δαβ h[j0x (r, t), j0x (r0 , t0 )]i0 1X h[j0γ (r, t), j0γ (r0 , t0 )]i0 . = −iθ(t − t0 )δαβ 3 γ 157 (5.22) (5.23) Mit der obigen Näherung wird dies CjR0α (r)j0β (r0 ) (t − t0 ) = −iθ(t − t0 )δαβ vF2 h[%(r, t), %(r0 , t0 )]i0 3 (5.24) vF2 χR (rt, r0 t0 ) (5.25) 3 mit der retardierten Dichte-Dichte-Korrelationsfunktion bzw. elektrischen Suszeptibilität aus Abschnitt 4.3. Diese kennen wir schon für das wechselwirkungsfreie Elektronengas ohne Störstellen. In diesem Fall ist χR = χR 0 gemäß Abschnitt 4.8 durch ein Schleifendiagramm gegeben: = χR 0 (q, ν) δαβ −Π0 R(q, ν) = − = (5.26) da % hier die Ladungsdichte ist ↓ 2 Xˆ 3 2e β = iωn ˆ 2e2 = ¯ ¯ d k 1 1 ¯ 3 (2π) iωn + iνn − ξk+q iωn − ξk ¯iνn →ν+iη d3 k nF (ξk ) − nF (ξk+q ) . (2π)3 ν + ξk − ξk+q + iη Wir betrachten den statischen (ν → 0), homogenen (q → 0) Grenzfall: ˆ ˆ d3 k ∂nF ∂nF R 2 2 ∼ χ0 (q, ν) = 2e = 2e dξ d(µ + ξ) (2π)3 ∂ξ ∂ξ (5.27) (5.28) (5.29) mit der Zustandsdichte pro Spin-Richtung, d(µ + ξ). Die Ableitung ∂nF /∂ξ ist nur in der Nähe der Fermi-Energie wesentlich von Null verschieden. Ist dort d(µ + ξ) ≈ const, so folgt ˆ ∂nF R 2 ∼ χ0 (q, ν) = 2e d(EF ) dξ = −2e2 d(EF ), (5.30) ∂ξ wie wir schon gesehen hatten. Für ξ = k 2 /2m − µ ist 2d(EF ) = 3nel 3nel = 2EF mvF2 (5.31) 2 ⇒ ∼ 3e nel χR 0 (q, ν) = − mvF2 für q, ν → 0. (5.32) Die Kubo-Formel (5.19) wird dann, nach Fourier-Transformation, 2 e2 nel 1 v¡ 3¢ e2 nel − σαβ ∼ δαβ = 0. (5.33) = + δαβ ¡F 2 iν iνm v¡ ¢3 m ¡ F Für freie Elektronen ohne Unordnungspotential erhalten wir σ = 0. Das ist ein unphysikalisches Ergebnis, das nur anzeigt, dass die Annahme linearer Antwort hier zusammenbricht: Die Elektronen sollten im elektrischen Feld beliebig beschleunigt werden, der Strom wächst unbegrenzt auch für eine kleine Störung. Das Ergebnis ist dennoch nützlich: Bei der Rechnung in Anwesenheit von Unodnungsstreuung können wir den Ausdruck ohne Unordnungsstreuung gleich abziehen, da er vom zweiten Term in der Kubo-Formel R ohnehin weggehoben wird. Also berechnen wir χR (q, ν) − χR 0 (q, ν) anstelle von χ . R Die einfachste Näherung besteht nun darin, in χ die Green-Funktion (5.20) mit endlicher Streuzeit τ einzusetzen. Die retardierte und avancierte Green-Funktion implizieren die Matsubara-Green-Funktion Ḡ1B (k, iωn ) = 1 . iωn − ξk + (i/2τ ) sgn(ωn ) (5.34) Die Vorzeichenfunktion sorgt dafür, dass sich Ḡ R und Ḡ A korrekt durch analytische Fortsetzung ergeben. Wir erhalten ˆ 2e2 X 1 1 d3 k χ(q, iνn ) = (5.35) β iω (2π)3 iωn + iνn − ξk+q + (i/2τ ) sgn(ωn + νn ) iωn − ξk + (i/2τ ) sgn(ωn ) n 158 und im homogenen Grenzfall (q → 0) ˆ 2e2 X d3 k 1 1 χ(0, iνn ) = . 3 β iω (2π) iωn + iνn − ξk + (i/2τ ) sgn(ωn + νn ) iωn − ξk + (i/2τ ) sgn(ωn ) (5.36) n Die Frequenz-Summe lässt sich mit Hilfe der Methoden aus Abschnitt 4.4 berechnen. Der Summand hat keine Pole, aber Schnitte für z = ε ∈ R und z = ε − iνn , ε ∈ R. Es folgt ( à ˆ ˆ d3 k 1 1 2e2 dε nF (ε) χ(0, iνn ) = − 3 2πi (2π) ε + iνn − ξk + (i/2τ ) sgn(νn ) ε − ξk + i/2τ ! à ! ) 1 1 1 1 − + − . (5.37) ε − ξk − i/2τ ε − ξk + i/2τ ε − ξk − i/2τ ε − iνn − ξk − (i/2τ ) sgn(νn ) Dies enthält den Faktor 1 1 − ε − ξk + i/2τ ε − ξk − i/2τ = GR (k, ε) − GA (k, ε) (5.38) = 2iIm GR (k, ε) = −i A(k, ε), (5.39) also die Spektralfunktion. Wir erhalten à ˆ ˆ ∞ d3 k e2 1 © A(k, ε) © χ(0, iνn ) = ¡ − dε nF (ε) © (−i) (2π)3 −∞ ε + iνn − ξk + (i/2τ ) sgn(νn ) π i¤ ! 1 + ε − iνn − ξk − (i/2τ ) sgn(νn ) (5.40) und nach analytischer Fortsetzung µ ¶ ˆ ˆ ∞ e2 d3 k 1 1 χR (0, ν) = dε n (ε)A(k, ε) + (5.41) F π (2π)3 −∞ ε + ν − ξk + i/2τ ε − ν − ξk − i/2τ ˆ ˆ ∞ e2 d3 k 2(ε − ξk ) = dε nF (ε)A(k, ε) (5.42) 2. π (2π)3 −∞ (ε − ξk )2 + (ν + i/2τ ) Im statischen Grenzfall (ν → 0) wird dies à ! ˆ ˆ ∞ i/τ 2e2 d3 k ε − ξk R ∼ 1+ χ (0, ν) = dε nF (ε)A(k, ε) 2 2 ν . (5.43) π (2π)3 −∞ (ε − ξk )2 + (1/2τ ) (ε − ξk )2 + (1/2τ ) Mit A(k, ε) = erhalten wir χR (0, ν) ∼ = = 2τ e2 π 2τ e2 π à ˆ d3 k (2π)3 ˆ = ∞ ¡ ¢ dε nF (ε)A2 (k, ε)(ε − ξk ) 1 + A(k, ε) iν −∞ ˆ à ∞ dξ d(µ + ξ) −∞ (5.44) 2 (ε − ξk )2 + (1/2τ ) ∞ × 1+ ε→ε+ξ ˆ 1/τ dε nF (ε) −∞ ! iν/τ 2 !2 1/τ 2 (ε − ξ)2 + (1/2τ ) (ε − ξ)2 + (1/2τ ) à !2 ˆ ˆ ∞ 1/τ 2τ e2 ∞ dξ d(µ + ξ) dε nF (ε + ξ) ε 2 π ε2 + (1/2τ ) −∞ −∞ ! à iν/τ . × 1+ 2 ε2 + (1/2τ ) 159 (5.45) (ε − ξ) (5.46) (5.47) Für kB T ¿ EF gilt ˆ 2 ˆ ∞ dξ d(µ + ξ)nF (ξ + ε) = ∞ ¡ ¢ dE d(E)nF E − (µ − ε) 2 −∞ (5.48) −∞ 3 = [2m(µ − ε)] 2 3π 2 für µ > ε, sonst Null. (5.49) Es folgt τ e2 (2m)3/2 χ (0, ν) ∼ = π 3π 2 ˆ R à µ dε(µ − ε) ε2 + (1/2τ ) −∞ !2 à 1/τ 3/2 ε 1+ 2 ! iν/τ 2 ε2 + (1/2τ ) . (5.50) Der Term von der Ordnung ν 0 geht für 1/µτ → 0 gegen eine Konstante, die in χR − χR 0 wegfällt. Es bleibt der Term der Ordnung ν 0 . Im Limes 1/µτ → 0 erhalten wir also R χ (0, ν) − χR 0 (0, ν) ∼ = τ e2 (2m)3/2 π 3π 2 ˆ à µ 3/2 dε (µ − ε) εiν −∞ µ ¶ 3π √ τ e2 (2m)3/2 iν − µ π 3π 2 2 1 √ = − 2 iντ e2 (2m)3/2 µ 2π ∼ = mit √ µ≈ √ !3 1/τ ε2 + (1/2τ ) 2 (5.51) (5.52) (5.53) √ EF = kF / 2m und d(EF ) = mkF /2π 2 folgt ... = = 1 iντ e2 4π 2 d(EF ) 2π 2 −2iν τ e2 d(EF ). − (5.54) (5.55) Dies führt auf (vgl. S. 157) σαβ (0, ν) ∼ = = v2 τ 1 δαβ 2 ½ i½ ν F e2 d(EF ) i½ ν 3 ½ 2 v τ δαβ 2e2 F d(EF ). 3 + Hier definiert man die Diffusionskonstante D := vF2 τ 3 (5.56) (5.57) (5.58) und erhält die statische, homogene Leitfähigkeit σ∼ = e2 2d(EF ) D. | {z } (5.59) Zustandsdichte Dies ist eine Schreibweise der Drude-Leitfähigkeit. Dieser Ausdruck, den man in der elementaren Festkörperphysik im Wesentlichen errät, folgt also auch im Rahmen der Vielteilchentheorie. Hier haben wir folgendes getan: • Die elektronische Green-Funktion wurde in Anwesenheit von Störstellenstreuung in der ersten Bornschen Näherung berechnet. • Die Leitfähigkeit wurde dann in der Lineare-Antwort-Theorie mittels der Kubo-Formel berechnet. Es ist nicht zu leugnen, dass die Herleitung der einfachen Drude-Formel ziemlich kompliziert war. Die Vielteilchentheorie erlaubt aber, darüber hinausgehende Resultate für den Einfluss von Störstellen auf den elektronischen Transport zu erhalten, z.B. zu Fluktuationen des Leitwerts im Magnetfeld. Für den Rest der Vorlesung werden wir die Bewegung von Teilchen unter dem Einfluss von Unordnung aus einem scheinbar ganz anderen Blickwinkel betrachten. 160 5.2 Brownsche Bewegung und Diffusion Ein leichtes, aber unter dem Mikroskop sichtbares Teilchen führt in einer Flüssigkeit zufällige Bewegungen aus, wie R. Brown 1827 an Pollen auf einer Wasseroberfläche beobachtete. Erst später wurde klar, dass diese Brownsche Bewegung auf Stößen mit selbst nicht sichtbaren Molekülen in der Flüssigkeit beruht. Ein konzeptionell ähnliches Bild der Bewegung von Elektronen in ungeordneten Leitern geht auf Drude zurück, die Stöße erfolgen hier mit Störstellen oder Gitterschwingungen, wie wir in Kap. 4 gesehen haben. Wenn viele Brownsche Teilchen vorliegen, können wir über kleine Volumina ∆V, die dennoch viele Teilchen enthalten, mitteln und eine ortsabhängige Konzentration n(r, t) einführen. Während die Brownsche Bewegung eines einzelnen Teilchens praktisch nicht voraussagbar ist, können wir über die gemittelte Größe n(r, t) Aussagen machen. Wir wissen aus der Erfahrung, dass Inhomogenitäten in n(r, t) zu einem Strom führen, der diese auszugleichen sucht. Die Stromdichte j wird also vom Gradienten von n abhängen, diesem entgegenwirken („bergab“) und für verschwindenden Gradienten ebenfalls verschwinden. Der einfachste Ansatz mit diesen Eigenschaften ist j = −D∇n, (5.60) dieser wird auch experimentell bestätigt. Da die Teilchenzahl erhalten ist, gilt eine Kontinuitätsgleichung ∂n = −∇ · j. ∂t (5.61) ∂n = D∇2 n. ∂t (5.62) Aus den letzten beiden Gleichungen folgt Das ist die Diffusionsgleichung mit der Diffusionskonstante D. Die Diffusionsgleichung ist formal sehr ähnlich der Schrödinger-Gleichung für ein freies Teilchen, i ∂ψ 1 =− ∇2 ψ ∂t 2m ⇔ ∂ψ i = ∇2 ψ. ∂t 2m (5.63) Der einzige Unterschied ist, dass wir D durch eine imaginäre Größe ersetzen müssen. Daher lassen sich Lösungsmethoden für die Schrödinger-Gleichung auf die Diffusionsgleichung übertragen. Z.B. können wir eine Green-Funktion P definieren: µ ¶ ∂ 2 − D∇ P (rt, r0 t0 ) = 0 für t > t0 (5.64) ∂t mit der Anfangsbedingung P (rt, r0 t0 ) = δ(r − r0 ). P (rt, r0 t0 ) ist hier die bedingte Wahrscheinlichkeit, ein Teilchen zur Zeit t > t0 bei r zu finden, wenn es zur Zeit t0 bei r0 war. P (rt, r0 t0 ) hängt von den Randbedingungen (etwa dem Vorliegen von Wänden) ab. Ist P (rt, r0 t0 ) bestimmt, so lautet die Lösung der Diffusionsgleichung für die Anfangsbedingung n(r0 , t0 ) = n0 (r0 ) ˆ n(r, t) = d3 r0 P (rt, r0 t0 )n0 (r0 ) für t ≥ t0 . (5.65) Der Beweis ist sehr einfach. 161 Beispielsweise lautet die Green-Funktion für Diffusion in einer Dimension ohne Wände µ ¶ 1 (x − x0 )2 P (xt, x0 t0 ) = p exp − . 4D(t − t0 ) 4πD(t − t0 ) (5.66) Für festes t − t0 > 0 beschreibt P eine Normalverteilung mit der Varianz σ 2 = 2D(t − t0 ). Die Breite der p Verteilung nimmt also mit der Zeit wie D(t − t0 ) zu. (Dies gilt allgemein, nicht nur in einer Dimension, p da D(t − t0 ) die einzige Größe von der Dimension einer Länge ist, die man aus D und t−t0 konstruieren kann.) Das ist das erwartete Verhalten für die Verteilungsfunktion für die Anfangsbedingung n(x, t0 ) = δ(x − x0 ). 5.3 Die Langevin-Gleichung Wir wollen die Diffusion bzw. Brownsche Bewegung auf einer mikroskopischeren Ebene verstehen. Ein Brownsches Teilchen, z.B. ein Pollenkorn in Browns Experiment, führt zahlreiche Stöße mit Molekülen aus. Dies führt zum Einen sicherlich zu Reibung. Wenn sich das Brownsche Teilchen hinreichend langsam in einer Flüssigkeit bewegt, ist die Reibungskraft in guter Näherung durch Newtonsche Reibung FR = −mγ ṙ (5.67) beschrieben. mγ ist der Reibungskoeffizient. Die Bewegungsgleichung mr̈ = −mγ ṙ beschreibt exponentielle Dämpfung der Bewegung, aber noch keine Diffusion. Dazu ist also eine zusätzliche Kraft Fs notwendig. Auch drückt FR noch nicht die Idee von zufälligen Stößen mit Molekülen aus. Diese Überlegungen führen zur Langevin-Gleichung: mr̈ = −mγ ṙ + Fs (t), (5.68) wobei Fs (t) eine zufällige, zeitabhängige Kraft ist. Für eine bestimmte Realisierung von Fs (t) erhalten wir eine bestimmte Bahnkurve r(t). Für eine Zufallsverteilung der Fs (t) erhalten wir eine Zufallsverteilung von r(t). Da die Langevin-Gleichung Zufallsgrößen enthält, bezeichnet man sie als eine stochastische Gleichung. Die Verteilung der r(t) hängt natürlich von der Verteilung der Fs (t) ab. Wir fragen uns, unter welchen Bedingungen wir Diffusion erhalten. Wir schreiben die Langevin-Gleichung als v̇ = −γv + mit dem Integral ˆ v(t) = v(t0 ) e−γ(t−t0 ) + Fs (t) m t (5.69) 0 dt0 e−γ(t−t ) t0 Fs (t0 ) . m (5.70) Wir setzen o.B.d.A. t0 = 0 und r(t0 ) ≡ r0 = 0. Durch nochmalige Integration erhalten wir r(t) = v0 ↑ =v(t0 ) 1 − e−γt + γ ˆ ˆ t t1 dt1 0 0 dt2 e−γ(t1 −t2 ) Fs (t0 ) . m Wir nehmen zur Vereinfachung v0 = 0 an und vertauschen die t1 , t2 -Integration: ˆ t ˆ t Fs (t2 ) r(t) = dt2 dt1 e−γ(t1 −t2 ) m 0 t2 ˆ t −γt Fs (t2 ) γt2 e − e−γt2 = dt2 e m −γ 0 ˆ t 1 dt2 Fs (t2 ) [1 − e−γ(t−t2 ) ]. = mγ 0 162 (5.71) (5.72) (5.73) (5.74) Die Langevin-Gleichung enthält eine typische Zeitskala 1/γ, die offenbar die Dämpfung beschreibt. Wir betrachten hier lange Zeiten t À 1/γ. Dann ist der Term e−γ(t−t2 ) im Integranden fast immer klein und wir schreiben ˆ t 1 ∼ r(t) = dt2 Fs (t2 ). (5.75) mγ 0 Der Ortsvektor des Teilchens ist also die Summe vieler zufälliger Verrückungen dt/(mγ) Fs (t). Diskretisiert man die Zeit, n ∆t X r(n∆t) = Fs (n0 ∆t), (5.76) mγ 0 n =1 so erhält man einen Random Walk. Wir haben bisher keine Annahmen über die Verteilung der Zufallsgrößen Fs (t) gemacht. Man kann zeigen, dass für sehr viele Stöße mit Molekülen im thermischen Gleichgewicht folgende Annahmen gerechtfertigt sind: 1. Fs (t) und Fs (t0 ) zu verschiedenen Zeiten t 6= t0 sind unkorreliert. D.h. Fs hat kein Gedächtnis. Dies nennt man die Markov-Eigenschaft. 2. Fs (t) ist normalverteilt. Dann bezeichnet man Fs (t) als Gauss-Prozess. Wir betrachten nun den eindimensionalen Fall, um Schreibarbeit zu sparen. Höhere Dimensionen lassen sich analog behandeln. Eigenschaft 1 lässt sich dann schreiben als hFs (t)Fs (t0 )i = S δ(t − t0 ). 2 (5.77) Dann ist das Rauschspektrum ˆ S(ω) := 2 ∞ 0 d(t − t0 ) eiω(t−t ) hFs (t)Fs (t0 )i = S = const. | {z } −∞ (5.78) 0 =S 2 δ(t−t ) Ein solches konstantes Rauschspektrum bezeichnet man als weißes Rauschen. Wir diskretisieren nun die Zeit und schreiben n n ∆t X ∆t X xn = Fs (n0 ∆t) ≡ Fn0 . (5.79) mγ 0 mγ 0 n =1 n =1 Nun ist hFn Fn0 i = S δnn0 . 2 ∆t Insbesondere ist die Varianz der Verteilung von Fs (t) nun σ 2 = S/2∆t. Eigenschaft 2 führt dann auf die Verteilungsfunktion der Zufallskraft µ ¶ r µ ¶ 1 Fn2 ∆t ∆t 2 √ p(Fn ) = exp − 2 = exp − F . 2σ πS S n 2πσ Die Verteilungsfunktion des zurückgelegten Weges, P (xn ), ist dann, vgl. Gl. (5.79), à ! ˆ n ∆t X P (xn ) = dF1 · · · dFn δ xn − Fn0 p(F1 ) · · · p(Fn ) mγ 0 n =1 " à !# ˆ ∞ ˆ n ∆t X dκ = dF1 · · · dFn exp iκ xn − Fn0 p(F1 ) · · · p(Fn ) mγ 0 −∞ 2π n =1 µ ¶r µ ¶ ˆ ∞ n ˆ κ∆t ∆t ∆t dκ iκxn Y dFl exp −i e Fl exp − Fl2 . = mγ πS S −∞ 2π l=1 163 (5.80) (5.81) (5.82) (5.83) (5.84) Die Fl -Integrale kann man mittels quadratischer Ergänzung im Exponenten ausführen. Man erhält · µ ¶¸n ˆ ∞ µ ¶ ˆ ∞ dκ iκxn S∆t nS∆t dκ iκxn P (xn ) = e exp − 2 2 κ2 e exp − 2 2 κ2 . (5.85) = 4m γ 4m γ −∞ 2π −∞ 2π Das kann man wieder ausrechnen: µ ¶ γm γ 2 m2 2 √ exp − x . P (xn ) = √ √ n∆tS n π n∆t S (5.86) Wir sehen, dass dies eine sehr ähnliche Form zur Green-Funktion für die Diffusionsgleichung hat, vgl. Gl. (5.66). Die Zeit ist offensichtlich t = n∆t und der Ort nach der Zeit t ist xn = x(t). Wir haben hier tatsächlich die Green-Funktion für die eindimensionale Langevin-Gleichung unter den Annahmen 1 und 2 und t À 1/γ ausgerechnet: µ 2 2 ¶ γm γ m 2 P (xt, 00) = √ √ exp − x . (5.87) St π St Das ist genau die Green-Funktion (5.66) für die Diffusionsgleichung, wenn wir für die Diffusionskonstante setzen S D = 2 2. (5.88) 4γ m Diese Beziehung ist sinnvoll: Je größer die Rauschamplitude, desto schneller ist die Diffusion. Je größer die Reibung, desto langsamer ist die Diffusion. Im Grenzfall langer Zeiten, t À 1/γ, beschreibt die Diffusionsgleichung also dieselbe Physik wie die Langevin-Gleichung unter den gemachten Annahmen über die Zufallskraft. 5.4 Die Boltzmann-Gleichung Die Diffusionsgleichung beschreibt die zeitliche Entwicklung der Dichte n(r, t) im Ortsraum. Es ist oft nützlich, stattdessen die Dichte im Phasenraum zu betrachten. Die Anzahl der Brownschen Teilchen mit ihrem Ort r im Volumenelement d3 r und ihrem Impuls p im Impulselement d3 p sei f (r, p, t) d3 r d3 p. Die Ortsraumdichte ist dann ˆ n(r, t) = d3 p f (r, p, t). (5.89) Für wechselwirkungsfreie klassische Teilchen ergibt sich die Bewegungsgleichung für f aus dem LiouvilleTheorem, das eine Kontinuitätsgleichung für f darstellt: 0= df ∂f ∂f ∂f ∂f p ∂f ∂f = + ṙ · + ṗ · = + · +F· , dt ∂t ∂r ∂p ∂t m ∂r ∂p mit offensichtlichen Definitionen von ∂/∂r und ∂/∂p. Also gilt ¶ µ p ∂ ∂ ∂ + · +F· f (r, p, t) = 0. ∂t m ∂r ∂p (5.90) (5.91) Wechselwirkungen zwischen den Teilchen führen zur Streuung aus Zuständen mit Ort r und Impuls p in Zustände mit Ort r0 (in realistischen Anwendungen meist identisch zu r, da die Teilchen nicht instantan springen können) und Impuls p0 . Diese Streuprozesse induzieren also zusätzliche zeitliche Änderungen in f , die man formal in einem Streuterm auf der rechten Seite von Gl. (5.91) zusammengefasst: ¶ µ p ∂ ∂ ∂ + · +F· f = −S[f ]. (5.92) ∂t m ∂r ∂p Dies ist die berühmte Boltzmann-Gleichung. Die Schreibweise drückt aus, dass der Streuterm ein noch zu bestimmendes Funktional der Phasenraumdichte f ist. 164 5.4.1 Relaxationszeitansatz Ein oft verwendeter phänomenologischer Ansatz für S[f ] geht von der Beobachtung aus, dass das System für Zeiten t → ∞ ins thermische Gleichgewicht kommen muss, sofern F zeitunabhängig ist. Die Gleichgewichtsverteilung sei f0 (r, ¡ p), so ¢erwarten wir für klassische Teilchen ¡ ¢ p). Ist die Einteilchenenergie E(r, f0 (r, p) ∼ exp −βE(r, p) und für Elektronen f0 (r, p) ∼ nF E(r, p) . Der Relaxionszeitansatz besteht nun in ! S[f ] = f (r, p, t) − f0 (r, p) τ (5.93) mit der Relaxationszeit τ . Dies erzwingt, dass f auf der Zeitskala τ gegen f0 konvergiert. Man kann mit der Bolzmann-Gleichung im Relaxionszeitansatz die Leitfähigkeit berechnen. Wir führen dies hier nicht durch. Man erhält wieder die Drude-Formel. Aber wieso stimmt das Resultat mit dem aus der quantenmechanischen Vielteilchentheorie überein? Die Boltzmann-Gleichung beschreibt die klassische Phasenraumverteilung f . Es ist nicht klar, wieso sie auf Elektronen anwendbar sein sollte. Wir werden im folgenden Abschnitt skizzieren, auf welchem Weg sich die Boltzmann-Gleichung aus der Quantenmechanik von Vielteilchensystemen ergibt. 5.4.2 Wigner-Funktion und Quanten-Boltzmann-Gleichung Es ist nicht offensichtlich, was in der Quantenmechanik an die Stelle der Phasenraumverteilung f (r, p, t) tritt. Diese gibt nämlich an, mit welcher Wahrscheinlichkeit ein Teilchen den Ortsvektor r und den Impuls p hat. Die Heisenbergsche Unschärferelation zeigt aber, dass wir dies aus prinzipiellen Gründen gar nicht genau angeben können. Eine sinnvolle Frage im Rahmen der quantenmechanischen Vielteilchentheorie ist sicherlich, mit welcher Wahrscheinlichkeitsamplitude wir ein Teilchen zur Zeit t bei r finden, wenn es zur Zeit t0 bei r0 war. Dies wird natürlich durch die Green-Funktion ausgedrückt. Wir betrachten hier G< (rt, r0 t0 ) = ihΨ† (r0 , t0 )Ψ(r, t)i (5.94) für Fermionen und unterdrücken die Spin-Indizes. Hier ist h. . .i = Tr % . . . Im Gleichgewicht ist % = Z −1 e−βH , aber die Definition von G< gilt ganz allgemein für beliebige Dichteoperatoren %. Wir führen Schwerpunkts- und Relativkoordinaten r + r0 2 ∆r := r − r0 R := t + t0 t − t0 ∆t := t − t0 , T := , ein und schreiben, unter Änderung der Notation, ¿ µ ¶ µ ¶À ∆r ∆t ∆r ∆t < † G (∆r, ∆t; R, T ) = i Ψ R − ,T − Ψ R+ ,T + . 2 2 2 2 Nun Fourier-transformieren wir nach den Relativkoordinaten und erhalten ˆ < G (k, ω; R, T ) = d3 ∆r d∆t e−ik·∆r+iω∆t G< (∆r, ∆t; R, T ). (5.95) (5.96) Diese Funktion enthält natürlich noch immer dieselbe Information wie der ursprüngliche Propagator. Nun definieren wir die Wigner-Funktion: f (k, ω; R, T ) := −iG< (k, ω; R, T ). (5.97) Wir zeigen, dass diese Funktion eng mit der Phasenraumverteilung zusammenhängt: Es gilt nämlich ˆ ˆ dω d3 k f (k, ω; R, T ) = −iG< (∆r = 0, ∆t = 0; R, T ) (5.98) 3 (2π) 2π = 165 hΨ† (R, T )Ψ(R, T )i, (5.99) was offenbar die Teilchenzahldichte ist. Andererseits ist ˆ ˆ ˆ dω 3 d R f (k, ω; R, T ) = d3 R d3 ∆r e−ik·∆r (−i)G< (∆r, ∆t = 0; R, T ) (5.100) 2π ¿ µ ¶ µ ¶À ˆ ∆r ∆r (5.101) = d3 R d3 ∆r e−ik·∆r Ψ† R − ,T Ψ R + ,T 2 2 ˆ 0 = d3 r d3 r0 e−ik·(r−r ) hΨ† (r0 , T )Ψ(r, T )i (5.102) = hΨ† (k, T )Ψ(k, T )i, (5.103) also die Teilchenzahldichte im Impulsraum. Dies legt nahe, ˆ dω f (k, ω; R, T ) fW (R, k, T ) := 2π (5.104) als Verteilungsfunktion im Phasenraum zu interpretieren. Die so definierte Funktion fW nennt man oft auch Wigner-Funktion. fW ist aber i.A. nicht positiv semidefinit, so dass man fW nicht direkt als Phasenraumdichte deuten kann. Das ist eine Folge der Quantenmechanik. Die Bewegungsgleichung für f (k, ω; R, T ) ist die Quantum-Boltzmann-Gleichung, die wir nun motivieren wollen. Sie folgt aus der Bewegungsgleichung für G< , die wir analog zu Abschnitt 3.1 herleiten können. Wir betrachten zunächst wechselwirkungsfreie Elektronen in einem statischen elektrischen Feld. Der Einteilchen-Hamiltonian lautet µ ¶2 1 1 H0 = ∇ + eA − eφ(r). (5.105) 2m i Wir erhalten i ∂ < G (rt, r0 , t0 ) = ∂t 0 = Also ist Analog gilt ¿ À ∂ i Ψ† (r0 , t0 )i Ψ(r, t) ∂t * " # + µ ¶2 1 1 † 0 0 i Ψ (r , t ) ∇ + eA(r) − eφ(r) Ψ(r, t) . 2m i " # µ ¶2 ∂ < 1 1 0 0 0 0 i G (rt, r , t ) = ∇ + eA(r) − eφ(r) G< 0 (rt, r , t ). ∂t 0 2m i (5.106) (5.107) (5.108) " # µ ¶2 ∂ < 1 1 0 0 i 0 G0 (rt, r0 , t0 ) = − − ∇0 + eA(r0 ) − eφ(r0 ) G< 0 (rt, r , t ). ∂t 2m i (5.109) Damit können wir die Ableitung von f0 (k, ω; R, T ) nach der Schwerpunktszeit T ausrechnen: ¶ µ ˆ ∂ ∂ ∆r ∆t ∆r ∆t . (5.110) f0 (k, ω; R, T ) = −i d3 ∆r d∆t e−ik·∆r+iω∆t G< R + , T + , R − , T − 0 ∂T ∂T | {z 2 } | {z 2} | {z 2 } | {z 2} r t r0 t0 Die Rechnung führen wir hier nicht explizit durch. Unter der Annahme eines räumlich und zeitlich schwach veränderlichen elektromagnetischen Feldes erhalten wir ½ ¾ k ∂ ∂ k ∂ ∂ f0 (k, ω; R, T ) = − · + eE · + · eE f0 (k, ω; R, T ) (5.111) ∂T m ∂R ∂k m ∂ω Es folgt µ ¶ ∂ k ∂ ∂ k ∂ + · −eE · − · eE f0 (k, ω; R, T ) = 0. ∂T m ∂R | {z ∂k} | m {z ∂ω} ∂ =+F· ∂k k =+ m ·F 166 ∂ ∂ω (5.112) Beiträge aufgrund der Elektron-Elektron-Wechselwirkung, die hier vernachlässigt wurde, drücken wir wieder durch Streuterme auf der rechten Seite der Gleichung aus: µ ¶ ∂ k ∂ ∂ k ∂ + · +F· + ·F f (k, ω; R, T ) = −SQB [f ]. (5.113) ∂T m ∂R ∂k m ∂ω SQB [f ] kann man durch elektronische Green-Funktionen und Selbstenergien ausdrücken, was wir hier nicht zeigen. Die Gleichung heißt Quanten-Boltzmann-Gleichung, da sie sehr ähnlich zur klassischen BoltzmannGleichung µ ¶ k ∂ ∂ ∂ + · +F· f (R, k, T ) = −S[f ] (5.114) ∂T m ∂R ∂k ist. Den zusätzlichen Term in der Quanten-Boltzmann-Gleichung, (k/m)·F ∂/∂ω, kann man interpretieren: v · F = ∂E/∂t ist die Verlustleistung aufgrund von Joulescher Wärme. Tatsächlich erhält man eine Boltzmann-Gleichung für die Wigner-Funktion fW durch Integration der Quanten-Boltzmann-Gleichung über ω, was µ ¶ ˆ ∂ dω k ∂ ∂ + · +F· fW (R, k, T ) = − SQB [f ] (5.115) ∂T m ∂R ∂k 2π ergibt. Hier ist die rechte Seite aber i.A. noch kein Funktional allein von fW , also sind noch Näherungen für SQB nötig, um den Streuterm auf die Form −S[fW ] zu bringen. Man spricht in diesem Zusammenhang von der semiklassischen Boltzmann-Gleichung, um auszudrücken, dass sie zwar die Form einer klassischen Gleichung hat, aber aus einer quantenmechanischen Herleitung resultiert. Wir fassen noch einmal zusammen: • Die Bewegungsgleichung für G< ist äquivalent zur Quanten-Boltzmann-Gleichung für die WignerVerteilungsfunktion f (k, ω; R, T ). • Durch Integration über ω und Näherungen erhält man eine Boltzmann-Gleichung für ˆ dω fW (R, k, T ) = f (k, ω; R, T ). 2π Dies gestattet, die Boltzmann-Gleichung im Rahmen der Vielteilchentheorie zu begründen. 167 (5.116) Anhang A Literatur Es existieren zahlreiche Lehrbücher zu den Themen dieser Vorlesung. Da die Vorlesung Elemente von Quantenfeldtheorie, Vielteilchentheorie und Statistischer Physik im Nichtgleichgewicht beinhaltet, kann man nicht erwarten, den Inhalt der Vorlesung in einem einzigen Buch wiederzufinden. Hier folgt eine subjektive Auswahl von Lehrbüchern, die entweder noch im Druck oder in der Bibliothek zu finden sein sollten, mit kurzen Kommentaren. Quantenfeldtheorie K. Huang, Quantum Field Theory (Wiley, New York, 1998): Überwiegend elegante, moderne und klar strukturierte Darstellung, die anders als andere Bücher nicht ausschließlich Anwendungen in der Elementarteilchenphysik im Sinn hat. Der Teil, den wir hier benötigen, ungefähr die erste Hälfte, verwendet ausschließlich den Operator-Formalismus, keine Pfadintegrale. Enthält leider viele Druckfehler in den Formeln. Die Qualität des Textes variiert, insgesamt aber didaktisch gut aufbereitet. C. Itzykson und J.-B. Zuber, Quantum Field Theory (McGraw-Hill, New York, 1980): Ein klassisches Lehrbuch der Quantenfeldtheorie aus Sicht der Elementarteilchenphysik. Führt Pfadintegrale ebenfalls erst spät ein. Enthält weitaus mehr als wir hier brauchen. A. M. Tsvelik, Quantum Field Theory in Condensed Matter Physics, 2. Auf lage (Cambridge University Press, Cambridge, 2003): Führt in die Quantenfeldtheorie aus Sicht der Vielteilchentheorie ein, wäre insofern ein ideales Lehrbuch für diese Vorlesung, benutzt aber Pfadintegrale und behandelt viele grundlegende Themen nicht. Die diskutierten Anwendungen sind relativ modern und fortgeschritten und spiegeln die Interessen des Autors wider. Inakzeptables Stichwortverzeichnis. Enthält zahlreiche von Tsvelik gezeichnete Karikaturen, sein Markenzeichen. Vielteilchentheorie G. D. Mahan, Many-Particle Physics, 2. Auf lage (Plenum, New York, 1990): Ein Klassiker, vielleicht der Klassiker. Beruht auf dem Operator-Formalismus, der auch in der Vorlesung verwendet wird. Etwas leichter lesbar als Negele und Orland. Argumentiert eher physikalisch. Umfangreich, deckt fast alles ab, was zu einer Einführung in die Vielteilchentheorie gehört, einschließlich Superfluidität und Supraleitung. Geht fast sofort zum Formalismus für Temperaturen T > 0 über. J. W. Negele und H. Orland, Quantum Many-Particle Systems (Addison-Wesley, Reading, 1988): Ein weiterer Klassiker. Baut auf dem Pfadintegral-Formalismus auf und ist in diesem Sinn moderner als Mahan. Supraleitung wird nicht behandelt. Vielleicht das am besten durchdachte Buch, aber nicht leicht zu lesen, auch wegen des hässlichen Layouts. W. Nolting, Grundkurs Theoretische Physik 7: Viel-Teilchen-Theorie, 6. Auf lage (Springer, Berlin, 2005): Gutes, deutschsprachiges Lehrbuch, klar gegliedert, didaktisch 168 besser aufbereitet als die vorgenannten Klassiker. Starkes Gewicht auf Formalismen. Supraleitung wird nicht behandelt, dafür relativ fortgeschrittene Themen zum Magnetismus (Interessengebiet des Autors). H. Bruus und K. Flensberg, Many-Body Quantum Theory in Condensed Matter Physics (Oxford University Press, Oxford, 2004): Didaktisch recht gut aufbereitetes neues Lehrbuch, das den Operator-Formalismus verwendet, keine Pfadintegrale. Teilweise etwas inexakt in der Interpretation. Deckt im Wesentlichen den gesamten Stoff einer Einführung in die Vielteilchentheorie ab, einschließlich Supraleitung, ist aber kompakter und besser strukturiert als Mahans Buch. Kapitel über Transport in mesoskopischen Systemen und über eindimensionale Systeme gehen über den Standard-Stoff hinaus. A. A. Abrikosov, L. P. Gorkov und I. E. Dzyaloshinski, Methods of Quantum Field Theory in Statistical Physics (Dover, New York, 1963): Ein weiterer Klassiker. Trotz des Titels ein fortgeschrittenes Lehrbuch über Vielteilchentheorie. Sehr dicht, vergleichbar mit Negele und Orland, verwendet aber den Operator-Formalismus. Enthält ein Kapitel zur Supraleitung. Unzureichendes Stichwortverzeichnis. X.-G. Wen, Quantum Field Theory of Many-Body Systems (Oxford University Press, Oxford, 2004): Die erste Hälfte des Buches enthält eine knappe Darstellung von Standard-Stoff der Vielteilchentheorie im Pfadintegral-Bild. Die zweite Hälfte behandelt hochaktuelle Fragen, überwiegend aus der eigenen Forschung des Autors, und liegt teilweise weit außerhalb des allgemein akzeptierten Kenntnisstandes. Enthält einsichtsvolle Bemerkungen, z.B. zum Vergleich von Vielteilchentheorie und Elementarteilchentheorie. Das erste Kapitel lohnt sich zu lesen. E. M. Lifshitz und L. P. Pitaevskii, Landau and Lifshitz, Course of Theoretical Physics 9: Statistical Physics Part 2 (Butterworth-Heinemann, Oxford, 1980) bzw. Landau und Lifshitz, Lehrbuch der Theoretischen Physik 9: Statistische Physik Teil 2, 4. Auf l. (Akademie Verlag, Berlin, 1992): Der „Landau-Lifshiftz“ zum Thema Vielteilchentheorie. Baut auf der Landau-Theorie der Fermi-Flüssigkeiten auf, was zu einer ungewohnten Reihenfolge der Kapitel führt. Wie üblich für Landau und Lifshitz überwiegend inhaltlich gut durchdacht, aber sehr dicht und didaktisch nicht sehr freundlich. J. R. Schrieffer, Theory of Superconductivity, überarbeiteter Nachdruck (AddisonWesley, Redwood City, 1983): Wie der Titel sagt, ein Lehrbuch über die (BCS-) Theorie der Supraleitung. Enthält jedoch eine knappe, klare Darstellung der ihr zu Grunde liegenden Vielteilchentheorie im Operator-Formalismus, überwiegend für Temperatur T = 0. Statistische Physik im Nichtgleichgewicht Der überwiegende Teil des Stoffes, den wir in diesem Kapitel behandeln wollen, ist in den vorgenannten Lehrbüchern der Vielteilchentheorie enthalten. Brownsche Bewegung, Markov-Prozesse und semiklassische Boltzmann-Theorie werden in verschiedenen Lehrbüchern der Statistischen Physik besprochen. C. Kittel, Elementary Statistical Physics (Wiley, New York, 1958): Klassisches Lehrbuch mit einem relativ hohen Anteil von Formeln. Enthält eine knappe aber klare Darstellung der genannten Aspekte. R. Kubo, M. Toda und N. Hashitsume, Statistical Physics II: Nonequilibrium Statistical Mechanics, 2. Auf lage (Springer, Berlin, 1991): Ein neueres Lehrbuch, das die hier wichtigen Aspekte ausführlicher behandelt als Kittel, aber die wesentlichen Punkte manchmal nicht so klar herausarbeitet. 169