Theoretische Physik V Höhere Quantentheorie Skritpum o.Univ.-Prof. Urbaan M. Titulaer Institut für Theoretische Physik Universität Linz SS 2009 Gesetzt von Oskar Armbruster, Johannes Gall und Philipp Kolmhofer Inhaltsverzeichnis 2 Kapitel 1 Zielsetzung und Inhaltsübersicht In dieser Vorlesung werden wir einige Themen und Methoden behandeln, die über den Sto der Kursvorlesungen Quantenmechanik und Thermodynamik und Statistische Physik hinausgehen, aber andererseits von genügend allgemeinem Interesse sind und in verschiedenen Teilbereichen der Physik ihre Anwendung nden. Es wird dabei ein gewisser Überlapp mit den Vorlesungen Theoretische Atom- und Kernphysik und Theoretische Festkörperphysik auftreten, aber der Akzent wird in dieser Vorlesung eher auf der allgemeinen Methodik als auf den spezischen Anwendungen liegen. Andererseits werde ich versuchen, bei jedem neu eingeführten Formalismus auch einige Anwendungen zu diskutieren; nur so kann die Motivation zur Einführung des Formalismus einsichtig gemacht werden. Das wichtigste Thema der Vorlesung ist die Beschreibung von Vielteilchensystemen, insbesondere auch von solchen, in denen Teilchen erzeugt und vernichtet werden können. Für solche Systeme reicht die in der Vorlesung Quantenmechanik verwendete Beschreibung nicht aus; dort wurde die Zahl der Teilchen bei der Spezizierung des Hilbertraumes (Zahl der Freiheitsgrade sowie Festlegung des Symmetriecharakters bezüglich Vertauschung identischer Teilchen) (ein für allemal) festgelegt. Als Einstieg in die Behandlung von Vielteilchensystemen behandeln wir in Kap. II die Quantentheorie des Strahlungsfeldes. Aus der Elektrodynamik ist bekannt, dass das Strahlungsfeld sich dynamisch verhält wie ein System harmonischer Oszillatoren, und es liegt nahe, auf diesen Feldoszillatoren die Quantisierungsvorschrift für normale Oszillatoren anzuwenden. Dies führt auf natürliche Weise zu einer für Bosonen angemessenen Beschreibung; nach Einbeziehung der Wechselwirkung mit einem Atom können auch Absorption und (spontane und stimulierte) Emission von Strahlung auf recht natürliche Weise erklärt werden. (Der für das Strahlungsfeld entwickelte Formalismus kann auch für sonstige Oszillatoren verwendet werden; als Beispiel werden wir in Kap. III kurz die Beschreibung von Gitterschwingungen diskutieren.) Aufgrund der unendlichen Zahl der Feldoszillato- ren treten in der Theorie Divergenzen auf; wir werden an einigen Beispielen zeigen, wie Renormierungsverfahren beseitigen kann. In Kap. III zeigen wir, wie der Formalismus für die Behandlung von Systemen aus vielen Fermionen modiziert werden muss. Dies ist von Interesse für die Beschreibung von man diese, wenigstens formal, durch Atom, Molekül und Festkörper. Als erstes diskutieren wir die Hartree-Fock-Näherung, und 3 4 KAPITEL 1. ZIELSETZUNG UND INHALTSÜBERSICHT illustrieren sie am Beispiel des Elektronengases. Es erweist sich dabei als nützlich, auch für die Elektronen einen Formalismus mit Erzeugungs- und Vernichtungsoperatoren einzuführen. Dieser Formalismus wird wohl etwas irreführend zweite Quantisierung genannt. Der so erhaltene Formalismus erweist sich als besonders geeignet für die Formulierung der BCS-Theorie der Supraleitung. Wir werden auch kurz auf die Herleitung der in der BCSTheorie auftretenden anziehenden Elektron-Elektron Wechselwirkung aus der ElektronPhonon Wechselwirkung eingehen. Dirac In Kap. IV diskutieren wir die von vorgeschlagene relativistische Wellengleichung 1 für ein Teilchen mit Spin . Die physikalische Interpretation dieser Gleichung weist einige 2 Schwierigkeiten auf, welche auf das Auftreten von zu- Lösungen mit negativer Energie rückzuführen sind. Diese Schwierigkeiten lassen sich weitgehend dadurch beseitigen, dass man annimmt, dass sämtliche Zustände mit negativer Energie im energetisch niedrigsten zugänglichen Zustand des Systems besetzt sind. Durch diese Annahme ist aber auch die Dirac-Theorie nicht länger eine reine Ein-Teilchen-Theorie; eine Umformulierung in eine Viel-Teilchen-Theorie erscheint angebracht, aber wir werden diese Umformulierung in dieser Vorlesung nicht explizit durchführen. Literatur Bisher habe ich kein Buch gefunden, in dem sämtliche Themen der Vorlesung behandelt werden. Viele der Themenkreise werden behandelt in: A. Messiah, Quantum Mechanics, Teil II. J. J. Sakurai, Advanced Quantum Mechanics. H. A. Bethe und R. W. Jackiw, Intermediate Quantum Mechanics. W. Greiner, Theoretische Physik 4A: Quantentheorie, Spezielle Kapitel. Insbesondere für Probleme der Festkörpertheorie: C. Kittel, Quantum Theory of Solids. J.M. Ziman, Electrons and Phonons. Kapitel 2 Quantentheorie des Strahlungsfeldes 2.1 Die klassischen Feldgleichungen und die Feldoszillatoren Ausgehend von den Maxwellgleichungen im freien Raum ∂B = −c ∇×E ∂t ∇·B = 0 ∂E = c ∇×B ∂t ∇·E = 0 suchen wir zuerst nach speziellen Lösungen vom Typ E(r, t) = e(r)q(t) B(r, t) = b(r)p(t). (1.1) Substitution in die Maxwellgleichungen liefert e(r)q̇(t) = c p(t) ∇×b(r); b(r)ṗ(t) = −c q(t) ∇×e(r). In beiden Gleichungen steht auf beiden Seiten jeweils ein Produkt einer reinen Ortsfunktion und einer reinen Zeitfunktion. Gleichheit für alle Konstanten α und β q̇ = αp; ṗ = −βq; r und c ∇×b = αe; c ∇×e = βb. (1.2) q = −ω 2 q ω 2 = αβ, also die typischen Oszillatorgleichungen, sowie ∇×( ∇×b) = ist nur möglich, falls es zwei gibt, so dass Das ineinander Substituieren dieser Gleichungen ergibt p̈ = −ω 2 p t ω2 α ∇×e = 2 b. c c 5 6 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES Aus letzterer Gleichung kann man über ∇×( ∇×b) = ∇( ∇·b) − ∇2 b und ∇·b = 0, sowie die analogen Beziehungen für ∇2 b = − ω2 b c2 ∇2 e = − e, auf die Eigenwertgleichungen ω2 e c2 schlieÿen. Diese Gleichungen sind formal analog zur zeitunabhängigen Schrödingergleichung für ein freies Teilchen. Im unendlichen Raum sind die Lösungen ebene Wellen vom Typ eik (r) ≈ êi eikr , wobei êi ein Einheitsvektor ist mit êi ⊥ k. Die zugehörige Frequenz ist ω = ck. Der Wellenvektor k kann alle reellen Werte annehmen; bei jedem Wert von linear unabhängige Polarisationsvektoren k gibt es zwei êi . Weil das Arbeiten mit einem überabzählbaren Satz nicht konventionell normierbarer Funktionen etwas unbequem ist, legt man oft bus mit Kantenlänge L periodische Randbedingungen auf einem Ku- fest: e(x + lx L, y + ly L, z + lz L) = e(x, y, z) für alle ganze Zahlen lx , ly und lz . Dadurch werden die zulässigen Werte von k eingeschränkt auf 2π (nx , ny , nz ) L k= mit nx , ny und nz ganze Zahlen. Für das Feld in einem Hohlraum mit spiegelnden Wänden sind die zulässigen Werte von ω diskret (siehe Vorlesung Elektrodynamik). Dafür sind dann aber die sog. Modenfunktionen en (r) und bn (r) von etwas komplizierterer Gestalt; sie können aber immer reell gewählt werden. Auch für den Fall periodischer Randbedingungen kann man wegen der Entartung ikr −ikr zwischen k und −k, das Paar Modenfunktionen êi e und êi e durch êi sin kr und êi cos kr ersetzen. So erhält man für alle Fälle einen Satz reeller Modenfunktionen, was für die weitere formale Entwicklung einige Vorteile bietet. [Wir werden im weiteren die Modenfunktionen mit einem einfachen Index k (für Wellenvektor und Polarisation!) durch- nummerieren.] Am Schluss unserer Herleitung werden die für komplexe Modenfunktionen erforderlichen Modikationen ohne explizite Rechnung erwähnt werden. 2.1. DIE KLASSISCHEN FELDGLEICHUNGEN UND DIE FELDOSZILLATOREN 7 Normierung: Weil die Aufspaltung ( ??) nur bis auf Konstanten eindeutig ist, können wir für die Mo- denfunktionen eine im Prinzip beliebige Normierung wählen. Auch die Konstanten α und 2 können unter Beibehaltung von αβ = ω frei gewählt werden; die Wahl α = β = ω liegt β ??): nahe. Mit dieser Wahl gilt dann aufgrund von ( Z V Z c2 ( ∇×ek ) ( ∇×ek ) dr bk (r)bk (r)dr = 2 ω V Z c2 = 2 ek ( ∇×( ∇×ek )) dr + Oberächenterm. ω V Dabei bezeichnet V (1.3) das Periodizitäts- oder Hohlraumvolumen. (Das auf den ersten Blick anomale Vorzeichen des partiell integrierten Terms kann durch Ausschreiben in Komponenten überprüft werden; siehe Skriptum Elektrodynamik.) Der Oberächenterm ist proportional zu I I 2 d O (n̂×ek )bk = d2 O n̂ (ek ×bk ) , also proportional zum Oberächenintegral der Normalkomponente des Poyntingvektors, d.h. der Energiestromdichte. Für reelle Modenfunktionen verschwindet diese Gröÿe; hätten wir komplexe Modenfunktionen gewählt, so hätten sich aufgrund der periodischen Randbedingungen die Beiträge der Kantenächen der Kuben jeweils paarweise kompensiert. Aus ( ??) schlieÿt man jetzt nach Einsetzen der Eigenwertgleichung Z Z bk (r)bk (r)dr = ek (r)ek (r)dr Weiters sind natürlich Modenfunktionen mit verschiedenen Indizes orthogonal zueinander. Wir wählen jetzt als Normierungsbedingung Z e∗k (r)ek0 (r)dr = 4πωk δkk0 , (wobei die Verallgemeinerung auf komplexe Modenfunktionen miteingeschlossen wurde). Für den Fall eines kontinuierlichen Modenindex wählt man auf analoge Weise Z e∗ki (r)ek0 j (r)dr = 4πωk δ 3 (k − k0 )δij . 2.1.1 Entwicklung nach Modenfunktionen Aus der Vollständigkeit der Modenfunktionen versale Feld nach ihnen entwickeln kann: E(r, t) = X k ek (r)qk (t) mit ek (r) oder bk (r) folgt, dass man jedes trans- 1 qk (t) = 4πωk Z E ek dr 8 KAPITEL 2. B(r, t) = X bk (r)pk (t) QUANTENTHEORIE DES STRAHLUNGSFELDES mit k 1 pk (t) = 4πωk Z B bk dr Einsetzen dieser Entwicklungen in den Ausdruck für die Feldenergie liefert Z 1 W (t) = dr |E(r, t)|2 + |B(r, t)|2 8π Z Z 1 X qk qk 0 dr ek ek0 + pk pk0 dr bk bk0 = 8π kk0 V V 1X 2 ωk pk (t) + qk2 (t) . = 2 k Wenn man diesen Ausdruck als Hamiltonfunktion auasst: W (t) = H({pk , qk }), so erhält man als die Hamilton'schen Bewegungsgleichungen ṗk = − ∂H = −ωk qk ∂qk q̇k = ∂H = ωk pk , ∂pk also genau die vorher aus dem Separationsansatz erhaltenen Ausdrücke. 2.1.2 Das Vektorpotential; Ankoppelung an eine Stromdichte Wie aus der Elektrodynamik bekannt ist, können die Felder B = ∇×A E=− in einem Vektorpotential A E und B mittels 1 ∂A − ∇φ c ∂t und einem skalaren Potential φ ausgedrückt werden. Die oben angegebenen allgemeinen Ausdrücke für rein transversale Felder E und B können herge- leitet werden aus φ(r, t) = 0 A(r, t) = X c pk (t)ek (r). ωk k Diese Wahl ist nicht eindeutig; sie entspricht der Coulomb-Eichung ∇·A = 0; diese Eichung ist für den Übergang zur Quantentheorie die bequemste; sie hat aber den Nachteil, dass sie nicht relativistisch kovariant ist. In Anwesenheit von Ladungen und Strömen werden zwei der Maxwellgleichungen abgeändert in ∂E = c ∇×B − 4πj ∂t ∇·E = 4πρ. 2.2. QUANTISIERUNG DER FELDOSZILLATOREN 9 Aus der ersten Gleichung erhält man durch skalare Multiplikation mit Modenentwicklungen für E B, und Einsetzen von ∇×bk = (w/c)ek , êk (r), Einsetzen der und Integration über r: q̇k = ωk pk + gk (t) mit 1 gk (t) = − ωk Z dr j(r, t)ek (r). erzwungene Schwingungen aus. Die obige Glei- Die Feldoszillatoren führen jetzt also chung kann auch aus dem Hamilton'schen Formalismus erhalten werden; dazu nimmt man in H einen Zusatzterm 1 H1 = − c Z dr j(r, t)A(r, t) = X auf. Für den longitudinalen Anteil von lediglich die pk (t)gk (t) k Bestimmungsgleichung Z Ek = −∇φ φ(r, t) = dr0 E erhält man keine Bewegungsgleichung, ∇·Ek = 4πρ mit der Lösung sondern ρ(r0 , t) |r − r0 | Im Hamilton'schen Formalismus spielen also, wenigstens in der Coulomb-Eichung, die Gröÿen A und φ recht unterschiedliche Rollen: A ist eine Linearkombination von Impulsen von φ ist ein Integral über Feldoszillatoren und wird in der Quantentheorie zu einem Operator; die Ladungsverteilung und hat mit den Feldoszillatoren nichts zu tun; es bleibt auch in der Quantentheorie eine reine Zahlenfunktion, wenigstens bezüglich der Freiheitsgrade des elektromagnetischen Feldes. (Die Ladungsverteilung ρ kann, wie wir später sehen werden, unter Umständen selbst Operatorcharakter haben; wenn chung vorkommt, muss weiters r φ(r, t) in einer Schrödingerglei- als der Ortsoperator des beschriebenen Teilchens inter- pretiert werden. Dies sind übrigens Komplikationen die bei der Interpretation von A(r, t) genauso auftreten.) 2.2 Quantisierung der Feldoszillatoren Wie zuerst von Dirac vorgeschlagen wurde, kann man aus der im vorherigen Abschnitt behandelten Hamilton'schen Theorie des Strahlungsfeldes dadurch eine Quantentheorie erhalten, dass man die Koordinaten durch Operatoren [Pk , Qk0 ] = Qk und Pk , qk und die Impulse X1 ~ δkk0 i k 2 ωk Pk2 + Q2k der Feldoszillatoren ersetzt die die Vertauschungsrelationen erfüllen. Man erhält so für die Hamiltonoperatoren H= pk H1 = X k Pk gk (t). 10 KAPITEL 2. Zur Diskussion des Spektrums von QUANTENTHEORIE DES STRAHLUNGSFELDES H führen wir, wie für normale Oszillatoren, Leiter- operatoren ein: 1 a†k = √ (Qk − iPk ) 2~ r ~ Pk = −i (ak − a†k ). 2 1 ak = √ (Qk + iPk ) 2~ r ~ Qk = (ak + a†k ) 2 Hieraus folgen die Vertauschungsrelationen h i ak , a†k0 = δkk0 und der Ausdruck für den freien Hamiltonoperator H= X k 1 † ~ωk ak ak + . 2 Die Eigenwerte dieses Operators sind, wie für normale Oszillatoren, E{nk } = X ~ωk k 1 nk + 2 mit willkürlichen nk ≥ 0. Dies sieht auf den ersten Blick wegen der Divergenz der Summe P 1 physikalisch ~ k ωk ziemlich beunruhigend aus. Weil aber nur 2 relevant sind, können wir den divergenten Term in H genausogut weglassen und schreiben Energieunterschiede H= X ~ωk a†k ak E{nk } = k X ~ωk nk . k Das heiÿt aber nicht, dass die sogenannte Nullpunktsenergie physikalisch völlig ohne Bedeutung ist; sie spielt eine Rolle, wenn wir Änderungen der Randbedingungen vornehmen. Dazu betrachten wir z.B. einen kubischen Hohlraum, der durch eine bewegliche Metallplatte in zwei Teile geteilt ist. Die Eigenschwingungen des geteilten Hohlraumes hängen von der Position der Platte ab. Die damit zusammenhängende Änderung der Nullpunktsenergie führt zu einer die Platte, die von Casimir Kraft auf berechnet werden konnte. Seine Ergebnisse konnten später experimentell genau bestätigt werden. Dies ist ein typisches Phänomen für die Quantentheorie von Systemen mit unendlich vielen Freiheitsgraden: In einer solchen Theorie treten oft formal divergente Ausdrücke auf, die man zuerst wegen ihrer prinzipiellen Nichtbeobachtbarkeit ausser Acht lassen kann. Bei genauerer Betrachtung ergibt aber die Änderung eines solchen Ausdrucks bei Änderung irgendeines Systemparameters (eine Gröÿe, die nur mit Hilfe recht abenteuerlicher mathematischer Verfahren überhaupt berechnet werden kann) einen interessanten beobachtbaren physikalischen Eekt. Die quantitative Vorhersage, erhalten durch solche abenteuerliche Manipulationen mit divergenten Gröÿen, stimmt dann typischerweise sehr genau mit den experimentellen Beobachtungen überein. 2.2. QUANTISIERUNG DER FELDOSZILLATOREN 11 2.2.1 Der Hilbertraum des Strahlungsfeldes Bisher haben wir zwar die Operatoren H , B und E eingeführt, aber noch nicht den Hilbert- raum speziziert, in dem sie arbeiten. Die Analogie mit der herkömmlichen Quantenmechanik legt es aber nahe, die Eigenzustände von H als Basiszustände (Basis-Eigenvektoren) des Hilbertraumes zu verwenden. Eine zentrale Rolle spielt der Vakuumzustand |{0} , deniert durch ak |{0} = 0 für alle der dem Grundzustand von H k, entspricht. Durch mehrfaches Anwenden von Erzeugungs- operatoren erhält man die Zustände nk † Y ak |{0} √ |{nk } = nk ! k (mit nur endlich vielen E{nk } = X nk 6= 0!), (2.1) die den Energieeigenwerten ~ωk nk k entsprechen. Als neue Sprachregelung führen wir ein, dass sich im Strahlungsfeld im Zustand |{nk } nk jeweils Photonen der Sorte k benden. Dabei ist die Sorte durch die Modenfunktion speziziert. Der von den Basisvektoren aufgespannte Raum ( Fockraum. Er besteht aus allen Linearkombinationen X |φ = c{nk } |{nk } {nk } mit X ??) heiÿt |c{nk } |2 = 1. {nk } Dabei läuft die Summation über alle Reihen ganzer Zahlen ist. nk , bei denen P k nk endlich 2.2.2 Superposition von Zuständen ??) und den Vertauschungsrelationen zwischen ak Aus der Denition ( leicht herleiten, dass der Zustand N= X a†k ak k mit dem Eigenwert n{nk } = X k nk |{nk } und a†k kann man zugleich ein Eigenzustand des Operators 12 KAPITEL 2. ist. Der Operator als die |{nk } N QUANTENTHEORIE DES STRAHLUNGSFELDES Photonenzahloperator; N hat wesentlich mehr Eigenzustände heiÿt . So ist z. B. auch der Zustand |α, β = αa†k + βa†l |{0} ein Eigenzustand von N |α|2 + |β|2 = 1 mit dem Eigenwert 1. Er entspricht einem Feld, in dem ein ein- zelnes Photon in irgendeiner (gleich genauer zu bestimmenden) linearen Superposition der ek (r) und el (r) angeregt ist. Die Zeitentwicklung −iωl t † −iωk t † al |{0} ; |α, β t = αe ak + βe Moden der Zustand ist also nur für den Spezialfall ωk = ωl des obigen Zustandes ist ein stationärer Zustand. Der obige Zustand beschreibt also eine ganz andere Situation als der Zustand |1k , 1l = a†k a†l |{0} . Letzterer ist immer stationär; er entspricht der Situation, in der das Feld genau zwei Photonen enthält, eins der Sorte k und eins der Sorte l . Um die physikalische Bedeutung von Zuständen des Typs |α, β etwas genauer zu bestim- men, betrachten wir den Operator des elektrischen Feldes, der geschrieben werden kann als r E(r, t) = X k h i ~ ek (r) ak (t) + a†k (t) . 2 (2.2) Eine ähnliche Darstellung sollte es natürlich für jede Wahl eines vollständigen Systems {ek (r)} geben. Wir betrachten insbesondere eine unitäre Basistransformation energetisch entartete Eigenfunktionen miteinander vermischt: Ukl = 0 falls ωk 6= ωl . Ukl , die nur (2.3) Man überprüft leicht, dass man mit Hilfe der Transformationen ẽk = X Ukl el ãk = l X Ukl∗ al ã†k = X l Ukl a†l l die Darstellung E(r, t) = X k r h i ~ ẽk (r)ãk (t) + ẽ∗k (r)ã†k (t) 2 erreicht. Für den Hamiltonoperator erhält man H= X ~ωk ã†k ãk , k und es liegt nahe, ã†k als Erzeuger eines Photons mit der Modenfunktion ẽk zu interpretieẽk anstelle von ẽ∗k werden wir gleich ein Argument geben.) ren. (Für die Wahl von 2.2. QUANTISIERUNG DER FELDOSZILLATOREN 13 Beispiel 1: e1 ∼ êx cos kz e1,2 ∼ êx e e2 ∼ êx sin kz ±ikz ã†1,2 erzeugen Photonen mit den Wellenvektoren +kêz bzw −kêz . Dieses ∗ Beispiel gestattet es, die obige Mehrdeutigkeit zwischen ẽk und ẽk zu entscheiden. Falls wir jedem Photon mit Wellenvektor k einen Impuls ~k zuordnen, so liegt es nahe, als Operator für den Gesamtimpuls P des Feldes den Ausdruck X P= ~k a†k,i ak,i Die entsprechenden k,i anzusetzen. Nur für die oben festgelegte Identikation stimmt dies mit dem Ausdruck 1 P= 4πc Z dr E(r)×B(r) V aus der Maxwelltheorie überein. Beispiel 2: e1 ∼ êx eikz e2 ∼ êy eikz Linearkombinationen von a†1 und a†2 mit reellen Koezienten erzeugen linear polarisierte Photonen mit einem Polarisationsvektor in der x-y-Ebene. Für ein komplexes Verhältnis α/β α/β = ±i erhält man elliptische Polarisation; insbesondere für links oder rechts zir- kular polarisierte Photonen. Wellenpakete ??) fallen lässt, so geht die Dia- Wenn man im obigen Formalismus die Nebenbedingung ( H gonalform von in der Transformation verloren. Die ã†k erzeugen dann Photonen, die keinen stationären Zuständen des Strahlungsfeldes entsprechen, sondern Wellenpaketen. Bei der Denition der Amplitude eines solchen Wellenpaketes tritt allerdings eine Komplikation auf. Das Betragsquadrat der Gröÿe X ẽl (r) = Ulk ek (r) k hängt mit der Energiedichte zusammen. Die entsprechende Gröÿe für die Teilchendichte setzen wir an als f̃l (r) = X k Ulk (4πωk )−1/2 ek (r) 14 KAPITEL 2. Aus der Normierung der kann also als ek QUANTENTHEORIE DES STRAHLUNGSFELDES folgt, dass |f̃l |2 immer auf eins normiert ist; sein Betragsquadrat Aufenthaltswahrscheinlichkeit des Photons interpretiert werden. Diese Interpretation wird unterstützt vom folgenden Lemma: Seien b†1 = X U1k a†k b†2 = X k U2k a†k k und entsprechend fi (r) = X Uik (4πωk )−1/2 ek (r) k so gilt Z h i X † ∗ U1k U2k = dr f1∗ (r)f2 (r). b1 , b2 = V k Insbesondere verschwindet also der Kommutator, falls die Funktionen f1 (r) und f2 (r) nicht überlappen: Man kann kein Photon vernichten an einem Punkt, wo das Photon sich nicht aufhält. Die obige Betrachtung ist recht plausibel, aber genau gesehen wurde die intuitive Bedeutung der Bezeichnung Erzeuger oder Vernichter etwas überstrapaziert! In einer vernünftigen Theorie sollte man eigentlich überhaupt nicht von Aufenthaltswahrscheinlichkeiten für Photonen reden, sondern nur von Nachweiswahrscheinlichkeiten für ganz bestimm- te Detektoren (mit ggf. frequenzabhängigen Empndlichkeiten). Weiters sollte man im Auge behalten, dass die Wellenausbreitung des Lichtes im Vakuum nicht-dispersiv ist. Das Auseinanderlaufen von Wellenpaketen ist also lediglich auf Unschärfe in der Richtung von k zurückzuführen. Für ein zur Zeit für spätere Zeiten ẽl (r, t) und f̃l (r, t) t=0 scharf lokalisiertes Wellenpaket sind also auch in den gleichen Teilen des Raumes konzentriert. (Die zeitabhängigen Amplituden erhält man dadurch, dass man in der Entwicklung nach den sta−iωk t tionären Modenfunktionen jedem ek (r) einen Zeitfaktor e gibt.) Schlieÿlich enthalten die meisten in der Praxis auftretenden Wellenpakete nur Komponenten aus einem relativ schmalen k-Bereich (d.h. sie haben eine relativ wohldenierte Energie). Auch deshalb ist der Unterschied zwischen ẽl und f̃l für die Praxis eher unwichtig. 2.2.3 Einstein-Podolsky-Rosen Korrelationen Ein spezieller Typ von Zuständen mit typisch quantenmechanischen Eigenschaften tritt z.B. beim Zerfall eines ruhenden Positronium-Atoms aus dem Grundzustand in zwei γ -Quanten auf. Aufgrund der Erhaltung von Impuls und Drehimpuls weiÿ man, dass der gebildete Zwei-Photonzustand einen Gesamtimpuls und einen Gesamtdrehimpuls gleich Null haben 2.2. QUANTISIERUNG DER FELDOSZILLATOREN 15 muss. Impuls und Drehimpuls der einzelnen Photonen sind aber völlig unbestimmt. Ein Zustand der diese Anforderungen erfüllt ist i h X |pos ∼ g(|k|) a†k,+ a†−k,− + a†k,− a†−k,+ |{0} ; k a†k,± die Erzeuger für Photonen mit Impuls k und positive, bzw negative zirkulare Polarisation. Die Funktion g(k) ist so gewählt, dass X f (r) = g(k)eikr (4πωk )−1/2 hier bezeichnen die k t ist dann auf einer Kugelschale mit dem Radius R = ct lokalisiert. Für genügend groÿes R in Richtung (θ, φ) tragen zur Amplitude in R nur Partialwellen mit k in Richtung (θ, φ) bei. Ein Detektor in (R, θ, φ) spricht also im Zustand |pos nur auf Photonen mit k in Richtung (θ, φ) an. Wie man leicht nachprüft, hat der Zustand |pos die Eigenschaft 0 aki a−k0 j |pos = 0 falls k 6= −k . in der Nähe des Ursprungs lokalisiert ist. Die entsprechende Amplitude zur Zeit Mit der intuitiven Deutung der Vernichter heiÿt dies für den Fall, dass die Kugel mit Radius R mit vielen Detektoren besetzt ist: Wenn ich im Punkt (R, θ, φ) ein Photon aus dem Zustand |pos detektiere, so weiÿ ich damit auch, dass zu etwa der gleichen Zeit nur der Detektor im Punkt (R, π − θ, 2π − φ) ein Photon detektieren kann; alle anderen Detektoren sehen mit Sicherheit nichts. Ich erhalte also Information über Ereignisse, die in der Relativitätstheorie als zu mir raumartig bezeichnet werden. Dieser Aspekt der Quantentheorie, der zuerst von Einstein, in Zusammenarbeit mit Podolsky und Rosen bemerkt wurde, war für ihn Anlass, die Quantentheorie trotz ihrer Erfolge abzulehnen oder zumindest als eine unvollständige Theorie zu bezeichnen. Auf den ersten Blick erscheint ein Ausweg möglich, wobei man den Photonen verborgene Parameter zuschreibt, die von der Quantentheorie nicht erfasst werden. Das obige Experiment wäre dann vergleichbar mit einem Versuch, in dem ich zwei Hälften einer Banknote an zwei weit auseinander wohnende Freunde mit perfekt synchronisierter Postzustellung zuschicke; in dem Fall würde sich niemand über Informationen mit Überlichtgeschwindigkeit bezüglich gelesener Seriennummern usw. aufregen. Erklärungsversuche dieser Art scheitern aber, wenn man auch die Polarisationsfreiheitsgrade mit ins Spiel bringt. Wenn man sich auf die Komponenten mit man für |pos und k in der z -Richtung beschränkt, so überprüft man leicht, dass die zwei äquivalenten Darstellungen |pos ∼ a†k,+ a†−k,− + a†k,− a†−k,+ |{0} |pos ∼ a†k,x a†−k,x + a†k,y a†−k,y |{0} 16 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES angeben kann. (Der Beweis benützt die oben in Beispiel 2 gegebenen Beziehungen.) Mit einem Argument wie oben schlieÿt man, dass aus Information über entweder die lineare oder die zirkulare Polarisation des einen Photons sofortige Information über die entsprechende Polarisation des anderen Photons folgt. Weil ich weiters mit der Entscheidung, ob ich lineare oder zirkulare Filter vor meine Detektoren setze, warten kann bis die Photonen schon emittiert sind, müssen die Photonen in einer Verborgenen-Parameter-Theorie also genaue Information sowohl über ihre zirkulare als auch über ihre lineare Polarisation mit sich führen. Da dies genaue Kenntnisse über die Werte zweier nicht-vertauschenden Operatoren [für etwas explizitere Angabe dieser Operatoren siehe Kap. II des Skriptums Quantenmechanik] bedeuten würde, impliziert eine solche Vorstellung eine Verletzung der Heisenberg'schen Unschärferelationen; letztere sind aber in Experimenten vom Stern-Gerlach Typ vielfach bestätigt worden! Bemerkung 1: Bei der praktischen Durchführung von Experimenten, in denen die Filter erst nach der Emission der Photonen eingestellt werden (delayed choice experiments), muss vom obigen Schema etwas abgewichen werden; die Photonen müssen durch Spiegel umgeleitet und aufgehalten werden, damit eine synchrone Einstellung rechtzeitig stattnden kann. Bemerkung 2: Ein quantitativer Test von Theorien mit verborgenem Parameter kann mittels der sog. Bell'schen Ungleichungen erfolgen. Dies sind Ungleichungen über Koinzidenzraten zwischen Photonen-Detektoren mit verschieden geneigten Polarisationsltern; sie sind erfüllt in Theorien mit verborgenen Parametern (und ohne instantane Wechselwirkungen), aber verletzt für Quantenzustände vom Typ |pos . Experimente von Clauser und Shimony, und später von Aspect, zeigten klare Verletzungen der Bell'schen Ungleichungen, und widerlegten damit klar die natürliche Theorie mit verborgenen Parametern. 2.2.4 Verborgene Variablen und die Bell'sche Ungleichung Wir betrachten für die Einstein-Podolsky-Rosen-Anordnung den Operator Werte θ +1 bzw. −1 annimmt, falls das Photon mit Impuls +~k A+ (θ), der die einen unter dem Winkel zur x-Achse geneigten Polarisationslter passiert, bzw. nicht passiert. Ähnlich deniert man den Operator A− (θ) für das Photon mit dem Impuls −~k . Die Korrelation P(θ1 , θ2 ) ist deniert als Erwartungswert des Produktes dieser Operatoren P(θ1 , θ2 ) = hA+ (θ1 )A− (θ2 )i . Die Quantenmechanik macht für P(θ1 , θ2 ) die Vorhersage P(θ1 , θ2 ) = cos [2 (θ1 − θ2 )] . (2.4) 2.2. QUANTISIERUNG DER FELDOSZILLATOREN 17 In einer Theorie mit verborgenen Variablen macht man die Annahme, dass das Ergebnis der Messung sämtlicher Operatoren λ, A± (θ) festgelegt ist durch einen verborgenen Parameter der bei der Präparation des Systems gemäÿ einer Wahrscheinlichkeitsverteilung λ kann dabei willkürlich sein.) A± (θ; λ) die die Werte ±1 annehmen können, und es gilt Z P(θ1 , θ2 ) = dλ ρ(λ)A+ (θ1 ; λ) A− (θ2 ; λ). gesetzt wird. (Der Wertebereich von ρ(λ) Es existieren also Funktionen Aus dem experimentellen Ergebnis P(θ, θ) =1 folgt (mindestens für fast alle λ) A+ (θ; λ) = A− (θ; λ), und daher werden wir weiters die Indizes ± weglassen. Wir betrachten jetzt Z P(θ0 , θ1 ) − P(θ0 , θ2 ) = dλ ρ(λ) [A(θ0 ; λ)A(θ1 ; λ) − A(θ0 ; λ)A(θ2 ; λ)] Z dλ ρ(λ)A(θ0 ; λ)A(θ1 ; λ) [1 − A(θ1 ; λ)A(θ2 ; λ)] , wobei wir die Identität A2 (θ; λ) = 1 ausgenutzt haben. Der Ausdruck in den eckigen Klammern ist positiv semidenit; es gilt also die Ungleichung Z |P(θ0 , θ1 ) − P(θ0 , θ2 )| 6 dλ ρ(λ) [1 − A(θ1 ; λ)A(θ2 ; λ)] , oder |P(θ0 , θ1 ) − P(θ0 , θ2 )| 6 1 − P(θ1 , θ2 ). (2.5) Dies ist die Bell'sche Ungleichung. Sie ist mit der (experimentell bestätigten) Vorhersage ??) ( der Quantenmechanik unverträglich. Dazu betrachtet man z.B. die Umgebung des Punktes θ1 = θ2 . Die linke Seite ist linear in Ableitung von P nach θ0 |θ1 − θ2 |, falls man θ0 nicht so wählt, dass die verschwindet. Die rechte Seite dagegen ist quadratisch in für den (experimentell bestätigten) Ausdruck ( ??) verletzt ist! θ1 − θ2 ??); es gibt also sicher einen Bereich, wo die Ungleichung ( Unser Schluss ist: Eine Theorie mit verborgenen Zuständen kann die Ergebnisse der Quantenmechanik für EPR-Zustände nie voll reproduzieren. Im Experiment wählt man Werte von θ0 , θ1 und θ2 für die die Verletzung der Ungleichung möglichst groÿ ist, und auf jeden Fall gröÿer als der experimentelle Messfehler. 2.2.5 Erwartungswerte von Feldoperatoren; Kohärente Zustände B(r, t)in den ak und a†k Erwartungswerte in den Zuständen |{nk } : {nk }|E(r, t)|{nk } = {nk }|B(r, t)|{nk } = 0 Da die Feldoperatoren E(r, t) und linear sind, verschwinden ihre 18 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES Zustände mit nicht-verschwindenden Erwartungswerten von nationen von |{nk } E und B müssen Linearkombi- mit unterschiedlichen Besetzungszahlen sein. Die wichtigsten Beispie- le solcher Zustände sind die kohärenten Zustände. Diese erhält man auf natürliche Weise durch Betrachtung des Hamiltonoperators für das Strahlungsfeld in Wechselwirkung mit j(r, t). Wie im vorherigen r X ~ X ak − a†k gk (t). H(t) = ~ωk a†k ak − i 2 k k einer klassischen Stromdichte Die Heisenberg'schen Bewegungsgleichungen für die Abschnitt gezeigt wurde, gilt: ak (t) lauten i d ih ak (t) = Ĥ(t), ak (t) , dt ~ wobei Ĥ(t) den Hamiltonoperator im Heisenbergbild (d.h. mit zeitabhängigen ak und a†k darstellt. Der obige Ausdruck liefert 1 d ak (t) = −iωk ak (t) + √ gk (t) dt 2~ oder d 1 ak (t)eiωk t = √ eiωk t gk (t). dt 2~ Die Lösung ist ak (t)e iωk t Z t 1 0 dt0 eiωk t gk (t0 ) = ak + √ 2~ 0 = ak + αk (t), oder ak (t) = [ak + αk (t)] e−iωk t (2.6) und, auf völlig analoge Weise h i a†k (t) = a†k + αk∗ (t) eiωk t . Jetzt nehmen wir zusätzlich an, dass die Stromdichte verschwindet. Weiters soll das System für j(r, t), gk(t), für t < 0 |{0} sein. Damit und damit t = 0 im Vakuumzustand |{0} festgelegt. Den Schrödingerzustand ist der Zustand im Heisenbergbild also auch auf |{0}; t . Aus der Invarianz sämtlicher Matrixelemente für den Übergang zwischen Schrödinger- und Heisenbergbild erhält man für willkürliches |ψ ψ|ak (t)|{0} = ψ; t|ak |{0}; t . bezeichnen wir mit 2.2. QUANTISIERUNG DER FELDOSZILLATOREN 19 ??) Andererseits folgt mit Hilfe von ( ψ|ak (t)|{0} = e−iωk t ak (t) ψ|{0} = e−iωk t ak (t) ψ; t|{0}; t . Aus der Gleichheit der beiden Ausdrücke für willkürliches |ψ, t , |ψ , also auch für willkürliches folgt ak |{0}; t = αk (t)e−iωk t |{0}; t . Der Zustand |{0}; t ist also ein Eigenzustand sämtlicher {ak } mit Eigenwerten αk (t) exp [−iωk t]. Solche Eigenzustände für normale Oszillatoren haben wir im Skriptum Quantenmechanik diskutiert. Sie heiÿen kohärente Zustände und werden mit |α bezeichnet. Der Zusam- menhang mit den Energieeigenzuständen ist X αn 1 2 √ |n . |α = e− 2 |α| n! n Insbesondere gilt in diesem Zustand eine Poissonverteilung der Zahl der Energiequanten: 2n 2 |α| | n|α |2 = e−|α| . n! Die Verallgemeinerung für das Strahlungsfeld ist " # " # X Y (αk )nk 1X √ |{αk } = exp − |αk |2 |{nk } . 2 k nk ! k {nk } Der Zustand |{0}; t ist also, bis auf |{ak (t) exp [−iωk t]} identisch. Insbesondere dende Erwartungswerte für E und B: {0}; t|E(r, t)|{0}; t = Re{E(r, t)} einen Phasenfaktor, gibt es im Zustand mit |{0}; t dem Zustand nichtverschwin- mit √ E(r, t) = 2~ X ek (r)αk (t)e−iωk t . k Dieser Erwartungswert ist genau die Lösung des entsprechenden klassischen Problems. Die kohärenten Zustände eines Oszillators haben die zusätzliche Eigenschaft, dass die Schwankungen von Energie und Impuls in ihnen genauso groÿ sind wie im Grundzustand. Auch diese Eigenschaft lässt sich auf das Strahlungsfeld übertragen. Allerdings erhält man für die Schwankungen im Grundzustand einen unendlichen Beitrag. Bei der Ausarbeitung von X ~ ek (r)ek0 (r) ak + a†k ak0 + a†k0 |{0} {0}| |E(r)|2 |{0} = {0}| 2 kk0 20 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES liefern nur die Terme mit {0}|ak a†k0 |{0} = δkk0 einen Beitrag; alle sonstigen Terme verschwinden wegen ak |{0} = {0}|a†k = 0. −1 Die nichtverschwindenden Terme sind alle aber etwa von der Gröÿe ωk V und führen zu 2 einer Divergenz. Der Operator |E(r)| ist also nicht wohldeniert. Aus schlechtdenierten Operatoren dieser Art kann man wieder wohldenierte machen durch Subtraktion des divergenten Anteils, also hier des Vakuumerwartungswertes. Für einen Operator man den nichtdivergenten Anteil :A: A deniert symbolisch als : A : = A − {0}|A|{0} . Eine etwas präzisere Vorschrift ist: a) b) Schreibe A als ein Polynom in den {ak } und {a†k0 } Ändere in jedem Term die Reihenfolge der Faktoren so, dass alle a†k0 , stehen. ak rechts von allen Durch diesen letzten Schritt ist das Verschwinden des Vakuumerwartungswertes gesichert. : A : heiÿt die normalgeordnete Version von A. Als Beispiel betrachten wir h i ~X ek (r)ek0 (r) ak ak0 + a†k a†k0 + a†k ak0 + a†k0 ak . : |E(r)|2 : = 2 kk0 Der Operator Es lässt sich leicht zeigen, dass gilt 2 {αk }| : |E(r)|2 : |{αk } = {αk }| E(r) |{αk } , also das Feld E hat im Zustand |{αk } keine gröÿeren Schwankungen als im Vakuumzustand. Dasselbe lässt sich für das B-Feld auf gänzlich analoge Weise zeigen. Die Zustände |{αk } sind also so klassisch wie in der Quantentheorie nur möglich. 2.2.6 Regularisierung der Feldoperatoren Die oben aufgetretenen Schwierigkeiten (Divergenzen des Schwankungsquadrats) können darauf zurückgeführt werden, dass wir uns wieder etwas zu weit von der physikalischen Realität entfernt haben. In der Praxis misst man nie das Feld an einem scharfen Punkt, sondern höchstens den Mittelwert des Feldes über ein Gebiet der Gröÿe z.B. eines Licht absorbierenden oder stimuliert emittierenden Atoms. Mathematisch kann man dies darstellen durch eine φ(r − r0 ) und daran anschlieÿend die sog. Verschmierungsfunktion regularisierten Operatoren Z Eφ (r) = dr0 φ(r − r0 )E(r0 ) 2.2. QUANTISIERUNG DER FELDOSZILLATOREN einführen, wobei φ(r) 21 eine glatte, positive Funktion mit beschränkter Reichweite ist, die im übrigen ziemlich frei gewählt werden kann. Für das Schwankungsquadrat dieser Gröÿe im Vakuum erhält man Z 2 X ~ X 2 0 0 0 dr φ(r − r )ek (r ) ≡ {0}| |Eφ (r)| |{0} = |φ̃k |2 . 2 k k Da φ glatt ist, nehmen die Entwicklungskoezienten ponenten sind, mit zunehmendem k φ̃k , die im wesentlichen Fourierkom- sehr rasch ab, und das Schwankungsquadrat der re- gularisierten Feldoperatoren ist endlich, aber natürlich von der genauen Wahl von φ(r) abhängig. Regularisierungsmethoden sind fast unumgänglich, falls wir die Unschärferelation zwischen 0 den Feldern E und B diskutieren wollen. Für die Operatoren Ei (r) und Aj (r ) erhält man aus den Modenentwicklungen den Kommutator [Ei (r), Aj (r0 )] = X eki (r) [Qk , Pk ] kk0 = i~c X c ek0 j (r0 ) ωk0 ωk−1 eki (r)ekj (r0 ). k Die Funktionen ek (r) bilden aber einen vollständigen Satz von Funktionen im Raum der rein transversalen Vektorfelder: X k wobei ⊥ θij 1 ⊥ eki (r)ekj (r0 ) = θij (r − r0 ), 4πωk den Projektionsoperator auf die transversalen Felder darstellt. Dessen Fourier- transformierte ist bekanntlich ⊥ θij (k) ∼ δij − ki kj ; k2 r-Darstellung werden wir nicht schen Ei und Bj interessiert sind: die brauchen, weil wir letztendlich am Kommutator zwi- [Ei (r), Bj (r0 )] = 4πi~c jkl ∇0k θil⊥ (r − r0 ). In dem Ausdruck für θil⊥ (k) ist der Zusatzterm rein longitudinal, und seine Rotation ver0 schwindet. Der erste Term ist die Fouriertransformierte von δij δ(r − r ), so dass wir letztendlich erhalten [Ei (r), Bj (r0 )] = 4πi~c ijk ∇0k δ(r − r0 ). Dieser Ausdruck ist nur für verschmierte Felder sinnvoll: 0 [Eφi (r), Bψj (r )] = 4πi~c ijk ∇0k Z dr00 φ(r − r00 )ψ(r0 − r00 ). 22 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES Unschärferelationen Aus diesem Kommutator erhält man mit der üblichen Prozedur 0 zwischen Eφi (r) und Bψj (r ). Wie zuerst von Bohr und Rosenfeld analysiert wurde, sind die Verhältnisse recht subtil: Um φ Eφ (r) scharf bestimmen zu können, muss ich die Funktion ziemlich breit wählen. Dies impliziert aber, dass es auch ein relativ groÿes Gebiet gibt, Bψ (r0 ) nicht gleichzeitig scharf bestimmen kann. Die obige Analyse erweist sich in dem ich aber trotz ihrer Subtilität als für die Praxis nicht allzu bedeutsam; wie wir im nächsten Abschnitt sehen werden, messen die meisten Detektoren nicht E oder B, sondern den nichtdivergenten Anteil irgendeines quadratischen Ausdrucks in den Feldern. Gerade weil die Vakuumuktuationen so stark sind, empehlt es sich, Detektoren so zu konstruieren, dass sie auf die Vakuumuktuationen überhaupt nicht reagieren. Die obigen Überlegungen dienen lediglich dazu, klar zu machen, dass die Messung der Felder Eφ und Bψ nicht zu prinzipiellen Schwierigkeiten in der Theorie führt. 2.3 Das Strahlungsfeld in Wechselwirkung mit Atomen In diesem Abschnitt betrachten wir ein Atom in Wechselwirkung mit dem Strahlungsfeld. Der Einfachheit halber werden wir das Atom meistens durch ein Ein-Elektron-System ersetzen (Leuchtelektron-Näherung), und auch seine Schwerpunktsbewegung vernachlässigen. Diese Einschränkungen lassen sich alle ohne viel Schwierigkeiten aufheben, allerdings auf Kosten einer weiteren Komplizierung der Notation. Die Güte der Leuchtelektronnäherung wird insbesondere auch im nächsten Kapitel noch zur Sprache kommen. Wir werden annehmen, dass die Engergieeigenwerte und Eigenzustände des Atoms, ggf. in hinreichender Näherung, bekannt sind, und sie mit dem Label A bezeichnen: Hat |A = EA |A . Der Hilbertraum des Gesamtsystems ist das direkte Produkt des Hilbertraumes für das Atom und desjenigen für das Strahlungsfeld. Seine Basiszustände werden wir mit |A; {nk } bezeichnen. Für die Physik spielen auch Superpositionen mit Korrelationen zwischen Atom und Strahlungsfeld oft eine wesentliche Rolle. Für die Einführung der Wechselwirkung zwischen Atom und Strahlungsfeld gibt es, solange wir die Spinfreiheitsgrade auÿer Betracht lassen, eine universelle Vorschrift: Man ersetze im atomaren Hamiltonoperator den Impulsoperator pi eines Teilchens mit der Ladung ei durch pi − wobei ri ei A(ri ), c den Ortsoperator des betreenden Teilchens darstellt. Weil man es in der Praxis meist mit Elektronen zu tun hat, werden wir für dann ei auch e schreiben; diese Gröÿe wird negativ sein. Mit der obigen Substitution erhält man für die kinetische Energie des Elektrons 2 1 e p2 e e2 [pi A(ri ) + A(ri )pi ] + |A(ri )|2 . pi − A(ri ) = i − 2 2m c 2m 2mc 2mc 2.3. DAS STRAHLUNGSFELD IN WECHSELWIRKUNG MIT ATOMEN 23 In störungstheoretischen Rechnungen niedrigster Ordnung kann man den letzten Term weglassen, weil seine Eekte in erster Ordnung mit den Eekten des ersten Terms in zweiter Ordnung vergleichbar sind. Weiters kommutieren ratoren pi und A(ri ); in Coulomb-Eichung die Ope- der Kommutator in Ortsdarstellung enthält nämlich ∇·A(r). Der Wechselwirkungs-Hamiltonoperator beträgt also in niedrigster Ordnung HI = − Weil e pi A(ri ). mc (e/m)pi als der vom Teilchen getragene Strom interpretiert werden kann, ist dieser Ausdruck mit unserem Ausdruck für die Ankopplung an eine klassische Stromdichte analog. Für ein Teilchen mit Spin hat man den Zusatzterm HI0 = − e~ ~σi B(ri ), 2mc auf dessen Herleitung wir in Zusammenhang mit der Dirac-Gleichung noch zurückkommen werden. 2.3.1 Wahl der störungstheoretischen Behandlung In der Quantenmechanik kennt man zwei theoretische Verfahren, die stationäre und die zeitabhängige Störungstheorie. Für einen zeitunabhängigen Hamiltonoperator, wie er in unserem Fall vorliegt, sind im Prinzip beide anwendbar. Für die Anwendung haben aber beide ihre Vor- und Nachteile: Die stationäre Störungsrechnung ist im Prinzip leistungsfähiger, aber sie wird recht schwerfällig, wenn Entartung vorliegt. Dies ist für die von uns betrachteten Systeme immer der Fall; der Zustand EA − EB . |A; {0} ist z.B. entartet mit allen |B; 1k mit EB < EA und ~ωk = Die stationäre Störungsrechnung ndet denn auch kaum Anwendung in der Theorie des Strahlungsfeldes. Die zeitabhängige Störungsrechnung beruht auf einer Störungsentwicklung für den Evolutionsoperator im Wechselwirkungsbild. Sie ist insbesondere zugeschnitten auf die Behandlung von Prozessen, bei denen der Endzustand im kontinuierlichen Spektrum des ungestörten Hamiltonoperators liegt. Allerdings ist dies eine Entwicklung nach der Zahl der Male, die die Störung wirksam wird; der Formalismus ist also vor allem für dauernde Prozesse kurz an- geeignet, z. B. Zerfalls- oder Streuprozesse, bei denen das Photon sich räumlich rasch vom Atom trennt. Für Atome in Hohlräumen oder Laserresonatoren trit dies nicht zu; dort werden wir einen Teil des Wechselwirkungsoperators in den ungestörten Hamiltonoperator herüberholen müssen. Auch für die Beschreibung der Wechselwirkung eines Atoms mit den Vakuumuktationen des Strahlungsfeldes, die zur sog. Lamb-Verschiebung Anlass gibt, muss die zeitabhängige Störungsrechnung etwas modiziert werden. 24 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 2.3.2 Die Matrixelemente der Störung; Die Dipolnäherung Der Hamiltonoperator ie e HI = − p·A(r) = − mc m 1/2 X ~ ek (r) † p· ak − ak 2 ωk k bewirkt in erster Ordnung Störungstheorie Übergänge unter Emission oder Absorption eines einzelnen Photons. Die Matrixelemente von HI zwischen Basiszuständen sind aufgebaut aus Atom- und Feldanteilen: ie A; {nk }|HI |B; {n0k } = − m 1/2 X 1 ~ {nk }| ak − a†k |{n0k } . A|p·ek (r)|B 2 ωk k In erster Ordnung tragen nur Matrixelemente zwischen energetisch entarteten Zuständen 0 bei, d.h. solche in denen sich {nk } und {nk } nur unterscheiden um eine einzelne Einheit für eine einzelne Mode, für die weiters noch gilt ~ωk = |EB − EA |. Die Photonen dieser Mode haben relativ zur Ausdehnung des Atoms lange Wellenlängen. Falls verschwindet, kann also ek (r) im Matrixelement durch die Lage des Atomschwerpunktes ist; ek (r0 ) ek (r0 ) A|p|B nicht ersetzt werden, wobei r0 kann auÿerhalb des Matrixelements gebracht werden, weil es die Elektronenkoordinate nicht enthält. Für das verbleibende Matrixelement gilt im im(EA − EB ) A|p|B = A| [Hat , r] |B = − A|r|B . ~ ~ (3.1) Einsetzen dieses Ausdrucks in das obige Matrixelement liefert (unter Ausnützung von ~ωk = ±(EB − EA ), wobei das Vorzeichen für den ak - und den a†k -Beitrag unterschiedlich zu wählen ist) 1/2 X ~ A|r|B · ek (r0 ) {nk }|(ak + a†k )|{n0k } = −e A|r|B · {nk }|E(r0 )|{n0k } . −e 2 k Ein Übergang mit ek (r) durch ek (r0 ) A|r|B = 6 0 heiÿt elektrischer Dipolübergang; die Näherung, in der Dipolnäherung. In dieser Näherung bewirken, wie ersetzt wird, heiÿt A2 -Term und der man leicht nachprüft, der Übergänge mehr (sie enthalten weder − r noch B·~σ -Term überhaupt p). Die Äquivalenz keine elektronischen e A(r)·p ≈ −eE(r)·r, mc welche hier nur in Störungstheorie erster Ordnung bewiesen wurde [Ersetzen von ±(EB − EA )] Störung durch lässt sich innerhalb der Dipolnäherung zu einer Ersetzung der −eE(r)·r verallgemeinern (ohne Beweis!). ~ωk durch gesamten 2.3. DAS STRAHLUNGSFELD IN WECHSELWIRKUNG MIT ATOMEN 25 2.3.3 Kurze Rekapitulation der zeitabhängigen Störungstheorie Wir betrachten ein System mit einem Hamiltonoperator H = H0 + HI , wobei die Eigenwerte und Eigenvektoren von H0 bekannt sind: H0 |i = Ei |i . Wenn wir den Zustand des Systems darstellen durch X i |ψ; t = ci (t)e− ~ Ei t |i , i so erhält man durch Substitution in die Schrödingergleichung den Satz gekoppelter Gleichungen ċi (t) = i 1 X i|HI |j e ~ (Ei −Ej )t cj (t). i~ j Diese Gleichungen können iterativ gelöst werden. Für die Anfangsbedingung ci (0) = δia erhält man in erster Ordnung (1) cf (t) 1 = i~ Z t i 0 dt0 f |HI |a e ~ (Ef −Ea )t . 0 Gelegentlich werden wir auch die zweite Ordnung brauchen: (2) cf (t) 1 X = i~ i Z t i 00 (1) dt00 f |HI |i e ~ (Ef −Ei )t ci (t00 ) 0 Z Z 00 i i 1 X t 00 t 0 00 0 dt dt f |HI |i e ~ (Ef −Ei )t i|HI |a e ~ (Ei −Ea )t . =− 2 ~ i 0 0 Die Wahrscheinlichkeit, das System zur Zeit t im Zustand Ordnung gegeben durch (1) |cf (t)|2 Für groÿes t Z 2 t 0 i (E −Ea )t0 2 1 f . ~ = 2 f |HI |a dt e ~ 0 erhält man mit Hilfe der Formel sin2 tx = πδ(x) t→∞ tx2 lim den Ausdruck (1) |cf (t)|2 = 2 2π f |HI |a δ(Ef − Ea )t. ~ |f anzutreen, ist in erster 26 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES Ein solcher Ausdruck ist nur dann sinnvoll, wenn der Zustand |f in einem Kontinuum (oder Gebiet sehr dichter Zustände) liegt. Falls weiters noch das Matrixelement in einem Energiebereich um Ef nur schwach von scheinlichkeit pro Zeiteinheit wf = wobei ρf wf Ef Fermi'schen goldenen Regel nach der 2 2π f |HI |a ρf , ~ die Zahl der Zustände vom Typ Ef es neben abhängt, so erhält man für die Übergangswahr- Raumwinkel f pro Energieintervall um Ef bezeichnet. Wenn noch einen kontinuierlichen Parameter des Endzustandes gibt, wie z.B. den dΩ, in den ein Photon emittiert oder gestreut wird, so deniert man entspre- chende dierentielle Übergangsraten wf,dΩ und Zustandsdichten ρf,dΩ . 2.3.4 Emission und Absorption von Strahlung Wir betrachten jetzt als Anfangszustand den Zustand |A; {0} , wobei |A ein angeregter atomarer Zustand ist, der Einfachheit halber ein s-Zustand. Wegen der Auswahlregeln für das Matrixelement B|r|A sind Dipolübergänge nur nach p-Zuständen möglich. Als Modenfunktionen für die Photonen wählen wir die ebenen Wellen eki (r) = wobei wir die 4πωk V êi 1/2 êi eik·r , so wählen, dass êi steht. Beim Übergang vom Zustand Polarisation êi in der (k, êz )-Ebene liegt |A nach |B, lz = 0 kann und ê2 darauf senkrecht dann nur ein Photon der emittiert werden. Wir werden weiters das Atom immer im Ursprung des Koordinatensystems platzieren. Das Matrixelement für diesen Übergang beträgt B, 0; 1k1 |HI |A; {0} = −e wobei θ den Winkel zwischen k 2πωk ~ V und êz 1/2 B, 0|z|A sin θ, (3.2) darstellt. Zur Berechnung der Zerfallsrate brauchen wir noch die Zahl der Modenfunktionen mit Energie zwischen ~ω und ~ω + dE im Raumwinkel dΩ um die Richtung k. Die Dichte der k-Werte im k-Raum ist 3 L V dk = dk. ρk dk = 2π 8π 3 erlaubten In einem Ausschnitt dΩ einer Kugelschale um ω = ck mit der Dicke dE = d(~ck) benden sich also ρE,dΩ dEdΩ = erlaubte k-Werte. wE,d2 Ω = V ω2 dEdΩ 8π 3 ~c3 Für die Zerfallsrate erhalten wir also mit Hilfe der goldenen Regel 2 e2 ω 3 2 . sin θ B, 0|z|A 2~c3 2.3. DAS STRAHLUNGSFELD IN WECHSELWIRKUNG MIT ATOMEN Weil e2 /~c die dimensionslose Feinstrukturkonstante α ≈ 1/137 27 ist, hat dieser Ausdruck die Dimension einer inversen Zeit, wie für eine Rate zu erwarten war. Um die Lebensdauer des Zustandes |A zu berechnen müssen wir a) integrieren über alle Richtungen von b) summieren über die 3 Subniveaus von c) summieren über alle p-Niveaus EB )/~ |B k; dies liefert einen Faktor |B mit R dΩ sin2 θ = 8π/3 : ein Faktor 3 EB < EA . Dabei soll ω durch ωAB = (EA − ersetzt werden. Das Ergebnis ist wA = 0 2 3 4e2 X 1 . B|z|A ωAB = 3 τA ~c B (3.3) Für Absorption und stimulierte Emission ist dasselbe atomare Matrixelement ( ??) verant- wortlich (oder dessen komplex konjugiertes). Bei der Auswertung der goldenen Regel muss jetzt aber beachtet werden, dass der Endzustand diskret ist, während der Anfangszustand im Kontinuum liegt. Das relevante Feld-Matrixelement ist √ {nl − δkl }|ak |{nl } = nk ; Die ??) geht also über in die Rate für die Absorption oder stimulierte Emission durch Rate ( Multiplikation mit der Zahl hnk i, der mittleren Zahl der Photonen pro Mode. Betrachte jetzt einen Hohlraum, in dem sich ein Atom bendet. Im thermischen Gleichgewicht müssen die Raten für Absorption und (stimulierte + spontane) Emission einander die Waage halten. Wenn wir die Wahrscheinlichkeiten, dass sich das Atom im Zustand bendet, mit pC |C bezeichnen, so muss gelten: hnk i pB = (hnk i + 1)pA . Weil im thermischen Gleichgewicht pA = e−β(EA −EB ) pB = e−β~ωk pB gelten muss, erhalten wir also für hnk iβ , der mittleren Quantenzahl pro Mode, den für Bosonen bekannten Wert hnk iβ = 1 eβ~ω −1 . Mit diesem Argument wurde zuerst von Einstein die Planck'sche Formel für die Energiedichte der Hohlraumstrahlung ~ω 3 1 U (ω)dω = 3 β~ω dω πc e −1 hergeleitet (vgl. Skriptum Thermodynamik). 28 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 2.3.5 Streuung von Photonen Als nächstes betrachten wir die Streuung eines Photons an einem Atom. Das relevante Matrixelement ist B; 1k0 j |HI |A; 1ki . A2 -Term zum Tragen, weil wenigstens ein Erzeuger In diesem Matrixelement kommt nur der und ein Vernichter auftreten muss. In der Dipolnäherung erhält man √ e2 4π ωk ωk0 c2 ~ † † 0 j |a 0 aki + aki a 0 |1ki 1 k k j k j 2mc2 V 2ωk ωk0 2 2πe ~ = δAB êj êi √ mV ωk ωk0 B; 1k0 j |HI |A; 1ki = B|A êj êi Der A2 -Term führt also nur zu elastischer Streuung. In derselben Ordnung der Störungstheorie müssen aber auch Terme mitgenommen werden, in denen der Term erster Ordnung zweimal wirkt: t0 t00 → |B; 1k0 ,j |A; 1ki − → |C; {0} − und t00 t0 |A; 1ki − → |C; 1ki 1k0 j − → |B; 1k0 ,j Der intermediäre Zustand wird i.a. nicht mit Anfangs- und Endzustand energetisch entartet sein (dieser Ausnahmefall der resonanten Streuung bedarf einer separaten Diskussion). Salopp gesagt darf das System diesen Zustand aber für eine kurze Zeit ∆t ∼ ~/∆E inneha- ben; solange bemerkt das System die Verletzung der Energieerhaltung wegen der EnergieZeit-Unschärferelation nicht (eine genauere mathematische Begründung folgt gleich). Die drei Beiträge zur Streuung werden oft wie folgt graphisch dargestellt: Graphen eines ähnlichen Typs wurden zuerst von Feynman zur Veranschaulichung von Rechnungen in der (relativistischen) Quantenelektrodynamik eingeführt; sie werden deshalb als Feynmangraphen bezeichnet. Feynman führte auch Regeln ein, die es erlauben, an Hand des Graphen sofort das zugehörige Matrixelement zu bestimmen. Wir werden statt dessen die Matrixelemente auf konventionelle Art bestimmen. Der Beitrag des ersten Diagramms zur Übergangsamplitude beträgt, wie man durch Sub(1) stitution des Matrixelements in den allgemeinen Ausdruck für cf sieht, (1) cf,I (t) 2πe2 δAB êj ·êi =− √ imV ωk ωk0 2 = Z t i 0 dt0 e ~ (EB +~ωk0 −EA −~ωk )t 0 i (EB +~ωk0 −EA −~ωk )t ~ 2πe ~ e −1 δAB êj ·êi . √ mV ωk ωk0 EB + ~ωk0 − EA − ~ωk 2.3. DAS STRAHLUNGSFELD IN WECHSELWIRKUNG MIT ATOMEN 29 Die mit dem zweiten Diagramm assoziierte Amplitude beträgt (2) cf,II √ 1 4π ωk ωk0 c2 ~ e2 X =− 2 êj ·pBC pCA ·êi ~ V 2ωk ωk0 m2 c2 C Z t Z t00 i 00 i 0 00 dt0 e ~ (EB +~ωk0 −EC )t e ~ (EC −EA −~ωk )t , × dt 0 0 wobei wir die Abkürzungen pBc = B|p|C usw. eingeführt haben. Das Doppelintegral ist elementar auswertbar: t Z 00 Z t00 dt 0 0 i t Z ~ dt . . . = i 0 00 dt e i (EB +~ωk0 −EC )t00 ~ 0 ~2 =− EC − EA − ~ωk " 00 e ~ (EC −EA −~ωk )t − 1 EC − EA − ~ωk # i i e ~ (EB +~ωk0 −EA −~ωk )t − 1 e ~ (EB +~ωk0 −EC )t − 1 − . EB + ~ωk0 − EA − ~ωk EB + ~ωk0 − EC Bei der Auswertung der Übergangsrate liefert der zweite Term (im Limes Beitrag proportional zu t → ∞) einen δ(EB + ~ω − EC ); dieser trägt nur bei, falls der Endzustand mit |C; {0} entartet ist. Dies ist der Fall resonanter Streuung, k0 einem intermediären Zustand den wir ausgeschlossen haben. Es gibt einen zweiten, etwas subtileren Grund, weshalb der zweite Term physikalisch nicht relevant ist. Ein Indiz dafür ist die oensichtliche Nichterhaltung der Energie, sowie der Umstand, dass der Übergang |A; 1ki → |C; {0} unmittelbar zur Zeit t=0 stattzunden |A; 1ki Zustand |A scheint. Das Auftreten dieses Terms hat damit zu tun, dass der Ausgangszustand nur in niedrigster Ordnung dem physikalisch gemeinten Zustand (Atom im + ein Photon der Sorte ki) entspricht. [Der physikalische Anfangszustand ist genau be- trachtet nicht der Eigenzustand |A; 1ki des ungestörten Operators, sondern der Zustand der daraus nach sanftem Einschalten der Störung Beimischung des Zustandes |C; {0} , H1 entsteht. Letzterer enthält u.a. eine deren Berücksichtigung zu einem Beitrag führt, wel- cher denjenigen des zweiten Terms in der obigen Formel genau aufhebt. Da diese Eekte bei den nichtresonanten Beiträgen bis zur betrachteten Ordnung aber ohnehin keine Rolle spielen, werden wir den dazu benötigten Formalismus nicht näher diskutieren.] Mit einer ähnlichen Rechnung lässt sich auch der Beitrag (2) cf,III des dritten Diagramms berechnen. Das Doppelintegral liefert 2 − " i (EB +~ωk0 −EA −~ωk )t ~ i (EB −EC −~ωk )t ~ # e −1 e −1 ~ − . EC + ~ωk0 − EA EB + ~ωk0 − EA − ~ωk EB − EC − ~ωk Der zweite Term trägt nur dann bei, wenn |B; {0} mit |C; 1ki entartet ist, also wieder nur für den bereits ausgeschlossenen Resonanzfall; wir werden ihn weiters weglassen. Wir 30 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES erhalten also für sämtliche Beiträge zu cf (t) denselben Zeitfaktor: " X 2πe2 ~ mδAB êj ·êi − cf (t) = − 2 √ m V ωk ωk 0 C êj ·pBC pCA ·êi êj ·pCA pBC ·êi + EC − EA − ~ωk EC + ~ωk0 − EA # i e ~ (EB +~ωk0 −EA −~ωk )t − 1 × . EB + ~ωk0 − EA − ~ωk Aus dem Betragsquadrat dieses Ausdrucks erhält man mittels einer Rechnung, die der Herleitung der Zerfallsrate völlig analog ist, für die 0 mit dem Photon k j in einem Raumwinkel dΩ wf dΩ Übergangsrate in einen Endzustand 2 2π 4π 2 e4 ~2 V ωk20 . . . dΩ = ~ m2 V 2 ωk ωk0 8π 3 ~c3 2 e4 c ωk0 = 2 4 2 . . . dΩ. m c m V ωk Streuquerschnitt an, deniert als einfallende Photonenstromdichte. Weil sich im Üblicherweise gibt man statt der Übergangsrate den die Übergangsrate dividiert durch die Zustand |1ki ein Photon im Volumen V bendet, welches sich natürlich mit der Lichtge- schwindigkeit bewegt, ist die Stromdichte in unserem Fall klassischen Elektronenradius r0 = e2 /mc2 c/V . Falls man weiters noch den einführt, erhält man für den dierentiellen Streuquerschnitt ωk0 dσ = r02 dΩ ωk 2 1 X êj ·pBC pCA ·êi êj ·pCA pBC ·êi + δAB êj ·êi − . m C EC − EA − ~ωk EC + ~ωk0 − EA Diese Formel wurde zuerst von Kramers und Heisenberg mit Hilfe der alten Quanten- theorie hergeleitet; die in dieser Formel auftretende Struktur hat Heisenberg zur Idee der Matrixmechanik geführt. Energieerhaltung gelten: Falls A = B gilt auch ωk = ωk ; man spricht dann von elastischer Streuung. Streuung mit Änderung des Bei der Streuung eines Photons muss immer 0 atomaren Zustandes (oder allgemeiner, des Zustandes des Systems, an welchem gestreut Raman-Streuung. Je nachdem ob das Photon seine Energie erniedrigt oder erhöht, spricht man von Stokes oder Anti-Stokes-Linien im Streuspektrum. wird) heiÿt Rayleigh-Streuung Wir betrachten jetzt insbesondere die elastische Streuung eines Photons an einem Atom im Grundzustand. Weiters soll die Energie des Photons klein sein gegenüber sämtlichen atomaren Anregungsenergien EC − EA . Wir können dann die Resonanznenner entwickeln gemäÿ: 1 ~ω 1 = + + ... . EC − EA − ~ω EC − EA (EC − EA )2 2.4. DAS ATOM IM STRAHLUNGSFELD: SPEZIELLE PROBLEME Falls wir weiters noch die in Gleichung ( pAC = 31 ??) hergeleitete Beziehung im(EA − EC ) rAC ~ verwenden, so erhält man für den Streuquerschnitt 2 " # X dσ i 2 = r0 êj ·êi − êj · (pAC rCA − rAC pCA ) ·êi + . . . . dΩ ~ C Aus der Vollständigkeit der Zustände |C kann man schlieÿen, dass der Ausdruck in eckigen Klammern der Kommutatorausdruck ~~ A| [p, r] |A = I~ i ist. Die oben angegebenen Terme heben sich also auf; das gleiche gilt für die Terme der 2 Ordnung (~ω) , und der Streuquerschnitt ist bestimmt von der dritten Ordnung in ~ω : " # 2 r 2 X 1 dσ 0 = (p p + p p ) ·ê ~4 ωk4 êj · AC CA AC CA i . 3 dΩ m (E − E ) C A C In niedrigster Ordnung in ω erhalten wir also die bekannte ω 4 -Abhängigkeit, die zuerst von Lord Rayleigh für die Streuung an einem harmonisch gebundenen Elektron hergeleitet wurde. Der Eekt erklärt die blaue Farbe des Himmels, sowie die rote Farbe der untergehenden Sonne. Weil der aus den pAC gebildete Tensor bei Summation über alle |A C -Zustände (und, falls kein s-Zustand ist, bei Mittelung über die lz -Unterzustände von |A ) zur Einheitsmatrix proportional ist, ist auch der Polarisationszustand des Streulichtes und seine Winkelverteilung leicht anzugeben (siehe Skriptum Elektrodynamik für eine Ausarbeitung). 2.4 Das Atom im Strahlungsfeld: Spezielle Probleme 2.4.1 Idealisierte Photodetektoren In diesem Abschnitt betrachten wir als idealisiertes Modell eines Photodetektors ein Atom, in dem die im Feld vorhandenen Photonen immer Übergänge ins Kontinuum, also toionisation erwirken. Weiters erweist es sich als zweckhaft, die Dipolnäherung und im Wechselwirkungsbild zu betrachten: Wechselwirkung Pho- HI in HI (t) = −eE(r0 , t)·r(t). Das Matrixelement zwischen einem Anfangszustand |A; a beträgt dann F ; f |HI (t)|A; a = −e F |r(t)|A · f |E(r0 , t)|a = −e eiωF A t rF A · f |E(r0 , t)|a . und einem Endzustand |F ; f 32 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES In niedrigster Ordnung trägt nur der Vernichter-Anteil von zeichnet, bei. Für die Wahrscheinlichkeit E, weiters mit E(+) (r0 , t) be- p1 (t), dass im Intervall (0, t) überhaupt ein Über- gang dieser Art stattndet, erhält man X X ie Z t 2 0 0 iω t (+) 0 dt e F A rF A · f |E (r0 , t )|a p1 (t) = ~ 0 F f (4.1) e 2 X Z t Z t 00 0 dt00 eiωF A (t −t ) r∗F A ·G1a (r0 , t0 ; r0 , t00 )·rF A , = dt0 ~ 0 0 F wobei wir die Abkürzung G1a (r0 , t0 ; r1 , t00 ) = a|E(−) (r0 , t0 )E(+) (r1 , t00 )|a eingeführt haben; E(−) cf (t) bezeichnet den Anteil von E. der Ausdruck für und die Vollständigkeit der Zustände 1 leicht, dass für Ga die alternative Darstellung G1a (r1 , t1 ; r2 , t2 ) = ??) wurden Bei der Herleitung von ( |f benutzt. Man überprüft 1 a| : E(r1 , t1 )E(r2 , t2 ) : |a 2 gilt. Dies bestätigt die auf S. ?? gemachte Aussage, dass in vernünftigen Messanordnun- gen nur normal geordnete Produkte von Feldoperatoren gemessen werden. ??) lichkeitstensors Der Ausdruck ( lässt sich noch etwas umschreiben durch Einführung des e 2 X S(ω) = 2π ~ r∗F A rF A δ(ω − ωF A ); (4.2) F ??) ergibt Substitution in ( 1 p1 (t) = 2π t Z 0 Z dt t 00 +∞ dt 0 0 Z 00 −t0 ) dω eiω(t S(ω) : G1a (r0 , t0 ; r0 , t00 ) −∞ Eine weitere Vereinfachung erfolgt über die Fourier-Transformierte 1 S(t) ≡ 2π Z +∞ dω eiωt S(ω); −∞ Einsetzen dieser Gröÿe liefert Z p1 (t) = t 0 Z dt 0 0 Empnd- t dt00 S(t00 − t0 ) : G1a (r0 , t0 ; r0 , t00 ). 2.4. DAS ATOM IM STRAHLUNGSFELD: SPEZIELLE PROBLEME 33 Zwischenbemerkung Der S-Tensor-Formalismus erlaubt auch die Berücksichtigung weiterer experimentell rele- ??) einen Faktor RF vanter Faktoren: man kann hinter der Summation in ( die Nachweiswahrscheinlichkeit Dadurch wird p1 (t) des in |F einführen, der enthaltenen Photoelektrons repräsentiert. zur Wahrscheinlichkeit, dass ein Photon (über den Prozess der Pho- toionisation) detektiert wird. Auch der Eekt von vor dem Detektor platzierten Frequenzoder Polarisationsltern lässt sich durch eine Abänderung von S(ω) berücksichtigen. In der Praxis wird man für Detektion von Licht bevorzugt solche Atome wählen, die im für das Experiment relevanten Frequenzbereich eine möglichst konstante Empndlichkeit haben und die weiters nicht polarisationsselektiv sind: S(ω) ' s0 I; S(t) ' s0 I δ(t). In dieser Näherung gilt Z p1 (t) = s0 t dt0 I : G1a (r0 , t0 ; r0 , t00 ). 0 Die Detektionsrate |E(r0 , t)|2 : d p (t) ist dann tatsächlich zum Erwartungswert von dt 1 w1 (t) = : proportional! 2.4.2 Die Koinzidenz zweier Detektoren Als Nächstes betrachten wir die Situation, dass sich im Feld zwei Ein-Atom-Detektoren r10 (0, t) (mit gleichen Atomen) an den Orten lichkeit dafür, dass im Zeitintervall und r20 beide Basiszustände des Hilbertraumes haben die Form Atom 1 sich im Zustand B benden. Wir suchen die Wahrschein- Detektoren ein Photon detektieren. Die |B1 ; C2 ; i , wobei B1 z.B. andeutet, dass bendet, und wir suchen nach Übergängen vom Typ |A1 ; A2 ; a → |F1 ; G2 ; f . Solche Übergänge erfordern zwei Eingrie von HI (der A2 -Term bewirkt keine Übergänge und kann vernachlässigt werden) und zwar jeweils einen von den beiden Termen in die HI zerlegt werden kann: HI (t) = HI1 (t) + HI2 (t), wobei HIi (t) nur die Wechselwirkung zwischen Feld und Atom i enthält. Die Übergansam- plitude für den obigen Übergang beträgt also −1 cF Gf (t) = F1 ; G2 ; f | 2 ~ Jedes der Z t 0 Z dt 0 t0 dt00 [HI1 (t0 )HI2 (t00 ) + HI2 (t0 )HI1 (t00 )] |A1 ; A2 ; a . (4.3) 0 (+) (−) HI,i (t) kann wieder geschrieben werden als HIi (t)+HIi (t), wobei die ±-Anteile die Vernichter bzw. Erzeuger von Photonen enthalten. Weil für den gesamten Übergang 34 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES Energieerhaltung gelten muss, und der atomare Anteil der Energie auf jeden Fall zunimmt, (+) muss im obigen Ausdruck jeder Term mindestens ein HIi enthalten. Beiträge, bei denen im (−) anderen Faktor der Anteil H eine Rolle spielt, treten auf, aber sie sind, relativ zu Termen, −1 in denen von beiden HIi der (+)-Anteil auftritt, von der Ordnung (ωF A t) (Der Beweis (+) wird dem Leser als Übungsaufgabe überlassen). Weil die HIi miteinander kommutieren (sie enthalten als Feldoperatoren nur Vernichter; die auftretenden atomaren Operatoren wirken auf verschiedene atomare Freiheitsgrade), kann der so erhaltene dominante Anteil von cF Gf (t) auch geschrieben werden als −1 F1 ; G2 ; f | 2 ~ t Z 0 Z t dt (+) (+) dt00 HI1 (t0 )HI2 (t00 )|A1 ; A2 ; a 0 0 [zum Beweis: abgesehen von der Reihenfolge der Operatoren ist die Dierenz zwischen ??), den Termen in ( dass im ersten Term HI2 und im zweiten Term HI1 zuerst wirkt. Eine Umbenennung der Integrationsvariablen führt sofort zum obigen Ausdruck]. Eine Ausarbeitung des Matrixelements liefert t e 2 Z ~ 0 t Z 0 00 dt00 eiωF A t eiωGA t (rF A rGA ) : f |E(+) (r20 , t00 )E(+) (r10 , t0 )|a . dt 0 0 Die mit Hilfe dieses Ausdrucks berechnete Wahrscheinlichkeit p2 (t) für das Auftreten von Ionisation in beiden Detektoren p2 (t) = XXX F G |cF Gf (t)|2 f kann jetzt genauso wie p1 (t) umgeformt werden durch Einführung der Empndlichkeits- tensoren und Ausnützung der Vollständigkeit der Feldzustände p2 (t) = XZ t 0 00 dt 0 ijkl t Z Z dt 0 t 000 Z dt 0 |f . Das Ergebnis ist t dt0000 Sil (t0000 − t0 )Sjk (t000 − t00 ) 0 0000 000 00 0 × G2,a ijkl (r10 , t ; r20 , t ; r20 , t ; r10 , t ), mit der Denition (−) (−) (+) (+) G2,a (x ; x ; x ; x ) ≡ a|E (x )E (x )E (x )E (x )|a , i j k l i j k l i j ijkl k l wobei xi für das Paar (ri0 , ti ) steht. Man überprüft leicht, dass auch G2,a als Erwartungswert eines normal geordneten Operators aufgefasst werden kann. Für breitbandige, isotrope Detektoren vereinfacht sich der Ausdruck für p2(t) = s20 XZ ij 0 t 0 Z dt 0 p2 (t): t 0 00 00 0 dt00 G2,a ijji (r10 , t ; r20 , t ; r20 , t ; r10 , t ). 2.4. DAS ATOM IM STRAHLUNGSFELD: SPEZIELLE PROBLEME 35 Für diesen Fall lässt sich also eine Koinzidenzrate w2 (t1 , t2 ) = s20 X G2,a ijji (x1 ; x2 ; x2 ; x1 ) ij denieren. Im allgemeinen sind die zwei Prozesse, trotz der dynamischen Unabhängigkeit der beiden Detektoren, korreliert: w2 (t1 , t2 ) 6= w1 (t1 )w2 (t2 ). Der Bosecharakter der Photonen G2,a ijji (x1 ; x2 ; x2 ; x1 ) lässt sich für Breitbanddetektoren also denieren als die Rate, womit sowohl ein Photon mit Polarisation i zur Zeit t1 in der Nähe von r10 als auch ein Photon mit Polarisation j zur Zeit t2 in der Nähe von r20 detektiert wird. Es ist instruktiv, Die Gröÿe diese Gröÿe für den Zwei-Photonen-Zustand |k, l ≡ |1k 1l = a†k a†l |{0} zu berechnen. Das Ergebnis ist (beachte, dass in der Mitte des Ausdruckes für Projektor |{0} {0}| G2,a ijji = G2,kl der hineingeschoben werden darf ) ~2 |eki (r10 , t1 )elj (r20 , t2 ) + eli (r10 , t1 )ekj (r20 , t2 )|2 , 2 also dem entsprechenden Betragsquadrat einer symmetrisierten Zwei-Teilchen-Wellenfunktion, wie sie für Bosonen üblich ist, recht analog. Wir sehen insbesondere, dass neben den räumlichen und den Polarisationsindizes auch die Zeitpunkte in den beiden Termen miteinander vertauscht werden müssen; in dieser Hinsicht geht der hier behandelte Formalismus über den aus der Vorlesung Quantenmechanik bekannten hinaus. Ein weiterer Unterschied zu dem bekannten Formalismus ist noch, dass hier nicht die Ein-Teilchen-Wellenfunktionen fk (r), eingeführt auf S. ??, auftreten, sondern die Feldamplitudenfunktionen ek (r); dies hat damit zu tun, dass der hier beschriebene Photodetektor mit konstantem S(ω) auf die 2 −1 Gröÿe : |E(r, t)| : anspricht. Für die Wahl S(ω) ∼ ω wären in der obigen Formel die fk vorgekommen; dies wäre aber eine recht spezielle, praktisch nicht leicht realisierbare Wahl (sogar falls die Bedingung nur über einen beschränkten Frequenzbereich zu gelten braucht). (+) des Feldes sind Eigenzustände der E (r, t). Für solche Zustände 1 2 faktorisieren also die Feldkorrelationsfunktionen G und G , und es treten keinerlei Kor- Kohärente Zustände relationen zwischen unterschiedlichen Detektoren auf. Mit einer maximalen Bestimmtheit dieser Zustände vom Wellenaspekt her korrespondiert also eine maximale Stochastizität des Teilchenaspektes des Feldes. Mehrfachkoinzidenzen von mehr als zwei Detektoren können auf völlig ähnliche Weise diskutiert werden. Eine ausführlichere Behandlung von Photodetektion und der Statistik von Photoelektronen ndet man in den Vorlesungen von Glauber in der Sommerschule von 1964 in Les Houches (Quantum Optics and Electronics, C. DeWitt et al., Hrsg., Gordon and Breach, New York, 1965). 36 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES 2.4.3 Ein Atom in einem Resonator In diesem Abschnitt betrachten wir ein Atom in einem Laser- oder Hohlraumresonator, der eine Eigenfrequenz besitzt, welche mit einem erlaubten Übergang des Atoms fast resonant ist. Ein im angeregten Zustand in den Resonator hineingebrachtes Atom wird rasch zerfallen, aber das emittierte Photon wird dann von den Spiegeln oder Wänden auf das Atom zurückreektiert und mit einer gewissen Wahrscheinlichkeit wieder reabsorbiert. Zur Beschreibung dieser Situation nehmen wir die Terme, die am eektivsten zu den atomaren Übergängen beitragen, im ungestörten Hamiltonoperator auf, und berechnen dann die H0 . Es zeigt sich, dass diese Zusatzterme immer nur die |B; n0 − 1 miteinander mischt, wobei | A und | B die beteiligten atomaren Zustände sind, und m0 der Zustand mit genau m Photonen in der fast resonanten † Feldmode, dessen Erzeuger und Modenfunktion wir mit a0 bzw. e0 (r) bezeichnen werden. Eigenzustände des so geänderten Zustände |A; n0 und Es reicht deshalb aus, den reduzierten Hamiltonoperator H00 1 † =EA |A A| + EB |B B| + ~ω0 a0 a0 + 2 r h i ~ † −e e0 (r0 )·rAB a0 |A B| + a0 |B A| 2 (4.4) zu betrachten, wobei wir uns einfachheitshalber auf den Fall reeller e0 (r) und rAB be H00 bezüglich der Basisvektoren |e1 = |A; n0 und |e2 = |B; n0 − 1 bilden die 2x2 Matrix schränkt haben. Die Matrixelemente von √ 1 ~ω√ −~g n 0 EA + n − ~ω0 I + . ~ωat −~g n 2 Dabei haben wir die Abkürzungen ~ωat = EB − EA ; e g = − √ e0 (r0 )·rAB 2~ eingeführt und die Bezeichnung I für die Einheitsmatrix verwendet. Die obige Matrix hat die Eigenwerte 1 1 1 p = EA + n − ~ω0 + ~(ω0 + ωat ) ± ~ (ωat − ω0 )2 + 4ng 2 2 2 2 p 1 1 = (EA + EB ) + n~ω0 ± ~ (∆ω)2 + 4ng 2 . 2 2 ~ωn± Die zugehörigen Eigenzustände sind |n + = cos θn |A; n − sin θn |B; n − 1 ; |n − = sin θn |A; n − cos θn |B; n − 1 , 2.4. DAS ATOM IM STRAHLUNGSFELD: SPEZIELLE PROBLEME 37 wobei "p # √ (∆ω)2 + 4ng 2 − ∆ω 1 2g n √ θn = arctan = arctan . 2 ∆ω 2g n Für genaue Resonanz (∆ω = 0) gilt immer θn = 45◦ . Die hier diskutierte Hamiltonfunktion kann auch für ein Atom in einem sehr intensiven Laserstrahl benutzt werden. Der Sonderstatus einer einzelnen Mode des Feldes folgt dann aus der sehr hohen Besetzungszahl, nicht aus der Diskretheit des Spektrums. Betrachte jetzt den Fall, dass sich das System zur Zeit t = 0 im Zustand |B, n−1 bendet. Wegen gilt |B, n − 1 = − sin θn |n + + cos θn |n − für den Zustand |t zur Zeit t bis auf einen Phasenfaktor |t = − sin θn e−iωRn t |n + + cos θn eiωRn t |n − = i sin 2θn sin ωRn t|A; n + [cos ωRn t + i cos 2θn sin ωRn t]|B; n − 1 . Der Zustand oszilliert also mit der ωRn = 1/2 1 (∆ω)2 + 4ng 2 2 zwischen den zwei Komponenten (∆ω = 0) Rabi-Frequenz |A; n und |B; n − 1 , und zwar für exakte Resonanz 2 vollständig, für endliche Verstimmung nur mit der Amplitude sin 2θn . Die Rabi- Oszillatoren können dadurch experimentell beobachtet werden, dass man einen Strahl von Atomen quer durch einen starken Laserstrahl schieÿt und die Fluoreszenz beobachtet, d.h. spontane Zerfälle unter Emission eines Photons, deren k-Vektor nicht parallel zum Laser- strahl zeigt. Die Intensität des Fluoreszenzlichtes ist dann entlang des Strahls räumlich moduliert mit einer Wellenlänge λ = 2π wobei vat vat , ωRn die Geschwindigkeit der Atome im Strahl darstellt. Im Spektrum der Fluoreszenzstrahlung sind die vier Kombinationsfrequenzen ω0 ± ωRn ± ωR,n−1 im Prinzip alle vertreten. Dabei ist die Dierenz zwischen nie auösbar, wenn ωRn ωRn und ωR,n−1 experimentell selbst hinreichend groÿ ist. Man erhält also drei Komponenten mit den Intensitätsverhältnissen sin4 θn : 2 sin2 θn cos2 θn : cos4 θn . 38 KAPITEL 2. √ |∆ω|√ g n ∆ω g n gilt Für gilt θn ' 45◦ QUANTENTHEORIE DES STRAHLUNGSFELDES und das Intensitätsverhältnis ist näherungsweise 1:2:1. Für 1 ~ω0 ; ωn− ' EB + n − 2 √ g n θn ' 1, ∆ω ωn−1,+ 1 = EA + n − ~ω0 ; 2 also die Intensität liegt fast vollständig bei der Frequenz verschobenen atomaren Frequenz. Für allgemeine Werte ωn− −√ ωn−1,+ ' ωat , der unvon 2g n/∆ω ndet man ein Intensitätsverhältnis zwischen den beiden Extremen; für den gewichteten Mittelwert der Emissionsfrequenz erhält man mit Hilfe einiger trigonometrischer Beziehungen immer die unverschobene atomare Frequenz ωat . Bemerkung Für die obige Betrachtung ist wesentlich, dass jeweils nur ein Atom mit dem Feld wech- selwirkt. Falls mehrere Atome vorhanden sind, so wird i.a. die Modenfunktion an den verschiedenen Orten einen etwas anderen Wert haben, und auch die Verstimmung wird auf Grund der Dopplerverschiebung leicht unterschiedliche Werte haben; die Rabi-Oszillationen verschiedener Atome geraten also rasch auÿer Takt. 2.4.4 Energieverschiebungen durch Ankopplung an die Vakuumuktuationen (die Lamb-Verschiebung) In diesem letzten Abschnitt des Kapitels über die Quantentheorie des Strahlungsfeldes betrachten wir den Einuss der Ankopplung an das Strahlungsfeld auf die Lage der atomaren Niveaus. Eine quantitativ zuverlässige Behandlung dieser Eekte kann nur im Rahmen einer voll-relativistischen Theorie gegeben werden. Die nachfolgende nicht-relativistische Beschreibung liefert aber schon eine Erläuterung der grundlegenden physikalischen Ideen, sowie eine überraschend gute vorläuge Abschätzung der Gröÿenordnung des zu erwartenden Eekts. Konkret betrachten wir das System (Atom + Feld) im Zustand kung HI |A; {0} . Die Wechselwir- bewirkt, dass dieser Zustand für eine kurze Zeit in einen Zustand |B; 1k über- gehen kann, und sich dann, ehe die entsprechende Verletzung der Energieerhaltung auf Grund der Energie-Zeit-Unschärfe bemerkt werden kann, wieder in den Zustand |A; {0} zurückverwandelt. Auch kompliziertere Szenarien sind möglich; einige davon sind in der untenstehenden Reihe von Graphen dargestellt. Diese Umwandlungen haben zur Folge, dass die den Zeiten EA t = 0 und t = t1 im Zustand |A; {0} mittlere Energie eines Systems, das sich zu bendet, sich von der ungestörten Energie e2 berechnen, etwas unterscheidet. Wir werden diesen Eekt in niedrigster Ordnung in 2.4. DAS ATOM IM STRAHLUNGSFELD: SPEZIELLE PROBLEME 39 d.h. wir betrachten nur die Graphen I und II, und zwar zuerst nur den Graphen I; wir werden später ein Argument geben, weshalb der Graph II nicht zu beobachtbaren Eekten führt. Zum skizzierten Vorgehen betrachten wir also einen Zustand der allgemeinen Form X |t = cA (t)|A; {0} + cBk (t)|B; 1k . B,k Wir vernachlässigen also Beimischungen von weiteren Zuständen. Weiters wissen wir aus den Betrachtungen über den atomaren Zerfall (S. immer nur ein Polarisationszustand des Photons k ??), dass für vorgegebene A, B und k ankoppelt. Für die Entwicklungskoe- zienten erhält man die Bewegungsgleichungen (hergeleitet auf S. ??) i (−) i~ċBk (t) = B; 1k |HI |A; {0} e ~ (EB +~ωk −EA )t cA (t) X i (+) i~ċA (t) = A; {0}|HI |B; 1k e ~ (EA −EB −~ωk )t cBk (t), (4.5) B,k wobei in Dipolnäherung gilt (vgl. S. ?? und ??) ∗ ie (−) (+) B; 1k |HI |A; {0} = A; {0}|HI |B; 1k = − m pBA Die Elimination von |A; {0} und |B; 1k zugunsten von rBA r 2π~ ∗ 0 ê ·pBA ≡ HBkA . V ωk k1 ist hier nicht möglich, weil die Zustände nicht energetisch entartet zu sein brauchen! Wir suchen jetzt eine Lösung des Systems ( ??) mittels des Ansatzes i cA (t) = e− ~ ∆EA t . Dies ergibt H0 cBk (t) = BkA i~ 0 = HBkA Z t i 0 dt0 e ~ (EB +~ωk −EA −∆EA )t 0 i (EB +~ωk −EA −∆EA )t ~ e −1 . (EA + ∆EA − EB − ~ωk ??) für cA , und Division durch e− Substitution in die Gleichung ( i ∆EA t ~ , liefert i ∆EA = X B,k 2 0 |HBkA | 1 − e ~ (EA −EB −~ωk )t . (EA − EB − ~ωk ) Im obigen Ausdruck haben wir auf der rechten Seite ∆EA gegenüber EA vernachlässigt, 2 weil wir ohnehin ∆EA nur bis zur Ordung e berechnen wollen (Mitnehmen von ∆EA , aber nicht von ∆EB , wäre überdies auch inkonsistent). Die Zeitabhängigkeit im obigen Ausdruck t → ∞ ersetzt ist natürlich unphysikalisch; die Zeitfunktion soll durch ihren Grenzwert für 40 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES werden. Um für das zugrundeliegende Integral einen wohldenierten Wert zu erhalten, fügt man im Exponenten einen kleinen Imaginärteil hinzu: Z ∞ 1 − eixt 0 dt0 ei(x+iη)t lim ≡ − lim i t→∞ η&0 x 0 1 x 1 iη = lim = lim 2 = − iπδ(x). − η&0 x + iη η&0 x + η 2 x2 + η 2 x Wir erhalten für ∆EA also einen komplexen Wert: 0 |2 |HBkA Re(∆EA ) = EA − EB − ~ωk B,k X 2 0 Im(∆EA ) = −π | δ(EA − EB − ~ωk ). |HBkA X B,k Der Imaginärteil liefert (wegen ωk > 0) nur für angeregte Zustände einen Beitrag; in dem Ausdruck − 2 2π X 0 2 Im(∆EA ) = |HBkA | δ(EA − EB − ~ωk ) = wA ~ ~ B,k Fermi'schen goldenen Regel berechnete totale Zerfalls rate des Zustandes |A , die auf S. ?? explizit berechnet wurde, wieder. Diese Interpretation erkennt man die mit Hilfe der wird unterstützt durch das Ergebnis |cA (t)|2 = e+2Im(∆EA )t/~ |cA (0)|2 = e−wA t |cA (0)|2 . 0 Im Ausdruck für Re(∆EA ) substituieren wir jetzt den Wert des Matrixelements HBkA . 3 Weiters ersetzen wir die Summe über k durch ein Integral, was den Faktor V /(2π) (gleich der Dichte der zulässigen Werte im k-Raum) mit sich bringt: Z 1 |ê∗k1 ·pBA |2 2π~e2 V X dk . Re(∆EA ) = m2 V 8π 3 B ωk EA − EB − ~ωk Als nächstes führen wir die Integration über die Winkel im wir wie auf S. Z ?? die Beziehung dΩ |ê∗k1 ·pBA |2 2 = |pBA | Z k-Raum durch; dabei können 2 dΩ sin2 θ = |pBA |2 4π 3 einsetzen. Falls wir weiters noch von der Integrationsvariablen übergehen, erhalten wir Z 2 e2 1 X ∞ Eγ |pBA |2 Re(∆EA ) = dE . γ 3π ~c (mc)2 B 0 EA − EB − Eγ |k| auf Eγ = ~ωk = ~ck 2.4. DAS ATOM IM STRAHLUNGSFELD: SPEZIELLE PROBLEME 41 Dieser Ausdruck beruht auf einer nicht relativistischen Beschreibung des Elektrons und auf der Dipolnäherung, die nur gilt, falls die Wellenlänge des Photons klein ist gegenüber den pBA . Beide Näherungen werden schlecht für hohe Werte von Eγ (Beachte, dass bei vorgegebenem Eγ sämtliche Zustände |B , für die gilt EB − EA ∼ Eγ , noch beachtliche Beiträge liefern können; für hohe Werte von Eγ sind sonstigen relevanten Längen im Matrixelement dies ionisierte Zustände mit relativistischen Geschwindigkeiten des Elektrons). Sowohl die Korrekturen zur Dipolnäherung als auch die relativistischen Korrekturen führen zu einer starken Unterdrückung der Beiträge hoher Eγ . (Für die Korrekturen zur Dipolnäherung ist dies evident: die Substitution Z ψB∗ (r) ∂ ψA (r)dr −→ ∂r Z ψB∗ (r)e−ik·r ∂ ψA (r)dr ∂r führt zum Verschwinden des Matrixelements im Limes |k| → ∞!) Wir bringen diese Korrekturen jetzt ganz grob in Rechnung durch ein Abschneiden des obi(max) gen Integrals bei einem, vorerst noch recht willkürlichen, Wert Eγ . Zur Abschätzung von (max) −ik·r Eγ kann folgende Überlegung dienen: Die Reduktion des Matrixelements durch e wird eektiv, sobald der Wellenvektor des Photons vergleichbar wird mit dem Wellenvektor ke des Photoelektrons, der ohnehin in ψB∗ (r) vorkommt. Dies bedeutet konkret r ke ∼ 2mEγ Eγ ∼ ~2 ~c =⇒ Eγ ∼ 2mc2 . (Der Faktor 2 ist natürlich nicht ernst zu nehmen, weil für Beziehung zwischen E ke Re(∆EA ) und E ∼ mc2 die nichtrelativistische längst nicht mehr gilt!) Auch nach diesem Abschneiden ist der Ausdruck für noch nicht wohldeniert; er hängt noch sehr sensitiv von (max) Eγ ab. Um zu einer vernünftigen Interpretation zu kommen, brauchen wir eine neue physikalische Idee, die Massenrenormierung. 2.4.5 Intermezzo: Die Selbstenergie freier Elektronen Die obige Rechnung für ein in einem Atom gebundenes Elektron kann auch für ein freies Elektron durchgeführt werden. Die Zustände |p und |p0 mit den Wellenfunktionen |A und |B 1 i r|p = √ e ~ p·r V ersetzt werden, und für das Matrixelement erhält man Hp0 0 kp r Z i 2π~ e (p−p0 )·r −ik·r ~ dr e =− e (p·êk1 ) 3 m ωk V r e 2π~ =− p·êk1 δp0 ,p−~k . m ωk V müssen dann durch die Zustände 42 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES Selbstenergie des Elektrons be- Im Ausdruck für die Gröÿe Re(∆Ep ), die auch als die zeichnet wird, tritt weiters noch der Energienenner Ep − Ep0 − ~ωk = |p − ~k|2 p2 − − ~ωk ≈ −~ωk 2m 2m auf, wobei die Abschätzung für nichtrelativistische Werte von p2 |p − ~k|2 p·~k ~2 k2 − = + = 2m 2m m 2m Hp0 0 kp Einsetzen des Ausdrucks für für ∆Ep0 v ~ωk ·k̂ + c 2mc2 k gültig ist: ~ωk . und der Näherung für den Energienenner im Ausdruck Ausführen der Winkelintegration, sowie ein Übergang zur Integrationsvariablen Eγ , liefert einen rein reellen Ausdruck (gleichzeitige Erhaltung von Energie und Impuls 0 beim Ubergang |p; {0} → |p ; 1k ist nicht möglich), und zwar e2 2p2 ∆Ep = − ~c 3π(mc)2 Z (max) (max) Eγ dEγ = − 0 e2 2 Eγ p2 . 2 ~c 3π (mc) Dieser Beitrag zur Energie eines freien Elektrons kann genauso behandelt werden wie der Beitrag der potentiellen Energie zur Energie des Elektrons in einem periodischen Potential. Dafür erhält man z.B. im Kronig-Penney-Modell, und für genügend kleine p, einen Ausdruck vom Typ hV ip = c0 + c1 p2 . In der Festkörperphysik ist es üblich, diesen Term über eine eektive Masse m∗ in Rech- nung zu bringen: p2 p2 + hV i = c0 + 2m 2m∗ mit m∗ = m . 1 + 2mc1 Auf ähnliche Weise können wir jetzt schreiben p2 Ep − ∆Ep = 2m∗ was für die Wahl (max) Eγ (max) " mit = mc2 e2 4 Eγ 1 + m∗ ∼ = ~c 3π mc2 eine Korrektur von 0,3% # m, bedeutet. Die Masse m∗ heiÿt in renormierte Masse. Die für die weitere Rechnung entscheidende, von Kramers stammende Idee ist jetzt: Ei- diesem Zusammenhang auch ne experimentelle Messung der Elektronenmasse bestimmt immer in Hamiltonoperator aufscheinende nackte Masse schiebung ∆EA m. |A eben bestimmten Absenkung der kinetischen Energie: (obs) und nicht die im ist prinzipiell nicht beobachtbar; beobachtbar ist nur der zwischen der Niveauverschiebung des im Zustand ∆EA m∗ Auch die oben berechnete Niveauver- p2 p2 ≡ ∆EA − A| − |A . 2m∗ 2m Unterschied gebundenen Elektrons und der so- 2.4. DAS ATOM IM STRAHLUNGSFELD: SPEZIELLE PROBLEME 43 Ehe wir diesen Ausdruck für die Niveaus des Wasserstoatoms auswerten, diskutieren wir ??. Dieser führt zu einem Zusatzterm in der noch kurz den Einuss des Graphen II auf S. Gleichung für ċA : i~ċA = . . . + e2 ~2 2 A; {0}|A (r)|A; {0} . 2mc2 In der Dipolnäherung kann A2 (r) durch A2 (r0 ) ersetzt werden. Letzterer Operator wirkt nicht mehr auf die Elektronenkoordinaten, und man erhält i~ċA = . . . + e2 ~2 A|A {0}|A2 (r0 )|{0} , 2 2mc also einen Beitrag zur Selbstenergie, der zwar ohne Abschneidung der k-Integration di- vergent ist, aber für alle Zustände gleich, und der deshalb prinzipiell nicht beobachtbar ist. Man überzeugt sich leicht, dass auch für freie Elektronen (ohne Dipolnäherung!) ein p-unabhängiger Beitrag, analog zur Gröÿe c0 in der Festkörperanalogie, entsteht. Bethe's Berechnung der Lamb-Verschiebung Einsetzen der schon berechneten Werte für Re(∆EA ) und m∗ in den obigen Ausdruck (obs) (obs) ohne nähere Angabe den Realteil liefert (wir werden weiters unter ∆EA für ∆EA verstehen) (obs) ∆EA e2 2 = ~c 3π(mc)2 Z e2 2 ~c 3π(mc)2 Z = (max) " Eγ dEγ X 0 B (max) Eγ dEγ 0 Eγ |pBA |2 + (p2 )AA EA − EB − Eγ # X |pBA |2 (EA − EB ) B EA − EB − Eγ X e2 2 = |pBA |2 (EB − EA ) ln ~c 3π(mc)2 B (max) Eγ |EB − EA | ! . 2 Bei dieser Herleitung wurde im ersten Schritt die Vollständigkeitsbeziehung (p )AA = P 2 B |pBA | verwendet; im zweiten Schritt wurde für den Fall EB < EA die Singularität bei Eγ = EB − EA behoben durch Ausschneiden eines kleinen symmetrischen Intervalls (genaueres Studium des Grenzübergangs auf S. ist); die Integrale über (0, EBA − η) das Endergebnis folgt nach der oberen Integrationsgrenze. Der erhaltene Ausdruck für ?? zeigt, dass dies die korrekte Behandlung (EBA + η, 2EBA ) heben sich dann genau auf, und (max) Vernachlässigung von EAB relativ zu Eγ ∼ mc2 im Beitrag (obs) ∆EA und ist für die Niveaus des Wasserstoatoms ohne weiteres exakt auswertbar, weil sämtliche Eigenwerte EA und Eigenzustände |A exakt bekannt sind. Die Summe erweist sich als konvergent; sie hängt natürlich noch logarithmisch vom (max) Abschneideparameter Eγ ab. Zur näheren Auswertung schreiben wir das Ergebnis in 44 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES der Form (obs) ∆EA (max) 2 e2 = ln ~c 3π(mc)2 Eγ h|EB − EA |iav was lediglich einer Denition von ! h|EB − EA |iav X |pBA |2 (EB − EA ), B entspricht. Als nächstes betrachten wir die Identität pHat − Hat p = −i~∇V, 2 B |pBA | (EB − EA ) erhält man entweder durch Nehmen des (BA)-Matrixelements der Identität, Multiplikation die für jedes Ein-Elektron-Atom gilt. Die zu berechnende Summe mit P pAB und Summation über B , oder durch das gespiegelte Verfahren: X X X |pBA |2 (EB − EA ) = −i~ pAB ·(∇V )BA = i~ (∇V )AB ·pBA . B B B Der Mittelwert der zwei äquivalenten Ausdrücke liefert X |pBA |2 (EB − EA ) = − B i~ ~2 ([p, ∇V ])AA = − (∇2 V )AA . 2 2 Für das Coulombpotential gilt ∇2 V (r) = 4πe2 δ(r), also X |pBA |2 (EB − EA ) = −2πe2 ~2 |ψA (0)|2 . B Diese Gröÿe ist nur für s-Zustände nichtverschwindend; für diese gilt die Beziehung |ψns (0)|2 = 1 πn3 a30 mit a0 = ~ ~c . mc e2 Für die Verschiebung der s-Niveaus des Wasserstoatoms erhalten wir also letztendlich 8 (obs) ∆Ens = 3π Die Gröÿe e2 /(2a0 ) e2 ~c 3 e2 1 ln 2a0 n3 (max) Eγ h|EB − EA |iav ! . ist die Rydbergenergie, die natürliche Einheit für atomare Energieab- stände. Für Niveaus mit l 6= 0 erhalten wir in dieser Ordnung keine Energieverschiebung. Eine numerische Rechnung liefert für h|EB − E2s |i den Wert (max) Wertes liefert für die Wahl Eγ = mc2 die Vorhersage 1 (obs) (obs) ∆E2s − ∆E2p1/2 = 1040 M hz, ~ 17,8 Ry . Einsetzen dieses 2.4. DAS ATOM IM STRAHLUNGSFELD: SPEZIELLE PROBLEME 45 in erstaunlich guter Übereinstimmung mit dem experimentellen Wert 1060 M Hz . Ände(max) rung von Eγ um einen Faktor 2 würde eine Änderung der Vorhersage um etwa 9% mit sich bringen. Die genaue Übereinstimmung ist also eher ein glücklicher Zufall, aber die Gröÿenordnung des Ergebnisses wird durch unsere sehr grobe Theorie recht gut vorhergesagt. Die oben durchgeführte Rechnung hat also folgendes Ergebnis gebracht: Der nichtrelativistische Ausdruck für ∆EA ist in niedrigster Ordnung der Störungstheorie divergent (max) und hängt linear von der Abschneideenergie Eγ ab; der Massenrenormierungsterm di(max) vergiert auch linear mit Eγ , aber die beobachtbare Niveauverschiebung ist nur noch logarithmisch divergent. Die Abhängigkeit von der Abschneideenergie bedeutet, dass die Rechnung eigentlich überhaupt keine quantitative Vorhersage gebracht hat! Andererseits ist die Rechtfertigung für das Abschneiden der Integrale keineswegs problematisch: Die nicht relativistische Rechnung reicht nun einmal für hohe Eγ nicht aus, und man weiÿ im Prinzip, was man besser machen soll. In der relativistischen Theorie sind, wie sich herausstellt, sowohl ∆EA als auch die Massen(max) renormierung nur noch logarithmisch divergent mit Eγ und für deren Dierenz erhält (max) man einen endlichen, von Eγ unabhängigen Wert. Es gibt in der relativistischen Theorie noch einen zweiten Eekt, die Vakuumpolarisation. Wie wir in unserer Diskussion der Diracgleichung sehen werden, kann aus dem Vakuumzustand vorübergehend ein ElektronPositron-Paar entstehen, das wegen Nichterhaltung der Energie natürlich wieder schnell verschwinden muss. Während der kurzen Existenz des Paares werden die beiden aber durch ein etwaiges äuÿeres Feld ein wenig auseinander gezogen, was zu einer Abschirmung sämt- licher Ladungen führt, genau wie für eine Ladung in einem Dielektrikum. Diese sogenannte Ladungsrenormierung ist wieder formal divergent, aber prinzipiell unbeobachtbar. Im Wasserstoatom gibt es aber beobachtbare Eekte, weil sowohl Elektron als auch Proton in die Abschirmungswolke aus Vakuumuktuationen des jeweilig anderen Teilchens kommen. Dieser Nettoeekt ist wieder endlich, und die Summe der beiden so berechneten (obs) Beiträge zu ∆EA stimmt innerhalb der inzwischen sehr kleinen Messungenauigkeiten mit dem Experiment überein. Die einschlägigen Rechnungen wurden in den vierziger Jahren von Tomonaga, Schwinger und Feynman unabhängig voneinander durchgeführt. Der Beweis, dass die entwickelten Formalismen auch in höheren Ordnungen endliche Ergebnisse liefern, stammt von Dyson. Um diese Übereinstimmung zu erhalten, müssen auch Terme höherer Ordnung in der Störungstheorie betrachtet werden, aber bei diesen treten keine neuen Divergenzen auf. Eine Theorie, in der nur endlich viele divergente Graphen auftreten, heiÿt renormierbar. Während die relativistische Quantenelektrodynamik also quantitativ sehr genaue Vorhersagen machen kann, wird die Rechtfertigung der formalen Vorgehensweise um einiges diziler: Das Auftreten divergenter Ausdrücke für Massen- und Ladungsrenormierung ist ein Indiz dafür, dass auch die relativistische Theorie im Bereich extrem hoher Energien nicht korrekt sein kann. Es ist aber noch nicht klar, welche neuen physikalischen Eekte die Massen- und Ladungsrenormierung zustande bringen (Eekte der Gravitation, Supersymmetrie, Superstrings, . . . ). Der wesentliche Vorteil einer renormierbaren Theorie ist aber, 46 KAPITEL 2. QUANTENTHEORIE DES STRAHLUNGSFELDES dass man die Antwort auf diese Frage nicht zu wissen braucht, um mit der Theorie selbst weiterarbeiten zu können. Viele Physiker halten sogar das Problem der Behebung der Divergenzen eher für ein psychologisches Problem der Theoretiker. In dieser Betrachtungsweise reicht es völlig aus, dass ein wohldenierter Algorithmus zur Berechnung sämtlicher beobachtbarer Eekte existiert, und es wird als eine Anmaÿung empfunden, der Natur vorzuschreiben, welcher Art von Mathematik sie sich zu bedienen hat. Kapitel 3 Quantentheorie von Fermionfeldern 3.1 Hilbertraum und Feldoperatoren für identische Fermionen In diesem Kapitel werden wir auch für Fermionen einen Besetzungszahlformalismus entwickeln, der demjenigen für Photonen möglichst analog ist. Als erstes brauchen wir dazu einen Satz von Modenfunktionen. Diese können ziemlich willkürlich gewählt werden; die einzige Bedingung ist, dass sie vollständig sein müssen. Eine mögliche Wahl sind die stationären Zustände irgendeines Referenz-Hamiltonoperators Href φk (r, sz ) = Ek φk (r, sz ) mit Href = Href , p2 + Vref (r) 2m und der Normierung XZ dr |φk (r, sz )|2 = 1. sz Weil Fermionen immer einen Spin haben, haben wir auch den Spinfreiheitsgrad explizit angegeben. In der obigen Denition ist Vref spinunabhängig gewählt; eine Verallgemeinerung auf spinabhängige Potentiale bereitet keine Schwierigkeiten, wird aber für unsere Zwecke nicht gebraucht. Unsere Wahl impliziert, dass jeder Eigenwert mindenstens (2s + 1)-fach entartet ist; diese Entartung muss natürlich beim Abzählen der Eigenzustände berücksichtigt werden. Als Basiszustände des Hilbertraumes wählen wir wieder die |{nk } , nk Besetzungszahl-Eigen-zustände 0 und 1 annehmen können (Pauliverbot!). P † Weiters gilt wieder die Nebenbedingung k nk < ∞. In Folge führen wir Erzeuger ck und Vernichter ck ein, die die Besetzungszahl nk um eins erhöhen bzw. erniedrigen, falls † dies erlaubt ist. Diese Vorschrift legt die ck und ck noch nicht fest; die allgemeinste noch † zugelassene Form, für die ck und ck hermitesch konjugiert sind, ist c†k |{nl } = [1 − nk ]eiφk ({nl +δkl }) |{nl + δkl } (1.1) ck |{nl } = nk e−iφk ({nl }) |{nl − δkl } , wobei jetzt aber die nur die Werte 47 48 KAPITEL 3. φk ({nl }) wobei die Phasen QUANTENTHEORIE VON FERMIONFELDERN im Prinzip noch frei wählbar sind. Insbesondere könnte man sie alle, wie im analogen Bose-Fall, gleich Null wählen; dies führt aber zu einem recht schwerfälligen Formalismus. Um zur Festlegung der φk ({nl }) zu gelangen, betrachten wir zuerst die Identität c†k ck + ck c†k |{nl } = (1 − nk + nk )|{nl } = |{nl } , oder n o c†k , ck ≡ c†k ck + ck c†k = 1. Statt einer charakteristischen Vertauschungsbeziehung, wie für Bosonen, haben wir also hier eine charakteristische Antivertauschungsbeziehung. Es liegt jetzt nahe, diese An- tikommutatorstruktur auszubauen und zu fordern o n c†k , c†l = {ck , cl } = 0. n o c†k , cl = δkl ; Dies wird ermöglicht durch die von φk ({nl }) = π X (1.2) Jordan und Wigner vorgeschlagene Phasenkonvention nl0 ; l0 <k für diese Konvention ist es also notwendig, die Indizes k auf irgendeine, weitgehend will- kürliche, aber ein für allemal festzulegende, Weise zu ordnen. Der formale Beweis, dass diese Vorschrift nach Substitution in ( ??) ??) zu den Beziehungen ( führt, ist nicht sehr schwierig, aber etwas mühsam, und wir beschränken uns auf einige Beispiele: c†1 c†2 |{0} = c†1 |01 ; 12 = |11 ; 12 ; c†2 c†1 |{0} = c†2 |11 ; 02 = −|11 ; 12 ; c†1 c3 |01 ; 12 ; 13 = −c†1 |01 ; 12 ; 03 = −|11 ; 12 ; 03 ; c3 c†1 |01 ; 12 ; 13 = c3 |11 ; 12 ; 13 = |11 ; 12 ; 03 . Wir bemerken noch nebenbei, dass der Operator Nk = c†k ck der Zähloperator für die Zahl der Fermionen im Zustand φk (r, sz ) Nk |{nl } = nk |{nl } . Der Operator N= X Nk k ist oensichtlich der Operator für die Gesamtzahl der Fermionen. ist: 3.1. HILBERTRAUM UND FELDOPERATOREN 49 3.1.1 Feldoperatoren Wir führen jetzt den Feldoperator ψ(r, sz ) = X ψ(r, sz ) ein mittels ck φk (r, sz ) k und betrachten den Kommutator [N, ψ(r, sz )] = X h i φl (r, sz ) c†k ck , cl . k,l Aus der Beziehung h c†k ck , cl i = c†k ck cl − cl c†k ck = c†k ck cl + c†k cl ck n o † − ck , cl ck = c†k ck cl + c†k cl ck − δkl ck = −δkl ck folgt [N, ψ(r, sz )] = −ψ(r, sz ), ψ(r, sz ) erniedrigt die ψ(r, sz )|{δlk } = φk (r, sz )|{0} , also der Operator gilt zusätzlich noch, dass mit Spin sz ψ(r, sz ) Fermionenzahl um eins. Aufgrund der Identität nur ein Fermion vernichten kann, falls eines am Ort r vorhanden ist. Auf ähnliche Weise kann man den adjungierten Operator ψ † (r, sz ) = X c†k φ∗k (r, sz ) k interpretieren als den Erzeuger eines Fermions mit Spin sz am Ort r. Aufgrund der Voll- ψk (r, sz ) gilt die Antikommutatorbeziehung n o † X ∗ ψ (r, sz ), ψ(r0 , s0z = φk (r, sz )φl (r0 , s0z ) c†k , cl ständigkeit der k,l = X φ∗k (r, sz )φk (r0 , s0z ) = δ(r − r0 )δsz s0z . k Es liegt jetzt nahe, den Operator ρ(r, sz ) = ψ † (r, sz )ψ(r, sz ) als die Teilchendichte am Ort r für den Spin sz normalität der XZ φk zu interpretieren. Aufgrund der Ortho- gilt † drψ (r, sz )ψ(r, sz ) = sz XXXZ sz = k XX k l drc†k cl φ∗k (r, sz )φl (r, sz ) l δkl c†k cl = X c†k ck = N, k also die integrierte Teilchendichte liefert die Teilchenzahl, wie es sich gehört. 50 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN Bemerkung Bei der obigen Formulierung ist es eher nebensächlich, dass wir die Modenfunktionen in der mit (r, sz )-Darstellung speziziert haben. Man erhält einen völlig äquivalenten Formalismus ψ † (p, sz ) und ψ(p, sz ), falls man statt dessen die (p, sz )-Darstellung wählt. Als nächstes betrachten wir die Paardichte, d.h. den Operator, dessen Erwartungswert die Wahrscheinlichkeit dafür angibt, dass sich sowohl am Ort r ein Teilchen mit Spin 0 0 als auch am Ort r ein Teilchen mit Spin sz bendet. Dieser Operator ist sz 1 ρ2 (x0 , x) = ψ † (x0 )ψ † (x)ψ(x)ψ(x0 ), 2 wobei wir die kompakte Notation x x für das Paar (r, sz ) eingeführt haben. (Eine Integrati- und Summation über sz 0 aufzufassen sein.) Wir berechnen als Beispiel den Erwartungswert von ρ2 (x , x) im Zwei- on über wird im folgenden auch immer als Integration über teilchenzustand |1k , 1l r : 0 1k , 1l |ρ2 (x , x)|1k , 1l 2 1 0 † † = {0}|ψ(x)ψ(x )ck cl |{0} 2 2 1 † † 0 † 0 = − {0}|ψ(x)ck ψ(x )cl |{0} + φk (x ) {0}|ψ(x)cl |{0} 2 1 2 = |−φk (x)φl (x0 ) + φk (x0 )φl (x)| . 2 antisymmetrisierten Zwei-Teilchen-Wellen- Wir erhalten also das Betragsquadrat einer funktion. Die Normierungsbedingung lautet Z Z dx dx0 1k , 1l |ρ2 (x0 , x)|1k , 1l = 1. wie aus der Orthonormalität der Modenfunktionen φk leicht hergeleitet werden kann. Für einen n-Teilchen-Zustand erhält man auf ähnliche Weise Z Z dx 0 dx n|ρ2 (x0 , x)|n = n . 2 also die Zahl der Paare, die aus den Modenindizes gebildet werden können. 3.1.2 Der Hamiltonoperator für Fermionfelder Wir betrachten jetzt ein System aus identischen Teilchen, die sich in einem gemeinsamen äuÿeren Potential V (r) bewegen und weiters eine Paarwechselwirkung W (ri − rj ) mitein- ander haben. Für den Erwartungswert der potentiellen Energie erhält man so in einem Zustand |χ den Ausdruck χ|Hpot |χ = Z dx V (r) χ|ρ(x)|χ + Z Z dx dx0 W (r − r0 ) χ|ρ2 (x, x0 )|χ . 3.2. DIE HARTREE-FOCK-NÄHERUNG 51 Die kinetische Energie hat eine entsprechend einfache Form in der χ|Hkin |χ = XZ dp sz Weil ψ(p, sz ), Impulsdarstellung: p2 χ|ψ † (p, sz )ψ(p, sz )|χ . 2m wie in der normalen Quantentheorie, als Fouriertransformierte von ψ(r, sz ) geschrieben werden kann, lässt sich dies umformen zu X χ|Hkin |χ = Z sz ~2 2 † dr χ|ψ (r, sz ) − ∇ ψ(r, sz )|χ . 2m Für den gesamten Hamiltonoperator erhalten wir also ~2 2 H = dr ψ (x) − ∇ + V (r) ψ(x) 2m Z Z 1 + dx dx0 ψ † (x0 )ψ † (x)W (r − r0 )ψ(x)ψ(x0 ). 2 Z † (1.3) Verallgemeinerungen, die spinabhängige Wechselwirkungen und/oder Mehrteilchenwechselwirkungen enthalten, sind leicht hinzuschreiben, aber für uns nicht weiters von Interesse. 3.2 Die Hartree-Fock-Näherung Eine der Aufgaben der Atom-, Kern- und Festkörperphysik ist es, die stationären Zustände ??) für ein n-Teilchen-System zu bestimmen. Um eine Idee für die des Hamiltonoperators ( dabei auftretenden Schwierigkeiten zu erhalten, leiten wir zuerst die Bewegungsgleichung für den Feldoperator ψ(x) , betrachtet als ein Operator im Heisenbergbild, ab. Insbesondere betrachten wir den Kommutator [H, ψ(x)] = [H0 + Hw , ψ(x)] , wobei H0 den Ein-Teilchen-Anteil und Z H0 = dx0 ψ † (x0 )H10 ψ(x0 ) H10 = − ~2 02 ∇ + V (r0 ). 2m Hw den Wechselwirkungsanteil bezeichnet: mit Für den ersten Teil des Kommutators erhalten wir so Z [H0 , ψ(x)] = Z dx0 ψ † (x0 )H10 ψ(x0 ), ψ(x) dx0 −ψ † (x0 )ψ(x)H10 ψ(x0 ) − ψ(x)ψ † (x0 )H10 ψ(x0 ) Z = − dx0 δ(x − x0 )H10 ψ(x0 ) = −H1 ψ(x). = 52 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 0 Bei dieser Herleitung wurde im ersten Schritt das Antivertauschen von ψ(x) mit ψ(x ), 0 0 0 sowie das Vertauschen von H1 und ψ(x) ausgenutzt (H1 wirkt auf x , aber nicht auf x). Im † 0 zweiten Schritt wurde der Antikommutator von ψ (x ) und ψ(x) eingesetzt. Das Ergebnis ist nicht sonderbar aufregend; ohne Wechselwirkung erhält man ψ(x) entwickelt nach den Eigenfunktionen ψ(x) = X φ̃l (x) von H1 ψ(x, t) dadurch, dass man Ẽk , mit Eigenwerten c̃l φ̃l (x), l und dann jedem ψ(x, t) = c̃l X seinen Zeitfaktor gibt: i c̃l φ̃l (x)e− ~ Ẽl t . k Der Kommutator mit dem Wechselwirkungsterm ergibt Z Z 1 0 dx dx00 ψ † (x0 )ψ † (x00 )W (r0 − r00 )ψ(x00 )ψ(x0 ), ψ(x) [Hw , ψ(x)] = 2 Z Z 1 0 00 0 00 = dx dx W (r − r ) ψ † (x0 ) ψ(x), ψ † (x00 ) ψ(x00 )ψ(x0 )− 2 δ(x − x )ψ (x )ψ(x )ψ(x ) 1 = 2 Z dx0 W (r0 − r)ψ † (x0 )ψ(x)ψ(x0 )− Z 00 0 † 00 00 00 † 00 00 0 dx W (r − r )ψ (x )ψ(x )ψ(x) Z =− dx0 W (r0 − r)ψ † (x0 )ψ(x0 )ψ(x). Die Wechselwirkung verknüpft also die Zeitentwicklung des Feldoperators ψ(x) mit derje- nigen eines Produktes aus drei Feldoperatoren. Die Bestimmung der Zeitentwicklung dieser letzteren Gröÿe erfordert Kenntnisse über Produkte aus 5 Feldoperatoren usw. Es bestehen also kaum Aussichten, ohne recht drastische Näherungen irgendwelchen Fortschritt zu machen. Die auf Hartree und Fock zurückgehende Idee zur Erhaltung einer Näherungslösung ist jetzt folgende: 1) Man nehme an, es existiert ein Satz von n Basisfunktionen φl (x), welche näherungs- weise harmonisch von der Zeit abhängen (als Heisenbergbild-Operatoren betrachtet). Für die Entwicklungskoezienten von ψ(x, t) nach diesen speziellen Basisfunktionen soll also gelten i cl (t) = e− ~ l t cl (2.1) 3.2. DIE HARTREE-FOCK-NÄHERUNG 2) 53 Nehme in dem Ausdruck Z dx0 W (r0 − r)ψ † (x0 , t)ψ(x0 , t)ψ(x, t) Z X † =− ck (t)cl (t)cm (t) dx0 W (r0 − r)φ∗k (x0 )φl (x0 )φm (x) [Hw , ψ(x)] = − k,l,m nur diejenigen Terme mit, die mit irgendeiner der in quenzen ψ(x, t) schon vorkommenden Fre- resonant sind. Dies sind sicher die wichtigsten Terme; der Eekt der sons- tigen Terme wird sich bei der Ausintegration der Bewegungsgleichungen weitgehend ausmitteln. Nach dieser Näherung bleiben (in Abwesenheit zufälliger Entartungen) k=l nur noch die Terme mit 3) oder k=m übrig. c†k ck Ersetze in den übriggebliebenen Termen den Operator wert hnk i durch seinen Erwartungs- im gesuchten stationären n-Teilchenzustand. Man erhält so [Hw , ψ(x, t)] = − X Z hnk i cm (t) dx0 W (r0 − r)φ∗k (x0 )φk (x0 )φm (x) X Z k,m + hnk i cl (t) dx0 W (r0 − r)φ∗k (x0 )φk (x)φl (x0 ) k,l Z =− dx0 W (r0 − r) ψ † (x0 )ψ(x0 ) ψ(x) Z + dx0 ψ(x0 )W (r0 − r) ψ † (x0 )ψ(x) , wobei wir die Summen für ψ(y) und ψ † (y) zurückgebildet haben, und benutzt haben, ??) gelten muss dass in einem stationären Zustand im Rahmen der Näherung ( D E c†k cl = δkl hnk i . Wenn wir jetzt den Ausdruck für φl (x) [Hw , ψ(x, t)] bilden und nach den (immer noch gesuchten) ??) einsetzen, erhalten wir die Eigenwertglei- zerlegen, und weiters die Bedingung ( chung Z dx W (r − r) φ (x )φ(x ) φl (x) 0 0 † 0 0 X 0 0 l φl (x) = H1 + Z − dx0 φl (x0 )W (r0 − r) ψ † (x0 )ψ(x) , oder Z l φl (x) = H1 + ! dx W (r − r) hnk i φ∗k (x0 )φk (x0 ) k Z − dx0 φl (x0 )W (r0 − r) X k hnk i φ∗k (x0 )φk (x). φl (x) 54 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN H0 zwei zusätzliche Terme auf: ein von der gemittelten Teilchendichte erdirektes Wechselwirkungspotential und ein zusätzliches, nichtlokales Austauschpotential. Zum letzteren tragen nur dieRZustände bei, die denselben Spin wie das gesuchte Es treten also zu zeugtes φl (r, sz )] haben; das Symbol dx0 bedeutet auch eine Summation über s0z , und 0 wenn φl (x ) und φm (x) bezüglich ihrer Spinabhängigkeit zueinander orthogonal stehen, trägt der Term l = m zum Austauschpotential nicht bei. φl (x) [d.h. Die oben hergeleiteten Gleichungen heiÿen und implizit; die gesuchten Funktionen die Gleichungen müssen Hartree-Fock Gleichungen. Sie sind nichtlinear φl (x0 ) kommen auch an der rechten Seite vor, und selbstkonsistent gelöst werden. In der Praxis geht man iterativ vor: Man nimmt zuerst n einigermaÿen plausibel erscheinende Versuchsfunktionen setzt die zugehörigen hnk i φ0k (x), gleich eins und berechnet direktes und Austauschpotential. Als nächstes löst man das so entstandene lineare Eigenwertproblem und nimmt die n Lösungen 1 mit niedrigstem l als neue Versuchsfunktionen φk (x). Man wiederholt dieses Verfahren, i−1 i bis sich die φk (x) von den φk (x) nicht mehr nennenswert unterscheiden. In der Praxis konvergiert das Verfahren recht ordentlich. Es ist aber nicht gesichert, dass die Lösung 0 eindeutig (d.h. von der Wahl der φk unabhängig) ist; man kennt Beispiele, in denen es mehrere Lösungen gibt. Bemerkung 1 Durch Weglassen des Austauschtermes erhält man aus den Hartree-Fock-Gleichungen die sog. Hartree-Gleichungen. Dabei lässt man allerdings den Term k = l im direkten Poten- tial (der im Hartree-Fock-Formalismus vom entsprechenden Term im Austauschpotential genau kompensiert wird) weg. Historisch wurden die Hartree-Gleichungen zuerst hergeleitet; man erhält sie, wenn man zu den vorhergehenden ähnliche Betrachtungen durchführt in der normalen n-Teilchen-Quantenmechanik unter Berücksichtigung des Pauliverbotes, aber ohne Antisymmetrisierung der Wellenfunktion. Hartree zeigte, dass man zu den Hartree-Gleichungen geführt wird, falls man mit Hilfe der Variationsrechnung versucht, den Erwartungswert des Hamiltonoperators H= n X (i) H1 i=1 n 1 X W (ri − rj ) + 2 i6=j=1 innerhalb der Klasse der Versuchswellenfunktionen vom Typ φ(x1 , . . . , xn ) = n Y φi (xi ) i=1 zu minimieren, wobei die {φi } einen Satz orthonormaler Funktionen bilden. (Im obigen (i) Ausdruck bezeichnet H1 den Operator H1 wirkend auf die Variablen des i-ten Teilchens). Die Hartree-Fock-Gleichungen erhält man auf ähnliche Weise durch Minimierung innerhalb der Klasse von antisymmetrisierten Produktwellenfunktionen (oder Slaterdeterminan- 3.2. DIE HARTREE-FOCK-NÄHERUNG 55 ten) n Y 1 X p φi (xpi ), (−1) φ(x1 , . . . , xn ) = √ n! p i=1 wobei über alle Permutationen P der Indizes 1 bis n summiert wird. Bemerkung 2 Der wichtigste Mangel der Hartree-Fock-Zustände ist die völlig unzureichende Beschreibung der Korrelationen in den Positionen der Elektronen. Für die Zweiteilchendichte im Hartree-Fock-Grundzustand gilt ρ2 (r, sz ; r0 , s0z ) = X φ∗k (r, sz )φk (r, sz )φ∗l (r0 , s0z )φl (r0 , s0z ) k<l − φ∗k (r, sz )φk (r0 , s0z )φ∗l (r0 , s0z )φl (r, sz ) . Falls sz 6= s0z gibt der zweite Term keinen Beitrag (dies ist sofort klar, wenn die Eigenfunktionen von sz {φl } sind; aber auch sonst ist dies leicht zu zeigen), und man erhält z.B. 1 1 1 1 ρ2 (r, + ; r0 , − ) = ρ(r, + )ρ(r0 , − ), 2 2 2 2 ein für ein System mit Coulombabstoÿung völlig unrealistisches Ergebnis. Für sz = s0z erhält man schon Korrelationen; insbesondere gilt auch im Hartree-Fock-Grundzustand ρ2 (r, sz ; r, sz ) = 0, wie es aufgrund des Pauliverbots sein soll, aber sonst ist auch hier das Hartree-FockErgebnis für die Korrelationsfunktion g2 (x, x0 ) ≡ ρ2 (x, x0 ) − ρ(x)ρ(x0 ) weit von der Realität entfernt. Die Berechnung von Korrelationseekten ist wegen der langen Reichweite des Coulombpotentials recht dizil; eine normale Störungsentwicklung um das Hartree-Fock-Ergebnis konvergiert schlecht und führt für ausgedehnte Systeme (Festkörper) sogar zu Divergenzen oder unphysikalischen Formabhängigkeiten in den einzelnen Ordnungen. Erst eine Resummation der Störungsreihe, die dem Phänomen der Abschirmung der Coulombkräfte Rechnung trägt, führt zu einigermaÿen akzeptablen Er- gebnissen (siehe Kap. 6 im Buch von Kittel für eine Einführung in die Problematik). Die Korrelationsfunktion kann insbesondere durch Streuung polarisierter Neutronen gemessen werden; Experimente dieser Art wurden in letzter Zeit am Hochussreaktor in Grenoble an einigen Materialien durchgeführt. 56 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN 3.2.1 Die Bedeutung der Hartree-Fock Eigenwerte Die Hartree-Fock Eigenwertgleichung besitzt viele der Eigenschaften einer normalen Schrödingergleichung; insbesondere kann sie geschrieben werden als 1 φl (x), l φl (x) = HHF wobei 1 HHF ein eektiver hermitescher Ein-Teilchen-Hamiltonoperator ist, der zwar von dem gesuchten Vielteilchenzustand, des Weglassens des Terms k=l aber nicht vom Modenindex Unabhängigkeit bringt mit sich, dass der übliche Beweis der unterschiedlichen l l abhängt. (Wegen ist dies in der Hartree-Näherung nicht der Fall!) Letztere Orthogonalität der φl mit ohne weiteres auch auf die Hartree-Fock Eigenfunktionen anwendbar ist; es ist also möglich, die φl (x) orthonormal zu wählen. Andererseits gilt nicht, dass die Hartree-Fock Grundzustandsenergie geschrieben werden kann als Summe der l für die besetzten Ein-Teilchen-Zustände: E0,HF 6= n X l . (2.2) l=1 Zur Überprüfung der obigen Ungleichheit berechnen wir zuerst einen Ausdruck für ∗ Multiplikation der Eigenwertgleichung mit φl (x) und Integration über x: Z l = dx φ∗l (x)H1 φl (x) + n Z X Z dx l durch dx0 |φl (x)|2 W (r − r0 )|φk (x0 )|2 k=1 n Z X − Z dx dx0 φ∗l (x)φ∗k (x0 )W (r − r0 )φl (x0 )φk (x). k=1 Andererseits erhält man für den Erwartungswert des Vielteilchen-Hamiltonoperators ( |11 , . . . , 1n ; 0n+1 , . . . ≡ |0HF Z X = 0HF |H|0HF = dx φ∗l (x)H1 φl (x) im Hartree-Fock-Grundzustand E0,HF ??) das Ergebnis l + − n n Z 1 XX 2 dx0 |φk (x)|2 W (r − r0 )|φl (x0 )|2 Z dx0 φ∗l (x)φ∗k (x0 )W (r − r0 )φl (x0 )φk (x). dx k=1 l=1 n n Z 1 XX 2 Z dx k=1 l=1 ??) Die Wechseiwirkungsterme treten also in den zwei in ( verglichenen Ausdrücken mit 0 auf. Die Energien l − (l ≤ n, l > n) sind genau die 0 Energien, die man brauchen würde, um ein Elektron aus dem Zustand l in den Zustand unterschiedlichen Vorfaktoren l zu bringen l0 ohne Änderung der Zustände der sonstigen Elektronen. Für groÿe Atome und Kerne (und erst recht für Festkörper) kann die Änderung der Zustände der 3.2. DIE HARTREE-FOCK-NÄHERUNG 57 verbliebenen Elektronen (Kongurationsrelaxation) vernachlässigt werden, und die können dann mit den experimentellen l − l0 Anregungsenergien für Elektronen verglichen wer- den. Als Beispiel der so erhaltenen Ergebnisse werden in der nachfolgenden Tabelle die mit der Hartree-Fock-Näherung errechneten lonisationsenergien für die verschiedenen Zustände mit dem Experiment verglichen. Dabei ist zu berücksichtigen, dass die L·S-Kopplung in der Rechnung nicht berücksichtigt wurde, im Experiment aber nicht abzuschalten ist. HF exp n Fehler j = l + 1/2 j = l − 1/2 1s 2s 1828 270 2p 3s 3p 3d 251 52,2 44,3 29,8 260,1 46,0 27,8 1879,7 282,0 53,4 247,2 43,6 27,4 −2,8% −4,4% −1,1% −2,3% −1,1% +7,4% 4d 1,69 1,57 +7,1% (Energien in Rydberg.) Für Näheres siehe Bethe-Jackiw. Zwischenbemerkung: Die Symmetrie der Orbitale In der obigen Tabelle wurden die Funktionen φl (x) (weiters auch Orbitale genannt) cha- rakterisiert durch Quantenzahlen, wie sie für ein Zentralfeldproblem üblich sind. Genau betrachtet ist aber das eektive Potential nicht exakt zentralsymmetrisch, auÿer für ein Atom mit abgeschlossenen Schalen (Edelgasekonguration); im letzteren Fall ist sofort klar, dass das direkte Potential zentralsymmetrisch ist, und eine relativ mühsame Rechnung zeigt, dass auch das Austauschpotential eine so symmetrische Form hat, dass Lösungen vom Typ φk (x) = φnlmσ (r, sz ) = Rnl (r) Ylm (θ, φ)χσ (sz ) r möglich sind (siehe Bethe-Jackiw, S.64, für Einzelheiten). Für nicht-Edelgas-Atome ist die obige Überlegung nicht mehr exakt gültig; sie bleibt aber aufrecht für den Beitrag ge1 schlossener Schalen zu HHF , und für die sonstigen Beiträge erweist es sich als eine nicht zu schlechte Näherung, auch diese durch ihr Mittel über die Winkel zu ersetzen; die so gemachten Fehler sind klein gegenüber den ohnehin schon in der Hartree-Fock-Näherung enthaltenen. Die sphärische Mittelung bringt einen zweifachen Vorteil: Erstens sind die Rechnungen um Gröÿenordnungen einfacher, weil eindimensionale statt dreidimensionale gekoppelte Integro-Dierentialgleichungen selbstkonsistent zu lösen sind. Zweitens sind auch die Ergebnisse einfacher zu deuten, und insbesondere lässt sich das Periodensystem relativ leicht anhand eines Hartree-Fock Schalenbildes diskutieren. Ähnliche Überlegungen können für Festkörper gemacht werden. Das eektive Potential V (r), als das in der Theorie der Bandstruktur von Festkörpern auftritt, soll eigentlich auch selbstkonsistentes Potential im Sinne einer Hartree-Fock-Theorie aufgefasst werden. Auch hier kann nur für die Beiträge vollständig gefüllter Bände gezeigt werden, dass sie strenge Gitterperiodizität besitzen. Die Beiträge teilweise gefüllter Bände brauchen nicht die Symmetrie des Gitterpotentials zu haben (Gegenbeispiel: Für von Leitungselektronen 58 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN verursachten Ferromagnetismus ist das eektive Potential, im Gegensatz zum Gitterpotential, spinabhängig). In normalen Materialien stellt der Ansatz einer Bloch-Form für die Orbitale: φl (x) = eik·r ukn (r)χσ (sz ), ukn (r), mit gitterperiodischem noch eine der harmlosesten Näherungen in einer Band- strukturrechnung dar. Insbesondere bei genau halbgefüllten Bändern muss man aber auf das Auftreten von Strukturen mit dem inversen Fermi-Wellenvektor (Elektrondichtewellen) gefasst sein. Solche Strukturen in der Elektronendichte führen aber i.a. wieder zu Gitterverzerrungen, womit dann wieder Gitter und Elektronen in Gleichschritt gebracht worden sind. 3.2.2 Beispiel: Das Elektronengas Ein einfaches Beispiel, wofür die Hartree- und Hartree-Fock-Gleichungen exakt gelöst werden können, ist das Elektronengas, d.h. ein Modell, in dem das Potential der lonenrümpfe ersetzt wird durch das Potential einer homogenen über das Kristallvolumen ausgeschmier(+) = N |e|/V . Die Hartree-Gleichung lautet dann ten Ladungsverteilung ρ0 " p2 − l φl (x) = 2m Z (+) ρ |e| dx0 0 0 + |r − r | Z # n 0 2 X e dx0 φ∗ (x0 )φk (x0 ) φl (x), |r − r0 | k=1 k wobei der Strich bei der Summation bedeutet, dass der Term k=l entfällt. Wir versuchen den Lösungsansatz 1 φkσ (r, sz ) = √ eik·r χσ (sz ), V wobei der Wellenvektor k so gewählt werden soll, dass die periodischen Randbedingungen an den Grenzen des kubisch gewählten Volumens erfüllt sind. Mit dieser Wahl erhält man für die Ladungsdichte im direkten Potential 0 N X0 X N −1 1 (−) ∗ e e= e. φk (r)φk (r) = eρ0 = V V k k=1 Bis auf einen Fehler der Ordnung 10−23 hebt also das direkte Potential das äuÿere Potential der verschmierten Rumpadungen genau auf, und man erhält für die Hartree-Energien genau die Werte für freie Teilchen kσ = ~2 k2 . 2m k-Werte bis zu einem Wert kF mit jeweils zwei Elektronen kF bestimmt man aus der Beziehung r Z V 1 N 3 k 2 dk dΩ = 2 kF3 = N −→ kF = 3π 2 . π 3 V Im Grundzustand sind sämtliche (zwei Spinrichtungen) besetzt. V 2 3 8π Z 0 kF 3.2. DIE HARTREE-FOCK-NÄHERUNG 59 Für die mittlere Energie pro Teilchen erhält man R 3 ~2 kF2 3 ~2 k 2 k 2 dk R = = F , hl i = 2 2m 5 2m 5 k dk wobei auch F wieder in der Dichte auszudrücken ist. Oft wählt man eine etwas andere Darstellung und drückt V 4 3 πr0 = 3 N kF −→ r0 des mittleren Volumens r 4 3 α0 = = 0,521 . . . . 9π aus in dem Radius kF = 1 α0 r0 mit pro Teilchen: Ein vernünftiger dimensionsloser Parameter ist das Verhältnis rs von r0 zum Bohr'schen 2 2 Radius a0 = ~ /(me ) = 0,529 Å. Ausgedrückt in diesem Parameter erhält man hl i = 3 me4 1 2,210 = Ry. 2 5 2~2 α0 rs2 rs2 Zwischenbemerkung Der obige Ausdruck ist nicht mit der Energie pro Teilchen im Hartree-Grundzustand iden- tisch. Bei der Berechnung der letzteren Gröÿe geht die Wechselwirkung der Elektronen mit dem Hintergrund voll ein, die Wechselwirkung der Elektronen untereinander aber nur mit dem Faktor 1/2. Die physikalisch interessante Gröÿe ist aber nicht diese Grundzustands- energie, sondern die Kohäsionsenergie in der auch noch die elektrostatische Energie der Hintergrundladung in Betracht gezogen wird. Letztere ist wieder genau gleich der Wechselwirkungsenergie der Elektronen und die Bilanz stimmt wieder! Man kann dieses Ergebnis auch dadurch erreichen, dass man das Elektronengas so aufbaut, dass man abwechselnd ein Elektron in das Volumen V hineinbringt und den positiven Hintergrund um eine Einheits- ladung aufstockt. Weil man so immer Ladungen an fast-neutralen Systemen hinzufügt, −1 braucht man (bis zu Ordnung N ) keine elektrostatische Arbeit zu leisten. 3.2.3 Die Austauschenergie des Elektronengases Es wird sich jetzt herausstellen, dass die ebenen Wellen auch Eigenfunktionen des Austauschterms in der Hartree-Fock Eigenwertgleichung sind. Da die Austauschkräfte nur zwischen Orbitalen gleicher Spins wirken, gilt X 0 1 Z 1 ik·r ~2 k2 1 ik·r 0 0 0 √ e − √ = dr0 ei(k−k )·r W (r − r0 )eik ·r kσ √ e 3 2m V V V |k0 |<kF Z X 0 1 0 0 √ = ... − dr0 ei(k−k )·(r −r) W (r − r0 )eik·r , V3 |k0 |<kF und durch Übergehen auf die Integrationsvariable kσ = ~2 k2 1 X0 − G(k − k0 ), 2m V k0 <k F r0 − r = s erhält man 60 KAPITEL 3. wobei G(q) QUANTENTHEORIE VON FERMIONFELDERN für das Coulombpotential den Wert Z G(q) = ds e −iq·s W (s) = e 2 Z ds e−iq·s 4πe2 = 2 s q annimmt. Substitution dieses Ausdruckes ergibt Z ~2 k2 4πe2 X 0 1 4πe2 V kσ − =− =− 2m V k0 <k |k − k0 |2 V 8π 3 F 2 Z dk0 1 |k − k0 |2 k<kF kF Z +1 e 1 2π k 02 dk 0 dµ 2 2 02 2π k + k − 2kk 0 µ 0 −1 Z e2 kF 0 0 e2 kF2 − k 2 kF + k k + k0 =− =− ln k dk ln + kF . πk 0 |k − k 0 | π 2k kF − k =− Im Punkt k = kF kσ = Weil die im kσ eine senkrechte 2 2 1 + x ln + O(x ) . |x| hat die Funktion ~2 k2 e2 kF − 2m π Zustandsdichte einen Faktor (∂kσ /∂k)−1 k-Raum Tangente: für k = kF (1 + x) enthält (die erlaubten gilt k-Werte sind gleichmäÿig verteilt), bedeutet dies eine verschwindende Zustandsdichte an der Fermikante, was für die Transporteigenschaften bei niedriger Temperatur und für das thermodynamische Verhalten bedeutsam wäre. Allerdings ist die Einschneidung in der Zu−1 standsdichte sehr schmal (siehe Skizze): um auf einen Bruchteil p der Hintergrundsdichte herunterzukommen, muss man bis auf einen Bruchteil π(p − 1) x = 2 exp − α 0 rs an die Fermienergie herangehen. Für rs = 3 und p = 10 ist dies 3 · 10−8 . Auch in der Theorie ist der Eekt sehr delikat; die Einschneidung kann leicht durch Korrelationseekte (Abschirmung des Coulomb-Potentials) verschmiert werden. Experimentell gibt es, z.B. in Metallen, nicht den geringsten Hinweis auf eine verschwindende Zustandsdichte an der Fermikante. Die mittlere Energie pro Elektron kann im Prinzip durch Summation aller kσ erhalten 1 weil es sich um eine Wechselwirkungsenergie handelt, 2 für die beiden Spinrichtungen). Eine direkte Rechnung ist werden (man braucht einen Faktor siehe S. ??, und einen Faktor 2 aber einfacher 1 4πe2 X 0 1 Eex = − 2 2 V k ,k <k |ki − kj |2 i j F 2 Z 2 4πe V 1 =− . dk1 dk2 3 V 8π |k1 − k2 |2 k1 ,k2 <kF 3.2. DIE HARTREE-FOCK-NÄHERUNG 61 Der Integrand kann umgeschrieben werden als 1 1 1 1 ≡ 2 . ≡ 2 2 2 2 |k1 − k2 | k1 + k2 − 2k1 k2 µ k1 1 + s − 2sµ Der zweite Faktor kann für s<1 in den Legendre-Polynomen ausgedrückt werden: " #2 ∞ X X 1 0 L = s PL (µ) = sL+L PL (µ)PL0 (µ). 2 1 + s − 2sµ L L,L0 =0 Das gesamte Integral setzt sich zusammen aus Beiträgen der Bereiche k1 < k2 (s > 1), k2 < k1 (s < 1) und welche aus Symmetriegründen gleich sein müssen. Das erste Teilintegral lässt sich mit Hilfe der obigen Formeln berechnen; für das Gesamtintegral Z Z I=2 2πk22 dk1 k1 <kF k2 <k1 Z = 8π Z dk1 dk2 0 k1 <kF Z = 8π k1 dk1 k1 L k1 <kF erhält man so L+L0 ∞ X 1 k2 P (µ)PL0 (µ) dk2 dµ 2 L k k 1 1 0 L,L =0 2L+2 ∞ X k2 L=0 X I k1 1 2L + 1 ∞ X 1 1 2 4 = 8π kF . (2L + 1)(2L + 3) (2L + 1)(2L + 3) L=0 Wegen ∞ X ∞ 1X 1 1 1 1 = − = (2L + 1)(2L + 3) 2 L=0 2L + 1 2L + 3 2 L=0 erhält man letztendlich für die Austauschenergie Eex = − e2 kF4 V e2 V 2 4 4π k = − . F 16π 5 4π 3 Einsetzen der Beziehung zwischen kF und der Dichte liefert für die mittlere Austausch- energie pro Teilchen ex = − 0,916 3e3 =− 4πα0 r0 rs Ry, und für die Kohäsionsenergie pro Teilchen in Hartree-Fock Näherung koh HF = 2,21 0,916 − rs2 rs Ry. Anders als in der Hartree-Näherung erhält man also einen Ausdruck, der wenigstens für genügend groÿes rs (für Metalle gilt typischerweise 2 < rs < 5) negativ werden kann 62 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN (Echte metallische Kohäsion würde übrigens erfordern, dass koh die atomare lonisations- energie übersteigt). Nähere Diskussion des obigen Ergebnisses lohnt sich aber kaum, weil die Hartree-Fock Näherung viel zu grob ist, um realistische Werte für die Kohäsionsenergie zu liefern. Weiters haben wir durch Einsetzen der ebenen Wellen zwar eine Lösung der Hartree-Fock-Gleichungen bestimmt, aber keineswegs gezeigt, dass dies auch die energetisch günstigste Lösung ist. Overhauser konnte zeigen, dass man Lösungen mit niedrigerer Energie erhält durch das Ansetzen von Spindichtewellen; in diesen Lösungen ist die Ge- samtladungsdichte konstant, aber es gibt lokal Überschüsse der einen oder anderen Spinrichtung. Dies kostet zwar kinetische Energie, aber die potentielle Energie wird abgesenkt, weil Teilchen gleichen Spins einander aus dem Wege gehen, wie wir gleich im Detail sehen werden. Auch die Overhauser-Lösung liefert aber noch keinen realistischen Wert für die Kohäsionsenergie. 3.2.4 Die Korrelationsfunktion (das Austauschloch) Zum Schluss unserer Diskussion der Hartree-Fock Näherung bestimmen wir noch die Paar0 dichte ρ2 (r, +; r , +) für Elektronen gleichen Spins (die - triviale - Struktur für ungleiche Spinrichtungen wurde schon auf S. ?? bestimmt). Aus dem Ausdruck von S. ?? für parallele Spins folgt i 1 Xh −i(k−k0 )·(r−r0 ) 1−e ρ2 (r, +; r , +) = 2 V kk0 Z 2 2 1 N 1 −ik·(r−r0 ) = − dk e 3 2 4 V (8π ) 0 k<kF = Das Integral in F (y) 1 4 N V 2 1 − F 2 (kF |r − r0 |) . ist der Formfaktor der Einheitskugel; mit Hilfe der Beziehung 1 V 4π 3 kF = N 2 (2π) 3 2 erhält man für F (y) = F (y) das Ergebnis 3 (sin y − y cos y). y3 1 2 F (y) verhält sich für kleine y wie 1− 10 y und hat seinen ersten Nulldurchgang y = π/4, d.h. bei r = π/4kF = πα0 r0 /4 = 0,409 r0 . Das Loch in der Elektronendichte Die Funktion bei um jedes Elektron heiÿt Fermi- oder Austauschloch. In einem reellen Elektronengas gibt es natürlich zusätzliche Eekte aufgrund der Coulomb-Abstoÿung, die in der Hartree-Fock Näherung nur äuÿerst unzureichend berücksichtigt worden sind. 3.2. DIE HARTREE-FOCK-NÄHERUNG 63 3.2.5 Die Dichtefunktionalmethode Zu einer Verbesserung des Ergebnisses der Hartree-Fock-Methode kann man durch Störungstheorie oder durch Variationsrechnung geraten. In den letzten Jahren hat sich aber ein alternativer Zugang durchgesetzt: die Dichtefunktionalmethode. Ausgangspunkt ist ein bemerkenswertes Theorem von Hohenberg und Kohn: Der Grundzustand der N-TeilchenSchrödingergleichung für ein System von N Elektronen in einem vorgegebenen äuÿeren (1) Potential V(r) ist im Prinzip durch die Teilchendichte ρ (r) = n(r) eindeutig festgelegt. Der Beweis erfolgt durch reductio ad absurdum: Nehme an, es gäbe zwei Potentiale und V2 (r), V1 (r) die zur selben Dichte im Grundzustand führen. Falls wir die entsprechenden Grundzustände mit Ψ1 (r1 , . . . , rN ) und Ψ2 (r1 , . . . , rN ) bezeichnen, so gilt nach dem Ritz- schen Variationsprinzip: E10 = Ψ1 |H1 |Ψ1 < Ψ2 |H1 |Ψ2 Z = Ψ2 |H2 |Ψ2 + dr [V2 (r) − V1 (r)] n(r), wobei das <-Zeichen nur durch ein = ersetzt werden kann, falls V1 (r) und V2 (r) sich nur um eine Konstante unterscheiden. Aus der obigen Ungleichung folgt Z E10 − E20 < dr [V2 (r) − V1 (r)] n(r). Durch Vertauschen der Indizes 1 und 2 erhält man aber Z E20 − E10 < dr [V1 (r) − V2 (r)] n(r), was einen Widerspruch ergibt. Die Annahme, zwei verschiedene n(r), V (r) führen zum selben ist also nicht haltbar. E0 [n(r)] geben, das die Grundzustandsenergie in der zum Grundzustand gehörenden Dichte n(r) ausdrückt. Das Funktional kann geschrieben werden Es muss also ein Funktional als Z E0 [n] = T [n] + wobei 1 dr V (r)n(r) + 2 ZZ dr dr0 e2 n(r)n(r0 ) + EXC [n], |r − r0 | T [n] die kinetische Energie und EXC [n] die Austausch- und Korrelationskorrekturen T [n] als auch EXC [n] sind aber bisher noch unbekannte Funktionale. Der darstellt. Sowohl Vorteil des neuen Formalismus ist aber, dass er als Ausgangspunkt für neuartige Näherungen dienen kann. Die lokale-Dichte-Näherung Die einfachste Näherung besteht darin, dass wir die Ergebnisse für das homogene Elek- tronengas nützen. Für dieses System (Jellium) gibt es recht gute Näherungen für E0J (n), 64 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN Funktion von das wegen der Homogenität kein echtes Funktional, sondern lediglich eine J n ist, und deshalb auch für EXC (n). Wir ersetzen nun das exakte Funktional Z EXC [n] ' EXC [n] durch J dr EXC (n(r)) , also durch einen gewichteten Mittelwert der Werte für homogenes Jellium. E0 [n] einem Variationsprinzip ähnlich Ψ|H1 |Ψ sein Minimum für Ψ1 annimmt und von E0 [n] nach n lautet in der lokalen-Dichte- Die nächste Beobachtung ist, dass das Funktional dem Rayleigh-Ritz-Prinzip gehorcht (weil Ψ1 durch n(r) bestimmt ist). Die Variation Näherung: δT δE0 = + V (r) + Φdir (r) + µXC (r) = 0, δn δn wobei Z Φdir (r) = dr0 e2 n(r0 ) ; |r − r0 | µXC (r) = J (n(r)) dEXC . dn Dieses Variationsprinzip ist identisch zu demjenigen für ein Gas aus nichtwechselwirkenden Teilchen im eektiven Potential Vef f (r) = V (r) + Φdir (r) + µXC (r). Für dieses äquivalente System ist der Grundzustand gegeben als eine Slaterdeterminante aus den N niedrigsten Eigenfunktionen der sog. Kohn-Sham-Gleichung: ~2 2 ∇ + Vef f Φ(r) = KS Φ(r); − 2m (2.3) diese Gleichung ist, wie die Hartree-Gleichung, bei vorgegebenem n(r) numerisch lösbar. ??) für Wie bei der Hartree-Gleichung kann man also iterativ vorgehen: Zuerst löst man ( n0 (r); aus den N niedrigsten Eigenfunktionen konstruiert man dann über die Slater-Determinante ein n1 (r), bestimmt daraus ein neues Vef f (r) und wiederholt eine Versuchsfunktion das Verfahren, bis man in genügender Näherung Konsistenz erreicht hat. Die Dichtefunktionalmethode in der lokalen-Dichte-Näherung hat zu einem Durchbruch bei der Berechnung der Struktur von Atomen, Molekülen und Festkörpern geführt. Gegenüber einer direkten Lösung der Schrödingergleichung hat sie aber den Nachteil, dass sie nicht systematisch ist (Variationsrechnung: untere Grenze; Störungsrechnung: fester Algorithmus). Seit den ersten Arbeiten von Kohn et a. hat es weitere Entwicklungen gegeben; insbesondere sind Korrekturen zur lokalen-Dichte-Näherung vorgeschlagen worden, in denen auch Ortsabhängigkeiten über die Ableitungen von n(r) mitgenommen werden. Auch diese Varianten bilden aber noch keine voll systematische Theorie. 3.3. DIE ELEKTRON-PHONONWECHSELWIRKUNG; POLARONEN 65 Literatur ∗ Einführend: → ∗ Physics Today, December 1998, p 21 Originalarbeiten: → P. Hohenberg, W. Kohn, Phys. Rev. B 136, 864 (1964) → W. Kohn, L.J. Sham, Phys. Rev. A 140, 1133 (1965) 3.3 Die Elektron-Phononwechselwirkung; Polaronen In diesem Abschnitt werden wir die Elektron-Phonon-Wechselwirkung in einem Festkörper diskutieren. Unser wichtigstes Ziel dabei ist es, die Diskussion der BCS-Theorie der Supraleitung vorzubereiten. Weil in der BCS-Theorie nur die niedrigfrequenten Phononen eine Rolle spielen, und deren Verhalten von Einzelheiten der Gitterstruktur weitgehend unabhängig ist, werden wir uns in der Diskussion der Phononen auf einfache hochsymmetrische Kristalle beschränken, sofern die Diskussion und die Formeln dadurch einfacher werden. 3.3.1 Gitterschwingungen und ihre Quantisierung; Phononen Im vorhergehenden Kapitel wurde skizziert, wie man im Prinzip die elektronische Grundzustandsenergie für ein System von Elektronen in einem vorgegebenen äuÿeren Potential berechnet, insbesondere im Potential einer vorgegebenen Anordnung von lonenrümpfen. Für eine vorgegebene Zahl von Ionenrümpfen (oder sogar von Kernen) in einem vorgegebenem Volumen wird diese Grundzustandsenergie von der Anordnung der Rümpfe abhängen, und i.a. ihr Minimum für irgendeine periodische Anordnung erreichen, wobei jedes Ion auf einem Gitterplatz Rnα sitzt, mit Rnα = Rn + cα = n1 a1 + n2 a2 + n3 a3 + cα ; ai drei Gittervektoren; die ni sind ganze Zahlen mit 0 ≤ ni ≤ Ni ; N1 N2 N3 = N/s, und die Zahl s bezeichnet die Zahl der Plätze, charakterisiert durch die Vektoren cα mit 1 ≤ α ≤ s, innerhalb einer Gitterzelle. Gitterplätze verschiedener cα können mit Ionen dabei sind die verschiedener Art besetzt sein. Wir betrachten im weiteren Kongurationen des Gitters, in denen jedes Ion sich nahe seinem Gitterpunkt bendet: rnα = Rnα + snα , und betrachten die potentielle Energie nur bis zu quadratischen Termen in den E ({snα }) = E0 + 1 X Φnαi 0 0 snαi sn0 α0 j 2 nn0 αα0 ij n α j snα : 66 KAPITEL 3. mit QUANTENTHEORIE VON FERMIONFELDERN E0 = E({0}); die Entwicklungskoezienten Φnαi n0 α0 j Kraftkonstanten. Zwischen Symmetriebedingungen. Die heiÿen den Kraftkonstanten existieren viele strukturabhängige wichtigsten sind: a) Symmetrie 0 0 nαj Φnαi n0 α0 j = Φnαi b) Invarianz gegenüber Gittertranslationen: (n−n0 )αi Φnαi n0 α0 j = Φoα0 j (d.h. der Energieaufwand für eine Auslenkung zweier Ionen hängt nur vom Abstand der Gleichgewichtspositionen, nicht aber von deren absoluten Orten ab.) c) Invarianz gegenüber starren Verschiebungen des Gitters X 0 0 Φnnαiα j = 0. nα Die Hamiltonfunktion für die Gitterschwingungen kann jetzt geschrieben werden als HG = 1 X 1X mα (ṡnα )2 + Φnαi 0 0 snαi sn0 α0 j . 2 nα 2 nn0 αα0 ij n α j (3.1) Dies ist die aus der Vorlesung Mechanik bekannte Form für kleine Schwingungen um ein Gleichgewicht. Es existieren zeitlich periodische s(p) nα (t) = √ Normalschwingungen vom Typ 1 −iωp t u(p) nα e mα mit zeitunabhängigen (p) unα . orthogonal zueinander stehen; für die Skriptum Mechanik). Die Eigenwerte −1/2 (p) mα bewirkt, dass die u zu verschiedenen ωp (p) s gilt mit mα gewichtete Orthogonalität; siehe (Der Faktor ωp folgen aus der Eigenwertgleichung 0 0 (p) ωp2 unαi = X n0 α0 j (p) Dnαi un0 α0 j n0 α0 j n0 α0 j mit Dnαi Φnnαiα j ≡√ . mα mα0 Wegen der Invarianz bezüglich Gittertranslationen lässt sich dieses in N/s unabhängige (p) unαi ≡ uqβ nαi (3s × 3s)-Eigenwertprobleme r = s qβ iq·Rn c e . N αi (3N ×3N )-Eigenwertproblem zerlegen mit dem Ansatz 1 ≤ β ≤ 3s (3.2) 3.3. DIE ELEKTRON-PHONONWECHSELWIRKUNG; POLARONEN 67 Hierdurch reduziert sich die obige Eigenwertgleichung zu " X X 2 qβ ωqβ cαi = α0 j Doαi # eiq·(Rn −Rn0 ) cqβ α0 j n0 X ≡ (n0 −n)α0 j (3.3) α0 j Dαi (q)cqβ α0 j . α0 j Die N/s Gittervektoren qm = wobei bi q haben die Gestalt m2 m3 m1 b1 + b2 + b3 ; N1 N2 N3 die 0 < mi < Ni , (3.4) Basisvektoren des reziproken Gitters sind, charakterisiert durch bi ·aj = 2πδij . ??) mit den q-Vektoren (??) erfüllen periodische Randbedingungen für ein Volumen bestehend aus N1 × N2 × N3 Einheitszellen. Die Einschränkung in (??) zur sogen. ersten Brillouin-Zone verhindert Doppelzählungen: Man überzeugt sich leicht, dass die Die Lösungen ( Substitution q m → q m + Gp mit ganzzahligen pi mit Gp = p1 b1 + p2 b2 + p3 b3 die Eigenvektoren uqβ nαi unverändert lässt. Normalkoordinaten Wenn wir die Lösungen des Eigenwertproblems ( X ??) gemäÿ 0 ∗ qβ cqβ αi cαi = δββ 0 αi normieren, können wir die allgemeinste Lösung der aus ( ??) hergeleiteten Bewegungsglei- chungen in der Form snαi (t) = X qβ r s qβ iq·Rn c e Qqβ (t) N mα αi schreiben. Falls wir weiters die cqβ αi so wählen, dass gilt ∗ c−qβ = cqβ , αi αi was aufgrund der Form der Eigenwertgleichung ( X n 0 ei(q−q )·Rn = N ∆(q − q0 ) s ??) erlaubt ist, und weiters die Identität 68 KAPITEL 3. benützen, wobei ∆(q) QUANTENTHEORIE VON FERMIONFELDERN gleich eins ist für den Nullvektor oder jeden anderen Vektor des reziproken Gitters, und null für alle sonstigen Vektoren, so lässt sich die Hamiltonfunktion HG mittels einer etwas mühsamen Rechnung in 1X 1 X 2 2 Q̇qβ Q̇−qβ + ωqβ Qqβ Q−qβ = Pqβ P−qβ + ωqβ Qqβ Q−qβ , 2 qβ 2 qβ HG = umformen, wobei die Pqβ und Qq0 β 0 die üblichen Poisson-Klammern für Koordinaten und Impulse erfüllen. Die Quantisierung der Gitterschwingungen geschieht mittels der Substitution s ~ aqβ + a†−qβ ; 2ωq β r ~ωqβ † = −i a−qβ − aqβ , 2 Qqβ = Pqβ wobei die aqβ und Boseteilchen heiÿen a†qβ Erzeuger und Vernichter für Bosonen sind. Die so erhaltenen Phononen. Die Hamiltonfunktion in diesen Variablen erhält die schon vertraute Form H= X qβ 1 † ~ωqβ aqβ aqβ + , 2 Nullpunktsenergie des Phononensystems liefert einen Beitrag zur Grundzustandsenergie und und wir können auch für die Phononen eine Besetzungszahldarstellung einführen. Die muss als solche neben der elektronischen Grundzustandsenergie beim Vergleich zweier konkurrierender Kristallstrukturen berücksichtigt werden. Dynamisch spielt sie aber keine Rolle. Optische und akustische Phononen 2 Aus der Struktur des Eigenwertproblems geht hervor, dass die ωqβ analytische Funktionen qβ von q sind, und dass die cαi analytisch gewählt werden können. Andererseits weiÿ man, q = 0 drei Eigenvektoren zu ω = 0 gibt, nämlich die starren Verschiebungen des Gitters. Es müssen sich also unter den 3s Funktionen ωqβ = ωβ (q) mindestens 3 benden, die für q ↓ 0 nach Null gehen. Andererseits lässt sich zeigen, dass die Anwesenheit von mehr als 3 nach Null strebenden Frequenzen, sowie von ωβ (q), die langsamer als q ansteigen, mit dass es für der Stabilität der Kristallstruktur unvereinbar ist. Für Kristalle genügend hoher Symmetrie (z.B. kubische Kristalle) gibt es drei sog. cqβ α k q; und zwei entartete cqβ α ⊥ q; akustische Zweige, einen longitudinalen mit ωβ (q) = cl q + O(q 2 ) transversale mit ωβ (q) = ct q + O(q 2 ), 3.3. DIE ELEKTRON-PHONONWECHSELWIRKUNG; POLARONEN wobei cl 69 ct die longitudinale, bzw transversale Schallgeschwindigkeit bezeichnen. Wenn q = 0 entfernen, so geht die strenge Trennung zwischen longitudinalen und wir uns vom Punkt und transversalen Schwingungen, sowie die Entartung der zwei vorwiegend transversalen Zweige, auÿer in einigen hochsymmetrischen Richtungen im Kristall, allmählich verloren. Die 3(s − 1) weiteren Phononenzweige werden optische Zweige genannt. 3.3.2 Die Elektron-Phonon-Wechselwirkung Wir betrachten jetzt einen Kristall mit Ein-Elektron-Orbitalen vom Bloch-Typ 1 Φkνσ (x) = √ eikr ukν (r)χσ (sz ), V mit einer gitterperiodischen Funktion kung des Ions n, α. X vα (r − rnα ) = X = V0 (r) − XX r Qqβ nαi qβ V0 (r) r wirkt; in niedrigster Ordnung gilt [vα (r − Rnα ) − snα ∇vα (r − Rnα )] nα nα wobei und untersuchen den Einuss einer Auslen- Diese Auslenkung hat einen direkten Einuss auf das Potential der Ionen das auf die Elektronen am Ort V (r) = ukν (r), s qβ iqRn ∂ c e vα (r − Rnα ), N mα αi ∂ri das äuÿere Potential des ungestörten Gitters darstellt. Im Hamiltonoperator für das Fermionfeld erhält man so einen zusätzlichen Term Z dx ψ † (x) [V (r) − V0 (r)] ψ(x). Hel-ph = Substitution der Modenentwicklungen für Hel-ph = − X ψ und ψ† liefert qβ Mkνk aqβ + a†−qβ c†k0 ν 0 σ ckνσ 0ν0 kνk0 ν 0 σ qβ mit qβ Mkνk 0ν0 = XZ s ~s ∗ iqRn i(k−k0 )r cqβ e . αi uk0 ν 0 (r)ukν (r)∇i vα (r − Rnα ) × e 2 2N mα ωqβ V dr nαi Als nächstes setzen wir für ∇i vα (r − Rnα ) = i vα (r − Rnα ) X q0 0 eine Fourierreihe ein. Dies liefert 0 e−iq Rn qi0 vαq0 eiq r , 70 KAPITEL 3. wobei wir einen Faktor über das exp(−iq0 cα ) QUANTENTHEORIE VON FERMIONFELDERN in vαq0 absorbiert haben. Ausführen der Summation n liefert einen Faktor NX N 4(q − q0 ) = δq0 , q+Gp ; s s p r-Integral enthält also auÿer gitterperiodischen Faktoren nur noch den Exponential- faktor exp [i(k + q + Gp − k0 )r] , und es verschwindet, wenn nicht nur der Term mit Hel-ph = − i Gp0 = 0 s X k0 = k + q + Gp + Gp0 . ukν (r) ist wichtig, und wir erhalten nach sämtlichen Substitutionen ~N (q + Gp )cqβ α 2smα ωqβ kνν 0 αGp qβ Für genügend glatte Z dr u∗(k+q+Gp )ν 0 (r)ukν (r) τ vα(q+Gp ) aqβ + a†−qβ c†(k+q+Gq )ν 0 σ ckνσ , wobei das r-Integral über eine Gitterzelle läuft. Der Wechselwirkungsterm beschreibt Pro0 zesse, in denen ein Elektron vom Zustand kvσ in den Zustand (k + q + Gp )ν σ übergeht und dabei ein Phonon mit Quasiimpuls −q q absorbiert oder ein Phonon mit Quasiimpuls emittiert. Ein Übergang ist natürlich nur möglich, wenn der Ausgangszustand besetzt und der Endzustand leer ist. Weil typische Phononenergien klein sind gegenüber der Breite typischer Bänder, spielen für Metalle nicht zu weit vom Gleichgewicht nur Übergänge innerhalb des Bandes, in dem das Fermi-Niveau liegt eine Rolle; wir werden einfachheitshalber annehmen, dass dieses Band nicht entartet ist, und dass die Fermioberäche nicht Umklapprozesse mit Gp 6= 0 vernachlässigen kann. Dies hat wieder zur Folge, dass nur longitudinal polarisierte Phononen für die Wechselwirkung eine Rolle spielen. Für Elementkristalle entfällt zu nahe an die Ränder der Brillouin-Zone kommt, so dass man auch die auch noch die Summation über a und nur der longitudinale akustische Phononzweig trägt bei. Nach allen diesen Vereinfachungen erhält man s Z ~N † ql ∗ qc vq dr uk+q (r)uk (r) aq + a−q c†k+q,σ ckσ Hel-ph = −i 2mωql τ kqσ X ≡ Mkq aq + a†−q c†k+q,σ ckσ , X (3.5) kqσ wobei wir den Index l bei den Phononen-Erzeugern und -Vernichtern weggelassen haben. k-Abhängigkeit von Mkq , ausgeprägt als die q-Abhängigkeit. Für breite Bänder ist auch die ist, sehr viel weniger Die Wechselwirkung ( ??) die auf die uk (r) zurückzuführen beschreibt den Einuss der Phononen auf die Elektronennive- aus noch nicht vollständig; eine Änderung der Positionen der Ionen bringt eine Umverteilung der Dichte der Elektronen, und damit eine Änderung des selbstkonsistenten ElektronElektronpotentials mit sich. Eekte dieser Art führen aber zu Termen derselben Ordnung 3.3. DIE ELEKTRON-PHONONWECHSELWIRKUNG; POLARONEN 71 ??) enthaltenen (bis zur niedrigsten Ordnung in den Phononkoordinaten); le- wie die in ( diglich die Interpretation der Mkq ändert sich. Abbremsung von Elektronen durch Phononenemission Unter Einuss der Elektron-Phonon-Wechselwirkung kann ein Elektron mit Wellenvektor k q in ein Elektron mit Wellenvektor k−q und ein longitudinales Phonon mit Wellenvektor zerfallen. Dabei muss aber Energieerhaltung gelten: k − k−q − ~ωq = 0, was für parabolische Bänder und unter Vernachlässigung der Phonondispersion zu ~ 2kq − q 2 = cl q 2m∗ führt. Der Mindestwert von k, für den diese Gleichung erfüllt sein kann, ist 1 ~kmin = ~q + m∗ cl , 2 oder, weil q beliebig klein gewählt werden kann, ~kmin = m∗ cl . Dies bedeutet, dass nur Elektronen, deren Gruppengeschwindigkeit vg = ~k/m∗ die lon- gitudinale Schallgeschwindigkeit übertrit, durch Emission von Phononen zerfallen (akustische Cerenkov-Strahlung). Virtuelle Phononen, das Polaron In unserer Diskussion der Lamb-Verschiebung haben wir gesehen, dass die Wechselwirkung eines Atoms mit dem Strahlungsfeld zur Folge hat, dass das Atom dauernd zwischen den |B; 1k hin und her pendelt. Auf ähnliche Weise bendet sich ein Elektron mit Wellenvektor k aufgrund der Elektron-Phonon-Wechselwirkung für einen Teil der Zeit in Zuständen |1k−q,σ ; 1q , |1k−q−q0 ,σ ; 1q 1q0 usw., wobei die angegebenen Zustände nicht energetisch mit |1kσ ; {0} entartet zu sein brauchen. Die Phononen können also Zuständen |A; {0} und nicht frei durch den Kristall laufen; sie müssen in der Nähe des Elektrons bleiben, um wieder reabsorbiert zu werden, ehe die Verletzung der Energieerhaltung bemerkt werden kann". Das Elektron schleppt also eine Wolke virtueller Phononen mit sich. Die kombinierte Anregung heiÿt Polaron. Für schwache Elektron-Phonon-Wechselwirkung lässt sich der Aufbau des Polarons mittels Störungsrechnung bestimmen. In niedrigster Ordnung gilt für den Ein Polaron-Zustand |1kσ ; {0} p |1kσ ; {0} p X = |1kσ ; {0} + q der Ausdruck Mkq |1k−q,σ ; 1q . k − k−q − ~ωql 72 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN Genau wie bei der Lamb-Verschiebung führt die Beimischung von Zuständen mit virtuellen Phononen auch zu einer Verschiebung der Energieniveaus (allerdings hat man wegen der endlichen Zahl der Phononanregungen keinerlei Divergenzschwierigkeiten). Wir werden die Berechnung der Energieverschiebungen aber nicht weiter verfolgen. Elektron-Elektron-Wechselwirkung durch Phononaustausch In untenstehender Skizze wird ein Prozess veranschaulicht, der in zweiter Ordnung in Hel−ph auftritt und der zu einer eektiven Wechselwirkung zwischen den Elektronen führt. Das besondere daran ist, dass diese Wechselwirkung unter Umständen attraktiv sein kann; dies ist für die Erklärung der Supraleitung wesentlich. (Nebenbei sei bemerkt, dass in der relativistischen Quantenelektrodynamik die Coulombwechselwirkung zwischen geladenen Teilchen auf völlig analoge Weise als eine Folge des Austausches eines Photons zwischen den Teilchen gedeutet wird.) Die Amplitude für den skizzierten Prozess erhält man genauso wie die Amplitude für die Streuung von Photonen an einem Atom (Kapitel ??, S. ??). Wenn wir die k-Abhängigkeit von Mkq vernachlässigen und die Beziehung M−q = Mq∗ ausnützen, welche aus der Denition von Mkq und der Konvention auf S. qβ Polarisationsvektoren cα folgt, so erhalten wir 2 c(t) ∼ |Mq | 1 k0 − k0 −q − ~ωq + ?? über die 1 k − k+q − ~ωq . Die hieraus folgende Übergangswahrscheinlichkeit enthält einen Faktor t δ (k0 −q + k+q − k0 − k ); wenn man nur in der Übergangsrate in niedrigster Ordnung interessiert ist, kann man durch Substitution der δ -Funktion den Ausdruck in eckigen Klammern noch etwas umformen: 1 1 + [. . . ] = − ~ωq + (k − k+q ) ~ωq − (k − k+q ) +2~ωq = . (k − k+q )2 − ~2 ωq2 Dieselbe Übergangsamplitude würde man aus einer e Hel-el eektiven Wechselwirkung 1 X +2 |Mq |2 ~ωq = c†k0 −q,σ0 c†k+q,σ ckσ ck0 σ0 2 2 2 2 kk0 qσσ0 (k+q − k ) − ~ ωq erhalten. (Die Reihenfolge der Fermionoperatoren ist äquivalent mit den in dem Störungs† † ausdruck zweiter Ordnung in den Amplituden auftretenden Reihenfolgen ck+q,σ ckσ ck0 −q,σ 0 ck0 σ 0 3.4. DIE BCS-THEORIE DER SUPRALEITUNG 73 c†k0 −q,σ0 ck0 σ0 c†k+q,σ ckσ ; der Faktor 1 tritt auf, weil der Übergang von q nach 2 bewirkt wie die Vertauschung der zwei Diagramme in der Skizze auf S. ). bzw ?? −q dasselbe Die obige Herleitung der eektiven Wechselwirkung kann auch etwas vornehmer durchgeführt werden, indem man die Erzeuger und Vernichter für die Elektronen zugunsten derjenigen für die Polaronen eliminiert. Dies kann mit Hilfe einer kanonischen Transformation geschehen, siehe Madelung, Festkörpertheorie II, 81; das Ergebnis ist aber dasselbe. ??) Ein Vergleich mit der Fourierdarstellung des Ausdrucks ( oben hergeleitete Wechselwirkung |k+q − k | < ~ωq . 3.4 repulsiv ist für auf S. ?? |k+q − k | > ~ωq ergibt, dass die und attrativ für Die BCS-Theorie der Supraleitung In diesem Abschnitt werden wir zeigen, dass die Elektron-Phonon-Wechselwirkung dazu führen kann, dass der Grundzustand des Elektronensystems sich radikal ändert. Wir werden dabei vom Hamiltonoperator H= X k c†kσ ckσ + kσ 1 X Vkk0 q c†k0 −q,σ0 c†k+q,σ ckσ ck0 σ0 2 kk0 σσ0 q ausgehen. Dabei haben wir vernachlässigt, dass die k nicht wirklich Ein-Teilchen-Energien sind. Dieser Fehler ist nicht sehr bedeutsam, solange wir nur Zustände betrachten, in denen nur eine kleine Zahl von Elektronen angeregt sind. Cooper-Paare Cooper betrachtete für den obigen Hamiltonoperator den Fall, dass alle Niveaus bis zum Fermi-Niveau besetzt sind, und dass zwei zusätzliche Elektronen in das System hineingebracht werden. Er suchte jetzt den niedrigsten Zustand für diese Zusatzelektronen; falls die Wechselwirkung zwischen den Elektronen vorwiegend attraktiv ist, kann man gebundene Zustände erwarten; insbesondere erwartet man den niedrigsten Wert für die Energie für einen verschwindenden Gesamtimpuls des Paares, und für antiparallele Spins (für die das Pauliverbot die Elektronen nicht daran hindert, das attraktive Potential auszunützen). Wir wählen also für den Zwei-Teilchen-Zustand den Ansatz X |ψ = α(k)c†k↑ c†−k↓ |0HF . |k|>kF Für die Energie dieses Zustandes erhält man E − E0,HF = 2 X k>kF k |α(k)|2 + 1X (Vk,−k,q + V−k,k,−q ) a∗ (k + q)α(k). 2 k,q 74 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN P Dieser Ausdruck muss unter der Nebenbedingung |α(k)|2 = 1 minimiert werden. Dies k führt zu den Euler-Lagrange-Gleichungen 2k α(k) + 1X (Vk−q,−k+q,q + V−k+q,k−q,−q ) α(k − q) − λα(k) = 0. 2 q a∗ (k) muss eine Variablentransformation k ⇒ ∗ durchgeführt werden.) Durch Multiplikation der oberen Gleichung mit a (k) und (Bei der Ableitung des Potentialterms nach k−q (4.1) k Summation über erhält man für λ die Interpretation λ = E − E0,HF . ??) zu erhalten, führen wir eine zuerst Um einen Eindruck der möglichen Lösungen von ( von Bardeen vorgeschlagene vereinfachte Form für die Wechselwirkung V schon, dass der von Phononen vermittelte Teil von V attraktiv ist für ein. Wir wissen |k+q − k | < ~ωq . Bardeen schlug als Näherung vor Vk,−k,q Dabei ist ω0 ( −W = 0 |k − F | und |k+q − F | < ~ω0 ; für sonstige Werte von k und q. für eine typische Frequenz von der Gröÿe der Debye-Frequenz. Mit dieser verein- fachten Wechselwirkung erhält man für die obige Gleichung X (2k − λ)α(k) = W α(k0 ) für F < k < F + ~ω0 ; F <k0 <F +~ω0 α(k) = 0 sonst. Diese Gleichung ist exakt lösbar, weil die Summe nicht mehr von k abhängt und durch k in ein Integral über eine Konstante A ersetzt werden kann. Die Lösung ist α(k) = AW und der Eigenwert A= X λ X F <k <F +~ω0 ~ω0 F < k < F + ~ω0 , folgt aus der Konsistenzbedingung α(k) = k Weil für F 2k − λ AW 2k − λ . können wir bei der Umformung der Summe über die Zustandsdichte im gesamten Integrationsintervall gleich der Zustandsdichte an der Fermienergie g(F ) Z 1 = g(F ) setzen, und erhalten ~ω0 d 0 W 2 − (λ − 2F ) 3.4. DIE BCS-THEORIE DER SUPRALEITUNG 75 mit der Lösung 1 W g(F ) ln 2 2~ω0 − (λ − 2F ) −(λ − 2F ) was für kleine Werte von W g(F ) = 1, geschrieben werden kann als −(λ − 2F ) = 2~ω0 e−2/W g(F ) . gebundenen Zustand der zwei Zusatzelektronen gefunden. Dies bedeutet aber zugleich eine Instabilität des Hartree-Fock-Grundzustands: auch Wir haben also wirklich einen für die schon anwesenden Elektronen in den oberen Niveaus ist es energetisch vorteilhaft, sich aus den Ebenen-Wellen-Zuständen zu entfernen und Cooper-Paare zu bilden. Diese können dann aber bei genügend hoher Dichte der Paare nicht länger als unabhängig betrachtet werden, und wir brauchen einen neuen Ansatz für die GrundzustandsWellenfunktion. Der neue Ansatz kann nicht mit Störungstheorie erhalten werden. Der −1 Ausdruck für die Bindungsenergie eines Cooper-Paares enthält W im Exponenten; er nichtanalytisch in der Kopplungskonstanten W . Störungstheorie dagegen liefert immer Ausdrücke, die analytische Funktionen der Kopplungskonstante sind. ist also Ehe wir dieses Problem näher betrachten, werden wir noch zeigen, dass die BardeenWechselwirkung keine Triplett-Paare vom Typ |ψ t X = β(k)c†k↑ c†−k↑ |0HF |k|>kF zulässt. Wegen c†k↑ c†−k↑ |0HF = −c†−k↑ c†k↑ |0HF trägt nur der in k antisymmetrische Teil von β(k) zum Zustand |ψ β(−k) = −β(k) setzen. X β(k), B≡ t bei und wir können Dann verschwindet aber die Gröÿe k und die Integralgleichung für λ − 2F hat nur die triviale Lösung λ = 2F mit β(k) = 0. Für allgemeinere Formen der Wechselwirkung sind aber Triplett-Paare durchaus möglich; 3 für den suprauiden Grundzustand von He treten sie in gewissen Parameterbereichen auf und auch für Supraleiter gibt es diesbezügliche Spekulationen. Triplett-Paare würden insbesondere die Koexistenz von Supraleitung und Ferromagnetismus ermöglichen, wofür es allerdings im Experiment keinerlei Hinweise gibt. Der BCS-Grundzustand Wir versuchen jetzt einen alternativen Grundzustand zu konstruieren, in dem die attraktive Wechselwirkung so gut wie möglich ausgenützt wird. In einem System aus vielen Fermionen 76 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN tritt dabei eine Komplikation auf: sogar für positives W haben die Matrixelemente der Wechselwirkung zwischen den Komponenten eines Zustandes |ψ t = X γ ({nkσ }) |{nkσ } (4.2) {nkσ } ?? eingeführten Jordan-Wigner- scheinbar regellos verteilte Vorzeichen aufgrund der auf S. Phasen. Die von Bardeen, Cooper und Schrieer vorgeschlagene Lösung für dieses Problem ist: 1 Nummeriere die Zustände so, dass die Orbitale für k ↑; −k ↓; −k ↑; k ↓ k und −k immer in der Reihenfolge vorkommen. ??) nur solche {nkσ } zu, in denen die Orbitale k ↑ und −k ↓ 2 Lasse in der Superposition ( entweder beide besetzt oder beide leer sind; wähle weiters alle γ ({nkσ }) reell und positiv. (Eine andere Nummerierung der Orbitale führt zu einer sehr komplizierten Wahl für die Vorzeichen der γ ({nkσ }).) Hierdurch hat man erreicht, dass wenigstens alle Beiträge zum Erwartungswert des zierten Wechselwirkungsoperators I Hred = −W 0 X redu- c†k↑ c†−k↓ c−k0 ↓ ck0 ↑ k,k0 1 ist verschwunden, weil wir alle Terme so umgeordnet haben, 2 dass der erste Erzeuger mit dem Spin ↑ vorkommt.) Der Strich beschränkt die Summation positiv sind. (Der Faktor auf ein Band der Breite 2~ω0 um F . ??) nicht beschränken P N = kσ nkσ . Diese Erwei- Der zweite von BCS angewandte Trick ist, dass sie sich im Zustand ( auf Komponenten mit einer vorgegebenen Gesamtteilchenzahl terung des Raumes der erlaubten Zustände wird es, wie in der groÿkanonischen Gesamtheit der statistischen Physik, erlauben, die Besetzungswahrscheinlichkeiten für die Paare (k ↑, −k ↓) unabhängig voneinander zu wählen. Weiters führt es zu nichtverschwindenden Erwartungswerten der Erzeuger und Vernichter für Paare ψ|c−k↓ ck↑ |ψ = ψ|c†k↓ c†−k↑ |ψ = D(k). Die obigen Überlegungen dienten lediglich als Motivation für die nachfolgende formale Vorgangsweise: I Führe einen reduzierten Hamiltonoperator ein für die Orbitale F + ~ω0 . (Die niedrigeren Orbitale sind alle besetzt; die höheren alle leer.) Wir ver- wenden weiters die Konvention, dass der Index für −k ↓. F − ~ω0 < k < k für k ↑ steht und der Index −k Schlieÿlich nehmen wir nur den oben angegebenen reduzierten Wechselwir- kungsoperator mit: Hred = 0 X k k c†k ck + c†−k c−k −W 0 X k,k0 c†k c†−k c−k0 ck0 . 3.4. DIE BCS-THEORIE DER SUPRALEITUNG 77 k immer relativ zum Ferminiveau. Aus diesem HamiltonBewegungsgleichungen Wir rechnen weiters die operator folgen die i~ċk = k ck − W c†−k 0 X c−k0 ck0 k0 i~ċ†−k = −k c†−k − W ck X c†k0 c†−k k0 II Ersetze in diesen Bewegungsgleichungen die Summen durch ihre Erwartungswerte im gesuchten Grundzustand 0 X k 0 X c−k ck → c†k c†−k → k 0 X k 0 X c−k ck ≡ c†k c†−k ≡ k 0 X k 0 X D(k) ≡ 4/W D∗ (k) ≡ 4∗ /W. k Mit Hilfe dieser Variante des Hartree-Fock-Ansatzes erhält man aus dem obigen System die linearen, bezüglich k entkoppelten, Gleichungen (wir wählen 4 weiters reell) i~ċk = k ck − 4c†−k ; i~ċ†−k = −k c†−k − 4ck . Diese Gleichungen haben Operator-Lösungen vom Typ 1 1 ak = uk ck − vk c†−k ≡ cos θk ck − sin θk c†−k 2 2 1 1 a†−k = uk c†−k + vk ck ≡ cos θk c†−k + sin θk ck , 2 2 die von der Zeit abhängen gemäÿ αk (t) = αk (0)e−iλk t/~ wobei † † α−k (t) = α−k (0)e+iλk t/~ , λk aus der Eigenwertgleichung λk − k 4 = λ2k − 2k − 42 = 0 4 λk + k folgt; die positive Wurzel ist also λk = q 2k + 42 . (4.3) 78 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN ??) gewählte Normierung bewirkt, dass die αk Die in ( und αk† die für Fermion-Erzeuger und -Vernichter charakteristischen Antikommutatoren besitzen: 1 = + = sin θk 2 {αk , α−k } = uk vk − vk uk = 0, n αk† , αk usw. Die uk o u2k vk und vk2 2 + cos 2 1 θk 2 = 1; bestimmt man durch Substitution in die Eigenwertgleichung: λk uk = k uk + 4vk λ2k u2k = 2k + 42 u2k = 2k u2k + 42 vk2 + 2k 4uk vk 42 u2k − vk2 = 2k 4uk vk . oder: bzw.: Einsetzen der trigonometrischen Darstellung liefert 4 cos θk = k sin θk ⇒ tan θk = 4 , k (4.4) oder auch # " 1 1 1 k k 2 = 1+ p 2 uk = (1 + cos θk ) = 1+ 2 2 2 λk k + 42 1 k 1 vk2 = (1 − cos θk ) = 1− , 2 2 λk woraus klar hervorgeht, dass beim Übergang k → −k auch die uk und vk ihren Wert austauschen; die physikalische Bedeutung dieses Faktums wird gleich erläutert werden. Die explizite Form des Grundzustandes Weil die αk die Energie eines Zustandes um Systems von allen |ψBCS ∼ = αk 0 Y λk erniedrigen, muss der Grundzustand des vernichtet werden. Diese Bedingung wird erfüllt vom Zustand α−k αk |{0} , k wie aus der Antivertauschung der Ausdrücke " 0 Y {αk } und aus ?? lässt sich dies umschreiben zu (−vk ) uk + vk c†k c†−k αk0 αk0 = 0 hervorgeht. Mit Hilfe der # |{0} , k wobei Terme mit einem auf |{0} wirkenden Vernichter weggelassen wurden. Der korrekt normierte Zustand ist " |ψBCS = 0 Y k uk + vk c†k c†−k # |{0} , 3.4. DIE BCS-THEORIE DER SUPRALEITUNG 79 wie aus 0 Y ψBCS |ψBCS = u2k + vk2 = 1 k sofort hervorgeht. Der Zustand |ψBCS kann auch aufgefasst werden als ein Zustand für Cooperpaare mit dem Paarerzeuger † A ∼ 0 X k 1 tan θk c†k c†−k , 2 (weil kein Paar mehrfach besetzt werden kann, bleiben von |ψBCS kohärenter exp αA† |{0} genau die in † auftretenden Terme übrig; wir werden die korrekte Normierung von A hier nicht explizit bestimmen). Ehe wir unsere Rechnung weiter verfolgen, und insbesondere den noch immer nicht fest- 4 selbstkonsistent bestimmen, müssen wir nocheine weitere Konsistenzbedingung kontrollieren: Damit der Zustand |ψBCS mit |0HF verglichen werden kann, muss er zumindest im Mittel die gleiche Teilchenzahl N/2 aufweisen. Um den gelegten Parameter Erwartungswert von den αk und αk† P0 k c†k ck + c†−k c−k zu bestimmen, müssen die ausgedrückt werden. Aus den Beziehungen ( † ck = uk αk + vk α−k ; ck und c†k zuerst in ??) schlieÿt man sofort c−k = uk α−k − vk αk† , woraus folgt † ψBCS |c†k ck |ψBCS = vk2 ψBCS |α−k α−k |ψBCS = vk2 . Weil die vk2 für k-Werte mit entgegengesetzten k sich zu eins summieren, erhält man in der 1 für den obigen Erwartungswert, vorausgesetzt, dass die NiveauTat im Mittel den Wert 2 dichte im betrachteten Energiebereich eine Konstante ist. (Für nichtkonstantes g() hätte man den Nullpunkt der Energieskala nicht in die Mitte des betrachteten Energiebereichs legen dürfen; wegen der vielen Näherungen, die ohnehin schon gemacht worden sind, lohnt sich die Diskussion solcher Feinheiten aber hier kaum mehr.) Die Bestimmung des Parameters 4 Ähnlich wie oben bestimmen wir jetzt † |ψBCS = uk vk ; D(k) = ψBCS |c−k c−k |ψBCS = uk vk ψBCS |α−k α−k für 4 erhält man so die Konsistenzbedingung 4=W 0 X k 0 0 1 X 1 X 4 p sin θk = W . D(k) = W 2 + 2 2 2 4 k k k 80 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN Dies führt zu der Bestimmungsgleichung Z 1 1 = W g(F ) 2 +~ω0 d p −~ω0 42 + 2 = W g(F ) arsinh ~ω0 4 mit der Lösung ~ω0 ≈ 2~ω0 e−1/W g(F ) , sinh g(F1)W 4= was bis auf den Faktor 2 im Exponenten mit dem Ausdruck für die Bindungsenergie eines Cooperpaares übereinstimmt; genaue Übereinstimmung wäre ohnehin nicht zu erwarten, weil der Zustand der Zustand |0HF |ψBCS einen ganz anderen Hintergrund für die Cooperpaare bildet als . Bestimmung der Grundzustandsenergie Als letztes müssen wir noch verizieren, dass der Zustand niedrigeren Erwartungswert der Energie hat als der Zustand |ψBCS auch wirklich |0HF . Dazu berechnen einen wir ψBCS |Hred |ψBCS = 0 0 X X k ψBCS |c†k ck + c†−k c−k |ψBCS − W ψBCS | = c†k c†−k c−k0 ck0 |ψBCS kk0 k =2 0 X 0 X k vk2 − W uk vk uk0 vk0 = 2 kk0 k 0 X k vk2 − k 42 , W (4.5) wobei die obigen Zwischenergebnisse aus der Bestimmung von 4 und der mittleren Teil- chenzahl benützt wurden. Der obige Ausdruck muss verglichen werden mit E0,HF = X 2k = − k <0 0 X |k | . k ??) erhält man mit Hilfe des Ausdrucks für vk2 auf S. ?? Für den ersten Term in ( 2 0 X k vk2 = 0 X k k k weil der Mittelwert von Eg k k 1− λk Z +~ω0 = −g(F ) −~ω0 ndet man Eg = 2g(F ) 0 ~ω0 2 2 + 42 , verschwindet. Für den Energieunterschied = EBCS − E0,HF Z d p ( d − p 2 2 + 42 ) − 42 . W 3.4. DIE BCS-THEORIE DER SUPRALEITUNG Auswerten des Integrals und Einsetzen der obigen Beziehung zwischen 81 4 und W liefert letztendlich s ( Eg = g(F )~2 ω02 42 1+ 2 2 ~ ω0 1− ) =− 2g(F )~2 ω02 ∼ 1 = − g(F )42 . e2/g(F )W − 1 2 Das Ergebnis ist also für alle Werte von W negativ! Nach der hier behandelten einfachen Theorie wird ein Metall also immer supraleitend, wenn für ein noch so kleines Energiegebiet die attraktive, von Phononen vermittelte, Wechselwirkung zwischen den Elektronen gröÿer ist als die Coulombabstoÿung. Angeregte Zustände; die Energielücke Die niedrigsten angeregten Zustände erhält man durch Anwendung der Erzeuger Quasiteilchen auf den Grundzustand |ψBCS αk† für . Der so erhaltene Zustand ist 00 Y uk0 + vk0 c†k0 c†−k0 |{0} a†k |ψBCS = uk c†k − vk c−k uk + vk c†k c†−k k0 = c†k 00 Y uk0 + vk0 c†k0 c†−k0 |{0} , k0 Q00 0 k0 ein Produkt über alle k 6= k im betrachteten Band von Energiewerten bezeichnet. Die Energie des so erhaltenen Zustands liegt um λk oberhalb der wobei das Symbol Grundzustandsenergie. Allerdings lässt sich der obige Zustand nicht über einen physikali† schen Mechanismus anregen; jede Störung ist in den ck und ck , und deshalb auch † in den αk und αk . Die tatsächlich anregbaren Zustände haben die Form bilinear 000 Y αk† αk† 0 |ψBCS = c†k c†k0 uk00 + vk00 c†k00 c†−k00 |{0} k00 λk + λk0 , bzw. 00 Y † † † † αk α−k |ψBCS = uk ck ck − vk uk0 + vk0 c†k0 c†−k0 |{0} mit der Zusatzenergie k0 mit der Zusatzenergie 2λk . Die obige Rechnung überzeugt noch nicht ganz; eigentlich soll- ten wir nur Zustände mit derselben mittleren Teilchenzahl vergleichen. Dies lässt sich durch und eine geringfügige Änderung der uk0 vk0 , die einer Verschiebung des Referenzniveaus −1 für die Energie der Ordnung N entspricht, erreichen. (Vgl. die Änderung des chemischen Potentials mit der Temperatur für das ideale Fermigas im Skriptum Thermodynamik und Statistische Physik.) Es lässt sich zeigen, dass diese Korrektur nur zu Modikationen der −1 Ordnung N in den Anregungsenergien führt. Wir haben also gesehen, dass mit Energien kleiner als 24 Anregungen nicht möglich sind. Diese so genannte Energielücke ist experimentell gut bestätigt, und sie ist wesentlich für das Verständnis der elektromagnetischen Eigenschaften des Supraleiters. 82 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN Elektromagnetische Eigenschaften von Supraleitern Von den Brüdern F. und H. London wurden schon 1935 zur Beschreibung des elektromagnetischen Verhaltens von Supraleitern für E= ∂ (ΛJs ) ∂t die Gleichungen B = −c ∇×(ΛJs ) vorgeschlagen. Dabei bezeichnet ∇×E + T TC Js den Strom und (4.6) Λ ist eine Konstante, die wegen 1 ∂B =0 c ∂t ??) besagt, in beiden Gleichungen gleich gewählt werden soll. Die erste der Gleichungen ( ohne Dissipation ieÿt. Feld und Strom haben immer einen Phasenun- dass der Strom terschied von 90◦ . Aus der zweiten Gleichung schlieÿt man mit Hilfe der vierten Maxwell- gleichung ∇×B = 4π Js c ⇒ ∇2 B = 4πB B ≡ ; Λc2 λ2L B-Feld im Inneren des Supraleiters auf einer Längenskala λL abklingen muss (der Meissner-Ochsenfeld-Eekt). Weil λL experimentell die Gröÿenordnung µm hat, heiÿt dies, dass ein Magnetfeld in einen Supraleiter kaum eindringen kann. Diese Gleichung besagt, dass das Andererseits kostet das Austreiben des Feldes (Kompression der Feldlinien) Energie, und es wird ersichtlich, dass genügend hohe Magnetfelder die Supraleitung zerstören. Für rein transversale Felder (und in der Coulomb-Eichung) lassen sich die Gleichungen ??) zusammenfassen zu ( Js (r) = − 1 A(r). Λc (4.7) Letztere Gleichung werden wir jetzt zum Schluss unseres Kapitels über Supraleitung aus der BCS-Theorie herleiten. Mikroskopische Herleitung der London-Gleichung Wir werden die London-Gleichung für langwellige stationäre transversale Felder herleiten A(r) = Aq eiqr ; qAq = 0. Die elektrische Stromdichte wird im Formalismus der quantisierten Felder dargestellt von dem Operator X e~ ψ † (r, σ)∇ψ(r, σ) − ψ(r, σ)∇ψ † (r, σ) 2mi σ e2 X † − ψ (r, σ)A(r)ψ(r, σ) = JP (r) + JD (r), mc σ Js (r) = 3.4. DIE BCS-THEORIE DER SUPRALEITUNG wobei die Operatoren JP und JD 83 als paramagnetische bzw. diamagnetische Stromdich- te bezeichnet werden. Die obige Form für den Stromdichteoperator folgt direkt aus dem Operator e e e~ e2 j = ev = p− A = ∇− A m c im mc der normalen Ein-Teilchen-Quantenmechanik. Durch Einsetzen der Modenentwicklungen † † für ψ und ψ können wir JP und JD in den ckσ und ckσ ausdrücken. Wir werden dabei die Blochfunktionen uk (r) durch eins ersetzen; durch diese Prozedur erhält man über die Einheitszelle gemittelte Stromdichten (das Überlappintegral der verschiedenen auftretenden uk (r) geht nach eins im Limes q → 0). Die so erhaltenen Ausdrücke sind e~ X † 0 ck+q0 ,σ ckσ e−iq r (2k + q0 ) ; 2mV kq0 σ JP (r) = JD (r) = − e2 X † 0 ck+q0 ,σ ckσ e−iq r A(r). mcV kq0 σ Die makroskopisch relevanten Gröÿen sind die Erwartungswerte dieser Operatoren im (durch das äuÿere Feld möglicherweise geänderten) Vielteilchenzustand des Systems, insbesondere bei T = 0, wo das ungestörte System im Zustand |ψBCS ist. Die diamagnetische Stromdichte ist selbst linear im äuÿeren Feld; zur Berechnung der im Feld linearen Antwort reicht es also aus, den Erwartungswert im |ψBCS zu bilden. Dies 0 impliziert, dass nur Terme mit q = 0 in der Summe überleben, wie man durch Zerlegen † † der ckσ und ckσ nach den α±k und α±k leicht sieht. Das Ergebnis ist X † e2 Ns e2 ckσ ckσ |ψBCS = − A(r) ψBCS | A(r), jD (r) = ψBCS |JD |ψBCS = − mcV mcV kσ wobei Ns die Zahl der in Cooper-Paaren gebundenen Elektronen ist, also die Zahl der Niveaus zwischen F − ~ω0 und F . Die diamagnetische Stromdichte allein hat also genau die für die London-Gleichung erforderliche Form, wobei noch gilt Λ= m ns e2 λ2L = oder mc2 , 4πns e2 Ns die Dichte der an der Supraleitung beteiligten Elektronen. V Zur Berechnung der paramagnetischen Stromdichte brauchen wir zuerst die Änderung des mit ns = Grundzustandes durch die Störung H1 =− XZ σ Z e e~ X 0 dr ψ (r) A(r)p ψ(r) = − dr c†k+q0 ,σ ckσ A(r)k e−iq r , mc mcV kq0 σ wobei wir wieder die A(r) † uk0 (r) durch eins ersetzt haben. Einsetzen der speziellen Form von ergibt H1 =− e~ X † c ckσ kAq . mc kσ k+q,σ (4.8) 84 KAPITEL 3. QUANTENTHEORIE VON FERMIONFELDERN Weil dieser Störterm nicht auf die Spins wirkt, können nur Paare von Quasiteilchen mit † entgegengesetzten Spins angeregt werden. (Der Operator αk erhöht den Spin um ~/2, † während α−k ihn um ~/2 erniedrigt.) Der gestörte Zustand hat also die Form X † 2 |ψA = |ψBCS + e f (k0 )αk† 0 +q α−k 0 |ψBCS + O(e ), k0 und die stationäre Störungsrechnung ergibt für die Koezienten f (k) = 1 ψBCS |α−k αk+q H1 |ψBCS . e (λk + λk+q ) Zum Matrixelement tragen zwei Terme in ( ??) bei: † † c†k+q,↑ ck↑ |ψBCS = uk+q vk αk+q α−k |ψBCS und † † c†−k,↓ c−k−q,↓ |ψBCS = uk vk+q αk+q α−k |ψBCS , wobei die Beziehungen u−k0 = uk0 ; v−k0 = −vk0 benützt wurden. Einsetzen dieser Bezie- hungen liefert f (k) = ~ [kAq uk+q vk − (k + q)Aq uk vk+q ] , mc (λk + λk+q ) was sich wegen f (k) = q→0 qAq = 0 reduziert zu ~kAq ~kAq 1 [uk+q vk − uk vk+q ] = sin (θk − θk+q ) . mc (λk + λk+q ) mc (λk + λk+q ) 2 (4.9) f (k) nach Null, während der Nenner endlich bleibt. Dies bedeutet aber, dass sämtliche f (k) für q → 0 verschwinden, und damit der Erwartungswert der paramagnetischen Stromdichte. (Der Erwartungswert von JP (r) in |ψBCS verschwindet, wie man leicht zeigt.) Für geht also der Zähler des Ausdrucks für Damit ist gezeigt worden, dass der einzige Beitrag zur von einem Feld induzierten Stromdichte der diamagnetische Beitrag ist, der die Londongleichung erfüllt. Auf ähnliche Weise zeigt man, dass der B~σ -Term, der zu H1 noch hätte addiert werden müssen, und der in normalen Metallen zur paramagnetischen Antwort beiträgt, auch keine Paare von Quasi- q → 0 anregen kann. In normalen Metallen gibt es elementare Anregunniedriger Energie. Die zu f (k) analogen Ausdrücke verschwinden dann teilchen im Limes gen mit beliebig im Limes q → 0 nicht, weil sowohl Zähler als auch Nenner des betreenden Ausdrucks verschwinden, und deren Quotient endlich bleibt. Man ndet typischerweise, dass die paramagnetische Stromdichte die diamagnetische weitgehend kompensiert, und es bleiben nur kleine Nettoeekte übrig. 3.4. DIE BCS-THEORIE DER SUPRALEITUNG 85 Zum Schluss dieser Ausführungen soll noch betont werden, dass sämtliche in diesem Abschnitt erhaltenen Ergebnisse auch in einer eichinvarianten Weise erhalten werden kön- nen. Das Verhalten der ganzen Theorie unter Eichtransformationen ist aber recht kompliziert, weil die Feldoperatoren, und damit auch die Gröÿen Phasenfaktoren erhalten, und damit auch |ψBCS D(k) auf S. ?? ortsabhängige selbst keine eichinvariante Gröÿe ist. Für eine Diskussion siehe z.B. G. Rickayzen, Theory of Superconductivity, 6.4, oder Kittel, S. 172-177. Kapitel 4 Die Dirac-Gleichung 4.1 Die Herleitung der Dirac-Gleichung Die von Dirac vorgeschlagene relativistische Wellengleichung für das Elektron kann natürlich genausowenig hergeleitet werden wie irgendeine andere fundamentale Gleichung in der Physik (Newton-, Maxwell- oder Schrödingergleichung). Man kann höchstens versuchen, die postulierte Gleichung plausibel zu machen. Dabei werden wir in dieser Vorlesung nicht den ursprünglich von Dirac gewählten Zugang nehmen, sondern eine von Feynman propagierte Alternative, die auch im Buch von Sakurai verwendet wird. Als Einführung betrachten wir zunächst eine zuerst von van der Waerden vorgeschlagene, alternative 1 . 2 Ein übliches Argument zur Begründung der Schrödingergleichung geht aus von der BezieForm der nichtrelativistischen Schrödingergleichung für ein Teilchen mit Spin hung E = p2 + V (r) 2m und führt die Substitution E → i~ ∂ ∂t p → −i~∇ durch. Dies führt zur Schrödingergleichung ~2 2 ∂ ∇ + V (r) ψ. i~ ψ = Hψ = − ∂t 2m Für ein Teilchen mit Spin 1 gibt es aber die äquivalente Darstellung 2 (~σ p)(~σ p) p2 = , 2m 2m die mittels der Identität (~σ A) (~σ B) = AB + i~σ (A × B) 86 4.1. DIE HERLEITUNG DER DIRAC-GLEICHUNG 87 leicht zu überprüfen ist. Aus der obigen Identität geht aber auch hervor, dass die Äquivalenz verloren geht nach der Substitution p e → p − A(r); c die zweite Alternative führt dann zu 1 e e ~σ p − A ~σ p − A + V (r) 2m c c 1 e 2 e e i i h = p− A + ~σ p − A × p − A + V (r), 2m c 2m c c was mittels der Identität p × A + A × p = −i~( ∇×A) in der Form i2 1 h e e~ p − A(r) − ~σ B(r) + V (r) 2m c 2mc (1.1) geschrieben werden kann. Der Zusatzterm − e e~ ~σ B = − SB, 2mc mc der in der üblichen Behandlung von Hand eingesetzt werden muss, wird also in der Formulierung von van der Waerden und Feynman automatisch mitgeliefert, inklusive des ??) Wertes 2 für das gyromagnetische Verhältnis des Elektrons. Der Hamiltonoperator ( wirkt selbstverständlich auf eine zweikomponentige Wellenfunktion des Elektrons. Die freie Dirac-Gleichung Ganz analog zum Vorhergehenden kann man für die relativistische Energie-Impuls-Beziehung 1 schreiben eines freien Teilchens mit Spin 2 2 E E E 2 −p = − ~σ p + ~σ p = m2 c2 . c c c Dies führt zu einer Wellengleichung für eine zweikomponentige Wellenfunktion ψ der Form ∂ ∂ i~ + i~~σ ∇ i~ − i~~σ ∇ ψ = (mc)2 ψ. ∂t ∂t Im Gegensatz zur nichtrelativistischen Schrödingergleichung ist dies eine Dierentialgleichung zweiter Ordnung bezüglich der Zeit. Eine Reduktion auf Dierentialgleichungen 88 KAPITEL 4. erster Ordnung ist aber ohne weiteres möglich durch riablen: Falls wir denieren ψ (L) ≡ ψ ψ (R) ≡ DIE DIRAC-GLEICHUNG Verdopplung der Zahl der Va- i~ (∂0 − ~σ ∇) ψ mc mit ∂0 ≡ 1∂ , c ∂t so gehorcht das Paar zweikomponentiger Wellenfunktionen ψ (R) , ψ (L) dem Gleichungs- system i~ [∂0 − ~σ ∇] ψ (L) = mcψ (R) ; i~ [∂0 + ~σ ∇] ψ (R) = mcψ (L) . (1.2) 1 Für masselose Spin- -Teilchen (Neutrinos) erweist sich die Variablenverdopplung als über2 üssig; solche Teilchen können durch zweikomponentige Wellenfunktionen dargestellt werden, die einer Dierentialgleichung erster Ordnung gehorchen. Es sind im Prinzip zwei (L) Arten von Neutrinos denkbar: Solche vom Typ ψ , für die Spin und Impuls immer anti(R) parallel stehen, und solche vom Typ ψ , für die Spin und Impuls immer parallel stehen. (L) In der Natur kommen nur linkshändige Neutrinos vom Typ ψ vor (genauer gesagt, nur solche Neutrinos wechselwirken mit normaler Materie oder Antimaterie über die schwache Wechselwirkung. Rechtshändige Neutrinos würden im Prinzip über ihre Energiedichte zum Krümmungsradius des Weltalls beitragen, aber die Astrophysik ist noch weit davon entfernt, solche Eekte messen zu können). ??) in die von Dirac angegebene Form zu bringen, bilden wir zuerst Um die Gleichungen ( Summe und Dierenz der Gröÿen ψ (L) ψ (A) ≡ ψ (L) + ψ (R) und ψ (R) : ψ (B) ≡ ψ (R) − ψ (L) . Diese Gröÿen erfüllen das Gleichungssystem i~ ~σ ∇ψ (B) + ∂0 ψ (A) = mcψ (A) i~ ~σ ∇ψ (A) + ∂0 ψ (B) = −mcψ (B) oder, zusammengefasst zu einem vierdimensionalen System i~ −∂0 −σ∇ σ∇ ∂0 ψ (A) ψ (B) = −mc ψ (A) ψ (B) . Eine etwas kompaktere Schreibweise entsteht mit Hilfe der Denitionen γk = 0 −iσk iσk 0 k = 1, 2, 3 γ4 = 0 , 0 −I I 4.1. DIE HERLEITUNG DER DIRAC-GLEICHUNG wobei I die zweidimensionale Einheitsmatrix und 0 89 die zweidimensionale Nullmatrix dar- stellt. Die obigen Denitionen führen zum Gleichungssystem ∂ mc ~γ ∇ + γ4 ψ+ ψ = 0; ∂x4 ~ x4 = ict, oder noch kompakter (mit Einstein-Konvention) ∂ mc γµ + ψ = 0. ∂xµ ~ Hier ist die Gröÿe ψ (1.3) ein vierdimensionales Objekt, das als ??) ist Spinor bezeichnet wird. Eine etwas explizitere Darstellung von ( 4 X 4 X (γµ )αβ µ=1 β=1 γµ Die Matrizen ∂ mc + δαβ ψβ = 0. ∂xµ ~ (α = 1, . . . , 4). erfüllen die Antivertauschbeziehungen {γµ , γν } = 2δµν I4 , (1.4) die man aus der expliziten Darstellung leicht überprüfen kann (die Gröÿe I4 bezeichnet die 4-dimensionale Einheitsmatrix): 0 −iσk 0 −iσl 0 −iσl 0 −iσk {γk , γl } = + iσk 0 iσl 0 iσl 0 iσk 0 {σk , σl } 0 I 0 = = 2δkl , 0 {σk , σl } 0 I usw. Wie zuerst von Matrizen γµ Pauli gezeigt wurde, bestimmen die Beziehungen (??) die 4-dimensionalen bis auf eine Ähnlichkeitstransformation: γµ0 , γν0 = 2δµν I4 ⇐⇒ γµ0 = Sγµ S−1 mit irgendeiner nichtsingulären Matrix jeder Lösung ψ der Gleichung ( S. Aus diesem Theorem folgt sofort, dass man aus 0 ) eine Lösung ψ ≡ Sψ der Gleichung ?? mc 0 ∂ + ψ0 = 0 γµ ∂xµ ~ konstruieren kann. Der physikalische Inhalt der Dirac-Gleichung wird deshalb von einer Änderung der Darstellung der γ -Matrizen nicht beeinträchtigt, und man ndet in der Li- teratur eine Menge solcher Darstellungen, worauf wir hier nicht näher eingehen werden. Wir bemerken weiters noch, dass mit unserer Wahl der γµ diese hermitesch und spurlos sind. Letztere Eigenschaft bleibt unter Ähnlichkeitstransformationen erhalten; die Hermitizität 90 KAPITEL 4. ebenso, wenn S DIE DIRAC-GLEICHUNG unitär gewählt wird. Zum Schluss erwähnen wir noch, dass die Darstel- lungsunabhängigkeit der Dirac-Gleichung in Anwesenheit eines elektromagnetischen Feldes erhalten bleibt, wie man nach der Substitution ~ ∂ ~ ∂ e −→ − Aµ , i ∂xµ i ∂xµ c leicht sieht. ??) kann durch Multiplikation von links mit γ4 in die vertraute Form Die Gleichung ( i~ ∂ ψ = HD ψ ∂t (1.5) gebracht werden. Für den Hamiltonoperator ndet man so HD = −ic~~ α∇ + βmc2 (1.6) mit β = γ4 = Die Form ( 0 ; 0 −I 0 σk . σk 0 I αk = iγ4 γk = ??) ist die von Dirac ursprünglich vorgeschlagene. Wahrscheinlichkeitsdichte und Wahrscheinlichkeitsstrom Wir werden mit einer Diskussion der physikalischen Interpretation von ψ und seinen Kom- ponenten noch etwas warten, bis wir einige einfache Lösungen der Dirac-Gleichung diskutiert haben. Es liegt aber nahe anzusetzen, dass die Gröÿe ψ † (r, t)ψ(r, t)d3 r ≡ X ψα∗ (r, t)ψα (r, t)d3 r α die Wahrscheinlichkeit darstellt, zur Zeit t ein Teilchen im Volumen d3 r um r anzutreen. Wir werden später sehen, dass diese Interpretation nicht ganz unproblematisch ist, aber wir zeigen jetzt als erstes, dass es in der Dirac-Theorie eine † † die Gröÿe ψ ψ gibt. Aus der Dirac-Gleichung folgt für ψ ∂ mc † ∂ † ψ γk + ∗ ψ † γ4 + ψ = 0. ∂xk ∂x4 ~ Multiplikation von rechts mit γ4 und Ausnützen von ∂ ∂ ∂ = =− ∗ ∗ ∂x4 ∂(ict) ∂x4 liefert für die Gröÿe ψ̄ ≡ ψ † γ4 mc ∂ ψ̄γµ + ψ̄ = 0, ∂xµ ~ die adjungierte Gleichung Kontinuitätsgleichung für 4.2. NICHTRELATIVISTISCHE NÄHERUNGEN wobei wir noch die Beziehung γµ γ4 = −γ4 γµ 91 benutzt haben. Aus der obigen Gleichung und der Dirac-Gleichung selbst folgt jetzt ∂ ψ̄γµ ψ = 0, ∂xµ also eine Erhaltungsgröÿe für den Stromvektor sµ = icψ̄γµ ψ = cψ † α ~ ψ, icψ † ψ . Es liegt also nahe, die Gröÿe j = cψ † α ~ψ als Wahrscheinlichkeitsstromdichte und ψ†ψ als Wahrscheinlichkeitsdichte zu interpretie- ren. Zur Absicherung dieser Interpretation sollte eigentlich noch gezeigt werden, dass sich sµ unter Lorentztransformationen in der Tat wie eine Vektordichte transformiert. Dies ist tatsächlich der Fall, aber der Beweis kann hier nicht gegeben werden (siehe Sakurai oder Messiah). Weiters liegt es nahe, die Gröÿe c~ α als Geschwindigkeitsoperator zu deuten, was sich mit gewissen Einschränkungen als möglich erweisen wird. Zum Schluss bemerken wir noch, dass die obige Form für sµ auch in Anwesenheit eines Viererpotentials Aµ un- geändert bleibt, wie man leicht nachprüft. Die Stromdichte in der Dirac-Theorie hat also keine manifest diamagnetischen Anteile! 4.2 Nichtrelativistische Näherungen In diesem Abschnitt diskutieren wir die Lösungen der Gleichung ∂ ie mc − Aµ γµ ψ + ψ=0 ∂xµ ~c ~ (2.1) die harmonisch von der Zeit abhängen gemäÿ ψ(r, t) = ψ(r, 0)e−iEt/~ , also stationäre Lösungen. Das Viererpotential Aµ ist dabei deniert als Aµ ≡ (A, iA0 ) = (A, iΦ) Die Gleichung ( (B) und ψ : ??) kann jetzt zerlegt werden in zwei Gleichungen für die Bestandteile ψ(A) h 1 e i ~σ p − A ψ (B) = c c h e i (A) 1 ~σ p − A ψ = c c E − eA0 − mc2 ψ (A) ; E − eA0 + mc2 ψ (B) . 92 KAPITEL 4. Mit Hilfe der zweiten Gleichung kann man ψ (B) DIE DIRAC-GLEICHUNG eliminieren; so erhält man h h e i c2 e i (A) ~σ p − A ~ σ p − A ψ = c E − eA0 + mc2 c E − eA0 − mc2 ψ (A) . Für nichtrelativistische Teilchen gilt E ≈ mc2 ; |eA0 | mc2 . Es liegt also nahe, die nichtrelativistische Energie zu denieren als E (NR) = E − mc2 und den Faktor in der Mitte der Gleichung für ψ (A) zu entwickeln gemäÿ " # (NR) c2 1 2mc2 1 E − eA0 = = 1− + ... . E − eA0 + mc2 2m 2mc2 + E(NR) − eA0 2m 2mc2 (2.2) Wenn man sich auf den ersten Term beschränkt, erhält man die Gleichung 1 e e (A) (NR) ~σ p − A ~σ p − A ψ = E − eA0 ψ (A) , 2m c c also genau die van-der-Waerden'sche Form der nichtrelativistischen stationären Schrödingergleichung für eine zweikomponentige Wellenfunktion; wie im vorhergehenden Abschnitt gezeigt wurde, lässt sie sich schreiben als e 2 e~ 1 p− A − ~σ B + eA0 ψ (A) = E(NR) ψ (A) . 2m c 2mc (Für eine lineare Superposition von stationären Lösungen, deren Eigenwerte alle die Un(NR) gleichung E mc2 erfüllen, gilt die zeitabhängige Schrödingergleichung für die Gröÿe ψ (NR) (r, t) = ψ (A) (r, t)eimc 2 t/~ ; der zusätzliche Phasenfaktor ist für die physikalische Interpretation ohne Bedeutung; wir haben damit also aus der Dirac-Gleichung die Schrödingergleichung hergeleitet mit der Bedingung für ihre Gültigkeit.) Relativistische Korrekturen für den elektrostatischen Fall Als nächstes werden wir den Korrekturterm in (??) mit berücksichtigen; wir uns aber der Einfachheit halber auf den Fall Gleichung lässt sich schreiben als (NR) (A) ψ HA = E(NR) ψ (A) A=0 zusammen dabei werden beschränken. Die so entstandene 4.2. NICHTRELATIVISTISCHE NÄHERUNGEN 93 mit (NR) HA 1 = (~σ p) 2m 1− E (NR) − eA0 + ... 2mc2 ! (~σ p) + eA0 . Auf den ersten Blick sieht diese Gleichung ganz vernünftig aus; bei näherer Betrachtung sieht man aber (mindestens) drei Schwierigkeiten: (NR) 1 Der Operator HA (NR) enthält den Eigenwert EA (NR) 2 Der Operator HA . ist nicht hermitesch; beim Ausarbeiten der (~σ p) sieht man, dass (NR) i~Ep neben hermiteschen Termen ein Term entsteht. Die Nichthermitizität von HA ist nicht ohne weiteres fatal, aber sie macht lästige Umformulierungen der allgemeinen Theorie erforderlich. 3 Die zweikomponentige Wellenfunktion ψ (A) ist nicht korrekt normiert; die korrekte Nor- mierung lautet Z dr ψ (A)† ψ (A) + ψ (B)† ψ (B) = 1. Bis zur betrachteten Ordnung gilt aber ψ (B) ≈ ~σ p (A) ψ , 2mc weshalb wir die Normierungsbedingungen für Z (A)† dr ψ 1+ ψ (A) in der Form p2 (A) ψ ≈1 4m2 c2 schreiben können. Wie wir gleich zeigen werden, lassen sich sämtliche Schwierigkeiten beheben, und zwar durch die Transformation Ψ = Ωψ (A) p2 ψ (A) . ≡ 1+ 8m2 c2 Die zweikomponentige Wellenfunktion Ψ ist oensichtlich bis zur betrachteten Ordnung korrekt normiert, und die Gleichung (NR) −1 Ω Ψ Ω−1 HA = E(NR) Ω−2 Ψ lautet bis auf Terme höherer Ordnung " p2 + eA0 − 2m p2 , 8m2 c2 p2 + eA0 2m ~σ p − 2m (NR) E − eA0 2mc2 ! # (NR) ~σ p Ψ = E 1− p2 4m2 c2 Ψ. 94 KAPITEL 4. DIE DIRAC-GLEICHUNG oder o p2 p4 1 n 2 (NR) + eA0 − p , E − eA + 0 2m 8m3 c2 8m2 c2 i −2 (~σ p) E(NR) − eA0 (~σ p) Ψ = E(NR) Ψ. Der letzte Term in den eckigen Klammern lässt sich umformen mittels der Identität 2ABA = A2 , B − [A, [A, B]] (mit A = ~σ p und B = E(NR) − eA0 ). Der erste Term kompensiert genau den vierten Term in den eckigen Klammern. Weil die Zahl E (NR) damit auch die Abhängigkeit vom Eigenwert E zum Doppelkommutator nicht beiträgt, ist (NR) eliminiert worden. Der Doppelkommu- tator lässt sich weiter vereinfachen mit Hilfe der Identitäten [~σ p, −eA0 ] = −ie~~σ E [~σ p, −ie~~σ E] = −e~2 ∇E − 2e~~σ (E × p) ∇A0 = −E bei deren Herleitung auch und ∇×E = 0 verwendet wurden. Einsetzen der Ergebnisse sämtlicher Umformungen liefert p4 e~~σ (E × p) e~2 p2 + eA0 − − − ∇E Ψ = E(NR) Ψ. 2m 8m3 c2 4m2 c2 8m2 c2 (2.3) ??) sind bekannt; der dritte Terme ist die erste Korrektur zur Die ersten zwei Terme in ( kinetischen Energie, die man auch erhalten würde mittels der Taylorentwicklung q p2 p4 (mc2 )2 + p2 c2 − mc2 = − + ... 2m 8m3 c2 . Der vierte Term liefert die Spin-Bahn-Kopplung: Ein Elektron, das sich im Feld E bewegt, sieht in seinem Ruhesystem infolge der Lorentztransformation ein Magnetfeld, welches an seinen Spin ankoppelt. Für ein zentralsymmetrisches Potential eA0 = V (r) erhält man die vertraute Form e~ ~ − 2 2 ~σ (E × p) = − 2 2 4m c 4m c 1 dV 1 dV − ~σ (r × p) = S L. r dr 2m2 c2 r dr Der letzte Term − der als e~2 e~2 ∇E = ∇2 A0 , 8m2 c2 8m2 c2 Darwin-Term bezeichnet wird, kann mit der potentiellen Energie eA0 zusammen genommen werden. Er besagt dann, dass das Elektron nicht das Potential am genauen Ort ~ r spürt, sondern den Mittelwert über einen Bereich der Abmessung mc = 3, 9 · 10−11 cm. 4.2. NICHTRELATIVISTISCHE NÄHERUNGEN 95 Auf dieses Phänomen werden wir später im Zusammenhang mit der so genannten bewegung des Dirac-Elektrons noch zurückkommen. Für das Wasserstoatom gilt Zitter- ∇E = 4πeδ(r) und der Darwin-Term trägt nur für s-Zustände bei (im Gegensatz zur Spin-Bahn-Kopplung, die nur für l 6= 0-Zustände von Bedeutung ist). Der Einuss der Zusatzterme in (??) in ers- ter Ordnung Störungstheorie lässt sich für das Wasserstoatom explizit berechnen (Rechnungen in zweiter und höherer Ordnung sind nur sinnvoll, wenn auch höhere Korrekturen (NR) zu HA berücksichtigt werden). Die Energiewerte hängen nur von den Quantenzahlen und j ab und betragen Enj wobei a0 1 α2 −e2 1 + 3 = 2 2a0 n n j+ 1 2 3 − 4n den Bohr'schen Radius und α0 n , die Feinstrukturkonstante darstellt. Ohne Beweis erwähnen wir noch, dass sich die volle Dirac-Gleichung für das Wasserstoatom auch exakt lösen lässt; das Ergebnis ist (für Kernladung Z) − 21 Enj Z 2 α2 = mc 1 + 2 q 2 j + 12 − Z 2 α2 n − j + 21 + 2 . Wegen der Beziehung e2 1 2 2 α mc = 2 2a0 liefert die Taylorentwicklung nach Potenzen von α2 bis auf einen additiven Faktor mc2 das nichtrelativistische Ergebnis. Es ist bemerkenswert, dass in der Dirac-Theorie neben der jz -Entartung auch noch ein Teil der l-Entartung erhalten bleibt. So sind z.B. die Zustände 2s1/2 und 2p1/2 immer noch entartet; diese Entartung wird erst durch die Wechselwirkung mit dem Strahlungsfeld aufgehoben (siehe unsere Diskussion der Lamb-Verschiebung in Kapitel ??). Weiters ist noch zu bemerken, dass der exakte Ausdruck nur für Werte von Z Z ≤ 137 gilt; für höhere treten formal komplexe Eigenwerte auf (instabile Niveaus). Stabile Kerne mit Z > 137 kommen zwar in der Natur nicht vor, aber die Ergebnisse haben trotzdem eine gewisse Relevanz für die Beschreibung von Experimenten, in denen hochenergetische schwere Kerne aufeinandergeschossen werden. Auf die physikalische Bedeutung der komplexen Eigenwerte werden wir kurz näher eingehen im Zusammenhang mit unserer Diskussion des Klein'schen Paradoxons im nächsten Abschnitt. 96 KAPITEL 4. 4.3 DIE DIRAC-GLEICHUNG Lösungen der freien Dirac-Gleichung In diesem Abschnitt diskutieren wir Lösungen der freien Dirac-Gleichung (Aµ = 0) der Form einer ebenen Welle: ψ(r, t) = ψ (A) ψ (B) = Ne i(pr−Et)/~ uA (p) , uB (p) wobei N ein noch zu bestimmender Normierungsfaktor ist. Substitution in die Gleichungen (A) (B) für ψ und ψ ergibt uA (p) = c (~σ p) uB (p); E − mc2 Die Gröÿen E und p uB (p) = c (~σ p) uA (p). E + mc2 (3.1) erfüllen selbstverständlich die Beziehung q E = ± p2 c2 + (mc2 )2 . Für jede Wahl des Vorzeichens existieren zwei linear unabhängige Lösungen. Insbesondere 2 2 2 für p m c gilt: uA (p) uB (p) für E > 0. < Um zur korrekten Wahl des Vorzeichens für E zu gelangen, betrachten wir zuerst den Fall p = 0. Dann muss gelten γ4 ∂ mc ψ=− ψ ∂(ict) ~ oder expliziter − E c~ I 0 0 -I uA (0) uB (0) mc =− ~ uA (0) . uB (0) Aus dieser Gleichung folgt sofort, dass gelten muss E = mc2 ⇐⇒ uB (0) = 0; E = −mc2 ⇐⇒ uA (0) = 0 Der vollständige Satz von Eigenspinoren u(1) 1 0 = 0 0 u(2) 0 1 = 0 0 u(3) 0 0 = 1 0 u(4) 0 0 = 0 1 hat als zusätzliche Eigenschaft, dass er aufgebaut ist aus Eigenvektoren des Operators γ1 γ2 − γ2 γ1 Σ3 = = 2i σ3 0 , 0 σ3 4.3. LÖSUNGEN DER FREIEN DIRAC-GLEICHUNG 97 Spin ~ den des Dirac-Elektrons beschreibt. (Diese intuitiv plausible 2 Interpretation kann abgesichert werden durch Betrachtung des Transformationscharakters der bis auf den Faktor der Dirac-Gleichung unter Drehungen. Dies wird in dieser Vorlesung nicht durchgeführt.) (1) (2) Man wählt jetzt die Eigenspinoren u (p) und u (p) für E > 0 auch für p 6= 0 so, dass gilt (1) uA (p) 1 ; =N 0 (2) uA (p) 0 u(3) (p) (3) 0 1 ; uB (p) = N 0 für die Eigenspinoren und 0 ; =N 1 u(4) (p) 0 < 0 wählt 0 (4) . uB (p) = N 0 1 für E man dagegen Mit Hilfe der Darstellung ~σ p = p3 p1 − ip2 p1 + ip2 −p3 erhält man so aus ( ??) für die vollständigen Eigenspinoren u(1) (p) = N 0 1 0 0 1 u(2) (p) = N 0 (p1 −ip2 )c/(E+mc2 ) ; −p3 c/(E+mc2 ) −(p1 −ip2 )c/(|E|+mc2 ) p3 c/(|E|+mc2 ) . u(4) (p) = N 0 0 1 ; (p1 +ip2 )c/(E+mc2 ) −p3 c/(|E|+mc2 ) −(p1 +ip2 )c/(|E|+mc2 ) ; u(3) (p) = N 0 1 0 p3 c/(E+mc2 ) Man prüft leicht nach, dass für die so konstruierten Eigenspinoren gilt u(r)† (p) u(s) (p) = 0 für r 6= s. Die Normierung der Eigenspinoren ist weitgehend eine Konventionssache. Die am häugsten verwendete Konvention ist (r)† u |E| (p)u (p) = mc2 (r) r ⇒ 0 N = |E| + mc2 ; 2mc2 dies bedeutet, dass sich die Norm des Eigenspinors wie die vierte Komponente eines Vierervektors transformiert. Mit dieser Denition sind die normierten Eigenlösungen der DiracGleichung s ψ (r) (r, t) = mc2 (r) u (p) ei(pr−ηr |E|t)/~ |E| V 98 KAPITEL 4. DIE DIRAC-GLEICHUNG mit ( +1 ηr = −1 für für r = 1, 2; r = 3, 4. Die Korrektheit der Wahl der Vorzeichen mit dem Fall p=0 ηr für die Energie, die bisher nur über die Analogie plausibel gemacht wurde, lässt sich auch mittels Substitution in die Dirac-Gleichung überprüfen. Wir bemerken noch, dass die Eigenspinoren u(r) (p) nur im Spezialfall p 1 = p2 = 0 auch Σ3 sind. Wie wir gleich sehen werden, ist nur die Komponente des Spins parallel zu p eine Bewegungskonstante der freien Dirac-Gleichung. Dies stellt einen Eigenvektoren von wichtigen Unterschied zur nichtrelativistischen Theorie dar. Im Limes V → ∞ erhält man für das Eigenwertspektrum der freien Dirac-Hamiltonfunktion ein (zweifach) entartetes Kontinuum mit den zwei getrennten Bereichen −∞ < E < −mc2 Das Fehlen einer mc2 < E < ∞. und unteren Schranke für die möglichen E-Werte stellt die gröÿte Schwierig- keit bei der Interpretation der Dirac-Gleichung als Einteilchengleichung dar; eine nicht sehr speziell gewählte Störung würde ein unbeschränktes Absinken der Energie des Elektrons zur Folge haben. Damit würde die Stabilität der Materie, die gerade durch die Einführung der normalen Quantentheorie wiederhergestellt wurde, wieder verloren gehen. Ehe wir im nächsten Abschnitt auf die Vorschläge zur Beseitigung dieser Schwierigkeit eingehen, diskutieren wir kurz noch einige weitere Folgerungen aus der Dirac-Gleichung. Observable und Bewegungskonstanten Die Observablen für ein Diracteilchen lassen sich genauso wie für ein Schrödingerteilchen aus den Basisoperatoren r, p und S konstruieren; lediglich für die Komponenten von in der Diractheorie eine andere Darstellung notwendig; auf S. ~1 ~ ~ ijk γj γk = Si = Σi = 2 2 2i 2 S ist ?? wurde die Darstellung σi 0 0 σi vorgeschlagen, allerdings mit einer recht dürftigen Begründung. In der nachfolgenden Betrachtung werden wir die Dynamik dieser Observablen (im Heisenbergbild) etwas näher betrachten. Die Bewegungsgleichung für eine Observable A lautet dA dt = ∂A i + [H, A] ∂t ~ mit H = c~ αp + βmc2 . Die Observable p vertauscht oensichtlich mit H und ist also auch in der Diractheorie für ein freies Teilchen eine Bewegungskonstante. 4.3. LÖSUNGEN DER FREIEN DIRAC-GLEICHUNG 99 Die erste Überraschung tritt bei der Betrachtung des Drehimpulses auf. Dafür gilt [H, L] = [c~ αp, r × p] = ~ cα ~ ×p i oder dL =cα ~ × p. dt 1 ist der Drehimpuls 2 also keine Bewegunskonstante. Auch der Spin ist, wie schon aus der Konstruktion der Anders als in der Schrödingertheorie eines freien Teilchens mit Spin Eigenspinoren hervorging, keine Bewegungskonstante. Wegen 0 σi σj 0 0 σk [αi , Σj ] = , = 2iijk ; σi 0 0 σj σk 0 I 0 σi 0 [β, Σi ] = , =0 0 -I 0 σi gilt d dt S= i i ic h ~ = −c α [H, S] = α ~ p, Σ ~ × p. ~ 2 Wir sehen also, dass wenigstens der Gesamtdrehimpuls J=L+S auch für das freie Diracteilchen eine Bewegungskonstante ist; dies gilt übrigens auch für die Gröÿe S·p S p̂ = die sog. oder für S·p |p| Helizität des Elektrons. Die Tatsache, dass J = L + S für unsere Wahl von S eine Bewegungskonstante ist, ist natürlich umgekehrt ein starkes Argument für die Wahl von ~~ Σ als Darstellung für den Spinoperator S. 2 Als nächstes betrachten wir die Zeitentwicklung des Ortsoperators: dr dt = i ic [H, r] = [~ αp, r] = c α ~. ~ ~ Für den Geschwindigkeitsoperator erhalten wir also nicht etwa p/m, sondern Komponente von α ~ nur die Eigenwerte Eigenzustand einer Komponente von ±1 c~ α. Weil jede hat, ist klar, dass ein Elektron nie in einem α ~ sein kann (Lichtgeschwindigkeiten sind für Teilchen αi haben mit endlicher Masse nicht erlaubt!). Formal betrachtet: die Eigenvektoren von 100 KAPITEL 4. DIE DIRAC-GLEICHUNG keinen endlichen Erwartungswert der Energie und können nicht experimentell präpariert werden. Für den Operator dα ~ dt = wie man aus α ~ erhält man die Bewegungsgleichung i i i [H, α ~ ] = (−2~ αH + {H, α ~ }) = (−2~ αH + 2cp) , ~ ~ ~ {αi , αj } = 2δij und {αi , β} = 0 sofort sieht. Die obige Operator-Dierentialgleichung hat die Lösung α ~ (t) = cp H cp −2iHt/~ + α ~ (0) − e , H wie man durch direkte Substitution sieht (bedenke [H, p] Eigenzustand von p genau die = 0). Der erste Term ist für einen Gruppengeschwindigkeit dividiert durch c: q dE(p) d c2 p 2 2 2 2 vg ≡ = ± p c + (mc ) = dp dp E(p) (bemerke, dass für Zustände negativer Energie vg und p antiparallel stehen!). Der Zu- satzterm stellt eine sehr hochfrequente, oszillierende Bewegung dar (minimale Frequenz 2mc2 /~ ' 1, 5 · 10+21 sec−1 ), die genannt wird. Zitterbewegung Der Erwartungswert der Amplitude der Zitterbewegung verschwindet für Eigenzustände von p; z.B. gilt Z dr ψp(1)† (r)αi ψp(1) (r) = † 1 1 2 E + mc 0 0 0 σi V = cpi . 1 1 σi 0 2E V E c c ~ σ p ~ σ p 2 2 E+mc E+mc 0 0 Auf analoge Weise errechnet man die Erwartungswerte in den übrigen Eigenfunktionen. Matrixelemente von αi zwischen Eigenfunktionen mit unterschiedlichem p verschwinden trivialerweise (r-Integration), und man zeigt auch leicht Z dr ψp(1)† (r) αi ψp(2) (r) Z = dr ψp(3)† (r) αi ψp(4) (r) = 0 Um eine nichtverschwindende Amplitude der Zitterbewegung zu erhalten, braucht man also eine Linearkombination von Lösungen der freien Diracgleichung mit unterschiedlichen Vorzeichen von E; durch Betrachten der führenden Komponenten sieht man z.B. Z dr ψp(3)† (r) (1) α3 ψ (r) = 1 + O p2 m2 c2 . Eng mit dem Phänomen der Zitterbewegung verknüpft ist die Unmöglichkeit, ein Diracteilchen beliebig genau zu lokalisieren. Die Konstruktion einer Wellenfunktion vom Typ ψ † (r) = (Φ∗ (r), 0, 0, 0) 4.3. LÖSUNGEN DER FREIEN DIRAC-GLEICHUNG 101 führt nicht zum Ziel; in einer Zerlegung nach ebenen Wellen gemäÿ Z ψ(r) = dp c1 (p)u(1) (p) + c3 (p)u(3) (p) + c4 (p)u(4) (p) eipr/~ muss gelten c3 (p) −p3 c = ; c1 (p) |E(p)| + mc2 − (p1 − ip2 ) c c4 (p) = . c1 (p) |E(p)| + mc2 Das Auftreten von Wellenvektoren mit ~/mc p ∼ mc, die für eine Lokalisierung auf Gebiete 4x ∼ notwendig sind, hat also automatisch eine starke Beimischung von Komponenten mit negativen Energien, also eine ausgeprägte Zitterbewegung, zur Folge; letztere zerstört dann sofort wieder die Lokalisierung. Newton und Wigner konnten zeigen, dass auch die Bildung eines Wellenpaketes, welches nur Komponenten positiver Energie enthält, nie 4x ∼ ~/mc führen kann. Weil die Eigenfunktionen der freien Diracgleichung mit E > 0 nicht vollständig sind, ist auch nicht zu erwarten, dass die Eigenfunktionen zu E > 0 eines Diracteilchens in einem äuÿeren Potential aus einer linearen Superposition von Ebenen-Wellen-Lösungen mit E > 0 aufzubauen sind. zu einer Lokalisierung schärfer als Dies erklärt das Auftreten des Darwin-Terms in der ersten relativistischen Korrektur zur Schrödingergleichung, der ja als eine Verschmierung der Position des Elektrons über einen Bereich ~/mc gedeutet werden konnte. Stückweise konstante Potentiale; das Klein'sche Paradoxon Der Fall eines stückweise konstanten Potentials, welches nur von einer Raumkoordinate abhängt, ist auch für die Diracgleichung der nächst einfache exakt lösbare Fall. Weil die Diracgleichung eine Gleichung erster Ordnung in den Raumableitungen ist, braucht man nur Stetigkeit der vierkomponentigen Wellenfunktionen zu verlangen, nicht aber deren Ableitungen. Wegen der Verdopplung der Komponentenzahl gegenüber der nichtrelativistischen Theorie bleibt aber die Zahl der so erhaltenen Anschlussbedingungen die gleiche. Die Energie-Impuls-Beziehung in einem Bereich mit Potential V = eA0 Beziehung (~σ p) c2 (~σ p) ψ (A) = E − V + mc2 E − V − mc2 ψ (A) und lautet p 2 c2 = E − V + mc2 E − V − mc2 . Diese Gleichung hat reelle Lösungen für E > V + mc2 oder E < V − mc2 . und imaginäre Lösungen (evaneszente Wellen) für die Bandlücke V − mc2 < E < V + mc2 . folgt z.B. aus der 102 KAPITEL 4. DIE DIRAC-GLEICHUNG Wir werden hier keine expliziten Rechnungen durchführen. Diese sind im Prinzip nicht schwierig, dafür aber etwas langwierig; explizite Rechnungen ndet man z.B. in W. Greiner, Theoretische Physik, Band 6. Das qualitative Verhalten ist aber aus den obigen Ergebnissen leicht einsichtig zu machen. Kastenpotentiale ( V Für |V| = V0 für 0 für < 2mc2 |z| < a |z| > a. ergibt sich folgende Situation (Skizze für V<0) Im Energiebereich E Im Bereich > mc2 hat man ein kontinuierliches Spektrum (Streuzustände) mc2 − V < E < mc2 hat man einige diskrete, in dem Kasten lokalisierte, Niveaus. Im Bereich Im Bereich E V < E −mc2 < E < mc2 − V gibt es keine Zustände. < −mc2 gibt es wieder nur ein kontinuierliches Spektrum. Für −mc2 − < −mc2 sind die verallgemeinerten Eigenfunktionen im Bereich |z| < a evaneszent: Die ebenen Wellen negativer Energie tunneln durch das für sie abstoÿend wirkende Potential hindurch. Beim Anwachsen von |V| spalten sich die gebundenen Zustände vom Kontinuum der Zustände mit E > 0 ab. Für V > 0 entstehen hingegen gebundene Zustände aus dem Kontinuum der Zustände mit negativer Energie. 2 Für |V| > 2mc wird das Verhalten qualitativ anders: Für mc2 − V < Resonanzen E < −mc2 hat man jetzt ein kontinuierliches Spektrum, allerdings mit im Reexionskoezienten, deren Lagen in Abhängigkeit von V sich stetig mit den Lagen gebundener Zustände verbinden lässt; die gebundenen Zustände werden instabil beim Eintauchen in das Kontinuum der Zustände negativer Energie (vgl. das Ergebnis für das Coulombproblem mit für den Energiewert E1,1/2 Zα > 1; dort tritt aber ein Zusammenbruch auf = 0; dies ist aber eine Besonderheit des singulären Potentials. 2 Nach Abschneiden des Potentials tritt die Instabilität erst bei E1,1/2 = −mc auf ). Ähnlich paradoxe Ergebnisse erhält man für Streuung an einer V(z) Potentialstufe: = V0 θ(z). < 2mc2 erhält man teilweise Reexion für E(p) > V0 + mc2 und 2 2 E(p) < V0 + mc . Für V0 > 2mc tritt aber die skizzierte Lage auf: Für V0 Totalreexion für 4.4. DIE LÖCHERTHEORIE Für E(p) < V0 − mc2 103 wird das Potential wieder transparent; es lässt sich eine Lösung konstruieren aus einer einlaufenden und einer reektierten Welle für rechts auslaufenden Welle (mit pZ < 0 z<0 und einer nach wegen des anomalen Vorzeichens der Gruppenge- schwindigkeit im unteren Kontinuum! Eine Lösung, die rechts eine Welle enthält, ist formal auch möglich, führt aber zu einem physikalisch inakzeptablen Wert ezienten). Dieses Verhalten wurde zuerst von Klein'sches Paradoxon bekannt. 4.4 R > 1 des Reexionsko- Klein gefunden und ist unter dem Namen Die Löchertheorie Bisher haben wir drei physikalisch schwerverdauliche Konsequenzen aus der Diractheorie gefunden: 1: Die Instabilität der Zustände mit E >0 gegenüber strahlendem Zerfall in Zustände des unteren Kontinuums 2: Das Instabilwerden von gebundenen Zuständen beim Eintauchen in das untere Kontinuum 3: Das Klein'sche Paradoxon Zur Beseitigung dieser Mängel stellte Dirac die Hypothese auf, dass sämtliche Zustände 2 mit E < −mc (für den feldfreien Raum) besetzt sind, mit vielleicht sehr wenigen Ausnahmen. Ein fehlendes Elektron in einem Zustand negativer Energie verhält sich wie ein positiv geladenes Teilchen mit Energie, Impuls und Spin entgegengesetzt zu demjenigen des fehlenden Elektrons. Dieses Loch hat dieselbe Masse wie das Elektron; es wird Positron genannt und wurde kurz nach dem Vorschlag von Dirac auch experimentell von Anderson in der kosmischen Strahlung gefunden. Positronen können dadurch erzeugt werden, dass ein γ -Quant ein Elektron aus einem Zustand mit E <0 in einen mit E neuen Sprachregelung heiÿt dies: Das Photon erzeugt ein >0 anhebt. In der Elektron-Positron-Paar. Der Einwand der Instabilität von Atomen und freien Elektronen ist durch die Dirachypothese beseitigt. (Dies zeigt übrigens, dass die Diracgleichung nur für Fermionen eine akzeptable Beschreibung darstellt.) Beim Eintauchen eines unbesetzten gebundenen Zustands in das Kontinuum wird er sofort von einem Elektron aus dem Dirac-Meer besetzt. Experimentell würde dies bedeuten, dass bei der Bildung eines überkritischen Potentials (z.B. beim Zusammenstoÿ zweier hochgeladener Kerne) eine beachtliche Zahl von unge- paarten Positronen emittiert wird, was auch wieder der Beobachtung entspricht. Auf eine detaillierte Deutung des Klein'schen Paradoxons in der Löchertheorie werden wir verzichten, weil die dort vorausgesetzte Situation (zwei unendliche Halbräume mit unterschiedlichem Potential) unphysikalisch ist und höchstens als Grenzfall eines Kastenpotentials mit groÿer Breite von Bedeutung sein kann. Die in einem solchen Gebiet über die Schwelle 104 E KAPITEL 4. = mc2 DIE DIRAC-GLEICHUNG hinausgehobenen besetzten Zustände entleeren sich (Bildung lokalisierter Po- sitronen unter Emission freier Elektronen) und die so gebildete Raumladung bringt dann 2 das überkritische Potential bis auf den Wert 2mc hinunter. Anwendung: Streuung von Licht an freien Elektronen Die Wechselwirkung eines Diracteilchens mit einem Strahlungsfeld kann analog zur Theorie in Kap. Operator ?? aufgezogen werden, indem man A(r, t) in der Diracgleichung durch den für das quantisierte Strahlungsfeld ersetzt. Wir werden als Beispiel für das Funktionieren der Löcherhypothese die Streuung von Licht an freien Elektronen studieren. Die klassische Theorie liefert hier den Streuquerschnitt dσ dΩ = r02 |êi · êj |2 e2 der klassische Elektronenradius ist und êi bzw. êj die Polarisationsvektoren mc2 des einfallenden bzw. gestreuten Photons. (Dieses Ergebnis folgt aus der Formel auf S. , r0 = wobei ?? wenn man bedenkt, dass der Operator p keine Übergänge zwischen verschiedenen Zustän- freien Elektrons vermitteln kann; dann gilt auch ωk = ωk .) Der verbleibende 2 Term im Ausdruck auf S. ?? kommt vom A -Term in der klassischen Wechselwirkung, der den eines 0 in der Diractheorie kein direktes Analogon hat. Die Wechselwirkung in der Diractheorie ist gegeben durch HI = −e~ αA(r, t). Für die Streuamplitude bis zur zweiten Ordnung gemäÿ dem zweiten und dritten Graphen auf S. ??: erhält man in Analogie mit der unteren Formel auf S. ??: 0 0 0 p r |~ α · êj e−ik r |p00 r00 p00 r00 |~ α · êi eikr |pr −2πe2 c2 ~ X X √ V ωk ωk0 E − E − ~ωk p00 r00 =1,2 0 0 ! 0 p r |~ α · êi eikr |p00 r00 p00 r00 |~ α · êj e−ik r |pr . + E − E + ~ωk0 Für p=0 tragen nur die Zwischenzustände p00 = ~k bzw. p00 = −~k0 bei. Weil α ~ nur zwi- schen groÿen und kleinen Komponenten der Eigenspinoren nichtverschwindende Matrixelemente hat, erhält man für das Verhältnis des obigen Ausdrucks zum nichtrelativistischen Ausdruck auf S. ?? mc2 X (êi · êj ) r00 ... " = O mc2 c~k mc2 2 # 1 ~ωk =O . ~ck mc2 4.4. DIE LÖCHERTHEORIE Dieser Ausdruck verschwindet für 105 ωk → 0! Es gibt in der Diractheorie aber noch eine dritte Möglichkeit: Das einkommende Photon kann ein Elektron-Positron Paar erzeugen; das Positron vernichtet dann das ursprünglich anwesende Elektron unter Emission eines Photons. Diese und eine vierte Möglichkeit sind in den unten skizzierten Diagrammen angegeben: Die zugehörige Amplitude ist 00 00 0 p r |~ α · êj e−ik r |pr p0 r0 |~ α · êi eikr |p00 r00 −2πe2 c2 ~ X X √ V ωk ωk0 E' + |E | − ~ωk p00 r00 =3,4 ! 00 00 0 p r |~ α · êi eikr |pr p0 r0 |~ α · êj e−ik r |p00 r00 . + E' + |E | + ~ωk0 Für p=0 und ~ωk mc2 gilt in guter Näherung u(r) (p0 ) ≈ u(r) (p00 ) ≈ u(r) (0) 0 eikr ≈ e−ik r ≈ 1 und E' + |E | − ~ωk ≈ E' + |E | + ~ωk0 ≈ 2mc2 . Falls man weiters noch schreibt (r) χ+ u (0) = 0 (r) für (r) r = 1, 2 u (0) = 0 (r) χ− für r = 3, 4 , so erhält man für die obige Summe 0 00 0 1 X (r00 )† (r) (r )† (r00 ) (r )† (r) (r )† (r00 ) χ ~ σ · ê χ χ ~ σ · ê χ + χ ~ σ · ê χ χ ~ σ · ê χ , j + i − i + j − + − + 2mc2 r00 =3,4 − was sich wegen der Vollständigkeit der (r) χ− schreiben lässt als 1 1 (r0 )† (r) χ [~σ êj ~σ êi + ~σ êi ~σ êj ] χ+ = êi êj δrr0 , + 2 2mc mc2 also genau das zur Erhaltung des klassischen Resultats benötigte Ergebnis. Das obige Ergebnis zeigt auf recht beeindruckende Weise, dass die Diractheorie erst mit Berücksichtigung der Zustände negativer Energie und der Löcherhypothese zu Übereinstimmung mit den bekannten experimentellen Ergebnissen führt. In den obigen Diagrammen wurde gemäÿ einer von Feynman vorgeschlagenen Konvention das Positron als ein sich 106 KAPITEL 4. rückwärts in der Zeit DIE DIRAC-GLEICHUNG bewegendes Elektron gezeichnet. Der in den Diagrammen auf- tretende Zwischenzustand ist weiters für nichtrelativistische Ausgangsteilchen mit einem riesigen Energieexzess behaftet, also extrem kurzlebig. Das könnte man dadurch zum Ausdruck bringen, dass man die beiden Vertizes extrem nahe zusammenzeichnet; damit ist der 2 Übergang zum nichtrelativistischen A -Graphen auch anschaulich plausibel zu machen! Zum Schluss: Mit der Löcherhypothese hört die Diractheorie auf, eine echte Einteilchentheorie zu sein. Sie ist eigentlich nur als Vielteilchentheorie konsisten interpretierbar, und es liegt nahe, auch das Diracfeld als Operatorfeld umzudenieren. In einer solchen Feldtheorie kann man auch einige etwas beunruhigende Aspekte der Löchertheorie (unendliche Massenund Ladungsdichte des Vakuums) durch Renomierung wegdenieren. Die trodynamik, Quantenelek- d.h. die Theorie der gekoppelten quantisierten Dirac- und Maxwellfelder, ist trotz der in ihr notwendigen, formal sehr abenteuerlichen, Renormierungsverfahren, die wohl erfolgreichste fundamentale Theorie der heutigen Physik; sie erlaubt z.B. eine sehr präzise Berechnung der Lambverschiebung und des, in der Vorlesung nicht diskutierten, anomalen magnetischen Moments von Elektron und Myon. Weiters ist sie das Vorbild weiterer in der Elementarteilchenphysik benützter Feldtheorien für starke und schwache Wechselwirkungen. Lehrbücher, die die Quantenelektrodynamik behandeln, sind z.B. Sakurai und Messiah; siehe auch R. P. Feynman, Quantum Elektrodynamics, sowie sein für Laien verfasstes QED, The Strange Theory of Light and Matter. 4.5 Quantisierung des Diracfeldes Ganz analog zur Vorgangsweise bei dem Maxwell- bzw. Schrödingerfeld führen wir einen Feldoperator für das Diracfeld ein mittels der Denition 4 1 XX ψ(r, t) = √ V p und interpretieren die s r=1 (r) bp (t) mc2 (r) b (t)u(r) (p) eipr/~ |E| p als Vernichter eines Elektrons im Zustand (5.1) (p, r). Sie erfüllen also die Antivertauschungsbeziehungen o n o n (r)† (s)† (r) (s) = 0. bp , bp0 = bp , bp0 n o (r) (s)† bp , bp0 = δrs δpp0 ; Der Hamiltonoperator für das freie Diracfeld lautet dann Z H = H(r) = ψ † (r) HD ψ(r) dr H(r) mit HD = −i~c α∇ + βmc2 . Einsetzen der Entwicklung ( H = ··· = ??) in H liefert XXXX p p0 r r0 XX mc2 E (r)† (r0 ) (r)† 0 (r) δpp0 p bp bp0 u (p) u(r ) (p0 ) = ηr |E|b(r)† p bp |EE'| p r 4.5. QUANTISIERUNG DES DIRACFELDES 107 mit η3 = η4 = −1, η1 = η2 = 1; E = Ep = ± p p2 c2 + m2 c4 . Mit Hilfe dieses Hamiltonoperators erhalten wir als Bewegungsgleichung für die (r)† bp d dt d dt (r) bp und i i (r) H, bp = −ηr |E| bp(r) ~ ~ i i (r)† = H, bp = ηr |E| b(r)† p ~ ~ b(r) p = b(r)† p ?? Die Lösungen dieser Gleichung können verwendet werden, um in ( ) die Heisenbergope(r) (r) (r) ratoren bp (t) zugunsten der Schrödingeroperator bp ≡ bp (0) zu eliminieren: s ψ(r, t) = XX p r mc2 (r) (r) ipr − iηr |E|t b u (p) exp . |E| V p ~ Neben der Gesamtladung H benötigen wir später noch Ausdrücke für die Gesamtladung Z dr ψ † (r)ψ(r) = Q=e X (r) e b(r)† p bp p,r und für den Gesamtimpuls Z P = −i~ dr ψ † (r)∇ψ(r) = X (r) p b(r)† p bp p,r Der Grundzustand (oder Vakuumzustand) des freien Diracfeldes entspricht gemäÿ der Löchertheorie dem Zustand, in dem alle Orbitale mit r = 3, 4 mit besetzt sind: b(r) p |vac = 0, r = 1, 2 Für r = 1, 2 leer und alle Orbitale r = 3, 4 b(r)† p |vac = 0, r = 3, 4 . hebt der Operator gleichzeitig den Impuls um gewissermaÿen als p (r) bp die Energie des Vakuums um E an, und erniedrigt und die Ladung um e. Diese Operatoren verhalten sich also Erzeuger für positiv geladene Teilchen, die Positronen. Wir denieren die Erzeuger für Positronen mittels: (4) d(1)† = −b−p ; p (3) d(2)† = b−p p sorgt dafür, dass für p ≈ 0 die Erzeuger mit Index 1 ~ erhöhen. Die Vorzeichen sorgen dafür, dass die Jordan2 Wigner Phasenkonventionen erhalten bleiben, falls wir das Vakuum neu denieren als den Die Korrespondenz 1 ↔ 4, 2 ↔ 3 die z-Komponente des Spins um Zustand, in dem sämtliche Elektron- und Positron-Orbitale leer sind: b(r) p |vac = 0, d(r) p |vac = 0, r = 1, 2 . 108 KAPITEL 4. DIE DIRAC-GLEICHUNG Die Antikommutatoren lauten, wie erwartet, n o 0 (r) (r )† dp , dp0 = δrr0 δpp0 ; Antikommutatoren vom Typ {d, d}, d† , d† , sowie {d, b}, d† , b usw. verschwinden alle. Falls wir weiters Positron-Spinoren einführen mittels: v (1) (p) = −u(4) (−p) v (2) (p) = u(3) (−p) , so können wir den Feldoperator r ψ(r, t) = XX ψ umschreiben als mc2 (s) (s) (s) −i(pr−Et)/~ , bp u (p) ei(pr−Et)/~ + d(s)† p v (p) e E V p s=1,2 p p2 c2 + m2 c4 entspricht. Bei der Summation in (??) sämtliche p umfasst, wobei E ab jetzt immer dem positiven Ausdruck E(p) obigen Umformung haben wir benutzt, dass die sodass p unter der Summation durch −p =+ ersetzt werden kann. Der Hamiltonperator in den neuen Operatoren lautet H = XX EP (s) b(s)† p bp − (s) (s)† d−p d−p = XX p p s=1,2 EP (s) (s)† (s) b(s)† p bp + dp dp − 1 , s wobei wir die Antivertauschungsrelation ausgenützt und im zweiten Term den Summationsindex von p in −p umbenannt haben. Der Term −1 im Summanden ist eine (divergente) Konstante und wird üblicherweise weggelassen. Für die Gesamtladung erhält man analogerweise Q=e X (s) b(s)† p bp + (s) (s)† d−p d−p ps =e X (s) (s)† (s) b(s)† p bp − dp dp + 1 ps Hier sieht man also explizit, dass die Positronen positive Ladung tragen (e = −|e|). Weiters tritt hier eine unübliche Hintergrundladung des Dirac-Sees auf; dieser Term wird üblicherweise auch ohne viel Kommentar gestrichen. Allerdings bietet sich in jüngster Zeit eine attraktive Alternative an: in den erfolgreicheren modernen Theorien der Elementarteilchen treten diese in Generationen auf. Zu dem Elektron mit Ladung −|e| (und dem ungela2 denen Elektronneutrino) gehören in einer Generation zwei Quarks mit Ladung |e| und 3 − 31 |e|, die auch Spin 12 haben und weiters noch in drei Varianten (Farben) vorkommen. Die 2 1 Gesamtladung der Orbitale mit Impuls p ist also: 2 −|e| + 3 − 3 |e| = 0, und auch 3 die Hintergrundladungen der Diracseen addieren sich innerhalb der Generation zu Null. 4.5. QUANTISIERUNG DES DIRACFELDES 109 Wechselwirkungen In einer relativistisch invarianten Theorie ist es unschön, ein Wechselwirkungspotential V (r1 − r2 ) zwischen zwei Fermionen einzuführen: eine instantane Wechselwirkung zwischen zwei zueinander raumartig gelegenen Teilchen verträgt sich schlecht mit der relativistischen Kausalität (nur zueinander raumartig gelegene Ereignisse können einander beeinussen). Stattdessen lässt man sich inspirieren von der Methode der Ankopplung von geladenen Teilchen an das Maxwellfeld (oder von den Elektronen an den Phononen in der Festkörperphysik). Der Wechselwirkungsterm (in der Hamiltondichte, oder, auf etwas fundamentalerem Niveau, in der Lagrangedichte) hat die Form LI = G J A , wobei G eine Zahl (Kopplungskonstante) ist, J ein Strom bilinear in den Fermionenfeldern, und A ein Kraftfeld (Bosonfeld) ist (in komplizierteren Theorien treten auch Ströme aus Bosonenfeldern auf ). Weiters soll LI eine skalare Dichte sein; dies heiÿt, dass J und A unter Lorentztransforma- tionen ähnlich transformieren müssen. Weil das Maxwellfeld Aµ ein Vektorfeld ist, darf es nur an einen Vektorstrom ankoppeln; wir haben in der Tat gesehen, dass die Stromdichte = ψ̄γµ ψ = ψ † αψ, ψ † ψ E transformiert. Vektor p, c Jµ wie ein Die schwache Wechselwirkung sollte z.B. imstande sein, Zerfälle wie µ− −→ e− + ν̄e + νµ zu beschreiben. Dies geschieht durch Ankopplung an ein intermediäres Vektorboson der obige Prozess wird zerlegt in µ− −→ W− + νµ W− −→ ν̄e + e− oder auch (vgl. die Thomsonstreuung) |0 −→ W+ + e− + ν̄e µ− + W+ −→ νµ W± ; 110 KAPITEL 4. DIE DIRAC-GLEICHUNG Der schwache Strom muss also Terme enthalten, die ein Myon vernichten und ein MyonNeutrino erzeugen (oder ein Elektron und ein Elektron-Antineutrino erzeugen). Ein Ansatz wäre Jµw ? = ψ̄νe γµ ψe + ψ̄νµ γµ ψm + h.c. wobei der Myonspinor mit (5.2) ψm bezeichnet wurde. Da das W± -Teilchen sehr massiv ist, führt es in dem skizzierten Prozess zu sehr groÿen Energienennern, also zu sehr schwacher Wechselwirkungen, sogar falls die Kopplungskonstante mit derjenigen der elektromagnetischen Wechselwirkung vergleichbar ist. (Allerdings nicht mehr, falls die Energie des einfallenden 2 Teilchens mit mW c vergleichbar ist.) Der obige Ansatz kann aber nicht richtig sein, weil das Neutrino nur zwei Komponenten hat; das Neutrino kommt nur als linkshändiges Teilchen vor! Wir müssen im Stromoperator also auf linkshändige Teilchen projizieren. Für masselose Teilchen hat der Diracspinor die Form χ(+) σ·pc (+) |E| χ = χ(+) σ · p̂ χ(+) wegen E = c|p|. [σ · p̂]2 = I gilt also σ · p̂ χ(+) σ · p̂ 0 χ(+) χ(+) , = = Σ · p̂ 0 σ · p̂ χ(+) σ · p̂ χ(+) σ · p̂ χ(+) Wegen d.h. Σ · p̂ = −γ5 mit γ5 = γ1 γ2 γ3 γ4 = 0 −I . −I 0 1 (1 + γ5 ). Weiters sieht 2 man, dass γ5 mit einem Pseudoskalar (Vektorprodukt eines axialen mit einem polaren VekDer Projektor auf die linkshändigen Teilchen hat also die Form tor) zusammenhängt; dies wird bestätigt durch eine Analyse des Verhaltens der unter Lorentztransformationen, die ergibt, dass γ5 γ -Matrizen mit eigentlichen Lorentztransformatio- nen kommutiert, aber mit Raumspiegelungen antikommutiert. Durch Überlegungen dieser ??) anzusetzen Art wird man dazu geführt, statt ( Jµw = ψ̄νe γµ (1 + γ5 ) ψe + ψ̄νµ γµ (1 + γ5 ) ψm + . . . , wobei benützt wurde, dass γ5 mit allen γµ antivertauscht. Aus dieser Form geht hervor, dass in der schwachen Wechselwirkung, d.h. beim Zerfall des W− -Teilchens, nur linkshändige Elektronen produziert werden (auch beim Zerfall des Neutrons, wobei das W− durch ein Nukleon- (oder Quark-)-Anteil in Jµw produziert wurde). Diese Vermutung wurde schon 1958 durch Wu et al. experimentell bestätigt. In der vereinheitlichten Theorie der elektromagnetischen und schwachen Wechselwirkungen kann zusätzlich zum Photon und zum W± noch ein viertes Teilchen, das Z0 , ausgetauscht 4.5. QUANTISIERUNG DES DIRACFELDES 111 werden. Der zugehörige Strom enthält neben einem reinen ψ̄νe γµ (1 + γ5 )ψν Term auch neutrale (ladungserhaltende) Ströme aus geladenen Teilchen (mit irgendeiner Kombination aus γµ und γµ γ5 ). Dieser Term führt zu e − ν -Streuung. Durch Drehung dieses Diagramms sieht man, dass das Z0 durch e+ − e− Vernichtung er- zeugt werden kann, und dann in alle möglichen Teilchen-Antiteilchen Paare zerfallen kann. Aus der Lebensdauer des Z0 -Teilchens kann man dementsprechend die gesamte Zahl der 1 M ) bestimmen. Die im letzten Jahr angelau2 Z0 fenen Experimente zeigen, dass es neben den bisher bekannten Teilchen keine weiteren zu Elementarteilchen (mit Masse kleiner als geben scheint, also insbesondere keine weiteren masselosen Neutrinos (neben ντ ). νe , νµ und