Skript

Werbung
Quantentheorie 2
Carsten Timm
Sommersemester 2013
Technische Universität Dresden
Institut für Theoretische Physik
Version: 4. Juni 2014
LATEX & Abbildungen: A. Lau und C. Timm
Inhaltsverzeichnis
1 Einführung
1.1 Was fehlt noch? . . . . . . . . . . .
1.2 Lehrbücher . . . . . . . . . . . . .
1.3 Formalismus der Quantenmechanik
1.3.1 Zustände und Operatoren .
1.3.2 Dynamik . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
4
4
5
5
7
2 Identische Teilchen und zweite Quantisierung
2.1 Unterscheidbare Teilchen . . . . . . . . . . . . . . . . .
2.1.1 N -Teilchen-Hilbertraum . . . . . . . . . . . . . .
2.1.2 Observable . . . . . . . . . . . . . . . . . . . . .
2.1.3 Dynamik . . . . . . . . . . . . . . . . . . . . . .
2.2 Identische Teilchen . . . . . . . . . . . . . . . . . . . . .
2.2.1 Symmetrisierte und antisymmetrisierte Zustände
2.2.2 Observable . . . . . . . . . . . . . . . . . . . . .
2.3 Zweite Quantisierung . . . . . . . . . . . . . . . . . . . .
2.3.1 Besetzungszahldarstellung . . . . . . . . . . . . .
2.3.2 Operatoren in zweiter Quantisierung . . . . . . .
2.3.3 Quantenfeldoperatoren . . . . . . . . . . . . . . .
2.4 Festkörperelektronen . . . . . . . . . . . . . . . . . . . .
2.4.1 Der Fermi-See . . . . . . . . . . . . . . . . . . .
2.4.2 Teilchen und Löcher . . . . . . . . . . . . . . . .
2.5 Austausch-Wechselwirkung und Hartree-Fock-Näherung
2.5.1 Direkte und Austausch-Wechselwirkung . . . . .
2.5.2 Hartree-Fock-Gleichungen . . . . . . . . . . . . .
2.5.3 Hartree-Fock-Näherung in zweiter Quantisierung
2.5.4 Das Wasserstoffmolekül . . . . . . . . . . . . . .
2.6 Bosonen . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9
9
9
11
12
13
15
19
22
22
27
30
32
33
34
35
35
38
40
43
47
3 Relativistische Quantentheorie
3.1 Spezielle Relativitätstheorie . . . . . . . . . . . . . . .
3.1.1 Viererschreibweise und relativistische Mechanik
3.1.2 Elektrodynamik . . . . . . . . . . . . . . . . .
3.1.3 Minimale Kopplung . . . . . . . . . . . . . . .
3.2 Die Klein-Gordon-Gleichung . . . . . . . . . . . . . . .
3.2.1 Freie Teilchen . . . . . . . . . . . . . . . . . . .
3.2.2 Eigenschaften der Klein-Gordon-Gleichung . .
3.2.3 Teilchen im elektromagnetischen Feld . . . . .
3.3 Die Dirac-Gleichung . . . . . . . . . . . . . . . . . . .
3.3.1 Freies Teilchen . . . . . . . . . . . . . . . . . .
3.3.2 Eigenschaften der Dirac-Gleichung . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
49
49
50
53
55
55
55
57
60
61
61
64
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
66
68
69
70
75
76
76
79
80
82
4 Streutheorie
4.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.1 Teilchenzahlerhaltung und Optisches Theorem . . . . . . . .
4.2 Partialwellen und Streuphasen . . . . . . . . . . . . . . . . . . . . .
4.2.1 Streupotentiale mit endlichem Träger . . . . . . . . . . . . .
4.2.2 Resonanzstreuung . . . . . . . . . . . . . . . . . . . . . . . .
4.2.3 Integraldarstellung der Streuphasen und Bornsche Näherung
4.3 Coulomb-Streuung . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.1 Die Rutherfordsche Streuformel . . . . . . . . . . . . . . . . .
4.3.2 Partialwellenzerlegung . . . . . . . . . . . . . . . . . . . . . .
4.4 Streuung identischer Teilchen . . . . . . . . . . . . . . . . . . . . . .
4.4.1 Streuung von Teilchen aneinander . . . . . . . . . . . . . . .
4.4.2 Identische Teilchen . . . . . . . . . . . . . . . . . . . . . . . .
4.4.3 Mittelung über Spin-Einstellungen . . . . . . . . . . . . . . .
4.5 Green-Funktions-Methode . . . . . . . . . . . . . . . . . . . . . . . .
4.5.1 Integraldarstellung der Streuamplitude . . . . . . . . . . . . .
4.5.2 Bornsche Reihe . . . . . . . . . . . . . . . . . . . . . . . . . .
4.6 Basisunabhängige Streutheorie . . . . . . . . . . . . . . . . . . . . .
4.6.1 Die allgemeine Lippmann-Schwinger-Gleichung . . . . . . . .
4.6.2 Die S -Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.6.3 Die T -Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.6.4 Verbindung zur Streuamplitude . . . . . . . . . . . . . . . . .
4.7 Anhang: Zeitabhängige Störungstheorie . . . . . . . . . . . . . . . .
4.7.1 Bildwechsel in der Quantentheorie . . . . . . . . . . . . . . .
4.7.2 Fermis Goldene Regel . . . . . . . . . . . . . . . . . . . . . .
4.7.3 Verallgemeinerung auf die T -Matrix . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
86
86
89
91
96
102
104
106
109
110
112
112
113
114
115
116
118
119
119
123
124
125
126
126
129
131
5 Feldquantisierung
5.1 Von der klassischen Mechanik zur Quantenmechanik
5.2 Lagrange-Formalismus für Felder . . . . . . . . . . .
5.3 Kanonische Quantisierung . . . . . . . . . . . . . . .
5.3.1 Schrödingersche Wellenfunktion . . . . . . . .
5.3.2 Elektromagnetisches Feld . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
133
133
135
139
140
140
3.4
3.5
3.3.3 Drehimpuls und Spin . . . . . . . . . . . . . . . . . . .
3.3.4 Wahrscheinlichkeitsdichte . . . . . . . . . . . . . . . .
3.3.5 Teilchen im elektromagnetischen Feld . . . . . . . . .
3.3.6 Klein-Paradoxon . . . . . . . . . . . . . . . . . . . . .
3.3.7 Löchertheorie . . . . . . . . . . . . . . . . . . . . . . .
Nichtrelativistischer Grenzfall und relativistische Korrekturen
3.4.1 Große und kleine Komponenten, Pauli-Theorie . . . .
3.4.2 Relativistische Korrekturen, Spin-Bahn-Kopplung . .
3.4.3 Feinstruktur des Spektrums des Wasserstoffatoms . .
Graphen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Kapitel 1
Einführung
1.1
Was fehlt noch?
Die Vorlesung Quantentheorie 2 bildet den abschließenden Teil des Vorlesungszyklus zur Theoretischen Physik im
Bachelor-Studium. Zugleich setzt sie die Vorlesung Quantentheorie 1 fort. Es stellt sich die Frage, welche Themen
der physikalischen Allgemeinbildung durch die Quantentheorie 1 noch nicht abgedeckt wurden.
Die Quantentheorie 1 beschäftigt sich mit der Quantenmechanik von einzelnen Teilchen, die sich mit im
Vergleich zur Lichtgeschwindigkeit c kleinen Geschwindigkeiten bewegen. Weiter wurden mit Ausnahme von
einfachen Tunnelproblemen nur gebundene Zustände untersucht. Daraus ergeben sich die folgenden Lücken und
Mängel der Beschreibung, die wir zumindest zum Teil beheben werden:
1. Die Wellenfunktion ψ(r) ist eine Funktion eines Ortes oder, in der Verallgemeinerung auf N Teilchen, von N
Orten, ψ(r1 , . . . , rN ). Der bisher entwickelte Formalismus enthält keine Möglichkeit, zeitliche Änderungen
der Zahl der Argumente von ψ zu beschreiben. Er kann daher die Erzeugung und Vernichtung von Teilchen
nicht beschreiben, z.B. den β-Zerfall n → p + e− + ν̄e . Eine solche Beschreibung ist mittels der sogenannten
zweiten Quantisierung möglich, die wir in Kap. 2 diskutieren werden.
2. Die bisherige Theorie (Schrödinger-Gleichung) ist nicht Lorentz-invariant und ihr klassischer Grenzfall ist
daher nicht mit der Speziellen Relativitätstheorie vereinbar. Daher wird die Dynamik von Teilchen mit
Geschwindigkeiten nahe c nicht korrekt beschrieben. Die vernachlässigten relativistischen Effekte sind auch
für das Verständnis der Atomniveaus und -spektren wichtig. Die Schrödinger-Gleichung ergibt nicht die
beobachtete Feinstruktur. Das liegt v.a. an der vernachlässigten Spin-Bahn-Kopplung. Diese ist auch für
die Festkörperphysik von Bedeutung. In Kap. 3 werden wir Lorentz-invariante Formulierungen der Quantenmechanik kennenlernen.
3. Während wir gebundene Zustände z.B. in Atomen recht gut verstehen, fehlt es uns bisher an einer systematischen Theorie für Streuprozesse. Diese sind aber als Basis für zahlreiche experimentelle Methoden sehr
wichtig. In Kap. 4 beschäftigen wir uns mit der Streutheorie.
4. Wir können die Dynamik von Materieteilchen quantentheoretisch beschreiben und in der zweiten Quantisierung auch deren Erzeugung von Zerfall. Dagegen kennen wir bisher nur eine klassische Theorien von
Feldern, insbesondere die Maxwell-Theorie des elektromagnetischen Feldes. Viele Experimente zeigen aber,
dass Licht auch Teilchencharakter hat, z.B. der photoelektrische Effekt. Eine Quantentheorie von Feldern,
insbesondere des elektromagnetischen, ist daher erforderlich, Grundlagen dafür sollen in Kap. 5 besprochen
werden.
1.2
Lehrbücher
Aus dem Angebot von Lehrbüchern soll hier eine kleine und subjektive Auswahl erwähnt werden:
4
• W. Nolting, Grundkurs Theoretische Physik, Band 5/2: Quantenmechanik – Methoden und Anwendungen,
6. Aufl. (Springer-Verlag, Berlin, 2006): Die gesamte Reihe von Lehrbüchern ist empfehlenswert. Nolting
legt relativ großes Gewicht auf das Einüben der Formalismen und weniger auf die ausführliche Diskussion
des physikalischen Gehalts. Er führt Herleitungen oft im Detail vor, wo andere Autoren nur das Ergebnis
angeben. Die Darstellung ist fast immer klar. Die Bücher enthalten viele gute Übungsaufgaben mit Lösungen und Kontrollfragen. Format und Layout sind ansprechend. Ein Literaturverzeichnis fehlt leider. Die
relativistische Quantentheorie kommt relativ kurz.
• A. Messiah, Quantenmechanik, Band 1, 2. Aufl. (de Gruyter, Berlin, 1991) und Band 2, 3. Aufl. (de Gruyter, Berlin, 1990): Ein empfehlenswertes klassisches Lehrbuch in zwei Bänden, wobei wir überwiegend den
zweiten Band benötigen. Sehr umfangreich in der Stoffauswahl und mit etwas größerem Gewicht auf Prosa
als Noltings Buch. Die Bücher enthalten Übungsaufgaben ohne Lösungen.
• L. D. Landau und E. M. Lifschitz, Lehrbuch der theoretischen Physik, Band 3: Quantenmechanik, 9. Aufl.
(Verlag Harri Deutsch, Frankfurt am Main, 1986/1992) und Band 4: Quantenelektrodynamik, 7. Aufl. (Verlag Harri Deutsch, Frankfurt am Main, 1991/2009): Teile der klassischen Reihe von russischen Lehrbüchern.
Inzwischen etwas altmodisch in der Stoffauswahl und der Darstellung. Zwischenschritte werden selten angegeben. Die Bücher enthalten recht schwierige Übungsaufgaben ohne Lösungen. Band 3 umfasst die nicht
relativistische Quantenmechanik, die überwiegend schon in der Vorlesung Quantentheorie 1 behandelt wurde, Band 4 die relativistische Quantenmechanik, die Feldquantisierung und, wie der Titel sagt, die Quantenelektrodynamik. Band 4 geht damit deutlich über den Stoff der Vorlesung hinaus.
• J. J. Sakurai, Advanced Quantum Mechanics (Pearson Education, 2006): Relevant für die relativistische
Quantenmechanik und die Feldquantisierung. Altmodische Formulierung der relativistischen Metrik unter
Verwendung der imaginären Einheit i.
• C. Cohen-Tannoudji, B. Diu und F. Laloë, Quantenmechanik, Band 1 und 2, 4. Aufl. (de Gruyter, 2010).
• R. Shankar, Principles of Quantum Mechanics, 2. Aufl., 3. Nachdruck (Springer-Verlag, 2008).
Die zweite Quantisierung wird auch am Anfang von vielen Lehrbüchern der Vielteilchentheorie und der Quantenfeldtheorie diskutiert. Eine ansprechende Darstellung findet sich z.B. in H. Bruus und K. Flensberg, Many-body
Quantum Theory in Condensed Matter Physics (Oxford University Press, Oxford, 2004).
1.3
Formalismus der Quantenmechanik
Wir wiederholen zunächst Material aus der Quantentheorie 1, zur Vorbereitung auf den neuen Stoff.
1.3.1
Zustände und Operatoren
Ein Zustand eines quantenmechanischen Einteilchensystems wird durch einen Vektor |ψ⟩ ̸= 0 aus einem Hilbertraum H repräsentiert. Genauer beschreiben zwei Vektoren |ψ⟩ und c|ψ⟩, c ∈ C, c ̸= 0, denselben Zustand,
Zustände werden also durch ganze eindimensionale, komplexe Unterräume von H (Strahlen) dargestellt. Wir
werden i.A. aber nicht zwischen Hilbertraum-Vektoren und Zuständen unterscheiden.
Ein Hilbertraum ist ein Vektorraum über R oder C, für √
den ein Skalarprodukt ⟨ψ|ϕ⟩ existiert und der bezüglich
der durch dieses Skalarprodukt induzierten Norm ||ψ|| := ⟨ψ|ψ⟩ vollständig ist. Der Hilbertraum der Quantenmechanik ist genauer ein Vektorraum über C und ist zusätzlich separabel. Folgende Begriffe sind wichtig:
• Vollständigkeit: Jede Cauchy-Folge von Elementen aus H konvergiert in H. Eine Cauchy-Folge |ψn ⟩ ist
definiert durch die Bedingung ∀ ϵ > 0 : ∃ N ∈ N : ∀ m, n > N : ||(|ψm ⟩ − |ψn ⟩)|| < ϵ. Vollständigkeit
garantiert, dass Superpositionen von abzählbar vielen Vektoren aus H in H enthalten sind:
∞
∑
cn |ψn ⟩ ∈ H.
n=1
5
(1.1)
• Separabilität: Es existiert eine abzählbare Orthonormalbasis {|ϕn ⟩}. Daraus folgt, dass sich alle Vektoren
aus H als Superpositionen von abzählbar vielen Basisvektoren darstellen lassen. Tatsächlich haben wir es in
der Quantenmechanik oft mit Systemen mit überabzählbar vielen linear unabhängigen Zuständen zu tun.
Wir gehen hier nicht auf die zusätzlichen mathematischen Komplikationen ein, die solche uneigentlichen
Zustände, die formal nicht im Hilbertraum liegen, mit sich bringen. Im Zweifel stellen wir uns das System
geeignet regularisiert vor, z.B. durch Einschränkung auf ein großes, aber endliches Volumen, so dass eine
abzählbare Basis existiert.
Operatoren, genauer lineare Operatoren, sind lineare Abbildungen H 7→ H. Ein Operator A kann eindeutig durch
seine Matrixelemente ⟨ϕm |A|ϕn ⟩ bezüglich einer Orthonormalbasis {|ϕn ⟩} charakterisiert werden. Zu jedem Operator A existiert ein adjungierter Operator A† , definiert durch
⟨ψ|Aϕ⟩ ≡ ⟨ψ|A|ϕ⟩ =: ⟨ϕ|A† |ψ⟩∗ ≡ ⟨ϕ|A† ψ⟩∗ ≡ ⟨A† ψ|ϕ⟩.
(1.2)
Wichtig sind insbesondere zwei Typen von Operatoren:
• Hermitesche Operatoren A erfüllen A = A† , also ⟨ψ|Aϕ⟩ = ⟨Aψ|ϕ⟩. Er folgt ⟨ψ|A|ψ⟩ = ⟨ψ|A|ψ⟩∗ und damit
⟨ψ|A|ψ⟩ ∈ R. Observable werden in der Quantenmechanik durch hermitesche Operatoren dargestellt.
• Unitäre Operatoren U erfüllen U −1 = U † oder äquivalent U U † = U † U = 1. Es folgt
⟨U ψ|U ϕ⟩ = ⟨U † U ψ|ϕ⟩ = ⟨ψ|ϕ⟩,
(1.3)
Skalarprodukte und damit insbesondere die Norm von Vektoren sind also invariant unter unitären Operatoren. Für jeden hermiteschen Operator A ist eiA ein unitärer Operator. In der Quantenmechanik werden viele
Transformationen durch unitäre Operatoren dargestellt, z.B. Drehungen durch Drehoperatoren e−iL·nα/ℏ .
Manche Transformationen, z.B. die Zeitumkehr, lassen sich nicht durch unitäre Operatoren darstellen.
Wichtige Operatoren wie die Auf- und Absteigeoperatoren für Drehimpulse, L± = Lx ± iLy , und für den harmonischen Oszillator, b† und b, sind weder hermitesch noch unitär.
Sowohl für hermitesche als auch für unitäre Operatoren A existiert eine Orthonormalbasis von Eigenzuständen
|a⟩ ∈ H zu Eigenwerten a ∈ C, die also
A |a⟩ = a |a⟩
(1.4)
erfüllen. Diese Orthonormalbasis nennen wir die Eigenbasis von A. Eigenwerte von hermiteschen Operatoren sind
immer reell, Eigenwerte von unitären Operatoren sind komplexe Zahlen vom Betrag eins (reine Phasenfaktoren).
Nützlich sind die Eigenzustände |r⟩ des Ortsoperators r̂,
r̂ |r⟩ = r |r⟩.
(1.5)
Die Darstellung der Zustände |ψ⟩ in der von den |r⟩ gebildeten Orthonormalbasis ergibt die zugehörigen Wellenfunktionen
ψ(r) := ⟨r|ψ⟩.
(1.6)
Da die Ortseigenzustände vollständig sind, können wir schreiben
∫
dd r |r⟩⟨r| = 1
(1.7)
(d ist die Dimension des Ortsraumes). Damit können wir die Zustandsvektoren durch die zugehörige Wellenfunktion ausdrücken:
∫
∫
|ψ⟩ = dd r |r⟩⟨r|ψ⟩ = dd r ψ(r) |r⟩.
(1.8)
Auch Operatoren lassen sich in der Ortsbasis darstellen:
∫
∫
d
d ′
′
′
A = d r d r |r⟩⟨r|A|r ⟩⟨r | =: dd r dd r′ A(r, r′ ) |r⟩⟨r′ |.
6
(1.9)
Man kann jede Basis nehmen, z.B. von Eigenzuständen |k⟩ des Impulsoperators p̂, die die Gleichung
p̂ |k⟩ = ℏk |k⟩
√
erfüllen. Mit ⟨r|k⟩ = (1/ V) eik·r (V ist das d-dimensionale Volumen des Systems) folgt
∫
∫
1
⟨k|ψ⟩ =
dd r ⟨k|r⟩⟨r|ψ⟩ = dd r √ e−ik·r ψ(r)
V
(1.10)
(1.11)
Das ist offenbar die Fourier-Transformierte von ψ(r).
Mögliche Ergebnisse der Messung einer Observablen, dargestellt durch einen hermiteschen Operator A, sind
die Eigenwerte von A. Der Mittelwert der Messwerte für viele Messungen von A für denselben Anfangszustand
|ψ⟩ konvergiert gegen den Erwartungswert ⟨ψ|A|ψ⟩. Dieser
∑ ist i.A. kein Eigenwert. Der Zustand |ψ⟩ lässt sich
(natürlich) in der Eigenbasis von A darstellen: |ψ⟩ = a |a⟩⟨a|ψ⟩. Damit können wir für den Erwartungswert
schreiben
∑
∑
∑
⟨ψ|A|ψ⟩ =
⟨ψ|a′ ⟩⟨a′ | A |a⟩⟨a|ψ⟩ =
⟨ψ|a′ ⟩ a δa′ a ⟨a|ψ⟩ =
|⟨a|ψ⟩|2 a.
(1.12)
a,a′
a,a′
a
|⟨a|ψ⟩| ist die Wahrscheinlichkeit für das Auftreten des Messwertes a bei einer Einzelmessung. Nach der Messung
wissen wir, dass das System im Zustand |a⟩ ist (wir nehmen der Einfachheit halber an, dass der Eigenwert a nicht
entartet ist). Dieser scheinbar unstetige Übergang des Zustands von |ψ⟩ in |a⟩ ( Kollaps“) während der Messung
”
war und ist immer noch Gegenstand der Diskussion über die Interpretation der Quantenmechanik. Das Problem
wird teilweise durch eine quantenstatistische Beschreibung vermieden.
2
1.3.2
Dynamik
Die Zeitentwicklung eines Zustandes wird durch die Schrödinger-Gleichung
iℏ
d
|ψ⟩ = H |ψ⟩
dt
(1.13)
mit dem Hamilton-Operator (Hamiltonian) H bestimmt. H ist ein hermitescher Operator auf H. Ist H zeitunabhängig, so lautet die formale Lösung
|ψ(t)⟩ = e−iH(t−t0 )/ℏ |ψ(t0 )⟩ =: U (t, t0 ) |ψ(t0 )⟩,
(1.14)
wie man durch Einsetzen sieht. Hier ist U (t, t0 ) = e−iH(t−t0 )/ℏ der Zeitentwicklungsoperator, der offenbar unitär
ist und daher insbesondere die Norm des Zustands erhält. Für einen zeitabhängigen Hamiltonian schreibt man
|ψ(t)⟩ = U (t, t0 ) |ψ(t0 )⟩, aber der Zeitentwicklungsoperator U (t, t0 ) hat eine kompliziertere Form. Wir nehmen im
Folgenden den Hamiltonian aber als zeitunabhängig an.
Eine besonders nützliche Basis wird von den Eigenzuständen des Hamiltonians gebildet:
H |ν⟩ = Eν |ν⟩
(1.15)
(ν steht für einen geeigneten vollständigen Satz kompatibler Quantenzahlen). Das ist die zeitunabhängige
Schrödinger-Gleichung. Die Zustände |ν⟩ sind vollständig, was sich als
∑
|ν⟩⟨ν| = 1
(1.16)
ν
schreiben lässt. Die Eigenfunktionen von H sind die zu den Eigenzuständen gehörenden Wellenfunktionen,
uν (r) = ⟨r|ν⟩.
Diese erfüllen die zeitunabhängige Schrödinger-Gleichung in der allgemeinen Ortsdarstellung
∫
dd r′ H(r, r′ ) uν (r′ ) = Eν uν (r).
7
(1.17)
(1.18)
Für den Einteilchen-Hamiltonian
H=
lautet die Ortsdarstellung
p̂2
+ V (r̂)
2m
[
ℏ2 2
H(r, r ) = δ(r − r ) −
∇ + V (r)
2m
′
′
(1.19)
]
(1.20)
(der Hamiltonian ist also lokal) und die zeitunabhängige Schrödinger-Gleichung nimmt die bekannte Form
[
]
ℏ2 2
−
∇ + V (r) uν (r) = Eν uν (r)
(1.21)
2m
an. Man sollte nicht vergessen, dass die Ortsdarstellung von H nicht dasselbe ist wie der (basisunabhängige)
Operator H.
Die Darstellung eines beliebigen Zustands in der Eigenbasis lautet
∑
∑
⟨ν|ψ⟩ |ν⟩
|ν⟩⟨ν|ψ⟩ =
|ψ⟩ =
(1.22)
| {z }
ν
ν
Zahlen
und für die Wellenfunktion
ψ(r) =
∑
∑
⟨r|ν⟩⟨ν|ψ⟩ =
⟨ν|ψ⟩ uν (r).
ν
(1.23)
ν
Die Eigenzustände ändern sich mit der Zeit nur in ihrer Phase,
(t−t0 )/ℏ
|ν(t)⟩ = e−iH(t−t0 )/ℏ |ν(t0 )⟩ = e|−iEν{z
} |ν(t0 )⟩,
(1.24)
Zahlenfunktionen
so dass sich die Form der Wellenfunktion nicht ändert,
(t−t0 )/ℏ
uν (r, t) = |e−iEν{z
} uν (r, t0 ).
unabhägig von r
8
(1.25)
Kapitel 2
Identische Teilchen und zweite
Quantisierung
In diesem Kapitel geht es um Systeme aus mehreren Teilchen. Wir wiederholen den zentralen Begriff identischer
Teilchen. Es wird sich herausstellen, dass eine Beschreibung von Systemen mit mehreren identischen Teilchen im
bisherigen Hilbertraum-Bild möglich aber unpraktisch ist, sofern die Teilchenzahl erhalten ist. Die Erzeugung und
Vernichtung von Teilchen kann in diesem Bild gar nicht beschrieben werden. Der Ausweg ist der Formalismus der
zweiten Quantisierung.
2.1
Unterscheidbare Teilchen
Zwei Teilchen nennen wir unterscheidbar, wenn wir sie im Prinzip experimentell eindeutig unterscheiden können.
Das bedeutet, dass sie bezüglich mindestens einer erhaltenen Messgröße unterschiedliche Messwerte liefern müssen,
z.B. können sie unterschiedliche Ladung oder Ruhemasse oder unterschiedlichen Spin haben. Unterscheidbare
Teilchen tragen gewissermaßen ein Etikett. Wir können z.B. eindeutig sagen, dass Teilchen 1 auf Detektor A
trifft und Teilchen 2 auf Detektor B; das ist eine andere Aussage als die, dass Teilchen 2 auf Detektor A trifft
und Teilchen 1 auf Detektor B. N > 2 nennen wir unterscheidbar, wenn sie paarweise unterscheidbar sind. Wir
betrachten zunächst nur unterscheidbare Teilchen.
2.1.1
N -Teilchen-Hilbertraum
Für mehr als ein Teilchen brauchen wir eine zusätzliche Annahme darüber, wie wir Zustände des Gesamtsystems
beschreiben wollen. Die formale Frage lautet: Was ist der Zustandsraum für mehrere Teilchen? Eine naheliegende
Antwort ist folgende: Für zwei unterscheidbare Teilchen ist der Hilbertraum das direkte Produkt der Hilberträume
der einzelnen Teilchen,
H2 = HTeilchen 1 ⊗ HTeilchen 2 .
(2.1)
Diese Gleichung drückt aus, dass jedes der beiden Teilchen in jedem Einteilchenzustand sein kann, ganz gleich
in welchem Zustand sich das andere Teilchen befindet. Jedes der Teilchen hat einen vollständigen EinteilchenHilbertraum zur Verfügung. Wir brauchen für jedes Teilchen einen vollständigen Satz kompatibler EinteilchenQuantenzahlen, um den Vielteilchenzustand eindeutig zu beschreiben. Das bedeutet nicht, dass die Zustände der
beiden Teilchen unkorreliert sind.
Wollen wir z.B. nur die Bewegung der Teilchen im d-dimensionalen Raum beschreiben, so sind die beiden
Einteilchen-Hilberträume identisch (obwohl die Teilchen nicht identisch sind) und wir haben speziell H2 = H ⊗ H.
Die Verallgemeinerung auf N Teilchen lautet offenbar
HN = H ⊗ . . . ⊗ H ≡ H⊗N .
|
{z
}
N -mal
Man kann zeigen, dass der Raum HN ein separabler Hilbertraum über C ist.
9
(2.2)
Ausgehend von einer beliebigen Basis {|ν⟩} des Einteilchen-Hilbertraums H können wir eine Basis des
Vielteilchen-Hilbertraums HN konstruieren, nämlich die Produktbasis bestehend aus den Vektoren
|ν1 , ν2 , . . . , νN ⟩ := |ν1 ⟩|ν2 ⟩ · · · |νN ⟩.
ν1 , . . . , νN sind vollständige Sätze von kompatiblen Einteilchen-Quantenzahlen für die Teilchen 1, . . . , N .
Bezüglich dieser Produktbasis können wir die Zustände aus HN zerlegen:
∑
∑
|ψ⟩ =
|ν1 , . . . , νN ⟩⟨ν1 , . . . , νN |ψ⟩ =
⟨ν1 , . . . , νN |ψ⟩ |ν1 , . . . , νN ⟩.
ν1 ,...,νN
(2.3)
(2.4)
ν1 ,...,νN
Wir definieren auch allgemeine Produktzustände: Falls sich die Koeffizienten in der Form
(N )
⟨ν1 , . . . , νN |ψ⟩ = c(1)
ν1 · · · cνN
(2.5)
(n)
mit cνn ∈ C schreiben lassen, so folgt
|ψ⟩ =
∑
c(1)
ν1 |ν1 ⟩ · · ·
ν1
∑
)
c(N
νN |νN ⟩.
(2.6)
νN
∑
(n)
Also ist |ψ⟩ ein Produkt von Einteilchenzuständen |ψn ⟩ =
νn cνn |νn ⟩ und wir nennen |ψ⟩ separabel oder
einen Produktzustand.
Ist |ψ⟩ nicht separabel, so nennen wir |ψ⟩ verschränkt. Für zwei Spins 1/2 ist z.B. |ψ⟩ =
√
(|↑⟩|↓⟩ − |↓⟩|↑⟩)/ 2 ein verschränkter Zustand.
Wir müssen auch ein Skalarprodukt auf HN definieren. Die Standarddefinition für Produktvektorräume ergibt
für Elemente der Produktbasis
N
∏
′
⟨ν1 , . . . , νN |ν1′ , . . . , νN
⟩ :=
⟨νn |νn′ ⟩.
(2.7)
n=1
Dies legt das Skalarprodukt für beliebige Elemente von HN eindeutig fest. Die Definition ist physikalisch plausibel,
da verschiedene unterscheidbare Teilchen nicht interferieren.
Speziell können wir die Ortsbasis von HN einführen:
|r1 ⟩ |r2 ⟩ |r3 ⟩ · · · |rN ⟩ =: |r1 , r2 , . . . , rN ⟩ ∈ HN .
|{z} |{z} ...
im
(2.8)
im
1. H
2. H
Die zum Zustand |ψ⟩ gehörende Vielteilchen-Wellenfunktion ist seine Darstellung bezüglich dieser Basis:
ψ(r1 , r2 , . . . , rN ) := ⟨r1 , r2 , . . . , rN |ψ⟩.
(2.9)
|ψ(r1 , r2 , . . . , rN )|2 dd r1 · · · dd rN
(2.10)
Dann ist
d
d
die Wahrscheinlichkeit, Teilchen 1 in d r1 um r1 , Teilchen 2 in d r2 um r2 usw. zu finden.
Wenn wir die Einteilchen-Wellenfunktionen der Zustände |ν⟩ mit uν (r) := ⟨r|ν⟩ bezeichnen, dann lautet die
Vielteilchen-Wellenfunktion
ψ(r1 , r2 , . . . , rN )
⟨r1 , r2 , . . . , rN |ψ⟩
∑
= ⟨r1 , r2 , . . . , rN |
|ν1 , ν2 , . . . , νN ⟩⟨ν1 , ν2 , . . . , νN |ψ⟩
=
=
∑
ν1 ,...,νN
⟨r1 |ν1 ⟩⟨r2 |ν2 ⟩ · · · ⟨rN |νN ⟩ ⟨ν1 , ν2 , . . . , νN |ψ⟩
ν1 ,...,νN
=
∑
ν1 ,...,νN
⟨ν1 , ν2 , . . . , νN |ψ⟩ uν1 (r1 ) uν2 (r2 ) · · · uνN (rN ).
|
{z
}
(2.11)
Zahlen
Hier haben wir die Definition (2.7) des Skalarproduktes in HN verwendet.
Abschließend sei betont, dass die Wahl des Produktraums mit dem Standardskalarprodukt als Zustandsraum
HN für N Teilchen nicht aus der Einteilchen-Quantenmechanik folgt (und folgen kann). Vielmehr hat die Definition
von HN den Charakter eines weiteren Postulats, das sich im Vergleich mit Experimenten bewähren muss.
10
2.1.2
Observable
Observable sollten weiterhin durch hermitesche Operatoren darstellt werden, aber nun durch Operatoren auf HN .
(n)
Wir betrachten zunächst Observable AN , die sich nur auf ein Teilchen n beziehen, etwa seinen Ort oder Impuls.
(n)
Der Subskript N soll andeuten, dass AN auf HN definiert ist. Falls sich die Teilchen in einem Produktzustand
(n)
befinden, sollten Messungen von AN an irgendeinem Teilchen nicht von den Zuständen der übrigen beeinflusst
(n)
werden. Dies erfordert für die Matrixelemente von AN bezüglich einer Produktbasis
′
⟨ν1 , ν2 , . . . , νN | AN |ν1′ , ν2′ , . . . , νN
⟩
(n)
′
′
′
= ⟨ν1 |ν1′ ⟩ · · · ⟨νn−1 |νn−1
⟩⟨νn | A(n) |νn′ ⟩ ⟨νn+1 |νn+1
⟩ · · · ⟨νN |νN
⟩
′
′
⟨νn | A(n) |νn′ ⟩ δνn+1 νn+1
· · · δνN νN′ ,
= δν1 ν1′ · · · δνn−1 νn−1
(2.12)
wobei A(n) der zur Observablen gehörende Operator auf dem Einteilchen-Hilbertraum von Teilchen n ist. Durch
diese Matrixelemente ist der Operator aber eindeutig festgelegt,
(n)
AN = 1(1) ⊗ · · · ⊗ 1(n−1) ⊗ A(n) ⊗ 1(n+1) ⊗ · · · ⊗ 1(N ) ,
(2.13)
wobei 1(n) der identische Operator auf dem Einteilchen-Hilbertraum von Teilchen n ist. Damit ist die Wirkung
(n)
von AN auf beliebige Zustände, nicht nur Produktzustände, festgelegt. Es ist üblich, wenn auch ungenau, die
(n)
Operatoren AN und A(n) miteinander zu identifizieren. Wir werden daher i.A. den Subskript N weglassen. Aus
(n′ )
(n)
der Darstellung folgt sofort, dass Observable zu unterschiedlichen Teilchen kommutieren, [AN , BN ] = 0 für
n ̸= n′ .
Observable, die sich auf mehr als ein Teilchen beziehen, müssen entsprechend durch hermitesche Operatoren
repräsentiert werden, die in mindestens zwei Faktorräumen vom identischen Operator verschieden sind. Weiter
gibt es keine prinzipiellen Einschränkungen. Als Beispiel betrachten wir die Coulomb-Energie von zwei Teilchen
n < n′ mit den Ladungen q und q ′ . Der entsprechende Operator ist
∫
qq ′
1
(n,n′ )
VC
=
d3 sn d3 sn′
4πϵ0
|sn − sn′ |
′
′
× 1(1) ⊗ · · · ⊗ 1(n−1) ⊗ |sn ⟩⟨sn | ⊗ 1(n+1) ⊗ · · · ⊗ 1(n −1) ⊗ |sn′ ⟩⟨sn′ | ⊗ 1(n +1) ⊗ · · · ⊗ 1(N ) . (2.14)
Wie im Fall von Einteilchenoperatoren ist es offensichtlich vorteilhaft, die Identitäten zu unterdrücken. Daher
schreiben wir
∫
qq ′
1
(n,n′ )
VC
=
d3 sn d3 sn′
|sn ⟩⟨sn | ⊗ |sn′ ⟩⟨sn′ |.
(2.15)
4πϵ0
|sn − sn′ |
Um zu zeigen, dass dieser Operator vernünftige Ergebnisse liefert, betrachten wir seinen Erwartungswert in einem
Produktzustand. Wir betrachten nur zwei Teilchen n = 1, n′ = 2, die Zustände der übrigen spielen ja keine Rolle.
Den Produktzustand schreiben wir in der Ortsbasis als
∫
|ψ1 ⟩|ψ2 ⟩ = d3 r1 d3 r2 ψ1 (r1 ) ψ2 (r2 ) |r1 ⟩|r2 ⟩.
(2.16)
Dann lautet der Erwartungswert
∫
qq ′
ψ ∗ (r2 ) ψ1∗ (r1 ) ψ1 (r′1 ) ψ2 (r′2 )
|ψ1 ⟩|ψ2 ⟩ =
d3 r1 d3 r2 d3 s1 d3 s2 d3 r1′ d3 r2′ 2
4πϵ0
|s1 − s2 |
(
) ′ ′
× ⟨r2 |⟨r1 | |s1 ⟩⟨s1 | ⊗ |s2 ⟩⟨s2 | |r1 ⟩|r2 ⟩
∫
ψ ∗ (r2 ) ψ1∗ (r1 ) ψ1 (r′1 ) ψ2 (r′2 )
qq ′
d3 r1 d3 r2 d3 s1 d3 s2 d3 r1′ d3 r2′ 2
⟨r1 |s1 ⟩⟨s1 |r′1 ⟩⟨r2 |s2 ⟩⟨s2 |r′2 ⟩
=
4πϵ0
|s1 − s2 |
∫
qq ′
|ψ1 (r1 )|2 |ψ2 (r2 )|2
=
,
(2.17)
d3 r1 d3 r2
4πϵ0
|r1 − r2 |
(1,2)
⟨ψ2 |⟨ψ1 | VC
wobei wir mehrfach die Orthonormalitätsrelation
⟨r|r′ ⟩ = δ(r − r′ )
11
(2.18)
für Ortseigenzustände verwendet haben. Das Ergebnis für Produktzustände ist jedenfalls das erwartete CoulombGesetz, was zeigt, dass der klassische Grenzfall korrekt ist. Für verschränkte Zustände ergibt sich dagegen kein
klassisch verständliches Ergebnis.
2.1.3
Dynamik
Solange die N Teilchen nicht wechselwirken, sollte die Dynamik eines Teilchens von allen anderen unabhängig
sein. Falls sich die Teilchen in einem Produktzustand |ψ⟩ = |ψ1 ⟩|ψ2 ⟩ · · · |ψN ⟩ befinden, sollte für jedes Teilchen
n = 1, . . . , N die Einteilchen-Schrödinger-Gleichung
iℏ
d
|ψn ⟩ = H (n) |ψn ⟩
dt
(2.19)
mit dem Hamiltonian H (n) gelten. Wie sieht dann der Hamiltonian H des N -Teilchen-Systems aus? H ist ein
Operator auf HN , der im Faktorraum zu Teilchen n wie H (n) wirkt. Aber H (n) hat keine Wirkung auf die anderen
Teilchen. Die Antwort lautet formal
H=
N
∑
1(1) ⊗ · · · ⊗ 1(n−1) ⊗ H (n) ⊗ 1(n+1) ⊗ · · · ⊗ 1(N ) .
(2.20)
n=1
Jeder Term in der Summe hat wieder die Form einer Einteilchenobservablen, die auf den gesamten N -TeilchenHilbertraum trivial ausgedehnt wurde. Wie im vorigen Abschnitt ist es üblich, den Operator H (n) auf H stillschweigend mit dem Operator 1(1) ⊗ · · · ⊗ 1(n−1) ⊗ H (n) ⊗ 1(n+1) ⊗ · · · ⊗ 1(N ) auf HN zu identifizieren und einfach
zu schreiben
N
∑
H=
H (n) .
(2.21)
n=1
Für Produktzustände |ψ⟩ ist die Schrödinger-Gleichung
iℏ
d
|ψ⟩ = H |ψ⟩
dt
(2.22)
äquivalent zu den N Gleichungen (2.19).
Beweis: 1. ( ⇒“) Unter der Voraussetzung von (2.19) gilt
”
d
d
iℏ |ψ⟩ = iℏ |ψ1 ⟩|ψ2 ⟩ · · · |ψN ⟩
dt
dt
∑
d
=
|ψ1 ⟩ · · · |ψn−1 ⟩ (iℏ |ψn ⟩) |ψn+1 ⟩ · · · |ψN ⟩
dt
n
∑
=
|ψ1 ⟩ · · · |ψn−1 ⟩ (H (n) |ψn ⟩) |ψn+1 ⟩ · · · |ψN ⟩
n
=
∑
H (n) |ψ1 ⟩|ψ2 ⟩ · · · |ψN ⟩ = H |ψ⟩.
(2.23)
n
2. ( ⇐“) Aus (2.22) folgt
”
[
]
i ∑ (n)
|ψ(t)⟩ = e−iH (t−t0 )/ℏ |ψ(t0 )⟩ = exp −
H (t − t0 ) |ψ1 (t0 )⟩ · · · |ψN (t0 )⟩.
ℏ n
Nun kommutieren H (m) und H (n) für m ̸= n miteinander und daher ist
[
]
]
∏
∏[
(n)
i
exp − H (n) (t − t0 ) |ψ1 (t0 )⟩ · · · |ψN (t0 )⟩ =
e−iH (t−t0 )/ℏ , |ψn (t0 )⟩ .
|ψ(t)⟩ =
ℏ
n
n
Wir können also |ψ(t)⟩ schreiben als
|ψ(t)⟩ = |ψ1 (t)⟩ · · · |ψN (t)⟩
12
(2.24)
(2.25)
(2.26)
mit
|ψn (t)⟩ = e−iH
(n)
(t−t0 )/ℏ
|ψn (t0 )⟩,
(2.27)
was äquivalent zu Gl. (2.19) ist.
Allgemeine, nicht unbedingt separable, Zustände |ψ⟩ können wir nach einer Produktbasis {|ν1 ⟩|ν2 ⟩ · · · |νN ⟩}
entwickeln. Die Zeitentwicklung jedes Einteilchenzustands |νn ⟩ ist durch (2.19) bestimmt, so dass auch die Zeitentwicklung von |ψ⟩ eindeutig bestimmt ist. Wird sie allgemein durch die Vielteilchen-Schrödinger-Gleichung
(2.22) korrekt beschrieben? Ja, denn sonst ließe sich in der Entwicklung nach der Produktbasis zumindest ein
(Produkt-) Zustand finden, der (2.22) nicht erfüllt. Wir hatten aber gezeigt, dass (2.22) für Produktzustände aus
(2.19) folgt. Es ergibt sich ein Widerspruch.
Bisher haben wir wechselwirkungsfreie Teilchen betrachtet. Jetzt nehmen wir eine Wechselwirkung hinzu.
der übrigen abhängt.
Mit Wechselwirkung“ meinen wir, dass die Dynamik eines Teilchens von den Zuständen
∑
”
(n)
Der Hamiltonian für ein wechselwirkendes System muss von der Form H =
H
abweichen,
denn diese
n
ist, wie eben gezeigt, äquivalent zu unabhängiger Dynamik der einzelnen Teilchen. Der Hamiltonian für ein
wechselwirkendes N -Teilchen-System hat also allgemein die Form
H=
N
∑
(n)
H0
+ V,
(2.28)
n=1
wobei V ̸= 0 ein hermitescher Operator auf HN ist, der in mehr als einem Faktorraum (generisch in allen
Faktorräumen) vom identischen Operator verschieden ist.
Als Beispiel nehmen wir die Coulomb-Wechselwirkung. Gemäß (2.15) lautet die Coulomb-Energie von N
Teilchen gleicher Ladung q,
∫
∑ (n,n′ )
1
q2 ∑
d3 sn d3 sn′
|sn ⟩⟨sn | ⊗ |sn′ ⟩⟨sn′ |
VC =
VC
=
4πϵ
|s
−
sn ′ |
0
n
n<n′
n<n′
∫
1
1 q2 ∑
d3 sn d3 sn′
=
|sn ⟩⟨sn | ⊗ |sn′ ⟩⟨sn′ |.
(2.29)
2 4πϵ0
|s
−
sn ′ |
n
′
n̸=n
Die Beschränkung auf n < n′ bzw. der Faktor 1/2 verhindern Doppelzählung. Mehrteilchensysteme mit Wechselwirkung lassen sich nur in sehr einfachen Fällen exakt lösen.
2.2
Identische Teilchen
Bei der Diskussion der Quantenmechanik für Mehrteilchensysteme sind wir nicht auf Hinweise dafür gestoßen,
dass diese Beschreibung unvollständig sein könnte. Es sei aber daran erinnert, dass die Konstruktion des N Teilchen-Zustandsraums Postulatcharakter hat und daher einer experimentellen Überprüfung bedarf. Und dabei
zeigen sich Schwierigkeiten:
• Die Spektren von Atomen und Ionen mit mehreren Elektronen lassen sich nur unter der Annahme verstehen, dass zwei Elektronen nicht in allen Quantenzahlen übereinstimmen können (Pauli-Prinzip), wobei
eine zusätzliche zweiwertige Quantenzahl (der Spin) auftritt. Ein solches Verbot folgt nicht aus der bisher
entwickelten Theorie.
• Elektronen in Metallen tragen für hinreichend niedrige Temperaturen (typischerweise bis oberhalb von Zimmertemperatur!) vernachlässigbar zur spezifischen Wärme bei. Das ist nicht zu verstehen, wenn Elektronen
unterscheidbare Teilchen im Sinne des vorigen Abschnitts sind.
• Das Phänomen der Bose-Einstein-Kondensation, z.B. in kalten Gasen, lässt sich mit der bisherigen Theorie
nicht verstehen.
Die Probleme treten auf, wenn mehrere Teilchen derselben Art vorhanden sind. Das ist ein Hinweis darauf, dass
wir die Annahme der Unterscheidbarkeit hinterfragen müssen.
13
In Umkehrung der Definition unterscheidbarer Teilchen nennen wir zwei Teilchen identisch, wenn wir sie experimentell aus Prinzip nicht eindeutig unterscheiden können. Das bedeutet, dass die Teilchen in allen invarianten
Eigenschaften übereinstimmen. Invariante Eigenschaften sind solche, die sich nicht zeitlich ändern. Also sind Ort
und Impuls eines Teilchens sicher keine invarianten Eigenschaften. Ruhemasse, Ladung und Spin sind es hingegen. Dies zeigt aber, dass die Ununterscheidbarkeit von Teilchen nicht unabhängig von der experimentellen
Situation ist: Zwei Atomkerne desselben Nuklids im Grundzustand sind ununterscheidbar. Wenn wir aber mit
Gammastrahlung hinreichend hoher Energie einen der Kerne anregen, so dass er z.B. einen anderen Kernspin
erhält, werden sie unterscheidbar. Elementare Teilchen wie Elektronen sind dagegen ununterscheidbar, solange
sie überhaupt existieren.
Man kann bei einem Streuexperiment mit zwei Elektronen aus Prinzip nicht entscheiden, welches herauskommende Elektron welchem ursprünglichen entspricht.
e−
e−
e−
e−
Das ist ähnlich zum Doppelspaltexperiment. Dort ergibt sich die elektronische Wellenfunktion hinter dem
Doppelspalt durch die Interferenz der von den beiden Spalten ausgehenden Wellen. Das gilt aber nur, wenn wir
nicht messen, durch welchen Spalt die Elektronen fliegen. Also: Wenn wir nicht zwischen den beiden Wegen
unterscheiden (obwohl wir es hier könnten), ist die Lösung der Schrödinger-Gleichung die Superposition der
Lösungen für die beiden Wege.
Per Analogieschluss vermuten wir, dass die Lösung für die Streuung zweier Elektronen aneinander, in welchem
Fall wir gar nicht zwischen den beiden Wegen“ unterscheiden können, ebenfalls die Superposition der beiden
”
Möglichkeiten ist:
e−
e−
=
e−
+
−
e−
Welche Konsequenzen hat die Ununterscheidbarkeit für die Wellenfunktion? Der Zustand muss gleich bleiben,
wenn zwei Teilchen vertauscht werden. Die Wellenfunktion darf sich dabei also nur um einen Zahlenfaktor λ ∈ C
ändern:
ψ(r1 , . . . , rk , . . . , rj , . . . , rN ) = λ ψ(r1 , . . . , rj , . . . , rk , . . . , rN ).
(2.30)
j
k
Zweimalige Vertauschung ist, zumindest in drei (oder mehr) Raumdimensionen, die Identitätsoperation, also gilt
ψ(r1 , . . . , rj , . . . , rk , . . . , rN )
=
j
λ2 ψ(r1 , . . . , rj , . . . , rk , . . . , rN ).
k
14
(2.31)
Damit ergeben sich
λ2 = 1
⇒
λ = ±1
(2.32)
als einzige Möglichkeiten. Die N -Teilchen-Wellenfunktion muss demnach entweder symmetrisch in allen Paaren
von Argumenten (total symmetrisch) oder antisymmetrisch in allen Paaren von Argumenten (total antisymmetrisch) sein. Für λ = +1 (symmetrischer Fall) nennen wir die Teilchen Bosonen, für λ = −1 (antisymmetrischer
Fall) Fermionen. In zwei Raumdimensionen gilt das übrigens nicht: Hier bewegt sich bei der zweimaligen Vertauschung jedes Teilchen genau einmal um das andere herum. In zwei Dimensionen kann man die Bahnen, die
die beiden Teilchen beschreiben, nicht stetig so verformen, dass sie nicht mehr umeinander herum laufen. Dazu
müsste man eine Bahn durch das andere Teilchen hindurch schieben, was eine qualitative Änderung der Bahnen
darstellt. Daher ist in zwei Dimensionen die Anzahl der zweifachen Vertauschungen eine topologische Invariante
– sie kann durch stetige Verformung der Bahnen nicht geändert werden. Das ist in drei (und mehr) Dimensionen
anders, hier kann man die Bahnen immer zu einem Punkt zusammenziehen. Daher muss in zwei Dimensionen
der Zustand, der durch zweifache Vertauschung entsteht, nicht mit dem ursprünglichen Zustand identisch sein.
Dann folgt, dass λ zwar aufgrund der Normiertheit der Zustände den Betrag eins haben muss, aber eine beliebige
Phase haben kann. Man spricht von Anyonen.
In einer Dimension kann man ebenfalls keine Einschränkungen an den Faktor λ herleiten, außer die aus
der Normiertheit folgende Bedingung |λ| = 1. In einer Dimension müssen sich Teilchen bei der Vertauschung
mindestens einmal an demselben Ort befinden, man kann daher keine topologischen Argumente anwenden.
Das wichtige Spin-Statistik-Theorem, das wir hier nicht beweisen, zeigt, dass die Symmetrie oder Antisymmetrie der Wellenfunktion in drei Raumdimensionen mit dem Spin der Teilchen zusammenhängt:
• Bosonen: λ = +1, ganzzahliger Spin S = 0, 1, 2, . . .,
• Fermionen: λ = −1, halbzahliger Spin: S = 21 , 32 , 52 , . . .
Lorentz-Invarianz ist eine der Voraussetzungen des Spin-Statistik-Theorems, es kann schon deshalb nicht im
Rahmen der bisher entwickelten nicht relativistischen Quantenmechanik bewiesen werden.
Elementare Materieteilchen sind Fermionen: Quarks und Leptonen. Elementare Bosonen vermitteln Wechselwirkungen (Photonen, W ± und Z 0 , Gluonen, hypothetische Gravitonen) und treten als Anregungen des HiggsFeldes auf, dass im Zusammenhang mit den Teilchenmassen postuliert wurde. Zusammengesetzte Materieteilchen
können Fermionen (z.B. Baryonen) oder Bosonen (z.B. Mesonen) sein. Effektive Anregungen in kondensierter
Materie haben oft, aber nicht immer, bosonischen Charakter (Phononen, Magnonen).
2.2.1
Symmetrisierte und antisymmetrisierte Zustände
Die oben gefundene Darstellung
ψ(r1 , r2 , . . . , rN ) =
∑
⟨ν1 , ν2 , . . . , νN |ψ⟩ uν1 (r1 ) · · · uνN (rN )
(2.33)
ν1 ,...,νN
ist für identische Teilchen problematisch. Diese Wellenfunktion erfüllt i.A. weder die fermionische noch die bosonische Relation für Vertauschungen der rj . Diese Relationen führen auf Nebenbedingungen für die Koeffizienten
⟨ν1 , ν2 , . . . νN |ψ⟩. Es ist wünschenswert, diese Bedingungen gleich in die Basis einzubauen. Das kann man durch
(Anti-) Symmetrisierung erreichen: Wir definieren
uν1 (r1 ) uν1 (r2 ) · · · uν1 (rN ) uν2 (r1 ) uν2 (r2 ) · · · uν2 (rN ) 1
Ŝ± uν1 (r1 ) · · · uνN (rN ) := √
(2.34)
,
..
..
..
..
N ! n1 ! · · · nN ! .
.
.
.
uν (r1 ) uν (r2 ) · · · uν (rN ) N
N
N
±
wobei (N ! n1 ! · · · nN !)−1/2 ein Normierungsfaktor (dazu gleich mehr) und | . . . |− die Determinante ist:
∑
1
sgn(p) uν1 (rp1 ) · · · uνN (rpN ),
Ŝ− uν1 (r1 ) · · · uνN (rN ) = √
N ! n1 ! · · · nN ! p∈S
N
15
(2.35)
wobei SN die Gruppe aller Permutationen (p1 , p2 , . . . , pN ) der N Elemente (1, 2, . . . , N ) ist (die sogenannte
Symmetrische Gruppe) und sgn(p) das Vorzeichen der Permutation p. [Beispiel: sgn(2, 1, 3) = −1, da eine Vertauschung nötig ist und eins ungerade ist. Man schreibt auch (−1)p .] Der Ausdruck in Gl. (2.35) heißt SlaterDeterminante. Die Determinante einer Matrix ist bekanntlich antisymmetrisch unter Vertauschung zweier Spalten
der Matrix, wie auch Gl. (2.35) zeigt. Daher ist die Funktion Ŝ− uν1 (r1 ) · · · uνN (rN ) total antisymmetrisch. Das
untere Vorzeichen (−) ist demnach für Fermionen zu wählen.
Wir sehen sofort, dass für zwei Fermionen in gleichen Einteilchenzuständen, z.B. νj = νk , die j-te und kte Zeile der Determinante gleich sind. Die Zeilen sind also linear abhängig. Die Determinante verschwindet in
diesem Fall, |. . .|− = 0. Null ist aber kein Zustand. Es gibt also keine Zustände mit νj = νk für j ̸= k. Das ist die
übliche Formulierung des Pauli-Prinzips. Sie folgt also aus der fundamentaleren Bedingung der Antisymmetrie
der Wellenfunktion.
Weiterhin erkennen wir, dass für zwei Fermionen am gleichen Ort, z.B. rj = rk , die j-te und k-te Spalte der
Determinante gleich sind. Also finden wir, dass sich zwei Fermionen nicht an demselben Ort befinden können,
unabhängig von ihren Zuständen.
Andererseits ist |. . .|+ die sogenannte Permanente:
∑
1
Ŝ+ uν1 (r1 ) · · · uνN (rN ) = √
uν1 (rp1 ) · · · uνN (rpN ),
N ! n1 ! · · · nN ! p∈S
(2.36)
N
d.h. die vorzeichenlose Determinante“. Die Gleichung zeigt, dass die Funktion Ŝ+ uν1 (r1 ) · · · uνN (rN ) total sym”
metrisch ist. Sie gilt also für Bosonen.
Wir haben die (anti-) symmetrisierten Zustände in der Ortsdarstellung eingeführt, da die Bedeutung von
Symmetrie bzw. Antisymmetrie unter Vertauschung hier am anschaulichsten ist. Die Argumente übertragen sich
aber praktisch unverändert auf beliebige Einteilchenbasen: Zunächst muss für jeden Zustand |ψ⟩ identischer
Teilchen gelten
⟨ν1 , . . . , νk , . . . , νj , . . . , νN |ψ⟩ = λ ⟨ν1 , . . . , νj , . . . , νk , . . . , νN |ψ⟩
(2.37)
und daher λ2 = 1. Zu einer beliebigen Einteilchenbasis {|ν⟩} definieren wir
Basiszustände
|ν1 ⟩(1) |ν1 ⟩(2)
|ν2 ⟩(1) |ν2 ⟩(2)
1
Ŝ± |ν1 , ν2 , . . . , νN ⟩ := √
..
..
N ! n1 ! · · · nN ! .
.
|νN ⟩(1) |νN ⟩(2)
(anti-) symmetrisierte (N -Teilchen-)
···
···
..
.
|ν1 ⟩(N )
|ν2 ⟩(N )
..
.
···
|νN ⟩(N )
,
(2.38)
±
wobei hier der Superskript (j) die Teilchen numeriert. Dieser Superskript ist redundant, wenn wir die Reihenfolge
der Faktoren in |νp1 ⟩|νp2 ⟩ · · · |νpN ⟩ nicht verändern.
Wir begründen jetzt den Normierungsfaktor (N ! n1 ! · · · nN !)−1/2 der (anti-) symmetrisierten Zustände. Hier
ist nν die Besetzungszahl des Einteilchenzustands |ν⟩, d.h., nν gibt an, wie oft ν in {ν1 , ν2 , . . .}√vorkommt. Für
Fermionen kann das natürlich nur gar nicht oder einmal sein, so dass sich der Vorfaktor zu 1/ N ! vereinfacht.
Es sei daran erinnert, dass νi für einen vollständigen Satz von kompatiblen Einteilchenquantenzahlen steht. Falls
keine zwei νi übereinstimmen (erzwungen für Fermionen), ist die Determinante bzw. Permanente in (2.38) eine
Superposition√von N ! orthonormalen Zustandsvektoren. Daher ergibt sich für diesen Fall sofort ein Normierungsfaktor von 1/ N !.
Jedoch können für Bosonen Quantenzahlen mehrfach vorkommen. Die Vertauschung von Teilchen mit identischen Quantenzahlen lässt den Zustandsvektor aber unverändert. Kommt νi z.B. ni -mal vor, so bilden die Terme
in der Permanente Gruppen von ni ! identischen Vektoren, die durch solche Vertauschungen verknüpft sind. Diese
werden alle mit positivem Vorzeichen addiert. Also besteht die Permanente aus N !/(n1 ! · · · nN !) orthogonalen
Vektoren der Länge n1 ! · · · nN !. Deren Summe hat die Norm
√
√
N!
(n1 ! · · · nN !)2 = N ! n1 ! · · · nN !,
(2.39)
n1 ! · · · nN !
was den Normierungsfaktor erklärt.
16
Da die (Anti-) Symmetrisierung eines (anti-) symmetrischen Zustands diesen nicht ändert, kann sich
2
Ŝ±
|ν1 , ν2 , . . . , νN ⟩ von Ŝ± |ν1 , ν2 , . . . , νN ⟩ nur durch einen Zahlenfaktor unterscheiden. Man prüft leicht nach, dass
dieser gleich eins ist. Da diese Eigenschaft für alle Basisvektoren |ν1 , ν2 , . . . , νN ⟩ gilt, folgt sie für alle |ψ⟩ ∈ HN .
Also sind die Operatoren Ŝ+ , Ŝ− idempotent:
2
Ŝ±
= Ŝ± .
(2.40)
Man prüft auch leicht nach, dass Ŝ± hermitesch sind. Damit sind Ŝ± Projektionsoperatoren.
Da für N ≥ 2 ein nicht verschwindender Vektor nicht zugleich total symmetrisch und total antisymmetrisch
sein kann, gilt
Ŝ+ Ŝ− = Ŝ− Ŝ+ = 0,
(2.41)
die beiden Operatoren projizieren also auf orthogonale Unterräume. Dabei ist Ŝ+ HN (Ŝ− HN ) der Unterraum
der total symmetrischen (antisymmetrischen) Zustände, d.h. der für identische Bosonen (Fermionen) möglichen
Zustände. Hat der Einteilchen-Hilbertraum H endliche Dimension d, so sind die Dimensionen der VielteilchenHilberträume (wir geben auch die entsprechende kombinatorische Problemstellung an):
• dim(HN ) = dN (N unterscheidbare Kugeln in d Urnen),
(
)
N +d−1
• dim(Ŝ+ HN ) =
(N ununterscheidbare Kugeln in d Urnen),
N
( )
d
• dim(Ŝ− HN ) =
(N ununterscheidbare Kugeln in d Urnen, wobei jede Urne höchstens eine Kugel
N
enthalten kann).
Für N = 2 gilt
(
) ( )
d+1
d
(d + 1)!
d!
d(d + 1) + d(d − 1)
+
=
+
=
= d2 = dim(H2 ),
2
2
2(d − 1)! 2(d − 2)!
2
(2.42)
daher spannen Ŝ+ H2 und Ŝ− H2 den gesamten Raum H2 auf. Für N ≥ 3 gilt das nicht, z.B. ist
dim(Ŝ+ H2 ) + dim(Ŝ− H2 ) =
dim(Ŝ+ H3 ) + dim(Ŝ− H3 ) =
d3
2d
+
< d3 = dim(H3 ).
3
3
(2.43)
Für große Teilchenzahlen N wird HN exponentiell größer (hinsichtlich der Dimension) als Ŝ+ HN und dieser als
Ŝ− HN .
Wir können jetzt nach den (anti-) symmetrisierten Basiszuständen entwickeln:
∑
|ψ⟩ =
Cν1 ,...,νN Ŝ± |ν1 , . . . , νN ⟩.
(2.44)
ν1 ,...,νN
In Ortsdarstellung erhalten wir entsprechend
ψ(r1 , r2 , . . . , rN ) =
∑
Cν1 ,...,νN Ŝ± uν1 (r1 ) · · · uνN (rN ).
(2.45)
ν1 ,...,νN
Pauli-Prinzip
Wir kommen nochmals auf das Pauli-Prinzip zurück und betrachten speziell Spin-1/2-Teilchen, z.B. Elektronen.
Ihr Einteilchen-Hilbertraum lässt sich als Produkt
H = HOrt ⊗ HSpin
(2.46)
schreiben, wobei HOrt den Ort des Teilchens und HSpin seinen Spin betrifft.
HSpin = span(|↑⟩, |↓⟩)
17
(2.47)
ist für den Spin 1/2 zweidimensional. Ist {|ν⟩} eine Einteilchenbasis von HOrt , so ist die Produktbasis
{|ν, ↑⟩, |ν, ↓⟩}
(2.48)
eine Einteilchenbasis von H. Den räumlichen Anteil können wir in der Ortsdarstellung schreiben:
⟨r|ν, σ⟩ =: uν (r) |σ⟩ mit
σ = ↑, ↓.
(2.49)
Aus der Einteilchenbasis können wir wie beschrieben eine Vielteilchenbasis als Produktbasis konstruieren.
Nun muss jeder Zustand identischer Fermionen total antisymmetrisch sein:
⟨. . . , νk , σk , . . . , νj , σj , . . . |ψ⟩ = −⟨. . . , νj , σj , . . . , νk , σk , . . . |ψ⟩.
(2.50)
Wir betrachten nun speziell zwei identische Spin-1/2-Teilchen,
⟨ν2 , σ2 , ν1 , σ1 |ψ⟩ = −⟨ν1 , σ1 , ν2 , σ2 , |ψ⟩.
(2.51)
Oft haben wir es mit Situationen zu tun, in denen der Vielteilchenzustand eine bestimmte Parität (symmetrisch
oder antisymmetrisch) bezüglich Vertauschung beschränkt auf die räumlichen Freiheitsgrade hat. Das ist z.B.
der Fall, wenn die räumlichen Wellenfunktionen der beiden Teilchen übereinstimmen. Allgemein gibt es zwei
Möglichkeiten:
• Der räumliche Zustand ist symmetrisch,
⟨ν2 , σ2 , ν1 , σ1 |ψ⟩ = ⟨ν1 , σ2 , ν2 , σ1 |ψ⟩.
(2.52)
Da der Gesamtzustand antisymmetrisch sein muss, siehe (2.51), folgt
⟨ν1 , σ2 , ν2 , σ1 |ψ⟩ = −⟨ν1 , σ1 , ν2 , σ2 |ψ⟩,
(2.53)
der Spin-Zustand ist also antisymmetrisch. Beispiele sind, in Ortsdarstellung für den räumlichen Anteil,

u(r1 )u(r2 )


 |↑↓⟩ − |↓↑⟩
u(r1 )v(r2 ) + v(r1 )u(r2 )
√
×
,
(2.54)
√

2

2

v(r1 )v(r2 )
wobei u und v orthonormale Wellenfunktionen sind. Diese Zustände sind alle symmetrisch im Ortsraum
und antisymmetrisch im Spin. Der Gesamt-Spin ist 0. Die antisymmetrische Kombination zweier Spins 1/2
nennt man Singulett-Zustand, weil es nur eine solche Kombination gibt. Der erste (oder dritte) Fall in
(2.54) beschreibt offenbar die Situation, dass sich zwei Elektronen in demselben Orbital befinden, z.B. im
1s-Orbital für den 11 S-Grundzustand von Helium.
• Der räumliche Zustand ist antisymmetrisch,
⟨ν2 , σ2 , ν1 , σ1 |ψ⟩ = −⟨ν1 , σ2 , ν2 , σ1 |ψ⟩.
(2.55)
⟨ν1 , σ2 , ν2 , σ1 |ψ⟩ = ⟨ν1 , σ1 , ν2 , σ2 |ψ⟩,
(2.56)
Dann folgt analog
der Spin-Zustand ist also symmetrisch. Beispiele sind




|↑↑⟩
u(r1 )v(r2 ) − v(r1 )u(r2 )
|↑↓⟩
+ |↓↑⟩
√
×
.
√

2

2

|↓↓⟩
(2.57)
Diese Zustände sind alle antisymmetrisch im Ortsraum und symmetrisch im Spin. Der Gesamt-Spin ist 1.
Die symmetrischen Kombinationen zweier Spins 1/2 nennt man Triplett-Zustände, weil es drei davon gibt.
18
Allgemein gilt: der Singulett- (Triplett-) Zustand zweier Elektronen hat eine symmetrische (antisymmetrische)
räumliche Wellenfunktion. Es folgt die aus der Schule und den Einführungsvorlesungen bekannte Formulierung
des Pauli-Prinzips: Zwei Elektronen können nicht zugleich im selben Spin- und Ortszustand sein.
Es sei angemerkt, dass ein Mehrteilchenzustand keine definierte Parität unter Vertauschungen ausschließlich
im Ortsraum oder im Spin haben muss. Zum Beispiel ist
u(r1 )v(r2 ) |↑↓⟩ − v(r1 )u(r2 ) |↓↑⟩
√
2
(2.58)
ein erlaubter, weil antisymmetrischer, Zustand für zwei identische Elektronen. Er ist aber weder symmetrisch
noch antisymmetrisch unter Vertauschung der Ortskoordinaten. Man kann sagen, dass Ort und Spin der beiden
Elektronen verschränkt sind.
2.2.2
Observable
Als nächstes wollen wir Observable betrachten, insbesondere den Hamiltonian. Die Diskussion von Observablen
für unterscheidbare Teilchen ist auch für identische Teilchen gültig, nur müssen sie mit der Ununterscheidbarkeit
der Teilchen vereinbar sein. Observable dürfen natürlich nicht gestatten, identische Teilchen zu unterscheiden.
Wir betrachten konkret Hamiltonians von der Form
H =T +V =
N
∑
p2i
+ V (r1 , . . . , rN )
2m
i=1
(2.59)
mit pi = −iℏ∇i ≡ −iℏ ∂/∂r in Ortsdarstellung. Wir haben hier angenommen, dass kein Vektorpotential vorliegt.
Identische Teilchen müssen natürlich identische Massen haben, so dass T symmetrisch unter Vertauschung von
Teilchen ist. Analog muss V symmetrisch unter Vertauschung sein, sonst wären die Teilchen experimentell unterscheidbar. Damit ist der gesamte Hamiltonian symmetrisch. Beachte, dass diese Aussage für Bosonen und für
Fermionen gilt.
V kann i.A. Beiträge enthalten, die von 1, 2, 3, . . . Einteilchenzuständen abhängen. Wir zerlegen V nach diesen
Beiträgen,
V = V1 + V2 + V3 + . . .
(2.60)
Physikalisch ist V1 das äußere Potential, V2 ist die Zwei-Teilchen-Wechselwirkung, V3 die Drei-TeilchenWechselwirkung usw. Wir schreiben in Ortsdarstellung
V (r1 , . . . , rN ) :=
=
⟨r1 , . . . , rN |V |r1 , . . . , rN ⟩
∑
1∑
1
V1 (ri ) +
V2 (ri , rj ) +
2
3!
i
ij
i̸=j
∑
V3 (ri , rj , rk ) + . . . ,
(2.61)
ijk
i̸=j̸=k̸=i
was explizit symmetrisch ist. Die Faktoren 1/n! korrigieren die Mehrfachzählung derselben Wechselwirkung. Beachte, dass wir z.B. Terme der Art V2 (ri , ri ) ausschließen. Solche Terme sind bereits in V1 enthalten. Beispiel: Die
Coulomb-Wechselwirkung lautet für Teilchen mit der Ladung ±e,
V2 (ri , rj ) = VC (ri , rj ) =
1
e2
.
4πϵ0 |ri − rj |
(2.62)
In der Praxis werden wir es nicht mit n-Teilchen-Wechselwirkungen für n > 2 zu tun haben.
Einteilchenobservable
Wir wollen den Hamiltonian bezüglich einer beliebigen Einteilchenbasis {|ν⟩} ausdrücken können. Für das Potential finden wir
∑ (1) ∑ ∑
∑
(1)
′
′
V1 ≡
Vi =
|ν1 , . . . , νN ⟩⟨ν1 , . . . , νN | Vi
|ν1′ , . . . , νN
⟩⟨ν1′ , . . . , νN
|.
(2.63)
i
i
′
ν1′ ,...,νN
ν1 ,...,νN
19
Für Fermionen sollen die Summen über Einteilchenzustände nur mit dem Pauli-Prinzip vereinbare Kombinationen
(1)
enthalten, d.h. νi ̸= νj und νi′ ̸= νj′ für i ̸= j. Vi wirkt hier nur auf den Zustand des i -ten Teilchens, also auf
′
|νi ⟩, |νi ⟩. Die anderen Summen können daher ausgeführt werden:
∑∑
∑
(1)
... =
|νi ⟩⟨νi | Vi
|νi′ ⟩⟨νi′ |.
(2.64)
(1)
Wie oben fassen wir Vi
νi′
νi
i
, eigentlich ein Operator auf HN , jetzt als Operator auf H auf. Weiter ergibt sich
∑∑
∑ ∑ (1)
(1)
|νi ⟩⟨νi |Vi |νi′ ⟩⟨νi′ | =
Vνi ν ′ |νi ⟩⟨νi′ |
(2.65)
... =
i
νi νi′
i
mit
(1)
(1)
Vνi ν ′ := ⟨νi |Vi
i
|νi′ ⟩ =
∫
νi νi′
i
d3 r u∗νi (r) V1 (r) uνi′ (r).
Wählt man die Ortsbasis, |ν⟩ = |r⟩, so erhält man entsprechend
∑∫
V1 =
d3 ri d3 ri′ V (1) (ri , r′i ) |ri ⟩⟨r′i |
(2.66)
(2.67)
i
mit
V (1) (ri , r′i ) =
∫
d3 r δ(r − ri ) V1 (r) δ(r − r′i ) = δ(ri − r′i ) V1 (ri ),
da die Eigenfunktionen des Ortsoperators δ-Funktionen sind. Eingesetzt ergibt sich
∑∫
V1 =
d3 ri V1 (ri ) |ri ⟩⟨ri |.
(2.68)
(2.69)
i
Diese Herleitung funktioniert für alle Einteilchenobservablen A(i) , man erhält entsprechende Ausdrücke. Die
kinetische Energie T (i) des Teilchens i ist sicherlich eine solche Obserable. Für die gesamte kinetische Energie
erhalten wir also
∑∑
∑∑
|νi ⟩⟨νi |Ti |νi′ ⟩⟨νi′ | =
Tνi νi′ |νi ⟩⟨νi′ |
(2.70)
T =
i
νi νi′
i
mit
Tνi νi′ := ⟨νi |Ti |νi′ ⟩ =
∫
νi νi′
d3 r u∗νi (r) T (r, p = −iℏ∇) uνi′ (r).
In Abwesenheit eines Vektorpotentials gilt einfach T (r, p = −iℏ∇) = −ℏ2 ∇2 /2m, also
∫
∫
ℏ2
ℏ2
Tνi νi′ = −
d3 r u∗νi (r) ∇2 uνi′ (r) = +
d3 r ∇u∗νi (r) · ∇uνi′ (r),
2m
2m
(2.71)
(2.72)
wobei wir im letzten Schritt eine partielle Integration ausgeführt haben, um einen symmetrischeren Ausdruck zu
erhalten. In der Ortsbasis erhalten wir
∑∫
T =
d3 ri d3 ri′ T (ri , r′i ) |ri ⟩⟨r′i |
(2.73)
i
mit
T (ri , r′i )
∫
ℏ2
= −
d3 r δ(r − ri ) ∇2 δ(r − r′i )
2m
∫
ℏ2
= −
d3 r δ(r − ri ) (∇′i )2 δ(r − r′i )
2m
ℏ2
(∇′i )2 δ(ri − r′i )
= −
2m
20
(2.74)
(wir schreiben ∇i ≡ ∂/∂ri und ∇′i ≡ ∂/∂r′i ) und
∫
ℏ2 ∑
T = −
2m i
∫
ℏ2 ∑
= −
2m i
∫
ℏ2 ∑
= −
2m i
∫
ℏ2 ∑
= +
2m i
schließlich
[
]
d3 ri d3 ri′ (∇′i )2 δ(ri − r′i ) |ri ⟩⟨r′i |
d3 ri d3 ri′ δ(ri − r′i ) (∇′i )2 |ri ⟩⟨r′i |
d3 ri |ri ⟩ ∇2i ⟨ri |
d3 ri ∇i |ri ⟩ · ∇i ⟨ri |,
(2.75)
wobei wir mehrfach partiell integriert haben. Diese Ortsdarstellung ist für die kinetische Energie i.A. nicht sehr
nützlich.
Wechselwirkungsterme
2, 3, . . .-Teilchen-Terme enthalten 2, 3, . . . Bra- und Ket-Vektoren. Zum Beispiel ist
1∑ ∑
1∑ ∑
(2)
(2)
|νi ⟩|νj ⟩⟨νj |⟨νi |Vij |νi′ ⟩|νj′ ⟩⟨νj′ |⟨νi′ | =
Vνi νj ν ′ ν ′ |νi ⟩|νj ⟩⟨νj′ |⟨νi′ |
V2 =
i j
2 ij
2
′ ′
′ ′
ij
νi νj νi νj
i̸=j
i̸=j
∫
mit
(2)
Vνi νj ν ′ ν ′
i j
(2.76)
νi νj νi νj
:=
(2)
⟨νj |⟨νi |Vij |νi′ ⟩|νj′ ⟩
=
d3 ri d3 rj u∗νj (rj )u∗νi (ri )V2 (ri , rj )uνi′ (ri )uνj′ (rj ).
Beachte die Reihenfolge der Indizes νi , νj (Konvention). In der Ortsbasis erhalten wir
∫
1∑
d3 ri d3 ri′ d3 rj d3 rj′ V (2) (ri , rj ; r′i , r′j ) |ri ⟩|rj ⟩⟨r′j |⟨r′i |
V2 =
2
(2.77)
(2.78)
i̸=j
mit
V
(2)
(ri , rj ; r′i , r′j )
∫
=
=
und schließlich
d3 Ri d3 Rj δ(Rj − rj )δ(Ri − ri ) V2 (Ri , Rj ) δ(Ri − r′i )δ(Rj − r′j )
δ(ri − r′i ) δ(rj − r′j ) V2 (ri , rj )
1∑
V2 =
2
(2.79)
∫
d3 ri d3 rj V2 (ri , rj ) |ri ⟩|rj ⟩⟨rj |⟨ri |.
(2.80)
i̸=j
Für die Coulomb-Wechselwirkung aus (2.62) erhalten wir speziell
∫
1 e2 ∑
1
VC =
d3 ri d3 rj
|ri ⟩|rj ⟩⟨rj |⟨ri |,
2 4πϵ0
|ri − rj |
(2.81)
i̸=j
was mit (2.29) übereinstimmt.
Wie gesagt müssen alle Terme im Hamiltonian H symmetrisch unter Vertauschung identischer Teilchen sein.
Man kann zeigen, dass H daher die Symmetrie oder Antisymmetrie von Zuständen erhält, d.h. H Ŝ± |ν1 , . . . , νN ⟩
ist (anti-) symmetrisch. Es folgt
Ŝ± H Ŝ± |ν1 , . . . , νN ⟩ = H Ŝ± |ν1 , . . . , νN ⟩ = H Ŝ± Ŝ± |ν1 , . . . , νN ⟩
(2.82)
für alle Basiszustände und daher für alle Zustände aus Ŝ± HN . Damit gilt auf dem Raum erlaubter Zustände die
Operatoridentität
Ŝ± H = H Ŝ± ⇒ [Ŝ± , H] = 0.
(2.83)
21
Beachte, dass wir die Terme im Hamiltonian oben durch Einteilchen-Bras und Kets ausgedrückt haben, nicht
in einer Basis explizit (anti-) symmetrischer Vielteilchenzustände, was das eigentliche Ziel war. Das macht die
Auswertung von z.B. H Ŝ± |ν1 , . . . , νN ⟩ für einen konkreten Fall mühsam. Wir werden im Folgenden H durch
(anti-) symmetrisierte Zustände ausdrücken, verwenden dafür aber eine günstigere Darstellung dieser Zustände.
2.3
Zweite Quantisierung
Die bisher entwickelte Verallgemeinerung der Quantenmechanik auf N -Teilchen-Systeme ist aus mehreren
Gründen ungünstig:
• Praktische Rechnungen mit den (anti-) symmetrisierten Zuständen sind mühsam.
• Die Zustände enthalten eine feste Teilchenzahl N . Teilchenerzeugung und -vernichtung können nicht beschrieben werden.
• Ebenfalls wegen der festen Teilchenzahl N ist der Formalismus auch nicht ideal, wenn die Teilchenzahl zwar
erhalten ist, wir aber mehr als einen möglichen Wert betrachten wollen, z.B. für statistische Aussagen über
großkanonische Ensembles.
Diese Mängel werden vom Formalismus der Zweiten Quantisierung behoben. Dabei wird im Übrigen gar nichts
zweimal quantisiert. Es handelt sich um eine irreführende historische Bezeichnung; wir werden auf ihren Ursprung
später zurückkommen.
Wir müssen zunächst einen Zustandsraum konstruieren, der Zustände mit Teilchenzahlen N = 0, 1, . . . enthält.
HN für festes N reicht also nicht. Wir führen den Fock-Raum ein:
F := H0 ⊕ H1 ⊕ H2 ⊕ . . .
(2.84)
Der Fock-Raum
ist die direkte Summe der HN , d.h. die Basis von F ist die Vereinigungsmenge der Basen der
∪∞
HN , N =0 (Basis von HN ).
Der Null-Teilchen-Hilbertraum H0 ist besonders einfach: Er enthält nur den einen Zustand ohne Teilchen.
Dieser wird Vakuumzustand (oder Vakuum) genannt und oft mit |0⟩ bezeichnet. H0 ist also ein eindimensionaler
Hilbertraum, aufgespannt durch |0⟩. (Der normierbare Zustandsvektor |0⟩ darf nicht mit dem Nullvektor 0 im
Hilbertraum verwechselt werden.)
2.3.1
Besetzungszahldarstellung
Bei der Zweiten Quantisierung beschreiben wir Vielteilchenzustände durch Angabe der Zahl von Teilchen in
bestimmten Einteilchenzuständen. Wir definieren Besetzungszahloperatoren n̂ν durch ihre Darstellung in der
Basis der bekannten (anti-) symmetrisierten Vielteilchenzustände. Diese Zustände sollen sämtlich Eigenzustände
von n̂ν sein und die folgende Eigenwertgleichung erfüllen:
n̂ν Ŝ± |ν1 , . . . , νN ⟩ = nν Ŝ± |ν1 , . . . , νN ⟩,
(2.85)
wobei nν die Anzahl des Auftretens von ν in der Folge {ν1 , . . . , νN } ist. Mit anderen Worten, nν beschreibt, wieviele
Teilchen im Einteilchenzustand |ν⟩ sind. Wegen der (Anti-) Symmetrisierung ist der Basiszustand Ŝ± |ν1 , . . . , νN ⟩
durch Angabe der Besetzungszahlen für alle möglichen Einteilchenzustände eindeutig bestimmt. Ein Phasen- oder
allgemeiner ein Normierungsfaktor ist dadurch nicht festgelegt, ändert aber nicht den Zustand.
Wir schreiben für die (normierten) Basiszustände
|n1 , n2 , . . .⟩
mit n1 + n2 + . . . = N.
(2.86)
Diese nennt man Besetzungszahlzustände und die Darstellung von Operatoren usw. in dieser Basis Besetzungszahldarstellung. Es ist wichtig, sich klarzumachen, dass es dieselben (anti-) symmetrisierten Basiszustände sind
wie im vorigen Abschnitt; die expliziten Vektoren unterscheiden sich höchstens um einen Zahlenfaktor. Sie werden
nur anders bezeichnet.
22
Die Eigenwertgleichung (2.85) lautet nun einfach
n̂ν |n1 , n2 , . . .⟩ = nν |n1 , n2 , . . .⟩.
(2.87)
Es ist sinnvoll, auch Operatoren einzuführen, die die Teilchenzahlen ändern. Wir diskutieren zunächst Bosonen
und anschließend Fermionen.
Bosonen
Wir definieren den Erzeugungsoperator b†ν für den Einteilchenzustand |ν⟩ durch
b†ν | . . . , nν , . . .⟩ = Bn∗ ν +1 | . . . , nν + 1, . . .⟩,
(2.88)
wobei wir den Zahlenfaktor Bn∗ ν +1 etwas später festlegen werden. b†n erhöht offensichtlich die Besetzungszahl nν
um eins. Wir definieren außerdem den Vernichtungsoperator durch bν := (b†ν )† . Es folgt
⇒
⇒
Weiter folgt
⟨. . . , n′ν , . . . | b†ν | . . . , nν , . . .⟩ = Bn∗ ν +1 δn′ν ,nν +1
⟨. . . , nν , . . . | bν | . . . , n′ν , . . .⟩ = Bnν +1 δn′ν ,nν +1
bν | . . . , nν + 1, . . .⟩ = Bnν +1 | . . . , nν , . . .⟩.
(2.89)
(2.90)
(2.91)
b†ν bν | . . . , nν , . . .⟩ = Bn∗ ν Bnν | . . . , nν , . . .⟩.
(2.92)
| . . . , nν , . . .⟩ ist also ein Eigenzustand von b†ν bν mit Eigenwert Bn∗ ν Bnν .
bν muss den Zustand zerstören, wenn kein Teilchen im Einteilchenzustand |ν⟩ ist, weil negative Teilchenzahlen
keinen Sinn haben:
bν | . . . , nν = 0, . . .⟩ = 0.
(2.93)
Es folgt
B0 = 0.
(2.94)
†
Über B
√n , n ≥ 1, können wir noch verfügen. Es ist nützlich, zu definieren (als Bestandteil der Definition von bν )
Bn = n. Dann folgt
√
b†ν | . . . , nν , . . .⟩ =
nν + 1 | . . . , nν + 1, . . .⟩,
(2.95)
√
bν | . . . , nν , . . .⟩ =
nν | . . . , nν − 1, . . .⟩,
(2.96)
b†ν bν | . . . , nν , . . .⟩
b†ν bν ist demnach der Besetzungszahloperator:
= nν | . . . , nν , . . .⟩.
(2.97)
b†ν bν = n̂ν .
(2.98)
Weiter folgt
[bν , b†ν ] | . . . , nν , . . .⟩ ≡ (bν b†ν − b†ν bν ) | . . . , nν , . . .⟩ = [(nν + 1) − nν ] | . . . , nν , . . .⟩ = | . . . , nν , . . .⟩.
Da dies für alle Basiszustände gilt, folgt
Weiterhin gilt trivial
(2.99)
[bν , b†ν ] = 1.
(2.100)
[bν , bν ] = [b†ν , b†ν ] = 0,
(2.101)
da jeder Operator mit sich selbst kommutiert.
Soweit haben wir Vertauschungsrelationen für Erzeuger und Vernichter desselben Einteilchenzustandes betrachtet. Operatoren für verschiedene Einteilchenzustände |ν⟩, |ν ′ ⟩ kommutieren, da der Vielteilchenzustand symmetrisch unter Vertauschung von Teilchen ist. Das wollen wir am Beispiel von b†ν und b†ν ′ , ν ′ ̸= ν, zeigen. Für
Bosonen gilt
⟨. . . , νj , . . . , νk , . . . |ψ⟩ = ⟨. . . , νk , . . . , νj , . . . |ψ⟩.
(2.102)
23
Nun ist
b†ν |ν1 , . . . , νN ⟩ =
b†ν |ν1 ⟩ · · · |νN ⟩
√
nν + 1 |ν⟩|ν1 ⟩ · · · |νN ⟩
√
nν + 1 |ν, ν1 , . . . , νN ⟩
(2.103)
√
√
nν + 1 nν ′ + 1 |ν, ν ′ , ν1 , . . . , νN ⟩.
(2.104)
=
=
(dieser Zustand liegt in HN +1 ) und
b†ν b†ν ′ |ν1 , . . . , νN ⟩ =
Aber für Bosonen kommt es nicht auf die Reihenfolge der ν an:
√
√
. . . = nν ′ + 1 nν + 1 |ν ′ , ν, ν1 , . . . , νN ⟩ = b†ν ′ b†ν |ν1 , . . . , νN ⟩ ∀ |ν1 , . . . , νN ⟩.
Es folgt
b†ν b†ν ′ = b†ν ′ b†ν
⇒
[b†ν , b†ν ′ ] = 0
(2.105)
(2.106)
[bν , b†ν ′ ].
und ähnlich für [bν , bν ′ ] und
Wir erhalten schließlich die fundamentalen Vertauschungsrelationen für Bosonen:
[bν , b†ν ′ ] = δνν ′ ,
[bν , bν ′ ] = 0,
(2.107)
(2.108)
[b†ν , b†ν ′ ] = 0.
(2.109)
Erzeugungs- und Vernichtungsoperatoren für unterscheidbare Bosonen vertauschen natürlich in jedem Fall.
Fermionen
Für Fermionen hatten wir gesehen, dass jeder Einteilchenzustand ν höchstens einfach besetzt sein kann. Also gilt
nν = 0, 1 ∀ν.
(2.110)
Wir definieren zunächst analog zu Bosonen den Erzeugungsoperator c†ν durch
c†ν | . . . , nν , . . .⟩ = Cn∗ν +1 | . . . , nν + 1, . . .⟩
(2.111)
und den Vernichtungsoperator durch cν := (c†ν )† . Es folgt
⇒
⇒
Weiter folgt
⟨. . . , n′ν , . . . | c†ν | . . . , nν , . . .⟩ = Cn∗ν +1 δn′ν ,nν +1
⟨. . . , nν , . . . | cν | . . . , n′ν , . . .⟩ = Cnν +1 δn′ν ,nν +1
cν | . . . , nν + 1, . . .⟩ = Cnν +1 | . . . , nν , . . .⟩.
c†ν cν | . . . , nν , . . .⟩ = Cn∗ν Cnν | . . . , nν , . . .⟩.
(2.112)
(2.113)
(2.114)
(2.115)
Analog zu Bosonen ist C0 = 0. Für Fermionen gilt aber außerdem
c†ν | . . . , nν = 1, . . .⟩ = 0
⇒
C2∗ = 0.
(2.116)
(2.117)
Wir können praktischerweise C1 = 1 definieren und erhalten dann
c†ν | . . . , nν = 0, . . .⟩
c†ν | . . . , nν = 1, . . .⟩
= | . . . , nν = 1, . . .⟩,
= 0,
(2.118)
(2.119)
cν | . . . , nν = 0, . . .⟩
cν | . . . , nν = 1, . . .⟩
= 0,
= | . . . , nν = 0, . . .⟩
(2.120)
(2.121)
24
und
c†ν cν | . . . , nν = 0, . . .⟩
c†ν cν | . . . , nν = 1, . . .⟩
Also ist
= 0,
= | . . . , nν = 1, . . .⟩.
(2.122)
(2.123)
c†ν cν = n̂ν
(2.124)
[cν , c†ν ] | . . . , nν , . . .⟩ ≡ (cν c†ν − c†ν cν ) | . . . , nν , . . .⟩ = (−1)nν | . . . , nν , . . .⟩.
(2.125)
der Besetzungszahloperator, wie für Bosonen.
Für den Kommutator erhalten wir
Der Kommutator ist also nicht universell. Es ist fundamental für die Physik von Fermionen, dass wir stattdessen
ein einfaches Ergebnis für den Antikommutator
{cν , c†ν } := cν c†ν + c†ν cν
erhalten:
(2.126)
{cν , c†ν } | . . . , nν , . . .⟩ ≡ (cν c†ν + c†ν cν ) | . . . , nν , . . .⟩ = | . . . , nν , . . .⟩
∀ | . . . , nν , . . .⟩.
(2.127)
Hier haben wir ausgenutzt, dass immer einer der beiden Terme eins und der andere Null ergibt. Es folgt
{cν , c†ν } = 1.
(2.128)
Für den Antikommutator schreibt man auch [A, B]+ := AB + BA.
Aus (2.118)–(2.121) folgt sofort
{cν , cν }
{c†ν , c†ν }
≡
≡
2cν cν = 0,
2c†ν c†ν = 0.
(2.129)
(2.130)
Die letzte Gleichung enthält das Pauli-Prinzip: Man kann keine zwei Fermionen in demselben Zustand |ν⟩ erzeugen.
Wie lauten die Antikommutatoren für verschiedene Einteilchenzustände? Für Fermionen macht es, anders als
für Bosonen, einen Unterschied, welches Teilchen zuerst erzeugt wird. Es gilt
⟨. . . , νj , . . . , νk , . . . |ψ⟩ = −⟨. . . , νk , . . . , νj , . . . |ψ⟩.
(2.131)
′
Also folgt für ν ̸= ν
c†ν c†ν ′ |ν1 , . . . , νN ⟩ = Cn∗ν +1 Cn∗ν ′ +1 |ν, ν ′ , ν1 , . . . , νN ⟩
= −Cn∗ν ′ +1 Cn∗ν +1 |ν ′ , ν, ν1 , . . . , νN ⟩
= c†ν ′ c†ν |ν1 , . . . , νN ⟩
⇒
⇒
c†ν c†ν ′
{c†ν , c†ν ′ }
=
−c†ν ′ c†ν
∀ |ν1 , . . . , νN ⟩
(2.132)
(2.133)
= 0.
(2.134)
Analoge Ergebnisse folgen für {cν , cν ′ } und, für ν ′ ̸= ν, für
schungsrelationen
{cν , c†ν ′ }.
Insgesamt erhalten wir die Anti -Vertau-
{cν , c†ν ′ } = δνν ′ ,
(2.135)
{cν , c } = 0,
(2.136)
{c†ν , c†ν ′ }
(2.137)
ν′
= 0.
Wie sehen die (Anti-) Vertauschungsrelationen für unterscheidbare Fermionen aus? Man kann zeigen, dass es
immer möglich ist, die Erzeugungs- und Vernichtungsoperatoren so zu konstruieren, dass sie antivertauschen:
{cν , d†µ } = 0 usw. Wenn Superpositionen der Teilchen möglich sind, müssen die Operatoren antivertauschen. Zum
Beispiel sind Elektronen- und Myonen-Neutrinos durch Reaktionen wie νe + n → e− + p und νµ + n → µ− + p
unterscheidbar, wandeln sich aber bei der freien Propagation ineinander um (Neutrino-Oszillation). Die entsprechenden Operatoren müssen antivertauschen. Superpositionen von Teilchen mit unterschiedlichen (elektrischen
oder anderen) Ladungen werden hingegen nicht beobachtet. In solchen Fällen hat es keine beobachtbaren Konsequenzen, ob die Operatoren für unterschiedliche Fermionarten vertauschen oder antivertauschen. Operatoren für
Fermionen und Bosonen, die offensichtlich immer voneinander unterscheidbar sind, kommutieren.
25
Basiswechsel
Die weitere Diskussion bezieht sich soweit möglich sowohl auf Bosonen als auch auf Fermionen. Für Erzeugungsund Vernichtungsoperatoren für beide Fälle schreiben wir a†ν , aν .
Es ist wichtig zu prüfen, wie sich die Erzeugungs- und Vernichtungsoperatoren unter einem Wechsel der
Einteilchenbasis transformieren. Die Einteilchenbasiszustände selbst transformieren sich gemäß
∑
∑
|µ̃⟩ =
|ν⟩⟨ν|µ̃⟩ =
⟨ν|µ̃⟩ |ν⟩.
(2.138)
ν
ν
Nun soll a†ν ein Teilchen im Zustand |ν⟩ erzeugen und ㆵ ein Teilchen im Zustand |µ̃⟩,
|ν⟩
|µ̃⟩
= a†ν |0⟩,
= ㆵ |0⟩.
(2.139)
(2.140)
Das wird erreicht, wenn die Transformationsvorschrift für die Erzeugungsoperatoren lautet
∑
ㆵ =
⟨ν|µ̃⟩ a†ν ,
(2.141)
ν
denn dann ist
|µ̃⟩ = ㆵ |0⟩ =
∑
∑
⟨ν|µ̃⟩ a†ν |0⟩ =
⟨ν|µ̃⟩ |ν⟩.
ν
(2.142)
ν
Dieser Beweis“ bezieht sich aber nur auf Einteilchenzustände. Um die Korrektheit der Transformationsvorschrift
”
allgemein zu zeigen, muss man von den (anti-) symmetrisierten Zuständen in erster Quantisierung ausgehen, und
zeigen, dass deren Transformation bei Basiswechsel mit der durch (2.141) induzierten übereinstimmt. Wir führen
das hier nicht durch.
Aus (2.141) folgt sofort
∑
ãµ =
⟨µ̃|ν⟩ aν
(2.143)
ν
für die Vernichtungsoperatoren. Die Kommutatorrelationen für Bosonen transformieren sich dann wie
∑
∑
⟨µ̃|ν⟩⟨ν ′ |µ̃′ ⟩ [bν , b†ν ′ ] =
[b̃µ , b̃†µ′ ] =
⟨µ̃|ν⟩⟨ν|µ̃′ ⟩ = ⟨µ̃|µ̃′ ⟩ = δµµ′
|
{z
}
ν
νν ′
(2.144)
δνν ′
usw. und die Antikommutatorrelationen für Fermionen wie
∑
∑
⟨µ̃|ν⟩⟨ν ′ |µ̃′ ⟩ {cν , c†ν ′ } =
{c̃µ , c̃†µ′ } =
⟨µ̃|ν⟩⟨ν|µ̃′ ⟩ = ⟨µ̃|µ̃′ ⟩ = δµµ′ .
|
{z
}
′
ν
νν
(2.145)
δνν ′
Die (Anti-) Kommutatoreigenschaften der Operatoren sind also invariant unter Wechsel der Einteilchenbasis. Die
(Anti-) Kommutatoreigenschaften sind somit basisunabhängig, was sehr wünschenswert ist.
Die Gesamtteilchenzahl transformiert sich gemäß
∑
∑
∑
∑
a†ν aν = N̂ .
(2.146)
ㆵ 㵠=
⟨ν|µ̃⟩⟨µ̃|ν ′ ⟩ a†ν aν ′ =
⟨ν|ν ′ ⟩ a†ν aν ′ =
µ
νν ′ µ
νν ′
ν
Die Gesamtteilchenzahl ist also ebenfalls invariant, was der intuitiven Bedeutung einer Teilchenzahl entspricht.
Konstruktion der Zustände
Der Vakuum-Zustand |0⟩ ist nach Definition der Zustand ohne Teilchen. Er wird daher von allen aν vernichtet:
aν |0⟩ = 0 ∀ν.
26
(2.147)
Damit schreiben wir die Besetzungszahlzustände nun als
|n1 , n2 , . . .⟩ ∼ (a†1 )n1 (a†2 )n2 · · · |0⟩,
(2.148)
wobei wir uns gleich um die Normierung kümmern werden. Für Fermionen kommt es auf die Reihenfolge an, wir
müssen eine Ordnung von Einteilchenzuständen festlegen und dann konsistent verwenden, ansonsten können sich
Vorzeichenfehler einschleichen. Die (Anti-) Vertauschungsrelationen der aν stellen sicher, dass diese Zustände die
korrekten (Anti-) Symmetrie-Eigenschaften haben.
Die fermionischen Zustände sind bereits normiert: Wir betrachten ⟨0| · · · cn2 2 cn1 1 (c†1 )n1 (c†2 )n2 · · · |0⟩. Hierin ist
{
1
für n1 = 0,
cn1 1 (c†1 )n1 =
(2.149)
1 − c†1 c1 für n1 = 1.
Im Fall n1 = 1 wirkt dieser Operator auf den Zustand (c†2 )n2 · · · |0⟩, der keine Teilchen im Zustand |1⟩ enthält.
Daher kann der Besetzungszahloperator c†1 c1 durch Null ersetzt werden und der Operator cn1 1 (c†1 )n1 kann durch
eins ersetzt werden. Dasselbe Argument lässt sich für die Zustände |2⟩, |3⟩, etc. wiederholen, so dass sich am Ende
⟨0| · · · cn2 2 cn1 1 (c†1 )n1 (c†2 )n2 · · · |0⟩ = 1
(2.150)
ergibt.
Für Bosonen betrachten wir ⟨0| · · · bn2 2 bn1 1 (b†1 )n1 (b†2 )n2 · · · |0⟩. Es gilt
bnν ν (b†ν )nν = bnν ν −1 (1 + b†ν bν ) (b†ν )nν −1 .
(2.151)
Der Besetzungszahloperator b†ν bν wirkt auf einen Zustand, der nν − 1 Teilchen enthält und kann daher durch
nν − 1 ersetzt werden. Damit kann im obigen Skalarprodukt bnν ν (b†ν )nν durch nν bnν ν −1 (b†ν )nν −1 ersetzt werden.
Iteration ergibt den Faktor nν !. Dies wird erst für Zustand |1⟩, dann für |2⟩ usw. ausgeführt und ergibt schließlich
⟨0| · · · bn2 2 bn1 1 (b†1 )n1 (b†2 )n2 · · · |0⟩ = n1 ! n2 ! · · ·
(2.152)
Damit erhalten wir für die normierten Besetzungszahlzustände
|n1 , n2 , . . .⟩ =
|n1 , n2 , . . .⟩ =
√ 1
(b†1 )n1 (b†2 )n2 · · ·
n1 ! n2 !···
(c†1 )n1 (c†2 )n2 · · · |0⟩
|0⟩ für Bosonen,
für Fermionen.
(2.153)
(2.154)
Der Ausdruck für Bosonen gilt auch für Fermionen, da 0! = 1! = 1.
2.3.2
Operatoren in zweiter Quantisierung
Wir wollen Observable, insbesondere wieder den Hamiltonian, durch Erzeugungs- und Vernichtungsoperatoren
ausdrücken.
Einteilchenobservable
Für Einteilchen-Terme (T und V1 ) hatten wir, siehe (2.65),
∑∑
V1 =
Vνν ′ |ν⟩⟨ν ′ | .
| {z }
′
i
νν
(2.155)
wirkt auf Teilchen i
Offenbar trägt der Operator unter der Summe nur bei, wenn Teilchen i im Zustand |ν ′ ⟩ ist, der Operator verschiebt
es dann in den Zustand |ν⟩. Demnach gilt für Bosonen
∑∑
V1 b†ν1 b†ν2 · · · b†νN |0⟩ =
Vνν ′ δν ′ νi b†ν1 · · · b†ν · · · b†νN |0⟩ .
(2.156)
|{z}
′
i
νν
i-tes Teilchen
27
Das nächste Ziel ist, die rechte Seite als Operator, ausgedrückt durch die b, b† , angewandt auf den Zustand
b†ν1 · · · b†νN |0⟩ zu schreiben. Also soll b†ν1 · · · b†νN |0⟩ ganz rechts stehen. Um das zu erreichen, betrachten wir den
Einteilchenzustand |ν ′ ⟩ genauer. In b†ν1 · · · b†νN |0⟩ sei dieser n′ -mal besetzt (n′ = 1, 2, 3, . . .; n′ = 0 ergibt Null).
′
Dieser Zustand enthält also (b†ν ′ )n , angewandt auf das Vakuum. Um die Erzeuger so zusammenzufassen, nutzen
wir aus, dass bosonische Erzeugungsoperatoren miteinander kommutieren. Der Summand in Gl. (2.156) enthält
′
stattdessen b†ν (b†ν ′ )n −1 . Dies wollen wir in eine ähnliche Form bringen:
′
b†ν (b†ν ′ )n −1
⇒
= b†ν
V1 b†ν1 b†ν2 · · · b†νN |0⟩
′
bν ′ b†ν ′ † n′ −1
1
= ′ b†ν bν ′ (b†ν ′ )n
(bν ′ )
′
n }
n
| {z
∑
=
=1
Vνν ′
νν ′
∑
δν ′ νi
i
1 †
b bν ′ b†ν1 b†ν2 · · · b†νN |0⟩.
n′ ν
(2.157)
(2.158)
Da |ν ′ ⟩ in b†ν1 b†ν2 · · · b†νN |0⟩ nun n′ -fach besetzt ist, enthält die i-Summe n′ identische, nicht verschwindende Terme,
wodurch sich der Faktor 1/n′ weghebt. Also ist
∑
... =
Vνν ′ b†ν bν ′ b†ν1 · · · b†νN |0⟩.
(2.159)
νν ′
Dies gilt für alle Basiszustände b†ν1 · · · b†νN |0⟩ und daher folgt die Operatoridentität
V1 =
∑
Vνν ′ b†ν bν ′ .
(2.160)
Tνν ′ b†ν bν ′ .
(2.161)
νν ′
Ebenso erhält man
T =
∑
νν ′
Einteilchenobservable sind also bilinear in Erzeugungs- und Vernichtungsoperatoren.
Zur Klasse der Einteilchenobservablen gehören natürlich auch die Besetzungszahloperatoren n̂ν = b†ν bν der
Einteilchenzustände. Ebenfalls von dieser bilinearen Form ist der wichtige Gesamtteilchenzahloperator
∑
N̂ =
b†ν bν .
(2.162)
ν
Harmonischer Oszillator
Es sei an die algebraische Lösung des harmonischen Oszillators aus der Quantentheorie 1 erinnert: Der Hamiltonian
p2
1
+ mω02 x2
2m 2
H=
(2.163)
lässt sich durch Einführung neuer Operatoren
√
b
b†
i
mω0
x+ √
p,
2ℏ
2ℏmω0
√
mω0
i
=
x− √
p
2ℏ
2ℏmω0
=
(2.164)
(2.165)
mit der Umkehrtransformation
√
x =
p =
ℏ
(b + b† ),
2mω0
√
ℏmω0
−i
(b − b† )
2
28
(2.166)
(2.167)
(
auf die Form
H = ℏω0
1
b b+
2
†
)
(2.168)
bringen.
Die neuen Operatoren erfüllen
[
]
)
√
1 √
i
i
i (
i
− [x, p] + [p, x] =
[b, b† ] =
mω0 x + √
p, mω0 x − √
p =
(−2iℏ) = 1
| {z } | {z }
2ℏ
mω0
mω0
2ℏ
2ℏ
(2.169)
= −iℏ
= iℏ
und trivialerweise [b, b] = [b† , b† ] = 0. b† und b verhalten sich also wie bosonische Erzeugungs- und Vernichtungsoperatoren. Außerdem ist der Hamiltonian H, bis auf eine Konstante, bilinear in diesen Operatoren. Bosonen sind
also im Wesentlichen dasselbe wie Anregungen von harmonischen Oszillatoren. Wir werden auf diese Erkenntnis
bei der Quantisierung des elektromagnetischen Feldes zurückkommen.
Wechselwirkungsterme
Zwei-Teilchen-Wechselwirkungen lassen sich gemäß (2.76) schreiben als
V2 =
1∑
2
∑
i̸=j µi µj µ′i µ′j
Vµi µj µ′i µ′j |µi ⟩|µj ⟩⟨µ′j |⟨µ′i | .
|
{z
}
(2.170)
wirkt auf Teilchen i,j
Für Bosonen finden wir, analog zur obigen Herleitung,
V2 b†ν1 b†ν2 · · · b†νN |0⟩ =
1∑
2
∑
Vµi µj µ′i µ′j δµ′i νi δµ′j νj b†ν1 · · · b†µi · · · b†µj · · · b†νN |0⟩.
(2.171)
i̸=j µi µj µ′i µ′j
Nun müssen wir die Fälle µ′i ̸= µ′j und µ′i = µ′j unterscheiden. Ob µi ̸= µj oder µi = µj ist, spielt, wie wir sehen
werden, an dieser Stelle keine Rolle.
• Für µ′i ̸= µ′j haben wir
b†µi b†µj
n ′ −1
n ′ −1
(b†µ′ ) µi (b†µ′ ) µj
j
i
=
=
b†µi b†µj
bµ′j b†µ′ bµ′i b†µ′
j
i
n
µ′j
n
µ′i
nµ′ −1
(b†µ′ )
i
i
(b†µ′ )
nµ′ −1
j
j
1
n ′
n ′
b†µi b†µj bµ′j bµ′i (b†µ′ ) µi (b†µ′ ) µj .
j
i
nµ′i nµ′j
(2.172)
Das gilt unabhängig davon, ob µi ̸= µj oder µi = µj ist. Der entsprechende Anteil an der Summe in (2.171)
ist
∑
1∑
1
V2 b†ν1 b†ν2 · · · b†νN |0⟩µ′ ̸=µ′ =
Vµi µj µ′i µ′j δµ′i νi δµ′j νj
b†µi b†µj bµ′j bµ′i b†ν1 b†ν2 · · · b†νN |0⟩
′
i
j
2
n
µi nµ′j
′
′
1
=
2
∑
i̸=j µi ,µj ,µi ̸=µj
Vµa µb µ′a µ′b
µa ,µb ,µ′a ̸=µ′b
∑
δµ′a νi δµ′b νj
i̸=j
1
b† b† bµ′ bµ′ b† b† · · · b†νN |0⟩.
nµ′a nµ′b µa µb b a ν1 ν2
(2.173)
Da |µ′a ⟩ und |µ′b ⟩ in b†ν1 b†ν2 · · · b†νN |0⟩ nun nµ′a - bzw. nµ′b -fach besetzt sind, enthält die i, j-Summe nµ′a nµ′b
identische, nicht verschwindende Terme. Also ist
... =
1
2
∑
Vµa µb µ′a µ′b b†µa b†µb bµ′b bµ′a b†ν1 b†ν2 · · · b†νN |0⟩.
µa ,µb ,µ′a ̸=µ′b
29
(2.174)
• Für µ′i = µ′j haben wir stattdessen
n ′ −2
b†µi b†µj (b†µ′ ) µi
i
=
bµ′i bµ′i b†µ′ b†µ′
b†µi b†µj
i
i
nµ′i (nµ′i − 1)
(b†µ′ )
nµ′ −2
i
=
i
1
nµ′i (nµ′i − 1)
b†µi b†µj bµ′i bµ′i (b†µ′ )
nµ′
i
.
(2.175)
i
Wieder gilt dies auch für µi = µj . Der entsprechende Anteil in (2.171) ist
1
1∑ ∑
b†µi b†µj bµ′i bµ′i b†ν1 b†ν2 · · · b†νN |0⟩
Vµi µj µ′i µ′i δµ′i νi δµ′i νj
V2 b†ν1 b†ν2 · · · b†νN |0⟩µ′ =µ′ =
′
′
i
j
2
n
(n
−
1)
µi
µi
′
1
=
2
∑
i̸=j µi ,µj ,µi
Vµa µb µ′a µ′a
µa ,µb ,µ′a
∑
δµ′a νi δµ′a νj
i̸=j
1
b† b† bµ′ bµ′ b† b† · · · b†νN |0⟩.
nµ′a (nµ′a − 1) µa µb a a ν1 ν2
(2.176)
|µ′a ⟩ tritt nµ′a -mal auf. Wir erhalten immer denselben Term, wenn Teilchen i und Teilchen j (j ̸= i) im
Zustand |µ′a ⟩ sind. Das ist ein Problem des Ziehens von zwei Zahlen aus {1, 2, . . . , N } ohne Zurücklegen.
Dafür gibt es nµ′a (nµ′a − 1) Möglichkeiten. Der Faktor 1/nµ′a (nµ′a − 1) hebt sich also weg,
... =
1
2
∑
Vµa µb µ′a µ′a b†µa b†µb bµ′a bµ′a b†ν1 b†ν2 · · · b†νN |0⟩.
(2.177)
µa ,µb ,µ′a
Zusammenfassung der beiden Fälle ergibt
V2 b†ν1 b†ν2 · · · b†νN |0⟩ =
1
2
∑
Vµa µb µ′a µ′b b†µa b†µb bµ′b bµ′a b†ν1 b†ν2 · · · b†νN |0⟩,
(2.178)
µa µb µ′a µ′b
so als hätten wir den Fall µ′i = µ′j einfach ignoriert. Da das für alle Zustände gilt, folgt
V2 =
1
2
∑
Vµa µb µ′a µ′b b†µa b†µb bµ′b bµ′a .
(2.179)
µa µb µ′a µ′b
Die Ordnung der Erzeugungs- und Vernichtungsoperatoren ist die konventionelle Form. Beachte die Reihenfolge
der Subskripte.
Dieselben Darstellungen (mit bν durch cν ersetzt) ergeben sich für Fermionen, wenn man die Antikommutatoren korrekt behandelt. Das zeigen wir hier nicht.
2.3.3
Quantenfeldoperatoren
Das bisher gesagte gilt im Wesentlichen für jede beliebige Einteilchenbasis {|ν⟩}. Ein wichtiger Spezialfall ist die
Ortsbasis {|r⟩}. Wir definieren für Bosonen und für Fermionen, zunächst unter Vernachlässigung des Spins, den
Quantenfeldoperator
∑
∑
Ψ(r) :=
⟨r|ν⟩ aν =
uν (r) aν .
(2.180)
ν
ν
Diese Gleichung hat die normale Form eines Basiswechsels, siehe Gl. (2.143). Ψ(r) ist offenbar eine Linearkombination von Vernichtungsoperatoren. Beachte die übliche Schreibung mit einem Großbuchstaben Ψ zur Unterscheidung von einer Einteilchenwellenfunktion.
Der hermitesch konjugierte Operator ist
∑
∑
u∗ν (r) a†ν .
(2.181)
⟨r|ν⟩∗ a†ν =
Ψ† (r) =
ν
ν
Wir finden für Bosonen
[Ψ(r1 ), Ψ† (r2 )] =
∑
uν1 (r1 ) u∗ν2 (r2 ) [bν1 , b†ν2 ] =
| {z }
ν1 ν2
= δν1 ν2
30
∑
ν1
uν1 (r1 ) u∗ν1 (r2 ) = δ(r1 − r2 )
(2.182)
unter Verwendung der Vollständigkeitsrelation. Für Fermionen ergibt sich analog
∑
∑
{Ψ(r1 ), Ψ† (r2 )} =
uν1 (r1 ) u∗ν2 (r2 ) {cν1 , c†ν2 } =
uν1 (r1 ) u∗ν1 (r2 ) = δ(r1 − r2 ).
|
{z
}
ν1 ν2
ν1
(2.183)
= δν1 ν2
Allgemein finden wir
∫
∫
∑
∑
∑
d3 r Ψ† (r)Ψ(r) = d3 r
u∗ν (r) uν ′ (r) a†ν aν ′ =
δνν ′ a†ν aν ′ =
a†ν aν = N̂ ,
νν ′
νν ′
(2.184)
ν
also den Gesamtteilchenzahloperator. Es liegt nahe, Ψ† (r)Ψ(r) als Teilchenzahldichteoperator aufzufassen.
Das oben für die Darstellung von Operatoren durch Erzeuger und Vernichter gesagte gilt entsprechend auch
für die Ortsdarstellung. Der Operator der kinetischen Energie
T =
∑
Tνν ′ a†ν aν ′
mit
Tνν ′ = ⟨ν|
νν ′
∫
wird z.B. zu
T =
d3 r d3 r′ T (r, r′ ) Ψ† (r) Ψ(r′ ) mit
p2 ′
|ν ⟩
2m
T (r, r′ ) = ⟨r|
(2.185)
p2 ′
|r ⟩.
2m
(2.186)
Die kinetische Einteilchenenergie in Ortsdarstellung lautet gemäß (2.74)
T (r, r′ ) = −
ℏ2
(∇′ )2 δ(r − r′ ).
2m
(2.187)
Daraus folgt
∫
[
]
ℏ2
= −
d3 r d3 r′ (∇′ )2 δ(r − r′ ) Ψ† (r) Ψ(r′ )
2m
∫
ℏ2
= −
d3 r d3 r′ δ(r − r′ ) Ψ† (r) (∇′ )2 Ψ(r′ )
2m
∫
ℏ2
d3 r Ψ† (r) ∇2 Ψ(r).
= −
2m
T
Mittels partieller Integration können wir dies auch in symmetrischer Form schreiben:
∫
ℏ2
T =+
d3 r ∇Ψ† (r) · ∇Ψ(r).
2m
(2.188)
(2.189)
Analog gilt
∫
V1
=
V2
=
d3 r Ψ† (r) V1 (r) Ψ(r),
∫
1
d3 r1 d3 r2 Ψ† (r1 )Ψ† (r2 ) V2 (r1 , r2 ) Ψ(r2 )Ψ(r1 ).
2
(2.190)
(2.191)
Zumindest die Gleichungen (2.188) und (2.190) sehen so aus wie die Erwartungswerte der entsprechenden Energiebeiträge für ein Einteilchensystem in erster Quantisierung,
∫
ℏ2
d3 r ψ ∗ (r)∇2 ψ(r),
⟨T ⟩ = −
(2.192)
2m
∫
⟨V1 ⟩ =
d3 r ψ ∗ (r) V1 (r) ψ(r).
(2.193)
Ψ ist jetzt aber ein Operator, keine Wellenfunktion. Es scheint so, als ob wir die Einteilchenwellenfunktion ψ(r) zu
Ψ(r) quantisiert“ haben. Daher die Bezeichung Zweite Quantisierung“. Wir haben aber nur einmal quantisiert,
”
”
31
nämlich als wir [x̂, p̂] = iℏ postuliert haben, der Rest folgt aus der Konstruktion des Fock-Raums mittels linearer
Algebra.
Die Ähnlichkeit mit Einteilchenerwartungswerten kann zu einem weiteren Missverständnis führen, das hier ausgeräumt werden soll: Die Wellenfunktion ψ(r) charakterisiert den Zustand eines (Einteilchen-) Systems, nämlich
in der Ortsdarstellung. Der Quantenfeldoperator Ψ(r) charakterisiert dagegen nicht den Zustand eines Systems,
sonders ist ein Operator, der auf (Vielteilchen-) Zustände wirkt. Genauer ist Ψ(r) ein Vernichtungsoperator, der
versucht, ein Teilchen am Ort r zu vernichten. Analog ist ψ ∗ (r)ψ(r) eine Aufenthaltswahrscheinlichkeitsdichte,
aber Ψ† (r)Ψ(r) ein Operator, der prüft, ob am Ort r ein Teilchen vorhanden ist.
Unter Beachtung des Spins lautet der Quantenfeldoperator für Bosonen mit Spin und für Fermionen
∑
∑
Ψσ (r) :=
⟨r, σ|ν⟩ aνσ =
uν (r) aνσ .
(2.194)
ν
ν
Falls in der gewählten Einteilchenbasis die räumlichen Zustände (Wellenfunktionen) vom Spin abhängen, schreiben
wir stattdessen
∑
∑
uνσ (r) aνσ .
(2.195)
⟨r, σ|ν⟩ aνσ =
Ψσ (r) :=
ν
ν
Man zeigt leicht
[Ψσ1 (r1 ), Ψ†σ2 (r2 )] =
{Ψσ1 (r1 ), Ψ†σ2 (r2 )}
2.4
δσ1 σ2 δ(r1 − r2 ) für Bosonen,
= δσ1 σ2 δ(r1 − r2 ) für Fermionen.
(2.196)
(2.197)
Festkörperelektronen
Wir betrachten Elektronen im periodischen Potential eines Festkörpers in zweiter Quantisierung. Als einfachste Näherung nehmen wir die Kerne als unbeweglich und perfekt periodisch angeordnet an und vernachlässigen
zunächst die (Coulomb-) Wechselwirkung zwischen den Elektronen. (Wieso diese Vernachlässigung oft qualitativ richtige Resultate ergibt wird in der Vorlesung Vielteilchentheorie diskutiert.) Dann lautet der EinteilchenHamiltonian in erster Quantisierung
p2
H=
+ V (r)
(2.198)
2m
und der Hamiltonian auf dem Fock-Raum, in zweiter Quantisierung, ist
∑
(Tνν ′ + Vνν ′ ) c†ν cν ′
(2.199)
H̃ =
νν ′
mit einer beliebigen Einteilchenbasis {|ν⟩}. Daher sind die Vielteilchenzustände einfach alle möglichen Kombinationen von besetzten und unbesetzten Einteilchenzuständen |nkσ⟩.
Wir hatten gesehen, dass gilt
∫
ℏ2
Tνν ′ = −
d3 r u∗ν (r) ∇2 uν ′ (r),
(2.200)
2m
∫
Vνν ′ =
d3 r u∗ν (r) V (r) uν ′ (r),
(2.201)
wobei
uν (r) := ⟨r|ν⟩.
(2.202)
Es ist günstig, als Basis die Eigenzustände von H zu verwenden. Da das Potential V (r) gitterperiodisch sein soll,
sind dies Bloch-Zustände (vgl. die Vorlesungen zur Festkörperphysik, Festkörpertheorie und Vielteilchentheorie), multipliziert mit Spin-Zuständen. Die Bloch-Zustände werden durch einen Kristallimpuls k aus der ersten
Brillouin-Zone und einen Bandindex n abgezählt. In Ortsdarstellung lautet die zeitunabhängige SchrödingerGleichung
Hφnk (r)|σ⟩ = ϵnk φnk (r)|σ⟩,
(2.203)
32
wobei nach dem Bloch-Theorem gilt
φnk (r) = eik·r unk (r),
(2.204)
worin unk (r) gitterperiodisch ist. In der Basis der Bloch-Zustände sind die Matrixelemente Tνν ′ und Vνν ′ zunächst
offensichtlich diagonal im Spin und unabhängig vom Spin, wir können die Spin-Indizes weglassen. Es bleiben
∫
ℏ2
Tnk,n′ k′ = −
d3 r φ∗nk (r) ∇2 φn′ k′ (r),
(2.205)
2m
∫
Vnk,n′ k′ =
d3 r φ∗nk (r) V (r) φn′ k′ (r).
(2.206)
Daraus folgt
Hnk,n′ k′
:=
=
=
Tnk,n′ k′ + Vnk,n′ k′
)
( 2
∫
p
d3 r φ∗nk (r)
+ V (r) φn′ k′ (r)
2m
∫
d3 r φ∗nk (r) ϵn′ k′ φn′ k′ (r) = δnn′ δkk′ ϵnk
(2.207)
und schließlich
H̃
=
∑ ∑
Hnk,n′ k′ c†nkσ cn′ k′ σ
nk,n′ k′ σ
=
∑
ϵnk c†nkσ cnkσ ≡
∑
ϵnk n̂nkσ .
(2.208)
nkσ
nkσ
In der Basis der Bloch-Zustände wird H̃ also diagonal in den Quantenzahlen n, k, σ. H̃ ist dann einfach eine
Summe von Besetzungszahloperatoren, gewichtet mit den Bandenergien ϵnk .
Wir haben gesehen, dass die Diagonalisierung eines bilinearen Hamiltonians nur die Lösung einer EinteilchenSchrödinger-Gleichung erfordert. Sobald Wechselwirkungen
nicht vernachlässigt werden können, wird das Problem
( )
viel schwieriger; i.A. muss der Hamiltonian auf dem Nd -dimensionalen N -Teilchen-Hilbertraum HN diagonalisiert
werden. Meist ist man auf Näherungslösungen angewiesen (siehe Vorlesung Vielteilchentheorie).
2.4.1
Der Fermi-See
Im Grundzustand für N Elektronen werden die Einteilchenzustände der Reihe nach mit wachsender Energie ϵnk
aufgefüllt. Die höchste dabei erreichte Energie ist bekanntlich die Fermi-Energie.
nk
ky
leer
EF
kx
Diesen Grundzustand nennt man den Fermi-See.
Bisher hatten wir als Vakuum den Zustand ohne Teilchen definiert. In
• der Festkörperphysik und
33
• der Dirac-Theorie (siehe Kapitel 3)
ist es oft aber sinnvoll, den Fermi-See als neues Vakuum zu betrachten. Dies führt auf die neue Definition von
|0⟩ ≡ |Fermi-See⟩ durch
cnkσ |0⟩ = 0
∀ n, k, σ mit ϵnk > EF ,
(2.209)
c†nkσ |0⟩
∀ n, k, σ mit ϵnk ≤ EF .
(2.210)
=0
(Der Fermi-See enthält kein Fermion mit ϵnk > EF und alle Zustände mit ϵnk ≤ EF sind besetzt.)
2.4.2
Teilchen und Löcher
Wir gewinnen die vorherige Formulierung (das Vakuum wird von allen Vernichtungsoperatoren zerstört) zurück,
indem wir neue Operatoren einführen:
h†nkσ := cnkσ ,
(2.211)
dann ist
hnkσ = c†nkσ .
(2.212)
{hnkσ , h†nkσ } = {c†nkσ , cnkσ } = {cnkσ , c†nkσ } = 1
(2.213)
†
Wir sagen, h erzeugt ein Loch. Offensichtlich ist
usw. Die Löcher sind ebenfalls Fermionen. Weiter ist der Besetzungszahloperator der Löcher
h†nkσ hnkσ = cnkσ c†nkσ = 1 − c†nkσ cnkσ .
(2.214)
Nun ist
cnkσ |0⟩ = 0
hnkσ |0⟩ = 0
∀ n, k, σ mit ϵnk > EF ,
∀ n, k, σ mit ϵnk ≤ EF ,
(2.215)
(2.216)
woraus folgt
c†nkσ cnkσ |0⟩ = 0
für ϵnk > EF ,
(2.217)
h†nkσ hnkσ |0⟩
für ϵnk ≤ EF .
(2.218)
=0
Der Fermi-See enthält also keine Löcher.
Für nicht wechselwirkende Teilchen lautet der Hamiltonian nun
∑
H̃ =
ϵnk c†nkσ cnkσ
nkσ
=
∑
ϵnk c†nkσ cnkσ +
nkσ
ϵnk >EF
=
∑
ϵnk c†nkσ cnkσ +
∑
ϵnk ≤EF
|
{z
ϵnk hnkσ h†nkσ
nkσ
ϵnk ≤EF
ϵnk >EF
=
∑
∑
ϵnk +
}
Vakuumenergie
ϵnk >EF
|
∑
ϵnk (1 − h†nkσ hnkσ )
ϵnk ≤EF
∑
ϵnk c†nkσ cnkσ +
{z
}
ϵnk ≤EF
|
Teilchenenergie
(−ϵnk ) h†nkσ hnkσ .
{z
(2.219)
}
Lochenergie
Wir können eine Konstante zum Einteilchen-Hamiltonian H addieren, so dass die Energien ϵnk relativ zu EF
gemessen werden. Dann schreibt man oft ξnk für die Energien. Es folgt
∑
∑
ξnk c†nkσ cnkσ +
(−ξnk ) h†nkσ hnkσ .
(2.220)
H̃ = Vakuumenergie +
ξnk ≤0
ξnk >0
Die Energien der Teilchen, ξnk , sind nun positiv und ebenso die Energien der Löcher, −ξnk mit ξnk ≤ 0. Es kostet
Energie, ein Teilchen außerhalb des Fermi-Sees zu erzeugen, wie auch, ein Loch innerhalb des Fermi-Sees. Beide
Operationen ändern die Teilchenzahl. Bei festem N ist nur die Erzeugung eines Teilchen-Loch-Paares möglich.
34
ky
nkσ
kx
Diese kostet die Energie ξnk + (−ξn′ k′ ) > 0. Das ist vernünftig, da der Fermi-See der Zustand niedrigster Energie
ist.
2.5
Austausch-Wechselwirkung und Hartree-Fock-Näherung
Der exakte Grundzustand eines wechselwirkenden Mehr-Teilchen-Systems ist i.A. kein Produktzustand. Die
Hartree-Näherung lässt sich als Variationsansatz verstehen, bei dem dieser Zustand durch einen optimalen Produktzustand angenähert wird,
|ψ⟩ ≈ |ν1 , σ1 ⟩|ν2 , σ2 ⟩ · · · |νN , σN ⟩.
(2.221)
Optimal“ bedeutet hier mit minimaler Energie, es handelt sich also um eine Anwendung des Ritzschen Variati”
onsverfahrens. Wir haben aber inzwischen erkannt, dass ein solcher Produktansatz für identische Teilchen nicht die
richtigen Symmetrieeigenschaften hat. Die Hartree-Näherung ist daher nicht gerechtfertigt. Wir sollten stattdessen den optimalen (anti-) symmetrisierten Produktzustand suchen. Das ist die Idee der Hartree-Fock-Näherung.
Wir beschränken uns zunächst auf Fermionen, speziell auf Elektronen.
2.5.1
Direkte und Austausch-Wechselwirkung
Für Elektronen besteht die Hartree-Fock-Näherung darin, eine Einteilchenbasis {|νj , σj ⟩} zu finden, so dass die
Slater-Determinante
|ν1 , σ1 ⟩(1) · · · |ν1 , σ1 ⟩(N ) 1 ..
..
..
Ŝ− |ν1 , σ1 , . . . , νN , σN ⟩ = √ (2.222)
.
.
.
N! |νN , σN ⟩(1) · · · |νN , σN ⟩(N ) den Erwartungswert der Energie, ⟨H⟩, minimiert. Wir betrachten konkret die Coulomb-Wechselwirkung. Der
Hamiltonian lautet
(2.223)
H = T + V + VC
| {z }
=H0
mit der kinetischen Energie T , dem (spinunabhängigen) Einteilchenpotential V und der Coulomb-Wechselwirkung
VC , siehe 2.2.2. Wir hatten gesehen, dass gilt
∑∑∑
Tµj µ′j |µj , σj ⟩⟨µ′j , σj |,
T =
(2.224)
j
V
=
µj µ′j σj
∑∑∑
j
Vµj µ′j |µj , σj ⟩⟨µ′j , σj |
µj µ′j σj
35
(2.225)
(Hier ist nur der Spin-Index hinzugekommen, von dem kinetische Energie und Potential nicht abhängen sollen).
Damit ist
∑∑∑
1 ∑
⟨H0 ⟩ =
sgn(p) sgn(p′ ) ⟨νpN , σpN | · · · ⟨νp1 , σp1 |
(Tµj µ′j + Vµj µ′j )
N! ′
′ σ
j
p,p
µj µj
j
|µj , σj ⟩⟨µ′j , σj ||νp′1 , σp′1 ⟩ · · · |νp′N , σp′N ⟩
=
∑∑∑
1 ∑
sgn(p) sgn(p′ )
(Tµj µ′j + Vµj µ′j )⟨νp1 , σp1 |νp′1 , σp′1 ⟩ · · · ⟨νpj−1 , σpj−1 |νp′j−1 , σp′j−1 ⟩
N! ′
′ σ
j
p,p
µj µj
j
× ⟨νpj , σpj |µj , σj ⟩⟨µ′j , σj |νp′j , σp′j ⟩⟨νpj+1 , σpj+1 |νp′j+1 , σp′j+1 ⟩ · · · ⟨νpN , σpN |νp′N , σp′N ⟩
=
∑∑∑
1 ∑
sgn(p) sgn(p′ )
(Tµj µ′j + Vµj µ′j )
N! ′
′ σ
j
p,p
µj µj
j
× δp1 p′1 · · · δpj−1 p′j−1 δνpj µj δσpj σj δµ′j νp′ δσj σp′ δpj+1 p′j+1 · · · δpN p′N ,
(2.226)
j
j
wobei wir verwendet haben, dass jeder Satz νj ,σj von Quantenzahlen höchstens einmal auftritt. Sind die beiden
Permutationen p und p′ nicht identisch, so unterscheiden sie sich an mindestens zwei Stellen, so dass mindestens
ein Kronecker-δ verschwindet. Also ergibt sich
1 ∑∑
... =
(Tνpj νpj + Vνpj νpj ).
(2.227)
N! j p
Die (N − 1)! Permutationen, die pj unverändert lassen, führen einfach zu einem Zählfaktor. Mit k := pj erhalten
wir
(N − 1)! ∑
(Tνk νk + Vνk νk )
... =
| N
{z! } jk
1/N
∑
=
(Tνk νk + Vνk νk )
k
=
∑∫
3
d r
u∗νk (r)
(
k
)
ℏ2 2
−
∇ + V (r) uνk (r).
2m
(2.228)
Das Ergebnis ist nicht überraschend. Für die Coulomb-Wechselwirkung erhalten wir
∑ ∑ ∑
1 1 ∑
VµCi µj µ′i µ′j
⟨VC ⟩ =
sgn(p) sgn(p′ ) ⟨νpN , σpN | · · · ⟨νp1 , σp1 |
2 N! ′
′ ′ σ σ
p,p
i̸=j µi µj µi µj
i
j
|µi , σi ⟩|µj , σj ⟩⟨µ′j , σj |⟨µ′i , σi ||νp′1 , σp′1 ⟩ · · · |νp′N , σp′N ⟩
=
∑
1 1 ∑
sgn(p) sgn(p′ )
2 N! ′
p,p
i̸=j
∑
µi µj µ′i µ′j
∑
VµCi µj µ′i µ′j δp1 p′1 · · · δpN p′N
|
{z
}
σi σj
ohne Teilchen i,j
′
× ⟨νpi , σpi |µi , σi ⟩⟨νpj , σpj |µj , σj ⟩⟨µj , σj |νp′j , σp′j ⟩⟨µ′i , σi |νp′i , σp′i ⟩.
(2.229)
Für eine gegebene Permutation p ist der Summand nun i.A. für zwei p′ von Null verschieden: Für p′ = p und für
p′ = (i, j) × p, d.h. für den Summanden mit einer zusätzlichen Permutation von i und j. In den beiden Fällen
erhalten wir
∑
′
′
⟨νpi , σpi |µi , σi ⟩⟨νpj , σpj |µj , σj ⟩⟨µj , σj |νp′j , σp′j ⟩⟨µi , σi |νp′i , σp′i ⟩
σi σj
=
∑
σi
δσpi σi δσi σpi
∑
p′ =p
δσpj σj δσj σpj δνpi µi δνpj µj δµ′j νpj δµ′i νpi
σj
= δνpi µi δνpj µj δµ′j νpj δµ′i νpi
36
(2.230)
bzw.
∑
⟨νpi , σpi |µi , σi ⟩⟨νpj , σpj |µj , σj ⟩⟨µ′j , σj |νp′j , σp′j ⟩⟨µ′i , σi |νp′i , σp′i ⟩
p′ =(i,j)×p
σi σj
=
∑
⟨νpi , σpi |µi , σi ⟩⟨νpj , σpj |µj , σj ⟩⟨µ′j , σj |νpi , σpi ⟩⟨µ′i , σi |νpj , σpj ⟩
σi σj
=
∑
δσpi σi δσi σpj δσpj σj δσj σpi δνpi µi δνpj µj δµ′j νpi δµ′i νpj
σi σj
= δσpi σpj δνpi µi δνpj µj δµ′j νpi δµ′i νpj .
(2.231)
Offensichtlich ist sgn((i, j) × p) = −sgn(p). Wir erhalten
]
1 1 ∑∑[
sgn(p) sgn(p) VνCp νp νp νp + sgn(p) sgn((i, j) × p) δσpi σpj VνCp νp νp νp
⟨VC ⟩ =
i
j
i
j
i
j
j
i
2 N!
i̸=j p
)
1 1 ∑∑( C
k := pi , l := pj
Vνp νp νp νp − δσpi σpj VνCp νp νp νp
=
i
j
i
j
i
j
j
i
2 N!
p
i̸=j
=
)
1 (N − 2)! ∑ ∑ ( C
Vνk νl νk νl − δσk σl VνCk νl νl νk
2| N
{z! }
i̸=j k̸=l
1
N (N −1)
=
=
)
1 ∑( C
Vνk νl νk νl − δσk σl VνCk νl νl νk
2
k̸=l
∫
1 e2 ∑
1
d3 r d3 r′ u∗νl (r′ ) u∗νk (r)
[uνk (r) uνl (r′ ) − δσk σl uνl (r) uνk (r′ )] .
2 4πϵ0
|r − r′ |
(2.232)
k̸=l
Den ersten Term hätten wir auch für unterscheidbare Teilchen bzw. Produktzustände gefunden. Dieser Term,
genannt direkte Coulomb-Wechselwirkung, tritt auch in der Hartree-Näherung auf. Der zweite Term beruht auf
der Antisymmetrisierung, ist also ein rein quantenmechanischer Beitrag und tritt nur für identische Teilchen auf.
Beachte:
• Dieser Term hat ein negatives Vorzeichen aufgrund der insgesamt ungeraden Anzahl von Permutationen in
p und p′ .
• Er tritt nur zwischen Teilchen mit demselben Spin auf (beachte den Faktor δσk σl ).
Dieser Beitrag schwächt die Coulomb-Abstoßung aufgrund der direkten Wechselwirkung ab, aber nur für Elektronen mit demselben Spin, für die also das Pauli-Prinzip gilt. Die Ursache ist, dass die Wahrscheinlichkeitsdichte
für zwei identische Fermionen für r′ → r gegen Null geht. Die Coulomb-Abstoßung ist daher weniger stark als für
unterscheidbare Teilchen. Den zweiten Term nennt man Austausch-Wechselwirkung, weil die Zustände νk , νl im
letzten Faktor vertauscht auftreten.
Aufenthaltswahrscheinlichkeitsdichte:
| (r,r')|²
Austauschloch
0
|r'-r|
~de Broglie-Wellenlänge
37
2.5.2
Hartree-Fock-Gleichungen
Die Aufgabe besteht nun darin, die Einteilchenzustände |νj , σj ⟩ so zu variieren, dass der Erwartungswert
†
⟨ν1 , σ1 , . . . , νN , σN |Ŝ−
(H0 + VC )Ŝ− |ν1 , σ1 , . . . , νN , σN ⟩
(2.233)
minimal wird. Dabei müssen die Nebenbedingungen der Orthonormierung erfüllt sein:
⟨νi , σi |νj , σj ⟩ = δνi νj δσi σj .
(2.234)
⟨r|νj , σj ⟩ = φνj σj (r) |σj ⟩,
(2.235)
Wir schreiben in der Ortsdarstellung
wobei wir zugelassen haben, dass die Wellenfunktion vom Spin σj abhängt. Das ist für magnetische Systeme
wichtig. Die Orthonormierungsbedingung lautet nun
∫
d3 r φ∗νi σi (r) φνj σj (r) ⟨σi |σj ⟩ = δνi νj δσi σj .
(2.236)
Der Spin-Anteil der Gleichung ist trivial erfüllt, wir müssen also nur
∫
d3 r φ∗νi σ (r) φνj σ (r) = δνi νj
(2.237)
gewährleisten. Diese Nebenbedingungen implementieren wir mit Hilfe von Lagrange-Multiplikatoren ϵνi νj . Die
Extremalbedingung lautet dann
(
{∑∫
)
∫
ℏ2 2
1
1 e2 ∑
3
∗
d r φνj σj (r) −
d3 r d3 r′ φ∗νj σj (r′ ) φ∗νi σi (r)
δ
∇ + V (r) φνj σj (r) +
2m
2
4πϵ
|r
−
r′ |
0
j
i̸=j
}
∫
∑
× [ φνi σi (r) φνj σj (r′ ) − δσi σj φνj σj (r) φνi σi (r′ ) ] −
ϵνi νj δσi σj d3 r φ∗νi σi (r) φνj σj (r) = 0. (2.238)
ij
38
Hier sind φ und φ∗ linear unabhängig, da Re φ und Im φ linear unabhängig sind. (Die Komplexkonjugation z → z ∗
ist keine lineare Abbildung.) Die Extremalbedingung erfordert
0 =
=
δ
δφ∗νk σk (s)
{· · · }
(
)
ℏ2 2
d3 r δjk δ(r − s) −
∇ + V (r) φνj σj (r)
2m
j
∫
1 e2 ∑
+
d3 r d3 r′ [ δjk δ(r′ − s) φ∗νi σi (r) + φ∗νj σj (r′ ) δik δ(r − s) ]
2 4πϵ0
∑∫
i̸=j
1
[ φνi σi (r) φνj σj (r′ ) − δσi σj φνj σj (r) φνi σi (r′ ) ]
|r − r′ |
∫
∑
−
ϵνi νj δσi σj d3 r δik δ(r − s) φνj σj (r)
×
ij
(
−
=
ℏ2 2
∇ + V (s)
2m s
)
φνk σk (s) +
∫
1 e2 ∑
1
d3 r′ φ∗νj σj (r′ ) ′
2 4πϵ0
|r − s|
j(j̸=k)
′
× [φνj σj (r ) φνk σk (s) + φνk σk (s) φνj σj (r′ ) − δσj σk φνk σk (r′ ) φνj σj (s) − δσj σk φνj σj (s) φνk σk (r′ )]
∑
−
ϵνk νj δσk σj φνj σj (s)
(
=
j
ℏ2 2
∇ + V (s)
−
2m s
)
∫
1
e2 ∑
d3 r′ φ∗νj σj (r′ ) ′
φνk σk (s) +
4πϵ0
|r − s|
j(j̸=k)
× [φνj σj (r′ ) φνk σk (s) − δσj σk φνk σk (r′ ) φνj σj (s)]
∑
ϵνk νj δσk σj φνj σj (s).
−
(2.239)
j
Der letzte Term hat die Form einer Matrix (ϵνk νj δσk σj ) multipliziert mit einem Vektor (φνj σj (s)). Wir können
ihn durch eine unitäre Transformation der φνj σj (s) diagonalisieren. Wir bezeichnen die transformierten Wellenfunktionen mit ψνσ (s) und die Eigenwerte von (ϵνk νj δσk σj ) mit ϵνσ . Die übrigen Terme ändern unter der unitären
Transformation ihre Form nicht, da sie ohnehin für eine beliebige Einteilchenbasis hergeleitet wurden. Mit den
Umbenennungen s → r, νk → ν, σk → σ, νj → ν ′ , σj → σ ′ erhalten wir
(
)
∫
∑
ℏ2 2
1
e2
0 =
−
∇ + V (r) ψνσ (r) +
d3 r′ ψν∗′ σ′ (r′ ) ′
ψν ′ σ′ (r′ ) ψνσ (r)
2m
4πϵ0
|r
− r|
′ ′
ν σ
[(ν ′ ,σ ′ )̸=(ν,σ)]
−
∫
e2 ∑
1
d3 r′ ψν∗′ σ (r′ ) ′
ψνσ (r′ ) ψν ′ σ (r) − ϵνσ ψνσ (r),
4πϵ0
|r − r|
′
(2.240)
ν
(ν ′ ̸=ν)
wobei die Summen nur über besetzte Einteilchenzustände zu bilden sind. Es folgt sofort die Hartree-Fock-Gleichung
]
[
∫
′ 2
∑
e2
ℏ2 2
3 ′ |ψν ′ σ ′ (r )|
∇ + V (r) +
d r
ψνσ (r)
−
2m
4πϵ0
|r′ − r|
′ ′
ν σ
[(ν ′ ,σ ′ )̸=(ν,σ)]
−
∫
e2 ∑
ψ ∗′ (r′ ) ψνσ (r′ ) ψν ′ σ (r)
d3 r ′ ν σ
= ϵνσ ψνσ (r),
4πϵ0
|r′ − r|
′
(2.241)
ν
(ν ′ ̸=ν)
wobei die Summen weiterhin nur besetzte Einteilchenzustände umfassen. Sie hat die Form einer nichtlinearen
Verallgemeinerung der Einteilchen-Schrödinger-Gleichung. Es handelt sich formal um eine Integrodifferentialgleichung, die i.A. nicht analytisch lösbar ist. Die Lösung erfolgt daher numerisch, oft durch Iteration.
39
Der dritte (Hartree-) Term beschreibt die Coulomb-Wechselwirkung mit den übrigen Elektronen. Er ist ohne
Weiteres plausibel. Der vierte (Austausch- oder Fock-) Term ist nicht lokal, da ψνσ am Ort r′ auftritt und
beschreibt den rein quantenmechanischen Austauscheffekt.
Der minimale Wert der Energie, ⟨H⟩HF , ergibt sich aus den Lösungen der Hartree-Fock-Gleichung zu
)
(
∑∫
ℏ2 2
3
∗
⟨H⟩HF =
d r ψνσ (r) −
∇ + V (r) ψνσ (r)
2m
νσ
∫
∑
|ψνσ (r)|2 |ψν ′ σ′ (r′ )|2
1 e2
+
d3 r d3 r′
2 4πϵ0
|r′ − r|
′
′
νν σσ
[(ν,σ)̸=(ν ′ ,σ ′ )]
−
∫
∗
1 e2 ∑
ψ ∗′ (r′ ) ψνσ
(r) ψν ′ σ (r) ψνσ (r′ )
d3 r d3 r′ ν σ
.
2 4πϵ0
|r′ − r|
′
(2.242)
νν σ
[ν̸=ν ′ ]
Mit der Hartree-Fock-Gleichung wird dies (beachte die Vorzeichenwechsel!)
∫
∑∫
∑
1 e2
|ψνσ (r)|2 |ψν ′ σ′ (r′ )|2
∗
⟨H⟩HF =
d3 r ψνσ
(r) ϵνσ ψνσ (r) −
d3 r d 3 r ′
2 4πϵ0
|r′ − r|
′
′
νσ
+
=
1 e2
2 4πϵ0
∑
νσ
+
ϵνσ −
∑ ∫
νν σσ
[(ν,σ)̸=(ν ′ ,σ ′ )]
d3 r d3 r′
νν ′ σ
[ν̸=ν ′ ]
1 e2
2 4πϵ0
∗
(r) ψν ′ σ (r) ψνσ (r′ )
ψν∗′ σ (r′ ) ψνσ
|r′ − r|
∫
∑
d3 r d3 r′
νν ′ σσ ′
[(ν,σ)̸=(ν ′ ,σ ′ )]
|ψνσ (r)|2 |ψν ′ σ′ (r′ )|2
|r′ − r|
∫
∗
1 e2 ∑
ψ ∗′ (r′ ) ψνσ
(r) ψν ′ σ (r) ψνσ (r′ )
d3 r d3 r′ ν σ
,
2 4πϵ0
|r′ − r|
′
(2.243)
νν σ
[ν̸=ν ′ ]
wobei die Summen wieder nur besetzte Zustände enthalten. Das erste Integral nennt man Coulomb-Integral, das
zweite Austauschintegral. Beachte, dass die Summe der Hartree-Fock-Eigenenergien ϵνσ das Coulomb-Integral
zweifach mit positivem Vorzeichen und das Austauschintegral zweifach mit negativem Vorzeichen enthält. Insgesamt enthält ⟨H⟩HF also das Coulomb-Integral einfach positiv und das Austauschintegral einfach negativ. Das
stimmt mit der vorherigen Beobachtung überein, wonach die Coulomb-Abstoßung die Energie erhöht, die Austauschwechselwirkung sie aber wieder absenkt.
Wie immer beim Ritz-Verfahren ist ⟨H⟩HF größer als oder gleich der exakten Grundzustandsenergie,
⟨H⟩HF ≥ E0
(2.244)
Der exakte Grundzustand ist i.A. keine Slater-Determinante von Einteilchenzuständen. Der nächste Schritt zur
Verbesserung der Näherung ist die sogenannte configuration interaction (CI) approximation. Dabei setzt man eine
Superposition mehrerer Slater-Determinanten an.
2.5.3
Hartree-Fock-Näherung in zweiter Quantisierung
Die Hartree-Fock-Näherung lässt sich kompakt mit Hilfe der zweiten Quantisierung formulieren. Die Suche nach
der optimalen Slater-Determinante entspricht hier der Suche nach dem optimalen bilinearen Hamiltonian. In
beiden Formulierungen werden die Einteilchenzustände variiert. Der volle Hamiltonian lautet in zweiter Quantisierung
H = H0 + VC
(2.245)
40
mit
H0
∑
=
kσ
VC
1
2
=
ξk c†kσ ckσ ,
∑
∑
kk′ k′′ k′′′
σσ ′
(2.246)
†
†
C
′′ ′
′′′
Vkk
′ k′′ k′′′ c
kσ ck′ σ ′ ck σ ck σ ,
(2.247)
wobei wir uns auf ein Band beschränkt und ausgenutzt haben, dass die Coulomb-Wechselwirkung nicht vom Spin
abhängt. Die Wechselwirkung erhält jedoch auch den Gesamtimpuls,
k + k′ = k′′ + k′′′ .
(2.248)
Mit k1 = k′′′ , k2 = k′′ , q = k − k′′′ können wir daher schreiben
VC =
1 ∑ ∑ C
Vk1 k2 q c†k1 +q,σ1 c†k2 −q,σ2 ck2 σ2 ck1 σ1 .
2
σ σ
k1 k2 q
1
(2.249)
2
Im Fall freier Elektronen hat VkC1 k2 q eine einfache Form:
VkC1 k2 q
=
=
=
=
e2
4πϵ0
∫
d3 r1 d3 r2
φ∗k1 +q (r1 ) φ∗k2 −q (r2 ) φk2 (r2 ) φk1 (r1 )
|r1 − r2 |
∫
e2 1
e−i(k1 +q)·r1 e−i(k2 −q)·r2 eik2 ·r2 eik1 ·r1
d3 r1 d3 r2
2
4πϵ0 V
|r1 − r2 |
∫
2
e
1
1
d3 r1 d3 r2
e−iq·(r1 −r2 )
4πϵ0 V 2
|r1 − r2 |
∫
e2 1
1 iq·∆r
1 e2 1
1
d3 r1 d3 ∆r
e
=
=: VC (q).
2
4πϵ0 V
∆r
V ϵ0 q2
V
| {z }
(2.250)
=V
In diesem Fall hängt VkC1 k2 q = V1 VC (q) also nur vom Impulsübertrag q ab.
Wir diskutieren die oft benötigte Fourier-Transformierte des Coulomb-Potentials etwas genauer. Wir schreiben
r anstelle von ∆r. Gesucht ist
∫
e2 eiq·r
VC (q) = d3 r
.
(2.251)
4πϵ0 r
Da dieses Integral bei großen r nicht konvergiert, regularisieren wir es durch Übergang zum Yukawa-Potential
∫
e2 eiq·r e−κr
VY (q) = d3 r
.
(2.252)
4πϵ0
r
und lassen am Ende der Rechnung κ → 0 gehen. Das Yukawa-Potential beschreibt eine abgeschirmte CoulombWechselwirkung. Es gilt
∫
eiqr cos θ e−κr
e2
dr dθ dφ r2 sin θ
VY (q) =
4πϵ0
r
∫ 1
2 ∫ ∞
e
du eiqru
=
dr r e−κr
2ϵ0 0
−1
|
{z
}
=
e2 1
ϵ0 q
∫
|0
iqr −e−iqr
iqr
=e
∞
=2
sin qr
qr
e2
1
dr e−κr sin qr =
.
2
ϵ0 q + κ2
{z
}
q
= q2 +κ
2
41
(2.253)
Im Limes κ → 0 erhalten wir
e2 1
.
ϵ0 q 2
VC (q) =
(2.254)
Dieses Ergebnis erhält man übrigens sofort aus der Poisson-Gleichung für eine Punktladung:
∇2 ϕ = −
e2
δ(r).
ϵ0
(2.255)
Mittels Fourier-Transformation folgt
−q 2 ϕ(q) =
⇒
⇒
ϕ(q) =
VC (q) =
e
ϵ0
e 1
ϵ0 q 2
−
e ϕ(q) =
(2.256)
(2.257)
e2 1
.
ϵ0 q 2
(2.258)
Die Abhängigkeit 1/q 2 ist unabhängig von der Dimension des Raumes und ist in gewissem Sinne fundamentaler
als das Coulomb-1/r-Gesetz, das speziell für drei Dimensionen gilt.
Nun wollen wir H = H0 + VC durch einen bilinearen Ausdruck annähern. Im Wesentlichen machen wir eine
Mean-Field-Näherung. Zur Wiederholung: Für zwei Observablen A, B schreiben wir
A = ⟨A⟩ + δA,
B = ⟨B⟩ + δB,
(2.259)
(2.260)
wobei ⟨A⟩, ⟨B⟩ die (thermischen) Mittelwerte und δA, δB die Fluktuationen repräsentieren. Dann ist
AB = ⟨A⟩⟨B⟩ + ⟨A⟩δB + δA⟨B⟩ + δA δB
(2.261)
und die Mean-Field-Näherung besteht im Weglassen der von höherer Ordnung kleinen“ Terme δA δB:
”
∼ ⟨A⟩⟨B⟩ + ⟨A⟩δB + δA⟨B⟩
AB =
=
=
⟨A⟩⟨B⟩ + ⟨A⟩(B − ⟨B⟩) + (A − ⟨A⟩)⟨B⟩
⟨A⟩B + A⟨B⟩ − ⟨A⟩⟨A⟩.
(2.262)
Wenn wir dieses Schema naiv auf VC anwenden, erhalten wir
A =
c†k1 +q,σ1 ck1 σ1 ,
(2.263)
B
c†k2 −q,σ2 ck2 σ2 ,
(2.264)
=
also
c†k1 +q,σ1 c†k2 −q,σ2 ck2 σ2 ck1 σ1
†
†
†
†
∼
= ⟨ck1 +q,σ1 ck1 σ1 ⟩ck2 −q,σ2 ck2 σ2 + ck1 +q,σ1 ck1 σ1 ⟨ck2 −q,σ2 ck2 σ2 ⟩
− ⟨c†k1 +q,σ1 ck1 σ1 ⟩⟨c†k2 −q,σ2 ck2 σ2 ⟩.
(2.265)
Das ist die Hartree-Näherung. Jedoch ist unsere Wahl der Operatoren A, B nicht die einzig mögliche. Ebenso gut
ist
A′
= c†k1 +q,σ1 ck2 σ2 ,
(2.266)
′
c†k2 −q,σ2 ck1 σ1 .
(2.267)
B
=
Um auf die Form A′ B ′ zu kommen, bedarf es einer ungeraden Zahl von Vertauschungen, daher erhält der gesamte
Term ein zusätzliches Minuszeichen. Die Hartree-Fock-Näherung besteht nun darin, die beiden Möglichkeiten zu
42
addieren. (Warum das vernünftig ist und insbesondere keine Faktoren von 1/2 auftreten, wird in der Vielteilchentheorie erklärt.) Wir erhalten
∼
=
c†k1 +q,σ1 c†k2 −q,σ2 ck2 σ2 ck1 σ1
⟨c†k1 +q,σ1 ck1 σ1 ⟩c†k2 −q,σ2 ck2 σ2 + c†k1 +q,σ1 ck1 σ1 ⟨c†k2 −q,σ2 ck2 σ2 ⟩
− ⟨c†k1 +q,σ1 ck1 σ1 ⟩⟨c†k2 −q,σ2 ck2 σ2 ⟩
− ⟨c†k1 +q,σ1 ck2 σ2 ⟩c†k2 −q,σ2 ck1 σ1 − c†k1 +q,σ1 ck2 σ2 ⟨c†k2 −q,σ2 ck1 σ1 ⟩
+ ⟨c†k1 +q,σ1 ck2 σ2 ⟩⟨c†k2 −q,σ2 ck1 σ1 ⟩.
(2.268)
Die letzten drei sind hier die Austauschterme. Unter der Annahme, dass die Wechselwirkung weder die
Translations- noch die Spin-Rotations-Symmetrie bricht, können wir schreiben
= δq0
⟨c†k2 −q,σ2 ck2 σ2 ⟩
= δq0
⟨c†k1 +q,σ1 ck2 σ2 ⟩
= δk1 +q,k2 δσ1 σ2
⟨c†k2 −q,σ2 ck1 σ1 ⟩
= δk1 +q,k2 δσ1 σ2
Damit ist
H∼
= HHF
:=
=
n̄k1
,
2
n̄k2
,
2
⟨c†k1 +q,σ1 ck1 σ1 ⟩
∑
(2.269)
(2.270)
n̄k2
,
2
n̄k1
.
2
(2.271)
(2.272)
(
1∑ C
n̄k′
n̄k′
1∑ C
Vk′ ,k,0
Vk,k′ ,0
+
2 ′ ′
2
2 ′ ′
2
kσ
kσ
kσ
)
n̄k′
n̄k′
1∑ C
1∑ C
V ′ ′
V ′
c†kσ ckσ + const
−
−
′
2 ′ k,k ,k −k 2
2 ′ k ,k,k−k 2
k
k
)
∑
∑(
∑
1
C
C
′
′
Vk′ ,k,0 n̄k −
ξk +
Vk′ ,k,k−k′ n̄k c†kσ ckσ + const.
2
k′
kσ
k′
|
{z
} |
{z
}
ξk +
Hartree−Term
(2.273)
Fock−Term
C
C
2
Wir haben die Symmetrie Vk,k
′ ,−q = Vk′ ,k,q ausgenutzt (ohne Beweis; für freie Elektronen, VC ∼ 1/q , gilt dies
offensichtlich). Im nächsten Schritt müssten wir
∑ †
n̄k =
⟨ckσ ckσ ⟩
(2.274)
σ
selbstkonsistent mit Hilfe des genäherten (Hartree-Fock-) Hamiltonians HHF bestimmen und das Ergebnis in HHF
einsetzen. Die praktische Rechnung erfolgt wieder durch Iteration. Man kann zeigen, dass dieses Verfahren zum
oben für die erste Quantisierung diskutierten äquivalent ist.
2.5.4
Das Wasserstoffmolekül
Zur Illustration des Pauli-Prinzips und der Austauschwechselwirkung betrachten wir das H2 -Molekül aus zwei
Protonen und zwei Elektronen. Die Protonen bewegen sich aufgrund ihrer großen Masse viel langsamer als die
Elektronen und können im Folgenden als ruhend betrachtet werden. Dann lautet der Hamiltonian in erster
Quantisierung
(
)]
(
)
2 [ 2
∑
e2
1
1
e2
1
1
pi
−
+
+
+
(2.275)
H=
2m 4πϵ0 riA
riB
4πϵ0 r12
rAB
i=1
mit den Abständen der Elektronen von den Protonen,
riJ := |ri − RJ |,
i = 1, 2, J = A, B,
43
(2.276)
dem Abstand der Elektronen voneinander,
r12 := |r1 − r2 |,
(2.277)
rAB := |RA − RB |.
(2.278)
und dem Abstand der Protonen voneinander,
H kommutiert mit dem Gesamtspin S = S1 + S2 der Elektronen. Daher können wir die Eigenzustände von H
zugleich als Eigenzustände |s, m⟩ von S2 und Sz wählen.
Diese Spin-Zustände sind bekannt: Es gibt einen Singulett-Zustand
|0, 0⟩ =
|↑↓⟩ − |↓↑⟩
√
,
2
(2.279)
sowie drei Triplett-Zustände
|1, 1⟩ =
|1, 0⟩ =
|1, −1⟩ =
|↑↑⟩,
|↑↓⟩ + |↓↑⟩
√
,
2
|↓↓⟩.
(2.280)
(2.281)
(2.282)
Wir wissen aus 2.2.1, dass die räumliche Wellenfunktion für das Singulett (Triplett) symmetrisch (antisymmetrisch) sein muss. Sie lässt sich aber nicht exakt bestimmen; das Problem ist die Elektron-Elektron-Wechselwirkung
e2 1
.
4πϵ0 r12
(2.283)
Als grobe Näherung, die aber die Diskussion der wesentlichen Effekte gestattet, nehmen wir an, dass die Wellenfunktion durch die Grundzustandswellenfunktionen
1
ψnlm (r) = ψ100 (r) = √ 3/2 e−r/aB
πaB
(2.284)
der beiden H-Atome für sich allein approximiert werden kann (aB ist der Bohr-Radius). Der räumliche Hilbertraum ist also zweidimensional und wird von
|ψ0A ⟩,
|ψ0B ⟩
(2.285)
aufgespannt, wobei
⟨r|ψ0A ⟩
⟨r|ψ0B ⟩
= ψ0A (r) = ψ100 (r − RA ),
= ψ0B (r) = ψ100 (r − RB ).
(2.286)
(2.287)
Da |ψ0A ⟩ und |ψ0B ⟩ zu verschiedenen Atomen gehören, sind sie nicht orthogonal. Ihr Überlappintegral ist
∫
|r−RA |
|r−RA |
1
−
−
IAB = ⟨ψ0A |ψ0B ⟩ =
d3 r e aB e aB
3
πaB
(
)
rAB
r2
=
1+
+ AB
exp (−rAB /aB ) > 0
(2.288)
aB
3a2B
mit rAB = |RA − RB |. Für den Singulett-Zustand finden wir die (symmetrischen) Wellenfunktionen
ψ0A (r1 )ψ0A (r2 ),
ψ0A (r1 )ψ0B (r2 ) + ψ0B (r1 )ψ0A (r2 )
√ √
,
2
2 1 + IAB
(2.289)
ψ0B (r1 )ψ0B (r2 ).
(2.291)
44
(2.290)
Diese sind linear unabhängig, aber nicht orthogonal, und spannen einen dreidimensionalen ZweiteilchenHilbertraum auf. Das Problem ist jetzt im Prinzip ohne weitere Näherungen lösbar, da es auf die Diagonalisierung
einer 3 × 3-Matrix hinausläuft.
Wir nähern aber noch weiter. In den Zuständen
ψ0A (r1 )ψ0A (r2 ),
ψ0B (r1 )ψ0B (r2 )
(2.292)
befinden sich beide Elektronen bevorzugt in der Nähe desselben Protons. Ihre Coulomb-Abstoßung ist daher
besonders groß. Die Heitler-London-Näherung besteht darin, diese Zustände zu vernachlässigen. Dann ist die
Wellenfunktion im Singulett-Zustand
φs (r1 , r2 ) =
ψ0A (r1 )ψ0B (r2 ) + ψ0B (r1 )ψ0A (r2 )
√ √
.
2
2 1 + IAB
(2.293)
Im Triplett-Zustand kann die (antisymmetrische) Wellenfunktion nur lauten
φt (r1 , r2 ) =
ψ0A (r1 )ψ0B (r2 ) − ψ0B (r1 )ψ0A (r2 )
√ √
.
2
2 1 − IAB
(2.294)
Die entsprechenden Dichten
∫
ns,t (r) :=
3 ′
′
∫
d r |ϕs,t (r, r )| ≡
2
d3 r′ |ϕs,t (r′ , r)|2
(2.295)
sind hier skizziert:
+
+
+
ns
+
nt
Die Aufgabe ist nun festzustellen, welcher der beiden Zustände bei welchem Kernabstand rAB den Energieerwartungswert ⟨H⟩ minimiert. Wir verwenden die exakte Schrödinger-Gleichung für das Wasserstoffatom,
( 2
)
pi
e2 1
−
ψ0A (ri ) = E0 ψ0A (ri )
(2.296)
2m 4πϵ0 riA
mit der Grundzustandsenergie E0 . Außerdem benötigen wir die Größen
∫
d3 r1 d3 r2 ψ0A (r1 )ψ0B (r2 )Hψ0A (r1 )ψ0B (r2 )
( 2
)
∫
∫
p1
e2 1
=
d3 r1 ψ0A (r1 )
−
ψ0A (r1 ) d3 r2 ψ0B (r2 )ψ0B (r2 )
2m 4πϵ0 r1A
( 2
)
∫
∫
p2
e2 1
+ d3 r1 ψ0A (r1 )ψ0A (r1 ) d3 r2 ψ0B (r2 )
−
ψ0B (r2 )
2m 4πϵ0 r2B
∫
∫
e2 1 A
− d3 r1 ψ0A (r1 )
ψ0 (r1 ) d3 r2 ψ0B (r2 )ψ0B (r2 )
4πϵ0 r1B
∫
∫
e2 1 B
− d3 r1 ψ0A (r1 )ψ0A (r1 ) d3 r2 ψ0B (r2 )
ψ (r2 )
4πϵ0 r2A 0
∫
∫
e2
1
+
d3 r1 ψ0A (r1 )ψ0A (r1 ) d3 r2 ψ0B (r2 )ψ0B (r2 )
4πϵ0 rAB
∫
e2 1 A
+ d3 r1 d3 r2 ψ0A (r1 )ψ0B (r2 )
ψ (r1 )ψ0B (r2 )
4πϵ0 r12 0
= 2E0 + CAB
45
(2.297)
mit dem (verallgemeinerten) Coulomb-Integral
{
}
∫
∫
∫
e2
1
|ψ0A (r1 )|2
|ψ0B (r2 )|2
|ψ0A (r1 )|2 |ψ0B (r2 )|2
3
3
3
3
CAB :=
− d r2
+ d r1 d r2
.
− d r1
4πϵ0 rAB
|r1 − RB |
|r2 − RA |
|r1 − r2 |
Analog gilt
Andererseits ist
(2.298)
∫
d3 r1 d3 r2 ψ0B (r1 )ψ0A (r2 )Hψ0B (r1 )ψ0A (r2 ) = 2E0 + CAB .
(2.299)
2
d3 r1 d3 r2 ψ0A (r1 )ψ0B (r2 )Hψ0B (r1 )ψ0A (r2 ) = 2E0 IAB
+ JAB
(2.300)
∫
mit dem (verallgemeinerten) Austauschintegral
{
∫
∫
e2
1 2
ψ A (r1 )ψ0B (r1 )
ψ B (r2 )ψ0A (r2 )
JAB :=
IAB − d3 r1 0
IAB − d3 r2 0
IAB
4πϵ0 rAB
|r1 − RB |
|r2 − RA |
}
∫
ψ A (r1 )ψ0B (r2 )ψ0B (r1 )ψ0A (r2 )
+ d3 r1 d3 r2 0
.
|r1 − r2 |
(2.301)
Damit ist
Es := ⟨φs |H|φs ⟩
1
2
2 ) (4E0 + 2CAB + 4E0 IAB + 2JAB )
2(1 + IAB
CAB + JAB
= 2E0 +
,
2
1 + IAB
=
1
2
2 ) (4E0 + 2CAB − 4E0 IAB − 2JAB )
2(1 − IAB
CAB − JAB
= 2E0 +
.
2
1 − IAB
Et := ⟨φt |H|φt ⟩
(2.302)
=
(2.303)
Es folgt
Et − Es
=
CAB − JAB
CAB + JAB
−
2
2
1 − IAB
1 + IAB
=
2
2
(CAB − JAB )(1 + IAB
) − (CAB + JAB )(1 − IAB
)
4
1 − IAB
= 2
2
CAB IAB
− JAB
.
4
1 − IAB
(2.304)
Die Integrale CAB und JAB lassen sich numerisch berechnen. Sie hängen von einem einzigen Parameter, rAB /aB ,
ab. Man findet Et − Es > 0 ∀ rAB . Der Grundzustand ist also auf jeden Fall ein Singulett. Beachte, dass
die magnetische Wechselwirkung – antiparallele Spins sind energetisch günstiger als parallele – aus der (rein
elektrischen) Coulomb-Wechselwirkung und dem Pauli-Prinzip erwächst. Das ist auch der wesentliche Ursprung
von Magnetismus in Festkörpern.
Weiter findet man, dass Es , aber nicht Et , ein Minimum als Funktion von rAB hat:
46
E
Et
Eklass
2E0
Es
*
rAB
/aB
0
rAB/aB
2
∗
Damit gibt es einen gebundenen Zustand mit dem Kernabstand rAB
, wobei
dE = 0.
drAB rAB =r∗
(2.305)
AB
Die Austauschwechselwirkung, und damit der Term JAB , ist ein quantenmechanischer Effekt. Aus einer klassischen
2
2
B
Rechnung mit elektronischen Ladungsdichten −e|φA
0 (r1 )| und −e|φ0 (r2 )| erhält man eine Energie Eklass , die
ebenfalls kein Minimum als Funktion von rAB zeigt. Also ist der Austauscheffekt notwendig für die kovalente Bindung im H2 -Molekül und auch ganz allgemein. Trotz der groben Näherungen liegen die quantitativen Ergebnisse
für H2 in der richtigen Größenordnung:
2.6
∗
rAB
∗
Es (rAB
) − 2E0
Heitler-London
0,869 Å
−3,14 eV
experimentell
0,74 Å
−4,73 eV
Bosonen
Der Grundzustand eines Systems von nicht wechselwirkenden, identischen Fermionen ist der Fermi-See. Was ist der
Grundzustand von wechselwirkungsfreien, identischen Bosonen? Die Antwort hängt davon ab, ob die Teilchenzahl
erhalten ist:
• Teilchenzahl nicht erhalten (Photonen, Phononen, . . . ): Der Grundzustand enthält keine Teilchen (Vakuum).
• Teilchenzahl erhalten (4 He-Atome, 87 Rb-Atome): Im Grundzustand befinden sich alle N Teilchen im Einteilchen-Grundzustand. Wir nehmen hier an, dass dieser nicht entartet ist. Wir wissen aus der Quantenstatistik,
dass in d ≥ 3 Dimensionen für endliche Temperaturen 0 < T < Tc eine makroskopische (extensive) Zahl N0
von Teilchen im Einteilchengrundzustand bleibt (Bose-Einstein-Kondensation).
47
N0
N1
0
Tc
0
T
Für wechselwirkende, geladene Bosonen verläuft die Berechnung der Wechselwirkung analog zu den Fermionen,
mit einem wichtigen Unterschied: Die Austausch-Wechselwirkung hat für Bosonen das gleiche Vorzeichen wie die
direkte Coulomb-Wechselwirkung, verstärkt also die Abstoßung. Das Vorzeichen beruht darauf, dass bosonische
Operatoren vertauschen, während fermionische antivertauschen. Physikalisch ist die Ursache, dass sich Bosonen
mit größerer Wahrscheinlichkeit nahe beieinander aufhalten als unterscheidbare Teilchen und sich daher stärker
abstoßen.
Die Hartree-Fock-Näherung ist ebenfalls analog, bis auf das relative Plus-Zeichen von Hartree- und Fock-Term.
Die Näherung lautet also in zweiter Quantisierung
b†ν ′ b†ν ′ bν2 bν1
1
2
†
†
†
†
†
†
∼
= ⟨bν ′ bν1 ⟩bν ′ bν2 + bν ′ bν1 ⟨bν ′ bν2 ⟩ − ⟨bν ′ bν1 ⟩⟨bν ′ bν2 ⟩
2
1
2
1
2
1
+ ⟨b†ν ′ bν2 ⟩b†ν ′ bν1 + b†ν ′ bν2 ⟨b†ν ′ bν1 ⟩ − ⟨b†ν ′ bν2 ⟩⟨b†ν ′ bν1 ⟩
1
2
1
2
1
(2.306)
2
und in der Impulsraumbasis für spinlose Bosonen
b†k1 +q b†k2 −q bk2 bk1
†
†
†
†
†
†
∼
= ⟨bk1 +q bk1 ⟩bk2 −q bk2 + bk1 +q bk1 ⟨bk2 −q bk2 ⟩ − ⟨bk1 +q bk1 ⟩⟨bk2 −q bk2 ⟩
+ ⟨b†k1 +q bk2 ⟩b†k2 −q bk1 + b†k1 +q bk2 ⟨b†k2 −q bk1 ⟩ − ⟨b†k1 +q bk2 ⟩⟨b†k2 −q bk1 ⟩.
48
(2.307)
Kapitel 3
Relativistische Quantentheorie
Die Schrödinger-Gleichung für ein freies Teilchen,
iℏ
∂
ℏ2 2
ψ(r, t) = −
∇ ψ(r, t),
∂t
2m
(3.1)
ist sicherlich nicht Lorentz-invariant, da sie den Ort r und die Zeit t nicht gleichartig behandelt: Sie enthält die erste
Ableitung nach t, aber die zweite nach r. Tatsächlich beruht die Schrödinger-Gleichung auf der nichtrelativistischen
kinetischen Energie p2 /2m. Genauer ergibt sich für ein Wellenpaket
⟨H⟩ ≡ ⟨ψ|H|ψ⟩ =
⟨p2 ⟩
,
2m
(3.2)
also finden wir als klassischen Grenzfall
p2
,
(3.3)
2m
im Widerspruch zur Speziellen Relativitätstheorie. Wir erwarten also, dass Voraussagen der Schrödinger-Gleichung
versagen, wenn typische Geschwindigkeiten nicht v ≪ c, mit der Lichtgeschwindigkeit c, erfüllen. Dann sollte
nämlich im klassischen Grenzfall für das freie Teilchen die relativistische Beziehung
√
E = m2 c4 + p2 c2
(3.4)
E=
herauskommen. In diesem Kapitel beschäftigen wir uns mit der relativistischen, d.h. Lorentz-invarianten, Quantentheorie für Einteilchensysteme. Wir beginnen mit einer Wiederholung von Konzepten und Schreibweisen der
Speziellen Relativitätstheorie.
3.1
Spezielle Relativitätstheorie
Zentral ist der Begriff des Inertialsystems. Ein Inertialsystem ist ein Bezugssystem (ein Koordinatensystem in
der vierdimensionalen Raumzeit, dem Minkowski-Raum), in dem sich ein kräftefreier Körper geradlinig und
gleichförmig bewegt. Die Existenz von Intertialsystemen wird von Newtons 1. Axiom postuliert, das weiterhin
gültig bleibt. Einstein formulierte nun folgende Postulate:
1. Äquivalenzpostulat: Die physikalischen Gesetze sind in allen Inertialsystemen identisch (das ist noch nicht
beschränkt auf die relativistische Physik).
2. Konstanz der Lichtgeschwindigkeit: c = const ist ein physikalisches Gesetz im Sinne des Äquivalenzpostulats.
49
3.1.1
Viererschreibweise und relativistische Mechanik
Die Transformation zwischen verschiedenen Inertialsystemen wird durch allgemeine Lorentz-Transformationen
vermittelt. Diese bilden die Lorentz-Gruppe mit 6 Generatoren:
• Lorentz-Boosts für die Relativgeschwindigkeit v in 3 unabhängigen Richtungen (bilden die speziellen
Lorentz-Transformationen),
• räumliche Drehungen in 3 unabhängigen Ebenen.
Für Koordinaten r, t im Intertialsystem S und r, t im Inertialsystem S lautet die spezielle Lorentz-Transformation
(d.h. der Boost) für Relativgeschwindigkeit v = vx̂ (o.B.d.A.)
x − vt
,
x= √
2
1 − vc2
(3.5)
x + vt
x= √
,
2
1 − vc2
(3.6)
t − v2 x
t= √ c
,
2
1 − vc2
(3.7)
t + v2 x
t= √ c
,
2
1 − vc2
(3.8)
y = y,
(3.9)
z = z.
Die Lorentz-Transformationen lassen sich als verallgemeinerte Rotationen von Vierervektoren auffassen. Den
Viererortsvektor schreiben wir als
(xµ ) = (x0 , x1 , x2 , x3 ) = (ct, x, y, z) = (ct, r).
(3.10)
Wir verwenden hier die Schreibweise (xµ ), wenn wir den Vektor meinen, und xµ für die µ-te Komponente. Damit
ist die obige spezielle Lorentz-Transformation
xµ = Lµν xν
(mit Einsteinscher Summenkonvention: über identische obere und
0, 1, 2, 3), wobei

γ
−βγ 0
−βγ
γ
0
µ
(L ν ) = 
 0
0
1
0
0
0
(3.11)
untere Indizes wird summiert, hier über ν =

0
0

0
1
(3.12)
mit
β
:=
v
,
c
γ
:=
1
1
√
=√
2
1−β
1−
(3.13)
.
(3.14)
v2
c2
Definitionen:
• Kontravarianter Vektor (aµ ) = (a0 , a1 , a2 , a3 ): Transformiert sich wie (xµ ),
aµ =
∂xµ ν
a ≡ Lµν aν .
∂xν
(3.15)
• Kovarianter Vektor (aµ ) = (a0 , a1 , a2 , a3 ): Transformiert sich gemäß
aµ =
∂xν
aν =: Lµν aν .
∂xµ
50
(3.16)
Es folgt mit Hilfe der Kettenregel
Lµν Lλν =
∂xµ ∂xν
∂xµ
=
= δλµ ,
ν
λ
∂x ∂x
∂xλ
(3.17)
wobei δλµ bis auf die Stellung der Indizes das gewöhnliche Kronecker-Symbol ist.
• Allgemeiner definiert man Tensoren 2., 3., usw. Stufe, wobei jeder Index kontra- oder kovariant sein kann.
Z.B. transformiert sich (Aµν ) gemäß
∂xµ ∂xν ρσ
A ≡ Lµρ Lν σ Aρσ
∂xρ ∂xσ
(3.18)
Aµν
Aµν
= Lµρ Lν σ Aρσ ,
= Lµρ Lν σ Aρσ ,
(3.19)
(3.20)
Aµν
= Lµρ Lν σ Aρσ .
(3.21)
Aµν =
und analog
Die Reihenfolge der Indizes ist wesentlich. Für Tensoren höherer Stufe lautet die Transformation analog,
z.B.
B λµν = Lλρ Lµσ Lν τ B ρστ .
(3.22)
Zu jedem kontravarianten Vektor existiert ein kovarianter Vektor und umgekehrt. Allgemeiner kann man
alle Indizes von Tensoren zwischen kontravariant und kovariant umwandeln ( heben“ oder senken“). Dies
”
”
erfolgt mit Hilfe des metrischen Tensors (gµν ):
aµ
aµ
Aµν
= gµν aν ,
= g µν aν ,
= gµρ Aρν = gµρ gνσ Aρσ = gνσ Aµσ
(3.23)
(3.24)
(3.25)
usw. In der Speziellen Relativitätstheorie ist

1
0
µν
(g ) = (gµν ) = 
0
0

0
0
0
−1 0
0
.
0 −1 0 
0
0 −1
(3.26)
[In der Allgemeinen Relativitätstheorie ist (g µν (xλ )) hingegen ein dynamisches Feld.] Mit (xµ ) = (ct, r)
folgt also
(xµ ) = (ct, −r).
(3.27)
• Das Skalarprodukt ist definiert durch
aµ bµ = gµν aµ bν = gνµ aµ bν = aν bν .
Man findet
aµ bµ = Lµν Lµλ aν bλ ≡
∂xµ ∂xλ ν
∂xλ ν
a bλ = aν bν .
a
b
=
λ
∂xν ∂xµ
∂xν
(3.28)
(3.29)
Das Skalarprodukt ist also invariant unter Lorentz-Transformationen (Lorentz-invariant).
• Lorentz-Skalare sind Größen, die sich unter Lorentz-Transformationen nicht ändern, z.B. Skalarprodukte.
• Betragsquadrat:
aµ aµ = gµν aµ aν = (a0 )2 − (a1 )2 − (a2 )2 − (a3 )2 ,
(3.30)
z.B. xµ xµ = c2 t2 − r2 . Beachte, dass dieses (verallgemeinerte) Betragsquadrat negativ werden kann. Wir
nennen einen Vierervektor (aµ )
51
– zeitartig, wenn aµ aµ > 0,
– lichtartig, wenn aµ aµ = 0,
– raumartig, wenn aµ aµ < 0.
• Vierergradient:
(
transformiert sich gemäß
)
∂
,
∂aµ
(3.31)
∂
∂aν ∂
∂xν ∂
=
=
.
∂aµ
∂aµ ∂aν
∂xµ ∂aν
(3.32)
Vergleich mit Gl. (3.16) zeigt, dass sich
( die) Ableitung nach einem kontravarianten Vektor wie ein kovarianter
Vektor transformiert. Umgekehrt ist ∂a∂µ ein kontravarianter Vektor. Speziell für raumzeitliche Gradienten
schreiben wir
∂µ
:=
∂µ
:=
∂
∂xµ
∂
∂xµ
Es ist
(
(kovariant),
(3.33)
(kontravariant).
(3.34)
1
c
(
1
c
(∂µ ) =
(∂ µ ) =
)
∂
,∇ ,
∂t
)
∂
, −∇ .
∂t
(3.35)
(3.36)
Beachte die umgekehrten Vorzeichen im Vergleich zu (xµ ) = (ct, −r), (xµ ) = (ct, r).
• D’Alembert-Operator :
□ := ∂µ ∂ µ = ∂ µ ∂µ =
1 ∂2
− ∇2 .
c2 ∂t2
(3.37)
• Die Eigenzeit τ ist die von einer Uhr angezeigte Zeit, die von einem Massenpunkt mitgeführt wird. Diese
Uhr befindet sich daher i.A. nicht in einem Inertialsystem. Für das Differential dτ gilt
dτ =
dt
γ
(3.38)
√
mit γ = 1/ 1 − v 2 /c2 , wobei v = dr/dt hier die momentane Geschwindigkeit des Massenpunktes in einem
gegebenen Inertialsystem (z.B. dem Laborsystem) mit den Koordinaten ct, r ist.
• Die Vierergeschwindigkeit ist
(
(uµ ) :=
• Der Viererimpuls ist
dxµ
dτ
)
(
=
γc, γ
dr
dt
(pµ ) := (muµ ).
)
= (γc, γv).
(3.39)
(3.40)
Mit m bezeichnen wir immer die Ruhemasse, wir verwenden kein Konzept einer geschwindigkeitsabhängigen
”
Masse“. Man findet leicht
)
(
v2
(3.41)
pµ pµ = m2 uµ uµ = γ 2 m2 (c2 − v2 ) = γ 2 m2 c2 1 − 2 = m2 c2 .
c
Wir schreiben
(pµ ) = (p0 , p),
52
(3.42)
dann ist
= (p0 )2 − p2 = m2 c2
= m2 c2 + p2
√
p0 c =
m2 c4 + p2 c2 .
pµ pµ
(p0 )2
⇒
⇒
Der Limes für v ≪ c ergibt
(3.43)
(3.44)
(3.45)
√
p2 ∼
p2
2
mc
+
,
(3.46)
=
m2 c2
2m
also die Ruheenergie mc2 plus die nichtrelativistische kinetische Energie. Es liegt daher nahe, p0 c als relativistische Verallgemeinerung der Gesamtenergie des freien Teilchens zu betrachten:
√
(3.47)
E := m2 c4 + p2 c2 ⇒ E 2 = m2 c4 + p2 c2 .
0
2
p c = mc
1+
Beachte, dass E die 0-Komponente eines Vierervektors ist und kein Lorentz-Skalar. E hängt also vom
Inertialsystem ab, wie man auch erwartet.
Allgemein sollten physikalische Gesetze kovariant formuliert“ werden, d.h., sie sollten nur Lorentz-Skalare, Vie”
rervektoren und entsprechende höhere Tensoren enthalten. Dann erfüllen sie automatisch die Einsteinschen Postulate. Es ist eine Schwäche der relativistischen Newton-Mechanik, dass sie mit nicht kovarianten Größen, wie der
Energie E, operiert. Die relativistische Quantenmechanik erbt dieses Problem.
Eine kovariante Formulierung der klassischen Mechanik ist aber möglich, sie verwendet den LagrangeFormalismus. Eine kovariante Formulierung der Quantentheorie ist, im Rahmen der Zweiten Quantisierung, ebenfalls möglich. Sie verwendet einen Lagrange-Operator, ausgedrückt durch die Quantenfeldoperatoren Ψ, Ψ† , und
ist somit eine relativistische Quantenfeldtheorie.
3.1.2
Elektrodynamik
Das elektrische und das magnetische Feld erfüllen in Gegenwart von Ladungen und Strömen die MaxwellGleichungen (in Gaußschen Einheiten)
∇ · E = 4πρ,
∇·B
(3.48)
(3.49)
= 0,
1 ∂B
,
c ∂t
4π
1 ∂E
j+
.
c
c ∂t
∇×E = −
(3.50)
∇×B
(3.51)
=
Aus diesen folgt die Kontinuitätsgleichung:
1
∂E
c
∂ρ
=
∇·
=
∇ · (∇ × B) −∇ · j = −∇ · j
{z
}
∂t
4π
∂t
4π |
(3.52)
=0
∂ρ
+ ∇ · j = 0.
(3.53)
∂t
Die Maxwell-Gleichungen vereinfachen sich durch Einführung von Eichfeldern (Potentialen) ϕ, A gemäß
⇒
E = −∇ϕ −
1 ∂A
,
c ∂t
B = ∇ × A.
(3.54)
(3.55)
Dann sind die homogenen Maxwell-Gleichungen (3.49) und (3.50) automatisch erfüllt. Die Gleichungen und damit
die beobachtbaren Größen sind invariant unter den simultanen Eichtransformationen
A → A + ∇χ,
1 ∂χ
,
ϕ → ϕ−
c ∂t
53
(3.56)
(3.57)
wobei χ(r, t) ein beliebiges skalares Feld ist (Eichinvarianz). Die Maxwell-Gleichungen sind bereits Lorentzinvariant, was man ihnen aber nicht gleich ansieht. Die Kovarianz wird klar erkennbar durch Einführung des
Viererpotentials
(Aµ ) = (ϕ, A).
(3.58)
Die Felder E, B sind nicht die räumlichen Komponenten von Vierervektoren, sondern Komponenten des antisymmetrischen Feldstärketensors,
F µν := ∂ µ Aν − ∂ ν Aµ .
(3.59)
Dieser ist invariant unter allgemeinen Eichtransformationen der Form
Aµ → Aµ − ∂ µ χ,
(3.60)
F µν → F µν − ∂ µ ∂ ν χ + ∂ ν ∂ µ χ = F µν .
(3.61)
denn
Es ist oft praktisch, eine bestimmte Eichung zu wählen. Eine besondere Rolle spielt die Lorenz-Eichung (Ludvig
Lorenz, ohne t“)
”
∂µ Aµ = 0,
(3.62)
da sie offensichtlich Lorentz-invariant ist (Hendrik Anton Lorentz, mit t“).
”
Die Komponenten des Feldstärketensors sind, für m, n = 1, 2, 3,
F 0n
F m0
F mn
∂ϕ
1 ∂An
+
= −En ,
c ∂t
∂rn
∂ϕ
1 ∂Am
= −
−
= Em ,
∂rn
c ∂t
∑
∂An
∂Am
= −
+
=−
ϵmnp Bp ,
∂rm
∂rn
p
=

also
0
E1
µν

(F ) = 
E2
E3
−E1
0
B3
−B2
−E2
−B3
0
B1

−E3
B2 
.
−B1 
0
(3.63)
(3.64)
(3.65)
(3.66)
Die homogenen Maxwell-Gleichungen lassen sich zu
∂ λ F µν + ∂ µ F νλ + ∂ ν F λµ = 0
(3.67)
zusammenfassen. Z.B. ist für (λ, µ, ν) = (0, 1, 2):
0=−
∂E2
∂E1
1 ∂B3
1 ∂B3
−
+
=−
− (∇ × E)3 .
c ∂t
∂r1
∂r2
c ∂t
(3.68)
Die homogenen Gleichungen sind weiterhin automatisch erfüllt:
∂ λ F µν + ∂ µ F νλ + ∂ ν F λµ
= ∂ λ ∂ µ Aν − ∂ λ ∂ ν Aµ + ∂ µ ∂ ν Aλ − ∂ µ ∂ λ Aν + ∂ ν ∂ λ Aµ − ∂ ν ∂ µ Aλ = 0.
(3.69)
Die Dichten ρ, j bilden den Viererstromdichtevektor
(j µ ) = (ρc, j).
(3.70)
Die inhomogenen Gleichungen lauten dann
∂µ F µν =
54
4π ν
j ,
c
(3.71)
denn es folgt
4πρ
4π n
j
c
4π 0
j = ∂n F n0 = ∇ · E,
c
1 ∂En
F mn
= ∂µ F µn = −
+
c ∂t
∂rm
∂Bp
1 ∂En ∑
= −
−
ϵmnp
c ∂t
∂rm
p
=
= −
1 ∂En
+ (∇ × B)n .
c ∂t
(3.72)
(3.73)
Die Kontinuitätsgleichung nimmt die einfache Form
∂ µ j µ = ∂µ j µ = 0
(3.74)
an, denn es ist
∂µ j µ =
3.1.3
1 ∂
∂ρ
ρc + ∇ · j =
+ ∇ · j = 0.
c ∂t
∂t
(3.75)
Minimale Kopplung
Die Wirkung des elektromagnetischen Feldes auf Teilchen der Ladung q beschreiben wir in der nichtrelativistischen
klassischen Mechanik durch
• Addition von q ϕ(r) zur potentiellen Energie und
• Ersetzung des kanonischen Impulses in der kinetischen Energie durch den kinetischen Impuls,
p→p−
q
A(r).
c
(3.76)
Man überzeugt sich, dass hieraus die bekannte Lorentz-Kraft folgt. Die beiden Schritte lassen sich in Viererschreibweise elegant zusammenfassen:
q
(3.77)
pµ → pµ − Aµ
c
(vgl. Skript zur Theoretischen Mechanik). Diese Art der Ankopplung des Eichfeldes (Aµ ) nennt man minimale
Kopplung, da es die einfachste nichttriviale, aber mit der Eichinvarianz vereinbare, Möglichkeit darstellt. Es ist
nach unserem Wissen auch die tatsächlich realisierte Kopplung.
3.2
Die Klein-Gordon-Gleichung
Wir wollen nun eine Lorentz-invariante Einteilchen-Quantentheorie konstruieren. Im ersten Schritt ignorieren wir
den Spin der Teilchen bzw. betrachten spinlose Teilchen (π-Mesonen, Higgs-Bosonen, 4 He-Atome).
3.2.1
Freie Teilchen
Die Argumentation folgt der heuristischen Begründung der Schrödinger-Gleichung für den nichtrelativistischen
Fall. Zentral ist das Korrespondenzprinzip: Die Quantenmechanik enthält die klassische Mechanik als Grenzfall für große Wirkungen S ≫ ℏ. Also muss sich für freie Teilchen im klassischen Grenzfall die relativistische
Energierelation
√
(3.78)
E = p2 c2 + m2 c4
ergeben. Wir erhalten den klassischen Grenzfall, indem wir das Teilchen durch ein möglichst schmales Wellenpaket
darstellen,
∫
d3 k
f (k) ei(k·r−ωt) .
(3.79)
ψ(r, t) =
(2π)3
55
Der Schwerpunkt des Wellenpakets bewegt sich mit der Gruppengeschwindigkeit
vg =
∂ω
.
∂k
(3.80)
Das Korrespondenzprinzip verlangt, dass diese Geschwindigkeit des Schwerpunktes im klassischen Grenzfall gleich
der Geschwindigkeit des Teilchens ist,
∂ω
∂E
!
= vg = v =
,
(3.81)
∂k
∂p
wobei wir eine kanonische Gleichung der klassischen Hamilton-Mechanik verwendet haben. Um eine möglichst
einfache Lösung zu finden, fordern wir, dass diese Identität ganz allgemein gilt, nicht nur im klassischen Grenzfall.
(Sollten wir keine Lösung finden, müssten wir diese sehr starke Forderung abschwächen.) Der Photoeffekt zeigt,
dass für Photonen E = ℏω gilt. Mit
∂E
∂ω
=
(3.82)
∂k
∂p
folgt p = ℏk. De Broglie stellte die Vermutung auf, dass diese Beziehungen auch für Materiewellen gelten. Dann
erhalten wir für Materiewellen ohne äußeres Potential die Dispersionsrelation
√
m2 c4
ω = k2 c2 + 2 .
(3.83)
ℏ
Ebene Wellen haben also die Form
√
([
])
m2 c4
2
2
ψ(r, t) = ψ0 exp i k · r − k c + 2 t .
ℏ
In Vierernotation ist
(3.84)
ψ((xµ )) ≡ ψ(x) = ψ0 e−ik xµ
(3.85)
(
)
(
)
mit (k µ ) = ωc , k ; vergleiche den Viererimpuls (pµ ) = Ec , p , dies ist also konsistent mit pµ = ℏk µ .
Immer in Analogie zum Fall der Schrödinger-Gleichung suchen wir eine möglichst einfache Gleichung, die von
ψ(x) erfüllt wird. Die Gleichung soll natürlich Lorentz-invariant sein. Da
µ
∂ −ikν xν
e
= −ik µ ψ(x)
∂xµ
−k µ kµ ψ(x)
∂ µ ψ(x) =
⇒
ψ0
∂ µ ∂µ ψ(x) =
und
k µ kµ =
lautet eine solche Gleichung
(3.86)
(3.87)
ω2
m2 c2
2
−
k
=
,
c2
ℏ2
(3.88)
)
m2 c2
ψ(x) = 0.
ℏ2
(3.89)
(
∂ µ ∂µ +
Dies ist die Klein-Gordon-Gleichung für ein freies Teilchen, die übrigens zuerst von Schrödinger gefunden aber
wieder verworfen wurde. Eine äquivalente Schreibweise ist
(
)
m2 c2
□+ 2
ψ(x) = 0.
(3.90)
ℏ
Expliziter lautet die Gleichung
(
)
m2 c2
1 ∂2
2
−∇ + 2
ψ(r, t) = 0.
c2 ∂t2
ℏ
(3.91)
Beachte, dass hier die Compton-Wellenlänge λC := ℏ/mc auftritt. Im Fall m = 0 erhalten wir die Wellengleichung,
so dass wir die Klein-Gordon-Gleichung als Verallgemeinerung der Wellengleichung auf massive Teilchen verstehen
können. Es ist zu beachten, dass die Klein-Gordon-Gleichung nicht die einzige Lorentz-invariante Gleichung ist,
56
die die geforderte Dispersion liefert, sondern bestenfalls die einfachste. Insbesondere kann man sich fragen, warum
wir nicht
√
m2 c2
□ + 2 ψ(x) = 0
(3.92)
ℏ
angesetzt haben, was homogen von erster Ordnung in der Energie ist, wie die Schrödinger-Gleichung. Diese
alternative Gleichung ist aber nicht schön, weil die Wurzel eine Unstetigkeit (nämlich einen Verzweigungspunkt)
hat, und zwar gerade für solche ψ, die die Gleichung erfüllen.
Man fasst die heuristische Begründung oft wie folgt zusammen: Die Schrödinger-Gleichung kann man erhalten,
indem man in der nichtrelativistischen, klassischen Relation
E=
p2
2m
(3.93)
die Ersetzungen
E
→ iℏ
p
→
∂
,
∂t
ℏ
∇
i
(3.94)
(3.95)
vornimmt, und die resultierenden Differentialoperatoren auf die Wellenfunktion anwendet:
iℏ
∂ψ
ℏ2 2
=−
∇ ψ.
∂t
2m
(3.96)
Analog machen wir dieselben Ersetzungen,
pµ → iℏ ∂ µ ,
(3.97)
E 2 = (p0 c)2 = p2 c2 + m2 c4
(3.98)
für
und erhalten
∂2ψ
−ℏ2 2 = −ℏ2 c2 ∇2 ψ + m2 c4 ψ
∂t
(
)
1 ∂2
m2 c2
2
⇒
−∇ + 2
ψ = 0,
c2 ∂t2
ℏ
(3.99)
(3.100)
also die Klein-Gordon-Gleichung. Diese Argumentation ist aber nur als Karikatur der ausführlicheren zu betrachten.
3.2.2
Eigenschaften der Klein-Gordon-Gleichung
Wir untersuchen nun die Klein-Gordon-Gleichung genauer.
• Die Gleichung ist linear, daher gilt das Superpositionsprinzip: Sind ψ1 und ψ2 Lösungen, so auch λ1 ψ1 +λ2 ψ2
für alle λ1 , λ2 ∈ C.
• Die Gleichung ist von zweiter Ordnung in der Zeit. Daher brauchen wir zwei Anfangsbedingungen, i.A.
∂ψ(r, t) ψ(r, t0 ) und
,
(3.101)
∂t t=t0
um die Lösung eindeutig festzulegen. Das ist anders als bei der Schrödinger-Gleichung. Diese Eigenschaft
ist beunruhigend: Es ist schwer zu verstehen, dass man in der kovarianten Quantentheorie ψ(t0 ) und ∂ψ
∂t (t0 )
kennen muss, um die zukünftige Zeitentwicklung vorherzusagen, während im nichtrelativistischen Grenzfall
die Wellenfunktion ψ(t) ausreicht.
57
• Lösungen sind ebene Wellen
ψ = ψ0 e−ik
denn dann ist
µ
xµ
mit
k µ kµ =
m2 c2
,
ℏ2
(
)
(
)
m2 c2
m2 c2
∂ µ ∂µ + 2
ψ = −k µ kµ + 2
ψ = 0.
ℏ
ℏ
(3.102)
(3.103)
Aber die Bedingung für (k µ ) impliziert nur
ω2
⇒
ω
⇒
E
m2 c4
= k2 c2 + 2
ℏ
√
m2 c4
= ± k2 c2 + 2
ℏ
√
2
= ℏω = ± ℏ c2 k2 + m2 c4 .
(3.104)
(3.105)
(3.106)
Die Dispersion besteht aus zwei Hyperbeln. Das Spektrum hat eine Energielücke von −mc2 bis mc2 und
ist nach oben und unten unbeschränkt. Das ist problematisch, sobald wir das Teilchen an ein Wärmebad
koppeln, so dass es Energie abgeben und aufnehmen kann. Es wird dann das bestreben haben, seine Energie
zu minimieren. Es kann aber beliebig viel Energie an das Bad abgeben und dabei in immer tiefer liegende
Niveaus fallen. Dieses unphysikalische Verhalten nennt man Zerstrahlungskatastrophe.
• Die Wahrscheinlichkeitsstromdichte (j µ ) sollte die Kontinuitätsgleichung
∂ µ jµ = 0
(3.107)
erfüllen. Tatsächlich benutzen wir die Kontinuitätsgleichung, um herauszufinden, wie j µ aussieht. Es gibt
keinen Grund anzunehmen, dass die Wahrscheinlichkeitsstromdichte dieselbe Form wie in der SchrödingerTheorie hat. Aus der Klein-Gordon-Gleichung erhalten wir
(
)
m2 c2
∗
µ
ψ ∂ ∂µ + 2
ψ=0
(3.108)
ℏ
und
)
m2 c2
ψ ∗ = 0,
ψ ∂ ∂µ + 2
ℏ
(
µ
(3.109)
woraus folgt
ψ ∗ ∂ µ ∂µ ψ − ψ∂ µ ∂µ ψ ∗
⇔ ∂ µ (ψ ∗ ∂µ ψ − ψ∂µ ψ ∗ )
58
= 0
= 0.
(3.110)
(3.111)
Damit haben wir eine (vierer-) divergenzfreie Größe gefunden. Daher definieren wir
j µ :=
iℏ
(ψ ∗ ∂ µ ψ − ψ∂ µ ψ ∗ ),
2m
|{z}
(3.112)
konventioneller
Vorfaktor
so dass ∂ µ jµ = 0 gilt. Die Komponenten von (j µ ) lauten
j0
⇒
= ρc
(
(
)
)
iℏ
1 ∂ψ ∗
iℏ
∂ψ ∗
∗ ∂ψ
∗ 1 ∂ψ
ρ =
ψ
−ψ
=
ψ
−ψ
2mc
c ∂t
c ∂t
2mc2
∂t
∂t
(3.113)
(3.114)
und
iℏ
(ψ ∗ ∇ψ − ψ∇ψ ∗ ).
(3.115)
2m
Die Dichte ρ hat also tatsächlich nicht die Form ψ ∗ ψ aus der Schrödinger-Theorie. Hier tritt ein Problem auf:
Da die Klein-Gordon-Gleichung von zweiter Ordnung ist, können wir ψ(r, t0 ) und ∂ψ
∂t (r, t0 ) beliebig vorgeben.
Damit können wir aber auch ρ(r, t0 ) beliebig vorgeben; Gl. (3.114) garantiert nur, dass ρ reell ist. Wir können
insbesondere ρ(r, t) < 0 für gewisse r wählen. Dann können wir ρ aber nicht als Wahrscheinlichkeitsdichte
interpretieren.
j=−
Betrachten wir ebene Wellen, die ja spezielle Lösungen der Klein-Gordon-Gleichung sind, so erhalten wir
ρ=
iℏ
ℏω
|ψ0 |2 (−iω − iω) =
|ψ0 |2 .
2
2mc
mc2
(3.116)
Wir sehen:
– ω > 0 (E > 0) führt auf konstante, positive Dichte,
– ω < 0 (E < 0) führt auf konstante, negative Dichte.
Man kann im Rahmen der Klein-Gordon-Theorie keine erhaltene Viererstromdichte konstruieren, die ρ ≥ 0
garantiert. Die Größe ψ ∗ ψ ist z.B. zwar positiv definit, aber nicht erhalten:
∂ ∗
∂ψ ∗
∂ψ
ψ ψ=
ψ + ψ∗
∂t
∂t
∂t
(3.117)
und die Klein-Gordon-Gleichung determiniert ∂ψ/∂t nicht, also können wir insbesondere nicht ∂ψ/∂t durch
räumliche Ableitungen ausdrücken. Daher können wir die rechte Seite von Gl. (3.117) auch nicht allgemein
als räumliche Divergenz einer Stromdichte schreiben.
Dieses Problem führt zu einer möglichen Uminterpretation der Theorie nach Pauli und Weißkopf: 1. Da sich
keine erhaltene Wahrscheinlichkeitsstromdichte konstruieren lässt, ist die Wahrscheinlichkeit offenbar nicht
erhalten. Das heißt, dass Teilchen erzeugt und vernichtet werden können. 2. Die Viererstromdichte
jµ =
iℏq ∗ µ
(ψ ∂ ψ − ψ∂ µ ψ ∗ )
2m
(3.118)
(der neue Faktor q ist eine – nicht unbedingt elektrische – Ladung) ist aber erhalten. Wir interpretieren
j 0 = ρ/c als Ladungsdichte und j als Ladungsstromdichte. 3. Die Theorie beschreibt also die Erzeugung und
Vernichtung von Teilchen in Paaren der Gesamtladung Null (Teilchen-Antiteilchen-Paare).
Da wir aber vom Einteilchenbild ausgegangen waren, ist diese Interpretation mit der Klein-GordonQuantenmechanik unverträglich. Sie weist über deren Rahmen hinaus. Erst in der Mehr-Teilchen-Theorie
mit zweiter Quantisierung, d.h. in der Quantenfeldtheorie, kann sauber die Paarerzeugung und -vernichtung
beschrieben werden. Sie löst auch die Probleme der Wahrscheinlichkeitserhaltung und des nach unten unbeschränkten Spektrums.
59
3.2.3
Teilchen im elektromagnetischen Feld
Mit dem Viererimpulsoperator in Ortsdarstellung
p̂µ
:=
p̂0
=
p̂
=
iℏ∂ µ ,
iℏ ∂
,
c ∂t
−iℏ∇,
können wir die freie Klein-Gordon-Gleichung schreiben als
(
)
1 µ
m2 c2
− 2 p̂ p̂µ + 2
ψ
ℏ
ℏ
⇔
(p̂µ p̂µ − m2 c2 ) ψ
(3.119)
(3.120)
(3.121)
= 0
(3.122)
= 0
(3.123)
(beachte das Vorzeichen des Massenterms). Die minimale Kopplung an das elektromagnetische Feld besteht nun
in der Ersetzung
q
p̂µ → p̂µ − Aµ .
(3.124)
c
Wir erhalten die Klein-Gordon-Gleichung für ein Teilchen der Ladung q im elektromagnetischen Feld,
]
[(
)(
)
q
q
(3.125)
p̂µ − Aµ p̂µ − Aµ − m2 c2 ψ = 0.
c
c
Äquivalent können wir ersetzen
∂ µ → Dµ := ∂ µ −
q µ
q µ
A = ∂µ + i
A .
iℏc
ℏc
(3.126)
(Dµ ) nennt man eichkovariante Ableitung, eine unglückliche Bezeichnung, die nichts damit zu tun hat, dass (Dµ )
ein kontravarianter Vektor (sic!) ist. Damit wird die Klein-Gordon-Gleichung
(
)
m2 c2
µ
D Dµ + 2
ψ=0
(3.127)
ℏ
[(
) m2 c2 ]
q µ )(
q
⇔
∂µ + i
A
∂µ + i
Aµ + 2 ψ = 0
(3.128)
ℏc
ℏc
ℏ
[
]
q
q2
m2 c2
⇔
∂ µ ∂µ + i
(∂ µ Aµ + Aµ ∂µ ) − 2 2 Aµ Aµ + 2 ψ = 0.
(3.129)
ℏc
ℏ c
ℏ
Für zeitunabhängiges Feld (Aµ ) können wir stationäre Lösungen suchen, d.h. solche mit zeitunabhängigem Betragsquadrat |ψ|2 . Wir machen den Ansatz, analog zum Schrödinger-Fall,
ψ(r, t) = e−iEt/ℏ ψ(r).
Einsetzen ergibt
(3.130)
[(
)2 (
)2
]
E
q
q
m2 c2
−i
+i
ϕ(r) − ∇ + i
A(r) + 2 ψ(r) = 0
ℏc
ℏc
ℏc
ℏ
)2
(
(
)2
q
ℏ
⇒
∇ − A(r) ψ(r) + m2 c4 ψ(r).
E − qϕ(r) ψ(r) = c2
i
c
(3.131)
(3.132)
Das ist die zeitunabhängige Klein-Gordon-Gleichung für ein Teilchen im statischen elektromagnetischen Feld. Man
kann jetzt z.B. ein π − -Meson im Coulomb-Potential eines Kerns betrachten, d.h. setzen
q = −e,
ϕ(r) =
60
Ze
,
r
A ≡ 0.
(3.133)
Wir haben hier eine Lorenz-Eichung gewählt, denn es gilt
∂ µ Aµ =
1 ∂ϕ
Ze ∂ 1
=
= 0.
c ∂t
c ∂t r
(3.134)
Die resultierende Gleichung kann man weitgehend analog zum nichtrelativistischen Fall durch den Separationsansatz in Kugelkoordinaten
ψ(r) = R(r) Y (ϑ, ϕ)
(3.135)
lösen, vgl. z.B. F. Schwabl, Quantenmechanik für Fortgeschrittene“. Der Winkelanteil ist wieder durch Kugel”
flächenfunktionen Ylm (ϑ, ϕ) gegeben; dies folgt allein aus der Rotationssymmetrie.
3.3
3.3.1
Die Dirac-Gleichung
Freies Teilchen
Wie wir gesehen haben, lässt sich im Rahmen der Klein-Gordon-Theorie keine erhaltene, positiv-definite Wahrscheinlichkeitsdichte konstruieren. Die erhaltene Dichte ρ = j 0 /c kann negativ gewählt werden, da die KleinGordon-Gleichung von zweiter Ordnung in der Zeit ist. Das ist ohnehin merkwürdig – warum sollte man in der
kovarianten Theorie ψ und ∂ψ/∂t kennen müssen, um die Zeitentwicklung vorherzusagen, im nichtrelativistischen
Grenzfall aber nur ψ?
Diracs Ziel war daher, eine relativistische Bewegungsgleichung für ψ zu konstruieren, die von erster Ordnung
in t ist. Aufgrund der Kovarianz muss sie dann auch von erster Ordnung in r sein. Dirac machte daher den Ansatz
)
(
∂
2
+ iℏc α · ∇ − βmc ψ(r, t) = 0.
(3.136)
iℏ
∂t
Das ist die Dirac-Gleichung für ein freies Teilchen. Sie lässt sich auch in einer zur Schrödinger-Gleichung ähnlichen
Form schreiben:
∂ψ
iℏ
= Hψ
(3.137)
∂t
mit
H = −iℏc α · ∇ + βmc2 = c α · p̂ + βmc2 .
(3.138)
Gilt die Dirac-Gleichung (3.136), so folgt (beachte die Vorzeichen!)
(
)(
)
(
)
∂
∂
∂
2
2
2
iℏ
− iℏc α · ∇ + βmc
iℏ
+ iℏc α · ∇ − βmc ψ(r, t) = iℏ
− iℏc α · ∇ + βmc 0 = 0.
∂t
∂t
∂t
(3.139)
Also ist
[
]
∂2
2 2
−ℏ
− (iℏc α · ∇ − βmc ) ψ(r, t)
∂t2
[
]
∂2
=
− ℏ2 2 + ℏ2 c2 (α · ∇)2 + iℏc α · ∇ βmc2 + iβmc2 ℏc α · ∇ − β 2 m2 c4 ψ(r, t)
∂t
= 0.
2
Daraus folgt
[
]
1 ∂2
imc
imc
m2 c2 2
2
−
(α
·
∇)
−
αβ
·
∇
−
βα
·
∇
+
β
ψ(r, t) = 0.
c2 ∂t2
ℏ
ℏ
ℏ2
(3.140)
(3.141)
Im klassischen Grenzfall soll sich weiterhin die Relation E 2 = p2 c2 + m2 c4 ergeben. Daher liegt es nahe, die
Koeffizienten α1 , α2 , α3 , β so zu wählen, dass Gl. (3.141) wieder die Klein-Gordon-Gleichung
(
)
1 ∂2
m2 c2
2
−
∇
+
ψ(r, t) = 0
(3.142)
c2 ∂t2
ℏ2
61
ergibt. Dafür muss gelten
αi αj + αj αi = 0
αi2 = 1,
für i ̸= j,
(3.143)
(3.144)
αi β + βαi = 0,
β 2 = 1.
(3.145)
(3.146)
Etwas kompakter lauten diese Bedingungen unter Verwendung des Antikommutators
{αi , αj }
{αi , β}
β2
= 2δij 1,
= 0,
= 1
(3.147)
(3.148)
(3.149)
Die Bedingungen lassen sich nicht durch Zahlen erfüllen, denn dann würde gelten
αi β + βαi = 2αi β = 0
⇒
αi2 β 2 = 0
⇒
11 = 0.
(3.150)
Man kann sie jedoch mit Matrizen erfüllen. Sind αi und β n × n-Matrizen, muss die Wellenfunktion ψ(r, t)
offensichtlich n Komponenten haben.
Die einfachste Wahl wäre n = 2. Die Bedingung {αi , αj } = 2δij 1 wird gerade von den Pauli-Matrizen erfüllt,
da gilt
σi σi
=
i̸=j
σi σj + σj σi
=
1,
(3.151)
iϵijk σk + iϵjik σk = iϵijk (σk − σk ) = 0.
(3.152)
Jedoch existiert keine vierte 2 × 2-Matrix β, die zu 1 quadriert und mit den Pauli-Matrizen antivertauscht. Das
sieht man wie folgt: Die komplexen 2 × 2-Matrizen bilden offenbar einen vierdimensionalen Vektorraum über C.
Eine Basis dieses Vektorraums ist
{1, σ1 , σ2 , σ3 }.
(3.153)
Daher müsste sich β schreiben lassen als
β = b0 1 + b1 σ1 + b2 σ2 + b3 σ3
mit b0 , b1 , b2 , b3 ∈ C.
(3.154)
Es folgt
{σi , β} = b0 (σi 1 + 1σi ) + b1 (σi σ1 + σ1 σi ) + b2 (σi σ2 + σ2 σi ) + b3 (σi σ3 + σ3 σi )
!
⇒
b0 = b1 = b2 = b3
⇒ β2
= 2b0 σi + 2bi 1 = 0
= 0
= 0,
für i = 1, 2, 3
(3.155)
(3.156)
(3.157)
im Widerspruch zur Bedingung β 2 = 1. Daher ist eine Darstellung durch 2 × 2-Matrizen nicht möglich.
Für beliebiges ungerades n ist ebenfalls keine Darstellung möglich. Beweis:
⇒
α1 α2 = −α2 α1
det (α1 α2 ) = det (−α2 α1 ),
(3.158)
(3.159)
daraus folgt für n ungerade
det (α1 α2 ) =
⇒
det α1 det α2
⇒ det α1
− det (α2 α1 )
= − det α2 det α1
= 0 ∨ det α2 = 0.
62
(3.160)
(3.161)
(3.162)
Nun ist aber
α12
det α12
⇒
⇒
(det α1 )2
= α22 = 1
= det α22 = 1
(3.163)
(3.164)
= (det α2 )2 = 1,
(3.165)
es ergibt sich ein Widerspruch. Also lässt sich insbesondere keine Darstellung durch 3 × 3-Matrizen finden.
Eine Darstellung durch 4 × 4-Matrizen existiert. Man überzeugt sich leicht, dass folgende Matrizen alle Bedingungen erfüllen:
)
(
0 σi
,
αi =
(3.166)
σi 0
(
)
12
0
β =
(3.167)
,
0 −12
wobei 12 die 2 × 2-Einheitsmatrix ist. Damit erfordert die einfachste Lösung n = 4. Man kann außerdem zeigen:
Darstellungen existieren nur für n = 4k, k = 1, 2, 3, . . . und jede Darstellung ist ähnlich (im Sinne von ähnlichen
Matrizen) zu blockdiagonalen Matrizen mit n/4 identischen Blöcken mit der angegebenen expliziten Darstellung
von αi oder β.
Die Form (3.136) der Dirac-Gleichung bringt deren Lorentz-Invarianz nicht klar zum Ausdruck. Dafür ist es
nützlich zu definieren
γ0
γi
= β,
= βαi ,
i = 1, 2, 3.
Damit lautet die Dirac-Gleichung, multipliziert mit β/c,
(
)
(
)
1 ∂
iℏβ
+ iℏβ α · ∇ − β 2 mc ψ(x) = iℏγ 0 ∂0 + iℏ γ · ∇ − mc ψ(x)
c ∂t
(
)
µ
⇒
iℏγ ∂µ − mc ψ(x) = 0,
(3.168)
(3.169)
(3.170)
(3.171)
wobei im Massenterm eine Einheitsmatrix 1 impliziert ist. Man verwendet zur Abkürzung den Feynman dagger“
”
(dagger = Dolch): Für einen Vierervektor (B µ ) ist
⧸
B := γ µ Bµ ≡ γµ B µ ,
(3.172)
⧸
∂ := γ µ ∂µ ≡ γµ ∂ µ .
(3.173)
(
)
iℏ⧸
∂ − mc ψ(x) = 0.
(3.174)
{γ µ , γ ν } = 2g µν 1
(3.175)
also z.B.
Damit lautet die freie Dirac-Gleichung
Die γ-Matrizen erfüllen
mit dem metrischen Tensor (g µν ). Eine mögliche Darstellung lautet explizit
(
)
12
0
0
γ =
,
0 −12
(
)
0
σi
γi =
.
−σi 0
(3.176)
Wie üblich ist γµ = gµν γ ν . Es folgt
γ µ γµ = gµν γ µ γ ν = (γ 0 )2 − (γ 1 )2 − (γ 2 )2 − (γ 3 )2 = 1 + 1 + 1 + 1 = 4 1,
63
(3.177)
was offensichtlich ein Lorentz-Skalar ist.
Die Dirac-Gleichung (3.171) soll Lorentz-invariant sein. Da sich (∂µ ) wie ein kovarianter Vektor transformiert,
muss sich (γ µ ) als kontravarianter Vektor transformieren:
γ µ → Lµν γ ν .
(3.178)
Also sind die γ µ abhängig vom Bezugssystem. Wir können die spezifische Darstellung (3.176) für ein Inertialsystem
fordern, z.B. das Laborsystem. Um Konsistenz zu gewährleisten, muss die algebraische Struktur {γ µ , γ ν } = 2g µν 1
unter Lorentz-Transformation invariant sein. Das ist der Fall:
{Lµρ γ ρ , Lν σ γ σ } = Lµρ Lν σ {γ ρ , γ σ } = Lµρ Lν σ 2g ρσ 1 = 2Lµσ Lν σ 1 = 2g µτ Lτ σ Lν σ 1 = 2g µν 1.
| {z }
(3.179)
=δτν
Beachte außerdem, dass die γ µ nicht hermitesch sind. Es gilt nämlich
(γ 0 )†
(γ i )†
= γ0,
= −γ i
(3.180)
(3.181)
für i = 1, 2, 3.
Wegen γµ = gµν γ ν lässt sich dies schreiben als
(γ µ )† = γµ .
(3.182)
Die γ µ sind jedoch unitär, denn
γ 0 (γ 0 )†
i
i †
γ (γ )
= γ 0 γ 0 = β 2 = 1,
= −γ γ = −βαi βαi =
i i
(3.183)
+β 2 αi2
= 1.
(3.184)
Das Fehlen von Hermitizität stellt kein Problem dar; die äquivalente Form
iℏ
)
∂ψ (
= c α · p̂ + βmc2 ψ ≡ Hψ
∂t
(3.185)
mit (αi )† = αi , β † = β zeigt, dass der Hamiltonian hermitesch ist. Diese Form verschleiert aber wie erwähnt die
Lorentz-Invarianz.
3.3.2
Eigenschaften der Dirac-Gleichung
Da der Hamilton-Operator
H = c α · p̂ + βmc2
(3.186)
eine 4 × 4-Matrix ist, muss die Wellenfunktion ψ(x) ein vierkomponentiger Vektor ( Dirac-Spinor“) sein. Wir
”
untersuchen jetzt die Bedeutung der vier Komponenten. Dazu betrachten wir zunächst ein ruhendes Teilchen:
p̂ ψ(r, t) = 0
⇒
iℏ
∂ψ
= Hψ = βmc2 ψ.
∂t
Wir schreiben ψ als Vektor aus zwei Zweiervektoren (Spinoren),
( )
φ
ψ=
.
χ
Dann ist
∂
iℏ
∂t
( )
( )
φ
φ
2
= mc
.
χ
−χ
Wir suchen stationäre Lösungen
ψ = ψ0 e
−iEt/ℏ
( )
φ0 −iEt/ℏ
≡
e
.
χ0
64
(3.187)
(3.188)
(3.189)
(3.190)
Mit diesem Ansatz folgt
E
( )
(
)
φ0
φ0
= mc2
.
χ0
−χ0
(3.191)
Die beiden Lösungen sind
( )
φ0
0
( )
0
χ0
zur Eigenenergie E = mc2 ,
(3.192)
zur Eigenenergie E = −mc2 .
(3.193)
βmc2 ist der Operator der Ruheenergie, man nennt β auch Ruheenergiematrix. Für ruhende Teilchen beschreiben
die ersten beiden Komponenten von ψ offenbar Zustände positiver Energie und die anderen beiden Komponenten
Zustände negativer Energie.
Für nicht ruhende Teilchen gilt das nicht mehr: Die stationären Lösungen der freien Dirac-Gleichung sind
ψ(r, t) = ψ0 eik·r−iEt/ℏ
)
(
∂ψ
!
⇒ iℏ
= Eψ = Hψ = ℏc α · k + βmc2 ψ
∂t
(
)
⇒ ℏc α · k + βmc2 ψ0 = Eψ0 .
Die Eigenenergien sind also die Eigenwerte der 4 × 4-Matrix
(
mc2 12
2
ℏc α · k + βmc =
ℏc σ · k
ℏc σ · k
−mc2 12
(3.194)
(3.195)
)
(3.196)
[σ = (σ1 , σ2 , σ3 ) ist der Vektor der Pauli-Matrizen] und für jeden Eigenwert ist ψ0 der zugehörige Eigenvektor.
Die Eigenwerte sind
√
E = ± ℏ2 c2 k2 + m2 c4 ,
(3.197)
wie erwartet. Die beiden Eigenwerte sind jeweils zweifach entartet. Die Dispersion ist identisch mit der aus der
Klein-Gordon-Gleichung folgenden, abgesehen von der zusätzlichen Entartung. Die Eigenvektoren ψ0 diskutieren
wir später; für k ̸= 0 enthalten sie sowohl φ0 ̸= 0 als auch χ0 ̸= 0. Wir können natürlich immer in das mitbewegte
Inertialsystem transformieren, in dem k = 0 gilt.
c α lässt sich als Geschwindigkeitsoperator deuten: Im Heisenberg-Bild ist, für j = 1, 2, 3,
vj := ẋj =
3
3
i
ic ∑
ic
ic ∑
[αl p̂l , xj ] =
αl (−iℏ) δlj = c αj ,
[H, xj ] = [α · p̂, xj ] =
ℏ
ℏ
ℏ
ℏ
l=1
(3.198)
l=1
also v = c α. Beachte, dass v die Ableitung nach der Zeit t in einem Inertialsystem enthält, wie die Dirac-Gleichung
selbst auch. v korrespondiert also nicht direkt zur klassischen relativistischen Geschwindigkeit (uµ ) = (u0 , u), die
die Ableitung nach der Eigenzeit τ enthält.
Die αi nennt man manchmal Geschwindigkeitsmatrizen. Wegen αj2 = 1 sind die Eigenwerte von αj gleich ±1
und die von vj somit gleich ±c. Die Geschwindigkeitskomponenten kommutieren in der Dirac-Theorie, anders als
in der nichtrelativistischen Quantenmechanik, nicht:
(
)
0
2
2
2 σi σj − σj σi
[vi , vj ] = c [αi , αj ] = c (αi αj − αj αi ) = c
0
σi σj − σj σi
(
)
∑
σk 0
= 2ic2
ϵijk
̸= 0 für i ̸= j.
(3.199)
0 σk
k
Daher sind die Geschwindigkeitskomponenten nicht gleichzeitig scharf messbar. Die Geschwindigkeitskomponenten
kommutieren auch nicht mit dem Hamiltonian. Die oben betrachteten stationären Lösungen haben also keine
scharfe Geschwindigkeit (wohl aber einen scharfen Impuls ℏk).
65
3.3.3
Drehimpuls und Spin
Die stationären Lösungen der freien Dirac-Gleichung sind zweifach entartet. Das bedeutet, dass durch die DiracGleichung beschriebene Teilchen einen zweiwertigen inneren Freiheitsgrad haben. Um dessen physikalische Bedeutung zu verstehen, betrachten wir zunächst den (Bahn-) Drehimpuls
L := r × p.
(3.200)
Da das System rotationsinvariant ist, sollte der Drehimpuls erhalten sein. Wir überprüfen dies o.B.d.A. für L3 :
[H, L3 ] = c[α · p̂, x1 p̂2 − x2 p̂1 ] = c[α1 p̂1 + α2 p̂2 , x1 p̂2 − x2 p̂1 ] = c[α1 p̂1 , x1 p̂2 ] − c[α2 p̂2 + x2 p̂1 ]
= cα1 [p̂1 , x1 ] p̂2 − cα2 [p̂2 , x2 ] p̂1 = −iℏc (α1 p̂2 − α2 p̂1 )
| {z }
| {z }
=−iℏ
=−iℏ
= −iℏc (α × p̂)3 ̸= 0.
(3.201)
Überraschenderweise ist der Bahndrehimpuls nicht erhalten. Haben wir vielleicht Beiträge zum Drehimpuls übersehen? Können wir L zu einer Erhaltungsgröße vervollständigen? Dazu betrachten wir den Defekt“ −iℏc α × p̂
”
weiter: Es gilt
3
∑
∑ ( {α2 , αj } {α1 , αj } )
α1 p̂2 − α2 p̂1 =
−
α2 p̂j
(α1 δj2 − δj1 α2 )p̂j =
α1
2
2
j=1
j
=
=
1 ∑
α1
αj
α
α1
αj
α
(α1 α2 αj + 2 −
2 − αj α1 α2 )p̂j
2 j
1 ∑
[α1 α2 , αj ]p̂j
2 j
1
1
[α1 α2 , α · p̂] = − [α · p̂, α1 α2 ]
2
2
1
2
= − [H − βmc , α1 α2 ].
2c
=
(3.202)
Hierin ist
[β, α1 α2 ] = βα1 α2 − α1 α2 β = −α1 βα2 − α1 α2 β = +α1 α2 β − α1 α2 β = 0,
also
α1 p̂2 − α2 p̂1 = −
1
[H, α1 α2 ]
2c
(3.203)
(3.204)
und damit
⇒
⇒
iℏ
[H, L3 ] =
[H, α1 α2 ]
2
[
]
iℏ
H, L3 −
α1 α2 = 0
2
[
]
ℏ
H, L3 + (α1 α2 − α2 α1 ) = 0.
4i
(3.205)
(3.206)
(3.207)
Verallgemeinert auf alle Komponenten gilt
[
H, L +
]
ℏ
α × α = 0.
4i
Damit ist
(3.208)
ℏ
α×α
(3.209)
4i
eine Erhaltungsgröße von der Dimension eines Drehimpulses (“Gesamtdrehimpuls“). Es liegt nahe, den Zusatzterm
als Eigendrehimpuls (Spin) des Teilchens zu interpretieren, da er nicht aus der Bahnbewegung resultiert. Man
schreibt
J=L+S
(3.210)
J := L +
66
mit
ℏ
1
Σ,
Σ=
α × α.
2
2i
Explizit findet man für die obige Standarddarstellung der αi ,
(
)
σ 0
Σ=
.
0 σ
S=
Da
ℏ
2
(3.211)
(3.212)
σ bekanntlich die Drehimpulsvertauschungsrelationen erfüllt, tut S dies ebenfalls. Außerdem gilt
S·S=
ℏ2
4
(
σ·σ
0
0
σ·σ
)
=
(
)
3 2
1 1
ℏ 1=
+ 1 ℏ2 1.
4
2 2
(3.213)
S repräsentiert also einen Spin 1/2, genauer zwei Moden mit positiver und negativer Energie und jeweils dem
Spin 1/2. Aus Diracs linearem Ansatz für H folgt also zwingend, dass die beschriebenen Teilchen den Spin 1/2
tragen und damit insbesondere Fermionen sind.
Damit ist die Bedeutung der vier Komponenten des Dirac-Spinors klar: Es ist 4 = 2×2, wobei ein Faktor von 2
die Zweige positiver und negativer Energie unterscheidet und der andere Faktor von 2 die beiden Einstellmöglichkeiten des Spins. Es ist wichtig, sich klarzumachen, dass diese vier Komponenten nichts mit den ( zufällig“ auch)
”
vier Dimensionen des Minkowski-Raums zu tun haben.
Wir haben gesehen, dass der Gesamtdrehimpuls J eine Erhaltungsgröße ist:
[H, J] = 0.
(3.214)
Eine weitere Erhaltungsgröße der freien Dirac-Gleichung ist der Impuls p̂:
[H, p̂] = [c α · p̂, p̂] = 0.
(3.215)
p̂ · L = p̂ · (r × p̂) = p̂1 x2 p̂3 − p̂1 x3 p̂2 + p̂2 x3 p̂1 − p̂2 x1 p̂3 + p̂3 x1 p̂2 − p̂3 x2 p̂1 = 0,
(3.216)
Nun gilt
woraus folgt
p̂ · S
⇒
= p̂ · J
(3.217)
[H, p̂ · S] = [H, p̂ · J] = p̂ · [H, J] + [H, p̂] · J = 0.
(3.218)
Also ist p̂·S eine Erhaltungsgröße. Die Eigenfunktionen der freien Dirac-Gleichung sind ebene Wellen mit scharfem
Wellenvektor k. Man definiert die Helizität als Matrix
ĥ :=
In der Standarddarstellung ist also
k 2S
k
·
≡ · Σ.
k ℏ
k
(k
ĥ =
k
·σ
0
0
k
k ·σ
(3.219)
)
(3.220)
(eine alternative Definition fügt im unteren rechten Block ein Minuszeichen hinzu). Die Helizität ĥ beschreibt
die Spinkomponente (in Einheiten von ℏ/2) in Ausbreitungs- bzw. Bewegungsrichtung. Sie ist offensichtlich eine
Erhaltungsgröße. Ihre Eigenwerte sind h = ±1, wir können die vier Eigenzustände von H zum Wellenvektor k
durch
• E ≷ 0,
• h = ±1
klassifizieren. Teilchen mit positiver (negativer) Helizität nennt man rechtshändig (linkshändig).
67
k/k
k/k
S
S
h=+1
rechtshändig
h=-1
linkshändig
Wir können die Eigenfunktionen jetzt angeben: Sie lauten
ψ(r, t) = ψ0 eik·r−iEt/ℏ
)
 (
W+




AW+


(
)



W−


( ) 
−AW−
φ0
(
)
ψ0 ≡
=
χ0

−AW+




W+


(
)



AW−


W−
mit
(3.221)
für E > 0, h = +1,
für E > 0, h = −1,
(3.222)
für E < 0, h = +1,
für E < 0, h = −1,
wobei W± (Zweier-) Eigenspinoren der Helizität sind,
k
· σ Wh = h Wh ,
k
h = ±1,
(3.223)
und
A :=
|E|
=
ℏck
,
|E| + mc2
√
ℏ2 c2 k 2 + m2 c4 .
(3.224)
(3.225)
Offenbar ist A ≪ 1 falls ℏck ≪ mc2 , d.h. im nichtrelativistischen Limes.
Für massive Teilchen ist die Helizität zwar erhalten, aber nicht Lorentz-invariant, denn ĥ ist ein Skalarprodukt
von Dreiervektoren, nicht von Vierervektoren. Transformieren wir vom Laborsystem auf ein Bezugssystem, das
sich schneller als das Teilchen bewegt (das ist möglich für m > 0), so kehren sich k/k und damit die Helizität um.
3.3.4
Wahrscheinlichkeitsdichte
Eine Motivation für die Dirac-Gleichung war, dass die Klein-Gordon-Gleichung keine positiv definite, erhaltene Dichte erlaubt. Wie sieht das bei der Dirac-Gleichung aus? Wir müssen wieder eine Kontinuitätsgleichung
konstruieren. Aus der Dirac-Gleichung
(
)
∂
2
iℏ
(3.226)
+ iℏc α · ∇ − βmc ψ = 0
∂t
erhalten wir
(
)
∂
∂ψ
2
ψ iℏ
+ iℏc α · ∇ − βmc ψ = iℏ ψ †
+ iℏc ψ † α · ∇ψ − mc2 ψ † βψ = 0
∂t
∂t
†
mit dem Zeilenvektor
ψ † = (ψ1∗ , ψ2∗ , ψ3∗ , ψ4∗ ).
68
(3.227)
(3.228)
Die hermitesch konjugierte Dirac-Gleichung lautet
−iℏ
∂ψ †
− iℏc ∇ψ † · α − ψ † βmc2 = 0,
∂t
(3.229)
woraus folgt
∂ψ †
ψ − iℏc (∇ψ † ) · α ψ − mc2 ψ † βψ = 0.
∂t
Die Differenz von Gl. (3.227) und der letzten Gleichung ist
−iℏ
∂ †
(ψ ψ) + iℏc ∇ · (ψ † αψ) = 0
∂t
1 ∂ †
(ψ ψ) + ∇ · (ψ † αψ) = 0
c ∂t
∂ µ jµ = ∂µ j µ = 0,
iℏ
⇒
⇒
(3.230)
(3.231)
(3.232)
(3.233)
wenn wir die Viererstromdichte definieren als
(j µ ) := (ψ † cψ, ψ † cαψ).
(3.234)
Diese ist per Konstruktion erhalten. Die zeitliche Komponente ρ := j 0 /c = ψ † ψ ist auch offensichtlich positiv
definit. Wir können daher ρ = ψ † ψ als erhaltene Wahrscheinlichkeitsdichte interpretieren.
3.3.5
Teilchen im elektromagnetischen Feld
Ein Spin-1/2-Teilchen im elektromagnetischen Feld wird wieder durch minimale Kopplung beschrieben. Der günstigste Ausgangspunkt ist die explizit kovariante Form der Dirac-Gleichung,
(
)
iℏγ µ ∂µ − mc ψ(x) = 0.
(3.235)
Darin ersetzen wir
∂µ → D µ = ∂µ + i
Dies ergibt
(
)
iℏγ µ Dµ − mc ψ(x) = 0
⇔
(
q
Aµ .
ℏc
iℏγ µ ∂µ −
)
q µ
γ Aµ − mc ψ(x) = 0.
c
Um dies durch einen Hamiltonian auszudrücken, schreiben wir
(
)
iℏ 0 ∂
q
q
γ
− γ 0 ϕ(r, t) + iℏ γ · ∇ + γ · A(r, t) − mc ψ(r, t) = 0
c
∂t c
c
)
(
q
q
iℏ ∂
− ϕ(r, t) + iℏ α · ∇ + α · A(r, t) − βmc ψ(r, t) = 0
⇒
c ∂t c
c
(
)
∂ψ
ℏc
⇒ iℏ
=
α · ∇ − q α · A(r, t) + qϕ(r, t) + βmc2 ψ(r, t) ≡ Hψ(r, t).
∂t
i
(3.236)
(3.237)
(3.238)
(3.239)
(3.240)
Man findet leicht, dass die Viererstromdichte (j µ ) = (ψ † cψ, ψ † cαψ) weiterhin erhalten ist. Allerdings wäre eine
Definition von j µ mit Hilfe der γ-Matrizen hier günstiger. Wir haben γ 0 = β, γ = βα und β 2 = 1. Daraus folgt
und
Wir definieren
α = βγ
(3.241)
(j µ ) = (ψ † cββψ, ψ † cβγψ).
(3.242)
ψ̄ := ψ † β ≡ ψ † γ 0 ,
(3.243)
69
man nennt ψ̄ etwas missverständlich das Adjungierte (oder Pauli-Adjungierte) zu ψ. Damit ist
j µ = c ψ̄γ µ ψ.
(3.244)
∂ µ jµ = ∂ µ (c ψ̄γµ ψ) = c (∂ µ ψ̄)γµ ψ + c ψ̄γµ ∂ µ ψ.
(3.245)
Wir überzeugen uns von der Erhaltung von j µ :
Nun gilt gemäß der Dirac-Gleichung
1
γ µ ∂ ψ = γ ∂µ ψ =
iℏ
µ
µ
(
)
q µ
γ Aµ + mc ψ.
c
(3.246)
Die hermitesch konjugierte Dirac-Gleichung lautet
−iℏ(∂µ ψ † )(γ µ )† −
q † µ †
ψ (γ ) Aµ − mcψ † = 0.
c
(3.247)
Nun zeigt man durch explizites Nachrechnen, dass gilt
(γ µ )† = γ 0 γ µ γ 0 ,
(3.248)
also folgt
−iℏ(∂µ ψ̄)γ µ γ 0 −
q
ψ̄γ µ γ 0 Aµ − mcψ̄γ 0 = 0
c
(3.249)
q
⇒ −iℏ(∂µ ψ̄)γ µ − ψ̄γ µ Aµ − mcψ̄ = 0
c
(
)
1
q µ
µ
⇒ (∂ ψ̄)γµ = (∂µ ψ̄)γ µ = − ψ̄
γ Aµ + mc .
iℏ
c
Schließlich folgt
∂ µ jµ = −
3.3.6
c
ψ̄
iℏ
(
(3.250)
(3.251)
)
(
)
q µ
c
q µ
γ Aµ + mc ψ +
ψ̄
γ Aµ + mc = 0.
c
iℏ
c
(3.252)
Klein-Paradoxon
Als Anwendung betrachten wir die Streuung an einer Potentialstufe im Rahmen der Dirac-Theorie. Das skalare
Potential sei
V0
ϕ(z) =
θ(z), V0 > 0.
(3.253)
q
qφ(z)
II
II
V0
z
0
70
Wir wählen die Eichung A ≡ 0 und suchen stationäre Lösungen für einen von links einlaufenden Teilchenstrahl
mit positiver Energie E > 0 und Spin |↑⟩. Die Dirac-Gleichung lautet
(
)
q
iℏγ µ ∂µ − γ 0 ϕ(z) − mc ψ(r, t) = 0
(3.254)
c
und speziell in einer Raumdimension (beschrieben durch die Koordinate z)
(
)
iℏ 0 ∂
∂
q
γ
+ iℏ γ 3
− γ 0 ϕ(z) − mc ψ(z, t) = 0.
c
∂t
∂z
c
Wir machen den Ansatz
und erhalten
ψ(z, t) = ψ(z) e−iEt/ℏ
(
(3.256)
)
q 0
E 0
3 ∂
γ + iℏγ
− γ ϕ(z) − mc ψ(z) = 0
c
∂z
c
(
)
∂ψ
⇒
E − qϕ(z) γ 0 ψ(z) = −iℏcγ 3
+ mc2 ψ(z)
∂z
(
)
∂ψ
⇒
E − qϕ(z) ψ(z) = −iℏc γ 0 γ 3
+ mc2 γ 0 ψ(z).
| {z } ∂z
|{z}
α3
Wir betrachten eine einlaufende Welle im Bereich I:
(
)
|↑⟩
ψin (z) =
eikz
A|↑⟩
mit
(3.255)
(3.257)
(3.258)
(3.259)
β
|↑⟩ =
( )
1
.
0
(3.260)
Einsetzen ergibt
(
E
)
(
)
(
)
|↑⟩
|↑⟩
|↑⟩
= ℏckα3
+ mc2 β
A|↑⟩
A|↑⟩
A|↑⟩
⇒ E = ℏckA + mc2
∧
EA = ℏck − mc2 A.
(3.261)
(3.262)
Die Lösung mit positiver Energie lautet
E
A
√
ℏ2 c2 k 2 + m2 c4 ,
E − mc2
=
.
ℏck
=
(3.263)
(3.264)
Für die reflektierte Welle erhalten wir dasselbe Ergebnis mit k → −k, also A → −A. Wir nehmen hier an, dass
der Spin erhalten ist. Für die transmittierte Welle haben wir ebenfalls dasselbe Ergebnis, jedoch mit E durch
E − V0 ersetzt. Im Fall |E − V0 | < mc2 wird
k′ =
1 √
(E − V0 )2 − m2 c4
ℏc
(3.265)
′
rein imaginär; eik z ergibt dann eine exponentiell fallende Lösung. Nach diesen Überlegungen machen wir die
folgenden Ansätze in den Bereichen I und II:
(
)
(
)
|↑⟩
|↑⟩
ikz
ψI (z) =
e +r
e−ikz
(3.266)
A|↑⟩
−A|↑⟩
mit
k
=
A
=
1√ 2
E − m2 c4 ,
ℏc
E − mc2
ℏck
71
(3.267)
(3.268)
(
)
′
|↑⟩
ψII (z) = t
eik z
A′ |↑⟩
und
(3.269)
mit
k′
=
A′
=
1√
(E − V0 )2 − m2 c4 ,
ℏc
E − V0 − mc2
.
ℏck ′
(3.270)
(3.271)
Da die Dirac-Gleichung von erster Ordnung in räumlichen Ableitungen ist, existiert nur die eine Anschlussbedingung
ψI (0) = ψII (0)
⇒ 1 + r = t ∧ A − Ar = A′ t
2A
A − A′
∧
t=
.
⇒ r=
A + A′
A + A′
(3.272)
(3.273)
(3.274)
Zur Bestimmung der Reflexions- und Transmissionskoeffizienten benötigen wir die Stromdichte
j ≡ j 3 = ψ † cα3 ψ,
(3.275)
also für den einlaufenden Strahl (A ist reell)

0 0
(
) 0 0
jin = c 1, 0, A, 0 
1 0
0 −1
1
0
0
0
 
0
1
0
−1
   = 2cA,
0  A
0
0
1
0
0
0


0
1


−1
  0  = −2cA r∗ r


0
−A
0
0
(3.276)
für den reflektierten Strahl

0 0
(
) 0 0
∗

jR = c r r 1, 0, −A, 0 
1 0
0 −1
und für den transmittierten Strahl (A′ kann reell

0 0

(
)
0 0
jT = c t∗ t 1, 0, (A′ )∗ , 0 
1 0
0 −1
oder imaginär sein)
 
1 0
1
0
0 −1
   = c (A′ + A′∗ )t∗ t = 2c Re A′ t∗ t.
0 0  A′ 
0 0
0
Damit ist der Reflexionskoeffizient
T =
(3.278)
−jR
= r∗ r
jin
(3.279)
Re A′ t∗ t
jT
=
.
jin
A
(3.280)
R=
und der Transmissionskoeffizient
(3.277)
Wir unterscheiden zwei Fälle:
1. |E − V0 | < mc2 : A′ ist rein imaginär, damit ist T = 0 und
2
′ 2
A − A′ 2 A − i Im A′ 2
= A + (Im A ) = 1.
R=
=
A + i Im A′ A + A′ A2 + (Im A′ )2
72
(3.281)
2. |E − V0 | ≥ mc2 : A′ ist reell. Es folgt
)2
A − A′
A2 − 2AA′ + (A′ )2
= 2
,
′
A+A
A + 2AA′ + (A′ )2
4AA′
A′
4A2
= 2
,
′
2
A (A + A )
A + 2AA′ + (A′ )2
(
R
=
T
=
(3.282)
(3.283)
so dass R + T = 1 gilt, wie erwartet.
Solange V0 ≤ 2mc2 ist, ergibt sich kein ungewöhnliches Verhalten:
1
T
R
0
mc²
mc² +V0
E
keine einlaufende
Welle
E
mc² +V0
mc²
0
z
-mc²
Das Klein-Paradoxon tritt auf, wenn die Stufe größer ist als die zweifache Ruheenergie: V0 > 2mc2 .
73
1
T
R
0
mc²
V0 - mc²
mc² +V0
E
Im Energieintervall mc2 < E < V0 − mc2 finden wir R > 1 und T < 0. Wenn wir die Definitionen (3.279)
und (3.280) von R und T betrachten, sehen wir, dass die Ströme in diesem Fall in die umgekehrte Richtung fließen.
Weiterhin finden wir |A′ | > 1, d.h. die transmittierten Teilchen haben ein hohes Gewicht von Zuständen unterhalb
der Energielücke. Der Effekt beruht auf Tunneln von Zuständen oberhalb der Lücke in Zustände unterhalb der
Lücke.
E
mc² +V0
mc²
0
z
-mc²
Deren Strom zählt aber negativ“. Das liegt daran, dass ihre Geschwindigkeit antiparallel zu k ist. Schon in
”
der Klein-Gordon-Theorie hatte es sich angeboten, Zuständen unterhalb der Energielücke stattdessen die entgegengesetzte Ladung zuzuordnen. In demselben Sinne können wir sagen, dass an der Stufe zusätzliche Paare von
Teilchen mit den Ladungen ±q erzeugt werden, so dass die Teilchen der Ladung −q nach rechts laufen und die
mit der Ladung q nach links, zusätzlich zu den reflektierten einlaufenden Teilchen.
74
Dies erklärt die Ergebnisse R > 1 und T < 0 oder deutet sie zumindest. Die Interpretation der zusätzlichen
Teilchen mit Ladungen ±q als Teilchen-Antiteilchen-Paare ist sehr naheliegend. Diese Idee werden wir im nächsten
Abschnitt weiter verfolgen.
3.3.7
Löchertheorie
Die Dispersion freier Dirac-Teilchen ist, wie wir gesehen haben,
√
E = ± ℏ2 c2 k 2 + m2 c4 .
(3.284)
Damit leidet die Dirac-Theorie wie die Klein-Gordon-Theorie unter dem Problem, dass das Spektrum nach unten
unbeschränkt ist. Für die freie Theorie ist das kein Problem, da keine Übergänge zwischen Einteilchenzuständen
stattfinden können. Koppeln wir aber die Teilchen an das elektromagnetische Feld, so können sie beliebig viel
Energie abstrahlen und ihre Energie divergiert dabei nach −∞. Dieses Verhalten wird nicht beobachtet.
E
k
Dirac hat die Löchertheorie formuliert, um dieses Problem zu beheben: Im Vakuum sind die Zustände negativer Energie nicht, wie man zunächst denken würde, unbesetzt, sondern sie sind alle besetzt. Aufgrund des
Pauli-Prinzips können sie nicht mehrfach besetzt werden. Ein zusätzlich eingeführtes Elektron hat daher notwendigerweise positive Energie E ≥ mc2 . Dirac musste Folgendes postulieren:
1. Das Fermi-Gas von besetzten Zuständen, also das Vakuum, hat keine elektromagnetische Wirkung, obwohl
seine Ladungsdichte unendlich groß ist.
2. Das Vakuum hat keine gravitative Wirkung, obwohl seine Energiedichte unendlich groß ist.
3. Die divergente Energie des Vakuums kann als Nullpunkt der Energieskala gewählt werden.
75
√
Damit
kostet die Entfernung eines Teilchens negativer Energie − ℏ2 c2 k 2 + m2 c4 die positive Energie
√
ℏ2 c2 k 2 + m2 c4 . Ein fehlendes Teilchen nennt man, wie in der Halbleiterphysik, ein Loch. Aus dem 1. Postulat
folgt, dass ein Loch die entgegengesetzte Ladung −q trägt. Die Betrachtung von Wellenpaketen aus Zuständen
negativer
Energie zeigt, dass man die Dynamik in der Tat unter der Annahme der Ladung −q und der Dispersion
√
p2 c2 + m2 c4 verstehen kann. Im nicht-relativistischen Grenzfall v ≪ c ist die träge Masse also positiv.
Die Identifikation der Löcher mit Antiteilchen liegt nahe. Damit kann man nun im Prinzip die Paarerzeugung
beschreiben: Ein Teilchen wird aus einem Zustand negativer Energie in einen Zustand positiver Energie angehoben
und lässt ein Loch (Antiteilchen) zurück. Entsprechend kann man die Paarvernichtung durch den umgekehrten
Prozess beschreiben.
Die Löchertheorie ist jedoch aus mehreren Gründen problematisch:
• Die Begriffe des Vakuums, der Paarerzeugung und -vernichtung und des Pauli-Prinzips sind sämtlich nur
im Rahmen einer Mehrteilchentheorie sinnvoll. Die Löchertheorie ist also als Interpretation der EinteilchenDirac-Theorie inkonsistent.
• Zwar sind die Voraussagen der Theorie symmetrisch für Teilchen und Antiteilchen, aber die Formulierung
ist asymmetrisch (unendlich viele Teilchen, aber keine Antiteilchen im Vakuum).
• Eine unendliche Dichte von massiven, geladenen Teilchen soll keine beobachtbaren Konsequenzen haben.
Diese Probleme lassen sich im Rahmen der Mehrteilchentheorie beheben. Die Anwendung der Methoden aus
Kap. 2, insbesondere der Zweiten Quantisierung, führt auf eine konsistente Dirac-Feldtheorie. Diese wird in der
Vorlesung Quantenfeldtheorie besprochen.
3.4
Nichtrelativistischer Grenzfall und relativistische Korrekturen
Bewegt sich ein Dirac-Teilchen langsam im Vergleich zu c, so sollte sich aus der Dirac-Theorie die nichtrelativistische Quantenmechanik ergeben, allerdings für ein Teilchen mit dem Spin 1/2. Diesen Grenzfall untersuchen wir
in diesem Abschnitt.
3.4.1
Große und kleine Komponenten, Pauli-Theorie
Wir gehen von der Hamiltonschen Formulierung der Dirac-Theorie für ein Teilchen im elektromagnetischen Feld
aus, siehe Gl. (3.240):
]
[
(
∂ψ
q )
(3.285)
iℏ
= Hψ = c α · p̂ − A + qϕ + βmc2 ψ
∂t
c
76
mit
ℏ
∇.
i
Wir suchen stationäre Zustände und schreiben ψ und H wieder in Blockform,
( )
φ0 −iEt/ℏ
ψ =
e
,
χ0
)
)
(
(
q )
0 σ (
12
0
· p̂ − A + qϕ +
mc2 .
H = c
σ 0
0 −12
c
p̂ =
Dann lautet die Eigenwertgleichung für die Energie
(
)
( )
(
)
( )
(
q ) σχ0
φ0
φ0
φ0
c p̂ − A ·
+ qϕ
+ mc2
=E
.
σφ0
χ0
−χ0
χ0
c
Dies ergibt zwei gekoppelte Gleichungen für die Zweierspinoren φ0 (r), χ0 (r):
(
q )
c p̂ − A · σ χ0 = (E − qϕ − mc2 ) φ0 ,
c
(
q )
c p̂ − A · σ φ0 = (E − qϕ + mc2 ) χ0 .
c
(3.286)
(3.287)
(3.288)
(3.289)
(3.290)
(3.291)
Wir lösen die zweite Gleichung nach χ0 auf,
χ0 =
(
1
q )
c
p̂
−
A · σ φ0 .
E − qϕ + mc2
c
(3.292)
Soweit ist alles exakt. Ist nun E > 0 und
1. die Geschwindigkeit klein, v ≪ c, und
2. das Viererpotential schwach, d.h.
|qϕ| ≪ E,
q A ≪ |⟨p̂⟩|,
c
(3.293)
(3.294)
so folgt
E − qϕ + mc2 ≈ 2mc2
(3.295)
und
1
1 p̂
cp̂ · σ φ0 =
· σ φ0 .
(3.296)
2mc2
2 mc
Damit ist χ0 relativ zu φ0 um einen Faktor der Größenordnung v/c ≪ 1 kleiner. Man nennt daher φ0 die große
und χ0 die kleine Komponente von ψ0 für den Fall E > 0. Beachte, dass wir neben der nichtrelativistischen auch
eine Schwach-Feld-Näherung gemacht haben.
Nun schwächen wir die Annahmen etwas ab und fordern nur noch
χ0 ≈
1. v ≪ c und
2. |qϕ| ≪ E.
Dann ist die kleine Komponente
( v2 )
q )
1 (
p̂ − A · σ φ0 + O 2 .
2mc
c
c
Einsetzen in die Gleichung für die große Komponente ergibt
χ0 ∼
=
(
( v3 )
1 (
q )
q )
p̂ − A · σ p̂ − A · σ φ0 + O 3 ∼
= (E − qϕ − mc2 ) φ0 .
2m
c
c
c
77
(3.297)
(3.298)
In führender Ordnung in v/c erhalten wir damit die Pauli-Gleichung
HPauli φ0 (r) = (E − mc2 ) φ0 (r)
(3.299)
mit
(
1 (
q )
q )
p̂ − A · σ p̂ − A · σ + qϕ.
(3.300)
2m
c
c
Dieser Hamiltonian sieht des nichtrelativistischen Version schon recht ähnlich, aber die Pauli-Spin-Matrizen stören
noch. Wir verwenden die Identität
HPauli :=
(a · σ)(b · σ) =
3
∑
ai σi bj σj =
i,j=1
=
∑
∑
ai bj σi σj =
∑
i,j
ai bi 12 +
i
∑
i
ai bi σi σi +
|{z}
=12
∑
ai bj σi σj
i,j
i̸=j
ai bj ϵijk iσk
i,j,k
= a · b + i (a × b) · σ.
Im ersten Term in der letzten Zeile ist eine Einheitsmatrix 12 impliziert. Damit ist
q )2
i [(
q ) (
q )]
1 (
p̂ − A +
p̂ − A × p̂ − A · σ + qϕ
HPauli =
2m
c
2m
c
c
)
1 (
q )2
iq (
=
p̂ − A −
p̂ × A + A × p̂ · σ + qϕ
2m
c
2mc [
]
1 (
q )2
iq ℏ
ℏ ℏ =
p̂ − A −
(∇ × A) − A
×
∇
+
A
×
∇
· σ + qϕ
2m
c
2mc i
i
i
1 (
q )2
qℏ
=
p̂ − A −
B · σ + qϕ.
2m
c
2mc
Betrachten wir speziell ein Elektron, so ist
e )2
eℏ
1 (
p̂ + A +
B · σ − eϕ.
HPauli =
2me
c
2me c
(3.301)
(3.302)
(3.303)
Offenbar tritt ein Zeeman-Term proportional zu B · S ≡ B · ℏ2 σ auf. Wir führen das magnetische Moment µe ein
durch
eℏ
!
B · σ = −µe · B.
(3.304)
2me c
Dann ist
eℏ
e
eℏ S
S
µe = −
σ=−
S = −2
= −2µB
(3.305)
2me c
me c
2me c ℏ
ℏ
mit dem Bohrschen Magneton, in Gaußschen Einheiten,
eℏ
.
2me c
(3.306)
µ = ±gµB J
(3.307)
µB :=
Durch Vergleich mit der allgemeinen Beziehung
(das Vorzeichen hängt vom Vorzeichen der Ladung des Teilchens ab) finden wir, dass der Landé-Faktor des
Elektronenspins
g=2
(3.308)
beträgt. Die Kopplung an das elektromagnetische Feld führt zu einer kleinen Korrektur, die im Rahmen der QED
berechnet werden kann. Damit ist g = 2,0023. Zur Erinnerung: Für die Bahnbewegung eines Elektrons findet man
µL = −
L
e
L = −µB ,
2me c
ℏ
also den Landé-Faktor g = 1. Wir erhalten folgende Resultate:
78
(3.309)
• Das Elektron hat auch im nichtrelativistischen Grenzfall einen Eigendrehimpuls (Spin) S = 1/2.
• Dieser ist mit einem magnetischen Moment verbunden, das doppelt so groß ist, wie für Bahndrehimpulse.
3.4.2
Relativistische Korrekturen, Spin-Bahn-Kopplung
Bewegt sich ein Teilchen nicht ganz so langsam“, müssen wir über die Pauli-Gleichung hinaus die ersten Korrek”
turen in v/c berücksichtigen. Die bei der Herleitung der Pauli-Gleichung verwendete Methode lässt sich nicht leicht
auf höhere Ordnungen in v/c verallgemeinern. Ein Problem besteht im Term ϕ(r, t) im Nenner von Gl. (3.292),
der nicht mit p̂ kommutiert. Stattdessen verwendet man die sogenannte Foldy-Wouthuysen-Transformation. Die
Idee ist die folgende: Wir suchen eine evtl. zeitabhängige unitäre Transformation
U = eiS
(3.310)
(S ist hermitesch), die die großen und kleinen Komponenten in
( ′)
φ
= eiS ψ
ψ′ =
χ′
(3.311)
bis zu einer gewünschten Ordnung in 1/m entkoppelt. Die Entkopplung bedeutet, dass die transformierte Gleichung für ψ ′ bis zu dieser Ordnung keine Terme enthält, die φ′ und χ′ verknüpfen. Bis zu dieser Ordnung haben
wir damit unabhängige Gleichungen für die Zweierspinoren φ′ (wichtig für positive Energien) und χ′ (wichtig für
negative Energien).
Die Entwicklung in 1/m ist mathematisch sauberer als die in v/c, da m ein Parameter der Theorie ist, während
wir v als Erwartungswert oder Operator ansehen müssen. Die Bedingung, dass 1/m klein sein soll, bedeutet dabei,
dass alle anderen Beiträge zur Energie klein gegenüber der Ruheenergie mc2 sein sollen, was offensichtlich den
nichtrelativistischen Grenzfall ergibt.
Aus der Dirac-Gleichung erhalten wir
iℏ
∂ψ
∂t
∂ −iS ′
e ψ
∂t
(
)
∂ −iS
∂ψ ′
= iℏ
e
ψ ′ + e−iS iℏ
∂t
∂t
= iℏ
= Hψ = He−iS ψ ′
(
)
∂ −iS
!
= −eiS iℏ
e
ψ ′ + eiS He−iS ψ ′ = H ′ ψ ′ .
∂t
!
⇒
iℏ
∂ψ
∂t
′
(3.312)
(3.313)
Der transformierte Dirac-Hamiltonian lautet daher
)
(
∂
e−iS .
H ′ = eiS H − iℏ
∂t
(3.314)
Der ungewohnte zweite Term erscheint, weil S zeitabhängig sein kann. Es soll also ein S gefunden werden, so
dass in H ′ alle Terme bis zu einer gewissen Ordnung in 1/m verschwinden, die große und kleine Komponenten
koppeln. Wir geben hier nur die wesentlichen Ergebnisse an:
Fordern wir die Entkopplung bis zur Ordnung 1/m, so erhalten wir wieder den Pauli-Hamiltonian HPauli für
die großen Komponenten. Fordern wir dagegen die Entkopplung bis zur Ordnung (1/m)3 , so erhalten wir für die
großen Komponenten die Gleichung
Hφ0 = (E − mc2 ) φ0
(3.315)
mit
H
=
1 (
q )2
qℏ
p̂ − A −
B · σ + qϕ
c
|2m
{z 2mc
}
−
(
HPauli
q )4
1
qℏ2
qℏ
p̂ − A −
∇ · E−
(E × p̂) · σ +
3
2
2 c2
2 2
8m
c
c
8m
4m
|
{z
} |
{z
} | c {z
}
Korrektur zur
kinetischen Energie,
Darwin-Term
Spin-Bahn-Kopplung
79
qℏ2 ∂B
×σ
i
2 3
| 8m c {z∂t
}
.
Korrektur zur Zeeman-Energie
= 0 im statischen Feld
(3.316)
Den Darwin-Term kann man als Korrektur zur potentiellen Energie interpretieren. Er enthält
∇ · E = −∇2 ϕ = 4πρ.
(3.317)
Speziell in Atomen wird dieser Term nur für s-Orbitale relevant sein, da ρ(r) = eδ(r) und nur s-Orbitale eine
endliche Aufenthaltswahrscheinlichkeit am Kernort r = 0 haben. Die Spin-Bahn-Kopplung ist i.A. die wichtigste
Korrektur. Wir können sie schreiben als
HSB = −
qℏ
qℏ
ℏ
(E × p̂) · σ = + 2 2 (∇ϕ × p̂) · σ =
(∇V × p̂) · σ,
4m2 c2
4m c
4m2 c2
(3.318)
wobei V = qϕ das lokale Potential ist. Speziell für Zentralpotential gilt
∇ϕ =
dϕ r
,
dr r
(3.319)
also
qℏ 1 dϕ
q
1 dϕ
(r × p̂) · σ =
L · S.
(3.320)
4m2 c2 r dr
2m2 c2 r dr
Wir finden also eine L · S-Kopplung, wie sie aus der Atomphysik bekannt ist. Beachte, dass der Vorfaktor stark
r-abhängig ist. Für das Coulomb-Potential ϕ ∼ 1/r ist
HSB =
1 dϕ
1
∼ 3.
r dr
r
(3.321)
Wegen HSB kommutieren weder L noch S mit dem Hamiltonian, also sind L und S keine Erhaltungsgrößen.
Jedoch gilt für den Gesamtdrehimpuls J = L + S:
[
]
J2 − L2 − S2
1
1
1
[J, L · S] = J,
= [J, J2 ] − [L, L2 ] − [S, S2 ] = 0.
(3.322)
2
2
2
2
Der Gesamtdrehimpuls J ist also auch in Anwesenheit von Spin-Bahn-Kopplung erhalten.
3.4.3
Feinstruktur des Spektrums des Wasserstoffatoms
Eine wichtige Konsequenz der Spin-Bahn-Kopplung ist die Aufhebung von Entartungen im Energiespektrum
von Wasserstoff und wasserstoffähnlichen Ionen. Dies ist die sogenannte Feinstrukturaufspaltung. Wir könnten sie
ausgehend vom genäherten Hamiltonian mit relativistischen Korrekturen aus dem vorigen Abschnitt diskutieren.
Jedoch ist dies unnötig, da sich die Dirac-Gleichung für ein Elektron im Coulomb-Potential exakt lösen lässt. Die
Vorgehensweise ist ähnlich zur Lösung des Wasserstoffproblems in der Schrödinger-Quantenmechanik. Wir geben
hier nur das Ergebnis für die Energieeigenwerte an.
Der Hamiltonian lautet, jetzt in SI-Einheiten,
H = cα · p̂ − eϕ(r) + βme c2 = cα · p̂ −
Ze2 1
+ βme c2 ,
4πϵ0 r
(3.323)
wobei Z die Kernladungszahl ist. Die Eigenenergien sind

−1/2
2 2
Z α


En,j = me c2 1 + [
√
]2 
n − (j + 12 ) + (j + 12 )2 − Z 2 α2
,
(3.324)
wobei n = 1, 2, . . . die Hauptquantenzahl und j = 12 , 32 , . . . die Quantenzahl des Gesamtdrehimpulses ist. Nach
den üblichen Regeln für die Kombination von Drehimpulsen ist
{1
für l = 0,
2
j=
(3.325)
l ± 12 für l = 1, 2, . . . ,
80
wobei l die Quantenzahl des Bahndrehimpulses ist und 12 die Quantenzahl des Elektronenspins. Die Zustände
werden durch
nlj
(3.326)
bezeichnet, wobei l durch den Buchstaben s, p, d, f, g, h, . . . ersetzt wird.
α :=
e2 1
1
≈
4πϵ0 ℏc
137
(3.327)
ist die Feinstrukturkonstante in SI-Einheiten (jetzt wird klar, wieso sie so genannt wird!). Da
1
,
c
entsprechen kleine Zα dem nichtrelativistischen Grenzfall. Entwicklung von En,j nach Zα ergibt
(
)
2 4
2 4
1
1
3
m
Z
e
m
c
Z
e
e
(
)
En,j ∼
− α4
− 4 .
= me c2 −
(4πϵ0 )2 ℏ2 n2
2
4n
j + 12 n3
|
{z
}
|
{z
}
Zα ∼
nichtrelativistischer
Limes
(3.328)
(3.329)
relativistische
Korrekturen
Die Feinstrukturaufspaltung ist offenbar am größten, wenn j und n möglichst klein sind. Für n = 1 gibt es aber
keine Aufspaltung, da j dann auf den Wert j = 1/2 beschränkt ist. Die größte Aufspaltung tritt also zwischen
(2s1/2 , 2p1/2 ) und
2p3/2
(3.330)
auf. Im Wasserstoffatom beträgt diese Aufspaltung ungefähr 0,1 meV. 2s1/2 und 2p1/2 sind in der Dirac-Theorie
noch entartet (gleiches n und j). Diese Entartung wird durch die Wechselwirkung mit dem elektromagnetischen
Feld aufgehoben (Lamb-Shift).
Noch eine Bemerkung zum exakten Ausdruck (3.324): Das Ergebnis kann nicht stimmen, wenn Zα > 1 wird,
da dann für den kleinsten Wert von j, nämlich 12 , der Radikand
(
1 )2
j+
− Z 2 α2 = 1 − Z 2 α2 < 0
(3.331)
2
wäre. En,1/2 würde dann komplex, was ein Eigenwert eines hermiteschen Operators aber nicht sein kann. In der
hier nicht gezeigten Herleitung wird aber Zα < 1 angenommen. Für Zα > 1, also Z > 137, kann man das
Problem auch lösen, nur braucht man weitere Überlegungen. Physikalisch passiert für Z > 137 Folgendes: Der
am stärksten gebundene 1s1/2 -Zustand hat eine Bindungsenergie, die größer als 2me c2 ist. Der Zustand ist somit
resonant mit dem Kontinuum von Zuständen negativer Energie ( Positronen“).
”
- me c²
Bisher wurden keine Kerne mit Ladungszahlen Z > 137 hergestellt. Derselbe physikalische Effekt tritt jedoch
auch in Halbleitern auf, wenn die Bindungsenergie eines Donators größer ist als die Bandlücke.
81
3.5
Graphen
Als Beispiel dafür, dass Dirac-Teilchen im vielleicht unerwarteten Kontext der Festkörperphysik auftreten können,
betrachten wir die elektronische Struktur von Graphen. Graphen besteht aus einer Lage von Kohlenstoffatomen,
die ein Honigwabengitter bilden. Dieses ist ein Dreiecksgitter mit einer zweiatomigen Basis.
a1
δ
B
A
a2
Die C-Atome bilden σ-Bindungen zwischen sp2 -Hybridorbitalen aus. Die bindenden Molekülorbitale sind alle
besetzt, die antibindenden unbesetzt. Diese Orbitale spielen keine Rolle für die elektronischen Eigenschaften bei
niedrigen Energien (nahe der Fermi-Energie). Drei der vier Valenzelektronen des Kohlenstoffs besetzen diese Molekülorbitale. Jedes C-Atom hat noch ein pz -Orbital mit im Mittel einem Elektron. Diese pz -Orbitale hybridisieren
und bilden ein Energieband.
Eine vernünftige Näherung berücksichtigt nur das Hüpfen von Elektronen zwischen nächsten Nachbarn. Wir
schreiben den Hamiltonian für diese Elektronen in zweiter Quantisierung:
∑( †
)
H = −t
cARσ cBRσ + c†ARσ cB,R−a2 ,σ + c†ARσ cB,R−a1 ,σ + H.c.,
(3.332)
Rσ
wobei sich A und B auf die beiden Basisatome beziehen und H.c.“ für Hermitian conjugate steht.
”
Um die Eigenenergien aus Gl. (3.332) zu erhalten, führen wir eine Fourier-Transformation durch,
√
2 ∑ ik·R
e
cAkσ ,
cARσ =
N
k
√
2 ∑ ik·(R+δ)
e
cBkσ ,
cBRσ =
N
(3.333)
(3.334)
k
wobei N → ∞ die Zahl der C-Atome und N/2 somit die Zahl der Einheitszellen ist. Wir erhalten
H
)
′
′
2 ∑ ∑ [ −ik·R ( ik′ ·(R+δ)
e
e
+ eik ·(R+δ−a2 ) + eik ·(R+δ−a1 ) c†Akσ cBk′ σ
N
k,k′ ,σ R
) ′
]
(
+ e−ik·(R+δ) + e−ik·(R+δ−a2 ) + e−ik·(R+δ−a1 ) eik ·R c†Bkσ cAk′ σ
)
∑[(
= −t
eik·δ + eik·(δ−a2 ) + eik·(δ−a1 ) c†Akσ cBkσ
= −t
k,σ
)
]
+ e−ik·δ + e−ik·(δ−a2 ) + e−ik·(δ−a1 ) c†Bkσ cAkσ
]
∑[(
)
(
)
= −t
eik·δ1 + eik·δ2 + eik·δ3 c†Akσ cBkσ + e−ik·δ1 + e−ik·δ2 + e−ik·δ3 c†Bkσ cAkσ
(
k,σ
82
(3.335)
mit den Nächste-Nachbar-Vektoren
δ1
δ2
= δ,
= δ − a2 ,
(3.336)
(3.337)
δ3
= δ − a1 .
(3.338)
(
)
∑ †
cAkσ
(cAkσ , c†Bkσ ) Ĥ(k)
cBkσ
(3.339)
Den Hamiltonian kann man kompakt schreiben als
H=
k,σ
(
mit
Ĥ(k) = −t
0
e−ik·δ1 + e−ik·δ2 + e−ik·δ3
eik·δ1 + eik·δ2 + eik·δ3
0
)
.
Nun können wir die Eigenwerte leicht bestimmen:
√
E = ±t 3 + 2 cos k · (δ 2 − δ 1 ) + 2 cos k · (δ 3 − δ 2 ) + 2 cos k · (δ 1 − δ 3 )
√
√
√
3kx
3 ky
= ±t 3 + 4 cos
cos
+ 2 cos 3 ky .
2
2
(3.340)
(3.341)
Die beiden Bänder sind hier skizziert:
Wir finden Bandberührungen in Form von Doppelkegeln ( Dirac-Kegel“). Diese Dispersion erinnert bereits
”
an masselose Dirac-Teilchen. Die Brillouin-Zone ist ein Sechseck mit diesen Dirac-Punkten an den Ecken, also
erhalten wir zwei inäquivalente Dirac-Kegel pro Brillouin-Zone. Wir können z.B. die Kegel an den Punkten K
und K’ wählen.
83
K
Γ
1. Brillouin−Zone
K’
Linearisiert man die Dispersion in der Nähe der Dirac-Punkte ν = 1, 2, so kann man mit
{
kK für ν = 1,
q=k−
kK′ für ν = 2
und
Eq :=
3t
q
2
(3.342)
(3.343)
den Hamiltonian näherungsweise schreiben als
(
)
∑
H=
Eq c†ν + qσ cν + qσ − c†ν − qσ cν − qσ .
(3.344)
ν,q,σ
Das hochgestellte ± bezeichnet das Band positiver/negativer Energie.
Jetzt drehen wir die soeben ausgeführte Diagonalisierung zurück und schreiben


c1Aqσ
∑ †
 c2Aqσ 

H=
(c1Aqσ , c†2Aqσ , c†2Bqσ , c†1Bqσ ) Ĥ(q) 
 c2Bqσ 
q,σ
c1Bqσ
mit
Ĥ(q)

=
0
0
0

−t 

=
=
0
0
e−i(kK′ +q)·δ1 + e−i(kK′ +q)·δ2 + e−i(kK′ +q)·δ3
e
+e
+e
0

i(kK +q)·δ 1
i(kK +q)·δ 2
i(kK +q)·δ 3
0
e
+e
+e

0
ei(kK′ +q)·δ1 + ei(kK′ +q)·δ2 + ei(kK′ +q)·δ3


0
0
0
0


3i
3
0
0
0
2 qx − 2 qy
3
3i


q
+
q
0
0
0
x
y
2
2

−t 
3


0
− 3i
q
+
q
0
0
2 x
2 y
3
− 3i
q
−
q
0
0
0
x
2 y
2

0
0
0
qx + iqy
(
)

3i 
3i
0
0
qx − iqy
0
0
qx σ1 − qy σ2


− t
 = −2 t
0
−qx − iqy
0
0
−qx σ1 + qy σ2
0
2
−qx + iqy
0
0
0
[(
)
(
) ]
3
0 −iσ1
0
iσ2
t
qx +
(3.346)
qy .
iσ1
0
−iσ2 0
2
−i(kK +q)·δ 1
∼
=
(3.345)
−i(kK +q)·δ 2
−i(kK +q)·δ 3
84
Also lautet der effektive (linearisierte) Hamiltonian für festen Spin σ, in erster Quantisierung,
[(
)
(
) ]
3 t
0 −iσ1
0
iσ2
H̃σ =
p̂x +
p̂y .
iσ1
0
−iσ2 0
2 ℏ
(3.347)
Beachte, dass die beiden hier auftretenden Matrizen hermitesch sind und außerdem die folgenden Eigenschaften
haben:
(
)(
) (
)(
) (
)
0 −iσ1
0 −iσ1
0
iσ2
0
iσ2
12 0
=
=
,
(3.348)
iσ1
0
iσ1
0
−iσ2 0
−iσ2 0
0 12
)(
) (
)(
) (
)
(
0 −iσ1
0
iσ2
0
iσ2
0 −iσ1
0 0
+
=
.
(3.349)
iσ1
0
−iσ2 0
−iσ2 0
iσ1
0
0 0
Also handelt es sich um eine Darstellung der Dirac-Matrizen α1 und α2 . Damit können wir schreiben
H̃σ =
3 t
α · p̂
2 ℏ
(
mit
α=
)
α1
.
α2
(3.350)
(3.351)
Abgesehen davon, dass wir es mit einem zweidimensionalen System zu tun haben, ist dieser Hamiltonian identisch
mit dem Dirac-Hamiltonian für
3 t
c=
,
m = 0,
(3.352)
2 ℏ
also für ein masseloses Teilchen mit der (Fermi-) Geschwindigkeit vF = 3t/2ℏ, die für Graphen deutlich kleiner
als die Lichtgeschwindigkeit ist. Beachte, dass hier der Index ν = 1, 2, der zwischen Dirac-Punkten K, K ′ unterscheidet, an die Stelle des Spins tritt. Der reale Spin σ trat in der gesamten Herleitung nur als Zuschauer“ auf.
”
Durch die beiden Einstellmöglichkeiten σ = ↑, ↓ verdoppelt sich die Zahl der Zustände noch einmal.
85
Kapitel 4
Streutheorie
Wir hatten in der Quantentheorie 1 überwiegend gebundene Zustände betrachtet. Damit können wir die meisten
spektroskopischen Experimente im Prinzip verstehen. Diese Experimente messen die Übergangsenergien zwischen
gebundenen Zuständen sowie die Übergangsraten unter bekannten Störungen (vgl. die zeitabhängige Störungstheorie). Bei Streuexperimenten sind dagegen der Anfangs- und Endzustand i.A. ungebunden. Beispiele sind die
Experimente von Rutherford, Franck und Hertz, Stern und Gerlach sowie Compton und natürlich die Experimente mit Teilchenbeschleunigern. Um Streuexperimente beschreiben zu können, benötigen wir eine systematische
Quantentheorie der Streuung, von der wir hier die Grundzüge entwickeln wollen.
4.1
Grundlagen
Wir unterscheiden folgende Fälle:
• Streuung an einem festen Target. Dies ist ein Einteilchenproblem: Wir suchen Streuzustände eines Teilchens
in einem gegebenen Potential. Diese Streuung ist immer elastisch, die Einteilchenenergie ist erhalten.
• Streuung an anderen Teilchen. Handelt es sich um elastische Streuung, d.h. Streuung ohne innere Anregung der Teilchen und ohne Teilchenerzeugung und -vernichtung, an einem anderen Teilchen, kann das
Problem durch Transformation auf Schwerpunkts- und Relativkoordinaten auf die Streuung am Potential
zurückgeführt werden.
Wir machen einige vereinfachende Annahmen: Wir betrachten, zumindest vorerst, nur. . .
• Streuung an einem Potential (diese ist automatisch elastisch).
• den nichtrelativistischen Grenzfall, die kinetische Energie lautet also
p̂2
.
2m
Eine Verallgemeinerung auf die Dirac- oder Klein-Gordon-Gleichung ist möglich.
T =
(4.1)
• ein hinreichend schnell abfallendes Potential, genauer
lim rV (r) ≡ lim rV (r, ϑ, φ) = 0
r→∞
r→∞
∀ϑ, φ.
(4.2)
Das bedeutet, dass V schneller als 1/r abfällt. Beachte, dass wir damit das Coulomb-Potential ausschließen.
r = 0 nennen wir Streuzentrum.
• einen einfallenden Teilchenstrahl mit festem Impuls ℏk und daher fester Energie E = ℏ2 k 2 /2m weit entfernt
vom Streuzentrum. Dort wird der einlaufende Zustand also durch eine ebene Welle ψein (r, t) ∼ ei(k·r−Et/ℏ)
beschrieben. Das ist nicht realistisch, da diese ebene Welle unendlich breit ist, was außerdem im Experiment
die Detektion der gestreuten Welle stören würde. Wir stellen uns daher bei Bedarf ein aus ebenen Wellen
zusammengesetztes Wellenpaket vor.
86
Das Streuproblem besteht jetzt in der Lösung der zeitunabhängigen Schrödinger-Gleichung
(
)
ℏ2 2
−
∇ + V (r) ψ(r) = Eψ(r)
2m
mit E > 0 und
ψ(r) = ψ0 (r) + ψs (r) ,
| {z }
| {z }
Primärwelle
(4.3)
(4.4)
Streuwelle
wobei
ψ0 (r) = eik·r
(4.5)
(die Primärwelle wurde o.B.d.A. auf Amplitude 1 normiert). Weit entfernt vom Streuzentrum muss ψ und damit
auch ψs die freie Schrödinger-Gleichung zur
√ Energie E (elastische Streuung!) erfüllen. Daher muss ψs eine Superposition von ebenen Wellen mit |k| = 2mE/ℏ sein. Wegen der Lokalisierung des Streuers [schneller Abfall
von V (r)] ist eine Darstellung in Kugelkoordinaten günstig. Wir wählen das Koordinatensystem so, dass sich die
einlaufende Welle entlang der positiven z-Richtung ausbreitet: k = kẑ.
y
r
x
k
φ
θ
z
Nun ist
eikr
(4.6)
r
√
√
mit k = 2mE/ℏ (λ = 2π/k = 2πℏ/ 2mE ist die de-Broglie-Wellenlänge der Streuteilchen) für große r eine
Lösung der freien Schrödinger-Gleichung, denn
ψs (r) = f (ϑ, φ)
−
ℏ2 2
∇ ψs (r) =
2m
ℏ2 2
eikr
∇ f (ϑ, φ)
2m
r
[
]
2
2
ℏ
1 ∂
eikr
eikr
1
∂
∂f
eikr
1
∂2f
= −
f
r
+
sin
ϑ
+
2m
r ∂r2 r
r r2 sin ϑ ∂ϑ
∂ϑ
r r2 sin2 ϑ ∂φ2
ℏ2 k 2 eikr
ℏ2 ( eikr )
=
f
−
O f 3
2m
r
2m
r
( ℏ2 1
)
= Eψs (r) − O
ψ
(r)
.
s
2m r2
−
(4.7)
Die Schreibweise soll andeuten, dass die Beiträge der Ableitungen nach ϑ, φ durch einen zusätzlichen Faktor 1/r2
unterdrückt sind. Daher können wir schreiben
ψ(r) ∼
= eik·r + f (ϑ, φ)
eikr
r
(4.8)
für große r. Man nennt f (ϑ, φ) ≡ f (r̂) mit r̂ := r/r die Streuamplitude. Sie ist i.A. komplex.
Wir definieren nun den differentiellen Wirkungsquerschnitt (oder Streuquerschnitt) dσ/dΩ zunächst in Worten:
Es ist
dσ
Zahl der gestreuten Teilchen in dΩ pro Zeit
dσ ≡
dΩ =
.
(4.9)
dΩ
Zahl der einlaufenden Teilchen pro Zeit und Fläche
87
y
r²dΩr^
r
x
dΩ
0
z
dΩ = sin ϑ dϑ dφ ist das Raumwinkelelement in der Richtung r̂. Zähler und Nenner sind weit entfernt vom
Streuzentrum, d.h. für r → ∞, auszuwerten. Weiter definieren wir den totalen Wirkungsquerschnitt (oder Streuquerschnitt)
Zahl der gestreuten Teilchen pro Zeit
.
(4.10)
σtot =
Zahl der einlaufenden Teilchen pro Zeit und Fläche
Offenbar gilt
∫
σtot =
∫
dσ =
dΩ
dσ
.
dΩ
(4.11)
σtot hat die Dimension einer Fläche und lässt sich als Querschnittsfläche des Anteils des einlaufenden Strahls
interpretieren, der gestreut wird. Für den Fall der klassischen Streuung an einer harten Kugel mit dem Radius
R ist σtot = πR2 , also ist der totale Wirkungsquerschnitt gleich der Querschnittsfläche der Kugel.
Um dσ/dΩ durch die Streuamplitude f auszudrücken, bestimmen wir die Stromdichte aufgrund der einlaufenden Welle,
j0 (r) =
]
] ℏk
ℏ [ ∗
ℏ [ −ik·r ik·r
e
ike
− eik·r (−ik)e−ik·r =
ψ0 (r)∇ψ0 (r) − ψ0 (r)∇ψ0∗ (r) =
2mi
2mi
m
(4.12)
und die Stromdichte aufgrund der Streuwelle für r → ∞,
js (r)
=
=
]
] r→∞ ℏ [ e−ikr
−ikr
ℏ [ ∗
eikr
eikr
∗
∗
∗ e
∼
ψ (r)∇ψs (r) − ψs (r)∇ψs (r) =
f
∇f
−f
∇f
2mi s
2mi
r
r
r
r
[ (
)
(
)
−ikr
ikr
ikr
−ikr
ℏ
e
∂
e
e
∂
e
1
∂
1
∂
r̂ f ∗ f
− ff∗
+ ϑ̂ f ∗ 3
f −f 3
f∗
2mi
r ∂r r
r ∂r r
r ∂ϑ
r ∂ϑ
(
)]
1
∂
1
∂ ∗
+ φ̂ f ∗ 3
f −f 3
f
.
(4.13)
r sin ϑ ∂φ
r sin ϑ ∂φ
Wir benötigen im Folgenden nur die radiale Komponente
(
)
r→∞
ik
1 ik
1
ℏk 1
2 ℏk
∼
r̂ · js (r) = |f |
−
+ 2 + 3 = |f |2
.
m r2 r3
r
r
m r2
(4.14)
Die Zahl der gestreuten Teilchen pro Zeit im Raumwinkelelement dΩ erhalten wir, indem wir js für r → ∞ über
ein Flächenelement r2 dΩ r̂ der Kugeloberfläche mit dem Radius r integrieren:
r2 dΩ r̂ · js = |f |2
ℏk
dΩ.
m
(4.15)
Die Zahl der einlaufenden Teilchen pro Zeit pro Fläche ist einfach
|j0 | =
88
ℏk
.
m
(4.16)
Damit folgt
ℏk
|f |2
dΩ
dσ
m
dΩ =
= |f |2 dΩ,
ℏk
dΩ
m
(4.17)
also
dσ
= |f (ϑ, φ)|2 .
(4.18)
dΩ
Der differentielle Wirkungsquerschnitt ist demnach das Betragsquadrat der Streuamplitude. Es folgt sofort
∫
∫
∫
dσ
σtot = dΩ
= dΩ |f (ϑ, φ)|2 = dϑ dφ sin ϑ |f (ϑ, φ)|2 .
(4.19)
dΩ
Ist das Streupotential speziell ein Zentral potential, V (r) = V (r), so ist der Hamiltonian invariant unter Drehungen
um die Einfallsrichtung (z -Achse). Daher müssen beobachtbare Größen ebenfalls diese Rotationssymmetrie haben.
Das bedeutet, dass f und dσ/dΩ nur von ϑ, aber nicht von φ, abhängen können.
4.1.1
Teilchenzahlerhaltung und Optisches Theorem
Aus der Tatsache, dass in der Abwesenheit von Teilchenerzeugung und -vernichtung die Zahl der gestreuten
Teilchen gleich der Verminderung der Zahl der in Vorwärtsrichtung ungestreut weiterfliegenden Teilchen sein
muss, folgt das Optische Theorem
4π
σtot =
Im f (ϑ = 0).
(4.20)
k
Hier ist f (ϑ = 0) ≡ f (ϑ = 0, φ) die Streuamplitude in Vorwärtsrichtung. Wir beweisen dieses Theorem nun:
Die Erhaltung der Wahrscheinlichkeit (oder der Teilchenzahl) bedeutet, dass der Gesamtstrom durch eine geschlossene Fläche verschwinden muss. Wir wählen eine Kugel mit dem Radius r um das Streuzentrum. Wählen wir
r hinreichend groß im Vergleich zur Reichweite des Streupotentials, so können wir in der Nähe der Kugeloberfläche
die Wellenfunktion näherungsweise schreiben als
eikr
eik·r + f (ϑ, φ)
ψ(r) ∼
.
= |{z}
r}
|
{z
ψ0 (r)
(4.21)
ψs (r)
Die ebene Welle allein trägt nichts zum Strom durch die Kugel bei, denn was hinein fließt, kommt auch wieder
heraus. Die Streuwelle allein trägt, wie wir gesehen haben, den aus der Kugel herausfließenden Strom
∫
∫
ℏk
ℏk
2
Is = dΩ r r̂ · js (r) =
dΩ |f (ϑ, φ)|2 =
σtot
(4.22)
m
m
bei. Wie kann dann der Gesamtstrom verschwinden? Notwendig dafür ist die Interferenz von einlaufender und
gestreuter Welle. Der Interferenz-Beitrag zur Stromdichte ist
]
ℏ [ ∗
jint (r) =
ψ0 (r)∇ψs (r) + ψs∗ (r)∇ψ0 (r) − ψ0 (r)∇ψs∗ (r) − ψs (r)∇ψ0∗ (r) .
(4.23)
2mi
Wir benötigen nur die radiale Komponente
r̂ · jint (r) ≡ jint,r (r)
[
]
ℏ
∂
∂
∂ ∗
∂ ∗
=
ψ0∗ (r)
ψs (r) + ψs∗ (r)
ψ0 (r) − ψ0 (r)
ψs (r) − ψs (r)
ψ0 (r)
2mi
∂r
∂r
∂r
∂r
[
ikr
−ikr
∂
e
e
∂ ik·r
ℏ
e−ik·r
f (ϑ, φ)
+ f ∗ (ϑ, φ)
e
=
2mi
∂r
r
r ∂r
]
e−ikr
eikr ∂ −ik·r
ik·r ∂
∗
−e
f (ϑ, φ)
− f (ϑ, φ)
e
.
∂r
r
r ∂r
89
(4.24)
Hier benötigen wir die ebene Welle eik·r für große r. Der Grenzwert limr→∞ eik·r existiert aber nicht im Sinne von
gewöhnlichen Funktionen, sondern nur im Sinne von Distributionen. Wir müssen uns über die physikalisch angemessene Interpretation von eik·r für große r klar werden. Sie bestimmt hier die Reihenfolge von Grenzübergängen.
Der Ansatz ψ0 (r) = eik·r ist eine Idealisierung für einen Strahl mit endlichem Radius b, der groß ist gegenüber
2π/k = λ und gegenüber der Reichweite des Streupotentials. Der Radius r der betrachteten fiktiven Kugel soll
aber groß gegenüber allen Längen im System sein, also auch r ≫ b.
x
r
x
θ
z
0
z
2b
Wir schreiben also genauer für die einlaufende Welle (Ausbreitung entlang ẑ)
ψ0 (r) = Θ(b2 − x2 − y 2 ) eikz = Θ(b2 − r2 sin2 ϑ) eikr cos ϑ .
(4.25)
Für r ≫ b ist dies nur von Null verschieden, wenn ϑ = 0 oder π ist (Vorwärts- oder Rückwärtsrichtung). Daher
ist
ψ0 (r) ∼
(4.26)
= α δ(r̂ − ẑ) eikr + β δ(r̂ + ẑ) e−ikr
|
{z
} |
{z
}
vorwärts
rückwärts
mit noch zu bestimmenden Koeffizienten α, β. Diese müssen so gewählt werden, dass sie für kleine r, insbesondere
r < b, mit der ebenen Welle mit Amplitude eins, eik·r , kompatibel sind. Dazu betrachten wir die über eine Kugel
des Radius r < b integrierte (oder gemittelte) Wellenfunktion
∫
∫
[
]
!
dΩ r2 eik·r = dΩ r2 α δ(r̂ − ẑ) eikr + β δ(r̂ + ẑ) e−ikr .
(4.27)
Die linke Seite ergibt
∫
∫
2 ik·r
2
dΩ r e
= 2πr
∫
π
dϑ sin ϑ e
ikr cos ϑ
= 2πr
1
2
d(cos ϑ) eikr cos ϑ = 2πr2
−1
0
Die rechte Seite ergibt einfach
(
)
. . . = r2 α eikr + β e−ikr .
eikr − e−ikr
.
ikr
(4.28)
(4.29)
Gleichsetzen liefert
2π
2π
, β=−
.
ikr
ikr
Der Ausdruck für die einlaufende Welle für große r ≫ b ist schließlich
α=
ψ0 (r) ∼
=
2π ikr
2π −ikr
e δ(r̂ − ẑ) −
e
δ(r̂ + ẑ).
ikr
ikr
90
(4.30)
(4.31)
Dies setzen wir jetzt in den Interferenz-Beitrag zur radialen Stromdichte ein,
[
ℏ 2π
e−ikr
∂ eikr
eikr
∂ eikr
jint,r =
−
δ(r̂ − ẑ)f (r̂)
+
δ(r̂ + ẑ)f (r̂)
2mi ik
r
∂r r
r
∂r r
e−ikr ∂ eikr
e−ikr ∂ e−ikr
δ(r̂ − ẑ) − f ∗ (r̂)
δ(r̂ + ẑ)
r ∂r r
r ∂r r
eikr
∂ e−ikr
e−ikr
∂ e−ikr
−
δ(r̂ − ẑ)f ∗ (r̂)
+
δ(r̂ + ẑ)f ∗ (r̂)
r
∂r r
r
∂r r
]
eikr ∂ e−ikr
eikr ∂ eikr
+ f (r̂)
δ(r̂ − ẑ) − f (r̂)
δ(r̂ + ẑ) .
r ∂r r
r ∂r r
+ f ∗ (r̂)
(4.32)
Nun ist
(
∂ e±ikr
1 ) e±ikr
= ± ik −
.
(4.33)
∂r r
r
r
Die Beiträge mit einem zusätzlichen Faktor 1/r fallen für r → ∞ schneller ab und sind daher vernachlässigbar.
Es bleibt
[
ℏ 2π ik
(
∗ (
((
((
jint,r =
− δ(r̂ − ẑ)f (r̂) + (
δ(r̂(+(ẑ)f
(r̂) + δ(r̂ − ẑ)f ∗ (r̂) + (
δ(r̂(+(ẑ)f
(r̂)
2
2mi ik r
]
(
∗ (
((
((
+ δ(r̂ − ẑ)f ∗ (r̂) − (
δ(r̂(+(ẑ)f
(r̂) − δ(r̂ − ẑ)f (r̂) − (
δ(r̂(+(ẑ)f
(r̂)
= −
ℏ 4π
ℏ 4π
δ(r̂ − ẑ) Im f (r̂) = −
δ(r̂ − ẑ) Im f (ẑ).
m r2
m r2
(4.34)
Interferenz tritt also nur in Vorwärtsrichtung auf. Die radiale Komponente jint,r ist negativ, d.h. der Interferenzstrom fließt von rechts nach links. Dies drückt aus, dass jint eine Vermindung der i.A. sehr viel größeren
Stromdichte j0 in Vorwärtsrichtung beschreibt. Der Interferenz-Beitrag zum Gesamtstrom durch die große Kugel
ist damit
∫
ℏ
ℏ
Iint = dΩ r2 jint,r (r) = −4π Im f (ẑ) = −4π Im f (ϑ = 0).
(4.35)
m
m
Der Gesamtstrom muss verschwinden,
ℏ
ℏk
!
σtot − 4π Im f (ϑ = 0) = 0.
I = I0 +Is + Iint =
|{z}
m
m
(4.36)
=0
Es folgt
σtot =
4π
Im f (ϑ = 0).
k
(4.37)
Während das Optische Theorem aus einem einfachen Prinzip, der Teilchenzahlerhaltung, folgt, ist die Herleitung recht subtil. Wir werden sehen, dass es sich im Rahmen der im Folgenden betrachteten Partialwellenmethode
einfacher begründen lässt.
4.2
Partialwellen und Streuphasen
Wir haben gesehen, dass für das Streuproblem die Verwendung von Kugelkoordinaten bzgl. des Streuzentrums
als Koordinatenursprung nützlich ist. Dies legt nahe, die Wellenfunktion nach Kugelflächenfunktionen Ylm (ϑ, φ)
zu entwickeln, die die natürliche Basis des winkelabhängigen Anteils bilden. Wir beschränken uns auf den Fall
eines Zentralpotentials V (r) und wählen die z-Achse parallel zur Einfallsrichtung. Dann ist das System rotationssymmetrisch um die z-Achse und in der Entwicklung treten nur Terme mit m = 0 auf,
√
2l + 1
Pl (cos ϑ)
(4.38)
Yl0 (ϑ, φ) =
4π
91
mit den Legendre-Polynomen Pl (u). Wir schreiben also
ψ(r) =
∞
∑
ul (r)
r
l=0
Pl (cos ϑ)
(4.39)
und nennen dies die Zerlegung nach Partialwellen. Die Beiträge von l = 0, 1, 2, . . . nennt man s-, p-, d-, . . .
Streuung oder auch s-Wellen-Streuung, usw. Der explizite Faktor 1/r wird sich später als nützlich erweisen; dies
war auch schon bei der Betrachtung gebundener Zustände im Zentralpotential der Fall. Wie dort zerlegen wir die
kinetische Energie in Radial- und Winkelanteil,
[
]
ℏ2 1 ∂ 2
L2
r
+
+
V
(r)
ψ(r) = E ψ(r)
(4.40)
H ψ(r) = −
2m r ∂r2
2mr2
]
∑ ul (r)
∑[
ℏ2 l(l + 1)
V (r)
ℏ2 1 ′′
ul (r) +
u
(r)
+
u
(r)
Pl (cos ϑ) = E
Pl (cos ϑ)
⇒
−
(4.41)
l
l
3
2m r
2mr
r
r
l
l
]
∑[
∑
ℏ2 ′′
ℏ2 l(l + 1)
−
⇒
ul (r) Pl (cos ϑ).
(4.42)
ul (r) +
u
(r)
+
V
(r)
u
(r)
Pl (cos ϑ) = E
l
l
2
2m
2mr
l
l
Unter Ausnutzung der Orthogonalität der Pl (u) erhalten wir
−
ℏ2 l(l + 1)
ℏ2 ′′
ul (r) +
ul (r) + V (r) ul (r)
2m
2mr2 [
]
⇒
u′′l (r) + k 2 − veff (r) ul (r)
=
E ul (r)
(4.43)
=
0
(4.44)
mit
k2
veff (r) ≡
:=
2m
Veff (r) :=
ℏ2
2m
E,
ℏ2
2m
l(l + 1)
V (r) +
.
2
ℏ
r2
(4.45)
(4.46)
Für große Abstände vom Streuzentrum geht veff (r) → 0 und ul (r) erfüllt daher asymptotisch die Gleichung
mit der Lösung
u′′l (r) ∼
= −k 2 ul (r)
(4.47)
ul (r) ∼
= Al e−ikr + Bl eikr .
| {z }
| {z }
(4.48)
einlaufend
auslaufend
Wegen der Teilchenzahl- und Drehimpulserhaltung muss für jedes l die auslaufende Amplitude gleich der einlaufenden sein:
|Bl | = |Al |.
(4.49)
Die ul (r) enthalten sowohl die einfallende ebene Welle als auch die Streuwelle. Der asymptotische einlaufende
Anteil Al e−ikr enthält natürlich ausschließlich die einfallende ebene Welle.
Die einfallende Welle ψ0 allein können wir ebenfalls entwickeln: Wir verwenden die Identität (ohne Beweis)
eik·r = eikr cos ϑ =
∞
∑
(2l + 1) il jl (kr) Pl (cos ϑ)
(4.50)
l=0
mit den sphärischen Bessel-Funktionen
√
jl (x) :=
π
J 1 (x)
2x l+ 2
und den Legendre-Polynomen Pl (u). Für x ≫ 1 gilt nun aber
(
π )
sin x − l
2
jl (x) ∼
=
x
92
(4.51)
(4.52)
und für große Abstände vom Streuzentrum, kr ≫ 1, folgt
(
)
π
π
π
∑
∑
eikr e−i 2 l − e−ikr ei 2 l
ik·r
l sin kr − 2 l
∼
(2l + 1) i
e
Pl (cos ϑ) =
(2l + 1) il
Pl (cos ϑ)
=
kr
2ikr
l
!
=
l
∑ A(0) e−ikr + B (0) eikr
l
l
r
l
Pl (cos ϑ).
(4.53)
Damit sind die Koeffizienten (beachte eiπ/2 = i)
π
(0)
ei 2 l
2ik
= −(2l + 1) il
Al
(0)
Bl
(2l + 1) il
=
= −(−1)l (2l + 1)
−i π
2l
e
= (2l + 1)
2ik
1
,
2ik
1
.
2ik
(4.54)
(4.55)
Der einlaufende Anteil von ul (r) stammt nur von der einfallenden ebenen Welle, also ist
(0)
Al = Al
= −(−1)l (2l + 1)
1
.
2ik
(4.56)
Es folgt
(0)
(0)
|Bl | = |Al | = |Al | = |Bl |.
(0)
Bl und Bl
(4.57)
unterscheiden sich also höchstens in ihrer Phase. Wir definieren daher
(0)
Bl = e2iδl Bl ,
(4.58)
hier heißen die δl Streuphasen. 2δl ist also die Phasenverschiebung der auslaufenden Welle im Kanal l im Vergleich
zum einfallenden Strahl. Die Streuphasen hängen i.A. von der Energie ab. Wir erhalten nun für große r,
ul (r)
eikr e2iδl
e−ikr
∼
+ (2l + 1)
= −(−1)l (2l + 1)
2ik
2ik
)
π
2l + 1 i π l iδl ( ikr −i π l iδl
=
e 2 e e e 2 e − e−ikr ei 2 l e−iδl
2ik
(
)
π
2l + 1 l iδl
i e sin kr − l + δl .
=
k
2
(4.59)
Für große r gilt aber auch
⇒
f (ϑ)
ψ(r)
e
∼
= eik·r + f (ϑ)
eikr
r
∼
= ψ(r) − eik·r ,
ikr
r
(4.60)
(4.61)
woraus folgt
f (ϑ)
⇒
eikr
r
=
f (ϑ)
=
∑(
(0)
Bl − Bl
l
∑ 2l + 1
l
=
2ik
∑ 2l + 1
l
k
) eikr
Pl (cos ϑ)
r
(e2iδl − 1) Pl (cos ϑ)
eiδl sin δl Pl (cos ϑ).
Die Streuphasen δl bestimmen also f (ϑ) und damit das Streuverhalten eindeutig und vollständig.
93
(4.62)
(4.63)
Insbesondere ergibt sich für den totalen Wirkungsquerschnitt
∫
∫ π
2
σtot =
dΩ |f (ϑ)| = 2π
dϑ sin ϑ|f (ϑ)|2
0
= 2π
∑ (2l + 1)(2l′ + 1)
k2
ll′
=
e−iδl +iδl′ sin δl sin δl′
∫
dϑ sin ϑ Pl (cos ϑ) Pl′ (cos ϑ)
|
{z
}
2
= 2l+1
δll′
4π ∑
(2l + 1) sin2 δl .
k2
(4.64)
l
Diese Gleichung beschreibt die Beiträge von verschiedenen Drehimpulsen l zum totalen Wirkungsquerschnitt.
Andererseits erhalten wir für die Streuamplitude in Vorwärtsrichtung
f (ϑ = 0) =
∑ 2l + 1
k
l
eiδl sin δl Pl (1)
| {z }
⇒
Im f (ϑ = 0) =
2l + 1
sin2 δl .
k
(4.65)
=1
Also gewinnen wir wieder das Optische Theorem
4π
Im f (ϑ = 0).
k
σtot =
(4.66)
Als Beispiel für die Partialwellenmethode betrachten wir zunächst ein Potential der Form
V (r) =
ℏ2 C
2mr2
(4.67)
mit einer dimensionslosen Konstante C > 0, für das sich die Streuphasen exakt bestimmen lassen. Es ist
veff (r) =
Die Gleichung
u′′l (r)
C + l(l + 1)
Cl
=: 2 .
2
r
r
(4.68)
[
]
Cl
+ k − 2 ul (r) = 0
r
2
(4.69)
ist vom Bessel-Typ und hat die allgemeine Lösung
√
√
+
−
(kr) + αl− r H√
(kr)
ul (r) = αl+ r H√
1+4C /2
1+4C /2
l
mit Hankel-Funktionen
l
Hn± (x) := Jn (x) ± i Yn (x).
Für große x gilt
√
Hn± (x)
∼
=
2 ±ix ∓i π2
e
e
πx
(
n+ 21
(4.70)
(4.71)
)
.
(4.72)
Daher finden wir für große r
√
ul (r)
∼
= αl+
2 ikr −i π (√1+4Cl +1)
e e 4
+ αl−
πk
√
2 −ikr i π (√1+4Cl +1)
e
e 4
πk
= Al e−ikr + Bl eikr ,
!
√
also
αl−
(4.73)
1
2 i π (√1+4Cl +1)
(0)
= Al = Al = −(−1)l (2l + 1)
e 4
πk
2ik
94
(4.74)
√
und
αl+
2 −i π (√1+4Cl +1)
e2iδl
(0)
= Bl = e2iδl Bl = (2l + 1)
e 4
πk
2ik
√
1+4Cl +1)
√
π
αl− ei 4 ( 1+4Cl +1)
αl+ e−i 4 (
π
⇒
e
2iδl
=
−(−1)
=
αl+
i (−1)l −
αl
l
e
√
−i π
1+4Cl
2
= −(−1)l
(4.75)
αl+ −i π √1+4Cl −i π
2
e 2
|e {z }
αl−
−i
.
(4.76)
Nun müssen wir noch die Koeffizienten αl± bestimmen. Für kleine r wird die Radialgleichung (4.69) zu
u′′l (r) −
mit den Lösungen
Cl
ul (r) ∼
=0
r2
∼ ± 12 (1±
u±
l (r) = βl r
(4.77)
√
1+4Cl )
.
(4.78)
u−
l (r)
Man kann zeigen, dass die Lösungen
für r → 0 so stark divergieren, dass ψ(r) in einer Umgebung des
Streuzentrums nicht quadratintegrabel ist. Also muss gelten
√
⇒
ul (r)
ul (r)
lim √
r→0
r
1
∼
= βl+ r 2 (1+
=
lim βl+ r
1+4Cl )
√
1
1+4Cl
2
r→0
für r → 0
= 0.
(4.79)
(4.80)
Es folgt
0
=
=
]
[
ul (r)
−
+
lim √
(kr) + αl− H√
(kr)
= lim αl+ H√
1+4Cl /2
1+4Cl /2
r→0
r
[
]
lim (αl+ + αl− ) J√1+4Cl /2 (kr) + i (αl+ − αl− ) Y√1+4Cl /2 (kr) .
r→0
r→0
(4.81)
Da die Bessel-Funktionen Yn (x) für x → 0 divergieren, folgt
αl+ = αl− .
(4.82)
Damit ist
e2iδl
⇒
δl
√
√
= i (−1)l e−i 2 1+4Cl = ei 2 eiπl e−i 2 1+4Cl
( [
])
1 1√
= exp iπ l + −
1 + 4Cl
2 2
) π(
)
π(
1 1√
1 1√
=
l+ −
1 + 4Cl =
l+ −
1 + 4l(l + 1) + 4C
2 ( 2 2
2)
2 2
√(
)
2
π
1
1
=
l+ −
l+
+C ,
2
2
2
π
π
π
(4.83)
(4.84)
wobei die Streuphasen natürlich nur modulo 2π definiert sind. Jetzt können wir im Prinzip alle interessierenden
Größen berechnen, z.B.
√(
√(
(
[
])
( [
])
∑ 2l + 1
π
1
1 )2
1
1 )2
π
f (ϑ) =
exp i
l+ −
l+
l+ −
l+
+C
sin
+C
Pl (cos ϑ) (4.85)
k
2
2
2
2
2
2
l
und
σtot
√(
( [
])
π
1
1 )2
4π ∑
2
.
l+ −
l+
+C
= 2
(2l + 1) sin
k
2
2
2
l
{z
}
|
δl
95
(4.86)
Beachte, dass für l ≫ 1 gilt
δl
=
∼
=
√
]
1 (
1)
C
l+ − l+
1+
2
2
(l + 1/2)2


(
)−3
π
1 (
1)
C
1

) +O l+
l+ − l+
− (
2
2
2
2
2 l+ 1
π
2
= −
[
π C
4 l + 12
2
(
)−3
1
+O l+
.
2
(4.87)
Die Streuphasen verschwinden für l → ∞ wie 1/l. Die Beiträge großer Drehimpulse zum totalen Wirkungsquerschnitt σtot verschwinden also auch nur wie l/l2 = 1/l und die Reihe divergiert. Das liegt daran, dass das
Potential ∼ C/r2 langreichweitig ist. f (ϑ) und dσ/dΩ sind jedoch wohldefiniert, wenngleich die l-Reihe sehr
langsam konvergiert.
4.2.1
Streupotentiale mit endlichem Träger
Weitere Erkenntnisse lassen sich für den Fall von (Zentral-) Potentialen mit
V (r) = 0
∀r >a
(4.88)
gewinnen. In diesem Fall konvergieren auch alle auftretenden l-Reihen. Es sei
v(r) :=
2m
V (r),
ℏ2
also
veff = v(r) +
Wir wollen die Gleichung
u′′l (r)
(4.89)
l(l + 1)
.
r2
]
l(l + 1)
+ k − v(r) −
ul (r) = 0
r2
(4.90)
[
2
(4.91)
mit den Randbedingungen
ul (0) = 0
(4.92)
(
)
π
2l + 1 l iδl
i e sin kr − l + δl
für große r
ul (r) ∼
=
k
2
(4.93)
[damit ψ(r) regulär bei r = 0 ist] und
lösen. Für r > a haben wir die Besselsche Differentialgleichung
[
]
l(l + 1)
u′′l (r) + k 2 −
ul (r) = 0
r2
(4.94)
mit der allgemeinen Lösung (s.o.)
ul (r) = αl+
√
√
+
−
r Hl+1/2
(kr) + αl− r Hl+1/2
(kr).
(4.95)
Für unseren Fall ist aber eine andere Darstellung günstiger:
(1)
ul (r) = βl
(2)
r jl (kr) + βl
96
r yl (kr),
(4.96)
wobei jl (x), yl (x) sphärische Bessel-Funktionen erster bzw. zweiter Art sind. Diese sind für l = 0, 1, 2, . . . durch
elementare Funktionen darstellbar:
j0 (x)
=
j1 (x)
=
j2 (x)
...
=
y0 (x)
=
y1 (x)
=
y2 (x)
...
=
sin x
,
x
sin x − x cos x
,
x2
(3 − x2 ) sin x − 3x cos x
,
x3
cos x
,
x
cos x + x sin x
−
,
x2
(3 − x2 ) cos x − 3x sin x
−
,
x3
−
(4.97)
(4.98)
(4.99)
(4.100)
(4.101)
(4.102)
(4.103)
Die Funktionen jl (x) sind alle für x → 0 endlich (hebbare Singularität), die Funktionen yl (x) haben dort jedoch
einen Pol.
Für große x gilt
)
(
sin x − π2 l
(4.104)
jl (x) ∼
,
=
(x
)
cos x − π2 l
yl (x) ∼
,
(4.105)
= −
x
[
]
(
(
1 (1)
π )
π )
(2)
ul (r) ∼
βl sin kr − l − βl cos kr − l .
=
k
2
2
also
(4.106)
Um die Randbedingungen (4.93) zu erfüllen, setzen wir
(1)
βl
= βl cos δl ,
(4.107)
(2)
βl
= −βl sin δl ,
(4.108)
denn dann folgt
ul (r)
∼
=
=
[
]
(
(
βl
π )
π )
cos δl sin kr − l + sin δl cos kr − l
k
2
2
(
)
(
)
βl
π
2l + 1 l iδl
π
!
sin kr − l + δl =
i e sin kr − l + δl .
k
2
k
2
(4.109)
Daher muss gelten
βl = (2l + 1) il eiδl .
(4.110)
[
]
ul (r) = (2l + 1) il eiδl r cos δl jl (kr) − sin δl yl (kr) .
(4.111)
Die (exakte) Lösung für r > a ist damit
Somit haben wir für 0 ≤ r ≤ a zu lösen
u′′l (r)
[
]
l(l + 1)
+ k − v(r) −
ul (r) = 0
r2
2
97
(4.112)
mit
ul (0) = 0,
ul (a)
u′l (a)
[
]
= (2l + 1) i e a cos δl jl (ka) − sin δl yl (ka) ,
[
]
d
=
(2l + 1) il eiδl r cos δl jl (kr) − sin δl yl (kr) dr
r=a
[
]
2l + 1 l iδl {
i e
cos δl ka jl−1 (ka) + jl (ka) − ka jl+1 (ka)
=
2
[
]}
− sin δl ka yl−1 (ka) + yl (ka) − ka yl+1 (ka) .
l iδl
(4.113)
(4.114)
(4.115)
Drei Randbedingungen überbestimmen die Lösung der Differentialgleichung, die ja von zweiter Ordnung ist. Die
zusätzliche Gleichung legt die noch unbestimmte Streuphase δl fest. Wir betrachten zunächst den Spezialfall l = 0
(s-Wellen-Streuung): Hier ist einfach
[
]
u′′0 (r) + k 2 − v(r) u0 (r) = 0
(4.116)
mit
u0 (0)
=
u0 (a) =
u′0 (a) =
0,
(
sin ka
cos ka ) eiδ0
eiδ0 a cos δ0
+ sin δ0
=
sin(ka + δ0 ),
ka
ka
k
d eiδ0
sin(ka + δ0 )
= eiδ0 cos(ka + δ0 ).
dr k
r=a
(4.117)
(4.118)
(4.119)
Es folgt
u0 (a)
u′0 (a)
⇒
δ0
1
tan(ka + δ0 )
k
k u0 (a)
+ νπ = −ka + arctan
= −ka + arctan ′
u0 (a)
(4.120)
=
d
dr
k
+ νπ
ln u0 (r)r=a
(4.121)
mit ν ∈ Z. Beachte, dass wir hiermit die Lösung für δ0 nur modulo π und nicht modulo 2π bestimmt haben. Die
Anschlussbedingungen bei r = a erlauben auch nicht, δ0 modulo 2π zu bestimmen, da
eiδ0
ei(δ0 +π)
sin(ka + δ0 + π) = (−1)2
sin(ka + δ0 )
| {z } k
k
(4.122)
=1
und
ei(δ0 +π) cos(ka + δ0 + π) = (−1)2 eiδ0 cos(ka + δ0 ).
| {z }
(4.123)
=1
Das macht aber nichts, da sich f (ϑ) bei einer Verschiebung δl → δl + π für irgendwelche l nicht ändert. Wir
können also ν = 0 setzen. Explizite Berechnung von δ0 erfordert natürlich die Lösung der Differentialgleichung
für ein konkretes Potential v(r).
Für l > 0 ist die allgemeine Rechnung mühsam und wir betrachten nur zwei Grenzfälle:
• 0 < l ≪ ka: Wir können die asymptotische Form der sphärischen Bessel-Funktionen für große Argumente
verwenden und erhalten analog zum Fall l = 0,
(
(
)
)]
[
sin ka − π2 l
cos ka − π2 l
l iδl
∼
+ sin δl
ul (a) = (2l + 1) i e a cos δl
ka
ka
(
)
2l + 1 l iδl
π
=
(4.124)
i e sin ka − l + δl ,
k
2
(
)
∼ (2l + 1) il eiδl cos ka − π l + δl ,
u′l (a) =
(4.125)
2
98
also (wieder modulo π)
π
δl ∼
= l − ka + arctan
2
d
dr
k
.
ln ul (r)r=a
(4.126)
• l ≫ ka: Hier können wir die asymptotische Form für kleine Argumente verwenden,
xl
,
(2l + 1)!!
(2l − 1)!!
yl (x) ∼
,
= −
xl+1
wobei die Doppelfakultät“ für ungerades n lautet
”
n!! := 1 × 3 × 5 × · · · × n.
jl (x) ∼
=
Damit ist
ul (a)
u′l (a)
(4.127)
(4.128)
(4.129)
[
]
(ka)l
(2l − 1)!!
∼
+ sin δl
,
= (2l + 1) il eiδl a cos δl
(2l + 1)!!
(ka)l+1
]
[
(ka)l−1
(2l − 1)!!
∼
− (l + 1) sin δl
.
= (2l + 1) il eiδl ka l cos δl
(2l + 1)!!
(ka)l+2
(4.130)
(4.131)
Es folgt
l
⇒
ul (a)
u′l (a)
∼
=
(ka)
cos δl (2l+1)!!
+ sin δl (2l−1)!!
1
(ka)l+1
=a
l−1
(ka)
(2l−1)!!
k l cos δl
l
(2l+1)!! − (l + 1) sin δl (ka)l+2
tan δl
∼
=
(a)
−a
l uu′l (a)
(ka)2l+1
l
.
u
(a)
(2l + 1)!! (2l − 1)!! (l + 1) l′ + a
u (a)
(ka)l
(2l−1)!!
(2l+1)!! + (ka)l+1 tan δl
(ka)l
(2l−1)!!
(2l+1)!! − (l + 1) (ka)l+1 tan δl
(4.132)
(4.133)
l
Für ein nicht speziell gewähltes Potential v(r) erwarten wir
ul (a) ∼
= O(a)
u′l (a)
(4.134)
und der zweite Faktor auf der rechten Seite ist nicht besonders groß. Der erste Faktor ist jedoch sehr klein
l ≫ ka. Damit wird tan δl und auch δl sehr klein – die Streuung in Kanäle l ≫ ka ist stark unterdrückt. Das ist
im Rahmen der klassischen Mechanik verständlich: Klassisch können nur Massenpunkte mit Stoßparametern
b ≤ a gestreut werden.
√
Sie haben den (erhaltenen) Drehimpuls L = bp = b 2mE = bℏk. Der maximale Drehimpuls von Teilchen,
die klassisch gestreut werden, ergibt sich für b = a zu
Lmax = ℏka
(4.135)
Solange die klassische Näherung gerechtfertigt ist, sollte also die Streuung für
l≳
Lmax
= ka
ℏ
unterdrückt sein. Für ka ≪ 1 sind das alle l bis auf l = 0 (s-Wellen-Streuung).
99
(4.136)
Als Beispiel betrachten wir die quantenmechanische Streuung an einer harten Kugel. Wir erhalten diesen
Spezialfall durch den Grenzübergang
v(r) → ∞ für r < a.
(4.137)
Dies können wir praktischer durch die neue Randbedingung
ul (a) = 0
(4.138)
ausdrücken. Wir hatten jedoch schon eine Randbedingung für r = a, aufgrund unserer Lösung für r > a:
[
]
(4.139)
ul (a) = (2l + 1) il eiδl a cos δl jl (ka) − sin δl yl (ka) .
Es folgt eine Bestimmungsgleichung für die Streuphase:
cos δl jl (ka) − sin δl yl (ka) = 0
⇒
tan δl =
jl (ka)
yl (ka)
⇒
δl = arctan
jl (ka)
+ νπ,
yl (ka)
ν ∈ Z.
(4.140)
Nun erhalten wir den totalen Wirkungsquerschnitt
σtot =
4π ∑
4π ∑
tan2 δl
4π ∑
jl2 (ka)
2
.
(2l
+
1)
sin
δ
=
(2l
+
1)
=
(2l
+
1)
l
k2
k2
k2
yl2 (ka) + jl2 (ka)
1 + tan2 δl
l
l
(4.141)
l
4.0
Σ tot Π a2
3.5
3.0
2.5
0
5
10
15
20
ka
Nun ist λ = 2π/k die de-Broglie-Wellenlänge der Streuteilchen. Wir betrachten zwei Grenzfälle:
• ka ≪ 1, also λ ≫ a: Wir spalten den Beitrag für l = 0 ab und verwenden für die übrigen die Näherung für
100
kleine Argumente,
σtot
∞
4π
j02 (ka)
4π ∑
+
(2l + 1)
k 2 y02 (ka) + j02 (ka)
k2
=
2
=
4π
4π
sin ka
+ 2
2
2
2
k cos ka + sin ka
k
∼
=
4π
1
sin2 ka + 2 O(ka)6 .
k2
k
l=1
∞
∑
l=1
(ka)2l
(2l+1)!!2
(2l−1)!!2
(ka)2l+2
(ka)4l+2
(2l + 1)(2l − 1)!!4
(4.142)
Bis auf Korrekturen höherer Ordnung ist also
4π
σtot ∼
= 2 sin2 ka ∼
= 4πa2 ,
k
(4.143)
das ist die vierfache Querschnittsfläche der Kugel. Außerdem liegt praktisch reine s-Wellen-Streuung(l = 0)
vor.
• ka ≫ 1, also λ ≪ a: Wir verwenden wieder die Näherung für große Argumente und erhalten
(
)
∞
∞
(
sin2 ka − π2 l
4π ∑
4π ∑
π )
2
(
)
(
)
=
l .
σtot = 2
(2l + 1)
(2l
+
1)
sin
ka
−
k
k2
2
cos2 ka − π2 l + sin2 ka − π2 l
l=0
(4.144)
l=0
Hier haben wir aber einen Fehler gemacht. Beachte, dass λ ≪ a gerade den klassischen Grenzfall beschreibt.
Daher sollten, wie oben gesehen, nur Drehimpulsquantenzahlen l ≲ ka beitragen. Sei lmax der ganzzahlige
Anteil von ka, dann erhalten wir die Abschätzung
lmax
(
4π ∑
π )
σtot ∼
(2l + 1) sin2 ka − l .
= 2
k
2
(4.145)
l=0
Wir fassen die l-Terme paarweise zusammen (da lmax ≫ 1 macht es nur einen vernachlässigbaren Unterschied, ob lmax gerade oder ungerade ist),
σtot
∼
=
=
=
=
4π
k2
4π
k2
4π
k2
(lmax −1)/2 [
(
π )]
(4n + 1) sin2 (ka − πn) + (4n + 2) sin2 ka − πn −
2
∑
n=0
(lmax −1)/2
∑
[
]
(4n + 1) sin2 ka + (4n + 2) cos2 ka
n=0
(lmax −1)/2
∑
|
16π
k2
n=0
(4n + 1) +
{z
2
O(lmax
)
(
lmax −1 lmax −1
2
2
2
}
+1
)
4π
cos2 ka
k2
(lmax −1)/2
(lmax −1)/2
n=0
n=0
∑
|
{z
O(lmax )
16π
1 ∼
= 2
k
}
2π 2
∼
∼
= 2 lmax
= 2πa2 .
k
∑
n
(4.146)
Dieses Ergebnis ist doppelt so groß wie die Querschnittsfläche. Klassisch berechnet man als totalen Wirkungsquerschnitt aber genau πa2 . Wieso ist das quantenmechanische Ergebnis im klassischen Limes λ ≪ a
doppelt so groß? Das ist kein subtiler Quanteneffekt, sondern liegt daran, dass in der quantenmechanischen
Definition von σtot auch die Vorwärtsstreuung enthalten ist, in der klassischen aber nicht. Die Amplitude
der Vorwärtsstreuung ist aber (klassisch wie quantenmechanisch) genausogroß wie die gesamte Streuung in
alle anderen Richtungen. σtot = 2πa2 zählt die Änderung (nämlich Verminderung) des Teilchenstroms in
Vorwärtsrichtung aufgrund der Abschattung mit.
101
4.2.2
Resonanzstreuung
Die Diskussion im vorigen Abschnitt legt nahe, dass für ein Streupotential begrenzter Reichweite a die Streuung
in Kanäle mit l ≳ ka unterdrückt ist. Für l ≲ ka ist die Streuung i.A. stark und die Streuphase δl hängt
vom spezifischen Potential v(r) ab. Die s-Wellen-Streuung (l = 0) ist natürlich immer in diesem Regime. Die
Schlussfolgerung, dass die Streuung für l ≳ ka schwach ist, gilt aber nicht immer, wie wir im Folgenden zeigen.
Wir betrachten der Einfachheit halber die Streuung langsamer, d.h. energiearmer, Teilchen. Dann ist ka ≪ 1.
Darüberhinaus beschränken wir uns auf die Streuung an einem sphärischen Potentialtopf,
V (r) =
v(r) =
mit
v0 =
−V0 Θ(a − r),
−v0 Θ(a − r)
(4.147)
(4.148)
2m
V0 > 0.
ℏ2
(4.149)
V
0
r
a
Für l = 0 und r ≤ a haben-Vwir
zu lösen
0
u′′0 (r) + (k 2 + v0 ) u0 (r) = 0
102
(4.150)
mit u0 (0) = 0. Die Lösung ist
√
u0 (r) = c0 sin( k 2 + v0 r).
|{z}
(4.151)
Normierungsfaktor
Wir kennen bereits [siehe Gl. (4.121)]
δ0
k
+ νπ = −ka + arctan
ln u0 (r)r=a
(
)
√
k
2
= −ka + arctan √ 2
tan k + v0 a + νπ
k + v0
= −ka + arctan
d
dr
mit ν ∈ Z. Wir definieren die Streulänge
√
k
√
k2 +v0√cos k2 +v0 a
2
sin k +v0 a
+ νπ
√
)]
(
tan k 2 + v0 a
1
.
arctan ka √ 2
aS := a 1 −
ka
k + v0 a
(4.152)
[
(4.153)
Außer sehr nah an den Polen des Tangens ist das Argument des Arcustangens wegen ka ≪ 1 klein und wir
erhalten
√
(
)
tan k 2 + v0 a
∼
√
aS = a 1 −
.
(4.154)
k 2 + v0 a
Es gilt exakt
δ0 = νπ − kaS
(4.155)
und der Beitrag von l = 0 zum Wirkungsquerschnitt ist
σ0 =
4π
4π
sin2 δ0 = 2 sin2 kaS ∼
= 4πa2S
k2
k
Die Näherung im letzten Schritt gilt wieder überall, außer in der Nähe der Pole des Tangens.
Uns interessiert hier aber vor allem der Fall l ≥ 1. Hier müssen wir lösen
]
[
l(l + 1)
′′
2
ul (r) = 0
ul (r) + k + v0 −
r2
mit ul (0) = 0. Die allgemeine Lösung lautet, wie bekannt,
)
(√
)
(√
(2)
(1)
k 2 + v0 r + βl r yl
k 2 + v0 r .
ul (r) = βl r jl
(4.156)
(4.157)
(4.158)
Jedoch divergieren die Funktionen yl (x) für x → 0 wie 1/xl+1 . Die Randbedingung ul (0) = 0 erfordert daher
(2)
βl = 0 und wir erhalten
(√
)
(1)
ul (r) = βl r jl
k 2 + v0 r .
(4.159)
Für ka ≪ 1 gilt offensichtlich auch ka ≪ l ∀ l ≥ 1. Für diesen Fall hatten wir schon gefunden [siehe Gl. (4.133)]
tan δl ∼
=
l uul′ (a)
−a
(2l + 1)(ka)2l+1
l ul (a) − a u′l (a)
(ka)2l+1
l (a)
=
.
2
u
(a)
(2l + 1)!! (2l − 1)!! (l + 1) l′ + a
(2l + 1)!!
(l + 1) ul (a) + a u′l (a)
u (a)
(4.160)
l
Also erhalten wir durch Einsetzen
)
)
)
(√
(√
(√
√
la jl k 2 + v0 a − a jl k 2 + v0 a − a2 k 2 + v0 jl′ k 2 + v0 a
(2l + 1)(ka)2l+1
(√
)
(√
)
)
(√
√
tan δl
(2l + 1)!!2
(l + 1)a jl k 2 + v0 a + a jl k 2 + v0 a + a2 k 2 + v0 jl′ k 2 + v0 a
(√
) √
(√
)
(2l + 1)(ka)2l+1 (l − 1) jl k 2 + v0 a − k 2 + v0 a jl′ k 2 + v0 a
)
(√
).
(√
√
=
(4.161)
(2l + 1)!!2
(l + 2) jl k 2 + v0 a + k 2 + v0 a jl′ k 2 + v0 a
√
Falls der Nenner nicht aufgrund einer speziellen Wahl von k 2 + v0 a klein oder sogar Null ist, ist der gesamte
Ausdruck wegen des Faktors (ka)2l+1 sehr klein und δl ist sehr klein. Das ist der Fall, den wir oben schon
∼
=
103
betrachtet haben. Dieses Argument für eine kleine Streuphase δl bricht jedoch in der Umgebung der Nullstellen
des Nenners zusammen. Diese treten für k = kl,i , i = 1, 2, . . . mit
(√ 2
) √ 2
(√ 2
)
(l + 2) jl
kl,i + v0 a + kl,i
+ v0 a jl′
kl,i + v0 a = 0
(4.162)
2
auf. Der Nenner hat also für Energien E = El,i = ℏ2 kl,i
/2m Nullstellen. Hier divergiert tan δl und es folgt
δl = π/2 + νπ, ν ∈ Z. Damit ist der Beitrag zum Wirkungsquerschnitt
σl (k = kl,i ) =
4π
2 (2l + 1)
kl,i
(4.163)
Dies ist nicht klein im Vergleich zur s-Wellen-Streuung σ0 . Diese Erhöhung der Streuung für bestimmte Energien
und Drehimpulse l ≥ 1 nennt man Resonanzstreuung. Die physikalische Ursache ist die Kopplung der Streuzustände an metastabile Zustände (Resonanzen) im effektiven Potential veff (r) = v(r) + l(l + 1)/r2 .
veff
Resonanzen
El,1
0
El,2
l(l+1)/r 2
a
r
v0
Ein Streuteilchen kann für eine beträchtliche (aber endliche) Zeit im Potentialtopf in einem Drehimpuls-l-Zustand
gefangen werden, daher wird die Streuung sehr stark. Eine detailiertere Untersuchung zeigt, dass die Breite ∆E der
Streuresonanz in der Energie über τ ≈ ℏ/∆E mit der Lebensdauer des metastabilen Zustands zusammenhängt.
4.2.3
Integraldarstellung der Streuphasen und Bornsche Näherung
Die Streuphasen lassen sich expliziter als bisher durch die Partialwellen ul (r) und das Streupotential v(r) ausdrücken. Die resultierende Darstellung ist nützlich, wenn v(r) als kleine Störung behandelt werden kann.
Wir starten von der bekannten Gleichung
[
]
l(l + 1)
u′′l (r) + k 2 + v(r) −
ul (r) = 0
(4.164)
r2
(0)
mit der Randbedingung u( 0) = 0. Analog erfüllt die freie Lösung ul (r) die Gleichung
[
]
l(l + 1) (0)
(0)′′
2
ul (r) + k −
ul (r) = 0
r2
(0)
(0)
(4.165)
mit ul (0) = 0. Wir multiplizieren Gl. (4.164) mit ul (r), Gl. (4.165) mit ul (r), ziehen die Ergebnisse voneinander
ab und integrieren über [0, ∞[:
∫ ∞
[ (0)
]
(0)′′
(0)
dr ul (r)u′′l (r) − ul (r)ul (r) − v(r)ul (r)ul (r) = 0
(4.166)
∫0 ∞
∫ ∞
[ (0)
]
(0)′′
(0)
⇒
dr ul (r)u′′l (r) − ul (r)ul (r) =
dr v(r)ul (r)ul (r).
(4.167)
0
0
104
(0)
Auf der rechten Seite setzen wir die explizit bekannte Lösung für ul (r) ein und erhalten
∫ ∞
. . . = il (2l + 1)
dr v(r)r jl (kr)ul (r),
(4.168)
0
(0)
der hier verwendete Normierungsfaktor ist so gewählt, dass ul (r) → ul (r) für v(r) → 0 ∀ r. Die linke Seite lässt
sich partiell integrieren:
∫ ∞
]
[ (0)′
]∞
[ (0)
(0)′
(0)′
dr ul (r)u′l (r) − u′l (r)ul (r)
. . . = ul (r)u′l (r) − ul (r)ul (r) 0 −
|
{z
}
0
=
=0
]
[ (0)
(0)′
lim ul (r)u′l (r) − ul (r)ul (r) .
(4.169)
r→∞
Wir setzen nun die asymptotische Form für große r ein:
[
(
(
)
(
)
(
π )
π
π
π )]
(2l + 1)2 2l
i lim sin kr − l eiδl k cos kr − l + δl − eiδl sin kr − l + δl k cos kr − l
... =
2
r→∞
k
2
2
2
2
2
(2l + 1)2 2l iδl
(2l
+
1)
=
i e sin(−δl ) = −i2l
eiδl sin δl .
(4.170)
k
k
Insgesamt erhalten wir also
∫
l
i (2l + 1) e
iδl
∞
sin δl = −
dr v(r)kr jl (kr) ul (r).
(4.171)
0
Diese Gleichung ist exakt. Sie ergibt offensichtlich δl = 0 für v ≡ 0. Für von Null verschiedenes Potential ist die
Gleichung für die exakte Lösung des Streuproblems aber nicht besonders nützlich, da sie auf der rechten Seite die
unbekannte Funktion ul (r) enthält.
Ist das Potential jedoch hinreichend schwach, so erhalten wir
(0)
ul (r) ∼
= ul (r) + O(v),
δl ∼
= O(v),
(4.172)
(4.173)
was im Nachhinein zu überprüfen ist. Dann können wir in führender Ordnung in v in Gl. (4.171) ul (r) durch
(0)
ul (r) ersetzen, da die rechte Seite schon explizit von erster Ordnung in v ist, und auf der linken Seite entwickeln,
eiδl sin δl ∼
= δl + O(δl2 ).
Damit ist
δl
∫ ∞
1
(0)
dr v(r)kr jl (kr)ul (r)
2l + 1 0
∫
1 ∞
−l
= −
i
dr v(r)kr jl (kr) il (2l+
1) r jl (kr)
2l
+
1
0
∫ ∞
[
]2
1
= −
dr v(r) kr jl (kr) .
k 0
(4.174)
∼
= −i−l
(4.175)
Dies nennt man die Bornsche Näherung für die Streuphasen. Sie gibt einen expliziten Ausdruck für δl . Wir sehen,
dass δl wie angenommen von erster Ordnung in v ist. Eine besonders einfache Form ergibt sich für s-WellenStreuung, da j0 (x) = sin x/x (exakt):
∫
1 ∞
∼
dr v(r) sin2 kr.
(4.176)
δ0 = −
k 0
Als Beispiel untersuchen wir, ob ein Streupotential v(r) existiert, für das die s-Wellen-Streuung (die ja i.A.
dominiert) in Bornscher Näherung verschwindet. Also: Existiert eine nicht identisch verschwindende Funktion
v(r) mit
∫
∞
dr v(r) sin2 kr = 0
0
105
(4.177)
√
für alle Energien E, d.h. für alle k = 2mE/ℏ? Man kann zeigen, dass das nicht der Fall ist. Jedoch ist es möglich
dafür zu sorgen, dass δ0 auf einem ganzen Energieintervall [0, Emax [ verschwindet: Wir betrachten
v(r) = v0
sin κr
κr
(4.178)
mit v0 ̸= 0 (klein) und κ > 0. Dann ist
δ0
v0
∼
= −
kκ
∫
∞
dr
0


0
2
v0 π
sin κr sin kr
=−
8
r
kκ 
π
4
πv0 (
κ)
= −
Θ k−
.
4kκ
2
für k < κ/2
für k = κ/2
für k > κ/2
(4.179)
Also ist für hinreichend niedrige Energie E < Emax = ℏ2 κ2 /8m der Streuteilchen der Streuer unsichtbar für
s-Wellen-Streuung, in Bornscher Näherung. Jenseits der Bornschen Näherung gilt das nicht mehr, δ0 ist von Null
verschieden, wenn auch klein.
4.3
Coulomb-Streuung
Die offensichtlich wichtige Streuung an einem Coulomb-Potential erfüllt nicht die bisher gestellte Bedingung
lim rV (r) = 0.
(4.180)
r→∞
Daher ist die asymptotische Form der Wellenfunktion für große r nicht
ψ(r) ∼
= eik·r + f (ϑ, φ)
eikr
,
r
(4.181)
wie wir jetzt zeigen werden. Die Schrödinger-Gleichung lautet (in SI-Einheiten)
(
)
ℏ2 2
1 q1 q2
−
∇ +
ψ(r) = E ψ(r)
2m
4πϵ0 r
mit den Ladungen q1 , q2 von Streuteilchen und Streuzentrum. Wir definieren k :=
γ :=
(4.182)
√
2mE/ℏ und
q1 q2 m
.
4πϵ0 ℏ2 k
(4.183)
γℏ2 k 1
m r
(4.184)
Damit lautet das Potential
V (r) =
bzw.
2γk
2m
V (r) =
.
2
ℏ
r
Die Schrödinger-Gleichung lässt sich nun schreiben als
(
)
2γk
2
2
∇ ψ(r) + k −
ψ(r) = 0.
r
v(r) =
(4.185)
(4.186)
Physikalische Lösungen müssen – trotz des Pols des Coulomb-Potentials – am Ursprung r = 0 regulär sein. Die
Schrödinger-Gleichung kann man mit dem Ansatz
ψ(r) = eikz g(r − z)
106
(4.187)
lösen, wobei die spezielle Wahl des Koordinatensystems einem entlang der negativen z-Achse einlaufenden Teilchenstrahl entspricht. Einsetzen ergibt
(
)
)
(z
(
2γk ikz
((
ikz ′
ikz
2
2
2(
ikz
(
(
− 1 e g (r − z) + e ∇ g(r − z) + k −
e g(r − z) = 0
(4.188)
−k(e g(r − z) + 2ik
(
r
r
⇒
)
2γk
− 1 g ′ (r − z) + ∇ · g ′ (r − z)(r̂ − ẑ) −
g(r − z)
r
r
(z
)
2 2γk
= 2ik
− 1 g ′ (r − z) + g ′′ (r − z) (r̂ − ẑ) · (r̂ − ẑ) + g ′ (r − z) −
g(r − z)
|
{z
}
r
r
r
2ik
(z
=2(1−cos ϑ)
⇒
ikz − ikr + 1 ′
2γk
= 2(1 − cos ϑ)g ′′ (r − z) + 2
g (r − z) −
g(r − z) = 0
r
r
(r − z)g ′′ (r − z) + (ikz − ikr + 1) g ′ (r − z) − γk g(r − z) = 0.
(4.189)
(4.190)
Mit ζ := ik(r − z) erhalten wir
d2 g
dg
+ ik(1 − ζ) − γk g
dζ 2
dζ
d2 g
dg
⇒ ζ 2 + (1 − ζ) + iγ g
dζ
dζ
ikζ
= 0
(4.191)
= 0.
(4.192)
Dies ist eine sogenannte Kummersche Differentialgleichung. Die allgemeine Lösung lautet
g(ζ) = c1 M (−iγ, 1, ζ) + c2 U (−iγ, 1, ζ),
(4.193)
wobei M und U konfluent hypergeometrische Funktionen (oder Kummersche Funktionen) sind. Die Funktion U
ist jedoch nicht regulär; sie hat einen Schnitt auf der negativen ζ-Achse. Die physikalisch sinnvolle Lösung ist
daher die Funktion M . Es ist
M (α, β, x) ≡ 1 F1 (α; β; x) := 1 +
α
α(α + 1) x2
α(α + 1)(α + 2) x3
x+
+
+ ···
β
β(β + 1) 2!
β(β + 1)(β + 2) 3!
Wir haben also mit Hilfe des Ansatzes eine Lösung der Schrödinger-Gleichung gefunden:
(
)
ψ(r) = c1 eikz M −iγ, 1, ik(r − z) ,
(4.194)
(4.195)
mit einer Konstanten c1 . ψ(r) beschreibt einen Streuzustand, da E > 0 angenommen wurde. Es ist aber natürlich
nicht garantiert, dass diese spezielle Lösung etwas mit der Streuung einer von negativem z her einlaufenden Welle
zu tun hat. Um zu sehen, dass die Lösung tatsächlich diese Situation beschreibt, können wir Re ψ(r) plotten:
107
Diese Graphik legt nahe, dass tatsächlich die gewünschte Situation beschrieben wird. Um dies zu beweisen,
betrachten wir Orte r nahe der negativen z-Achse, weit entfernt vom Streuzentrum. Hier ist
r groß, |z| groß, z < 0,
(4.196)
also auch r − z > 0 groß. Für große ρ := r − z ist aber (vgl. Abramowitz, Stegun, Handbook of Mathematical
Functions)
eπγ/2 eiγ ln kρ
eikρ eπγ/2 e−iγ ln kρ
M (−iγ, 1, ikρ) ∼
−γ
(4.197)
=
Γ(1 + iγ)
kρ
Γ(1 − iγ)
mit der Gammafunktion Γ(x), sowie
U (−iγ, 1, ikρ) ∼
= e−πγ/2 eiγ ln kρ .
(4.198)
Dies gestattet, die Wellenfunktion ψ(r) in einen für große r − z rein einlaufenden und einen rein auslaufenden
Anteil zu zerlegen:
(
)
ψ(r) = c1 eikz M − iγ, 1, ik(r − z)
]
[
(
)
(
)
eπγ
ikz
U − iγ, 1, ik(r − z)
= c1 e
M − iγ, 1, ik(r − z) −
Γ(1 + iγ)
|
{z
}
=:ψs (r)
+ c1 eikz
|
(
)
eπγ
U − iγ, 1, ik(r − z) .
Γ(1 + iγ)
{z
}
(4.199)
=:ψ0 (r)
Die beiden Anteile lauten nämlich asymptotisch
ψ0 (r)
ψs (r)
eπγ/2
eikz+iγ ln k(r−z) ,
Γ(1 + iγ)
[ πγ/2 iγ ln k(r−z)
k(r−z)
]
e eik(r−z) eπγ/2 e−iγ ln k(r−z)
eπγ/2 eiγ ln
ikz e
∼
−γ
− = c1 e
Γ(1
Γ(1 + iγ)
+ iγ)
k(r − z)
Γ(1 − iγ)
∼
= c1
= −γ c1
eπγ/2 eikr−iγ ln k(r−z)
.
Γ(1 − iγ)
k(r − z)
108
(4.200)
(4.201)
ψ0 (r) hat asymptotisch die Form einer einlaufenden ebenen Welle, bis auf den logarithmischen Term im Exponenten. Dieser ist zwar klein im Vergleich zum linearen Term ikz, divergiert aber auch entlang der negativen z-Achse
wie iγ ln 2k|z|. Diese Korrektur zeigt an, dass das langreichweitige Coulomb-Potential die einlaufende Welle schon
im Unendlichen beeinflusst. Wir wählen die Normierungskonstante als
c1
eπγ/2
=1
Γ(1 + iγ)
⇔
c1 = e−πγ/2 Γ(1 + iγ),
(4.202)
dann wird die Amplitude von ψ0 asymptotisch zu eins. Die exakte Lösung des Streuproblems lautet damit
(
)
ψ(r) = e−πγ/2 Γ(1 + iγ) eikz M −iγ, 1, ik(r − z) .
(4.203)
In der Streuwelle ψs setzen wir
z = r cos ϑ
(4.204)
und erhalten für große r − z,
[
]
)
(
ikr−iγ ln kr(1−cos ϑ)
Γ(1 + iγ) exp ikr − iγ ln 2kr − iγ ln sin2 ϑ2
Γ(1
+
iγ)
e
∼
= −γ
ψs (r) = −γ
.
Γ(1 − iγ)
kr(1 − cos ϑ)
Γ(1 − iγ)
2kr sin2 ϑ2
(4.205)
Wir definieren
Γ(1 + iγ) = |Γ(1 + iγ)| ei arg Γ(1+iγ) =: |Γ(1 + iγ)| eiσ0 ,
(4.206)
Γ(1 − iγ) = |Γ(1 + iγ)| e−iσ0
(4.207)
(
)
eikr−iγ ln 2kr exp 2iσ0 − iγ ln sin2 ϑ2
∼
ψs (r) = −γ
.
2kr sin2 ϑ2
(4.208)
dann ist
und
Dies können wir schließlich schreiben als
e
ψs (r) ∼
= fC (ϑ)
ikr−iγ ln 2kr
r
(4.209)
mit der Coulomb-Streuamplitude
fC (ϑ) := −
γ
2k sin2
ϑ
2
(
ϑ)
exp 2iσ0 − iγ ln sin2
.
2
(4.210)
Beachte, dass fC nur von θ, aber nicht von r abhängt. Die Streuwelle hat, wie angekündigt, für große r nicht die
Form
eikr
f (ϑ)
,
(4.211)
r
sondern enthält, wie ψ0 , einen zusätzlichen logarithmischen Term aufgrund der langen Reichweite des CoulombPotentials. Beachte, dass dieser Term nur eine abstandsabhängige Phase repräsentiert. Die Amplitude fällt wie
immer für eine Kugelwelle mit 1/r ab, was durch die Erhaltung der Wahrscheinlichkeit erzwungen ist.
4.3.1
Die Rutherfordsche Streuformel
Die asymptotische Form von ψ(r) für große Abstände reicht aus, um den differentiellen Wirkungsquerschnitt zu
berechnen – wir betrachten die Ströme durch eine Kugel des Radius r → ∞ um das Streuzentrum. Die einlaufende
Welle ist asymptotisch
ψ0 (r) ∼
(4.212)
= eikz+iγ ln k(r−z)
und nahe der negativen z-Achse insbesondere
ψ0 (r) ∼
= eikz+iγ ln(−2kz) .
109
(4.213)
Die zugehörige Stromdichte ist
[
]
ℏ
∂ ikz+iγ ln(−2kz)
−ikz−iγ ln(−2kz)
ikz+iγ ln(−2kz)
−ikz−iγ ln(−2kz)
∼
j0 (r) =
e
ẑ
e
−e
ẑ e
2mi
∂z
ℏ (
γ ) ∼ ℏk
=
ẑ k +
ẑ.
=
m
z
m
(4.214)
Die Korrektur zur einlaufenden Stromdichte aufgrund der langen Reichweite verschwindet also für große |z|. Die
Streuwelle
eikr−iγ ln 2kr
ψs (r) ∼
(4.215)
= fC (ϑ)
r
hat die Stromdichte
( −ikr+iγ ln 2kr
[
)
ℏ
eikr−iγ ln 2kr ∂ e−ikr+iγ ln 2kr
∂ eikr−iγ ln 2kr
2 e
∼
js (r) =
r̂ |fC (ϑ)|
−
2mi
r
∂r
r
r
∂r
r
]
(
)
1
∂ ∗
∂
+ ϑ̂ 3 fC∗ (ϑ)
fC (ϑ) − fC (ϑ)
f (ϑ)
r
∂ϑ
∂ϑ C
[
(
)]
ℏ
γ2
1
γ)
1( ∗
∂ ∗
∂
=
r̂
2i k +
+ ϑ̂ 3 fC (ϑ)
fC (ϑ) − fC (ϑ)
f (ϑ) .
(4.216)
2mi 4k 2 sin4 ϑ2 r2
r
r
∂ϑ
∂ϑ C
Wir vernachlässigen Terme von der Ordnung 1/r3 gegenüber 1/r2 und erhalten
js (r) ∼
=
ℏk
γ2
r̂ 2 2 4
m 4k r sin
ϑ
2
.
(4.217)
Der differentielle Wirkungsquerschnitt ist dann exakt (er ist im Grenzfall r → ∞ definiert) gegeben durch
dσ
⇒
dσ
dΩ
js (r) · r̂ r2 dΩ
r→∞
|j0 (r)|
2
γ
=
2
4k sin4 ϑ2
( q q )2 1
1
1 2
=
2
4πϵ0 (4E) sin4
=
lim
(4.218)
q1 q2 m
γ =
4πϵ0 ℏ2 k
ϑ
2
.
(4.219)
Dies ist die bekannte Rutherfordsche Streuformel. Das Ergebnis ist identisch mit dem klassischen Resultat, siehe
Vorlesung Klassische Mechanik. Es ist nicht klar, ob diese Übereinstimmung eine tiefere Bedeutung hat. Es ist
schon aus der klassischen Mechanik bekannt, dass der totale Wirkungsquerschnitt divergiert.
4.3.2
Partialwellenzerlegung
Die Zerlegung der Wellenfunktion ψ(r) in Partialwellen ist auch für ein langreichweitiges Potential möglich,
ψ(r) =
∞
∑
ul (r)
l=0
r
Pl (cos ϑ).
(4.220)
Für die reine Coulomb-Streuung ist diese Zerlegung nicht besonders nützlich, da wir das Problem ja exakt lösen
können. Auch konvergiert die Partialwellenzerlegung sehr langsam. Sie ist aber nützlich, wenn zum CoulombPotential ein kurzreichweitiges Potential hinzutritt, z.B. bei der Streuung von Nukleonen an einem Atomkern.
Wir illustrieren das Vorgehen dennoch für das Coulomb-Potential. Die Partialwellen ul (r) müssen die Gleichung
]
[
2γk l(l + 1)
′′
2
−
ul (r) = 0
(4.221)
ul (r) + k −
r
r2
110
mit der Randbedingung ul (0) = 0 erfüllen. Die allgemeine Lösung lässt sich durch sogenannte WhittakerFunktionen ausdrücken, die ebenfalls mit den konfluent hypergeometrischen Funktionen zusammenhängen,
(1)
ul (r) = βl
(2)
Miγ,(2l+1)/2 (2ikr) + βl
Die Funktionen W divergieren für kr → 0, so dass
dann
ul (r) =
(2)
βl
Wiγ,(2l+1)/2 (2ikr)
(4.222)
= 0 sein muss. Die asymptotische Form für große kr lautet
(1)
βl
Miγ,(2l+1)/2 (2ikr)
[
]
(1)
πγ/2 exp(ikr − iγ ln 2kr)
l exp(−ikr + iγ ln 2kr)
∼
− (−1)
.
= βl (2l + 1)! e
Γ(l + 1 − iγ)
Γ(l + 1 + iγ)
(4.223)
Wir drücken die komplexe Gammafunktion durch Betrag und Phase aus,
ul (r)
1
(1)
∼
= βl (2l + 1)! eπγ/2 il
|Γ(l + 1 + iγ)|
[
]
exp(ikr
− iγ ln 2kr)
l
l exp(−ikr + iγ ln 2kr)
× (−i)
−i
exp(−i arg Γ(l + 1 + iγ))
exp(i arg Γ(l + 1 + iγ))
(1)
πγ/2 l [
(
)
βl (2l + 1)! e
i
π
exp ikr − iγ ln 2kr − i l + i arg Γ(l + 1 + iγ)
=
|Γ(l + 1 + iγ)|
2
(
)]
π
− exp − ikr + iγ ln 2kr + i l − i arg Γ(l + 1 + iγ)
2
(1)
(
)
πγ/2 l+1
2βl (2l + 1)! e
i
π
=
sin kr − γ ln 2kr − l + σl
|Γ(l + 1 + iγ)|
2
|
{z
}
(4.224)
=: cl = const
mit
σl := arg Γ(l + 1 + iγ).
(4.225)
Wir sehen, dass die asymptotische Form von ul (r) nicht mit derjenigen für kurzreichweitige Potentiale übereinstimmt. Dort gilt, siehe Gl. (4.59),
(
)
π
ul (r) ∼
(4.226)
= c′l sin kr − l + δl .
2
Aufgrund der langen Reichweite des Coulomb-Potentials tritt wieder ein zusätzlicher logarithmischer Term auf.
Man kann also keine Streuphase δl definieren, die von r unabhängig wäre. Berücksichtigt man den logarithmischen
Term explizit, so bleibt die r-unabhängige Phase σl übrig. Man nennt sie die Coulomb-Streuphase.
(1)
Im Prinzip müssen wir noch die Koeffizienten βl bzw. cl bestimmen. Die Idee ist dieselbe wie für ein kurzreichweitiges Potential: Wir entwickeln den einlaufenden Strahl ψ0 in Partialwellen und nutzen die Drehimpulserhaltung aus. Nur ist der einlaufende Strahl jetzt keine ebene Welle eikz mehr. Wir kennen aber die asymptotische
Form von ψ0 , wenn der langreichweitige Anteil des Potentials vom Coulomb-Typ (1/r) ist: Sie lautet
(
)
∼
ψ0 (r)
eikz+iγ ln k(r−z) = exp ikr cos ϑ + iγ ln[kr(1 − cos ϑ)]
=
(
ϑ)
=
exp ikr cos ϑ + iγ ln 2kr + iγ ln sin2
2
(
)
2 ϑ
ikr cos ϑ
=
exp ikr cos ϑ + iγ ln sin
e
2
π
π
∞
(
(4.53)
ϑ) ∑
eikr−i 2 l − e−ikr+i 2 l
∼
Pl (cos ϑ)
exp ikr cos ϑ + iγ ln sin2
(2l + 1) il
(4.227)
=
2
2ikr
l=0
Der einlaufende Anteil muss auf der negativen z-Achse mit dem einlaufenden Anteil der vollen Wellenfunktion
asymptotisch identisch sein. Wegen der Drehimpulserhaltung gilt dies für jeden Kanal l für sich:
−ikr+iγ ln 2kr+i 2 l−iσl
e−ikr+i 2 l
! cl e
Pl (−1) =
Pl (−1)
2ikr
r
2i
(2l + 1) il eiσl
1
.
⇒ −(2l + 1) il = cl e−iσl ⇒ cl = −
k
k
π
π
−eiγ ln 2kr (2l + 1)! il
111
(4.228)
(4.229)
Dafür können wir auch schreiben
cl = −
(2l + 1) il ei arg Γ(l+1+iγ)
(2l + 1) il Γ(l + 1 + iγ)
=−
.
k
k
|Γ(l + 1 + iγ)|
(4.230)
Mit [siehe Gl. (4.224)]
(1)
cl =
2βl (2l + 1)! eπγ/2 il+1
|Γ(l + 1 + iγ)|
(4.231)
erhalten wir
|Γ(l + 1 + iγ)| (2l + 1) il Γ(l + 1 + iγ)
e−πγ/2 Γ(l + 1 + iγ)
=
i
.
k
|Γ(l + 1 + iγ)|
2(2l)!
k
2(2l + 1)! eπγ/2 il
Die Partialwellenzerlegung für die Coulomb-Streuung lautet schließlich
(1)
βl
=−
ψ(r) =
∞
i −πγ/2 1 ∑ 1
e
Γ(l + 1 + iγ) Miγ,(2l+1)/2 (2ikr) Pl (cos ϑ).
2
kr
(2l)!
(4.232)
(4.233)
l=0
4.4
Streuung identischer Teilchen
In diesem Abschnitt diskutieren wir zunächst die Streuung von Teilchen aneinander anstatt an einem festen
Target. Dann beschäftigen wir uns insbesondere mit der Streuung identischer Teilchen.
4.4.1
Streuung von Teilchen aneinander
Wir betrachten die Streuung von zwei unterscheidbaren Teilchen mit den Massen m1 , m2 aneinander aufgrund der
Wechselwirkung V (r1 , r2 ). Spielen andere Teilchen und äußere Felder keine Rolle, so ist V (r1 , r2 ) = V (r2 − r1 ).
Es ist günstig, zu Schwerpunkts- und Relativkoordinaten überzugehen,
m1 r1 + m2 r2
,
m1 + m2
r = r2 − r1 ,
R
=
(4.234)
(4.235)
so dass
r1
r2
Der Hamiltonian lautet
ℏ2
H=−
2m1
(
m1
r,
m1 + m2
m1
= R+
r.
m1 + m2
= R−
∂
∂r1
)2
ℏ2
−
2m2
(
∂
∂r2
(4.236)
(4.237)
)2
+ V (r2 − r1 ).
(4.238)
Mit
∂
∂r1
∂
∂r2
=
=
m1
m1 + m2
m1
m1 + m2
∂
∂
−
,
∂R ∂r
∂
∂
+
∂R ∂r
(4.239)
(4.240)
(4.241)
(Kettenregel!) erhalten wir
H
=
=
[
(
)2
(
)2 ]
ℏ2 1
m1
∂
∂
1
m1
∂
∂
−
−
+
+
+ V (r)
2 m1 m1 + m2 ∂R ∂r
m2 m1 + m2 ∂R ∂r
(
)2
(
) ( )2
∂
ℏ2
∂
ℏ2
1
1
−
−
+
+ V (r)
2(m1 + m2 ) ∂R
2 m1
m2
∂r
{z
}
|
=: 1/m
112
(4.242)
mit der effektiven Masse
m=
m1 m2
.
m1 + m2
(4.243)
Die Schwerpunkts- und Relativbewegung separieren also. Die Schwerpunktsbewegung ist unbeschleunigt. Für die
Relativbewegung können wir die bisher für festes Target eingeführte Theorie anwenden, dabei müssen wir nur die
Teilchenmasse durch die effektive Masse ersetzen. Damit erhalten wir z.B. aus den Ergebnissen aus Abschnitt 4.3
eine exakte Beschreibung der Elektron-Proton- und Elektron-Positron-Streuung im nichtrelativistischen Limes.
4.4.2
Identische Teilchen
Bei der Streuung zweier identischer Teilchen muss der Zweiteilchenzustand symmetrisch (für Bosonen) bzw. antisymmetrisch (für Fermionen) sein. Wir betrachten zunächst den Fall, dass der Spin-Zustand der beiden Teilchen
feste Parität hat, d.h. symmetrisch oder antisymmetrisch ist. Das ist z.B. für spinlose Bosonen trivialerweise der
Fall, ebenso für zwei Fermionen mit identischer Spineinstellung. Es ergibt sich eine räumliche Wellenfunktion
ψ(r1 , r2 ) mit fester Parität, wie in Kap. 2 besprochen.
Ist die Wellenfunktion ψ(r1 , r2 ) = Ψ(R) ψ(r) symmetrisch/antisymmetrisch, so gilt für die abseparierte Relativbewegung
ψ(−r) = ±ψ(r).
(4.244)
Dies können wir wieder durch explizite Symmetrisierung/Antisymmetrisierung erreichen. Ist ψ̃(r) eine ohne Beachtung der Symmetrie gefundene Lösung, so ist
ψ(r) ∼ ψ̃(r) ± ψ̃(−r)
(4.245)
mit geeigneter Normierung eine Lösung mit der geforderten Symmetrie. [Mit ψ̃(r) ist auch ψ̃(−r) eine Lösung
der Schrödinger-Gleichung, sofern V (r) = V (−r) gilt.] Für hinreichend kurze Reichweite von V (r) gilt
ψ̃(r) ∼
= eik·r + f (r̂)
eikr
r
(4.246)
für große r. (Die Verallgemeinerung auf das Coulomb-Potential ist unproblematisch.) Damit ist
ψ(r) ∼
= eik·r ± e−ik·r + f (r̂)
eikr
eikr
ˆ
± f (−r)
,
r
r
(4.247)
wobei wir eine spezifische Wahl für die Amplitude der ebenen Wellen e±ik·r getroffen haben. Ist V (r) = V (r) ein
Zentralpotential, so folgt
[
] eikr
ψ(r) ∼
.
(4.248)
= eik·r ± e−ik·r + f (ϑ) ± f (π − ϑ)
r
Für die Berechnung des differentiellen Wirkungsquerschnitts gehen wir von der Definition in Abschnitt 4.1 aus:
dσ =
Zahl der gestreuten Teilchen in dΩ pro Zeit
.
Zahl der einlaufenden Teilchen pro Zeit und Fläche
(4.249)
Da wir identische Teilchen betrachten, können wir aus Prinzip nicht zwischen den gestreuten Teilchen unterscheiden. Zwischen den einlaufenden Teilchen können wir aber unterscheiden – wir präparieren ja einen nach rechts
laufenden und einen nach links laufenden Strahl. Wir könnten für die einlaufenden Teilchen (Nenner von dσ)
entweder nur die aus einer Richtung einlaufenden oder alle einlaufenden Teilchen zählen. Die übliche Definition
verwendet die aus einer Richtung einlaufenden. Dann ist
dσ =
r2 dΩ r̂ · js
|j0 |
(4.250)
ℏk
m
(4.251)
mit
|j0 | =
113
und
r→∞
js (r)
∼
=
=
=
{
[
] e−ikr ∂ [
] eikr
ℏ
r̂ f ∗ (ϑ) ± f ∗ (π − ϑ)
f (ϑ) ± f (π − ϑ)
2mi
r ∂r
r
}
ikr
ikr
[
]e
]e
∂ [ ∗
f (ϑ) ± f ∗ (π − ϑ)
− f (ϑ) ± f (π − ϑ)
r ∂r
r
(
[
][
] ik
ℏ
1 ik
1 )
r̂ f ∗ (ϑ) ± f ∗ (π − ϑ) f (ϑ) ± f (π − ϑ)
−
+
+
2mi
r2 r3
r2 r3
]
ℏk r̂ [
|f (ϑ)|2 + |f (π − ϑ)|2 ± 2 Re f ∗ (ϑ)f (π − ϑ) .
m r2
(4.252)
Es folgt
dσ
= |f (ϑ)|2 + |f (π − ϑ)|2 ± 2 Re f ∗ (ϑ)f (π − ϑ).
(4.253)
dΩ
Im Vergleich zur Streuung am festen Target oder von unterscheidbaren Teilchen aneinander erhalten wir einen
zusätzlichen Interferenzterm ±2 Re f ∗ (ϑ)f ∗ (π − ϑ). Dieser beruht auf der Interferenz der beiden möglichen (und
ununterscheidbaren) Zuordnungen von ein- und auslaufenden Teilchen:
θ
±
π-θ
Wir erkennen, dass für reine s-Wellen-Streuung und antisymmetrische Wellenfunktion der differentielle Wirkungsquerschnitt verschwindet: Es ist dann f (ϑ) = f = const und daher
dσ
= |f |2 + |f |2 − 2|f |2 = 0.
(4.254)
dΩ
Dieses Ergebnis lässt sich mit Hilfe der Partialwellenzerlegung verallgemeinern.
Die Partialwellenzerlegung lässt sich wie folgt auf identische Teilchen erweitern: Wir schreiben wie vorher
ψ(r) =
∞
∑
ul (r)
l=0
r
Pl (cos ϑ).
(4.255)
Da jedoch ψ(−r) = ±ψ(r) gelten soll und
Pl (cos(π − ϑ)) = Pl (− cos ϑ) = (−1)l Pl (cos ϑ)
(4.256)
ist, können nur gerade l (für symmetrische Wellenfunktion) bzw. ungerade l (für antisymmetrische Wellenfunktion)
vorkommen.
Interessant ist der Fall eines Streupotentials V (r) mit beschränktem Träger mit dem Radius a und ka ≪ 1.
Wie oben gesehen, ist die Streuung in Kanäle mit Drehimpulsquantenzahl l ≫ ka stark unterdrückt. Das sind für
ka ≪ 1 aber alle bis auf l = 0. Für symmetrische Wellenfunktion ergibt sich nichts wesentliche neues. Für antisymmetrische Wellenfunktion ist jedoch l = 0 ausgeschlossen. Der führende Term hat l = 1 (p-Wellen-Streuung)
und ist bereits stark unterdrückt. Man kann dies so deuten, dass sich die Teilchen aufgrund der Antisymmetrie von
ψ(r) nicht so nahe kommen, während der Fall ka ≪ 1 näherungsweise eine Kontaktwechselwirkung beschreibt.
4.4.3
Mittelung über Spin-Einstellungen
Im Allgemeinen enthalten die Teilchenstrahlen eine gewisse Verteilung von Spin-Einstellungen. Wir betrachten
hier unpolarisierte Strahlen aus Teilchen mit Spin S = 0, 1/2, 1, 3/2, . . . Die Dichtematrix für unpolarisierte
Teilchen ist
1
1
(4.257)
ρS =
2S + 1
114
(diese ist invariant unter beliebigen unitären Transformationen und hat insbesondere auch im Schwerpunktsystem
diese Form). Die beiden Teilchen zusammen haben (2S + 1)2 mögliche Spin-Einstellungen. Wir charakterisieren
diese durch die beiden Spin-z-Quantenzahlen m1 , m2 = −S, . . . , S und schreiben eine Basis des Spin-Hilbertraums
als {|m1 , m2 ⟩}. Aus diesen können wir die folgenden linear unabhängigen symmetrischen und antisymmetrischen
Kombinationen bilden:
• symmetrisch:
|m1 , m1 ⟩
(4.258)
(beide Spins haben dieselbe Sz -Quantenzahl) sowie
|m1 , m2 ⟩ + |m2 , m1 ⟩
√
2
für m1 < m2 ,
(4.259)
das sind insgesamt
1 + 2 + 3 + . . . + (2S + 1) =
(1 + 2S + 1)(2S + 1)
= (S + 1)(2S + 1)
2
(4.260)
Zustände,
• antisymmetrisch:
|m1 , m2 ⟩ − |m2 , m1 ⟩
√
2
für m1 < m2 ,
(4.261)
(1 + 2S)2S
= S(2S + 1)
2
(4.262)
das sind insgesamt
1 + 2 + 3 + . . . + 2S =
Zustände.
Dies sind zusammen offensichtlich (2S + 1)2 Zustände, damit haben wir einen vollständigen Satz konstruiert. Da
dieser durch eine unitäre Transformation aus {|m1 , m2 ⟩} hervorgeht, ist die Dichtematrix auch in dieser neuen
Basis
1
ρS ⊗ ρS =
1,
(4.263)
(2S + 1)2
d.h. alle Zustände sind gleich wahrscheinlich. Nun müssen wir das vorige Ergebnis Gl. (4.253) für den differentiellen
Wirkungsquerschnitt über alle diese Spin-Zustände mitteln. Es folgt für das Spin-Mittel
dσ
(S + 1)(2S + 1) dσ S(2S + 1) dσ =
+
dΩ
(2S + 1)2
dΩ sym. Spin-Zustand
(2S + 1)2 dΩ antisym. Spin-Zustand
S
S+1
2 Re f ∗ (ϑ)f (π − ϑ) ∓
2 Re f ∗ (ϑ)f (π − ϑ)
2S + 1
2S + 1
2
= |f (ϑ)|2 + |f (π − ϑ)|2 ±
Re f ∗ (ϑ)f (π − ϑ),
2S + 1
= |f (ϑ)|2 + |f (π − ϑ)|2 ±
(4.264)
wobei jetzt das obere (untere) Vorzeichen für Bosonen (Fermionen) gilt. Die Interferenz nimmt also für große Spins
S in ihrer Bedeutung ab. Das ist vernünftig, da S → ∞ dem klassischen Grenzfall für Drehimpulse entspricht.
4.5
Green-Funktions-Methode
Die Partialwellenzerlegung ist insbesondere für hohe Energien nicht günstig, da die Entwicklung nach Drehimpulsl-Beiträgen langsam konvergiert. Hier besprechen wir eine alternative Methode unter Verwendung von GreenFunktionen.
115
4.5.1
Integraldarstellung der Streuamplitude
√
Mit k = 2mE/ℏ und v(r) = 2mV (r)/ℏ2 können wir die Schrödinger-Gleichung schreiben als
(∇2 + k 2 ) ψ(r) = v(r) ψ(r),
(4.265)
wobei wir jetzt nicht annehmen, dass V (r) ein Zentralpotential sein muss. Die zugehörige freie Differentialgleichung (die Helmholtz-Gleichung) habe die Lösung ψ0 (r):
(∇2 + k 2 ) ψ0 (r) = 0.
(4.266)
Die Green-Funktion Gk (r, r′ ) ist definiert als Lösung der Gleichung
(∇2 + k 2 ) Gk (r, r′ ) = δ(r − r′ ),
(4.267)
die aus der freien Gleichung (4.266) durch Einfügen der Inhomogenität δ(r − r′ ) hervorgeht. Sowohl ψ0 (r) als auch
Gk (r, r′ ) (als Funktion von r) sollen dieselben Randbedingungen erfüllen wie ψ(r). Für das Streuproblem sind
alle diese Funktionen auf R3 definiert und müssen für r → ∞ beschränkt bleiben. Aus der Translationsinvarianz
des Problems folgt dann, dass Gk (r, r′ ) nur von r − r′ abhängen kann. Wir schreiben daher Gk (r, r′ ) = Gk (r − r′ ).
Der Nutzen der Green-Funktion liegt darin, dass jede Lösung der Integralgleichung
∫
ψ(r) = ψ0 (r) + d3 r′ Gk (r, r′ ) v(r′ ) ψ(r′ )
(4.268)
für die gesuchte Funktion ψ(r) die Schrödinger-Gleichung löst. Beweis:
∫
(∇2 + k 2 ) ψ(r) = (∇2 + k 2 ) ψ0 (r) + d3 r′ (∇2 + k 2 ) Gk (r, r′ ) v(r′ ) ψ(r′ ) = v(r) ψ(r).
{z
}
|
{z
}
|
(4.269)
= δ(r−r′ )
=0
Wir wollen nun ψ0 (r) und Gk (r, r′ ) explizit bestimmen. Wir betrachten einen entlang der negativen z-Achse
einlaufenden Teilchenstrahl. Dann ist
ψ0 (r) = eikz .
(4.270)
Zur Lösung von Gl. (4.267) ersetzen wir zunächst r − r′ → r und schreiben
(∇2 + k 2 ) Gk (r) = δ(r).
(4.271)
Gk (r) = e±ikr Fk (r).
(4.272)
Dann machen wir den Ansatz
Damit ist
(∇2 + k 2 ) Gk (r) = (∇2 + k 2 ) e±ikr Fk (r)
(
)
1 d2
±ikr
=
re
Fk (r) + 2 ∇e±ikr · ∇Fk (r) + e±ikr ∇2 Fk (r) + k 2 e±ikr Fk (r)
r dr2
∂
1
k 2
e±ikr
Fk (r) ± 2ike±ikr
k 2
e±ikr
Fk (r)
Fk (r) + e±ikr ∇2 Fk (r) + = 2 (±ik)e±ikr Fk (r) − r
∂r
2ik ±ikr
±ikr ∂
±ikr
= ±
e
Fk (r) ± 2ike
Fk (r) + e
∇2 Fk (r) = δ(r)
r
∂r
∂
2ik
⇒ ∇2 Fk (r) ± 2ik
(4.273)
Fk (r) ±
Fk (r) = e∓ikr δ(r) = δ(r).
∂r
r
Wir wissen aus der Elektrodynamik, dass gilt
∇2
1
= −4π δ(r)
r
116
(4.274)
(dies ist die Poisson-Gleichung für eine Punktladung) und probieren daher den Ansatz
Fk (r) = −
1
.
4πr
(4.275)
Einsetzen in die Gleichung für Fk (r) ergibt
1
1
δ(r) ± 2ik 2 ∓ 2ik 2 = δ(r).
4πr
4πr
Die Gleichung ist also erfüllt. Damit haben wir zwei Lösungen für die Green-Funktion gefunden:
(4.276)
′
Gk (r − r′ ) = −
e±ik|r−r |
.
4π|r − r′ |
(4.277)
Im Prinzip können wir noch eine beliebige Lösung der homogenen (Helmholtz-) Gleichung addieren. Man kann
aber zeigen, dass dies zu Lösungen der ursprünglichen Schrödinger-Gleichung führt, die nicht der Streusituation
′
entsprechen. Aus demselben Grund müssen wir die Lösung mit eik|r−r | wählen; damit beschreiben wir auslaufende
und nicht einlaufende Kugelwellen. Also erhalten wir
′
Gk (r − r′ ) = −
eik|r−r |
4π|r − r′ |
und damit die Lippmann-Schwinger-Gleichung in Ortsdarstellung,
∫
′
1
eik|r−r |
ψ(r) = eikz −
v(r′ ) ψ(r′ ).
d3 r ′
4π
4π|r − r′ |
(4.278)
(4.279)
Dies ist nun eine explizite Integralgleichung für ψ(r), die der Streusituation (einlaufende ebene Welle, auslaufende
Kugelwelle) angepasst ist. Es ist aber noch nicht klar, was wir durch die Übersetzung einer partiellen Differentialgleichung für ψ(r) in eine Integralgleichung gewonnen haben. Wir werden gleich sehen, dass die Integralgleichung
für bestimmte Näherungen günstig ist.
Wir betrachten zunächst die Gleichung für große Abstände r vom Streuzentrum. Ist v(r′ ) hinreichend kurzreichweitig, trägt der Integrand
′
eik|r−r |
v(r′ ) ψ(r′ )
(4.280)
|r − r′ |
nur für kleine r′ ≪ r bei. Dann können wir für große r entwickeln:
1
1
∼
=
′
|r − r |
r
und
e
ik|r−r′ |
(4.281)
( √
)
( √
)
r · r ′ ( r ′ )2
2
′
2
′
= exp ik r + (r ) − 2 r · r = exp ikr 1 − 2 2 +
r
r
( [
)
′]
′
r·r
∼
= eikr e−ik r̂·r .
= exp ikr 1 − 2
r
Damit gilt für große r,
ψ(r) ∼
= eikz −
eikr 1
r 4π
∫
′
d3 r′ e−ik r̂·r v(r′ ) ψ(r′ ).
(4.282)
(4.283)
Vergleich mit der asymptotischen Form
ψ(r) ∼
= eikz +
ergibt für die Streuamplitude
eikr
f (r̂)
r
(4.284)
∫
′
m
f (r̂) = −
d3 r′ e−ik r̂·r V (r′ ) ψ(r′ ).
(4.285)
2πℏ2
Diese Beziehung ist exakt, da f (r̂) durch das asymptotische Verhalten definiert ist. Beachte, dass wir nicht
angenommen haben, dass V (r) rotationssymmetrisch ist.
117
4.5.2
Bornsche Reihe
Die Integralgleichung für ψ(r) legt eine iterative Lösung nahe: Starte mit einem geeigneten Ansatz für ψ(r), setze
ihn in die Integralgleichung ein, erhalte eine neue Funktion ψ(r) und iteriere diese Schritte bis zur Konvergenz.
Der übliche nullte Ansatz für ψ(r) ist die ungestreute Welle ψ0 (r) = eikz . Sei
ψ (0) (r) =
ψ (n) (r) =
eikz ,
−
m
2πℏ2
∫
(4.286)
d3 r′
ik|r−r′ |
e
V (r′ ) ψ (n−1) (r′ )
|r − r′ |
Dann ist die Bornsche Reihe
ψ(r) =
∞
∑
für n ≥ 1.
ψ (n) (r)
(4.287)
(4.288)
n=0
eine Lösung der Lippmann-Schwinger-Gleichung und damit der ursprünglichen Schrödinger-Gleichung, denn
ψ(r)
=
∞
∑
n=0
= eikz
= eikz
= eikz
∞
∑
ψ (n) (r) = eikz +
ψ (n) (r)
n=1
∫
∞
ik|r−r′ |
∑
m
3 ′ e
d r
V (r′ )ψ (n−1) (r′ )
−
2
′|
2πℏ
|r
−
r
n=1
∫
∞
ik|r−r′ |
∑
m
3 ′ e
d
V (r′ )ψ (n) (r′ )
−
r
2
′|
2πℏ
|r
−
r
n=0
∫
ik|r−r′ |
m
3 ′ e
−
d
r
V (r′ )ψ(r′ ).
2πℏ2
|r − r′ |
(4.289)
Die Bornsche Reihe ist weiterhin eine exakte Lösung. Die n-te Bornsche Näherung besteht in diesem Kontext
darin, die Reihe für ψ(r) nach dem n-ten Term abzubrechen. In der Praxis ist aber fast nur die erste Bornsche
Näherung von Bedeutung. Hier ist
(4.290)
ψ(r) ∼
= eikz + ψ (1) (r)
mit
ψ (1) (r) = −
m
2πℏ2
∫
′
d3 r ′
′
eik|r−r |
V (r′ ) eikz .
′
|r − r |
Dies entspricht der folgenden Näherung für die Streuamplitude, vgl. Gl. (4.285),
∫
∫
′
m
m
3 ′ −ik r̂·r′
′
ikz ′
f (1) (r̂) = −
d
r
e
V
(r
)
e
=
−
d3 r′ e−ik(r̂−ẑ)·r V (r′ ).
2πℏ2
2πℏ2
(4.291)
(4.292)
Dies ist nun eine explizite Darstellung der genäherten Streuamplitude. In dieser Näherung ist die Streuamplitude
also durch die Fourier-Transformierte des Streupotentials,
∫
Ṽ (q) = d3 r e−iq·r V (r),
(4.293)
gegeben,
 

sin ϑ cos φ
(
)
m
m
f (1) (r̂) = −
Ṽ k(r̂ − ẑ) = −
Ṽ k  sin ϑ sin φ  .
2πℏ2
2πℏ2
cos ϑ − 1
(4.294)
Wenn wir die k-Abhängigkeit von f (1) explizit machen und k, ϑ, φ als Kugelkoordinaten eines Vektors k auffassen,
können wir schreiben
m
Ṽ (k − kẑ).
(4.295)
f (1) (k) ≡ f (1) (k, ϑ, φ) = −
2πℏ2
Wir erkennen, dass die Streuung bei großen (kleinen) Energien der Streuteilchen, also großen (kleinen) k v.a. für
das Fourier-transformierte Streupotential Ṽ (q) = Ṽ (k − kẑ) bei großen (kleinen) |q| empfindlich ist.
118
Die erste Bornsche Näherung (und tatsächlich jede Bornsche Näherung) hat die Schwäche, dass sie das optische
Theorem verletzt, denn es gilt
∫
′
m
d3 r′ e−ik(ẑ−ẑ)·r V (r′ )
f (1) (ϑ = 0) ≡ f (1) (r̂ = ẑ) = −
2πℏ2
∫
m
m
= −
d3 r′ V (r′ ) = −
Ṽ (q = 0).
(4.296)
2
2πℏ
2πℏ2
Dies ist reell, weshalb das optische Theorem ergibt
∫
4π
(1)
σtot = dΩ |f (1) (ϑ, φ)|2 =
Im f (1) (ϑ = 0) = 0
k
⇒
f (1) (ϑ, φ) ≡ 0,
(4.297)
(4.298)
und das ist ein Widerspruch. Die erste Bornsche Näherung ist dennoch vernünftig, wenn das Streupotential
hinreichend schwach ist. Dass die Bornschen Näherungen einer Störungsentwicklung für kleines Streupotential
entsprechen, werden wir im nächsten Abschnitt sehen.
Als Beispiel betrachten wir die Coulomb-Streuung. Hier würden wir nicht erwarten, dass etwas Vernünftiges
herauskommt, da sich die Wellenfunktion asymptotisch gar nicht wie
ψ(r) ∼
= eikz +
eikr
f (r̂)
r
(4.299)
verhält. Die Abweichung liegt in logarithmischen Termen in den Phasen der ein- und auslaufenden Wellen. Dennoch berechnen wir
f (1) (r̂) =
=
Damit erhalten wir
m e2
m
1
me2 1
1
Ṽ
(k
−
kẑ)
=
−
=
−
2πℏ2
2πℏ2 ϵ0 k 2 (k − kẑ)2
2πℏ2 ϵ0 k 2 2 − 2 cos ϑ
me2 1
1
e2 1
1
−
=
−
.
8πℏ2 ϵ0 k 2 sin2 ϑ2
16πϵ0 E sin2 ϑ2
−
( dσ )(1)
dΩ
= |f (1) (r̂)|2 =
( e2 )2 1
1
2
4πϵ0 (4E) sin4
ϑ
2
.
(4.300)
(4.301)
Das ist tatsächlich das exakte Ergebnis aus Abschnitt 4.3. Das ist erstaunlich, denn die Phase von f (1) (r̂) ist
offensichtlich falsch – es fehlt der logarithmische Term. Die höheren Bornschen Näherungen sind ebenfalls falsch
und sogar divergent.
4.6
Basisunabhängige Streutheorie
Die bisher entwickelte Streutheorie ist noch nicht sehr allgemein, da sie
• eine spezielle Art von einlaufenden Zuständen, nämlich ebene Wellen, betrachtet und
• in Ortsdarstellung formuliert ist.
Im Folgenden wollen wir eine allgemeinere Formulierung besprechen.
4.6.1
Die allgemeine Lippmann-Schwinger-Gleichung
Wir arbeiten jetzt mit Zustandsvektoren ohne Bezug auf eine bestimmte Basis. Die zeitunabhängige SchrödingerGleichung ohne Streuung laute (in diesem Abschnitt kennzeichnen wir Operatoren mit einem Zirkumflex bzw.
Dach)
Ĥ0 |ψ0 ⟩ = E |ψ0 ⟩ ⇒ (Ĥ0 − E) |ψ0 ⟩ = 0
(4.302)
119
und mit Streuung
Ĥ |ψ⟩ ≡ (Ĥ0 + V̂ ) |ψ⟩ = E |ψ⟩
⇒
(Ĥ0 − E) |ψ⟩ = −V̂ |ψ⟩.
(4.303)
Beachte, dass wir in beiden Fällen dieselbe Eigenenergie E gewählt haben. Dies können wir tun, wenn Ĥ0 und Ĥ
dasselbe kontinuierliche Spektrum haben, was für ein lokales Streupotential V̂ erfüllt sein sollte. Es folgt
(Ĥ0 − E) (|ψ⟩ − |ψ0 ⟩) = −V̂ |ψ⟩.
(4.304)
Falls Ĥ0 − E ≡ Ĥ0 − E1 invertierbar ist, können wir folgern
|ψ⟩ − |ψ0 ⟩
= −
1
Ĥ − E
| 0{z }
V̂ |ψ⟩
(4.305)
konventionelle
Schreibweise für
(Ĥ0 −E1)−1
⇒
|ψ⟩
= |ψ0 ⟩ −
1
Ĥ0 − E
V̂ |ψ⟩.
(4.306)
In der Ortsdarstellung ist dies die Lippmann-Schwinger-Gleichung (4.279). Die Herleitung war aber nicht sauber,
da Ĥ0 −E nicht allgemein invertierbar ist, für Eigenwerte E von Ĥ0 nämlich nicht. |ψ0 ⟩ soll aber ein ungebundener
Zustand sein, also liegt E im kontinuierlichen Spektrum und auf dem gesamtem Spektrum ist Ĥ0 − E nicht
invertierbar.
Wie lösen wir dieses Problem? Dazu betrachten wir die zeitabhängige Schrödinger-Gleichung. Uns interessiert
der Fall, dass der Zustand lange vor der Streuung, für t → −∞, ein freier Zustand ist, also
(
)
lim |ψ(t)⟩ − |ψ0 (t)⟩ = 0
(4.307)
t→−∞
oder kürzer, aber etwas ungenau,
|ψ(−∞)⟩ = |ψ0 (−∞)⟩.
(4.308)
Beachte, dass |ψ(t)⟩ und |ψ0 (t)⟩ nun nicht mehr Eigenzustände von Ĥ bzw. Ĥ0 sind – für Eigenzustände zu
derselben Eigenenergie E wäre die Zeitentwicklung trivial und die Betrachtung von t → −∞ hat keinen Sinn.
Wir denken stattdessen an Wellenpakete. Ihre Unschärfe in der Energie, ∆E, soll so klein sein, dass |ψ(t)⟩ während
der Streuung als stationär angesehen werden kann, d.h. ∆E∆t ≪ ℏ, wobei ∆t hier die charakteristische Streuzeit
ist, die ein Teilchen im Streubereich verbringt. Unter Verwendung der Zeitentwicklungsoperatoren zu Ĥ0 und Ĥ
folgt
|ψ0 ⟩ =
|ψ0 (0)⟩ = lim e−iĤ0 (−t)/ℏ |ψ0 (t)⟩ = lim eiĤ0 t/ℏ e−iĤt/ℏ |ψ(0)⟩
t→−∞
| {z } t→−∞
= |ψ(t)⟩
=
lim eiĤ0 t/ℏ e−iEt/ℏ |ψ⟩ = lim ei(Ĥ0 −E)t/ℏ |ψ⟩.
t→−∞
t→−∞
(4.309)
Bei der Ersetzung von Ĥ durch E haben wir verwendet, dass |ψ(t)⟩ während der Streuung als stationär angesehen
werden kann.
Für den Grenzwert für t → −∞ können wir folgende Identität ausnutzen:
∫ 0
u
ηt
lim+ η
dt e f (t) Substitution t =
η
η→0
−∞
∫ 0
(u) ∫ 0
( u ) beachte u < 0
= lim+
du eu f
=
du eu lim+ f
η
η
η→0
η→0
−∞
−∞
∫ 0
(4.310)
= f (−∞)
du eu = lim f (t).
−∞
t→−∞
120
Damit folgt
|ψ0 ⟩
=
lim+
η→0
=
lim
η→0+
η
ℏ
∫
0
−∞
dt eηt/ℏ ei(Ĥ0 −E)t/ℏ |ψ⟩ = lim+
η→0
0
ei(Ĥ0 −E−iη)t/ℏ −∞
η
i(Ĥ0 − E − iη) |
|
{z
}
{z
lim
η→0+
iη
E − Ĥ0 + iη
∫
0
−∞
dt ei(Ĥ0 −E−iη)t/ℏ |ψ⟩
|ψ⟩
= 1 da η>0
Operatorinverses
=
}
η
ℏ
|ψ⟩.
(4.311)
Hierfür findet man oft folgende Schreibweisen: Entweder man lässt limη→0+ weg (der Grenzübergang ist aber
impliziert) oder man schreibt
i0+
|ψ0 ⟩ =
|ψ⟩.
(4.312)
E − Ĥ0 + i0+
Wir definieren den Greenschen Operator zu Ĥ0 :
Ĝ+
0 :=
1
E − Ĥ0 + i0+
.
(4.313)
Der Operator ist wegen des Imaginärteils i0+ invertierbar. Nun folgt
(
)
i0+
|ψ⟩ − |ψ0 ⟩ =
1−
|ψ⟩
E − Ĥ0 + i0+
[
]
i0+
1
(E − Ĥ0 + i0+ ) −
=
|ψ⟩
E − Ĥ0 + i0+
E − Ĥ0 + i0+
1
1
+
+
(E − Ĥ0 + (Ĥ − Ĥ0 ) |ψ⟩
=
i0
−
i0
) |ψ⟩ =
E − Ĥ0 + i0+
E − Ĥ0 + i0+
1
=
V̂ |ψ⟩,
E − Ĥ0 + i0+
also
|ψ⟩ = |ψ0 ⟩ +
1
E − Ĥ0 + i0+
V̂ |ψ⟩ = |ψ0 ⟩ + Ĝ+
0 V̂ |ψ⟩,
(4.314)
(4.315)
oder äquivalent
|ψ⟩ = |ψ0 ⟩ −
1
Ĥ0 − (E + i0+ )
V̂ |ψ⟩,
(4.316)
anstelle von Gl. (4.306). Diese beiden Formen sind die allgemeine, basisunabhängige Lippmann-SchwingerGleichung. Die Gleichung kann wieder durch Iteration gelöst werden, was auf eine Bornsche Reihe führt:
+
+
|ψ⟩ = |ψ0 ⟩ + Ĝ+
0 V̂ |ψ0 ⟩ + Ĝ0 V̂ Ĝ0 V̂ |ψ0 ⟩ + . . .
∞
∑
1
n
=
(Ĝ+
|ψ0 ⟩.
0 V̂ ) |ψ0 ⟩ =
1 − Ĝ+
0 V̂
n=0
(4.317)
Wir überprüfen, dass dies die Schrödinger-Gleichung löst: Es ist
|ψ⟩
−1
= (1 − Ĝ+
|ψ0 ⟩ = [1 − (E − Ĥ0 + i0+ )−1 V̂ ]−1 |ψ0 ⟩
0 V̂ )
= (E − Ĥ0 + i0+ − V̂ )−1 (E − Ĥ0 + i0+ ) |ψ0 ⟩
⇒
(E − Ĥ) |ψ⟩
(4.318)
= (E − Ĥ + i0+ )−1 i0+ |ψ0 ⟩
+
+
= (E − Ĥ + i0 − i0 ) |ψ⟩
((
(((
= (
(E(−(Ĥ(+(i0+ ) (
(E(−(Ĥ(+(i0+ )−1 i0+ |ψ0 ⟩ − i0+ (E − Ĥ + i0+ )−1 i0+ |ψ0 ⟩
)
(
iη
|ψ0 ⟩ = 0.
(4.319)
= lim iη 1 −
η→0+
E − Ĥ + iη
121
Man schreibt die Lippmann-Schwinger-Gleichung auch in Operatorform mit Hilfe des Møller-Operators Ω̂+ .
Dieser ist definiert durch die Beziehung
|ψ⟩ = Ω̂+ |ψ0 ⟩,
(4.320)
wobei |ψ⟩, |ψ0 ⟩ weiterhin die oben angeführten Bedingungen erfüllen sollen, insbesondere |ψ(−∞)⟩ = |ψ0 (−∞)⟩.
Dann ist
+
Ω̂+ |ψ0 ⟩ = |ψ0 ⟩ + Ĝ+
(4.321)
0 V̂ Ω̂ |ψ0 ⟩.
Da dies für jeden Eigenzustand ψ0 ⟩ von Ĥ0 gilt und diese eine Basis bilden, erhalten wir die Lippmann-SchwingerGleichung in Operatorform:
+
Ω̂+ = 1 + Ĝ+
(4.322)
0 V̂ Ω̂ .
Die explizite Lösung lässt sich leicht finden:
+
(1 − Ĝ+
0 V̂ ) Ω̂
⇒
Ω̂+
(4.323)
= 1
1
=
1 − Ĝ+
0 V̂
.
(4.324)
Eine andere Form der Lösung ergibt sich mit
Ω̂+
⇒ (E − Ĥ0 + i0+ ) Ω̂+
⇒ (E − Ĥ + i0+ ) Ω̂+
⇒
Ω̂+
1
V̂ Ω̂+
E − Ĥ0 + i0+
= E − Ĥ0 + i0+ + V̂ Ω̂+
= E − Ĥ0 + i0+ = E − Ĥ + i0+ + V̂
1
= 1+
V̂
E − Ĥ + i0+
= 1+
(4.325)
(4.326)
(4.327)
(4.328)
und der Definition des Greenschen Operators zum vollen Hamiltonian Ĥ,
Ĝ+ :=
1
E − Ĥ + i0+
,
(4.329)
zu
Ω̂+ = 1 + Ĝ+ V̂ .
(4.330)
−
Es ist für formale Manipulationen oft nützlich, Streuzustände |ψ ⟩ zu betrachten, die im Endzustand, nicht
im Anfangszustand, mit freien Zuständen |ψ0 ⟩ übereinstimmen. Dies ist natürlich keine experimentell leicht zu
realisierende Situation. Wir definieren den Møller-Operator Ω̂− durch
|ψ − ⟩ = Ω̂− |ψ0 ⟩,
(4.331)
wobei der einzige Unterschied ist, dass nun gelten soll
|ψ − (+∞)⟩ = |ψ0 (+∞)⟩.
(4.332)
Völlig analoge Herleitungen ergeben
Ω̂−
=
Ω̂−
=
Ω̂−
=
−
1 + Ĝ−
0 V̂ Ω̂ ,
1
,
1 − Ĝ−
0 V̂
(4.333)
(4.334)
1 + Ĝ− V̂
(4.335)
mit
Ĝ−
0
:=
Ĝ−
:=
1
E − Ĥ0 − i0+
1
.
E − Ĥ − i0+
122
,
(4.336)
(4.337)
+
−
Man nennt Ĝ+
retardierte und Ĝ−
avancierte Greensche Operatoren. Erstere beschreiben die
0 und Ĝ
0 , Ĝ
Propagation von Zuständen vorwärts in der Zeit, letztere die Propagation rückwärts in der Zeit. Beachte, dass
wir die ganze Zeit von der freien und der vollen zeitunabhängigen Schrödinger-Gleichung mit der Energie E
ausgegangen sind. Die zeitabhängigen Zustände |ψ0 (t)⟩ und |ψ ± (t)⟩ sind also immer stationäre Lösungen der
zeitabhängigen Schrödinger-Gleichungen mit der Eigenenergie E. Die Greenschen Operatoren hängen explizit
von E ab und die Møller-Operatoren implizit durch die Greenschen Operatoren.
4.6.2
Die S -Matrix
Die gesamte Information über das Verhalten eines Streuers lässt sich mit Hilfe der Streumatrix oder S-Matrix
ausdrücken. Wir betrachten einlaufende Teilchen, die sich für t → −∞ im freien Zustand |ψ0,n ⟩ = eiĤ0 t/ℏ |ψ0,n ⟩ =
e−iEt/ℏ |ψ0,n ⟩ befanden, d.h.
|ψn+ (−∞)⟩ = |ψ0,n (−∞)⟩.
(4.338)
n bezeichnet einen geeigneten Satz von Quantenzahlen. Welchen Anteil der Teilchen finden wir nach der Streuung,
für t → +∞, im freien Zustand |ψ0,m (∞)⟩? Die Antwort wird sicherlich von der Übergangsamplitude
⟨ψ0,m (∞)|ψn+ (∞)⟩
(4.339)
bestimmt sein (mit geeigneter Normierung). Diese Übergangsamplitude können wir schreiben als
⟨ψ0,m (∞)|ψn+ (∞)⟩ =
=
=
′
lim
lim ⟨ψ0,m (t)| e−iĤ(t−t )/ℏ |ψn+ (t′ )⟩
lim
lim ⟨ψ0,m (t)| e−iĤ(t−t )/ℏ |ψ0,n (t′ )⟩
lim
lim ⟨ψ0,m (0)| e+iĤ0 t/ℏ e−iĤ(t−t )/ℏ e−iĤ0 t /ℏ |ψ0,n (0)⟩ .
{z }
| {z }
t→∞ t′ →−∞
′
t→∞ t′ →−∞
′
t→∞ t′ →−∞ |
′
⟨ψ0,m |
(4.340)
|ψ0,n ⟩
Der hier auftretende Operator ist der Zeitentwicklungsoperator im Wechselwirkungs- (Dirac-) Bild,
′
′
ÛD (t, t′ ) = e+iĤ0 t/ℏ e−iĤ(t−t )/ℏ e−iĤ0 t /ℏ .
Also ist
⟨ψ0,m (∞)|ψn+ (∞)⟩ = lim
(4.341)
lim ⟨ψ0,m | ÛD (t, t′ ) |ψ0,n ⟩.
t→∞ t′ →−∞
(4.342)
Für die Berechnung sind die Møller-Operatoren Ω̂± nützlich. Dabei müssen wir jetzt aufpassen, welche Energie
E in Ω̂± auftritt und wir machen diese Energieabhängigkeit daher explizit. Es ist
⟨ψ0,m (∞)|ψn+ (∞)⟩
=
=
=
Wir definieren die S-Matrix
′
lim ⟨ψ0,m (t)|e−iĤt/ℏ ′ lim eiĤt /ℏ |ψ0,n (t′ )⟩
t →−∞
−
+
−
⟨ψm (0)|ψn (0)⟩ ≡ ⟨ψm |ψn+ ⟩
⟨ψ0,m | [Ω̂− (Em )]† Ω̂+ (En ) |ψ0,n ⟩.
t→∞
Ŝ ≡ Ŝ(Em , En ) := [Ω̂− (Em )]† Ω̂+ (En ).
(4.343)
(4.344)
Da Ŝ von den Energien des Ausgangs- und Endzustands abhängt, haben nur die Matrixelemente von Ŝ zwischen
Zuständen fester Energie eine physikalische Bedeutung, insbesondere die Übergangsamplituden
Smn := ⟨ψ0,m | Ŝ |ψ0,n ⟩.
(4.345)
Wir bestimmen nun Smn mit Hilfe der Ergebnisse des letzten Abschnitts. Es gilt
−
+
|ψm
⟩ − |ψm
⟩
= [Ω̂− (Em ) − Ω̂+ (Em )] |ψ0,m ⟩
= [1 + Ĝ− (Em )V̂ − 1 − Ĝ+ (Em )V̂ ] |ψ0,m ⟩
= [Ĝ− (Em ) − Ĝ+ (Em )] V̂ |ψ0,m ⟩.
123
(4.346)
Wir multiplizieren diese Gleichung von links mit ⟨ψn+ | und erhalten
−
⟨ψn+ |ψm
⟩−
| {z }
−
+ ∗
=⟨ψm
|ψn
⟩
⇒
= ⟨ψn+ | [Ĝ− (Em ) − Ĝ+ (Em )] V̂ |ψ0,m ⟩
⟨ψ + |ψ + ⟩
| n{z m}
⟨ψ0,n (−∞)|ψ0,m (−∞)⟩
∗
Smn
− δ(m − n)
⟨ψ0,n | [Ω̂+ (En )]† [Ĝ− (Em ) − Ĝ+ (Em )] V̂ |ψ0,m ⟩.
=
(4.347)
Hier bedeutet die δ-Funktion δ(m − n) ein Produkt von δ-Funktionen für alle kontinuierlichen Quantenzahlen und
von Kronecker-δ-Symbolen für alle diskreten Quantenzahlen. Komplexkonjugation der letzten Gleichung liefert
Smn = δ(m − n) + ⟨ψ0,m | V̂ [Ĝ− (Em ) − Ĝ+ (Em )]† Ω̂+ (En ) |ψ0,n ⟩.
Nun ist
(
± †
(Ĝ ) =
und es folgt
)†
1
E − Ĥ ±
=
i0+
1
E − Ĥ ∓ i0+
(4.348)
= Ĝ∓
(4.349)
Smn = δ(m − n) + ⟨ψ0,m | V̂ [Ĝ+ (Em ) − Ĝ− (Em )] Ω̂+ (En ) |ψ0,n ⟩.
Wir benötigen nun die Differenz
(
−
Ĝ (Em ) − Ĝ (Em ) = lim+
+
η→0
1
Em − Ĥ + iη
−
1
Em − Ĥ − iη
)
= lim+
η→0
−2iη
(Em − Ĥ)2 + η 2
(4.350)
.
(4.351)
Im Ausdruck für Smn wirkt dieser Operator auf Ω̂+ (En ) |ψ0,n ⟩ = |ψn+ ⟩, was ein Eigenzustand zu Ĥ mit der
Eigenenergie En ist. Wir können also Ĥ durch den Eigenwert En ersetzen und erhalten
lim
η→0+
−2iη
= −2πi δ(Em − En ).
(Em − En )2 + η 2
(4.352)
Damit ist
Smn = δ(m − n) − 2πi δ(Em − En ) ⟨ψ0,m | V̂ Ω̂+ |ψ0,n ⟩ .
| {z }
(4.353)
+
⟩
|ψn
Dies ist die Grundformel der Streutheorie oder auch Streuformel. Wir haben das Energieargument von Ω̂+ weggelassen, da es wegen der δ-Funktion keine Doppeldeutigkeit mehr gibt.
Beachte, dass Ŝ kein linearer Operator ist, da Ŝ über Em , En von den Zuständen abhängt, bezüglich der die
Matrixelemente berechnet werden. Man kann Smn aber als Matrixelemente eines linearen Operators schreiben,
nämlich von
∫
ˆ
S̃ = 1 − 2πi dm dn δ(Em − En )|ψ0,m ⟩⟨ψ0,m | V̂ Ω̂+ (En ) |ψ0,n ⟩⟨ψ0,n |.
(4.354)
4.6.3
Die T -Matrix
Wir wollen zum Schluss die Grundformel der Streutheorie noch etwas umschreiben. Dadurch wird sie symmetrischer in Anfangs- und Endzustand. Außerdem werden wir eine Verbindung zur zeitabhängigen Störungstheorie
erkennen. Es ist
Smn
= δ(m − n) − 2πi δ(Em − En ) ⟨ψ0,m | V̂ Ω̂+ |ψ0,n ⟩
1
= δ(m − n) − 2πi δ(Em − En ) ⟨ψ0,m | V̂
|ψ0,n ⟩
1 − Ĝ+
0 V̂
+
+
= δ(m − n) − 2πi δ(Em − En ) ⟨ψ0,m | V̂ + V̂ Ĝ+
0 V̂ + V̂ Ĝ0 V̂ Ĝ0 V̂ + . . . |ψ0,n ⟩
(4.355)
Wir definieren die Transfermatrix oder T -Matrix durch ihre Matrixelemente
Tmn
≡
Tmn (En ) ≡ ⟨ψ0,m | T̂ (En ) |ψ0,n ⟩
:=
⟨ψ0,m | V̂ Ω̂+ |ψ0,n ⟩
=
+
+
⟨ψ0,m | V̂ + V̂ Ĝ+
0 V̂ + V̂ Ĝ0 V̂ Ĝ0 V̂ + . . . |ψ0,n ⟩.
124
(4.356)
Damit ist
Smn = δ(m − n) − 2πi δ(Em − En ) Tmn .
(4.357)
Die letzte Form in Gl. (4.356) gibt T̂ als Entwicklung in der Anzahl der Streuungen am Potential V̂ wieder.
Zwischen den Streuereignissen wird die Propagation der Teilchen durch die freie Green-Funktion Ĝ+
0 beschrieben:
^
V
^
T=
^
V
+
+
G0+
^
+
...
^
V
Hier haben wir Tmn und damit Smn explizit durch eine Bornsche Reihe ausgedrückt. Die erste Bornsche Näherung
besteht in diesem Formalismus darin, die Reihe nach dem ersten Glied abzubrechen,
(1)
(1)
Smn
= δ(m − n) − 2πi δ(Em − En ) Tmn
(4.358)
(1)
Tmn
= ⟨ψ0,m | V̂ |ψ0,n ⟩.
(4.359)
mit
Dies sind einfach die Matrixelemente des Streupotentials bezüglich der freien Zustände. Diese Näherung erinnert
an Fermis Goldene Regel aus der zeitabhängigen Störungstheorie und in der Tat ist die obige erste Bornsche
Näherung deren Verallgemeinerung auf Streuzustände.
4.6.4
Verbindung zur Streuamplitude
Die Verbindung zwischen der abstrakten Streutheorie und der vorher betrachteten Streuamplitude f (ϑ, ϕ) können
wir erkennen, wenn wir für |ψ0,m ⟩, |ψ0,n ⟩ speziell ebene Wellen einsetzen, die für den Fall
Ĥ0 =
p̂2
2m
(4.360)
offenbar freie Lösungen sind. Wir schreiben also für die Streuformel
Sk′ k
= δ(k′ − k) − 2πi δ(Ek′ − Ek ) Tk′ k
( ℏ2 [
])
(k ′ )2 − k 2 Tk′ k
= δ(k′ − k) − 2πi δ
2m
2m
δ(k ′ − k)
= δ(k′ − k) − 2πi 2
Tk′ k
ℏ
2k
m
= δ( k′ − k ) − 2πi 2 δ( k ′ − k ) Tk′ k
| {z }
ℏ k | {z }
Vektoren!
mit
(4.361)
Beträge!
Tk′ k = ⟨k′ | T̂ (Ek ) |k⟩
mit Impulseigenzuständen (ebene Wellen) |k⟩, |k′ ⟩. Nun ist aber
∫
Tk′ k = ⟨k′ | V̂ Ω̂+ (Ek )|k⟩ = d3 r d3 r′ ⟨k′ |r′ ⟩⟨r′ |V̂ |r⟩⟨r|Ω̂+ (Ek )|k⟩
(4.362)
(4.363)
und Ω̂+ (Ek )|k⟩ ist der sich aus der ebenen Welle |k⟩ bei t → −∞ entwickelnde Zustand. Also finden wir die
Wellenfunktionen
⟨r|k⟩
=
⟨r|Ω̂+ (Ek )|k⟩
=
1
1
eik·r =
ψ0 (r),
(2π)3/2
(2π)3/2
1
ψ(r),
(2π)3/2
125
(4.364)
d.h. die oben diskutierte Lösung des Streuproblems. Demnach ist
∫
∫
′ ′
1
1
3
3 ′ −ik′ ·r′ ′
Tk′ k =
d
r
d
r
e
⟨r
|
V̂
|r⟩
ψ(r)
=
d3 r′ e−ik ·r V (r′ ) ψ(r′ ).
3
3
(2π)
(2π)
(4.365)
Da die Streuung elastisch ist, gilt |k′ | = |k| = k. Wir schreiben k′ = kr̂, wobei der Einheitsvektor r̂ die betrachtete
auslaufende Richtung (Richtung des Detektors) angibt. Damit ist
∫
′
1
Tk′ k =
d3 r′ e−ikr̂·r V (r′ ) ψ(r′ ).
(4.366)
3
(2π)
Jetzt erinnern wir uns an die Darstellung (4.285) der Streuamplitude,
∫
′
m
f (r̂) = −
d3 r′ e−ik r̂·r V (r′ ) ψ(r′ ),
2πℏ2
(4.367)
und folgern
ℏ2
ℏ2
f (r̂) = − 2 f (ϑ, φ),
(4.368)
2
4π m
4π m
wobei ϑ, φ die Polarwinkel von k′ relativ zu k, also zur Strahlachse ẑ, sind. Damit erkennen wir, dass die T Matrix eine natürliche Verallgemeinerung der Streuamplitude auf das allgemeine Streuproblem (beliebiges Ĥ0 ,
einfallender Zustand nicht unbedingt ebene Welle) ist.
Tk′ k = −
4.7
Anhang: Zeitabhängige Störungstheorie
In diesem Abschnitt wollen wir kurz die – mit der formalen Streutheorie verwandte – zeitabhängige Störungstheorie
besprechen, falls diese nicht in der Vorlesung Quantentheorie 1 eingeführt wurde. Die Aufgabenstellung besteht
darin, die zeitliche Entwicklung eines Systems unter dem Einfluss einer zeitabhängigen Störung zu bestimmen.
Der Hamilton-Operator hat die Form (wir verzichten hier auf den Zirkumflex bei Operatoren)
H(t) = H0 + V (t),
(4.369)
wobei H0 einfach und zeitunabhängig sein soll und V (t) die zeitabhängige Störung ist. Für diesen Fall ist eine
Formulierung nützlich, die sich auf die nichttriviale Zeitentwicklung aufgrund von V (t) konzentriert. Eine solche
Formulierung wird durch das Wechselwirkungsbild (Dirac-Bild) realisiert.
4.7.1
Bildwechsel in der Quantentheorie
Es soll kurz an die Beziehungen zwischen Schrödinger-, Heisenberg- und Wechselwirkungs-Bild erinnert werden.
Die einzigen beobachtbaren Größen in der Quantentheorie sind Matrixelemente von (hermiteschen) Operatoren,
⟨φ|A|ψ⟩. Diese sind invariant unter unitären Transformationen
|φ⟩ →
|ψ⟩ →
A →
U |φ⟩,
U |ψ⟩,
U AU †
(4.370)
(4.371)
(4.372)
(U unitär), da unter dieser Transformation
†
†
⟨φ|A|ψ⟩ → ⟨φ| U
U AU
U |ψ⟩ = ⟨φ|A|ψ⟩
| {z}
| {z}
1
(4.373)
1
gilt. Dies kann man ausnutzen, um eine dem jeweiligen Problem angemessene Darstellung zu konstruieren.
Im Schrödinger-Bild haben Operatoren höchstens eine explizite Zeitabhängigkeit (z.B. zeitabhängiges äußeres
Potential). Zustände erfüllen die Schrödinger-Gleichung
iℏ
d
|ψ(t)⟩ = H |ψ(t)⟩.
dt
126
(4.374)
Wir betrachten zunächst einen zeitunabhängigen Hamiltonian H. Das ist nicht konzeptionell notwendig, macht
die Diskusion aber klarer. Dann ist die formale Lösung der Schrödinger-Gleichung
|ψ(t)⟩ = e−iHt/ℏ |ψ(0)⟩.
(4.375)
Im Heisenberg-Bild verwenden wir eine unitäre Transformation, um die Zustände zeitunabhängig zu machen.
Die gesamte Dynamik ist dann in den Operatoren enthalten. Dazu wählen wir, für zeitunabhängiges H, U =
eiHt/ℏ . Das dreht gerade die Zeitentwicklung der Zustände im Schrödinger-Bild zurück:
|ψ(t)⟩H := eiHt/ℏ |ψ(t)⟩ = eiHt/ℏ e−iHt/ℏ |ψ(0)⟩ = |ψ(0)⟩
↑
| {z }
| {z }
Heisenberg
Schrödinger (ohne Index)
(4.376)
Schrödinger
(zeitunabhängig). Andererseits werden Operatoren zu
AH (t) := eiHt/ℏ A e−iHt/ℏ .
(4.377)
Hier ist A ein Operator im Schrödinger-Bild, der explizit zeitabhängig sein kann. Zum einen folgt
d
|ψ⟩H = 0
dt
(4.378)
und zum anderen
d
AH
dt
=
=
=
d iHt/ℏ
e
A e−iHt/ℏ
dt
(
)
iH iHt/ℏ
iH
−iHt/ℏ
iHt/ℏ ∂A −iHt/ℏ
iHt/ℏ
−iHt/ℏ
e
Ae
+e
e
+e
Ae
−
ℏ
∂t
ℏ
i
∂A
−iHt/ℏ
iHt/ℏ
−iHt/ℏ
iHt/ℏ
(H |eiHt/ℏ Ae
Ae
e−iHt/ℏ
{z
} − |e
{z
} H) + e
ℏ
∂t
AH
=
i
[H, AH ] +
ℏ
(
∂A
∂t
AH
)
(4.379)
.
H
Das ist die bekannte Heisenberg-Gleichung. Sie ist äquivalent zur Schrödinger-Gleichung.
Im Wechselwirkungsbild (Dirac-Bild ) führen wir eine unitäre Transformation durch, die nur einen Teil des
Hamiltonians enthält. Es sei
H(t) = H0 + V (t),
(4.380)
wobei dieser Formalismus wie erwähnt nützlich ist, wenn H0 zeitunabhängig und einfach ist. V (t) kann explizit
von der Zeit abhängen. Wir verwenden U = eiH0 t/ℏ :
|ψ(t)⟩D := eiH0 t/ℏ
↑
Dirac
und
|ψ(t)⟩
| {z }
(4.381)
Schrödinger
AD (t) := eiH0 t/ℏ A e−iH0 t/ℏ .
(4.382)
Es folgt
iℏ
d
|ψ(t)⟩D
dt
d iH0 t/ℏ
e
|ψ(t)⟩
dt
= −H0 eiH0 t/ℏ |ψ(t)⟩ + eiH0 t/ℏ H |ψ(t)⟩
= iℏ
=1
z
}|
{
= −H0 eiH0 t/ℏ |ψ(t)⟩ + eiH0 t/ℏ H e−iH0 t/ℏ eiH0 t/ℏ |ψ(t)⟩
↑
H0 =eiH0 t/ℏ H0 e−iH0 t/ℏ =H0,D
= VD (t) |ψ(t)⟩D .
(4.383)
127
Wir erhalten eine Gleichung von der Form der Schrödinger-Gleichung für |ψ(t)⟩D , die nur die Störung (den
komplizierten Anteil) VD enthält. Die einfache Zeitentwicklung aufgrund von H0 steckt einzig in den Operatoren.
Die Lösung ist von der Form
|ψ(t)⟩D = UD (t, t0 ) |ψ(t0 )⟩D
(4.384)
mit einem unitären Operator UD (t, t0 ), der natürlich auch nur von VD abhängen kann. Offensichtlich ist
UD (t0 , t0 ) = 1.
Wir betrachten zunächst eine zeitunabhängige Störung V . Dann ist auch H zeitunabhängig und es gilt
|ψ(t)⟩D = eiH0 t/ℏ |ψ(t)⟩ = eiH0 t/ℏ , e−iHt/ℏ |ψ(0)⟩.
(4.385)
Beachte, dass H0 und H i.A. nicht kommutieren, daher gilt nicht
eiH0 t/ℏ e−iHt/ℏ = ei(H0 −H)t/ℏ = e−iV t/ℏ .
?
(4.386)
Man erkennt leicht, dass diese Gleichung für nicht kommutierende Operatoren nicht stimmt:
)(
)
(
1 2
1 2
A B
∼
1+A+ A
1+B+ B
e e
=
2
2
1
1
∼
= 1 + A + B + AB + A2 + B 2 ,
2
2
(4.387)
während
eA+B
1
∼
= 1 + A + B + (A + B)2
2
1
1
1
1
∼
= 1 + A + B + AB + BA + A2 + B 2 .
2
2
2
2
(4.388)
Es folgt auch
|ψ(t0 )⟩D
⇒
also
=
|ψ(0)⟩ =
eiH0 t0 /ℏ e−iHt0 /ℏ |ψ(0)⟩
(4.389)
eiHt0 /ℏ e−iH0 t0 /ℏ |ψ(t0 )⟩D ,
(4.390)
iHt0 /ℏ −iH0 t0 /ℏ
|ψ(t0 )⟩D ,
|ψ(t)⟩D = eiH0 t/ℏ |e−iHt/ℏ
{ze
}e
(4.391)
UD (t, t0 ) = eiH0 t/ℏ e−iH(t−t0 )/ℏ e−iH0 t0 /ℏ .
(4.392)
so dass gilt
Man sieht, dass dieser Operator unitär ist.
Für eine allgemeine, zeitabhängige Störung V (t) setzen wir
|ψ(t)⟩D = UD (t, t0 ) |ψ(t0 )⟩D
(4.393)
in die Schrödinger-Gleichung ein:
d
UD (t, t0 ) |ψ(t0 )⟩D = VD (t) UD (t, t0 ) |ψ(t0 )⟩D
dt
d
⇒
iℏ UD (t, t0 ) = VD (t) UD (t, t0 )
dt
iℏ
∀ |ψ(t0 )⟩D
(4.394)
(4.395)
mit der Anfangsbedingung UD (t0 , t0 ) = 1. Dies ist eine Differentialgleichung für eine operatorwertige Funktion.
Integration liefert
∫
1 t
dt1 VD (t1 ) UD (t1 , t0 ).
(4.396)
UD (t, t0 ) = 1 +
iℏ t0
128
Nun haben wir eine Integralgleichung erhalten. Was haben wir dadurch gewonnen? Wir können die Gleichung
iterieren, indem wir UD (t, t0 ) immer wieder rechts einsetzen:
∫ t
∫ t1
∫
1 t
1
UD (t, t0 ) = 1 +
dt1 VD (t1 )
dt2 VD (t2 ) + . . .
(4.397)
dt1 VD (t1 ) +
iℏ t0
(iℏ)2 t0
t0
Das können wir kompakter schreiben. Der Term n-ter Ordnung enthält
∫ t
∫ tn−1
∫ t
dt1 · · ·
dtn VD (t1 ) · · · VD (tn ) =
dt1 dt2 · · · dtn VD (t1 )VD (t2 ) · · · VD (tn )
←−−−−−−−−−−−−−−−−−
t0
t0
t0
|
{z
} anwachsende Argumente
=:
1
n!
∫
nur t0 ≤tn ≤tn−1 ≤...≤t2 ≤t1 ≤t/ℏ
t
dt1 dt2 · · · dtn T VD (t1 ) · · · VD (tn ).
↑
t0
↑
Zeitordnungsoperator
Anzahl der Permutationen
(4.398)
Der Zeitordnungsoperator ist definiert durch
{
T A(t1 ) B(t2 ) =
A(t1 ) B(t2 ) für t2 < t1 ,
B(t2 ) A(t1 ) für t2 > t1 .
(4.399)
Es kommt natürlich nicht darauf an, wie wir die Zeitvariablen numerieren, nur dass sie der Größe nach sortiert
sind. Es folgt
(
)n ∫ t
∞
∑
1
i
UD (t, t0 ) =
−
dt1 · · · dtn T VD (t1 ) · · · VD (tn )
n!
ℏ
t0
n=0
(
)
∫
i t ′
′
=: T exp −
(4.400)
dt VD (t ) .
ℏ t0
Dies definiert die zeitgeordnete Exponentialfunktion. Sie ist gegeben durch die Taylor-Reihe, wobei der Zeitordnungsperator auf jeden Term unter dem Integral anzuwenden ist.
Die Reihenentwicklung für UD (t, t0 ) in Potenzen der Störung VD lässt sich mit Hilfe von Diagrammen veranschaulichen:
t
+
UD( t , t 0 ) =
VD ( t 1)
+
VD ( t 1)
VD ( t 2)
+ ...
t0
Ist VD klein, so kann man die Reihe abbrechen. Es wird oft erst nachträglich klar, ob man ein VD als klein ansehen
kann. Z.B. lautet die Näherung erster Ordnung
∫
1 t
∼
UD (t, t0 ) = 1 +
dt1 VD (t1 ).
(4.401)
iℏ t0
4.7.2
Fermis Goldene Regel
Fermis Goldene Regel ergibt sich in der zeitabhängigen Störungstheorie als Näherung für die Übergangsrate von
einem Zustand |i⟩ in einen Zustand |f ⟩. Wir definieren die Rate wie folgt: Das System startet zur Zeit t0 im
Zustand
|ψ(t0 )⟩ = |i⟩
(4.402)
(im Schrödinger-Bild). Der Hamiltonian sei
H = H0 + V
129
(4.403)
mit zeitunabhängigem H0 . Wir nehmen nun an, dass V langsam eingeschaltet wird. Dazu schreiben wir die
Zeitabhängigkeit explizit hin,
H(t) = H0 + V eηt/ℏ ,
(4.404)
wobei η > 0 klein und V zeitunabhängig ist. Dann ist
|ψ(t0 )⟩D = eiH0 t0 /ℏ |ψ(t0 )⟩ = eiH0 t0 /ℏ |i⟩.
(4.405)
Außerdem ist
|ψ(t)⟩D
|ψ(t)⟩
| {z }
⇒
= UD (t, t0 ) |ψ(t0 )⟩D
= e−iH0 t/ℏ UD (t, t0 ) eiH0 t0 /ℏ |i⟩.
(4.406)
(4.407)
Schrödinger
Die Wahrscheinlichkeitsamplitude dafür, das System zur Zeit t im Zustand |f ⟩ zu finden, ist
⟨f |ψ(t)⟩ = ⟨f | e−iH0 t/ℏ UD (t, t0 ) eiH0 t0 /ℏ |i⟩.
(4.408)
Wir betrachten Übergänge zwischen Eigenzuständen |i⟩, |f ⟩ von H0 mit Energien Ei , Ef und nehmen |i⟩ =
̸ |f ⟩
an. In erster Ordnung in VD gilt
(
)
∫
1 t
−iH0 t/ℏ
∼
. . . = ⟨f | e
1+
dt1 VD (t1 ) eiH0 t0 /ℏ |i⟩
iℏ t0
(
)
∫
1 t
= ⟨f | e−iEf t/ℏ
1/
+
dt1 VD (t1 ) eiEi t0 /ℏ |i⟩
|{z}
iℏ t0
da ⟨f |i⟩=0
= ⟨f | e
=
−iEf t/ℏ
1
iℏ
∫
t
t0
dt1 eiH0 t1 /ℏ V (t1 ) e−iH0 t1 /ℏ eiEi t0 /ℏ |i⟩
| {z }
1
⟨f |V |i⟩ e−iEf t/ℏ
iℏ
∫
|
V eηt1 /ℏ
t
t0
dt1 ei(Ef −Ei )t1 /ℏ eηt1 /ℏ eiEi t0 /ℏ .
{z
}
(4.409)
Das hier auftretende Integral ist
t
ei(Ef −Ei )t1 /ℏ eηt1 /ℏ ei(Ef −Ei )t/ℏ eηt/ℏ − ei(Ef −Ei )t0 /ℏ eηt0 /ℏ
.
.
.
=
ℏ
.
=
ℏ
|{z}
i(Ef − Ei ) + η t0
i(Ef − Ei ) + η
(4.410)
Wir schicken nun t0 nach −∞, d.h. das System wurde vor beliebig langer Zeit präpariert. Es folgt
⟨f |ψ(t)⟩ = −⟨f |V |i⟩ e−iEf t/ℏ
eiEi (t−t0 )/ℏ eηt/ℏ
ei(Ef −Ei )t/ℏ eηt/ℏ iEi t0 /ℏ
e
= −⟨f |V |i⟩
.
Ef − Ei − iη
Ef − Ei − iη
(4.411)
Die Wahrscheinlichkeit, das System zur Zeit t im Zustand |f ⟩ zu finden, wenn es zur Zeit t0 → −∞ im Zustand
|i⟩ präpariert wurde, ist dann |⟨f |ψ(t)⟩|2 . Die Übergangsrate Γf i von |i⟩ nach |f ⟩ ist die Änderungsrate dieser
Wahrscheinlichkeit mit der Zeit,
Γf i
:=
=
=
d
|⟨f |ψ(t)⟩|2
dt
d
e2ηt/ℏ
|⟨f |V |i⟩|2
2
2
dt (Ef − Ei ) + η η→0+
2ηe2ηt/ℏ
2 1
|⟨f |V |i⟩|
.
2
2
ℏ (Ef − Ei ) + η η→0+
130
(4.412)
Der letzte Faktor ist eine Darstellung der δ-Funktion. Wir erhalten Fermis Goldene Regel
Γf i =
2π
δ(Ef − Ei ) |⟨f |V |i⟩|2 .
ℏ
(4.413)
Bemerkung: Oft wollen wir eigentlich die Rate für Übergänge nach |f ⟩ ausrechnen, mit der Bedingung, dass das
System zur Zeit t (oder genauer t − δt, δt → 0+ ) im Zustand |i⟩ ist. Was wir aber anscheinend ausgerechnet
haben, ist die Rate unter der Bedingung, dass das System zur Zeit −∞ im Zustand |i⟩ war. Ist das nicht etwas
anderes? Im Allgemeinen schon, aber in erster Ordnung in V kommen wir damit durch, weil vor der Zeit t keine
anderen Übergänge stattfinden können – wir brauchen den einen Faktor von V schon zur Zeit t:
4.7.3
Verallgemeinerung auf die T -Matrix
Es ist im Prinzip klar, wie wir zu höheren Ordnungen in V übergehen können: Wir setzen die vollständige
Reihenentwicklung für UD (t, t0 ) ein,
[ ∫ t
]
∫ t
∫ t1
1
1
⟨f |ψ(t)⟩ = ⟨f | eiEf t/ℏ
dt1 VD (t1 ) +
dt
dt
V
(t
)V
(t
)
+
.
.
.
eiEi t0 /ℏ |i⟩.
(4.414)
1
2
D
1
D
2
iℏ t0
(iℏ)2 t0
t0
Der Term n-ter Ordnung enthält, mit t0 → −∞,
1
(iℏ)n
∫
∫
t
−∞
×e
vertauschen nicht
↙
↓
ηt1 /ℏ
iH0 t1 /ℏ
tn−1
dt2 · · ·
dtn e
−∞
−∞
−iH0 t1 /ℏ iH0 t2 /ℏ
ηt2 /ℏ −iH0 t2 /ℏ
dt1
e
1
=
(iℏ)n−1
×e
∫
t1
∫
Ve
∫
t
−∞
−iH0 t1 /ℏ
dt1
t1
e
∫
dt2 · · ·
−∞
iH0 tn−1 /ℏ
Ve
· · · eiH0 tn /ℏ V eηtn /ℏ e−iH0 tn /ℏ
↑
Ei
tn−2
dtn−1 eiH0 t1 /ℏ V eηt1 /ℏ
−∞
ηtn−1 /ℏ
···e
Ve
i(
H
−E
)t
0
i
n−1 /ℏ+ηtn−1 /ℏ
(e
((
/ℏ
0 tn−1
((
×(
e−iH
V.
Ei − H0 + iη
(4.415)
Der Bruch steht hier wieder für eine Operatorinversion. Für tn−1 haben wir im Prinzip das gleiche Integral zu
lösen, außer dass die obere Grenze tn−2 ist und dass η durch 2η ersetzt wird. Es geht weiter mit Iteration bis wir
schließlich erhalten
... =
e−i(H0 −Ei )t/ℏ+nηt/ℏ
1
1
V
V ···
V.
Ei − H0 + inη
Ei − H0 + i(n − 1)η
Ei − H0 + iη
(4.416)
Nun können wir den Grenzübergang η → 0+ im ersten und in den folgenden Faktoren unabhängig voneinander
ausführen, da die Grenzwerte jeweils für sich allein existieren. Der erste Faktor führt, wie wir sehen werden, zu
einer δ-Funktion. In den übrigen Faktoren zeigt der kleine Imaginärteil im Nenner nur an, auf welcher Seite der
131
reellen Achse die Pole liegen. Wir schreiben
⟨f |ψ(t)⟩
∞
H
0 −Ei )t/ℏ eϵt ∑ ei( 1
1
f t/ℏ
= ⟨f |
e−iE
V
V ···
V eiEi t0 /ℏ |i⟩
+
+
E
−
H
+
iϵ
E
−
H
+
i0
E
−
H
+
i0
+
i
0
i
0
i
0
ϵ→0
n=1
↑
Ef
=
∞
∑
e−iEi (t−t0 )/ℏ eϵt 1
1
⟨f
|
V
V ···
V |i⟩.
+
Ei − Ef + iϵ ϵ→0+
Ei − H0 + i0
Ei − H0 + i0+
n=1
(4.417)
Hier finden wir die oben definierte T -Matrix wieder:
1
1
1
V +V
V
V + ...
Ei − H0 + i0+
Ei − H0 + i0+ Ei − H0 + i0+
T (Ei ) := V + V
(4.418)
Die Übergangsrate ist schließlich
Γf i
=
2ηe2ηt/ℏ
d
1
2
|⟨f | T (Ei ) |i⟩|2
|⟨f |ψ(t)⟩| =
dt
ℏ (Ei − Ef )2 + η 2 η→0+
=
2π
δ(Ef − Ei ) |⟨f | T (Ei ) |i⟩|2 .
ℏ
(4.419)
Offenbar erhalten wir die Goldene Regel richtig als führende Ordnung in V :
T (Ei ) ∼
=V
⇒
2π
Γf i ∼
δ(Ef − Ei ) |⟨f |V |i⟩|2 .
=
ℏ
(4.420)
Es ist wichtig zu beachten, dass Γf i im T -Matrix-Formalismus nicht die Übergangsrate von |i⟩ zur Zeit t − δt
nach |f ⟩ zur Zeit t beschreibt, sondern die Änderungsrate der Wahrscheinlichkeit von |f ⟩ zur Zeit t, unter der
Bedingung, dass das System zur Zeit −∞ im Zustand |i⟩ war. Bei der Interpretation ist also Vorsicht geboten.
132
Kapitel 5
Feldquantisierung
In diesem letzten Kapitel sollen in knapper Form wesentliche Grundideen der Quantisierung von Feldern besprochen werden. Wir beginnen mit dem Postulat der kanonischen Quantisierung. Am Ende kommen wir zur
Quantentheorie des elektromagnetischen Feldes.
5.1
Von der klassischen Mechanik zur Quantenmechanik
In der klassischen Mechanik kann man die Bewegungsgleichungen für ein System (mit bestimmten Eigenschaften)
mit N generalisierten Koordinaten q1 , . . . , qN aus dem Hamiltonschen Prinzip erhalten. Dieses Prinzip fordert,
dass die Variation der Wirkung S verschwindet:
wobei
∫
δS = 0,
(5.1)
dt L(q(t), q̇(t), t)
(5.2)
t2
S=
t1
ist. L ist die Lagrange-Funktion, die von den Koordinaten q = (q1 , . . . , qN ) und Geschwindigkeiten q̇ = (q̇1 , . . . , q̇N )
und i.A. explizit der Zeit t abhängt. Bei der Variation sind die Anfangs- und Endkonfigurationen q(t1 ), q(t2 )
festzuhalten.
Die Wirkung ist ein Funktional S[q] der Bahnkurven q(t), d.h. eine Abbildung aus einem Funktionenraum in
eine Menge von Zahlen, hier R. Wir können das Hamiltonsche Prinzip auch mit Hilfe von Funktionalableitungen
schreiben, nämlich als
δS
= 0 ∀ i, t,
(5.3)
δqi (t)
wobei die Funktionalableitungen im Sinne von Distributionen definiert sind durch ihr Verhalten unter einem
Integral,
∫
δS
S[q + ϵf ] − S[q]
dt
f (t) := lim
(5.4)
ϵ→0
δq(t)
ϵ
mit einer beliebigen Testfunktion f (t), so dass S[q + ϵf ] existiert. Etwas unsauber können wir f (t) = δ(t − t0 )
setzen und erhalten
δS S[q(t) + ϵ δ(t − t0 )] − S[q(t)]
.
(5.5)
= lim
δq(t) t=t0 ϵ→0
ϵ
Wir stellen einige nützliche Beziehungen zusammen: Für die Wahl S[q] = q(s) erhalten wir
+ ϵ δ(s − t0 ) − q(s)
q(s)
δq(s) = δ(s − t0 )
= lim ϵ→0
δq(t) t=t0
ϵ
⇒
δq(s)
δq(t)
= δ(s − t)
(5.6)
(5.7)
133
und für die n-te Ableitung
δq (n) (s) δq(t) t=t0
⇒
=
δq (n) (s)
δq(t)
lim
ϵ→0
+ ϵ δ (n) (s − t ) − (s)
(s)
q (n)
q (n)
0
= δ (n) (s − t0 )
ϵ
= δ (n) (s − t).
(5.8)
(5.9)
Außerdem gilt für eine beliebige von q unabhängige Funktion g:
δg(s) g(s) − g(s)
= lim 0 = 0.
= lim
ϵ→0
δq(t) t=t0 ϵ→0
ϵ
(5.10)
Die Funktionalableitung ist eine natürliche Verallgemeinerung der gewöhnlichen Ableitung auf Funktionale.
Aus dem Hamiltonschen Prinzip folgen die Lagrange-Gleichungen 2. Art. Genauer sind diese die EulerLagrange-Gleichungen des Hamiltonschen Prinzips. Zur Erinnerung: Es ist
∫ t2
δS
δL(q(t′ ), q̇(t′ ), t′ )
0 =
=
dt′
δqi (t)
δqi (t)
t1
(∑
)
∫ t2
′
∂L δqj (t ) ∑ ∂L δ q̇j (t′ ) ∂L δt′
′
=
dt
+
+ ′
∂qj δqi (t)
∂ q̇j δqi (t)
∂t δqi (t)
t1
j
j
| {z }
∫
t2
=
dt′
t1
(∑
j
=0
)
∑ ∂L
∂L
′
′ ′
δij δ(t − t) +
δij δ (t − t) .
∂qj
∂ q̇j
j
(5.11)
Partielle Integration liefert
∫
t2
0=
′
dt
t1
[
∂L
δ(t′ − t) −
∂qi
(
t2
)
]
d ∂L
∂L ′ ′
′
δ(t − t) +
δ (t − t) .
′
dt ∂ q̇i
∂ q̇i
t1
(5.12)
Nun müssen aber qi (t1 ) und qi (t2 ) konstant gehalten werden, daher muss der letzte Term, der von der Variation
von S mit qi (t1 ) und qi (t2 ) stammt, verschwinden. Formal sind also nur solche Testfunktionen f (t) zugelassen,
da mit dem Variationsproblem vereinbar, die für t1 und t2 verschwinden. Damit folgt die Lagrange-Gleichung
d ∂L
∂L
−
= 0.
∂qi
dt ∂ q̇i
(5.13)
Beim Übergang zur Hamilton-Mechanik definieren wir schließlich den zu qi kanonisch konjugierten Impuls
pi :=
und die Hamilton-Funktion
H(q, p, t) :=
∑
∂L
∂ q̇i
pi q̇i − L(q, q̇, t).
(5.14)
(5.15)
i
Der Übergang von der klassischen zur Quantenmechanik lässt sich natürlich nicht im Rahmen der klassischen
Mechanik begründen. Die klassische Mechanik ist schließlich nur ein Grenzfall der Quantenmechanik. Es sind
Postulate erforderlich, die außerhalb der klassischen Physik liegen. Diese Postulate müssen sich letztlich durch
den Vergleich der auf ihnen beruhenden Voraussagen mit Experimenten bewähren. In dieser Hinsicht erfolgreiche
Postulate lassen sich wie folgt formulieren:
1. Observable werden durch lineare, hermitesche Operatoren auf einem Hilbertraum beschrieben.
134
2. Kanonisch konjugierte Observable q̂j , p̂j erfüllen die Vertauschungsrelationen
[q̂j , p̂j ] = iℏ,
(5.16)
während nicht konjugierte Observable, die klassisch in Involution stehen (vgl. Vorlesung Theoretische Mechanik), kommutieren. Also gilt insbesondere
[q̂i , p̂j ] = iℏδij ,
[q̂i , q̂j ] = 0,
(5.17)
(5.18)
[p̂i , p̂j ] = 0.
(5.19)
3. Die Ersetzung der Variablen qi , pi in der Hamilton-Funktion durch die Operatoren q̂i , p̂i ergibt den
Hamilton-Operator. Eventuell sind weitere Postulate erforderlich, um die Reihenfolge nicht kommutierender
Operatoren festzulegen. Der Hamilton-Operator bestimmt die Zeitentwicklung über die Schrödinger- bzw.
Heisenberg-Gleichung.
5.2
Lagrange-Formalismus für Felder
Es ist bemerkenswert, dass sich die Grundgleichungen praktisch aller Zweige der Physik als Euler-LagrangeGleichungen aus Hamiltonschen Prinzipien für geeignete Wirkungen S herleiten lassen. Das gilt insbesondere
auch für die Bewegungsgleichungen von Feldern, z.B. die Maxwell-Gleichungen. Ein Feld ist eine Größe, die an
jedem Raumpunkt r einen oder mehrere Freiheitsgrade hat. D.h. die Ortsvariable r tritt an die Stelle des Index i =
1, . . . , N oder zu diesen hinzu. Die Funktionalableitung nach einem Feld φ(r, t) ist analog zur Funktionalableitung
nach einer zeitabhängigen Funktion q(t) definiert, wobei nur zu beachten ist, dass φ von zusätzlichen Variablen
abhängt. Insbesondere gilt
δφ(R, T )
= δ(R − r) δ(T − t)
(5.20)
δφ(r, t)
und allgemeiner für einen beliebigen Differentialoperator D, z.B. ∇R , ∇2R , ∂/∂T , . . . ,
δDφ(R, T )
= D δ(R − r) δ(T − t)
δφ(r, t)
Für ein Feld φ schreiben wir die Wirkung als
∫ t2
∫
S=
dt L(t) = dt d3 r L(r, t)
(5.21)
(5.22)
t1
mit der Lagrange-Dichte L, die (typischerweise lokal) vom Feld, dessen ersten Ableitungen und evtl. explizit von
Ort und Zeit abhängt. Also ist
∫
S = dt d3 r L(φ, φ̇, ∇φ, r, t),
(5.23)
was wir auch in Viererschreibweise als
∫
S = d4 x L(φ, ∂ 0 φ, ∂ 1 φ, ∂ 2 φ, ∂ 3 φ, x0 , x1 , x2 , x3 )
(5.24)
schreiben können. Die Wirkung kann also ein Lorentz-Skalar sein, muss es aber nicht. Wir betrachten einige
wichtige Beispiele:
1. Skalare Wellengleichung: Mit
L=
γ
(∂µ φ)(∂ µ φ)
2
135
(5.25)
für ein reelles Feld φ(r, t) lautet das Hamiltonsche Prinzip
[
]
∫
δS
γ δ∂µ′ φ(x′ ) ′µ
δ∂ ′µ φ(x′ )
0 =
=
d4 x′
∂ φ(x′ ) + ∂µ′ φ(x′ )
δφ(x)
2 δφ(x)
δφ(x)
∫
γ
=
d4 x′ [(∂µ′ δ(x′ − x))(∂ ′µ φ(x′ )) + (∂µ′ φ(x′ ))(∂ ′µ δ(x′ − x))]
2
∫
γ
= −
d4 x′ [δ(x′ − x)∂µ′ ∂ ′µ φ(x′ ) + (∂ ′µ ∂µ′ φ(x′ ))δ(x′ − x)]
2
= −γ ∂µ ∂ µ φ(x).
(5.26)
Damit erhalten wir als Euler-Lagrange-Gleichung die Wellengleichung
∂µ ∂ µ φ ≡
Für ein komplexes Feld φ und
1 ∂2φ
− ∇2 φ = 0.
c2 ∂t2
L = γ(∂µ φ∗ )(∂ µ φ)
lautet das Hamiltonsche Prinzip
δS
=
0=
δφ∗ (x)
∫
d4 x′ γ
δ∂µ′ φ∗ (x′ ) ′µ
∂ φ(x′ ).
δφ∗ (x)
φ und φ∗ sind linear unabhängig, da Re φ und Im φ es sind, vgl. Abschnitt 2.5.2. Es folgt
∫
∫
0 = γ d4 x′ (∂µ′ δ(x′ − x))(∂ ′µ φ(x′ )) = −γ d4 x′ δ(x′ − x)∂µ′ ∂ ′µ φ(x′ ) = −γ∂µ ∂ µ φ(x).
(5.27)
(5.28)
(5.29)
(5.30)
Daher erhalten wir wieder
1 ∂2φ
− ∇2 φ = 0.
(5.31)
c2 ∂t2
Die resultierende Euler-Lagrange-Gleichung ist offensichtlich unabhängig von einem globalen Faktor, hier
γ. Dieser wird jedoch wichtig, wenn wir zur Quantentheorie übergehen.
∂µ ∂ µ φ ≡
2. Elektromagnetisches Feld : Hier wird das Feld durch den Vierervektor (Aµ ) beschrieben. Wir schreiben die
Lagrange-Dichte in Gaußschen Einheiten. Beachte, dass im Kontext der Quantenfeldtheorie oft sogenannte
Heaviside-Lorentz-Einheiten verwendet werden. Diese vermeiden unhandliche Faktoren von 4π, die sich bei
der Verwendung von Gaußschen Einheiten durch die Rechnung ziehen. Wir wollen wir aber nicht neben SIund Gauß-Einheiten noch ein drittes Einheitensystem einführen. Die Lagrange-Dichte lautet
(
)
1
1
4π µ
1
1
L=
− F µν Fµν −
j Aµ = −
F µν Fµν − j µ Aµ
(5.32)
4π
4
c
16π
c
mit F µν = ∂ µ Aν − ∂ ν Aµ , wobei L als Funktion (und S als Funktional) von (Aµ ) aufzufassen ist. Man kann
zeigen, dass aus δS = 0 die Maxwell-Gleichungen folgen, vgl. z.B. die Vorlesung Vielteilchentheorie.
3. Klein-Gordon-Theorie: Mit
L=
folgt
0
ℏ2
mc2 ∗
(∂µ ψ ∗ )(∂ µ ψ) −
ψ ψ
2m
2
[ 2
]
∫
ℏ δ∂µ′ ψ ∗ (x′ ) ′µ
mc2 δψ ∗ (x′ )
δS
4 ′
′
′
=
d
x
∂
ψ(x
)
−
ψ(x
)
δψ ∗ (x)
2m δψ ∗ (x)
2 δψ(x)
[ 2
]
∫
2
ℏ
mc
(∂µ′ δ(x′ − x))(∂ ′µ ψ(x′ )) −
δ(x′ − x)ψ(x′ )
=
d4 x′
2m
2
[
]
∫
2
ℏ
mc2
=
d4 x′ δ(x′ − x) −
∂µ′ ∂ ′µ ψ(x′ ) −
ψ(x′ )
2m
2
]
2 2
2 [
m c
ℏ
∂µ ∂ µ ψ(x) + 2 ψ(x) ,
= −
2m
ℏ
(5.33)
=
136
(5.34)
also die Klein-Gordon-Gleichung
(
)
m2 c2
1 ∂2
2
−∇ + 2
ψ(x) = 0.
c2 ∂t2
ℏ
(5.35)
Dasselbe Ergebnis erhalten wir aus δS/δψ = 0 nach Komplexkonjugation.
Beachte, dass es bei dieser Herleitung keine Rolle gespielt hat, dass ψ eine quantenmechanische Wellenfunktion, also ein Quantenzustand in der Ortsbasis, ist. Das Hamiltonsche Prinzip stellt sich als mathematische
Methode für die kompakte Formulierung von Wellengleichungen dar, für die es egal ist, was die dadurch
beschriebene Welle physikalisch repräsentiert.
4. Dirac-Theorie: Mit
L = ψ̄ (iℏc γ µ ∂µ − mc2 ) ψ
folgt für den vierkomponentigen Gradienten δS/δ ψ̄(x) im Spinorraum
∫
δS
0=
= d4 x′ δ(x′ − x) (iℏc γ µ ∂µ′ − mc2 ) ψ(x′ ) = c (iℏ γ µ ∂µ − mc) ψ(x).
δ ψ̄(x)
(5.36)
(5.37)
Dies ist die Dirac-Gleichung multipliziert mit c. Dasselbe Ergebnis erhält man aus δS/δψ = 0 durch hermitesche Konjugation.
5. Schrödinger-Theorie: Mit
∂ψ
ℏ2
−
(∇ψ ∗ ) · (∇ψ) − V (r) ψ ∗ ψ
∂t
2m
L = iℏ ψ ∗
(5.38)
folgt
0
=
∫
[
) (
)
∂ψ
ℏ2 ( ′ ′
dt′ d3 r′ iℏ δ(r′ − r) δ(t′ − t) ′ −
∇ δ(r − r) δ(t′ − t) · ∇′ ψ(r′ , t′ )
∂t
2m
]
− V (r) δ(r′ − r) δ(t′ − t) ψ(r′ , t′ )
δS
=
δψ ∗ (r, t)
= iℏ
∂ψ
ℏ2 2
+
∇ ψ + V (r) ψ,
∂t
2m
(5.39)
also die Schrödinger-Gleichung
∂ψ
ℏ2 2
=−
∇ ψ + V (r) ψ.
∂t
2m
Dasselbe Ergebnis erhält man aus δS/δψ = 0.
iℏ
(5.40)
Wir können auch das Konzept eines kanonisch konjugierten Impulses auf Felder übertragen. Das zu einem
reellen oder komplexen Feld φ(r, t) kanonisch konjugierte Feld lautet
∂L π(r, t) :=
.
(5.41)
∂ φ̇ r,t
Eine alternative Darstellung ist
δS
=
π(r, t) =
δ φ̇
∫
∂L
∂L ′
′
dt d r
δ(r − r) δ(t − t) =
.
∂ φ̇
∂ φ̇ r,t
′
3 ′
(5.42)
Die Definition von π(r, t) zeichnet offensichtlich die Zeit vor den räumlichen Koordinaten aus. Wir erhalten daher
i.A. keine explizit kovariante Formulierung, selbst wenn die betrachtete Theorie eigentlich Lorentz-invariant ist.
Analog hatten wir in der Mechanik gefunden, dass die Hamilton-Funktion, die pi = ∂L/∂ q̇i enthält, nicht Lorentzinvariant ist.
In den obigen Beispielen erhalten wir jeweils Folgendes für das konjugierte Feld:
137
1. Skalare Wellengleichung (für ein reelles Feld):
π=
[
]
∂ γ
∂ γ 1
γ
(∂µ φ)(∂ µ φ) =
φ̇
φ̇
−
(∇φ)
·
(∇φ)
= 2 φ̇.
∂ φ̇ 2
∂ φ̇ 2 c2
c
(5.43)
2. Elektromagnetisches Feld : Es ist nützlich, die Lagrange-Dichte umzuschreiben:
1
1
F µν Fµν − j µ Aµ
16π
c
3
3
3
3
1 ∑ µ0
1 ∑ 0ν
1 ∑ µν
1
1∑ µ
= −
F Fµ0 −
F F0ν −
F Fµν − j 0 A0 −
j Aµ
16π µ=1
16π ν=1
16π µ,ν=1
c
c µ=1
L = −
=
=
1
1
1
1
E·E+
E·E−
B · B − ρϕ + j · A
16π
16π
8π
c
1
1
(E 2 − B 2 ) − ρϕ + j · A,
8π
c
(5.44)
wobei wir daran denken müssen, dass (Aµ ) = (ϕ, A) das relevante Feld ist. Das zu Aµ konjugierte Feld ist
∂L
.
∂ Ȧµ
(5.45)
∂L
= 0,
∂ ϕ̇
(5.46)
Πµ =
Insbesondere ist das zu A0 = ϕ konjugierte Feld
Π0 =
da ϕ̇ gar nicht in L vorkommt. Das bedeutet, dass ϕ keine dynamische Variable ist. Dieses Ergebnis versteht
man am besten mit Hilfe der Coulomb-Eichung: Damit gilt nämlich
∇2 ϕ = −
4π
ρ,
c
(5.47)
d.h. ϕ ist durch die äußere Ladungsdichte und Randbedingungen eindeutig festgelegt und hat keine eigene
Dynamik.
Andererseits ist das zu A konjugierte Feld
Π
∂ 1 2
∂L
=
E
∂ Ȧ
∂ Ȧ 8π
(
∂ 1
1 )2
−∇ϕ − Ȧ
c
∂ Ȧ 8π
1 )1
E
1 (
∇ϕ + Ȧ
= −
,
4π
c
c
4πc
=
=
=
(5.48)
also proportional zum elektrischen Feld. Wir kommen bei der Feldquantisierung darauf zurück.
3. Klein-Gordon-Theorie: Hier haben wir es mit einem komplexen Feld ψ zu tun. Das konjugierte Feld
∂L
∂ ψ̇
(5.49)
ℏ2
mc2 ∗
(∂µ ψ ∗ )(∂ µ ψ) −
ψ ψ
2m
2
(5.50)
∂ ℏ2
ℏ2
ψ̇ ∗ ψ̇ =
ψ̇ ∗ .
2
2mc2
∂ ψ̇ 2mc
(5.51)
π=
ist dann i.A. auch komplex. Mit der Lagrange-Dichte
L=
erhalten wir
π=
138
4. Dirac-Theorie: Mit
L = ψ̄ (iℏc γ µ ∂µ − mc2 ) ψ
(5.52)
folgt
π=
∂
1
ψ̄ iℏc γ 0 ψ̇ = iℏ ψ̄ γ 0 = iℏ ψ † γ 0 γ 0 = iℏ ψ † ,
c
∂ ψ̇
(5.53)
da ψ̄ = ψ † γ 0 definiert wurde. ψ̇ ist ein vierkomponentiger Dirac-Spinor, daher ist π ein vierkomponentiger
Gradient des Skalars L nach ψ̇. Beachte, dass das zum Spaltenvektor ψ konjugierte Feld der Zeilenvektor
π = iℏ ψ † ist.
5. Schrödinger-Theorie: Mit
L = iℏψ ∗
∂ψ
ℏ2
−
(∇ψ ∗ ) · (∇ψ) − V (r) ψ ∗ ψ
∂t
2m
(5.54)
folgt
π=
∂
iℏ ψ ∗ ψ̇ = iℏ ψ ∗ .
∂ ψ̇
(5.55)
Für die Schrödinger- wie auch die Dirac-Theorie sehen wir, dass Real- und Imaginärteil der Wellenfunktion
zueinander konjugiert sind. Für den Schrödinger-Fall erhalten wir nämlich aus ψ = ψ1 + iψ2 , π = π1 + iπ2
mit ψ1 , ψ2 , π1 , π2 ∈ R, dass gilt
π1 + iπ2 = iℏ (ψ1 − iψ2 ) = ℏ ψ2 + iℏ ψ1 ,
(5.56)
also
π1
π2
= ℏ ψ2 ,
= ℏ ψ1 .
(5.57)
(5.58)
ψ1 und ψ2 sind damit keine unabhängigen Freiheitsgrade des Feldes.
Es ist jetzt möglich, mittels der Legendre-Transformation
H = π φ̇ − L
(5.59)
eine Hamilton-Dichte H einzuführen und kanonische (Hamiltonsche) Bewegungsgleichungen herzuleiten. Diese
sind zu den Lagrangeschen Bewegungsgleichung äquivalent. Wir kommen auf die Hamiltonsche Formulierung im
Zusammenhang mit der Feldquantisierung in Kürze zurück.
5.3
Kanonische Quantisierung
Die zentrale Idee bei der Konstruktion von Quantentheorien für Felder ist, die in der Quantenmechanik erfolgreichen kanonischen Vertauschungsrelationen
[q̂i , p̂j ] = iℏ δij
(5.60)
der konjugierten Größen q̂i , p̂j auf konjugierte Felder zu übertragen. Man postuliert also:
1. Felder werden durch Feldoperatoren auf einem Fock-Raum (siehe Kap. 2) beschrieben.
2. Kanonisch konjugierte Felder φ̂i (r, t), π̂j (r, t) erfüllen die Vertauschungsrelationen (wir betrachten hier
Bosonen)
[φ̂i (r, t), π̂j (r′ , t)] =
[φ̂i (r, t), φ̂j (r′ , t)] =
iℏ δij δ(r − r′ ),
0,
(5.61)
(5.62)
[π̂i (r, t), π̂j (r′ , t)] =
0
(5.63)
(5.64)
139
für reelle und komplexe Felder. Beachte, dass die beiden Felder bei derselben Zeit t auszuwerten sind, die
Ortsargumente aber verschieden sein können. Das ist analog zum Fall der Mechanik, da r, r′ analog zu i, j die
Freiheitsgrade des Feldes abzählen. Für komplexe Felder geht die komplexe Konjugation in die hermitesche
Konjugation für die Feldoperatoren über, d.h. ψ ∗ wird zu ψ̂ † . Die Indizes i, j in Glg. (5.61)–(5.63) beziehen
sich auf die Komponenten von Vektorfeldern wie (Aµ ).
5.3.1
Schrödingersche Wellenfunktion
Wir wenden diese Postulate zunächst auf die Schrödinger-Theorie an, d.h. wir versuchen, die Schrödingersche
Wellenfunktion kanonisch zu quantisieren. Das scheint zunächst eine absurde Idee zu sein, da die Wellenfunktion
ψ(r, t) ja bereits einen quantenmechanischen Zustand beschreibt – sie ist ein Zustandsvektor in der Ortsdarstellung. Jetzt tun wir so, als ob ψ(r, t) ein klassisches Feld analog zum elektromagnetischen sei. Dennoch wollen wir
sehen, was bei dieser Übungs herauskommt.
Wir hatten π(r, t) = iℏ ψ ∗ (r, t) gefunden. Demnach erhalten wir
[ψ̂(r, t), π̂(r′ , t)] = iℏ δ(r − r′ )
⇔
⇔
†
′
(5.65)
′
iℏ [ψ̂(r, t), ψ̂ (r , t)] = iℏ δ(r − r )
†
′
′
[ψ̂(r, t), ψ̂ (r , t)] = δ(r − r ).
(5.66)
(5.67)
Genau die gleiche Relation hatten wir in Abschnitt 2.3 aus der Konstruktion des Fock-Raums erhalten, siehe
Gl. (2.182). Diese hatte ebenfalls den Charakter eines Postulats, war aber physikalisch naheliegender als die adhoc Annahme der kanonischen Quantisierung. Es ist interessant, dass beide Wege zu demselben Ziel führen. Für
Fermionen wird im Postulat der kanonischen Quantisierung der Kommutator durch den Antikommutator ersetzt:
{φ̂i (r, t), π̂j (r′ , t)} = iℏ δij δ(r − r′ )
(5.68)
usw. Dies führt im Schrödinger-Fall offensichtlich auf
{ψ̂σ (r, t), ψ̂σ† (r′ , t)} = δσσ′ δ(r − r′ ),
(5.69)
was mit dem Resultat aus Abschnitt 2.3 übereinstimmt.
Ohne kanonische Quantisierung der Wellenfunktion (also klassisch“) erhalten wir die Hamilton-Dichte
”
ℏ2
H = π ψ̇ − L = iℏ ψ ∗ ψ̇ − iℏ ψ ∗ ψ̇ +
(∇ψ ∗ ) · (∇ψ) + V (r) ψ ∗ ψ
2m
ℏ2
(∇ψ ∗ ) · (∇ψ) + V (r) ψ ∗ ψ.
(5.70)
=
2m
Einsetzen der Feldoperatoren und Integration über den Raum ergibt den Hamilton-Operator in zweiter Quantisierung:
[ 2
]
∫
ℏ
3
†
†
Ĥ = d r
(∇ψ̂ ) · (∇ψ̂) + V (r) ψ̂ ψ̂ .
(5.71)
2m
Dieser Weg macht noch deutlicher, wieso die Methode Zweite Quantisierung“ genannt wird: Wir kommen zur
”
Vielteilchentheorie, indem wir die Schrödinger-Gleichung in erster Quantisierung als klassische“ Wellengleichung
”
auffassen und dann die Wellenfunktion kanonisch quantisieren.
Diese Erkenntnis ermutigt uns, die kanonische Quantisierung auf weitere Feldtheorien anzuwenden. Für die
Klein-Gordon- und Dirac-Theorien funktioniert dies analog. Die resultierenden Theorien werden in der Vorlesung
Quantenfeldtheorie besprochen. Wir untersuchen hier zum Abschluss die kanonische Quantisierung der Elektrodynamik.
5.3.2
Elektromagnetisches Feld
Wir hatten bereits gesehen, dass A0 = ϕ kein dynamisches Feld, sondern durch äußere Ladungen und Randbedingungen determiniert ist. A ist dagegen dynamisch und das dazu konjugierte Feld ist
−
1
1
E
=
∇ϕ +
Ȧ.
4πc
4πc
4πc2
140
(5.72)
Wenn wir naiv kanonisch quantisieren, erhalten wir
]
[
1
?
Âm (r, t), −
Ên (r′ , t) = iℏ δmn δ(r − r′ ),
4πc
also
[Êm (r, t), Ân (r′ , t)] = 4πi ℏc δmn δ(r − r′ ).
?
(5.73)
(5.74)
Dieser Ansatz führt aber auf zwei Wegen zu Widersprüchen:
1. Wir dürfen sicherlich die Coulomb-Eichung
∇ · Â = 0
(5.75)
wählen. Dann folgt aus Gl. (5.74) aber
[
]
∑ ∂
∑ ∂
′
0 = Êm (r, t),
[Êm (r, t), Ân (r′ , t)]
Â
(r
,
t)
=
n
′
′
∂x
∂x
n
n
n
n
∑ ∂
δ δ(r − r′ )
= 4πi ℏc
′ mn
∂x
n
n
=
4πi ℏc
∂
∂
δ(r − r′ ) = −4πi ℏc
δ(r − r′ )
∂x′m
∂xm
(5.76)
und wir finden einen Widerspruch.
2. Die Quantisierung soll die Maxwell-Gleichungen respektieren. Wir erwarten also
∇ · Ê = 4πρ
(5.77)
und insbesondere in Abwesenheit von Ladungen
∇ · Ê = 0.
(5.78)
Es folgt
0
[∑ ∂
]
∑ ∂
Êm (r, t), Ân (r′ , t) =
[Êm (r, t), Ân (r′ , t)]
∂x
∂x
m
m
m
m
∑ ∂
∂
= 4πi ℏc
δmn δ(r − r′ ) = 4πi ℏc
δ(r − r′ ),
∂x
∂x
m
n
m
=
(5.79)
also ebenfalls einen Widerspruch.
In Worten: Das Vektorpotential kann immer transversal geeicht werden und das elektrische Feld ist in Abwesenheit
von Ladungen transversal. Daher muss der Kommutator von Ê und  [die linke Seite von Gl. (5.74)] transversal
sein, die rechte Seite ist es aber nicht.
Da die naive kanonische Quantisierung nicht zum Erfolg führt, müssen wir das Quantisierungspostulat anpassen. Wir beschränken uns auf den ladungsfreien Fall (ρ ≡ 0) und verwenden die Coulomb-Eichung. Die wesentliche
Idee ist, die rechte Seite von Gl. (5.74) durch ihren in r und r′ transversalen Anteil zu ersetzen. Dies lässt sich
bequemer im Impulsraum ausdrücken.
Zunächst transformieren wir Gl. (5.74) in den Impulsraum, wobei wir ein √
endliches, aber großes Volumen V
annehmen und die Faktoren in der Fourier-Transformation symmetrisch zu 1/ V wählen:
∫
′ ′
1
†
′
d3 r d3 r′ eik·r−ik ·r [Êm (r, t), Ân (r′ , t)]
[Êm (k, t) , Ân (k , t)] =
V
∫
′ ′
4πi ℏc
?
=
δmn d3 r d3 r′ eik·r−ik ·r δ(r − r′ )
V
∫
′
4πi ℏc
=
δmn d3 r ei(k−k )·r
V
(5.80)
= 4πi ℏc δmn δkk′ .
141
Wir haben hier angenommen, dass Ê(r, t) hermitesch ist, da dieses Feld aus dem reellen elektrischen Feld hervorgeht. Aus der Transversalität von A folgt
0 = [Êm (k, t)† , k′ · Â(k′ , t)] = 4πi ℏc km δkk′
?
(5.81)
und aus der Transversalität von E,
0 = [k · Ê(k, t)† , Ân (k′ , t)] = 4πi ℏc kn δkk′ ,
?
(5.82)
also zwei Widersprüche. Wir postulieren jetzt, dass der Kommutator proportional zum in k und k′ transversalen
Anteil von δkk′ ist:
(
)
km kn
[Êm (k, t)† , Ân (k′ , t)] = 4πi ℏc δmn −
δkk′ .
(5.83)
|k|2
Jetzt ist die rechte Seite transversal in k und k′ , denn
)
(
)
∑ (
km kn
|k|2 kn
′ = 4πi ℏc
km δmn −
4πi ℏc
δ
k
−
δkk′ = 0
kk
n
|k|2
|k|2
m
und analog
4πi ℏc
∑
n
(
)
(
)
km kn
km |k|2
′
kn′ δmn −
δ
=
4πi
ℏc
k
−
δkk′ = 0.
kk
m
|k|2
|k|2
(5.84)
(5.85)
Die neue Quantisierungsbedingung (5.83) kann auch in den Ortsraum zurücktransformiert werden:
T
(r − r′ )
[Êm (r, t), Ân (r′ , t)] = 4πi ℏc δmn
(5.86)
(
)
1 ∑ ik·r
km kn
:= √
e
δmn −
.
|k|2
V k
(5.87)
mit
T
(r)
δmn
Es gibt nun zwei orthogonale lineare Polarisationen von A, da A transversal ist. Die entsprechenden linearen Polarisationsrichtungen seien êk1 , êk2 ; die klassischen Lösungen der freien Maxwell-Gleichungen seien also
proportional zu
êks ei(k·r−ωk t) , s = 1, 2.
(5.88)
Wir vereinbaren, dass êk1 , êk2 und k ein Rechtssystem bilden, also
êk1 × êk2 = k̂ =
k
k
(5.89)
(beachte, dass der Zirkumflex hier Einheitsvektoren und nicht Operatoren kennzeichnet). Wir können dann nicht
ê−k,1 = −êk1 und ê−k,2 = −êk2 als Polarisationsrichtungen für −k wählen, da −êk1 , −êk2 und −k ein Linkssystem bilden. Stattdessen vereinbaren wir
ê−k,1
=
êk1
(5.90)
ê−k,2
=
−êk2 .
(5.91)
Dann ist
ê−k,1 × ê−k,2 = êk1 × (−êk2 ) = −k̂
(5.92)
und die drei Vektoren bilden ein Rechtssystem.
Für das Folgende ist die Zerlegung des Feldes in entgegengesetzt zirkular polarisierte Komponenten günstig
oder zumindest üblich. Diese sind durch komplexe Einheitsvektoren
êk± :=
êk1 ± i êk2
√
2
142
(5.93)
gekennzeichnet. Beachte
ê∗k± · êk±
=
ê∗k± · êk∓
=
êk1 · êk1 + êk2 · êk2
= 1,
2
êk1 · êk1 − êk2 · êk2
= 0.
2
(5.94)
(5.95)
Auch nützlich sind die Identitäten
ê−k,± =
ê−k,1 ± i ê−k,2
êk1 ∓ i êk2
√
√
=
= êk∓
2
2
und
ê∗k,± = êk∓ = ê−k,± .
(5.96)
(5.97)
Wir schreiben das klassische Feld A nun als Superposition von ebenen Wellen (d.h. wir schreiben die allgemeine
Lösung der freien Maxwell-Gleichungen als Superposition aller speziellen Lösungen),
√
]
4πℏc2 ∑ 1 ∑ [
√
A(r, t) =
êks aks ei(k·r−ωk t) + ê∗ks a∗ks e−i(k·r−ωk t)
(5.98)
V
2ωk s=±
k
√
mit ωk = ck. Die Koeffizienten sind so gewählt, dass A(r, t) reell ist. Dass ein Faktor 4πℏc2 /2ωk explizit
hingeschrieben und nicht in aks , a∗ks absorbiert wurde, ist an dieser Stelle reine Konvention. Diese Schreibweise
führt aber nach der Quantisierung zu einfacheren Ergebnissen. Beim Übergang zum Quantenfeld  müssen wir
die Koeffizienten aks , a∗ks durch Operatoren âks , â†ks ersetzen:
√
]
4πℏc2 ∑ 1 ∑ [
√
êks âks ei(k·r−ωk t) + ê∗ks â†ks e−i(k·r−ωk t) .
(5.99)
Â(r, t) =
V
2ωk s=±
k
Es folgt sofort
1 ∂
Ê(r, t) = −
Â(r, t) = i
c ∂t
√
]
4πℏ ∑ ωk ∑ [
√
êks âks ei(k·r−ωk t) − ê∗ks â†ks e−i(k·r−ωk t) .
V
2 s=±
(5.100)
k
Im Impulsraum ist
Â(k, t)
=
=
=
=
=
∫
1
√
d3 r e−ik·r Â(r, t)
V
√
∫
[
]
′
′
4πℏc2 ∑ 1 ∑
√
d3 r êk′ s âk′ s e−i(k−k )·r−iωk′ t + ê∗k′ s â†k′ s e−i(k+k )·r+iωk′ t
V
2ωk′ s
k′
√
)
4πℏc2 ∑ 1 ∑ (
√
êk′ s âk′ s V δkk′ e−iωk′ t + ê∗k′ s â†k′ s V δk,−k′ eiωk′ t
V
2ωk′ s
k′
√
)
2πℏc2 ∑ (
êks âks e−iωk t + ê∗−k,s â†−k,s eiωk t
ωk
s
√
)
(
2
∑
2πℏc
(5.101)
êks âks e−iωk t + â†−k,s eiωk t
ωk
s
(beachte ê∗k,± = êk∓ ) und analog
Ê(k, t) = i
)
(
∑
√
êks âks e−iωk t − â†−k,s eiωk t .
2πℏωk
s
143
(5.102)
Es folgt
ωk
Â(k, t) − i Ê(k, t)
c
ωk
Â(k, t) + i Ê(k, t)
c
also
ê∗ks ·
ê∗ks ·
[ω
k
[ ωc
k
c
=
∑
√
êks′ âks′ e−iωk t ,
8πℏωk
(5.103)
s′
=
∑
√
8πℏωk
êks′ â†−k,s′ eiωk t ,
(5.104)
s′
Â(k, t) − i Ê(k, t)
]
]
Â(k, t) + i Ê(k, t)
=
=
√
8πℏωk âks e−iωk t ,
√
8πℏωk â†−k,s eiωk t ,
(5.105)
(5.106)
und schließlich (beachte Subskript k!)
âks
=
â†ks
=
=
[√ Â(k, t)
]
i
1
√
− √ Ê(k, t) ,
eiωk t ê∗ks ·
ωk
c
ωk
8πℏ
[
]
√ Â(−k, t)
1
i
√
e−iωk t êks ·
ωk
+ √ Ê(−k, t)
c
ωk
8πℏ
[
]
†
√ Â(k, t)
i
1
√
ωk
+ √ Ê(k, t)† .
e−iωk t êks ·
c
ωk
8πℏ
(5.107)
(5.108)
Die letzte Gleichheit folgt aus der Hermitizität von Â(k, t) und Ê(k, t). Die Gleichung für â†ks folgt natürlich auch
unmittelbar aus derjenigen für âks . Nun berechnen wir den Kommutator
{√
ωk ωk′
1 i(ωk −ωk′ )t ∑ ∗
†
[âks , âk′ s′ ] =
(êks )m (êk′ s′ )n
e
[Âm (k, t), Ân (k′ , t)† ]
2
|
{z
}
8πℏ
c
mn
=0
√
√
i
ωk
i ωk′
+
[Âm (k, t), Ên (k′ , t)† ] −
[Êm (k, t), Ân (k′ , t)† ]
{z
}
{z
}
|
c ωk′ |
c
ω
k
(
(
)
)
k k
k k
= −4πi ℏc δmn −
m n
k2
δkk′
}
= 4πi ℏc δmn −
1
[Êm (k, t), Ên (k′ , t)† ]
+√
{z
}
ωk ωk′ |
=0
(
)
∑
km kn
=
(ê∗ks )m (êk′ s′ )n δmn −
δkk′
k2
mn
(
)
ê∗ks · k êks′ · k
∗
=
êks · êk′ s′ −
δkk′ = δss′ δkk′ .
| {z } |
k{z2
}
=δss′
Analog erhält man
m n
k2
δkk′
(5.109)
=0
[âks , âk′ s′ ] = [â†ks , â†k′ s′ ] = 0.
(5.110)
â†ks , âks
sind also bosonische Erzeugungs- und Vernichtungsoperatoren. Sie erzeugen bzw. vernichten ein Quant
des elektromagnetischen Feldes, also ein Photon.
Schließlich können wir noch den Hamilton-Operator ermitteln: Klassisch erhalten wir für die Hamilton-Dichte
im freien Fall
H
= Π · Ȧ − L
1
1 2
1
E
· (−c E) −
(E 2 − B 2 ) =
E −
(E 2 − B 2 )
= −
4πc
8π
4π
8π
1
=
(E 2 + B 2 ),
8π
144
(5.111)
was die bekannte Energiedichte des freien elektromagnetischen Feldes (in Gaußschen Einheiten) reproduziert.
Diese können wir auch schreiben als
[ (
)2
]
1 1 ∂A
2
H=
+ (∇ × A) .
(5.112)
8π c2 ∂t
Durch Einsetzen der Feldoperatoren und Integration über den Raum erhalten wir den Hamilton-Operator
[
]
∫
1
1 ∂ Â ∂ Â
3
Ĥ =
d r 2
·
+ (∇ × Â) · (∇ × Â) .
(5.113)
8π
c ∂t ∂t
Wenn wir hier die Darstellung des Feldes  durch Erzeuger und Vernichter einsetzen, finden wir
∑∫
1 ℏ∑
1
Ĥ =
d3 r
√
2 V ′ 2 ωk′ ωk ′
ss
kk
[ (
)
′
′
∂
êk′ s′ âk′ s′ ei(k ·r−ωk′ t) + ê∗k′ s′ â†k′ s′ e−i(k ·r−ωk′ t)
×
∂t
)
∂(
·
êks âks ei(k·r−ωk t) + ê∗ks â†ks e−i(k·r−ωk t)
∂t (
(
))
′
=
=
′
+ c2 ∇ × êk′ s′ âk′ s′ ei(k ·r−ωk′ t) + ê∗k′ s′ â†k′ s′ e−i(k ·r−ωk′ t)
(
(
))]
†
i(k·r−ωk t)
∗
−i(k·r−ωk t)
· ∇ × êks âks e
+ êks âks e
∫
∑
1 ℏ∑
1
d3 r
√
2 V ′ 2 ωk′ ωk ′
ss
kk
[(
)
′
′
×
− iωk′ êk′ s′ âk′ s′ ei(k ·r−ωk′ t) + iωk′ ê∗k′ s′ â†k′ s′ e−i(k ·r−ωk′ t)
(
)
· iωk êks âks ei(k·r−ωk t) − iωk ê∗ks â†ks e−i(k·r−ωk t)
)
(
′
′
+ c2 ik′ × êk′ s′ âk′ s′ ei(k ·r−ωk′ t) − ik′ × ê∗k′ s′ â†k′ s′ e−i(k ·r−ωk′ t)
(
)]
· ik × êks âks ei(k·r−ωk t) − ik × ê∗ks â†ks e−i(k·r−ωk t)
∑
1 ∑
1
ℏ
√
2
2 ωk′ ωk ′
ss
kk′
[
2
× − δk′ ,−k ωk ê−k,s′ · êks â−k,s′ âks e−2iωk t + δk′ k ωk2 êks′ · ê∗ks âks′ â†ks
+ δk′ k ωk2 ê∗ks′ · êks â†ks′ âks − δk′ ,−k ωk2 ê∗−k,s′ · ê∗ks â†−k,s′ â†ks e2iωk t
− c2 δk′ ,−k ((−k) × ê−k,s′ ) · (k × êks ) â−k,s′ âks e−2iωk t
+ c2 δk′ k (k × êks′ ) · (k × ê∗ks ) âks′ â†ks + c2 δk′ k (k × ê∗ks′ ) · (k × êks ) â†ks′ âks
]
− c2 δk′ ,−k ((−k) × ê∗−k,s′ ) · (k × ê∗ks ) â†−k,s′ â†ks e2iωk t .
(5.114)
Nun verwenden wir ê−k,± = ê∗k± , ê∗ks′ · êks = δs′ s und
(k × ê∗ks′ ) · (k × êks )
=
=
=
k × êk1 ∓ is′ k × êk2 k × êk1 ± is k × êk2
√
√
·
2
2
′
k êk2 ± is k êk1 k êk2 ∓ is k êk1
√
√
·
2
2
2
′
2
k + s sk
= δs′ s k 2 .
2
145
(5.115)
Es folgt
Ĥ
=
1 ∑ 1 ∑[
ℏ
− ωk2 δs′ s â−k,s âks e−2iωk t + ωk2 δs′ s âks â†ks + ωk2 δs′ s â†ks âks
2
2ωk ′
k
ss
†
â−k,s
â†ks e2iωk t + c2 k 2 δs′ s â−k,s âks e−2iωk t + c2 k 2 δs′ s âks â†ks
]
+ c2 k 2 δs′ s â†ks â†ks + c2 k 2 δs′ s â†−k,s â†ks e2iωk t .
−
ωk2 δs′ s
(5.116)
Mit ωk = ck heben sich jetzt die Terme der Form ââ und ↠↠zwischen den E- und B-Feld-Beiträgen heraus und
es folgt
1 ∑ ∑
(âks â†ks + â†ks âks )
Ĥ =
ℏ
ωk
2
s
k
∑
1 †
=
ℏωk (âks âks + 1 + â†ks âks )
2
ks
(
∑
1)
=
ℏωk â†ks âks +
.
(5.117)
2
ks
Der Hamiltonian zerfällt also in eine Summe über nicht wechselwirkende harmonische Oszillatoren. Der Beitrag
1
2 ℏωk ist die Vakuumenergie der Mode k, s. Offensichtlich divergiert die totale Vakuumenergie. Das ist kein
Problem, da man sie dem Feld nicht entziehen kann. Dass sie dennoch physikalisch relevant ist, sieht man am
Casimir-Effekt, der auf der Abhängigkeit der Vakuumenergie von Randbedingungen aufgrund leitender Körper
beruht.
Die durch â†ks , âks beschriebenen Photonen sind für das freie elektromagnetische Feld also nicht wechselwirkende Bosonen. Analog kann man den Gesamtimpuls des Feldes herleiten und findet
∑
1
ℏk (âks â†ks + â†ks âks )
p̂ =
2
ks
∑ ( †
1)
=
ℏk âks âks +
2
ks
∑
ℏk â†ks âks ,
=
(5.118)
ks
wobei sich die Vakuumbeiträge von k und −k aufheben. Wir folgern, dass Photonen den Impuls ℏk tragen.
Ähnlich können wir bestätigen, dass ihr Spin S = 1 ist, siehe z.B. Vorlesung Vielteilchentheorie.
Addieren wir die Lagrange-Dichten des elektromagnetischen und des Dirac-Feldes und quantisieren sie kanonisch (transversal bosonisch bzw. fermionisch), so erhalten wir sofort die Lagrange-Dichte der Quantenelektrodynamik (QED). Sie lautet in Gaußschen Einheiten
1
1
F µν Fµν − j µ Aµ + iℏc ψ̄ γ µ ∂µ ψ − mc2 ψ̄ψ.
16π
c
Mit der (Ladungs-) Stromdichte, vgl. Abschnitt 3.3.4,
L=−
j µ = cq ψ̄ γ µ ψ
(5.119)
(5.120)
folgt
L
1
F µν Fµν − q ψ̄ γ µ Aµ ψ + iℏc ψ̄ γ µ ∂µ ψ − mc2 ψ̄ψ
16π
(
)
q
1
= iℏc ψ̄ γ µ ∂µ + i Aµ −mc2 ψ̄ψ −
F µν Fµν .
ℏc
16π
|
{z
}
= −
(5.121)
= Dµ
Die gesamte QED, eine quantitativ sehr erfolgreiche Theorie, beruht auf dieser Lagrange-Dichte. Die Quantenfeldtheorien der schwachen und starken Wechselwirkung lassen sich durch konzeptionell ähnliche, aber kompliziertere
Lagrange-Dichten charakterisieren.
146
Herunterladen