Inhaltsverzeichnis - Institut für Theoretische Physik

Dr. T.-P. Hack
Inst. f. Theoretische Physik
Wintersemester 2015/16
TP4 - Quantenmechanik 2 / Thermodynamik und Statistik 2 (StEx LA)
Vorlesungsskript (Stand: 2. Februar 2016)
Inhaltsverzeichnis
1 Quantenmechanik 2
1.1 Wiederholung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1 Motivation: Quantenmechanik im Alltag . . . . . . . . . . . . . . . . . .
1.1.2 Der konzeptionelle und mathematische Rahmen der Quantenmechanik
1.2 Drehimpulsaddition & allgemeine Drehimpulskopplung . . . . . . . . . . . . .
1.2.1 Kombination von Systemen, Tensorprodukt . . . . . . . . . . . . . . . .
1.2.2 Drehimpulsaddition: allgemeiner Fall . . . . . . . . . . . . . . . . . . .
1.2.3 Allgemeine Drehimpulskopplung . . . . . . . . . . . . . . . . . . . . . .
1.2.4 Drehimpulsaddition: Spin 1/2 und Spin 1/2 . . . . . . . . . . . . . . . .
1.2.5 Drehimpulsaddition: Bahndrehimpuls und Spin 1/2 . . . . . . . . . . . .
1.3 Teilchen im elektromagnetischen Feld . . . . . . . . . . . . . . . . . . . . . . .
1.3.1 Hamiltonoperator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.2 Normaler Zeemann-Eﬀekt . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.3 Aharonov-Bohm-Eﬀekt . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Zeitunabhängige Störungstheorie . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.1 Allgemeine Herleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.2 Harmonischer Oszillator im Gravitationsfeld . . . . . . . . . . . . . . .
1.4.3 Feinstruktur des Wasserstoﬀatoms . . . . . . . . . . . . . . . . . . . . .
1.5 Zustandsgemische und Dichtematrizen . . . . . . . . . . . . . . . . . . . . . .
1.5.1 Die Dichtematrix eines reinen Zustandes . . . . . . . . . . . . . . . . .
1.5.2 Gemischte Zustände . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.5.3 Unterschiede zwischen reinen und gemischten Zuständen . . . . . . .
1.5.4 Die Zeitentwicklung gemischter Zustände . . . . . . . . . . . . . . . .
1.6 EPR-Paradoxon, Bell’sche Ungleichungen und Quantenkryptographie . . . . .
1.6.1 Das EPR-Paradoxon . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.6.2 Die Bell’sche Ungleichung . . . . . . . . . . . . . . . . . . . . . . . . . .
1.6.3 Verschränkte Zustände . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
3
4
18
19
22
25
27
29
29
29
32
33
37
37
40
41
44
44
47
49
50
52
52
54
58
1.6.4 Quantenkryptographie . . . . . . . . . . . . . . . . . . . . . . . . . .
1.7 Vielteilchensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.7.1 Vielteilchenwellenfunktionen und Vielteilchen-Schrödingergleichung
1.7.2 Ununterscheidbare Teilchen . . . . . . . . . . . . . . . . . . . . . . . .
1.7.3 Das Heliumatom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.7.4 Das Wasserstoﬀmolekül . . . . . . . . . . . . . . . . . . . . . . . . . .
1.7.5 Atomaufbau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.8 Energiebänder in Festkörpern . . . . . . . . . . . . . . . . . . . . . . . . . .
1.8.1 Gitter und reziprokes Gitter . . . . . . . . . . . . . . . . . . . . . . . .
1.8.2 Translationoperator . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.8.3 Bloch-Wellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.8.4 Die quasifreie Elektronen-Approximation . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Thermodynamik und Statistik 2
2.1 Wiederholung: phänomenologische Thermodynamik . . . . . . . . . . . . . . . . .
2.1.1 Grundbegriﬀe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.2 Der nullte Hauptsatz: die Existenz der Temperatur . . . . . . . . . . . . . . .
2.1.3 Der erste Hauptsatz: Energieerhaltung . . . . . . . . . . . . . . . . . . . . .
2.1.4 Der zweite Hauptsatz: Entropie und irreversible Prozesse . . . . . . . . . . .
2.1.5 Der dritte Hauptsatz: Unerreichbarkeit des Temperaturnullpunktes . . . . . .
2.1.6 Gleichgewichtsbedingungen und Konkavität/Konvexität . . . . . . . . . . . .
2.1.7 Zustandsgleichungen und thermodynamische Potentiale . . . . . . . . . . .
2.2 Phasengleichgewichte und Phasenübergänge . . . . . . . . . . . . . . . . . . . . .
2.2.1 Phasenübergang flüssig/gasförmig beim van der Waals-Gas . . . . . . . . .
2.3 Ensembles in der statistischen Mechanik . . . . . . . . . . . . . . . . . . . . . . . .
2.3.1 Wiederholung: Der Zustandsbegriﬀ in der statistischen Mechanik . . . . . .
2.3.2 Das mikrokanonische Ensemble, Boltzmann- und von Neumann-Entropie . .
2.3.3 Das kanonische Ensemble . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.4 Der Fockraum und das großkanonische Ensemble . . . . . . . . . . . . . . .
2.4 Bose(-Einstein) und Fermi(-Dirac) Statistik . . . . . . . . . . . . . . . . . . . . . . .
2.5 Ideale Quantengase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.1 Das ideale Fermigas, weiße Zwerge, Neutronensterne und schwarze Löcher
2.5.2 Das ideale Bosegase, Strahlungsgesetze, Bose-Einstein-Kondensation . . . .
2.6 Ferromagnetismus, das Ising-Modell . . . . . . . . . . . . . . . . . . . . . . . . . .
2
59
61
62
63
66
68
70
71
72
74
75
76
82
82
82
84
84
87
89
89
91
94
96
101
101
103
105
107
110
112
113
115
116
1
Quantenmechanik 2
1.1
Wiederholung
1.1.1
Motivation: Quantenmechanik im Alltag
Es wird oft gesagt, dass Quantenmechanik mikroskopische Phänomene beschreibt. Tatsächliche
gibt es aber, abgesehen von den bekannten und eher akademischen Beispielen des Doppelspaltoder Stern-Gerlach-Experimentes, zahlreiche aus dem Alltag bekannte Phänomene oder technische Anwendungen in denen quantenmechanische Eﬀekte direkt makroskopisch beobachtbar
sind.
• Laser (in DVD-Playern, Druckern, Barcodescannern, ...): Die Energieniveaus von
Elektronen in Atomen sind diskret bzw. quantisiert. “Fällt” ein angeregtes Elektron in einen
niederenergetischeren Zustand zurück, wird dabei Licht einer der Energiediﬀerenz entsprechenden definierten Frequenz (Farbe) emittiert. Ein Laser ist eine Lichtquelle die auf
diesem Prinzip beruht.
• Halbleiter (in LEDs, Solarzellen, Computerchips, Digitalkameras, ...): In Festkörpern bzw. Kristallen ergeben sich für die Elektronen komplexere Energieniveaus als in einzelnen Atomen; tatsächlich gibt es sogenannte erlaubte Energiebänder, wobei das Leitungsband ein Energieband bezeichnet, das Elektronen enthalten kann die beweglich sind
und daher Strom leiten können. Bei bestimmten Kristallen ist dieses Band durch eine endliche aber nicht zu große Lücke von den niederenergetischeren Bändern getrennt. Man
spricht dann von einem Halbleiter da z.B. durch thermische Anregungen Elektronen in das
Leitungsband gehoben werden können und das Material dann von einem Isolator zu einem
Leiter wird.
• Permanentmagnete (in Festplatten, Lautsprechern, Elektromotoren, ...): Elektronen besitzen einen intrinsischen Drehimpuls, den sogenannten Spin, und damit ein intrinsisches magnetisches Moment. In Ferromagneten bzw. Permanentmagneten sind diese
Drehimpulse in großen Volumina parallel ausgerichtet, so dass sich die mikroskopischen
magnetischen Momente zu einem makroskopischen addieren.
• Tageslicht (Tunneleﬀekt bei Kernfusion in der Sonne): bei der Kernfusion in der Sonne verschmelzen vier Protonen zu einem Heliumkern wobei die überschüssige Energie u.a.
als Licht abgestrahlt wird. Dafür müssen sich die geladenen Protonen sehr nahe kommen
und entsprechend die elektrostatische Abstoßung überwinden. Man kann abschätzen, dass
die thermische kinetische Energie der Protonen dafür nicht ausreicht, die Kernfusion im
Rahmen der klassischen Physik also nicht möglich ist. Sie wird erst möglich durch das
“quantenmechanische Tunneln” durch die Potentialbarierre.
• Quantencomputer und Quantenkryptographie: quantenmechanische Eﬀekte wie die
Verschränkung beziehungsweise die Beeinflussung des Zustandes durch die Messung ma3
chen es möglich eﬃzientere und schnellere logische Schaltkreise und Verschlüsselungsalgorithmen zu entwickeln.
Die Grundlagen dieser Eﬀekte und Anwendungen werden wir teilweise in der Vorlesung diskutieren.
1.1.2
Der konzeptionelle und mathematische Rahmen der Quantenmechanik
Analog zur klassischen Mechanik möchten wir in der Quantenmechanik Observablen und Zustände eines physikalischen Systems modellieren. Observablen sind beobachtbare Größen wie
z.B. Energie, Impuls, Ort, Drehimpuls, und entsprechen in Laborsituationen geeigneten Messapparaturen. Zustände sind die möglichen Konfigurationen eines physikalischen Systems; in Laborsituationen entsprechen sie den Präparationen eines physikalischen Systems, die in einem
Experiment ausgemessen werden.
Zustände, Hilberträume. In der Quantenmechanik werden (reine) Zustände durch Vektoren
in einem Hilbertraum mathematisch modelliert. Ein Hilbertraum H ist ein komplexer Vektorraum mit einem einer hermiteschen, positiv definiten Form, einem Skalarprodukt (·, ·), d.h. für
beliebige Vektoren v1 , v2 , v3 ∈ H und komplexe Zahlen a1 , a2 ∈ C:
•
(v1 , v2 ) ∈ C.
Das Skalarprodukt weist zwei Vektoren eine komplexe Zahl zu.
•
(v1 , v2 )∗ = (v2 , v1 ).
Komplexe Konjugation vertauscht die Einträge im Skalarprodukt. Wir erinnern uns, dass
für a ∈ C mit a = x + iy , x, y ∈ R die komplexe Konjugation definiert ist als a∗ = x − iy .
•
(v3 , a1 v1 + a2 v2 ) = a1 (v3 , v1 ) + a2 (v3 , v2 ).
Das Skalarprodukt ist linear im 2. Eintrag.
•
(a1 v1 + a2 v2 , v3 ) = a∗1 (v1 , v3 ) + a∗2 (v2 , v3 ).
Das Skalarprodukt ist antilinear im 1. Eintrag. (Das folgt bereits aus den zwei vorherigen
Eigenschaften.)
4
•
(v1 , v1 ) = 0 ⇔ v1 = 0 ∈ H .
(v1 , v1 ) ≥ 0 ,
Das Skalarprodukt ist positiv definit und das Skalarprodukt eines Vektors mit sich selbst
verschwindet nur für den Nullvektor.
Aus der letzten Eigenschaft folgt, dass man aus dem Skalarprodukt eine Norm konstruieren
kann. Diese ist definiert als
p
kv1 k =
(v1 , v1 ) .
Jeder Hilbertraum besitzt (mindestens) eine normierte Orthogonalbasis oder Orthonormalbasis,
d.h. eine Familie von Vektoren1
{v1 , v2 , . . . , vd−1 , vd }
wobei die Anzahl der Vektoren d der Dimension des Hilbertraumes entspricht. Diese Vektoren
sind paarweise orthogonal und haben Norm 1
(vm , vn ) = δmn ,
wobei δmn das Kronecker-Delta ist
δmn =
1
0
wenn m = n,
wenn m =
6 n.
Eine Basis ist vollständig, d.h. jeder Vektor v ∈ H lässt sich als Linearkombination der Basisvektoren schreiben.
v=
d
X
an vn
n=1
Aus der Orthogonalität folgt, dass die Entwicklungskoeﬃzienten sich berechnen lassen als
an = (vn , v) .
Folglich hängen sie von der gewählten Basis ab.
In der Quantenmechanik haben wir es mit endlichdimensionalen (d < ∞) und unendlichdimensionalen (d = ∞) Hilberträumen zu tun. Beispiele sind:
• H = C2 . Die Zustände des Spins eines Elektrons werden durch Vektoren in diesem zweidimensionalen Hilbertraum modelliert. Das Skalarprodukt ist
a1
b
, 1
= a∗1 b1 + a∗2 b2 .
a2
b2
1
Für mathematisch Interessierte: wir haben hier angenommen, dass der Hilbertraum separabel ist, d.h. eine abzählbare Basis besitzt. Das ist in der Physik in der Regel der Fall.
5
Eine mögliche Basis ist
1
0
,
.
0
1
Der erste (zweite) Vektor dieser Basis wird üblicherweise mit dem Zustand “spin up” (“spin
down”) identifiziert.
• H = L2 (R), der Raum der quadratintegrablen Funktionen auf R. Die Zustände – die möglichen Wellenfunktionen – eines Punktteilchens in einer Raumdimension werden durch Vektoren in diesem unendlichdimensionalen Hilbertraum modelliert. Elemente von L2 (R) sind
also Funktionen2
ψ:R→C
für die gilt
Z
Z
∗
dx ψ(x) ψ(x) =
dx |ψ(x)|2 < ∞ .
R
R
Das Skalarprodukt auf L2 (R) is für beliebige ψ1 , ψ2 ∈ L2 (R) gegeben durch
Z
(ψ1 , ψ2 ) =
dx ψ1 (x)∗ ψ2 (x) .
R
Bei den Elementen von L2 (R) handelt es sich also um Funktionen mit endlicher Norm
kψk < ∞. Eine mögliche Basis von L2 (R) ist gegeben durch die Eigenfunktionen des Hamiltonoperators des harmonischen Oszillators.
• H = L2 (R3 ), der Raum der quadratintegrablen Funktionen auf R3 . Dieser unendlichdimensionale Hilbertraum ist analog zum vorherigen Beispiel definiert und modelliert die
Zustände eines Punktteilchens in drei Raumdimensionen.
Für einen Vektor ψ ∈ H und eine beliebige komplexe Zahl a ∈ C interpretieren wir ψ und
aψ als denselben physikalischen Zustand. Es ist daher zweckmäßig, in der Regel mit normierten
Vektoren zu rechnen, d.h. ohne Beschränkung anzunehmen, dass kψk = 1. Im Fall H = L2 (R3 )
ist es daher sinnvoll, die Wellenfunktion ψ(~
x) derart zu interpretieren, dass das Betragsquadrat
2
|ψ(~x)| die Wahrscheinlichlichkeit angibt, das Punktteilchen am Ort ~x ∈ R3 vorzufinden (und
analog im Fall H = L2 (R)). kψk = 1 ist dann gleichbedeutend damit, dass das Teilchen sich
irgendwo im Raum befinden muss.
Die Tatsache, dass wir Zustände als Elemente eines Hilbertraums, also eines Vektorraums,
modellieren, impliziert insbesondere dass das Superpositionsprinzip gilt: Die Summe ψ1 +ψ2 von
zwei physikalischen (reinen) Zuständen ψ1 , ψ2 ist wieder ein gültiger Zustand. Alle Vektoren des
Hilbertraums entsprechen also möglichen Zuständen.
Tatsächlich gibt es aber Zustände, die sich nicht durch Vektoren in einem Hilbertraum modellieren lassen. Letztere entsprechen den sogenannten reinen Zuständen, in Laborsituationen
Für die mathematisch Interessierten: Elemente von L2 (R) sind eigentlich sog. Äquivalenzklassen von Funktionen,
siehe z.B. das QM1 Skript von Fredenhagen oder das Buch von Münster.
2
6
entsprichen diese den idealen Präparationen des Systems (z.B. ist ein perfektes Vakuum ein reiner Zustand im wahrsten Sinne des Wortes). Darüber hinaus gibt es aber noch die sogenannten
gemischen Zustände oder Zustandsgemische. Diese sind u.a. relevant für die Thermodynamik
und werden später diskutiert.
Observablen, Operatoren. In der Quantenmechanik werden Observablen durch lineare Operatoren auf dem betrachteten Hilbertraum modelliert. Lineare Operatoren sind lineare Abbildungen die Vektoren auf Vektoren abbilden. Im Fall von endlichdimensionalen Hilberträumen mit Dimension d sind das einfach d × d–Matrizen. Im Fall von unendlichdimensionalen Hilberträumen
kann man sich Operatoren zwar als unendlichdimensionale Matrizen vorstellen (wie Born, Heisenberg und Jordan in ihren frühen quantenmechanischen Arbeiten zur “Matrizenmechanik”),
manchmal ist das aber nicht zweckmässig. Die Matrixelemente Amn eines Operators A (auf einem endlich- oder unendlichdimensionalen Hilbertraum H ) bezüglich einer Basis {ψ1 , . . . , ψd }
sind definiert als
Amn = (ψm , Aψn ) .
Eine besondere Klasse von Operatoren sind hermitesche Operatoren. Dazu definieren wir
das (hermitesch) Adjungierte A† eines Operators A3 für beliebige (geeignete) ψ1 , ψ2 ∈ H als
(ψ1 , A† ψ2 ) = (Aψ1 , ψ2 ) .
Für die Matrixelemente von A und A† gilt
A†
mn
= A∗nm .
Ein Operator wird hermitesch genannt, wenn
A† = A
gilt. In der Literatur spricht man auch oft von selbstadjungierten Operatoren. Tatsächlich gibt
es im Fall von unendlichdimensionalen Hilberträumen einen mathematischen Unterschied zwischen “hermitesch” und “selbstadjungiert” auf den wir in dieser Vorlesung nicht näher eingehen
wollen. Mathematisch Interessierte können z.B. im QM1-Skript von Fredenhagen oder im Buch
von Münster weitere Details finden.
Hermitesche Operatoren besitzen im Gegensatz zu allgemeinen linearen Operatoren reelle
Eigenwerte (s. Aufgabe 1.1). Dabei nennen wir einen Vektor ψ ∈ H , ψ 6= 0 der für einen Operator
A und eine komplexe Zahl a ∈ C
Aψ = aψ
erfüllt, einen Eigenvektor (oder Eigenzustand) des Operators A zum Eigenwert a. Man kann
ebenfalls zeigen, dass Eigenvektoren eines hermiteschen Operators zu unterschiedlichen Eigenwerten orthogonal sind (s. Aufgabe 1.1). Darüber hinaus gilt sogar, dass die Eigenvektoren eines
3
sprich: “A dagger”
7
selbstadjungierten Operators eine Basis des Hilbertraums bilden.4 In dieser Basis {ψ1 , . . . , ψd }
gilt für die Matrixelemente des selbstadjungierten Operators A: Amn = an δmn wobei an der Eigenwert zum Eigenvektor ψn ist. Amn sind also die Matrixelemente einer Diagonalmatrix, daher
spricht man beim Finden der Eigenvektoren und Eigenwerte von A vom Diagonalisieren des
Operators A.
Ein Postulat der Quantenmechanik ist, dass Messwerte Eigenwerten eines Operators entsprechen, der die entsprechende Observable modelliert. Da Messwerte immer reelle Zahlen
sind, modelliert man in der Quantenmechanik physikalische Observablen durch hermitesche
Operatoren.
Dirac-Notation. Eine suggestive Notation für Vektoren, Operatoren, Skalarprodukte und Matrixelemente ist folgende Notation von Dirac, die wir im Folgenden verwenden werden.
• Vektoren ψ ∈ H schreiben wir als |ψi (“ket”). Im Fall einer Orthonormalbasis {ψ1 , . . . , ψd }
schreiben wir in der Regel |ψn i als |ni. Einen Eigenzustand zum Eigenwert a schreiben wir
oft als |ai.
• Skalarprodukte (ψ1 , ψ2 ) schreiben wir als hψ1 |ψ2 i. Dabei ist hψ| (“bra”) gleichbedeutend mit
(|ψi)† , dem hermitesch adjungierten (oder dualen) Vektor zum Vektor |ψi.
• Matrixelemente Amn = (ψm , Aψn ) schreiben wir als hψm |A|ψn i bzw. hm|A|ni.
• Die Vollständigkeit einer Basis {ψ1 , . . . , ψd }, lässt sich ausdrücken durch
X
1=
|nihn|
n
wobei 1 der Einsoperator ist und |nihn| der Projektor auf den Zustand |ni. Hier und im
P
Pd
Folgenden werden wir die Summe n=1 vereinfachend als n notieren.
Beispiel: Für H = C2 mit Orthonormalbasis
|1i =
ist z.B.
1
,
0
|2i =
0
1
† 1 0
1
1
1
1 0 =
,
|1ih1| =
=
0
0
0
0 0
4
Für mathematisch Interessierte: Im Allgemeinen gilt das nicht für hermitesche Operatoren die nicht selbstadjungiert sind. Des Weiteren gilt die Aussage für selbstadjungierte Operatoren so nur für den Fall eines diskreten
Spektrums, d.h. benachbarte Eigenwerte sind durch einen endlichen Abstand getrennt. Im Fall eines kontinuierlichen Spektrums (z.B. beim Hamiltonoperator des freien Teilchens) gibt es keine echten Eigenvektoren, die Elemente
des Hilbertraums sind und damit endliche Norm haben sondern nur sogenannte schwache Eigenvektoren die formal
unendliche Norm haben (z.B. ebene Wellen).
8
wobei der letzte Schritt sich aus direkter Matrixmultiplikation ergibt. |1ih1| ist also tatsächlich ein Operator, der wegen
|1ih1| (a1 |1i + a2 |2i) = |1i (a1 h1|1i + a2 h1|2i) = a1 |1i ,
oder äquivalent in Matrix-/Vektorschreibweise
1 0
a1
a1
=
,
0 0
a2
0
einen beliebigen Vektor |vi = a1 |1i + a2 |2i auf a1 |1i abbildet, also auf den |1i-Zustand
projiziert.
Erwartungswerte, Messung, Wahrscheinlichkeitsinterpretation.
und einen selbstadjungierten Operator A nennen wir
Für einen Vektor |ψi
hAiψ = hψ|A|ψi
den Erwartungswert der Observable A im Zustand ψ . Dieser Erwartungswert entspricht in der
Regel nicht einem direkten Messwert sondern muss statistisch interpretiert werden, da wie schon
vorweggenommen ein Messwert eines einzelnen Experimentes immer einem konkreten Eigenwert entspricht.
Tatsächlich wird in der Quantenmechanik postuliert, dass bei der Messung der Observable
A in einem Zustand |ψi dieser Zustand in einen Eigenzustand der Observable A übergeht (Zustandsreduktion bzw. der Spezialfall des “Zusammenbruchs der Wellenfunktion” bei der Messung des Ortes). Wir können |ψi nach den Eigenvektoren |ni des Operators A entwickeln
|ψi = 1|ψi =
X
|nihn|ψi =
n
X
hn|ψi|ni .
n
Das Betragsquadrat |hn|ψi|2 des Entwicklungskoeﬃzienten interpretieren wir als Wahrscheinlichkeit, dass der Zustand |ψi bei der Messung von A in den Eigenzustand |ni übergeht. Tatsächlich
gilt
X
X
hψ|nihn|ψi = hψ|1|ψi = hψ|ψi = 1 .
|hn|ψi|2 =
n
n
Entsprechend gilt für den Erwartungswert
hAiψ = hψ|A|ψi = hψ|1A1|ψi =
X
hψ|nihn|A|mihm|ψi =
n,m
X
n,m
hψ|nian δmn hm|ψi =
X
an |hn|ψi|2 .
n
Mit der Wahrscheinlichkeit |hn|ψi|2 wird also bei der Messung von A der (Eigen-)Wert an gemessen. Der Erwartungswert hAiψ ergibt sich entsprechend als Mittelwert einer (im idealisierten Fall
unendlich oft) wiederholten Messung derselben Observable am identisch präparierten physikalischen System.
9
Daraus folgt, dass ein Zustand |ψi so zu interpretieren ist, dass er einem Ensemble von
N 1 gleichartig präparierten Systemen entspricht. Wird an diesen N Systemen die Observable
A gemessen, so finden sich die Messwerte an mit der Häufigkeit N (an ) so dass
N=
X
N (an )
n
und
N (an )
≈ |hn|ψi|2 .
N
Diese approximative Identität wird umso besser je größer N ist, so dass
N (an )
= |hn|ψi|2 .
N →∞
N
lim
Die einzelnen Messwerte, die gemittelt dem Erwartungswert hAiψ entsprechen, besitzen eine gewisse Streuung oder Varianz ∆ψ (A). Diese ist gegeben durch den Erwartungswert der
quadratischen Abweichung vom Mittelwert
(∆ψ (A))2 = (A − hAiψ )2 ψ = hA2 iψ − hAi2ψ .
Ist |ψi ein (normierter) Eigenzustand von A so ist ∆ψ (A) = 0. Die Observable A ist also im
Eigenzustand |ψi “scharf”. Jeder Messwert entspricht dem Erwartungswert und es gibt keine inhärente statistische Unsicherheit bei der Messung. In allen Zuständen, die keine Eigenzustände
sind, gilt aber ∆ψ (A) > 0.
Beispiel: Wir messen den Spin in z=x3 -Richtung im Zustand der eine Superposition aus “spin
up” und “spin down” ist. Die Observable A ist also
~
A = S3 = Sz =
2
1 0
.
0 −1
Für spätere Zwecke halten wir fest, dass es sich um die Eigenschaft bezüglich der z−Richtung
handelt und nennen die Zustände entsprechend “z−spin up” |z ↑i und “z−spin down” |z ↓i.
Konkret nehmen wir an, dass der Zustand |ψi gegeben ist durch
1
1
|ψi = √ (|z ↑i + |z ↓i) = √
2
2
so dass
|hz ↑|ψi|2 =
1
,
2
1 1
1
0
+
=√
,
0
1
2 1
|hz ↓|ψi|2 =
1
.
2
Oﬀenbar gilt für den Erwartungswert hAiψ = 0, wobei in 50% aller Messungen der Messwert 12 ~
und in 50% aller Messungen der Messwert − 21 ~ gemessen wird. Das Stern-Gerlach-Experiment
10
(SG) ist eine experimentelle Realisierung dieser Situation. Eine Elektronenkanone “schießt” in regelmäßigen Abständen Elektronen die im Zustand |ψi präpariert sind durch eine Stern-GerlachApparatur5 , in der ein in z−Richtung inhomogenes, aber in x− und y -Richtung homogenes Magnetfeld vorherrscht, die Apparatur ist also in z−Richtung ausgerichtet. Hinter der Apparatur ist
ein Schirm aufgestellt, der die Position der auftreﬀenden Elektronen registriert. Die Kombination aus SG-Apparat und Schirm entspricht der Messung des Spins in z−Richtung. Man stellt fest,
dass jedes Elektron entweder oben (“z−spin up”), oder unten (“z−spin down”) auf dem Schirm
auftriﬀt. Ist nach N abgeschossenen Elektronen N (z ↑) die Anzahl der oben auftreﬀenden Elektronen und N (z ↓) die Anzahl der unten auftreﬀenden Elektronen, so gilt
N (z ↑)
1
≈ ,
N
2
N (z ↓)
1
≈ ,
N
2
wobei diese Identität immer exakter wird je größer N ist.
Für die Varianz ∆ψ (Sz ) erhalten wir
2
(∆ψ (Sz )) =
hSz2 iψ
−
hSz i2ψ
~2 1 0 1 1
1
~2
√
=√ 1 1
−0=
4 0 1
4
2
2 1
| {z }
Sz2
⇒
∆ψ (Sz ) =
~
.
2
Das leuchtet ein, da das (in diesem Spezialfall) gerade der Abstand der möglichen Messwerte
± 21 ~ vom Erwartungswert 0 ist.
Am SG-Experiment kann man auch sehr gut verdeutlichen, dass eine quantenmechanische
Messung den ausgemessenen Zustand ändert, indem er ihn in einen Eigenzustand der gemessenen Observable überführt. Dazu betrachten wir folgende Anordnung. Nach der ersten z−SGApparatur wird ein Schirm aufgestellt, der nur die z−spin down Elektronen registriert und die
z−spin up Elektronen passieren lässt, die z−spin up Elektronen werden also herausgefiltert.
Diese Filterung entspricht bereits einer Messung. Im Falle, dass ein Elektron den Filter passiert,
wurde durch die Messung der Zustand |ψi in den Zustand |z ↑i überführt. Schaltet man eine
weitere z−SG-Apparatur hinter die erste, passieren die herausgefilterten Elektronen diese ohne
5
Tatsächlich benutzt man im SG-Experiment zunächst vollständig unpolarisierte Elektronen (bzw. Silberatome, weil
diese neutral sind). Man kann aber die hier beschriebene Situation problemlos experimentell realisieren indem man
einen weitere geeignete SG-Apparatur vorschaltet, siehe den folgenden Abschnitt.
11
Zustandsänderung, da sie bereits in einem Eigenzustand der Sz -Observable sind. Insbesondere
werden am hinteren Schirm keine z−spin down Elektronen registriert.
Um die Zustandsänderung noch stärker zu verdeutlichen, führen wir eine zweite Observable
ein, den Spin in x−Richtung, sowie die entsprechenden x−spin up und x−spin down Eigenzustände (siehe Aufgabe 1.3)
~
S1 = Sx =
2
0 1
,
1 0
1
|x ↑i = √
2
1
,
1
1
|x ↓i = √
2
1
.
−1
Sx wird experimentell durch eine x−SG-Apparatur implementiert, also eine SG-Apparatur die in
x−Richtung ausgerichtet ist. Mathematisch gilt oﬀenbar
1
|z ↑i = √ (|x ↑i + |x ↓i) ,
2
was in folgender Versuchsanordnung sichtbar wird. Wir leiten den im vorigen Experiment gefil-
terten Strahl aus z−spin up Elektronen nicht in einen weiteren z−SG-Apparat, sondern in einen
x−SG-Apparat, dessen Ausrichtung relativ zum z−SG-Apparat also um 90◦ verdreht ist (wegen
der zweidimensionalen Darstellung ist das im Bild leider nicht realistisch wiedergegeben). Die
Messung ergibt dabei, dass jeweils 50% der gefilterten Elektronen als x−spin up und x−spin
down gemessen werden. Darüber hinaus erkennen wir, dass der als Eingangszustand präparierte Zustand |ψi tatsächlich der Zustand |x ↑i ist (und wissen inzwischen, wie wir diesen durch
12
einen x−SG-Filter präparieren können). Es wird also deutlich, dass der eingangs präparierte Zustand |x ↑i durch die Messung von Sz entweder in |z ↑i oder |z ↓i übergeht. Filtert man den
|z ↑i-Anteil heraus und misst Sx , sind beide Alternativen x−spin up und x−spin down als Messergebnis möglich. Die eingangs präparierte Eigenschaft der Elektronen, im x−spin up Zustand
zu sein, wird durch die Sz -Messung also gewissermaßen “gelöscht”.
Zeitentwicklung, Korrespondenzprinzip, Schrödingergleichung Für die kräftefreie Bewegung eines Teilchens in drei Raumdimensionen gelten für Energie E und Impuls p
~ die de
Broglie-Beziehungen
p~ = ~~k ,
E = ~ω ,
wobei ω die Kreisfrequenz und ~k der Wellenzahlvektor sind. Aus der (nichtrelativistischen) EnergieImpuls-Beziehung
E=
p~2
2m
folgt daher die (nichtrelativistische) Dispersionsrelation
ω=
~ ~2
k .
2m
Materiewellen, die dieser Dispersionsrelation genügen sind ebene Wellen
i
~
ψ(t, ~x) = ae ~ (k·~x−ωt)
die der Diﬀerentialgleichung
i~
∂
~2 ~ 2
~2
ψ(t, ~x) = −
∇ ψ(t, ~x) = −
∆ψ(t, ~x)
∂t
2m
2m
genügen, wobei


~ =
∇
der Gradient und
∂
 ∂x∂ 1 
 ∂x2 
∂
∂x3
2
2
2
~2 = ∂ + ∂ + ∂
∆=∇
∂x21 ∂x22 ∂x23
der Laplaceoperator ist. Die de Broglie-Beziehungen motivieren die Interpretation, dass der Operator
~~
~
P~ = ∇
= −i~∇
i
der Impulsoperator (im Ortsraum) ist, während der Operator
H=
P~ 2
2m
der “Energieoperator” bzw. Hamiltonoperator des freien Teilchens ist.
13
In der klassischen Mechanik ist die Observable, die der Energie entspricht die Hamiltonfunktion h(~
p, ~q), wobei die Koordinate ~q im einfachsten Fall dem Ort ~q = ~x entspricht. Der Bewegung
eines Teilchens in drei Raumdimensionen unter dem Einfluss des Potentials V (~
q ) entspricht die
Hamiltonfunktion
h(~
p, ~q) =
p~ 2
+ V (~q) .
2m
Gemäß des Korrespondenzprinzips ordnet man klassischen Observablen, die Funktionen von p
~
und ~
q sind, entsprechende Observablen in der Quantentheorie zu indem man dieselben Funktionen nimmt und die Ersetzung
p~ → P~ ,
~
~q → Q
~ der Ortsoperator, der (im Ortsraum) der Multipliktion mit ~q = ~x entspricht.
vornimmt. Dabei ist Q
Orts- und Impulsoperator genügen den berühmten Heisenberg’schen Kommutatorrelationen6
[Qi , Pj ] = Qi Pj − Pj Qi = i~δij 1 .
Aufgrund des Korrespondenzprinzips ordnen wir nun der Observablen, die der Energie eines Teilchens das sich in drei Raumdimensionen unter dem Einfluss des Potentials V (~
q ) bewegt
entspricht, den Hamiltonoperator
H=
P~ 2
~
+ V (Q)
2m
zu und postulieren, dass der Zustand dieses physikalischen Systems zu jedem Zeitpunkt t durch
eine Wellenfunktion ψ(t, ~
x) beschrieben wird, die der zeitabhängigen Schrödingergleichung
i~
∂
ψ(t, ~x) = Hψ(t, ~x)
∂t
genügt. Dabei ist für einen festen Zeitpunkt t die Wellenfunktion ψ(t, ~
x) eine quadratintegrable
2
3
Funktion von ~
x, also ein Vektor im Hilbertraum L (R ). Die zeitabhängige Schrödingergleichung
bestimmt die Dynamik eines quantenmechanischen Systems und ist gewissermassen das quantenmechanische Analogon der Hamilton’schen bzw. Newton’schen Bewegungsgleichungen in
der klassischen Mechanik.
Die zeitabhängige Schrödingergleichung ist auch sinnvoll für Systeme die sich durch endlichdimensionale Hilberträume modellieren lassen. Für die Beschreibung der Zeitabhängigkeit
eines Elektronspins in einem äußeren Magnetfeld gilt z.B. eine analoge Gleichung wobei die Zustandsfunktion ψ(t) oder |ψ(t)i zu jedem Zeitpunkt ein Vektor in C2 ist und der Hamiltonoperator
eine geeignete 2 × 2 Matrix ist.
Für eine allgemeine Lösung der zeitabhängigen Schrödingergleichung ist die Wahrscheinlichkeitsdichte |ψ(t, ~
x)|2 zeitabhängig (die Norm kψ(t, ~x)k aber nicht!). Da der Hamiltonoperator
6
Aus diesem Grund ist das Korrespondenzprinzip in der Regel nicht eindeutig, da man z.B. der klassischen Observablen q1 p1 = p1 q1 die quantenmechanischen Observablen Q1 P1 oder P1 Q1 = Q1 P1 + i~1 zuordnen könnte. Dieses
Problem wird uns in der Vorlesung in der Regel aber nicht betreﬀen.
14
nicht von der Zeit abhängt sollte es allerdings Lösungen der zeitabhängigen Schrödingergleichung geben für die |ψ(t, ~
x)|2 zeitunabhängig ist. Um diese zu finden machen wir den Ansatz
ψ(t, ~x) = f (t)ψ(~x) .
Einsetzen in die zeitabhängige Schrödingergleichung ergibt f (t) = exp(−i Et
~ ) mit E ∈ R und
damit
ψ(t, ~x) = e−i
Et
~
ψ(~x) ,
Hψ(~x) = Eψ(~x) .
Diese speziellen Lösungen der zeitabhängigen Schrödingergleichung nennt man stationäre Lösungen. Der räumliche Anteil der Wellenfunktion erfüllt dabei die zeitunabhängige Schrödingergleichung Hψ = Eψ . Diese Gleichung ist eine Eigenwertgleichung für den Hamiltonoperator
H , stationäre Zustände entsprechen also den Eigenzuständen von H . Da H eine Observable
ist verlangen wir, dass H ein hermitescher (selbstadjungierter) Operator ist. Die Eigenzustände
von H bilden also eine Basis für den Hilbertraum. Darüber hinaus lässt sich eine allgemeine
Lösung der zeitabhängigen Schrödingergleichung als Superposition von stationären Zuständen
schreiben. In der Regel ist es also ausreichend, die zeitunabhängige Schrödingergleichung zu
betrachten.
Verträgliche Observablen, Unschärferelation. Wir wollen nun in einem Zustand |ψi zunächst die Observable A und anschließend die Observable B messen. Nach der Messung von A
geht |ψi in einen Eigenzustand |ai von A über und man misst den Eigenwert a. Bei der anschließenden Messung von B geht |ai abermals in einen Eigenzustand |bi von B über und man misst
den Eigenwert b. War |ψi bereits ein gemeinsamer Eigenvektor von A und B , ändert er sich bei
den Messungen nicht und die Messungen von A und B ergeben den jeweils gleichen Messwert,
unabängig davon welche der beiden Observablen zuerst gemessen worden ist. Mathematisch
wird das ausgedrückt durch die Tatsache, dass der Erwartungswert
hψ| (AB − BA) |ψi
des Kommutators
[A, B] = AB − BA
im Zustand |ψi verschwindet. Man kann zeigen, dass das Verschwinden des Kommutators [A, B]
als Observable (d.h. der Erwartungswert des Kommutators verschwindet in allen Zuständen)
äquivalent dazu ist, dass es eine Basis des Hilbertraums gibt, die aus Vektoren besteht, die
gemeinsame Eigenvektoren von A und B sind. Man spricht in diesem Fall davon, dass A und B
gleichzeitig diagonalisierbar sind. Physikalisch bedeutet das, dass A und B gleichzeitig scharf
messbar sind. Daher werden Observablen A und B deren Kommutator verschwindet verträglich
oder kommensurabel genannt.
Sind zwei Observablen nicht verträglich, lässt sich der “Grad der Unverträglichkeit in einem
Zustand ψ ” durch die allgemeine Unschärferelation
1
∆ψ (A)∆ψ (B) ≥ |h[A, B]iψ |
2
15
charakterisieren. Im Falle von A = Q (Ortsoperator) und B = P (Impulsoperator) bekommt man
aufgrund der Kommutatorrelation [Q, P ] = i~1 die Heisenberg’sche Unschärferelation
∆ψ (P )∆ψ (Q) ≥
~
2
deren rechte Seite universell, d.h. zustandsunabhängig ist. Diese Unschärferelation ist folgendermaßen zu interpretieren: Es ist nicht möglich das System in einem Zustand ψ zu präparieren
in dem das Produkt der Varianzen von P und Q beliebig klein wird. Dies lässt sich am besten an
einem Gauss’schen Wellenpaket
x2
ψ(x) =
− 2
1 exp
4σ0
(2πσ02 ) 4
1
illustrieren, das in der Quantenmechanik dem klassischen Zustand eines Punktteilchens (hier
ruhend, im Ursprung und in einer Raumdimension) entspricht. Man findet
∆ψ (P ) =
~
,
2σ0
⇒
∆ψ (Q) = σ0
∆ψ (P )∆ψ (Q) =
~
.
2
Präpariert man diesen Zustand also so, dass ∆ψ (Q) klein ist, dann ist ∆ψ (P ) zwangsläufig
groß und umgekehrt. Darüber hinaus sind Gauss’sche Wellenpakete oﬀenbar Zustände in denen
∆ψ (P )∆ψ (Q) den kleinstmöglichen Wert einnimmt.
Auch wenn der nichtverschwindende Kommutator von P und Q damit zusammenhängt, dass
sich die Messungen von P und Q beeinflussen können, ist diese Beeinflussung nicht die Ursache für die Unschärferelation. Man kann z.B. ein Ensemble von N 1 Elektronen im Zustand
ψ präparieren. An der einen Hälfte dieser Elektronen wird P bzw. ∆ψ (P ) gemessen, and der
anderen Hälfte wird – zur Verdeutlichung z.B. einen Tag später – Q bzw. ∆ψ (Q) gemessen. Die
Messungen sind unabhängig und können sich nicht gegenseitig beeinflussen. Trotzdem findet
man ∆ψ (P )∆ψ (Q) ≥ 21 ~. Man muss die gegenseitige Beeinflussung der Messungen und die
Unschärferelation also als Konsequenzen der gemeinsamen Ursache [Q, P ] 6= 0, also der Unverträglichkeit von Q und P , ansehen.
Schrödingerbild, Heisenbergbild Im zuvor diskutierten Schrödingerbild wird die Zeitentwicklung eines Zustandes durch die zeitabhängige Schrödingergleichung
i~
∂
|ψ(t)i = H|ψ(t)i ,
∂t
bestimmt. Die allgemeine Lösung dieser Gleichung ist
i
|ψ(t)i = e− ~ Ht |ψ(0)i
wobei |ψ(0)i die Rolle eines Anfangswertes spielt. In speziellen Fall, dass |ψ(0)i ein Eigenzustand
des Hamiltonoperators zur Energie E ist, gilt
i
|ψ(t)i = e− ~ Et |ψ(0)i
16
im Einklang mit der Diskussion im vorigen Abschnitt. Dies folgt aus der Tatsache, dass allgemein für den Eigenzustand |ai eines selbstadjungierten Operators A zum Eigenwert a gilt, dass
f (A)|ai = f (a)|ai für beliebige (genügend reguläre) Funktionen f .
Ist eine Observable A nicht explizit zeitabhängig, so ergibt sich die Zeitabhängigkeit des
Erwartungswertes im Schrödingerbild
hAiψ(t) = hψ(t)|A|ψ(t)i
vollständig aus der Zeitabhängigkeit von |ψ(t)i. Allerdings sind es in der Quantenmechanik die
Erwartungswerte selbst die den Kontakt zum Experiment darstellen, es spielt also gewissermaßen keine Rolle wie diese Erwartungswerte mathematisch zustande gekommen sind. Daher ist
der Standpunkt des Heisenbergbildes (mathematisch und physikalisch) äquivalent zum Schrödingerbild. Im Heisenbergbild postuliert man, dass die Zustände |ψH i selbst zeitunabhängig
sind. Dagegen sind die Observablen zeitabhängig, wobei die Zeitabhängigkeit durch die Heisenberggleichung
i~
d
AH (t) = −[H, AH (t)]
dt
bestimmt ist. Die allgemeine Lösung dieser Gleichung ist
i
i
AH (t) = e ~ Ht AH (0)e− ~ Ht ,
wobei AH (0) analog zum Schrödingerbild die Rolle eines Anfangswertes spielt. Die mathematische Äquivalenz der beiden Bilder wird durch den unitären Operator
i
U (t) = e− ~ Ht
vermittelt, wobei wir uns erinnern, dass ein Operator A unitär genannt wird, wenn A† = A−1 .
Konkret setzen wir
AH (t) = U (t)−1 AU (t) ,
|ψH i = U (t)−1 |ψ(t)i ,
d.h. wir identifizieren den Anfangswert AH (0) im Heisenbergbild mit dem Operator A im Schrödingerbild, und den Anfangswert |ψ(0)i im Schrödingerbild mit dem Zustand |ψH i im Heisenbergbild. Die physikalische Äquivalenz der beiden Bilder folgt dann aus
hψH |AH (t)|ψH i = (|ψH i)† AH (t)|ψH i = U (t)−1 |ψ(t)i
†
U (t)−1 AU (t)U (t)−1 |ψ(t)i
= hψ(t)|U (t)U (t)−1 AU (t)U (t)−1 |ψ(t)i = hψ(t)|A|ψ(t)i .
Erhaltungsgrößen eines quantenmechanischen Systems sind Observable deren Erwartungswerte in allen Zuständen zeitunabhängig sind. Im Heisenbergbild ist das äquivalent damit dass
[H, AH (t)] = 0. Dann gilt aber auch AH (t) = AH (0) = A. Unabhängig vom verwendeten Bild
kann man daher sagen, dass Erhaltungsgrößen durch die Bedingung
[H, A] = 0
charakterisiert sind.
17
Zusammenfassung: die Postulate der Quantenmechanik.
schnitt diskutierten Postulate der Quantenmechanik zusammen.
Wir fassen die in diesem Ab-
1. Reine Zustände eines physikalischen System werden durch (normierte) Vektoren eines
komplexen Hilbertraums H repräsentiert. Es gilt das Superpositionsprinzip: die Summe
zweier Zustandsvektoren entspricht wieder einem physikalischen Zustand; dies gilt entsprechend für alle Vektoren in H .
2. Die Observablen eines physikalischen Systems werden durch hermitesche (selbstadjungierte) Operatoren auf H modelliert. Die möglichen Messwerte entsprechen den Eigenwerten dieser Operatoren.
3. Wird die Observable A in einem durch den Zustand |ψi repräsentierten System gemessen
und wird dabei der Messwert a gefunden so geht das System nach der Messung in den
Eigenzustand |ai von A zum Eigenwert a über (Zustandsreduktion).
4. Der Erwartungswert der Observable A im Zustand |ψi ist gegeben durch
hAiψ = hψ|A|ψi .
Er entspricht dem Mittelwert der Messwerte, die sich aus einer wiederholten Messung an
einem Ensemble N 1 identisch präparierter Systeme ergeben.
5. Im Schrödingerbild wird die Zeitentwicklung eines Zustandes |ψ(t)i durch die zeitabhängige Schrödingergleichung
i~
∂
|ψ(t)i = H|ψ(t)i ,
∂t
bestimmt, deren allgemeine Lösung
i
|ψ(t)i = e− ~ Ht |ψ(0)i
ist. Im Heisenbergbild wird die Zeitentwicklung einer Observablen durch die Heisenberggleichung
i~
d
AH (t) = −[H, AH (t)]
dt
bestimmt, deren allgemeine Lösung
i
i
AH (t) = e ~ Ht AH (0)e− ~ Ht
ist.
1.2
Drehimpulsaddition & allgemeine Drehimpulskopplung
Wenn in einem System zwei unabängige Drehimpulse auftreten, können diese zu einem Gesamtdrehimpuls kombiniert werden. Mögliche Beispiele sind:
18
~ und Spin S
~ zum Gesamtdrehimpuls J~ = L
~ +S
~
a) Addition von Bahndrehimpuls L
~ (1) und S
~ (2) zum Gesamtspin S
~=S
~ (1) + S
~ (2)
b) Addition von zwei Spins S
An dieser Stelle soll noch einmal erinnert werden, dass der Spin im Gegensatz zum Bahndrehimpuls eine intrinsische Eigenschaft bzw. ein intrinsischer Freiheitsgrad eines Teilchens ist der
nicht mit einer Bewegung im Raum zusammenhängt. Versucht man z.B. den Spin des Elektrons
durch eine Eigendrehung des Teilchens zu erklären so kommt man zu dem Schluss, dass die
(hypothetische) Oberfläche des Elektrons sich mit Überlichtgeschwindigkeit drehen müsste, im
Widerspruch zur Relativitätstheorie.
Die Addition von Drehimpulsen ist ein Spezialfall der Kombination von quantenmechanischen
Systemen. Für die mathematische Beschreibung solch einer Kombination benötigt man das Tensorprodukt, das wir im Folgenden kurz diskutieren.
1.2.1
Kombination von Systemen, Tensorprodukt
Möchte man zwei Systeme kombiniert beschreiben, wobei die Zustände der jeweiligen Systeme Elemente der Hilberräume H (1) und H (2) sind, so ist der geeignete Hilbertraum für das
kombinierte System das Tensorprodukt
H = H (1) ⊗ H (2) .
Um die Eigenschaften dieses Produkts zu beschreiben, betrachten wir beliebige Vektoren |vi
(1)
|wi
∈H
(1) ,
(2)
|vi
(2)
, |wi
∈H
(2)
(1)
,
und beliebige komplexe Zahlen a, b ∈ C.
• Das Tensorprodukt ist linear in beiden Faktoren.
a|vi(1) + b|wi(1) ⊗ |vi(2) = a |vi(1) ⊗ |vi(2) + b |wi(1) ⊗ |vi(2)
|vi(1) ⊗ a|vi(2) + b|wi(2) = a |vi(1) ⊗ |vi(2) + b |vi(1) ⊗ |wi(2)
Das heißt insbesondere, dass die Klammern auf der rechten Seite weggelassen werden
können.
• Das Tensorprodukt ist verträglich mit dem Skalarprodukt
(1)
|vi(1) ⊗ |vi(2) , |wi(1) ⊗ |wi(2) =
hv|wi(1)
|
{z }
|
{z
}
Skalarprodukt in H (1)
Skalarprodukt in H = H (1) ⊗ H (2)
Daraus folgt inbesondere: Ist |ni
|ni
(1)
⊗ |mi
(2)
(1)
×
(2)
|
hv|wi(2)
{z }
.
Skalarprodukt in H (2)
(2)
eine ONB von H (1) und |mi
eine ONB von H (2) , so ist
eine ONB von H = H (1) ⊗ H (2) .
Beispiele von Tensorprodukten sind:
19
• Die Zustände eines Spin- 12 Teilchens unter Vernachlässigung der räumlichen Dynamik sind
Elemente von C2 . Will man die Spins zweier solcher (unterscheidbarer) Teilchen als kombiniertes System beschreiben, so sind die Zustände dieses Systems Elemente von
C2 ⊗ C2 = C4 .
= (a1 , b1 ) und |vi(2) = (a2 , b2 ) das Tensorprodukt definiert


a1 a2
!
 a1 b2 
a1 |vi(2)

|vi(1) ⊗ |vi(2) =
=
(2)
 b1 a2  .
b1 |vi
b1 b2
Dabei ist für zwei Vektoren |vi
als7
(1)
• Allgemein gilt
Cm ⊗ Cn = Cmn .
• Die Dynamik eines Elektrons in drei Raumdimensionen unter Vernachlässigung des Spins
wird beschrieben durch Zustände in L2 (R3 ). Will man Spin und räumliche Dynamik gleichzeitig beschreiben, betrachtet man das Tensorprodukt
L2 (R3 ) ⊗ C2 = L2 (R3 → C2 )
also den Raum der Funktionen von R3 nach C2 die quadratintegrabel sind, d.h. für Ψ ∈
L2 (R3 → C2 )
ψ1 (~x)
,
Ψ(~x) =
ψ2 (~x)
kΨk2 =
Z
d3 x |ψ1 (~x)|2 + |ψ2 (~x)|2 < ∞ .
R3
Dabei gilt für ψ(~
x) ∈ L2 (R3 ) und (a, b) ∈ C2
aψ(~x)
a
.
=
ψ(~x) ⊗
bψ(~x)
b
• Will man die räumliche Dynamik von n (unterscheidbaren) Teilchen im dreidimensionalen
Raum beschreiben, so ist der entsprechende Hilbertraum
L2 (R3 ) ⊗ · · · ⊗ L2 (R3 ) = L2 (R3n ) .
|
{z
}
n mal
Dabei ist
(ψ1 ⊗ · · · ⊗ ψn ) (~x1 , . . . , ~xn ) = ψ1 (~x1 )ψ2 (~x2 ) . . . ψn (~xn ) .
Das Tensorprodukt von Zuständen entspricht also in diesem Fall dem Produkt von Wellenfunktionen.
7
Dies ist nur eine mögliche Definition, alle anderen sind jedoch (unitär) äquivalent.
20
In der Literatur und im Folgenden wird das Tensorprodukt von Vektoren oft vereinfacht so geschrieben, dass das Symbol ⊗ weggelassen wird, d.h.
|vi(1) |vi(2)
|vi(1) ⊗ |vi(2) .
entspricht
Um Observable des durch H = H (1) ⊗ H (2) beschriebenen Systems zu modellieren benötigen wir das Tensorprodukt von Operatoren. Sind A(1) , A(2) lineare Operatoren auf H (1) , H (2)
so ist A(1) ⊗ A(2) ein linearer Operator auf H (1) ⊗ H (2) . Dieser wirkt auf Tensorprodukte von
Vektoren als
A(1) ⊗ A(2)
|vi(1) ⊗ |vi(2) = A(1) |vi(1) ⊗ A(2) |vi(2) .
Daraus folgt für das Operatorprodukt
A(1) ⊗ A(2)
B (1) ⊗ B (2) = A(1) B (1) ⊗ A(2) B (2) .
Beispiel: sind A(1) und A(2) jeweils Matrizen auf C4 , so ist A(1) ⊗ A(2) die folgende Matrix auf
C4 :
A
A(1) ⊗ A(2)
(1)
a1 b1
=
,
c1 d1
(2)
A
=
a2 b2
c2 d2
,


a1 a2 a1 b2 b1 a2 b1 b2
 a1 c2 a1 d2 b1 c2 b1 d2 
a1 A(2) b1 A(2)


=
=
 c1 a2 c1 b2 d1 a2 d1 b2 
c1 A(2) d1 A(2)
c1 c2 c1 d2 d1 c2 d1 d2
Sind A(1) , A(2) hermitesch bzw. selbstadjungiert, so gilt das auch für A(1) ⊗ A(2) . Das Tensorprodukt von zwei Observablen ist also wieder eine Observable.
Betrachtet man das Tensorprodukt eines Operators mit dem Einheitsoperator auf dem jeweils
anderen Hilbertraum, wird dieses oft nicht explizit ausgeschrieben, so dass der ursprüngliche
Operator in kanonischer Weise als Operator auf dem Tensor-Hilbertraum aufgefasst wird:
A(1) als Operator auf H (1) ⊗ H (2)
entspricht
A(1) ⊗ 1(2) ,
A(2) als Operator auf H (1) ⊗ H (2)
entspricht
1(1) ⊗ A(2) .
Sind die zwei kombinierten Teilsysteme nicht in Wechselwirkung miteinander, so setzt sich der
Hamiltonoperator H wie folgt aus den Hamiltonoperatoren H (1) , H (2) der Einzelsysteme zusammen:
H = H (1) ⊗ 1(2) + 1(1) ⊗ H (2) ,
bzw., in vereinfachter Schreibweise,
H = H (1) + H (2) .
Das drückt die physikalische Tatsache aus, dass die Gesamtenergie zweier Systeme beim Fehlen
einer Wechselwirkung gerade die Summe der einzelnen Energien ist.
21
Die Aussage “A(1) und A(2) wirken auf unterschiedliche Objekte, darum gilt automatisch
[A(1) , A(2) ] = 0.” folgt in expliziter Schreibweise aus
A(1) ⊗ 1(2)
1(1) ⊗ A(2) − 1(1) ⊗ A(2)
A(1) ⊗ 1(2) = A(1) ⊗ A(2) − A(1) ⊗ A(2) = 0 .
Das motiviert die vereinfachte Schreibweise:
A(1) A(2) = A(2) A(1)
A(1) ⊗ A(2) .
entspricht
Wir werden im Folgenden meistens die vorgestellten vereinfachten Schreibweisen verwenden um im Einklang mit dem Großteil der Literatur zu sein und um Formeln übersichtlicher zu
gestalten. Die vereinfacht geschriebenen Formeln lassen sich immer eindeutig interpretieren,
wenn man im Hinterkopf behält, welcher Operator auf welchen Tensorfaktor des Hilbertraums
wirkt.
1.2.2
Drehimpulsaddition: allgemeiner Fall
Wir betrachten nun die Addition zweier allgemeiner Drehimpulse J~ (1) , J~ (2) deren Komponenten
jeweils hermitesche Operatoren auf den Hilberträumen H (1) , H (2) – und damit auch auf dem
Tensorprodukt H (1) ⊗ H (2) – sind. Diese Komponenten erfüllen die Kommutatorrelationen
h
(1)
(1)
Ji , Jj
i
= i~
X
(1)
ijk Jk ,
h
(2)
(2)
Ji , Jj
i
= i~
k
X
(2)
ijk Jk ,
h
i
(1)
(2)
Ji , Jj
= 0.
k
Wir betrachten Darstellungen der zwei Drehimpulse zu jeweils festen Drehimpulsquantenzahlen
j1 und j2 . D.h.
H (1) = Hj1 = C2j1 +1 ,
H (2) = Hj2 = C2j2 +1 ,
wobei ONBs der zwei Hilberträume gegeben sind durch |j1 , m1 i für m1 ∈ {−j1 , −j1 + 1, . . . , j1 }
und |j2 , m2 i für m2 ∈ {−j2 , −j2 + 1, . . . , j2 } mit
J~ (1)
2
|j1 , m1 i = ~2 j1 (j1 + 1)|j1 , m1 i ,
J3 |j1 , m1 i = ~m1 |j1 , m1 i ,
J~ (2)
2
|j2 , m2 i = ~2 j2 (j2 + 1)|j2 , m2 i ,
J3 |j2 , m2 i = ~m2 |j2 , m2 i .
(1)
(2)
Wir betrachten nun den Gesamtdrehimpulsoperator
J~ = J~ (1) + J~ (2)
auf dem Hilbertraum
Hj1 &j2 = Hj1 ⊗ Hj2 = C(2j1 +1)(2j2 +1) .
Wir wissen bereits, dass eine ONB dieses Hilbertraums gegeben ist durch
|j1 , m1 ; j2 , m2 i = |j1 , m1 i|j2 , m2 i .
22
Man überprüft leicht, dass die Komponenten des Gesamtdrehimpulsoperators ebenfalls hermitesch sind und die Drehimpulsalgebra erfüllen
[Ji , Jj ] = i~
X
ijk Jk .
k
Das impliziert, dass es eine ONB |j, m; j1 , j2 i von Hj1 &j2 geben muss mit
J~ 2 |j, m; j1 , j2 i = ~2 j(j + 1)|j, m; j1 , j2 i ,
J3 |j, m; j1 , j2 i = ~m|j, m; j1 , j2 i .
Dabei wissen wir schon, dass m die Werte m ∈ {−j, −j + 1, . . . , j} annehmen kann, wir wissen
allerdings noch nicht, welche Werte für j möglich sind. Der Grund, warum wir die ONB zusätzlich
zur Indizierung mit den Quantenzahlen j und m auch noch mit den Quantenzahlen j1 und j2
indizieren, wird gleich deutlich werden.
Im Folgenden möchten wir nun zwei Fragen beantworten:
a) Welche Werte für j sind möglich?
b) Wie hängen die ONB |j1 , m1 ; j2 , m2 i und |j, m; j1 , j2 i miteinander zusammen?
Zur Beantwortung dieser Fragen stellen wir zunächst fest, dass
2 2 2 2 (2)
(1)
(2)
(1)
2
2
~
~
~
~
~
~
= 0,
= J3 , J
= J3 , J
= J , J
J , J
wie sich leicht überprüfen lässt. Die Vektoren |j, m; j1 , j2 i sind also auch Eigenvektoren von
J~ (1)
2
und J~ (2)
2
, bzw. diagonalisieren auch diese Operatoren; daher wurden für die Indizie-
rung von |j, m; j1 , j2 i auch die Quantenzahlen j1 , j2 verwendet. Allerdings verifiziert man
h
i h
i
h
i
(1)
(2)
(2)
J~ 2 , J3
= J~ 2 , J3 − J3
= − J~ 2 , J3
6= 0 .
(1)
Die Vektoren |j, m; j1 , j2 i sind also im Allgemeinen keine Eigenvektoren von J3
Umgekehrt gilt allerdings
(1)
(2)
J3 |j1 , m1 ; j2 , m2 i = J3 + J3
|j1 , m1 ; j2 , m2 i = ~(m1 + m2 )|j1 , m1 ; j2 , m2 i .
Daraus folgt:
1.
m = m1 + m2 .
m kann also die Werte
m ∈ {−(j1 + j2 ), −(j1 + j2 ) + 1, . . . , j1 + j2 }
annehmen.
23
(2)
und J3 .
2. Das größtmögliche j ist
jmax = mmax = j1 + j2 .
3. Mit ein bisschen mehr Aufwand kann man zeigen, dass das kleinstmögliche j
jmin = |m2,max + m1,min | = |m2,min + m1,max | = |j2 − j1 |
ist und das j alle Werte
j ∈ {|j2 − j1 |, |j2 − j1 | + 1, . . . , j1 + j2 }
annehmen kann. Man kann sich jmin und jmax als die Länge der Vektoren
~jmin = j2~ez − j1~ez ,
~jmax = j2~ez + j1~ez ,
veranschaulichen. Allerdings ist diese klassische Analogie nur begrenzt hilfreich, weil es
sich bei der quantenmechanischen Drehimpulsaddition gewissermaßen um eine “quantisierte Vektoraddition” handelt.
4. Mathematisch bedeutet die vorige Aussage, dass der Hilbertraum Hj1 &j2 = Hj1 ⊗ Hj2 in
eine direkte orthogonale Summe zerfällt.
Hj1 &j2
=
Hj1 ⊗ Hj2
jM
1 +j2
=
Hj
C(2j1 +1)(2j2 +1)
=
C2j1 +1
⊗
=
=
=
j=|j2 −j1 |
C2j2 +1
jM
1 +j2
=
C2j+1
j=|j2 −j1 |
Das bedeutet, dass Hj1 ⊗ Hj2 ein kartesisches Produkt der Hj ist und dass die UnterHilberträume Hj für unterschiedliche j paarweise orthogonal in Hj1 ⊗ Hj2 liegen. Ein
Vektor v ∈ Hj1 ⊗ Hj2 kann also durch eine unitäre Transformation – d.h. eine Basistransformation – auf die Form


v|j2 −j1 |
v|j −j |+1 
 2 1 
v=
,
..


.
vj1 +j2
vj ∈ Hj
gebracht werden. Als Kontrolle dieser Tatsache können wir die Dimensionsverhältnisse
überprüfen. Dazu nehmen wir ohne Beschränkung der Allgemeinheit an, dass j2 ≥ j1 .
jX
1 +j2
j=|j2 −j1 |
2j + 1 = [2(j2 − j1 ) + 1] + [2(j2 − j1 + 1) + 1] + · · · + [2(j2 + j1 ) + 1]
{z
}
|
2j1 +1 Summanden
= (2j1 + 1)(2j2 + 1) + 2[(−j1 ) + · · · + (j1 )]
|
{z
}
=0
24
Nachdem wir die Frage nach den möglichen j beantwortet haben, widmen wir uns der Relation zwischen den ONB |j, m; j1 , j2 i und |j1 , m1 ; j2 , m2 i. Da es sich um ONB handelt, muss es
eine unitäre Transformation – d.h. eine Matrix A auf C(2j1 +1)(2j2 +1) mit A† = A−1 – geben, die die
letztere Basis auf die erstere abbildet. Wegen
j1
X
|j, m; j1 , j2 i = 1|j, m; j1 , j2 i =
j2
X
|j1 , m1 ; j2 , m2 ihj1 , m1 ; j2 , m2 |j, m; j1 , j2 i
m1 =−j1 m2 =−j2
=
j1
X
j2
X
hj1 , m1 ; j2 , m2 |j, m; j1 , j2 i|j1 , m1 ; j2 , m2 i
m1 =−j1 m2 =−j2
sind die Matrixelemente dieser Matrix gerade die Clebsch-Gordon-Koeﬃzienten
hj1 , m1 ; j2 , m2 |j, m; j1 , j2 i .
Wir wissen bereits, dass m = m1 + m2 . Daraus folgt:
1.
hj1 , m1 ; j2 , m2 |j, m; j1 , j2 i ∝ δm1 +m2 ,m .
2. Für die maximalen bzw. minimalen Werte m1 = j1 , m2 = j2 und m1 = −j1 , m2 = −j2 , muss
|j1 , m1 ; j2 , m2 i gerade der Vektor zum maximalen j und maximalen m sein, also (bis auf
eine irrelevante Phase)
|j1 , m1 = ±j1 ; j2 , m2 = ±j2 i = |j = j1 + j2 , m = ±(j1 + j2 ); j1 , j2 i
⇒
hj1 , m1 = ±j1 ; j2 , m2 = ±j2 |j = j1 + j2 , m = ±(j1 + j2 ); j1 , j2 i = 1 .
Die vollständigen Clebsch-Gordon-Koeﬃzienten lassen sich unter Zuhilfenahme der Leiteroperatoren aus diesen Beziehungen ausrechnen.
1.2.3
Allgemeine Drehimpulskopplung
Mathematisch sind die ONB |j, m; j1 , j2 i und |j1 , m1 ; j2 , m2 i äquivalent. Physikalisch hängt es von
der jeweiligen Situation ab, welche Basis besser zur Beschreibung des quantenmechanischen
Systems geeignet ist. Der Hamiltonoperator H , der die Dynamik der zwei Drehimpulse in einem
~ beschreibt enthält im Allgemeinen die Terme
externen Magnetfeld B
~,
H1 = c1 J~ (1) · B
~,
H2 = c2 J~ (2) · B
H3 = c3 J~ (1) · J~ (2) .
mit geeigneten dimensionsbehafteten Konstanten c1 , c2 , c3 ; d.h.
H = H0 + H1 + H2 + H3
25
mit einem Beitrag H0 für den hier nur wichtig ist, dass
[H0 , Hi ] = 0
für
i ∈ {1, 2, 3} .
Die Terme H1 , H2 , H3 entsprechen jeweils der individuellen Kopplung der zwei Drehimpulse an
das Magnetfeld sowie der Kopplung der Drehimpulse untereinander. Diese Kopplungen entstehen dadurch, dass den Drehimpulsen, unter der Annahme, dass es sich um Drehimpulse geladener Teilchen handelt, magnetische Momente entsprechen. Es sind nun zwei physikalische
Situationen möglich.
1. Schwaches Magnetfeld. In diesem Fall dominiert H3 über H1 und H2 . Wegen
1
J~ (1) · J~ (2) =
2
2 2 J~ 2 − J~ (1) − J~ (2)
sind die Zustände |j, m; j1 , j2 i – im Gegensatz zu den Zuständen |j1 , m1 ; j2 , m2 i – Eigenzustände von H3 und daher besser geeignet zur Beschreibung des Systems. Zur Behandlung
der Terme H1 und H2 , die in der Basis |j, m; j1 , j2 i nicht diagonal sind, können folgende
Approximationsmethoden verwendet werden:
a) Die Terme H1 und H2 können störungstheoretisch behandelt werden. Diese Methode
werden wir im Laufe der Vorlesung allgemein diskutieren.
b) Physikalisch erwartet man, dass die Drehimpulse J~ (1) , J~ (2) um den Gesamtdrehimpuls
J~, bzw. dessen magnetisches Moment, präzedieren (siehe Aufgabe 2.2). Man kann daher approximativ die Drehimpulse J~ (1) , J~ (2) durch ihre Zeitmittel, also die Projektionen
auf die J~-Achse ersetzen.
(1)
J~ (1) ≈ J~Zeitmittel
(2)
J~ (2) ≈ J~Zeitmittel
2 2
~ 2 + J~ (1) − J~ (2)
J
(1)
~
~
J ·J ~
=
J=
J~
J~ 2
2J~ 2
2 2
2+ J
(2)
(1)
~
~
~
J
−
J
(2)
J~ · J~ ~
=
J=
J~
J~ 2
2J~ 2
Ersetzt man H1 und H2 entsprechend durch ihre jeweiligen Zeitmittel, so erhält man
Operatoren die in der Basis |j, m; j1 , j2 i ebenfalls diagonal sind.
In beiden Fällen ist der Gesamtdrehimpuls, nicht aber die einzelnen Drehimpulse, approximativ eine Erhaltungsgrösse des Systems, da
[H, Ji ] ≈ 0
für
i ∈ {1, 2, 3} .
~ , J~ (2) = S
~ Bahndrehimpuls und Spin eines Elektrons in einem Atom
Im Fall dass J~ (1) = L
~ induzierte
sind, entspricht H3 der Spin-Bahn-Kopplung und die via H1 und H2 durch B
Aufspaltung der Energieniveaus – und damit der Spektrallinien – wird Zeemann-Eﬀekt genannt.
26
2. Starkes Magnetfeld. In diesem Fall dominieren H1 und H2 über H3 . Die Kopplung zwischen J~ (1) und J~ (2) wird aufgelöst und der Gesamtdrehimpuls J~ ist keine Erhaltungsgröße,
während das für J~ (1) und J~ (2) approximativ der Fall ist. Die Zustände |j1 , m1 ; j2 , m2 i sind
gut geeignet für die Beschreibung des Systems und approximative Eigenzustände von H .
Der Term H3 kann störungstheoretisch behandelt werden.
~ , J~ (2) = S
~ Bahndrehimpuls und Spin eines Elektrons in einem Atom
Im Fall, dass J~ (1) = L
~ induzierte Aufspaltung der Energieniveaus Paschensind, wird die via H1 und H2 durch B
Back-Eﬀekt genannt. Das Muster der Spektrallinien ist im Allgemeinen deutlich anders als
beim Zeemann-Eﬀekt, typischerweise gibt es deutlich weniger Spektrallinien.
1.2.4
Drehimpulsaddition: Spin 1/2 und Spin 1/2
Wir wollen nun die Drehimpulsaddition am Beispiel zweier 21 -Spins im Detail betrachten. Die
~ (1) und J~(2) = S
~ (2) werden zum Gesamtspin
einzelnen Spins J~(1) = S
~=S
~ (1) + S
~ (2)
J~ = S
(1)
kombiniert. Die Komponenten Si
ratoren auf
(2)
und Sj
der individuellen Spinoperatoren sind jeweils Ope-
H (1) = H 1 = C2 ,
H (2) = H 1 = C2
2
2
und damit – wie auch die Komponenten Si des Gesamtspins – Operatoren auf dem Tensorprodukt
H (1) ⊗ H (2) = C2 ⊗ C2 = C4 .
Die Eigenzustände
(1)
|s1 , m1 i ,
s1 =
1
2
, m1 = ± 12
von
~ (1) )2 , S ,
(S
3
|s2 , m2 i ,
s2 =
1
2
, m2 = ± 21
von
~ (2) )2 , S
(S
3
(2)
bilden jeweils ONB von H (1) und H (2) . Für die ONB
|s1 , m1 ; s2 , m2 i = |s1 , m1 i|s2 , m2 i
von H (1) ⊗ H (2) verwenden wir im Folgenden die vereinfachte Notation
|↑↑i = 21 , 21 ; 21 , 12 ,
|↓↑i = 12 , − 21 ; 21 , 12 ,
|↑↓i = 12 , 12 ; 12 , − 12 ,
|↓↓i = 12 , − 12 ; 12 , − 21 .
Für die ONB von H (1) ⊗ H (2) aus den Eigenzuständen
|s, m; s1 , s2 i
von
~ 2 , S3
S
verwenden wir die vereinfachte Notation
|s, m; s1 , s2 i = |s, mi .
27
Aus den allgemeinen Überlegungen zur Drehimpulsaddition folgt, dass für die maximal und minimal möglichen Werte für s
smin = |s2 − s1 | = 0
smax = s2 + s1 = 1 ,
gilt. Da die möglichen Werte von s sich nur um eine ganze Zahl unterscheiden können impliziert
das bereits
s ∈ {0, 1} .
Entsprechend gilt
2
= H1 ⊗ H1
2
C4
2
= H1 + H0
=
=
2
=
H1&1
=
C2 ⊗ C2
=
C3 ⊕ C
und die ONB |s, mi besteht aus den Vektoren
|1, 1i ,
|1, 0i ,
|1, −1i ,
|0, 0i .
Aus den allgemeinen Überlegungen zur Drehimpulsaddition folgt ebenfalls direkt, dass
|1, 1i = |↑↑i ,
|1, −1i = |↓↓i .
Die übrigen zwei Vektoren |1, 0i und |0, 0i müssen wegen m = m1 + m2 also eine Linearkombination aus |↑↓i und |↓↑i sein. Um diese genau zu bestimmen, berechnen wir
2
2 ~ (2) + 2 S (1) S (2) + S (1) S (2) + S (1) S (2)
~ (1) + S
~2 = S
S
1
1
2
2
3
3
2 2
~ (1) + S
~ (2) + S (1) S (2) + S (1) S (2) + 2S (1) S (2)
= S
+
−
−
+
3
3
und damit
~ 2 |↑↓i = ~2 1 (1 + 1 + 0 + 0 + 2) |↑↓i = ~2 |↑↓i ,
S
4
~ 2 |↓↑i = ~2 1 (1 + 1 + 0 + 0 + 2) |↓↑i = ~2 |↓↑i .
S
4
Daraus folgt
~ 2 (|↑↓i + |↓↑i) = 2~2 (|↑↓i + |↓↑i) ,
S
~ 2 (|↑↓i − |↓↑i) = 0
S
und damit
|1, 0i =
√1
2
(|↑↓i + |↓↑i) ,
|0, 0i =
√1
2
(|↑↓i − |↓↑i) .
Abschließend stellen wir fest, dass die Zustände zum Spin s = 1 symmetrisch unter Vertauschung der Spins sind, während der Zustand zum Spin s = 0 antisymmetrisch unter dieser
Vertauschung ist. Dieser Sachverhalt wird bei der Diskussion des Heliumatoms eine wichtige
Rolle spielen.
28
1.2.5
Drehimpulsaddition: Bahndrehimpuls und Spin 1/2
~ , J~ (2) = S
~ Bahndrehimpuls
Als zweites wichtiges Beispiel besprechen wir den Fall, dass J~ (1) = L
und Spin eines Elektrons in einem Atom sind. Die Drehimpulsquantenzahlen sind also
j 1 = l ∈ N0 ,
j2 = s =
1
2
.
Wir betrachten zunächst den Fall l = 0. In diesem Fall gibt es nur eine Möglichkeit für j , und zwar
j = s = 12 . Es gilt also
1 , ± 1 ; 0, 1 = 0, 0; 1 , ± 1 .
2
2
2
2
2
Für l ≥ 1 gilt j = l ± 21 . Wie gehabt gilt zunächst
l + 1 , ± l + 1 ; l, 1 = l, ±l; 1 , ± 1 .
2
2
2
2
2
Für die anderen Zustände ergibt eine einfache aber unübersichtliche Rechnung mit Leiteroperatoren
s
l ± 1 , mj ; l, 1 =
2
2
l + 12 ∓ mj l, mj + 21 ; 12 , − 12 ±
2l + 1
s
l + 12 ± mj l, mj − 21 ; 21 , 12 .
2l + 1
Diese Formel ist auch für die Extremfälle j = jmax = l + 12 , mj = ±jmax gültig.
1.3
Teilchen im elektromagnetischen Feld
In der ersten Vorlesung zur Quantenmechanik wurde der Einfluss eines elektrischen Feldes auf
ein quantenmechanisches System am Beispiel des Wasserstoﬀatoms diskutiert. Es gibt jedoch
wichtige Phänomene die mit dem Einfluss magnetischer Felder zusammenhängen wie z.B.:
a) Paramagnetismus, die Induktion eines gleichgerichteten Magnetfeldes durch ein äußeres Magnetfeld,
b) Diamagnetismus, die Induktion eines entgegengesetzt ausgerichteten Magnetfeldes durch
ein äußeres Magnetfeld,
c) der Zeemann-Eﬀekt und der Paschen-Back-Eﬀekt, die Aufspaltung der Energieniveaus des
Elektrons im Wasserstoﬀatom in einem Magnetfeld.
1.3.1
Hamiltonoperator
Um diese Eﬀekte in der Quantenmechanik zu beschreiben müssen wir den entsprechenden Ha~ , Q)
~ konstruieren. Wie zuvor wollen wir diesen durch das Korrespondenzprinmiltonoperator H(P
zip aus der klassischen Hamiltonfunktion H(~
p, ~q) erhalten. Um diese zu motivieren, erinnern wir
29
~ und das Magnetfeld B
~ durch das skalare
uns, dass in der Elektrodynamik das elektrische Feld E
~
Potential φ und Vektorpotential A ausgedrückt werden können:
~
~ = − ∂ A − ∇φ
~ ,
E
∂t
~ =∇
~ ×A
~,
B
wobei wir im Folgenden immer von der Coulomb-Eichung
~ ·A
~=0
∇
~ als divergenzfrei annehmen. Die klassiche Bewegung eines Teilchens
ausgehen wollen, d.h. A
der Masse m und Ladung q unter dem Einfluss dieser Felder wird durch die Newton’sche Bewe~L als Quellterm auftaucht
gungsgleichung bestimmt, in denen die Lorentzkraft F
~
¨ = F~L = q E
~ + ~x˙ × B
~ = q − ∂ A − ∇φ
~ ×A
~
~ + ~x˙ × ∇
m~x
∂t


X
~
∂A ~
~ j − ~x˙ · ∇
~ A
~ .
= q −
− ∇φ +
ẋj ∇A
∂t
!
j
Diese Gleichungen lassen sich aus der klassischen Hamiltonfunktion
2
~
p~ − q A
h(~
p, ~q) =
2m
+ qφ
herleiten. Tatsächlich lauten die Hamilton’schen Bewegungsgleichungen
q̇i = ẋi =
∂h
,
∂pi
ṗi = −
∂h
∂h
=−
,
∂qi
∂xi
woraus folgt
ẋi =
ṗi = −
∂h
pi − qAi
=
∂pi
m
⇒
∂Aj
∂h
q X
∂φ
=
−
(pj − qAj )
∂xi
m
∂xi
∂xi
j
~
p~ − q A
~x˙ =
,
m
X
~ j − q ∇φ
~ .
⇒
p~˙ = q
ẋj ∇A
j
Ableitung der ersten Gleichung nach der Zeit und einsetzen der zweiten in das Ergebnis liefert
~ x(t), t) = ∂ A(~
~ x(t), t) + (~x˙ · ∇)
~ A
~ !).
~˙ x(t), t) = d A(~
das gewünschte Resultat (Vorsicht: A(~
dt
∂t
Daher machen wir folgenden Ansatz für den Hamiltonoperator eines Teilchens in einem elektromagnetischen Feld
H=
~
P~ − q A
2m
2
+ qφ =
~ − qA
~ · P~ + q 2 A
~2
P~ 2 − q P~ · A
+ qφ .
2m
30
Wir betrachten nun den Spezialfall eines homogenen Magnetfeldes. In diesem Fall ist ein mögliches divergenzfreies Vektorpotential
~
~ = − ~x × B .
A
2
Einsetzen in den Hamiltonoperator ergibt
H=
~ 2
P~ 2
q ~ ~ q 2 (~x × B)
L·B+
−
+ qφ ,
2m 2m
2m
wobei
~ =Q
~ × P~ = ~x × ~ ∇
~
L
i
der Bahndrehimpulsoperator ist und wir ausgenutzt haben dass
~ ·A
~=0
∇
~=A
~ · P~ .
P~ · A
⇒
Der Term
HB,L = −
q ~ ~
L·B
2m
~ entspricht der potentiellen Energie eines magnetischen Momentes
linear in B
~L = q L
~
M
2m
~ und ist verantwortlich für den Paramagnetismus von Atomen. Der Term
in einem Magnetfeld B
~ entspricht ebenfalls einem induzierten, allerdings entgegengerichteten maquadratisch in B
gnetischen Moment und kann daher für diagmagnetische Eﬀekte verantwortlich sein. Für nicht
zu starke Magnetfelder kann dieser Term vernachlässigt werden.
Der bisher diskutierte Hamiltonoperator – ein Operator auf dem Hilbertraum H = L2 (R3 )
– beschreibt nur die räumliche Dynamik des Teilchens, z.B. eines Elektrons, im elektromagnetischen Feld. Um gleichzeitig die Spindynamik zu beschreiben machen wir den Ansatz, dass
der entsprechende Beitrag zum Hamiltonoperator – der nun ein Operator auf dem Hilbertraum
H = L2 (R3 ) ⊗ C2 ist – von der Form
HB,S = −
gs q ~ ~
S·B
2m
(Pauli-Term)
~ das magnetische Moment
ist, d.h. wir ordnen dem Spin S
~ S = gs q S
~
M
2m
zu. Hierbei ist gs der Landé-Faktor. Während für den Bahndrehimpuls aus der klassischen Theorie der Landé-Faktor gl = 1 vorhergesagt werden kann, ist das für den Spin nicht möglich, da
dieser kein klassischer Eﬀekt ist. Aus der relativistischen Quantenmechanik, wie auch aus Experimenten lässt sich für das Elektron der Wert gs = 2 ableiten. Tatsächlich liefert eine verfeinerte
theoretische und experimentelle Analyse den Wert
gs ' 2.00231930436182(52)
31
der sich in der Quantenelektrodynamik ergibt. Im Folgenden rechnen wir der Einfachheit halber
mit gs = 2 und bemerken, dass die Tatsache dass gs 6= 1 ein weiterer Beleg dafür ist, dass der
Spin eine intrinsische Eigenschaft ist die nicht mit einer räumlichen Bewegung zusammenhängt.
Insgesamt erhalten wir für ein nicht zu starkes Magnetfeld den folgenden Beitrag zum Ha~
miltonoperator eines Elektrons im homogenen Magnetfeld B
HB = HB,L + HB,S = −
q ~
~ ·B
~.
L + 2S
2m
Wie schon in der Diskussion der allgemeinen Drehimpulskopplung vorweggenommen, sehen
wir, dass es nicht der Gesamtdrehimpuls
~ +S
~
J~ = L
~ und S
~ separat an B
~ koppeln.
ist, der an das Magnetfeld koppelt, sondern dass im Allgemeinen L
1.3.2
Normaler Zeemann-Eﬀekt
Wir möchten im Folgenden den normalen Zeemann-Eﬀekt diskutieren, wobei wir im Widerspruch
zu Theorie und Experiment den Spin vernachlässigen um die Berechnung einfacher zu gestalten.
Der realistische Fall – der anomale Zeemann-Eﬀekt – soll später behandelt werden.
Wir betrachten den Hamiltonoperator
H = H0 +
e0 ~ ~
L·B
2m
(q = −e0 )
auf H = L2 (R3 ), wobei
H0 =
P~ 2
γ
−
,
2m |~x|
γ=
e20
4π0
der Hamiltonoperator des Wasserstoﬀatoms (unter Vernachlässigung von z.B. Spin und bei abgeschaltetem Magnetfeld) ist. Wenn wir annehmen, dass das Magnetfeld homogen ist, können wir
~ legen, so dass B
~ = (0, 0, B)
ohne Beschränkung der Allgemeinheit die z -Achse in Richtung von B
und damit
H = H0 +
e0 B
Lz .
2m
Die Eigenwerte und Eigenfunktionen von H0 sind aus der ersten Quantenmechanikvorlesung
bekannt. Es gilt
H0 |n, l, ml i = En,0 |n, l, ml i ,
En,0 = −
R
,
n2
n ∈ N,
R=
wobei R die Rydbergkonstante ist.
32
l ∈ {0, 1, . . . , n − 1} ,
me40
,
2(4π0 )2 ~2
Die Zustände |n, l, mi sind gleichzeitig Eigenzustände zum Quadrat des Bahndrehimpulses
2
~
L sowie zu Lz mit den bekannten Eigenwerten ~2 l(l + 1) und ~ml . Es gilt daher ml ∈ {−l, . . . , l}
und die Zustände |n, l, ml i sind ebenfalls Eigenzustände des vollen Hamiltonoperators H . Tatsächlich gilt
H|n, l, ml i = En,ml |n, l, ml i ,
En,ml = En,0 +
~e0 B
ml .
2m
Pn−1
2
Im Fall B = 0 sind die Energieeigenwerte des Wasserstoﬀatoms
l=0 (2l + 1) = n -fach
2
entartet, d.h. es gibt für jeden Eigenwert En,0 n dazugehörige Eigenzustände. Diese Entartung
wird durch die Kopplung an das Magnetfeld teilweise aufgehoben, da die Energieniveaus sich
abhängig von der magnetischen Quantenzahl ml verschieben. Entsprechend spalten sich die
Spektrallinien des Wasserstoﬀs im Magnetfeld auf. Die durch die obige Rechnung vorhergesagte Aufspaltung entspricht aber nicht der gemessenen Aufspaltung. Der Grund hierfür ist die
Vernachlässigung des Spins. Tatsächlich war die Diskrepanz zwischen den beobachtenen und
der durch den (normalen) Zeemann-Eﬀekt vorhergesagten Aufspaltung der Spektrallinien ein
Indiz für die Existenz des Spins als zusätzliche Eigenschaft bzw. zusätzlicher Freiheitsgrad eines
Elektrons.
1.3.3
Aharonov-Bohm-Eﬀekt
Ein äußerst verbüﬀender quantenmechanischer Eﬀekt in einem elektromagnetischen Feld,
der erneut die Unterschiede zwischen klassischer und Quantenphysik oﬀenbart, ist der AharonovBohm-Eﬀekt.
Dazu betrachten wir folgende Versuchsanordnung: Wir modifizieren die Versuchsanordnung
33
des Doppelspaltexperimentes für Elektronen derart, dass wir hinter die Wand mit den zwei Spalten eine dünne stromdurchflossene Spule anbringen, die parallel zu den Spalten ausgerichtet
~ 6= 0 existiert,
ist. Ziel ist es, dass innerhalb der Spule ein nichtverschwindendes Magnetfeld B
~
~
während überall außerhalb der Spule B = 0 (außerdem soll E überall verschwinden). Das ist allerdings nur exakt der Fall wenn die Spule unendlich lang ist, im Realfall gibt es also ein kleines
nichtverschwindendes Magnetfeld außerhalb der Spule. Dieses lässt sich aber experimentell gut
kontrollieren, und es lässt sich a posteriori ausschließen, dass es für den im Folgenden beschriebenen Eﬀekt verantwortlich ist. Daher können wir guten Gewissens annehmen, dass außerhalb
~ = 0 gilt. Zudem nehmen wir an, dass der Spulendurchmesser klein gegenüber dem
der Spule B
Spaltabstand ist, so dass klassische Elektronbahnen die Spule nicht berühren und quantenmechanisch die Aufenthaltswahrscheinlichkeit des Elektrons innerhalb der Spule verschwindend
gering ist.
~ und damit auch den maIndem wir den Strom durch die Spule kontrollieren, können wir B
gnetischen Fluss
Z
~ · dΣ
~
B
Φ=
Σ
kontrollieren, wobei Σ eine beliebige zweidimensionale Fäche ist, die die Spule durchschneidet. Inbesondere ist Φ, da das Magnetfeld außerhalb der Spule verschwindet, unabhängig von
der Wahl einer solchen Fläche Σ. Wir führen nun das Doppelspaltexperiment durch: Wir schießen in endlichen Zeitabständen N 1 einzelne Elektronen auf die Spaltebene und nehmen
das Interferenzmuster auf. Im Falle Φ = 0 sieht man das übliche Muster, bei einer typischen
Versuchsanordnung ist in der Mitte des Schirms das Maximum der Verteilung. Dreht man das
Magnetfeld auf, dann ändert sich das Interferenzmuster stetig. Bei qΦ = π~ sieht man die größte
Änderung und das zentrale Maximum “spaltet sich auf”, bei qΦ = 2π~ und verallgemeinert bei
qΦ = 2nπ~ mit n ∈ Z sieht man wiederum keine Änderung mehr. Klassisch erwarten wir keinen
Einfluss auf das Interferenzmuster, da das Elektron sich niemals im Bereich des nichtverschwin~ = 0 (und E
~ = 0 was wir
denden Magnetfeldes aufhält und die Lorentzkraft verschwindet wenn B
voraussetzen) ist. Wie ist es also möglich, dass das Elektron das Magnetfeld trotzdem “sieht”?
Um diesen Eﬀekt theoretisch herzuleiten erinnern wir uns an einige Tatsachen aus der Elektrodynamik. Wir betrachten eine geschlossene Kurve γ , die eine Fläche Σ umschließt, d.h. γ =
~ zu B
~
∂Σ. Nach dem Stokes’schen Satz gilt für ein Vektorpotential A
Z
γ
~ · d~γ =
A
Z
Σ
~ × A)
~ · dΣ
~ =
(∇
Z
~ · dΣ
~ =
B
Σ
Φ wenn γ die Spule umläuft8 .
0 wenn γ die Spule nicht umläuft.
Daraus können wir Zweierlei folgern:
1. Auch wenn das Vektorpotential “unphysikalisch” ist, da zwei sich um eine Eichung unter~ + ∇λ
~ 9 zum selben Magnetfeld B
~ =∇
~ ×A
~=∇
~ ×A
~0
~ und A
~0 = A
scheidende Potentiale A
8
9
Das gilt für einen Umlauf gegen den Uhrzeigersinn, andernfalls gibt es ein Vorzeichen.
~ ·A
~ = 0 erfüllen sollen
mit ∆λ = 0 wenn beide Vektorpotentiale die Coulombeichbedingung ∇
34
führen, ist das Integral des Vektorpotentials entlang einer geschlossenen Kurve physikalisch und kann den eingeschlossenen magnetischen Fluss “messen” auch wenn überall auf
der Kurve das Magnetfeld verschwindet. Das liegt natürlich daran, dass das Vektorpotential
selbst auf der Kurve nicht verschwindet. Z.B. ist
 
−y
Φ
~ x) =
x
A(~
2π(x2 + y 2 )
0
für ~
x außerhalb der Spule ein mögliches Vektorpotential eines Spulenfeldes für eine Spule
in z -Richtung mit magnetischem Fluss Φ.
2. Für zwei Punkte ~
x0 und ~x und zwei Kurven γ~x0 ,~x , γ~x0 0 ,~x die beide bei ~x0 beginnen und bei ~x
~ zu B
~
enden gilt für ein Vektorpotential A
Z
γ~x0 ,~x
~ · d~γ =
A
Z
γ~x0
~ · d~γ 0
A
wenn γ~x0 ,~x , γ~x0 0 ,~x beide ober-/unterhalb der Spule verlaufen.
x
0 ,~
D.h. diese Integrale hängen nur von ~
x und ~x0 ab. Tatsächlich kann man zeigen, dass
Z
~ ~x
∇
|{z}
~ · d~γ = A(~
~ x) .
A
γ~x0 ,~x
Gradient nach ~
x
Um das Experiment quantenmechanisch zu beschreiben suchen wir nach Lösungen der sta~
tionären Schrödingergleichung im Magnetfeld B
~
P~ − q A
HψA~ (~x) =
2
ψA~ (~x) =
2m
~~
i∇
~
− qA
2
ψA~ (~x) = EψA~ (~x) .
2m
~ indiziert um zu betonen, dass sie im AllgemeiDie Wellenfunktionen ψA~ (~
x) haben wir hier mit A
nen von der Wahl des uneindeutigen Vektorpotentials zum eindeutigen Magnetfeld abhängen.
Das Betragsquadrat |ψA~ (~
x)|2 darf allerdings nicht von der Wahl des Vektorpotentials abhängen,
weil es einer direkten physikalischen Observablen entspricht. Wir machen daher für (~
x ausserhalb der Spule und) ~
x0 beliebig den Ansatz
ψA~ (~x) = fA~ (~x)ψ0 (~x) ,
fA~ (~x) = exp
iq
~
Z
!
~ · d~γ
A
.
γ~x0 ,~x
Aus der vorigen Diskussion folgt
~~
~ ~ (~x)
∇fA~ (~x) = q Af
A
i
⇒
⇒
~~
~~
~
∇ − q A fA~ (~x)ψ0 (~x) = fA~ (~x) ∇ψ
x) ,
0 (~
i
i
HψA~ (~x) = fA~ (~x)Hψ0 (~x) .
~ =
Also löst ψA~ (~
x) die Schrödingergleichung mit A
6 0 genau dann wenn ψ0 (~x) die Schrödinger~ = 0 löst und es gilt die Eichinvarianzbedingung |ψ ~ (~x)|2 = |ψ ~ 0 (~x)|2 = |ψ0 (~x)|2 .
gleichung mit A
A
A
35
Das beim Doppelspaltexperiment gemessene Interferenzmuster entspricht dem Betragsquadrat
2
x) + ψA,↓
x)
ψA,↑
~ (~
~ (~
der Superposition aus der Wellenfunktion ψA,↑
x) die der Situation “oberer Spalt oﬀen, unterer
~ (~
Spalt geschlossen” und der Wellenfunktion ψA,↓
x) die der Situation “oberer Spalt geschlossen,
~ (~
unterer Spalt oﬀen”, entspricht.
Die Wellenfunktionen ψA,↑
x), ψA,↓
x) sollen stetig in ~x sein und für ~x weit vor der Spaltebene
~ (~
~ (~
übereinstimmen. Daraus folgt:
a) Die Integrationspfade γ↑ , γ↓ in
ψA,↑
x) = exp
~ (~
iq
~
Z
!
~ · d~γ
A
ψ0,↑ (~x) ,
γ↑
ψA,↓
x) = exp
~ (~
iq
~
Z
!
~ · d~γ
A
ψ0,↓ (~x) ,
γ↓
müssen beim gleichen Startpunkt ~
x0 beginnen; dieser kann ohne Beschränkung der Allgemeinheit als sich vor der Spaltebene befindend angenommen werden.
b) Der Pfad γ↑ muss für ~
x jenseits der Spaltebene durch den oberen Spalt führen, der Pfad γ↓
entsprechend durch den unteren.
Aus diesen beiden Aussagen folgt wiederrum, dass für ein ~
x jenseits der Spaltebene (z.B. auf
dem Schirm)
2
x) + ψA,↓
x)
ψA,↑
~ (~
~ (~
!!
Z
Z
iq
iq
~ · d~γ +
~ · d~γ
−
=|ψ0,↑ (~x)| + |ψ0,↓ (~x)| + 2<
A
A
~ γ↑
~ γ↓
!!
Z
iq
2
2
∗
~ · d~γ
=|ψ0,↑ (~x)| + |ψ0,↓ (~x)| + 2< ψ0,↑ (~x)ψ0,↓ (~x) exp
A
~ γ↓ −γ↑
iqΦ
2
2
∗
=|ψ0,↑ (~x)| + |ψ0,↓ (~x)| + 2< ψ0,↑ (~x)ψ0,↓ (~x) exp
.
~
2
2
∗
(~x)ψ0,↓ (~x) exp
ψ0,↑
Hierbei ist γ↓ − γ↑ der geschlossene Pfad, der sich ergibt wenn man γ↓ entlanggeht und dann
entlang γ↑ zurückgeht. Wir sehen also, wie die nichttriviale zusätzliche relative Phase qΦ/~ den
Interferenzterm und damit das Interferenzmuster abändert.
Zum Abschluss soll betont werden, dass man die Integrationspfade nicht als klassische Pfade
des Elektrons auﬀassen darf, da das Doppelspaltexperiment ja gerade zeigt, dass man einem
Elektron, dass auf den Schirm auftriﬀt, keinen klassischen Pfad zuweisen kann. Die Aussage,
dass “die Phase qΦ/~ der Phasenverschiebung zwischen einem Elektron, das obenherum fliegt
und einem Elektron, das untenherum fliegt, entspricht” ist also keine gute Interpretation des
Eﬀektes.
36
1.4
Zeitunabhängige Störungstheorie
Es gibt wenige physikalische Systeme die sich exakt (klassisch und) quantenmechanisch berechnen lassen. Einige davon haben wir bereits in dieser Vorlesung oder in Quantenmechanik 1
kennengelernt:
1. das freie Teilchen,
2. der harmonische Oszillator,
3. das Teilchen im Coulombpotential (Wasserstoﬀatom in der minimalen Version),
4. Systeme endlich vieler Spins,
5. . . . ,
6. und Kombinationen dieser Systeme.
Diese Modellsysteme sind in einigen Situationen gute Näherungen für ein realistisches System.
Im Allgemeinen hat man es aber mit komplizierteren Systemen zu tun, die nicht in diese Klasse
fallen, so dass man sich etwas einfallen lassen muss um zumindest einige Berechnungen durchführen zu können oder zumindest approximative Lösungen zu bekommen. Eine Methode, die
sich dabei gut bewährt hat, und die Grundlage der meisten Berechnungen in der Teilchenphysik
dargestellt, ist die Störungstheorie.
1.4.1
Allgemeine Herleitung
Um die Methode der Störungstheorie zu entwickeln betrachten wir den Hamiltonoperator
H = H0 + λH1
wobei H0 der ungestörte Hamiltonoperator ist, und wir λH1 , mit einer dimensionslosen Konstanten λ und einem Operator H1 als kleine Störung auﬀassen wollen. Es ist nicht im Allgemeinen
möglich zu sagen wann λH1 “klein” im Vergleich zu H0 ist, aber wenn λ 1 ist, dann ist das
folgende Verfahren oft gut geeignet um ausgehend von den bekannten Eigenzuständen und
Eigenwerten von H0 die Eigenzustände und Eigenwerte von H näherungsweise zu berechnen.
Wir betrachten zunächst den Fall, dass H1 zeitunabhängig ist. Der zeitabhängige Fall soll später
behandelt werden.
(0)
Dazu seien |n(0) i und En
die Eigenzustände und Eigenwerte von H0
H0 |n(0) i = En(0) |n(0) i .
37
(0)
Wir nehmen an, dass diese Eigenwerte nicht entartet sind, es gibt zu jedem En also genau
einen Eigenzustand. Wir möchten die Eigenzustände |ni und Eigenwerte En von H
H|ni = En |ni
berechnen. Dazu nehmen wir an, dass diese Größen in eine Potenzreihe entwickelt werden können.
En = En(0) + λEn(1) + λ2 En(2) + . . . ,
|ni = |n(0) i + λ|n(1) i + λ2 |n(2) i + . . . .
Wir können nun die Eigenwertgleichung
(H0 + λH1 ) |n(0) i + λ|n(1) i + . . . = En(0) + λEn(1) + . . .
|n(0) i + λ|n(1) i + . . .
nach Potenzen von λ sortieren. Da höhere Potenzen von λ nach Annahme “weniger wichtig sind”
als niedrigere Potenzen, verlangen wir, dass die obige Eigenwertgleichung zu jeder Ordnung in
λ erfüllt ist. Zur untersten Ordnung bekommen wir erwartungsgemäß
H0 |n(0) i = En(0) |n(0) i .
Die erste und zweite Ordnung geben hingegen
H0 |n(1) i + H1 |n(0) i = En(0) |n(1) i + En(1) |n(0) i
H0 |n(2) i + H1 |n(1) i = En(0) |n(2) i + En(1) |n(1) i + En(2) |n(0) i .
Wir können diese Gleichungen umschreiben als
H0 − En(0) |n(1) i = −H1 |n(0) i + En(1) |n(0) i
H0 − En(0) |n(2) i = −H1 |n(1) i + En(1) |n(1) i + En(2) |n(0) i .
Wir multiplizieren die obere Gleichung von links mit einem Eigenzustand hm(0) | und erhalten
dann
⇒
hm(0) | H0 − En(0) |n(1) i = −hm(0) |H1 |n(0) i + En(1) hm(0) |n(0) i
(0)
Em
− En(0) hm(0) |n(1) i = −hm(0) |H1 |n(0) i + En(1) δmn .
Aus dem Fall m = n können wir direkt die erste Korrektur zum Energieeigenwert ablesen
En(1) = hn(0) |H1 |n(0) i ,
nicht ganz überraschend ergibt sich diese Korrektur also als Erwartungswert der Störung im
ungestörten Zustand. Aus dem Fall m 6= n können wir dagegen |n(1) i bestimmen. Dazu erinnern
wir uns dass |n(0) i ja nach Annahme eine ONB des Hilbertraums ist. Daher können wir |n(1) i in
dieser ONB entwickeln
|n(1) i =
X
m
|m(0) i hm(0) |n(1) i =
| {z }
(1)
cm,n
38
X
m
(0)
c(1)
m,n |m i .
Aus der Gleichung zur ersten Ordnung mit m 6= n erhalten wir entsprechend
hm(0) |H1 |n(0) i
(0) (1)
c(1)
m,n = hm |n i =
(0)
für m 6= n .
(0)
En − Em
(1)
Zur eindeutigen Bestimmung von |n(1) i fehlt uns noch der Koeﬃzient cn,n , dieser ist jedoch durch
die hergeleiteten Gleichungen nicht festlegbar. Diese Unbestimmtheit entspricht der Tatsache,
dass der Zustand |ni nur bis auf einen komplexen Vorfaktor festgelegt ist, da zwei “parallele
Vektoren” in einem Hilbertraum demselben physikalischen Zustand entsprechen. Es ist nicht
zweckmässig diesen Vorfaktor z.B. durch die Bedingung festzulegen, dass |ni normiert ist. Für
Berechnungen ist es stattdessen besser, diesen Vorfaktor durch die Bedingung hn(0) |ni = 1 zu
fixieren. Das impliziert hn(0) |n(k) i = 0 für alle k ≥ 1 und damit insbesondere
(0) (1)
c(1)
n,n = hn |n i = 0 .
Damit erhalten wir
|n(1) i =
X hm(0) |H1 |n(0) i
(0)
En
m6=n
−
(0)
Em
|m(0) i .
Aus den bisherigen Überlegungen folgt für die Korrektur zur Energie in zweiter Ordnung
En(2) = hn(0) | H0 − En(0) |n(2) i + hn(0) |H1 |n(1) i + En(1) hn(0) |n(1) i
| {z }
{z
}
|
=
=0
X |hm(0) |H1 |n(0) i|2
(0)
(0)
En − Em
m6=n
=0
.
Dieses Verfahren lässt sich zu beliebig hohen Ordnungen fortsetzen. Oft geben aber die untersten ein oder zwei Ordnungen schon gute Resultate.
(0)
Wir haben zu Beginn angenommen, dass die Energien En nicht entartet sind. Ist das der
Fall, muss man ein wenig mehr rechnen. Dies ist allerdings nicht nötig wenn der Operator H1
(0)
diagonal in dem Unterraum zur Energie En
(0)
ist. D.h. seien |nk i k ∈ {1, . . . , N } die (gewähl(0)
ten10 ) Eigenvektoren der ONB aus Eigenzuständen von H0 zur Energie En . Dann können wir
die Matrixelemente
(0)
(0)
H1,k,l = hnk |H1 |nl i
(1)
definieren. Ist H1,k,l ∝ δkl , dann gilt die Formel für En unverändert, während bei den Formeln
(2)
(0)
für |n(1) i und En die Summe alle “Indizes zum selben Eigenwert En ” ausspart. Diese Diagonalitätseigenschaft von H1 wird in allen in der Vorlesung und den Übungen diskutierten Beispielen
vorhanden sein.
10
Diese sind für N > 1 nicht eindeutig, wenn man keine weitere Bedingung fordert.
39
1.4.2
Harmonischer Oszillator im Gravitationsfeld
Bevor wir Anwendungen der Störungstheorie besprechen in denen die Berechnungen (im Rahmen der nichtrelativistischen Quantenmechanik) nur störungstheoretisch möglich sind, wollen
wir die Gültigkeit dieser Methode an einem Beispiel testen, das exakt gelöst werden kann. Dazu
betrachten wir den harmonischen Oszillator im Gravitationsfeld der Erde. Der Hamiltonoperator
ist
H=
P2
mω 2 2
+
Q + mgQ
{z }
|2m {z 2
} |H
1
H0
wobei wir die Erdbeschleunigung g als “Störparameter” ansehen wollen. Im hier betrachteten
Fall spielt es keine Rolle ob g klein in einem geeigneten Sinn ist, da wir das System auch exakt
lösen können. Tatsächlich können wir H umschreiben als
H=
P2
mω 2 2
P2
mω 2 g mg 2
.
+
Q + mgQ =
+
Q+ 2 −
2m
2
2m
2
ω
2ω 2
Daraus können wir ablesen, dass der Einfluss der Schwerkraft den Punkt, um den der Oszillator
oszilliert verschiebt und zwar so, dass die Rückstellkraft und die Gravitationskraft sich an diesem
Punkt gerade ausgleichen. Da die Verschiebung des Oszillationsnullpunktes keinen Einfluss auf
die Energieeigenwerte hat, können wir sofort ablesen, dass die Eigenwerte des Oszillators im
Gravitationsfeld von der Form
En = En(0) −
mg 2
1
mg 2
=
~ω
n
+
−
2
2ω
2
2ω 2
sind. Inbesondere sehen wir, dass die exakt berechnete Änderung der Energieeigenwerte quadratisch in g ist. Wenn die störungstheoretische Rechnung sinnvoll ist, müsste sich also zur ersten Ordnung eine verschwindende Korrektur der Erwartungswerte ergeben, während zur zweiten Ordnung bereits das exakte Resultat herauskommen sollte.
Um dies zu verifizieren, erinnern wir uns and die Leiteroperatoren a, a† des harmonischen
Oszillators
1
a= √
2
1
d
Q+i P
d
~
,
1
a† = √
2
1
d
Q−i P
d
~
r
,
d=
Diese wirken wie folgt auf die normierten Eigenzustände |n(0) i von H0 :
a|n(0) i =
√
n|(n − 1)(0) i ,
a† |n(0) i =
√
n + 1|(n + 1)(0) i .
Daraus folgen direkt die Eigenwerte von H0 , weil sich dieser Operator als
1
†
H0 = ~ω a a +
2
schreiben lässt, wie man leicht verifiziert. Wegen
d Q = √ a + a†
2
40
~
.
mω
und der Orthogonalität der Zustände |n(0) i gilt
∗
hn(0) |a|n(0) i = hn(0) |a† |n(0) i = 0
⇒
hn(0) |Q|n(0) i = 0
⇒
En(1) = hn(0) |H1 |n(0) i = 0
wie erwartet. Andererseits gilt
En(2) =
X |hm(0) |H1 |n(0) i|2
(0)
m6=n
1.4.3
(0)
En − Em
=
m2 g 2 d2
2
X
|hm(0) |(a + a† )|n(0) i|2
(0)
(0)
En − Em
!
|h(n − 1)(0) |a|n(0) i|2 |h(n + 1)(0) |a† |n(0) i|2
+
~ω
−~ω
=
m2 g 2 d2
2
=
m2 g 2 d2
mg 2
(n − (n + 1)) = − 2 .
2~ω
2ω
m∈{n−1,n+1}
Feinstruktur des Wasserstoﬀatoms
Als zweite Anwendung der Störungstheorie diskutieren wir die Feinstruktur des Wasserstoﬀspektrums. Auch hierbei handelt es sich um einen Eﬀekt, der im Prinzip exakt berechnet werden
kann. Allerdings ist das nur in der relativistischen Quantenmechanik möglich, in der die Diracgleichung die räumliche und Spindynamik eines Elektrons beschreibt. Diese Gleichung soll hier
nicht vollständig und im Detail diskutiert werden. Stattdessen möchten wir nur einige Aspekte
der Diracgleichung hervorheben:
1. Der nichtrelativistischen Limes der Diracgleichung im Coulombpotential, d.h. die unterste
~ /(mc) – wobei P~ /m als “Geschwindigkeitsoperator” aufgefasst werden kann
Ordnung in P
–, ergibt die (nichtrelativistische) Schrödingergleichung im Coulombpotential. Die Diracgleichung ist also eine relativistische Verallgemeinerung der (nichtrelativistischen) Schrödingergleichung für ein Teilchen mit Spin 1/2.
~ er2. Der nichtrelativistische Limes der Diracgleichung in einem homogenen Magnetfeld B
gibt den bekannten Zusatzbeitrag
HB = −
q ~
~ ·B
~
L + 2S
2m
zum Hamiltonoperator. Der Spin ist also eine Eigenschaft, die durch die relativistische
Quantenmechanik vorhergesagt wird, und zwar mit dem (fast) korrekten Landé-Faktor
gs = 2.
3. Die Energieeigenwerte der Diracgleichung sind derart, dass für jeden Eigenwert E auch
der Eigenwert −E existiert. Die entsprechenden Zustände mit negativer Energie werden
als Zustände des Antiteilchens des Elektrons, des Positrons interpretiert. In diesem Sinne
ist die Existenz von Antiteilchen eine Vorhersage der relativistischen Quantenmechanik.
41
~ /(mc) und betrachtet nicht
4. Entwickelt man die Diracgleichung im Coulombpotential in P
nur die unterste Ordnung, sondern auch noch die nächsthöhere, erhält man folgende Zusatzbeiträge zum Hamiltonoperator des Elektrons im Coulombpotential:
a) Erste relativistische Korrektur zur kinetischen Energie. Die Entwicklung der relativistischen Energie-Impuls-Beziehung
2 2
2
p
p
~
1
p
~
2
E = m2 c4 + p~ 2 c2 = mc +
−
+ ...
2m 8 m3 c2
ergibt zur ersten Ordnung in p
~/(mc) einen Zusatzterm der analog im Hamiltonoperator
dem Zusatzbeitrag
2
~2
P
1
=−
8 m3 c2
HR.K.
entspricht.
b) Spin-Bahn-Kopplung. Die Diracgleichung liefert ebenfalls einen Term, der den Spin
und den Bahndrehimpuls des Elektrons miteinander koppelt
HS.B. =
1
γ ~ ~
1
γ ~ 2 ~ 2 ~ 2
.
S
·
L
=
J −L −S
2m2 c2 |~x|3
4m2 c2 |~x|3
Dieser Term kann so interpretiert werden, dass das Elektron in seinem Ruhesystem
das Magnetfeld des (sich bewegenden) Kerns spürt, das über den üblichen Pauliterm
~ ·B
~ an das magnetische Moment des Spins koppelt. Wie bereits vorweggenommen,
∝S
~ und S
~ selbst keine Erhaltungsgrößen
ist diese Kopplung dafür verantwortlich, dass L
~ +S
~ der Fall ist.
des Systems sind, während das für den Gesamtdrehimpuls J~ = L
c) Darwin-Term. Der dritte Korrekturbeitrag von der Diracgleichung ist von der Form
HDa. = −
~2
γ
π~2 γ
∆
=
δ(~x) .
8m2 c2 |~x|
2m2 c2
Dieser Term hat als Ursache die sogenannte “Zitterbewegung” des Elektrons: Die Existenz der bereits erwähnten Lösungen der Diracgleichung zu negativer Energie führt
dazu, dass die Position des Elektrons nur bis auf seine Comptonwellenlänge
λCo. =
~
mc
genau bestimmt ist. Entsprechend spürt das Elektron das Coloumbpotential nicht direkt,
sondern gemittelt über Abstände λCo. . Der Term HDa. kann als Resultat der Ersetzung
γ
γ −
→− |~x|
|~x| mittel, λCo.
interpretiert werden.
42
Wir möchten nur den Einfluss der relativistischen Korrekturen auf das Spektrum des Wasserstoﬀatoms in erster Ordnung Störungstheorie berechnen. Der ungestörte Hamiltonoperator
sei
H0 =
P~ 2
γ
P~ 2
~cα
−
=
−
,
2m |~x|
2m
|~x|
α=
e20
1
'
,
~c(4π0 )
137
wobei α die Sommerfeld’sche Feinstrukturkonstante ist. Die Energieeigenwerte
En,0 = −
1
mc2 α2
me40
=
−
,
2(4π0 )2 ~2 n2
2 n2
sind bekanntlich entartet. Im Hinblick auf die Spin-Bahn-Kopplung wählen wir als ONB von Eigenzuständen zu H0 die Gesamtdrehimpuls-ONB
|n; j, mj ; l, si ,
n ∈ N0 ,
l ∈ {0, . . . , n − 1} ,
j =l±
1
,
2
mj ∈ {−j, . . . , j} .
Die erste Korrektur der Energieniveaus ist der Erwartungswert der Störung
H1 = HR.K. + HS.B. + HDa.
in den Zuständen |n; j, mj ; l, si. Nach einer längeren Rechnung, die wir hier nicht im Detail besprechen wollen, bekommt man
En,j = En,0 + hn; j, mj ; l, s|H1 |n; j, mj ; l, si
!!
α2 3
n
mc2 α2
1− 2
−
.
=−
2 n2
n
4 j + 21
Die Energiekorrekturen sind also von der Ordnung α4 und damit im Vergleich zun den ungestörten Energien um den Faktor α2 ≈ 5.3 × 10−5 kleiner. Darüber hinaus wird die Entartung der
Energieniveaus teilweise in Abhängigkeit von der Gesamtdrehimpulsquantenzahl j aufgehoben.
Dies ist die Feinstruktur des Spektrums.
Auf Grundlage der Diracgleichung können die Energieeigenwerte exakt berechnet werden.
Man erhält
−2 − 21
s
2
1
1
= mc2 1 + α2 n − j +
+
j+
− α2   − mc2
2
2

En,j,exakt

Die obige störungstheoretische Berechnung entspricht dem α4 -Beitrag der Taylorentwicklung
dieses exakten Resultats.
Für schwerere Elemente gilt die obige Formel mit der Ersetzung
α → Zα
mit der Kernladungszahl Z . Da j ≥ 21 kann man also ablesen, dass Atome mit Z > 1/α ≈ 137
nicht mehr (stabil) existieren können, da die Energieeigenwerte komplex werden und damit der
Hamiltonoperator nicht mehr selbstadjungiert ist. Nimmt man die endliche Kernausdehnung in
Betracht, bekommt man die verfeinerte Stabilitätsgrenze Z ≈ 172.
43
1.5
Zustandsgemische und Dichtematrizen
Bisher haben wir Zustände eines quantenmechanischen Systems mit Vektoren (oder besser
“Richtungen”11 ) in einem Hilbertraum identifiziert. Die Zustände dieser Art nennt man reine
Zustände, physikalisch entsprechen sie optimalen Präparationen eines Systems.
Tatsächlich gibt es aber Zustände, die sich nicht derart beschreiben lassen, die gemischten
Zustände oder Zustandsgemische. Viele physikalische Situationen lassen sich nicht mit reinen
Zuständen beschreiben, sondern nur mit Zustandsgemischen, z.B.:
1. Ein Gas einer bestimmten Temperatur ist in einem gemischten Zustand. Details dazu im
zweiten Vorlesungsteil zur Statistik.
2. Der Eingangszustand im Stern-Gerlach-Experiment ist ein gemischter Zustand. Details dazu in den Übungsaufgaben.
Um gemischte Zustände mathematisch zu beschreiben, müssen wir zunächst eine neue,
aber äquivalente, Schreibweise für reine Zustände und Erwartungswerte in diesen Zuständen
entwickeln.
1.5.1
Die Dichtematrix eines reinen Zustandes
Dazu betrachen wir einen beliebigen reinen Zustand ψ , d.h. einen normierten Vektor |ψi in einem
Hilbertraum H . Aus diesem Vektor können wir den uns schon bekannten Operator
ρψ = |ψihψ|
konstruieren. Dieser wirkt auf einen anderen reinen Zustand |φi als
ρψ |φi = |ψihψ|φi = hψ|φi|ψi .
Der Operator ρψ projiziert also den Vektor |φi auf den Vektor – oder besser, die Richtung des
Vektors – |ψi, darum nennen wir ihn einen Projektor. Allgemein ist ein Projektor ein linearer
Operator A auf einem Hilbertraum H , der selbstadjungiert ist und dessen Quadrat wieder den
Operator selbst gibt, d.h.
A† = A ,
A2 = A .
Wir verifizieren leicht, dass ρψ diese Eigenschaften besitzt:
† †
ρ†ψ = (|ψihψ|)† = |ψi (|ψi)† = (|ψi)† (|ψi)† = |ψihψ| ,
ρ2ψ = |ψi hψ|ψi hψ| = |ψihψ| = ρψ .
| {z }
=1
11
Der mathematisch korrekte Begriﬀ ist Strahl.
44
Beispiel: Es sei |ψa,b i ∈ C2 der normierte Vektor
a
|ψa,b i = p
,
2
2
|a| + |b| b
1
Dann ist
ρψa,b
1
= |ψa,b ihψa,b | = 2
|a| + |b|2
a, b ∈ C .
2
1
a
|a| ab∗
∗
∗
a b = 2
.
b
|a| + |b|2 a∗ b |b|2
Allgemeine Projektoren projizieren nicht auf einen einzelnen Vektor, sondern auf einen Unterraum des Hilbertraums, z.b. eine “Fläche” im Hilbertraum. Der Einsoperator 1 lässt sich z.B
als ein Projektor auf den ganzen Hilbertraum auﬀassen, da 1† = 1 und 12 = 1. Wir haben bereits
oft verwendet, dass sich der Einsoperator als Summe der Projektoren auf die Vektoren einer ONB
|ni schreiben lässt
X
1=
|nihn| .
n
Im Allgemeinen ist die Summe mehrerer Projektoren aber nicht wieder ein Projektor12 .
Die Tatsache, dass ρ2ψ = ρψ impliziert inbesondere, dass die Eigenwerte von ρψ nur 1 oder 0
sein können. Das folgt aus der Tatsache, dass, wenn a ein Eigenwert von A ist, a2 ein Eigenwert
von A2 ist und alle Eigenwerte von A2 von dieser Form sind.
Beispiel: Für den besprochenen Vektor |ψa,b i ∈ C2 ist ρψa,b eine 2 × 2-Matrix. Allgemein gilt,
dass die Spur – d.h. die Summe der Diagonalelemente – einer Matrix die Summe ihrer Eigenwerte
(mit Vielfachheit) ist, während die Determinante einer Matrix das Produkt der Eigenwerte (mit
Vielfachheit) ist. Für eine 2 × 2-Matrix kann man die Eigenwerte also direkt aus der Spur und der
Determinante berechnen. Es gilt
Sp(ρψa,b ) =
|a|2 + |b|2
= 1 = 1 + 0,
|a|2 + |b|2
det(ρψa,b ) =
|a|2 |b|2 − ab∗ a∗ b
(|a|2 + |b|2 )2
= 0 = 1 · 0.
Daraus folgt, dass ρψa,b die Eigenwerte 1 und 0 hat.
Wir nennen den Operator ρψ die Dichtematrix oder den statistischen Operator des Zustandes
ψ . Wie lassen sich Erwartungswerte im Zustand ψ mit Hilfe von ρψ berechnen? Dazu brauchen
wir den Begriﬀ der Spur eines Operators. Die Spur eines Operators ist die Verallgemeinerung der
Spur einer Matrix. Gegeben eine ONB |ni eines Hilbertraums H , lassen sich die Matrixelemente
Amn eines Operators A auf H bekanntermaßen als
Amn = hm|A|ni
definieren. Wir definieren die Spur von A als die Spur der Matrix Amn :
Sp(A) =
X
Ann =
n
12
X
hn|A|ni .
n
Dies gilt nur, wenn die aufsummierten Projektoren orthogonal sind, d.h. die Summe A + B von zwei Projektoren
A und B ist wieder ein Projektor wenn AB = 0 (und damit BA = 0).
45
Die Spur hat einige wichtige mathematische Eigenschaften.
1. Die Spur hängt nicht von der Wahl der ONB |ni ab. Man kann zur Berechnung der Spur also
eine beliebige ONB verwenden.
2. Die Spur eines Produktes zweier Operatoren hängt nicht von der Reihenfolge ab, d.h. es
gilt
Sp(AB) = Sp(BA) .
3. Das komplexkonjugierte der Spur ist die Spur des adjungierten Operators.
(Sp(A))∗ = Sp(A† )
Es sei A eine Observable, also ein selbstadjungierter Operator A. Wir berechnen nun den
Ausdruck Sp(ρψ A) = Sp(Aρψ ) unter Verwendung einer beliebigen ONB |ni:
Sp(ρψ A) =
X
hn|ρψ A|ni =
n
= hψ|A
X
n
X
hn|ψi hψ|A|ni =
| {z } | {z }
Zahl
Zahl
X
n
hψ|A|ni hn|ψi
| {z } | {z }
Zahl
Zahl
|nihn| |ψi = hψ|A|ψi = hAiψ
n
|
{z
=1
}
Wir sehen also, dass sich der Erwartungswert hAiψ der Observable A im Zustand ψ auf zwei
Arten und Weisen ausrechnen lässt:
1. als Spur Sp(ρψ A) des Produktes der Dichtematrix ρψ und des Operators A
2. und als Skalarprodukt des Vektors |ψi mit dem Vektor A|ψi.
Insbesondere ist der Erwartungswert des Einsoperators gerade das Quadrat der Norm des Vektors |ψi
h1iψ = Sp(ρψ 1) = Sp(ρψ ) = hψ|ψi = 1 .
Die Tatsache, dass |ψi normiert ist, ist also äquivalent zur Tatsache, dass die Spur der Dichtematrix ρψ gleich 1 ist. Andererseits folgt die Tatsache, dass Erwartungswerte von selbstadjungierten Operatoren immer reell sind, in der Berechnung mittels der Dichtematrix aus der dritten
erwähnten mathematischen Eigenschaft der Spur und der Selbstadjungiertheit von ρψ :
(hAiψ )∗ = (Sp(ρψ A))∗ = Sp((ρψ A)† ) = Sp(A† ρ†ψ ) = Sp(Aρψ ) = Sp(ρψ A) = hAiψ .
Wir fassen die charakteristischen Eigenschaften der Dichtematrix ρψ eines reinen Zustandes
ψ zusammen:
1. Sp(ρψ ) = 1. Dies entspricht der Tatsache, dass der Erwartungswert des Einsoperators 1
ist, d.h. der Zustand ist normiert.
46
†
2. ρψ = ρψ . Dies entspricht der Tatsache, dass Erwartungswerte von selbstadjungierten Operatoren – d.h. Observablen – reell sind.
3. ρ2ψ = ρψ . Dies entspricht der Tatsache, dass die Eigenwerte von ρψ nur 1 oder 0 sind.
1.5.2
Gemischte Zustände
Allgemeine quantenmechanische Zustände ψ erhält man nun, indem man die dritte Eigenschaft
in dem Sinne aufweicht, dass man nicht notwendigerweise verlangt, dass ρ2ψ = ρψ und damit,
dass die Eigenwerte von ρψ nur 1 oder 0 sind, sondern nur verlangt, dass die Eigenwerte von
ρψ alle ≥ 0 sind – die physikalische Bedeutung dieser Bedingung wird später diskutiert. Aus der
Bedingung, dass Sp(ρψ ) = 1 folgt dann sogar, dass die Eigenwerte ≤ 1 sind.
In den Postulaten der Quantenmechanik im Abschnitt 1.1.2 verallgemeinern wir das Zustandsund das Erwartungswertpostulat also folgendermaßen:
• Zustände ψ eines physikalischen Systems werden durch eine Dichtematrix repräsentiert,
d.h. einen linearen Operator ρψ auf einem Hilbertraum H der folgende Eigenschaften
erfüllt:
ρ†ψ = ρψ ,
Die Eigenwerte von ρψ sind ≥ 0.
Sp(ρψ ) = 1 ,
Gilt ρ2ψ = ρψ , spricht man von einem reinen Zustand und es existiert ein Vektor |ψi ∈ H
so dass
ρψ = |ψihψ| .
Ist das nicht der Fall, so nennt man ψ einen gemischten Zustand.
• Der Erwartungswert hAiψ einer Observable A in einem Zustand ψ ist gegeben durch
hAiψ = Sp(ρψ A)
Er entspricht dem Mittelwert der Messwerte, die sich aus einer wiederholten Messung an
einem Ensemble N 1 identisch präparierter Systeme ergeben. Im Falle eines reinen
Zustandes gilt
hAiψ = hψ|A|ψi .
Warum nennt man nicht-reine Zustände gemischt? Das liegt daran, dass man zeigen kann,
dass die Dichtematrix ρψ eines gemischten Zustandes sich immer als konvexe Kombination von
Dichtematrizen reiner Zustände schreiben kann. D.h. es existieren Vektoren |ψi i, i ∈ {1, . . . , N }
und Koeﬃzienten
ci ≥ 0 ,
N
X
i=1
47
ci = 1
so dass
ρψ =
N
X
ci ρψi =
i=1
N
X
ci |ψi ihψi | .
i=1
Dabei ist N = ∞ erlaubt und es ist erlaubt, dass die |ψi i nicht alle linear unabhängig oder gar
orthogonal sind. Für den Erwartungswert einer Observablen A gilt folglich
hAiψ = Sp(ρψ A) =
N
X
ci Sp(ρψi A) =
i=1
N
X
ci hAiψi =
i=1
N
X
ci hψi |A|ψi i .
i=1
Daher interpretieren wir ci als die Wahrscheinlichkeit, dass das System im reinen Zustand ψi
ist. Diese statistische Unsicherheit entspricht einer klassischen Unsicherheit. Diese besteht in
gemischten Zuständen zusätzlich zur quantenmechanischen Unsicherheit, mit der einzelne Messungen von Observablen in reinen Zuständen behaftet sind. Zur Verdeutlichung sei |ni eine ONB
aus Eigenzuständen von A mit Eigenwerten an . Dann gilt
hAiψ =
=
N
X
i=1
N X
X
i=1
=
ci hψi |A|ψi i ,
X
aus Kapitel 1.1.2 : hψi |A|ψi i =
X
|hn|ψi i|2 an
n
ci |hn|ψi i|2 an
n
pn an ,
pn =
n
N
X
ci
|{z}
i=1 klass. Wahrsch.
dass System
im Zust. ψi ist
|hn|ψi i|2
| {z }
.
QM-Wahrsch.
dass Zust. ψi
bei Messung
von A in
Zust. |ni überg.
Insbesondere ist also im obigen Ausdruck der Koeﬃzient pn von an die gemischt klassischquantenmechanische Wahrscheinlichkeit, bei einer Messung der Observable A im Zustand ψ
den Messwert an zu finden. Die Zerlegung eines gemischten Zustandes in reine Zustände ist im
Allgemeinen nicht eindeutig. Wegen
pn =
N
X
i=1
ci |hn|ψi i|2 =
N
X
ci hn|ψi ihψi |ni = hn|ρψ |ni
i=1
ist die physikalisch relevante Wahrscheinlichkeit pn aber unabhängig von der gewählten Zerlegung.
Jetzt könner wir auch die Bedingung, dass die Eigenwerte von ρψ ≥ 0 sind verstehen. Diese
Bedingung garantiert nämlich, dass ci ≥ 0 und damit, dass pn ≥ 0 und die Interpretation der pn
als Wahrscheinlichkeiten sinnvoll ist. Diese Interpretation ist weiterhin auch nur dann konsistent,
P
wenn n pn = Sp(ρψ ) = 1, was die Spurbedingung erklärt.
48
1.5.3
Unterschiede zwischen reinen und gemischten Zuständen
Um die Unterschiede zwischen reinen und gemischten Zuständen nochmals zu verdeutlichen
betrachten wir zwei reine Zustände |ϕ1 i und |ϕ2 i und konstruieren daraus die reine Superposition
1
|ψsup i = √ (|ϕ1 i + |ϕ2 i) ,
N
N = (hϕ1 | + hϕ2 |) (|ϕ1 i + |ϕ2 i)
und den gemischten Zustand
ρψgem =
1
(|ϕ1 ihϕ1 | + |ϕ2 ihϕ2 |) .
2
Es sei A eine Observable. Für den Erwartungswert von A in den konstruierten Zuständen berechnen wir
hAiψsup = hψsup |A|ψsup i =
1
(hϕ1 |A|ϕ1 i + hϕ1 |A|ϕ2 i + hϕ2 |A|ϕ1 i + hϕ2 |A|ϕ2 i) ,
N
hAiψgem = Sp(ρψgem A) =
1
(hϕ1 |A|ϕ1 i + hϕ2 |A|ϕ2 i) .
2
Wir sehen, also, dass im Erwartungswert des gemischten Zustandes die für eine Superposition
charakteristischen Interferenzterme fehlen.
Besonders anschaulich ist das am Beispiel des Doppelspaltexperimentes mit Elektronen. Hier
ist der Zustand des Elektrons hinter der Spaltebene im Fall dass beide Spalte geöﬀnet sind eine
Superposition aus dem reinen Zustand ψ↑ , der der Situation “oberer Spalt geöﬀnet, unterer Spalt
geschlossen” und dem reinen Zustand ψ↓ , der der Situation “oberer Spalt geschlossen, unterer
49
Spalt geöﬀnet” entspricht. Modifiziert man das Doppelspaltexperiment derart, dass immer nur
ein Spalt geöﬀnet ist, wobei für jedes abgeschossene Elektron per Münzwurf festgelegt wird
welcher der Spalte geöﬀnet ist, so befindet sich das Elektron hinter der Spaltebene in dem
gemischten Zustand
1
(|ψ↑ ihψ↑ | + |ψ↓ ihψ↓ |)
2
und das Interferenzmuster verschwindet. Die Koeﬃzienten 1/2 drücken dabei die klassische
ρψgem =
statistische Unsicherheit aus, die dadurch resultiert, dass man vorher nicht mit Bestimmtheit
weiß, welcher Spalt geöﬀnet ist.
1.5.4
Die Zeitentwicklung gemischter Zustände
Wir kennen bereits die Zeitentwicklung reiner Zustände. Diese wird durch die zeitabhängige
Schrödingergleichung
i~
∂
|ψ(t)i = H|ψ(t)i ,
∂t
bestimmt. Die allgemeine Lösung dieser Gleichung ist
i
|ψ(t)i = e− ~ Ht |ψ(0)i
wobei |ψ(0)i die Rolle eines Anfangswertes spielt. Drückt man diese Tatsachen durch die Dichtematrix ρψ(t) des reinen Zustandes aus, bekommt man wegen
i
†
i †
i
hψ(t)| = (|ψ(t)i)† = e− ~ Ht |ψ(0)i = (|ψ(0)i)† e− ~ Ht = hψ(0)|e ~ Ht
die Beziehung
i
i
i
i
ρψ(t) = |ψ(t)ihψ(t)| = e− ~ Ht |ψ(0)ihψ(0)|e ~ Ht = e− ~ Ht ρψ(0) e ~ Ht .
Hierbei ist es wichtig zu bemerken, dass die Vorzeichen im Exponenten im Gegensatz zum Heisenbergbild gerade “umgekehrt” sind. Darum erfüllt ρψ(t) auch die “Heisenberggleichung mit
falschem Vorzeichen” (die von Neumann-Gleichung)
i~
∂
ρ
= [H, ρψ(t) ] .
∂t ψ(t)
Am einfachsten sieht man diesen “Vorzeichenwechsel” im Heisenbergbild. Für eine Observable
AH (t) im Heisenbergbild gilt
i
i
AH (t) = e ~ Ht AH (0)e− ~ Ht ,
AH (0) = A
Für den Erwartungswert im Zustand ψH = ψ(0) gilt also


i
i
i

 i
hAH (t)iψH = Sp(ρψH AH (t)) = Sp ρψH e ~ Ht AH (0)e− ~ Ht = Sp e− ~ Ht ρψH e ~ Ht AH (0)
|
{z
}
=ρψ(t)
wobei wir ausgenutzt haben dass Sp(AB) = Sp(BA). Das motiviert die folgende Verallgemeinerung des Zeitentwicklungspostulats für das Schrödingerbild aus dem Abschnitt 1.1.2:
50
• Im Schrödingerbild wird die Zeitentwicklung eines Zustandes ψ(t) durch die von NeumannGleichung
i~
∂
ρ
= [H, ρψ(t) ] .
∂t ψ(t)
bestimmt, deren allgemeine Lösung
i
i
ρψ(t) = e− ~ Ht ρψ(0) e ~ Ht
ist. Im Fall dass ψ(t) ein reiner Zustand ist, ist diese Gleichung äquivalent zur zeitab∂
hängigen Schrödingergleichung i~ ∂t
|ψ(t)i = H|ψ(t)i, deren allgemeine Lösung |ψ(t)i =
i
e− ~ Ht |ψ(0)i ist.
Kommutiert die Dichtematrix ρψ(t) eines gemischten Zustandes ψ(t) mit dem Hamiltonoperator H so nennt man ψ(t) stationär, da
i~
∂
ρ
= [H, ρψ(t) ] = 0 .
∂t ψ(t)
Das verallgemeinert stationäre reine Zustände, d.h. Eigenzustände des Hamiltonoperators. Für
solche gilt nämlich
i
i
|ψ(t)i = e− ~ Ht |ψ(0)i = e− ~ Et |ψ(0)i
und damit
i
i
i
i
ρψ(t) = |ψ(t)ihψ(t)| = e− ~ Et |ψ(0)ihψ(0)|e ~ Et = |ψ(0)ihψ(0)|e− ~ Et e ~ Et = ρψ(0) .
Die Dichtematrix eines Zustandes ist das quantenmechanische Analogon der Wahrscheinlichkeitsdichte %(q, p) in der klassischen Mechanik. Entsprechend ist die von Neumann-Gleichung
das quantenmechanische Analogon der Liouville-Gleichung
∂
%(q, p) = {h(q, p), %(q, p)}
∂t
mit der Hamiltonfunktion h und der Poisson-Klammer {·, ·}.
Wenn [H, ρψ ] = 0, dann haben H und ρψ gemeinsame Eigenvektoren, und zwar gerade die
reinen stationären Zustände von H . Ist allgemein A ein selbstadjungierter Operator mit ONB |ni
aus Eigenzuständen mit Eigenwerten an so kann man schreiben13 :
A=
X
an |nihn| .
Test:
A|mi =
n
X
n
an |ni hn|mi = am |mi .
| {z }
=δmn
Ist |ni die ONB aus Eigenvektoren von H mit Eigenwerten En gilt also
H=
X
En |nihn| ,
ρψ =
n
13
X
pn |nihn| .
n
Entartete Eigenwerte zählen wir hier mehrfach, entsprechend ihrer Vielfachheit.
51
In diesem Fall ist ψ also eine Mischung aus reinen stationären Zuständen und die Eigenwerte pn
von ρψ geben gerade die klassische Wahrscheinlichkeit an, dass ψ im Zustand |ni ist. Wenn die
Energieeigenwerte En nicht entartet sind, folgt sogar, dass ρψ eine Funktion fψ (H) von H ist,
denn für eine solche gilt
fψ (H) = fψ (H)1 = fψ (H)
X
|nihn| =
X
n
fψ (En )|nihn| .
n
Die Wahrscheinlichkeiten pn sind also für nicht entartete En von der Form pn = fψ (En ), wobei die
Funktion fψ für alle n dieselbe ist. Dieser Sachverhalt wird im zweiten Vorlesungsteil zur Statistik
eine wichtige Rolle spielen. Sind die Energieeigenwerte En entartet, dann benötigt man noch
weitere Erhaltungsgrößen des Systems um einen gemischen stationären Zustand in der obigen
Weise auszudrücken.
Beispiel: Wir betrachten die zwei selbstadjungierten Matrizen
H=
1 0
,
0 −1
a
b + ic
,
b − ic
d
A=
a, b, c, d ∈ R
Es soll gelten [H, A] = 0, daraus folgt
0
−2(b + ic)
2(b − ic)
0
0 = [H, A] =
⇒
b=c=0
⇒
a 0
.
A=
0 d
Daher können wir A umschreiben als
A=
a+d
a 0
2 +
=
0 d
0
a−d
2
a+d
2
0
−
a−d
2
a+d
=
2
a−d 1 0
1 0
+
.
0 1
0 −1
2
Daher gilt
A=
1.6
a+d 2 a−d
H +
H = fA (H) .
2
2
EPR-Paradoxon, Bell’sche Ungleichungen und Quantenkryptographie
Wie wir wissen sind in der Quantenmechanik im Allgemeinen nur statistische Aussagen über
den Ausgang einzelner Messungen möglich. Eigenschaften einzelner Teilchen wie Ort, Impuls,
Spin in z -Richtung etc. sind im Allgemeinen vor der Messung dieser Eigenschaft nicht scharf
definiert, so dass Aussagen wie “Die z -Richtung des Teilchenspins is ~/2” im Allgemeinen nur
nach der Messung dieser Spinrichtung möglich sind, vorher aber nicht. Viele Physiker haben
diese Tatsache kritisiert und damit die Quantenmechanik an sich. Berühmt ist der (sinngemäße)
Ausspruch von Einstein: “Gott würfelt nicht!”.
1.6.1
Das EPR-Paradoxon
Ein wichtiger Beitrag zu dieser Diskussion ist ein Argument von Einstein, Podolski und Rosen
(EPR) aus dem Jahre 1935, hier in der vereinfachten Version von Bohm aus 1951.
52
Ein Teilchen mit Spin 0 zerfällt in zwei Teilchen mit Spin 1/2, z.B. zerfällt ein neutrales Pion
(π -Meson) in ein Elektron und ein Positron (Antielektron). Die zwei Teilchen mit Spin 1/2 fliegen in
entgegengesetzter Richtung entlang der x-Achse auseinander. Nach einer gewissen Zeit t misst
Alice die z -Komponente des Spins des linken Teilchens und findet den Wert ~/2. Kurz danach, zu
der Zeit t+, misst Bob die z -Komponente des Spins des rechten Teilchens. Wegen der Erhaltung
des Gesamtdrehimpulses bzw. Gesamtspins – und damit insbesondere seiner z -Komponente –
kann man vorhersagen, dass Bob den Wert −~/2 finden muss. Das Experiment soll dabei so
durchgeführt werden, dass die Entfernung der zwei Teilchen nach der Zeit t und t + derart groß
ist, dass eine Kommunikation zwischen Alice und Bob in dem Zeitintervall nach den Gesetzen
der speziellen Relativitätstheorie nicht möglich ist, d.h. es soll gelten
|xrechts (t + ) − xlinks (t)| > c .
Diese Voraussetzung kann immer geschaﬀen werden, wenn Alice lange genug wartet (t groß)
und Bob kurz nach Alice misst ( klein). Unter diesen Voraussetzungen kann man also im Rahmen
der speziellen Relativitätstheorie ausschließen, dass die Messung von Alice die Messung von Bob
direkt beeinflusst, z.B. indem bei der Messung von Alice ein Lichtstrahl zu Bob ausgesandt wird,
der mit dem rechten Teilchen wechselwirkt und seinen Spin in die richtige Richtung dreht. Die
konservativste Annahme ist, also, dass die z -Komponente der Spins beider Teilchen schon vor
der Messung feststand.
Nun wiederholen Alice und Bob das Experiment, messen aber die x-Komponente der Teilchenspins. Wieder gilt: Findet Alice den Messwert a, muss Bob den Messwert b = −a finden.
Wieder ist die konservativste Annahme, dass die x-Komponente der Spins beider Teilchen schon
vor der Messung feststand. Wegen [Sx , Sz ] 6= 0 ist diese Annahme aber nicht mit der Quantenmechanik verträglich (siehe auch die Diskussion des Messprozesses am Beispiel des SternGerlach-Experiments in Abschnitt 1.1.2): Es ist im Rahmen der Quantenmechanik nicht möglich,
dass die x- und z -Komponente der Teilchenspins gemeinsam vor der Messung feststehen. EPR
haben diese Beobachtungen (vereinfacht) so interpretiert:
Die verschieden Spinkomponenten der Teilchen haben gleichzeitig einen bestimmten Wert.
Im Rahmen der Quantenmechanik ist dies nicht möglich. Also kann die Quantenmechanik
keine vollständige Theorie sein.
Somit stellt sich die Frage: Ist es möglich die Quantenmechanik zu vervollständigen um das Paradoxon aufzulösen? Eine naheliegende Möglichkeit ist die folgende. Man postuliert, dass alle
Spinkomponenten beider auseinanderfliegender Teilchen vor der Messung klar definierte Größen
sind. In der Quantenmechanik gilt das nur für die jeweils gemessene Komponente. Die anderen
beiden sind in der Quantenmechanik selbst nicht zugänglich und werden als “verborgene Variablen” angesehen. Die statistischen Aussagen der Quantenmechanik ergeben sich durch Mittelung über diese unbekannten Größen, analog zur klassischen statistischen Mechanik, wo sich
Messgrößen – wie z.B. die Temperatur eines Gases – als Mittelung über sehr viele unbekannte
Größen – wie z.B. die Geschwindigkeiten jedes einzelnen Gasteilchens – ergeben.
53
1.6.2
Die Bell’sche Ungleichung
Die Frage nach der Existenz verborgene Variablen wurde heiß diskutiert. Bell hat 1964 ein theoretisches Kriterium entwickelt, anhand dessen man überprüfen kann, ob verborgende Variablen
existieren können. Es ist sehr wichtig, sich klarzumachen, dass dieses Kriterium die Quantenmechanik nicht voraussetzt. Es ist also ein unabhängiges Kriterium, dass an der Quantenmechanik
oder einer anderen Theorie überprüft werden kann.
Dazu stellen wir folgende Vorüberlegungen an. Das EPR Gedankenexperiment kann mit Messungen der Spinkomponenten in beliebigen Richtungen durchgeführt werden, d.h. die Messapparaturen (z.B. Stern-Gerlach-Apparate) von Alice und Bob können in verschiedene Richtungen
~a und ~b ausgerichtet sein, wobei ~a und ~b dreidimensionale Vektoren der Länge 1 sind. Die Observablen sind also
~ (1)
~a · S
~b · S
~ (2)
Spin des linken Teilchens in Richtung ~a ,
entspricht
entspricht
Spin des rechten Teilchens in Richtung ~b .
Die möglichen Messwerte dieser Observablen seien per Annahme (allerdings ohne die Annahme,
dass die Quantenmechanik gültig ist) ±~/2. Um die Diskussion übersichtlicher zu gestalten,
teilen wir alle Messwerte durch ~/2, wir setzen also
~σ (1) =
2 ~ (1)
S ,
~
~σ (2) =
2 ~ (2)
S
~
und betrachten die Observablen
~a · ~σ (1)
~b · ~σ (2)
entspricht
entspricht
Spin des linken Teilchens in Richtung ~a in Einheiten
Spin des rechten Teilchens in Richtung ~b in Einheiten
~
,
2
~
,
2
deren mögliche Messwerte ±1 sind. Das EPR-Gedankenexperiment wird nun N mal durchgeführt, wobei N 1. Für ein beliebiges i ∈ {1, . . . , N } definieren wir nun
MiA (~a) = Messwert der Observable ~a · ~σ (1) bei der i-ten Messung ,
MiB (~b) = Messwert der Observable ~b · ~σ (2) bei der i-ten Messung .
Wir gehen nun davon aus, dass MiA (~a) und MiB (~b) für beliebige i und ~a, ~b bereits vor der Messung
feststehen, auch wenn immer nur ein Richtungspaar (~a, ~b) = (~ai , ~bi ) ausgemessen wird. Die
MiA (~a), MiB (~b) für (~a, ~b) 6= (~ai , ~bi ) sind dann die verborgenen Variablen. Zusammen legen diese
Zahlen den Zustand ψ der N Teilchenpaare auf eine deterministische Art und Weise fest.
Wegen der Drehimpulserhaltung gilt
~b = ~a
⇒
MiB (~b) = −MiA (~a) .
54
In Fall, dass ~b 6= ~a, gibt es eine solche zwingende Relation nicht. Allerdings gilt folgende Relation
immer für vier beliebige Vektoren ~k , ~l, m
~ , ~n und ein beliebiges i:
A~
B ~
B
A
B ~
B
~ + Mi (~n) Mi (l) − Mi (m)
~ = 2.
Mi (k) Mi (l) + Mi (m)
Dies folgt sofort aus der Tatsache dass entweder MiB (m)
~ = MiB (~l), dann verschwindet der 2.
Term, oder MiB (m)
~ = −MiB (~l), dann verschwindet der 1. Term. Der nichtverschwindende Term
ist immer = ±2 und hat damit den Betrag 2.
Wir betrachten nun für beliebige ~a, ~b die Produktobservable
(~a · ~σ (1) )(~b · ~σ (2) ) .
Diese entspricht dem Produkt der beiden Spinkomponenten und hat darum die möglichen Messwerte
MiA (~a)MiB (~b) .
Der Erwartungswert Eψ (~a, ~b) = h(~a · ~
σ (1) )(~b · ~σ (2) )iψ entspricht im deterministischen Zustand ψ
dem Mittelwert
N
D
E
1 X A
(1) ~
(2)
~
Mi (~a)MiB (~b).
Eψ (~a, b) = (~a · ~σ )(b · ~σ ) =
N
ψ
i=1
Dieser Erwartungswert ist eine Zahl im Intervall [−1, 1] und ist folgendermaßen zu interpretieren.
Wenn Eψ (~a, ~b) sehr nahe an ±1 ist, dann kommt es sehr häufig vor, dass MiA (~a) = ±MiB (~b) und
man sagt, dass die Observablen ~a · ~
σ (1) und ~b · ~σ (2) stark (anti)korreliert sind. Wenn Eψ (~a, ~b)
sehr nahe an 0 ist, dann kommen die Fälle MiA (~a) = MiB (~b) und MiA (~a) = −MiB (~b) in etwa
gleich häufig vor und man sagt dass die Observablen sehr schwach bzw. gar nicht korreliert
sind. Darum nennt man Eψ (~a, ~b) die Korrelation zwischen den Messgrößen ~a · ~
σ (1) und ~b · ~σ (2) .
Diese Zahl ist ein Maß dafür wie stark diese Messgrößen im betrachteten Zustand miteinander
zusammenhängen.
Bell hat nun folgende Korrelationsgröße betrachtet14 . Für vier beliebige Einheitsvektoren ~k ,
~l, m
~ , ~n definieren wir die Bell’sche Korrelationsgröße
Bψ (~k, ~l, m,
~ ~n) = |Eψ (~k, ~l) + Eψ (~k, m)
~ + Eψ (~n, ~l) − Eψ (~n, m)|
~ .
14
Hier in der von Clauser, Home, Shimony und Holt in 1969 vorgeschlagenen Form.
55
Es gilt unter Verwendung der Dreieckungsungleichung und der weiter oben gefundenen Identität
Bψ (~k, ~l, m,
~ ~n) = |Eψ (~k, ~l) + Eψ (~k, m)
~ + Eψ (~n, ~l) − Eψ (~n, m)|
~
N h
1 X
i
A ~
B ~
A ~
B
A
B ~
A
B
=
Mi (k)Mi (l) + Mi (k)Mi (m)
~ + Mi (~n)Mi (l) − Mi (~n)Mi (m)
~ N
i=1
N h
1 X
i
MiA (~k) MiB (~l) + MiB (m)
~ + MiA (~n) MiB (~l) − MiB (m)
~
=
N
≤
=
1
N
1
N
i=1
N
X
A~
~ + MiA (~n) MiB (~l) − MiB (m)
~ Mi (k) MiB (~l) + MiB (m)
i=1
N
X
2=2
i=1
insgesamt also
Bψ (~k, ~l, m,
~ ~n) = |Eψ (~k, ~l) + Eψ (~k, m)
~ + Eψ (~n, ~l) − Eψ (~n, m)|
~ ≤ 2.
Das ist gerade die Bell’sche Ungleichung, die sich als Vorhersage aus der Existenz von verborgenen Variablen, bzw. aus der Annahme eines deterministischen Zustandes ergibt.
Wir können nun diese Ungleichung in der Quantenmechanik testen. Der Zustand ψ der beiden
Teilchen im EPR-Gedankenexperiment ist
1
1
|ψi = |0, 0i = √ (|↑↓i − |↓↑i) = √
2
2
1
0
0
1
.
⊗
−
⊗
0
1
1
0
In der Quantenmechanik gilt also für beliebige ~a, ~b
D
E
Eψ (~a, ~b) = (~a · ~σ (1) )(~b · ~σ (2) ) = h0, 0|(~a · ~σ (1) )(~b · ~σ (2) )|0, 0i = −~a · ~b ,
ψ
wie in den Übungsaufgaben zu zeigen ist. Hierbei erinnern wir uns, dass die Observable
(~a · ~σ (1) )(~b · ~σ (2) )
eine verkürzte Schreibweise für
(~a · ~σ (1) ) ⊗ (~b · ~σ (2) )
ist. Anschaulich ist es leicht nachzuvollziehen, dass Eψ (~a, ~b) = −~a ·~b. Der Zustand ψ ist invariant
unter Drehungen, d.h. Eψ (~a, ~b) muss invariant unter Drehungen sein. Gleichzeitig muss diese
Größe linear in ~a und ~b sein. Man kann zeigen, dass daraus folgt, dass Eψ (~a, ~b) = c~a · ~b mit
einer Konstante c die nicht von ~a und ~b abhängt. Es reicht daher c für ein einfaches Beispiel zu
berechnen. An Eψ (~a, ~b) = −~a · ~b sieht man deutlich, dass die Aussage “Wenn Alice in Richtung
~a das Messergebnis a findet, dann findet Bob in Richtung ~b = ~a das Messergebnis b = −a.” für
alle ~a gültig ist, obwohl man den Zustand |0, 0i zunächst aus Eigenzuständen von Sz konstruiert
56
~ für beliebiges ~a
hat. Tatsächlich kann man den Zustand |0, 0i aus Eigenzuständen von ~a · S
konstruieren.
Wir können nun die Bell’sche Korrelationsgröße in der Quantenmechanik abschätzen. Es gilt
Bψ (~k, ~l, m,
~ ~n) = |Eψ (~k, ~l) + Eψ (~k, m)
~ + Eψ (~n, ~l) − Eψ (~n, m)|
~
= | − ~k · ~l − ~k · m
~ − ~n · ~l + ~n · m|
~
= |~k · (~l + m)
~ + ~n · (~l − m)|
~
≤ |~k · (~l + m)|
~ + |~n · (~l − m)|
~
≤ |~k||~l + m|
~ + |~n||~l − m|
~ = |~l + m|
~ + |~l − m|
~
p
p
= 2 + 2 cos φ + 2 − 2 cos φ
cos φ = ~l · m
~ , φ ∈ [0, π)
φ
φ
φ
φ
= 2 cos + sin
cos φ = 2 cos2 − 1 = − sin2 + 1
2
2
2
2
√
φ π
+
= 2 2 sin
2
4
√
≤ 2 2.
wobei wir mehrmals die trigonometrischen Additionstheoreme verwendet haben. Wir bekommen
also eine höhere obere Schranke als in der Bell’schen Ungleichung. Das heißt jedoch nicht, dass
diese verletzt ist. Tatsächlich ist das aber der Fall, denn für z.B.
~k = √1 (~ez + ~ey ) ,
2
~l = ~ez ,
m
~ = ~ey ,
1
~n = √ (~ez − ~ey )
2
gilt
Bψ (~k, ~l, m,
~ ~n) = |Eψ (~k, ~l) + Eψ (~k, m)
~ + Eψ (~n, ~l) − Eψ (~n, m)|
~
1
= √ | (~ez + ~ey ) · (~ez + ~ey ) + (~ez − ~ey ) · (~ez − ~ey ) |
2
√
2+2
= √ = 2 2.
2
Die Bell’sche Ungleichung ist also in der Quantenmechanik verletzt! Daher sind die Aussagen
der Quantenmechanik nicht kompatibel mit der Existenz von verborgenen Variablen und diese
können nicht zu einer Vervollständigung der Quantenmechanik dienen.
Die Verletzung der Bell’schen Ungleichungen wurde auch experimentell nachgewiesen (allerdings nicht mit Spin 1/2 Teilchen und Stern-Gerlach-Apparaten, sondern mit polarisierten Photonen und doppelbrechenden Kristallen), zunächst von Aspect et al. in 1981 und später mit
besseren Experimenten von Zeilinger et al. und Gisin et al. in 1998. Man kann also die Quantenmechanik als vollständig ansehen und muss eben “akzeptieren”, dass sie sich teilweise radikal
von der klassischen deterministischen Physik unterscheidet.
57
1.6.3
Verschränkte Zustände
Die Verletzung der Bell’schen Ungleichung in der Quantenmechanik ist auf die Existenz verschränkter Zustände zurückzuführen. Ein reiner Zustand ψ eines quantenmechanischen Systems aus zwei Teilchen (oder Freiheitsgraden) heißt separabel wenn er von der Form
|ψi = |ψi(1) ⊗ |ψi(2)
ist, sich also als ein Tensorprodukt von Zuständen der Einzelsysteme schreiben kann. Ein gemischter Zustand heißt separabel, wenn er eine Mischung aus separablen reinen Zuständen ist.
Ein Zustand der nicht separabel ist, wird verschränkt genannt.
In reinen separablen Zuständen gilt für Observablen von der Form
A = A(1) ⊗ A(2)
immer
hAiψ = hψ|A|ψi =
(1)
hψ|A(1) |ψi(1)
(2)
hψ|A(2) |ψi(2) = hA(1) iψ(1) hA(2) iψ(2) ,
d.h. Erwartungswerte sind Produkte von Erwartungswerte in den einzelnen Systemen. Für verschränkte Zustände ist das im Allgemeinen nicht der Fall und es gibt “Mischterme”. Anschaulich
kann man das so interpretieren, dass in verschränkten Zuständen die Korrelationen zwischen
Observablen in den einzelnen Systemen größer sind als in separablen Zuständen. Tatsächlich ist
der Zustand im EPR-Gedankenexperiment verschränkt, da er eine Superposition von separablen
Zuständen ist die sich nicht als Tensorprodukt umschreiben lässt:
1
1
|ψi = |0, 0i = √ (|↑↓i − |↓↑i) = √
2
2
1
0
0
1
.
⊗
−
⊗
0
1
1
0
Dagegen sind in separablen Zuständen die Bell’schen Ungleichungen erfüllt. Z.B. ist
E↑↓ (~a, ~b) = h↑↓|(~a · ~σ (1) )(~b · ~σ (2) )|↑↓i = −a3 b3
E↓↑ (~a, ~b) = h↓↑|(~a · ~σ (1) )(~b · ~σ (2) )|↓↑i = −a3 b3
wie in den Übungen gezeigt wird. Daraus folgt
B↑↓ (~k, ~l, m,
~ ~n) = |k3 (l3 + m3 ) + n3 (l3 − m3 )|
≤ |k3 (l3 + m3 )| + |n3 (l3 − m3 )|
≤2
58
und analog für |↓↑i. Der letzte Schritt folgt dabei aus k3 , l3 , m3 , n3 ∈ [−1, 1] und
n3 (l3 − m3 ) = n3 l3 (1 ± k3 m3 ) −n3 m3 (1 ± k3 l3 )
| {z }
| {z }
≥0
≥0
⇒|n3 (l3 − m3 )| ≤ |n3 l3 |(1 ± k3 m3 ) + |n3 m3 |(1 ± k3 l3 ) = 2 ± k3 (l3 + m3 )
| {z }
| {z }
≤1
≤1
⇒|n3 (l3 − m3 )| ≤ 2 − |k3 (l3 + m3 )|
⇒|n3 (l3 − m3 )| + |k3 (l3 + m3 )| ≤ 2 .
1.6.4
Quantenkryptographie
Die Tatsache, dass verschränkte Zustände die Bell’schen Ungleichungen verletzen können, während das für separable nicht gilt, kann man ausnutzen um verbesserte digitale Verschlüsselungsmechanismen zu entwickeln. Tatsächlich werden solche quantenkryptographischen Methoden
verwendet und entsprechende Apparate sind käuflich zu erwerben.
Grundsätzlich funktioniert eine digitale Verschlüsselung folgendermaßen. Alice möchte Bob
eine digitale Nachricht übermitteln. Diese setzt sich aus einzelnen Bits zusammen und ist daher
von der Form
Nachricht (unverschüsselt): 0 1 0 1 1 0 1 1 . . .
Diese Nachricht lässt sich mittels eines zufälligen digitalen Schlüssels verschlüsseln.
Zufälliger Schlüssel:
0 0 1 1 0 1 0 0 ...
Dazu werden Nachricht und Schlüssel bitweise addiert nach der Vorschrift
1 + 0 = 0 + 1 = 1,
1 + 1 = 0 + 0 = 0.
Man bekommt also
Nachricht (unverschüsselt):
Zufälliger Schlüssel:
Nachricht (verschüsselt):
0 1 0 1 1 0 1 1 ...
0 0 1 1 0 1 0 0 ...
0 1 1 0 1 1 1 1 ...
Die Nachricht lässt sich entschlüsseln in dem man die verschlüsselte Nachricht und den Schlüssel erneut bitweise addiert. Es gilt nach der obigen Additionsvorschrift nämlich
a + b + b = a + (b + b) = a + 0 = a
für beliebige a, b ∈ {0, 1}. Alice kann also beliebig viele verschlüsselte Nachricht sicher über “unsichere Kanäle” an Bob senden (und umgekehrt), solange Bob den geheimen Schlüssel kennt.
Der Schwachpunkt dieser Verschlüsselungsmethode ist die eine notwendige Nachricht, mit der
Alice Bob den geheimen Schlüssel mitteilt oder umgekehrt. Es gibt also zwei Probleme
59
1. Wie können sich Alice und Bob möglichst abhörsicher den Schlüssel gegenseitig mitteilen?
2. Wie können Alice und Bob feststellen, dass sie bei der Schlüsselmitteilung abgehört wurden
(und dann daraus die Konsequenz ziehen, dass ein neuer Schlüssel nötig ist)?
Die Quantenmechanik liefert eine Lösung für diese Probleme. Verschiedene Verschlüsselungsprotokolle basierend auf verschränkten Zuständen sind bereits theoretisch entwickelt worden und einige davon werden in der Praxis auch verwendet. Hier wollen wir ein einfaches Protokoll diskutieren, das 1991 von Ekert vorgeschlagen wurde.
Dazu wird das EPR-Experiment wie folgt verwendet. Alice und Bob legen vier Vektoren ~k , ~l,
m
~ , ~n fest – z.B. die vier oben diskutierten – die derart sind, dass
√ im verschränkten Zustand |ψi =
|0, 0i für die Bell’sche Korrelationsgröße Bψ (~k, ~l, m,
~ ~n) = 2 2 gilt. Das Experiment wird N 1
mal durchgeführt. Bei jedem Durchlauf bestimmen Alice und Bob unabhängig voneinander und
zufällig jeweils eine Messrichtung ~a, ~b ∈ {~k, ~l, m,
~ ~n}. Ein möglicher Ausgang des Experiments
sieht also wie folgt aus, wobei wir ↑ und ↓ für die Messwerte und +1 und −1 schreiben.
Messung #
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 . . .
Messrichtung Alice ~k ~
n ~n
Messrichtung Bob m
~ m
~ ~l
~k ~n ~k
~l ~l m
~
~l ~n ~k
~l m
~ m
~
~k
~l
~n
m
~ ~l
~k
~l
~k
m
~ ~l
~n ~k m
~ ...
~l m
~ m
~ ...
Messwert Alice
↑ ↑ ↑ ↓ ↓ ↑ ↑ ↑ ↓
↑
↓
↑
↑
↓
↑
↓
↑
↓ ...
Messwert Bob
↑ ↑ ↓ ↑ ↑ ↓ ↓ ↑ ↑
↓
↓
↓
↓
↓
↑
↓
↓
↑ ...
~n
~n
Nach Abschluss der Messreihe teilen sich Alice und Bob über einen beliebigen, nicht notwendigerweise sicheren, Kanal gegenseitig die ausgemessenen Richtungen mit, nicht aber die
gemessenen Werte. Anschließend teilen Alice und Bob die einzelnen Messungen in zwei Gruppen
auf:
Gruppe 1. die Messungen bei denen sie beide dieselbe Richtung ausgemessen haben
Gruppe 2. und die übrigen Messungen.
Auf Grundlage der Messungen aus Gruppe 1 legen Alice und Bob den Schlüssel wie folgt fest.
Misst Alice ↑ und Bob ↓, entspricht das einer 1, im anderen Fall einer 0. Schließlich teilen sich
Alice und Bob die Messwerte für die Messungen aus Gruppe 2 mit (nicht aber die aus Gruppe 1!).
Auf Grundlage dieser Messwerte kann die Bell’sche Korrelationsgröße Bψ (~k, ~l, m,
~ ~n) berechnet
werden. Diese wird aus den Messungen ermittelt, indem man entsprechend der Postulate der
Quantenmechanik den Erwartungswert Eψ (~a, ~b) mit dem Mittelwert
E(~a, ~b) =
1
N (~a, ~b)
N (~a,~b)
X
i=1
60
MiA (~a)MiB (~b) ,
identifiziert, wobei nur die Einzelmessungen beitragen, bei denen tatsächlich die Messrichtungen (~a, ~b) ausgemessen wurden und N (~a, ~b) ≤ N die Anzahl dieser Messungen ist. Da die
Messrichtungen aus einer endlichen Menge von Möglichkeiten zufällig bestimmt√wurden, impliziert N 1 auch N (~a, ~b) 1 und Alice und Bob erwarten, Bψ (~k, ~l, m,
~ ~n) ' 2 2 zu finden.
Sollten Sie allerdings Bψ (~k, ~l, m,
~ ~n) ≤ 2 finden, dann ist das ein sicherer Hinweis darauf, dass
ein dritter mit der Messung interferiert hat und der generierte Schlüssel darum nicht sicher ist.
Um das im Detail zu verstehen betrachten wir den Fall, dass Eve Kenntnis über den Schlüssel
erlangen will. Dazu kann Eve folgendes machen: Sie misst die Spins der zwei Teilchen aus, bevor
diese zu Alice und Bob gelangen. Das bringt allerdings zwei Probleme mit sich:
1. Für jede mögliche Vorschrift die Eve wählt, um ihre Messrichtungen für die beiden Teilchen
festzulegen, gilt: Eves Messungen geben nur Aufschluss über den generierten Schlüssel,
wenn sie dieselben Richtungen ausgemessen hat, für die sich Alice und Bob zufällig auch
entschieden haben. Mit großer Wahrscheinlichkeit wird Eve also nur einen Bruchteil des
Schlüssels erfahren.
2. Nach der Messung von Eve sind die beiden Teilchen nicht mehr in einem verschränkten
Zustand, sondern in einem separablen. Misst Eve z.B. jeweils in Richtung ~l = ~
ez dann ist
der Zustand |0, 0i nach der Messung entweder in den Zustand |↑↓i oder in den Zustand |↓↑i
übergegangen. Daher können Alice und Bob die Aktion von Eve durch die Bestimmung der
Bell’schen Korrelationsgröße aufdecken und sich dafür entscheiden, den Schlüssel nicht zu
verwenden.
Wie bei der experimentellen Überprüfung der Verletzung der Bell’schen Ungleichung verwendet man für solche und ähnliche Quantenkrytographieprotokolle keine Spin 1/2 Teilchen sondern
polarisierte Photonen, da diese relativ störungsfrei über Glasfaserkabel übertragen werden können. In 2014 wurde mit einem in 2005 entwickelten Quantenkryptographieprotokoll ein Schlüssel
über eine Distanz von 307 km übertragen. Für Details siehe: http://arxiv.org/abs/1407.7427.
1.7
Vielteilchensysteme
Bislang haben wir im hauptsächlich Systeme untersucht bei denen es um einen oder mehrere
Freiheitsgrade eines einzelnen Teilchens geht, oder nur bestimmte Aspekte von Vielteilchensystemen betrachtet. Im Folgenden sollen nun fundamentale Aspekte von Vielteilchensystemen
diskutiert werden. Wichtige Beispielssysteme sind:
• höhere Elemente im Periodensystem, z.b. He, Li, ...
• chemische Bindungen / Moleküle, z.B. H2 , ...
• Festkörper, Gase, ...
• ...
61
1.7.1
Vielteilchenwellenfunktionen und Vielteilchen-Schrödingergleichung
Wie bereits diskutiert gilt: Werden die reinen Zustände N einzelner Teilchen durch Vektoren
in den Hilberträumen H1 , . . . , HN beschrieben, so werden die reinen Zustände des Gesamtsystems der N Teilchen durch Vektoren im Hilbertraum
H = H1 ⊗ · · · ⊗ HN
beschrieben. Für N Teilchen in drei Raumdimensionen unter Vernachlässigung des Spins gilt
insbesondere
H1 = · · · = HN = L2 (R3 ) ,
H = L2 (R3 ) ⊗ · · · ⊗ L2 (R3 ) = L2 (R3N ) ,
|
{z
}
N mal
so dass die Wellenfunktion eines N -Teilchenzustandes von der Form
ψ(~x1 , . . . , ~xN )
ist. Betrachtet man zusätzlich den Spin der Teilchen dann hat die Wellenfunktion mehrere Komponenten. Haben z.B. alle N Teilchen Spin 1/2, dann gilt
H1 = · · · = HN = L2 (R3 ) ⊗ C2 = L2 (R3 → C2 ) ,
N
H = L2 (R3 → C2 ) ⊗ · · · ⊗ L2 (R3 → C2 ) = L2 R3N → C2
,
|
{z
}
N mal
eine Wellenfunktion von zwei Elektronen hat also z.B. vier Komponenten die wir bekanntermaßen
in einer 4 × 4 Matrix anordnen können. Einfache Zustände ψ zweier Elektronen haben Wellenfunktionen von der Form
ψOrt (x1 , x2 )ψSpin ,
ψSpin ∈ {|↑↑i, |↑↓i, |↓↑i, |↓↓i} .
Allgemeine Zustände zweier Elektronen sind Superpositionen von Zuständen solcher Art.
Der Hamilonoperator eines N -Teilchensystems (unter Vernachlässigung des Spins) ist typischerweise von der Form
H=
N ~2
X
Pi
~ 1, . . . , Q
~N) ,
+ V (Q
2mi
~ ~x ,
P~i = −i~∇
i
~ i = ~xi .
Q
i=1
Die kinetische Energie des Gesamtsystems ist also die Summe der kinetischen Energien der
einzelnen Teilchen. Für die potentielle Energie gilt das im Allgemeinen nicht, da es Wechselwirkungen zwischen den Teilchen geben kann. Die Schrödingergleichung für N Teilchen ohne Spin
ist also typischerweise von der Form
∂
i~ ψ(t, ~x1 , . . . , ~xN ) =
∂t
N
X
i=1
!
~2
−
∆~x + V (~x1 , . . . , ~xN ) ψ(t, ~x1 , . . . , ~xN ) .
2mi i
62
1.7.2
Ununterscheidbare Teilchen
Wir betrachten zwei Teilchen mit identischen Eigenschaften, d.h. z.B. identischer Ladung, Masse,
Spin. In der klassischen Mechanik gilt Folgendes: Wir können die zwei Teilchen gedanklich mit
“1” und “2” benennen und ihre Bahnkurven im Raum für alle Zeiten einzeln verfolgen, selbst
wenn sie sich zu einigen Zeitpunkten schneiden. D.h. wir können die zwei Teilchen zu allen Zeiten
unterscheiden. In der Quantenmechanik gilt dies nicht! Im Prinzip ist diese Tatsache ein weiteres
unabhängiges Postulat, das sich also nicht aus den anderen Postulaten ableiten lässt. Dennoch
lässt sich dieses Postulat sehr gut anschaulich motivieren.
Wir betrachten zwei Teilchen mit identischen Eigenschaften die durch Wellenfunktionen ψ1 (~
x1 ),
ψ2 (~x2 ) beschrieben werden. Um nahe an der Situation klassischer Bahnkurven zu sein, kann man
sich diese Wellenfunktionen als Gauss’sche Wellenpakete vorstellen. Im Gegensatz zur klassischen Mechanik haben diese Wellenpakete eine endliche Breite. Wenn sich die Schwerpunkte
der Wellenpakete zu einem Zeitpunkt nahe kommen – entsprechend der analogen Situation,
dass sich in der klassischen Mechanik die Bahnkurven der zwei Teilchen nahe kommen –, dann
gibt es einen großen Bereich V ⊂ R3 im Raum in dem für alle ~
x ∈ V gilt
|ψ1 (~x)|2 0 ,
|ψ2 (~x)|2 0 ,
d.h. die Wellenfunktionen der zwei Teilchen “überlappen sich” und die Aufenthaltswahrscheinlichkeiten beider Teilchen in diesem Gebiet sind sehr groß. Daher gibt es kein Experiment, das
im Gebiet V die Teilchen unterscheiden kann. Sind die Schwerpunkte der Wellenpakete jedoch
weit voneinander entfernt, dann gilt “ist |ψ1 (~
x)|2 groß, dann ist |ψ2 (~x)|2 klein (und umgekehrt)”.
Man kann also mit guter Genauigkeit die beiden Teilchen unterscheiden, und zwar umso besser,
je weiter die Schwerpunkte der Wellenfunktionen voneinander entfernt sind. Das reproduziert
die bekannte Situation aus der klassischen Physik. Haben die zwei Teilchen unterschiedliche
Eigenschaften, z.B. unterschiedliche Massen oder Ladungen, dann sind sie auch in der Quantenmechanik jederzeit unterscheidbar, da man ja z.B. die Ladung oder Masse messen kann und
anhand der unterschiedlichen Messwerte die Teilchen unterscheiden kann.
Das Ununterscheidbarkeitspostulat lässt sich folgendermaßen formulieren:
• Die Erwartungswerte in einem quantenmechanischen System von N identischen Teilchen
dürfen nicht von der Nummerierung der Teilchen abhängen.
Konkret bedeutet das Folgendes. Wie wir wissen sind einfache reine Zustände eines Zweiteilchensystems von der Produktform
|ψ1 ; ψ2 i = |ψ1 i|ψ2 i = |ψ1 i ⊗ |ψ2 i
wobei ψ1 und ψ2 reine Zustände des Einteilchensystems sind. Allgemeine reine Zustände des
Zweiteilchensystems sind Superpositionen solcher Produktzustände. Wir definieren nun den Permutationsoperator P12
P12 |ψ1 ; ψ2 i = |ψ2 ; ψ1 i
63
der die Nummerierung der zwei Teilchen vertauscht. Für diesen Operator gilt
2
P12
= 1.
†
P12
= P12 ,
P12 ist also ein selbstadjungierter Operator dessen Quadrat die Identität ist. Die Eigenzustände
und Eigenwerte von P12 sind also von der Form
1
(|ψ1 ; ψ2 i ± |ψ2 ; ψ1 i)
N±
mit Eigenwerten
± 1,
sind sind also entweder symmetrisch oder antisymmetrisch unter Umnummerierung der Teilchen.
Beispiel: Für ein System von zwei Spin 1/2 Teilchen unter Vernachlässigung der räumlichen
Dynamik kennen wir die “Einzelspin-ONB” |↑↑i, |↑↓i, |↓↑i, |↓↓i. Auf diese Zustände wirkt P12 wie
folgt
P12 |↑↑i = |↑↑i ,
P12 |↑↓i = |↓↑i ,
P12 |↓↑i = |↑↓i ,
P12 |↓↓i = |↓↓i .
Daher sind die Zustände der “Gesamtspin-ONB”
|1, −1i = |↓↓i
1
|1, 0i = √ (|↑↓i + |↓↑i) ,
2
1
|0, 0i = √ (|↑↓i − |↓↑i)
2
|1, 1i = |↑↑i ,
Eigenzustände von P12 mit Eigenwert 1 (Gesamtspin 1) und −1 (Gesamtspin 0).
Das Ununterscheidbarkeitspostulat bedeutet in diesem Fall: Für beliebige Zustände ψ und
Observablen A eines Systems zweier identischer Teilchen muss gelten: Die Erwartungswerte
von A in den Zuständen |ψi und P12 |ψi müssen übereinstimmen:
hAiψ = hψ|A|ψi = (|ψi)† A|ψi = hAiP12 ψ = (P12 |ψi)† AP12 |ψi = hψ|P12 AP12 |ψi = hP12 AP12 iψ .
Daraus kann man zwei Forderungen ableiten:
1. Observablen eines Systems zweier identischer Teilchen müssen mit P12 kommutieren, also
invariant unter Umnummerierung sein, denn:
[A, P12 ] = 0
⇔
2
P12 AP12 − A = P12 AP12 − P12
A = P12 [A, P12 ] = 0 .
|{z}
=1
2. Zustände eines Systems zweier identischer Teilchen müssen Eigenzustände von P12 sein,
d.h. entweder symmetrisch oder antisymmetrisch, denn dann gilt hP12 AP12 iψ = (±1)2 hAiψ =
hAiψ .
Tatsächlich reicht zur Erfüllung des Ununterscheidbarkeitspostulats eine der beiden Forderungen – analog zur Äquivalenz von Schrödinger- und Heisenbergbild. Es ist zweckmäßig mit
der zweiten Forderung zu arbeiten. In der Praxis betrachtet man dann dennoch zusätzlich als
64
Observablen nur Operatoren, die die erste Forderung erfüllen, da von nichtsymmetrischen Operatoren bei der Berechnung von Erwartungswerten in (anti)symmetrischen Zuständen sowieso
nur der symmetrisierte Anteil beiträgt.
Für ein System zweier identischer Teilchen mit Spin wirkt der Permutationsoperator P12 sowohl auf den Ortsanteil ψOrt (x1 , x2 ) als auch auf den Spinanteil ψSpin eines Zustandes. Die Wirkung auf den Spinanteil haben wir am Beispiel Spin 1/2 diskutiert. Die Wirkung auf den Ortsanteil
ist
P12 ψOrt (x1 , x2 ) = ψOrt (x2 , x1 ) .
Daraus ergeben sich folgende Möglichkeiten das Ununterscheidbarkeitspostulat zu erfüllen (mit
± für symmetrisch/antisymmetrisch):
ψOrt ψSpin ψ = ψOrt ψSpin
+
+
+
+
−
−
−
+
−
−
−
+
Der Orts- und Spinanteil müssen also separat symmetrisch oder antisymmetrisch sein, wobei
verschiedene Kombinationen insgesamt eine symmetrische oder antisymmetrische Gesamtwellenfunktion ergeben.
Wir betrachten nun den allgemeinen Fall N identischer Teilchen. Allgemeine N -Teilchenzustände
sind wieder Superpositionen von Produktzuständen
|ψ1 ; . . . ; ψN i = |ψ1 i ⊗ · · · ⊗ |ψN i .
Für beliebige i, j ∈ {1, . . . , N } definieren wir den Vertauschungsoperator Pij durch
Pij |ψ1 ; . . . ; ψi ; . . . ; ψj ; . . . ; ψN i = |ψ1 ; . . . ; ψj ; . . . ; ψi ; . . . ; ψN i .
Pij vertauscht also die Nummerierung der Teilchen i und j . Wie im einfachen Fall gilt
Pij2 = 1 .
Pij† = Pij ,
D.h. die Eigenwerte λij von Pij sind λij = ±1 entsprechend den Zuständen die symmetrisch/
antisymmetrisch unter Vertauschung von i und j sind. Das Ununterscheidbarkeitspostulat impliziert, dass ein Zustand |ψi des Systems N identischer Teilchen ein Eigenzustand aller Pij sein
muss, da Erwartungswerte unter beliebigen Vertauschungen invariant sein müssen. Erstaunlicherweise folgt für solche gemeinsamen Eigenzustände, dass die Eigenwerte λij alle dasselbe
Vorzeichen haben müssen, denn es gilt für beliebige i, j :
Pij = P1i P2j P12 P1i P2j
⇒
λij = λ1i λ2j λ12 λ1i λ2j = λ21i λ22j λ12 = λ12 .
Wir finden also:
65
• Für Zustände eines Systems N identischer Teilchen sind nur folgende Möglichkeiten mit
dem Ununterscheidbarkeitspostulat verträglich:
1. Der Zustand ist vollständig symmetrisch unter Vertauschung der Teilchen. Teilchen
mit dieser Eigenschaft nennt man Bosonen.
2. Der Zustand ist vollständig antisymmetrisch unter Vertauschung der Teilchen. Teilchen mit dieser Eigenschaft nennt man Fermionen.
Folgender Sachverhalt lässt sich (in der Quantenfeldtheorie) theoretisch herleiten und experimentell verifizieren:
• Teilchen mit halbzahligen Spin (z.B. Elektronen, Spin 1/2) sind Fermionen. Teilchen mit
ganzzahligem Spin (z.B. Photonen, Spin 1) sind Bosonen.
Das impliziert sofort das berühmte Pauli-Prinzip oder auch Pauli’sche Ausschließungsprinzip:
• Zwei identische Fermionen (z.B. zwei Elektronen) können nicht denselben Einteilchenzustand besetzen.
Denn wäre |ψi dieser Einteilchenzustand, dann müsste der Zweiteilchenzustand |ψi⊗|ψi−|ψi⊗
|ψi, also das antisymmetrisierte Tensorprodukt, sein. Dieses verschwindet aber, entspricht also
keinem physikalischen Zustand.
In den Folgenden Beispielen werden wir sehen, dass das Pauli-Prinzip die Grundlage für das
Verständnis vieler wichtiger physikalischer Systeme darstellt.
1.7.3
Das Heliumatom
Als erstes Beispiel für ein Vielteilchensystem diskutieren wir das Heliumatom. Wie beim Wasserstoﬀ vernachlässigen wir die Dynamik des Atomkerns und betrachten nur die Dynamik der zwei
Elektronen. Der Hilbertraum ist also H = L2 (R6 ) und der Hamiltonoperator ist15
H=
P~12
Zγ
P~ 2
Zγ
γ
−
+ 2 −
+
,
~ 1 | 2m |Q
~ 2 | |Q
~1 − Q
~ 2|
2m |Q
|
{z
} |
{z
} | {z }
=H (1)
=H (2)
Z = 2,
γ=
e2
.
4π0
=V
H ist oﬀenbar symmetrisch unter Vertauschung der Teilchen. Das Pauli-Prinzip verlangt, dass
die Gesamtwellenfunktion der beiden Elektronen antisymmetrisch ist. Oﬀenbar vertauscht H
~ (1) und S
~ (2) und daher auch mit dem Gesamtspin S
~=S
~ (1) + S
~ (2) . Damit den Spinoperatoren S
her sind Eigenzustände von H von der Form ψOrt (~
x1 , ~x2 )ψSpin wobei ψSpin eine beliebige Linearkombination der Einzelspin-ONB-Vektoren |↑↑i, |↑↓i, |↓↑i, |↓↓i sein kann. Wir wissen aber bereits,
15
Wir vernachlässigen hier der Übersicht halber die vom Wasserstoﬀ bekannten relativistischen Korrekturen.
66
dass ψOrt und ψSpin selbst symmetrisch oder antisymmetrisch sein müssen. Daher gibt es nur
zwei Möglichkeiten:
1. ψSpin ist symmetrisch und daher eine Linearkombination der “Triplett-Zustände” |1, −1i,
|1, 0i, |1, 1i, d.h. der Zustand hat Gesamtspin 1. ψOrt ist dann antisymmetrisch. Dieser Fall
wird Orthohelium genannt (“orthos”, griechisch für “aufrecht”, “gerade”).
2. ψSpin ist antisymmetrisch und daher der “Singulett-Zustand” |0, 0i, d.h. der Zustand hat
Gesamtspin 0. ψOrt ist dann symmetrisch. Dieser Fall wird Parahelium genannt (“para”,
griechisch für “trotz”, “gegen[über]”).
Im Gegensatz zum Wasserstoﬀatom lässt sich das Heliumatom nicht exakt analytisch berechnen, wir müssen daher auf Störungstheorie zurückgreifen. Dazu betrachten wir H0 = H (1) +H (2)
als ungestörten Hamiltonoperator und V als Störung. Die Ortsanteile der Eigenzustände von
H (i) , i = 1, 2 sind von der Form
ψni ,li ,mi (~xi )
mit Eigenwerten
Eni = −Z 2 RHe
1
n2i
wobei RHe ' R die Rydbergkonstante von Helium ist. Bis auf die Modifikation durch die höhere
Kernladungszahl Z (und die etwas geringere reduzierte Masse durch das höhere Kerngewicht),
haben wir es also mit Eigenfunktionen und Eigenwerten des Wasserstoﬀatoms zu tun.
Wegen des Pauli-Prinzips sind die “erlaubten” Eigenzustände von H0 solche in denen der
Ortsanteil der Wellenfunktion ein (anti)symmetrisiertes Produkt der ψni ,li ,mi (~
xi ) ist. Für Parahelium kommt also nur
ψab+ (~x1 , ~x2 ) = N (ψn1 ,l1 ,m1 (~x1 )ψn2 ,l2 ,m2 (~x2 ) + ψn2 ,l2 ,m2 (~x1 )ψn1 ,l1 ,m1 (~x2 ))
infrage, wobei wir a = (n1 , l1 , m1 ) und b = (n2 , l2 , m2 ) setzen. a = b ist erlaubt. Die Energieeigenwerte dieser Zustände sind
(0)
Eab
2
= −Z RHe
1
1
+ 2
2
n1 n2
.
Der Zustand mit der niedrigsten Energie ist ψ11+ . Für Orthohelium bekommen wir hingegen
1
ψab− (~x1 , ~x2 ) = √ (ψn1 ,l1 ,m1 (~x1 )ψn2 ,l2 ,m2 (~x2 ) − ψn2 ,l2 ,m2 (~x1 )ψn1 ,l1 ,m1 (~x2 )) ,
2
wobei a = b nicht erlaubt ist. Die Energieeigenwerte dieser Zustände sind ebenfalls
(0)
Eab
2
= −Z RHe
1
1
+ 2
2
n1 n2
.
(0)
(0)
Der Zustand mit der niedrigsten Energie ist diesmal ψ21− = ψ12− . Wegen E21 > E11 ist ψ11+
der Grundzustand von H0 und ψ21− ist ein angeregter Zustand.
67
(1)
Wir wollen nun die erste Energiekorrektur Eab± berechnen
(1)
Eab± = hψab± |V |ψab± i .
Für den Grundzustand bekommt man wie erwartet eine Korrektur durch die gegenseitige Abstoßung der Elektronen. Für ψab± mit a 6= b bekommt man stattdessen
(1)
Eab± = Kab ± Aab ,
Z
d3 x1 d3 x2 |ψa (~x1 )ψb (~x2 )|2
Kab =
R6
Z
Aab =
R6
γ
,
|~x1 − ~x2 |
d3 x1 d3 x1 ψa∗ (~x1 )ψb∗ (~x2 )ψa (~x2 )ψb (~x1 )
γ
.
|~x1 − ~x2 |
Kab ist erneut die Coloumbenenergie, die erwartete Korrektur durch die gegenseitige Abstoßung der Elektronen. Aab ist hingegen die sogenannte Austauschenergie, die klassisch nicht
interpretiert werden kann sondern ein rein quantenmechanischer Eﬀekt, d.h. eine Konsequenz
des Pauliprinzips ist. Man findet für a = (1, 0, 0) und b 6= a beliebig dass Kab > 0 und Aab > 0. D.h.
die Energiekorrektur ist für das Orthohelium kleiner als für das Parahelium. Das Orthohelium –
und damit die Triplettzustände der Spins – ist also durch die gegenseitige Abstoßung der Elektronen energetisch begünstigt. Anschaulich ist das nachvollziehbar. Bei Orthohelium sind durch
die antisymmetrische Ortswellenfunktion die Elektronen im Mittel weiter voneinander entfernt
(siehe Übung), dadurch wird ihre positive Abstoßungsenergie minimiert.
Am Beispiel des Heliums sehen wir eine wichtige Konsequenz des Pauliprinzips: Auch wenn
der Hamiltonoperator keine explizit Spin-abhängigen Terme enthält, hängen die Energien von
Vielteilchensystemen wegen des Pauli-Prinzips im Allgemeinen sehr wohl von den Spins der
Teilchen ab.
1.7.4
Das Wasserstoﬀmolekül
Als nächstes wichtiges Beispiel für ein Vielteilchensystem diskutieren wir das Wasserstoﬀmolekül H2 . Dazu seien ~
xa und ~xb die Positionen der zwei Protonen und Rab = |~xa − ~xb | ihr relativer
Abstand. Der Hamiltonoperator enthält wegen der insgesamt vier geladenen Teilchen (von denen wir die Dynamik zwei, der Protonen, wie üblich außer acht lassen), zahlreiche Beiträge:
H=
P~12
γ
P~ 2
γ
γ
γ
γ
γ
−
+ 2 −
−
−
+
+
.
~ 1 − ~xa | 2m |Q
~ 2 − ~xb | |Q
~ 1 − ~xb | |Q
~ 2 − ~xa | |Q
~1 − Q
~ 2 | Rab
2m |Q
|
{z
} |
{z
}|
{z
}
=H (1)
=V
=H (2)
Erneut sehen wir, dass H mit den Spinoperatoren vertauscht. Analog zur Diskussion des Heliumatoms haben wir also die zwei Möglichkeiten: Spin-Triplett & antisymmetrische Ortswellenfunktion oder Spin-Singulett & symmetrische Ortswellenfunktion.
68
Für die Gesamtwellenfunktion haben Heitler und London den störungstheoretisch motivierten Ansatz
ψab± (~x1 , ~x2 ) =
1
(ψa (~x1 )ψb (~x2 ) ± ψb (~x1 )ψa (~x2 ))
N±
vorgeschlagen, wobei ψa , ψb respektive Eigenfunktionen von H (1) und H (2) zur Energie Ea , Eb
– d.h. Eigenfunktionen eines Wasserstoﬀatoms in Position ~
xa , ~xb – sind. Der Normierungsfaktor
N± ist
Z
N±2 = 2(1 ± |S|2 ) ,
S=
R3
d3 x ψa∗ (~x)ψb (~x) .
Wir berechnen nun die Gesamtenergie in diesen Zuständen
Eab± = hψab± |H|ψab± i = Ea + Eb +
Kab ± Aab
,
1 ± |S|2
Z
γ
d3 x1 d3 x2 |ψa (~x1 )ψb (~x2 )|2
|~x1 − ~x2 |
R6
Z
Z
γ
γ
3
2
3
2
−
d x1 |ψa (~x1 )|
−
d x2 |ψb (~x2 )|
,
|~x1 − ~xb |
|~x2 − ~xa |
R3
R3
Kab =
γ
+
Rab
Z
γ
γ|S|2
3
3
∗
∗
=
+<
d x1 d x2 ψa (~x1 )ψb (~x2 )ψa (~x2 )ψb (~x1 )
Rab
|~x1 − ~x2 |
R6
Z
Z
γ
γ
−< S ∗
d3 x1 ψa∗ (~x1 )ψb (~x1 )
−< S
d3 x2 ψb∗ (~x1 )ψa (~x1 )
,
|~x1 − ~xb |
|~x2 − ~xa |
R3
R3
Aab
erneut ist Kab ein direkt und klassisch interpretierbares Coulombintegral während die Austauschenergie Aab ein genuin quantenmechanischer Eﬀekt ist. Für den Grundzustand des Moleküls
ist sicher der Fall relevant, dass ψa und ψb die jeweiligen Wasserstoﬀgrundzustände sind. In diesem Fall kann man die Integrale analytisch oder numerisch berechnen (ein vereinfachter Fall
wird in den Übungen diskutiert). Eab± ist eine Funktion des Kernabstandes Rab . Man findet, dass
für nicht zu kleine Rab gilt, dass Aab < 0 und Kab > 0. Im Gegensatz zum Helium ist hier der
Singulettzustand energetisch bevorzugt. Das lässt sich so interpretieren, dass die Elektronen in
diesem Zustand im Mittel näher zusammen sind und sich vor allem im Mittel mit größerer Wahrscheinlichkeit zwischen den Protonen aufhalten und damit, je nach Sichtweise, die Abstoßung
der Protonen abschirmen oder aber die Protonen anziehen. Dieser Eﬀekt ist hier größer als der
positive Energiebeitrag durch die verstärkte gegenseitige Abstoßung der Elektronen.
Qualitativ ergibt sich folgendes Bild für die Abhängigkeit der Eab± von Rab . Oﬀenbar hat Eab−
ein Minimum, d.h. ein bestimmter Kernabstand ist energetisch begünstigt. Man findet, dass der
Heitler-London-Ansatz den Kernabstand und die Bindungsenergie des Wasserstoﬀmoleküls bis
auf ca 30% Abweichung korrekt wiedergibt. Erneut sehen wir, dass Spins mittels des Pauliprinzips einen großen indirekten Einfluss auf die Energieniveaus von Systemen identischer Teilchen
haben können.
69
1.7.5
Atomaufbau
Mit dem Pauliprinzip können wir auch die Grundzüge des Aufbaus des Periodensystems der
Elemente verstehen. Dazu machen wir folgende Nährungen für die Beschreibung der Elektronen
in höheren Elementen:
1. Wir vernachlässigen (wie schon beim Heliumatom) direkte Drehimpulswechselwirkungen,
d.h. z.B. Spin-Spin-Kopplungen zwischen Paaren von Elektronen.
2. Wir nehmen an, dass sich die Wirkung der Z − 1 Restelektronen auf ein betrachtetes Elek~ approximieren lässt, dass zudem von der Form
tron durch ein Potential V (Q)
e
~ = − γZ
V (Q)
~
|Q|
e < Z die eﬀektive Kernladung ist, die kleiner als Z ist weil die Restelektronen
ist, wobei Z
die Kernladung eﬀektiv abschirmen.
Mit dieser Nährung bewegt sich jedes einzelne Elektron unabhängig unter dem Einfluss des
~ und kann die möglichen Zustände ψn,l,m ,m mit n ∈ N, l ∈
eﬀektiven Coulombpotentials V (Q)
s
l
{0, 1, . . . , n − 1}, ml ∈ {−l, . . . , l}, ms = ± 21 und En,l,ml ,ms = En = −Ze2 Rn−2 einnehmen.
Man macht deshalb den Ansatz dass der Gesamtzustand aller Z Elektronen ein vollständig
antisymmetrisierter Produktzustand aus Einzelzuständen ψni ,li ,ml,i ,ms,i ist. Die Gesamtenergie
dieses Zustandes ist die Summe der einzelnen Energien Eni . Für ein vorgegebenes Z erwartet
man, dass der Grundzustand dadurch zu finden ist, dass man die Z Zustände mit der niedrigsten
Energie auﬀüllt.
70
Für n = 1 gilt l = m = 0 es gibt also zwei mögliche Zustände (Spin-Up und Spin-Down), die
Wasserstoﬀ und Helium entsprechen, bzw. allgemein die innerste “Elektronenschale” bilden.
Für n = 2 gibt es l = m = 0 (2 Zustände) und l = 1, m ∈ {−1, 0, 1} (6 Zustände), insgesamt
also acht Zustände, die die zweite Elektronenschale bilden. Für höhere Elektronenschalen gilt
das einfache Modell nicht mehr, weil u.a. Elektronen in Zuständen mit niedrigem l eine höhere
Aufenthaltswahrscheinlichkeit nahe am Kern haben, was wegen der geringeren Abschirmung
der Kernladung energetisch günstiger ist. Die Reihenfolge der höheren Schalen wird daher nicht
nur durch n sondern auch durch l bestimmt.
1.8
Energiebänder in Festkörpern
Aus der Diskussion des unendlich hohen Potentialtopfes wissen wir, dass die möglichen Energieniveaus diskret sind. Zwischen diesen diskreten Energieniveaus liegen endliche Intervalle in
denen sich gewissermaßen keine Eigenzustände des Hamiltonoperators energetisch aufhalten
können. Heuristisch ist das so zu verstehen dass Wellen an den Potentialwänden mehrfach reflektiert werden. Haben diese Wellen gerade die passende Wellenlänge und damit passenden
Impuls und passende Energie, dann können sich stehende Wellen ausbilden. Für andere Energien und damit Wellenlängen interferieren sich die Mehrfachreflektionen weg und die Ausbildung
einer stehenden Welle ist nicht möglich.
Festkörper sind im einfachsten Fall Kristalle. D.h. die Atomkerne der entsprechenden Atome
sind in einem regelmäßigen dreidimensionalen Muster angeordnet. Die Coulombpotentiale all
dieser Atomkerne addieren sich zu einem Gesamtpotential, in dem sich die Elektronen bewegen.
Auch wenn das Coulombpotential sich deutlich vom unendlichen hohen Potentialtopf unterscheidet, kann man sich die Situation heuristisch so vorstellen, dass die Elektronenwellen, zumindest
teilweise, an den Atomkernen mehrfach reflektiert werden. Daraus folgt, dass die Eigenzustände
des Hamiltonoperators zumindest zum Teil den Charakter von stehenden Wellen haben. Daher
ist es nicht überraschend, dass es in Kristallen auch endliche Energieintervalle gibt, in denen
man keine Eigenzustände des Hamiltonoperators findet. Dazwischen liegen Intervalle, in denen
sehr wohl Energieigenzustände zu finden sind. Man spricht von “erlaubten” und “verbotenen”
Zonen oder Bändern, da Elektronen (in Zuständen die sehr nahe an Energieeigenzuständen sind)
sich in den “verbotenen” Zonen energetisch nicht aufhalten “dürfen”. Die erlaubten Zonen sind
nicht diskret sondern endliche Intervalle. Man kann sich diese als überlagerung von vielen, sehr
nahe beieinander liegenden diskreten Energieniveaus vorstellen. Diese kommen dadurch zustande, dass die diskreten Niveaus der Elektronen in einzelnen Atomen durch die Nähe zu den
anderen Atomen und deren Elektronen auf verschiedene mögliche Arten und Weisen “verschoben” werden und die diskreten einzelnen Energieniveaus sich daher zu endlichen Intervallen
verbreitern.
Diese Struktur der Energieniveaus in Kristallen beeinflüsst entscheidend die physikalischen
Eigenschaften des entsprechenden Festkörpers, insbesondere ihre Fähigkeit, Strom zu leiten.
Um das zu verstehen benötigen wir den Begriﬀ der Fermienergie EF . Dieser wird im zweiten
Vorlesungsteil präzise diskutiert. An dieser Stelle reicht die folgende Definition: EF ist dadurch
71
charakterisiert, dass bei Temperatur T = 0K die Energieniveaus für E < EF vollständig mit
Elektronen besetzt sind, während die Energieniveaus für E > EF vollständig unbesetzt sind.
Man kann sich Stromleitung nun vereinfacht so vorstellen, dass Elektronen durch ein angelegtes
elektrisches Feld in benachbarte Energieniveaus “geschoben werden”. Daher unterscheidet man
folgende Materialien.
• Leiter: Die Fermienergie EF liegt in einem erlaubten Energieband, das deswegen Leitungsband genannt wird. Es stehen benachbarte Energieniveaus zur Verfügung, die Elektronen haben also “genug Platz um Strom zu leiten”.
• Isolatoren: Die Fermienergie EF liegt in einer verbotenen und sehr großen Bandlücke.
Es stehen also keine benachbarten Energieniveaus zur Verfügung, die Elektronen haben
“keinen Platz um Strom zu leiten”.
• Halbleiter: Die Fermienergie EF liegt in einer verbotenen und vergleichsweise kleinen
Bandlücke. Das erlaubte Band jeweils über/unter der Bandlücke wird Leitungs-/Valenzband
genannt. Durch eine endliche Temperatur kann die durch EF vorgegebene “Energiegrenze” aufgeweicht werden, so dass die Niveaus für EF < E . EF + kB T (kB BoltzmannKonstante, T Temperatur) teilweise besetzt sein können (dieser Sachverhalt wird im zweiten Vorlesungsteil präzise behandelt). Ist die Bandlücke klein gegen kB T , dann stehen benachbarte Energieniveaus zur Verfügung. Stromleitung ist also bei genügend hohen Temperaturen möglich.
Aus diesen Definition sollte klar sein, dass es keine scharfe Grenze zwischen Halbleitern und
Isolatoren gibt.
Nach diesen einleitenden Betrachtungen zur Existenz und Relevanz von Energiebändern in
Festkörpern werden wir nun diskutieren, wie diese im Detail zustandekommen und berechnet
werden können.
1.8.1
Gitter und reziprokes Gitter
Wie bereits angedeutet sind Festkörper im einfachsten Fall Kristalle, also regelmäßige dreidimensionale Gebilde. Für die Diskussion in diesem Abschnitt nehmen wir idealisiert an, dass
diese unendlich ausgedehnt sind und vernachlässigen damit Eﬀekte an den Kristallrändern. Die
Atomkerne in den Kristallen bilden ein Gitter. Mathematisch lässt sich ein Gitter A beschreiben
als eine Menge von Punkten A ⊂ R3 . Diese Menge wird charakterisiert durch drei primitive Vektoren {~a1 , ~a2 , ~a3 }, die linear unabhängig sind und die Eigenschaft haben, dass eine Verschiebung
des Gitters um diese Vektoren das Gitter in sich selbst überführt. Um die Definition möglichst
eindeutig zu machen, verlangen wir, dass diese Vektoren die kleinstmögliche Länge haben. Im
Fall, dass der Festkörper ein Kristall aus Atomen eines einzigen chemischen Elementes ist – auf
den wir uns der Einfachheit halber einschränken wollen –, entsprechen die primitiven Vektoren
72
dann gerade den Verbindungsvektoren zwischen einem beliebigen Atom und einer Hälfte seiner
nächsten Nachbarn.
Beispiel: Im Falle eines rechtwinkligen Gitters bei dem die Atomabstände in x-, y - und z Richtung gerade a1 , a2 und a3 betragen sind mögliche primitive Vektoren
 
a1
 

~a1 =  0 
,
0
 
0
 

~a2 = a2 
,
0
 
0
 

~a3 =  0 
.
a3
Man kann aber auch einen oder mehrere dieser Vektoren mit −1 multiplizieren und erhält wieder
einen gültigen primitiven Vektor.
Aus dieser Diskussion folgt, dass sich – in einem Koordinatensystem mit einem Gitterpunkt
im Ursprung – die Punkte im Gitter A vollständig durch die primitiven Vektoren ausdrücken
lassen:
~ ∈ R3 von der Form A
~ = n1~a1 + n2~a2 + n3~a3 mit n1 , n2 , n3 ∈ Z} .
A = {Menge aller A
Der gesamte dreidimensionale Raum R3 wird durch das Gitter in einzelne Volumina unterteilt, die
man als Volumen eines Gitteratoms interpretieren kann. Wie bereits erwähnt wählt man die Koordinaten in R3 so, dass ein Gitteratom im Ursprung liegt. Das entsprechende Volumen nennt man
Wigner-Seitz-Zelle ZA . ZA wird konkret folgendermaßen konstruiert: Man betrachtet die halben
Verbindungsvektoren ± 12 ~ai , i ∈ {1, 2, 3} vom Ursprungsatom zu seinen nächsten Nachbarn. Auf
die Enden dieser Vektoren “legt” man Ebenen, die senkrecht auf diesen Vektoren stehen. Diese Ebenen schneiden sich an gewissen Linien und bilden ein Volumen, das das Ursprungsatom
umschließt und es als Zentrum hat. Dieses Volumen ist gerade die Wigner-Seitz-Zelle.
Beispiel: Für ein eindimensionales Gitter mit Gitterabstand a gilt
h a ai
ZA = − ,
⊂ R.
2 2
Zu jeden Gitter A lässt sich ein zweites Gitter B konstruieren, das sogenannte reziproke
Gitter. Dieses ist so definiert, dass die primitiven Vektoren {~b1 , ~b2 , ~b3 } dieses Gitters
~bi · ~aj = 2πδij
erfüllen. Diese Vektoren lassen sich ausrechnen durch die Formel
iT
h
~b1 ~b2 ~b3 = 2π [~a1 ~a2 ~a3 ]−1 .
Dabei ist für drei Vektoren ~
vi , i ∈ {1, 2, 3} [~v1 ~v2 ~v3 ] die Matrix deren i-te Spalte durch ~vi gegeben
ist.
73
Beispiel: Wir betrachten ein zweidimensionales Gitter, das durch die primitiven Vektoren
(2, 0) und (0, 1) gegeben ist. Es gilt dann
h
iT
~b1 ~b2 = 2π 2 0
0 1
!−1
=π
1 0
0 2
!
1 0
=π
!T
⇒
0 2
~b1 =
π
0
!
,
~b2 =
0
!
2π
.
Wie beim Gitter selbst gilt für das reziproke Gitter
~ ∈ R3 von der Form B
~ = n1~b1 + n2~b2 + n3~b3 mit n1 , n2 , n3 ∈ Z} .
B = {Menge aller B
Die Wigner-Seitz-Zelle ZB des reziproken Gitters nennt man Brillouin-Zone. Die Relevanz des
reziproken Gitters und seiner Brillouin-Zone für die aktuelle Diskussion wird in Kürze deutlich
werden.
1.8.2
Translationoperator
Ein Gitter A ist wie besprochen invariant unter Translationen um die Vektoren ~ai , i ∈ {1, 2, 3}.
Wir erwarten, dass diese Symmetrie sich in den Wellenfunktionen der Elektronen in den Gitteratomen widerspiegelt. Um diesen Sachverhalt zu formulieren benötigen wir den Translationsoperator T (~a). Für einen beliebigen räumlichen Vektor ~a ∈ R3 wird T (~a) definiert durch seine
Wirkung auf die Wellenfunktion ψ(~
x) eines beliebigen reinen Zustandes ψ ∈ L2 (R3 ):
T (~a)ψ(~x) = ψ(~x + ~a) .
Um die Eigenschaften dieses Translationsoperators zu untersuchen, betrachten wir die Fourierzerlegung
Z
~
d3 k ψ̂(~k)eik·~x
ψ(~x) =
R3
wobei ψ̂(~k) die Fouriertransformierte von ψ(~
x) ist. Es gilt
Z
T (~a)ψ(~x) =
~
~
d k ψ̂(~k) eik·~a eik·~x =
3
Z
R3
i ~
i ~
~
d3 k ψ̂(~k) e ~ P ·~a eik·~x = e ~ P ·~a ψ(~x) ,
R3
~ = −i~∇
~ der Impulsoperator ist. Es gilt also
wobei P
i
~
T (~a) = e ~ P ·~a .
Daraus folgt, dass die Eigenwerte von T (~a) von der Form
~
~k ∈ R3
eik·~a ,
~
sind. Mögliche Eigenfunktionen zu diesen Eigenwerten sind die ebenen Wellen eik·~x . Es gibt jedoch noch anderen Eigenfunktionen zu diesen Eigenwerten. Einige davon – die sogenannten
Bloch-Wellen – spielen eine wichtige Rolle für das Verständnis der Energiebänder in Festkörpern.
74
1.8.3
Bloch-Wellen
Das System der gesamten Elektronen im Kristallgitter wird durch einen Hamiltonoperator H
beschrieben der die Wechselwirkungen der Elektronen untereinander und mit allen vorhandenen
Atomkernen an den Gitterpunkten beschreibt. Wegen der diskreten Translationssymmetrie des
Gitters muss gelten
[H, T (~a1 )] = [H, T (~a2 )] = [H, T (~a3 )] = 0 ,
d.h. der Hamiltonoperator kommutiert mit den Translationsoperatoren für die primitiven Vektoren. Wir erwarten, dass Eigenzustände von H , die gleichzeitig Eigenzustände von den T (~ai )
sind, eine ausgezeichnete Rolle spielen. Tatsächlich gilt für solche Eigenzustände von T (~ai ) wie
besprochen
~
T (~ai )ψ~k0 (~x) = ψ~k0 (~x + ~ai ) = eik0 ·~ai ψ~k0 (~x)
für einen geeigneten Vektor ~k0 . Daraus folgt sofort
|ψ~k0 (~x + ~ai )|2 = |ψ~k0 (~x)|2 ,
die Wahrscheinlichkeitsdichte in Eigenzuständen von T (~ai ) ist also invariant unter Translationen
~
um ~ai . Hier haben wir die Eigenfunktionen mit dem Vektor ~k0 indiziert, der den Eigenwert eik0 ·~ai
festlegt. Wir wollen nun die allgemeine Form dieser Eigenfunktionen ermitteln. Dazu betrachten
wir wieder die Fourierzerlegung von ψ~k (~
x) und finden
0
Z
T (~ai )ψ~k0 (~x) =
R3
Z
~
~
d3 k ψ̂~k0 (~k) eik·~ai eik·~x =
~
~
R3
~
d3 k ψ̂~k0 (~k) eik0 ·~ai eik·~x = eik0 ·~ai ψ~k0 (~x) .
Diese Identität gilt genau dann wenn unter dem Integral für alle ~k gilt
ψ̂~k0 (~k) = 0
oder
~
~
eik·~ai = eik0 ·~ai .
~ ∈ B im
Die zweite Bedingung ist genau dann für alle i ∈ {1, 2, 3} erfüllt wenn es einen Vektor B
reziproken Gitter gibt, so dass
~k = ~k0 + B
~
denn
~ · ~ai = (n1~b1 + n2~b2 + n3~b3 ) · ~ai = 2πni .
B
Es folgt also, dass die Fouriertransformierte ψ̂~k (~k) nur dann von Null verschieden sein kann,
0
~ ist. Das Fourierintegral lässt sich in diesem Fall durch eine
wenn ~k von der Form ~k = ~k0 + B
Summe über die Punkte im reziproken Gitter ausdrücken:
ψ~k0 (~x) =
X
~
B∈B
~
~
~ i(k0 +B)·~x =
ψ̂~k0 (~k0 + B)e
X
~
~
~
B∈B
|
{z
=u~k (~
x)
0
75
~
~ iB·~x eik0 ·~x = u~ (~x)eik0 ·~x .
ψ̂~k0 (~k0 + B)e
k0
}
x) ist invariant unter Translationen um ~ai für alle i ∈
Die hierbei auftauchende Funktion u~k (~
0
{1, 2, 3} denn
u~k0 (~x + ~ai ) =
~ x iB·~
~
~ iB·~
ψ̂~k0 (~k0 + B)e
e ai =
X
X
~ x i2πni
~ iB·~
ψ̂~k0 (~k0 + B)e
e
= u~k0 (~x) .
~
B∈B
~
B∈B
Funktionen von der Form “ebene Welle mal Funktion invariant unter Gittertranslationen” nennt
man Bloch-Wellen. Wir haben also bewiesen:
ψ~k0 (~x) ist Eigenfunktion zu T (~ai ), für alle i ∈ {1, 2, 3}
⇔
ψ~k0 (~x) ist eine Bloch-Welle.
Daher suchen wir im Folgenden nach Eigenfunktionen des Hamiltonoperators die gleichzeitig
Bloch-Wellen sind.
~
Wir haben die Bloch-Wellen bislang mit einem Vektor ~k0 indiziert, der den Eigenwert eik0 ·~ai
bestimmt. Für den Rest der Diskussion lassen wir den Index 0 der Einfachheit halber weg. Für
eine Bloch-Welle ψ~k (~
x) wird
p~ = ~~k
der Quasiimpuls oder Kristallimpuls genannt. Dieser ist nicht eindeutig bestimmt, denn für be~ ∈ B gilt
liebige B
~
~
~
~
~
~
ei(k+B)·~ai = eik·~ai eiB·~ai = eik·~ai e2πini = eik·~ai ,
~k ist also nur bis auf einen Vektor im reziproken Gitter bestimmt. In der Literatur hat sich folgende
Konvention allgemein durchgesetzt: Um ~k eindeutig festzulegen, bestimmt man dass ~k ∈ ZB
gelten soll, d.h. dass ~k einen Punkt in der Brillouinzone angibt. Das führt allerdings dazu, dass es
mehrere mögliche Bloch-Wellen zum selben Quasiimpuls ~~k gibt, wie wir gleich sehen werden.
1.8.4
Die quasifreie Elektronen-Approximation
Wir wollen nun die Energieniveaus des Hamiltonoperators bestimmen, der das System der Elektronen im Kristall beschreibt. Die vollständige Form des Operators enthält natürlich Coulombwechselwirkungen zwischen allen Elektronen untereinander und mit allen Atomkernen und kann
darum wegen seiner Komplexität nicht exakt analysiert werden. Man macht deshalb die vereinfachende Annahme – die sogenannte Mean-Field-Näherung (etwa “Gemittelte–Feld–Näherung”)
–, dass sich die Coulombwechselwirkungen zwischen einem ausgewählten Elektron und allen
anderen durch eine einzige eﬀektive Potentialfunktion approximieren lässt. Damit lässt sich die
gesamte potentielle Energie eines einzelnen Elektrons durch eine einzige eﬀektive Potentialfunktion V (~
x) angeben. Wegen der Gittersymmetrie muss gelten
V (~x) = V (~x + ~ai )
für alle i ∈ {1, 2, 3}. Analog zur Diskussion des translationsinvarianten Anteils u~k (~
x) einer BlochWelle folgt aus der Translationsinvarianz von V (~
x), dass V (~x) von der Form
V (~x) =
X
~ x
~ iB·~
V̂ (B)e
.
~
B∈B
76
sein muss. Da das Potential reell ist, d.h. V (~
x)∗ = V (~x), gilt außerdem
~ = V̂ (B)
~ ∗.
V̂ (−B)
Schließlich können wir ohne Beschränkung der Allgemeinheit annehmen, dass V̂ (0) = 0 ist, denn
V̂ (0) 6= 0 wäre nur eine konstante Verschiebung der potentiellen Energie die keinen Einfluss auf
die Dynamik hat.
Für das Verständnis der elektrischen Leitfähigkeit von Festkörpern sind wir vor allem an Eigenzuständen des Hamiltonoperators interessiert, deren Energie in der Umgebung der Fermienergie ist. Für ein einzelnes Atom heißt das, dass wir vor allem an relativ hochenergetischen
Elektronen in den äußeren Schalen interessiert sind. Dieses Bild ist natürlich nicht ganz korrekt,
da ein Stromfluss gerade bedeutet, dass die Elektronen delokalisiert sind und nicht mehr einem einzelnen Atom zugeordnet werden können. Dennoch kann man daraus folgern, dass die
relevanten Elektronenzustände solche sind, in denen die Wahrscheinlichkeit, dass ein Elektron
sich nahe an einem Atomkern aufhält, sehr gering ist. Für solche Elektronen ist die Abschirmung
der positiven Kernladungen durch die anderen Elektronen im Kristall besonders groß. Daher erwartet man, dass die potentielle Energie V (~
x) für solche Elektronen betragsmäßig besonders
klein ist. Das motiviert eine an die Störungstheorie angelehnte approximative Behandlung der
Wirkung des Potentials V (~
x) auf die möglichen Energieniveaus eines Elektrons im Kristall.
In nullter Ordnung Störungstheorie betrachten wir deshalb für ein einzelnes Elektron den
Hamiltonoperator
H0 =
P~ 2
~2 ∆
=−
.
2m
2m
Wir suchen nach Eigenzuständen dieses Operators, die gleichzeitig Eigenzustände der Translationsoperatoren T (~ai ) sind, da jedes noch so kleine V (~
x) mit V (~x) = V (~x + ~ai ) dem System
diese diskrete Symmetrie vorgibt. Zusammengefasst suchen wir also nach Bloch-Wellen, die
Eigenfunktionen von H0 sind. Die möglichen Energieeigenwerte indizieren wir analog zur Indizierung der Bloch-Wellen mit dem Wellenzahlvektor ~k des Quasiimpulses. Aus der stationären
Schrödingergleichung bekommen wir
~2 ∆
−
ψ~ (~x) = E~k ψ~k (~x)
2m k
⇔
⇔
⇔
X
~
B∈B
~ 2
~2 (~k + B)
E~k −
2m
~ ∈ B gilt entweder
für alle B
~ 2
~2 (~k + B)
E~k −
2m
!
~ x
~ i(~k+B)·~
ψ̂~k (~k + B)e
=0
!
~ =0
ψ̂~k (~k + B)
~ 2
~2 (~k + B)
E~k −
2m
Die Lösungen dieser Gleichung sind daher von der Form
~
~
ψ~k (~x) = Cei(k+B)·~x
77
~ ∈B
für alle B
!
=0
oder
~ = 0.
ψ̂~k (~k + B)
~ und den möglichen Energien
mit einer Konstanten C = ψ̂~k (~k + B)
E~k =
~ 2
~2 (~k + B)
.
2m
Wenig überraschend finden wir also dass freie Bloch-Wellen ebene Wellen sein müssen, wo~ ∈ B möglich sind gilt, der Impuls
bei wegen der Tatsache, dass beliebige ~k ∈ ZB und B
~ 3 beliebige Werte annehmen kann und somit alle ebenen Wellen mögliche
~ ∈ R
p~ = ~(~k + B)
Bloch-Eigenzustände sind. Im Gegensatz zum “vollständig freien” Fall ohne Gittersymmetrie gilt
allerdings nicht, dass beliebige Superpositionen der ebenen Wellen mit Impuls p
~ und −~
p immer
noch mögliche Eigenzustände von H0 sind, da wir gleichzeitig Eigenzustände der T (~ai ) haben
wollen. Tatsächlich ist
~
~
~
~
Cei(k+B)·~x + De−i(k+B)·~x
~
für D 6= 0 genau dann eine Eigenfunktion von allen T (~ai ) zum Eigenwert eik·~ai für alle i ∈ {1, 2, 3}
wenn
~
~k = − B
und, wegen der Einschränkung ~k ∈ ZB ,
2
~ = n1~b1 + n2~b2 + n3~b3 mit n1 , n2 , n3 ∈ {−1, 0, 1}
B
gilt; ~k muss also am Rande oder in der Mitte der Brillouin-Zone liegen. Insgesamt finden wir also
dass zu jedem der möglichen Energieniveaus E~k genau ein Bloch-Eigenzustand existiert, außer
wenn ~k am Rande oder in der Mitte der Brillouin-Zone liegt; in diesem Fall sind die Energieniveaus
(unendlichfach) entartet. Außerdem sehen wir, dass zu einem beliebig vorgebenen Quasiimpuls
p = ~~k wegen der Einschränkung ~k ∈ ZB undlich viele verschiedene Bloch-Eigenzustände mit
unterschiedlichen Energien existieren. Diese Energieniveaus lassen sich im eindimensionalen
Fall für ein Gitter mit Gitterabstand a und reziprokem Gitterabstand b = 2π/a graphisch darstellen in dem man die Energieparabeln jeweils um Vielfaches von b nach links und rechts verschiebt
und kopiert.
78
Das Resultat kann man auch dadurch erhalten, dass man die Energieparabel an den Rändern der Brillouinzone mehrfach “spiegelt”. Im obigen Bild sind die Schnittpunkte der Parabeln
gerade die Punkte an denen die Energieniveaus entartet sind. In drei Dimensionen muss man
entsprechend in alle drei Richtungen ~ai verfahren, die Energieparabeln müssen also an allen
“Außenwänden” der Brillouin-Zone gespiegelt werden und es ergeben sich komplexere Energieniveaus.
Um den Einfluss des Potentials V (~
x) auf diese Energieniveaus zu bestimmen, betrachten wir
zunächst den eindimensionalen Fall qualitativ. Für den speziellen Entartungspunkt k = b/2 = π/a
sind die ebenen Wellen
bx
bx
ei 2
und
e−i 2
mögliche Bloch-Eigenzustände, aber auch beliebige Linearkombinationen davon. Wir betrachten
speziell die Linearkombinationen die sich durch Summe und Diﬀerenz ergeben
πx bx
= cos
,
2
a
πx bx
−i bx
2
−e
) = sin
.
= sin
2
a
bx
1 bx
ψ+ (x) = (ei 2 + e−i 2 ) = cos
2
ψ− (x) =
1 i bx
(e 2
2i
Wie wir bereits aus allgemeinen Überlegungen wissen, sind die Wahrscheinlichkeitsdichten |ψ+ (x)|2 ,
|ψ− (x)|2 invariant unter Translation um a, d.h. sie sind periodisch mit Periode a. Wie wir in folgendem Bild sehen, hat ein Elektron im Zustand ψ± eine höhere/niedrigere Aufenthaltswahrscheinlichkeit in der Nähe der Atomkerne als ein Elektron im Zustand gegeben durch eine der
ebenen Wellen. Daher erwarten wir, dass der Einfluss des Potentials V (x) derart ist, dass die
Energie von ψ± nach unten/oben verschoben wird und damit die Energieentartung aufgehoben
wird.
Das lässt sich auch näherungsweise berechnen. Wir betrachten dafür die Schrödingergleichung für den vollen Hamiltonoperator
H = H0 + V (~x) = −
79
~2 ∆
+ V (~x) ,
2m
wobei das Potential periodisch ist und sich daher wie besprochen in ebene Wellen mit Wellenzahlvektoren aus dem reziproken Gitter zerlegen lässt. Setzen wir diese Zerlegung, sowie die
Zerlegung einer Bloch-Welle in die Schrödingergleichung ein, erhalten wir
X
~
B∈B
~ 2
~2 (~k + B)
E~k −
2m
!
~
~
X
~ i(k+B)·~x =
ψ̂~k (~k + B)e
~
~0
~ 0 )ei(k+B )·~x
ψ̂~k (~k + B
=
~ 00 ·~
x
~ 00 )eiB
V̂ (B
~ 00 ∈B
B
~ 0 ∈B
B
X
X
~ 0)
ψ̂~k (~k + B
~ 0 ∈B
B
X
~ x
~ −B
~ 0 )ei(~k+B)·~
V̂ (B
~
B∈B
~ =B
~0 + B
~ 00 gesetzt haben und die Summe
wobei wir im zweiten Schritt auf der rechten Seite B
~ 00 durch die Summe über B
~ ausgedrückt haben. Analog zum Fall V = 0 ist diese Gleichung
über B
~ ∈ B erfüllt ist:
genau dann erfüllt wenn die folgende Gleichung für alle B
~ 2
~2 (~k + B)
E~k −
2m
!
~ =
ψ̂~k (~k + B)
X
~ 0 )V̂ (B
~ −B
~ 0) .
ψ̂~k (~k + B
~ 0 ∈B
B
~ entsprechen im Fall
Diese Gleichung ist wie folgt zu interpretieren. Die Koeﬃzienten ψ̂~k (~k + B)
~ ~
V (~x) = 0 verschiedenen Bloch-Eigenzuständen ei(k+B)·~x zum gleichen Quasiimpuls ~~k . Durch
das Potential werden diese verschiedenen Zustände aneinander gekoppelt.
Wir stellen die obige Gleichung nun um und erhalten
X
~ =
ψ̂~k (~k + B)
~ 0 )V̂ (B
~ −B
~ 0)
ψ̂~k (~k + B
~ 0 ∈B
B
~ 2
~2 (~k + B)
E~k −
2m
.
Wir betrachten nun den Fall, dass E~k das durch das Potential V (~
x) gestörte niedrigste Energie2~ 2
2~ 2
k
k
, dass E~k ' ~2m
. Der Nenner auf
niveau zum Quasiimpuls ~~k ist. Dann gilt wegen V (~
x) ~2m
der rechten Seite wird also minimal und der Ausdruck auf der rechten Seite wird maximal wenn
~ 2 = ~k 2
(~k + B)
~
~ = 0 oder ~k = − B ,
B
2
⇔
~ = n1~b1 + n2~b2 + n3~b3 mit n1 , n2 , n3 ∈
wobei erneut, und für den Rest der Diskussion gilt: B
~
{−1, 0, 1}, so dass ± B2 ∈ ZB . Diese Beobachtung ist folgendermaßen zu interpretieren: die durch
~
~
das Potential V (~
x) induzierte Kopplung zwischen den ungestörten Zuständen ei(k+B)·~x ist im Fall
der untersten Energieniveaus am stärksten für die beiden Zustände
ei
~ x
B·~
2
und
e−i
~ x
B·~
2
.
Für die anderen Zustände ist sie vergleichsweise schwach und wir werden sie im Folgenden daher als Approximation vernachlässigen. Diese zwei Zustände entsprechen gerade einem möglichen Energieentartungspunkt am Rand der Brillouin-Zone, den wir im eindimensionalen Fall
80
bereits qualitativ betrachtet haben. Eine analoge Aussage gilt für alle anderen Energieentartungspunkte am Rand oder in der Mitte der Brillouin-Zone.
Für den betrachteten Entartungspunkt reduziert sich die Schrödingergleichung also (unter
Ausnutzung von V̂ (0) = 0) in guter Näherung auf das Gleichungssystem
E− B~
2
E− B~
2
~2
~2 B
−
8m
~2
~2 B
−
8m
!
~
B
2
ψ̂− B~
2
!
ψ̂− B~
2
!
~
B
−
2
~
B
−
2
= ψ̂− B~
2
!
~
B
2
= ψ̂− B~
2
!
~ ,
V̂ (B)
!
~ ,
V̂ (−B)
das wir umschreiben können als


~2
~2 B
8m


~
ψ̂− B~ − B2
 2  = 0,
~
− E− B~
ψ̂− B~ B2
~ ∗
V̂ (B)
− E− B~
2
~2
~2 B
8m
~
V̂ (B)
2
2
~ = V̂ (B)
~ ∗ verwendet haben. Diese Gleichung hat nur dann
wobei wir V (~
x)∗ = V (~x) ⇔ V̂ (−B)
eine nichttrivialle Lösung wenn die Determinante der Matrix verschwindet. Daraus folgt für die
möglichen Energieniveaus unter dem Einfluss des Potentials
E− B~ = E± =
2
~2
~2 B
~ .
± |V̂ (B)|
8m
Diese entsprechen gerade den Zuständen


~
ψ̂− B~ − B2
 2 ∝
~
ψ̂− B~ B2
2
81
∓1
1
!
d.h. den Zuständen
!
~ x
~ x
B·~
1 B·~
ψ+ (~x) = (ei 2 + e−i 2 ) = cos
2
~ · ~x
B
2
~ x
~ x
B·~
B·~
1
ψ− (~x) = (ei 2 − e−i 2 ) = sin
2i
~ · ~x
B
2
,
!
.
Wir sehen also, dass die qualitativen Überlegungen in einer Dimension richtig waren. Die Ener~ , dem Betrag der
gieniveaus der Zustände ψ± werden verringert/erhöht, und zwar um |V̂ (B)|
~
~
Fouriertransformierten des Potentials an einer bestimmten Stelle B = 2k , wobei ~k der betrachtete Entartungspunkt am Rand oder in der Mitte der Brillouin-Zone ist. Die grafische Darstellung
der Energieniveaus in der Brillouin-Zone ändert sich also folgendermaßen ab:
Die Parabeln werden an den Energieentartungspunkten in der Mitte und am Rand der BrillouinZone durch das Potential “auseinandergebogen”. Dadurch entstehen “verbotene Zonen”, im Bild
durch graue Balken markiert. Die Breite einer verbotenen Zone – die Bandlücke – ist gerade so
~ .
groß wie 2|V̂ (B)|
2
Thermodynamik und Statistik 2
2.1
Wiederholung: phänomenologische Thermodynamik
Die phänomenologische Thermodynamik beschäftigt sich mit den phänomenologischen Eigenschaften von makroskopischen Systemen im Gleichgewicht. Die dabei postulierten Gesetze und
Zusammenhänge sind zunächst rein empirisch motiviert, können aber im Rahmen der statistischen Physik (zumindest zu einem großen Teil) mikroskopisch hergeleitet werden.
2.1.1
Grundbegriﬀe
Die der phänomenologischen Thermodynamik grundlegenden empirischen Beobachtungen sind:
1. Der Zustand eines Systems (Gas, Füssigkeit, Festkörper) lässt sich durch wenige intensive
Größen charakterisieren. Das sind Größen, die in einem Gebiet, das groß im Vergleich zu
atomaren Ausdehnungen aber klein im Vergleich zur Gesamtgröße des Systems ist, gemessen werden können. Beispiele sind: Druck, chemisches Potential, Dichten, Strömungsgeschwindigkeiten, Stoﬀkonzentrationen, Temperatur. Im Gegensatz dazu gibt es extensive
Größen die das Gesamtsystem beschreiben und derart sind, dass sie sich bei Kombination
von mehreren Einzelsystemen zu einem Gesamtsystem addieren, z.B. Energie, Volumen,
Teilchenzahl, Entropie, Magnetisierung. Diese hängen von den intensiven Größen ab. In
dieser Beschreibung ist ein Zustand eines Systems zu einem Zeitpunkt t gegeben durch
82
~ ~x) dessen Komponenten Zi (t, ~x) den Wert der i-ten Zustandsgröße am
ein Vektorfeld Z(t,
Ort ~
x und zum Zeitpunkt t angeben.
2. Der Zustand eines abgeschlossenen Systems tendiert immer zu einem stationären, d.h.
zeitunabhängigen Zustand. Ein Beispiel ist der Druckausgleich der stattfindet, wenn man
einen verschlossenen, mit Gas gefüllten Behälter in ein abgeschlossenes Vakuum einbringt
~ ~x) = Z
~ (0) (~x) wobei Z
~ (0) (~x) ein Gleichgeund öﬀnet. Mathematisch heißt das limt→∞ Z(t,
wichtszustand genannt wird. Man beobachtet, dass in einem Gleichgewichtszustand das
~ (0) (~x) jeGesamtvolumen V eines Systems in mehrere Teilvolumina Vi zerfällt in denen Z
weils konstant ist. In der Diskussion von Gleichgewichtszuständen können also alle Zuständsgrößen als ortsunabhängig angesehen werden; sie können nur zwischen homogenen Subsystemen des Gesamtsystems variieren. Im Kontext eines homogenen Systems
A im Gleichgewicht unterscheiden sich intensive und extensive Grössen folgendermaßen.
Teilt man A in zwei Subsyteme A1 und A2 auf so gilt für eine intensive Größe I und eine
extensive Größe E
I(A1 ) = I(A2 ) = I(A) ,
E(A1 ) + E(A2 ) = E(A).
Oft lassen sich Zustände eines Systems durch zwei Grössen eindeutig charakterisieren,
z.B. Druck & Temperatur oder Druck & Volumen für ein Gas das aus einer festgelegten
Anzahl N 1 Atomen oder Molekülen besteht. Ist zusätzlich N variabel, muss man eine
weitere Größe, z.B. N selbst, zur eindeutigen Charakterisierung dazunehmen. Für solche
Systeme kann es allerdings passieren, dass für bestimmte Werte der Zustandsgrößen mehr
als ein Zustand existiert. Man spricht dann von unterschiedlichen koexistierenden Phasen
und die Werte der jeweiligen Zustandsgrößen markieren einen Phasenübergang, z.B. jenen
von fest nach füssig, oder, z.B. bei Wasser, den Tripelpunkt an dem die feste, flüssige und
gasförmige Phase koexistieren.
Ziel der phänomenologischen Thermodynamik ist es nun, Gleichgewichtszustände selbst und
mögliche Übergänge zwischen diesen zu charakterisieren. Dabei betrachtet man in der Regel
quasistatische Prozesse, d.h. man stellt sich vor, dass der Zustand eines Systems im Gleichgewicht sich dadurch ändert, dass man es schwach an ein zweites System im Gleichgewicht koppelt. Ein Beispiel wären zwei Gasbehälter mit unterschiedlichen Drücken, bei denen der Druckausgleich durch einen sehr dünnen Verbindungsschlauch passiert. In einem solchen Fall kann
man annehmen, dass die Änderung des Gleichgewichtszustandes derart ist, dass jeder Zwischenschritt selbst ein Gleichgewichtszustand ist. Die Alternative würde ein genaues Verständnis von Nichtgleichgewichtszuständen erfordern, das im Allgemeinen nicht einfach zu erlangen
ist.
Quasistatische Prozesse sind also eindimensionale Kurven im Raum der Zustände, den wir
uns in vielen Fällen als zweidimensionalen oder dreidimensionalen Raum parametrisiert durch
z.B. die Variablen (p, V ) beziehungsweise (p, V, N ) vorstellen können. Die Hauptsätze der Thermodynamik charakterisieren die möglichen Prozesse.
83
2.1.2
Der nullte Hauptsatz: die Existenz der Temperatur
Es seien A und B zwei Systeme die jeweils in einem Gleichgewichtszustand sind. Wir bringen
A und B in thermischen Kontakt, das heißt, dass A und B derart in Kontakt sind, dass eine
mechanische Wechselwirkung oder ein Austausch von Materie zwischen A und B nicht möglich
ist. Ein Beispiel sind zwei gasgefüllte Behälter deren Außenwände sich berühren. Wir sagen nun
dass A und B im (gegenseitigen) thermischen Gleichgewicht sind, wenn sich der Zustand von A
und B durch den Kontakt nicht ändert. Der nullte Hauptsatz besagt nun für drei Systeme A, B , C :
Ist A im thermischen Gleichgewicht mit B und B im thermischen Gleichgewicht mit C dann
ist A im thermischen Gleichgewicht mit C .
Das impliziert sofort die Existenz einer intensiven Zustandsgrösse T die man Temperatur nennt.
2.1.3
Der erste Hauptsatz: Energieerhaltung
Sind A und B zwei Systeme im thermischen Kontakt die nach dem Kontakt zunächst nicht im
thermischen Gleichgewicht sind, dann werden sich die Zustände von A und B ändern, bis Gleichgewicht herrscht. Dabei wird im Allgemeinen Energie zwischen den beiden Systemen ausgetauscht. Diese Energie nennt man Wärme Q. Bei einem allgemeinen Kontakt zwischen den Systemen A und B wird nicht nur Wärme übertragen sondern ein System kann an dem anderen z.B.
mechanische oder chemische Arbeit leisten. Jedes System besitzt eine gewisse innere Energie
E (im Gegensatz zur kinetischen oder potentiellen Energie). Bei einem abgeschlossenen System
ist die Energie erhalten. Der erste Hauptsatz besagt gerade, dass die Änderung der Energie bei
einem nicht abgeschlossenen System notwendigerweise auf Beiträge wie mechanische Arbeit
oder Wärmeaustausch zurückzuführen ist.
Zur Formulierung des ersten Hauptsatzes erinnern wir an den mathematischen Begriﬀ des
Diﬀerenzials und den Zusammenhang mit partiellen Ableitungen. Dazu betrachten wir eine
Funktion f (x, y) von zwei Variablen. Wie gesagt lassen sich Zustände von vielen homogenen
Systemen oft durch die Angabe von zwei Zustandsvariablen bereits eindeutig charakterisieren,
die anderen Zustandsgrößen sind dann notwendigerweise Funktionen dieser Variablen. Wir definieren das totale Diﬀerential df der Funktion f (x, y) als
df (x, y) =
∂f (x, y)
∂f (x, y)
dx +
dy
∂x
∂y
und interpretieren diese Grösse als die infinitesimale Änderung von f bei infinitesimaler Änderung von x und y . Rechenregeln:
d(f g) = gdf + f dg ,
d(f + g) = df + dg .
In der Thermodynamik schreibt man das oft äquivalent als
df =
∂f
∂x
dx +
y
84
∂f
∂y
dy
x
um zu betonen, dass z.B.
∂f
∂x
y
der Ableitung von f nach x mit festgehaltenem y , also
∂f (x, y)
,
∂x
entspricht. Die Motivation der expliziten Ausweisung der Variablen, die beim Ableiten “festgehalten wird”, ist folgende. Es ist in der phänomenologischen Thermodynamik oft nützlich eine
Funktion der Zustandsvariablen, d.h. eine allgemeine Zustandsgröße, durch andere äquivalente Variable auszudrücken, die man etwa leichter experimentell kontrollieren kann. Z.B. kann es
manchmal nützlich sein einen Gleichgewichtszustand durch Druck p und Volumen V zu beschreiben, ein anderes Mal kann aber eine Beschreibung durch Druck p und Temperatur T geeigneter
sein. Im ersteren Fall würde man (p, V ) als Zustandsvariablen verwenden, im letzteren (p, T ).
Die funktionale Abhängigkeit einer anderen Zustandsgröße hängt natürlich von der Wahl dieser
Variablen ab und das gilt auch für ihre partiellen Ableitungen, die selbst Zustandsgrößen sind.
Beispiel: Es sei f (x, y) = xy 2 . Wir wollen f durch die Variablen u, y ausdrücken, wobei u =
u(x, y) = xy ist. Dazu bemerken wir dass x = u/y und damit f˜(u, y) = f (x(u, y), y) = uy . Es gilt
also
∂f (x, y)
= 2xy ,
∂y
∂ f˜(u, y)
= u.
∂y
In der Thermodynamik hat sich die Schreibweise durchgesetzt, dass f˜ auch als f geschrieben
wird da es dieselbe Funktion ist, bzw. physikalische Zustandsgröße ist, die nur durch andere
Variablen ausgedrückt wird. Man identifiziert daher (in diesem Beispiel und sonst analog)
∂f
∂y
x
∂f (x, y)
'
,
∂y
∂f
∂y
'
u
∂ f˜(u, y)
.
∂y
Drückt man nun (∂f /∂y)u als Funktion von (x, y) aus, findet man
∂f
∂y
= u = xy 6= 2xy =
u
∂f
∂y
.
x
Es wird also deutlich, dass es eine wichtige Rolle spielt, welche Größe man beim partiellen Ableiten “festhält”, d.h. genauer welche Grössen man als weitere Variablen wählt, da sich partielle
Ableitungen in verschiedenen Koordinatensystemen im Allgemeinen unterscheiden und damit
im Allgemeinen unterschiedlichen physikalischen Zustandsgrößen entsprechen.
Neben den oben erwähnten totalen Diﬀerentialen spielen auch allgemeine Diﬀerentiale eine
wichtige Rolle. Diese sind bei der Wahl der Variablen (x, y) von der Form
α(x, y) = αx (x, y)dx + αy (x, y)dy
85
Man kann zeigen, dass (auf einem sternförmigen Gebiet) α genau dann ein totales Diﬀerential
ist – d.h. es gibt eine Funktion f (x, y) mit α = df –, wenn
∂αy (x, y)
∂αx (x, y)
=
.
∂y
∂x
Diese Bedingung ist analog zur Bedingung, dass (αx , αy ) die Komponenten eines konservativen
(Kraft-)Feldes in zwei Raumdimensionen sind. f mit α = df wäre dann das Potential zu diesem
Feld.
Der Unterschied zwischen allgemeinen und totalen Diﬀerentialen ist folgender. Wir betrachten eine Kurve γ in einem zweidimensionalen Raum, z.B. einen thermodynamischen Prozess. Es
lässt sich zeigen, dass das Integral eines Diﬀerentials α entlang dieser Kurve genau dann nur
von Start- und Endpunkt der Kurve abhängt wenn α ein totales Diﬀerential ist.
Beispiel: Wir betrachten die Variablen (p, V ) und die zwei stückweise geraden Kurven γ1 :
(p0 , V0 ) → (p0 , V1 ) → (p1 , V1 ), γ2 : (p0 , V0 ) → (p1 , V0 ) → (p1 , V1 ), sowie das Diﬀerential δA =
−pdV . δA entspricht der infinitesimalen mechanischen Arbeit, die benötigt wird um das Volumen
V einen Systems mit Druck p um dV zu vergrößern (also δA > 0 bei p > 0 und Kompression).
Oﬀenbar ist δA kein totales Diﬀerential, da
δA = −pdV = −pdV + 0dP ,
∂(−p)
= −1 6= 0 .
∂p
Tatsächlich gilt
Z
Z
δA = −p0 (V1 − V0 ) 6= −p1 (V1 − V0 ) =
γ1
δA .
γ2
Andererseits gilt für das totale Diﬀerential α = df mit f (p, V ) = −pV
Z
Z
d(−pV ) = −
γ1
Z
pdV −
γ1
V dp = −p0 (V1 − V0 ) − V1 (p1 − p0 ) = −V1 p1 + V0 p0 =
γ1
Z
= −p1 (V1 − V0 ) − V0 (p1 − p0 ) =
d(−pV ) .
γ2
Wir sehen also, dass die an einem System geleistete Arbeit prozessabhängig ist. Der Anfangsund Endzustand von Prozessen mit gleichen Start- und Endpunkt und die damit zusammenhängenden Zustandsgrößen sind allerdings per Definition prozessunabhängig. Daraus folgt:
• Die infinitesimale Änderung von Zustandsgrößen Z (z.B. Energie, Temperatur, Druck, ...)
bei einer infinitesimalen Zustandsänderung wird durch ein totales Diﬀerential dZ ausgedrückt.
• Die infinitesimalen Änderung von prozessabhängigen Größen P (z.B. geleistete mechanische Arbeit A, Wärmeübertrag Q, geleistete chemische Arbeit C ) wird durch ein Diﬀerential
δP ausgedrückt das nicht total ist.
86
Wir können nun den ersten Hauptsatz formulieren als
dE = δA + δQ + δC = δQ − pdV + µdN
wobei δC = µdN die chemische Arbeit ist und µ das chemische Potential. D.h. µ ist die Arbeit, die
geleistet werden muss um bei konstantem Druck und konstanter Temperatur die Teilchenzahl
des betrachteten (hier der Einfachheit halber einatomigen) Systems um eins zu erhöhen. Im
allgemeinen kann es noch weitere (z.B. elektromagnetische) Beiträge zur Änderung der Energie
geben.
Der erste Hauptsatz kann auch als Definition von δQ und damit der Wärme aufgefasst werden. Dabei werden reversible Prozesse dadurch definiert, dass für ein abgeschlossenes System
δQ = 0 gilt. Im Gegensatz dazu gilt für irreversible Prozesse δQ 6= 0. Prozesse mit δQ = 0
werden auch adiabatisch genannt. Der Unterschied zwischen den Begriﬀen adiabatisch und irreversibel besteht im Wesentlichen darin, dass “adiabatisch” auch oft für ein Teilsystem eines
Gesamtsystems gebraucht wird, z.B. wenn ein zu betrachtendes System an ein “externes” System gekoppelt wird, während wir hier den Standpunkt einnehmen wollen, dass “irreversibel”
nur für abgeschlossene Systeme ein sinnvoller Begriﬀ ist.
2.1.4
Der zweite Hauptsatz: Entropie und irreversible Prozesse
Wie bereits diskutiert existieren in der phänomenologischen Thermodynamik irreversible Prozesse. Im zweiten Hauptsatz werden diese genauer charakterisiert. Es gibt unterschiedliche Äquivalente Formulierungen dieses Satzes. Die Version von Clausius lautet:
Es gibt keine Zustandsänderung, die allein darin besteht, dass Wärme von einem Wärmespeicher mit T1 auf einen Wärmespeicher mit T2 > T1 übergeht.
Die Formulierung von Kelvin lautet hingegen:
Es gibt keine Zustandsänderung, die allein darin besteht, dass eine Wärmemenge einem
Wärmespeicher entzogen und vollständig in Arbeit umgesetzt wird.
Die Äquivalenz der Formulierungen kann man folgendermaßen sehen. Angenommen die Bedingung von Kelvin ist verletzt, dann könnte man dem kalten Reservoir Wärme entziehen, vollständig in mechanische Arbeit umwandeln, und das warme Reservoir, z.B. durch Reibung, erhitzen; die Bedingung von Clausius wäre also auch verletzt. Umgekehrt nehmen wir an, dass diese
verletzt ist. Dann kann man eine Maschine konstruieren, die nacheinander 1) einem Reservoir
mit T2 die Wärmemenge Q2 entnimmt, 2) die mechanische Arbeit A leistet und gleichzeitig dem
Reservoir mit T1 < T2 die Wärmemenge Q1 zuführt und 3) diese Wärmemenge dem System mit
T2 zurückführt. Wegen des ersten Hauptsatzes gilt A = Q2 − Q1 und die Maschine hat bei einem
vollen Zyklus die Wärmemenge Q2 − Q1 vollständig in die mechanische Arbeit A überführt.
Eine weitere äquivalente Formulierung des zweiten Hauptsatzes bzw. eine Konsequenz ist
die Existenz einer Zustandsgröße S – die Entropie –, die folgende Bedingungen erfüllt und irre87
versible Prozesse quantitativ charakterisiert:
1. Bei irreversiblen Prozessen gilt für ein abgeschlossenes System dS > 0 (die Entropie erhöht
sich), bei reversiblen Prozessen gilt für ein abgeschlossenes System dS = 0 (die Entropie
ändert sich nicht).
2. S ist extensiv.
Durch diese Bedingungen wird S bis auf eine additive Konstante (und eine Einheit) festgelegt.
Tatsächlich folgt aus δQ = 0 für reversible Prozesse, dass
dS = βδQ
wobei β eine Funktion der Zustandsvariablen ist. β wird integrierender Faktor genannt, weil
durch Multiplikation mit β aus dem nicht-totalen Diﬀerential δQ ein totales Diﬀerential dS wird.
Anders gesagt, schaﬀt man es durch die Einführung der Entropie die prozessabhängige Größe
Q durch eine prozessunabhängige Zustandsgröße S auszudrücken. Man kann durch weitere
Überlegungen zeigen, dass β = 1/T die inverse (absolute, thermodynamische) Temperatur T ist.
Genaugenommen wird durch dS = δQ/T die thermodynamische Temperatur T erst vollständig
und systemunabhängig definiert.
Die infinitesimale Änderung der inneren Energie gemäß des ersten Hauptsatzes lässt sich
also umschreiben als
dE = T dS − pdV + µdN .
Das ist die sogenannte Gibbs’sche Fundamentalform.
Als Beispiel betrachten wir den thermischen Kontakt zweier Systeme die jeweils im Gleichgewicht sind mit jeweiligen Temperaturen T1 < T2 . Aus den Eigenschaften der Entropie und der
Irreversibilität des Temperaturausgleichs folgt
dS =
δQ1 δQ2
+
>0
T1
T2
wobei δQ1 und δQ2 die jeweils ausgenommenen Wärmemengen bei einem infinitesimalen Temperaturausgleichsprozess sind. Wegen Energieerhaltung und dem Fehlen von mechanischer und
chemischer Arbeit gilt δQ1 + δQ2 = 0 und damit
dS = δQ1
1
1
−
T1 T2
>0
⇒
δQ1 > 0
(da T2 > T1 ).
Die Forderung dS > 0 impliziert also, dass das wärmere System Wärme an das kältere abgibt.
An diesem Beispiel wird auch deutlich, dass die Entropie eines Subsystems durchaus abnehmen
kann. Die Forderung dS ≥ 0 gilt nur für abgeschlossene Systeme.
88
2.1.5
Der dritte Hauptsatz: Unerreichbarkeit des Temperaturnullpunktes
Nernst hat beobachtet, dass die Entropie eines Systems (eines perfekten Kristalls) nahe am
Temperaturnullpunkt eine universelle Größe ist, die nicht von den anderen (über die Temperatur hinaus zur eindeutigen Charakterisierung eines Zustandes benötigten) Zustandsvariablen
~ abhängt. Da S durch den zweiten Hauptsatz nur bis auf eine additive Konstante festgelegt
Z
ist, kann man die universelle Entropie bei T = 0 als S = 0 festlegen. Diese Tatsache lässt sich
mathematisch als dritten Hauptsatz formulieren:
~ = 0.
lim S(T, Z)
T →0
Zusätzlich fordert man oft, dass diese Eigenschaft auch für die partiellen Ableitungen von S gilt:
lim
T →0
~
∂S(T, Z)
∂Zi
!
= 0.
T,Zj6=i
Diese Tatsache impliziert, dass die mögliche Entropieentnahme durch Prozesse nahe am absoluten Temperaturnullpunkt ebenfalls immer kleiner wird. Diese Prozesse sind aber nötig, um ein
Teilsystem immer weiter abzukühlen. Es folgt also, dass es nicht möglich ist in endlicher Zeit
bzw. endlich vielen Prozessschritten ein Teilsystem auf T = 0 abzukühlen. Diese Tatsache folgt
nicht bereits aus dem zweiten Hauptsatz nach Clausius. Dieser besagt nämlich zunächst nur,
dass ein reiner Wärmeübertrag von einem kalten zu einem warmen System unmöglich ist. Die
Möglichkeit, dass dieses unter gleichzeitiger Verrichtung von Arbeit passiert, ist zunächst nicht
explizit ausgeschlossen.
2.1.6
Gleichgewichtsbedingungen und Konkavität/Konvexität
Die Entropie ist im Gleichgewicht maximal in folgenden Sinn. Wir betrachten zwei Systeme A1
und A2 die jeweils im Gleichgewicht sind. Die Gleichgewichtszustände der Systeme werden je~ i = (Ei , Vi , Ni ), i = 1, 2 eindeutig bestimmt. Wir bringen die
weils durch die Zustandsvariablen Z
beiden Systeme in Kontakt (z.B. thermisch oder mechanisch) und nehmen an, dass sie vor dem
Kontakt nicht miteinandeinder im Gleichgewicht waren. Der Prozess des z.B. Druck- oder Temperaturausgleichs nach dem Kontakt ist irreversibel, daher wächst die Entropie diesem Prozess
an und wird im Gleichgewicht maximal. Konkret bedeutet das folgendes. Die Systeme können
bei der Einstellung des Gleichgewichts z.B. Energie oder Volumen austauschen und haben im
~0, Z
~ 0 mit
Gleichgewicht die neuen Zustandsvariablen Z
1
2
~
~ 10 + Z
~ 20 = Z
~1 + Z
~2 = Z
Z
Also gilt nach der Einstellung des Gleichgewichts
~ = S(Z
~ 10 ) + S(Z
~ 20 ) = S(Z
~ 10 ) + S(Z
~ −Z
~ 10 ) .
S(Z)
89
~ als Funktion von Z
~ 0 im Gleichgewicht maximal wird. InsMaximalität bedeutet jetzt, dass S(Z)
1
besondere gilt dann im Vergleich zur Vorgleichgewichtssituation
~ ≥ S(Z
~ 1 ) + S(Z
~2) .
S(Z)
Diese Aussage lässt sich natürlich für beliebig viele Systeme verallgemeinern.
Wenn man annimmt dass
∂S
∂E
=
V,N
1
>0
T
⇔
T >0
also dass S(E, V, N ) eine streng monotone Funktion der inneren Energie ist, dann folgt aus der
Maximalität der Entropie die Minimalität der inneren Energie im Gleichgewicht nach Prozessen
bei denen sich S , V und N nicht ändern. Das ist wie folgt zu sehen. Wir betrachten wieder zwei
Systeme A1 und A2 die jeweils im Gleichgewicht sind. A1 und A2 werden in Kontakt miteinander und mit einem dritten System B (einem “Bad”) gebracht. Es stellt sich (quasistatisch) ein
Gleichgewicht zwischen allen drei Systemen A1 , A2 und B ein, wobei B während dieses Prozesses ständig als sich im Gleichgewicht befindend angenommen wird. Der Kontakt ist derart, dass
S1∪2 = S(A1 ) + S(A2 ) sich beim Übergang zum wechselseitigen Gleichgewicht aller Systeme
nicht ändert, während S(B) sich sehr wohl ändern kann. Da A1 ∪ A2 ∪ B abgeschlossen ist, ist
E = E1∪2 + E(B) erhalten und wir nehmen an, dass ein Austausch von V, N zwischen A1 und A2
möglich ist, nicht aber zwischen A1 ∪ A2 und B . Nachdem alle drei Systeme im Gleichgewicht
sind, ist S1∪2 + S(B) maximal. Wegen (∂S(B)/∂E(B))V (B),N (B) > 0 muss E(B) auch maximal
sein, darum ist E1∪2 minimal. Hierbei ist zu beachten dass “E(B) maximal” kein Widerspruch
zum abgeleiteten Resultat ist, da B sich ständig im Gleichgewicht befunden hat.
Aus der Maximalität der Entropie folgt eine wichtige Eigenschaft für die Entropie eines einzelnen Systems. Dazu betrachten wir ein System A dessen Zustand durch die extensiven Variablen
E, V, N festgelegt ist. Für ein kombinbiertes System aus λ Kopien des Systems A gilt wegen der
Extensivität der Entropie
S(λE, λV, λN ) =
λ
X
S(E, V, N ) = λS(E, V, N ) ,
i=1
d.h. die Entropie ist homogen für beliebige λ ∈ [0, ∞)16 . Analog sind alle extensiven Zustandsgrößen homogene Funktionen extensiver Zustandsvariablen.
Aus der Maxmimalität der Entropie folgt nun, dass die Entropie eine konkave Funktion der
~ = (E, V, N ) beextensiven Zustandsgrößen ist. Und zwar können wir ein Gesamtsystem mit Z
~
~
~
liebig aus zwei kleineren Kopien mit Z = λZ1 + (1 − λ)Z2 , λ ∈ (0, 1) zusammensetzen. Es gilt
also
~ 1 ) + (1 − λ)S(Z
~ 2 ) = S(λZ
~ 1 ) + S((1 − λ)Z
~ 2 ) ≤ S(λZ
~ 1 + (1 − λ)Z
~2) .
λS(Z
|{z}
|{z}
Hom.
Max.
16
Aus der Homogenität für natürliche Zahlen kann man unter der Annahme dass S für alle positiven reellen E, V, N
definiert und stetig ist zunächst die Homogenität für inverse natürliche Zahlen, dann die Homogenität für rationale
Zahlen und aus der angenommenen Stetigkeit schließlich die Homogenität für beliebige relle Zahlen folgern.
90
~ 1 und Z
~ 2 so wählen können, dass
Es gilt nicht notwendigerweise das Gleichheitszeichen, da wir Z
im jeweils dazugehörigen Gleichgewichtszustand z.B. die Temperaturen T1 und T2 unterschied~ 1 und Z
~ 2 , und damit auch die Systeme mit λZ
~ 1 und (1−λ)Z
~2,
lich sind, so dass die Systeme mit Z
im Allgemeinen nicht im Gleichgewicht miteinander sind.
Analog zu der Tatsache, dass die Maximalität der Entropie impliziert, dass S(E, V, N ) eine
konkave Funktion ist, impliziert die Minimalität der inneren Energie, dass E(S, V, N ) eine konvexe Funktion ist. Für eine konvexe Funktion f (x) einer Variablen die zweimal diﬀerenzierbar ist
gilt ∂ 2 f (x)/∂x2 ≥ 0. Für eine konvexe Funktion f (x1 , . . . , xn ) mehrerer Variablen gilt analog, dass
die Matrix der zweiten Variablen ∂ 2 f (x)/(∂xi ∂xj ) positiv semidefinit ist, d.h. alle Eigenwerte sind
≥ 0. Insbesonder impliziert das für die Diagonalelemente ∂ 2 f (x)/∂x2i > 0.
2.1.7
Zustandsgleichungen und thermodynamische Potentiale
Wie besprochen lassen sich Gleichgewichtszustände oft durch zwei oder drei Zustandsvaria~ eindeutig charakterisieren. Die anderen Zustandsgrößen sind dann notwendigerweise
blen Z
~ . Die Form dieser Funktionen bzw. allgemein die Relation zwischen anderen
Funktionen von Z
~ wird durch Zustandsgleichungen festgelegt.
Zustandsgrössen und Z
Beispiel: für das ideale Gas gilt die Relation
pV = N kT
wobei k die Boltzmann-Konstante
k = 1.38064852(79) × 10−23 J · K−1
~ = (p, V, N ) als Zustandsvariablen ergibt sich die thermische Zustandsist. Betrachtet man Z
gleichung
T (p, V, N ) =
pV
.
Nk
Aus dem Gleichverteilungssatz der klassischen statistischen Mechanik bekommt man die kalorische Zustandsgleichung
E(T, V, N ) =
f
N kT
2
wobei f die Anzahl der Freiheitsgrade eines Gasteilchens ist z.B. f = 3 bei einem einatomigen
Gas.
Bei der Beschreibung eines Gases als ideales Gas macht man unter anderen folgende vereinfachte Annahmen, die in vielen Situationen nicht gültig sind.
1. Man vernachlässigt die attraktive Wechselwirkung der Gasteilchen untereinander.
2. Man vernachlässigt das endliche Volumen der einzelnen Gasteilchen und nimmt diese als
punktförmig an. Genaugenommen impliziert das, dass man eine repulsive Wechselwirkung
der Gasteilchen untereinander vernachlässigt.
91
Reale Gase werden daher besser durch die van der Waals-Gleichung beschrieben, die die thermische Zustandsgleichung des idealen Gases verallgemeinert.
T (p, V, N ) =
1
k
aN 2
V
p+ 2
−b
V
N
Dabei sind a ≥ 0 und b ≥ 0 materialabhängige Konstanten, die das endliche Volumen (b) und die
gegenseitige Wechselwirkung der Gasteilchen (a) parametrisieren. In der Literatur findet man
verschiedene äquivalente Schreibweisen der van der Waals-Gleichung. Wichtig für das Verständnis ist die physikalische Bedeutung der Korrekturterme. Die das passende erweiterte kalorische
Zustandsgleichung ist
E(T, V, N ) =
f
aN 2
N kT −
.
2
V
Wie wir später sehen werden, ist die van der Waals-Gleichung auch nur eine Nährung an die
reale Situation, die in manchen Fällen nicht zutriﬀt. Daher nennen wir das durch diese Gleichung
beschriebene System van der Waals-Gas.
Analog zur klassischen Mechanik und Elektrodynamik sind thermodynamische Potentiale Zustandsgrößen aus denen sich Zustandsgleichungen für andere Zustandsgrößen als partielle Ableitungen ergeben. Wir haben bereits zwei thermodynamische Potentiale kennengelernt. Zum
einen die innere Energie E . Aus der Gibbs’schen Fundamentalform
dE = T dS − pdV + µdN
folgen die Zustandsgleichungen
T (S, V, N ) =
∂E
∂S
p(S, V, N ) = −
,
V,N
∂E
∂V
,
µ(S, V, N ) =
S,N
∂E
∂N
.
S,V
~ = (S, V, N ) angesehen, da diese
Dabei wird E als Funktion der extensiven Zustandsvariablen Z
Variablen im totalen Diﬀerential als Diﬀerentiale auftauchen. Daher nennt man (S, V, N ) die natürlichen Variablen von E . Oﬀensichtlich bekommt man aus E Zustandsgleichungen die Größen
ebenfalls als Funktionen dieser natürlichen Variablen ausdrücken. Ein weiteres thermodynamisches Potential ist die Entropie S selbst mit natürlichen Variablen (E, V, N ). Es gilt
p
µ
1
dE + dV − dN
T
T
T
dS =
und damit
T (E, V, N ) =
∂S
∂E
−1
,
p(E, V, N ) = T (E, V, N )
V,N
µ(E, V, N ) = −T (E, V, N )
∂S
∂N
∂S
∂V
,
E,N
.
E,V
Oﬀensichtlich kann man für eine Zustandsgrösse verschiedene Zustandsgleichungen erhalten,
je nach Wahl der Zustandsvariablen. Abhängig von der betrachteten physikalischer Situation
92
kann man einige Zustandsvariablen gut kontrollieren und andere nicht. Darum ist es hilfreich,
wenn man beliebige Paare der Größen (p, V, T, S) bzw. beliebige Tripel der Größen (p, V, T, S, µ, N )
als Zustandsvariablen verwenden kann. Eine mathematische Vorschrift um ausgehend von der
inneren Energie E(S, V, N ) eine extensive Variable (S, V, N ) durch eine intensive Variable (T, p, µ)
zu ersetzen, die (bis auf ein Vorzeichen bei p) gerade die partielle Ableitung von E nach der extensiven Variable ist, ist die Legendre-Transformation.
Als Beispiel betrachten wir eine diﬀerenzierbare und konvexe Funktion f (x, y). Wir setzen
∂f (x, y)
u(x, y) =
=
∂x
∂f
∂x
.
y
Wenn f (x, y) konvex ist, dann lässt sich die obige Gleichung nach x eindeutig auflösen und man
bekommt x(u, y) als Funktion von u und y . Als Gegenbeispiel betrachten wir f (x, y) = sin(x)y .
Diese Funktion ist nicht konvex und tatsächlich kann man
∂f (x, y)
u(x, y) =
=
∂x
∂f
∂x
= − cos(x)y
y
nicht eindeutig nach x auflösen. Für ein konvexes f definieren wir die Legendre-Transformierte
von f bezüglich x als
g(u, y) = ux(u, y) − f (x(u, y), y) .
Es gilt, dass g(u, y) wieder eine konvexe Funktion ist und dass f die Legendre-Transformierte von
g bezüglich u ist. Um zu “kontrollieren”, dass g(u, y) wirklich nicht mehr (explizit) von x abhängt
berechnen wir
∂f
∂f
∂f
dx +
dy = udx +
dy
df =
∂x y
∂y x
∂y x
∂f
∂f
dy = xdu +
dy .
dg = d(ux − f ) = xdu + udx − df = xdu + udx − udx +
∂y x
∂y x
Es gilt also
∂g
∂x
=0
u,y
und g hängt damit nur via u und y von x ab, x ist also keine natürliche Variable für g . Als Beispiel
betrachten wir die Enthalpie
H = E + pV .
Diese ist die negative Legendretransformierte von E bezüglich V . Folglich gilt
dH = dE + pdV + V dp = T dS + V dp + µdN = δQ + V dp + µdN
und H ist eine Funktion der natürlichen Variablen (S, p, N ). Da −H konvex ist ist H konkav. Die
Enthalpie ist eine wichtige Größe in der Chemie. Bei chemischen Reaktionen gilt häufig dp = 0
(isobarer Prozess) und dN = 0 und damit dH = δQ. Daher entscheidet das Vorzeichen von dH
ob es sich bei einer Reaktion (also einem Prozess) um eine endotherme oder eine exotherme
Reaktion handelt, d.h. ob Wärme aufgenommen oder abgegeben wird.
93
Eine wichtige Größe in der Thermodynamik sind Wärmekapazitäten. Anschaulich geben diese den infinitesimalen Wärmeübertrag bei Änderung der Temperatur und Festhalten der übrigen Variablen an. Da die Wärme selbst keine Zustandsgröße ist, muss man ein entsprechendes
thermodynamisches Potential wählen, dass bei Festhalten der übrigen Variablen gerade δQ entspricht. Beispiel: die isobare (p konstant) und isochore (V konstant) Wärmekapazität ist definiert
als
CV =
∂E
∂T
,
Cp =
V,N
∂H
∂T
.
p,N
Analog zur Enthalpie lassen sich durch alle möglichen Legendre-Transformationen folgende
thermodynamischen Potentiale konstruieren.
Thermodyn. Potantial
Definition
innere Energie
Totales Diﬀerential
Natürliche Variablen
dE = T dS − pdV + µdN
S, V, N
dS =
Entropie
1
T dE
+
p
T dV
−
µ
T dN
E, V, N
freie Energie
F = E − TS
dF = −SdT − pdV + µdN
T, V, N
Enthalpie
H = E + pV
dH = T dS + V dp + µdN
S, p, N
freie Enthalpie / Gibbs-Energie
G = F + pV
dG = −SdT + V dp + µdN
T, p, N
großkan. Potential
Ω = F − µN
dΩ = −SdT − pdV − N dµ
T, V, µ
Diese sind entweder konvex (E , G, Ω) oder konkav (S , F , H ) und sind analog zur inneren Energie
wegen der Maximalität der Entropie minimal bei Prozessen bei denen die natürlichen Variablen
festgehalten werden. Daher sind die freie Energie und das großkanonische Potential von besonderer Bedeutung für die statistische Mechanik, da sie minimal werden bei Prozessen bei denen
bei konstantem V und T Energie (F ) oder Energie und Teilchen (Ω) ausgetauscht werden.
2.2
Phasengleichgewichte und Phasenübergänge
Wir betrachten ein System dessen Gleichgewichtszustände generisch durch die intensiven Variablen (p, µ, T ) eindeutig festgelegt sind. In diesem Zusammenhang bedeutet “generisch” dass
(nur) in Ausnahmen für bestimmte Werte dieser Variablen kein eindeutiger Zustand existiert.
Gibt es in einem solchen Fall ϕ > 1 mögliche Zustände, spricht man von ϕ koexistierenden
Phasen und man muss an diesen Punkten im Zustandsraum eine weitere, allerdings diskrete,
Variable α ∈ {1, . . . , ϕ} einführen um mit (p, µ, T, α) einen Zustand eindeutig zu charakterisieren.
Beispiel: Wasser hat bei Normaldruck einen Siedepunkt von T = 373K. Für (unter anderem)
diese Werte von p und T koexistieren also die flüssige und die gasförmige Phase von Wasser.
Wir betrachten ein System im Gleichgewicht, das in ϕ Phasen vorliegt. Wir denken uns das
~ = (E, V, N )
System in ϕ Teilsysteme zerlegt, die den homogenen Phasen entsprechen. Sind Z
94
die extensiven Zustandsgrößen des Gesamtsystems gilt
~=
Z
ϕ
X
~α .
Z
α=1
~ nach Phasen ist eindeutig. Wäre sie das nicht, dann könnte man die
Dieser Zerlegung von Z
unterschiedlichen Phasen nicht eindeutig anhand von Zustandsgrößen unterscheiden bzw. iden~ α linear unabtifizieren. Mathematisch bedeutet die eindeutige Zerlegung, dass die Vektoren Z
hängig sind. Da das Gesamtsystem nach Annahme im Gleichgewicht ist, sind die intensiven
Variablen (p, µ, T ) in allen Phasen identisch.
~ α einer jeden Phase individuell skalieren, d.h. jede
Wir können nun die extensiven Variablen Z
Phase vergrößern oder verkleinern, ohne das Gleichgewicht zu stören. In Formeln bedeutet das,
~ 0 von der Form
dass alle Z
~0 =
Z
ϕ
X
~α .
λα Z
α=1
für beliebige λα > 0 einen Gleichgewichtszustand mit den gleichen intensiven Größen (p, µ, T )
und der gleichen Anzahl ϕ von koexistierenden Phasen charakterisieren. Bei vorgegebenen Werten für (p, µ, T ) und ϕ bilden die dazugehörigen Gleichgewichtszustände also einen Kegel im
~ α ist dieser Kegel
dreidimensionalen Zustandsraum. Wegen der linearen Unabhängigkeit der Z
ϕ-dimensional. Daraus folgt sofort, dass in der betrachteten Situation nie mehr als drei Phasen
koexistieren können.
Da alle Phasen nach Annahme miteinander im Gleichgewicht sind, gilt für die Entropie
~ 0) =
S(Z
ϕ
X
~α) .
λα S(Z
α=1
Im Koexistenzkegel der Phasen im Zustandsraum ist die Entropie also nicht strikt konkav sondern
linear.
Man kann sich nun fragen, wieviel Spielraum es für (p, µ, T ) bei vorgegebem ϕ gibt. Konkret
fragt man nach der möglichen Freiheit den ϕ-dimensional Kegel von Zuständen mit ϕ koexistierenden Phasen im dreidimensionalen Zustandsraum zu verschieben. Diese ist gerade durch die
Anzahl
3−ϕ
von zu dem Kegel transversalen Richtungen gegeben (Gibbs’sche Phasenregel). Bei drei koexitierenden Phasen gibt es also einen ausgezeichneten Punkt (p0 , µ0 , T0 ) an dem Koexistenz
herrscht. Weicht man von diesem Punkt ein wenig ab, können nur noch maximal zwei Phasen
koexistieren; ein Beispiel ist der Tripelpunkt von Wasser. Bei zwei koexistierenden Phasen gibt
es eine mögliche transversale Richtung. Es gibt also z.B. Funktionen p(T ) und µ(T ) so dass für
ein gewisses Temperaturintervall für alle Werte (p(T ), µ(T ), T ) zwei Phasen koexistieren. In einem p-T -Diagramm wäre das eine Kurve; ein Beispiel ist die Dampfdruckkurve von Wasser. Beim
95
generischen Fall ϕ = 1 gibt es z.B. eine Funktion µ(p, T ) die µ einschränkt, aber keine Einschränkungen an (p, T ) (außer natürlich die Einschränkung, dass man von den Koexistenzkurven oder
-punkten fernbleibt).
Diese Überlegungen lassen sich verallgemeinern auf ein Stoﬀgemisch von k verschiedenen
Stoﬀen mit Teilchenzahlen N1 , . . . , Nk . Dann gibt es 2 + k − ϕ freie Richtungen im Zustandsraum
und es können maximal 2 + k Phasen koexistieren.
2.2.1
Phasenübergang flüssig/gasförmig beim van der Waals-Gas
Als Beispiel für Phasenkoexistenz bzw. einen Phasenübergang betrachten wir das van der WaalsGas. Wir definieren die extensiven Größen pro Teilchen
E
,
N
S
V
,
v=
.
N
N
Für die Diskussion spielen nur diese eine Rolle. N selbst ist nicht relevant, da für N 1 die
e=
s=
genaue Größe des Systems für die Vorgänge unerheblich ist.
Die Isothermen des van der Waals-Gases für T /Tkr = 0.8, 0.9, 1, 1.1, 1.2
In den neuen Größen lauten die thermische und kalorischen Zustandsgleichungen
T (v, p) =
a
1
p + 2 (v − b) ,
k
v
96
e(v, T ) =
f
a
kT − .
2
v
Wir interessieren uns für die Isothermen des van der Waals-Gases, das sind die Kurven im
p-T -Diagramm die einer konstanten Temperatur entsprechen. Aus der kalorischen Zustandsgleichung erhalten wir
p(v, T ) =
kT
a
− 2.
v−b v
Die Isothermen sind daher von der unten abgebildeten Gestalt, wobei T auf jeweils höherliegenden Isothermen größer ist.
Es seien p, T vorgegeben. Wir können Folgendes beobachten. Für genügend große T gibt es
zu (p, T ) genau ein v(p, T ), die Funktion p(v, T ) ist monoton fallend in v . Für genügend kleine
T hat p(v, T ) ein Minimum und ein Maximum bezüglich v , es gibt also zu (p, T ) mit geeignetem p ≥ 0 genau drei mögliche v(p, T ). Es gibt eine kritische Temperatur Tkr die gerade einen
Wechsel zwischen den beiden Situationen markiert. Für T = Tkr fallen das Minimum und das Maximum von p(v, T ) bezüglich v zu einem Sattelpunkt zusammen. Das ist gerade bei der mittleren
abgebildeten Isotherme der Fall.
Für p < 0 gibt es nur zwei mögliche v(p, T ), allerdings ist p < 0 in diesem Zusammenhang
unphysikalisch. Die Tatsache, dass die van der Waals-Gleichung p < 0 ermöglicht ist bereits ein
erstes Indiz dafür, dass sie nicht vollständig korrekt sein kann.
Die kritischen Werte für Tkr , pkr und vkr lassen sich explizit berechnen aus den Bedingungen
für einen Sattelpunkt:
2 ∂p
∂ p
= 0,
∂v
Man findet
vkr = 3b ,
=0
∂v 2
T
kTkr =
T
8a
,
27b
pkr =
a
.
27b2
Wir wollen nun die Isothermen für T < Tkr analysieren. Dazu betrachten wir die isotherme
Kompressibilität κT . Für diese muss gelten
1
κT = −
V
∂V
∂p
T,N
1
=−
v
∂v
∂p
≥0
⇔
T
∂p
∂v
=
T
∂v
∂p
−1
≤ 0.
T
Ein System mit κT < 0 ist mechanisch instabil da in diesem Fall eine Volumenverkleinerung
zu einem kleineren Druck führt anstatt zu einem größeren, es gibt also zur Kompression keine
rücktreibende Kraft. Daher kann man den Abschnitt der Isotherme in der p anwächst als unphysikalisch ausschließen. Tatsächlich muss man einen größeren Bereich der Kurve als unphysikalisch ausschließen, da dieser nicht mit den Eigenschaften von Gleichgewichtszuständen, d.h.
den Hauptsätzen der Thermodynamik verträglich ist. Ein weiteres Argument dafür ergänzend
zum obigen Kompressibilitätsargument ist die Betrachtung der Entropie pro Teilchen. Analog
zum idealen Gas, kann man aus der thermischen und kalorischen Zustandsgleichung des van
der Waals-Gases folgende Entropiefunktion herleiten.
fk
s(v, e) =
log
2
e + av
e0
+ k log
97
v−b
v0
+ s0 (v0 , e0 )
Wie man in der folgenden Abbildung sieht ist dieser Funktion für genügend kleine e keine konkave Funktion von v . Das ist äquivalent dazu, dass S(E, V, N ) = N s(E/N, V /N ) keine konkave
Funktion von V ist.
Die Entropie pro Teilchen s(e, v) für e = e(vkr , Tkr ) in Abhängigkeit von v . Zur Verdeutlichung wird
für v eine logarithmische Achse verwendet.
Zusammenfassend kann man sagen, dass die van der Waals-Gleichung die van der Waals
1873 in seiner Doktorarbeit eingeführt hat, für manche Werte der Zustandsgrößen nicht mit
den Gesetzen der Thermodynamik verträglich ist. Trotzdem hat van der Waals 1910 den Nobelpreis dafür bekommen, da man auf Grundlage seiner Gleichung den Phasenübergang flüssig/gasförmig und die Existenz und das Verhalten bei der kritischen Temperatur qualitativ verstanden hat. Dazu kann die van der Waals-Gleichung in den fehlerhaften Bereichen modifiziert
werden um den Hauptsätzen der Thermodynamik zu genügen. Eine “minimale” Modifikation ist
die von Maxwell 1875 vorgeschlagene Maxwell-Konstruktion.
Die Isotherme für T = 0.9Tkr mit den Größen aus der Maxwell-Konstruktion
Zur Diskussion der Maxwell-Konstruktion betrachten wir die Isotherme für T = 0.9Tkr . Für
sehr große v spielt die durch die Konstante a parametrisierte attraktive Wechselwirkung der Gasteilchen keine Rolle und die van der Waals-Gleichung geht über in die (thermische) Zustandsgleichung des idealen Gases. Wir können für große v also den Zustand des van der Waals-Gases als
98
gasförmig bezeichnen bzw. annehmen, dass dieser Bereich der Isotherme die gasförmige Phase
des van der Waals-Gases beschreibt. Für sehr kleine v gilt hingegen v & b da b nach Konstruktion
das minimale Volumen pro Teilchen ist für das der Druck ins Unendliche geht. In diesem Bereich
der Isotherme sind die Gasteilchen also sehr nahe beieinander und wir können diesen Bereich
daher als die flüssige Phase des van der Waals-Gases interpretieren. Der Bereich mittlerer v der
zumindest teilweise unphysikalisch ist, muss also dem Phasenübergang von flüssig nach gasförmig entsprechen. Empirisch beobachtet man, dass bei diesem Phasenübergang der Druck
konstant bleibt während v variiert. Das motiviert folgende Konstruktion. Wir betrachten einen
Druck pd für die Gerade p = pd =konst. die Isotherme dreimal schneidet. Wie bereits diskutiert
ist der mittlere Schnittpunkt auf jeden Fall unphysikalisch, da dort die isotherme Kompressibilität
negativ ist. Wir bezeichnen das v des linken/rechten Schnittpunktes mit va /vb und interpretieren
va als Volumen pro Teilchen der flüssigen Phase und vb als Volumen pro Teilchen der gasförmigen Phase beim Phasenübergang, also bei der Phasenkoexistenz flüssig/gasförmig. Im Falle einer
Phasenkoexistenz muss gelten, dass die intensiven Größen (p, T, µ) in beiden Phasen gleich sind.
Im Allgemeinen gilt für ein pd mit drei Schnittpunkten dass µ(pd , va , T ) 6= µ(pd , vb , T ). Man kann
nun zeigen, dass es genau ein pd gibt so dass µ(pd , va , T ) = µ(pd , vb , T ). Dieser Verdampfungsdruck lässt sich grafisch finden, indem man verlangt, dass die zwei von der Isotherme und der
Schnittgerade eingeschlossenen Flächen links und rechts des mittleren Schnittpunktes genau
gleich groß sind. Man ersetzt nun die van der Waals-Isotherme zwischen va und vb durch die Konstante Funktion p = pd und bekommt entsprechend eine korrigierte van der Waals-Gleichung.
Es lässt sich zeigen, dass die dazugehörige Entropiefunktion konkav ist.17
Die korrigierte van der Waals-Isotherme lässt sich folgendermaßen interpretieren. Wenn man
von der gasförmigen Phase kommend v verringert erhöht sich der Druck immer weiter bis man
pd erreicht. Für p infinitesimal kleiner als pd liegt das van der Waals-Gas vollständig in seiner
gasförmigen Phase vor. Für p = pd gibt es ein Phasengleichgewicht, d.h. die gasförmige und
flüssige Phase koexistieren. Beispielsweise liegt für p = pd und v = 0.6va + 0.4vb das van der
Waals-Gas zu 60% in der flüssigen und zu 40% in der gasförmigen Phase vor. Verringert man v
weiter, dann liegt für p größer als pd das van der Waals-Gas vollständig in seiner flüssigen Phase
vor. Die korrigierte van der Waals-Gleichung ist oﬀenbar bei va und vb stetig aber nicht stetig
diﬀerenzierbar, d.h. (∂p/∂v)T und damit die Kompressibilität springt an diesen Stellen. Dieses
Verhalten ist typisch für Phasenübergange.
Was passiert bei der kritischen Temperatur T = Tkr ? Nähert man sich dieser von unten dann
rücken va und vb immer näher zusammen und die füssige und gasförmige Phase werden sich
“immer ähnlicher”. Bei T = Tkr gilt gerade va = vb = vkr und man kann nicht mehr von einer flüssigen oder gasförmigen Phase sprechen, es existiert nur noch eine einzige Phase die überkritisch
genannt wird. Bei Wasser (H2 O) liegt dieser kritische Punkt bei Tkr = 647K und pkr = 22.064MPa.
Überkritisches Wasser hat in der Industrie zahlreiche Anwendungen18 .
Die durch die Maxwell-Konstruktion korrigierte van der Waals-Gleichung gibt das Verhalten
17
Tatsächlich lässt sich die Maxwell-Konstruktion auch so formulieren, dass man die van der Waals-Entropiefunktion
durch ihre “konkave Einhüllende” ersetzt, also durch die kleinste Funktion die konkav ist und überall größergleich
der ursprünglichen Funktion. In diesem Sinne ist die Maxwell-Konstruktion minimal.
18
siehe https://de.wikipedia.org/wiki/%C3%9Cberkritisches_Wasser
99
von Stoﬀen an der Phasengrenze flüssig/gasförmig inklusive der Existenz eines kritischen Punktes erstaunlich gut wieder. Man kann z.B. die dimensionslose Größe
α=
pkr vkr
kTkr
betrachten. Beim van der Waals-Gas gilt α = 3/8 = 0.375. Bei Wasser (H2 0) gilt α = 0.23,
bei molekularem Wasserstoﬀ (H2 ) α = 0.304. Allerdings kann die van der Waals-Gleichung das
Verhalten bei niedrigen Temperaturen, also insbesondere den Phasenübergang fest/flüssig, nicht
richtig wiedergeben.
p-T -Phasendiagramme von van der Waals- und realem Gas im Vergleich
v -T -Phasendiagramm des gasförmig/flüssig Übergangs
Es ist aufschlussreich sich den gasförmig/flüssig Übergang des van der Waals-Gases bzw.
eines realen Gases auch im v -T Diagramm anzuschauen, in das man va und vb als Funktion
von T einträgt. Die darin sichtbare “parabelförmige” Phasengrenze ist ebenfalls typisch für Phasenübergänge und wird uns bei der Diskussion des Ferromagnetismus wieder begegnen. Das
100
Volumen pro Teilchen spielt dabei die Rolle des sogenannten Ordnungsparameters anhand dessen man die verschiedenen Phasen im Falle einer Phasenkoexistenz unterscheiden kann. Für
T = Tkr stimmen die Ordnungsparameter der Phasen überein und der Unterschied zwischen
den beiden Phasen verschwindet. Der von der Parabel eingeschlossene Bereich ist verboten im
Sinne, dass zu diesen Zustandsgrößen keine homogene Phase existiert.
2.3
Ensembles in der statistischen Mechanik
2.3.1
Wiederholung: Der Zustandsbegriﬀ in der statistischen Mechanik
Wir betrachten das abgeschlossenes System eines Gasvolumens. Die innere Energie E ist erhalten und kann im Prinzip beliebig genau bestimmt werden. Diese setzt sich natürlich zusammen
aus den Energien der einzelnen Gasteilchen. Da aber typischerweise N & 1023 gilt ist es erstens schwer vorstellbar, dass es praktisch möglich ist, die Eigenschaften jedes einzelnen Teilchens exakt zu bestimmen um daraus die makroskopischen Eigenschaften des Gasvolumens
abzuleiten. Zweitens zeigt die Erfahrung, dass das für eine zufriedenstellende makroskopische
Beschreibung gar nicht nötig ist. Man findet dass eine statistische mikroskopische Beschreibung
vollkommen ausreichend ist, d.h. man macht keine Aussage über präzise Eigenschaften einzelner Teilchen sondern nur über geeignete Mittelwerte. Das ist dadurch gerechtfertigt, dass für
sehr große Systeme mit N & 1023 die Schwankungen dieser Mittelwerte vernachlässigbar sind.
Als Beispiel betrachten wir den Druck des obigen Gasvolumens. Dieser setzt sich mikroskopisch zusammen aus der Kraft die einzelne Gasteilchen auf z.B. eine der Wände des Gasbehälters ausüben. Als Funktion der Zeit ist diese Kraft natürlich nicht konstant sondern schwankt
im Allgemeinen sehr stark. Bei der Messung des Drucks messen wir aber nicht diese Funktion,
sondern ihren Mittelwert über ein Zeitintervall ∆t das groß gegen mikroskopische Zeitenskalen
aber klein gegen makroskopische Zeitskalen ist. Für die empirische Beschreibung des makroskopischen Zustands des Systems betrachten wir also eine Mittelung über eine große Menge
mikroskopischer Zustände, in diesem Fall der Zustände die das System im für die Messung relevanten Zeitintervall annimmt. In unserem Beispiel wissen wir dass alle diese Zustände die
Gesamtenergie E besitzen.
Folgende Hypothese – die sogenannte Ergoden-Hypothese – hat sich als gute Motivation für
die Entwicklung der statistischen Mechanik herausgestellt, auch wenn sie im Allgemeinen nicht
oder nicht exakt erfüllt ist: Im Limes eines unendlich großen Zeitintervalls nimmt das System
innerhalb dieses Intervalls alle mikroskopischen Zustände zur Gesamtenergie E an. Die zeitliche
Mittelung über die mikroskopischen Zustände des Systems entspricht also der Mittelung über
die Menge aller mikroskopischen Zustände des Systems mit Gesamtenergie E . Die Menge dieser
Zustände nennt man Ensemble oder Gesamtheit. Ein Ensemble stellt man sich vor als verschiedene Kopien des gleichen Systems, jeweils eine Kopie für/in jeden/m möglichen mikroskopischen
Zustand zur Gesamtenergie E . Die Ergoden-Hypothese besagt also:
Für jede Zustandsgröße Z eines makroskopischen Systems im Gleichgewicht gilt für genü101
gend (im Idealfall unendlich) große Zeitintervalle: Z (Zeitmittel) = hZi (Ensemble-Mittel).
Etwas allgemeiner ist es auch sinnvoll Situationen zu betrachten in denen die Energie E
nicht genau bestimmt ist sondern nur N und V oder sogar nur V . Ein Ensemble entspricht dann
allen mikroskopischen Zuständen des Systems die für die vorgegebenen Größen N und V oder
V möglich sind, bzw. entsprechend vielen identischen Kopien des Systems, eine in jedem dieser
Zustände.
Ein Ensemble repräsentiert folglich den makroskopischen Zustand des makroskopischen Systems und die Ensemble-Mittelwerte werden mit den makroskopischen Zustandsgrößen in der
phänomenologischen Thermodynamik identifiziert. Dieses Postulat ist lose verwandt mit dem
Wahrscheinlichkeitspostulat der Quantenmechanik, wobei wir es hier in der statistischen Mechanik mit einer klassischen statistischen Unsicherheit über den genauen Zustand des mikroskopischen Systems zu tun haben, während wir es in der Quantenmechanik im Falle von reinen
Zuständen mit einer quantenmechanischen statistischen Unsicherheit zu tun haben. Wie wir
bei der Diskussion von gemischten Zuständen in der Quantenmechanik gesehen haben, stellen gemischte quantenmechanische Zustände gerade eine Situation dar, in denen die klassische und quantenmechanische Unsicherheit kombiniert auftreten. In der quantenstatistischen
Beschreibung der Thermodynamik werden Ensembles daher durch gemischte quantenmechanische Zustände ψ , also durch Dichtematritzen ρψ (auch: statistische Operatoren) repräsentiert.
Im Folgenden diskutieren wir nur Quantenstatistik, da die klassische statistische Mechanik im
Prinzip aus der ersten Vorlesung zu dem Thema bekannt ist.
Beim Ensemble-Mittel geht jeder mögliche mikroskopische Zustand zur Gesamtenergie E
mit einem bestimmten statistischen Gewicht ein. Diese Gewicht entspricht der Wahrscheinlichkeit, ein System im durch das Ensemble beschriebenen makroskopischen Zustand bei einer
hypothetischen Messung aller mikroskopischen Größen im jeweiligen mikroskopischen Zustand
vorzufinden. Zur Festlegung dieser Wahrscheinlichkeiten wird folgendes zweite Postulat herangezogen.
Im Gleichgewicht ist jeder mikroskopische Zustand zur festen Gesamtenergie E gleich
wahrscheinlich.
Dieses Postulat lässt sich im Gegensatz zur Ergoden-Hypothese einfacher mikroskopisch motivieren. Ein Gleichgewichtszustand ist per Definition statisch, ändert sich also nicht mit der Zeit.
In der Quantenstatistik verschwindet entsprechend der Kommutator der Dichtematrix ρψ mit
dem Hamiltonoperator H .
[ρψ , H] = 0
Wie in Abschnitt 1.5.4 diskutiert, folgt daraus unter der Annahme, dass die Eigenwerte von H
nicht entartet sind dass ρψ eine Funktion fψ (H) des Hamiltonoperators ist. Sind die Eigenwerte
von H entartet (die Situation, in der das obige Postulat überhaupt nicht-trivial ist), dann folgt
ρψ = fψ (H) nicht notwendigerweise, es ist aber sinnvoll diese Eigenschaft zu postulieren, nicht
zuletzt in Hinblick auf die Empirie der phänomenologischen Thermodynamik, die besagt, dass
102
sich Gleichgewichtsysteme durch sehr wenige Größen beschreiben lassen19 . Zerlegt man ρψ =
fψ (H) in (reine) Eigenzustände |n, ii zu H mit H|n, ii = En |n, ii wobei i die Zustände zu festem
En durchnummeriert, gilt also
ρψ = fψ (H) =
X
fψ (En )|n, iihn, i|
n,i
und die statistischen Gewichte fψ (En ) der einzelnen Zustände hängen nur von En d.h. n ab und
nicht von i.
2.3.2
Das mikrokanonische Ensemble, Boltzmann- und von Neumann-Entropie
Das einfachste und fundamentalste Ensemble ist das mikrokanonische Ensemble, das einem
abgeschlossenes System im Gleichgewicht zu scharfer innerer Energie E entspricht. Die extensiven Größen E , V , N sind also extern fest vorgegeben bzw. bekannt. Aus den allgemeinen
Überlegungen im vorigen Abschnitt folgt, dass die Dichtematrix des mikrokanonischen Ensembles von der Form
P
ρψ =
|ni ONB von HE,V,N
|nihn|
W (E, V, N )
ist. Die darin auftretenden Größen und Objekte sind
• HE,V,N = Hilbertraum der Zustände des Systems zu festem E , V , N , insbesondere also
H|ni = E|ni für alle |ni ∈ HE,V,N
• die mikrokanonische Zustandssumme W (E, V, N ) = dim HE,V,N , d.h. die Anzahl der linear
unabhängigen reinen Zustände zu vorgegebenem E , V , N
Beispiel: Wir betrachten ein System von zwei Spin 1/2 Teilchen mit Ladung q > 0 und Masse
m > 0 unter Vernachlässigung der räumlichen Dynamik. Wir nehmen an, dass die Teilchen an
unterschiedlichen klar definierten Orten “sitzen”, so dass sie unterscheidbar sind. Der Hilbertraum ist also H = C4 mit ONB |↑↑i, |↑↓i, |↓↑i, |↓↓i. Es gilt N = 2 und in dieser vereinfachten
Situation ist es natürlich nicht sinnvoll und hilfreich, von einem Volumen V zu sprechen. Der
~ = (0, 0, B), B > 0 sei
Hamiltonoperator des Systems in einem homogenen Magnetfeld B
H=−
2νB (1)
qB (1)
(Sz + Sz(2) ) = −
(Sz + Sz(2) ) ,
m
~
ν=
~q
> 0.
2m
Die möglichen Eigenwerte und Eigenzustände dieses Operators sind
|↑↑i
mit Eigenwert
E = −2νB ,
19
Eine sehr konkrete Motivation für das Postulat ρψ = fψ (H) ist die Tatsache, dass diese Beziehung die Stabilität
des Zustandes ψ unter kleinen Störungen impliziert. Diese Stabilität ist eine Eigenschaft, die empirisch bei Systemen
im Gleichgewicht beobachtet wird. Für Details sei auf Kapitel II.2 des Skripts von Klaus Fredenhagen verwiesen.
103
|↓↑i, |↑↓i
|↓↓i
E = 0,
mit Eigenwert
E = 2νB .
mit Eigenwert
Die mikrokanonischen Ensembles sind also
ρE=−2νB = |↑↑ih↑↑| ,
|↑↓ih↑↓| + |↓↑ih↓↑|
,
2
ρE=2νB = |↓↓ih↓↓| ,
ρE=0 =
wobei das erste hier dem Grundzustand des Systems entspricht.
Das zum mikrokanonischen Ensemble zugehörige thermodynamische Potential ist die BoltzmannEntropie
SB = k log W .
Es lässt sich zeigen dass diese Größe die charakteristischen Eigenschaften Maximalität und Extensivität hat. Die intensiven Zustandsgrößen p,µ, T lassen sich wie in der phänomenologischen
Thermodynamik diskutiert durch partielle Ableitungen aus der Entropie gewinnen. Beim obigen
Beispiel mit diskreten Energieniveaus ist eine partielle Ableitung von z.B. S nach E zur Bestimmung der (inversen) Temperatur oﬀenbar nicht wohldefiniert. In der Thermodynamik interessieren wir uns allerdings nur für makroskopische Systeme in denen die Energieniveaus “fast”
kontinuierlich (sehr großes Volumen) oder kontinuierlich (unendlich großes Volumen) sind.
An dieser Stelle können wir den dritten Hauptsatz der Thermodynamik “beweisen”. Wie wir
bereits diskutiert haben ist die Temperatur eine monotone Funktion der inneren Energie. Am
Temperaturnullpunkt ist also auch die Energie minimal. Ist der Grundzustand des betrachteten
Systems nicht entartet, dann gilt für den Grundzustand W = 1 und damit S = 0.
Eine weitere und allgemeinere Definition der Entropie ist die von Neumann-Entropie (oder
auch Informationsentropie, Shannon-Entropie)
S = −k Sp(ρψ log ρψ ) = −khlog ρψ iψ .
Für das mikrokanonische Ensemble gilt (weil |ni Eigenzustände von H und daher auch von ρψ )
log ρψ =
X
|nihn| log
1
W
1
W
|ni ONB von HE,V,N
und damit
S = −k Sp(ρψ log ρψ ) = −k
X
|ni ONB von HE,V,N
1
log
W
=k
W
log W = SB .
W
Wir sehen also dass die von Neumann-Entropie beim mikrokanonischen Ensemble der BoltzmannEntropie entspricht. Die von Neumann-Entropie kann für allgemeine gemischte Zustände definiert werden. Wie wir gesehen haben ist sie für reine Zustände immer Null und allgemein ≥ 0.
Sie kann also als ein Maß für den “Mischungsgrad” des Zustandes angesehen werden.
104
2.3.3
Das kanonische Ensemble
Das kanonische Ensemble beschreibt ein System mit festem V , N aber nicht scharf festgelegtem E , z.B. ein System das im thermischen Kontakt mit einem zweiten ist. Wir betrachten so eine
Situation. Das Gesamtsystem bestehend aus den zwei Teilsystemen soll eine scharfe Energie E
haben und kann daher durch ein mikrokanonisches Ensemble beschrieben werden. Die Dichtematrix des kanonischen Ensembles für das z.B. erste System kann nun aus diesem Ensemble
und der Bedingung des Gleichgewichts hergeleitet werden. Eine übersichtlichere Herleitung ist
Folgende.
Es seien H1 , H2 die Hamiltonoperatoren der beiden Systeme mit (möglicherweise entarteten)
Eigenzuständen |n1 i, |n2 i. Wie bereits diskutiert postulieren oder folgern wir für die Dichtematrix
beider invidueller Systeme im Gleichgewicht ρ1 = f1 (H1 ) und ρ2 = f2 (H2 ), d.h.
ρ1 = f1 (H1 ) =
X
f1 (En1 )|n1 ihn1 | ,
ρ2 = f2 (H2 ) =
X
f1 (En2 )|n2 ihn2 | .
|n2 i
|n1 i
Der Hamiltonoperator des Gesamtsystems ist H1&2 = H1 + H2 mit Eigenzuständen |n1 , n2 i =
|n1 i ⊗ |n2 i. Für die Dichtematrix des Gesamtsystems (eines mikrokanonischen Ensembles) gilt
ebenfalls
X
f (En1 + En2 )|n1 , n2 ihn1 , n2 |.
ρ1&2 = f1&2 (H1&2 ) =
|n1 ,n2 i
Da die zwei Teilsysteme im gegenseitigen Gleichgewicht als unabhängig angesehen werden
können muss gelten
ρ1&2 = ρ1 ⊗ ρ2
und damit
f1&2 (En1 + En2 ) = f1 (En1 )f2 (En2 )
für beliebige n1 , n2 . Wir diﬀerenzieren nun diese Gleichung nach En1 und En2 . Da beide Ableitungen bei f1&2 (En1 + En2 ) der Ableitung nach E = En1 + En2 entsprechen, muss gelten
f10 (En1 )f2 (En2 ) = f1 (En1 )f20 (En2 )
⇔
f0
f10
= 2,
f1
f2
wobei beide Seiten der zweiten Gleichung konstant sein müssen, da sie von unterschiedlichen
Variablen En1 und En2 abhängen. Wenn wir diese Konstante mit −β bezeichnen, erhalten wir für
jedes der Systeme die Dichtematrix des kanonischen Ensembles
ρ = f (H) =
e−βH
,
Z
Z = Sp(e−βH ) .
Der Normierungsfaktor Z ist dabei die kanonische Zustandssumme.
Bislang haben wir Dichtematritzen mit ρψ angegeben um zu verdeutlichen, dass sie einen bestimmten gemischten quantenmechanischen Zustand ψ repräsentieren. Im Folgenden werden
105
wir den Index ψ weglassen, da wir immer nur jeweils ein Ensemble und damit einen konkreten
Zustand diskutieren werden.
Was ist β ? Um das festzulegen betrachten wir die innere Energie und (von Neumann-) Entropie E im kanonischen Ensemble. Es gilt
E = hHi =
Sp(He−βH )
Z
,
S = −khlog ρi = k h(βH + log Z)i = kβE + k log Z .
Das motiviert folgende Interpretationen der auftretenden Größen.
• β = (kT )−1 ist die inverse thermodynamische Temperatur.
• F (β, V, N ) = − β1 log Z(β, V, N ) ist die freie Energie.
Denn mit
∂
∂Z
=
Sp(e−βH ) = −Sp(He−βH ) = −ZE
∂β
∂β
⇔
E=−
∂
log Z
∂β
lässt sich leicht verifizieren, dass
∂F
∂F
= −kβ 2
= −S
∂T
∂β
gilt, also die uns bereits aus der phänomenologischen Thermodynamik bekannte Beziehung. Bei
den partiellen Ableitungen nach β oder T wird hier jeweils V und N festgehalten.
Als Beispiel für ein kanonisches Ensemble betrachten wir den eindimensionalen harmonischen Oszillator, d.h. es gilt für die Teilchenzahl N = 1 und das Volumen V ist in diesem Fall
keine sinnvolle Größe. Es sei |ni die ONB aus Eigenzuständen des entsprechenden Hamiltonoperators mit den bekannten nichtentarteten Energieeigenwerten En = ~ω(n + 12 ).
Für die Zustandssumme berechnen wir
Z = Sp(e
−βH
)=
∞
X
−βH
hn|e
n=0
|ni =
∞
X
−βEn
e
=e
−~βω/2
n=0
∞ X
e−~βω
n
n=0
1
1
=
,
2 sinh (~βω/2)
1 − e−~βω
P∞
n
−1
wobei wir die Identität der geometrischen Reihe
n=0 α = (1 − α) , gültig für |α| < 1, ver= e−~βω/2
wendet haben.
Daraus können wir sofort die innere Energie und Wärmekapazität berechnen. Da V keine
Rolle spielt und N konstant ist, ist es nicht nötig diese Variablen explizit bei den partiellen Ableitungen “festzuhalten”.
E=−
∂
~ω
log Z =
coth(~βω/2)
∂β
2
106
C=
∂E
∂E
1
= −kβ 2
= k(~βω/2)2
2
∂T
∂β
sinh (~βω/2)
Wir wollen das Ergebnis nun interpretieren. In der klassischen statistischen Mechanik bekommt
man Eklass = kT = β −1 und damit Cklass = k . Trotz der Tatsache, dass wir es mit einem Freiheitsgrad zu tun haben, gilt nicht Eklass = kT /2 da die potentielle Energie des Oszillators auch in E
eingeht und die Formel Eklass = f kT /2 für f Freiheitsgrade nur für die kinetische Energie, also
freie Teilchen gilt.
Für große Temperaturen, d.h. kleine β , bekommen wir wegen sinh(x) ≈ x für kleine x das klassische Resultat. Für kleine Temperaturen, d.h. große β bekommen wir wegen sinh(x) ≈ exp(x)/2
für große x dass C verschwindet, wobei E sich dem konstanten Wert E = ~ω/2 nähert, der gerade der Grundzustandsenergie entspricht. Dieses Verhalten lässt sich derart interpretieren, dass
für T → 0 der Freiheitsgrad des Oszillators “einfriert” und sich der Oszillator daher wie ein System ohne dynamische Freiheitsgrade verhält. Dieses Einfrieren von Freiheitsgraden ist charakterischtisch für das thermodynamische Verhalten quantenmechanischer Systeme und entspricht
den experimentellen Befunden, die also nochmals klar verdeutlichen, dass die klassische Physik nur eine teilweise gültige approximative Beschreibung der Natur liefert. Beim diskutierten
Beispiel des Oszillators wird die Grenze der Gültigkeit der klassischen Beschreibung durch die
Energieskala ~ω bzw. die Temperaturskala ~ω/k markiert. Für Kristallgitterschwingungen in z.B.
Diamant ist ω ≈ 1THz = 1012 Hz. Daraus ergibt sich für die charakteristischen Skalen ~ω ≈ 10−22 J,
~ω/k ≈ 10K.
Wir halten also fest:
• Für große Temperaturen / Energien zeigen quantenmechanische (d.h. reale) Systeme klassisches Verhalten und können durch klassische Physik gut beschrieben werden.
• Für kleine Temperaturen / Energien liefert die klassische Physik keine gute Beschreibung
und quantenmechanische Eﬀekte werden relevant.
2.3.4
Der Fockraum und das großkanonische Ensemble
Im Gegensatz zum kanonischen Ensemble beschreibt das großkanonische Ensemble Systeme
bei denen sowohl Energie als auch Teilchenzahl nicht fest vorgegeben sind. Ein Bespiel sind zwei
Teilsysteme die thermisch und chemisch gekoppelt sind.
Zur Diskussion des großkanonischen Ensemble benötigen wir als Werkzeug zunächst einmal
die grundsätzliche quantenmechanische Beschreibung von Systemen mit variabler Teilchenzahl.
Es sei H1 der Hilbertraum eines einzelnen Teilchens. Für die Beschreibung zweier identischer,
also ununterscheidbarer Teilchen benötigen wir den Hilbertraum
H2 = H1 ⊗A/S H1
107
wobei ⊗A das antisymmetrische und ⊗S das symmetrische Tensorprodukt bezeichnet. Wie wir
diskutiert haben müssen Zustände identischer Teilchen entweder vollständig symmetrisch (Bosonen) oder vollständig antisymmetrisch (Fermionen) unter Umnummerierung der Teilchen sein.
Daher tritt für Bosonen das symmetrische und für Fermionen das antisymmetrische Tensorprodukt auf. Einfache reine Zustände in H2 sind bekanntlich von der Form
|ψi = |ψ1 i ⊗ |ψ2 i ± |ψ2 i ⊗ |ψ1 i
wobei ψ1 , ψ2 Zustände in H1 sind und für Bosonen/Fermionen das positive/negative Vorzeichen
gilt. Allgemeine reine Zustände in H2 sind lineare Superpositionen solcher Zustände.
Das lässt sich nun auf N Teilchen mit N beliebig verallgemeinern. Der Hilbertraum ist
HN = H1 ⊗A/S · · · ⊗A/S H1 .
|
{z
}
N mal
Einfache reine Zustände in HN sind von der Form
|ψi =
X
sign(π)α |ψπ(1) i ⊗ · · · ⊗ |ψπ(N ) i
Perm. π von {1,. . . ,N}
|ψ1 i, . . . , |ψN i ∈ H1 .
α = 0, 1 für Bosonen/Fermionen ,
Man summiert also über alle Permutationen π von {1, . . . , N } und berücksichtigt bei Fermionen
das Vorzeichen sign(π)α der Permutation π , das ±1 ist für gerade/ungerade Permutationen. Wie
im Fall von zwei Teilchen sind allgemeine reine Zustände in HN Linearkombinationen solcher
Zustände.
Wir fassen nun die N -Teilchen-Hilberträume für alle N zu einem einzigen Hilbertraum, dem
Fockraum
HF =
∞
M
HN
N =0
zusammen. Reine Zustände ψ in HF sind von der Form |ψi = (|ψ0 i, |ψ1 i, |ψ2 i, . . . ) mit |ψN i ∈ HN
d.h. (im Prinzip unendlich große) Vektoren deren Komponenten jeweils Vektoren/reine Zustände
zu einer festgelegten Teilchenzahl sind. Dabei ist H0 = C der Hilbertraum für 0 Teilchen, der bis
auf Normierung nur einen Zustand, das “Vakuum” enthält.
Die einfachsten Operatoren auf dem Fockraum sind solche die die Teilchenzahl erhalten.
Diese sind von der Form


A0 0
0 ...


 0 A1 0 . . .


A=

0
0 A2 . . . 


..
.
..
.
108
..
.
..
.
mit Operatoren AN auf HN . Ein Beispiel ist der Teilchenzahloperator


0
0
0
...

0

N =
0

11
0
0
212
..
.
..
.

. . .


. . .

..
.
..
.
wobei 1N der Einheitsoperator im Hilbertraum HN ist. Ein anderes Beispiel ist (in vielen Systemen) der Hamiltonoperator


0 0
0 ...


0 H1 0 . . .


H=

0 0 H2 . . .


..
.
..
.
..
.
..
.
Dabei gilt für wechselwirkungsfreie Systeme wie das ideale Gas, dass der Hamiltonoperator HN
für N Teilchen einfach die Summe aus N “Kopien” von H1 ist. Wir haben die “Vakuumenergie”
H0 = 0 gesetzt da sie für unsere Diskussion keine Rolle spielt.
Wir können nun das großkanonische Ensemble herleiten. Dazu postulieren wir als Verallgemeinerung der Bedingung ρ = f (H) beim mikrokanonischen und kanonischen Ensemble die
Bedingung ρ = f (H, N ), d.h. die Dichtematrix ρ soll eine Funktion von H und N sein. Das ist
gleichbedeutend damit, dass die Zustände für gleiche Energie und Teilchenzahl im Ensemble
gleich wahrscheinlich sind und die natürliche Verallgemeinerung der entsprechenden Bedingung nur für die Energie. Analog zum kanonischen Ensemble kann man sich nun zwei Systeme
vorstellen die thermisch und chemisch gekoppelt sind und für die entsprechenden Dichtematritzen
f1&2 (E1 + E2 , N1 + N2 ) = f1 (E1 , N1 )f2 (E2 , N2 )
folgern. Daraus kann man dann verallgemeinernd schließen, dass für das großkanonische Ensemble gelten muss
ρ = f (H, N ) =
e−β(H−µN )
,
ZG
ZG = Sp(e−β(H−µN ) ) .
mit der großkanonischen Zustandssumme ZG . Wie zuvor ist dabei β = (kT )−1 und die zweite
Konstante µ ist das chemische Potential. Das entsprechende thermodynamische Potential zum
großkanonischen Ensemble ist das großkanonische Potential
Ω(β, V, µ) = −
1
log(ZG (β, V, µ))
β
und es lässt sich leicht nachrechnen, dass die Identität
∂Ω
∂T
= −S = khlog ρi
µ,V
109
gilt.
Abschließend sei bemerkt, dass die drei diskutierten Ensembles in manchen Situationen eine gleich gute Beschreibung liefern. Für hohe Energien und Teilchenzahlen sind die relativen
Schwankungen dieser Größen, d.h. ∆H/H , ∆N/N , in den jeweiligen Ensembles wo diese Größen variabel sind klein und können daher vernachlässigt werden.
2.4
Bose(-Einstein) und Fermi(-Dirac) Statistik
Wie wirken sich die unterschiedlichen Eigenschaften von Bosonen und Fermionen thermodynamisch aus? Dazu diskutieren wir Operatoren die die Teilchenzahl nicht erhalten, die sogenannten
Erzeugungs- und Vernichtungsoperatoren. Diese sind mit den Leiteroperatoren in der Diskussion
des harmonischen Oszillators oder des Spins verwandt.
Es sei ϕ ein reiner Einteilchenzustand und wie zuvor
|ψi =
X
sign(π)α |ψπ(1) i ⊗ · · · ⊗ |ψπ(N ) i
Perm. π von {1,. . . ,N}
|ψ1 i, . . . , |ψN i ∈ H1
α = 0, 1 für Bosonen/Fermionen ,
ein reiner N -Teilchenzustand. Wir definieren nun den Vernichtungsoperator aϕ und den Erzeu†
gungsoperator aϕ als
aϕ |ψi =
√
X
N
sign(π)α hϕ|ψπ(1) i|ψπ(2) i ⊗ · · · ⊗ |ψπ(N ) i ,
Perm. π von {1,. . . ,N}
a†ϕ |ψi = √
X
1
sign(π)α |ψπ(0) i ⊗ · · · ⊗ |ψπ(N ) i ,
N + 1 Perm. π von {0,. . . ,N}
wobei wir im letzteren Fall
|ψ0 i = |ϕi
setzen. Die Interpretation dieser Operatoren ist, dass sie ein Teilchen im Zustand ϕ vernichten
†
bzw. erzeugen. Daher ist aϕ |ψi ein N − 1-Teilchenzustand und aϕ |ψi ein N + 1-Teilchenzustand.
†
Darüber hinaus sind aϕ und aϕ zueinander adjungiert wie die Notation bereits andeutet.
Es lässt sich verifizieren, dass die Erzeugungs- und Vernichtungsoperatoren zu zwei im allgemeinen unterschiedlichen Zuständen ϕ, χ folgende kanonische (Anti-)Vertauschungsrelationen
erfüllen
aϕ a†χ ∓ a†χ aϕ = hϕ|χi ,
aϕ aχ ∓ aχ aϕ = 0
Das negative/positive Vorzeichen gilt dabei für Bosonen/Fermionen. Aus der Definition folgt
ebenfalls folgende Vertauschungsrelationen mit dem Teilchenzahloperator
[N, aϕ ] = −aϕ .
110
Diese gibt gerade an, dass aϕ die Teilchenzahl um eins verringert.
Wir betrachten nun eine ONB |ni aus Eigenzuständen des Einteilchenhamiltonoperators H1
zu Energien En und ein nichtwechselwirkendes System bei dem H Blockform hat und jeder
Blöcke HN wie besprochen eine Summe aus N Kopien von H1 ist. Für die dazugehörigen Erzeugungsund Vernichtungsoperatoren gilt dann
an a†m ∓ a†m an = hn|mi = δn,m ,
am an ∓ an am = 0 .
und
[H, an ] = −En an .
Letztere Identität besagt gerade, dass an die Energie um En , also die Energie des vernichteten
Teilchens, verringert. Aus der Vertauschungsrelationen mit N und H folgt die Relation
[H − µN, a†n ] = (En − µ)a†n
bei der sichtbar wird, dass die Erzeugung eines Teilchen gerade die Energie µ kostet.
Wir können nun den Teilchenzahloperator durch Erzeugungs- und Vernichtungsoperatoren
ausdrücken. Dazu definieren wir
Nn = a†n an .
Dieser Operator gibt grob gesprochen “die Anzahl der Teilchen im Zustand |ni” an. Diese Aussage ist nicht ganz exakt, da der Erwartungswert von Nn auch in Zuständen, in denen die einzelnen Teilchen nicht exakt im Zustand |ni sondern z.B. in der Superposition |ni + |mi sind, nicht
verschwindet. Es gilt allerdings die exakte Operatorgleichung
N=
X
Nn .
n
Was ist der Erwartungswert von Nn im großkanonischen Ensemble? Dazu berechnen wir
ha†n am i = Sp(a†n am ρ) =
=
1
1
Sp(a†n am e−β(H−µN ) ) =
Sp(a†n e−β(H−µN ) am (β))
ZG
ZG
1
Sp(am (β)a†n e−β(H−µN ) ) = ham (β)a†n i
ZG
mit
am (β) = eβ(H−µN ) am e−β(H−µN ) .
Hierbei haben wir ausgenutzt, dass Sp(AB) = Sp(BA). Der β -abhängige Operator am (β) erfüllt
die Diﬀerentialgleichung und Anfangsbedingung
∂
am (β) = eβ(H−µN ) [H − µN, am ]e−β(H−µN ) = −(Em − µ)am (β) ,
∂β
Daraus folgt
am (β) = e−β(Em −µ) am .
111
am (0) = am .
Es gilt also die KMS-Bedingung (nach Kubo, Martin, Schwinger)
ha†n am i = e−β(Em −µ) ham a†n i .
Diese Relation charakterisiert das grosskanonische Ensemble vollständig, d.h. die Eigenschaften
des grosskanonischen Ensembles können aus dieser Relation gefolgert werden.
Insbesondere erhalten wir aus der KMS-Bedingung und den kanonischen (Anti-)Vertauschungsrelationen
ha†n am i = e−β(Em −µ) ham a†n i = e−β(Em −µ) ±ha†n am i + δmn
⇒
ha†n am i = δmn
1
eβ(Em −µ)
∓1
1
⇒ hNn i =
eβ(En −µ)
∓1
= δmn hNn i
.
Dabei gilt das negative/positive Vorzeichen für Bosonen/Fermionen. Aus der physikalischen Bedingung hNn i ≥ 0 können wir folgendes schließen:
• Für Fermionen sind im Prinzip alle Werte für β und µ erlaubt.
• Für Bosonen sind ist nur β ≥ 0 möglich und µ muss kleiner oder gleich der Grundzustandsenergie für ein Teilchen sein.
Wir können ebenfalls ablesen, dass µ für Fermionen die Rolle der Fermi-Energie spielt. Im Limes
T → 0 d.h. β → ∞ gilt hNn i = 1 für Zustände mit En < µ und hNn i = 0 für Zustände mit
En > µ. Insbesondere kann jeder Zustand gemäß des Pauli-Prinzips nur höchstens einmal besetzt werden. Für Bosonen gilt diese Begrenzung nicht und hNn i kann beliebige positive Werte
annehmen. Für große Werte von β(En − µ) geht das Resultat über in die klassische MaxwellBoltzmann-Verteilung
hNn i ≈ e−β(En −µ) .
2.5
Ideale Quantengase
Die einfachsten Beispiele für großkanonische Ensembles sind ideale Quantengase. Strenggenommen ist die bisherige Diskussion von thermodynamischen Ensembles nur gültig im Falle
eines endlichen Volumens (und damit endlicher Teilchenzahl, Energie). Für die Diskussion idealer Quantengase müssen wir aber den idealisierten Fall betrachten, dass V unendlich groß ist,
den sogenannten thermodynamischen Limes. Formal stellt man sich dazu ein System vor bei
dem E, V, N gegen unendlich gehen, wobei die Teilchen- und Energiedichten
n=
N
,
V
%=
E
V
(oder alternativ, falls es keine Phasenübergänge gibt, die intensiven Größen µ, T ) festgehalten
werden.
112
Im thermodynamischen Limes ist im Allgemeinen die Beschreibung eines Ensembles durch
eine Dichtematrix nicht möglich weil die Zustandssumme im Limes V → ∞ divergiert. Stattdessen muss man den entsprechenden gemischten Zustand direkt durch seine Erwartungswerte
charakterisieren, die durch die – auch im thermodynamischen Limes sinnvolle – KMS-Bedingung
bestimmt sind. Für ein ideales Gas mit Ein-Teilchen-Hamilton-Operator
H1 =
P~ 2
2m
lautet diese analog zum Fall endlichen Volumens:
ha~† aq~i = e−β(E~k −µ) haq~a~† i ,
k
E~k =
k
~2~k 2
.
2m
†
Dabei sind a~ , a~k Erzeungs- und Vernichtungsoperatoren zum scharfen Impuls ~~k und erfüllen
k
die kanonischen (Anti-)Vertauschungsrelationen
a~k a†q~ ∓ a†q~a~k = δ(~k − ~q) ,
aq~a~k ∓ a~k aq~ = 0 .
Analog zum Fall endlichen Volumens kann man aus diesen Relationen und der KMS-Bedingung
den Erwartungswert der Teilchenzahldichte pro scharfem Impuls n~k
hn~k i =
1
1
3
β(E
−µ)
(2π) e ~k
∓1
herleiten, wobei sich die gesamte Teilchenzahldichte als
Z
1
hni =
d k hn~k i =
(2π)3
R3
3
Z
d3 k
R3
1
β(E~k −µ)
e
∓1
berechnet. Wie zuvor gilt das negative/positive Vorzeichen für Bosonen/Fermionen.
2.5.1
Das ideale Fermigas, weiße Zwerge, Neutronensterne und schwarze
Löcher
Wie bereits erwähnt zeigen quantenmechanische Systeme bei tiefen Temperaturen deutliche
Abweichungen vom klassisch erwarteten Verhalten. Wie manifestiert sich das beim idealen Fermigas?
Wir berechnen die Teilchenzahldichte des idealen Fermigases bei T = 0, d.h. β = ∞. Das
Integral lässt sich leicht berechnen, da hn~k i bis zur Fermienergie konstant ist und danach verschwindet. Man findet
1 4π
hni =
(2π)3 3
2mµ
~2
3/2
= (αmµ)
3/2
,
und damit, durch Auflösen nach µ,
µ=
1
hni2/3 .
αm
113
α=
1 4π
(2π)3 3
2/3
2
~2
Wir wollen daraus den Druck hpi berechnen. Aus der phänomenologischen Thermodynamik wis∂p
sen wir, dass n = ∂µ gilt. Daraus folgt20
2
2 1
hpi = (αm)3/2 µ5/2 =
hni5/3 .
5
5 αm
Beim klassischen idealen Gas gilt
p=
N kT
= nkT ,
V
d.h. p = 0 für T = 0, auch wenn n > 0. Beim fermionischen idealen Quantengas finden wir
dass bei T = 0 der Druck nicht verschwindet wenn die Teilchendichte endlich ist. Dieser quantenmechanische Eﬀekt, der letztlich das Pauli-Prinzip bzw. das Ununterscheidbarkeitsprinzip als
seine Ursache hat, wird Entartungsdruck genannt. Dabei bezieht sich “entartet” nicht auf etwaige entartete Energieniveaus, sondern ist ein Ausdruck für die große Abweichung vom klassisch
erwarteten Verhalten.
Der Entartungsdruck spielt eine große Rolle beim Verständnis des Lebenszyklus eines Sterns.
Ein Stern ist zunächst einmal eine große Kugel aus Wasserstoﬀ. Wegen der gegenseitigen gravitativen Anziehung ist diese Kugel bestrebt sich zu verkleinern, die Materie innerhalb der Kugel
ist also einem großen Druck ausgesetzt, der im Zentrum maximal ist und umso größer ist, je größer die Gesamtmasse des Sterns ist. Durch diesen hohen Druck wird das Wasserstoﬀ zu einem
Plasma – d.h. die Bindung zwischen Elektronen und Atomekernen wird vollständig aufgehoben –
und Kernfusion möglich. Die dabei entstehende Energie wird in Form von (u.a.) Wärmestrahlung
frei. Der entsprechende Strahlungdruck wirkt dem Gravitationsdruck entgegen und stabilisiert
somit den Stern. Hat der Stern am Ende seines “Lebens” den Fusionsbrennstoﬀ aufgebraucht,
hört die Kernfusion auf und der stabilisierende Strahlungsdruck fehlt. Nun gibt es verschiedene
Möglichkeiten.
• Ist der Stern vergleichsweise leicht (bis ca. 10 Sonnenmassen), schrumpft ein großer Teil
der Materie zu einem weißen Zwerg zusammen (der Rest wird in der letzten Brennstufe durch den Strahlungsdruck “weggeblasen”). Ein weißer Zwerg lässt sich relativ gut als
ideales Fermigas modellieren und so ist es gerade der Entartungsdruck der Elektronen,
der dem gravitativen Druck entgegenwirkt und die “Sternenleiche” stabilisiert. Der mögliche Beitrag zum Entartungsdruck durch die tausendfach schwereren Atomkerne ist wegen
hpi ∝ m−1 vernachlässigbar. Weiße Zwerge sind folglich sehr klein (etwa so groß wie die
Erde) und sehr dicht (ca. 1t/cm3 ).
• Ist der Stern mittelschwer (ca. 10-20 Sonnenmassen), dann wäre der entstehende weiße
Zwerg so schwer, dass selbst der Entartungsdruck der Elektronen dem gravitativen Druck
nicht mehr widerstehen kann.21 Stattdessen werden die Elektronen von den Protonen der
Atomkerne unter Bildung von Neutronen eingefangen, so dass schließlich nur Neutronen
20
Man kann zeigen, dass hpi wirklich homogen in µ ist, d.h. für µ = 0 verschwindet.
Zur exakten Berechnung dieser sogenannten Chandrasekar-Grenze muss man das relativistische Fermigas betrachten.
21
114
übrigbleiben, daher spricht man von einem Neutronenstern. Der Entartungsdruck der Neutronen, die ebenfalls Fermionen sind, stabilisiert nun (zusätzlich zur sogenannten starken
Wechselwirkung zwischen ihnen) die Sternenleiche. Neutronensterne sind folglich noch
kleiner als weiße Zwerge (Radius ca. 10km) und noch dichter (ca. 1000t/mm3 ).
• Ist der Stern schwerer als ca. 20 Sonnenmassen reicht selbst der Entartungsdruck der
Neutronen nicht mehr aus um seinen Überrest zu stabilisieren und dieser kollabiert völlig zu
einem sogenannten schwarzen Loch. Heuristisch kann man sich dabei vorstellen, dass die
gesamte Masse des Sternenüberrestes zu einem einzigen Punkt kollabiert. Allerdings lässt
sich das “Innere” eines schwarzen Loches mit “normaler” Physik nicht beschreiben und es
gibt tatsächlich zahlreiche Aspekte schwarzer Löcher die nicht gut verstanden sind. Es gibt
allerdings wenig Zweifel daran und zahlreiche Indizien dafür, dass kompakte Objekte, die
dichter als Neutronensterne sind, existieren und bislang ist keine stabile Form von Materie
mit dieser Eigenschaft bekannt.
2.5.2
Das ideale Bosegase, Strahlungsgesetze, Bose-Einstein-Kondensation
Wir betrachten nun die Teilchendichte beim idealen Bosegas.
Z
1
hni =
d k hn~k i =
(2π)3
R3
3
Z
d3 k
R3
1
β(E~k −µ)
e
−1
p
−3
Diese wird maximal für µ → 0 und erreicht den kritischen Wert hni = nkr ≈ 2.61 2πβ~2 /m .
Was passiert bei größeren Teilchendichten? Analog zum Phasenübergang gasförmig/flüssig bei
realen Gasen am kritischen Druck tritt eine Kondensation auf, die sogenannten Bose-EinsteinKondensation. D.h. dass es zu festen intensiven Größen µ, β (mindestens) zwei homogene
Gleichgewichtszustände, also Phasen, geben muss. Um diese zu finden betrachten wir erneut
die KMS-Bedingung unter Ausnutzung der Vertauschungsrelationen
ha~† aq~i = e−β(E~k −µ) haq~a~† = e−β(E~k −µ) ±ha~† aq~i + δ(~q − ~k)
k
k
k
⇔
eβ(E~k −µ) − 1 ha~† aq~i = δ(~q − ~k)
k
Bei µ = 0 gilt für ~k = 0 dass E~k = 0 und damit (eβ(E~k −µ) − 1) = 0. Die Gleichung lässt sich
†
also nicht eindeutig nach ha~ aq~ i auflösen und die Teilchendichte ist für ~k = 0 durch die KMSk
Bedingung nicht eindeutig festgelegt. Für eine (genügend reguläre) Funktion f (~k) gilt im Produkt
mit der Delta-Distribution δ(~k)
f (~k)δ(~k) = f (0)δ(~k)
weil δ(~k) außerhalb von Null verschwindet. Daher können wir bei µ = 0 die KMS-Bedingung etwas
allgemeiner durch z.B.
ha~† aq~i =
k
δ(~k − ~q)
e
β(E~k −µ)
−1
+ n1 (2π)3 δ(~k)δ(~q) ,
115
n1 ≥ 0,
lösen. Die Teilchendichte in diesem Zustand ist
hni = nkr + n1 .
Anschaulich passiert also folgendes. Bei µ = 0 kostet es keine Energie, ein Teilchen im Grundzustand (d.h. mit ~k = 0 und damit E~k = 0) dem System hinzuzufügen. Daher kann dieser Zustand
mit einer makroskopischen Anzahl von Teilchen besetzt werden. Bose-Einstein-Kondensate wurden im Labor zum ersten Mal 1995 hergestellt (Nobelpreis für Physik 2001).
Wir betrachten nun das ideale Bosegas als Beschreibung von Photonen, also Lichtteilchen.
Da diese masselos
p sind, müssen wir relativistisch rechnen, also die relativistische Dispersions-
relation E~k = m2 c4 + ~2~k 2 c2 , in diesem Fall E~k = ~c|~k|, verwenden. Für %~k , die Energiedichte
pro scharfem Impuls ~k gilt dann – wegen µ = 0 für Photonen und zwei unabhängigen Polarisationszuständen –
h%~k i = E~k hn~k i =
2
~c|~k|
~ω
2
=
,
3
3
β~ω
~
β~c|
k|
(2π) e
(2π) e
−1
−1
ω = c|~k| .
Für die gesamte Energiedichte gilt also das bekannte Planck’sche Strahlungsgesetz
Z
h%i =
R3
2.6
d3 k h%~k i =
1
π2
Z
∞
dω
0
~ω 3
1
.
c3 eβ~ω − 1
Ferromagnetismus, das Ising-Modell
Zum Abschluss wollen wir das Ising-Modell diskutieren, das eine stark vereinfachte Beschreibung für Ferrogmagnetismus liefert. Wir betrachten ein kubisches Gitter mit N Gitterpunkten.
(i)
An jedem Gitterpunkt i ∈ {1, 2, . . . , N } sitzt ein Spin 1/2 Freiheitsgrad. Es sei σi = 2/~Sz der
entsprechende Spin-z Operator in Einheiten von ~ mit Eigenwerten ±1. Der Hamiltonoperator
sei
N
X
J X
H=−
σi σj − h
σi ,
2
i,j n.N.
i=1
wobei h die Kopplung an ein externes homogenes Magnetfeld darstellt, J die Kopplung zwischen
zwei benachbarten Spins angibt und “n.N.” bedeutet, dass man beim Wechselwirkungsterm
nur über nächste Nachbarn summiert. Man nimmt also an, dass übernächste Nachbarn nicht
miteinander wechselwirken.
Wir betrachten eine ferrogmagnetische Kopplung J > 0, d.h. die Parallelstellung benachbarter Spins ist im Gegensatz zur Antiparallelstellung energetisch bevorzugt. Im Abschnitt über
Quantenmechanik haben wir diskutiert dass zu jedem geladenen Teilchen mit Spin ein magnetisches Moment gehört, so dass zwischen geladenen Teilchen mit Spin eine direkte magnetische
Wechselwirkung vorhanden ist. Wir haben in Form der Austauschwechselwirkung auch eine indirekte magnetische Wechselwirkung kennengelernt. Diese indirekte Wechselwirkung resultiert
aus dem Pauli-Prinzip, das z.B. impliziert, dass zwei ununterscheidbare Spin 1/2 Teilchen mit
116
paralleler Spinausrichtung im Mittel weiter voneinander entfernt sein müssen als zwei solche
Teilchen mit antiparalleler Spinausrichtung. Es stellt sich heraus, dass diese indirekte magnetische Wechselwirkung in der Regel deutlich über die direkte dominiert, so dass Ferromagnetismus
auf die Austauschwechselwirkung und damit das Pauli-Prinzip zurückgeführt werden kann.
Um die Frage zu beantworten, ob und wie das Ising-Modell Ferromagnetismus beschreibt,
betrachten wir das dazugehörige kanonische Ensemble beschrieben durch die Dichtematrix
ρ=
e−βH
.
Z
Die entscheidende Größe ist die (mittlere) Magnetisierung
N
N
1 X −βH 1 X
hσi i =
Sp σi e
.
m=
N
ZN
i=1
i=1
m ist eine Funktion von β und h. Von einem ferromagnetischen Verhalten sprechen wir, wenn
bei h = 0 m 6= 0 ist, d.h. auch bei abgeschaltetem äußerem Magnetfeld bleibt der Kristall
magnetisch. Es stellt sich heraus, dass bei endlichem N , also einem endlichen Gitter, kein ferromagnetisches Verhalten sichtbar wird. Daher betrachten wir den thermodynamischen Limes
N → ∞.
Weil das System im thermodynamischen Limes translationsinvariant ist und wir einen Gleichgewichtszustand beschreiben wollen der per Definition homogen ist, muss gelten
hσi i = m
für alle i .
Um m zu berechnen müssen wir im Prinzip die Eigenzustände von H kennen. In einer und zwei
Raumdimensionen ist es möglich das Ising-Modell exakt zu lösen. In drei Raumdimensionen ist
eine exakte Methode nicht bekannt, daher greift man auf die sogenannte Molekularfeldnährung
– im Englischen treﬀender mean field approximation genannt – zurück. In dieser Nährung nimmt
man an, dass auf den Spin am i-ten Gitterplatz nur die Mittelwerte hσj i = m seiner nächsten
Nachbarn wirken. Man ersetzt also H durch
HMF = −Jν
X
i
σi m − h
X
σi = −(Jνm + h)
i
X
σi .
i
Dabei ist ν die Anzahl der nächsten Nachbarn, in einem dreidimensionalen kubischen Gitter also
ν = 6. In dieser Näherung haben wir es oﬀenbar mit unendlich vielen Kopien desselben Systems
zu tun, die jeweils nicht miteinander wechselwirken sondern nur mit dem eﬀektiven externen
Feld Jvm+h, das hier eine unbekannte Größe ist. Wegen hσi i = m reicht es also, zur Berechnung
von m ein einzelnes System mit Hamiltonoperator und Dichtematrix
HMF,1 = −(Jνm + h)σ ,
117
ρMF,1 =
e−βHMF,1
Z
zu betrachten. Es gilt
Sp σeβ(Jνm+h)σ
−e−β(Jvm+h) + eβ(Jvm+h)
=
= tanh (β(Jνm + h)) .
m = hσi = Sp(σρMF,1 ) =
e−β(Jvm+h) + eβ(Jvm+h)
Sp eβ(Jνm+h)σ
Wir erhalten also im Fall h = 0 mittels der Molekularfeldnäherung die Selbstkonsistenzgleichung
m = tanh (βJνm) .
Wir können die Lösungen dieser Gleichung graphisch bestimmen.
tanh (βJνm) für βJν ∈ {1/2, 1, 3/2, 2} im Vergleich zu m (gestrichelt).
Für βJν < 1 gibt es nur eine Lösung m = 0. Für βJν > 1 gibt es drei Lösungen, zum einen
m = 0 und zum anderen m(β) = ±|m(β)|, wobei |m(β)| eine monoton steigende Funktion von
β ist mit |m(β)| = 1 für β → ∞. Die Lösung m = 0 kann man im letzteren Fall außer Acht
lassen, da sie energetisch höher als die anderen beiden liegt. Der Wechsel zwischen den beiden
Situationen wird durch die kritische Curie-Temperatur
Tkr =
Jν
k
118
markiert, die – nicht überraschend – groß ist, wenn die eﬀektive Kopplung Jν groß ist, das Material also ein “guter” Ferromagnet ist22 . Wir finden also ein Verhalten analog zum Phasenübergang
flüssig/gasförmig bei realen Gasen: Für T < Tkr gibt es zwei Phasen mit m(T ) = ±|m(T )| die
koexistieren können und das Material ist ferromagnetisch, für T > Tkr existiert nur noch eine
nicht ferromagnetische Phase mit m = 0.
Das m-T -Phasendiagramm ähnelt dabei verbüﬀend dem v -T - Phasendiagramm des realen
Gases und verdeutlicht die Universalität von Phasenübergängen.
v -T -Phasendiagramm des gasförmig/flüssig Übergangs eines realen Gases
m
+|m(T)| ferromagnetisch
mkr= 0
“verboten”
nicht
ferromagnetisch
--|m(T)| ferromagnetisch
Tkr
T
m-T -Phasendiagramm des Phasenübergangs eines Ferromagneten
22
Tatsächlich findet man in einer Raumdimension, also bei ν = 2, dass die exakte Lösung kein ferromagnetisches
Verhalten zeigt, das ist erst in zwei und (vermutlich) mehreren Raumdimensionenen der Fall. Im Limes ν → ∞ wird
die Molekularfeldnäherung exakt.
119