Theoretische Physik für das Lehramt L2 Teil II

Werbung
Theoretische Physik für das Lehramt L2
Teil II
Statistische Physik und Thermodynamik
Helmut Neufeld
Fakultät für Physik
Universität Wien
Wintersemester 2008/09
ii
Inhaltsverzeichnis
1 Statistische Physik
1
1.1
Aufgabenstellung der statistischen Physik
. . . . . . . . . . . . .
1
1.2
Entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
2 Gleichgewichtszustände
5
2.1
Allgemeine Charakterisierung von Gleichgewichtszuständen . . . .
5
2.2
Mikrokanonisches Ensemble . . . . . . . . . . . . . . . . . . . . .
6
2.3
Kanonisches Ensemble . . . . . . . . . . . . . . . . . . . . . . . .
8
2.4
System in Kontakt mit einem Wärmebad . . . . . . . . . . . . . .
10
2.5
Temperatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
2.6
Paramagnetismus . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
2.7
Großkanonisches Ensemble . . . . . . . . . . . . . . . . . . . . . .
14
3 Thermodynamik
17
3.1
Hauptsätze der Thermodynamik . . . . . . . . . . . . . . . . . . .
17
3.2
Einfache Anwendungen . . . . . . . . . . . . . . . . . . . . . . . .
19
4 Identische Teilchen
23
4.1
Mehrteilchensysteme . . . . . . . . . . . . . . . . . . . . . . . . .
23
4.2
Quantenstatistik nicht wechselwirkender Teilchen . . . . . . . . .
26
4.3
Maxwell-Boltzmann-Statistik
. . . . . . . . . . . . . . . . . . . .
28
4.4
Ideales Gas im klassischen Limes . . . . . . . . . . . . . . . . . .
29
iii
INHALTSVERZEICHNIS
iv
5 Photonen
33
5.1
Energie des elektromagnetischen Feldes . . . . . . . . . . . . . . .
33
5.2
Freies elektromagnetisches Feld . . . . . . . . . . . . . . . . . . .
36
5.3
Feldquantisierung . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
5.4
Teilcheninterpretation
41
. . . . . . . . . . . . . . . . . . . . . . . .
6 Plancksches Strahlungsgesetz
43
6.1
Hohlraumstrahlung . . . . . . . . . . . . . . . . . . . . . . . . . .
43
6.2
Strahlungsdruck . . . . . . . . . . . . . . . . . . . . . . . . . . . .
47
6.3
Schwarzer Strahler . . . . . . . . . . . . . . . . . . . . . . . . . .
48
6.4
Oberflächentemperatur von Planeten . . . . . . . . . . . . . . . .
50
A Unitäre Vektorräume
53
A.1 Komplexes Skalarprodukt . . . . . . . . . . . . . . . . . . . . . .
53
A.2 Norm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
A.3 Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . .
56
A.4 Adjungierte Abbildung . . . . . . . . . . . . . . . . . . . . . . . .
57
A.5 Orthonormalbasis . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
A.6 Projektionsoperatoren . . . . . . . . . . . . . . . . . . . . . . . .
62
A.7 Hermitesche Operatoren . . . . . . . . . . . . . . . . . . . . . . .
63
A.8 Unitäre Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . .
65
A.9 Normale Operatoren . . . . . . . . . . . . . . . . . . . . . . . . .
66
A.10 Spektralsatz für normale Operatoren . . . . . . . . . . . . . . . .
67
A.11 Gleichzeitige Diagonalisierbarkeit . . . . . . . . . . . . . . . . . .
72
A.12 Funktionen normaler Operatoren . . . . . . . . . . . . . . . . . .
73
B Einfache Quantensysteme
77
B.1 Grundpostulate der Quantentheorie . . . . . . . . . . . . . . . . .
77
B.2 Spin 1/2 System
. . . . . . . . . . . . . . . . . . . . . . . . . . .
84
B.3 Zeitentwicklung in der Quantenmechanik . . . . . . . . . . . . . .
87
INHALTSVERZEICHNIS
C Literatur
v
89
C.1 Statistische Physik und Thermodynamik . . . . . . . . . . . . . .
89
C.2 Mathematische Methoden . . . . . . . . . . . . . . . . . . . . . .
89
vi
INHALTSVERZEICHNIS
Kapitel 1
Statistische Physik
1.1
Aufgabenstellung der statistischen Physik
Es wäre ein aussichtsloses Unterfangen, den Zustand eines makroskopischen Systems, das aus einer sehr großen Anzahl von Teilchen besteht, durch einen reinen Zustand beschreiben zu wollen. In diesem Fall haben wir es mit gemischten Zuständen zu tun, die bekanntlich durch Dichteoperatoren dargestellt werden
können. Jene Dichteoperatoren, die thermodynamischen Gleichgewichtszuständen
entsprechen, können sehr leicht durch Wahrscheinlichkeitsargumente gefunden
werden.
Hat man es mit Systemen zu tun, die aus einer sehr großen Anzahl N von Teilchen
(typische Größenordnung: Loschmidtsche Zahl L ∼ 6 × 1023 mol−1 ) bestehen, so
ist es unmöglich jene vollständige Information zu besitzen, die zur Festlegung eines reinen Zustandes derartiger Systeme nötig wäre. Klassisch gesprochen, müsste
man dafür zu einem bestimmten Zeitpunkt die Positionen und Geschwindigkeiten
aller N Teilchen genau kennen (das entspräche der Kenntnis von 6N reellen Zahlen). Bei der quantenmechanischen Beschreibung eines Systems von N spinlosen
Teilchen müsste man (wenn man in der Ortsdarstellung arbeitet) eine Wellenfunktion der Form ψ(x1 , . . . xN ) angeben, was ebenfalls völlig aussichtslos wäre.
Tatsächlich steht uns bei der Beschreibung des Zustands eines makroskopischen
System nur eine sehr viel geringere Information zur Verfügung, die weit von jener
maximalen Information entfernt ist, die zur Festlegung eines reinen Zustandes
nötig wäre. Betrachten wir etwa ein Gas, das sich in einem geschlossenen Behälter
befindet, so kennen wir vielleicht die Art des Gases (z.B. Helium), das von ihm
eingenommene Volumen V , seine Gesamtmasse M, den Druck p, den es auf die
Wände ausübt. Weiters könnte uns bekannt sein, dass der Gasbehälter schon so
lange in einem Raum mit konstanter Zimmertemperatur steht, sodass sich auch
1
KAPITEL 1. STATISTISCHE PHYSIK
2
die Temperatur T des Gases jener der Umgebung angeglichen hat. Durch welchen
Dichteoperator ρ wird der so festgelegte Zustand des Gases beschrieben?
Wir werden uns in dieser Vorlesung fast ausschließlich mit sogenannten Gleichgewichtszuständen beschäftigen. Die entsrechenden Dichteoperatoren lassen sich
in diesem Fall nämlich sehr leicht durch Wahrscheinlichkeitsargumente finden.
1.2
Entropie
Die Entropie spielt in der statistischen Physik eine zentrale Rolle. Sie ist ein Maß
für die Gemischtheit“ eines Zustandes.
”
Ein bestimmter Zustand werde durch den Dichteoperator
ρ=
pn |nn| ,
pn ≥ 0,
Trρ =
n
n
pn = 1,
n
beschrieben. Man kann sich diesen Zustand durch eine sehr große Anzahl N von
Kopien des Systems vorstellen, wobei sich N1 = p1 N von ihnen im reinen Zustand
|1 befinden, N2 = p2 N im Zustand |2, usw., wobei
Nn = N .
n
In diesem Fall gibt es
N!
N1 ! N2 ! . . .
verschiedene Möglichkeiten, dass sich von den insgesamt N Kopien des Systems
N1 = p1 N im reinen Zustand |1 befinden, N2 = p2 N im Zustand |2, und so
fort. Da Γ (in den uns interessierenden Fällen) i.A. eine sehr große Zahl sein wird,
ist es vorteilhaft, die etwas handlichere Größe
ln Nn !
ln Γ = ln N ! −
Γ=
n
zu verwenden. Aus dem selben Grund kann man die Stirlingsche Formel
ln N ! N ln N − N + . . .
anwenden, die für N 1 mit sehr guter Genauigkeit erfüllt ist. Man erhält daher
ln Γ N ln N − N −
(Nn ln Nn − Nn )
= N ln N −
n
n
Nn ln Nn .
1.2. ENTROPIE
3
Setzt man in diesen Ausdruck Nn = pn N ein, so erhält man
N pn (ln N + ln pn )
ln Γ N ln N −
= −N
n
pn ln pn = −N Tr(ρ ln ρ)
n
bzw.
ln Γ
−Tr(ρ ln ρ).
N
Die rechte Seite der letzten Formel ist unabhängig von N und wird (abgesehen von
einem historisch bedingten Faktor k) als Entropie des durch den Dichteoperator
ρ beschriebenen Zustands bezeichnet:
S = −k Tr(ρ ln ρ)
Der Proportionalitätsfaktor
k 1.38 × 10−23 JK−1
wird als Boltzmann1 -Konstante bezeichnet.
Bemerkung: ln Γ N S/k ⇔ Γ exp(N S/k).
Beispiele: Wir betrachten einen N-dimensionalen Zustandsraum H.
1. Für einen reinen Zustand ρ = |ψψ| (ψ|ψ = 1) ist −Tr(ρ ln ρ) = 0 und
die Entropie somit minimal.
2. Im Zustand ρ = /N (maximale Mischung) ist −Tr(ρ ln ρ) = ln N. Die
Entropie ist in diesem Fall maximal.
1
Ludwig Boltzmann, 1844 Wien – 1906 Duino.
4
KAPITEL 1. STATISTISCHE PHYSIK
Kapitel 2
Gleichgewichtszustände
2.1
Allgemeine Charakterisierung von Gleichgewichtszuständen
Thermodynamische Gleichgewichtszustände sind zeitlich konstante Zustände, für
welche die Entropie, unter Berücksichtigung aller vorhandenen Nebenbedingungen, maximal ist.
Ein quantenmechanisches System werde durch den Hamiltonoperator H beschrieben. Ein Gleichgewichtszustand dieses Systems kann durch die folgenden Forderungen charakterisiert werden:
1. Der Dichteoperator ρ soll zeitlich konstant sein.
2. Die Entropie soll unter Berücksichtigung aller Nebenbedingungen, denen
das System unterliegt, maximal sein.
Wegen der von Neumann1 -Gleichung,
ih̄
dρ(t)
= [H, ρ(t)],
dt
folgt aus der oben geforderten zeitlichen Konstanz des Dichteoperators, dass H
und ρ vertauschen. Es existiert somit ein gemeinsames vollständiges Orthonormalsystem |1, |2, . . . von Eigenvektoren:
H|n = En |n,
ρ|n = pn |n.
Bemerkung: Sind außer der Energie weitere Erhaltungsgrößen vorhanden,
können diese auf analoge Weise berücksichtigt werden.
1
Johann von Neumann, 1903 Budapest – 1957 Washington, D.C.
5
KAPITEL 2. GLEICHGEWICHTSZUSTÄNDE
6
2.2
Mikrokanonisches Ensemble
Wir wollen den Dichteoperator eines abgeschlossenenen Systems im thermischen Gleichgewicht finden. Die Energie des Systems sei auf den Bereich
I(E, δE) = [E − δE, E]
beschränkt. In diesem Fall müssen wir also das Maximum von
pn ln pn
−
En ∈I(E,δE)
unter Berücksichtigung der Nebenbedingung
pn = 1
En ∈I(E,δE)
finden. Die Nebenbedingung wird am besten durch einen Lagrangeschen2 Multiplikator berücksichtigt. Wir betrachten daher die Funktion
f (p1 , p2 , . . . , λ) = −
pn ln pn + λ(1 −
pn ).
En ∈I(E,δE)
En ∈I(E,δE)
Nullsetzen der Ableitungen nach p1 , p2 , . . . und λ ergibt
∂f
= 0 ⇒ ln pm = −1 − λ,
∂pm
∂f
=0 ⇒
pn = 1.
∂λ
En ∈I(E,δE)
Das heißt, für alle n mit En ∈ I(E, δE) ist pn eine von n unabhängige Konstante. Bezeichnet man die Anzahl der Zustände im zugänglichen Energieintervall
I(E, δE) mit
Ω(E, δE) =
1,
En ∈I(E,δE)
so erhält man
1/Ω(E, δE) für En ∈ I(E, δE)
.
pn =
0
sonst
Das ist gleichbedeutend mit
ρM K =
2
1
Ω(E, δE)
|nn|.
En ∈I(E,δE)
Joseph-Louis Lagrange, 1736 Turin – 1813 Paris.
2.2. MIKROKANONISCHES ENSEMBLE
7
Für die Entropie ergibt sich daher
S = k ln Ω(E, δE).
Befindet sich ein abgeschlossenenes (isoliertes) System im thermodynamischen
Gleichgewicht, tritt also jeder der zugänglichen Energieeigenzustände |n (En ∈
I(E, δE)) mit der gleichen Wahrscheinlichkeit
pn =
1
Ω(E, δE)
auf, wobei Ω(E, δE) die Anzahl der im Intervall I(E, δE) befindlichen Energieeigenzustände ist. Diese Charakterisierung wird manchmal auch als Fundamentalpostulat (FP) der statistischen Physik bezeichnet.
Bemerkungen3 : Das FP definiert“ das Gleichgewicht, seine Rechtfertigung ist
”
durch das Experiment gegeben.
Unter welchen Annahmen folgt das FP aus der Quantenmechanik? Welche dieser
Annahmen haben physikalischen (und nicht nur rein mathematischen) Inhalt?
Klarerweise gilt das FP nur für makroskopische Systeme. Um ein makroskopisches
System zu erhalten, kann man die Teilchendichte N/V konstant halten, aber N
und V sehr groß werden lassen (thermodynamischer Limes).
Lässt man die Zeitentwicklung bei t = 0 in einem reinen Zustand starten, wird das
System i.A. nicht im Gleichgewicht sein. Erst nach einer Zeit t τr wird sich das
Gleichgewicht einstellen, wobei τr die Relaxationszeit des Systems ist (τr ist die
typische Zeit, die ein System braucht, um nach einer plötzlichen Störung wieder
ins Gleichgewicht zu kommen; ein System kann für verschiedene Freiheitsgrade
unterschiedliche Relaxationszeiten haben). Der Übergang vom reinen Zustand bei
t = 0 zum gemischten Gleichgewichtszustand kann nicht durch die von NeumannGleichung beschrieben werden (dabei würde sich die Entropie nicht ändern). Für
den Übergang von einem reinen Zustand zum mikrokanonischen Ensemble im Fall
eines abgeschlossenen makroskopischen Systems wurden unter anderem folgende
Begründungen angegeben:
• Die Anzahl der dem Experimentator zugänglichen Observablen ist viel kleiner als die Anzahl der Freiheitsgrade des Systems (siehe frühere Diskussion).
Man sieht somit effektiv einen gemischten Zustand. Die ursprünglich vorhandene Information über das System kann im Laufe der Zeitentwicklung
schwerer zugänglich werden, was der kurzsichtige“ Beobachter als Streben
”
zum Gleichgewicht interpretiert.
• Makroskopische Messungen dauern eine endliche Zeit τM δτ , wobei δτ
die typische Zeit ist, in der eine Wechselwirkung der Teilchen untereinander
stattfindet.
3
Diese Bemerkungen sind dem T4 Skriptum von Walter Grimus entnommen.
KAPITEL 2. GLEICHGEWICHTSZUSTÄNDE
8
• Es tragen auch kleine Wechselwirkungen der Teilchen untereinander, die
im Hamiltonoperator H vernachlässigt werden, zur Durchmischung“ bei.
”
Weiters ist das System nie vollständig von seiner Umgebung isolierbar.
Jeder dieser Punkte kann in gewissen Fällen für die Begründung“ des FP aus
”
der Quantenmechanik herangezogen werden. Eine allgemein gültige Herleitung
ist schwierig, z.B. können in einem System mehrere Relaxationszeiten von völlig
unterschiedlicher Größenordnung auftreten.
Zur Erläuterung des dritten Punktes betrachten wir einen Hamiltonoperator H̄ =
H + W + U. Die Klassifikation der Energieeigenzustände des Systems erfolt nach
H, die innere Störung (Restwechselwirkung der Teilchen, die nicht in H enthalten
ist) wird durch W beschrieben und die äußere Störung (Wechselwirkung mit der
Umgebung) durch U. Ein typisches Beispiel wäre ein ideales Gas, wo der Beitrag
der Wechselwirkung zwischen den Molekülen in H vernachlässigt wird, diese ist
jedoch für das Zustandekommen des Gleichgewichts wesentlich!
2.3
Kanonisches Ensemble
In diesem Fall wird die mittlere Energie
pn En = E = const.
n
als Nebenbedingung vorgegeben. Man sucht also das Maximum von
S/k = −
pn ln pn
n
unter Berücksichtigung der beiden Nebenbedingungen
pn = 1,
pn En = E.
n
n
Analog zu vorhin, betrachten wir jetzt die Funktion
f (p1 , p2 , . . . , λ, β) = − pn ln pn + λ(1 −
pn ) + β(E −
pn En ).
n
n
Nullsetzen der Ableitungen nach p1 , p2 , . . ., λ und β ergibt
∂f
= 0 ⇒ ln pm = −1 − λ − βEm ,
∂pm
∂f
=0 ⇒
pn = 1,
∂λ
n
∂f
pn En = E.
=0 ⇒
∂β
n
n
2.3. KANONISCHES ENSEMBLE
⇒
9
pn = Ce−βEn
Die Konstante C kann mit Hilfe der Nebenbedingung
pn = 1 bestimmt werden:
n
C=
1
e−βEn
n
e−βEn
pn = −βEm
e
⇒
m
Das ist gleichbedeutend mit
e−βH
.
Tre−βH
Die absolute Temperatur T kann durch die Beziehung
ρK =
β=
1
kT
definiert werden. Durch die Nebenbedingung
n
pn En = E besteht ein Zusam-
menhang zwischen β (bzw. T ) und der mittleren Energie E:
−βEn
e
En
n
−βE
= E.
m
e
m
Definiert man die kanonische Zustandssumme
e−βEn ⇔ Z = Tre−βH ,
Z=
n
so kann man die mittlere Energie (den Erwartungswert von H) folgendermaßen
berechnen:
−βEn
e
En
∂ ln Z
n
= −βEm .
H = −
∂β
e
m
Aufgabe: Zeigen Sie, dass die Entropie eines kanonischen Ensembles durch
S=
gegeben ist.
E
+ k ln Z
T
KAPITEL 2. GLEICHGEWICHTSZUSTÄNDE
10
2.4
System in Kontakt mit einem Wärmebad
Man kann auch durch eine andere Überlegung zum kanonischen Ensemble gelangen: Wir betrachten ein kleines“ System A (kann auch ein mikroskopisches Sy”
stem sein) im thermischen Kontakt mit einem Wärmebad“ B (makroskopisches
”
System). Das aus A und B bestehende System sei abgeschlossen. Der Hamiltonoperator des Gesamtsystems is HA + HB + W . Der Wechselwirkungterm W ist
für den thermischen Kontakt der beiden Subsysteme zwar wesentlich, wir wollen
aber annehmen, dass wir ihn in der Gesamtenergiebilanz vernachlässigen können:
E = EA + EB .
Die Energieeigenzustände von HA seien mit |n bezeichnet. Befindet sich das
abgeschlossene Gesamtsystem im thermischen Gleichgewicht, so ist die Wahrscheinlichkeit, dass sich das System A im n-ten Energieeigenzustand mit Energie
En befindet durch
ΩB (E − En , δE)
pn =
Ω(E, δE)
gegeben. Dabei ist Ω(E, δE) die Anzahl der zugänglichen Zustände des Gesamtsystems A+B und ΩB (E − En , δE) die Anzahl der Zustände des Systems B mit
Energie E−En (innerhalb des Energieintervalls δE). Die Taylorreihenentwicklung
ln ΩB (E − En , δE) = ln ΩB (E, δE) − En
∂ ln ΩB (E, δE)
+...
∂E
β
liefert
ΩB (E − En , δE) = ΩB (E, δE)e−βEn .
Für die Wahrscheinlichkeit, dass sich das System A im n-ten Energieeigenzustand
befindet, ergibt sich daher wie früher
pn = Ce−βEn ,
beziehungsweise
pn =
1 −βEn
e
,
Z
Z=
e−βEn .
n
Wir sehen, dass zwischen der Temperatur T des Wärmebades und der Abhängigkeit der Anzahl seiner Zustände von der Energie die Beziehung
β=
1
∂ ln ΩB (E, δE)
=
∂E
kT
besteht.
Man kann also das kanonische Ensemble auch als ein System auffassen, das sich
im Gleichgewicht mit einem Wärmebad mit vorgegebener Temperatur T befindet.
2.5. TEMPERATUR
2.5
11
Temperatur
Die absolute Temperatur ist eine Gleichgewichtsgröße, d.h. nur einem System,
das sich im Gleichgewicht befindet, kann man eine Temperatur T zuschreiben.
Wir hatten die absolute Temperatur T zunächst über den Parameter β = 1/kT
des kanonischen Ensembles eingeführt,
pn =
1 −βEn
e
,
Z
Z=
e−βEn
n
und dann gesehen, dass man diese Größe auch im mikrokanonischen Ensemble
durch die Formel
∂ ln Ω(E, δE)
1
β=
=
∂E
kT
definieren kann.
Wir betrachten zwei kanonische Ensembles A, B mit den Temperaturen TA =
1/kβA und TB = 1/kβB . Die Energieeigenzustände des Systems A werden mit |n
bezeichnet, jene des Systems B mit |r. Die entsprechenden Wahrscheinlichkeiten
sind dann durch
1 −βEnA
1 −βErB
pA
e
,
pB
e
n =
r =
ZA
ZB
gegeben. Die beiden Systeme werden nun in thermischen Kontakt gebracht, sodass Energieaustausch möglich wird (Hamiltonoperator H = HA + HB + W ).
Ist die Wechselwirkung zwischen den beiden Systemen schwach (W HA,B ), so
können die Energieeigenzustände des Gesamtsystems näherungsweise durch die
Quantenzahlen “ |n, r mit dazugehörigen Energieeigenwerten En,r = EnA + ErB
”
charakterisiert werden. Unmittelbar nachdem A und B in thermischen Kontakt
gebracht wurden sind die Wahrscheinlichkeiten der Energieeigenzustände des Gesamtsystems
A
B
e−βA En e−βB Er
A B
.
pn,r = pn pr =
ZA ZB
Dies beschreibt nur dann einen Gleichgewichtszustand, falls βA = βB =: β ist. In
diesem Fall erhält man die kanonische Verteilung
A
pK
n,r
B
e−β(En +Er )
=
.
ZA ZB
Ist dagegen βA = βB , so entsprechen die pn,r keiner kanonischen Verteilung und
somit keinem Gleichgewichtszustand. In diesem Fall wird es zu einer Zustansänderung kommen, bis schließlich die kanonische Verteilung pK
n,r (der Zustand mit
maximaler Entropie) für einen gewissen Wert von β erreicht ist.
KAPITEL 2. GLEICHGEWICHTSZUSTÄNDE
12
Bemerkung: Wir sehen, dass die kanonische Zustandsumme Z zweier schwach
miteinander wechselwirkender Systeme einfach das Produkt der Zustandssummen
der Teilsysteme ist:
A
B
A
B
A
B
Z=
e−β(En +Er ) =
e−βEn e−βEr =
e−βEn
e−βEr .
n,r
n r ZA
ZB
Analog ist die Entropie S des zusammengesetzten Systems die Summe der Entropien der Teilsysteme:
S=
2.6
E
EA + EB
+ k ln Z =
+ k(ZA + ZB ) = SA + SB .
T
T
Paramagnetismus
Unsere Überlegungen zur kanonischen Verteilung sollen nun auf ein sehr einfaches
physikalisches System angewendet werden. Wir betrachten eine Substanz mit
N0 magnetischen Momenten μ (mit Spin 1/2) pro Volumen in einem äußeren
= Bez . Der Hamiltonoperator für einen der Spins ist dann
Magnetfeld B
−μB
0
= −μBσ3 =
H = −μ · B
0
+μB
Die Energieeigenwerte sind E↑ = −μB, E↓ = +μB und die dazugehörigen (normierten) Eigenvektoren
1
0
χ↑ =
, χ↓ =
.
0
1
Hat die Substanz die Temperatur T = 1/kβ, so wirkt diese für den betrachteten
Spin als Wärmebad und seine Zustandssumme
Z = Tre−βH = eβμB + e−βμB = 2 cosh(βμB),
entsprechend der kanonischen Verteilung
p↑ =
eβμB
,
Z
p↓ =
e−βμB
.
Z
Den Mittelwert der Komponente des magnetischen Moments in Richtung des
angelegten äußeren Feldes erhält man durch Berechnung von
μ̄z = p+ μ + p− (−μ) =
μB
eβμB μ − e−βμB μ
= μ tanh(βμB) = μ tanh
.
βμB
−βμB
e μ+e
μ
kT
2.6. PARAMAGNETISMUS
13
Bemerkung: Man hätte natürlich auch ∂ ln Z/∂(βB) berechnen können:
μ̄z =
sinh(βμB)
μ = μ tanh(βμB).
cosh(βμB)
Für die Magnetisierung M̄0 (mittleres magnetisches Moment pro Volumen)
erhält man
M̄0 = N0 μ̄z = N0 μ tanh(βμB).
Im Grenzfall großer Temperaturen (μB kT ) ergibt sich
μ̄z μ2 B
kT
bzw. M̄0 N0 μ2 B
.
kT
Die Größe
N0 μ2
kT
wird als magnetische Suszeptibilität bezeichnet, die Tatsache, dass sich diese
für große Temperaturen wie χ ∼ 1/T verhält, ist das Curiesche Gesetz.
χ=
Dagegen sind im Limes kleiner Temperaturen (μB kT ) die Spins im Grundzustand eingefroren und man erhält
μ̄z μ bzw. M̄0 N0 μ.
Wir wollen uns jetzt überlegen, welche statistischen Schwankungen in einem System von N Spins mit magnetischem Moment μ auftreten. (Dabei muss vorausgesetzt werden, dass die verschiedenen Spins im Prinzip an verschiedenen
Gitterpunkten lokalisierbar sind.) Wir haben oben die Zustandssumme für ein
magnetisches Moment berechnet:
Z1 = 2 cosh(βμB).
Die Zustandssumme von N schwach miteinander wechselwirkenden magnetischen
Momenten ist daher
ZN = Z1N = 2N coshN (βμB).
Wie bereits besprochen, kann man das mittlere magnetische Moment eines Spins
durch differenzieren von Z1 nach βB erhalten:
μ̄z = μ tanh(βμB).
Durch nochmaliges Differenzieren ergibt sich das Schwankungsquadrat des magnetischen Moments:
∂ μ̄z
∂ eβμB μ − e−βμB μ
=
∂(βμ)
∂(βμ)
Z1
βμB 2
−βμB
e μ +e
(−μ)2 μ2 (eβμB − e−βμB )2
=
−
Z1
Z12
= μ2z − (μ̄z )2 = (Δμz )2 .
KAPITEL 2. GLEICHGEWICHTSZUSTÄNDE
14
⇒ = (Δμz )2 =
μ2
.
cosh2 (βμB)
Für den Erwartungswert des gesamten magnetischen Moments aller N Spins
erhält man daher
∂
ln Z
∂(βB)
∂
∂
ln(2N coshN (βμB)) = N
cosh(βμB) .
=
∂(βB)
∂(βB)
(1)
(2)
(n)
M = μz + μz + . . . + μz =
μ̄z
Analog erhält man für das Schwankungsquadrat von M:
(ΔM)2 =
⇒
ΔM
=
M
∂M
= N(Δμz )2 ,
∂(βB)
√
1 Δμz
1
1
N Δμz
=√
=√
,
N μ̄z
N μ̄z
N sinh(βμB)
wird für großes N (makroskopisches
d.h. die relative Schwankung ΔM/M
√
System) verschwindend klein (∼ 1/ N )
Bemerkung: Im thermodynamischen Limes (N → ∞) besteht, wegen des Verschwindens der relativen Schwankungen, zwischen mikrokanonischem und kanonischem Ensemble kein Unterschied mehr. Da die Berechnung der kanonischen
Zustandssumme Z i.A. einfacher ist als die Ermittlung der Anzahl Ω(E, δE) der
Zustände in einem Energieintervall beim mikrokanonischen Ensemble, wird die
Verwendung des kanonische Ensembles bei praktischen Rechnungen bevorzugt.
Aufgabe: Behandeln Sie die Theorie des Paramagnetismus mit Hilfe des mikrokanonischen Ensembles.
2.7
Großkanonisches Ensemble
Kann ein Subsystem A mit einem großen System B nicht nur Energie, sondern
auch Teilchen austauschen, so gelangt man im Gleichgewicht zur großkanonischen Verteilung.
Der Hamiltonoperator des Systems A werde mit H und der Teilchenzahloperator
mit N bezeichnet. Wir nehmen an, dass H und N vertauschen und es daher eine
gemeinsame Orthonormalbasis {|n} von Eigenvektoren der beiden Operatoren
gibt:
H|n = En |n,
N|n = Nn |n.
2.7. GROSSKANONISCHES ENSEMBLE
15
Zum Ausdruck für den Dichteoperator des großkanonischen Ensembles gelangt
man wieder am einfachsten dadurch, dass man das Maximum der Entropie bei
vorgegebener mittlerer Energie E und mittler Teilchenzahl N bestimmt:
H = E,
N = N .
Wir bestimmen das Maximum der Funktion
pn )+β(E−
pn En )+α(N−
pn Nn ).
f (p1 , p2 , . . . , λ, β, α) = − pn ln pn +λ(1−
n
n
n
n
∂f
= 0 = − ln pm − 1 − λ − βEm − αNm
∂pm
⇒
pn = Ce−βEn −αNn
Wir definieren das chemische Potential μ = α/β und erhalten
pn = Ce−β(En −μNn ) .
Die Konstante C ist wieder durch die Normierungsbedingung
pn = 1
n
festgelegt:
pn =
1 −β(En −μNm )
,
e
Y
Y =
e−β(En −μNm ) .
n
Y wird als großkanonische Zustandssumme bezeichnet. Der Dichteoperator
des großkanonischen Ensembles hat daher die Form:
ρGK =
1 −β(H−μN )
e
,
Y
Y = Tre−β(H−μN ) .
16
KAPITEL 2. GLEICHGEWICHTSZUSTÄNDE
Kapitel 3
Thermodynamik
Die Thermodynamik kann zwar aus der statistischen Physik hergeleitet werde, sie
ist jedoch eine rein makroskopische Theorie, die keinen Bezug auf die mikroskopische Struktur der Materie nimmt.
3.1
Hauptsätze der Thermodynamik
Wir betrachten ein System, das durch einen Hamiltonoperator H(x1 , x2 , . . .) beschrieben wird. Die Größen x1 , x2 , . . . sind dabei gewisse äußere Parameter des
Systems.
Beispiele:
1. Unser betrachtetes System bestehe aus N Spins, die sich in einem äußeren
befinden. Der Hamiltonoperator hat (bei vernachlässigbarer
Magnetfeld B
Spin-Spin-Wechselwirkung) die Form
=−
H(B)
N
(k) · B.
μ
k=1
sind in diesem Fall äußere Parameter
Die Komponenten des Magnetfeldes B
des Systems.
2. N Teilchen seien in einem Behälter mit dem Volumen V eingeschlossen. V
ist ein äußerer Parameter dieses Systems.
Befindet sich das System in dem durch den Dichteoperator ρ beschriebenen Zustand, so ist der Erwartungwert der Energie des Systems durch
E = Tr H(x1 , x2 , . . .)ρ)
17
KAPITEL 3. THERMODYNAMIK
18
gegeben. In einem thermisch und mechanisch isolierten System ist ρ(t) =
exp(−iHt/h̄)ρ(0) exp(iHt/h̄) und E daher zeitlich konstant.
Eine Änderung von E kann nun auf zwei verschiedene Arten erfolgen: Entweder durch Änderung eines (oder mehrerer) der äußeren Parameter (das äußere
Magnetfeld, in dem sich das Spinsystem befindet, wird geändert; das Volumen
des Gasbehälters wird verkleinert). In diesem Fall spricht man von der durch die
Änderungen Δx1 , Δx2 , . . . am System geleisteten Arbeit A. Bleiben dagegen alle
äußeren Parameter x1 , x2 , . . . des Systems unverändert, so kann eine Änderung
von E dennoch durch Wärmeaustausch“ mit der Umgebung stattfinden, bei der
”
sich der Dichteoperator ρ ändert. Eine derartige Energieänderung bezeichnet man
als die dem System zugeführte Wärme Q. Diese Beobachtungen werden im 1.
Hauptsatz der Thermodynamik zusammengefasst:
ΔE = A + Q.
Bemerkung: Handelt es sich um einen Gleichgewichtszutand, so ist dessen in”
nere Energie“ E durch seine Entropie S und die äußeren Parameter x1 , x2 , . . .
festgelegt.
Die Entropie eines isolierten Systems nimmt zu, bis schließlich der Gleichgewichtszustand erreicht ist, in dem die Entropie ihren maximalen Wert annimmt.
Diese Aussage wird als 2. Hauptsatz der Thermodynamik bezeichnet:
ΔS ≥ 0
Bei nicht isolierten Systemen, sind sogenannte quasistatische Prozesse besonders wichtig. Darunter versteht man einen Vorgang, bei dem das betrachtete System zu jedem Zeitpunkt in guter Näherung durch einen Gleichgewichtszustand
beschrieben werden kann. Die Zeit, in der eine Änderung des Systems erfolgt,
muss dabei viel größer sein als die typischen Relaxationszeiten des Systems. In
diesem Fall besteht zwischen der dem System zugeführten Wärme δQ und der
dabei erfolgten Entropieänderung der Zusammenhang
dS =
δQ
.
T
Dazu müssen wir uns nur an einige Formeln erinnern, die wir für das mikrokanonische Ensemble hergeleitet hatten. Die Entropie war durch
S = k ln Ω(E, δE)
und der Zusammenhang mit der absoluten Temperatur durch
∂ ln Ω(E, δE)
1
=
∂E
kT
3.2. EINFACHE ANWENDUNGEN
19
gegeben. Kombiniert man beide Gleichungen, so erhält man
1
∂S
= .
∂E
T
Diese Gleichung kann man so interpretieren: Ändert man die innere Energie des
Systems ohne Änderung seiner äußeren Parameter um den Betrag δQ (zugeführte
Wärme), so ändert sich die Entropie um dS = δQ/T , was gerade die behauptete
Relation ist.
Schließlich besagt der 3. Hauptsatz, dass die Entropie für T → 0 gegen eine
von allen Parametern des Systems unabhängige Konstante S0 strebt:
lim S = S0 .
T →0
Bemerkung: Der 3. Hauptsatz der Thermodynamik kann durch Betrachtung
des kanonischen Ensembles verstanden werden. Werden die voneinander verschiedenen Energien des Systems mit E0 < E1 < . . . und die dazugehörigen
Vielfachheiten mit ν0 , ν1 , . . . bezeichnet, so ist die Wahrscheinlichkeit, dass das
System die Energie Er besitzt durch
νr e−Er /kT
νr e−(Er −E0 )/kT
pr = −Es /kT = −(Es −E0 )/kT
νs e
νs e
s
gegeben. Da für r = 0 gilt, dass Er − E0 echt größer als Null ist, folgt
lim e−(Er −E0 )/kT = 0
T →0
und
(r = 0)
1 für r = 0
.
lim pr =
T →0
0 für r = 0
Die Entropie für T → 0 ist daher
S0 = ln ν0 ,
der natürliche Logarithmis des Entartungsgrades des Grundzustands.
3.2
Einfache Anwendungen
Wir wollen die Thermodynamik auf ein ideales Gas anwenden. Ein solches wird
durch die Zustandsgleichung
pV = NkT
KAPITEL 3. THERMODYNAMIK
20
beschrieben. Im Rahmen der Thermodynamik ist dies eine rein phänomenologische Beziehung zwischen den Größen p (Druck), V (Volumen) und T (absolute
Temperatur), die man für die betrachtete Substanz gefunden hat. (Später werden
wir das ideale Gas im Rahmen der statistischen Physik behandeln, der Proportionalitätsfaktor N wird sich dann als die Anzahl der Teilchen in dem betrachteten
Gasvolumen herausstellen.)
Bei einem quasistatischen Prozess haben wir ganz allgemein
dE = δA + T dS,
bei einem Gas ist δA = −p dV , sodass wir in diesem Fall die Beziehung
dE = −p dV + T dS
⇔
dS =
p
1
dE + dV
T
T
erhalten. Wesentlich ist, dass dE und dS totale Differentiale sind, im Gegensatz
zu δA = −p dV oder δQ = T dS.
Setzen wir nun die Zustandsgleichung für ein ideales Gas ein, so erhalten wir
dS =
1
Nk
dE +
dV.
T
V
Dabei betrachten wir sowohl die Entropie S als auch die innere Energie E als
Funktionen der unabhängigen Variablen T und V :
S = S(T, V ),
E = E(T, V ).
Wir schreiben dE in der Form
dE =
∂E
∂E
dT +
dV
∂T
∂V
und setzen dies in den obigen Ausdruck für dS ein:
1 ∂E
1 ∂E
Nk
dS =
dT +
+
dV .
T
∂T
V
T
∂V
∂S
∂T
∂S
∂V
Somit erhalten wir
∂
∂V
∂
∂T
∂S
∂T
∂S
∂V
1 ∂ ∂E
,
T ∂V ∂T
1 ∂E
1 ∂ ∂E
= − 2
+
.
T ∂V
T ∂T ∂V
=
Wegen
∂ ∂E
∂ ∂E
=
,
∂T ∂V
∂V ∂T
∂ ∂S
∂ ∂S
=
∂T ∂V
∂V ∂T
3.2. EINFACHE ANWENDUNGEN
21
folgt
∂E
= 0,
∂V
das heißt die innere Energie eines idealen Gases hängt nicht von dem von ihm
eingenommenen Volumen V ab:
E = E(T )
(ideales Gas).
Bemerkung: Wir betrachten einen thermisch isolierten Behälter, der mit durch
eine bewegliche Trennwand in einen linken und rechten Teil getrennt ist. Ein ideales Gas befinde sich zunächst nur auf der linken Seite der geschlossenen Trennwand, das Gas nehme dabei das Volumen V1 ein. Nun wird die Trennwand geöffnet, das Gas kann sich nun auf das Volumen V2 > V1 verteilen. Da durch das
Öffnen der Trennwand keine Arbeit geleistet wird und das System von außen
keine Wärme aufnehmen kann, bleibt die innere Energie des Systems konstant.
Da diese bei einem idealen Gas nur von der Temperatur, aber nicht vom Volumen
abhängt, ändert sich auch die Temperatur bei diesem Expansionsvorgang nicht.
Bei einem realen Gas (z.B. van der Waals1 -Gas) ist das nicht der Fall. Hier
ist E = E(T, V ) und bei einer Volumsänderung bei konstanter innerer Energie
kommt es i.A. auch zu einer Temperaturänderung.
1
Johannes Diderik van der Waals, 1837 Leiden – 1923 Amsterdam.
22
KAPITEL 3. THERMODYNAMIK
Kapitel 4
Identische Teilchen
Eines der fundamentalen Theoreme der relativistischen Quantenfeldtheorie besagt, dass Teilchen gemäß ihrem Spin in zwei große Klassen eingeteilt werden
können. Solche mit ganzzahligem Spin sind verträgliche Wesen, man kann beliebig viele identische Teilchen dieser Art in den gleichen Einteilchenzustand hineinpferchen. Teilchen mit dieser Eigenschaft nennt man Bosonen. Teilchen mit
halbzahligem Spin sind unsozial, sie bestehen auf einem Privatzimmer. Nur eines
von ihnen kann in einem bestimmten Einteilchenzustand sitzen. Teilchen dieser
Art heißen Fermionen.
4.1
Mehrteilchensysteme
Ein reiner Zustand eines Systems von zwei unterscheidbaren Teilchen (z.B. ein
pe− -System) kann (im Ortsraum) durch eine Wellenfunktion der Form
ψ(x1 , σ1 ; x2 , σ2 )
beschrieben werden. Dabei sind x1 , σ1 die Orts-und Spinkoordinaten des ersten
Teilchens, x2 , σ2 jene des zweiten.
Handelt es sich um ein Zweiteilchensystem identischer (ununterscheidbarer)
Teilchen, so gibt es zwei Möglichkeiten:
1. Die Wellenfunktion ist symmetrisch bei gleichzeitiger Vertauschung von
Orts- und Spinkoordinaten:
ψ(x1 , σ1 ; x2 , σ2 ) = ψ(x2 , σ2 ; x1 , σ1 ).
Teilchen von diesem Typ heißen Bosonen1
1
Benannt nach Satyendra Nath Bose, 1894 Kalkutta – 1974 Kalkutta.
23
KAPITEL 4. IDENTISCHE TEILCHEN
24
2. Die Wellenfunktion ist antisymmetrisch bei gleichzeitiger Vertauschung
von Orts- und Spinkoordinaten:
ψ(x1 , σ1 ; x2 , σ2 ) = −ψ(x2 , σ2 ; x1 , σ1 ).
Teilchen von diesem Typ heißen Fermionen2
Im allgemeinen Fall von N ununterscheidbaren Teilchens ist
ψ(x1 , σ1 ; x2 , σ2 ; . . . xN , σN )
im Fall von Bosonenen total symmetrisch und im Fall von Fermionen total
antisymmetrisch, d.h. bei einer Vertauschung (xi , σi ) ↔ (xj , σj ) (i = j) ändert
sich bei Bosonen die Wellenfunktion nicht, bei Fermionen wechselt sie das Vorzeichen.
Die Tatsache, dass die Wellenfunktion eines Systems von identischen Fermionen
bei Vertauschung zweier Argumente (xi , σi ) ↔ (xj σj ) das Vorzeichen wechselt,
wird auch als Pauli-Prinzip3 oder (Paulisches) Ausschließungsprinzip bezeichnet. Für Fermionen gilt nämlich
ψ(x, σ; x, σ) = −ψ(x, σ; x, σ)
⇒
ψ(x, σ; x, σ) = 0,
d.h. zwei Fermionen mit gleicher Polarisation können nicht am gleichen Ort
sitzen.
Allgemein gilt folgendes: Gegeben sei eine Orthonormalbasis von Einteilchenwellenfunktionen φn (x, σ). Jede Zweiteilchenwellenfunktion kann dann in
der Form
ψ(x1 , σ1 ; x2 , σ2 ) =
cmn φm (x1 , σ1 )φn (x2 , σ2 )
m,n
geschrieben werden. Für Fermionen folgt aus
ψ(x1 , σ1 ; x2 , σ2 ) = −ψ(x2 , σ2 ; x1 , σ1 ),
dass cmn = −cnm und insbes. cnn = 0. Befindet sich bereits ein Fermion im Einteilchenzustand φn , so ist dieser Zustand für das zweite Fermion ausgeschlossen.
Für Bosonen ist die Situation anders: Hier folgt aus
ψ(x1 , σ1 ; x2 , σ2 ) = ψ(x2 , σ2 ; x1 , σ1 ),
dass cmn = cnm und zwei identische Bosonen können sehr wohl im gleichen Einteilchenzustand sitzen.
2
3
Benannt nach Enrico Fermi, 1901 Rom – 1954 Chikago.
Wolfgang Pauli, 1901 Wien – 1958 Zürich.
4.1. MEHRTEILCHENSYSTEME
25
Es war zunächst nur empirisch bekannt, dass Teilchen mit halbzahligem Spin
(z.B. Elektron, Proton) Fermionen und Teilchen mit ganzzahligem Spin (z.B.
Photon, 4 He) Bosonen sind. Im Jahr 1940 konnte Wolfgang Pauli zeigen, dass
dieser Zusammenhang zwischen Spin und Statistik“ aus der relativistischen
”
Quantenfeldtheorie (Kombination von Relativitätstheorie und Quantentheorie) folgt.
Beispiel: Identische Teilchen in einem würfelförmigen Gefäß
G = [0, L] × [0, L] × [0, L]
mit dem Volumen V = L3 . Der Einteilchen-Hamiltonoperator hat in der Ortsdarstellung die Form
h̄2 ∂ 2
∂2
∂2
+
+
H1 = −
2m ∂x2 ∂y 2 ∂z 2
Die Energieeigenzustände eines Teilchens mit Spin s sind daher durch die Einteilchenwellenfunktionen
3/2
πx x
2
πy y
πz z
φ,τ = δτ σ
sin
sin
sin
L
L
L
L
gegeben, mit x,y,z = 1, 2, . . . und τ = −s, −s + 1, . . . , +s. Dabei wurde die
Randbedingung φ = 0 verwendet. Die zum Zustand φ,τ gehörende Energie ist
∂G
ε,τ =
h̄2 π 2 2
h̄2 π 2 2
=
.
2mL2
2mV 2/3
Bringt man N nicht wechselwirkende Teilchen in das Gefäß und fragt sich z.B.
nach der Grundzustandenergie des N-Teilchen-Systems, so kann man im Fall
von Bosonen alle N Teilchen in den Einteilchenzustand mit niedrigster Energie
setzen. Bei Fermionen ist dies wegen des Paulischen Ausschließungsprinzips nicht
möglich.
Aufgaben: Ermitteln Sie die Grundzustandsenergie eines Systems von N identischen Teilchen mit Spin s für
1. s = 0, N = 4 (Lösung: 6h̄2 π 2 /mV 2/3 )
2. s = 1/2, N = 4 (Lösung: 9h̄2 π 2 /mV 2/3 )
Hinweis: Fertigen Sie Skizzen der zu besetzenden Einteilchen-Energieniveaus an.
KAPITEL 4. IDENTISCHE TEILCHEN
26
4.2
Quantenstatistik
Teilchen
nicht
wechselwirkender
Gegeben sei ein Einteilchen-Hamiltonoperator H1 mit Energieeigenvektoren |r
(r = 1, 2, . . .) und dazugehörigen Energieeigenwerten εr . Unter der Voraussetzung nicht wechselwirkender Teilchen kann man die Energieeigenzustände des
Mehrteilchensystems
|n1 , n2 , . . . , nr , . . .
festlegen, wobei nr die Besetungszahl des r-ten Einteilchenzustands ist. Die
Besetungszahlen können folgende Werte annehmen:
0, 1, 2, . . . für Bosonen
nr =
.
0, 1
für Fermionen
Bezeichnet man den Teilchenzahloperator des Mehrteilchensystems mit N und
den Hamiltonoperator mit H, so ist |n1 , n2 , . . . , nr , . . . ein gemeinsamer Eigenvektor beider Operatoren:
N|n1 , n2 , . . . , nr , . . . = (n1 + n2 + . . . + nr + . . .)|n1 , n2 , . . . , nr , . . .,
H|n1 , n2 , . . . , nr , . . . = (n1 ε1 + n2 ε2 + . . . + nr εr + . . .)|n1 , n2 , . . . , nr , . . ..
Wir verwenden das großkanonische Ensemble mit Dichtematrix ρGK und großkanonischer Zustandssumme Y :
ρGK =
1 −β(H−μN )
,
e
Y
Y = Tre−β(H−μN ) .
Daraus erhalten wir für die Wahrscheinlichkeit, dass sich das System im Zustand
|n1 , n2 , . . . , nr , . . . befindet den Wert
pn1 ,n2 ,... =
und für die Zustandssumme
Y
1 −β(n1 ε1 +n2 ε2 +...−μ(n1 +n2 +...))
e
Y
=
e−β(n1 ε1 +n2 ε2 +...−μ(n1 +n2 +...))
n1 ,n2 ,...
=
n1
e−β(ε1 −μ)n1
e−β(ε2 −μ)n2 . . . .
n2
Y1
Man muss also nur die Summe
nr
Y2
e−β(εr −μ)nr
4.2. QUANTENSTATISTIK NICHT WECHSELWIRKENDER TEILCHEN 27
berechnen. Für Bosonen läuft die Summation über nr = 0, 1, 2, . . . (unendliche
Summe), während für Fermionen nur über nr = 0, 1 summiert wird. Dies ergibt:
⎧
1
⎨
für Bosonen
−β(ε
r −μ)
Yr = 1 − e
⎩1 + e−β(εr −μ) für Fermionen
Wir wollen nun die mittlere Besetungszahl n̄r des r-ten Einteilchenzustands
berechnen. In der entsprechenden Summe
pn1 ,n2 ,...nr
n̄r =
n1 ,n2 ,...
kürzen sich alle Terme bis auf jene mit nr weg und man erhält
n̄r = −
1 ∂
1 ∂
ln Yr = −
ln Y.
β ∂εr
β ∂εr
Für Bosonen erhält man die sogenannte Bose-Einstein4 -Verteilung:
n̄r =
1
eβ(εr −μ)
Bemerkung: Durch die Formel
N=
n̄r =
r
r
−1
.
1
eβ(εr −μ)−1
wird ein Zusammenhang zwischen der mittleren Gesamtteilchenzahl N und dem
chemischen Potential μ hergestellt.
Für den Spezialfall μ = 0 erhält man aus der Bose-Einstein-Verteilung die Photonverteilung, welche der Situation entspricht, dass die Gesamtteilchenzahl
nicht eingeschränkt ist:
1
.
n̄r = βεr
e −1
Diese wird auch als Planckverteilung5 bezeichnet.
Für Fermionen erhält man die Fermi-Dirac6 -Verteilung
n̄r =
1
eβ(εr −μ)
+1
.
Man sieht, dass n̄r (wie es sein muss) nur zwischen dem Minimalwert 0 und dem
maximal möglichen Wert 1 liegen kann.
4
Albert Einstein, 1879 Ulm – 1955 Princeton.
Benannt nach Max Planck, 1858 Kiel – 1947 Göttingen.
6
Paul Adrien Maurice Dirac, 1902 Bristol – 1984 Tallahassee.
5
KAPITEL 4. IDENTISCHE TEILCHEN
28
Bemerkung: Wieder besteht zwischen dem chemischen Potential μ und der mittleren Teilchenzahl
1
N=
n̄r =
β(ε
−μ)
e r
+1
r
r
ein eindeutiger Zusammenhang.
Für den Logarithmus der großkanonischen Zustandsumme hat man die Formeln
ln(1 ± e−β(εr −μ) ) (+ f ür FD, − f ür BE).
ln Y = ±
r
Daraus erhält man
∂
ln Y
∂β
1 ∂
ln Y
β ∂μ
−
4.3
= H − μN = E − μN,
= N
Maxwell-Boltzmann-Statistik
Falls für alle r gilt, dass n̄r 1, dann verschwindet der Unterschied zwischen
BE- und FD-Statistik:
n̄r → eβμ e−βεr 1
Aus
N=
n̄r = eβμ
r
folgt
N
eβμ = n̄r
⇒
r
ln Y
r
= ±
→
e−βεr
n̄r = N n̄r
ln(1 ± e−β(εr −μ) )
r
e−β(εr −μ) = N.
r
Die Situation, dass alle mittleren Besetzungszahlen viel kleiner als 1 sind, entspricht dem klassischen Limes. Die entsprechende Verteilung wird als Maxwell7 Boltzmann-Verteilung bezeichnet.
Bemerkung: Bei einem Gas entspricht der klassische Limes bei festgehaltener
Temperatur dem Grenzfall kleiner Dichte (N klein), bzw. bei festgehaltenem N
dem Limes großer Temperatur (β klein).
7
James Clark Maxwell, 1831 Edinburgh – 1879 Cambridge.
4.4. IDEALES GAS IM KLASSISCHEN LIMES
4.4
29
Ideales Gas im klassischen Limes
Die Energieeigenfunktionen eines Teilchens mit Spin 0 und Masse m, das sich in
einem Behälter
G = [0, Lx ] × [0, Ly ] × [0, Lz ]
befindet, sind
1/2 1/2 1/2
2
2
πx x
πy y
πz z
2
sin
sin
sin
,
φx ,y ,z (x, y, z) =
Lx
Ly
Lz
Lx
Ly
Lz
(4.1)
x,y,z = 1, 2, . . . ,
mit dazugehörigen Energieeigenwerten
2y
h̄2 π 2 2x
2z
+
+
εx ,y ,z =
.
2m L2x L2y L2z
Berechnung der großkanonischen Zustandssumme im klassischen Limes:
e−β(εr −μ)
ln Y = eβμ
r
= eβμ
2 2
− βh̄2mπ
e
2
2
x + y
2
L2
L
x
y
2
+ z2
Lz
x ,y ,z
βμ
= e
∞
−
e
βh̄2 π 2 2
x
2mL2
x
x =1
Man muss also die Summe
∞
−
e
βh̄2 π 2 2
y
2mL2
y
y =1
∞
e−
∞
−
e
βh̄2 π 2 2
z
2mL2
z
z =1
βh̄2 π 2 2
2mL2
=1
berechnen. Da die Abmessungen Lx,y,z eines makroskopischen Behälters viel
größer sind als die typische de Broglie8 -Wellenlänge des Teilchens, kann diese
Summe mit hervorragender Genauigkeit durch das Integral
∞
2
βh̄2 π 2 2
2πmL
m
1
L
−
d e 2mL2 =
2 2 =
2 βh̄ π
h̄ 2πβ
0
approximiert werden.
⇒
8
3/2
m
V
ln Y = e
,
h̄3 2πβ
βμ
Louis de Broglie, 1892 Dieppe – 1987 Louveciennes.
V = Lx Ly Lz .
KAPITEL 4. IDENTISCHE TEILCHEN
30
Somit hat man
1 ∂
ln Y = ln Y,
β ∂μ
3/2
∂
m
3 −5/2
βμ V
E − μN = −
ln Y = −μN + e
β
3
∂β
2
h̄ 2π
Somit folgt für die innere Energie eines monoatomaren Gases:
⇒
E=
3
3N
= N kT.
2β
2
Welche Kraft übt ein Teilchen, das sich im Einteilchenzustand |r befindet, auf
die rechte Wand aus?
6y
Ly
Fr
-
-
Lx
x
∂εr
.
∂Lx
Die von allen Teilchen auf die rechte Wand ausgeübte mittlere Kraft ist daher
∂εr F =
n̄r −
.
∂Lx
r
Fr ΔLx = −Δεr
⇒
Fr = −
Im klassischen Limes ist n̄r = eβμ e−βεr und man erhält
∂εr
1 ∂ βμ −βεr
βμ −βεr
F =
e e
e e
.
−
=
∂L
β
∂L
x
x
r
r ln Y
⇒
1 ∂ βμ Lx Ly Lz
F =
e
β ∂Lx
h̄3
m
2πβ
3/2
=
1N
.
β Lx
4.4. IDEALES GAS IM KLASSISCHEN LIMES
Der (mittlere) Druck ist daher
p̄ =
F
NkT
1N
=
.
=
Ly Lz
βV
V
Das ist die Zustandsgleichung eines idealen Gases.
Bemerkung: Man hätte auch
p̄ =
verwenden können.
1 ∂ ln Y
β ∂V
31
32
KAPITEL 4. IDENTISCHE TEILCHEN
Kapitel 5
Photonen
5.1
Energie des elektromagnetischen Feldes
Die Grundgleichungen der (zunächst nichtquantisierten) Elektrodynamik werden
durch die Maxwellschen Gleichungen und den Ausdruck für die Lorentzkraft1
zusammengefasst. Im SI-System haben diese die folgende Form:
SI
∂B
SI
,
= −
rot E
∂t
SI = ρSI /ε0 ,
div E
SI
∂E
SI
SI
c rot B
,
= j /ε0 +
∂t
SI + v × B
SI .
F = q SI E
2
SI = 0,
div B
Im SI-System tritt nicht nur das historische Relikt
ε0 = 8.854 . . . × 10−12 F m−1
auf, sondern zu allem Überdruss haben auch noch das elektrische und magnetische Feld verschiedene Dimensionen, obwohl es sich doch um Größen handelt, die
beim Übergang von einem Inertialsystem auf ein anderes untereinander vermischt
werden. Durch eine Reskalierung der elektromagnetischen Größen (mechanische Größen bleiben unverändert),
= √ε 0 E
SI ,
E
√
ρ = ρSI / ε0
1
SI ,
= c √ε 0 B
B
√
⇒ j = j SI / ε0
Benannt nach Hendrik Antoon Lorentz, 1853 Arnheim – 1928 Haarlem.
33
KAPITEL 5. PHOTONEN
34
gelangt man zu den elektromagnetischen Grundgleichungen im Heaviside2 System:
= ρ,
= − 1 ∂B ,
divE
rot E
c ∂t
= j/c + 1 ∂ E ,
= 0,
rot B
div B
c ∂t
.
+ v × B
F = q E
c
In dieser Form ist auf einen Blick zu sehen, dass lediglich die Lichtgeschwindigkeit
c die einzige in der klassischen (nichtquantisierten) elektromagnetischen Theorie
auftretende Naturkonstante ist.
Wir betrachten nun ein dreidimensionales Gebiet V , in dem sich ein elektro x), B(t,
x) und Punktteilchen mit Massen m(a) und
magnetischisches Feld E(t,
(a)
Ladungen q befinden. Die Teilchen bewegen sich auf den Trajektorien r (a) (t).
Ich behaupte nun, dass das elektromagnetische Feld den Beitrag
1
Feld
2 + B
2)
d 3 x (E
EV =
2
V
zu der in V enthaltenen Gesamtenergie liefert. Um dies zu sehen, betrachten wir
die zeitliche Änderung des obigen Ausdrucks:
d Feld
E
=
dt V
∂E
∂B
+B·
d x E·
∂t
∂t
3
V
· (c rot B
− j) + B
· (−c rot E)]
d3 x [E
=
V
= −
+c
d x j · E
· rot B
−B
· rot E).
d 3 x (E
3
V
V
Unter Verwendung der Abkürzungen
v (a) =
dr (a) (t)
,
dt
(a) = E
t, r (a) (t)
E
können wir das erste Integral in der letzten Zeile folgendermaßen schreiben:
=
(a) .
d3 x j · E
q (a)v (a) · E
V
2
a∈V
Oliver Heaviside, 1850 London – 1925 Torquay.
5.1. ENERGIE DES ELEKTROMAGNETISCHEN FELDES
35
Das ist aber nichts anderes als die Leistung, die an den in V befindlichen geladenenen Teilchen vom elektrischen Feld verrichtet wird (das Magnetfeld leistet
keine Arbeit), da
(a)
dE (a)
(a) + v × B
(a) ,
(a) ) = q (a)v (a) · E
= q (a)v (a) · (E
dt
c
wobei
m(a) c2
E (a) = 1 − v (a) · v (a) /c2
die Energie des a-ten Teilchens ist. Wir sehen also, dass
d
Feld
(a)
· rot B
−B
· rot E).
E
= c d 3 x (E
EV +
dt
a∈V
V
Das hier verbliebene Integral wollen wir noch weiter umformen. Der Integrand
lässt sich nämlich als Divergenz eines Vektorfeldes schreiben! Unter Verwendung
von Indexschreibweise und Summenkonvention erhält man tatsächlich
Ei εijk ∇j Bk − Bk εkji∇j Ei = εijk ∇j (Ei Bk ) = −∇j (εjik Ei Bk )
× B).
= −div(E
Wir können nun den Satz von Gauß3 anwenden und das auf der rechten Seite
stehende Volumsintegral in ein Oberflächenintegral umwandeln:
d
Feld
(a)
× B.
+
E
= − df c E
E
dt V
a∈V
∂V
Wie man sieht, kann
= cE
×B
S
als Energiestromdichte des elektromagnetischen Feldes interpretiert werden.
Diese Größe wird auch als Poyntingvektor4 bezeichnet.
Aufgabe: Den obigen Ausdruck für die Energiebilanz kann man auch auf folgende Weise erhalten: Man zeigt mit Hilfe der Maxwellschen Gleichungen, dass die
Energiedichte
1 2 2
u = (E
+B )
2
die Kontinuitätsgleichung
und der Poyntingvektor S
∂u
= −j · E
+ div S
∂t
erfüllen.
Bemerkung: Durch analoge Überlegungen kann man zeigen, dass die Impuls 2 gegeben ist.
dichte des elektromagnetischen Feldes durch S/c
3
4
Carl Friedrich Gauß, 1777 Braunschweig – 1855 Göttinge.n
Benannt nach John Henry Poynting, 1852 Monton – 1914 Birmingham.
KAPITEL 5. PHOTONEN
36
5.2
Freies elektromagnetisches Feld
Im ladungs- und stromfreien Raum (ρ = 0, j = 0) lauten die Maxwellschen
Gleichungen:
= − 1 ∂B ,
rot E
c ∂t
1 ∂E
=
rot B
,
c ∂t
= 0,
divE
= 0.
div B
Wir wollen nun die allgemeine Lösung dieses Systems von partiellen Differentialgleichungen suchen. Unter Verwendung der Formel
rot rot = −Δ + grad div
finden wir, dass sowohl das elektrische als auch das magnetische Feld die (freie)
Wellengleichung erfüllen:
1 ∂2E
= 0,
− ΔE
c2 ∂t2
1 ∂2B
= 0.
− ΔB
c2 ∂t2
Insbesondere erfüllt jede einzelne Komponente dieser Felder die Wellengleichung
1 ∂2f
− Δf = 0.
c2 ∂t2
Um nun die allgemeine Lösung dieser Gleichung zu finden, erlegen wir der Funktion f (t, x) periodische Randbedingungen in einem Würfel mit Kantenlänge
L auf:
f (t, x + L, y, z) = f (t, x, y + L, z) = f (t, x, y, z + L) = f (t, x, y, z).
Das wäre an sich nicht nötig, vereinfacht jedoch die weitere Diskussion.
Die Funktionen
exp(ikx x) exp(iky y) exp(ikz z)
exp(ik · x)
√
√
√
√
=
,
V
L
L
L
k = 2π ,
L
∈ 3 ,
V = L3
bilden ein vollständiges Orthonormalsystem für den oben besprochenen
Raum periodischer Funktionen mit dem Skalarprodukt
L
L
dx
0
L
dy
0
∗
dz g(x, y, z) h(x, y, z) =
0
V
d3 x g(x)∗ h(x).
5.2. FREIES ELEKTROMAGNETISCHES FELD
37
Wie man leicht nachrechnet, ist tatsächlich die Orthonormierungsrelation
exp(−ik · x) exp(ik · x)
√
√
d3 x
= δkk
V
V
V
erfüllt. Das Funktionenystem ist vollständig, das heißt man kann jede periodische
Funktion f (x) als Fourierreihe5 schreiben:
f (x) =
exp(ik · x)
√
ck .
V
k
Unter Verwendung der Orthonormierungsrelation kann man die Fourierkoeffizienten durch die Formel
exp(−ik · x)
√
ck = d3 x
f (x)
V
V
aus der Funktion f (x) gewinnen.
Um nun die allgemeine Lösung der Wellengleichung zu finden, schreiben wir die
Funktion f (t, x) als Fourierreihe:
f (t, x) =
exp(ik · x)
√
ck (t).
V
k
Da die Funktion f (t, x) jetzt zusätzlich zeitabhängig ist, hängen natürlich auch ihre Fourierkoeffizienten von t ab. Einsetzen in die Wellengleichung und Beachtung
der linearen Unabhängigkeit der Basisfunktionen ergibt, dass die Fourierkoeffizienten ck (t) Lösungen der folgenden gewöhnlichen Differentialgleichung zweiter
Ordnung sein müssen:
d2 ck (t)
= c2k 2 ck (t).
dt2
Das ist natürlich nichts anderes als die Schwingungsgleichung eines harmonischen
Oszillators mit Kreisfrequenz
ωk = c k .
Die allgemeine Lösung für ck (t) ist daher eine Linearkombination der Funktionen
exp(±iωk t):
ck (t) = ak exp(−iωk t) + bk exp(iωk t)
und
1 exp(ik · x) ak exp(−iωk t) + bk exp(iωk t)
f (t, x) = √
V k
5
Benannt nach Joseph Fourier, 1768 Auxerre – 1830 Paris.
KAPITEL 5. PHOTONEN
38
ist die gesuchte allgemeine Lösung der Wellengleichung, es handelt sich um eine
Überlagerung von ebenen Wellen. Ist man nur an reellen Lösungen interessiert,
so muss die Beziehung
bk = a∗−k
gelten und man kann die Lösung in der Form
1 i(k·x−ω t)
−i(k·
x−ωk t) ∗
k a + e
e
ak
f (t, x) = √
k
V k
schreiben.
Wir betrachten nun eine spezielle Lösung für das elektrische Feld in Form einer
ebenen Welle mit Wellenzahlvektor k:
N i(k·x−ω t)
−i(k·
x−ωk t) ∗
x) = √
k a + e
e
a ε.
E(t,
V
N ist ein an dieser Stelle an sich überflüssiger reeller Normierungsfaktor und ε
ein Einheitsvektor, der die Polarisationsrichtung des elektrischen Feldes angibt.
x) in die bisher noch nicht verwendete Maxwellgleichung divE
=0
Setzen wir E(t,
ein, so stellen wir fest, dass der Polarisationsvektor ε auf den Wellenzahlvektor
normal stehen muss:
k · ε = 0.
Es gibt also zu einem vorgegebenen Wellenzahlvektor k zwei linear unabhängige
Polarisationsmöglichkeiten des elektrischen Feldes (normal auf k). Mit Hilfe der
Maxwellschen Gleichung
= − 1 ∂B
rot E
c ∂t
finden wir die Lösung
x) = k × E(t,
x)
B(t,
k für das Magnetfeld Die beiden restlichen Maxwellschen Gleichungen,
=
rot B
1 ∂E
,
c ∂t
= 0,
div B
sind damit automatisch erfüllt. Im Fall einer ebenen elektromagnetischen Welle
stehen also das elektrische Feld und das Magnetfeld normal aufeinander, im Hea und B
schwingen beide transversal
visidesystem haben sie den gleichen Betrag. E
B,
k bilden ein Rechtssystem). Im vorliegenden Fall
zum Wellenzahlvektor k (E,
erhält man für die Energiedichte daher
1 2 2
2
u = (E
+B )=E
2
5.2. FREIES ELEKTROMAGNETISCHES FELD
39
und für den Poyntingvektor
= cE
×B
= cu k ,
S
k das heißt die Feldenergie strömt tatsächlich in die Ausbreitungsrichtung der ebenen Welle. Für die gesamte, im Volumen V enthaltenene Feldenergie erhalten
wir
E = d3 x u = N 2 (aa∗ + a∗ a)
V
und für den Gesamtimpuls des Feldes
2 = N k (aa∗ + a∗ a) = E k .
P = d3 x S/c
c k c k V
Die allgemeine Lösung der freien Maxwellschen Gleichungen erhält man nun
wie vorhin durch Superposition aller möglichen ebenen Wellen:
N x) =
√ k ei(k·x−ωk t) ak,λ + e−i(k·x−ωk t) a∗k,λ εk,λ ,
E(t,
V
k,λ
k
N x) =
√ k ei(k·x−ωk t) ak,λ + e−i(k·x−ωk t) a∗k,λ × εk,λ .
B(t,
V
k k,λ
Dabei bezeichnet der Index λ = 1, 2 die beiden möglichen
Polarisationsrichtun gen. Die Vektoren εk,1 und εk,2 bilden zusammen mit k/ k eine Orthonormalbasis
im dreidimensionalen Raum. Die Gesamtenergie des im Volumen V befindlichen
elektromagnetischen Feldes ist
E=
Nk2 (ak,λ a∗k,λ + a∗k,λ ak,λ )
k,λ
und der Impuls des Feldes ist durch
P =
N2
k
(ak,λ a∗k,λ + a∗k,λak,λ ) c
k k
k,λ
gegeben.
Das freie elektromagnetische Feld kann man daher als System von unendlich
vielen ungekoppelten harmonischen Oszillatoren interpretieren.
Zu jedem (k, λ)
gibt es einen derartigen Oszillator mit Kreisfrequenz ωk = c k .
KAPITEL 5. PHOTONEN
40
5.3
Feldquantisierung
Die Quantisierung des freien elektromagnetischen Feldes ist nun kein Problem
mehr, wir wissen ja bereits wie man einen harmonischen Oszillator quantisiert!
Wir befördern die Fourierkoeffizienten a∗k,λ , ak,λ zu Erzeugungs- und Vernich-
tungsperatoren (Leiteroperatoren) a†k,λ , ak,λ . Wenn wir die noch unbestimmten
Normierungsfaktoren Nk,λ so wählen, dass
Nk2 = h̄ωk /2
ist, dann müssen die Erzeugungs- und Vernichtungsoperatoren die Vertauschungsrelationen
ak,λ , a†k ,λ = δkk δλλ ,
ak,λ , ak,λ = 0
erfüllen. Aus dem Ausdruck für die Gesamtenergie des Systems wird nun der
Hamiltonoperator
h̄ω
h̄ω k
k
(ak,λ a†k,λ + a†k,λ ak,λ ) =
+
h̄ωk a†k,λ ak,λ .
2
2
k,λ
k,λ
k,λ
Die hier auftretende unendlich große Energie des Grundzustands (Vakuumenergie) kann man durch eine Verschiebung des Energienullpunktes loswerden. Man
definiert einfach
H=
h̄ωk a†k,λ ak,λ
k,λ
als Hamiltonoperator. Ganz analog kann man den Impulsoperator des elektromagnetischen Feldes in der Form
P =
h̄k a†k,λ ak,λ
k,λ
schreiben.
Aufgabe: Man kann leicht überprüfen, dass man auf diese Weise das freie elektromagnetische Feld richtig“ quantisiert hat. In dem hier verwendeten Heisen”
bergbild erfolgt die Zeitentwichklung einer Observablen A(t) gemäß der Heisenbergschen Bewegungsgleichung
dA(t)
i
= [H, A(t)] .
dt
h̄
Berechnen Sie die Kommutatoren
x) ,
x)
H, E(t,
H, B(t,
und verifizieren Sie, dass die entsprechenden Heisenbergschen Bewegungsgleichungen tatsächlich das von den Maxwellschengleichungen geforderte zeitliche
Verhalten der Operatoren für das elektrische und magnetische Feld ergeben.
5.4. TEILCHENINTERPRETATION
5.4
41
Teilcheninterpretation
Der Grundzustand |0 des Hamiltonoperators des elektromagnetischen Feldes,
h̄ωk a†k,λ ak,λ ,
H=
k,λ
ist durch
ak,λ |0 = 0 ∀ k, λ
bestimmt. Somit ist
H|0 = 0,
P |0 = 0,
das heißt die Energie und der Impuls des Grundzustandes sind Null. Wendet man
den Erzeugungsoperator a†k,λ auf |0 an, so erhält man wieder einen Eigenzustand
von H und P ,
Ha†k,λ |0 = h̄ωk a†k,λ |0,
mit Energieeigenwert
P a†k,λ |0 = h̄ka†k,λ |0,
E = h̄ωk = h̄c k und Impulseigenwert
p = h̄k,
das heißt E und p erfüllen die Energie-Impulsbeziehung eines masselosen Teilchens:
E = c |p | .
Die Anregungen des quantisierten elektromagnetischen Feldes können also als
masselose Teilchen interpretiert werden, man nennt sie Photonen (oder Lichtquanten). Der Grundzustandsvektor |0 entspricht der Situation, dass keine Photonen vorhanden sind, man bezeichnet diesen Zustand auch als Vakuumzustand.
Der Zustandsvektor
a†k,λ |0
beschreibt einen Zustand mit einem einzigen Photon, das den Impuls p = h̄k und
die Polarisation λ besitzt. Der Vektor
a†k
1 ,λ1
a†k
2 ,λ2
|0,
(k1 , λ1 ) = (k2 , λ2 )
beschreibt einen Energie-Impuls-Eigenzustand mit zwei Photonen:
Ha†k
1 ,λ1
a†k
2 ,λ2
|0 = (h̄ωk1 + h̄ωk2 )a†k
P a†k
1 ,λ1
a†k
2 ,λ2
|0 = (h̄k1 + h̄k2 )a†k
1 ,λ1
1 ,λ1
a†k
a†k
2 ,λ2
2 ,λ2
|0,
|0.
KAPITEL 5. PHOTONEN
42
Allgemein beschreibt
|nk1 ,λ1 , nk2 ,λ2 , . . . =
(a†k
1 ,λ1
)
nk
1 ,λ1
nk1 ,λ1 !
(a†k
2 ,λ2
)
nk
2 ,λ2
nk2 ,λ2 !
. . . |0
einen Energie-Impuls-Eigenzustand von nk1 ,λ1 Photonen mit gleichen Impulsen
h̄k1 und Polarisationen λ1 , nk2 ,λ2 Photonen mit Impulsen h̄k2 und Polarisationen λ2 , und so weiter. Da Photonen Bosonen sind, können beliebig viele von
ihnen im gleichen Einteilchenzustand sitzen. Ein beliebiger Zustandsvektor des
Photonfeldes lässt sich nun als Linearkombination der so konstruierten Basis der
Energie-Impuls-Eigenvektoren erhalten.
Kapitel 6
Plancksches Strahlungsgesetz
6.1
Hohlraumstrahlung
Wir haben im vorigen Kapitel das freie elektromagnetische Feldes in einem Würfel
mit Kantenlänge L und periodischen Randbedingungen betrachtet. Die vorliegende Situation lässt sich auch so interpretieren, dass man die einander gegenüber
liegenden Würfelflächen identifiziert. Hätten wir den Fall von nur einer Raumdimension, so ergäbe sich (topologisch gesehen) ein Kreisring, bei zwei Raumdimensionen ein Torus. Klassifiziert man die Eigenschwingungen nach ebenen Wellen
der Form
exp(ikx x) exp(iky y) exp(ikz z)
so kann der Wellenzahlvektor k die möglichen Werte
kx = 2πx /L, ky = 2πy /L, kz = 2πz /L,
x,y,z ∈ annehmen. Bei vorgegebenem k können zwei Ploarisationsrichtungen (λ = 1, 2)
auftreten. Die dazugehörige Kreisfrequenz ist durch
2πc 2
2
2
2
ωk = c k = c kx + ky + kz =
x + 2y + 2z
L
gegeben. Wir wollen nun die Anzahl der Schwingungsmoden mit Kreisfrequenz im
Intervall [ω, ω + dω] bestimmen. Dazu zählen wir die Anzahl der Gitterpunkte“
”
∈ 3 , die sich im Gebiet
Lω
2πc
2
≤
2x
+
2y
+
2z
43
≤
L(ω + dω)
2πc
2
KAPITEL 6. PLANCKSCHES STRAHLUNGSGESETZ
44
befinden, ab. Das Ergebnis müssen wir dann noch mit zwei multiplizieren, um
die zwei möglichen Polarisationsrichtungen zu berücksichtigen:
2
Lω
Ldω
V ω 2dω
×
4π
×
=
.
2
2 c3
2πc
2πc
π
Pol.
Kugeloberfläche
Schichtdicke
Bemerkung: Man kann diese Formel auch so herleiten: Wir berechnen die Anzahl der Schwingungsmoden N (ω) mit Kreisfrequenz ≤ ω. N (ω) ist einfach das
doppelte Volumen einer Kugel mit Radius Lω/2πc:
3
V ω3
4π Lω
= 2 3.
N (ω) = 2 ×
3 2πc
3π c
Durch Berechnen von
N (ω + dω) − N = N (ω)dω =
V ω 2dω
π 2 c3
erhalten wir das gleiche Ergebnis wie vorhin.
Aufgabe: Betrachten Sie statt periodischer Randbedingungen den Fall stehender elektromagnetische Wellen
∼ sin(kx x) sin(ky y) sin(kz z)
in einem Würfel mit der Kantenlänge L. Man sich die Situation vorstellen , dass
das elektromagnetische Feld in einem Hohlraum mit ideal reflektierenden
Wänden eingeschlossen ist. Zeigen Sie, dass sich die Eigenschwingungen des Feldes
durch
kx = mx π/L, ky = my π/L, kz = mz π/L,
mx,y,z ∈ ,
sowie durch die Angabe der Polarisationsrichtung λ (λ = 1, 2) klassifizieren lassen. Die dazugehörige Kreisfrequenz ist wieder durch
ωk = c k = c kx2 + ky2 + kz2
gegeben. Ermitteln Sie die Anzahl der ,,Punkte“ (k, λ), deren Kreisfrequenz im
Intervall [ω, ω + dω] liegt. Sie werden feststellen, dass Sie das gleiche Ergebnis
wie im Fall periodischer Randbedingungen erhalten. (Die Anzahl der möglichen
Schwingungsmoden in einem Volumen V ist von der Wahl der Randbedingungen
unabhängig.)
Nach der Quantentheorie des elektromagnetischen Feldes (Quantenelektrodynamik) entspricht jedem erlaubten (k, λ) ein Ein-Photon-Zustand mit der Energie
Ek = h̄ωk . Da die Energie des Teilchens in diesem Zustand einen scharfen Wert
6.1. HOHLRAUMSTRAHLUNG
45
hat, spricht man auch von einem Energieeigenzustand. Im Fall der periodischen
Randbedingungen hat auch der Impuls des entsprechenden Photons einen scharfen Wert, nämlich gerade p = h̄k. Diese Zustände sind also auch Impulseigenzustände. Dagegen entsprechen den stehenden Wellen im Fall des Hohlraums mit
reflektierenden Wänden zwar Energieeigenzustände, jedoch keine Impulseigenzustände, sondern Überlagerungen von Zuständen mit entgegengestztem Impuls.
Formuliert in der Sprache der Quantentheorie, haben wir also die Anzahl der
Energieeigenzustände eines Photons, das sich in einem Gebiet mit dem Volumen
V = L3 befindet, im Energieintervall [E, E + dE] bestimmt. Das Ergebnis war
von der Wahl der Randbedingungen unabhängig.
Befindet sich das Photonsystem im thermischen Gleichgewicht bei einer Temperatur T , so ist die mittlere Besetzungszahl des Einteilchenzustands
a†k,λ |0
durch
nk,λ =
1
e
−1
gegeben (Bose-Einstein-Statistik mit μ = 0). Für die mittlere Energiedichte
(Energie/Volumen) der Hohlraumstrahlung. die von den Photonen im Kreisfrequenzintervall [ω, ω + dω] herrührt den Ausdruck
βh̄ωk
h̄ω ω 2 dω
h̄ ω 3 dω
.
=
eβh̄ω − 1 π 2 c3
π 2 c3 eβh̄ω − 1
Verwendet man die dimensionslose Größe
h̄ω
η = βh̄ω =
,
kT
so ergibt sich der Ausdruck
4 3
kT
η dη
h̄
.
u(ω, T )dω = 2 3
π c
h̄
eη − 1
u(ω, T )dω =
Durch Integration über alle Frequenzen gelangt man zur totalen Energiedichte:
∞
u(T ) =
dω u(ω, T )
0
h̄
=
2
π c3
kT
h̄
4 ∞
0
=
π2 k4 4
T .
15 (h̄c)3
η3
eη − 1
dη
π 4 /15
KAPITEL 6. PLANCKSCHES STRAHLUNGSGESETZ
46
Diese Formel wird als Stefan1 -Boltzmann-Gesetz bezeichnet.
Für kleine Frequenzen
η=
h̄ω
1
kT
kann man die Näherung
eη 1 + η
verwenden und erhält aus dem allgemeinen Ausdruck für u(ω, T )dω die Rayleigh2 -Jeans3 -Formel
u(ω, T )dω kT ×
ω 2 dω
π 2 c3
(f ür h̄ω kT )
Diese von h̄ unabhänge Näherungsformel lässt mit Hilfe der klassischen Elektrodynamik so verstehen: Jeder Schwingungsfreiheitsgrad gibt einen Beitrag kT zur
mittleren Energie des Systems, multipliziert mit der Anzahl der Schwingungsmoden im Intervall [ω, ω+dω] ergibt sich der obige Ausdruck. Sie zeigt die Grenze der
Anwenbarkeit der klassischen Elektrodynamik. Würde man die Rayleigh-JeansFormel für beliebig große Frequenzen ernst nehmen, so ergäbe sich ein divergenter
Ausdruck für die totale Energiedichte:
kT
π 2 c3
∞
dω ω 2 = ∞.
0
Dies wird auch als Ultraviolett-Katastrophe der klassischen Elektrodynamik bezeichnet. Wir haben oben gesehen, wie die Quantentheorie dieses Problem löst.
Der sogenannte Wiensche4 Grenzfall ergibt sich für große Frequenzen (η 1):
u(ω, T )dω h̄ 3 −h̄ω/kT
ω e
dω
π 2 c3
(f ür h̄ω kT )
Oft wird statt u(ωT )dω die Energieverteilung f(λ, T ) bezüglich der Wellenlänge
λ = 2πc/ω verwendet:
2πc
2πc
⇒ dω = − 2 dλ
λ
λ
8πch
dλ
.
f (λ, T )dλ =
5
hc/λkT
λ e
−1
ω=
⇒
1
Josef Stefan, 1835 St. Peter (Klagenfurt) – 1893 Wien.
John Rayleigh, 1842 Langford Grove – 1919 Terlin Place.
3
James Jeans, 1877 London – 1948 Dorking.
4
Benannt nach Wilhelm Wien, 1864 Fischhausen – 1928 München.
2
6.2. STRAHLUNGSDRUCK
47
Wir wollen nun jene Wellenlänge λmax finden, für welche die Funktion f (λ, T )
(bei festgehaltener Temperatur T ) ihr Maximum annimmt:
∂f (λ, T ) =0
∂λ λ=λmax
1
hc
.
−hc/λ
max kT
λmax kT 1 − e
⇒
5=
η̃ =
hc
λmax kT
Mit Hilfe der Abkürzung
können wir diese Gleichung in der Form
5[1 − exp(−η̃)] = η̃
schreiben. Der (nichtriviale) Fixpunkt der Funktion
η → 5[1 − exp(−η)]
lässt sich durch Iteration ermitteln. Mit dem Startwert η0 = 4.9 erhält man bereits
nach der vierten Iteration eine Genauigkeit von 6 Stellen nach dem Dezimalpunkt:
η̃ = 4.965114.
Damit erhält man das Wiensche Verschiebungsgesetz
λmax T = 2.89777 × 10−3 m K
Als einfache Anwendung des Wienschen Verschiebungsgesetzes wollen wir die
Oberflächentemperatur der Sonne bestimmen. Die Intensitätsverteilung der elektromagnetischen Strahlung in der Photosphäre der Sonne entspricht in guter
Näherung der besprochenen Spektralverteilung mit λmax ≈ 500 nm. Somit erhält
man für die Oberflächentemperatur der Sonne den Wert
T =
6.2
2.9 × 10−3 m K
= 5800 K
500 × 10−9 m
Strahlungsdruck
Den von einem Photonengas auf eine Wand ausgeübten mittleren Druck erhält
man mit Hilfe der Formel
∂Ek
p=
nk,λ −
.
∂V
k,λ
KAPITEL 6. PLANCKSCHES STRAHLUNGSGESETZ
48
Da die Abhängigkeit der Energie des Photons vom Volumen V durch
Ek =
h̄cπ
h̄cπ
|m|
= 1/3 |m|
L
V
gegeben ist, erhalten wir
−
∂Ek
1 Ek
=
∂V
3V
und daher
p=
6.3
E
1
= u(T ).
3V
3
Schwarzer Strahler
Ein kleines Loch in der Wand eines mit elektromagnetischer Strahlung (Photonen) erfüllten Hohlraumes (Temperatur T ) ergibt einen sogenannten schwarzen
Strahler. Der Grund für diese Bezeichnung ist der, dass von außen durch das
Loch eindringende Strahlung vollständig absorbiert wird. Das Loch eines schwarzen Strahlers der Temperatur T = 0 erscheint vollständig schwarz.
Wir wollen die von einer Öffnung mit der Fläche dA in das Kreisfrequenzintervall
[ω, ω+dω] abgegebene Strahlungleistung P(ω, T ) dω dA. Die Anzahl der Zustände
pro Volumen in
[kx , kx + dkx ] × [ky , ky + dky ] × [kz , kz + dkz ]
ist
2×
d3 k
dlx dly dlz
=2×
.
V
(2π)3
Die mittlere Photonendichte im obigen k-Bereich ist daher
2
k 2 dk dΩ
d3 k
1
1
=
2
,
3
βh̄ω
3
βh̄ω
(2π) e
−1
(2π) e
−1
ω = ck ,
wobei auf der rechten Seite Kugelkoordinaten verwendet wurden.
Somit erhalten wir
2
P(ω, T ) dω dA dt =
k 2 dk
3
(2π)
2π
π/2
dϕ dθ sin θ cos θ c dt dA
0 0
2π
=
h̄ω
−1
eβh̄ω
1/2
c
ω 3 dω
h̄
dA dt = u(ω, T ) dω dA dt.
2
2
βh̄ω
4π c e
−1
4
6.3. SCHWARZER STRAHLER
49
θ
dA
Das heißt also,
P(ω, T ) =
6
c dt cos θ
?
c
u(ω, T ).
4
Die Gesamtleistung der von einem schwarzen Strahler pro Fläche abgegebenen
Strahlung erhalten wir durch Integration über alle Frequenzen:
∞
c
dω P(ω, T ) =
4
0
∞
c
c π 2 (kT )4
dω u(ω, T ) = u(T ) =
4
4 15 (h̄c)3
0
P(T ) ist also proportional zur vierten Potenz der absoluten Temperatur,
P(T ) =
π2k4 4
3 2 T ,
60h̄
c σ
der Proportionalitätsfaktor
π2 k4
−8
σ=
W m−2 K−4
3 2 = 5.67 × 10
60h̄ c
wird als Stefan-Boltzmann-Konstante bezeichnet.
Bemerkung: Die Strahlungsleistung eines beliebigen Körpers mit Temperatur
T ist durch a(ω) P(ω, T ) gegeben, wobei a(ω) der Absorptionskoeffizient des
betreffenden Körpers für elektromagnetische Strahlung mir Kreisfrequenz ω ist.
Der schwarze Körper mit a(ω) = 1 entspricht maximalem Absorptionsvermögen
für einfallende Strahlung und damit maximalem Emissionsvermögen bei vorgegebener Temperatur.
Beispiel: Die Strahlungsleistung der Sonne beträgt
2
= 5.67 × 10−8 (5800)4 4π (6.961 × 108 )2 W = 3.9 × 1026 W.
σ T4 4π R
KAPITEL 6. PLANCKSCHES STRAHLUNGSGESETZ
50
Für die Solarkonstante erhält man bei einem mittleren Radius der Erdbahn
r 1.5 × 1011 m den Wert
2
2
σ T4 4π R
R
4
= σ T
1.38 W m−2
2
4π r
r
Das heißt, der Energiefluss der Sonne auf die Erde beträgt (vor dem Durchgang
durch die Atmosphäre) etwa 1.38 kW m−2 .
Aufgabe: Geben Sie eine größenordnungsmäßige Abschätzung der entsprechenden Anzahl von Photonen pro Zeit und Fläche.
6.4
Oberflächentemperatur von Planeten
Der Zusammenhang zwischen der Oberflächentemperatur der Sonne (T 5800 K) und der Oberflächentemperatur eines Planeten (TP ) kann näherungsweise durch folgende Überlegung erhalten werden: Man fasst sowohl die Sonne
als auch den Planeten als schwarze Strahler auf und nimmt weiters an, dass die
gesamte von der Sonne auf den Planeten eingestrahlte Leistung auch wieder abgestrahlt wird. Weiters ist zu beachten, dass der Planet nur auf der der Sonne
zugewandten Seite Strahlung aufnehmen kann, diese jedoch (falls Tag Jahr)
in alle Richtungen abgibt.
Bezeichnungen:
T
TP
R
LP
RP
σ
...
...
...
...
...
...
Temperatur der Sonne
Temperatur des Planeten
Radius der Sonne
(mittlerer) Abstand Planet − Sonne
Radius des Planeten
Stefan−Boltzmann−Konstante
von der Sonne abgestr. Leistung
2
σT4 4π R
×
RP2 π
4πL2P
=
σ T 4 4π R2
P P
vom Planeten abgestrahlte Leistung
vom Planeten aufgenommene Leistung
⇒ das Endergebnis hängt nicht von σ und auch nicht vom Radius des Planeten
ab:
R
TP =
T ,
T 5800 K, R = 6.961 × 108 m.
2LP
6.4. OBERFLÄCHENTEMPERATUR VON PLANETEN
51
Erde: L = 1.496 × 1011 m ⇒ T 280 K = 7◦ C
Venus: L = 1.082 × 1011 m ⇒ T 392 K = 56◦ C
Mars: L = 2.279 × 1011 m ⇒ T 227 K = −46◦ C
Merkur: L 0.5 × 1011 m. In diesem Fall ist die obige Formel nicht gut, da ein
Merkurtag 59 Erdtage beträgt, das Merkurjahr jedoch 88 Erdtage. Man verwendet daher
R
T 635 K.
TMerkur =
LMerkur
(Die tatsächliche Maximaltemperatur auf dem Merkur beträgt etwa 700 K).
52
KAPITEL 6. PLANCKSCHES STRAHLUNGSGESETZ
Anhang A
Unitäre Vektorräume
Die Verwendung des Grundkörpers der komplexen Zahlen besitzt eine Reihe von
rechentechnischen Vorteilen. Will man etwa die Eigenwerte einer n × n-Matrix
bestimmen, so besitzt das dazugehörige charakteristische Polynom über stets
n (eventuell teilweise zusammenfallende) Nullstellen, was über ja bekanntlich
nicht der Fall zu sein braucht. Darüberhinaus ist die Theorie der unitären Vektorräume in der Physik von allergrößter Bedeutung, handelt es sich dabei doch
um jene mathematischen Methoden, die in der Quantentheorie ihre natürliche
Anwendung finden. Wir beschränken uns hier ausschließlich auf den endlichdimensionalen Fall. Es sei jedoch darauf hingewiesen, dass die hier dargestellte
Theorie ihre volle Bedeutung erst im unendlichdimensionalen Fall erlangt, wo sie
im Rahmen der Funktionalanalysis in die Theorie der (unendlichdimensionalen)
Hilberträume übergeht.
A.1
Komplexes Skalarprodukt
Definition: Ein (endlichdimensionaler) Vektorraum H über heißt unitär
(oder endlichdimensionaler Hilbertraum), wenn ∀ ϕ, ψ ∈ H ein Skalarprodukt
(inneres Produkt) ϕ | ψ ∈ H definiert ist mit den folgenden Eigenschaften:
1. ϕ | c1 ψ1 + c2 ψ2 = c1 ϕ | ψ1 + c2 ϕ | ψ2 ,
∀ ϕ, ψ1,2 ∈ H,
∀ c1,2 ∈ 2. ϕ | ψ = ψ | ϕ∗
3. ψ | ψ ≥ 0,
ψ | ψ = 0 ⇔ ψ = 0
Bemerkungen: ϕ | ψ ist sesquilinear, d.h. linear in der zweiten Variablen
53
ANHANG A. UNITÄRE VEKTORRÄUME
54
und antilinear in der ersten Variablen, da
c1 ϕ1 + c2 ϕ2 | ψ = ψ | c1 ϕ1 + c2 ϕ2 ∗
= c∗1 ψ | ϕ1 ∗ + c∗2 ψ | ϕ2 ∗
= c∗1 ϕ1 | ψ + c∗2 ϕ2 | ψ.
Wir verwenden hier die in der physikalischen Literatur üblichen Konventionen. In
der mathematischen Literatur ist das innere Produkt oft in der ersten Variablen
linear und in der zweiten antilinear. Weiters findet man dort häufig die Schreibweise z̄ statt z ∗ für die zur komplexen Zahl z = a + ib (a, b ∈ ) konjugiert
komplexe Zahl z ∗ = a − ib.
Beispiele für unitäre Vektorräume:
1. U n = n mit dem Skalarprodukt
x | y =
n
x∗k yk .
k=1
2. Der Vektorraum, der auf [a, b] ⊂ definierten komplexen Polynome vom
Grad ≤ n,
n
p(x) =
ck xk , ck ∈ , x ∈ [a, b]
k=0
mit dem inneren Produkt
b
p | q =
dx p(x)∗ q(x).
a
3. Der Vektorraum der komplexwertigen Funktionen der Form
ψ(x) =
N
cn e2πinx ,
cn ∈ ,
n=−N
auf dem Intervall [0, 1] mit dem Skalarprodukt
1
ϕ | ψ =
0
dx ϕ(x)∗ ψ(x).
A.2. NORM
55
4. Der Vektorraum der komplexwertigen Funktionen der Form
ϕ(x) = e−x
2 /2
p(x)
auf , wobei p(x) ein Polynom vom Grad ≤ n ist, mit dem Skalarprodukt
∞
ϕ | ψ =
−∞
∞
=
dx ϕ(x)∗ ψ(x)
2
dx e−x p(x)∗ q(x),
−∞
wobei ψ(x) = e−x
A.2
2 /2
q(x).
Norm
In einem unitären Vektorraum H definiert man die Norm ψ eines Elementes
ψ ∈ H durch
ψ = ψ|ψ.
Für das Skalarprodukt gilt die Ungleichung von Cauchy-Schwarz:
|ϕ | ψ| ≤ ϕψ.
Beweis: Für ϕ = 0 oder ψ = 0 ist die Ungleichung trivialerweise erfüllt. Man
kann sich daher auf den Fall ϕ = 0 ∧ ψ = 0 beschränken. Es sei ε ∈ (|ε| = 1)
so gewählt, dass
εϕ | ψ = |ϕ | ψ|
ε∗ ϕ | ψ∗ = |ϕ | ψ| .
ϕ
ψ ϕ
ψ
εϕ|ψ
ε∗ ψ|ϕ
0 ≤
−ε
−ε
=2−
−
ϕ
ψ ϕ
ψ
ϕψ ϕψ
|ϕ|ψ|
= 2 1−
⇒ |ϕ|ψ| ≤ ϕψ.
ϕψ
⇒
⇒
Eigenschaften der Norm:
1. ψ ≥ 0,
ψ = 0 ⇔ ψ = 0
ANHANG A. UNITÄRE VEKTORRÄUME
56
2. aψ = |a|ψ ∀ a ∈ , ∀ψ ∈ H
3. ϕ + ψ ≤ ϕ + ψ
Beweis: Die ersten beiden Eigenschaften folgen unmittelbar aus der Definition
der Norm. Die dritte Eigenschaft (Dreiecksungleichung) ergibt sich aus der
Ungleichung von Cauchy-Schwarz:
ϕ + ψ2 = ϕ + ψ|ϕ + ψ = ϕ|ϕ + ψ|ψ + 2Reϕ|ψ
≤ ϕ2 + ψ2 + 2ϕψ = (ϕ + ψ)2 .
Definition: Ein Vektor ψ heißt normiert oder Einheitsvektor, wenn ψ = 1
ist. Zwei Vektoren ϕ, ψ heißen orthogonal, wenn ϕ|ψ = 0 ist.
Beispiel: Wir betrachten in dem Vektorraum der komplexen Polynome vom Grad
≤ n auf [0, 1] mit dem inneren Produkt
1
p|q =
dx p(x)∗ q(x)
0
√
√
die Elemente p0 (x) = 1, p1 (x) = x und p2 (x) = x2 . p0 , 3p1 und 5p2 sind
Einheitsvektoren, p0 und p1 sind nicht orthogonal, jedoch sind p0 und p0 − 2p1
orthogonal.
In einem unitären Vektorraum gilt die sogenannte Polarisierungsidentität:
1 k
ψ | ϕ =
i ϕ + ik ψ2
4 k=1
4
A.3
Lineare Abbildungen
U und V seien Vektorräume über dem Grundkörper der komplexen Zahlen. Eine
Abbildung A : U → V heißt linear, falls
A(c1 ψ1 + c2 ψ2 ) = c1 Aψ1 + c2 Aψ2
∀ c1,2 ∈ , ∀ ψ1,2 ∈ U.
Die Menge aller linearen Abbildungen von U nach V bezeichnen wir mit L(U, V).
Falls die Räume U und V übereinstimmen, schreiben wir L(U, U) = L(U). Ist
V = (also der Grundkörper), schreibt man L(U, ) = U. U wird Dualraum
von U genannt, die Elemente von U heißen lineare Funktionale.
A.4. ADJUNGIERTE ABBILDUNG
57
Ist {ϕ1 , . . . , ϕn } eine Basis von U und {χ1 , . . . , χm } eine Basis von von V, dann
lässt sich die Wirkung einer linearen Abbildung A ∈ L(U, V) auf die Basisvektoren {ϕ1 , . . . , ϕn } eindeutig bezüglich der Basis {χ1 , . . . , χm } zerlegen:
Aϕl =
m
χk Akl ,
1 ≤ l ≤ n,
Akl ∈ .
k=1
Die m × n Matrix (Akl ) bezeichnet man als Matrixdarstellung der linearen Abbildung A bezüglich der gewählten Basissysteme.
A.4
Adjungierte Abbildung
Die Rolle der transponierten Matrix AT wird im komplexen Fall durch die adjungierte Matrix A† = (AT )∗ übernommen. Die Operation A ∈ L(U n , U m ) →
A† ∈ L(U m , U n ) besitzt die folgende Eigenschaften:
(c1 A1 + c2 A2 )† = c∗1 A†1 + c∗2 A†2 ,
(AB)† = B † A† , A†† = A
Fasst man im Raum U n ein Element
c1,2 ∈ ⎞
x1
⎟
⎜
x = ⎝ ... ⎠
xn
⎛
als n × 1-Matrix auf, dann ist
x† = (x∗1 , . . . , x∗n )
und das Skalarprodukt kann in Matrixnotation
x | y = x† y
geschrieben werden. Die Abbildung x → x† stellt eine Identifizierung“ des U n
”
n dar, allerdings ist diese Identifizierung“
mit seinem Dualraum U
nicht linear:
”
(c1 x1 + c2 x2 )† = c∗1 x†1 + c∗2 x†2
Das Konzept der adjungierten Abbildung kann nun leicht auf den allgemeinen Fall
eines beliebigen unitären Raumes H erweitert werden. Da wir ein Skalarprodukt
auf kanonische
zur Verfügung haben, können wir H mit seinem Dualraum H
zu,
Weise identifizieren“ . Dazu ordnen wir jedem ϕ ∈ H das Funktional ϕ† ∈ H
”
welches durch
ϕ† ψ = ϕ | ψ ∀ ψ ∈ H
ANHANG A. UNITÄRE VEKTORRÄUME
58
definiert ist. Diese Abbildung führt linear unabhängige Vektoren wieder in linear
unabhängige Vektoren über und ist injektiv. Da die Dimension von H mit der
seines Dualraums übereinstimmt, ist sie auch surjektiv. Die inverse Abbildung
bezeichnen wir ebenfalls mit † , sodass ϕ†† = ϕ gilt.
Seien U und V unitäre Vektorräume und A : U → V eine lineare Abbildung. Die
zu A adjungierte Abbildung A† : V → U ist durch
A† ϕ | ψU = ϕ | AψV
∀ ψ ∈ U, ∀ ϕ ∈ V
definiert. Diese Definition ist äquivalent mit
A† ϕ = (ϕ† A)†
∀ ϕ ∈ V.
Die so definierte Abbildung ist wohldefiniert und linear, da
†
A† (c1 ϕ1 + c2 ϕ2 ) = (c1 ϕ1 + c2 ϕ2 )† A
†
= (c∗1 ϕ†1 + c∗2 ϕ†2 )A
= c1 (ϕ†1 A)† + c2 (ϕ†2 A)†
= c1 A† ϕ1 + c2 A† ϕ2
ϕ1,2 ∈ V,
c1,2 ∈ .
Eigenschaften der adjungierten Abbildung:
1. (c1 A1 + c2 A2 )† = c∗1 A†1 + c∗2 A†2 ,
2. A†† = A,
A1,2 ∈ L(U, V).
A ∈ L(U, V).
3. (BA)† = A† B † ,
A.5
c1,2 ∈ ,
A ∈ L(U, V), B ∈ L(V, W).
Orthonormalbasis
Bezüglich einer ONB {ϕ1 , . . . , ϕn } eines n-dimensionalen unitären Vektorraumes
H lässt sich jedes ψ ∈ H in der Form
ψ=
n
ϕ k ck
k=1
schreiben, wobei die Entwicklungskoeffizienten ck ∈ eindeutig durch
ck = ϕk | ψ = ϕ†k ψ
gegeben sind. Das heißt, dass
ψ=
n
k=1
ϕk ϕ†k ψ
∀ ψ ∈ H,
A.5. ORTHONORMALBASIS
59
und man erhält somit die Vollständigkeitsrelation für den Fall eines unitären
Vektorraumes:
n
ϕk ϕ†k = 1.
k=1
Das bedeutet, dass eine Menge von n Vektoren {ϕ1 , . . . , ϕn } in einem ndimensionalen unitären Vektorraum H genau dann eine ONB von H ist, falls
die Bedingungen
n
ϕk | ϕl = δkl ,
ϕk ϕ†k = 1
k=1
erfüllt sind.
Beispiel: Verifizieren Sie die oben angegebenen Eigenschaften für die folgende
ONB von U 2 :
1
1
1
i
√
, √
.
2 i
2 1
Bemerkung: Die Funktionen en (x) = e2πinx (−N ≤ n ≤ N) bilden eine ONB
des im Abschnitt A.1 in Beispiel 3 angegebenen unitären Vektorraumes. Aus
diesem Grund lassen sich die Entwicklungskoeffizienten cn in der Form
1
cn = en | ψ =
dx e−2πinx ψ(x)
0
schreiben. Im (formalen) Limes N → ∞ erhält man die Fourierreihe
cn e2πinx .
ψ(x) =
n∈
Das Gram-Schmidtsche Orthonormalisierungsverfahren ist eine Methode,
ausgehend von einer beliebigen Basis {χ1 , . . . , χn } eines unitären Vektorraumes,
eine ONB (ein VONS) {ϕ1 , . . . , ϕn } zu konstruieren.
ϕ1 =
χ1
χ1 χ2 = ϕ1 ϕ1 |χ2 + χ2 − ϕ1 ϕ1 |χ2 )
ϕ1
⇒
ϕ2 =
⊥ϕ1
χ2 − ϕ1 ϕ1 |χ2 χ2 − ϕ1 ϕ1 |χ2 ANHANG A. UNITÄRE VEKTORRÄUME
60
χ3 =
ϕ ϕ |χ + ϕ ϕ |χ 1 1 3 2 2 3
+ χ3 − ϕ1 ϕ1 |χ3 − ϕ2 ϕ2 |χ3 ⊥ϕ1 ,ϕ2
liegt in dem von ϕ1 , ϕ2
aufgespannten linearen Teilraum
⇒
ϕ3 =
χ3 − ϕ1 ϕ1 |χ3 − ϕ2 ϕ2 |χ3 χ3 − ϕ1 ϕ1 |χ3 − ϕ2 ϕ2 |χ3 usw. → VONS {ϕ1 , . . . , ϕn }.
Bemerkung: Aus diesem Resultat folgt auch unmittelbar, dass ein VONS stets
existiert.
Ein beliebiger n-dimensionaler unitärer Vektorraum H unterscheidet sich in
gewisser Weise nicht von einem U n . Wählt man nämlich in H eine ONB
{ϕ1 , . . . , ϕn }, so lässt sich jedes ψ ∈ H eindeutig in der Form
ψ=
n
ϕ k ck ,
ck = ϕk |ψ
k=1
schreiben. Der Vektor ψ ∈ H ist also
die n Zahlen
⎛
c1
⎜ ..
⎝ .
(bei vorgegebener ONB) eindeutig durch
⎞
⎟
n
⎠∈U
cn
bestimmt. Diese Zuordnung
⎞
c1
⎟
⎜
ψ ∈ H ↔ ⎝ ... ⎠ ∈ U n
cn
⎛
respektiert sowohl die Vektoraddition, die Multiplikation mit Skalaren als auch
die Bildung des Skalarprodukts. Man sagt auch, dass jeder n-dimensionale unitäre
Vektorraum isomorph zu U n ist.
Die Matrixdarstellung (Akl ) einer linearen Abbildung A ∈ L(H) hat
bezüglich einer ONB {ϕ1 , . . . , ϕn } eine besonders einfache Form. Bildet man
nämlich das Skalaprodukt von ϕk mit dem Ausdruck
Aϕl =
n
j=1
ϕj Ajl ,
A.5. ORTHONORMALBASIS
61
so erhält man
ϕk |Aϕl = ϕk |
n
ϕj Ajl =
j=1
n
j=1
Ajl ϕk |ϕj = Akl .
δkj
Das heißt, man bildet einfach ein Sandwich“ des Operators A zwischen den
”
Vektoren ϕk und ϕl um das Matrixelement Akl zu erhalten:
Akl = ϕk | Aϕl = ϕ†k Aϕl .
Für die Matrixelemente des zu A ∈ L(H) adjungierten Operators A† ∈ L(H)
erhält man daher bezüglich einer ONB
(A† )kl = ϕk | A† ϕl = Aϕk | ϕl = ϕl | Aϕk ∗ = A∗lk .
Das heißt, die Zeilen werden mit den Spalten vertauscht und die Matrixelemente
werden komplex konjugiert.
Bemerkung: In der Physik wird oft die sogenannte Diracschreibweise verwendet. Statt ψ ∈ H schreibt man dann |ψ ∈ H (ket-Vektor) und für ein Element
verwendet man die Notation ψ| (bra-Vektor). Die etwas
des Dualraums ψ † ∈ H
seltsame Sprechweise kommt von dem englischen Wort bracket = Klammer =
| . In der Diracschreibweise schreibt man z.B. die Vollständigkeitsrelation als
n
|ϕk ϕk | = 1,
k=1
oder oft in der Form
n
|kk| = 1,
k=1
wobei |k kurz für den Vektor |ϕk der gewählten ONB steht. Einige weitere
Beispiele mit Übersetzung“ :
”
|ϕψ| = ϕψ †
|kl| = |ϕk ϕl | = ϕk ϕ†l
k|l = ϕk |ϕl = ϕ†k ϕl
k |A| l = ϕk |A| ϕl = ϕk | Aϕl = Akl
ANHANG A. UNITÄRE VEKTORRÄUME
62
A.6
Projektionsoperatoren
Sei M ein Teilraum eines unitären Vektorraumes H. Dann bezeichnen wir mit
M⊥ das orthogonale Komplement von M, welches aus allen Elementen ψ ∈
H mit ϕ|ψ = 0 ∀ ϕ ∈ M besteht. Dann ist M⊥ wieder ein Teilraum von H
und M ∩ M⊥ = {0}, denn
ψ1,2 ∈ M⊥ ⇒ ϕ | c1 ψ1 + c2 ψ2 = c1 ϕ | ψ1 + c2 ϕ | ψ2 = 0
⇒ c1 ψ1 + c2 ψ2 ∈ M⊥ ,
ψ | ψ = 0 ⇒ ψ = 0.
ψ ∈ M ∩ M⊥ ⇒
∈M
∈M⊥
Mit dem Skalarprodukt von H ist M selbst ein unitärer Raum. Daher besitzt M
eine ONB {ϕ1 , . . . ϕm }. Für jeden Vektor ψ ∈ H sei
ψM =
m
ϕk ϕk | ψ =
k=1
m
ϕk ϕ†k ψ
k=1
Dann ist ψM ∈ M und ψ − ψM ∈ M⊥ , weil
ϕk | ψ − ψM = ϕk | ψ − ϕk | ψM m
%
&
ϕl ϕl | ψ
= ϕk | ψ − ϕk |
= ϕk | ψ −
m
l=1
l=1
ϕl | ψ ϕk | ϕl = ϕk | ψ − ϕk | ψ = 0
δkl
∀ k = 1, . . . , m
⇒ ψ = ψM + (ψ − ψM ) mit ψM ∈ M und ψ − ψM = ψM⊥ ∈ M⊥ . Diese
Darstellung ist eindeutig, weil M ∩ M⊥ = {0} ist, d.h. H = M ⊕ M⊥ und
dim M ⊥ = dim H − dim M. Weiters ist M⊥⊥ = M für jeden Teilraum M. Man
bezeichnet ψM als die orthogonale Projektion von ψ auf den Teilraum M.
Aus der Gleichung
ψM =
m
ϕk ϕ†k ψ
k=1
sieht man, dass der Operator
PM =
m
k=1
ϕk ϕ†k
=
m
|ϕk ϕk | ∈ L(H) (m ≤ dim H)
k=1
die Projektion ψ → ψM auf den m-dimensionalen Teilraum M bewerkstelligt,
wobei PM M⊥ = 0. PM heißt daher (orthogonaler) Projektionsoperator oder
A.7. HERMITESCHE OPERATOREN
63
(orthogonaler) Projektor auf M. PM ist natürlich von der Wahl der ONB
{ϕ1 , . . . , ϕm } in M unabhängig.
Eigenschaften von PM :
2
= PM (idempotent) wegen PM ψ = ψM , PM ψM = ψM .
1. PM
Anderer Beweis:
2
PM
=
m
ϕk ϕ†k
k=1
m
ϕl ϕ†l
=
l=1
m
ϕk ϕ†k ϕl
k,l=1
ϕ†l
=
m
ϕk ϕ†k = PM
k=1
δkl
†
2. PM
= PM (einen Operator mit dieser Eigenschaft nennt man hermitesch
oder selbstadjungiert).
'
†
PM
=
m
(†
ϕk ϕ†k
=
k=1
m ϕk ϕ†k
†
=
k=1
m
k=1
†
ϕ††
k ϕk
=
m
ϕk ϕ†k = PM
k=1
Umgekehrt definiert jeder Operator P ∈ L(H), der die Eigenschaften P 2 = P
und P † = P erfüllt, durch sein Bild M = P H einen linearen Teilraum, wobei
P M⊥ = 0, da
χ | P ψ = P †χ | ψ = P χ | ψ = 0
∀ ψ ∈ M⊥ ,
∀χ ∈ H
∈M
wobei P † = P verwendet wurde.
Bemerkung: PM⊥ = 1 − PM ,
PM PM⊥ = 0.
PM besitzt die Eigenwerte 0 (falls dim M < dim H = n) und 1, da PM ϕ =
ϕ, ∀ ϕ ∈ M und PM ψ = 0 ∀ ψ ∈ M⊥ und H = M ⊕ M⊥ . Man kann
die ONB {ϕ1 , . . . , ϕm } von M (die aus n linear unabhängigen Eigenvektoren
von PM zum Eigenwert 1 besteht) durch die Hinzunahme einer beliebigen ONB
{ϕm+1 , . . . , ϕn } von M⊥ (die aus n − m linear unabhängigen Eigenvektoren von
PM zum Eigenwert 0 besteht) zu einem VONS {ϕ1 , . . . , ϕm , ϕm+1 , . . . , ϕn } des
ganzen Raumes H = M ⊕ M⊥ ergänzen.
A.7
Hermitesche Operatoren
Definition: Ein Operator A ∈ L(H) (H ist ein unitärer Vektorraum) heißt hermitesch oder selbstadjungiert, wenn A† = A ist.
ANHANG A. UNITÄRE VEKTORRÄUME
64
Die Eigenwerte eines hermiteschen Operators sind reell: Sei ψ ∈ H ein Eigenvektror von A mit Eigenwert a (Aψ = aψ). Dann ist
ψ | Aψ = ψ | aψ = aψ | ψ.
Andererseits ist wegen A† = A
ψ | Aψ = A† ψ | ψ = Aψ | ψ = aψ | ψ = a∗ ψ | ψ,
und somit
(a − a∗ )ψ | ψ = 0.
Da ψ als Eigenvektor nicht der Nullvektor sein kann, ist auch ψ | ψ = 0, woraus
a = a∗ ∈ folgt.
Bemerkung: Die Umkehrung gilt nicht, das heißt ein Operator, der nur reelle
Eigenwerte besitzt, ist nicht notwendigerweise hermitesch. Gegenbeispiel im U 2 :
1 0
1 1
†
,
A=
= A =
1 1
0 1
jedoch hat A den (einfach entarteten) Eigenwert 1.
Beispiele für hermitesche Operatoren:
1. Die allgemeine Form einer hermiteschen Matrix im U 2 ist
a
c + id
A=
,
a, b, c, d ∈ .
c − id
b
Überzeugen Sie sich, dass die Eigenwerte von A tatsächlich reell sind.
2. Mit den orthogonalen Projektoren (P 2 = P, P † = P ) haben wir bereits
Spezialfälle von hermiteschen Operatoren kennengelernt. Man kann auch
sagen, dass die Projektionsoperatoren genau jene hermiteschen Elemente
aus L(H) sind, deren Eigenwerte 0 oder 1 sind.
3. In einem unitären Vektorraum H mögen die Vektoren {ϕ1 , . . . , ϕn } ein
VONS von H bilden. Dann ist
A=
n
k=1
ak ϕk ϕ†k =
n
ak |ϕk ϕk | ,
ak ∈ k=1
ein hermitescher Operator. Die reellen Zahlen ak (k = 1, . . . , n) sind Eigenwerte von A und die ONB {ϕ1 , . . . , ϕn } besteht aus Eigenvektoren von A.
Wir werden später sehen, dass sich jeder hermitesche Operator in der oben
angegebenen Form (Spektraldarstellung) schreiben lässt.
A.8. UNITÄRE OPERATOREN
A.8
65
Unitäre Operatoren
Definition: Ein Operator U ∈ L(H) (H ein unitärer Vektorraum) heißt unitär,
falls U invertierbar ist mit U −1 = U † (d.h. U † U = UU † = 1).
Satz: Sei U ∈ L(H) (H ein unitärer Vektorraum). Dann sind die folgenden
Aussagen äquivalent:
1. U ist unitär.
2. Uϕ | Uψ = ϕ | ψ
3. Uψ = ψ
∀ ϕ, ψ ∈ H.
∀ ψ ∈ H.
4. U bildet jede ONB von H wieder auf eine ONB von H ab.
Bei dem Beweis dieses Satzes bereitet nur die Implikation 3 ⇒ 2 etwas Mühe.
Nehmen wir an, dass Uψ = ψ ∀ψ ∈ H erfüllt ist, so folgt unter Verwendung
der Polarisierungsidentität, dass
1 k
i Uϕ + ik Uψ2
Uψ | Uϕ =
4 k=1
4
1 k
=
i U(ϕ + ik ψ)2
4 k=1
4
1 k
=
i (ϕ + ik ψ)2
4 k=1
4
= ψ | ϕ.
Sind U1 , U2 ∈ L(H) zwei unitäre Operatoren, dann ist auch das Produkt U1 U2
ein unitärer Operator, da
(U1 U2 )−1 = U2−1 U1−1 = U2† U1† = (U1 U2 )†
Die Eigenwerte eines unitären Operators haben den Betrag eins, da
Uψ = uψ (ψ = 0, u ∈ ) ⇒
ψ | ψ = Uψ | Uψ = uψ | uψ = |u|2 ψ | ψ
⇒
|u| = 1
=0
⇒
iα
u=e ,
α ∈ .
Das heißt, das Spektrum (die Menge der Eigenwerte) eines unitären Operators
ist eine Teilmenge des Einheitskreises in der komplexen Zahlenebene.
Beispiele von unitären Abbildungen:
ANHANG A. UNITÄRE VEKTORRÄUME
66
1. Sei U eine unitäre Matrix auf U n . Dann wird die Standardbasis {e1 , . . . , en }
(VONS von U n ) in einanderes VONS von U n {Ue1 , . . . , Uen } = {f1 , . . . , fn }
übergeführt. Wegen nk=1 fk fk† = 1 kann man schreiben:
U = U1 = U
n
ek e†k
=
k=1
n
k=1
Uek e†k
fk
=
n
fk e†k = (f1 , . . . , fn ),
k=1
d.h. die Spalten einer unitären Matrix bilden ein VONS.
2. Die allgemeine Form einer unitären 2 × 2 Matrix ist daher:
a −b∗
U=
eiα , a, b ∈ , |a|2 + |b|2 = 1, α ∈ .
b a∗
3. Die Vektoren {ϕ1 , . . . , ϕn } mögen ein VONS eines unitären Vektorraums
bilden. Dann ist
n
n
†
iαk
U=
e ϕk ϕk =
eiαk |ϕk ϕk | , αk ∈ ,
k=1
k=1
ein unitärer Operator. Die komplexe Zahl eiαk ist ein Eigenwert von U mit
dazugehörigem Eigenvektor ϕk . Wieder kann man zeigen, dass sich jeder
unitäre Operator in der obigen Form schreiben lässt.
A.9
Normale Operatoren
Definition: Ein Operator A ∈ L(H) (H ein unitärer Vektorraum) heißt normal,
falls AA† = A† A.
Bemerkung: Definiert man den Kommutator zweier Operatoren A, B ∈ L(H)
durch [A, B] = AB − BA, so ist die Eigenschaft, dass
bei
einem normalen Ope
rator A und A† vertauschen, gleichbedeutend mit A, A† = 0.
Beispiele für normale Operatoren:
1. Hermitesche und unitäre Operatoren sind normal.
2. Sei {ϕ1 , . . . , ϕn } ein VONS eines unitären Vektorraumes H. Dann ist
A=
n
k=1
ak ϕk ϕ†k =
n
ak |ϕk ϕk | ,
ak ∈ k=1
ein normaler Operator. Wir werden im nächsten Abschnitt zeigen, dass
sich jeder normale Operator in dieser Form schreiben lässt. Das ist die
Aussage des Spektralsatzes für normale Operatoren. Dieser behauptet
nämlich, dass die normalen Operatoren genau diejenigen sind, die eine ONB
von Eigenvektoren besitzen.
A.10. SPEKTRALSATZ FÜR NORMALE OPERATOREN
67
Bemerkungen:
1. Im Raum U 2 ist die Matrix
A=
1 1
0 1
nicht normal (AA† = A† A). Diese Matrix hat nur einen Eigenvektor!
2. Für jedes A ∈ L(H) sind A† A und AA† hermitesch.
3. Für jedes A ∈ L(H) sind
A1 =
1
A + A†
2
und A2 =
1 A − A†
2i
hermitesche Operatoren und es gilt
A = A1 + iA2
Der Operator A ist genau dann normal, wenn [A1 , A2 ] = 0 gilt. Daraus
ergibt sich, dass man normale Operatoren in gewisser Hinsicht als Verallgemeinerung der komplexen Zahlen interpretieren kann, wobei die hermiteschen Operatoren den reellen Zahlen entsprechen. Die unitären Operatoren
(U † U = UU † = 1) stellen das Analogon zu einer komplexen Zahl z mit
z ∗ z = 1, d.h. |z| = 1, dar.
A.10
Spektralsatz für normale Operatoren
Normale Operatoren lassen sich dadurch charakterisieren, dass sie ein vollständiges Orthonormalsystem von Eigenvektoren besitzen. Die Spektraldarstellung normaler Operatoren ist eine unmittelbare Folgerung aus dieser Eigenschaft. Diese
wird in den verschiedensten physikalischen Anwendungen benötigt.
Spektralsatz für normale Operatoren: Jeder normale Operator in einem
unitären Vektorraum besitzt ein vollständiges Orthonormalsystem von Eigenvektoren.
Beweis: Sei A ∈ L(H) ein normaler Operator ( A, A† = 0) in einem ndimensionalen unitären Vektorraum H. Dann besitzt das charakteristische Polynom von A,
pA (a) = det(a1 − A),
mindestens eine Nullstelle a1 ∈ . Die Eigenwertgleichung
Aϕ = a1 ϕ
ANHANG A. UNITÄRE VEKTORRÄUME
68
besitzt daher eine nichttriviale Lösung ϕ1 = 0, wobei man ϕ1 |ϕ1 = 1 wählen
kann. Da A normal ist, ist ϕ1 auch Eigenvektor des adjungierten Operators A†
zum Eigenwert a∗1 :
A† ϕ1 = a∗1 ϕ1 .
Das kann man folgendermaßen sehen:
%
0 =
%
=
%
=
%
=
%
=
(A − a1 )ϕ1 | (A − a1 )ϕ1
&
ϕ1 | (A − a1 )† (A − a1 )ϕ1
ϕ1 | (A − a1 )(A − a1 )† ϕ1
&
&
(A − a1 )† ϕ1 | (A − a1 )† ϕ1
(A† − a∗1 )ϕ1 | (A† − a∗1 )ϕ1
&
&
A† ϕ1 = a∗1 ϕ1
⇒
Man betrachtet nun den (n-1)-dimensionalen Teilraum
N = [ϕ1 ]⊥ = {ψ ∈ H | ϕ1 |ψ = 0} .
Die Anwendung von A bzw. A† auf Elemente von N führt aus diesem Teilraum
nicht heraus, denn für ψ ∈ N gilt
ϕ1 | Aψ = A† ϕ1 | ψ = a∗1 ϕ1 | ψ = a1 ϕ1 | ψ = 0
und
ϕ1 | A† ψ = Aϕ1 | ψ = a1 ϕ1 | ψ = a∗1 ϕ1 | ψ = 0.
Man kann daher A als Opertaor auf N auffassen, der natürlich auch normal
ist. Man wiederholt nun das Verfahren von vorhin und erhält ein ϕ2 ∈ N (d.h.
ϕ2 |ϕ1 = 0), ϕ2 = 1, mit Aϕ2 = a2 ϕ2 .
Die weitere Fortsetzung dieser Prozedur liefert nach insgesamt n Schritten ein
VONS {ϕ1 , . . . , ϕn } von Eigenvektoren von A: Aϕk = ak ϕk .
Zur Spektraldarstellung eines normalen Operators,
A=
n
ak ϕk ϕ†k =
k=1
n
ak |ϕk ϕk | ,
k=1
gelangt man nun einfach durch die Verwendung der Vollständigkeitsrelation für
die ONB {ϕ1 , . . . , ϕn }:
A = A1 = A
n
k=1
ϕk ϕ†k
=
n
k=1
Aϕk ϕ†k
=
n
k=1
ak ϕk ϕ†k
A.10. SPEKTRALSATZ FÜR NORMALE OPERATOREN
69
Bemerkung: Sei A ∈ L(U n ) eine normale n × n-Matrix. Dann gibt es ein VONS
{f1 , . . . , fn } von Eigenvektoren von A:
fk† fl
= δkl ,
n
fk fk† = 1,
k=1
A=
n
k=1
⎛
⎜
fk ak fk† = (f1 , . . . , fn ) ⎝
U
a1
Afk = ak fk .
⎞⎛
⎞
f1†
⎟ ⎜ .. ⎟
..
⎠⎝ . ⎠
.
an
fn†
Â
Die Matrizen
U=
n
U†
fk e†k = (f1 , . . . , fn )
k=1
und
⎞
f1†
⎟
⎜
ek fk† = ⎝ ... ⎠
U† =
k=1
fn†
⎛
n
sind unitär (UU † = U † U = 1). Der Spektralsatz besagt also, dass man jede
normale n × n-Matrix in der Form
A = U ÂU †
schreiben kann, wobei U unitär ist und  die aus den Eigenwerten a1 , . . . , an
gebildete Diagonalmatrix  = diag(a1 , . . . , an ) ist. Multipliziert man die obige
Gleichung von links mit U † und von rechts mit U, so erhält man
U † AU = Â
d.h. eine n × n-Matrix lässt sich genau dann durch eine unitäre Transformation auf Diagonalgestalt bringen, wenn sie normal ist. An dieser Stelle sei an den
allgemeinen Fall einer diagonalisierbaren n × n-Matrix erinnert, bei der eine Basis {f1 , . . . , fn } von Eigenvektoren Afk = ak fk existiert. Bildet man die Matrix
S = (f1 , . . . fn ), so ist S −1 AS = Â = diag(a1 , . . . , an ) die gewünschte Diagonalisierung. In unserem Fall einer normalen Matrix haben wir also den Spezialfall,
dass die Eigenvektoren eine ONB bilden und S daher unitär ist (S −1 = S † ).
Kochrezept
für das
Diagonalisieren einer normalen n × n-Matrix A (d.h. einer
Matrix mit A, A† = 0):
1. Man berechne das charakteristische Polynom von A:
pA (a) = det(a1 − A)
ANHANG A. UNITÄRE VEKTORRÄUME
70
2. Man berechne die Eigenwerte von A, indem man die Nullstellen des charakteritischen Polynoms bestimmt. Es kann natürlich vorkommen, dass
manche der Eigenwerte entartet sind.
3. Man ermittle die dazugehörigen Eigenvektoren fk aus der Eigenwertgleichung
Afk = ak fk
und normiere sie (fk = 1). Eigenvektoren zu verschiedenen Eigenwerten
(ak = al ) sind automatisch orthogonal, denn
†
fk† Afl = al fk† fl = A† fk fl = ak fk† fl
⇒
(ak − al ) fk† fl = 0
fk† fl = 0.
⇒
=0
Ist ein Eigenwert d-fach entartet, so gibt es d linear unabhängige Eigenvektoren (d.h. der Eigenraum dieses Eigenwertes ist d-dimensional). Diese
Eigenvektoren können aber stets orthonormal gewählt werden. Auf diese
Weise erhält man ein VONS {f1 , . . . , fn } von U n .
4. Man bilde die unitäre Matrix U = (f1 , . . . , fn ) mit den Eigenvektoren als
Spalten ⇒ U † AU = Â = diag(a1 , . . . , an ).
Beispiele:
1. Die Matrix
R=
cos θ − sin θ
sin θ cos θ
ist in U 2 unitär, ihre Eigenwerte sind e±iθ , die dazugehörigen normierten
Eigenvektoren sind
1
1
(zum Eigenwert e+iθ ),
f1 = √
−i
2
1
1
(zum Eigenwert e−iθ ).
f2 = √
i
2
somit ist
1
U = (f1 , f2 ) = √
2
und
1 1
−i i
U † RU = diag eiθ , e−iθ .
A.10. SPEKTRALSATZ FÜR NORMALE OPERATOREN
2. Die 3 × 3-Matrix
71
⎛
⎞
1 −2 1
A = ⎝ −2 1
1 ⎠
1
1 −2
ist hermitesch, die Eigenwerte müssen daher reell sein. Für das charakteristische Polynom erhält man pA (a) = a(a2 − 9) und somit die Eigenwerte
a1 = 0,
a2 = 3,
a3 = −3.
Die Eigenwertgleichungen Af1 = 0, Af2 = 3f2 , Af3 = −3f3 ergeben die
(normierten) Lösungen
⎛ ⎞
⎛
⎞
⎛
⎞
1
1
1
1
1
1
f1 = √ ⎝ 1 ⎠ , f2 = √ ⎝ −1 ⎠ , f3 = √ ⎝ 1 ⎠ ,
3
2
6
1
0
−2
Man überprüft leicht, dass {f1 , f2 , f3 } tatsächlich eine ONB von U 3 ist.
Ebenso kann man als Probe die Spektraldarstellung
A=
3
ak fk fk† = 3 f2 f2† − f3 f3†
k=1
überprüfen“. Für die unitäre Matrix U = (f1 , f2 , f3 ), welche die Diagona”
lisierung von A in der Form U † AU = diag(0, 3, −3) bewerkstelligt, erhält
man daher
⎛
⎞
⎜
U =⎝
√1
3
√1
3
√1
3
√1
2
− √12
0
√1
6
√1
6
− √26
⎟
⎠.
Bemerkung: Wir haben die Spektraldarstellung eines normalen Operators A
in einem n-dimensionalen unitären Raum so formuliert, dass wir A als Linearkombination von eindimensionalen Projektionsoperatoren |ϕk ϕk | geschrieben
haben,
n
A=
ak |ϕk ϕk | .
k=1
Wenn es entartete Eigenwerte gibt, dann sind einige der ak gleich und es ist
möglich die entsprechenden Terme zusammenzufassen. Dazu ändern wir unsere
Notation etwas ab: {aα }m
α=1 sei das Spektrum von A (d.h. aα = aβ für α = β).
a1 , . . . , am bezeichnen also jetzt die m ≤ n verschiedenen Eigenwerte von A
mit dazugehörigen Eigenräumen Mα (α = 1, . . . , m), die paarweise aufeinander
orthogonal stehen:
Mα ⊥ Mβ
für α = β,
H = M 1 ⊕ · · · ⊕ Mm .
ANHANG A. UNITÄRE VEKTORRÄUME
72
Durch eine geeignete Umbenennung der Vektoren der ONB {|ϕ1 , . . . , |ϕn } in
{| α, r}
r = 1, . . . dα = dim Mα
α = 1, . . . m,
kann man die Projektoren auf die Eigenräume Mα (α = 1, . . . , m) in der Form
PMα =
dα
| α, rα, r |
r=1
schreiben. Die Tatsache, dass die PMα orthogonale Projektionsoperatoren auf die
paarweise orthogonal stehenden Teilräume M1 , . . . , Mm sind, drückt sich durch
die Relationen
†
PMα PMβ = δαβ PMα , PM
= PMα
α
aus. Zusammen mit der Vollständigkeitsrelation
m
PMα = 1
α=1
gelangen wir schließlich zur gewünschten alternativen Formulierung der Spektraldarstellung von A:
m
A=
aα PMα .
α=1
A.11
Gleichzeitige Diagonalisierbarkeit
Das folgende Kriterium für die gleichzeitige Diagonalisierbarkeit normaler Operatoren wird vor allem in der Quantenmechanik oft benötigt.
Satz: A, B ∈ L(H) seien normale Operatoren, die miteinander vertauschen
([A, B] = 0). Dann gibt es eine gemeinsame ONB von Eigenvektoren für beide
Operatoren.
Beweis: Seien aα (α = 1, . . . m) die verschiedenen Eigenwerte von A und Mα
die entsprechenden Eigenräume. ψ ∈ Mα ⇒ Bψ ∈ Mα , denn
ABψ = BAψ = Baα ψ = aα Bψ
⇒ B|Mα ist ein normaler Operator auf Mα ⇒ ∃ ONB von Mα {|α, 1, . . . |α, dα}
von Eigenvektoren von B. Außerdem ist natürlich A|α, r = aα |α, r.
Die Vektoren |α, r (α = 1, . . . m, r = 1, . . . , dα = dim Mα ) bilden ein VONS von
H, das aus Eigenvektoren von A und B gebildet wird.
Bemerkung: Für normale n × n-Matrizen A, B mit [A, B] = 0 bedeutet das:
∃ unitäre Matrix U, sodass U † AU und U † BU Diagonalmatrizen sind. (A und B
sind gleichzeitig diagonalisierbar.)
A.12. FUNKTIONEN NORMALER OPERATOREN
A.12
73
Funktionen normaler Operatoren
Funktionen von linearen Operators treten etwa bei der Behandlung von Systemen linearer Differentialgleichungen, der Beschreibung von Symmetrietransformationen und der Zeitentwicklung in der Quantenmechanik auf. Die Berechnung
der Funktion eines normalen Operators ist erstaunlich einfach. Sie kann auf die
Bestimmung der Funktionswerte auf dem Spektrum des Operators zurückgeführt
werden.
Um dies zu sehen, gehen wir von der Spektraldarstellung eines normalen Operators A in der Form
n
A=
ak ϕk ϕ†k
k=1
aus. Multipliziert man diesen Ausdruck mit sich selbst (was einer nochmaligen
Anwendung der Abbildung A entspricht), so erhält man
2
A
= AA =
n
ak ϕk ϕ†k
k=1
=
n
n
al ϕl ϕ†l
l=1
=
n
k,l=1
ak al ϕk ϕ†k ϕl ϕ†l
δkl
a2k ϕk ϕ†k
k=1
bzw. für beliebiges m ∈ ,
· · A =
A =A
·
m
m-mal
n
†
am
k ϕk ϕk .
k=1
Ebenso erhält man für ein Polynom von A den Ausdruck
'
(
n
n
†
m
m
cm A =
cm ak ϕk ϕk =
p(ak )ϕk ϕ†k .
p(A) =
m
k=1
m
k=1
Für eine beliebige komplexwertige Funktion f , die auf dem Spektrum des normalen Operators A ∈ L(H) (das ist die Menge der Eigenwerte von A) definiert
ist, kann man f (A) ∈ L(H) daher durch
f (A) =
n
f (ak )ϕk ϕ†k
k=1
definieren, wobei f (A) natürlich wieder ein normaler Operator ist.
ANHANG A. UNITÄRE VEKTORRÄUME
74
Beispiele:
1. Sei A ∈ L(U n ) eine normale n×n-Matrix. A =U ÂU † , Â = diag(a
1 , . . . , an ),
†
U unitär ⇒ f (A) = Uf (Â)U , f (Â) = diag f (a1 ), . . . , f (an ) .
2. Sei U ∈ L(H) ein unitärer Operator. Seine Eigenwerte haben dann die
Gestalt eiαk (α ∈ ) und die Spektraldarstellung lautet
U=
n
eiαk ϕk ϕ†k = eiA ,
k=1
wobei A =
n
†
k=1 αk ϕk ϕk
= A† .
Das heißt, jeder unitäre Operator kann in der Form
U = eiA ,
A = A† ,
geschrieben werden.
3. Die Funktion f (A) eines normalen Operators A in einem zweidimensionalen unitären Raum kann als Linearkombination des Einheitsoperators
und von A selbst geschrieben werden. Sind die zwei möglichen Eigenwerte
entartet, so ist A = a1 und daher f (A) = f (a)1, womit die Behauptung
offensichtlich erfüllt ist. Im Fall verschiedener Eigenwerte (a1 = a2 ) hat
man
A = a1 P1 + a2 P2 , P1 + P2 = 1,
wobei
P1 = ϕ1 ϕ†1 ,
P2 = ϕ2 ϕ†2
die beiden eindimensionalen Projektoren auf die von den Eigenvektoren
ϕ1,2 aufgespannten Eigenräume sind. Aus der Spektraldarstellung und der
Vollständigkeitsrelation kann man die beiden Projektionsoperatoren als Linearkombinationen von 1 und A schreiben:
P1 =
A − a2
,
a1 − a2
P2 =
A − a1
.
a2 − a1
Somit erhält man
A − a2
A − a1
+ f (a2 )
a1 − a2
a1 − a2
f (a2 )a1 − f (a1 )a2
f (a1 ) − f (a2 )
=
1+
A.
a1 − a2
a1 − a2
f (A) = f (a1 )P1 + f (a2 )P2 = f (a1 )
A.12. FUNKTIONEN NORMALER OPERATOREN
75
4. In der Quantenmechanik treten bei der Beschreibung des Spin 1/2-Systems
die Paulischen Spinmatrizen
0 1
0 −i
1 0
σ1 =
, σ2 =
, σ3 =
1 0
i 0
0 −1
auf. Sie sind in U 2 hermitesch mit Eigenwerten ±1. Sie erfüllen die Vertauschungsrelationen
[σk , σl ] = 2i
3
klm σm
m=1
und die Antivertauschungsrelationen
σk σl + σl σk = 2δkl .
Bildet man die Linearkombination
n · σ =
3
ni σi
k=1
mit einem Einheitsvektor
⎛
⎞
n1
⎝ n2 ⎠ ∈ 3 ,
n3
n21 + n22 + n23 = 1,
so ist n · σ wieder hermitesch mit Eigenwerten ±1. Bei der Beschreibung
der räumlichen Drehung eines Spins um den Winkel α mit Drehachse n,
tritt die Matrix
e−iαn·σ/2
auf. Überprüfen Sie, dass diese Matrix in der Form
e−iαn·σ/2 = 1 cos
α
α
− in · σ sin
2
2
geschrieben werden kann. Hinweis: Wenden Sie die Formel von Beispiel 3
an.
76
ANHANG A. UNITÄRE VEKTORRÄUME
Anhang B
Einfache Quantensysteme
Die in der Theorie der unitären Räume eingeführten mathematischen Konzepte haben eine unmittelbare Entsprechung zu jenen grundlegenden physikalischen
Begriffen, die bei der Formulierung der Grundpostulate der Quantentheorie verwendet werden. Obwohl man zur Beschreibung der meisten realistischen quantenmechanischen Systeme unendlichdimensionale Hilberträume benötigt, können die
wesentlichen Grundideen der mathematischen Struktur der Quantentheorie bereits an Hand des einfacheren Spezialfalls eines endlichdimensionalen Zustandsraumes erläutert werden.
B.1
Grundpostulate der Quantentheorie
Zu jedem quantenmechanischen System gibt es einen geeigneten Hilbertraum
H, den sogenannten Zustandsraum des betrachteten Systems. Obwohl der Zustandsraum i.Allg. unendlichdimensional ist, gibt es physikalische Probleme,
bei denen nur ein endlicher Teilraum des gesamten Hilbertraums relevant ist.
Wir wollen uns also bei der Formulierung der Axiome der Quantentheorie auf
Systeme beschränken, die sich durch einen endlichdimensionalen Zustandsraum H (unitären Vektorraum) beschreiben lassen.
Die beobachtbaren Größen (Observable) des betrachteten quantenmechanischen Systems werden durch die hermiteschen Elemente der Observablenalgebra L(H) repräsentiert. Beispiele für Observable wären etwa die Energie oder
der Drehimpuls des Systems. Der wesentliche Unterschied zur klassischen Physik
liegt darin, dass man es in der Quantenmechanik mit einer nichtkommutativen Obervablenalgebra zu tun hat, d.h. es gibt Operatoren A, B ∈ L(H) mit
[A, B] = 0.
77
ANHANG B. EINFACHE QUANTENSYSTEME
78
Die möglichen Messwerte der durch den hermiteschen Operator A ∈ L(H) beschrieben Observablen sind die Elemente des Spektrums von A (d.h. die Eigenwerte von A). D.h. bei einer Messung der Observablen A kann als Messergebnis
immer nur einer der Eigenwerte a1 , . . . , an von A auftreten.
Bemerkung: Eine besondere Rolle spielen die Projektionsoperatoren, die als
hermitesche Operatoren ja ebenfalls beobachtbare Größen repräsentieren. Ist ein
hermitescher Operator durch seine Spektraldarstellung
A=
m
aα Pα
α=1
gegeben (m ist die Anzahl der verschiedenen Eigenwere von A), so entspricht
dem Projektor Pα (der auf den Eigenraum des Eigenwertes aα projiziert) die
Durchführung des folgenden ja-nein-Experiments: Erhält man bei einer Messung
”
der Observablen A den Messwert aα ?“ Da der Projektionsoperator Pα nur die
Eigenwerte 1 und 0 besitzt, entspricht dem Eigenwert 1 die Antwort ja“ und
”
dem Eigenwert 0 die Antwort nein“.
”
Die möglichen Zustände des Systems werden durch lineare Funktionale auf
der Observablenalgebra beschrieben, die zusätzlich nicht negativ und normiert
sind. Bei einem Zustand ω handelt es sich also um eine Abbildung ω : L(H) → mit folgenden Eigenschaften:
1. ω(c1 A1 + c2 A2 ) = c1 ω(A1 ) + c2 ω(A2 ),
2. ω(A† A) ≥ 0
c1,2 ∈ , A1,2 ∈ L(H)
∀ A ∈ L(H)
3. ω(1) = 1
Durch den Zustand ω wird jeder Observablen A ihr Erwartungswert ω(A)
zugeordnet. Für den Projektionsoperator Pα = Pα† = Pα Pα erhält man wegen der
Eigenschaft 2
pα = ω(Pα ) = ω(PαPα ) = ω Pα† Pα ≥ 0.
pα = ω(Pα ) ist die Wahrscheinlichkeit bei einer Messung der Observablen A
den Messwert aα zu erhalten, wenn sich das System in dem durch ω beschriebenen
Zustand befindet. Wegen der Vollständigkeitsrelation
m
Pα = 1
α=1
und der Linearität der Normierung von ω erhält man
(
' m
m
m
pα =
ω(Pα ) = ω
Pα = ω(1) = 1
α=1
α=1
α=1
B.1. GRUNDPOSTULATE DER QUANTENTHEORIE
79
für die Wahrscheinlichkeit irgendeinen der Eigenwerte von A zu messen. Der
Erwartungswert von A im Zustand ω lässt sich dann, wieder unter Verwendung
der Linearität von ω, in der Form
' m
(
m
m
ω(A) = ω
aα Pα =
aα ω(Pα) =
aα pα
α=1
α=1
α=1
schreiben. Präpariert man eine große Anzahl N von identischen Kopien des Systems alle im gleichen Zustand ω und führt dann an jeder dieser Kopien eine
Messung der Observablen A durch, so wird man Nα -mal den Messwert aα erhalten, wobei
Nα
−→ pα
N N →∞
und m
α=1 Nα = N ist. Für den Mittelwert der Messwerte ergibt sich daher
m
m
Nα
aα
aα pα = ω(A).
−→
N N →∞ α=1
α=1
Beispiele von Zuständen:
1. ψ ∈ H sei ein Einheitsvektor. Dann wird durch ω(A) = ψ|Aψ ∀ A ∈
L(H) ein sogenannter reiner Zustand definiert. Man überzeugt sich leicht,
dass die Eigenschaften 1-3 tatsächlich erfüllt sind. Man nennt ψ dann den
Zustandsvektor des entsprechenden reinen Zustands. Bemerkung: Der
Zustandsvektor eiϕ ψ beschreibt den selben Zustand.
2. ω1 , ω2 , . . . , ωr seien Zustände
r und p1 , p2 , . . . , pr positive Zahlen mit
r
j=1 pj = 1. Dann ist ω =
j=1 pj ωj ebenfalls ein Zustand. Insbesondere
wird durch
r
ω(A) =
pj ψj |Aψj ∀A ∈ L(H)
j=1
ein Zustand definiert, wenn die |ψj (nicht notwendigerweise aufeinander
normal stehende) Zustandsvektoren (ψj |ψj = 1) sind. Zustände, die man
nicht in der Form ω(A) = ψ|Aψ schreiben kann, heißen gemischte
Zustände.
Man kann eine Standardform für die Beschreibung von Zuständen angeben. Da
ω(A) linear in A ist, muss sich ω(A) in der Form
ω(A) =
ρkl Alk
k,l
ANHANG B. EINFACHE QUANTENSYSTEME
80
schreiben lassen, wobei Alk = ϕl |Aϕk die Matrixelemente des Operators A
bezüglich einer beliebigen ONB {ϕ1 , . . . , ϕn } (n = dim H) sind. Die Koeffizienten ρkl ∈ kann man dann ebenfalls als die Matrixelemente eines Operators
ρ ∈ L(H) bezüglich der selben ONB auffassen (ρkl = ϕk |ρϕl ).
⇒
n n
ω(A) =
ϕk | ρϕl ϕl | Aϕk k=1 l=1
n
=
ϕk | ρAϕk = Tr(ρA),
k=1
wobei die Spur eines Operators B,
n
n
TrB =
ϕk | Bϕk =
Bkk
k=1
k=1
unabhängig von der gewählten Basis ist.
(Tr = trace = Spur).
Bis jetzt wurde nur die Linearität von ω verwendet. Die Eigenschaft
ω A† A ≥ 0 ∀ A ∈ L(H)
liefert eine weitere Einschränkung an den Operator ρ. Nimmt man für A nämlich
den eindimensionalen Projektor A = |ϕϕ| (wobei |ϕ ein beliebiger Einheitsvektor ist), so erhält man wegen A† A = A
ϕ | ρϕ ≥ 0.
Ergänzt man nämlich |ϕ zu einer ONB {|ϕ, |ϕ2, . . . , |ϕn } von H, so ergibt sich
n
Tr ρA A = Tr (ρA) = ϕ | ρϕ ϕ | ϕ +
ϕk | ρϕ ϕ | ϕk †
1
k=2
0
= ϕ | ρϕ ≥ 0
und daher mit |ψ = c|ϕ (c ∈ ) die Aussage
ψ | ρψ ≥ 0 ∀ ψ ∈ H.
Einen Operator mit dieser Eigenschaft nennt man nicht negativ (ρ ≥ 0). Man
kann zeigen, dass die folgenden Aussagen äquivalent sind:
1. ψ | ρψ ≥ 0 ∀ ψ ∈ H.
B.1. GRUNDPOSTULATE DER QUANTENTHEORIE
81
2. ρ ist hermitesch und alle Eigenwerte sind ≥ 0.
3. Es gibt einen Operator A ∈ L(H), sodass ρ = A† A.
Beweis:
1 ⇒ 2 : Es seien ψk und ψl zwei aufeinander orthogonal stehende Einheitsvektoren. Dann ist laut Vorraussetzung
ψk + ψl |ρ(ψk + ψl ) = ρkk + ρll +ρkl + ρlk ≥ 0
≥0
⇒
Im(ρkl + ρlk ) = 0,
≥0
ψk + iψl |ρ(ψk + iψl ) = ρkk + ρll +iρkl − iρlk ≥ 0
≥0
⇒
⇒
Re(ρkl − ρlk ) = 0,
≥0
ρkl = ρ∗lk
⇒
ρ = ρ† .
Ist nun χk = 0 ein Eigenvektor von ρ zum Eigenwert ρk , so ist
χk |ρχk = χk |ρk χk = ρk χk |χk ≥ 0
⇒
ρk ≥ 0.
>0
2 ⇒ 3 : Laut Voraussetzung gibt es eine ONB {χ1 , . . . , χn } von Eigenvektoren
von ρ mit Eigenwerten ρk ≥ 0. In der Spektraldarstellung hat ρ die Gestalt
ρ=
n
ρk |χk χk |
k=1
Man kann hier problemlos den hermiteschen (und ebenfalls nicht negativen) Operator
n
√
√
ρ=
ρk |χk χk |
k=1
√ √
√ √
bilden und erhält ρ = ρ ρ = ( ρ)† ρ.
3 ⇒ 1 : ψ|ρ|ψ = ψ|A† Aψ = Aψ|Aψ ≥ 0.
Die Implikationskette 1 ⇒ 2 ⇒ 3 ⇒ 1 ist somit geschlossen und die Äquivalenz
von 1,2,3 gezeigt. Jede dieser drei Eigenschaften kann daher zur Definition eines
nicht negativen Operators herangezogen werden.
Es gibt also eine ONB {χ1 , . . . , χn } von Eigenvektoren von ρ mit Eigenwerten
ρk ≥ 0. Schließlich impliziert die Normierungsbedingung
ω(1) = Trρ = 1
⇒
n
k=1
ρk = 1.
ANHANG B. EINFACHE QUANTENSYSTEME
82
Der Dichteoperator
ρ=
n
ρk |χk χk | ,
ρk ≥ 0,
Trρ =
k=1
n
ρk = 1,
k=1
liefert also mit ω(A) = Tr(ρA) ∀ A ∈ L(H) die gewünschte Standardform für
die Darstellung des Zustands ω. Man kann sich also einen beliebigen Zustand
ω als statistisches Gemisch von reinen Zuständen (repräsentiert durch die
Zustandsvektoren |χk ) vorstellen, wobei |χk mit der Wahrscheinlichkeit ρk auftritt. Ein reiner Zustand ist dadurch charakterisiert, dass alle ρk bis auf eines
verschwinden. Der Dichteoperator, der dem Zustandsvektor |ψ entspricht, ist
ρψ = |ψψ|, also ein eindimensionaler Projektor (ρ†ψ = ρψ , ρ2ψ = ρψ ). Die Eigenschaft ρ2 = ρ charakterisiert jene Dichteoperatoren, die reinen Zuständen
entsprechen, denn in diesem Fall kann
n ρ nur die Eigenwerte 0, 1 besitzen und
wegen der Normierungsbedingung
k=1 ρk = 1 kann der Eigenwert 1 nur ein
einziges Mal auftreten ⇒ ρ = |ψψ|.
Für den Erwartungswert eines Operators A in einem beliebigen (gemischten)
Zustand ergibt sich
ω(A) = Tr(ρA) =
n
χk | ρAχk =
k=1
n
ρk χk | Aχk .
k=1
Hat A die Spektraldarstellung
A=
m
aα Pα ,
α=1
so erhält man
ω(A) =
n m
k=1 α=1
ρk χk | Pα χk aα .
pkα
Es treten hier sowohl die quantenmechanischen“ Wahrscheinlichkeiten pkα als
”
auch die klassischen“ statistischen Wahrscheinlichkeiten ρk auf. pkα ist die Wahr”
scheinlichkeit bei einer Messung der Observablen A in dem durch den Zustandsvektor |χk beschriebenen reinen Zustand den Messwert aα zu erhalten. Dagegen
ist ρk die Wahrscheinlichkeit in dem gemischten Zustand ω den durch |χk beschriebenen reinen Zustand vorzufinden. Die Wahrscheinlichkeit bei einer Messung von A im Zustand ω den Messwert aα zu erhalten, ist daher
ω (Pα ) =
n
k=1
ρk χk | Pα χk =
n
k=1
ρk pkα .
B.1. GRUNDPOSTULATE DER QUANTENTHEORIE
83
Ist ωψ ein reiner Zustand (mit Dichteoperator ρψ = |ψψ|), so vereinfachen sich
die Formeln:
ωψ (A) = ψ | Aψ =
m
ψ | Pα ψaα ,
α=1
ωψ (Pα ) = ψ | Pα ψ.
Verwendet man die Spektraldarstellung
Pα =
dα
|α, rα, r|
r=1
des Projektors auf den Eigenraum Mα , so kann man auch schreiben:
ωψ (Pα ) =
dα
ψ | α, rα, r | ψ =
dα
r=1
|α, r | ψ|2 .
r=1
Ist dα = 1, so hat man einfach ωψ (Pα ) = |α|ψ|2.
Beispiele für Dichteoperatoren gemischter Zustände:
1. Sei dim H = n, dann beschreibt der Dichteoperator ρ = 1/n den Zustand
mit maximaler Mischung.
2. Jener hermitesche Operator, welcher der Observablen Gesamtenergie des
”
Systems“ entspricht, wird als Hamiltonoperator H bezeichnet. Befindet
sich das betrachtete System im thermischen Gleichgewicht mit einem
Wärmebad“ der absoluten Temperatur T , so wird der entsprechende
”
Zustand des Systems durch den Dichteoperator
ρ=
e−H/kT
Tre−H/kT
beschrieben, wobei k 1.38 × 10−23 JK−1 die Boltzmann-Konstante ist.
Ist {|ϕ1 , . . . , |ϕn } eine ONB von Eigenvektoren von H,
H|ϕk = Ek |ϕk ,
ϕk |ϕl = δkl ,
n
|ϕk ϕk | = 1,
k=1
so ist die Spektraldarstellung des Dichteoperators durch
ρ=
n
e−El /kT
l=1
gegeben.
Z
|ϕl ϕl | ,
Z=
n
l=1
e−El /kT
ANHANG B. EINFACHE QUANTENSYSTEME
84
B.2
Spin 1/2 System
Die doch einigermaßen abstrakten allgemeinen Spielregeln der Quantentheorie
sollen nun durch ihre Anwendung auf ein möglichst einfaches quantenmechanisches System mit etwas mehr Leben erfüllt werden.
Sieht man von den Translationsfreiheitsgraden eines Elektrons (oder eines beliebigen anderen Spin 1/2 Teilchens) ab, so werden seine Spinfreiheitsgrade durch
einen zweidimensionalen Zustandsraum beschrieben. Da ein zweidimensionaler
unitärer Vektorraum isomorph zu U 2 ist, kann man die Zustandsvektoren durch
komplexe zweidimensionale Spaltenvektoren darstellen, die Observablenalgebra
ist dann nichts anderes als die Menge der komplexen 2 × 2-Matrizen. Den drei
entsprechen
räumlichen Komponenten S1 , S2 , S3 des Spindrehimpulsvektors S
die hermiteschen Matrizen
Sk =
h̄
σk
2
(1 ≤ k ≤ 3)
mit den bereits früher besprochenen Paulischen Spinmatrizen σk . Die Komponenten des Spinvektors in einer beliebigen räumlichen Richtung n (|n| = 1)
wird durch die Matrix
3
h̄
h̄
h̄ n1 − in2
n3
nk σk =
n · σ =
−n3
2
2
2 n1 + in2
k=1
beschrieben. Die Eigenwerte dieser Matrix sind ±h̄/2, d.h. bei der Messung einer
Spinkomponente in einer beliebigen räumlichen Richtung kann als Messwert nur
entweder +h̄/2 oder −h̄/2 auftreten (daher Spin 1/2“ ).
”
Die Matrix
h̄/2
0
S3 =
0 −h̄/2
besitzt die ONB von Eigenvektoren
1
,
χ↑ =
0
wobei
S3 χ↑ =
h̄
χ↑ ,
2
Dagegen besitzt
S1 =
die ONB von Eigenvektoren
1
ϕ↑ = √
2
1
1
,
χ↓ =
0
1
,
h̄
S3 χ↓ = − χ↓ .
2
0 h̄/2
h̄/2 0
1
ϕ↓ = √
2
1
−1
,
B.2. SPIN 1/2 SYSTEM
85
mit
S1 ϕ ↑ =
h̄
ϕ↑ ,
2
h̄
S1 ϕ ↓ = − ϕ ↓ .
2
Nehmen wir nun an, dass sich das System in dem durch den Zustandsvektor χ↑
beschriebenen reinen Zustand ω befindet (d.h. ω(A) = χ†↑ Aχ↑ , A ∈ L(U 2 )). Die
Wahrscheinlichkeit bei einer Messung der Spinkomponente S3 in diesem Zustand
den Messwert +h̄/2 zu erhalten, ist durch den Erwartungswert des Projektionsoperators χ↑ χ†↑ gegeben:
†
ω χ↑ χ↑ = χ†↑ χ↑ χ†↑ χ↑ = 1.
1
1
Das heißt, bei einer Messung von S3 erhält man in diesem Zustand immer den
Messwert +h̄/2. Dementsprechend ist die Wahrscheinlichkeit in diesem Zustand
für S3 den Messwert −h̄/2 zu erhalten gleich null:
†
ω χ↓ χ↓ = χ†↑ χ↓ χ†↓ χ↑ = 0.
0
0
Der Erwartungswert von S3 ist in diesem Zustand dann natürlich durch
ω(S3 ) = χ†↑ S3 χ↑ =
h̄
2
gegeben. Misst man dagegen in dem selben Zustand die Spinkomponente S1 , so
erhält man für die Erwartungswerte der Projektoren ϕ↑ ϕ†↑ , ϕ↓ ϕ†↓
ω
ϕ↑ ϕ†↑
1
= χ†↑ ϕ↑ ϕ†↑ χ↑ = ,
2
√1
2
1
√
2
1
ω ϕ↓ ϕ†↓ = χ†↑ ϕ↓ ϕ†↓ χ↑ = ,
2
√1
2
1
√
2
was bedeutet, dass man bei einer Messung von S1 in der Hälfte der Fälle den
Messwert +h̄/2 und in der anderen Hälfte den Messwert −h̄/2 erhalten wird.
Der Erwartungswert von S1 muss in dem betrachteten Zustand dann klarerweise
verschwinden:
ω(S1 ) = χ†↑ S1 χ↑ = 0
Wir wollen noch kurz den allgemeinen Fall der Messung der Spinkomponente
= h̄ n · σ ,
n · S
2
|n| = 1
ANHANG B. EINFACHE QUANTENSYSTEME
86
besprechen. Man kann den räumlichen Einheitsvektor n in der Form
⎛
⎞ ⎛
⎞
n1
sin θ cos φ
⎝ n2 ⎠ = ⎝ sin θ sin φ ⎠
n3
cos θ
parametrisieren. Für den Projektor P↑ auf den (eindimensionalen) Eigenraum
zum Eigenwert +1 von n · σ erhält man
1 1 + cos θ sin θ e−iφ
1 + n · σ
=
P↑ =
sin θ eiφ 1 − cos θ
2
2
und für den Projektor P↓ auf den Eigenraum zum Eigenwert −1 von n · σ
1
1 − n · σ
1 − cos θ − sin θ e−iφ
=
P↓ =
.
2
2 − sin θ eiφ 1 + cos θ
Nehmen wir wieder an, dass sich unser System in dem durch den Zustandsvektor
1
χ↑ =
0
beschriebenen reinen Zustand ω befindet, so ist
ω (P↑ ) =
1 + cos θ
θ
= cos2 ,
2
2
ω (P↓ ) =
1 − cos θ
θ
= sin2 .
2
2
Für den speziellen Wert θ = π/2 ergeben sich die früher erhaltenen Resultate.
Für den durch die Dichtematrix ρ = 1/2 beschriebenen maximal gemischten
Zustand (entspricht z.B. einem Strahl unpolarisierter Teilchen) erhält man die
Erwartungswerte
1
Tr(ρA) = TrA.
2
Somit verschwinden in diesem Fall die Erwartungswerte von S1 , S2 , S3 , dagegen
2
erhält man wegen Si2 = h̄4 1
h̄2
Tr(ρSi2 ) = .
4
Befindet sich ein Spin 1/2-System mit magnetischem Moment
μ = μσ
so ist der Hamiltonoperator
in einem äußeren Magnetfeld B,
H = −μ · B.
B.3. ZEITENTWICKLUNG IN DER QUANTENMECHANIK
87
Legt man die 3-Achse des räumlichen Koordinatensystems in Richtung des Ma = Be3 ), so ist
gnetfeldes (B
−μB
0
H = −μBσ3 =
0
+μB
diagonal mit Energieeigenwerten E↑ = −μB, E↓ = +μB und dazugehörigen
(normierten) Eigenvektoren
1
0
χ↑ =
, χ↓ =
.
0
1
Befindet sich dieses magnetische Moment nun im Kontakt mit einem Wärmebad
der Temperatur T , so ist seine Dichtematrix
μB/kT
1
1 −H/kT
0
e
,
=
ρ= e
0
e−μB/kT
Z
Z
wobei
μB
.
kT
Die Erwartungswerte vo μ1 und μ2 (bzw. auch S1 und S2 ) verschwinden in diesem
Zustand, dagegen erhält man für den Erwartungswert von μ3 den Ausdruck
Z = Tre−H/kT = eμB/kT + e−μB/kT = 2 cosh
Tr(ρμ3 ) = μ tanh
μB
,
kT
der in der Theorie des Paramagnetismus eine Rolle spielt.
B.3
Zeitentwicklung in der Quantenmechanik
In der Quantenmechanik wird die Zeitentwicklung eines Zustandsvektors
ψ(t) ∈ H (im Schrödingerbild) durch die Schrödingergleichung
ih̄
dψ(t)
= Hψ(t)
dt
beschrieben. Dabei ist H ein hermitescher Operator (Hamiltonoperator), welcher der Observablen Gesamtenergie des betrachteten Systems“ entspricht. Die
”
Lösung der Schrödingergleichung ist dann (wenn H zeitlich konstant ist) durch
ψ(t) = exp(−iHt/h̄) ψ(0)
gegeben. Da H hermitesch ist, ist der hier auftretende Operator
exp(−iHt/h̄)
ANHANG B. EINFACHE QUANTENSYSTEME
88
unitär, woraus folgt, dass sich die Norm des Zustandsvektors nicht ändert:
ψ(t)|ψ(t) = ψ(0)|ψ(0).
Da H weiters eine ONB von Eigenvektoren,
{φ1, . . . φn },
Hφk = Ek φk
besitzt (E1 , . . . En sind die Energieeigenwerte), hat H die Spektraldarstellung
H=
n
Ek φk φ†k =
k=1
n
Ek |φk φk |.
k=1
Somit ist
exp(−iHt/h̄) =
n
e−iEk t/h̄ φk φ†k =
k=1
n
e−iEk t/h̄ |φk φk |
k=1
und
ψ(t) = exp(−iHt/h̄) ψ(0)
n
=
e−iEk t/h̄ φk φ†k ψ(0)
k=1
=
n
e−iEk t/h̄ |φk φk |ψ(0).
k=1
Beschreibt man den dem Vektor |ψ(t) entsprechenden reinen Zustand durch den
Dichteoperator
ρψ (t) = |ψ(t)ψ(t)|,
so liest man die Zeitentwicklung
ρψ (t) = exp(−iHt/h̄) ρψ (0) exp(iHt/h̄)
ab. Diese Formel für die Zeitentwicklung,
ρ(t) = exp(−iHt/h̄) ρ(0) exp(iHt/h̄)
gilt auch ganz allgemein für Dichtematrizen ρ(t), die gemischten Zuständen entsprechen. Differenziert man die letzte Gleichung nach der Zeit, so erhält man die
von Neumann-Gleichung
dρ(t)
= [H, ρ(t)].
ih̄
dt
Mit ihrer Hilfe kann die Zeitentwicklung eines gemischten Zustands auch dann
beschrieben werden, wenn der Hamiltonoperator explizit von der Zeit abhängt.
Anhang C
Literatur
C.1
Statistische Physik und Thermodynamik
T. Fließbach, Statistische Physik, BI Wissenschaftsverlag
F. Reif, Statistische Physik (Berkeley Physik Kurs, Band 5), Vieweg
F. Reif, Fundamentals of Statistical and Thermal Physics, McGraw-Hill
B. Diu, C. Guthmann, D. Lederer, B. Roulet, Grundlagen der statistischen Physik, Walter de Gruyter
W. Grimus, Skriptum zur Vorlesung Theoretische Physik T4: Statistische Physik
”
und Thermodynamik“ (Sommersemester 2007)
C.2
Mathematische Methoden
H. Neufeld, Skriptum zur Vorlesung Mathematische Methoden der Physik I“
”
(Sommersemester 2008)
F. Embacher, Mathematische Grundlagen für das Lehramtsstudium Physik,
Vieweg + Teubner
89
Herunterladen