Statistische Mechanik und Thermodynamik

Werbung
Statistische Mechanik und Thermodynamik
Vorlesung SS 2004
(für Studenten ab 6. Fachsemester)
Literatur
W. Brenig,
Statistische Theorie der Wärme
Band 1 Gleichgewicht,
Springer, Berlin 1996
H. Haug,
Statistische Physik,
Vieweg 1997
K. Huang
Statistische Mechanik I, II
Bibliographisches Institut, Mannheim 1964
L. Landau,
E. Lifshitz
Lehrbuch der Theoretischen Physik Band V,
Statistische Physik,
Akademie Verlag, Berlin 1983
F. Reif,
Statistische Physik und Theorie der Wärme,
de Gruyter, Berlin 1987
L.E. Reichl
A Modern Course in Statistical Physics,
Arnold Publ., Great Britain, 1980
F. Schwabl
Statistische Mechanik,
Springer, Berlin, 2000
Voraussetzung
Grundkenntnisse in Klassischer Mechanik und Quantenmechanik
Stand: 15.7.04
1
Inhaltsverzeichnis
1 Grundbegriffe der Statistik
1.1 Wahrscheinlichkeit . . . .
1.2 Zufallsvariable . . . . . . .
1.3 Binomialverteilung . . . .
1.4 Zentraler Grenzwertsatz .
1.5 Gesetz der großen Zahlen .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
7
9
13
15
2 Vielteilchensysteme
16
3 Zeitmittelwerte
16
4 Statistische Ensemble – klassisch
18
5 Liouville-Gleichung
19
6 Statistische Ensemble – quantenmechanisch
22
7 Von Neumann-Gleichung
24
8 Thermodynamisches Gleichgewicht
25
9 Maxwellsche Geschwindigkeitsverteilung
28
10 Volumen der Energieschale und
Zustandsdichte für ein ideales Gas
29
11 Entropie
32
12 Entropie des idealen Gases
34
13 Mischungsentropie
35
14 Temperatur
37
15 Energieschwankungen
39
16 Kanonisches Ensemble
40
17 Gleichverteilungssatz
43
18 Paramagnetismus
47
19 1-dimensionales Ising Modell
und Transfer-Matrix Methode
50
20 Arbeit äußerer Kräfte und Druck
54
21 van der Waals Gleichung
58
2
22 Hauptsätze der Thermodynamik
63
23 Thermodynamische Prozesse
23.1 Joulsches Experiment der freien Expansion
23.2 Joule-Thomson-Prozeß . . . . . . . . . . .
23.3 Adiabatische Entspannung von Gasen . . .
23.4 Adiabatische Entmagnetisierung . . . . . .
23.5 Thermodynamische Kreisprozesse . . . . .
eines
. . .
. . .
. . .
. . .
Gases
. . . .
. . . .
. . . .
. . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
66
66
68
69
70
71
24 Chemisches Potential und
Gibbssche freie Enthalpie
74
25 Gleichgewichtsbedingungen
als Extrema von thermodynamischen Potentialen
76
26 Gleichgewicht unter Energie- und Teilchenaustausch
77
27 Chemische Reaktionsgleichgewichte
und Massenwirkungsgesetz
78
28 Koexistenz von Phasen
28.1 Wieviele Phasen können koexistieren? . . . . . . . . . . . . . . . . . . . . . .
28.2 Koexistenzkurven. Clausius Clapeyronsche Gleichung . . . . . . . . . . . . .
80
80
83
29 Großkanonische Verteilung
85
30 Ideale Quantengase
87
31 Freies Elektronengas
91
32 Paulischer Paramagnetismus
des freien Elektronengases
95
33 Diamagnetismus des freien Elektronengases
97
34 Einige astrophysikalische Anwendungen der
Theorie des idealen Fermi-Gases
98
35 Thermische Strahlung: Photonengas
102
36 Phononengase
104
36.1 Einstein Näherung für optische Phononen: . . . . . . . . . . . . . . . . . . . 106
36.2 Debye Näherung für akustische Zweige: . . . . . . . . . . . . . . . . . . . . . 106
37 Massives Bose-Gas und
Bose-Einstein Kondensation
108
3
38 Molekularfeldtheorie kritischer Phänomene
38.1 Phasenübergänge 1. und 2. Ordnung . . . .
38.2 Molekularfeldtheorie . . . . . . . . . . . . .
38.3 Molekularfeldtheorie kritischer Phänomene .
38.4 Ginzburg-Kriterium . . . . . . . . . . . . . .
4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
116
116
117
120
121
1
Grundbegriffe der Statistik
In der statistischen Mechanik werden Vielteilchensysteme behandelt, deren Bewegungsgleichungen im allgemeinen nicht lösbar sind. Stattdessen können solche Systeme mit statistischen Methoden analysiert werden. Daher ist es erforderlich, daß wir uns zunächst mit
einigen Grundbegriffen der Statistik vertraut machen, was in diesem Paragraphen geschehen
soll.
1.1
Wahrscheinlichkeit
1. Intuitive Definition:
Betrachten wir ein beliebig oft wiederholbares Experiment, dessen Ergebnis in zufälliger
Weise variiert, wie z.B. Würfeln und Ablesen der Augenzahl des Würfels. Nennen wir
das Ergebnis einer jeden Wiederholung des Experiments ein Ereignis und sei A ein
mögliches Ereignis. Falls bei N Wiederholungen des Experiments NA mal das Ergebnis
A auftritt, und das Verhältnis NA /N für N → ∞ gegen einen Grenzwert konvergiert,
heißt
NA
P (A) = lim
N →∞ N
die Wahrscheinlichkeit des Ereignisses A. Falls P (A) = 0 bzw. P (A) = 1 kommt
A in der unendlichen Folge von Wiederholungen “fast nie” bzw. “fast immer” vor.
Ereignisse können sich gegenseitig entweder ausschließen oder auch nicht, was man
durch
Mengenkreise darstellen kann:
A B (Ereignisse A, B schließen sich gegenseitig aus) A ∩ B = A B
(Ereignisse
A, B schließen sich gegenseitig nicht aus) A ∩ B 6= Die Ereignisse faßt man daher nützlicherweise als Mengen auf. Seien z.B. A und B
zwei mögliche Ereignisse, die sich nicht aussschließen müssen. Z.B. könnten A bzw. B
bedeuten, daß beim Wurf mit zwei Würfeln mindestens eine 1 bzw., mindestens eine
2 gewürfelt wird. Dann ist A ∪ B das Ereignis “entweder A oder B” (im Beispiel also:
mit 2 Würfeln wird entweder mindestens eine 1 oder mindestens eine 2 gewürfelt), und
A∩B ist das Ereignis “sowohl A als auch B” (im Beispiel: es wird sowohl eine 1 als auch
eine 2 gewürfelt). Die Wahrscheinlichkeitstheorie wird nun mathematisch axiomatisch
begründet als die Theorie von (positiven) Maßen auf Mengen (A.N. Kolmogorov). Die
intuitive Definition ist dann eine Folgerung aus den Axiomen als das sog. Gesetz der
großen Zahlen.
2. Axiomatische Definition:
(a) Jedem zufälligen Ereignis A ist eine reelle Zahl P (A) mit 0 ≤ P (A) ≤ 1 zugeordnet, welche Wahrscheinlichkeit von A heißt.
(b) Die Wahrscheinlichkeit des sicheren Ereignisses E ist 1: P (E) = 1
(c) Additionsaxiom: Sind A1 , A2 , A3 , . . . zufällige Ereignisse, die paarweise unvereinbar sind, d.h. für alle i, j mit i 6= j gilt Ai ∩ Aj = φ wo φ die Nullmenge ist, so
gilt
X
P (∪i Ai ) =
P (Ai ) .
i
5
Es folgt hieraus wegen E = E ∪ φ und E ∩ φ = φ, daß 1 = P (E) = P (E ∪ φ) =
P (E) + P (φ) = 1 + P (φ), woraus folgt P (φ) = 0. Außerdem, wenn Ā das Ereignis
“nicht A” ist, A ∪ Ā = E, A ∩ Ā = φ, so folgt P (A ∪ Ā) = P (Ā) + P (A) = 1 →
P (Ā) = 1 − P (A).
Die Wahrscheinlichkeit für ein Ereignis kann davon abhängen, ob ein anderes Ereignis
eingetreten ist oder nicht. Man beschreibt dies durch die bedingte Wahrscheinlichkeit
P (A|B) für Ereignis A, vorausgesetzt daß Ereignis B eingetreten ist. Sie ist definiert
durch
P (A ∩ B)
P (B)
P (A ∩ B)
P (B|A) =
P (A)
P (A|B) =
(falls P (B) 6= 0)
(falls P (A) 6= 0) .
Hieraus ergibt sich die Multiplikationsregel der Wahrscheinichkeitsrechnung
P (A ∩ B) = P (B)P (A|B) = P (A)P (B|A) ,
d.h. die Wahrscheinlichkeit dafür, daß bei 2 Ereignissen sowohl das eine als auch das
andere eintreten, ist gleich dem Produkt der Wahrscheinlichkeit eines der Ereignisse
mit der Wahrscheinlichkeit des anderen, bedingt daß das erstere eingetreten ist. Für
Ereignisse A, B, die sich gegenseitig ausschließen, A∩B = φ, gilt P (A∩B) = P (φ) = 0
und somit auch P (A|B) = 0. Zwei Ereignisse A, B heißen statistisch unabhängig
voneinander, wenn
P (A|B) = P (A) .
Dann gilt speziell
P (A ∩ B) = P (A)P (B) ,
d.h. für statistisch unabhängige Ereignisse multiplizieren sich die Wahrscheinlichkeiten.
Zwei Sätze lassen sich leicht beweisen: Es seien Ai , i = 1, 2, . . . n paarweise unvereinbare
Ereignisse, Ai ∩ Aj = 0 falls i 6= j, von denen eines mit Sicherheit eintritt, ∪iAi = E.
Für ein beliebiges zufälliges Ereignis B, dessen Eintreten davon abhängen kann, welches
der Ereignisse Ai vorher eingetreten ist, gilt dann B = B ∩ (∪i Ai ) = ∪i (B ∩ Ai ) und
daher mit der Additionsregel für Wahrscheinlichkeiten, die wegen (B ∩ Ai ) ∩ (B ∩ Aj ) =
B ∩ (Ai ∩ Aj ) = B ∩ φ = 0 anwendbar ist,
(a) P (B) = P (∪i (B ∩ Ai )) =
X
i
P (B ∩ Ai ) =
X
P (Ai )P (B|Ai )
i
(Satz von der totalen Wahrscheinlichkeit) .
Weiter gilt wegen
P (Ai ∩ B) = P (Ai |B)P (B) = P (B|Ai )P (Ai )
unter Benutzung des Satzes (a) für P (B)
P (Ai )P (B|Ai )
(Formel von Bayes) .
(b) P (Ai |B) = P
i P (Ai )P (B|Ai )
6
Die Bayessche Formel zeigt, wie sich die a priori Wahrscheinlichkeit P (Ai ) für ein
Ereignis Ai nachträglich ( a posteriori) verändert, wenn ein weiteres Ereignis B, das
von Ai nicht unabhängig ist, eintritt.
Betrachten wir hierzu ein zugegeben etwas extremes Beispiel:
Die Analyse der Struktur des Universums zeigt bis in verblüffende feine Einzelheiten
hinein, daß unser Universum so aufgebaut und feinabgestimmt ist, daß intelligentes
Leben möglich ist. Sollten wir uns hierüber wundern? Offenbar ja, denn die Wahrscheinlichkeit, daß dies zufällig möglich ist, erscheint verschwindend klein! Allerdings:
statistisch gesehen nein! Denn sei P (A1 ) die unbekannte aber mit Sicherheit winzig
kleine a priori Wahrscheinlichkeit, daß das Universum gerade so beschaffen ist, daß
intelligentes Leben im Universum möglich ist; sei A2 = Ā1 das zu A1 komplementäre
Ereignis, daß kein intelligentes Leben im Universum möglich ist; sei weiter B das Ereignis, daß (unsere) die menschliche, intelligente Lebensform im Universum auftritt.
Dann tritt nach Satz (a), da sich A1 und A2 gegenseitig ausschließen, doch eines der
beiden Ereignisse mit Sicherheit ein,
P (B) = P (A1 )P (B|A1 ) + P (A2 )P (B|A2 ) .
Es ist aber P (B|A2 ) = P (B|Ā1 ) = 0, da B sicher nicht auftritt, falls A1 , die Möglichkeit
für intelligentes Leben im Universum, nicht vorher eingetreten ist. Unsere Beobachtung
von A1 setzt andererseits ein Bewußtsein und intelligente Meßverfahren, also das Ereignis B, voraus. Wir beobachten also nicht etwa P (A1 ), sondern P (A1 |B) und erhalten
nach Bayes
P (A1 )P (B|A1 )
P (A1 |B) =
= 1.
P (A1 )P (B|A1 ) + P (A2 )P (B|A2 )
Unsere Beobachtung von A1 , unter der Vorraussetzung daß B nachträglich eingetreten
ist, war also mit Sicherheit zu erwarten, gleichgültig wie winzig klein P (A1 ) auch sein
mag. Das Beispiel ist extrem und daher auch trivial, da P (B|A2 ) = 0 war, so daß
P (A1 |B) = 1 resultierte. Doch würde sich P (A1 |B) auch dann noch drastisch von
P (A1 ) unterscheiden, wenn P (B|A2 ) ungleich 0, doch klein gegen P (A1 ) wäre.
1.2
Zufallsvariable
Dies sind Größen, die in einem beliebig oft in statistisch unabhängiger Weise wiederholbaren
Experiment zufällige Werte aus einem diskreten oder kontinuierlichen Wertevorrat annehmen
können. Die verschiedenen Werte schließen sich gegenseitig aus. Mit Sicherheit wird einer
der Werte angenommen.
Sei X die Zufallsvariable und, bei diskretem Wertevorrat {x1 , x2 , . . .}
X
fX (xi ) ≥ 0 mit
fX (xi ) = 1 ,
i
die Wahrscheinlichkeit daß X den Wert xi annimmt. Das n-te Moment von X ist der Mittelwert
X
xni fX (xi ) .
hX n i =
i
7
Die Varianz oder mittlere quadratische Schwankung von X ist definiert als
2
σX
= h(X − hXi)2 i = hX 2 i − 2hXihXi + hXi2 = hX 2 i − hXi2 .
q
Die Wurzel daraus, σX = hX 2 i − hXi2 , ist die “Standardabweichung“. Bei kontinuierlichem
R
Wertevorrat {x} von X heißt fX (x) ≥ 0 mit dxfX (x) = 1 die Wahrscheinlichkeitsdichte
von X und es ist
Z
n
hX i = dxxn fX (x) .
Es ist wichtig, die Zufallsvariable X und ihren Wertevorrat {x} begrifflich auseinanderzuhalten. Die Fouriertransformierte von fX (x) heißt charakteristische Funktion
φX (k) = heikX i =
=
∞
X
Z
dxeikx fX (x)
(ik)n n
hX i ,
n=0 n!
durch Entwicklung der Exponentialfunktion in eine Potenzreihe.
Aus φX (k) erhält man die Momente durch Differentiation:
φX (0) = 1
n
hX i = i
−n
dn
φ
(k)
.
X
n
dk
k=0
Entwickelt man den Logarithmus der charakteristischen Funktion nach k, so erhält man die
sog. Kumulanten Cn (X) von X
∞
X
(ik)n
Cn (X)
n=0 n!
ln φX (k) =
mit
Cn (X) = i−n
Speziell erhält man
dn
ln
φ(k)
.
n
dk
k=0
C0 (X) = 0
C1 (X) = hXi
2
C2 (X) = hX 2 i − hXi2 = hX 2 i − C12 (X) = σX
C3 (X) = hX 3 i − 3hX 2 ihXi + 2hXi3 = hX 3 i − 3C2 (X)C1 (X) − C13 (X)
etc. .
Mit X sind natürlich auch alle Funktionen von X, sagen wir Y = H(X), Zufallsvariable.
fY (y|x)dy = δ(y − H(x))dy
ist die bedingte Wahrscheinlichkeit für Y im Intervall dy bei y, falls X den Wert x annimmt.
Dann ist (nach dem Satz von der totalen Wahrscheinlichkeit)
fY (y) =
Z
dxfY (y|x)fX (x)
= hδ(y − H(X))i
8
die Wahrscheinlichkeitsdichte von Y . Diese läßt sich durch Integration über die δ-Funktion
auswerten zu
X fx (xi (y))
fY (y) =
0
i |H (xi (y)|)
wobei mit xi (y) die Lösungen der Gleichung y = H(x) bezeichnet seien.
Hat man mehrere (n) Zufallsvariable so kann man ihren simultanen Werten gemeinsame
Wahrscheinlichkeiten oder, bei kontinuierlichem Wertevorrat, gemeinsame Wahrscheinlichkeitsdichten
Z
f (x1 , x2 , . . . , xn ) ≥ 0 mit dn xf (x1 , . . . , xn ) = 1
zuordnen. Die Momente und Varianzen der Xi sind wie bisher definiert, aber mit Integralen
über dn x. Die Kovarianz von Xi und Xj ist definiert als
cov (Xi , Xj ) =
Z
dn x(xi − hXi i)(xj − hXj i)f (x1 , . . . , xn )
= hXi Xj i − hXi ihXj i .
Die Korrelation von Xi und Xj ist definiert als
cor (Xi , Xj ) =
cov (Xi , Xj )
,
σX i σX j
mit cor (Xi , Xj ) = cor (Xj , Xi ); |cor (Xi , Xj )| ≤ 1. Für zwei unabhängige Zufallsvariable X,
Y gilt
f (x, y) = fX (x)fY (y)
hXY i = hXihY i
2
2
σX+Y
= σX
+ σY2
cov (X, Y ) = 0 = cor (X, Y ) .
Aus der gemeinsamen Wahrscheinlichkeitsdichte für x1 , x2 , ...xn folgt die für x1 , x2 , ...xn−1
durch Integration über xn etc., und schließlich die jeder einzelnen Zufallsvariablen durch
Integration über alle andern, z.B.
fX1 (x1 ) =
Z
dx2 . . . dxn f (x1 , x2 , . . . , xn ) .
Durch Fouriertransformation bezüglich aller Zufallsvariablen erhält man die mehrdimensionalen charakteristischen Funktionen etc.
1.3
Binomialverteilung
Ein häufiger Fall ist, daß eine Zufallsvariable nur 2 Werte annehmen kann, z.B. 0 oder 1, -1
oder 1, ↑ oder ↓. Natürlich sind diese drei Beispiele abgesehen von Bezeichnungen äquivalent.
Nehmen wir den Fall X mit x1 = 1, x2 = −1 und fX (1) = p, fX (−1) = q = 1 − p.
Die Wahrscheinlichkeit, daß bei N -maliger Messung der Wert x1 n1 mal und der Wert x2
(N − n1 ) mal in einer ganz bestimmten Reihenfolge auftritt, ist nach der Multiplikationsregel
für unabhängige Ereignisse
pn1 q N −n1
9
unabhängig von der Reihenfolge. Bei N Messungen gibt es N !/(n1 !(N − n1 )!) verschiedene
Reihenfolgen von n1 Ereignissen +1 und n2 = N − n1 Ereignissen -1. Diese zählt man
ab, indem man zunächst alle Permutationen der N Ereignisse bildet, deren Anzahl ist N !,
und dann berücksichtigt, daß die Permutationen der n1 Ereignisse +1 untereinander und
der n2 = N − n1 Ereignisse -1 untereinander keine neuen Reihenfolgen liefern, so daß das
Ergebnis mit dem Produkt von deren Anzahl, n1 !n2 !, zu dividieren ist.
Verschiedene Reihenfolgen schließen sich gegenseitig aus und haben die gleiche Wahrscheinlichkeit pn1 q n2 . Nach der Additionsregel für Wahrscheinlichkeiten erhalten wir also für
die Wahrscheinlichkeit von n1 Ereignissen +1 und n2 Ereignissen -1 unabhängig von der
Reihenfolge die Binomialverteilung
PN (n1 ) =
N!
pn1 q N −n1 .
n1 !(N − n1 )!
Wir bezeichnen die Funktion auf der rechten Seite im folgenden auch als PN (n1 ; p, q) und
fassen sie dann nicht nur als Funktion von n1 sondern auch der dann als unabhängig angesehenen Variablen p und q auf. Als Funktion von n1 und für p + q = 1 ist PN (n1 ) richtig auf
1 normiert.
N
X
PN (n1 ) = (p + q)N = 1
n1 =0
nach dem für die N -te Potenz verallgemeinerten binomischen Lehrsatz. Die ersten beiden
Momente sind
N
X
N
X
∂
∂
= Np
hn1 i =
n1 PN (n1 ) =
p Pn (n1 ; p, q) = p
(p + q)N ∂p
∂p
n1 =0
n1 =0
q=1−p
hn21 i
=
N
X
n21 PN (n1 )
=
n1 =0
N
X
n1 =0
∂
p
∂p
!2

∂
PN (n1 ; p, q) = p
∂p
besitzt, was die Varianz
!2
N (p + q) q=1−p
= (N p)2 + N (p − p2 )
σ 2 = hn21 i − hn1 i2 = N p(1 − p)
ergibt und die relative Standardabweichung
σ
1
=√
hn1 i
N
s
1−p
→ 0 für N → ∞ .
p
In der folgenden Figur sind die Binomialverteilungen für N = 10 und p = 1/2 sowie p = 1/10
dargestellt.
10
P(n)
0.3
0.2
0.1
0
0
2
4
6
8
10
n
Binomial-Verteilungen für N = 10 und p = 1/2 sowie p = 1/10
Für größer werdende N ist die Binomialverteilung zunehmend schärfer um ihren Mittelwert
hn1 i = N p verteilt, d.h. der tatsächliche Wert von n1 /N in einer Folge von N Messungen
liegt für größer werdende N immer dichter beim Mittelwert p = hn1 i/N und stimmt im
Limes N → ∞ mit Wahrscheinlichkeit 1 mit diesem überein. Dies ist ein Beispiel für das
“Gesetz der großen Zahlen“, p = limN →∞ n1 /N ist tatsächlich die Wahrscheinlichkeit für das
Ereignis +1.
Grenzfälle der Binomialverteilung sind die Gaußverteilung (im Limes N groß, pN groß)
und die Poissonverteilung (im Limes N groß, pN fest). In beiden Fällen benutzen wir die
Stirlingsche Formel: für n > 10
n
√
n
.
n! ≈ 2πn
e
Für N groß, N p groß können wir diese Näherung für N !, n1 ! und (N − n1 )! benutzen und
erhalten
"
#1/2
n1 N
p
1 − p N −n1
PN (n1 ) '
NN
.
2πn1 (N − n1 )
n1
N − n1
Das Maximum von PN (n1 ) finden wir aus
∂ ln PN (n1 )
=0
∂n1
bei
n1 max = pN = hn1 i .
Außerdem finden wir nach weiterer Rechnung
∂ 2 ln PN (n1 ) 1
1
=
−
=
−
2
∂n1
p(1 − p)N
σ2
n1 =n1 max
die Taylor Reihe
1 − 2p
∂ 3 ln PN (n1 ) = 2 2
3
∂n1
N p (1 − p)2
n1 =n1 max
ln PN (n1 ) = ln PN (pN ) −
1
1 − 2p
1 (n1 − pN )2
+
(n1 − pN )3 + ...
2 N p(1 − p)
3! N 2 p2 (1 − p)2
11
Für N →q∞ ist der Korrekturterm (und die höheren Terme) vernachlässigbar, falls |n1 −
pN | = O( N p(1 − p)) (was aus der Abschätzung durch die Varianz folgt) (N p(1−p)/|1−
2p|)2/3 (was aus dem Korrekturterm 3. Ordnung folgt) und wir erhalten die Gaußverteilung
"
#
(n1 − pN )2
exp −
.
PN (n1 ) = q
2N p(1 − p)
2πN p(1 − p)
1
Sie ist durch Mittelwert und Varianz vollständig festgelegt. Alle Kumulanten 3. und höherer
Ordnung verschwinden für die Gaußverteilung.
Für N groß, N p = hn1 i fest (also p ∼ N −1 sehr klein) verwenden wir zur Vereinfachung
der Binomialverteilung Stirlings Formel nicht für n1 ! (da n1 nicht mehr groß sein muß),
sondern nur für
N N e−n1
N!
'
N −n1 + 1
(N − n1 )!
2
N N −n1 1 − nN1
was sich für n1 /N 1 mit (1 − n1 /N )N −n1 +1/2 ' (1 −
läßt durch N n1 . Also ergibt sich
PN (n1 ) '
n N
)
N
' e−n1 weiter approximieren
(pN )n1 −pN
e
,
n1 !
die Poissonverteilung. Sie ergibt sich also aus der Binomialverteilung für große N , falls die
Wahrscheinlichkeit p für eines der beiden alternativen Ereignisse sehr klein wird. Sie ist schon
durch ihren Mittelwert völlig festgelegt. Die Varianz und der Mittelwert sind durch
hn21 i − hn1 i2 = hn1 i
verknüpft. Die Poissonverteilungen mit hn1 i = 5 und hn1 i = 1 sind in der folgenden Figur
wiedergegeben.
0.35
P(n)
0.3
0.25
0.2
0.15
0.1
0.05
0
0
2
4
6
8
n
10
Poisson-Verteilung für < n >= 1 und < p >= 5
12
Betrachten wir als Anwendung die Teilchenzahlfluktuationen in einem kleinen Volumenelement ∆V eines Gases mit Teilchenzahldichte n = N/V . Ein Gasatom ist entweder in ∆V
(mit Wahrscheinlichkeit p 1, falls ∆V V ) oder nicht, also ein Fall für die Poissonverteilung. Genauer: die Wahrscheinlichkeit für ein Gasatom in ∆V zu sein ist p = ∆V /V 1.
Dann ist
(pN )N1 −pN
e
PN (N1 ) =
N1 !
die Wahrscheinlichkeit N1 Atome in ∆V zu finden. Der Mittelwert ist natürlich
hN1 i = pN = ∆V · N/V .
Die quadratische Schwankung hat für die Poissonverteilung denselben Wert wie der Mittelwert
N
hN12 i − hN1 i2 = ∆V ·
= hN1 i .
V
Dies ergibt für die relative Schwankung
q
hN12 i − hN1 i2
hN1 i
=q
1
∆V N/V
=q
1
hN1 i
.
Später werden wir sehen, daß dies Resultat charakteristisch ist für die relativen Schwankungen aller makroskopischen (“thermodynamischen”) Größen in einem System: sie skalieren
immer proportional zu 1 durch Wurzel aus der Teilchenzahl.
1.4
Zentraler Grenzwertsatz
Dieser Satz lautet: Eine Zufallsvariable Y , die sich additiv aus N unabhängigen Zufallsvariablen Xi über
N
1 X
Y =
Xi
N i=1
zusammensetzt, deren Wahrscheinlichkeitsverteilungen endliche Momente hXin i besitzen, ist
im Grenzfall N → ∞ Gauß-verteilt (auch “normal verteilt” genannt) mit Mittelwert
hY i =
N
1 X
hXi i ≡ hXi i
N i=1
und mittlerer quadratischer Schwankung
σY2 =
1 X 2
1 2
σX i ≡ σX
,
2
N i
N i
2
wobei hXi i und σX
die über alle Xi gemittelten Mittelwerte sind. (Also nochmal aufgei
passt: Im allgemeinen Fall haben wir es hier mit zwei verschiedenen Mittelungsprozessen zu
tun: Der erste ist die jetzt schon vertraute Mittelung für jede einzelne der N verschiedenen
2
Zufallsvariablen, was Mittelwerte wie hXin i und σX
ergibt. Der zweite ist eine nochmalige
i
Mittelung dieser Mittelwerte über die N verschiedenen Variablen. Für diese Mittelung verwenden wir den Querstrich über der gemittelten Größe als Symbol. In dem speziellen (aber
13
häufig vorkommenden) Fall, daß alle N -Zufallsvariable die gleichen Mittelwerte haben, kann
die zweite Mittelung natürlich entfallen, da sie nichts neues ergibt.) Insbesondere geht das
Verhältnis von Standardabweichung von Y zum Mittelwert von Y , falls letzterer von Null
verschieden ist, proportional zu N −1/2 gegen 0. Der Beweis ist einfach:
1 X
fY (y) = hδ(Y −
Xi )i
N i
ist die Verteilung von Y . Die zugehörige charakteristische Funktion ist
φY (k) =
Z
k
eiky fY (y)dy = hei N
P
i
Xi
i=
N
Y
i=1
k
hei N Xi i =
N
Y
φXi (k/N ) ,
i=1
wobei wir im 3. Schritt die statistische Unabhängigkeit der Xi benutzen. Durch TaylorEntwicklung von
2
hXi i 1 k 2 σX
i
ln (φXi (k/N )) = ik
−
+ iO((k/N )3 ) ,
N
2 N2
wobei wir voraussetzen, daß sämtliche Kumulanten der Xi existieren, erhalten wir
(
1 k2 X 2
ik X
hX1 i −
φY (k) = exp
σ + iN · O((k/N )3 )
N i
2 N 2 i Xi
)
.
Für N → ∞, |k| ≤ O(N 2/3 ) ist der dritte Term im Exponenten gegen den zweiten vernachlässigbar klein (obwohl auch der zweite Term gegen 0 strebt für N → ∞), und das
vorstehende Resultat strebt asymptotisch für große N gegen
1 2 2
σY
φY (k) = eikhY i− 2 k
mit den behaupteten Ausdrücken für hY i und σY2 . Die Fouriertransformation
Z
dk −iky
PY (y) =
e
φY (k) ,
2π
zu der nur k-Werte der Größenordnung
k = O(
1
O(N 1/2 )
)= q
≤ O(N 2/3 )
2
σY
σ Xi
wesentlich beitragen, liefert die behauptete Gaußverteilung für Y
!
1
(y − hY i)2
PY (y) = √
.
exp −
2σY2
2πσY
Der zentrale Grenzwertsatz erklärt das häufige Auftreten von Gaußverteilungen in der Natur
und in vielen statistischen Problemen.
Eine einfache Anwendung ist die im vorigen Abschnitt etwas mühsam abgeleitete Gaußsche Näherung für die Binomialverteilung PN (n1 ). Denn n1 ist der Wert der Zufallsvariablen
Y =
N
X
1
(1 + Xi ) ,
i=1 2
wobei die Xi mit den Werten +1 (mit Wahrscheinlichkeit p) und -1 (mit Wahrscheinlichkeit
q = 1−p) N unabhängige Zufallsvariable sind. Nach dem zentralen Grenzwertsatz ist also Y ,
und damit n1 , für N → ∞ Gauß-verteilt mit hY i = (1/2)N (1+hXi i) = (1/2)N (1+p−1+p) =
2
2
N p und σY2 = (N/4)σX
, wobei σX
= hX 2 i − hXi2 = 1 − (2p − 1)2 = 4p(1 − p), was unser
i
früheres Ergebnis reproduziert.
14
1.5
Gesetz der großen Zahlen
Das Gesetz der großen Zahlen besagt folgendes: Hat ein Ereignis A, die Wahrscheinlichkeit
P (A) dann geht bei N unabhängigen Versuchen der Bruchteil NA /N , bei denen das Ereignis
A eintritt im Limes N → ∞ gegen P (A),
NA
= P (A) .
N →∞ N
lim
Genau diese Eigenschaft liegt der anfangs gegebenen intuitiven Definition der Wahrscheinlichkeit zugrunde. Sie ermöglicht uns die praktische Schätzung von Wahrscheinlichkeiten
durch hinreichend viele Stichproben. Sie läßt sich als Satz aus den Axiomen der Wahrscheinlichkeitsrechnung ableiten. Beginnen wir mit der Anwendung des zentralen Grenzwertsatzes
auf dies Problem. Führen wir dazu für jeden der N statistisch unabhängigen Versuche eine
Zufallsvariable Xi , i = 1, 2, . . . , N ein mit Xi = 1, falls im i-ten Versuch A eintritt, also
mit Wahrscheinlichkeit P (A), und Xi = 0 falls Ā, d.h. “nicht A” eintritt, also mit Wahrscheinlichkeit 1 − P (A). Der Mittelwert von X ist hXi = P (A), die mittlere quadratische
Schwankung σx2i = hXi2 i − hXi i2 = P (A)(1 − P (A)). Dann ist
N
NA
1 X
=
Xi
N
N i=1
und nach dem zentralen Grenzwertsatz ist NA /N Gauß-verteilt um den Mittelwert hNA i/N =
N · P (A)/N = P (A) mit der q
Standardabweichung
√
−2
2 1/2
σ(N ) = (N · N · σXi ) = P (A)(1 − P (A))/ N .
Eine wichtige Ungleichung der Statistik, die Tchebycheff-Ungleichung, besagt, daß für eine
Zufallsvariable X die Wahrscheinlichkeit P (|x − hXi| ≥ ε), daß X von seinem Mittelwert
um mindestens ε abweicht, nach oben abgeschätzt werden kann durch das Verhältnis der
Varianz zu ε2 :
σ2
P (|x − hXi| ≥ ε) ≤ X2i
Tchebycheff-Ungleichung
ε
Der Beweis der Tchebycheff-Ungleichung gelingt mit folgenden einfachen Abschätzungen
2
σX
=
Z
≥
≥ε
+∞
dx(x − hXi)2 fX (x)
−∞
Z hXi−ε
−∞
2
Z
+
hXi−ε
−∞
Z
∞
hXi+ε
+
Z
!
(x − hXi)2 fX (x)dx
∞
hXi+ε
!
fX (x)dx
= ε2 P (|x − hXi| ≥ ε) ,
woraus sich nach Division mit ε2 die Ungleichung ergibt. Auf unseren Fall angewandt besagt
die Tchebycheff-Ungleichung, daß
0≤P |
NA
P (A)(1 − P (A))
− P (A)| ≥ ε ≤
→0
N
ε2 N
für N → ∞ ,
d.h. die Verteilung von NNA zieht sich für N → ∞ beliebig scharf um den Mittelwert P (A)
zusammen, womit das Gesetz der großen Zahlen bewiesen ist.
15
2
Vielteilchensysteme
Ziel der statistischen Mechanik ist, wie schon erwähnt, die Beschreibung von Vielteilchensystemen, sowohl klassisch als auch quantenmechanisch. Beispiele solcher Vielteilchensysteme
sind Gase, z.B. reine Gase aus Molekülen, z.B. Sauerstoff O2 oder Atomen, z.B. Helium He,
oder Gasgemische, z.B. Luft – ein Gemisch aus Stickstoff N2 , Sauerstoff O2 und Kohlendioxyd
CO2 und einiger weiterer Restgase, oder Flüssigkeiten, z.B. Wasser H2 O, oder Festkörper,
z.B. Eis H2 O, oder Elektronen in Metallen oder Halbleitern, oder magnetische Substanzen,
deren mikroskopische Bausteine magnetische Momente tragen, die mit den Drehimpulsen
der Atomhülle und der Atomkerne verbunden sind. In solchen Vielteilchensystemen ist die
Zahl der Teilchen typischerweise sehr groß. Eine Größenordnung gibt die Loschmidtsche Zahl
L = 6, 02 × 1023 , welche bekanntlich die Zahl der Moleküle in ein Mol einer Substanz angibt
(also z.B. in 2g H2 oder 32g O2 oder 18g H2 O). Oft ist es kein schwieriges Problem, die
Bewegungsgleichungen wenigstens anzugeben, wenngleich uns deren Lösung im allgemeinen
nicht möglich ist.
Klassisch müssen wir dazu die Hamilton-Funktion H(q, p) in geeigneten generalisierten
Koordinaten und Impulsen aufstellen, indem wir die gesamte kinetische Energie T (q, p) und
potentielle Energie U (q, p) der Wechselwirkung mit äußeren Feldern (z.B. Schwerkraft, elektrische und magnetische Felder, Wände eines einschließenden Behälters) und der inneren
Wechselwirkung zur Gesamtenergie E = H(q, p) = T (q, p) + U (q, p) aufaddieren und die
Hamiltonschen Gleichungen aufstellen
q̇i =
∂H(q, p)
∂pi
i = 1, 2, . . . , f
ṗi = −
(2.1)
∂H(q, p)
.
∂qi
Zur Lösung brauchen wir die Kenntnis von q1 (0), . . . , pf (0), die wir uns praktisch, z.B. durch
Messung, nicht verschaffen können.
Quantenmechanisch wird H(q, p) zum Hamiltonoperator durch die Quantisierungsregel
(wenn speziell die qi kartesische Koordinaten sind, was wir für diesen Zweck der Einfachheit
halber voraussetzen)
h̄ ∂
pi =
i ∂qi
und statt (2.1) haben wir die Vielteilchen-Schrödingergleichung
!
h̄ ∂
ih̄ψ̇(q1 , q2 , . . . , qf , t) = H q,
ψ(q1 , q2 , . . . , qf , t)
i ∂q
zu lösen. Zur Lösung brauchen wir hier die Kenntnis von ψ(q1 , q2 , . . . , qf , 0), die auch wiederum unmöglich zu beschaffen ist.
3
Zeitmittelwerte
Wenn f sehr groß wird, z.B. f ' 1023 , ist es impraktikabel, klassisch und quantenmechanisch, die erforderlichen Anfangsbedingungen zu bestimmen, etwa durch Messung aller q’s
16
und p’s, oder durch Messung des quantenmechanischen Zustands des Vielteilchensystems,
etwa durch Messung eines vollständigen Satzes von kommutierenden Observablen (z.B. alle
Orte und Spins). Ebenso impraktikabel ist die daran anschließende Lösung des Vielteilchenproblems. Schließlich, selbst wenn diese beiden Schritte doch bewältigt werden könnten,
wäre die Lösung am Ende praktisch wertlos, da sie Auskunft über die {qi (t), pi (t)} oder über
ψ(q1 , . . . , qf , t) geben würde, die für sehr viele Teilchen im einzelnen nicht meßbar sind!
Wir müssen also einen Weg finden, wie wir die begrenzte Information über unser Vielteilchensystem, welche der Messung zugänglich ist, direkt aus H(q, p) (und eventuell weiteren
Konstanten der Bewegung) extrahieren können, ohne die Bewegungsgleichungen im einzelnen
zu lösen. Doch welche Größen kann man in Vielteilchensystemen messen?
Meßbare Größen in der klassischen Physik sind allgemein Phasenraumfunktionen
A(q1 , . . . , qf , p1 , . . . , pf ) = A(q, p). Diese werden zeitabhängig A(q(t), p(t)), da sich die qi (t),
pi (t) gemäß der Hamiltonschen Gleichungen zeitlich ändern. Eine Messung von A(q(t), p(t))
in einem Vielteilchensystem kann jedoch im allgemeinen den sehr raschen zeitlichen Änderungen von A(q(t), p(t)) nicht folgen. Im Experiment wird daher nur ein zeitlicher Mittelwert
von A(q(t), p(t)) gemessen
A(t)
∆T
=
1
∆T
Z
t
t−∆T
A(q(t), p(t))dτ .
Die Größe von ∆T wird dabei zunächst natürlich vom Meßverfahren abhängen. Je größer
∆T ist, desto weniger zeitliche Details der Funktion A(q(t), p(t)) kann die Messung auflösen.
In jedem thermodynamischen System (mit der wichtigen Ausnahme von Gläsern) gibt es
eine sytemabhängige Zeitskala τrelax , so daß für ∆T τrelax die gemessenen Zeitmittelwerte
sogar ganz unabhängig von der Zeit werden. Wir sprechen dann von (automatisch zeitunabhängigen) Gleichgewichtsmittelwerten. Für ∆T < τrelax kann dagegen die Messung noch
die zeitabhängige Relaxation des Zeitmittelwerts auf seinen Gleichgewichtswert auflösen,
wenn auch t < τrelax gilt (wobei der Zeitpunkt t = 0 ausgezeichnet ist als Zeitpunkt, zu dem
ein Anfangszustand vorgegeben sei). Ist dagegen zwar ∆T < τrelax , aber t τrelax , so hat
zwar einerseits der gemessene Mittelwert genügend Zeit t, auf seinen zeitunabhängigen Wert
zu relaxieren, doch ist andererseits die zeitabhängige Messung mit ∆T < τrelax in der Lage,
die Fluktuationen von A(q(t), p(t)) um seinen Gleichgewichtsmittelwert herum, die ebenfalls
auf der charakteristischen Zeitskala τrelax erfolgen, bis zu einem gewissen Grad (nämlich bis
zur Zeitskala ∆T ) aufzuloesen. Es zeigt sich, daß es in vielen thermodynamischen Systemen
(Ausnahmen existieren) für die Wahl von ∆T ein Zeitskalenfenster τstoß ∆T τrelax gibt,
in dem die Zeitmittelwerte sogar praktisch unabhängig von der Wahl von ∆T werden. Ginge
man aber mit ∆T sogar noch unter die untere Grenze dieses Intervalls (was in der Praxis
schwer möglich ist), so würde die Messung die komplizierte mikroskopische Stoßdynamik
der mikroskopischen Konstituenten des Systems zeitlich aufloesen können. (Zuweilen gelingt
dies mit der (in der Arbeitsgruppe von der Linde perfektionierten) Technik ein System bei
t = 0 mit einem ultrakurzen Laserimpuls (Dauer∼ ∆T von der Größenordnung 10−13 s = 1fs)
anzuregen und seinen Zustand kurz danach (zur Zeit t) mit einem ebenso kurzen Laserimpuls wieder abzufragen.) Man nennt τstoß die charakteristische Stoßzeit des Systems, und wir
werden im folgenden immer annehmen, daß ∆T >> τstoß .
Bei quantenmechanischer Beschreibung interessiert man sich für Erwartungswerte von
Operatoren A(q, h̄i ∂/∂q), (wir schreiben q und meinen alle Koordinaten, die Integration über
17
alle q soll die Summation über die Spineinstellungen mit symbolisieren)
Z
dq1 . . .
Z
!
h̄ ∂
ψ(q, t) = hψ(t)|A|ψ(t)i .
dqf ψ (q, t)A q,
i ∂q
∗
Wiederum ist es im allgmeinen unmöglich, die Zeitabhängigkeit von hψ(t)|A|ψ|(t)i im einzelnen aufzulösen und nur Zeitmittelwerte
∆T
hψ(t)|A|ψ(t)i
1
=
∆T
Z
t
t−∆T
hψ(τ )|A|ψ(τ )idτ
sind von Interesse. Wie berechnet man solche Mittelwerte klassisch oder quantenmechanisch?
4
Statistische Ensemble – klassisch
Die Grundidee (L. Boltzmann, J.W. Gibbs) ist die Ersetzung des Mittelwerts eines Systems
über ein Zeitintervall ∆T von τ , t − ∆T ≤ τ ≤ t
A(t)
∆T
1
=
∆T
Z
t
t−∆T
A(q(τ ), p(τ ))dτ
(4.1)
durch den Mittelwert über (unendlich) viele Systeme zu einem Zeitwert:
A(t)
∆T
→ hA(t)i =
Z
df qdf p%(q, p, t)A(q, p) .
(4.2)
Man nennt die vielen Systeme, die hier zu Berechnung des Mittelwerts hilfsweise eingeführt
werden, ein Ensemble von Systemen, welches das tatsächlich vorliegende eine physikalische
System repräsentiert. %(q, p, t) ist eine Wahrscheinlichkeitsdichte im Phasenraum (oder ΓRaum), d.h. eine positive Funktion der qi , pi , wobei %(q, p, t)df qdf p die Wahrscheinlichkeit
(d.h. die relative Häufigkeit) ist, mit der ein System mit (q, p)-Werten im Volumenelement
dVΓ = df qdf p bei q, p im Ensemble vorkommt. (Die entsprechende quantenmechanische
Größe betrachten wir weiter unten.) Wegen h1i = 1 ist %(q, p, t) normiert. %(q, p, t) heißt
∆T
(Gibbssche) Phasenraumdichte. Gibt es ein %(q, p, t), so daß A(t) = hA(t)i?
Formal läßt sich unschwer ein solches %(q, p, t) angeben als
1 Zt
%∆T (q, p, t) =
dτ δ (2f ) (q − q(τ ), p − p(τ )) .
∆T t−∆T
(4.3)
Wir konstruieren das Ensemble also, indem wir die Trajektorie des Systems im Phasenraum
für t − ∆T ≤ τ ≤ t gleichförmig mit konstanter Dichte belegen. Indem wir diesen Ausdruck
in die Formel für hA(t)i einsetzen, die Integrationen über df qdf p mit der Zeitintegration
vertauschen und mit Hilfe der 2f -dimensionalen δ-Funktion ausführen, erhalten wir die For∆T
∆T
zurück, woraus also A(t)
= hA(t)i folgt. Wir erkennen in der formalen
mel für A(t)
(weil praktisch nicht durchführbaren) Vorschrift (4.3) ein Beispiel für die Konstruktion der
Wahrscheinlichkeitsdichte fY (y) = hδ(Y − fX (x))i aus fX (x). Im gegenwärtigen Fall sind die
Wahrscheinlichkeiten von p, q durch die Häufigkeit ihres zeitlichen Auftretens gegeben.
Die Einführung von % bedeutet den Übergang von einer deterministischen Beschreibung
zu einer statistischen.
18
5
Liouville-Gleichung
In der Ensemble-Beschreibung, die wir im letzten Abschnitt einführten, verlagert sich das
Interesse von den praktisch nicht konstruierbaren Lösungen der Bewegungsgleichungen qi (t),
pi (t), i = 1, 2, . . . , f auf die Phasenraumdichte (4.3), die wir durch Verschiebung der Integrationsvariablen τ um t auch schreiben können als
%∆T (q, p, t) =
1
∆T
Z
0
−∆T
dτ δ 2f (q − q(t + τ ), p − p(t + τ )) .
(5.1)
Welche Bewegungsgleichung hat die Phasenraumdichte? Betrachten wir ein System mit f
Freiheitsgraden. Durch Bildung der Zeitableitung finden wir durch Differentiation unter dem
τ -Integral und Ausnützen der Kettenregel
Z
f 1 X
∂
∂%∆T (q, p, t)
dτ q̇i (t + τ )δ 2f (q − q(t + τ ), p − p(t + τ ))
=−
∂t
∆T i=1 ∂qi
Z
∂
2f
dτ ṗi (t + τ )δ (q − q(t + τ ), p − p(t + τ )) .
+
∂pi
Für q̇i und ṗi setzen wir die Hamiltonschen Gleichungen ein
q̇i =
∂H
∂H
, ṗi = −
.
∂pi
∂qi
Schließlich verwenden wir, daß in Faktoren der δ-Funktion qi (t + τ ) bzw. pi (t + τ ) durch die
von τ und t unabhängigen qi bzw. pi ersetzt werden können, da nur dort wo diese Ersetzung
möglich ist, die δ-Funktion nicht verschwindet. Solche nur von q, p und nicht mehr von τ
abhängige Faktoren können wir vor das τ -Integral ziehen. Wir erhalten
f
X
∂
∂%∆T (q, p, t)
=−
∂t
i=1 ∂qi
!
f
X
∂
∂H
%∆T (q, p, t) +
∂pi
i=1 ∂pi
!
∂H
%∆T (q, p, t) .
∂qi
Diese Gleichung hat natürlich allgemeinere Lösungen als nur solche der Form (5.1). Wir
lassen daher im folgenden den Index ∆T weg und betrachten die Gleichung allgemein.
Es ist eine Kontinuitätsgleichung im Phasenraum
2f
∂% X
∂
+
vi % = 0
∂t i=1 ∂xi
mit
xi = qi , xf +i = pi ,
vi = q̇i =
∂H
∂H
, vf +i = ṗi = −
∂pi
∂qi









i = 1, 2, . . . , f .
Die Kontinuitätsgleichung drückt einfach nur die Erhaltung der Wahrscheinlichkeit in differentieller Weise aus. Nichtdifferentiell formuliert lautet dieser Erhaltungssatz: Die Wahrscheinlichkeit einen Zustand in einem endlichen Phasenraumvolumen VΓ vorzufinden, kann
19
sich nur ändern, wenn es einen Wahrscheinlichkeitsfluß durch die Oberfläche ∂VΓ des Volumens hindurch gibt
d
dt
Z
VΓ
dVΓ %(q, p, t) = −
Z
∂VΓ
dFΓ · v%(q, p, t) ,
wobei dFΓ das (2f −1)-dimensionale Oberflächenelement von ∂VΓ mit nach außen gerichteter
Normalen ist, und v = {ẋi ; i = 1, . . . , 2f } der Geschwindigkeitsvektor im Phasenraum. Die
Strömungsgeschwindigkeit im Phasenraum vi , i = 1, 2, . . . , 2f hat die wichtige Eigenschaft
2f
X
i=1
f
X
∂
∂2H
∂2H
vi =
−
∂xi
∂pi ∂qi
i=1 ∂qi ∂pi
!
= 0 (Liouvillescher Satz) .
In der Hydrodynamik gilt ein vollkommen analoges Gesetz im 3-dimensionalen Raum für die
Strömungsgeschwindigkeit v von inkompressiblen Flüssigkeiten
∇·v =0
inkompressible Strömung.
Sie besagt, daß die Flüssigkeitsteilchen, die anfangs ein Volumen der Größe V ausfüllen, für
alle späteren Zeiten immer ein Volumen mit dem gleichen Inhalt V ausfüllen
V
V
t>0
t=0
Mitschwimmendes Flüssigkeitsvolumen in einer inkompressiblen Strömung
In vollständiger Analogie hierzu lassen sich die verschiedenen Ensemble-Mitglieder, Punkte
im Phasenraum, als Teilchen einer Flüssigkeit im Phasenraum auffassen mit Teilchendichte
%(q, p, t). Die Teilchendichte ändert sich zeitlich, weil die Punkte (aufgrund der Hamiltonschen Gleichungen) mit der Strömungsgeschwindigkeit vi , i = 1, 2, . . . , 2f durch den PhaP
senraum strömen. Wegen 2f
i=1 ∂vi /∂xi = 0 ist diese Strömung inkompressibel, d.h. die Phasenraumpunkte aus einem anfangs gegebenen Volumenelement ∆VΓ füllen zu allen späteren
Zeiten ein Volumen des Inhalts ∆VΓ aus.
Zum Beweis der letzteren Aussage betrachten wir allgemein in n-Dimensionen ein ndimensionales Volumen V mit (n − 1)-dimensionaler Oberfläche ∂V , Oberflächenelement
dn−1 σ und n-dimensionalem nach außen gerichteten Normalvektor n. Die Oberfläche möge
sich lokal mit der Strömungsgeschwindigkeit v verschieben, von der wir annehmen, daß sie
Pn
i=1 ∂vi /∂xi = 0 erfülle. Nur die Normalverschiebung der Oberfläche ∂V kann eine Volumenänderung bewirken. Geometrisch ist klar, daß die Normalverschiebung von dσ um die
20
Strecke n · vdt eine Volumenänderung von dσn · vdt bewirkt. Die gesamte Volumenänderung
ergibt sich durch Aufintegration über die Oberfläche, also, nach Division mit dt
dV
=
dt
Z
∂VΓ
dσn · v .
Mit Hilfe des Gaußschen Satzes ergibt sich wie behauptet
dV
=
dt
Z
V
dn x
X
i
∂vi
= 0.
∂xi
Mit Hilfe der Liouville-Gleichung läßt sich die Kontinuitätsgleichung für %(q, p, t) etwas
umformen. Sie lautet dann
f
∂H ∂%
∂% X
∂H ∂%
+
−
∂t i=1 ∂pi ∂qi
∂qi ∂pi
!
= 0 (Liouville-Gleichung)
oder, in der Schreibweise mit Poisson-Klammer
{A, B} =
f
X
i=1
∂A ∂B ∂A ∂B
−
∂qi ∂pi ∂pi ∂qi
!
∂%
− {H, %} = 0 .
∂t
Auf der linken Seite der Liouville-Gleichung erscheint nun gerade die totale Zeitableitung
von %, und wir finden demzufolge, daß
d%
= 0 (Liouville-Gleichung)
dt
ist, d.h. % erweist sich allgemein als eine explizit zeitabhängige Konstante der Bewegung. In
der Sprache der Hydrodynamik: % ist im lokal mitschwimmenden Koordinatensystem zeitlich
konstant, was wiederum die Inkompressibilität der Strömung ausdrückt. Diese Eigenschaft
erweist sich als von ganz zentraler Bedeutung für die statistische Mechanik. Sie erlaubt es
nämlich, einfache zeitunabhängige Lösungen für % anzugeben. Z.B. in Systemen, denen nur
ein endliches Volumen VΓ des Phasenraums zugänglich ist, z.B. aufgrund des Energieerhaltungssatzes H = E = const ist offenbar
%=


 const


0
im zugänglichen Teil des Phasenraums
sonst
eine zeitunabhängige Lösung. Die Konstante ergibt sich durch Normierung
Z
VΓ
%df qdf p = 1
als const. = 1/VΓ . Diese konstante Lösung ordnet jeder Volumenzelle df qdf p des zugänglichen
Teils des Phasenraums die gleiche Wahrscheinlichkeit
P (df qdf p) =
21
df qdf p
VΓ
zu. Ist das dem System zugängliche Phasenraumvolumen nicht beschränkt, VΓ = ∞, ist diese
Lösung nicht brauchbar. Doch ist jede Funktion % von zeitunabhängigen Erhaltungsgrößen,
z.B. % = f (H(q, p)), eine zeitunabhängige Lösung von d%/dt = 0. Wir werden auf solche
zeitunabhängigen Lösungen bei der Diskussion thermodynamischer Gleichgewichte zurückgreifen. Zuvor jedoch werden wir die entsprechende quantenmechanische Beschreibung analog
zur klassischen entwickeln.
6
Statistische Ensemble – quantenmechanisch
Nun entwickeln wir in analoger Weise die Bildung von Mittelwerten in der Quantenstatistik.
Ausgangspunkt ist der zeitliche Mittelwert des quantenmechanischen Erwartungswerts
hψ(t)|A|ψ(t)i
∆T
Z
1
=
∆T
t
t−∆T
hψ(τ )|A|ψ(τ )idτ .
(6.1)
Durch Einschieben eines vollständigen Orthonormalsystems {|ni} mit Hilfe seiner Vollständigkeitsrelation
X
|nihn| = 1
n
23
(wobei im Symbol n sehr viele (∼ 10 ) Qantenzahlen zusammengefaßt sein können) können
wir (6.1) umschreiben in
∆T
hψ(t)|A|ψ(t)i
=
1
∆T
Z
t
t−∆T
dτ
X
(hψ(τ )|A|ni)(hn|ψ(τ )i) .
n
Durch Umordnen der beiden eingeklammerten Faktoren unter der Summe sowie Vertauschen
der Reihenfolge der Integration über τ mit der Summation über n erhalten wir
∆T
hψ(t)|A|ψ(t)i
=
X
n
hn|%(t)A|ni
mit dem sog. statistischen Operator
%(t) =
Z
1
∆T
t
t−∆T
dτ |ψ(τ )ihψ(τ )| .
(6.2)
Er tritt an die Stelle der Phasenraumdichte %(q, p) in der klassischen Beschreibung. Mit Hilfe
des statistischen Operators %(t) kann nun der gewünschte Mittelwert von A unabhängig von
der orthonormalen Basis {|ni} geschrieben werden
∆T
hψ(t)|A|ψ(t)i
= T r%(t)A ≡ hA(t)i .
Erinnern wir uns an (oder lernen wir hier neu) zwei wichtige Eigenschaften der Spurbildungsoperation T r:
(1.) Die Spur eines Operators ist unabhängig vom Orthonormalsystem, das zur Ausführung
benutzt wird: Seien |ni1 , |mi2 zwei verschiedene Orthonormalsysteme mit
X
n
|ni1 1 hn| = 1 =
22
X
m
|mi2 2 hm|
und sei B ein beliebiger Operator, für den die im folgenden auftretenden Summen
existieren: Dann ist
X
n
1 hn|B|ni1
=
XX
n
m
1 hn|B|mi2 2 hm|ni1
.
Nach Vertauschen der Reihenfolgen der Summen über n und m
X
n
1 hn|B|ni1
=
XX
m
n
2 hm|ni1 1 hn|B|mi2
.
Die Summe über n kann man mit Hilfe der Vollständigkeitsrelation ausgeführt werden
und wir erhalten
X
X
2 hm|B|mi2 ≡ T r B .
1 hn|B|ni1 =
m
n
(2.) Unter der Spurbildung sind Operatoren zyklisch permutierbar, z.B.
T r ABC = T r CAB = T r BCA ,
denn
T r ABC =
=
n
X
hn|ABC|ni =
XX
m
n
XX
n
m
hn|AB|mihm|C|ni
hm|C|nihn|AB|mi =
= T r CAB
etc.
X
m
hm|CAB|mi
Dabei haben wir im 3. Schritt die Reihenfolge der Summationen über n und m vertauscht.
Der statistische Operator %(t) beschreibt ein quantenmechanisches Ensemble, auch ein “Gemisch von Zuständen” genannt oder kurz ein “gemischter Zustand“: An die Stelle einer Wellenfunktion |ψ(t)i (nun auch “reiner Zustand“ genannt) tritt ein Ensemble von (unendlich)
vielen Zuständen, hier alle Zustände |ψ(τ )i für t−∆T ≤ τ ≤ t. Erwartungswerte in gemischten Zuständen sind so zu berechnen, daß zunächst der quantenmechanische Erwartungswert
mit jeder Wellenfunktion berechnet wird, die Mitglied des Ensembles ist; dann wird der Mittelwert über das Gemisch gebildet, wobei jeder quantenmechanische Erwartungswert mit dem
Gewicht eingeht (hier mit dτ /∆T ), mit dem die betreffende Wellenfunktion im Ensemble
vertreten ist. Diese Vorschrift ist letztlich Inhalt der allgemeinen Formel hAi = T r%A. Man
beachte, daß die verschiedenen im Ensemble vertretenen Wellenfunktionen
nicht notwendig
Rt
dτ |ψ(τ )ihψ(τ )|
aufeinander orthogonal zu sein brauchen; in unserem Fall %(t) = 1/∆T t−∆T
sind z.B. die |ψ(τ )i für verschiedene τ im allgemeinen nicht orthogonal. Statistische Operatoren % haben allgemein folgende Eigenschaften:
(1) % ist hermitisch, % = %†
(2) % ist positiv semi-definit, d.h. alle Eigenwerte (diskret oder kontinuierlich, sind ≥ 0)
(3) T r% = 1
23
Wegen (1) hat % eine Spektralzerlegung nach Eigenzuständen, z.B. für diskretes Spektrum
von %
X
pi |iihi|, hi|ji = δi,j .
%=
i
Die Eigenschaft (2) ist zu fordern, damit für jeden Zustand |ϕi der Erwartungswert
h|ϕihϕ|i = T r%|ϕihϕ| = hϕ|%|ϕi = w(|ϕi)
interpretiert werden kann als Wahrscheinlichkeit w(|ϕi) den Zustand |ϕi, in dem mit %
beschriebenen Ensemble vorzufinden. Denn zum einen erfordert diese Interpretation, mit
|ϕi = |ii,
X
pj |hi|ji|2 = pi ≥ 0 ,
hi|%|ii =
j
daß die pi positive Wahrscheinlichkeiten sind, zum andern wird dann
w(|ϕi)hϕ|%|ϕi =
X
i
pi |hϕ|ii|2 .
Auf der rechten Seite ist, wie aus der Quantentheorie bekannt, |hϕ|ii|2 allgemein die Wahrscheinlichkeit den Zustand |ϕi vorzufinden, falls der Zustand |ii vorliegt, wobei sich die |ii
wegen ihrer Orthogonalität gegenseitig ausschließen, zum andern ist pi wie gerade gezeigt,
die Wahrscheinlichkeit mit der |ii im Ensemble vertreten ist. Nach dem Satz von der totalen
Wahrscheinlichkeit ist also hϕ|%|ϕi wirklich die gesamte Wahrscheinlichkeit |ϕi im Ensemble
vorzufinden.
7
Von Neumann-Gleichung
Wir suchen nun die Bewegungsgleichung der %(t) genügt. Dazu verschieben wir in (6.2) die
Integrationsvariable τ und bringen es in die Form
1 Z0
%(t) =
dτ |ψ(t + τ )ihψ(t + τ )| .
∆T −∆T
Durch Differentiation nach t, die auf der rechten Seite unter dem Integral ausgeführt wird,
und Zuhilfenahme von
1
H|ψ(t + τ )i
ih̄
−1
hψ(t + τ )|H,
hψ̇(t + τ )| =
ih̄
|ψ̇(t + τ )i =
und indem wir H, das von τ nicht abhängt, nach links, bzw. rechts, aus dem Integral herausziehen, ergibt sich
1
%̇(t) = (H%(t) − %(t)H) ,
ih̄
was auch in der Form
ih̄%̇ = [H, %] (vonNeumann-Gleichung)
24
geschrieben werden kann. Durch die Ersetzung
1
(h̄→0)
[H, %] −→ {H, %} ,
ih̄
welche, wie stets, Kommutatoren in klassische Poisson-Klammern überführt, finden wir die
klassische Liouville-Gleichung wieder, wenn wir den klassischen Limes des statistischen Operators mit der klassischen Phasenraumdichte identifizieren. Die von-Neumann-Gleichung ist
also das quantenmechanische Analogon der Liouville-Gleichung. Es ist übrigens bemerkenswert, daß die Herleitung der von-Neumann-Gleichung beträchtlich einfacher ist als die der
Liouville-Gleichung.
8
Thermodynamisches Gleichgewicht
Betrachten wir nun ein Vielteilchensystem, das in einen Behälter fest eingeschlossen und
von der Umgebung vollständig isoliert ist. Ein derartiges System heißt abgeschlossen. Erfahrungsgemäß geht ein abgeschlossenes System, das sich selbst überlassen bleibt, nach einer
gewissen systemabhängigen Relaxationszeit τrelax τstoß in einen dynamischen Zustand
∆T
∆T
über, in dem die zeitabhängigen Zeitmittelwerte A(t)
bzw. hψ(t)|A|ψ(t)i
für hinreichend große ∆T (∆T /τrelax 1) konvergieren (d.h. nicht nur von ∆T , sondern auch von t
unabhängig werden).
1
∆T →∞ ∆T
A = lim
hψ|A|ψi = lim
Z
t
Z
∆T →∞ t−∆T
t
t−∆T
A(q(τ ), p(τ ))dτ
hψ(τ )|A|ψ(τ )idτ .
Dennoch bleiben sogar für t τrelax die ungemittelten Größen A(q(t), p(t)) und hψ(t)|A|ψ(t)i,
∆T
und wie bei den Zeitmittelwerten schon diskutiert, bis zu einem gewissen Grad auch A(t)
für ∆T τrelax selbst in diesem Zustand zeitabhängig und fluktuieren um ihre zeitlichen
Mittelwerte. Es handelt sich um einen Gleichgewichtszustand, der aber dennoch dynamisch
ist, man spricht vom thermodynamischen Gleichgewicht. Den Übergang eines Systems ins
thermodynamische Gleichgewicht behandelt die sog. kinetische Theorie mit Hilfe von sog. kinetischen Gleichungen (Boltzmann-Gleichung, Master-Gleichung, Fokker-Planck–Gleichung,
Langevin-Gleichung). Den thermodynamischen Gleichgewichtszustand selbst behandelt die
Statistische Mechanik des thermodynamischen Gleichgewichts, der wir uns nun zuwenden.
Wie kann man die zeitunabhängigen Zeitmittelwerte Ā bzw. hψ(t)|A|ψ(t)i im thermodynamischen Gleichgewicht berechnen? Nehmen wir an, unser klassisches abgeschlossenes
System habe die Gesamtenergie E. Dann bewegt es sich im Phasenraum auf der festen
Energiehyperfläche H(q, p) = E. Nehmen wir weiter an, daß die Gesamtenergie für unser System das einzige Integral der Bewegung ist, welches eine derartige Hyperfläche im
Phasenraum bildet. (Solche Integrale der Bewegung heißen “isolierend“. Sie ordnen jedem
Phasenraumpunkt (q, p) einen eindeutigen Wert des Bewegungsintegrals zu. Die meisten der
2f − 1 zeitunabhängigen Integrale der Bewegung (Integrationskonstanten) eines Systems mit
f Freiheitsgraden sind dagegen nichtisolierend, d.h. ordnen ein- und demselben Phasenraumpunkt mehrere, evtl. gar unendlich viele Werte zu und definieren keine Phasenraumhyperfläche). Für ein abgeschlossenes Vielteilchensystem in einem festen Behälter (dessen Wände
25
die Drehimpulserhaltung und Impulserhaltung aufheben) ist dies eine sehr plausible (wenn
auch schwer streng beweisbare) Annahme. In diesem Fall bewegt sich der Systempunkt auf
der Energiehyperfläche mehr oder weniger ungehindert. Das System wird ergodisch genannt,
wenn der Systempunkt im Laufe seiner Bewegung tatsächlich jedes beliebig kleine Flächenelement auf der Hyperfläche durchläuft. Birkhoffs Ergodentheorem von 1931 besagt, daß ein
System dann und nur dann ergodisch ist, wenn für alle Phasenraumpunkte (evtl. mit Ausnahme einer Punktmenge von verschwindendem Lesbeque-Maß df qdf p) der Zeitmittelwert
Ā von Phasenraumfunktionen existiert und gleich dem Mittelwert hAi über das Ensemble
1
Ā = hAi =
Σ(E)
Z
Γ
A(q, p)δ(H(q, p) − E)df qdf p
(8.1)
ist, mit dem Flächeninhalt der Energiehyperfläche
Σ(E) =
Z
Γ
δ(H(q, p) − E)df qdf p .
Die spezielle zugehörige Phasenraumdichte
%(q, p) =
1
δ(H(q, p) − E)
Σ(E)
(8.2)
ist von q, p nur über die Erhaltungsgröße H(q, p) abhängig und daher wie wir sahen automatisch eine zeitunabhängige Lösung der Liouville-Gleichung. Sie definiert das mikrokanonische
Ensemble. Für ein System mit zusätzlichen isolierenden Integralen Ci (q, p) = Ci verallgemeinert sich das Ergodentheorem entsprechend mit dem verallgemeinerten mikrokanonischen
Ensemble
n
Y
1
%(q, p) =
δ(H(q, p) − E) δ(Ci (q, p) − Ci ) .
Σ(E, C1 , . . . , Cn )
i=1
Gleichung (8.1) löst nun endlich unser Problem, wie wir für ein abgeschlossenes System im
thermodynamischen Gleichgewicht die meßbaren zeitunabhängigen Zeitmittelwerte Ā berechnen können ohne die mikroskopischen Bewegungsgleichungen zu lösen: Wir müssen nur
die Hamiltonfunktion H(q, p) kennen, damit die Phasenraumdichte (8.2) des mikrokanonischen Ensembles bilden und Mittelwerte der Form (8.1) durch Integration über den Phasenraum auswerten. Die Form (8.2) von %(q, p) im Gleichgewicht ist die einzig mögliche, welche
den Bedingungen genügt
1) %(q, p) = 0 falls H(q, p) 6= E
2) %(q, p) ≥ 0
3) %(q, p) = f (H(q, p))
4)
R
Γ
%(q, p)df qdf p = 1.
Im praktischen Umgang ist allerdings die δ-Distribution manchmal unhandlich. Man rechnet
dann bequemer und ohne Verlust an Genauigkeit, wenn man sie durch eine auf 1 normierte
Rechtecksfunktion der kleinen, endlichen Breite ∆E ersetzt
δ(H(q, p) − E) → δ∆E (H(q, p) − E) =
26
 1

 ∆E


0
0 ≤ H − E ≤ ∆E
sonst
.
Dann erhält man für %(q, p) des mikrokanonischen Ensembles

1

 ∆E·Σ(E)
mit
%(q, p) = 

0
0 ≤ H(q, p) − E ≤ ∆E
(8.3)
sonst
Σ(E)∆E =
Z
dVΓ
gleich dem Phasenraumvolumen der Energieschale (0 ≤ H(q, p) − E ≤ ∆E).
Nach dieser “Aufweichung” der δ-Funktion sind in unserem Ensemble Systeme mit allen Energien H(q, p) im Intervall (E, E + ∆E) vertreten. Dies ist nicht schlimm. Zwar hat
unser ursprüngliches physikalisches System nur einen Energiewert E, doch ist dieser Wert
weder genau bekannt noch genau auf einen vorgegebenen Wert einstellbar. Von Interesse
sind daher nur Eigenschaften, die sich nicht ändern, wenn eine hinreichend kleine endliche
Energieunschärfe ∆E 6= 0 zugelassen wird. In der neuen Form für %(q, p) ist nun der zugängliche Teil des Phasenraums die Energieschale E ≤ H(q, p) ≤ E + ∆E. In der Energieschale
ist %(q, p) = const , außerhalb ist %(q, p) = 0. Das Volumen der Energieschale ist die Dicke
der Schale ∆E mal dem Inhalt der Energiehyperfläche Σ(E), also ∆E · Σ(E).
Betrachten wir nun sofort auch Quantensysteme wiederum unter der Annahme, daß das
System abgeschlossen sei, und die Energie, d.h. der Hamiltonoperator, die einzige relevante Erhaltungsgröße ist. Dies heißt strikt genommen, daß keine Entartung der Eigenwerte
des Hamiltonoperators auftritt. Allerdings ist diese Aussage ohne große praktische Relevanz, denn für Vielteilchensysteme liegen die Energieniveaus außerordentlich dicht nebeneinander. Daher müßte man die Energienievaus mit unvorstellbarer Genauigkeit vermessen,
um sie unterscheiden zu können: ein hoffnungsloses Unterfangen. Stattdessen führen wir
eine “Grobkörnung“ (coase-graining) der Energieachse in kleine Zellen der Größe ∆E ein
(∆E E vorausgesetzt) und zählen alle Energienieveaus in der Energieschale als effektiv
entartet. Wenn H die einzige Erhaltungsgröße ist, kann jedenfalls der statistische Operator
für ein zeitunabhängiges Gleichgewichtsensemble gemäß der von-Neumann-Gleichung nur
von H abhängen und ist demzufolge diagonal in der Energiedarstellung
H|ε, qεi = ε|ε, qε i .
Hier soll ε die Energie unserer Energiezellen angeben und q möge die vielen Zustände
mit Energien innerhalb der gleichen Energiezelle (also die effektiv entarteten Energieeigenzustände) durchnumerieren. Der statistische Operator hat dann die Form
% = %(H) =
XX
ε
qε
%(ε)|ε, qε ihε, qε | ,
wobei %(ε) innerhalb einer Energiezelle als konstant, also als von qε unabhängig, angenommen
werden kann: alle effektiv entarteten Energieeigenzustände sind gleich wahrscheinlich.
Betrachten wir abgeschlossene Systeme mit fester Energie, dann ist
%(ε) = 0 für ε 6= E
%(ε) ≥ 0 ,
27
was eindeutig %(ε) festlegt auf
%(ε) =
mit
∆EΣQ (E) =
X

1

 ∆EΣQ (E)


E ≤ ε ≤ E + ∆E
0
sonst
1 = Zahl der Zustände in der Energieschale
E, E + ∆E .
qε
Alle Zustände in einer Energieschale sind also gleich wahrscheinlich. Die Größe ΣQ (E) ist
die Zahl der Energieeigenzustände pro Energieeinheit und wird Zustandsdichte des Systems
genannt. Der Index Q soll in Erinnerung halten, daß es die quantenmechanische Zustandsdichte ist. Es ist die vielleicht wichtigste physikalische Größe zur Charakterisierung eines
Vielteilchensystems. Eine kürzere Form, den gleichen statistischen Operator anzugeben, ist
für ∆E → 0
1
δ(H − E)
%=
ΣQ (E)
mit der Zustandsdichte
ΣQ (E) = T rδ(H − E) .
9
Maxwellsche Geschwindigkeitsverteilung
Betrachten wir als erste Anwendung des mikrokanonischen Ensembles ein beliebiges abgeschlossenes klassisches Vielteilchensystem, von dem wir nur verlangen, daß die kinetische
Energie die Form hat
N
X
p2i
Ekin =
, p i = m i vi
i=1 2mi
und die potentielle Energie nicht von den Impulsen p abhängt. Z.B. für ein System mit
2-Teilchen Wechselwirkung
H = Ekin +
X
i
0
1X
U (~xi ) +
U (~xi , ~xj ) .
2 i,j
Wir fragen nach der Geschwindigkeitsverteilung für ein beliebig herausgegriffenes Teilchen i
P (v) = hδ (3) (vi − v)i
im thermodynamischen Gleichgewicht. Die Mittelung ist hier über das Gleichgewichtsensemble, also die mikrokanonische Verteilung, vorzunehmen, also
1
P (v) =
Σ(E)
Z
dVΓ δ
(3)
pi
− v δ(H(q, p) − E) .
mi
Bei Ausführung des Phasenraumintegrals sorgt die erste δ-Funktion dafür, daß der Impuls
für das i-te Teilchen auf dem festen Wert mi v bleibt. Daher steht nur die restliche Energie
E − 21 mi v 2 für die zu mittelnde Teilchenbewegung zur Verfügung. Die Integration über die
Koordinaten und die Impulse aller andern Teilchen liefert in sehr guter Näherung, da es auf
28
1 Teilchen unter ∼ 1023 nicht ankommt, wiederum
E − 21 mi v2
P
, aber für die leicht verschobene Energie
1
P (v) = const (E)Σ(E − mi ) .
2
1
2
Da 2 mi v E und 1 N , können wir den Logarithmus von Σ(E) bis zum ersten Glied
entwickeln und dann abbrechen
∂ ln Σ(E) 1
1
mi v 2 .
ln Σ(E − mi v2 ) = ln Σ(E) −
2
∂E
2
Der Koeffizient β = ∂ ln Σ(E)/∂E hängt nur von der Energie des Systems ab, ist also für
alle Atome gleich. (Wir werden ihn später als die inverse absolute Temperatur identifizieren.)
Also erhalten wir das Ergebnis
1
P (v) = const e− 2 βmi v
mit
2
Maxwellsche Geschwindigkeitsverteilung
const =
q
(mi β)3
q
(2π)3
2
2
2
aus der Normierung und den Mittelwerten hvi i = 0, hvix
i = hviy
i = hviz
i = 1/mβ, hvi2 i =
3/mi β. Definieren wir die absolute Temperatur T durch die gewohnte Relation (m/2)hvi2 i =
(3/2)kB T , dann wird
1
∂ ln Σ(E)
β=
=
.
kB T
∂E
Der Vergleich mit der thermodynamischen Definition des Inversen der absoluten Temperatur
als Energieableitung der Entropie S(E), 1/T = ∂S(E)/∂E, zeigt, daß wir die Entropie
statistisch offenbar definieren sollten als
S(E) = kB ln ∆EΣ(E) ,
wobei wir den Faktor ∆E aus Dimensionsgründen wieder eingefügt haben. Dies ist in der
Tat die zuerst von Boltzmann gegebene statistische Entropiedefinition, auf die wir in § 11
zurückkommen werden. Sie ist, wegen Σ(E) = (1/∆E)eS(E)/kg , ein logarithmisches Maß für
das (extrem rasche) Anwachsen der Zustandsdichte (quantenmechanisch) bzw. des Volumens
der Energieschale (klassisch) mit der Energie.
10
Volumen der Energieschale und
Zustandsdichte für ein ideales Gas
Ein ideales einatomiges Gas von N Atomen mit Atommasse m hat die einfache Hamiltonfunktion
3N
X
p2i
.
H=
i=1 2m
Um Ergodizität annehmen zu können, müssen wir eine nicht verschwindende Wechselwirkung
zwischen den Teilchen zulassen, die aber einen so kleinen Beitrag zur Gesamtenergie leisten
möge, daß er im Vergleich zur kinetischen Energie vernachlässigbar sei. Ist das Gas in ein
29
Volumen V eingeschlossen, so gilt (bei kubischem Behälter der Länge L = V 1/3 ) für die
Atomkoordinaten 0 ≤ xi ≤ L. Daher ist
Σ(E) = V
N
Z
+∞
−∞
dp1 . . .
Z
+∞
−∞
X
dp3N δ
i
p2i
−E
2m
!
=
3N
1 N
V (2mE) 2 S3N −1 .
E
Um die Oberfläche Sn−1 der n-dimensionalen Einheitskugel zu berechnen, betrachten wir
das Gaußintegral
Z
Z
+∞
−∞
dx1 . . .
+∞
−∞
1
dxn e− 2
Pn
i=1
x2i
= (2π)n/2
und
qP führen dies in n-dimensionalen Kugelkoordinaten aus. Die linke Seite gibt, mit r =
n
2
i=1 xi ,
Sn−1
Das Radialintegral ergibt mit u =
1 2
r ,
2
Z
∞
0
r n−1 dr = (2u)
2
n−2
2
Z
∞
0
u
1 2
r n−1 e− 2 r dr .
n−2
2
n−2
2
e
−u
du
du = 2
also
Sn−1 = 2(π)n/2 /Γ
n−2
2
Γ
n
2
n
2
,
.
Damit erhalten wir das Ergebnis
Σ(E) =
3N
1 N
π 3N/2
V (2mE) 2 · 2 3N .
E
Γ( 2 )
Da N sehr groß ist, N ∼ 1023 , nimmt Σ(E) als Funktion von E und V enorm rasch zu. Dies
ist typisch für alle Vielteilchensysteme, nicht nur für das ideale Gas.
Berechnen wir nun die analoge Größe, die Zahl der Zustände in der Energieschale E, E +
∆E, auch quantenmechanisch. Die Energieeigenwerte für die im Kasten V = L3 eingesperrten
wechselwirkungsfreien Gasatome bei zyklischen Randbedingungen sind
ε=
N
X
h̄k2i
.
i=1 2m
(10.1)
Die Energieeigenfunktionen für alle N -Teilchen zusammen in einem kubischen Kasten der
Länge L mit zyklischen Randbedingungen sind
ϕε,k =
1
V
N/2
mit Impulsquantenzahlen
kj =
N
Y
j=1
2π
nj
L
30
eikj ·x
wobei die 3-dimensionalen Vektoren


nxj

nj =  nyj 

nzj
ganzzahlige Komponenten haben und ein kubisches Gitter mit Gitterkonstante 1 bilden.
Die kj erfüllen dabei die Bedingung (10.1) für vorgegebenen Energieeigenwert ε = E. Sie
spielen die Rolle der Quantenzahlen q in der allgemeinen Formulierung. Also ist die Zahl der
Zustände pro Energieintervall in der Energieschale E
ΣQ (E) =
0
X
...
0
X
kN
k1
h̄2 k2i
δ E−
i=1 2m
N
X
!
,
wobei die Summen durch die Nebenbedingungen eingeschränkt sind, daß Zustände, die sich
nur durch Permutationen der N Werte der ki unterscheiden für ununterscheidbare Teilchen wegen der Symmetrie der Wellenfunktion nicht gesondert zu zählen sind. Von dieser
Einschränkung befreien wir uns, indem wir solche Zustände zunächst mehrfach zählen und
dafür das Ergebnis mit der Zahl der Permutationen N ! durchdividieren. Allerdings ist dies
nur die richtige Zahl von Permutationen, wenn keine Quantenzustände
mehrfach besetzt
q
sind, was für hinreichend große Energie E, so daß ∆p ' 2mE/N h/∆x = h/(L/N 1/3 ),
in guter Näherung erfüllt ist. Wir formen um
X
ki
=
X
ni
3
∆ ni ≈
Z
d 3 ni ,
wobei wir ∆3 ni = 1 eingesetzt haben, da wegen der Quantisierung gerade 1 Quantenzustand
nj auf eine Volumenzelle ∆3 ni = 1 kommt. Schließlich haben wir die Summe durch ein
Integral approximiert, was für große Impulsquantenzahlen |ni | 1, also im semiklassischen
Limes (h̄ sehr klein gegen alle relevanten klassischen Größen von gleicher Dimension), erlaubt
ist. Mit
L 3 3
3
d ni =
d ki
2π
gilt schließlich
1
ΣQ (E) =
N!
V
(2π)3
!N Z
3
d k1 . . .
Z
h̄2 k2i
d kN δ E −
i=1 2m
3
N
X
!
.
Indem wir die Impulse pi = h̄ki als neue Integrationsvariable einführen sehen wir, daß sich
ΣQ (E) vom klassischen Σ(E) nur durch einen Faktor unterscheidet
ΣQ (E) =
Σ(E)
,
N !(2πh̄)3N
dessen N -Abhängigkeit allerdings extrem stark und äußert wichtig ist zur Vermeidung des
sog. Gibbs’schen Paradoxons der klassischen Physik. Wir kommen darauf bei der Diskussion
der Mischungsentropie zurück. Tatsächlich läßt sich diese Betrachtung für das ideale Gas für
beliebige Hamiltonfunktion für identische Teilchen, auch mit Wechselwirkung wiederholen
31
und man findet die allgemeine Beziehung für die semiklassische Zustandsdichte ΣQ (E) =
T rδ(E − H) und den Flächeninhalt der klassischen Energieschale Σ(E)
∆EΣQ (E) =
∆EΣ(E)
.
(2πh̄)3N N !
Sie zeigt, daß ein Quantenzustand semiklassisch ein Phasenraumvolumen (2πh̄)3N einnimmt.
11
Entropie
Die Mitglieder eines Ensembles (klassisch repräsentiert durch Punkte im Phasenraum mit
der Punktdichte %(q, p, t)) bewegen sich unabhängig voneinander, also im Phasenraum wechselwirkungsfrei. Sie lassen sich also anschaulich mit den Atomen eines idealen Gases vergleichen, die sich, ebenfalls wechselwirkungsfrei im allerdings nur 3-dimensionalen Raum bewegen. Ebenso wie die Atome eines Gases jedes ihnen zugängliche Volumen im Laufe der
Zeit mit gleicher mittlerer Teilchendichte ausfüllen, so erfüllen auch die Ensemblepunkte
im Phasenraum jedes ihnen zugängliche Phasenraumvolumen mit konstanter Dichte %(q, p),
wie das mikrokanonische Ensemble zeigt. Dieses anchauliche Bild legt die Vermutung nahe,
daß abgeschlossene Vielteilchensysteme nur solche Zustandsänderungen von selbst durchlaufen werden, bei denen das von den Ensemblepunkten ausgefüllte Phasenraumvolumen
zunimmt (oder gleichbleibt) und daß im thermodynamischen Gleichgewicht das ausgefüllte
Phasenraumvolumen maximal ist. Betrachten wir dazu ein Beispiel: Ein ideales Gas wird
sich nach Herausziehen einer Trennwand in ein vorher evakuiertes Volumen spontan ausdehnen. In welches Phasenraumvolumen breiten sich dabei die Systempunkte des Ensembles im
Phasenraum aus?
Trennwand
V/2
V/2
ideales Gas
Vakuum
Gedankenexperiment zur Expansion eines wechselwirkungsfreien Gases
Das physikalische Volumen verdoppelt sich von V /2 auf V , doch E und N ändern sich
nicht, da das System abgeschlossen ist. Dabei nimmt das zugängliche Phasenraumvolumen
∆EΣ(E, V /2, N ) wegen Σ(E, V, N ) ∼ V N um den Faktor 2N zu
∆EΣ(E, V, N ) ∼ V
N
N
= 2 ∆E
P
V
E, , N ∼ 2N (V /2)N .
2
Für N ∼ 1023 ist 2N eine unvorstellbar große Zahl. Wegen der Zunahme exponentiell mit N
fand es L. Boltzmann sinnvoll, allgemein den Logarithmus des vom Ensemble ausgefüllten
32
Phasenraumvolumens
S = kB log[∆E
P
Q (E, V, N )]
(11.1)
als Maß für die Unordnung im System zu betrachten und damit die (Boltzmannsche) Entropie
zu definieren. Hierbei ist kB die vom Maßsystem abhängige Boltzmann Konstante. Demnach
nimmt in unserem Beispiel des von V /2 auf V expandierenden abgeschlossenen Gases die
Entropie zu um ∆S = kB N ln 2. Allgemein kann in einem abgeschlossenen System die Boltzmannsche Entropie bei einem von selbst ablaufenden Übergang von einem Gleichgewichtszustand zu einem andern nach Aufhebung einer Einschränkung von selbst nur zunehmen, da im
mikrokanonischen Ensemble stets das maximal zur Verfügung stehende Phasenraumvolumen
ausgefüllt wird. Eine zeitabhängige Variante der Boltzmannschen Entropie läßt sich analog zu
(11.1) definieren, wenn die gesamte Zahl der Zustände in der Energieschale ∆EΣQ (E, V, N )
im Argument des Logarithmus ersetzt wird durch die kleinere oder höchstens gleiche Zahl
der davon tatsächlich im Ensemble enthaltenen Zustände. Wir werden von der zeitabhängigen Boltzmannschen Entropie hier jedoch keinen Gebrauch machen, bemerken aber, daß sie
das “H-Theorem” befriedigt, nämlich
dS(t)
≥ 0.
dt
Neben der Boltzmannschen Entropiedefinition gibt es weitere, insbesondere die Gibbssche
Entropie
SG = −kB T r% ln %
bzw. klassisch
SG = −kB
Z
df qdf p%(q, p, t) ln[%(q, p, t)(2πh̄)f CN ] ,
wobei CN ein kombinatorischer Faktor ist, der die Ununterscheidbarkeit identischer Teilchen
berücksichtigt und für N ununterscheidbare Teilchen gegeben ist durch CN = N !. Setzt man
für %(q, p, t) speziell die mikrokanonische Verteilung (8.3) ein, so geht SG über in
SG = kB ln[∆E · Σ(E)/CN · (2πh̄)f ] = S .
Gleichzeitig ist dies der maximal mögliche Wert von SG unter der Bedingung, daß %(q, p, t)
nur im zugänglichen Teil des Phasenraums, also in der Energieschale, ungleich Null ist. Denn
nehmen wir an, daß %(q, p, t) in der Energieschale ∂E eine beliebige normierte Funktion ist
R f f
f
und außerhalb verschwindet, so liefert die Variation
von
S
G = −kB d qd p% ln[%(2πh̄) CN ]
R
nach % unter Beachtung der Nebenbedingung ∂E %df qdf p = 1 mit dem Lagrange-Parameter λ
Z
∂E
df qdf pδ%{−kB ln[%(2πh̄)f CN ] − kB + λ} = 0 .
Da δ% beliebig ist, muß der Faktor von δ% verschwinden. Die Lösung ist
%=
 λ/k −1
B
e


 (2πh̄)f CN
= const in ∂E


0
sonst ,
also das mikrokanonische Ensemble. Die Konstante const. (und damit auch λ) ergibt sich
wie früher aus der Normierung, also als const = (1/∆EΣ(E)). Da SG ein konvexes Funktional von % ist (d.h. nach unten gekrümmt mit überall negativer 2. Funktionalableitung,
33
was man am leichtesten einsieht, wenn man sich klarmacht, daß −x ln x als Funktion von
x überall nach unten gekrümmt ist, da −x schneller fällt als ln x anwächst), ist das Extremum ein Maximum. Anders als die Boltzmannsche Entropie ist die Gibbssche Entropie SG
für beliebige %(q, p, t) definiert, doch hat sie einen ganz gravierenden Schönheitsfehler: da
%(q, p, t) allgemein eine zeitabhängige Konstante der Bewegung ist, ändert sich SG unter der
Hamiltonschen Dynamik nicht in der Zeit,
SG (t) = const .
Am leichtesten läßt sich dies quantemechanisch mit der von-Neumann-Gleichung zeigen. SG
ist also kein sehr geeignetes Maß für den heuristischen Begriff “Unordnung“, da es anders
als die Unordnung nicht von selbst wächst. Stattdessen ist SG interpretierbar als “Unkenntnis” oder negative “Information“ die aus einem andern Grunde sehr nützlich ist: So wie
die Boltzmannsche Entropie S für abgeschlossene Systeme das Maximum der Gibbsschen
Entropie über alle möglichen % ist, und das maximierende mikrokanonische Ensemble somit
die maximale Unkenntnis des Systems bei gegebener Energie und evtl. weiterer isolierender
Bewegungskonstanten ausdrückt, so ist das auch noch für nicht-abgeschlossene Systeme der
Fall, wie wir etwas später sehen werden, wo die Maximierung der Unkenntnis SG über die
Ensembles andere kanonische Gleichgewichtsensembles liefert, für die SG wiederum gleich
wird zur Boltzmannschen Entropie.
12
Entropie des idealen Gases
Für die Thermodynamik ist die Boltzmannsche Entropiedefinition die entscheidende. Werten
wir die Boltzmannsche Entropie für ein einatomiges ideales Gas aus. Da N ∼ 1023 1
verwenden wir die Stirlingsche Formel
√
N N
N ! ' 2πN
e
s
3N
3N
3N
3N
1 2 −1
Γ
' 2π
−1
−
2
2
2e
e
und erhalten aus
S=


3N
 2∆EV N (2mE) 3N
2 π 2 
kB ln
 EN !(2πh̄)3N Γ 3N 
2
durch Einsetzen
S = kB ln
Damit erhalten wir




4m∆E
√


 2πN
r
2π
3N
2
−1
eV
(2πh̄)3 N
(
!N
2meE
3
N −1
2
V
3 E
e5/2 m3/2
S = kB N ln + ln + ln 3 3
N
2 N
π 2 h̄ 33/2
√
1
6∆E
.
+O
+kB ln
πE
N
34
)
! 3N −1
2
π




3N
2



.
Da N ∼ 1023 interessieren wir uns nur für den führenden Term für große N , der proportional
zu N wird, falls V /N und E/N festgehalten werden, und der in der ersten Zeile angegeben
ist. Der nächste Term, der explizit in der zweiten Zeile angegeben ist, wächst höchstens noch
logarithmisch mit N (falls wir uns ∆E festgehalten oder proportional zu N 1/2 denken und
bedenken, daß E proportional zur Teilchenzahl skaliert), und ist in jedem Fall im Limes
N → ∞, V /N und E/N fest (thermodynamischer Limes) und ist relativ zum führenden
Term vernachlässigbar. Der konstante Anteil s00 der Entropie pro Gasatom s = S/N , auch
Entropiekonstante genannt, ist
s00 = kB ln
e5/2 m3/2
.
π 3/2 33/2 h̄3
Wir können an unserem Ergebnis nochmals kontrollieren, daß bei Verdopplung des Volumens
bei konstanter Energie und Teilchenzahl (d.h. also im abgeschlossenen System) die Entropie
pro Gasatom um kB ln 2 zunimmt. Die Unordnung hat also zugenommen (die Gasatome
sind nun über ein größeres Volumen verstreut) und unsere Information hat abgenommen
(wir wissen weniger genau, wo jedes Gasatom ist) und zwar um 1 Bit pro Gasatom.
13
Mischungsentropie
Betrachten wir eine Mischung von 2 idealen einatomigen Gasen, deren Atommassen verschieden sind. Die Hamiltonfunktion lautet nun in offensichtlicher Notation
H=
2 3N
X
Xk
k=1 i=1
p2ki
.
2mk
Wir beginnen mit der Berechnung des Volumens der Energieschale
Σ1,2 (E, V, N1 , N2 ) = V N1 +N2
Z
+∞
−∞
dp11 . . .
Z
+∞
−∞

Nk
2 X
X

p2ki
− E .
dp2(3N2 ) δ 
k=1 i=1 2mk
Durch Herausziehen
√ des Faktors E aus der δ-Distribution und Umskalieren der Integrationsvariablen in pki = 2mk Ezki geht Σ12 über in
Σ1,2 (E, V, N1 , N2 ) = V
N1 +N2 (2m1 E)
3N1
2
(2m2 E)
E
3N1
2
S3(N1 +N2 )−1 ,
wobei wie früher Sn−1 die Oberfläche der n-dimensionalen Einheitskugel bezeichnet. Wir
P
sehen, daß bis auf die unterschiedlichen Atommassen 12 nur von der Summe der Teilchenzahlen abhängt. Führen wir die effektive von den Konzentrationen
c1 =
N1
N1 + N 2
,
c2 =
N2
N1 + N 2
abhängige Masse
ein, so gilt
m = mc11 · mc22
Σ12 (E, V, N1 , N2 ) = Σ(E, V, N1 + N2 ) ,
35
(13.1)
wobei Σ der Flächeninhalt der Energiefläche für ein einkomponentiges Gas mit effektiver
Masse m ist. Ein wichtiger Unterschied des Gasgemisches zum 1-komponentigen Gas tritt erst
P
auf, wenn wir vom Volumen der Energieschale
zur Zustandsdichte ΣQ übergehen. Denn
anstelle des kombinatorischen Faktors 1/N !, der die Ununterscheidbarkeit aller Atome im
1
, da nur die Atome innerhalb
1-komponentigen Gas berücksichtigt, tritt nun der Faktor N1 !N
2!
jeder Komponente ununterscheidbar sind. Also gilt
ΣQ12 (E, V, N1 , N2 ) =
P
12 (E, V, N1 + N2 )
N1 !N2 !(2πh̄)3(N1 +N2 )
.
Durch Erweiterung mit N ! und Benutzen von (13.1) finden wir
ΣQ12 (E, V, N1 , N2 ) =
(N1 + N2 )! P
Q (E, V, N1 + N2 ) ,
N1 !N2 !
wobei ΣQ die Zustandsdichte für ein einkomponentiges Gas mit effektiver Masse m ist. Durch
Bildung des Logarithmus finden wir die Entropie S12 des Gasgemisches
S12 (E, V, N1 , N2 ) = S1 (E, V, N1 + N2 ) + Smisch
als Entropie S1 eines einkomponentigen Gases mit effektiver Masse m (die aber nur in die
Entropiekonstante s00 eingeht) und einem Zusatzanteil
Smisch = kB ln
(N1 + N2 )!
' kB {(N1 + N2 ) ln (N1 + N2 ) − N1 ln N1 − N2 ln N2 + O(ln N )}
N1 !N2 !
= −kB (N1 + N2 )(c1 ln c1 + c2 ln c2 ) ,
der als Mischungsentropie bezeichnet wird. Hier haben wir natürlich wieder Stirling’s Formel
benutzt. Für eine binäre Mischung mit c1 = x, c2 = 1 − x zeigt die folgende Figur die
Mischungsentropie als Funktion von x
1
s/k ln2
0.8
0.6
0.4
0.2
0
0
0.2
0.4
x
0.6
0.8
1
Mischungsentropie pro Molekül in Einheiten kln(2)
Tatsächlich rührt dieser (wegen 0 ≤ ci ≤ 1) stets positive Anteil zur Entropie jedes mehrkomponentigen Systems von der zusätzlichen Unordnung her, die bei der Vermischung verschiedener Atomsorten entsteht. Ihr Ursprung liegt in der Unterscheidbarkeit der vermischten
Teilchen. Ohne die Division des Flächeninhalts der Energieschale eines reinen Gases mit dem
36
nur quantenmechanisch begründeten Faktor N !, der von der Symmetrie der Wellenfunktion für ununterscheidbare Teilchen herrührt, hätte schon das einatomige Gas eine enorme
Mischungsentropie kB N ln N . Tatsächlich müßte diese auftreten, wenn die Gasatome alle
unterscheidbar wären. Die klassisch unverständliche Abwesenheit der Mischungsentropie in
Gasen identischer Atome wurde vor der Entwicklung der Quantentheorie identischer Teilchen
von Gibbs bemerkt. Dies “Gibbssche Paradoxon“ wurde erst später durch die Quantentheorie aufgelöst. Die Mischungsentropie, die also letzten Endes quantenmechanischen Ursprungs
ist (da sie von dem fundamentalen Unterschied herrührt zwischen identischen Teilchen und
nicht-identischen, somit unterscheidbaren Teilchen, den es nur in der Quantentheorie gibt),
steckt hinter so wichtigen Tatsachen wie dem Massenwirkungsgesetz und dem osmotischen
Druck, die später behandelt werden.
14
Temperatur
Betrachten wir zwei zunächst getrennte Systeme mit Energien E1 , E2 . Solange beide Systeme
abgeschlossen sind, behalten sie ihre Energien E1 und E2 bei. Die Energiehyperflächeninhalte
P
P
der beiden Systeme seien 1 (E1 ) und 2 (E2 ). Nun bringen wir beide Systeme miteinander
in Kontakt, so daß sie Energie austauschen können, ohne daß sich ihre Volumina oder ihre Teilchenzahlen oder weitere Variable (z.B. Magnetfeld) dabei ändern. Es wird also keine
Arbeit geleistet, nur kinetische Energie ausgetauscht, die in der Energie der ungeordneten
Bewegung der beiden Vielteilchensysteme steckt. Dieser Energieaustausch findet statt, indem
die Teilchen aus den beiden Teilsystemen an ihrer Kontaktfläche miteinander zusammenstoßen. Man spricht dann auch von Wärmeaustausch und von thermischem Kontakt zwischen
beiden Teilsystemen. Nach hinreichend langer Zeit wird ein neuer thermodynamischer Gleichgewichtszustand erreicht. Da das Gesamtsystem noch immer abgeschlossen ist, können wir
das mikrokanonische Ensemble für den Gleichgewichtszustand des Gesamtsystems
%=
verwenden. Der Flächeninhalt
P
P
δ(H1 + H2 − E)
P
(E)
(E) der Gesamtenergiehyperfläche ist gegeben durch
(E) =
Z
dVΓ1
Z
dVΓ2 δ(H1 + H2 − E) .
dVΓ1 , dVΓ2 sind die Volumenelemente in den Phasenräumen der beiden Teilsysteme. Wir
haben hier die Wechselwirkungsenergie zwischen beiden Teilsystemen vernachlässigt, was
erlaubt ist, weil ihr Kontakt nur auf einen Teil ihrer Oberfläche beschränkt ist und wir hier
nur an Volumeneffekten interessiert sind. Betrachten wir zunächst die Wahscheinlichkeitsverteilung der Energie E1 im Teilsystem 1. Im mikrokanonischen Ensemble des Gesamtsystems
gilt
Z
Z
1
P (E1 ) = hδ(H1 − E1 )i =
dVΓ1 dVΓ2 δ(H1 − E1 )δ(H1 + H2 − E)
Σ(E)
P
P
eS(E1 ,E)/kB
1 (E1 )
2 (E − E1 )
∼ S(E)/k = e∆S(E1 ,E)/kB .
=
B
Σ(E)
e
37
(14.1)
Hierbei haben wir die Entropie S(E1 , E) = kB ln(δE)2 Σ2 (E − E1 )Σ1 (E1 ) des Gesamtsystems
der Energie E bei festgehaltenem E1 definiert, mit
∆S(E1 , E) = S(E1 , E) − S(E) .
Die Wahrscheinlichkeitsverteilung ist richtig normiert, da
Σ(E) =
Z
E
0
dE1
P
2 (E
− E1 )
P
1 (E1 ) .
P
Diese Verteilung hat ein extrem scharfes Maximum, da 1 (E1 ) mit wachsendem E1 enorm
P
rasch zunimmt, während 2 (E − E1 ) ebenso rasch abnimmt. Wir können daher in hervorragender Näherung den Logarithmus der Verteilung um sein Maximum entwickeln. Zunächst
bestimmen wir nur den Ort des Maximums. Zur Breite der Verteilung kehren wir erst etwas
später zurück. Der Maximalwert der Verteilung wird angenommen für die Energie E1 max die
sich aus
P
P
1
∂ 1 (E1 ) ∂ 2 (E2 ) 1
= P
(14.2)
P
∂E1 V1 ,N1
∂E2 V2 ,N2
1 (E1 )
2 (E2 )
mit E = E1 + E2 ergibt. Wegen der extremen Schärfe des Maximums (siehe weiter unten)
stimmt E1 max mit dem Mittelwert hE1 i praktisch überein. Die Gleichgewichtsbedingung
(14.2) für Wärmeaustausch läßt sich unmittelbar durch die Entropie ausdrücken als
∂S1 (E1 , V1 , N1 )) ∂S2 (E2 , V2 , N2 )) =
,
∂E1
∂E2
V1 ,N2
V2 ,N2
wobei Volumen und Teilchenzahl und eventuell weitere Variable festgehalten werden bei der
Differentiation. Da S und E beide “extensiv“ sind, d.h. proportional zur Teilchenzahl, ist der
Differentialquotient ∂S/∂E, der im thermischen Gleichgewicht für beide Systeme gleich sein
muß, von N unabhängig, d.h. “intensiv“. Wir nennen das Inverse dieser intensiven Größe
die absolute Temperatur T ,
1
∂S(E, V, N ) =
T
∂E
V,N
Definition der absoluten Temperatur
(V, N stehen hier und im folgenden auch stellvertretend für alle weiteren Variablen von
denen Σ(E, V, N, . . .) sonst noch abhängt) und die Gleichgewichtsbedingung für thermischen
Kontakt lautet
T1 = T 2 .
Zwei absolut verschiedene physikalische Systeme haben also im thermischen Gleichgewicht
(d.h. Gleichgewicht bei Energieaustausch; thermischem Kontakt) mindestens eines gemeinsam: ihre Temperatur. Bei mehr als 2 Teilsystemen verallgemeinert sich die bisherige Betrachtung auf
T1 = T 2 = T 3 = . . . = T ,
d.h. wenn Teilsysteme 1 und 2 im thermischen Gleichgewicht sind, sowie 1 und 3, so sind
automatisch auch 2 und 3 im thermischen Gleichgewicht. Dieser Befund, der hier aus der
Statistischen Mechanik hergeleitet wurde, wird auch manchmal “0. Hauptsatz der Thermodynamik” genannt. Auf ihm beruht die Möglichkeit der objektiven Temperaturmessung.
38
Wenden wir als Beispiel unsere Temperaturdefinition auf das ideale 1-atomige Gas an.
Die Energieabhängigkeit seiner Entropie ist enthalten in
E
3
S = N kB ln + . . . ,
2
N
woraus sich
∂S 1
3 E
=
kB
=
T
∂E V,N
2N
oder
3
E = N kB T
2
ergibt, d.h. jedes Gasatom trägt mit (3/2)kB T zur Energie des Gases bei. Ist ν die Molzahl
unserer Gasmenge, so ist N = νL wo L die Loschmidtsche Zahl ist. Mit der idealen Gaskonstanten R = kB L finden wir also für das 1-atomige Gas die sog. kalorische Zustandsgleichung
3
E = νRT .
2
Da in dieser Rechnung S eine Funktion von E, V, N (oder ν) ist, müssen wir auch seine
Ableitung 1/T als Funktion dieser Größen auffassen. Es ist also bei nochmaliger Ableitung
nach E bei festem V, N
1
2
1
∂T =
=
=
.
∂E V,N
∂E/∂T |V, N
3N kB
CV
Das Inverse, die Energieänderung durch Temperaturänderung bei festem Volumen heißt Wärmekapazität CV bei festem Volumen, CV /N heißt spezifische Wärme cv . Für das ideale 1atomige Gas ist also
3
cv = k B .
2
15
Energieschwankungen
Kehren wir nun zur Energieverteilung (14.1) im Teilsystem E1 zurück und entwickeln ln P (E1 )
aus (14.1) bis zum quadratischen Glied um sein Maximum
ln P (E1 ) = const −
1
(E1 − hE1 i)2 + . . . .
2σE2 1
Der Koeffizient des quadratischen Gliedes ist das Inverse der Varianz der Energieschwankungen
P
P 1
∂ 2 ln 1 ∂ 2 ln 2 − 2 =
+
.
σE 1
∂E12
∂E22 E2 =E−E1
Betrachten wir die beiden Terme der rechten Seite für sich. Allgemein gilt
P ∂ 2 ln
∂E 2
V,N
∂ 1
∂E T
∂T ∂E 
1 ∂ 2 S 1
=
=
2
kB ∂E V,N
kB
1
=−
kB T 2
V,N
!
V,N
−1
∂E 
= − kB T 2
∂T V,N
39
=−
1
.
kb T 2 N c V
Die Temperaturableitung der Energie bei konstantem Volumen (und Teilchenzahl) ist die
schon erwähnte Wärmekapazität bei konstanten Volumen CV . Also ist
1
1
1
+
.
=
2
2
σE 1
k B T CV 1 k B T 2 CV 2
Meist (aber nicht immer!) ist das Teilsystem 2, das Energiereservoir oder Wärmebad, viel
größer als Teilsystem 1. Dann ist N2 N1 , CV 2 CV 1 und σE2 1 ist gegeben durch
σE2 1 = kB T 2 CV 1 .
Z.B. für ein ideales einatomiges Gas σ 2 = (3/2)(kB T )2 N = 2E 2 /3N . Dies ist ein wunderbares
Resultat: Eine rein makroskopische Messung von Temperatur und Wärmekapazität gibt uns
Auskunft über eine rein statistische Eigenschaft, die Stärke der Energieschwankungen in
einem System. Da CV 1 ebenso wie hE1 i extensiv ist, also proportional zu Teilchenzahl N1 ,
ist die relative Standardabweichung der Energie
1
σE 1
∼√
hE1 i
N1
und wird für makroskopische Systeme (N1 ∼ 1023 ) unmeßbar klein, außer in der unmittelbaren Umgebung von kritischen Punkten, an denen, wie wir später sehen werden, die spezifische
Wärme und somit auch σE12 divergiert.
Fassen wir zusammen: Ein System 1 im Kontakt mit einem zweiten hat eine Entropie
S(E1 , E), die von der Gesamtenergie E beider Systeme aber außerdem auch von E1 abhängt.
Letztere Energie kann bei kleinen Systemen 1 fluktuieren. Der Gleichgewichtszustand wird
durch das Maximum von S(E1 , E) bezüglich E1 festgelegt und liefert die Zustandsgleichung,
welche die Temperatur mit anderen Systemvariablen verknüpft:
∂S(E1 , E)
=0.
∂E1
Die Fluktuationen von E1 werden durch die Boltzmann-Einsteinsche Formel
1
e∆S(E1 ,E)/kB
1
eS(E1 ,E /kB
1 (E1 − Ē1 )2
q
=
'
P (E1 ) =
exp
−
∆EeS(E)/kB
∆E
2
σE2
2πσE2
!
,
beschrieben mit
σE2 = kB T 2 N cV 1 .
16
Kanonisches Ensemble
Wie wir sahen ist ein System, das im thermischen Gleichgewicht mit einem anderen System
steht, nicht mehr abgeschlossen. Auch im thermodynamischen Gleichgewicht hat es keine
feste Energie mehr, sondern seine Energie kann schwanken, indem es Energie aus dem andern System aufnimmt oder an dieses abgibt. Welches Ensemble, welche Phasenraumdichte
beschreibt ein solches System im thermodynamischen Gleichgewicht?
40
Für die gesamte Phasenraumdichte setzen wir wie immer das mikrokanonische Ensemble
an
%(q1 , . . . , pf , Q1 , . . . , Pf 0 ) =
δ(H1 (q, p) + H2 (Q, P ) − E)
sum(E)
unter Vernachlässigung der Wechselwirkungsenergie (aus den gleichen Gründen). Die Phasenraumdichte des durch die qi , pi beschriebenen Teilsystems ergibt sich hieraus durch Integration über die Variablen Q1 , . . . Pf 0 des als “Energiereservoir” oder “Wärmebad” fungierenden zweiten und als viel größer angenommenen Systems. Die gewünschten Integrationen
werden leicht ausgeführt, wenn wir zuvor wieder substituieren
δ(H1 + H2 − E) =
Z
E
0
dE1 δ(H1 − E1 )δ(H2 − E + E1 ) .
Wir finden dann unmittelbar
Z
P
− E1 )
Σ(E)
0
P
(E − H1 (q1 , . . . , pf ))
.
= 2
Σ(E)
%1 (q1 , . . . , pf ) =
E
dE1 δ(H1 − E1 )
2 (E
(16.1)
Tatsächlich wird %1 für das Teilsystem allein eine Funktion der Erhaltungsgrößen
H1 (q1 , . . . , pf ) und ist damit eine zeitunabhängige Lösung der Liouville-Gleichung. Ist das
Energiereservoir, d.h. Teilsystem 2, viel größer als Teilsystem 1 so ist die Energie H1 − hE1 i
für alle im Ensemble vertretenen Zustände viel kleiner als E2 = E − hE1 i und wir können
entwickeln
ln
Hierbei ist
P
2 (E
− H1 ) = ln
P
2 (E2 )
−
H1 − hE1 i 1 (H1 − hE1 i)2
−
+... .
kB T
2 2kB T 2 CV 2
P
P
∂ 2 ln 2 (E2 ) 1
−1 1
∂ ln 2 (E2 ) ,
=
=
.
2
kB T
∂E2
∂E2
k B T 2 CV 2
V2 ,N2
V2 ,N2
Wenn die Wärmekapazität CV 2 des Wärmebads bei der Energie E2 = E − hE1 i sehr groß
ist, kB CV 2 T 2 (H1 − hE1 i)2 ∼ kB CV 1 T 2 , dann ist der Term quadratisch in (H1 − hE1 i) in
der Entwicklung vernachlässigbar. Dann gilt
%1 (q1 , . . . , pf ) =
1 −βH1 (q1 ,...,pf )
e
Z
kanonisches Ensemble
(16.2)
wobei β ≡ 1/kB T . Unsere Herleitung zeigt, daß der Normierungsfaktor Z geschrieben werden
kann als
Σ(E)e−βhE1 i
P
Z=P
= 1 (hE1 i)e−βhE1 i ,
(16.3)
2 (E − hE1 i)
doch berechnet wird es nicht hieraus, sondern aus der Normierung von %1 (qq , . . . , pf )
Z
was
Z=
Z
dq1 . . . dpf %(q1 , . . . , pf ) = 1
dq1 . . . dpf e−βH1 (dq1 ...dpf ) = Z(β, V, N )
41
(16.4)
ergibt. Ähnlich wie schon beim mikrokanonischen Ensemble wird die Teilchenzahlabhängigkeit von Z durch diese klassische Formeln noch nicht richtig wiedergegeben, da die quantenmechanisch bedingte Ununterscheidbarkeit von identischen Teilchen nicht berücksichtigt
wird. Um diese in den Ausdruck für Z einzubauen, teilen wir den Phasenraum in kleine
Zellen der Größe
∆q1 . . . ∆pf = (2πh̄)f
ein, ersetzen H(q, p) durch einen konstanten Wert in jeder Zelle, und normieren die Phasenraumdichte
1 −βH
%1 =
e
Zq
nun durch Summation über die Zellen, wobei wir Zustände, die nur durch Permutation
identischer Teilchen unterschieden sind, nur einmal zählen. Also, indem wir uns von letzterer
Einschränkung durch Einführung eines kombinatorischen Faktors CN befreien,
1 X −βH1
e
CN (Zellen)
Z
1
dq1 . . . dpf e−βH1 .
=
f
CN (2πh̄)
Z=
Der kombinatorische Faktor für identische Teilchen ist CN = N ! Die analogen quantenmechanischen Gleichungen lauten
1 −βH1
e
Z
Z = T re−βH1 .
%1 =
(16.5)
Ihre Herleitung verläuft ganz analog, wobei Phasenraumintegrale durch Spuren über die
Hilberträume der entsprechenden Teilsysteme zu ersetzen sind.
Z heißt kanonisches Zustandsintegral (klassisch) oder kanonische Zustandssumme (quantenmechanisch). Aus Z als Funktion von β ergeben sich durch Differentiation:
∂
ln Z
∂β
∂2
ln Z .
=
∂β 2
hE1 i = −
σE2 1
Zur Deutung von Z können wir auf (16.3) zurückgreifen, wenn wir zuvor Σ(E) für das
Gesamtsystem aus Gl. (14.2) auswerten, indem wir das Integral durch den Maximalwert
des Integranden multipliziert mit der Breite des Maximums ∆E approximieren Σ(E) '
P
P
∆E 2 (E − E1 max ) 1 (E1 max ). Also erhalten wir
Z = ∆E
P
1 (E1 max )e
−βE1 max
und daraus bis auf Größen, die im thermodynamischen Limes vernachlässigbar sind
kB ln Z = S1 (E1 max , V1 , N1 ) −
42
E1 max
.
T
Hierbei ist E1 max die mittlere Energie im Teilsystem 1, die sich im Prinzip durch Lösung
der Gleichgewichtsbedingung (14.2), also durch Vorgabe seiner Temperatur T , ergibt. Im
folgenden schreiben wir daher statt E1 max nur E1 . Also ist die Temperatur (nicht die Energie)
hier die unabhängig vorgebbare Variable (durch Vorgabe der Temperatur des Wärmebads).
Wir können aus der durch −kB T ln Z gegebenen Funktion
−kB T ln Z = −T S1 (E1 , V1 , N1 ) + E1
die Energie E1 mit Hilfe der Beziehung
1
∂S1
=
T
∂E1
eliminieren. Dies ist eine Legendre-Transformation und die entstehende Funktion F (T, V1 , N1 )
F (T, V1 , N1 ) = E1 (T, V1 , N1 ) − T S1 (E1 (T, V1 , N1 ), V1 , N1 )
ist in der Thermodynamik bekannt als freie Energie (genauer: Helmoltzsche freie Energie).
Offenbar gilt also
F (T, V1 , N1 ) = −kB T ln Z(β, V1 , N1 ) .
Die Variablen T, V1 , N1 heißen die “natürlichen“ Variablen von F . Es sind wunderschönerweise die selben Variablen von denen auch Z abhängt. Die Auswertung der kanonischen
Zustandssumme liefert also direkt die freie Energie als Funktion ihrer natürlichen Variablen. Analog sind die extensiven Variablen E, V, N die natürlichen Variablen der Entropie
S = S(E, V, N ), deren statistische Bestimmung durch S = kB ln ∆EΣQ (E, V, N ) sie ebenfalls
als Funktion ihrer natürlichen Variablen liefert. Die Ableitung von S nach seiner natürlichen
Variablen E liefert die Temperatur T −1 = ∂S/∂E. Die Ableitung von F nach seiner natürlichen Variablen bei festem V, N liefert −S gemäß dF = dE − T dS − SdT = −SdT (falls V, N
fest) da dE = T dS (falls V, N fest), also
∂F = −S .
∂T V,N
Eine sehr einfache Anwendung des kanonischen Ensembles ist die Herleitung der Maxwellschen Geschwindigkeitsverteilung. Eine damit eng verknüpfte noch allgemeinere Aussage der
klassischen statistischen Mechanik behandeln wir als nächstes.
17
Gleichverteilungssatz
Der Gleichverteilungssatz der klassischen statistischen Mechanik lautet: Jede kanonische Koordinate und jeder kanonische Impuls, der quadratisch in die Hamiltonfunktion eingeht, trägt
zur mittleren Energie den Betrag (1/2)kB T bei und zur Wärmekapazität cv den Betrag kB /2.
Der Beweis ist mit Hilfe des kanonischen Ensembles leicht geführt: Man spaltet dazu die Hamiltonfunktion in den quadratischen Teil und den Rest auf, H = Hquadr. + HRest . Für die
Zustandssumme bedeutet dies eine entsprechende Faktorisierung
Z = Zquadr. · ZRest ,
43
was zur Aufspaltung
F = −kB T ln Z = Fquadr. + FRest
führt. Der Beitrag vom quadratischen Teil der Hamiltonfunktion ist dabei
Fquadr. = −kB T ln Zquadr. .
Die Temperaturabhängigkeit von Zquadr. wertet man am leichtesten aus, indem man durch
Reskalierung aller in die Hamiltonfunktion quadratisch eingehenden Variablen q oder p
q=
q
kB T Q ,
p=
q
kB T P
den Integranden exp(−βHquadr. (q, p)) = exp(−Hquadr. (Q, P )) temperaturunabhängig macht.
Im Volumenelement bedeutet dies
fq
dVΓquadr. (q, p) = (kB T ) 2 dVΓquadr. (Q, P ) ,
wobei dVΓquadr. (q, p) das Volumenelement für die quadratisch eingehenden Variablen ist
und fq die Gesamtzahl der quadratisch eingehendenn q’s und p’s, also die Dimension von
dVΓquadr. (q, p). Daher hat Zquadr. die Form
Zquadr. (T, V, N ) = (kB T )fq /2 Z̃quadr. (V, N ) ,
wobei Z̃quadr. (V, N ) unabhängig von der Temperatur ist. Also gilt
Fquadr. (T, V, N ) = −
kB T
fq ln kB T − kB T ln Z̃quadr. (V, N )
2
und
Squadr. = −
kB
kB
∂Fquadr.
=
fq ln kB T −
fq
∂T
2
2
+kB ln Z̃quadr. (V, N )
kB fq
∂Squadr. CV quadr.
=
=
T
∂T V
2 T
was CV quadr. /fq = kB /2 liefert, wie behauptet, und nach Integration bezüglich T
hE quadr. i =
kB T
fq .
2
Den Erwartungswert hEquadr. i kann man auch direkter bestimmen aus
hEquadr. i = −
fq
∂
ln Zquadr. = kB T ,
∂β
2
woraus ebenfalls CV quadr. = fq kB /2 folgt.
Eine Anwendung des Gleichverteilungssatzes ist die Berechnung der spezifischen Wärme von
Festkörpern bei so hohen Temperaturen, daß die klassische statistische Mechanik anwendbar ist. Die Atome des Kristalls führen in guter Näherung harmonische Schwingungen um
44
ihre Gleichgewichtslagen aus, d.h. sämtliche 3N Koordinaten und 3N Impulse gehen in die
Hamiltonfunktion quadratisch ein. Dies ergibt nach dem Gleichverteilungssatz
1
CV = kB · 6N = 3N kB
2
(Dulong Petitsche Regel) .
Diese “Dulong Petitsche Regel“ ist empirisch recht gut bestätigt. Harmonische Schwingungen
(dies stets mit Impuls und Koordinate quadratisch in die Hamiltonfunktion eingehen) sind
nur dann klassisch behandelbar, wenn ihre Frequenz ω die Bedingung h̄ω hEiklass = kB T
erfüllt. Andernfalls, für kB T <h̄ω, ist die Schwingung “eingefroren“ und nimmt nicht mehr
∼
an der gleichförmigen Energieverteilung (Äquipartition) teil.
Um dies zu sehen, berechnen wir die Wärmekapazität eines harmonischen Oszillators
quantenmechanisch. Aus
1
% = e−βH
Z
2
2 2
folgt mit H = p /2m + (m/2)ω q
Z = T re−βH =
X
n
hn|e−βH |ni
unter Verwendung des vollständigen Systems von Eigenzuständen |ni des Hamiltonoperators
1
|ni
H|ni = h̄ω n +
2
Z=
∞
X
1
e−βh̄ω(n+ 2 ) =
n=0
Also
hEi = −
e−βh̄ω/2
.
1 − e−βh̄ω
1
∂ ln Z
= h̄ω hni +
∂β
2
mit
hni =
1
eβh̄ω
Für die spezifische Wärme liefert dies
∂hEi
C=
= kB
∂T
−1
.
βh̄ω/2
sinh βh̄ω
2
!2
mit folgendem Temperaturverlauf, wobei kB T in Einheiten von h̄ω genommen wird
45
1
C/k
0.8
0.6
0.4
0.2
0
0.2 0.4 0.6 0.8
1
1.2 1.4 1.6 1.8
2
kT
Spezifische Wärme C/k einer harmonischen Schwingung
Wir sehen, daß für kB T h̄ω der Beitrag C der harmonischen Schwingung zur spezifischen Wärme den klassischen Wert 2kB /2 gemäß dem Gleichverteilungssatz annimmt, aber
auch wie die beiden “Schwingungsfreiheitsgrade“ fq = 2 für kB T <h̄ω aus der spezifischen
∼
Wärme herausfallen. Ähnliches gilt für die Rotationsfreiheitsgrade, z.B. in Gasmolekülen,
deren kinetische Energie der Rotation sich schreiben läßt als
Hrot =
3
1X
Θi ωi2 ,
2 i=1
wobei die Θi die Hauptträgheitsmomente und die ωi die Winkelgeschwindigkeiten um die
Hauptträgheitsachsen sind. Solange keine der Rotationen ausgefroren ist, und falls die nichtlineare Kopplung zwischen Rotationen und Vibrationen (durch Veränderung der Trägheitsmomente durch die Vibrationen) vernachlässigbar sind, nimmt jedes derartige Gasmolekül
mit 3 zusätzlichen “Rotationsgraden“ fq = 3 an der Energiepartition teil. Quantenmechanisch haben die ersten Rotationsniveaus Energien der Größe h̄2 /2Θi . Äquipartition kann
man daher annehmen falls kB T h̄2 /2Θi . Andernfalls werden auch die Rotationsfreiheitsgrade ausgefroren. Insbesondere bei hantelförmigen Molekülen ist das Trägheitsmoment um
die Achse parallel zur Hantel verschwindend klein, die Rotation um diese Achse ist also
stets ausgefroren. Gase wie N2 , O2 haben Moleküle mit 3 Translationsimpulskomponenten,
2 Streckschwingungskoordinaten (Koordinate und Impuls) und 2 Drehimpulskoordinaten
die (näherungsweise) quadratisch in die Hamiltonfunktion eingehen. Ihre spezifische Wärme
bei sehr hohen Temperaturen beträgt daher cv = 7kB T /2, die für T ≤ h̄ω/kB (ω= Frequenz der Streckschwingung) auf cv = 5kB T /2 abfällt und dann für T ≤ h̄2 /2ΘkB auf
cv = 3kB T /2 ausfriert. Bei Zimmertemperatur sind meist die Schwingungsbeiträge schon
ausgefroren, die Rotationsbeiträge dagegen noch nicht. Ein Gas wie CO2 hat noch immer
hantelförmige Moleküle, doch gibt es eine symmetrische und eine unsymmetrische Streckschwingung mit je 2 Schwingungsfreiheitsgraden und zwei unabhängige Knickschwingungen
transversal zur Hantelachse nochmals mit je 2 Schwingungsfreiheitsgraden, was eine spezifische Wärme cv = 13kB T N/2 bei sehr hohen Temperaturen ergibt. Planare 3-atomige und
komplizierte 3-dimensionale Moleküle haben 3 Rotationsfreiheitsgrade und cv = 6kB T /2 bei
Temperaturen, für die die Schwingungsfreiheitsgrade nicht aber die Rotationsfreiheitsgrade
46
ausgefroren sind.
18
Paramagnetismus
Betrachten wir ein Gas von Molekülen mit magnetischen Momenten µ in einem äußeren
Magnetfeld H. Die magnetische Energie eines Moleküls ist die Zeeman-Energie
hz = −µ · H .
m ist proportional zum Gesamtdrehimpuls h̄J des Moleküls µ = gµo J, wobei g der LandéFaktor ist und µ0 = eh̄/2me c das Bohrsche Magneton mit der Elektronenmasse me . Zeigt H
in z-Richtung gilt
hz = −gµ0 Jz H .
Jz = m kann 2J + 1 Werte zwischen −J und J annehmen. Der Mittelwert der magnetischen
Energie pro Molekül wird daher
hhz i =
J
1 X
∂
ln Z
hz e+βgµ0 mH = −
Z m=−J
∂β
mit
Z=
X
e
βgµ0 mH
m
1 − e−(2J+1)βgµ0 H
=e
1 − e−βgµ0 H
sinh[(J + 12 )βgµ0 H]
.
=
sinh[ 12 βgµ0 H]
βgµ0 mJH
Dies ergibt
E/N = hhz i = −
1
1
gµ0 H
(2J + 1) coth[ J +
βgµ0 H] − coth[ βgµo H]
2
2
2
mit den beiden Grenzfällen
hhz i → −gµ0 HJ (kB T Jgµo H)
1 (gµ0 H)2
J(J + 1) (kB T Jgµo H) .
hhz i → −
3 kB T
Die mittlere Zeeman-Energie pro Spin als Funktion von Temperatur und Magnetfeldstärke
zeigt die folgende Figur:
47
0
-2
-4
E/N
-6
-8
-10
0
-10
-5
5
10
kT
0
gµH
5
15
20 10
Mittlere Energie pro Spin als Funktion von T und H für J = 1
wobei in der Figur µ0 als µ abgekürzt wird und für alle Achsen die gleiche willkürliche Energieeinheit gewählt wird. In beiden Grenzfällen strebt der magnetische Anteil zur spezifischen
Wärme
∂hhz i
ch =
∂T
gegen Null ch → 0, mit einem Maximum für kB T ∼ (1/2)Jgµ0H.
0.6
0.5
c/k
0.4
0.3
0.2
0.1
0
0
0
2
5
4
10
kT
6
15
gµH
8
20 10
Spezifische Wärme c als Funktion von T und H für J = 1
Die mittlere Magnetisierung pro Molekül können wir ebenfalls aus Z berechnen mit
hµz i = gµ0 hJz i =
1 ∂ ln Z
hhz i
=−
,
β ∂H
H
was die Grenzfälle
hµz i → gµ0 J
(kB T Jgµ0 H)
48
hµz i → −
1 (gµ0 )2
HJ(J + 1) (kB T Jgµo H)
3 kB T
ergibt. Die mittlere Magnetisierung pro Spin in Einheiten gµ0 für verschiedene Werte von J
zeigt die nächste Figur:
2
<m>
1.5
1
0.5
0
1
2
3
4
gHµ/kT
5
6
Mittlere Magnetisierung pro Spin für J = 1/2, 1, 3/2, 2
Die magnetische Suszeptibilität des Gases pro Molekül erhalten wir damit als
∂hµz i
1 ∂ 2 ln Z
1 ∂hhz i
=
= − 2β
2
∂H
β ∂H
H
∂β
T
kB T ∂hhz i
= 2 ch .
=
2
H ∂(kB T )
H
χ=
die wir ebenfalls auftragen
5
4
χ
3
2
1
1
1.5
2
2.5
0
0
1
2
3
4
5
0
0.5
gµH
6 3
kT
Suszeptibilität χ/(gµ)2 als Funktion von T und H für J = 1
49
Insbesondere gilt für kB T Jgµ0 H
χ=
gµ20
J(J + 1) .
3kB T
Die Abhängigkeit χ = D/T ist als Curiesches Gesetz bekannt mit der Curieschen Konstanten
D. Wir sehen, daß das Curiesche Gesetz einhergeht mit einer Magnetfeldabhängigkeit der
Wärmekapazität
2N DH
∂CH =
,
(18.1)
∂H T
T2
aus deren Messung man die Curiesche Konstante für ein gegebenes Gas bestimmen kann.
Paramagnetismus kann von einem nichtverschwindenden Gesamtdrehimpuls der Elektronenhülle stammen, in welchem Fall |µ| von der Größenordnung des Bohrschen Magnetons ist,
oder, falls dieser verschwindet, vom Kernspin mit einem viel (etwa 1000-mal) kleineren magnetischen Moment. Kernspins richten sich daher im Magnetfeld erst bei einer ca. 1000-mal
kleineren Temperatur kB T <Jgµ0 H aus als Elektronenspins oder Drehimpulse der Elektro∼
nenhülle. Diese Eigenschaft macht man sich bei dem später zu diskutierenden Kühlverfahren
durch adiabatische Entmagnetisierung zunutze.
Eine Besonderheit von Spinsystemen ist es, daß die Energie nach unten und auch nach
oben beschränkt ist. Die Entropie nimmt für große Energien wieder ab,
1
0.8
0.6
S/kN ln(2J+1)
0.4
0.2
-1
-0.5
00
0.5
E/NgµH
1
Entropie s(e, H) für |T | < 4gµH im Fall J = 1
was zu negativen Temperaturen führt. Diese sind in gewisser Weise noch heißer als T =
∞, denn von kleinen zu großen Energien durchläuft man erst T von 0 bis ∞ und dann
anschließend von −∞ bis −0.
19
1-dimensionales Ising Modell
und Transfer-Matrix Methode
Das Ising-Modell ist zunächst ein klassisches Modell für einen Ferromagneten mit einer eventuell durch das Kristallgitter vorgegebenen leichten Richtung der Magentisierung. Darüber
50
hinaus kann es zur Modellierung einer Unzahl von Vielteilchensystemen verwendet werden.
Mikroskopisch besteht der Magnet in diesem Modell aus Spins mit dem Wert s = 1/2,
die auf einem regelmäßigen Kristallgitter gegebener Symmetrie (z.B. ein kubisches Gitter)
angeordnet sind. Die Spins haben nur 2 Einstellmöglichkeiten in die magnetisch leichte Richtung ms = 1/2 und ms = −1/2. Nächst benachbarte Spins auf dem Kristallgitter können
wechselwirken, und zwar erhält man Energieabsenkung um −J bei Parallelstellung und Energieerhöhung um +J bei Antiparallelstellung. J wäre quantenmechanisch proportional zum
Überlappungsintegral der Elektronenwellenfunktionen in den d-Schalen benachbarter Atome des ferromagnetischen Materials: Bei Parallelstellung der benachbarten Elektronenspins
werden diese Elektronen wegen des Pauli-Prinzips auf Abstand gehalten, wodurch ihre positive Coulombenergie verringert, also abgesenkt wird. Führen wir an jedem Gitterpunkt i
eine Spinzufallsvariable si = 2msi mit den möglichen Werten +1, -1 ein, so schreibt sich die
Energie des Ising-Modells in einem äußeren Magnetfeld Hz entlang der magnetisch leichten
Richtung
X
JX
si
H=−
si sj − h
2 hiji
i
mit h = 1/2gµoHz . Hierbei bedeutet hiji in der Doppelsumme, daß nur über Paare von
nächsten Nachbarn auf dem Gitter summiert wird. Es gibt natürlich Verallgemeinerungen
des Ising-Modells, wo jeder Spin statt 2 nun p > 2 Einstellmöglichkeiten hat (Potts-Modell),
oder wo auch übernächste Nachbarwechselwirkungen betrachtet werden, oder wo das Austauschintegral negativ ist, oder oszilliert vom nächsten zum übernächsten Nachbarn etc.
Außerdem kann das Ising-Modell zur Beschreibung von Gittergasen verwendet werden, in
denen Atome nur auf den Punkten eines festen Gitters sitzen können, die entweder besetzt
sind, pi = (1 + si )/2, oder nicht pi = (1 − si )/2.
Das 1-dimensionale Ising-Modell wurde schon von Ising exakt gelöst. Das zweidimensionale Ising-Modell ohne äußeres Magnetfeld, Hz = 0, konnte in einer spektakulären Arbeit
von Onsager exakt gelöst werden. Die Lösung des zweidimensionalen Modells mit Hz 6= 0
wurde später von Yang gegeben. Das 3-dimensionale Ising-Modell ist dagegen bis heute nur
näherungsweise lösbar. Betrachten wir hier die Lösung des 1-dimensionalen Ising-Modells mit
Hilfe der Transfer-Matrix Methode, die leicht abgewandelt auf alle 1-dimensionalen Systeme
mit kurzreichweitiger Wechselwirkung anwendbar ist.
Die Hamiltonfunktion lautet:
H = −J
N
X
k=1
sk sk+1 − h
N
X
sk
k=1
wobei wir N Gitterplätze auf einer geschlossenen linearen Kette angenommen haben (zyklische Randbedingungen). Die auszuwertende Zustandssumme im kanonischen Ensemble hat
die Form
"
#
Z=
X
s1
...
X
sN
exp β
N
X
(Jsk sk+1 + hsk ) ,
k=1
wobei sn+1 = s1 angenommen wird (zyklische Randbedingung). In 1-dimensionalen Systemen
können wir uns bei der Ausführung der Summen z.B. von links nach rechts durch das Gitter
hindurcharbeiten. Zur Auswertung definieren wir die symmetrische reelle Matrix
Qss0 = hs|Q|s0 i
51
in bewußt quantenmechanisch inspirierter Notation, welche die Zustandssumme in die Form
bringt
X
X
. . . hs1 |Q|s2 ihs2 |Q|s3 i . . . hsN |Q|s1 i .
Z=
s1
sN
Offenbar leistet die Wahl
0
Qss0 = eβJss +
βh
(s+s0 )
2

=

eβJ+βh
e
−βJ
e−βJ
e
βJ−βh



(19.1)
0
genau dieses. Denn im Produkt steuert dies Qss0 den richtigen Term eβJss bei jeweils der
Hälfte von βhs und βhs0 im Exponenten, wobei aber jedes s und s0 als erster und als zweiter
Matrix-Index vorkommt. Qss0 heißt Transfer-Matrix, weil sie in der Zustandssumme einen
Transfer von einem Gitterplatz zum nächsten auf unserer 1-dimensionalen Kette bewirkt.
Tatsächlich kann man die Summen über s2 , s3 , . . . , sn in (19.1) nun sofort ausführen mit
dem Ergebnis
X
Z = hs1 |QN |s1 i = T rQN .
s1
Die Zustandssumme ist also als Spur der N -ten Potenz (N =Zahl der Gitterplätze) der
Transfer-Matrix gegeben. Die Wechselwirkung steckt allein in den Matrixelementen. Die Faktoren von QN wechselwirken dagegen untereinander nicht. Diagonalisieren wir die TransferMatrix, so erhalten wir die beiden Eigenwerte
λ± = e
βJ
cos βh ±
q
2
cosh βh −
2e−2βJ
sinh 2βJ
,
wobei λ+ > λ− . Die freie Energie pro Spin erhalten wir aus
ln Z(T, h, N )
.
N →∞
N
f (T, h) = −kB T lim
Die Zustandssumme ergibt sich als
N
Z = T rQN = λN
+ + λ− ,
also
N
f (T, h) = −kB T lim N −1 ln(λN
+ + λ− ) ,
N →∞
= −kB T ln λ+ .
Im thermodynamischen Limes wird also die freie Energie pro Teilchen proportional zum
Logarithmus des größten Eigenwerts der Transfer-Matrix. Dies ergibt explizit:
f (T, h) = −J − kB T ln cosh βh +
q
2
cosh βh −
2e−2βJ
sinh 2βJ
woraus sich Entropie pro Spin s = −∂f (h, T )/∂T ), spezifische Wärme pro Spin ch =
und Suszeptibilität pro
T ∂s/∂T = −T ∂ 2 f (h, T )/∂T 2 Magnetisierung pro Spin m = ∂f
δh
T
52
Spin χ = ∂m/∂h = −∂ 2 f /∂h2 durch Differentiationen ergibt. Für die Magnetisierung finden
wir
∂f
sinh βh
m=−
=q
∂h
cosh2 (βh) − 2e−2βJ sinh 2βJ
und für die Suszeptibilität bei h = 0
χ=
∂m
= β(1 − 2e−2βJ sinh βJ)1/2 .
∂h
Die Isothermen m = m(T, h) für feste Werte von T zeigt die nächste Figur:
1
<m>
4
3
2
0.4
0.5
0
-0.5
-1
-4
-2
0
2
4
gµH / 2J
Magnetisierung m pro Spin in Einheiten von gµ/2 für kT /J = 0.4, 2, 3, 4
Die Einheit m = 1 entspricht physikalisch mphys = 21 gµ0 . Das eindimensionale System
hat (anders als 3-dimensionale uniaxiale Ferromagnete) keinen Phasenübergang für endliche Temperaturen T > 0. Dies gilt allgemein für 1-dimensionale Vielteilchensysteme mit
kurzreichweitiger Wechselwirkung. Doch findet man für T → 0, h → 0, daß die freie Energie
und die aus ihr abgeleiteten Größen singulär wird. Einen solchen Punkt im Zustandsraum
nennt man einen kritischen Punkt. Betrachten wir den kritischen Punkt des 1-dimensionalen
Ising-Modells für T = 0, h = 0 genauer. Im Grundzustand zeigen bei verschwindendem
äußeren Magnetfeld alle Spins nach oben oder unten. Um einen einzelnen Spin umzudrehen,
braucht man eine Energie von 4J, da die Wechselwirkungsenergie für zwei Nachbarn aufgebracht werden muß. Der Boltzmann-Faktor für einen einzelnen Spin-Flip ist also x = e−4βJ .
Die freie Energie ist eine Funktion von y = (βh) und x
q
F + NJ
= g(x, y) = − ln cosh yh + sinh2 y + x .
N kB T
g(x, y) nicht analytisch in x für x → 0, sondern (für y → 0, d.h. → 0)
s
g(x, y) = gsing (x, y) = −|y| 1 +
x
.
y2
Außerdem hat m = M/N einen Sprung für T = 0 bei y = 0(h = 0)
(kB T )msing = −
sgn(y)
∂gsing
y
=q
=√
2
∂y
x+y
1 + (yx2 )2
53
und
2
(kB T ) χsing
∂msing ∂msing sgn(y)
= (kB T )
= (kT )
= √
∂h T
∂y x
x
2
(y)2
+1
x
!−3/2
eine Singularität für y → 0, x → 0. Tatsächlich ist (F + N J)/N kB T für T → 0, d.h. x → 0,
√
˜ y2 ) mit g̃(u) = 1 + u und
h → 0 eine Skalenfunktion g(x, y) = −|y|g̃(x/y 2 ) = −x1/2 g̃(
x
√
˜
g̃(v)
= 1 + v in x und y und x = 0, y = 0 ein kritischer Punkt.
20
Arbeit äußerer Kräfte und Druck
Statt durch thermische Kontakte kann der Abschluß eines Systems auch dadurch aufgehoben werden, daß es zwar thermisch isoliert bleibt, aber äußere Kräfte auf es einwirken.
Z.B. können wir, wie in den beiden vorangehenden Abschnitten, ein äußeres Magnetfeld anlegen und ändern oder die Wände des Behälters verschieben. Im ersten Fall sprechen wir
von magnetischer Arbeit, im zweiten von Volumenarbeit. In all diesen Fällen verändern wir
Parameter λ, die in die Hamiltonfunktion eingehen. Wir können diese Parameter natürlich
schnell verändern oder sehr langsam (“quasistatisch“), insbesondere auch so langsam, daß
stets das System im Gleichgewicht bleibt, welches dann durch das mikrokanonische Ensemble
des abgeschlossenen Systems mit dem augenblicklich vorliegenden Wert der sich (langsam)
ändernden Parameter ist. Solche Parameteränderungen heißen “quasistatisch-reversibel“, da
sie jeder Zeit umkehrbar sind. Bei einer “quasistatisch reversiblen” kurz: adiabatischen Änderung von Parametern λ in einem Hamiltonschen System ändert sich einerseits die Hamiltonfunktion H(q, p, λ) mit λ, andererseits auch die gesamt Energie des mechanischen Systems,
E = E(λ). D.h. bei der Parameteränderung wird Arbeit an dem System, oder von dem
System, geleistet. Wie bestimmt man E(λ) für ein mechanisches System? Im Prinzip hat
man so vorzugehen, daß man die (für festgehaltenes λ) erhaltene Energie des Systems, die
Hamiltonfunktion H(q, p, λ), durch adiabatische Invarianten wie in integrablen Systemen,
die Wirkungsintegrale
Z
1
Ii =
Σfε=1 pε dqε ,
2π Ci
ausdrückt
1
H(q, pλ) = H(I, λ).
Die sich ergebende Funkton E(λ) = H(I, λ) bestimmt die λ-Abhängigkeit der Gesamtenergie. Demzufolge ändert sich bei einer adiabatischen Zustandsänderung die mikrokanonische
Verteilung gemäß
1
%(q, p, λ) =
δ(H(q, p, λ) − E(λ)),
Σ(E(λ), λ)
d.h. es verschieben sich also sowohl die Hamiltonfunktion, als auch die Energie. Dabei gilt
für jeden instantanen Wert von λ die Energieerhaltung in der quasistatischen Form
H(q, p, λ) = E(λ)
1
Wir müssen dies nie wirklich praktisch auch tun. Wichtig ist allein, daß wir dies tun könnten, so daß
E(λ) im Prinzip so definierbar ist.
54
für den jeweiligen instantanen Wert von λ, aber eben mit λ-abhängigem E(λ). Wie ändert
sich die Entropie bei einer adiabatischen Zustandsänderung?
S(λ) = kB ln
mit
Σ(E(λ), λ) =
Also
∂
∂S
kB
dS =
=P
(E(λ), λ)
∂λ
∆E
Σ(E(λ), λ)
CF DN (2πh̄)f
Z
dVΓ δ(H(q, p, λ) − E(λ)).
P
(E(λ), λ)
kB
=
∂λ
Σ(E(λ), λ)
Berechnen wir die Terme der rechten Seite:
∂Σ(E, λ) =−
∂E λ
Z
!
∂Σ ∂E(λ)
∂Σ .
+
∂E λ ∂λ
∂λ E
dVΓ δ 0 (H(q, p, λ) − E)
Z
∂Σ(E, λ) ∂H(q, p, λ)
= + dVΓ δ 0 (H(q, p, λ) − E)
∂λ E
∂λ
Z
∂E(λ)
= dVΓ δ 0 (H(q, p, λ) − E)
.
∂λ
Setzen wir dies ein, so finden wir
dS =
∂S
dλ = 0 ,
∂λ
d.h. die Entropie ändert sich nicht bei adiabatischen Zustandänderungen, sie ist eine adiabatische Invariante. Quasistatisch-reversible Prozesse in thermisch isolierten Systemen verlaufen also mit dS = 0 und heißen “adiabatisch“. Durch Umkehrung der Parameteränderung
können wir die gleiche Folge von Gleichgewichtszuständen in umgekehrter Richtung durchlaufen, wobei die vorher dem System zugeführte Energie nun wieder abgegeben wird. Die
reversible Energieänderung für ein thermisch isoliertes System bei einer Parameteränderung dλ können wir aus der Bedingung dS = 0 berechnen, wenn wir die Entropie aus
S = kB ln Σ(E, V, N, λ) berechnet haben, wobei die Abhängigkeit von λ von der λ-Abhängigkeit der Hamiltonfunktion herrührt. Werden V, N konstant gehalten, so gilt nämlich
0 = dS =
woraus
∂S
∂S
dE +
dλ ,
∂E
∂λ
∂E ∂S = −T
.
∂λ S,V,N
∂λ E,V,N
Wenn insbesondere der Parameter λ mit dem Volumen identifiziert wird, so ändert sich die
Energie durch Volumenarbeit
d− A = −pdV
am System. Der Querstrich an d− A soll daran erinnern, daß die Arbeit vom Weg abhängt,
d− A also nicht das Differential einer Funktion A ist. Für einen adiabatischen Prozeß (dS = 0)
55
ist die Energieänderung dE = d− A = −pdV . In diesem Fall ist also der Druck p definiert
durch
∂E p=−
∂V S,N
und läßt sich bei Kenntnis von S = kB ln Σ(E, V, N ) als Funktion von E, V, N berechnen aus
∂S .
p=T
∂V E,N
Als Beispiel betrachten wir das ideale 1-atomige Gas. Die Volumenabhängigkeit seiner Entropie ist in
V
S = kB N ln + . . .
N
enthalten, woraus sich durch Differentiation
p=
kB N T
V
ergibt, also die bekannte Zustandsgleichung des idealen Gases. Wir können den Druck auch
durch Auswertung der kanonischen Zustandssumme Z aus ln Z berechnen, denn aus
F = E − TS
dF = dE − T dS − SdT
folgt, falls nur T und V variiert werden (also N und alle weiteren λ konstant bleiben)
dF = dE − T
also
∂S
∂S
dE − T
dV − SdT = −pdV − SdT ,
∂E
∂V
∂ ln Z(β, V, N, λ) ∂F = kB T
p=−
∂V T,N,λ
∂V
T,N,λ
und allgemein
∂E ∂S ∂F ∂ ln Z =
−T
=
=
−k
T
.
B
∂λ S,V,N
∂λ E,V,N
∂λ T,V,N
∂λ T,V,N
Können zwei thermisch isolierte Systeme Volumen miteinander austauschen, z.B. über eine
thermisch isolierende aber bewegliche Trennwand, so zeigt eine Betrachtung ganz analog
zum Energieaustausch, daß Σ(E)
∂S1
∂S2
=
∂V1
∂V2
also
p
p
=
T 1
T 2
56
die Gleichgewichtsbedingung ist. Besteht außerdem noch thermischer Kontakt, so gilt im
Gleichgewicht zusätzlich T1 = T2 und es besteht auch ein Druckgleichgewicht p1 = p2 .
Wie stark ein System auf Druckänderungen reagiert wird durch die Kompressibilitäten
adiabatische Kompressibilität
isotherme Kompressibilität
1 ∂V κS = −
V ∂p S
1 ∂V κT = −
V ∂p T
charakterisiert. Weitere Größen, welche die Antwort eines Systems auf Temperaturänderungen charakterisieren, sind neben der schon bekannten Wärmekapazität CV
∂E ∂S CV =
=
T
∂T V,N
∂T V,N
(wegen dE|V,N = T dS|V,N )
die Wärmekapazität bei konstantem Druck
∂H ∂S =
Cp = T
∂T p,N
∂T p,N
(mit der Enthalpie H = E + pV )
und der thermische Volumenausdehnungskoeffizient
1 ∂V αp =
.
V ∂T p,N
Folgende Identitäten lassen sich durch Umrechnung der partiellen Ableitungen herleiten
κT (Cp − CV ) = T V αp2
Cp (κT − κS ) = T V αp2
und daraus
κT
Cp
=
.
CV
κS
Leiten wir als Beispiel die erste der obigen Identitäten ab:
∂E ∂V ∂E ∂H =
+
p
=
+
Cp =
∂T p,N
∂T p,N
∂T p,N
∂T V,N
= CV − V
Nun ist
!
∂E + p αp .
∂V T
∂E +p
∂V T
∂E ∂E ∂E ∂S ∂S =
+
= −p + T
∂V T
∂V S
∂S V,N ∂V T
∂V T
und, gemäß einer “Maxwell-Relation“
∂S ∂ ∂F
∂ ∂F
∂p =−
.
=−
=
∂V T
∂V ∂T
∂T ∂V
∂T V
57
!
∂V ∂T p,N
Also ist
∂p ∂E = −p + T
.
∂V T
∂T V
Aus der Zustandsgleichung V = V (T, p) folgt bei konstantem Volumen
∂V ∂V dV =
dT +
dp = 0 ,
∂T p
∂p T
daß
αp
∂p .
=−
∂T V
κT
Also ist
αp
∂E = −p − T
∂V T
κT
und schließlich
Cp − C V = T V
21
αp2
.
κT
van der Waals Gleichung
Betrachten wir ein klassisches Gas von wechselwirkenden Teilchen mit einem harten Kern
mit Radius a/2 und einer sehr langreichweitigen anziehenden Wechselwirkung −W (|xi − xj |)
und einem harten Kern bei kurzen Abständen a/2. Dichte des Gases und Reichweite der
Wechselwirkung seien so groß, daß immer viele Teilchen untereinander wechselwirken. Die
Zustandsumme ist
Z(T, V, N ) =
1
N !(2πh̄)3N
mit
V (|xi − xj |) =
V
0
Z





d3N pd3N x e
∞
−β
X
p2
i +1
2m
2
i
X
i,j
|xi − xj | ≤ a
V (|xi −xj 1)
.
−W (|xi − xj |) |xi − xj | > a
a
r
Form des Wechselwirkungspotentials in der Herleitung der van der Waals Gleichung
58
Durch Ausführen der Impulsintegrale reduziert sich das Zustandsintegral auf
1 1
Z(T, V, N ) =
N ! λ3N
T
Z
d
3N
xe
− β2
X
i,j
V (|xi −xj |)
mit der thermischen deBroglie Wellenlänge
λT =
2πh̄2
mkB T
!1/2
.
Nun folgen eine Reihe von Näherungen, die qualitativer Natur sind. Ziel ist eine Zustandsgleichung herzuleiten, die qualitativ Vielteilchensysteme im ganzen Bereich zwischen dem
idealen Gas, für geringe Dichte und hohe Temperaturen und Flüssigkeiten, für hohe Dichte
und tiefe Temperaturen beschreibt. Wir führen dazu eine Zelleneinteilung des Gasvolumens
in unterscheidbare Zellen mit Volumen ∆ durch, so daß stets viele Teilchen Nα in jeder Zelle
α sind. Innerhalb jeder Zelle vernachlässigen wir die langreichweitige anziehende Wechselwirkung. Jede Zelle trägt mit einem Faktor
γ(Nα ) = (∆ − Nα δ)Nα
R
zum Integral dq1 . . . dq3N bei, wobei δ das Volumen 4πa3 /3 des harten Kerns ist. Außerdem
Q
gibt N !/ α Nα ! verschiedene Arten N ununterscheidbare Teilchen auf unterscheidbare Zellen
zu verteilen, so daß in jeder Zelle Nα Teilchen sind. Die Ununterscheidbarkeit der Teilchen
wird durch Division mit N ! schon berücksichtigt. Zwischen den Zellen herrscht dann die
P
P
anziehende Wechselwirkung −Wαα0 Nα Nα0 . Wir erhalten (mit 0 . . . = δN,P Nα . . .)
α
Z(T, V, N ) =
0
X
1
1
N!
Q
3N
N ! (λT ) {Nα } α Nα0
Y
α
!
β
γ(Nα ) e 2
P
αα0
Wαα0 Nα Nα!
woraus mit Stirlings Formel wird
Z(T, V, N ) =
mit
φ({Nα }) =
X
α
(
0
1 X
eφ({Nα })
3N
λT {Nα }
∆ − Nα δ
βX
Nα ln
+ Nα +
Wαα0 Nα Nα0
Nα
2 α0
)
.
Die Summen über Nα werden vom großen Term dominiert, wenn die Nα alle groß sind. ExP
trema von φ unter der Nebenbedingung α Nα = N erfüllen mit dem Lagrange-Parameter χ
X
∂
(φ({Nα }) − χ
N α0 ) = 0
∂Nα
0
α
oder
ln
X
∆ − Nα δ
Nα δ
−
+β
Wαα0 Nα0 = χ .
Nα
∆ − Nα δ
α0
Eine räumlich homogene Lösung, welche die Nebenbedingung erfüllt, ist natürlich
Nα = N ∆/V ,
χ = ln
V − Nδ
Nδ
N
−
+ β W0
N
V − Nδ
V
59
mit
W0 =
X
Wαα0 ∆ =
α0
Z
d3 rw(r) .
Die freie Energie im thermodynamischen Limes ist mit n = N/V = 1/v
ln Z(β, V, N )
= −kB T lim φmax /N + 3kB T ln λT (T ) (21.1)
N,V →∞
N,V →∞
N
)
(
β
1 − nδ
= −kB T ln
+ 1 + nW0 + 3kB T ln λT (T ) .
(21.2)
n
2
f (n, T ) = −kB T
lim
Die Zustandsgleichung ergibt sich aus
∂f (n) ∂F =−
p=−
∂V T,N
∂(1/n) T
=
1
nkB T
− n2 W 0 .
(1 − nδ) 2
Diese Zustandsgleichung läßt sich umschreiben in die Form
!
aN 2
p + 2 (V − N b) = N kB T
V
mit a = W0 /2, b = δ und ist als van der Waalsche Zustandsgleichung bekannt. Die hier
gegebene Ableitung stammt von L.S. Ornstein, Doktorarbeit, Leiden 1908. Die Isothermen
im (p, V )-Diagramm zeigt die nächste Figur
0.14
0.12
0.1
kritischer
Punkt
0.08
2
pb /a
Isotherme T/Tc =.85
0.06
0.04
B
0.02
C
D
A
0
2
4
6
8
10
v/b
Isothermen des van der Waals Gases zwischen T /T c = 0.8 und 1.15
Die niedrigste eingezeichnete Isotherme (für T = 0.8Tc ) ist teilweise unphysikalisch, da negative Drucke auftreten, die in der Figur abgeschnitten wurden. Für T < Tc = (8/27)(a/kB b)
haben die Isothermen einen Teil mit (∂p/∂v)T > 0, wo also bei Reduzierung des Volumens
60
der Druck abnimmt, was rein intuitiv auf eine Instabilität hinweist! Unsere räumlich homogene Lösung ist allerdings nur dann korrekt, wenn sie auch wirklich dem absoluten Maximum
von φ (d.h. dem absoluten Minimum) entspricht. Das kann nur dann der Fall sein, wenn
wenigstens ein lokales Maximum von φ vorliegt, d.h. wenn
∂ 2 φmax /V
<0
∂n2
ist, was äquivalent ist zu
∂p(T, n)
∂p(T, v) 2
∂ 2 nf (n, T ) =
=−
v
0<n
2
∂n
∂n
∂v
max
d.h. also zu (∂p/∂v)T < 0. Doch reicht diese Bedingung für ein globales Maximum von φ
noch nicht aus. Denn im Bereich T < Tc gibt es auch bei gleichem Druck inhomogene Lösungen, wo zwei homogene Lösungen aus dem lokal stabilen Bereich räumlich koexistieren. Eine
ausführliche Diskussion im Rahmen der hier betrachteten Herleitung gibt N.G. van Kampen,
Phys. Rev. 135A, 362 (1964). Hier geben wir uns mit einer vereinfachten (aber allgemeiner anwendbaren) Betrachtung zufrieden.Tragen wir zunächst unser bisheriges Ergebnis für
f (N/V, T ) als Funktion von v = V /N für festes T < Tc auf.
Wendepunkte
-0.7
A
B
-0.8
Fb / Na
-0.9
-1
2
4
6
8
v/b
10
12
14
16
Freie Energie F/N des van der Waals Gases für T /T c = 0.85
Aus diesem Diagramm und dem Diagramm der Isothermen p = −∂F/∂V lesen wir ab, daß
F (V ) zwei Wendepunkte hat, welche den Punkten A und B entsprechen, und eine stark
negative Steigung für V → N b und Steigung 0 für V → ∞. Dabei fällt F (V ) für alle
V > N b monoton mit wachsendem V , da p = −∂F/∂V > 0. Damit stets Stabilität gewahrt
ist, ∂p/∂V < 0, sollte ∂p/∂V = −∂ 2 F/∂V 2 < 0 überall gelten, d.h. F sollte eine nach unten
konvexe Funktion sein. Wenn wir 2 koexistierende Lösungen (“Phasen“) im stabilen Bereich
einführen, die nach dem gerade festgestellten 2 verschiedenen Punkten auf dem nach unten
konvexen Teil der F -Kurve entsprechen müssen, also dem Bereich außerhalb des Intervalls
(A, B), so wird die F -Kurve in dem Bereich zwischen diesen Punkten durch die gerade
Verbindungslinie zwischen beiden Punkten ersetzt, da sich in diesem Bereich das Volumen
61
und die freie Energie ändern, indem Teilchen von einer Phase in die anderen übergehen und
es gilt
N1 N2
V =
+
, F = f 1 N1 + f 2 N2 , N = N 1 + N 2 .
n1
n2
Hierbei beziehen sich die Indizes 1, 2 auf die koexistierende Phasen. Elimination von N1 , N2
aus diesen Gleichungen liefert die behauptete lineare Funktion für F im Koexistenzbereich
F =
n1 f1 (n2 V − N ) − n2 f2 (n1 V − N )
.
n2 − n 1
Damit nun längs der gesamten F -Kurve Stabilität herrscht (und in unserer Rechnung φ wirklich maximiert wird) müssen, die beiden koexistierenden Phasen so eingeführt werden, daß
die gesamte F -Kurve nach unten konvex wird. Die entsprechende Konstruktion ist eindeutig
und heißt “Bildung der konvexen Hülle“ der Kurve. Das Ergebnis ist
-0.7
konvexe Hülle
C A
B
-0.8
Fb/Na
D
-0.9
-1
2
4
6
8
10
12
14
16
v/b
Freie Energie F/N des van der Waals Gases für T /T c = 0.85
Per Konstruktion liegt nun F im 2-Phasengebiet unter dem F der 1-Phasenzustände, d.h. die
Koexistenz der beiden Phasen bildet das wahre Minimum von F . Man macht sich leicht klar,
daß die beschriebene Konstruktion im p−V -Diagramm der bekannten Maxwell-Konstruktion
R
äquivalent ist, denn CD pdV über die 1-Phasen-Zustände und die Koexistenzlinie muß gleich
sein, damit in C und D die konvexe Hülle die ursprüngliche F -Kurve berührt. C und D
sind die koexistierenden Phasen, A und B sind die “Spinodalpunkte“ bis zu denen man
höchstens Flüssigkeiten überhitzen (B) und Gase unterkühlen kann (A), bevor endgültig
auch lokal Instabilität (∂p/∂V |T > 0) einsetzt.
62
22
Hauptsätze der Thermodynamik
Wir sind nun in der Lage, die Hauptsätze der Thermodynamik auf statistischer Grundlage
zu formulieren:
0. Hauptsatz
Sind zwei Systeme mit einem dritten im thermischen Gleichgewicht, so sind sie auch
untereinander im thermischen Gleichgewicht. Dieser Satz wurde im “Temperatur“ Abschnitt aus der statistischen Gleichgewichtsbedingung beim thermischen Kontakt zweier Systeme bewiesen: Aus
P
P
∂ ln 1
∂ ln 3
=
∂E1
∂E3
P
P
∂ ln 3
∂ ln 2
=
∂E2
∂E3
folgt trivialer Weise
P
∂ ln
∂E1
1
P
∂ ln 2
=
.
∂E2
1. Hauptsatz (Energiesatz)
Jeder Systemzustand besitzt eine mittlere Energie E, welche in abgeschlossenen Systemen gleich der Gesamtenergie ist und erhalten bleibt. In nicht abgeschlossenen Systemen ändert sich die mittlere Energie sowohl durch Arbeit, die am System geleistet
(positiv gezählt) oder vom System verrichtet (negativ gezählt) wird, als auch durch
Energieübertrag (positiv, falls dem System zugeführt) bei thermischem Kontakt. Der
Energieübertrag bei thermischem Kontakt heißt die übertragene Wärmemenge. Differentiell
dhEi = d− A + d− Q .
Hierbei drückt die Notation d− aus, daß die betreffenden Größen zwar differentiell klein
aber wegabhängig sind, d.h. nicht die Differentiale von Funktionen. Der erste Hauptsatz
drückt nur den Energiesatz aus. Arbeit wird geleistet, wenn Parameter λ, die in die
Hamiltonfunktion eingehen, wie z.B. das Volumen V (Volumenarbeit), Teilchenzahlen
Ni (chemische Arbeit) oder Magnetfeld H (magnetische Arbeit) geändert werden, so
daß sich die Hamiltonfunktion ändert
d− A =
Z
dVΓ (dH(q, p, λ))%(q, p, λ) =
*
∂H
∂λ
+
dλ .
Wärme wird übertragen, wenn sich die Verteilungsfunktion ändert, was auch zu einer
Änderung der mittleren Energie führen kann
−
dQ=
Z
dVΓ H(q, p, λ)d%(q, p, λ) .
Beide Größen zusammen liefern die Änderung der mittleren Energie,
dhEi = d
Z
dVΓ H(q, p)%(q, p) .
63
Im thermischen Gleichgewicht zwischen zwei Systemen ist der Wärmeübetrag reversibel, da Energie bei Schwankungen zwischen beiden Systemen hin- und herfließt. In
diesem Fall ist, ohne Arbeitsleistung, wie wir sahen
dhEi = d− Q = d− Qrev = T dS
mit der Boltzmannschen Entropie
S = kB ln
P
Q (E)
.
Kontrollieren wir, daß die statistische Definition des Wärmeübetrags
R
d− Q = dVΓ H(q, p, λ)d%(q, p, λ)
sich im reversiblen Fall auf T dS reduziert: Ändern wir durch reversiblen Wärmeübertrag die Temperatur um dT , so ändert sich die kanonische Verteilung nicht in ihrer
Form, sondern nur durch Verschiebung der Temperatur um dT , also
d%(q, p)rev
1
∂ ln Z
=
H+
2
kB T
∂β
!
e−βH
dT .
Z
Mit ∂ ln Z/∂β = −hEi ergibt sich daraus
−
d Qrev =
Z
1
dT (hE 2 i − hEi2 ) = CV dT
kB T 2
∂E = dE|V =const =
dS = T dS ,
∂S V
dVΓ Hd%(q, p)rev =
womit die Kontrolle durchgeführt ist.
Wird zusätzlich am System reversibel quasistatisch Arbeit verrichtet, wird, wie wir
sahen, die Entropie dadurch nicht zusätzlich verändert, und entsprechend dem ersten
Hauptsatz gilt
dhEi = T dS + d− Arev
Liegt kein Gleichgewicht vor, und auch bei nicht quasistatischer Arbeitsleistung, nimmt
S = kB ln ΣQ (E) durch Vergrößerung des erreichbaren Phasenraumvolumens zusätzlich
irreversibel zu, d.h.
dS =
1
d− Qrev
d− Q
dhEi − d− Arev =
>
T
T
T
oder kurz
d− Qrev > d− Q .
Entsprechend gilt d− Arev < d− A, da d− Arev + d− Qrev = dE = d− A + d− Q. Diese statistisch
begründeten Aussagen machen zusammen den 2. Hauptsatz aus, der den zentralen
Kern der Thermodynamik bildet und lautet:
2. Hauptsatz
Jedem Systemzustand ist eine Funktion zugeordnet, die Entropie S, mit den Eigenschaften
(a) Bei reversiblem Wärmeaustausch ist dS = d− Qrev /T
64
(b) Bei beliebigem Wärmeaustausch ist dS ≥ d− Q/T und nimmt insbesondere in
abgeschlossenen Systemen (d− Q = 0) zu oder bleibt gleich.
Schließlich gibt es eine letzte allgemeine Eigenschaft der Entropie, die zusammengefaßt
wird im sogenannten
3. Hauptsatz
Für T → 0 strebt die Entropie gegen eine von Details des Systems unabhängige Konstante s0 :
S(T )
= s0 .
lim lim
T →0 N →0 N
Diese Aussage folgt ebenfalls unmittelbar aus der statistischen Definition der Entropie.
Dazu müssen wir bedenken, daß der Grenzfall T → 0 der gleiche Grenzfall ist, in dem
die Energie E des Systems gegen die Energie E0 des Grundzustands strebt
T → 0 ⇐⇒ E → E0 .
Ist der Grundzustand nicht entartet, so ist
s0 = s(E0 ) = +kB ln 1 = 0 .
Nun kann allerdings in Vielteilchensystemen der Grundzustand durchaus entartet sein
(mit Entartungsgrad g(E0 )) und
s0 = kB ln g(E0 ) .
Doch ist der Entartungsgrad in der Regel keine exponentiell mit der Teichenzahl wachsende Funktion, sondern typisch wäre g(E0 ) < KN α mit von N unabhängigen Exponenten α und Konstanten K, die vom System abhängen. Also ist
S
1
< kB lim
(α ln N + ln K) = 0 .
T →0 N →0 N
N →∞ N
0 < s0 = lim lim
Daher gilt auch in diesem Fall s0 = 0.
Schließlich kann noch der Fall eintreten, wo das System Freiheitsgrade besitzt, die so
schwach an andere Freiheitsgrade gekoppelt sind, daß diese selbst bei den kleinsten
erreichten Temperaturen noch nicht ordnen und daher eine endliche Entropie liefern,
die im thermodynamischen Limes proportional zur Teilchenzahl ist. Ein Beispiel sind
die Spins von Atomkernen, welche z.B. in einem Festkörper noch völlig ungeordnet
sein können, wenn schon alle anderen Freiheitsgrade (z.B. die Position der Atome im
Kristallgitter, die Richtung der Elektronenspins) geordnet sind. Die von solchen Freiheitsgraden herrührende Restentropie s0 6= 0 ist dann aber universell für das System,
da sie von allen anderen Freiheitsgraden, die geordnet sind, nicht mehr abhängt. Außerdem ist anzunehmen, daß auch diese Restentropie bei noch weiterer Abkühlung
ebenfalls verschwindet.
65
23
Thermodynamische Prozesse
In diesem Abschnitt betrachten wir mit Hilfe der Hauptsätze der Thermodynamik und einiger Zustandsgleichungen für die verwendeten Materialien einige charakteristische thermodynamische Prozesse. Einige davon (Joule-Thomson Prozeß, Carnot-Prozeß, adiabatische
Entmagnetisierung) sind für Kühlverfahren bzw. deren Umkehrung-Wärmepumpen (z.B.
bei der Schwimmbadheizung) von praktischem Interesse.
23.1
Joulsches Experiment der freien Expansion eines Gases
Wir betrachten ein Gas, das durch eine Trennwand auf einen Teil eines Behälters eingeschränkt sei. Der gesamte Behälter sei gegenüber der Außenwelt isoliert. Wir analysieren
nun die Zustandsänderung des Gases, die eingetreten ist, falls es nach Öffnen eines Ventils
in den Rest des Behälters irreversibel ausgeströmt ist. (Gay-Lussac 1807, Joule 1843). Der
betrachtete Prozeß ist weder quasistatisch noch reversibel. Da der Behälter thermisch isoliert ist, gilt ∆Q = 0, also ist ∆S ≥ ∆Q = 0 positiv. Da das System abgeschlossen ist,
gilt für die Energieänderung zwischen Anfangs- und Endzustand ∆E = 0. Betrachten wir
zunächst nur eine differentielle Zustandsänderung der beschriebenen Art, d.h. das zusätzliche Volumen, in welches das Gas ausströmen kann, sei differentiell klein. Dann gilt für die
Temperaturänderung zwischen Anfangs- und Endzustand
∂T dV .
dT =
∂V E,N
Der Proportionalitätsfaktor soll durch die Zustandsgleichung des Gases ausgedrückt werden.
Aus
∂E ∂E dE =
dT +
dV = 0 (abgeschlossenes System)
∂T V
∂V T
gewinnen wir die Aussage
∂T 1 ∂E =−
.
∂V E,N
CV ∂V T,N
Ferner gilt wegen dE = T dS − pdV
∂E ∂S =T
−p.
∂V T,N
∂V T,N
Schließlich nutzen wir aus, daß ∂S/∂V |T,N proportional zu einer gemischten 2. Ableitung der
freien Energie F (T, V, N ) ist
∂ 2 F ∂2F
∂S =
−
=−
∂V T,N
∂V ∂T N
∂T ∂V
N
∂p =
.
∂T V,N
Thermodynamische Relationen dieses Typs heißen “Maxwell Relationen”. Listen wir noch
einige auf:
∂ 2 F ∂2F
=
∂V ∂T N
∂T ∂V
:
N
∂S ∂p =
∂V T,N
∂T V,N
66
∂2E
∂S∂V
∂2E
∂T ∂V
N
N
∂ 2 E ∂p ∂T =
=
:−
∂V ∂S N
∂S V,N
∂V S,N
∂ 2 E :
=
∂V ∂T N
∂S ∂2S
+T
∂V T,N
∂T ∂V
2
∂ S
∂T ∂V
bzw. T
N
V,N
!
=
=
∂p ∂CV
−
=
∂T V,N
∂V
∂CV
∂V
=
N
∂ p ∂T 2 2
bzw. T
∂CV
∂V
T,N
T,N
T,N
usw. Wir erhalten also für den Ausströmungsversuch ins Vakuum
∂T 1
=
∂V E,N
CV
∂p
p−T
∂T
V,N
−T 2 ∂
CV ∂T
p
T
.
V,N
Für ein ideales Gas ist p/T = N kB V unabhängig von T bei festem N, V . Daher liefert der
Ausströmungsversuch keine Temperaturänderung für ein ideales Gas, im Einklang damit, daß
E = N cv T gilt, also T = E/N cv unabhängig von V für festes E. Physikalisch rührt dies von
der fehlenden Wechselwirkung zwischen den Gasatomen her, die ihre Energie unabhängig von
ihrem mittleren Abstand macht. Die Entropie des idealen Gases nimmt bei diesem Prozeß
wie schon früher erwähnt stark zu, nämlich um dS = (∂S/∂V )E dV = Tp dV = NVkB dV .
Für ein van der Waals Gas ist
p
N kB
aN 2
=
−
T
(V − N b) V 2 T
also
und
∂
∂T
p
T
=
V,N
aN 2
V 2T 2
∂T aN 2
=− 2
.
∂V E,N
V CV
Die Volumenabhängigkeit der spezifischen Wärme CV des van der Waals Gases (oberhalb
von dessen kritischen Punkt) gewinnen wir ebenfalls aus seiner Zustandsgleichung als
∂CV
∂V
=T
T,N
∂2p
= 0.
∂T 2
d.h. die Wärmekapazität des van der Waals Gases ist wie beim idealen Gas von seiner
Teilchenzahl, nicht aber von seinem Volumen abhängig. Für den Ausströmungsversuch in
ein endliches Volumen ∆V können wir die Temperaturänderung durch Integration über V
mit CV = const bestimmen zu
∆T =
−aN 2
∆V
.
CV V (V + ∆V )
67
Bei einem wirklichen Versuch ist die Temperaturänderung geringer wegen der endlichen
Wärmekapazität CB des Behälters. Die gesamte Energieänderung ist dann
dE =
!
∂E ∂E + CB dT +
dV = 0 ,
∂T V
∂V T
d.h. in den bisherigen Beziehungen ist zu ersetzen
CV → C V + C B
was ∆T verringern wird.
23.2
Joule-Thomson-Prozeß
Die kontrollierte Entspannung eines thermisch isolierten Gases von einem Druck p1 auf einen
kleineren Druck p2 durch eine Drossel, d.h. eine poröse Trennwand, heißt Drosselpropzeß,
oder Joule-Thomson-Prozeß. Schematisch läuft der Prozeß wie folgt ab
Drossel
p1, T1
p2, T2
Joule-Thomson Prozeß
Auch dieser Prozeß ist weder quasistatisch, da er im allgemeinen bei endlicher Druckdifferenz
abläuft, noch reversibel. Die Arbeit und damit die Energie, welche pro Mol des umgesetzten
Gases dem System zugeführt wird, ist
∆a = +p1 v1 − p2 v2 = e2 − e1 ,
wobei die molaren extensiven Größen durch kleine Buchstaben symbolisiert sind, und das
Volumen des Gases links um |v1 | abnimmt, rechts um |v2 | zunimmt. Also ist bei dem Prozeß
die Zustandsfunktion H = E + pV pro umgesetztes Mol konstant. H heißt Enthalpie. Es ist
eine Legendre-transformierte Energie mit dem Differential
dH = dE + pdV + V dp = T dS − pdV + pdV + V dp = T dS + V dp .
Die natürlichen Variablen von H sind daher S, p und N . Die Temperaturänderung beim
Joule-Thomson-Prozeß bei differentiellem Druckunterschied p1 − p2 = −dp > 0 bestimmt
sich aus
∂H ∂H dH =
dT +
dp = 0 .
∂T p
∂p T
Wegen dH = T dS + V dp ist
∂S ∂H =T
= Cp .
∂T p
∂T p
68
Außerdem ist (∂H/∂p)T = T (∂S/∂p)T + V = −T (∂V /∂T )p + V , wobei die Maxwellsche
Relation (∂S/∂p)T = −(∂V /∂T )p benutzt wurde. Zusammengenommen erhalten wir
T 2 ∂V /T ∂T =
.
∂p H
Cp ∂T p
Für ein ideales Gas gilt also
∂T =0,
∂p H
d.h. die Temperatur eines idealen Gases ändert sich beim Drosselprozeß nicht. Dagegen
nimmt die Entropie auch bei diesem Prozeß zu um
V
|dp|
∂S dp = − dp = N kB
.
dS =
∂p H
T
p
Daran erkennen wir die Irreversibilität des Prozesses. Denn d− Q = 0 ist ja erfüllt, und wäre
der Prozeß reversibel, dann wäre 0 = d− Q = d− Qrev = T dS. Für ein van der Waals Gas findet
man mit der Annahme CV = (3/2)N kB

∂T 1  2a
=
∂p H
kB kB T
V − Nb
V
!2


5
−3a
− b /  −
2 kB T V
V − Nb
V
!2 

.
Für kleine Dichten N/V kB T /a, N/V b−1 vereinfacht sich dies auf (∂T /∂p)H '
(4a/kB T − 2b)/5kB . Für kleine Temperaturen kB T < b/2a ist (∂T /∂p)H > 0 und der Drosselversuch führt zur Kühlung. Allerdings wechselt der Koeffizient bei hohen Temperaturen
b 2
T > Tinv = (2a/kB b), genauer kB Tinv = 2a
( V −N
) , oder mit nochmaligem Gebrauch der
b
V
van der Waals Gleichung
2
p=
b
s
2akB Tinv
3 kB Tinv
a
−
− 2,
b
2 b
b
sein Vorzeichen, und beim Drosselversuch tritt Erwärmung ein. Der maximale Druck, bei
dem Inversion eintritt wird, bei
max
kB Tinv
=
8a
9b
2
erreicht und beträgt pmax
inv = a/3b .
Die Inversion des Joule-Thomson-Kühleffekts bei hohen Temperaturen wird wirklich bemax
max
max
obachtet (für CO2 gemessen: Tinv
= 1500K, Tinv
|vdw = 911K; für H2 : Tinv
= 202K
max
Tinv |vdw = 99K. Der Joule-Thomson-Prozeß wird zur technischen Verflüssigung von Gasen
(nach Vorkühlung unter die Inversionstemperatur) verwendet.
23.3
Adiabatische Entspannung von Gasen
Ein Gas wird in einem thermisch isolierten Behälter quasistatisch entspannt, wobei es reversibel Arbeit leistet. Bei diesem Prozeß ist die Entropie konstant da 0 = d− Q = d− Qrev = T dS
und die Energie nimmt ab
dE = −pdV .
69
Die Temperaturänderung ergibt sich aus
∂S ∂S dS =
dT +
dp = 0 (adiabatischer Prozeß) ,
∂T p
∂p T
also
∂T T ∂S T ∂V =−
=+
.
∂p S
Cp ∂p T
Cp ∂T p,N
Für ein ideales Gas liefert dies
N kB T
∂T =+
∂p S
Cp p
was integriert die Adiabatengleichungen ergibt:
T
=
T0
p
p0
! N kB
Cp
,
p
p0
V
=
V0
! N kB −1
Cp
T
=
T0
1− NCkp
B
,
die mit der aus der Zustandsgleichung folgenden Relation Cp − CV = N kB noch auf verschiedene andere Formen gebracht werden können. Für ein van der Waals Gas oberhalb
der kritischen Temperatur ist (∂V /∂T )p,N > 0 und adiabatische Entspannung führt zur
Abkühlung.
23.4
Adiabatische Entmagnetisierung
Ein paramagnetisches Salz wird im äußeren Magnetfeld bei fester Temperatur T0 magnetisiert, dann thermisch isoliert und quasistatisch entmagnetisiert, indem das äußere Magnetfeld langsam bis auf 0 zurückgefahren wird. Bei diesem letzteren Prozeß ist wiederum
dS = 0 und es gilt
∂S ∂S dS =
dT +
dH = 0 .
∂T H
∂H T
Der Prozeß und die Berechnung des Temperaturkoeffizienten (∂T /∂H)S sind weitgehend
analog zur adiabatischen Entspannung eines Gases. Wir erhalten analog zu dort mit dE =
T dS − hM idH
∂T T ∂S T ∂hM i =−
=−
.
∂H S
CH ∂H T
CH ∂T H,N
Für ein paramagnetisches Salz dessen Magnetisierung hM i dem Curieschen Gesetz genügt
hM i =
finden wir
wobei nach (18.1)
ND
H ,
T
∂T DH
>0,
=+
∂H S
cH (T, H)T
cH (T, H) = cV (T, 0) +
70
N DH 2
.
T2
Adiabatische Entmagnetisierung von elektronischem Paramagnetismus kann als Vorkühlmethode verwendet werden, um dann im 2. Schritt ein vorgekühltes System mit Kernspinparamagnetismus ebenfalls adiabatisch zu entmagnetisieren.
Ein qualitatives mikroskopisches quantenmechanisches Bild der beiden Prozesse isotherme Magnetisierung – adiabatische Entmagnetisierung, sieht wie folgt aus: Ein paramagnetisches Salz von (praktisch wechselwirkungsfreien) Atomen z.B. mit Spin J = 3/2 hat bei
hoher Temperatur T0 und kleinem Magnetfeld H0 vier praktisch gleich besetzte Energieniveaus pro Atom (a) .
e
(a)
e
(b)
S = const.
T = const.
P(h)
T, H
(c)
e
P(h)
T, H’>H
P(h)
T’<T, H
Kühlung durch isotherme Magnetisierung und adiabatische Entmagnetisierung
Bei isothermer Magnetisierung steigen die Abstände der Niveaus und es bildet sich bei gleicher Temperatur eine Boltzmann-Verteilung mit schwächerer Besetzung der höheren Niveaus
aus (b). Adiabatische Entmagnetisierung bedeutet Reduzierung von H ohne Änderung der
Besetzung der Niveaus (c). Es resultiert eine Boltzmann-Verteilung mit T1 < T0 .
23.5
Thermodynamische Kreisprozesse
Thermodynamische Kreisprozesse sind Sequenzen von Zustandsänderungen, bei denen der
Endzustand des Systens mit seinem Anfangszustand übereinstimmt. Bei einem thermodynamischen Kreisprozeß gilt für alle Zustandsgrößen Z wie z.B. Energie E, Entropie S, Volumen
V , Teilchenzahl N , Temperatur T , Druck p, freie Energie F , Enthalpie H, Magnetisierung
M etc. daß
I
dZ = 0 ,
wobei das Integral der Änderungen der Zustandsgrößen über den durchlaufenen Kreisprozeß
zu erstrecken ist. Zwei Kreisprozesse, die nicht existieren, sind gerade deshalb besonders
wichtig: Das Perpetuum
mobile 1. Art ist ein Kreisprozeß ohne Wärmeaustausch,
d− Q = 0,
H −
H
H
der Arbeit leistet, − d A > 0. Das ist unmöglich, da für d− Q = 0 gilt d− A = d− E = 0. Ein
Perpetuum mobile H2. Art ist
ein Kreisprozeß,
der ein Wärmereservoir abkühlt und Arbeit
H −
H −
−
leistet, also
0 < −H d A = (d HQ − dE) = dHQ. Er ist unmöglich, da nach dem 2. HauptH
satz 0 = dS > d− Q/T = T1 d− Q, woraus d− Q < 0 folgt. Ein spezieller auch technisch
wichtiger Kreisprozeß ist der bekannte Carnot-Prozeß, mit dessen Hilfe durch allmähliche
71
Abkühlung eines heißen Wärmereservoirs und Erwärmung eines kühleren Wärmereservoirs
von einem komprimierbaren und expandierbaren System Arbeit geleistet werden kann. Ein
Zyklus dieses Prozesses besteht aus 4 Phasen: Zuerst wird das System bei der kühleren Temperatur T1 unter Zufuhr von Arbeit ∆A1 isotherm komprimiert, sodann thermisch isoliert
und unter weiterer Zufuhr von Arbeit ∆A2 adiabatisch komprimiert solange bis es sich auf
die Temperatur T2 des heißeren Wärmereservoirs erwärmt hat, dann wird es im thermischen
Kontakt diesem zweiten Wärmebad bei der Temperatur T2 isotherm entspannt, wobei es
die Arbeit −∆A3 leistet und schließlich wieder thermisch isoliert und unter weiterer Arbeitsleistung −∆A4 adiabatisch auf sein ursprüngliches Volumen und seine ursprüngliche
Temperatur T1 expandiert. Die gesamte geleistete Arbeit ist
−∆A = −
I
d− A =
4
X
∆Ai .
i=1
Von technischem Interesse ist der Wirkungsgrad η dieses Prozesses, der definiert ist als
das Verhältnis insgesamt der geleisteten Arbeit −∆A zur Wärmeenergie ∆Q2 , die bei der
höheren Temperatur T2 (während der isothermen Expansionsphase) aufgenommen wurde.
Da während der isothermen Kompression eine Wärmemenge −∆Q1 an das kühlere Wärmereservoir abgegeben wird, kann −∆A nicht so groß werden wie ∆Q2 , sondern es gilt, weil es
sich um einen Kreisprozeß handelt,
∆E =
I
dE = ∆A + ∆Q1 + ∆Q2 = 0
also
η=
−∆A
∆Q1
= 1+
.
∆Q2
∆Q2
Die Existenz der Entropie als Zustandsgröße erlaubt es, eine universelle obere Grenze für
η abzuleiten, die als Carnotscher Wirkungsgrad ηc bekannt ist. Sind nämlich sämtliche Zustandsänderungen quasistatisch und reversibel, so gilt während der adiabatischen Phasen
des Prozesses
0 = d− Q = d− Qrev = T dS
und während der isothermen Phasen des Prozesses
∆Q1,2 = T1,2 ∆S1,2
und, wegen ∆S = 0 für den Kreispropzeß, ∆S1 = −∆S2
∆Q1
T1
=−
∆Q2
T2
also
T1
T2
unabhängig von der Arbeitssubstanz! Ein realer Prozeß läuft natürlich nicht quasistatisch
und reversibel. In den wärmeisolierten Phasen des Prozesses gilt dann
ηc = 1 −
0 = d− Q < T dSis
72
und während der isothermen Phasen
∆Q1,2 < T1,2 ∆S1,2 .
Aus der Bedingung ∆Sis + ∆S1 + ∆S2 = 0 mit der Entropiezunahme ∆Sis > 0 während der
wärmeisolierten Phase, folgt nun
∆Q1 ∆Q2
+
< ∆S1 + ∆S2 = −∆Sis < 0
T1
T2
und daher, wegen ∆Q2 > 0, T1 > 0
∆Q1 ∆Q2
+
< 0,
T1
T2
also
η =1+
∆Q1
T1
<
∆Q2
T2
∆Q1
T1
<1−
= ηc .
∆Q2
T2
Bekanntlich kann man den Carnotschen Wirkungsgrad für ein ideales Gas als Arbeitssubstanz auch ohne Einführung der Entropie explizit leicht ausrechnen. Die Existenz der Entropie als zusätzliche Zustandsgröße folgt dann rein phänomenologisch aus der phänomenologischen Formulierung des 2. Hauptsatzes als Unmöglichkeit eines perpetuum mobiles 2. Art:
es gibt keine periodisch arbeitende Maschine (Kreisprozeß), die nichts anderes bewirkt, als
die Abkühlung eines Wärmereservoirs und das Leisten von Arbeit.
Denn nach diesem Satz muß zum einen jeder reversible Kreisprozeß zwischen T1 und T2
genau den Carnotschen Wirkungsgrad haben, andernfalls könnte man ein perpetuum mobile
2. Art bauen, indem man den besseren Prozeß Arbeit leisten läßt und mit dem umgekehrt
geschalteten Carnot-Prozeß die Wärme −∆Q1 ins heißere Wärmebad zurückpumpt (d.h.
man benutzt in diesem Fall den Carnot-Prozeß zur Kühlung des kühleren Reservoirs (Kühlschrank!) und zur Heizung des wärmeren Reservoirs (Schwimmbadheizung mit Wärmepumpen)). Zum andern kann man jeden Kreisprozeß in infinitesimale Carnot-Prozesse zerlegen
oder jedenfalls zerlegt denken.
p
Adiabaten
Isothermen
V
Beliebiger Kreisprozeß überdeckt von Carnot-Prozessen
73
H
Für jeden kleinen Carnot-Prozeß gilt aber dS = 0. Nimmt man alle Carnot-Prozesse zusammen, so heben sich die inneren Beiträge weg und es bleibt nur noch das Integral über
dem ursprünglichen beliebigen Kreisprozeß, für den also gelten muß
I
dS = 0
mit einer Zustandsfunktion S, deren Differential definiert ist durch
d− Qrev
.
T
Diese Beziehung ist fundamental, sie ist aber mit viel Verstand zu benutzen. Sie besagt
nicht, daß dS nur für reversible Zustandsänderungen, an deren Anfang und Ende thermodynamische Gleichgewichtszustände liegen, definiert ist. Tatsächlich is dS für beliebige
Zustandsänderungen definiert. Sie besagt stattdessen: Um dS für eine beliebige irreversible Zustandsänderung mit beliebigem d− Q zu bestimmen, führe man zum Vergleich eine
Zustandsänderung mit dem gleichen Ergebnis auch reversibel durch und messe (oder berechne) die dabei aufgenommene Wärmemenge d− Qrev . Tatsächlich ist d− Qrev > d− Q. Dann ist
dS = d− Qrev /T , also dS > d− Q/T .
dS =
24
Chemisches Potential und
Gibbssche freie Enthalpie
Auch die Teilchenzahl N (oder Ni in mehrkomponentigen Systemen) ist ein Parameter, der
von außen änderbar ist. Dies geschieht, wenn zwei Systeme miteinander Teilchen derselben
Sorte austauschen können, z.B. durch eine Membran. Die Größe
∂E µi =
∂Ni S,V
heißt chemisches Potential der Teilchensorte i. Da die Teilchenzahlen Ni Beispiele für die
∂S Parameter λ des §20 sind, gilt insbesondere (wegen 0 = dS = dE
dN )
+ ∂N
T
E,V
µi = −T
∂S ∂Ni =
E,V
∂F ∂Ni T,V
= −kB T
∂ ln Z ∂Ni .
T,V
Damit kennen wir nun auch die Ableitung der Entropie nach ihren letzten natürlichen Variablen Ni und es gilt die fundamentale Relation für dS
dS =
1
p
1X
dE − dV −
µi dNi .
T
T
T i
Die Entropie ist extensiv, d.h. eine homogene Funktion ersten Grades ihrer natürlichen
Variablen E, V, Ni . Es gilt daher auch die Eulersche Gleichung für homogene Funktionen
ersten Grades
X ∂S
∂S
∂S
E+
V +
Ni
S=
∂E
∂V
i ∂Ni
X µi
E
p
= + V −
Ni .
T
T
i T
74
Insbesondere für einkomponentige Systeme, wo nur ein µ auftritt, können wir nach µ auflösen
µ=
E
pV
TS
+
−
.
N
N
N
(24.1)
Die Funktion
G = E + pV − T S = F + pV
heißt Gibbssche freie Enthalpie (im Unterschied zur Enthalpie H = E + pV ). Sie entsteht
durch eine zweifache Legendre-transformation aus E(S, V, N ), welche ihre natürlichen Variablen T , p einführt, neben der Variablen N . Doch ist die Abhängigkeit von N trivial,
da G extensiv, N extensiv und T, p intensiv sind. Also ist notwendig G = N f (p, T ) für
einkomponentige Systeme und
G
= µ(T, p) .
µ=
N
Speziell für das ideale einatomige Gas erhalten wir
3kB 3
5
ln
µ = kB T (1 − ln kB T ) + kB T ln p − T s00 +
2
2
2
!
.
Im Falle des Vorliegens von mehreren Komponenten Ni gilt mit G = E + pV − T S für die
Gibbssche freie Enthalpie
X
G=
µi N i .
i
Die Bildung des Differentials von G
dG = dE + pdV + V dp − T dS − SdT =
liefert mit der Relation
T dS = dE + pdV −
X
X
(µi dNi + Ni dµi )
i
µi dNi
i
das Differential von G(T, p, N )
dG = −SdT + V dp +
X
µi dNi
i
sowie die Gibbs-Duhem Relation
0 = SdT − V dp +
X
Ni dµi .
i
Insbesondere für einkomponentige Systeme liefert die Gibbs-Duhem Relation
S
∂µ =−
∂T p
N
,
∂µ V
.
=
∂p T
N
Als kleine Anwendung berechnen wir die Entropie eines einatomigen idealen Gases als Funktion von Druck und Temperatur
5
∂µ = N kB ln T − kB N ln p + N s0
S = −N
∂T p 2
75
mit der sog. Entropiekonstanten für ein einatomiges Gas
5
3
s0 = s00 + kB ln kB + kB ln 3/2
2
2
5/2
(ekB ) (2πm)3/2
= kB ln
.
(2πh̄)3
∂S
mit unserem früheren
Für ein Gemisch idealer Gase liefert die Beziehung µi = −T ∂N
i E,V
Ergebnis für S
X
3 E
Ni
V
0
Ni ln X
S = kB N ln + ln + s0 + kB
N
2 N
Nk
i
k
nach Einsetzen der mittleren Masse m =
nach Ni
Q
j
mj c j , c j = N j /
P
k
Nk in s00 und Differentiation
5
Ni
3
ln E/N + s00i ) + kB T + kB T ln
2
2
N
Ni
.
= µi0 (T, P ) + kB T ln
N
µi = −kB T (ln V /N +
Die letzte Beziehung folgt nach Einsetzen der Zustandsgleichugen
3
E = N kB T
2
,
V = N kB T /p
und unter Verwendung der Bezeichnung µi0 (T, p) für das chemische Potential der reinen
Gaskomponente i bei gleichem Druck und gleicher Temperatur. Interessant ist, daß die (temperaturunabhängige) Mischungsentropie pro Teilchen −kB ln Ni /N das chemische Potential
jeder Komponente verändert, und zwar stets proportional zur Temperatur absenkt.
25
Gleichgewichtsbedingungen
als Extrema von thermodynamischen Potentialen
Betrachten wir den ersten Hauptsatz in einem p − V System
dE = −pdV + d− Q
und die allgemeine Formulierung des zweiten Hauptsatzes
T dS > d− Q
zusammen
T dS > dE + pdV .
(25.1)
Dann sehen wir, daß in abgeschlossenen Systemen (V = const , E = const ) nur solche
Prozesse ablaufen, bei denen die Entropie zunimmt, dS > 0. Insbesondere ist im thermodynamischen Gleichgewicht in solchen Systemen dann
S = max
(E, V = const ) .
76
Ist dagegen das System im thermischen Kontakt mit einem Wärmebad der Temperatur T ,
so ist T = const , V = const die relevante Nebenbedingung und die Ungleichung (25.1) kann
in die Form
d(E − T S) ≡ dF > 0
also
F = min
(T, V = const )
gebracht werden. Also nimmt die freie Energie in einem System mit T , V = const solange
ab, bis das (absolute) Minimum von F zu gegebenem T , V erreicht ist, wo das System im
Gleichgewicht ist.
Ist schließlich das System im Temperatur- und Druckgleichgewicht mit der Umgebung, so
ist p, T const. und (25.1) reduziert sich auf
d(E + pV − T S) ≡ dG < 0
d.h. die Gibbssche freie Enthalpie ist im Gleichgewicht bei p, T = const minimal
G = min
26
(p, T = const )
Gleichgewicht unter Energie- und Teilchenaustausch
Die Gleichgewichtsbedingungen lauten in diesem Fall
∂S2 ∂S1 =
∂E1 V1 ,N1
∂E2 V2 ,N2
und
∂S1 ∂S2 =
,
∂N1 E1 ,V1
∂N2 E2 ,V2
woraus T1 = T2 und µ1 = µ2 für alle Teilsysteme 1, 2, die am Austausch beteiligt sind,
folgt. Eine Anwendung ist die Osmose, bei der 2 Teilsysteme A, B im Temperaturgleichgewicht durch eine Membran die Moleküle eines Lösungsmittels (1), z.B. H2 O, frei austauschen
können, nicht aber die größeren Moleküle des gelösten Stoffes (2). Es gilt also im Gleichgewicht für das dynamische Potential des Lösungsmittels
(A)
(B)
µ1 (T, p(A) ) = µ1 (T, p(B) ) ,
(26.1)
während das chemische Potential des gelösten Stoffes in den beiden getrennten Teilen des
Systems verschieden ist. Sei z.B. im Teilsystem (A) eine verdünnte Lösung vorhanden, für die
das chemische Potential des Lösungsmittels nur durch den Mischungsterm vom chemischen
Potential des reinen Lösungsmittels abweicht.
(A)
µ1 (T, p(A) , c1 ) ' µ10 (T, p(A) ) + kB T ln c1 .
Sei weiter im Teilsystem (B) nur das reine Lösungsmittel vorhanden
(B)
µ1 (T, p(B) ) = µ10 (T, p(B) ) .
77
(26.2)
Aus der Gleichgewichtsbedingung erhalten wir für c1 = 1 − c2 , c2 1 durch Taylorentwicklung nach den kleinen Größen p(A) − p(B) , c2 bis zum Glied erster Ordnung
(p
(A)
−p
(B)
∂µ10 ) (A) − kB T c2 = 0 .
∂p
T
Aus der Gibbs-Duhem Gleichung entnehmen wir
∂µ10 V (A)
,
=
∂p(A) T
N1
woraus wir mit c2 = N2 /N für den osmotischen Druck
pos = pA − pB =
N2 kB T
V (A)
erhalten. Die gelösten Teilchen erzeugen also in einer Lösung einen zusätzlichen Druck, den
osmotischen Druck, der speziell in einer stark verdünnten Lösung gerade gleich dem entsprechenden Druck eines idealen Gases aus den gelösten Teilchen bei gleicher Teilchendichte
und Temperatur ist. Osmotische Druckdifferenzen sind besonders in biologischen Systemen
allgegenwärtig.
-----------------
Massendichte
mn = n1 m1 + n2 m2
h = p / (mng)
-------------------
A
B
c1
c1 = 1
c2
Semipermeable Membran (durchlässig für 1)
Osmotischer Druck in einem System im Schwerefeld
27
Chemische Reaktionsgleichgewichte
und Massenwirkungsgesetz
Betrachten wir nun Umwandlungen von Atomen oder Molekülen in chemischen Reaktionen,
z.B.
− νA A − νB B *
) νC C + ν D D .
Die νi sind ganze Zahlen und heißen stöchiometrische Koeffizienten, die wir links negativ
und rechts positiv zählen werden, da wir annehmen, daß die Reaktion von links nach rechts
78
verläuft (A, B verschwinden, C, D entstehen), bevor ein chemisches Gleichgewicht besteht, in
dem sich die mittleren Konzentrationen cA , cB , cC , cD nicht mehr ändern. Für jede chemische
Reaktion definieren wir eine eigene Reaktionslaufzahl ξ. Bei Änderung von ξ um +1 sollen
gemäß der Reaktion νi -Mole des Stoffes i entstanden (νi > 0) oder verschwunden (νi < 0)
sein, also mit der Loschmidtschen Zahl L
dNi = νi Ldξ .
(27.1)
Im folgenden wird immer Druck- und Temperaturgleichgewicht angenommen. Die Wärmetönung ∆qp der Reaktion bei konstantem Druck ist dann die Wärmeenergie bezogen auf die
Teilchenzahl, die man zuführen (∆qp > 0 endotherm) oder abführen (∆qp < 0 exotherm)
muß, um bei ∆ξ = 1 die Temperatur konstant zu halten. Die Gleichgewichtsbedingungen
für das chemische Gleichgewicht (bei p, T konstant) folgen aus G = min unter einer Nebenbedigung (27.1) für jede chemische Reaktion. Dies liefert für jede Reaktion
X
i
X ∂G
∂G
dNi =
νi Ldξ = 0 ,
∂Ni
i ∂Ni
woraus wir folgern, daß für jede Reaktion im Gleichgewicht gilt
X
ν i µi = 0 .
(27.2)
i
Werten wir diese Relationen für ideale Mischungen (Reaktionen in idealen Gasen oder
verdünnten idealen Lösungen) aus: Für die Wärmetönung bei konstantem Druck können
wir den 1. Hauptsatz anwenden. Für ideale Mischungen ist die Energieänderung
∆E =
X
i
νi ei L∆ξ = L(∆qp − p
X
νi vi )∆ξ .
i
Wir schreiben hier auf die Teilchenzahl bezogene Größen ei , vi klein. Auf der rechten Seite der Energiebilanz muß außer der Wärmetönung auch die wegen p = const zugeführte
Volumenarbeit berücksichtigt werden. Wir lösen nach ∆qp auf und erhalten
∆qp =
X
νi hi (T, p) ,
i
wobei hi (T, p) die Enthalpie der reinen Komponente i ist. Die Gleichgewichtsbedingung
werten wir für ideale Mischungen aus, indem wir ansetzen
µi (T, p, c1 , c2 , . . .) = µi0 (T, p) + kB T ln ci .
Wir erhalten damit aus (27.2) sofort für jede chemische Reaktion im System eine Gleichung
Y
i
cνi i
= exp −
P
i
νi µi0 (T, p)
kB T
!
= Kc (T, p) (Massenwirkungsgesetz) ,
wobei die hiermit definierten Gleichgewichtskonstanten Kc (T, p) (für jede Reaktion eine eigene!) nur noch von Druck und Temperatur abhängen. Für die Druck- und Temperaturabhängigkeit von Kc (T, p) liefert die Gibbs-Duhem Relation
1 X ∂µi0 (T, p)
∂ ln Kc (T, p) 1 X
∆V
=−
=−
νi
νi vi = −
∂p
kB T i
∂p
kB T i
RT
T
1 X ∂(µi0 (T, p)/T )
∂ ln Kc (T, p) µi0
1 X
1 ∂µi0
=−
νi
=
νi
−
2
∂/T
kB i
∂T
kB T i
T
T ∂T
p
79
!
,
wobei ∆V die Volumenänderung bei ∆ξ = 1 ist und R = kB L die ideale Gaskonstante.
Mit
und
∂µi0
= −si
∂T
µi0 + T si = hi
X
νi hi = ∆qp
i
bleibt schließlich
∆Qp
∂ ln Kc (T, p) ,
=
∂T
RT 2
p
wobei ∆Qp = L · ∆qp bedeutet. Durch Messung der Volumenänderung ∆V als Funktion des
Druckes bei fester Temperatur T0 und der Wärmetönung ∆Qp bei festem Druck p als Funktion der Temperatur kann man die Gleichgewichtskonstante Kc (T, p) bis auf eine Konstante
bestimmen aus
ln
28
−1 Z p
1 ZT
∆Qp (T, p)
Kc (p, T )
=
.
dp∆V (p, T0 ) +
dT
Kc (p0 , T0 )
RT0 p0
R T0
T2
Koexistenz von Phasen
Am Beispiel der van der Waals Gleichung sahen wir, daß Teilchen in verschiedenen Phasen
koexistieren. Betrachten wir das Gleichgewicht dieser Koexistenz unter Teilchenaustausch,
wobei keine chemischen Reaktionen ablaufen sollen.
28.1
Wieviele Phasen können koexistieren?
Sei k die Zahl der Stoffe oder Komponenten und p die Zahl der koexistierenden Phasen. Sei
ferner ciq die Konzentration der Komponente i in der Phase q,
P
Niq
ciq = Pk
.
j=1 Njq
Pro Phase gibt es also wegen i ciq = 1 genau (k − 1) unabhängige Konzentrationen. Das
System hat also 2 + p(k − 1) Variable, nämlich p, T und die ciq . Dem stehen die Gleichgewichtsbedingungen
q = 1, 2, . . . , p
µiq = µi
i = 1, 2, . . . , k
gegenüber, was nach Elimination der k unbekannten µi noch (p − 1)k unabhängige Gleichungen sind. Diese sind nicht überbestimmt, falls
(p − 1)k ≤ 2 + p(k − 1) ,
woraus
p≤k+2
folgt. Dies ist die Gibbssche Phasenregel. Die Differenz f = k + 2 − p gibt die Zahl der
thermodynamischen Freiheitsgrade an. Z.B. für einkomponentige Systeme ist bei einer Phase
80
f = 2, d.h. p und T sind frei wählbar. Bei Koexistenz von zwei Phasen ist f = 1, d.h.
es existiert eine Relation zwischen p und T , p = p(T ). Bei Koexistenz von 3 Phasen ist
schließlich f = 0, d.h. p, T sind festgelegt (Tripelpunkt). Z.B. Phasendiagramm eines 1Komponenten-Systems
Schmelzkurve
p
fest
kritischer
Punkt
flüssig
Tripel-Punkt
Dampfdruckkurve
gasförmig
Sublimationskurve
T
Phasendiagramm eines 1-Komponentensystems
Betrachten wir noch einige Beispiele von Phasendiagrammen:
(i.) Koexistenz verschiedener Mischungen eines binären Systems
kritischer Punkt
T
p = const
Tc
II
I
B
A
Koexistenz von 2 Phasen
c
0
1c
c1
1
Phasendiagramm einer binären Mischung
T > Tc : Phase für 0 ≤ c1 ≤ 1, d.h. die Komponenten sind in beliebigem
Verhältnis mischbar
81
T < Tc : Bei allmählicher Erhöhung von c1 angefangen bei c1 = 0 durchläuft
man nacheinander:
(a) Reine Phase I (reich an Komponente 2, arm an Komponente
1). Hier f = 3; (p, T, c1 ) sind beliebig variierbar.
(b) Koexistenz von Phase I und Phase II, deren Zusammensetzung c1 , c2 durch die Koexistenzkurve bei gegebenem
p, T (f = 2) festgelegt ist.
(c) Reine Phase II (reich an Komponente 1, arm an Komponente 2)
(ii.) Koexistenz binärer Mischungen in verschiedenen Aggregatzuständen (z.B. flüssig-gasförmig)
p = const
T
T2
Taukurve
Gas (f = 3)
Koexistenz
Siedekurve
(f = 2)
T1
Flüssigkeit (f = 3)
0
c
1
Gas
c
1
flüssig
1
c
1
Koexistenz einer binären Flüssigkeit mit ihrem Dampf
Die Deutung des Diagramms ist analog zum vorherigen Beispiel.
Eine Mischung bei cf1 ` erzeugt bei Verdampfen einen Dampf mit cg1 + cf1 ` . Daher ändert
sich die Konzentration in einer siedenden Mischung im Laufe der Zeit unter gleichzeitiger Änderung der Siedetemperatur.
(iii.) Kompliziertere Phasendiagramme binärer Mischungen:
Der Punkt E heißt eutektischer Punkt. Dort gilt f = 1, z.B. ist der Druck variierbar.
82
p = const
T
Gas f = 3
II + Gas
I + Gas
I
flüssig
f=3
f=2
f=2
II
flüssig
f=3
E
eutektischer Punkt
f=1
I + II
f=2
c1
0
1
binäres System, das ich flüssig “nicht” mischt
28.2
Koexistenzkurven. Clausius Clapeyronsche Gleichung
Betrachten wir die Koexistenz von 2 Phasen (1) und (2) in einem 1 komponentigen System,
also f = k + 2 − p = 1. Längs der Koexistenzkurve gilt
µ(1) (p, T ) = µ(2) (p, T ) ⇒ p = p(T ) .
Durch Differentiation längs der Koexistenzkurve erhalten wir
∂µ(1) ∂µ(1) ∂µ(2) ∂µ(2) dp +
dT =
dp +
dT .
∂p T
∂T p
∂p T
∂T p
Für jede Phase gilt die Gibbs-Duhem Gleichung, wonach
dµ = −
also
und wir erhalten
V
S
dT + dp
N
N
∂µ = −s ,
∂T p
∂µ =v
∂p T
∂p ∆s
∆S
s(2) − s(1)
=
=
,
= (2)
(1)
∂T koex
v −v
∆v
∆V
wobei ∆S= Entropieänderung pro Mol bei Umwandlung von Phase 1 nach 2. ∆V = Volumenänderung pro Mol bei dieser Umwandlung. Die Größe ∆S läßt sich auf verschiedene Weisen
ausdrücken, z.B.
1
1
∆S = ∆Qrev = ∆H ,
T
T
83
wobei Qrev die Wärmemenge ist, die man bei reversibler Umwandlung eines Mols bei der
Temperatur T und dem Druck p dem System zuführen muß. Daher gilt
1 ∆H
dp ∆S
=
=
dT koex
∆V
T ∆V
(Clausius Clapeyronsche Gleichung) .
Betrachten wir einige Beispiele:
(i.) Dampfdruckkurve:
Das Volumen pro Teilchenzahl der flüssigen Phase kann gegen das der Gasphase vernachlässigt werden.
∆v = vGas − vFlßsig ≈
kB T
p
(vFlßsig vGas ) .
Für die spezifische Verdampfungsenthalpie ∆h können wir ansetzen
∆h ≈ ∆h0 ,
wobei ∆h0 eine spezifische Bindungsenergie in der Flüssigkeit ist und näherungsweise
als konstant betrachtet werden kann. Dann gilt
∆h0 p
dp
=
dT
kB T 2
∆h0
p = const exp −
kB T
;
!
.
Die Steigung der Dampfdruckkurve ist stets positiv, da ∆h > 0, ∆v > 0. Die spezifische
Wärme vom Dampf in Koexistenz mit der Flüssigkeit unterscheidet sich drastisch von
der reinen Dampfphase:
Ckoex =
=T
!
d− Qrev
dT
∂∆S ∂T p
= ∆Cp − T
=T
koex
d∆S
dT
!
koex
!
∂∆S dp
+T
∂p T dT koex
∂∆V 1 ∆H
.
.
∂T T ∆V
p
Approximieren wir ∆V ≈ V , (∂∆V /∂T )p ≈ V /T (ideales Gas). so ergibt sich
Ckoex = ∆Cp −
∆H
.
T
Ckoex kann sogar negativ werden, falls nämlich ∆H > T ∆Cp , d.h. der Dampf wird dann
heißer bei Entzug von Wärme, wenn nämlich der Wärmenentzug zur Kondensation in
die Flüssigkeit führt und dabei mehr Wärme frei wird, als dem System entzogen wurde,
was den Prozeß explosionsartig verstärken kann, falls nun noch mehr Wärme dem
System entzogen wird. Offensichtlich ist es sehr wichtig, auf solche thermodynamischen
Zusammenhänge zu achten, wenn man z.B. in Kraftwerken Unfälle vermeiden will!
84
(ii.) Schmelzkurve:
Betrachten wir die Steigung dieser Kurve. ∆h > 0 für Übergang ‘fest−→flüssig’, aber
>
∆v < 0 kommt beides vor, d.h. Schmelzkurven existieren mit positiver oder negativer
Steigung. Insbesondere bei H2 O ist ∆v < 0 für ‘Eis−→Wasser’, denn Eisberge schwimmen, wie wir alle aus dem Film Titanic wissen, was wegen ∆h > 0 zu einer abfallenden
Schmelzkurve führt.
(iii.) Sublimationskurve:
dp
> 0. Der Verlauf der
Da für ‘fest−→gasförmig’ stets ∆h > 0, ∆v > 0 ist immer dT
Sublimationskurve ist ähnlich zu dem der Dampfdruckkurve nur viel steiler ansteigend,
da die Sublimationswärme viel größer ist als die Verdampfungswärme.
29
Großkanonische Verteilung
Eine einfache Verallgemeinerung der Rechnung die zu (14.1) führte liefert für Systeme mit
Teilchenaustausch, für die N1 schwankt
%1 (q1 . . . p3N1 , N1 ) =
P
2 (E
− H1 , N − N 1 )
Σ(E)
und für die Energie und Teilchenzahlverteilung
P (E1 , N1 ) =
P
1 (E1 , N1 )
P
2 (E
− E1 , N − N1 )
.
Σ(E, N )
Das Maximum von P (E1 , N1 ) liefert die Gleichgewichtsbedingungen
1
1
=
,
T1
T2
die wir schon kennen, und zusätzlich
P
P
∂ ln 1
∂ ln 2
=
,
∂N1
∂N2
die gleichbedeutend sind mit
µ2
µ1
=
.
T1
T2
Entwickeln wir den Ausdruck für %1 um den Gleichgewichtspunkt und brechen schon nach
dem linearen Glied ab (was erlaubt ist, falls Cv1 Cv2 und κT 1 hN1 i2 /V1 κT 2 hN2 i2 /V2 ),
so erhalten wir
%1 (q1 , . . . , p3N1 , N1 ) =
1 −β(H1 −µN1 )
e
Zg
(großkanonisches Ensemble) ,
wobei Zg aus der Normierung bestimmt ist
Zg =
X
eβµN1 Z(β, V, N1 )
N1
85
und gleichzeitig mit der Zustandsdichte verknüpft ist über
Zg = P
Σ(E)e−β(hE1 i−µhN1 i)
P
= ∆E1 1 (hE1 i, hN1 i)e−β(hE1 i−µhN1 i) .
2 (E − hE1 i, N − hN1 i
Daraus erhalten wir das sogenannte großkanonische Potential Ω(T, V, µ)
−Ω(T, V, µ) ≡ kB T ln Zg = T S − hE1 i + µhN1 i = pV ,
wobei wir im letzten Schritt (24.1) verwendet haben. Man beachte, daß wegen der Extensivität von Ω und V und der Intensivität von p, T , µ die ganze V -Abhängigkeit von
Ω = −V p(T, µ) im Faktor V steckt, während p nur noch von T und µ abhängt. Weiter folgt
aus −dΩ = T dS + SdT − dE + µdN + N dµ, unter Benutzung von T dS = dE + pdV − µdN ,
daß
∂p ∂Ω ∂p ∂Ω ∂Ω = −V
= −S ;
= −p − V
= −p ;
= −N .
∂T V,µ
∂T V,µ
∂V T,µ
∂V T,µ
∂µ T,V
Aus Zg bekommt man unmittelbar den Druck
p=
kB T
ln Zg (β, V, µ) ,
V
in den natürlichen Variablen T, µ. Weitere unmittelbar zugängliche Größen sind
∂ ln Zg ∂hEi 1
∂ 2 ln Zg hEi = −
, σE2 = −
=
=
∂β βµ,V
∂β βµ,V
k B T 2 CV
∂β 2 βµ,V
∂ ln Zg ∂ 2 ln Zg ∂hN i 2
hN i = kB T
=
k
T
, σN
= (kB T )2
.
B
∂µ β,V
∂µ2 β,V
∂µ T,V
Die letztere Größe ist interessant, weil sie uns die Breite der Teilchenzahlverteilung gibt.
Durch Umformen von Ableitungen kann man zeigen
∂hN i hN i ∂hN i hN i2
κT
=
=
∂µ T,V
V
∂p T,V
V
denn
∂hN i ∂p hN i
∂hN i ∂hN i =
=
∂µ T,V
∂p T,V ∂µ T,V
∂p T,V V
(nach Gibbs-Duhem)
hN i2
hN i3 ∂(V /hN i) V ∂(hN i/V ) =
−
=
hN i
∂p
V
V2
∂p
T,V
T,V
=
hN i2
κT .
V
Wir stellen fest, daß
2
σN
=
kB T hN i2
κT ∼ N .
V
86
Also ist σN /N ∼ N −1/2 wieder verschwindend klein, außer in der Nähe von kritischen Punkten, wo die isotherme Kompressibilität divergiert.
Für ein ideales Gas ist
1
V
1 ∂V = =
κT = −
V ∂p T
p
hN ikB T
2
also σN
= hN i: ein Ergebnis, das auf eine Poissonverteilung hinweist und das wir schon von
§ 1c her kennen.
Für das van der Waals in der Nähe des kritischen Punkts und für T >Tc gilt
∼
p − pc = const 1 (vc − v)3 + const 2 (T − Tc )(vc − v)
∂p = −3const 1 (vc − v)2 − const 2 (T − Tc )
∂v T
woraus also
1
1 ∂v ,
'
κT = −
v ∂p T
3vc (const 1 (vc − v)2 + const 2 (T − Tc ))
2
1
1
σN
∼ κT ∼
∼
2
N
(vc − v)
(p − pc )2/3
1
∼
für v = vc folgt .
T − Tc
für T = Tc
Man nennt Potenzgesetze in der Nähe des kritischen Punkts wie (p − pc ) ∼ (vc − v)δ oder
1
κT ∼ (T −T
γ Skalengesetze und die Exponenten γ, δ (und eine Reihe weiterer ähnlicher
c)
Exponenten) “kritische Exponenten“. Experimentell haben diese nicht den von der van der
Waals Gleichung und ähnlichen “mean-field“ oder “Molekularfeld“-Theorien vorhergesagten
Wert, sondern weichen im 10%-Bereich davon ab. Dies wird durch die Theorie kritischer
Phänomene erklärt, zu der öfters Spezialvorlesungen angeboten werden.
30
Ideale Quantengase
Ideale Gase sind Gase von wechselwirkungsfreien Teilchen. Von Quantengasen sprechen wir,
wenn die Unschärferelation eine wichtige Einschränkung darstellt, d.h. wenn ∆x · ∆px für
1/3
ein
√ einzelnes Teilchen nicht mehr sehr viel größer als 2πh̄ ist. Mit ∆x ' (V /N ) , ∆px '
kB T · 2m ist also für Quantengase die Ungleichung
λdB verletzt, wobei
λdB =
q
3
v
u
u
t
V /N
2πh̄2
mkB T
die “thermische deBroglie Wellenlänge“ ist.
Seien die Energieniveaus eines Teilchens εν . Hierbei sind die ν Quantenzahlen eines Teilchens.
87
Z.B. für ein Teilchen in einem kubischen Kasten der Länge L mit zyklischen Randbedingungen
 
νx
2 2
h̄ kν
  2π
, kν =  ν y 
.
εν =
2m
L
νz
Hier, wie auch im nächsten Beispiel, sind νxi , νyi , νzi ganzzahlige 1-Teilchen Quantenzahlen.
Für ein Teilchen in einem harmonischen Fallenpotential gilt
εν = h̄ (ωx (νx + 1/2) + ωy (νy + 1/2) + ωz (νz + 1/2))
oder für ein Elektron in einem Kristall mit Energiebändern gilt
εν = ε` (k) ,
wobei ` die Energiebänder durchnumeriert und k Werte innerhalb der 1. Brillouin-Zone
annimmt, die wie im ersten Beispiel quantisiert sind, wenn der Kristall ein endliches Volumen
V ausfüllt. Meist sind nur zwei der Energiebänder von Interesse, das letzte gefüllte Band oder
Valenzband und das erste ganz oder teilweise gefüllte Leitfähigkeitsband.
In jedem Fall läßt sich die Energie des Systems schreiben als
E=
X
ε ν nν ,
ν
wobei die ganzen Zahlen nν die Zahl der Teilchen im 1-Teilchen-Zustand ν angibt. Die nν sind
nun die mikroskopischen Variablen. Für Fermionen gilt das Pauli-Prinzip, welches besagt,
daß
nν = 0, 1
Pauli-Prinzip, Fermionen .
Für Bosonen hingegen ist
nν = 0, 1, 2, . . . .
Weiter müssen wir unterscheiden zwischen masselosen Teilchen wie Neutrinos (Fermionen)
und Photonen, Phononen auf der einen Seite und massiven Teilchen wie Elektronen, Atomen
etc. auf der andern. Für masselose Teilchen kostet es keine Energie, um die Teilchenzahl zu
verändern, d.h. die Teilchenzahl ändert sich von selbst und ist keine unabhängige Systemvariable. Anders für massive Teilchen: hier ist die Teilchenzahl eine Erhaltungsgröße, solange
keine chemischen Reaktionen oder relativistische Teilchen-Erzeugungs- und Vernichtungsprozessedie Teilchenzahl ändern. Im Fall massiver Teilchen gilt also
N=
X
nν
massive Teilchen .
ν
Im großkanonischen Ensemble gilt
%({nν }) =
mit
Zg =
X
{nν }
1 −β P (εν nν −µnν )
ν
e
Zg
e−β
P
ν
(εν −µ)
88
nν .
Uns interessieren Größen wie
pV = kB T ln Zg ,
die mittlere Teilchenzahl
X
hN i =
ν
hnν i
und natürlich auch die mittleren Besetzungszahlen hnν i selbst; die mittlere Energie
hEi =
die Entropie
X
ν
εν hnν i ,
∂
hEi − µhN i
S=
kB T ln Zg = kB T ln Zg +
∂T
T
V,µ
und z.B. bei Spin-behafteten Teilchen wie Elektronen die mittlere Magnetisierung
hMi =
X
ν
gµB sν hnν i ,
wobei sν der mit dem Zustand |νi verknüpfte Spineigenwert ist. All diese Größen ergeben
sich durch Differentiation direkt aus Zg , das wir leicht auswerten aus
Zg =
YX
e−βn(εν −µ) =
(ν) n
ln Zg = ∓
X
ν
Y
(ν)
ln 1 ∓ e
−β(εν −µ)
1 ∓ e−β(εν −µ)
∓1
,
wobei hier und im folgenden das obere (untere) Vorzeichen für Bosonen (Fermionen) gilt.
Dann können wir nach εν differenzieren, um
hnν i = −
1
1 ∂ ln Zg
= β(εν −µ)
β ∂εν
e
∓1
zu erhalten.
n (ε)
kT
µ
ε
Fermi-Dirac Verteilung bei endlicher Temperatur
89
Für massive Fermionen ist die Fermi-Energie εF als Funktion der Teilchenzahl definiert durch
ν
X
ν
Θ(εF − εν ) = N ,
woraus wegen limβ→∞ (eβ(εν −µ) + 1)−1 = Θ(µ − εν ) folgt µ(T = 0) = εF . Die mittlere
Besetzungszahl hnν i = n(εν ) eines Zustands ν mit Energie εν gibt noch nicht die mittlere Zahl
von Teilchen bei der Energie εν an, da letztere auch noch von der Zahl der Zustände bei der
Energie εν abhängt. Die mittlere Zahl von Teilchen pro Volumeneinheit pro Energieeinheit
ist N (ε) = g(ε)n(ε), wo g(ε)dε = Zahl der Zustände pro Volumeneinheit im Energieintervall
dε (g(ε) = Zustandsdichte). Z.B. in einem Kristall ist die 1-Teilchen Zustandsdichte g(ε) für
die Valenzelektronen qualitativ von der Form
Fermiverteilung n(E)
Zustandsdichte g(E)
Isolator
Halbleiter
Metall
n
g
g
µ
µ
Valenzband
µ
E
Leitungsband
Fermi-Verteilung n und Zustandsdichte g in verschiedenen Typen von Festkörpern
Daraus ergibt sich die mittlere Zahl von Elektronen pro Energieinheit als
dN (ε)
g(ε)
= g(ε)n(ε) = β(ε−µ)
.
dε
e
+1
Die Fermi-Energie εF N = µ(T = 0, N ) ergibt sich aus
N=
X
ν
Θ(εF − εν ) =
Z
dεg(ε)Θ(εF − ε) =
Z
εF
εv0
dεg(ε) ,
wobei εv0 der Boden des Valenzbandes und N die Zahl der Valenzelektronen ist. Liegt εF
innerhalb eines Bandes, so hat man ein Metall. Ist dagegen das oberste Band gefüllt, das
nächste leer, so hat man einen Isolator (falls die Bandlücke kB T ) oder einen Halbleiter
(falls die Bandlücke <kB T ) vor sich. In einem reinen Kristall legt man dann εF per Defini∼
tion in die Mitte zwischen Valenz- und Leitfähigkeitsband. In einem dotierten Kristall gibt
es auch zwischen den Bändern Energieniveaus durch Störstellen. Dann wird die Lage von εF
bestimmt durch die Energie der gerade noch besetzten und der gerade nicht mehr besetzten
Störstellen-Niveaus (Akzeptor-Niveaus falls die Fremdatome weniger Valenzelektronen haben, also Elektronen aus dem Valenzband aufnehmen können, und Donator-Niveaus falls die
90
Fremdatome zusätzliche Valenzelektronen haben, und Elektronen ans Leitungsband abgeben
können). Mit der Zustandsdichte g(ε) schreiben sich die interessierenden Erwartungswerte
R
P
durch Ersetzen von ν . . . → dεg(ε) . . . als
pV = kB T
hN i =
hEi =
Z
Z
Z
g(ε)dε ln 1 + e−β(ε−µ)
g(ε)dε
1
eβ(ε−µ)+1
g(ε)d(ε)
ε
eβ(ε−µ) + 1
etc. Im Fall masseloser Teilchen entfällt hN i als unabhängige Variable und wir setzen einfach
µ = 0. Dies bedeutet den Übergang zum kanonischen Ensemble. Für εν kB T ist hnν i 1
und
hnν i ' e−β(εν −µ)
ist die klassische Boltzmann-Verteilung. Doch für εν − µ <kB T ist die quantenmechanische
∼
von der klassischen Verteilung wesentlich verschieden.
31
Freies Elektronengas
Überraschend viele Eigenschaften von Metallen bei tiefen Temperaturen lassen sich verstehen, wenn man die Elektronen trotz ihrer Coulombwechselwirkung als ein Gas von wechselwirkungsfreien Teilchen auffaßt. Daß die Coulombwechselwirkung hier trotz ihrer Stärke und
ihrer Langreichweitigkeit in vieler Hinsicht nur eine zweitrangige Rolle spielt, liegt an der
Eigenschaft der Abschirmung: Die Elektronen bewegen sich vor einem Hintergrund von positiv geladenen Ionenrümpfen. Betrachten wir ein herausgegriffenes Elektron. Auf kurzen
Abständen hat es eine stark abstoßende Wechselwirkung mit den anderen Elektronen, so
daß in der unmittelbaren Umgebung des Elektrons mit geringer Wahrscheinlichkeit weitere
Elektronen gefunden werden. Daher überwiegt in dieser Zone die positive Hintergrundladung.
Die weiter entfernten Elektronen sehen daher nur die wegen der positiven Hintergrundladung
abgeschirmte Ladung des Elektrons. Das Ergebnis ist eine sog. abgeschirmte Coulombwechselwirkung mit dem Potential U (r) = e2 e−κr /r, wobei 1/κ die Abschirmlänge ist. Die Vielteilchentheorie eines wechselwirkenden Coulombgases liefert dafür κ = (ne2 /kB T )1/2 . Damit
erhält die effektive Wechselwirkung eine endliche Reichweite und kann in dieser Form in
vielen Fällen als kleine Störung angesehen werden. Im folgenden betrachten wir daher ein
wechselwirkungsfreies Elektronengas.
P
V R 3
h̄2 2
kν , falls kein Magnetfeld anliegt und ν . . . → 2 (2π)
d k. Der Faktor 2
Hier ist εν = 2m
3
berücksichtigt die beiden verschiedenen Spineinstellungen pro Zustand. Wir erhalten
hEi = 2
V
(2π)3
Z
d3 k
hN i = 2
V
(2π)3
Z
d3 k
V
pV = 2
(2π)3
Z
3
h̄2 k 2 /2m
2 2
exp(β h̄2mk − βµ) + 1
h̄2 k 2 /2m
2 2
exp(β h̄2mk − βµ) + 1
d k ln 1 + e
91
2 2
−( βh̄2mk −µ)
Z
2 2
∞
4πV
2
−( βh̄2mk −µ)
= 2kB T
dk
k
ln
1
+
e
(2π)3 0
Z
1
kB T V βh̄2 ∞
.
dk k 4
=
2 2
3
k
βh̄
π
3m 0
− βµ) + 1
exp(
2m
Die auftretenden Integrale lassen sich durch Reihenentwicklung
(z −1 exp(βh̄2 k 2 /2m) + 1)−1 =
∞
X
(−z)n e−nβh̄
2 2
k /2m
n=1
mit z = eβµ und gliedweise Integration durch die “Fermifunktionen”
fα (z) =
∞
X
(−1)`+1 z `
2
=
`α
Γ(α)
`=1
Z
∞
0
dx
x2α−1
z −1 ex2 + 1
ausdrücken, und zwar
kB T V
f5/2 (eβµ )
λ3dB
3 V kB T
3
hEi = 2
f5/2 (eβµ ) = pV
3
2 λdB
2
V
hN i = 2 3 f3/2 (eβµ ) .
λdB
pV = 2
Es gilt fα−1 = z∂/∂zfα (z). Die Größe z = eβµ heißt “Fugazität“ und wird oft anstelle von µ
als unabhängige Variable benutzt.
Hochtemperaturlimes z 1: Im klassischen Grenzfall wird µ negativ, dann wird also z klein.
Mit der Reihenentwicklung für fα (z) ergibt sich
2
hN i
= 3
V
λdB
eβµ −
1
2
e2βµ + . . .
3/2
λ3dB hN i
1 λ6dB hN i2
µ = kB T ln
+ 3/2
+...
2V
2
(2V )2
1 2βµ
kB T
βµ
e − 5/2 e + . . .
p=2 3
λdB
2
!
λ3dB hN i
kB T hN i
1 + 5/2
+... .
=
V
2 (2V )
!
Im klassischen Grenzfall ergibt sich also die Zustandsgleichung des idealen Gases. Wegen der
Kleinheit der Elektronenmasse ist jedoch ein Elektronengas in Metallen bei Zimmertemperatur schon ein Quantengas.
!
hEi
3
λ3dB hN i
= kB T 1 + 5/2
+...
hN i
2
2 (2V )
!
3
λ3dB hN i
cV = kB 1 − 7/2
+... .
2
2 (2V )
92
Tieftemperaturlimes z 1: Für T → 0 geht
exp βh̄2 k 2 /2m − βµ + 1
und
−1
→ Θ(µ − h̄2 k 2 /2m)
−1
∂ h̄2
h̄2 ∂
2 2
2 2
Θ(µ
−
h̄
k
/2m)
=
−
δ(µ − h̄2 k 2 /2m) .
→
−
exp
βh̄
k
/2m
−
βµ
+
1
2
∂k
2m ∂µ
2m
Daher findet man mit Hilfe von partieller Integration (oder direkt durch Benutzung der
asymptotischen Entwicklungen)
!
4
∂
π2
z f5/2 (z) = f3/2 (z) ' √
(ln z)3/2 + (ln z)−1/2 + . . .
∂z
3 π
8
!
8
5π 2
5/2
1/2
f5/2 (z) ' √
(ln z) +
(ln z) + . . . ):
15 π
8
!
8
π2
1
3/2
3 hN i
= √
+...
(βµ) +
λdB
V
3 π
8 (βµ)1/2

π2
µ = εF (N ) 1 −
12
kB T
εF (N )
!2

+ . . . .
µ / εF
1
kT/ ε
0
0.5
1.0
1.5
F
-1
Chemisches Potential des Fermi-Gases
Mit der von der Teilchendichte n-abhängigen Fermi-Energie (und dem zugehörigen FermiImpuls)
!2/3
p2f
6π 2 N
h̄2
≡
,
εF (N ) =
2m V (2s + 1)
2m
wobei s der Spin ist, also s = 1/2 für Elektronen.
!
kB T 8
5π 2
√
p=2 3
(βµ)5/2 +
(βµ)1/2 + . . .
λdB 15 π
8
!
1
5π 2
2 εF (N )
+...
1+
=
5 v
12 β 2 ε2F (N )
93
P
Isochore V=const
T
Isochore des idealen Fermi-Gases
!
5π 2
3
3 εF (N )
hEi
1
1+
= p=
+...
2
2
hN i
2
5 v
12 β εF (N )
!!
kB T
kB π 2 kB T
1 ∂E =
1+O
cV =
hN i ∂T V
2 εF (N )
εF
Z T
cV
k2 π2 T
S
=
dT = B
+...
hN i
2 εF (N )
0 T
Cv
3 NK
2
Cv ~ T/T
F
T
Spezifische Wärme des idealen Fermi-Gases
Für eine normale Fermiflüssigkeit geht also die spezifische Wärme cV → 0 und die Entropie
s → 0 für T → 0 proportional zu T . Ein ideales Fermi-Gas hat selbst bei Temperatur
T = 0 noch einen positiven Druck, der rein quantenmechanischer Natur und eine Folge des
Pauli-Prinzips ist.
94
32
Paulischer Paramagnetismus
des freien Elektronengases
Ein freies Elektronengas (ideales Fermi-Gas) zeigt im homogenen Magnetfeld 2 verschiedene
magnetische Effekte, die sich gegenseitig teilweise kompensieren:
1. Diamagnetismus: hervorgerufen durch die Quantisierung der Bahnbewegung auf
Landau-Niveaus.
2. Paramagnetismus: hervorgerufen durch die Ausrichtung der Elektronenspins im Magnetfeld.
Der 1-Teilchen Hamiltonoperator ist
e
1
(p − A)2 − µ · B .
2m
c
Wir betrachten in diesem Abschnitt den Spin-Anteil, im nächsten Abschnitt den BahnAnteil. Also reduziert sich H auf
H=
p2
−µ·B
2m
p2
1
eh̄
εps =
− sgµ0 B
s = ±1 , µ0 =
, g = 2.
2m 2
2mc
In Besetzungszahl-Darstellung
X
H=
εp,s np,s
H=
p,s
Großkanonische Zustandssumme:
Zg =
X
e−β
{n}
=
P
YY
p
p,s
(εps −µ)nps
1 + e−β(εps −µ)
s
−pV = Ω = −kB T ln Zg ≡ kB T
= Ω0 (µ+ ) + Ω0 (µ− ) ,
XX
s
ln 1 + e−β(εps −µ)
p
wobei Ω0 (µ) das großkanonische Potential für B = 0 ist für eine Spineinstellung
Ω0 (µ) =
X
p2
ln(1 + e−β( 2m −µ) )
p
und
µ± = µ ± µ 0 B .
Wir haben als für die beiden Spineinstellungen gesonderte chemische Potentiale µ+ , µ− .
∂
1 ∂
ln Zg = − (Ω0 (µ+ ) + Ω0 (µ− ))
β ∂µ
∂µ
∂
∂
=−
Ω0 (µ+ ) −
Ω0 (µ− )
∂µ+
∂µ−
= hN+ i + hN− i
hN i =
95
P
mit hN± i = p hnp± i. Das Elektronengas verhält sich also wie 2 verschiedene Elektronengase
mit 2 verschiedenen chemischen Potentialen entsprechend den Spineinstellungen.
Für jedes einzelne der beiden Elektronengase gilt für T → 0

π2
µ± = εF (N± ) 1 −
12
h̄
=
2m
kB T
εF (N± )
!2
!2/3 
6π 2 N±
V
Aus
π2
1 −
12

+ . . .
kB T
2m
h̄2
µ± ≈ εF (N± )(1 −
h̄2
2µ0 B =
2m
6π 2
V
π2
−
12
!2/3 "
kB T 2m
h̄2
2/3
2/3
N+
−
1
2/3
N+
2/3
N−
!2 −
1
2/3
N−
M=
π2
( kB T ) 2
12 εF (N± )
!4/3

+ . . . .
+ . . .)
2/3
(N+ − N− )
V
6π 2
1/3
Für |N+ − N− | 1 folgt
Also
V
6π 2 N±
µ+ − µ− = 2µ0 B
folgt für tiefe Temperaturen:
!2


#
1
1 

+... .
−
2/3
2/3
N+
N−
2 N −1/3
=
(N+ − N− )
3 2
2 N −5/3
(N+ − N− ) .
=−
3 2
µ0 (N+ − N− )
= χB
V
mit der Suszeptibilität
2µ2 2m V
χ= 0 2
V h̄
6π 2

2/3
π2
3µ20 N 
=
1−
2εF (N ) V
12
Für hohe Temperaturen

3 N
2
2
1/3
kB T
εF (N )
π2
+
12
!2
2mkB T
h̄2
!2 V
6π 2
4/3 N
2

+ . . . .
µ± ≈ kB T ln
λ3 N ±
V
N±
1
' 3 eµ± /kB T
V
λ
V
µ0 B
V
≈ 2 3 eβµ
N = N+ + N− = 3 eβµ 2 cosh
λ
kB T
λ
µ+
µ− µ0
µ0 (N+ − N−
' 3 e kB T − e kB T
M=
V
λ
96
−5/3
−1
+ . . .
µ0 k µ T
µ0 B
e B 2 sinh
3
λ
kB T
µ0 N µ0 B
2
≈
2V kB T
=
also
χ=
µ20 N
kB T V
χ
kT/E F
1
Paramagnetische Suszeptibilität χ als Funktion der Temperatur in Einheiten der
Fermi-Energie
33
Diamagnetismus des freien Elektronengases
Wir wissen, daß die einzelnen Elektronen quantisierte Landau-Niveaus einnehmen mit Energien
p2
eh̄B
ε(pz , `) = z +
(` + 1/2) ` = 0, 1, 2, . . .
2m
mc
Jedes Landau-Niveau ist entartet, da es alle klassischen Kreisbahnen mit
p2x + p2y
eh̄B
eh̄B
` <
<
(` + 1)
(33.1)
mc
2m
mc
enthält. Also ist der Entartungsgrad des `-ten Landau-Niveaus
g` = 2
X
px ,py
2L2 Z
V 2/3
eh̄B
=
dp
dp
=
2
≡ g.
π2m
x
y
2
2
2
h
mc
(2π) h̄ (33.1)
Großkanonische Zustandssumme:
Zg =
X
{n}
e
−β
P
p,`,α
(εp,` −µ)np,`α
=
X
{n}
e
−βg
P
p,`
(εp,` −µ)np,`
α numeriert die g-entarteten Subniveaus von εp,` durch np,`,α ist die Besetzungszahl des
Subniveaus α von εp,` . Wir erhalten wie üblich
ln Zg = g
X
ln(1 + e−β(εp,` −µ) )
p,`
Z +∞
∞
p2
2V 2/3
eh̄B X
L
+ eh̄B
(`+1/2)−µ)
−β( 2m
mc
=
).
π
·
2
dp
ln(1
+
e
2
2
c `=0 2πh̄ −∞
(2π) h̄
97
Für hohe Temperaturen ergibt sich durch Entwicklung des Logarithmus unter dem Integral
nach der Exponentialfunktion
eh̄B
V eh̄B q
1
2πmkB T e−β( 2mc −µ)
ln Zg ≈ 4 3 π
.
eh̄B
h
c
1 − e− mc β
Die Magnetisierung ist definiert durch
hM i = +
Für kleine B
Daraus
1 ∂
ln Zg .
βV ∂B

1
1
ln Zg ≈ 2V eβµ 3 1 −
λ
6
eh̄
2mc
!2 2eβµ · 2
hM i = −
6 · k B T λ3
eh̄
2mc
!2
B
kB T
2

+ . . . .
B = χdia B .
Benutzen wir die Gleichung für hN i
2eβµ ≈
λ3 hN i
V
so erhalten wir das einfache Resultat, für kB T χdia
hN i
≈−
3V kB T
eh̄
2mc
eh̄B
mc
!2
1
= − χpara .
3
Wir schließen, daß der Paramagnetismus des Elektronengases zwar durch den entgegengesetzten Diamagnetismus abgeschwächt wird, aber überwiegt.
Bei tiefen Temperaturen hängt χdia in unstetiger Weise, oszillatorisch, von B ab (DeHaas–
VanAlphen-Effekt). Die unstetigen Änderungen treten immer dann auf, wenn ein LandauNiveau mit wachsendem B die Fermi-Energie überstreicht, da sich dann dieses oberste besetzte Landau-Niveau plötzlich entleert und sich damit die Besetzungszahl dieses Niveaus
in unstetiger Weise ändert. Da g ∼ B zunimmt, gehen die Elektronen in die verbleibenden
tiefer liegenden Landau-Niveaus.
34
Einige astrophysikalische Anwendungen der
Theorie des idealen Fermi-Gases
Wichtige Fermi-Gase sind:
Elektronen in Metallen, Elektronen und Löcher in Halbleitern, Nukleonen in Atomkernen,
Neutronen in Neutronensternen, Elektronen in weißen Zwergen, 3 He als Gas und Flüssigkeit.
Eine wichtige Kenngröße für diese Systeme ist die Fermitemperatur
εF
h̄2
TF =
=
kB
2mkB
6π 2
2S + 1
98
!2/3 N
V
2/3
.
Sie hängt von der Masse der Fermionen ab (kleines m heißt großes TF ) und vor der Teilchendichte (große Teilchendichte heißt großes TF ). Typische Fermitemperaturen sind:
Metall: Die Dichte der Leitungelektronen ist ca. 1 pro Gitterzelle (allgemein die chemische
Wertigkeit des Metallatoms pro Gitterzelle)
1023
N
'
,
V
cm3
TF ' 106 K
Halbleiter: TF kann in Bereich der Zimmertemperatur liegen oder kleiner sein.
Nukleonen in Atomkernen und Neutronen in Neutronensternen:
TF ' 3 × 1011 K
εF ' 30M eV ,
Elektronen in weißen Zwergen:
1030
N
'
,
V
cm3
TF ' 1011 K
εF ' 20M eV
dies sind Sterne der Größe etwa der Sonne, deren Wasserstoff zu Helium fusioniert ist.
% ' 107 g/cm3 ,
T ' 107 K TF .
In flüssigem 3 He ist das mittlere Volumen pro Atom ca 46,3Å3 , woraus TF ' einige ◦ K folgt.
Die Tatsache, daß Metallelektronen bei Zimmertemperatur entartete Fermi-Gase sind hat
wichtige Konsequenzen: Der Beitrag der Metallelektronen zur spezifischen Wärme ist proportional zu T /TF und etwa um diesen Faktor kleiner, als der Beitrag des Gitters bei Zimmertemperatur. Wir werden sehen, daß der Beitrag des Gitters (der Phononen) verschwindet
wie T 3 für T → 0. Dann dominiert der lineare Beitrag in T der Leitungselektronen.
Um astrophysikalische Anwendungen zu betrachten, wollen wir das Fermi-Gas auch relativistisch behandelt, d.h.
q
εp = p 2 c2 + m 2 c4 .
Die Energie des Grundzustands wird dann
E0 = 2
X q
p 2 c2 + m 2 c4 =
|p|<pF
2V
h3
Z
pF
0
q
4πp2 dp p2 c2 + m2 c4 .
Für pF mc:
2V
E0 = 3
h
!
4π 3
4π p5F
4πV
pF mc2 +
+ . . . = N · mc2 + 3 p5F + . . .
3
5 2m
5h m
Für pF mc (hochrelativistischer Grenzfall)
m4 c 5 1 p F
E0 = 2 3 V
π h̄ 4 mc
3π 2 N
pF = h̄
V
4
!1/3
.
99


1 + 1
pF 2
mc

+ . . .

Der Druck bei T = 0 ist
m4 c 5
∂F ∂E0
=
p0 = −
=−
∂V T =0
∂V
12π 2h̄3
pF
mc
4


1 − 1
pF 2
mc


+ . . . .
Der Druck im Zentrum eines Sterns mit Radius R muß im Gleichgewicht die Gravitationsenergie pro Volumeneinheit aufwiegen, also mit der Gravitationskonstanten γ,
p0 = α
γM 2
mit einem dimensionslosen Proportionalitätsfaktor α = O(1)
R4
(bei inkompressibler Materie und nicht-relativistischer Gravitation findet man z.B. α =
1/3
(3/8π)). Da pF ∼ NR und V ∼ R3 erhält man eine Gleichung der Form
N 4/3
C2 R 2
C1 4 1 − 2/3
R
N
!
C3 N 2
=
R4
mit
C1 =
π −2/3 35/3
c h̄(3π 2 )4/3 N 1/3
=
ch̄
4/3
12π 2
214/3
4π
3
C2 =
2/3
4π
3
2
2
h̄ (3π )2/3
m2 c 2
= π −2/3 3−4/3 24/3
m2 c 2
h̄2
C3 = αγm20
wobei m0 die Masse eines Nukleons (Proton oder Neutron) ist. Dagegen ist m die Masse
desjenigen Teilchens, dessen Fermi-Entartung den stabilisierenden Druck liefert (Elektronenmasse bei weißen Zwergen, Neutronenmasse bei Neutronensternen). Die Lösung für R
ist
N 1/3
C3 2/3 1/2
√
R=
1−
,
N
C1
C2
falls
C1 3/2
.
C3
Andernfalls gibt es keine stabile Gleichgewichtslage. Die Zahl
N<
C1
NC =
C3
3/2
=
35/3
ch̄
14/3
2/3
2 π
αγm20
!3/2
'
ch̄
γm20
!3/2
gibt eine kritische Schranke an. Überschreitet die Teilchenzahl eines Sterns diese Schranke (Chandrasekhar-Schranke), so kollabiert er (Gravitationskollaps). Setzt man für m0 die
Masse des Protons ein, so erhält man
h̄c
' 1039
γm2p
100
und
Mc = m 0 N c ' M Θ
Sonnenmasse .
Also:
Massen, die wesentlich schwerer sind als die Sonne, können keine stabilen Sterne mehr bilden
und kollabieren (Gravitationskollaps).
Für kleinere Dichten genügt die nichtrelativistische Rechnung. Die Gleichgewichtsbedingung
p0 = α
liefert dann mit p0 =
2
2 pf
5 2mV
γM 2
γm20 N 2
=
α
R4
R4
N
1
2
N
2
2 1/3
4π 3 h̄ (3π )
5 2m 3 R
4π
3
!4/3 N
R3
2/3
woraus N 1/3 R = C4
2 3(3π 2 )1/3 34/3
folgt, mit C4 =
5 2α4π(4π)4/3
γm20 N 2
=α
R4
h̄2
γm m20
!
'
h̄2
γm m20
!
.
Weiße Zwerge werden durch den Nullpunktsdruck des Elektronengases stabilisiert und bestehen hauptsächlich aus Helium, also
m = mel
m0 = mHe .
Ihre Teilchendichte bei gegebener TeilchenzahlN ist also
N
'
R3
γm m20
h̄2
!3
N2 .
Wird das stabilisierende Elektron durch Vergrößerung von N auf den Raum des Atomkerns
eingeschränkt, bilden sich durch inversen β-Zerfall Neutronen, welche nun die Rolle des
stabilisierenden Fermi-Gases übernehmen, d.h. nun ist
m = mNeutron .
Damit steigt die Gleichgewichtsdichte um einen Faktor
mNeutron
mel
3
' 106
an, d.h. der Radius kollabiert auf 1/100 (Supernova) und es bildet sich ein Neutronenstern.
Wird N weiter erhöht, bei wesentlich über 1039 hinaus, dann wird das Neutronengas extrem
relativistisch und kann schließlich den Gravitationskollaps nicht mehr verhindern, wenn die
Chandrasekhar-Grenze überschritten wird. Es bildet sich ein schwarzes Loch.
101
35
Thermische Strahlung: Photonengas
Photonen sind die Teilchen eines Vektorfeldes und tragen daher den Spin 1. Allerdings haben sie wegen der Transversalität elektromagnetischer Wellen nur zwei Spineinstellungen,
welche den beiden Polarisationsrichtungen von Licht entsprechen. Ihre Ruhemasse ist Null.
Gemäß der speziellen Relativitätstheorie bewegen sich masselose Teilchen stets mit Lichtgeschwindigkeit, sind also stets relativistisch zu behandeln. Photonen werden bei Emission
elektromagnetischer Strahlung frei erzeugt und bei Absorption vernichtet. Da für Photonen keine Teilchenzahlerhaltung gilt, ist die einzige Einschränkung, der das Gleichgewichtsensemble unterliegt, die Energieerhaltung, d.h. bei Energieaustausch ist im Gleichgewicht
die Temperatur vorgegeben durch das Wärmebad und die Energie liegt nur im Mittel fest.
hEi =
X
k
h̄ωk hb+
kλ bkλ i .
Hier sind bkλ und b+
kλ die Vernichtungs- und Erzeugungsoperatoren der Schwingungsquanten
des Lichtfelds mit Wellenvektor k und Polarisationsindex λ (z.B. λ = + für rechtszirkular
und λ = − für linkszirkular). Die Winkelfrequenz ωk = ck ist im Vakuum unabhängig von
λ. Also gilt im Gleichgewicht für den statistischen Operator
X
1
% = exp −β
h̄ωk b+
kλ bkλ
Z
kλ
!
.
In Photonenzahldarstellung mit b+
kλ bkλ |{n}i = nkλ |{n}i gilt
%=
X
W ({n})|{n}ih{n}|
{n}
1 −β P h̄ωk nkλ
kλ
.
e
Z
Die mittlere Besetzungszahl der Mode (q, κ) ist
mit
W ({n}) =
hnqκ i =
X
=
X
1 −β Pk,λ h̄ωk nkλ
nq,κ
e
Z
{n}
nq,κ
=−
1 −βh̄ωk nqκ
e
nq,κ
Zq,κ
1 ∂
ln Zq,κ ,
h̄ωk ∂β
1
.
1 − e−βh̄ωq
Damit ergibt sich die Plancksche mittlere Photonenzahl
wobei
Zqκ =
hnqκ i =
1
eβh̄ωq
−1
.
Um die mittlere spektrale Energiedichte u(ω)dω der thermischen Strahlung zu bestimmen
in einem (gegenüber der mittleren Wellenlänge) großen Volumen V = L3 , müssen wir die
Moden im Frequenzintervall dω um ω abzählen. Ist ihre Anzahl V g(ω)dω, so ist
u(ω) =
h̄ω
g(ω)dω .
−1
eβh̄ω
102
Die Anzahl V g(ω)dω für großes V ist gleich dem doppelten (wegen der beiden Polarisationsrichtungen) Volumen 4πn2 dn im n-Raum, welches über k = 2π
n dem Volumen der
L
Kugelschale im k-Raum entspricht, mit Radius |k| = ω/c und Dicke d|k| = dω/c. Also
L
V g(ω)dω = 2
2π
3
4π
ω 2 dω
.
c2 c
Das Volumen V hebt sich heraus, wie es für die Existenz des Grenzübergangs V → ∞
erforderlich ist, und wir erhalten für die Modendichte (Anzahl der Moden pro Volumen und
Frequenzeinheit) der elektromagnetischen Strahlung
g(ω)dω =
ω2
dω .
π 2 c3
Damit haben wir die Plancksche Strahlungsformel für thermische Strahlung abgeleitet. Das
heute wichtigste Beispiel ist die elektromagnetische kosmische Hintergrundstrahlung mit
T = 2.7 ◦ K. Bestimmen wir die mittlere Photonenzahl pro Volumeneinheit der thermischen
Strahlung. Da keine Teilchenzahlerhaltung gilt, ist sie wie schon erwähnt kein unabhängiger Parameter, welcher den Gleichgewichtszustand einschränkt und festlegt, sondern sie ist
eine eindeutige Funktion der Temperatur T , des einzigen Parameters, von dem (neben dem
Volumen) der Gleichgewichtszustand abhängt:
hN i =
Z ∞
1 X
1
.
hnkλ i =
g(ω)dω βh̄ω
V k,λ
e
−1
0
Hierbei haben wir den Limes V → ∞ gebildet, in dem die diskrete Summe über k in
ein Integral über das im Limes kontinuierliche Modenspektrum übergeht, mit der gerade
bestimmten Modendichte g(ω). Durch Entwicklung der Planckschen Besetzungszahl in eine
geometrische Reihe und Einführung der Integrationsvariablen nβh̄ω = x erhalten wir
hN i
1
= 2
V
π (βh̄c)3
Z
∞
0
∞
X
1
2
x e dx
= 2
3
π
n=1 n
2 −x
kB
h̄c
!3
P
T 3 ζ(3) ,
−p
wo ζ(p) = ∞
die Riemannsche ζ-Funktion ist. Es ist ζ(3) = 1.202 . . . .. Für T → 0
n=1 n
nimmt also die Photonenzahldichte proportional zu T 3 ab.
4
Die mittlere Energiedichte ergibt sich ganz analog in den folgenden Schritten mit ζ(4) = π90
1 X
hEi
=
h̄ωk hb+
kλ bkλ i
V
V k,λ
=
=
1 X
h̄ωk hnkλ
V k,λ
Z
∞
0
g(ω)
h̄ω
dω
−1
eβh̄ω
∞
1
(kB T )4 Z ∞ 3 −x X
x
e
dx
= 2
3
4
π (h̄c) 0
n=1 n
=
3! (kB T )4
2π 2 (kB T )4
ζ(4)
=
.
π 2 (h̄c)3
30(h̄c)3
103
Die spezifische Wärme cv des Photonengases ist also
4kB π 2
∂ hEi =
cv =
(kB T )3
3
∂T V V
15(h̄c)
und die Entropie
S
=
V
Z
T
0
dT 0
cv (T 0 )
8kB
2π 4 hN i
3
=
ζ(4)(k
T
)
=
.
B
T0
π 2 (h̄c)3
45 V
Es ist interessant, sich die Entropiedichte des Weltalls aufgrund der kosmischen Hintergrundstrahlung zu überlegen, und diese mit der Nukleonendichte (∼ 1/m3 ) zu vergleichen, was
ein Verhältnis von ca 109 ergibt. Das Ergebnis besagt, daß das Universum im Verhältnis zu
seinem Materieinhalt eine enorm hohe Entropie besitzt. Würde man es adiabatisch wieder
zurückkomprimieren auf eine mittlere Dichte, die der von normaler Materie entspricht, hätte
die kosmische Hintergrundstrahlung eine Temperatur von T ∼ 1010 K.
Den Druck des Photonengases finden wir schließlich aus
1 hEi
∂hEi =+
p=−
.
∂V S
3 V
Letztere Relation folgt auch aus der Elektrodynamik (z.B. indem man benutzt, daß der Druck
der isotrope Anteil des Spannungstensors ist, und man den Maxwellschen Spannungstensor
benutzt)
36
Phononengase
Ein Festkörper aus N -Atomen (f = 3N ), bei kleiner Auslenkung aus den Ruhelagen, hat
3N -Normalschwingungen mit den Frequenzen
ω1 , ω2 . . . ω3N .
Die quantisierte Version dieser Normalschwingungen heißen Phononen. Ein Kristall mit einem Atom pro Elementarzelle besitzt nur akustische Phononen d.h. Gitterschwingungen,
deren Frequenzen ω(k) gegen Null gehen für k → 0.
Grenze der Brillouin-Zone
Ω(k)
k
in eine feste Richtung im k-Raum
Dispersionsrelation akustischer Phononen
104
Phononen sind ein Vektorfeld, haben also Spin 1. Die 3 Spineinstellungen entsprechen 3
unabhängigen Polarisationsrichtungen, eine longitudinale und zwei transversale. Die Dispersionsrelation für verschiedene Polarisationsrichtungen stimmen im allgemeinen nicht überein.
Also hat man 3 Zweige von akustischen Phononen. Hat man einen Kristall mit mehreren Atomen pro Elementarzelle p Stück), so können diese Atome entweder miteinander, d.h. in Phase
schwingen – was wieder zum 1-atomigen Fall zurückführt (also zu akustischen Phononen,
oder sie schwingen gegeneinander, was zu optischen Phononen führt (3(p − 1) verschiedene
Zweige) z.B. 2 Atome pro Elementarzelle (N aCl).
Ω (k)
Grenze der Brillouin-Zone
optische
Zweige
akustische
Zweige
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
k
N/p diskrete Werte von k, z.B. (k 1, k 2, k3 ) = (2 π / L) (n 1, n2 , n3 )
Akustische und optische Phononen in einem Kristall aus N -Atomen mit Volumen L 3 und
p = 2 Atomen pro Einheitszelle
In einem endlichen Kristall mit N/p Einheitszellen: N/p diskrete k-Werte, kl = 2π
l. Optische
L
Phononen haben eine Frequenzlücke ω0 bei k = 0. Sie sind für kB T h̄ω0 praktisch nicht
angeregt. Bei tiefen Temperaturen sind also vor allem akustische Phononen wichtig, und hier
vor allem langwellige akustische Phononen, für die ωs (k) = cS k. Der Hamiltonoperator in
Besetzungszahl-Darstellung lautet
H=
XX
n̂lλ +
l
λ
1
h̄ωλ (kl )
2
in Zukunft ωλ (kl ) = ωlλ .
Hierbei soll λ über alle 3p Phononenzweige laufen (akustische und optische). Wiederum gibt
es keine Teilchenzahlerhaltung, da Phononen beliebig erzeugt und vernichtet werden: µ = 0.
Zg =
X
=
Y
{n}

exp −β
e
− 21 βh̄ωlλ
l,λ
X
l,λ
h̄ωlλ nlλ +
1
.
1 − e−βh̄ωlλ

1 
2
Daraus
hnlλ i + 1/2 = −
1 ∂
1
1
ln Zg = βh̄ω
+
lλ
h̄β ∂ωlλ
e
−1 2
105
hEi = E0 +
X
1X
h̄ωlλ
.
h̄ωlλ +
βh̄ω
2 l,λ
e lλ − 1
l,λ
Spezifische Wärme
X h̄ωlλ /kB T
∂hEi
= kB
Cv =
∂T
eβh̄ωlλ − 1
l,λ
36.1
!2
eβh̄ωlλ .
Einstein Näherung für optische Phononen:
Die 1. Brillouin Zone wird durch eine Kugel um k = 0 mit gleichem Volumen (im k-Raum)
ersetzt. Die Frequenz eines jeden optischen Zweiges wird durch eine Konstante ωEi ersetzt
P
(i = 1 . . . 3(p − 1)). Dann ist l ausführbar und gibt einfach die Zahl der Einheitszellen im
Kristall an: N/p (p= Zahl der Atome pro Einheitszelle). Also
Cv =
3(p−1)
h̄ωEi
∂ N X
·
.
βh̄ωEi
∂T p i=1 e
−1
Jeder optische Zweig trägt also bei mit
N
h̄ωEi
Cvi = k B
p
kB T
!2
eh̄ωEi /kB T
.
(eh̄ωEi /kB T − 1)2
Man sieht, wie Cv exponentiell gegen 0 geht für T → 0. Die Näherung ωEi konstant zu setzen
ist natürlich nur gut für enge optische Zweige.
N
h̄ωEi
Cvi −→ kB
p
kB tT
!2
e−h̄ωEi /kB T
für T → 0
Wir sehen, wie der Beitrag optischer Phononen zur spezifischen Wärme exponentiell gegen
N kB
und
Null geht für T → 0. Für T → ∞: Cvi →
p
X
optische
Zweige
Cvi =
3p − 1
N kB
p
(Dulong-Petit)
In diesem Limes ergibt sich also das Ergebnis des Gleichverteilungssatzes.
36.2
Debye Näherung für akustische Zweige:
Die 1. Brillouin-Zone wird durch eine Kugel gleichen Volumens im k-Raum ersetzt (Radius
kD ). Die Frequenz eines jeden akustischen Zweigs wird ersetzt durch
ωkλ = cλ k .
Bestimmen wir kD : Da
X
1=
Zahl der Einheitszellen im Kristall
k
=
N
p
p = Zahl der Atome pro Einheitszelle
106
(Achtung: p nicht mit dem Druck verwechseln, der im folgenden nicht vorkommt), und
X
k
1→
Z kD
V Z 3
V
V 4π 3
2
d
k
=
4π
k
k
dk
=
(2π)3
(2π)3
(2π)3 3 D
0
ist
p 3
N
= 2 kD
V
6π
kD = Debyesche Wellenzahl
ωDλ = cλ kD = Debye Frequenz
kB ΘDλ = h̄ωDλ : Debye Temperatur
Dann erhält man für jeden akustischen Zweig λ den Beitrag zur spezifischen Wärme
∂ X h̄ωkλ
∂T k eβh̄ωkλ − 1
h̄cλ k
∂
V Z kD
4πk 2 βh̄c k
=
dk
3
∂T (2π) 0
e λ −1
Cv(λ) =
mit der Substitution
x=
h̄cλ k
kB T
V =
6π 2
N
3
pkD
und
wird daraus
cv(λ)
C (λ)
T
3
= v = kB
N
p
ΘDλ
3 Z
ΘDλ /T
0
|
T
x4 e x
4π 4
kB
dx
→
x
2
(e − 1)
5p
ΘDλ
{z
}
für T →0: 154 π4
3
.
Für T → 0 erhält man für den Beitrag der akustischen Phonen zur spezifischen Wärme
cv =
mit
Für T ΘD :
1 12π 4
T
kB
p 5
ΘD
3
3
1
1X
1
kB ΘD = h̄ωD = h̄c̄kD , ¯3 ≡
.
3 λ=1 c3λ
c
Cv →
3N
kB
p
Dulong Petit
Den Verlauf des Beitrags akustischer Phononen zur spezifischen Wärme eines Kristalls (für
p = 1) zeigt die folgende Figur
107
~
Typische Debye-Temperaturen sind:
Eisen
ΘD = 420 ◦ K
mittlerer Wert
C (Diamant)
ΘD = 1860 ◦ K
sehr hoch.
Je härter ein Material, desto höher c̄ und damit auch ΘD .
Vergleich der Debye Näherung für tiefe Temperaturen mit der Theorie des Photonengases:
(1) Die mittlere Schallgeschwindigkeit tritt an die Stelle der Lichtgeschwindigkeit.
(2) Ein zusätzlicher Faktor 2/3 tritt für das Photonengas auf, da ein Ast fehlt (es gibt
keine longitudinalen Photonen).
(3) Das Wellenzahl-Integral für das Photonengas geht nach ∞, nicht bis kD , da es keine
Gitterstruktur des leeren Raumes gibt im Photonengas (mindestens nicht bis hin zu
den kleinsten bis heute zugänglichen Längenskalen). D.h. im Kristall gibt es nur endlich
viele (3N ) Gitterschwingungen, im Vakuum dagegen unendlich viele elektromagnetische Schwingungen (“Moden“ des elektromagnetischen Feldes).
37
Massives Bose-Gas und
Bose-Einstein Kondensation
(Literatur: K. Huang, Band II, Kapitel XII)
Im Jahre 1924 sagten der (vorher völlig unbekannte) indische Physiker Bose, und später
dadurch angeregt der damals schon weltberühmte Einstein die Kondensation eines idealen
Gases bei tiefen Temperaturen in einen rein quantenmechanisch bestimmten Zustand, das
Bose-Einstein Kondensat, voraus. Heute weiß man, daß nur Teilchen mit ganzzahligem Spin
der von Bose und Einstein zuerst benutzten Statistik folgen, sie heißen daher Bosonen. Seit
Boses und Einsteins Vorhersage gab es viele Versuche, die Bose-Einstein Kondensation im
Labor zu realisieren oder beobachtete Systemeigenschaften damit in Verbindung zu bringen
oder zu erklären. Doch erst 1995 gelang es kurz nacheinander zwei amerikanischen Gruppen, Bose-Einstein Kondensate in verdünnten, nahezu idealen Gasen von Alkaliatomen zu
realisieren. Das Rennen gewann eine Gruppe um C. E. Wieman und E. A. Cornell am JILA in Boulder/ Colorado, denen es gelang, einige Tausend Rb87 -Atome im 5S1/2 , F = 2,
108
mF = −2 Zustand in einer Magnetfalle bis auf eine Temperatur von ca. 100nK abzukühlen,
wobei Bose-Einstein Kondensation im quantenmechanischen Grundzustand der Falle bei
TBE = 170nK beobachtet wurde. Dicht gefolgt wurde dieser Erfolg von einer Gruppe um
W. Ketterle am MIT in Boston, die andere Magnetfallen und Na23 -Atome im 3S1/2 , F = 1,
mF = −1 Zustand benutzen, die bis auf ca 2µK abgekühlt werden, wo sie ebenfalls ein BoseEinstein Kondensat bilden. In den MIT Experimenten handelt es sich um Kondensate von
106 −107 Atomen. Ein drittes etwa zeitgleiches Experiment mit Lithium Atomen (Li7 ) wurde
von R. G. Hulet et al an der Rice University in Houston durchgeführt. Auch dieses Experiment zeigt inzwischen in klarer Weise Bose-Einstein Kondensation für die Atome im 2S1/2 ,
F = 2, mF = −2 Zustand. Während sich sowohl Rb-Atome als auch Na-Atome schwach
abstoßen, ziehen sich Li-Atome schwach an, was für die Bose-Einstein Kondensation einen
wichtigen Unterschied macht.
Diese kurz nacheinander erzielten Erfolge beruhen auf experimentellen Fortschritten bei
der Konstruktion von Magnetfallen, und der Kühltechnik für Atomgase in solchen Fallen.
Die verwendete Kühltechnik ist eine Kombination von Laserkühlung, mit der Atome bis auf
ca 100µK vorgekühlt werden, und anschließender Verdampfungskühlung auf die benötigte
Endtemperatur.
Die Realisierung von Bose Einstein Kondensaten im Labor hat das Interesse an der Theorie dieses Phänomens neu belebt – u.a. auch in meiner Arbeitsgruppe. Betrachten wir ein
ideales Bose-Gas von Atomen der Masse m im thermodynamischen Gleichgewicht bei der
Temperatur T in einem festen Volumen V , das wir zunächst als endlich voraussetzen. Wir
nehmen der Einfachheit halber an, daß die Atome Spin S = 0 haben. Für den Hamiltonoperator
X
εk a+
H=
k ak
k
und
Nop =
X
a+
k ak
k
lautet das großkanonische Ensemble
%G =
1 −β P a+ ak (εk −µ)
k k
e
.
ZG
Es führt in der schon bekannten Weise auf die Plancksche mittlere Besetzungszahl
hnk (β, µ)i = eβ(εk −µ) − 1
−1
.
Da hnk i ≥ 0 für alle k gilt, und insbesondere auch für k = 0, muß für das massive ideale
P
Bose-Gas µ < ε0 sein. Zur Fixierung von µ (in D Dimensionen) ist hN i = k hnk i zu erfüllen.
Unser Ziel ist es, die Besetzungszahl im energetisch tiefsten Einteilchenzustand k = 0, ε0 = 0
zu bestimmen. Daher spalten wir die Summe auf in
hN i = hN0 i +
mit hN0 i =
z
,
1−z
X
k6=0
hnk i
z = eβµ = e−β|µ| , hnk i = z/(eβεk − z).
Für endliches Volumen muß die Summe im allgemeinen numerisch ausgewertet werden. Doch
109
für kB T sehr viel größer als der größte Abstand benachbarter
1-Teilchenniveaus (der wie
R
P
−2/3
V
skalt) können wir zum Integral übergehen, k → dεg(ε).
Es ist von einigem Interesse die folgende Diskussion für beliebige Dimension D zu führen,
nicht nur für D = 3. Für ein D-dimensionales Volumen V = LD für Λ L, wobei
Λ=
q
2πh̄2 β/m
die thermische deBroglie Wellenlänge ist, gilt
X
k
V
→
(2π)D
mit
X
k6=0
Z
V SD−1
d k→
(2π)D
D
V
g(ε) =
2
m
πh̄2
hnk i = V SD−1
Z
∞
0
SD−1
=V
(2π)D
Z
D
∞
0
dkk
D−1
=
Z
∞
0
g(ε)dε
D
SD−1 ε 2 −1 ,
1
k D−1 dk
D
−1
βε
(2π) z e k − 1
2m
βh̄2
!D/2 Z
∞
0
xD−1 dx
.
z −1 ex2 − 1
Hierbei ist SD−1 das Volumen der (D −1)-Sphäre (d.h. der (D −1)-dimensionalen Oberfläche
der D-dimensionalen Einheitskugel)
SD−1 =
2π D/2
.
(D/2 − 1)!
Durch Entwicklung des Integranden in eine geometrische Reihe und Übergang zur Integrationsvariablen y = (n − 1)x2 erhalten wir
hN i − hN0 i
1
=
V
(2π)D/2 D2 − 1 !
m
βh̄2
!D/2 Z
∞
0
D
dye−y y 2 −1
∞
X
zn
= Λ−D gD/2 (z) . (37.1)
D/2
n
n=1
Für D = 3 ist also g3/2 (z) relevant. Den Verlauf dieser Funktion zeigt die folgende Figur
g 3/2 (z)
2.612
0
1
110
z
Die Funktionenschar gp (z) ist definiert durch
gp (z) =
∞
X
zn
p
n=1 n
(Re(p) > 1, |z| ≤ 1) .
Für reelle p > 1 ist gp (z) auf der reellen z-Achse im Intervall 0 < z ≤ 1 monoton wachsend
und erreicht seinen Maximalwert gp (1) = ζ(p)(p > 1) für z = 1, d.h. µ = 0. Die Funktionen
gp (z) haben die folgenden asymptotischen Entwicklungen für z = e−α , α → 0:
p = 1:
p = 2:
p > 0,
Hier kann man das Integral exakt auswerten
mit dem Ergebnis
g1 (e−α ) = − ln(1 − e−α )
Asymptotisch für α → 0 gilt
g2 (e−α ) ∼ ζ(2) − α(1 − ln α) + 0(α2 )
nicht ganzzahlig
P
(−α)k
gp (e−α ) ∼ ζ(p) + Γ(1 − p)αp−1 + ∞
k=1 ζ(p − k) k!
speziell für p = 3/2
g3/2 (e−α ) ∼ 2.612.. − 3.545..α1/2 + 1.460..α + 0(α)2
Man findet diese Darstellungen (die auch für die analytische Fortsetzung für α < 0 verwendet
werden können) über die Mellin-Transformierte
Gp (s) =
Z
∞
0
gp (e−α )αs−1 = ζ(p + s)Γ(s) ,
die in der komplexen s-Ebene definiert ist und deren Umkehrung
gp (e−α ) =
1
2πi
Z
c+i∞
c−i∞
dsα−s ζ(p + s)Γ(s) ,
wobei der Integrationsweg s = c rechts aller Singularitäten von Gp (s) verläuft.
D > 2: Liegt hN i/V unter einem kritischen Wert, so ist die Gleichung (37.1) lösbar und
liefert z = e−β|µ| als Funktion von hN i/V . Dies ist für hinreichend hohe Temperaturen, oder
bei jeder gegebenen Temperatur bei hinreichend kleinen Teilchenzahldichten, stets der Fall.
Liegt jedoch die mittlere Teilchendichte hN i/V über dem temperaturabhängigen kritischen
Wert
Nc /V = ζ(D/2)/ΛD = const T D/2 ,
m 3/2
(für D = 3: Nc /V = 2.612 . . . ( 2πh̄
(kB T )3/2 ) der bis auf einen numerischen Faktor der
2)
Größenordnung 1 gleich dem inversen deBroglie-Volumen ΛD ist, so ist µ = 0 und es sammeln
sich alle überschüssigen Teilchen im 1-Teilchen Grundzustand k = 0, ε0 = 0 an. Dies ist die
Bose-Einstein Kondensation. Es gibt im Prinzip zwei Möglichkeiten, in einem Bose-Gas die
Bose-Einstein Kondensation zu erzwingen
1. Erniedrigung der Temperatur bei fester Teilchendichte unter die von der Teilchendichte
abhängige kritische Temperatur
k B Tc =
N
V ζ(D/2)
111
!2/D
2πh̄2
m
oder
2. Erhöhung der Teilchendichte bei fester Temperatur über den temperaturabhängigen
kritischen Wert Nc /V .
Wegen z = 1 für T < Tc oder hN i > Nc ist
hN i − hN0 i = V Λ
−D
T
ζ(D/2) = Nc = hN i
Tc
D/2
,
so daß wir hN0 i, im thermodynamischen Limes V → ∞, hN i/V fest, darstellen können
in den Formen

0
T > Tc
(hN i < Nc )
hN0 i
D/2
=
1 − T
hN i→∞ hN i
= 1 − NNc
T < Tc
Tc
lim
(hN i > Nc )
Hier haben wir benutzt, daß z < 1 für T > Tc und daher limhN0 i/V = lim(z/V (1 −
z)) = 0.
Für großes aber endliches Volumen V (und entsprechend endliche Teilchenzahl hN i) erfährt
der im Limes scharfe Übergang eine Abrundung, weil z nun über einen endlichen Übergangsbereich hinweg gegen 1 strebt.
Isotherme in der (|µ|, hN i) Ebene bei endlichem Volumen
In endlichen Systemen gibt es also keine vollkommen scharfe Phasenübergänge. Dies muß so
sein, da in endlichen Systemen Mittelwerte keine Singularitäten aufweisen können. Um den
Übergangsbereich aufzulösen, müssen wir die Bestimmungsgleichung für z
ΛD
hN i
ΛD z
= gD/2 (z) +
V
V 1−z
(37.4)
für endliches aber großes V lösen. Hierbei wird sich eine Lösung für z ergeben, die für
hN i > Nc und 0 < (Nc − hN i)/hN i 1 dicht unter z = 1 liegt. Setzen wir also z = e−β|µ| =
112
1 − β|µ| + 21 β 2 µ2 + . . . und entwickeln obige Gleichung nach β|µ|, so nimmt sie die Form an
für 2 < D < 4
!
D−2
ΛD 1
D
|βµ| 2 + O(β|µ|) .
+Γ 1−
V β|µ|
2
√
Speziell für D = 3 ist z.B. Γ(1 − D/2) = −2 π < 0. Wir erhalten also glatte Isothermen
c
= F (β|µ|), die hier dargestellt sind.
der Form hN i−N
V
Im Limes V → ∞, hN i/V fest, schmiegt sich diese Isotherme für D > 2 immer mehr der
gestrichelten Kurve an falls µ = −|µ| 6= 0, wo also dann hN i > Nc in diesem Limes |µ| = 0
ist: D.h. im Limes V → ∞ ergibt sich wieder der scharfe Phasenübergang.
Für D = 2 hat die Funktion gD/2 (z) die geschlossene Form
Λ
D
hN i − Nc
V
=
g1 (z) = − ln(1 − z) .
In diesem Fall tritt auch im Limes V → ∞, hN i/V fest, keine Bose-Einstein Kondensation
ein. Die Gleichung (37.4) ist nämlich selbst im Grenzfall V → ∞, in dem der letzte Term auf
der rechten Seite N0 /V gegen 0 tendiert, für beliebig große Teilchendichten immer lösbar.
i
Im Grenzfall Λ2 hN
1 ergibt sich z.B. das Ergebnis
V
−βµ ' e−
Λ2 hN i
V
D=2,
womit die Besetzungszahl im Grundzustand asymptotisch geht wie
N0 ' e Λ
2 hN i/V
D=2,
so daß N0 /hN i = 0 im thermodynamischen Limes V → ∞, hN i/V = const . Im ganzen
Bereich D ≤ 2 tritt keine Bose-Einstein Kondensation auf. Zwar ist gD/2 (z) nicht in geschlossener Form bekannt, doch kann man für ΛD hN i/V die asymptotische Entwicklung für
z → 1 benutzen, und wir erhalten im thermodynamischen Limes
Λ
D hN i
V
D
'Γ 1−
2
woraus

−βµ ' 
Γ 1−
D
2
ΛD hN i
V
1
(β|µ|)1−D/2
2
 2−D

∼
1
N0
D<2,
D<2
folgt. Kehren wir nun zum Fall D = 3 im thermodynamischen Limes zurück und diskutieren
dessen thermodynamische Eigenschaften
1. Fugazität z = eβµ :
Für T < Tc , N > Nc ergab sich z = 1. Für T > Tc ist der Beitrag des Grundzustands in
Gl. (37.4) im thermodynamischen Limes vernachlässigbar, und wir erhalten für z → 1
Λ3
hN i − Nc
' −2Γ(1/2)(ln z −1 )1/2 + O(ln z −1 )
V

!2 
3
Λ
(N
−
hN
i)
T > Tc
c

√
z = eβµ ' exp −
hN
i < Nc
2 πV
113
P
2. Energie E = k εk hnk i:
Beim Übergang zum Integral braucht in diesem Fall, im Gegensatz zur Berechnung der
mittleren Teilchenzahl, der Grundzustand nicht abgespalten zu werden, da er selbst im
Bose-Einstein kondensierten Zustand nicht zur Energie beiträgt (ε0 = 0).
Die Auswertung des Integrals nach der schon bekannten Methode liefert
hEi =
3

2
V
g (z)
βΛ3 5/2
T > Tc ,
hN i < Nc
V
g (1)
2 βΛ3 5/2
T < Tc ,
hN i > Nc

3
.
Durch Differentiation nach V , bei festgehaltenen Besetzungszahlen der 1-Teilchenzustände,
und nach T bei konstanten V , gewinnen wir aus diesem Ergebnis den Druck und die spezifische Wärme cV .
1 ∂hEi ∂hEi
.
|s , c V =
p=−
∂V
V ∂T V
Aus den Energieeigenwerten
E{n} =
X 2π 2
L
n
folgt mit L = V 1/3
h̄2 n2
nn
2m
∂E{n}
2
|{n} = − E{n} .
∂V
3V
Daher gilt


1
2hEi  βΛ
p=
=

3V
 1
3
g5/2 (z)
T > Tc , hN i < Nc
g (1)
βΛ3 5/2
T < Tc , hN i > Nc
Die Isothermen sind im folgenden dargestellt.
p
Übergangskurve
A
B
T
Isothermen bei BEC
114
.
Die Übergangskurve, zunächst in der (T, P )-Ebene, erhalten wir, indem wir z = 1 setzen.
Sie ist gegeben durch
kB T
m
p= 3
g5/2 (1) = (kB T )5/2
Λ (T )
2πh̄
3/2
g5/2 (1) .
Auch im Bose-Einstein kondensierten Gebiet hN i/V > (N/V )c sind sämtliche Isochoren
(Kurven mit V =const) durch diese eine Kurve gegeben, wobei die Isochoren dann aber
bei der jeweiligen kritischen Temperatur Tc (N/V ) enden, während auf der Übergangskurve
hN i/V = Nc (T )/V nicht konstant bleibt, sondern sich T -abhängig einstellt.
In der (V, p)-Ebene ergibt sich die Übergangskurve aus Tc = Tc (N/V ) als
hN i
V
p=
!5/3
2πh̄2 ζ(5/2)
.
m (ζ(3/2))5/3
Die explizite Form der Isothermen für V /hN i > (V /N )c in der Nähe der Übergangskurve
folgt aus der asymptotischen Darstellung von g5/2 (z) und g3/2 (z) für z → 1,
g5/2 (z) ' ζ(5/2) − ζ(3/2)(1 − z) + O (1 − z)3/2
für die Isothermen ergibt sich



!2
!3

N
−
hN
i
Λ3 (Nc − hN i)
1 
c

 .
√
+
O
ζ(5/2)
−
ζ(3/2)
p'

βΛ3 
2 πV
V
Um die spezifische Wärme cV aus hEi zu berechnen, brauchen wir die Ableitung
∂g5/2 (z)
∂T
!
N
V
dg5/2 (z)
=
dz
∂z
∂T
!
.
N
V
Allgemein gilt dgn (z)/dz = gn−1 (z)/z. Um auch (∂z/∂T )N/V zu bestimmen, lösen wir die
Identität
!
!
∂(N/V )
∂z
1
3 1
0=
=
g3/2 (z) + 3 g1/2 (z)
∂T
2 Λ3 T
Λ z
∂T N
N
V
V
nach der gesuchten Größe auf. Damit erhalten wir schließlich

h
15 V


3
 4 Λ g5/2 (z) −
CV
=

kB

 15
2
3 (g3/2 (z))
5 g1/2 (z)
V
ζ(5/2)
4 Λ3
i
T > Tc
.
T < Tc
Durch Anwendung der asympotischen Entwicklungen ist es wieder möglich CV auch für
T > Tc explizit als Funktion von T darzustellen.
115
3
2
-
~
T
Spezifische Wärme als Funktion der Temperatur
Die Entropie schließlich kann durch die Integralbeziehung
S=
Z
T
0
dt
CV
T
ausgewertet werden. Für T < Tc ergibt sich wegen CV ∼ T 3/2 unmittelbar
5 hEi
2
S = CV =
3
3 T
T < Tc .
Die spezifische Wärme CV (T ) hat bei T = Tc eine Singularität, nämlich einen Sprung in der
(g (z))2
asymptotisch entwickelt und
Ableitung, der sich berechnen läßt, indem g5/2 (z) − 53 g3/2
1/2 (z)
nach T differenziert wird, unter Benutzung des schon hergeleiteten Ausdrucks für dz/dT .
38
Molekularfeldtheorie kritischer Phänomene
(Literatur: W. Brenig, Kapitel 43, 44, 45)
38.1
Phasenübergänge 1. und 2. Ordnung
Wir kennen schon die verschiedenen Phasen fest, flüssig, gasförmig. Im festen Zustand gibt es
weitere unterschiedliche Phasen, die sich bezüglich anderer Eigenschaften unterscheiden, z.B.
verschiedene Kristallarten ein und derselben Substanz, ferromagnetische, antiferromagnetische, ferroelektrische, supraleitende Phasen. Verschiedene Phasen unterscheiden sich durch
Symmetrien, z.B. zeichnet die ferromagnetische und auch die antiferromagnetische Phase
eine bestimmte Richtung (die Richtung der Magnetisierung (Ferromagnet) oder der alternierenden Magnetisierung (Antiferromagnet) aus. Innerhalb einer Phase sind alle Zustandsänderungen immer stetig, ohne Singularitäten. Phasenübergänge sind natürlich Übergänge zwischen verschiedenen Phasen. Diese können unstetig in ersten Ableitungen der freien Enthalpie
(Phasenübergänge 1. Ordnung) oder stetig in diesen ersten Ableitungen der freien Enthalpie
verlaufen (Phasenübergänge 2. Ordnung). Nehmen wir an, ein Phasenübergang verläuft zwischen zwei Phasen A,B, von denen die Phase A weniger symmetrisch sei als B, und zwar so,
116
daß A nur noch eine Untersymmetrie von B aufweist. Z.B. sei in B keine Richtung ausgezeichnet, d.h. man hat volle Rotationssymmetrie, während in A eine Richtung ausgezeichnet
sei, so daß A nur noch Rotationssymmetrie um eine Achse in der Vorzugsrichtung besitzt.
Dies ist eine Untersymmetrie der Symmetrie in B, d.h. die Symmetriegruppe von A ist eine
Untergruppe der Symmetriegruppe von B. Dann muß der Phasenübergang von A nach B
(und von B nach A) stetig verlaufen, denn am Übergangspunkt muß die Symmetriegruppe
von A mit der von B übereinstimmen, was nur dann sein kann, wenn ein Parameter in A
am Übergangspunkt stetig gegen 0 geht, womit A stetig in B übergeht. Solche stetigen Phasenübergänge, d.h. Phasenübergänge 2. Ordnung, treten an sog. kritischen Punkten oder an
Linien von kritischen Punkten auf. Ein Beispiel ist der flüssig-gasförmige Übergang. Er ist
unstetig (1. Ordnung) für T < Tc . D.h. am Phasenübergang ändert sich z.B. das spezifische Volumen unstetig. Für T = Tc ist dagegen die Änderung des spezifischen Volumens bei
p = pc stetig, der Phasenübergang ist dort von 2. Ordnung.
Ein anderes Beispiel ist ein Ferromagnet. Liegt kein äußeres Magnetfeld an, so ist oberhalb der Curie-Temperatur Tc keine Vorzugsrichtung ausgezeichnet. Kühlt man ab, so hat
das System bei Tc einen kontinuierlichen Phasenübergang, bei dem spontan eine Magnetisierung hMi entsteht, die bei T = Tc Null ist, aber für T ≤ Tc stetig von Null auf einen
endlichen Gleichgewichtswert anwächst. Legt man dagegen ein äußeres Magnetfeld an, so
ist für T < Tc die Magnetisierung eine unstetige Funktion des äußeren Magnetfeldes, da sie
sich sprunghaft ändert, z.B. von +|Mz | zu −|Mz |, wenn das Magnetfeld in z-Richtung stetig
reduziert wird, so daß es sein Vorzeichen wechselt. Der Phasenübergang ist nun 1. Ordnung.
Das Verhalten von Systemen in der Umgebung von kritischen Punkten ist besonders faszinierend: Wie kommt es zur spontanen Symmetriebrechung? Wie findet das System in der
weniger symmetrischen Phase z.B. seine Vorzugsrichtung? Man kann erwarten, daß große
Fluktuationen auftreten werden, wenn das System hin- und hergerissen ist zwischen den
verschiedenen Möglichkeiten, die alle gleichberechtigt sind, bis es sich schließlich für eine
wie auch immer entscheidet. Die physikalischen Phänomene, die dabei auftreten, nennt man
kritische Phänomene. Hier behandeln wir diese in einer einfachen, aber nur im 10% Bereich
richtigen Theorie: der Molekularfeldtheorie.
38.2
Molekularfeldtheorie
Betrachten wir einen uniaxialen Ferromagneten mit Hamiltonfunktion (für Spin 1/2)
H = −µB gB
X
n
sz (n) −
1 X
Jnn0 sz (n)sz (n0 ) .
2 hn,n0 i
(38.1)
Wegen der Wechselwirkung handelt es sich um kein 1-Teilchen Problem mehr. Die Idee
der Molekularfeldtheorie ist es, das Problem (38.1) durch ein effektives 1-Teilchenproblem
zu ersetzen, indem man jeden Spin im effektiven Feld alle übrigen Spins betrachtet. Dabei
müssen allerdings Fluktuationen vernachlässigt werden. Mit
− 12
X
Jnn0 sz (n)sz (n0 )
hn,n0 i
'−
1 X
1 X
(Jnn0 hsz (n)isz (n0 ) + Jnn sz (n)hsz (n0 )i) +
Jnn0 hSz (n)ihSz (n0 )i
2 hn,n0 i
2 hn,n0 i
117
=−
1 J hM i2
hM i X
sz (n) +
J
µB gN n
2 (µB g)2 N
wobei
J=
X
Jnn0
hM i
= N hsz (n)i
µB g
,
n0
erhalten wir näherungsweise
!
V
hM i X
sz (n) + W
H ' Heff = −µB g B + W
V
2
n
wobei
W =
hM i
V
!2
J
.
n(µB g)2
Der letzte Term in Heff ist unabhängig von der Spinvariablen sz (n) und fällt in der kanonischen Verteilung bei der Normierung weg. Für dieses 1-Teilchenproblem können wir nun die
mittlere Magnetisierung berechnen aus
hM i = N µB g
und erhalten
sz (n) −βHeff
e
Z
{sz (n)}
X
"
hM i
hM i = µB gN tanh βµB g B + W
V
!#
,
was wir nach B auflösen können
kB T
B=
artanh
µB g
hM i
µB gN
!
−W
hM i
V
M
Ms
M∞
T
T= c
T>Tc
T<Tc
B
-M∞
Magnetisierung in der Molekularfeld-Theorie
Am kritischen Punkt gilt
∂B
∂2B
=0 ,
=0
∂M
∂M 2
was hM ic = 0, kB Tc = (µB g)2 nW = J ergibt.
Auch die van der Waalssche Zustandsgleichung ist eine Molekularfeldtheorie: Jedes Atom
118
bewegt sich im Potentialfeld aller anderen, was zu einer globalen Verringerung des effektiven
Volumens führt v → v − b, wegen der harten Kerne der Atome (Parameter b), und zu einer
Erhöhung des effektiven Drucks p → p + a/v 2 wegen der globalen attraktiven Wechselwirkung. An die Stelle des “Ordnungsparameters“ hM i/V tritt die Teilchendichte n − nc , an
die Stelle der zugehörigen “generalisierten Kraft“ B (mit dF = BdhM i) tritt das chemische
Potential µ (mit dF
= µd(n − nc )). Für das van der Waals Gas gilt
V
#
"
bn
λ3 (T )n
+
− 2an .
µ = kB T ln dB
1 − bn
1 − bn
Am kritischen Punkt gilt
∂2µ
∂µ
=0 ,
=0
∂n
∂n2
was nc = 1/(3b), kB Tc = 8a/(27b) ergibt, und aufgetragen. Entwickeln wir um den kritischen
Punkt:
9
µ − µc (T ) = 2aτ (n − nc ) + ab2 (n − nc )3
2
wobei
"
λ3
µc (T ) = kB T ln dB
2b
T
−1
τ=
Tc
und
!
#
1
2a
+
−
2
3b
M 2
W
M
.
+
B = Wτ
V
3(nµB )2 V
Die Dichte der freien Energie in der Nähe des kritischen Punktes hat dann die Form, wegen
∂f
∂f
µ = ∂n
, bzw. B = ∂(M/V
. Hier ist f definiert als f = F/V und nicht wie früher in Kap. 21
)
als f = F/N . Also nf (Kap. 21)−→ f .
f = f0 + µc (t)(n − nc ) + aτ (n − nc )2 +
bzw.
f = f0 +
Führen wir f˜ ein mit µ − µc (T ) =
W
M
τ
2
V
∂ f˜
,
∂n
2
+
W
12(µB n)2
9 2
ab (n − nc )4
8
M
V
4
.
dann ist
9
f˜ = f0 + aτ (n − nc )2 + ab2 (n − nc )4
8
Als nächstes betrachten wir die Verallgemeinerung auf den inhomogenen Fall: Addieren wir
a`2 (∇n)2 /2 bzw. W `2 (∇hM i/V )2 /2 zur freien Energiedichte. Höhere Gradiententerme sind
natürlich auch möglich, werden aber bei langwelligen Schwankungen kleiner sein. ` ist eine
Länge und parametrisiert die Reichweite der Wechselwirkung. Führen wir allgemein ein
Ordnungsparameter-Feld ϕ(x) ein mit
ϕ2 (x) =

2
2

 a` (n − nc ) /kB Tc


W `2 M 2 /(V 2 kB Tc )
119
dann schreibt sich die freie Energie als
F − F 0 = k B Tc
Z
κ
g
1
d x (∇ϕ)2 + ϕ2 (x) + ϕ4 (x) − hϕ(x)
2
2
4
3
mit
κ = τ /`2
ξ = `/|τ |1/2
,
wobei
h=
,
τ=
T − Tc
Tc


 (µ − µc ) · const


B · const
Die Entropie S = −∂F/∂T erhält man, wenn man nach der T -Abhängigkeit in κ differenziert
als
kB Z
S − S 0 = − 2 ϕ2 d 3 x .
2`
38.3
Molekularfeldtheorie kritischer Phänomene
Der Ordnungsparameter ϕ fluktuiert mit der Wahrscheinlichkeitsverteilung
W ({ϕ}) ∼ exp(−F ({ϕ})/κB T ). Wir vernachlässigen jedoch die Fluktuationen und ersetzen
Mittelwerte durch wahrscheinlichste Werte, die sich aus F = min, d.h. δF = 0 ergeben. Bei
Variation δϕ(x) ergibt δF = 0
δF = kB Tc
Z
n
o
d3 xδϕ(x) −∇2 ϕ + κϕ + gϕ3 − h = 0 .
Also
h(x) = (κ − ∇2 )hϕi + ghϕi3 .
Für
h=0
hϕi = 0 r
hϕi = ±
|κ|
g
=±
r
,κ>0
|τ |
`2 g
,κ<0
spontane Symmetriebrechung
hϕi ist stetig bei T = Tc . Für die Entropie
kB V
|τ |
T < Tc
2`4 g
!
!
∂S
∂S
kB V
−
= 4 .
∂T T →Tc −0
∂T T →Tc +0
2` g
S − S0 = −
∆C =
Die spezifische Wärme macht einen Sprung.
Kritische Isotherme:
Für T = Tc gilt h = ghϕi3 . Daher erhält man für die Suszeptibilität für T = Tc
χ=
1
∂hϕi
1
1
= ∂h =
= 1/3 2/3
2
∂h
3ghϕi
3g h
∂hϕi
120
d.h. χ divergiert für h → 0 wie h−2/3 .
Suszeptibilität bei räumlich inhomogenem Feld
δh(r) =
Z
d3 k ik·x
e δh(k) .
(2π)3
Durch Fouriertransformation
Für k → 0
δh(k) = (k 2 + κ + 3ghϕi2 )δϕ(k)
≡ χ−1 (k)δϕ(k)
 1
T > Tc

 k2 +κ
χ(k) =


1
T < Tc
k 2 +2|κ|
χ(k) → χ(0) =
1

κ


T > Tc
1
2|κ|
T < Tc
Für Ferromagneten ist dies das Curie-Weissche Gesetz, das also für alle Phasenübergänge
2. Ordnung (in Molekularfeldnäherung) gilt.
2
2 2
−1/2
Für k 6= 0: χ(k)
=
q hängt nur von k /κ = ξ k ab, wobei ξ = |κ|
`/ |τ | die für T → Tc divergierende Korrelationslänge
im System ist.
Die Divergenz der Korrelationslänge am kritischen Punkt ist gewissermaßen die “Ursache“ für die am kritischen Punkt auftretenden Singularitäten. Insbesondere ist dies auch der
Grund für das Anwachsen der Streuintensität von Licht am kritischen Punkt.
38.4
Ginzburg-Kriterium
Aber sind Fluktuationen wirklich vernachlässigbar? Betrachten wir zunächst die Fluktuationen von ϕ(x) = hϕ(x)i + δϕ(x). Wegen
T δ ln Z
Tc δh(x)
2
δ 2 ln Z
T
2
h(δϕ(x)) i = lim
x0 →x Tc
δh(x0 )δh(x)
δhϕ(x)i
' lim
0
x →x δh(x0 )
= lim
χ(x − x0 )
0
hϕ(x)i =
x →x
=
1
(2π)d
Z
dd kχ(k) .
(38.2)
Wir benutzen hier einen für die Theorie kritischer Phänomene wichtigen Trick: Wir untersuchen das Problem zunächst in beliebigen Dimensionen d. In das Integral (38.2) setzen
wir
1
χ(k) = 2
k + |κ|
121
ein, wobei = 1 für T > Tc oder = 2 für T < Tc ist. Also
h(δϕ)2 i =
1
1 Z kc d
d k 2
.
d
(2π) 0
k + |κ|
Dabei ist kc = (Gitterkonstante)−1 ein “Cut-off“, der von den mikroskopischen Gitterstruktur des Systems herrührt. Das Integral konvergiert bei k = 0 auch für |κ| = 0, falls
d − 1 − 2 > −1, also d > 2 ist – auch untere kritische Dimension genannt. Nun wollen wir
untersuchen, wann diese Fluktuationen in der eigentlich vorliegenden exakten MittelwertGleichung
1 T
h= 2
− 1 hϕi + ghϕ3 i
` Tc
vernachlässigbar sind, so daß näherungsweise, wie in der Molekularfeldtheorie angenommen,
hϕ3 i ' hϕi3 gilt, d.h. die bisher betrachtete Gleichung in Molekularfeldnäherung (in der wir
nun κm statt κ schreiben)
1
h' 2
`
T
−1
Tcm
hϕi + ghϕi3 ≡ κm hϕi + ghϕi3 .
Mit ϕ = hϕi + δϕ gilt für kleine Gaußsche Fluktuationen hϕ3 i ' hϕi3 + 3hϕihδϕ2 i, wobei
wir hδϕ3 i vernachlässigt haben. Also
h=
1
`2
T
− 1 + 3ghδϕ2 i hϕi + ghϕi3 ≡ κhϕi + ghϕi3 .
Tcm
Jetzt sehen wir, daß sich die wirkliche kritische Temperatur, definiert durch das Verschwinden
des neuen Vorfaktors κ von hϕi, etwas verschiebt durch die Fluktuationsbeiträge, und zwar
ist
Tc
= 1 − 3g`2 hδϕ2 (Tc )i .
Tcm
Diese Verschiebung macht die Molekularfeldtheorie noch nicht ungültig. Um sie verläufig
zu retten, müssen wir nur die kritische Temperatur Tc als verschieden von Tcm zulassen.
Führen wir also τ = TTc − 1 als neue reduzierte Temperatur ein. Dann lautet unsere durch
kleine Fluktuationsbeiträge korrigierte Zustandsgleichung
1
h= 2
`
T
Tc
−1
+ 3g hδϕ2 (T )i − hδϕ2 (Tc )i hϕi + ghϕi3 .
Tc
Tcm
Unser Koeffizient κ ist durch den Vorfaktor von hϕi gegeben. Er geht nun auch in die Formel
1
für χ(k) = k2 +|κ|
und für hδϕ2 i ein. Also haben wir die Beziehung
Z
kc
Tc
1
3g
1
1 T
d
−1
+
d
k
−
κ= 2
` Tc
Tcm (2π)d
k 2 + |κ| k 2
Z kc
Tc
1 T
3g|κ|
1
= 2
−1
−
dd k 2
.
d
` Tc
Tcm
(2π)
(k + |κ|)k 2
!
Allerdings: Nur wenn das Integral konvergiert für |κ| → 0 ergibt sich wirklich κ ∼ TTc − 1
im Einklang mit der Molekularfeldtheorie. Dies ist erfüllt für Dimension d > 4. In Dimension
122
d < 4 dagegen bricht die Molekularfeldtheorie hinreichend dicht am kritischen Punkt (also
für kleine |τ |) zusammen. Wie dicht darf man an τ = 0 herangehen, ehe das passiert?
Offenbar muß gelten (Ginzburg Kriterium)
3g
(2π)d
bzw. für τ → 0
Z
kc
0
dd k
k 2 (k 2
1
1
+ |κ|)
d
3g|τ /`2 | 2 −2 · J 1
wobei (wohl gemerkt für d < 4)
J=
Z
∞
0
dd x
1
x2 (x2 + )
eine Konstante ist. Für d = 3 also wird der kritische Bereich, in dem die Molekularfeldtheorie versagt, umso enger, je größer `2 ist (langreichweitige Wechselwirkung) und je kleiner
g ist. Innerhalb des kritischen Bereichs muß die Molekularfeldtheorie durch die moderne
Renormierungsgruppentheorie kritischer Phänomene ersetzt werden (siehe Z.B. D. J. Amit,
Field Theory, the Renormalization Group, and Critical Phenomena, McGraw-Hill, Düsseldorf 1978).
123
Herunterladen