Statistische Mechanik und Thermodynamik

Statistische Mechanik und Thermodynamik
Vorlesung SS 2004
(für Studenten ab 6. Fachsemester)
Literatur
W. Brenig,
Statistische Theorie der Wärme
Band 1 Gleichgewicht,
Springer, Berlin 1996
H. Haug,
Statistische Physik,
Vieweg 1997
K. Huang
Statistische Mechanik I, II
Bibliographisches Institut, Mannheim 1964
L. Landau,
E. Lifshitz
Lehrbuch der Theoretischen Physik Band V,
Statistische Physik,
Akademie Verlag, Berlin 1983
F. Reif,
Statistische Physik und Theorie der Wärme,
de Gruyter, Berlin 1987
L.E. Reichl
A Modern Course in Statistical Physics,
Arnold Publ., Great Britain, 1980
F. Schwabl
Statistische Mechanik,
Springer, Berlin, 2000
Voraussetzung
Grundkenntnisse in Klassischer Mechanik und Quantenmechanik
Stand: 15.7.04
1
Inhaltsverzeichnis
1 Grundbegriffe der Statistik
1.1 Wahrscheinlichkeit . . . .
1.2 Zufallsvariable . . . . . . .
1.3 Binomialverteilung . . . .
1.4 Zentraler Grenzwertsatz .
1.5 Gesetz der großen Zahlen .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
7
9
13
15
2 Vielteilchensysteme
16
3 Zeitmittelwerte
16
4 Statistische Ensemble – klassisch
18
5 Liouville-Gleichung
19
6 Statistische Ensemble – quantenmechanisch
22
7 Von Neumann-Gleichung
24
8 Thermodynamisches Gleichgewicht
25
9 Maxwellsche Geschwindigkeitsverteilung
28
10 Volumen der Energieschale und
Zustandsdichte für ein ideales Gas
29
11 Entropie
32
12 Entropie des idealen Gases
34
13 Mischungsentropie
35
14 Temperatur
37
15 Energieschwankungen
39
16 Kanonisches Ensemble
40
17 Gleichverteilungssatz
43
18 Paramagnetismus
47
19 1-dimensionales Ising Modell
und Transfer-Matrix Methode
50
20 Arbeit äußerer Kräfte und Druck
54
21 van der Waals Gleichung
58
2
22 Hauptsätze der Thermodynamik
63
23 Thermodynamische Prozesse
23.1 Joulsches Experiment der freien Expansion
23.2 Joule-Thomson-Prozeß . . . . . . . . . . .
23.3 Adiabatische Entspannung von Gasen . . .
23.4 Adiabatische Entmagnetisierung . . . . . .
23.5 Thermodynamische Kreisprozesse . . . . .
eines
. . .
. . .
. . .
. . .
Gases
. . . .
. . . .
. . . .
. . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
66
66
68
69
70
71
24 Chemisches Potential und
Gibbssche freie Enthalpie
74
25 Gleichgewichtsbedingungen
als Extrema von thermodynamischen Potentialen
76
26 Gleichgewicht unter Energie- und Teilchenaustausch
77
27 Chemische Reaktionsgleichgewichte
und Massenwirkungsgesetz
78
28 Koexistenz von Phasen
28.1 Wieviele Phasen können koexistieren? . . . . . . . . . . . . . . . . . . . . . .
28.2 Koexistenzkurven. Clausius Clapeyronsche Gleichung . . . . . . . . . . . . .
80
80
83
29 Großkanonische Verteilung
85
30 Ideale Quantengase
87
31 Freies Elektronengas
91
32 Paulischer Paramagnetismus
des freien Elektronengases
95
33 Diamagnetismus des freien Elektronengases
97
34 Einige astrophysikalische Anwendungen der
Theorie des idealen Fermi-Gases
98
35 Thermische Strahlung: Photonengas
102
36 Phononengase
104
36.1 Einstein Näherung für optische Phononen: . . . . . . . . . . . . . . . . . . . 106
36.2 Debye Näherung für akustische Zweige: . . . . . . . . . . . . . . . . . . . . . 106
37 Massives Bose-Gas und
Bose-Einstein Kondensation
108
3
38 Molekularfeldtheorie kritischer Phänomene
38.1 Phasenübergänge 1. und 2. Ordnung . . . .
38.2 Molekularfeldtheorie . . . . . . . . . . . . .
38.3 Molekularfeldtheorie kritischer Phänomene .
38.4 Ginzburg-Kriterium . . . . . . . . . . . . . .
4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
116
116
117
120
121
1
Grundbegriffe der Statistik
In der statistischen Mechanik werden Vielteilchensysteme behandelt, deren Bewegungsgleichungen im allgemeinen nicht lösbar sind. Stattdessen können solche Systeme mit statistischen Methoden analysiert werden. Daher ist es erforderlich, daß wir uns zunächst mit
einigen Grundbegriffen der Statistik vertraut machen, was in diesem Paragraphen geschehen
soll.
1.1
Wahrscheinlichkeit
1. Intuitive Definition:
Betrachten wir ein beliebig oft wiederholbares Experiment, dessen Ergebnis in zufälliger
Weise variiert, wie z.B. Würfeln und Ablesen der Augenzahl des Würfels. Nennen wir
das Ergebnis einer jeden Wiederholung des Experiments ein Ereignis und sei A ein
mögliches Ereignis. Falls bei N Wiederholungen des Experiments NA mal das Ergebnis
A auftritt, und das Verhältnis NA /N für N → ∞ gegen einen Grenzwert konvergiert,
heißt
NA
P (A) = lim
N →∞ N
die Wahrscheinlichkeit des Ereignisses A. Falls P (A) = 0 bzw. P (A) = 1 kommt
A in der unendlichen Folge von Wiederholungen “fast nie” bzw. “fast immer” vor.
Ereignisse können sich gegenseitig entweder ausschließen oder auch nicht, was man
durch
Mengenkreise darstellen kann:
A B (Ereignisse A, B schließen sich gegenseitig aus) A ∩ B = A B
(Ereignisse
A, B schließen sich gegenseitig nicht aus) A ∩ B 6= Die Ereignisse faßt man daher nützlicherweise als Mengen auf. Seien z.B. A und B
zwei mögliche Ereignisse, die sich nicht aussschließen müssen. Z.B. könnten A bzw. B
bedeuten, daß beim Wurf mit zwei Würfeln mindestens eine 1 bzw., mindestens eine
2 gewürfelt wird. Dann ist A ∪ B das Ereignis “entweder A oder B” (im Beispiel also:
mit 2 Würfeln wird entweder mindestens eine 1 oder mindestens eine 2 gewürfelt), und
A∩B ist das Ereignis “sowohl A als auch B” (im Beispiel: es wird sowohl eine 1 als auch
eine 2 gewürfelt). Die Wahrscheinlichkeitstheorie wird nun mathematisch axiomatisch
begründet als die Theorie von (positiven) Maßen auf Mengen (A.N. Kolmogorov). Die
intuitive Definition ist dann eine Folgerung aus den Axiomen als das sog. Gesetz der
großen Zahlen.
2. Axiomatische Definition:
(a) Jedem zufälligen Ereignis A ist eine reelle Zahl P (A) mit 0 ≤ P (A) ≤ 1 zugeordnet, welche Wahrscheinlichkeit von A heißt.
(b) Die Wahrscheinlichkeit des sicheren Ereignisses E ist 1: P (E) = 1
(c) Additionsaxiom: Sind A1 , A2 , A3 , . . . zufällige Ereignisse, die paarweise unvereinbar sind, d.h. für alle i, j mit i 6= j gilt Ai ∩ Aj = φ wo φ die Nullmenge ist, so
gilt
X
P (∪i Ai ) =
P (Ai ) .
i
5
Es folgt hieraus wegen E = E ∪ φ und E ∩ φ = φ, daß 1 = P (E) = P (E ∪ φ) =
P (E) + P (φ) = 1 + P (φ), woraus folgt P (φ) = 0. Außerdem, wenn Ā das Ereignis
“nicht A” ist, A ∪ Ā = E, A ∩ Ā = φ, so folgt P (A ∪ Ā) = P (Ā) + P (A) = 1 →
P (Ā) = 1 − P (A).
Die Wahrscheinlichkeit für ein Ereignis kann davon abhängen, ob ein anderes Ereignis
eingetreten ist oder nicht. Man beschreibt dies durch die bedingte Wahrscheinlichkeit
P (A|B) für Ereignis A, vorausgesetzt daß Ereignis B eingetreten ist. Sie ist definiert
durch
P (A ∩ B)
P (B)
P (A ∩ B)
P (B|A) =
P (A)
P (A|B) =
(falls P (B) 6= 0)
(falls P (A) 6= 0) .
Hieraus ergibt sich die Multiplikationsregel der Wahrscheinichkeitsrechnung
P (A ∩ B) = P (B)P (A|B) = P (A)P (B|A) ,
d.h. die Wahrscheinlichkeit dafür, daß bei 2 Ereignissen sowohl das eine als auch das
andere eintreten, ist gleich dem Produkt der Wahrscheinlichkeit eines der Ereignisse
mit der Wahrscheinlichkeit des anderen, bedingt daß das erstere eingetreten ist. Für
Ereignisse A, B, die sich gegenseitig ausschließen, A∩B = φ, gilt P (A∩B) = P (φ) = 0
und somit auch P (A|B) = 0. Zwei Ereignisse A, B heißen statistisch unabhängig
voneinander, wenn
P (A|B) = P (A) .
Dann gilt speziell
P (A ∩ B) = P (A)P (B) ,
d.h. für statistisch unabhängige Ereignisse multiplizieren sich die Wahrscheinlichkeiten.
Zwei Sätze lassen sich leicht beweisen: Es seien Ai , i = 1, 2, . . . n paarweise unvereinbare
Ereignisse, Ai ∩ Aj = 0 falls i 6= j, von denen eines mit Sicherheit eintritt, ∪iAi = E.
Für ein beliebiges zufälliges Ereignis B, dessen Eintreten davon abhängen kann, welches
der Ereignisse Ai vorher eingetreten ist, gilt dann B = B ∩ (∪i Ai ) = ∪i (B ∩ Ai ) und
daher mit der Additionsregel für Wahrscheinlichkeiten, die wegen (B ∩ Ai ) ∩ (B ∩ Aj ) =
B ∩ (Ai ∩ Aj ) = B ∩ φ = 0 anwendbar ist,
(a) P (B) = P (∪i (B ∩ Ai )) =
X
i
P (B ∩ Ai ) =
X
P (Ai )P (B|Ai )
i
(Satz von der totalen Wahrscheinlichkeit) .
Weiter gilt wegen
P (Ai ∩ B) = P (Ai |B)P (B) = P (B|Ai )P (Ai )
unter Benutzung des Satzes (a) für P (B)
P (Ai )P (B|Ai )
(Formel von Bayes) .
(b) P (Ai |B) = P
i P (Ai )P (B|Ai )
6
Die Bayessche Formel zeigt, wie sich die a priori Wahrscheinlichkeit P (Ai ) für ein
Ereignis Ai nachträglich ( a posteriori) verändert, wenn ein weiteres Ereignis B, das
von Ai nicht unabhängig ist, eintritt.
Betrachten wir hierzu ein zugegeben etwas extremes Beispiel:
Die Analyse der Struktur des Universums zeigt bis in verblüffende feine Einzelheiten
hinein, daß unser Universum so aufgebaut und feinabgestimmt ist, daß intelligentes
Leben möglich ist. Sollten wir uns hierüber wundern? Offenbar ja, denn die Wahrscheinlichkeit, daß dies zufällig möglich ist, erscheint verschwindend klein! Allerdings:
statistisch gesehen nein! Denn sei P (A1 ) die unbekannte aber mit Sicherheit winzig
kleine a priori Wahrscheinlichkeit, daß das Universum gerade so beschaffen ist, daß
intelligentes Leben im Universum möglich ist; sei A2 = Ā1 das zu A1 komplementäre
Ereignis, daß kein intelligentes Leben im Universum möglich ist; sei weiter B das Ereignis, daß (unsere) die menschliche, intelligente Lebensform im Universum auftritt.
Dann tritt nach Satz (a), da sich A1 und A2 gegenseitig ausschließen, doch eines der
beiden Ereignisse mit Sicherheit ein,
P (B) = P (A1 )P (B|A1 ) + P (A2 )P (B|A2 ) .
Es ist aber P (B|A2 ) = P (B|Ā1 ) = 0, da B sicher nicht auftritt, falls A1 , die Möglichkeit
für intelligentes Leben im Universum, nicht vorher eingetreten ist. Unsere Beobachtung
von A1 setzt andererseits ein Bewußtsein und intelligente Meßverfahren, also das Ereignis B, voraus. Wir beobachten also nicht etwa P (A1 ), sondern P (A1 |B) und erhalten
nach Bayes
P (A1 )P (B|A1 )
P (A1 |B) =
= 1.
P (A1 )P (B|A1 ) + P (A2 )P (B|A2 )
Unsere Beobachtung von A1 , unter der Vorraussetzung daß B nachträglich eingetreten
ist, war also mit Sicherheit zu erwarten, gleichgültig wie winzig klein P (A1 ) auch sein
mag. Das Beispiel ist extrem und daher auch trivial, da P (B|A2 ) = 0 war, so daß
P (A1 |B) = 1 resultierte. Doch würde sich P (A1 |B) auch dann noch drastisch von
P (A1 ) unterscheiden, wenn P (B|A2 ) ungleich 0, doch klein gegen P (A1 ) wäre.
1.2
Zufallsvariable
Dies sind Größen, die in einem beliebig oft in statistisch unabhängiger Weise wiederholbaren
Experiment zufällige Werte aus einem diskreten oder kontinuierlichen Wertevorrat annehmen
können. Die verschiedenen Werte schließen sich gegenseitig aus. Mit Sicherheit wird einer
der Werte angenommen.
Sei X die Zufallsvariable und, bei diskretem Wertevorrat {x1 , x2 , . . .}
X
fX (xi ) ≥ 0 mit
fX (xi ) = 1 ,
i
die Wahrscheinlichkeit daß X den Wert xi annimmt. Das n-te Moment von X ist der Mittelwert
X
xni fX (xi ) .
hX n i =
i
7
Die Varianz oder mittlere quadratische Schwankung von X ist definiert als
2
σX
= h(X − hXi)2 i = hX 2 i − 2hXihXi + hXi2 = hX 2 i − hXi2 .
q
Die Wurzel daraus, σX = hX 2 i − hXi2 , ist die “Standardabweichung“. Bei kontinuierlichem
R
Wertevorrat {x} von X heißt fX (x) ≥ 0 mit dxfX (x) = 1 die Wahrscheinlichkeitsdichte
von X und es ist
Z
n
hX i = dxxn fX (x) .
Es ist wichtig, die Zufallsvariable X und ihren Wertevorrat {x} begrifflich auseinanderzuhalten. Die Fouriertransformierte von fX (x) heißt charakteristische Funktion
φX (k) = heikX i =
=
∞
X
Z
dxeikx fX (x)
(ik)n n
hX i ,
n=0 n!
durch Entwicklung der Exponentialfunktion in eine Potenzreihe.
Aus φX (k) erhält man die Momente durch Differentiation:
φX (0) = 1
n
hX i = i
−n
dn
φ
(k)
.
X
n
dk
k=0
Entwickelt man den Logarithmus der charakteristischen Funktion nach k, so erhält man die
sog. Kumulanten Cn (X) von X
∞
X
(ik)n
Cn (X)
n=0 n!
ln φX (k) =
mit
Cn (X) = i−n
Speziell erhält man
dn
ln
φ(k)
.
n
dk
k=0
C0 (X) = 0
C1 (X) = hXi
2
C2 (X) = hX 2 i − hXi2 = hX 2 i − C12 (X) = σX
C3 (X) = hX 3 i − 3hX 2 ihXi + 2hXi3 = hX 3 i − 3C2 (X)C1 (X) − C13 (X)
etc. .
Mit X sind natürlich auch alle Funktionen von X, sagen wir Y = H(X), Zufallsvariable.
fY (y|x)dy = δ(y − H(x))dy
ist die bedingte Wahrscheinlichkeit für Y im Intervall dy bei y, falls X den Wert x annimmt.
Dann ist (nach dem Satz von der totalen Wahrscheinlichkeit)
fY (y) =
Z
dxfY (y|x)fX (x)
= hδ(y − H(X))i
8
die Wahrscheinlichkeitsdichte von Y . Diese läßt sich durch Integration über die δ-Funktion
auswerten zu
X fx (xi (y))
fY (y) =
0
i |H (xi (y)|)
wobei mit xi (y) die Lösungen der Gleichung y = H(x) bezeichnet seien.
Hat man mehrere (n) Zufallsvariable so kann man ihren simultanen Werten gemeinsame
Wahrscheinlichkeiten oder, bei kontinuierlichem Wertevorrat, gemeinsame Wahrscheinlichkeitsdichten
Z
f (x1 , x2 , . . . , xn ) ≥ 0 mit dn xf (x1 , . . . , xn ) = 1
zuordnen. Die Momente und Varianzen der Xi sind wie bisher definiert, aber mit Integralen
über dn x. Die Kovarianz von Xi und Xj ist definiert als
cov (Xi , Xj ) =
Z
dn x(xi − hXi i)(xj − hXj i)f (x1 , . . . , xn )
= hXi Xj i − hXi ihXj i .
Die Korrelation von Xi und Xj ist definiert als
cor (Xi , Xj ) =
cov (Xi , Xj )
,
σX i σX j
mit cor (Xi , Xj ) = cor (Xj , Xi ); |cor (Xi , Xj )| ≤ 1. Für zwei unabhängige Zufallsvariable X,
Y gilt
f (x, y) = fX (x)fY (y)
hXY i = hXihY i
2
2
σX+Y
= σX
+ σY2
cov (X, Y ) = 0 = cor (X, Y ) .
Aus der gemeinsamen Wahrscheinlichkeitsdichte für x1 , x2 , ...xn folgt die für x1 , x2 , ...xn−1
durch Integration über xn etc., und schließlich die jeder einzelnen Zufallsvariablen durch
Integration über alle andern, z.B.
fX1 (x1 ) =
Z
dx2 . . . dxn f (x1 , x2 , . . . , xn ) .
Durch Fouriertransformation bezüglich aller Zufallsvariablen erhält man die mehrdimensionalen charakteristischen Funktionen etc.
1.3
Binomialverteilung
Ein häufiger Fall ist, daß eine Zufallsvariable nur 2 Werte annehmen kann, z.B. 0 oder 1, -1
oder 1, ↑ oder ↓. Natürlich sind diese drei Beispiele abgesehen von Bezeichnungen äquivalent.
Nehmen wir den Fall X mit x1 = 1, x2 = −1 und fX (1) = p, fX (−1) = q = 1 − p.
Die Wahrscheinlichkeit, daß bei N -maliger Messung der Wert x1 n1 mal und der Wert x2
(N − n1 ) mal in einer ganz bestimmten Reihenfolge auftritt, ist nach der Multiplikationsregel
für unabhängige Ereignisse
pn1 q N −n1
9
unabhängig von der Reihenfolge. Bei N Messungen gibt es N !/(n1 !(N − n1 )!) verschiedene
Reihenfolgen von n1 Ereignissen +1 und n2 = N − n1 Ereignissen -1. Diese zählt man
ab, indem man zunächst alle Permutationen der N Ereignisse bildet, deren Anzahl ist N !,
und dann berücksichtigt, daß die Permutationen der n1 Ereignisse +1 untereinander und
der n2 = N − n1 Ereignisse -1 untereinander keine neuen Reihenfolgen liefern, so daß das
Ergebnis mit dem Produkt von deren Anzahl, n1 !n2 !, zu dividieren ist.
Verschiedene Reihenfolgen schließen sich gegenseitig aus und haben die gleiche Wahrscheinlichkeit pn1 q n2 . Nach der Additionsregel für Wahrscheinlichkeiten erhalten wir also für
die Wahrscheinlichkeit von n1 Ereignissen +1 und n2 Ereignissen -1 unabhängig von der
Reihenfolge die Binomialverteilung
PN (n1 ) =
N!
pn1 q N −n1 .
n1 !(N − n1 )!
Wir bezeichnen die Funktion auf der rechten Seite im folgenden auch als PN (n1 ; p, q) und
fassen sie dann nicht nur als Funktion von n1 sondern auch der dann als unabhängig angesehenen Variablen p und q auf. Als Funktion von n1 und für p + q = 1 ist PN (n1 ) richtig auf
1 normiert.
N
X
PN (n1 ) = (p + q)N = 1
n1 =0
nach dem für die N -te Potenz verallgemeinerten binomischen Lehrsatz. Die ersten beiden
Momente sind
N
X
N
X
∂
∂
= Np
hn1 i =
n1 PN (n1 ) =
p Pn (n1 ; p, q) = p
(p + q)N ∂p
∂p
n1 =0
n1 =0
q=1−p
hn21 i
=
N
X
n21 PN (n1 )
=
n1 =0
N
X
n1 =0
∂
p
∂p
!2

∂
PN (n1 ; p, q) = p
∂p
besitzt, was die Varianz
!2
N (p + q) q=1−p
= (N p)2 + N (p − p2 )
σ 2 = hn21 i − hn1 i2 = N p(1 − p)
ergibt und die relative Standardabweichung
σ
1
=√
hn1 i
N
s
1−p
→ 0 für N → ∞ .
p
In der folgenden Figur sind die Binomialverteilungen für N = 10 und p = 1/2 sowie p = 1/10
dargestellt.
10
P(n)
0.3
0.2
0.1
0
0
2
4
6
8
10
n
Binomial-Verteilungen für N = 10 und p = 1/2 sowie p = 1/10
Für größer werdende N ist die Binomialverteilung zunehmend schärfer um ihren Mittelwert
hn1 i = N p verteilt, d.h. der tatsächliche Wert von n1 /N in einer Folge von N Messungen
liegt für größer werdende N immer dichter beim Mittelwert p = hn1 i/N und stimmt im
Limes N → ∞ mit Wahrscheinlichkeit 1 mit diesem überein. Dies ist ein Beispiel für das
“Gesetz der großen Zahlen“, p = limN →∞ n1 /N ist tatsächlich die Wahrscheinlichkeit für das
Ereignis +1.
Grenzfälle der Binomialverteilung sind die Gaußverteilung (im Limes N groß, pN groß)
und die Poissonverteilung (im Limes N groß, pN fest). In beiden Fällen benutzen wir die
Stirlingsche Formel: für n > 10
n
√
n
.
n! ≈ 2πn
e
Für N groß, N p groß können wir diese Näherung für N !, n1 ! und (N − n1 )! benutzen und
erhalten
"
#1/2
n1 N
p
1 − p N −n1
PN (n1 ) '
NN
.
2πn1 (N − n1 )
n1
N − n1
Das Maximum von PN (n1 ) finden wir aus
∂ ln PN (n1 )
=0
∂n1
bei
n1 max = pN = hn1 i .
Außerdem finden wir nach weiterer Rechnung
∂ 2 ln PN (n1 ) 1
1
=
−
=
−
2
∂n1
p(1 − p)N
σ2
n1 =n1 max
die Taylor Reihe
1 − 2p
∂ 3 ln PN (n1 ) = 2 2
3
∂n1
N p (1 − p)2
n1 =n1 max
ln PN (n1 ) = ln PN (pN ) −
1
1 − 2p
1 (n1 − pN )2
+
(n1 − pN )3 + ...
2 N p(1 − p)
3! N 2 p2 (1 − p)2
11
Für N →q∞ ist der Korrekturterm (und die höheren Terme) vernachlässigbar, falls |n1 −
pN | = O( N p(1 − p)) (was aus der Abschätzung durch die Varianz folgt) (N p(1−p)/|1−
2p|)2/3 (was aus dem Korrekturterm 3. Ordnung folgt) und wir erhalten die Gaußverteilung
"
#
(n1 − pN )2
exp −
.
PN (n1 ) = q
2N p(1 − p)
2πN p(1 − p)
1
Sie ist durch Mittelwert und Varianz vollständig festgelegt. Alle Kumulanten 3. und höherer
Ordnung verschwinden für die Gaußverteilung.
Für N groß, N p = hn1 i fest (also p ∼ N −1 sehr klein) verwenden wir zur Vereinfachung
der Binomialverteilung Stirlings Formel nicht für n1 ! (da n1 nicht mehr groß sein muß),
sondern nur für
N N e−n1
N!
'
N −n1 + 1
(N − n1 )!
2
N N −n1 1 − nN1
was sich für n1 /N 1 mit (1 − n1 /N )N −n1 +1/2 ' (1 −
läßt durch N n1 . Also ergibt sich
PN (n1 ) '
n N
)
N
' e−n1 weiter approximieren
(pN )n1 −pN
e
,
n1 !
die Poissonverteilung. Sie ergibt sich also aus der Binomialverteilung für große N , falls die
Wahrscheinlichkeit p für eines der beiden alternativen Ereignisse sehr klein wird. Sie ist schon
durch ihren Mittelwert völlig festgelegt. Die Varianz und der Mittelwert sind durch
hn21 i − hn1 i2 = hn1 i
verknüpft. Die Poissonverteilungen mit hn1 i = 5 und hn1 i = 1 sind in der folgenden Figur
wiedergegeben.
0.35
P(n)
0.3
0.25
0.2
0.15
0.1
0.05
0
0
2
4
6
8
n
10
Poisson-Verteilung für < n >= 1 und < p >= 5
12
Betrachten wir als Anwendung die Teilchenzahlfluktuationen in einem kleinen Volumenelement ∆V eines Gases mit Teilchenzahldichte n = N/V . Ein Gasatom ist entweder in ∆V
(mit Wahrscheinlichkeit p 1, falls ∆V V ) oder nicht, also ein Fall für die Poissonverteilung. Genauer: die Wahrscheinlichkeit für ein Gasatom in ∆V zu sein ist p = ∆V /V 1.
Dann ist
(pN )N1 −pN
e
PN (N1 ) =
N1 !
die Wahrscheinlichkeit N1 Atome in ∆V zu finden. Der Mittelwert ist natürlich
hN1 i = pN = ∆V · N/V .
Die quadratische Schwankung hat für die Poissonverteilung denselben Wert wie der Mittelwert
N
hN12 i − hN1 i2 = ∆V ·
= hN1 i .
V
Dies ergibt für die relative Schwankung
q
hN12 i − hN1 i2
hN1 i
=q
1
∆V N/V
=q
1
hN1 i
.
Später werden wir sehen, daß dies Resultat charakteristisch ist für die relativen Schwankungen aller makroskopischen (“thermodynamischen”) Größen in einem System: sie skalieren
immer proportional zu 1 durch Wurzel aus der Teilchenzahl.
1.4
Zentraler Grenzwertsatz
Dieser Satz lautet: Eine Zufallsvariable Y , die sich additiv aus N unabhängigen Zufallsvariablen Xi über
N
1 X
Y =
Xi
N i=1
zusammensetzt, deren Wahrscheinlichkeitsverteilungen endliche Momente hXin i besitzen, ist
im Grenzfall N → ∞ Gauß-verteilt (auch “normal verteilt” genannt) mit Mittelwert
hY i =
N
1 X
hXi i ≡ hXi i
N i=1
und mittlerer quadratischer Schwankung
σY2 =
1 X 2
1 2
σX i ≡ σX
,
2
N i
N i
2
wobei hXi i und σX
die über alle Xi gemittelten Mittelwerte sind. (Also nochmal aufgei
passt: Im allgemeinen Fall haben wir es hier mit zwei verschiedenen Mittelungsprozessen zu
tun: Der erste ist die jetzt schon vertraute Mittelung für jede einzelne der N verschiedenen
2
Zufallsvariablen, was Mittelwerte wie hXin i und σX
ergibt. Der zweite ist eine nochmalige
i
Mittelung dieser Mittelwerte über die N verschiedenen Variablen. Für diese Mittelung verwenden wir den Querstrich über der gemittelten Größe als Symbol. In dem speziellen (aber
13
häufig vorkommenden) Fall, daß alle N -Zufallsvariable die gleichen Mittelwerte haben, kann
die zweite Mittelung natürlich entfallen, da sie nichts neues ergibt.) Insbesondere geht das
Verhältnis von Standardabweichung von Y zum Mittelwert von Y , falls letzterer von Null
verschieden ist, proportional zu N −1/2 gegen 0. Der Beweis ist einfach:
1 X
fY (y) = hδ(Y −
Xi )i
N i
ist die Verteilung von Y . Die zugehörige charakteristische Funktion ist
φY (k) =
Z
k
eiky fY (y)dy = hei N
P
i
Xi
i=
N
Y
i=1
k
hei N Xi i =
N
Y
φXi (k/N ) ,
i=1
wobei wir im 3. Schritt die statistische Unabhängigkeit der Xi benutzen. Durch TaylorEntwicklung von
2
hXi i 1 k 2 σX
i
ln (φXi (k/N )) = ik
−
+ iO((k/N )3 ) ,
N
2 N2
wobei wir voraussetzen, daß sämtliche Kumulanten der Xi existieren, erhalten wir
(
1 k2 X 2
ik X
hX1 i −
φY (k) = exp
σ + iN · O((k/N )3 )
N i
2 N 2 i Xi
)
.
Für N → ∞, |k| ≤ O(N 2/3 ) ist der dritte Term im Exponenten gegen den zweiten vernachlässigbar klein (obwohl auch der zweite Term gegen 0 strebt für N → ∞), und das
vorstehende Resultat strebt asymptotisch für große N gegen
1 2 2
σY
φY (k) = eikhY i− 2 k
mit den behaupteten Ausdrücken für hY i und σY2 . Die Fouriertransformation
Z
dk −iky
PY (y) =
e
φY (k) ,
2π
zu der nur k-Werte der Größenordnung
k = O(
1
O(N 1/2 )
)= q
≤ O(N 2/3 )
2
σY
σ Xi
wesentlich beitragen, liefert die behauptete Gaußverteilung für Y
!
1
(y − hY i)2
PY (y) = √
.
exp −
2σY2
2πσY
Der zentrale Grenzwertsatz erklärt das häufige Auftreten von Gaußverteilungen in der Natur
und in vielen statistischen Problemen.
Eine einfache Anwendung ist die im vorigen Abschnitt etwas mühsam abgeleitete Gaußsche Näherung für die Binomialverteilung PN (n1 ). Denn n1 ist der Wert der Zufallsvariablen
Y =
N
X
1
(1 + Xi ) ,
i=1 2
wobei die Xi mit den Werten +1 (mit Wahrscheinlichkeit p) und -1 (mit Wahrscheinlichkeit
q = 1−p) N unabhängige Zufallsvariable sind. Nach dem zentralen Grenzwertsatz ist also Y ,
und damit n1 , für N → ∞ Gauß-verteilt mit hY i = (1/2)N (1+hXi i) = (1/2)N (1+p−1+p) =
2
2
N p und σY2 = (N/4)σX
, wobei σX
= hX 2 i − hXi2 = 1 − (2p − 1)2 = 4p(1 − p), was unser
i
früheres Ergebnis reproduziert.
14
1.5
Gesetz der großen Zahlen
Das Gesetz der großen Zahlen besagt folgendes: Hat ein Ereignis A, die Wahrscheinlichkeit
P (A) dann geht bei N unabhängigen Versuchen der Bruchteil NA /N , bei denen das Ereignis
A eintritt im Limes N → ∞ gegen P (A),
NA
= P (A) .
N →∞ N
lim
Genau diese Eigenschaft liegt der anfangs gegebenen intuitiven Definition der Wahrscheinlichkeit zugrunde. Sie ermöglicht uns die praktische Schätzung von Wahrscheinlichkeiten
durch hinreichend viele Stichproben. Sie läßt sich als Satz aus den Axiomen der Wahrscheinlichkeitsrechnung ableiten. Beginnen wir mit der Anwendung des zentralen Grenzwertsatzes
auf dies Problem. Führen wir dazu für jeden der N statistisch unabhängigen Versuche eine
Zufallsvariable Xi , i = 1, 2, . . . , N ein mit Xi = 1, falls im i-ten Versuch A eintritt, also
mit Wahrscheinlichkeit P (A), und Xi = 0 falls Ā, d.h. “nicht A” eintritt, also mit Wahrscheinlichkeit 1 − P (A). Der Mittelwert von X ist hXi = P (A), die mittlere quadratische
Schwankung σx2i = hXi2 i − hXi i2 = P (A)(1 − P (A)). Dann ist
N
NA
1 X
=
Xi
N
N i=1
und nach dem zentralen Grenzwertsatz ist NA /N Gauß-verteilt um den Mittelwert hNA i/N =
N · P (A)/N = P (A) mit der q
Standardabweichung
√
−2
2 1/2
σ(N ) = (N · N · σXi ) = P (A)(1 − P (A))/ N .
Eine wichtige Ungleichung der Statistik, die Tchebycheff-Ungleichung, besagt, daß für eine
Zufallsvariable X die Wahrscheinlichkeit P (|x − hXi| ≥ ε), daß X von seinem Mittelwert
um mindestens ε abweicht, nach oben abgeschätzt werden kann durch das Verhältnis der
Varianz zu ε2 :
σ2
P (|x − hXi| ≥ ε) ≤ X2i
Tchebycheff-Ungleichung
ε
Der Beweis der Tchebycheff-Ungleichung gelingt mit folgenden einfachen Abschätzungen
2
σX
=
Z
≥
≥ε
+∞
dx(x − hXi)2 fX (x)
−∞
Z hXi−ε
−∞
2
Z
+
hXi−ε
−∞
Z
∞
hXi+ε
+
Z
!
(x − hXi)2 fX (x)dx
∞
hXi+ε
!
fX (x)dx
= ε2 P (|x − hXi| ≥ ε) ,
woraus sich nach Division mit ε2 die Ungleichung ergibt. Auf unseren Fall angewandt besagt
die Tchebycheff-Ungleichung, daß
0≤P |
NA
P (A)(1 − P (A))
− P (A)| ≥ ε ≤
→0
N
ε2 N
für N → ∞ ,
d.h. die Verteilung von NNA zieht sich für N → ∞ beliebig scharf um den Mittelwert P (A)
zusammen, womit das Gesetz der großen Zahlen bewiesen ist.
15
2
Vielteilchensysteme
Ziel der statistischen Mechanik ist, wie schon erwähnt, die Beschreibung von Vielteilchensystemen, sowohl klassisch als auch quantenmechanisch. Beispiele solcher Vielteilchensysteme
sind Gase, z.B. reine Gase aus Molekülen, z.B. Sauerstoff O2 oder Atomen, z.B. Helium He,
oder Gasgemische, z.B. Luft – ein Gemisch aus Stickstoff N2 , Sauerstoff O2 und Kohlendioxyd
CO2 und einiger weiterer Restgase, oder Flüssigkeiten, z.B. Wasser H2 O, oder Festkörper,
z.B. Eis H2 O, oder Elektronen in Metallen oder Halbleitern, oder magnetische Substanzen,
deren mikroskopische Bausteine magnetische Momente tragen, die mit den Drehimpulsen
der Atomhülle und der Atomkerne verbunden sind. In solchen Vielteilchensystemen ist die
Zahl der Teilchen typischerweise sehr groß. Eine Größenordnung gibt die Loschmidtsche Zahl
L = 6, 02 × 1023 , welche bekanntlich die Zahl der Moleküle in ein Mol einer Substanz angibt
(also z.B. in 2g H2 oder 32g O2 oder 18g H2 O). Oft ist es kein schwieriges Problem, die
Bewegungsgleichungen wenigstens anzugeben, wenngleich uns deren Lösung im allgemeinen
nicht möglich ist.
Klassisch müssen wir dazu die Hamilton-Funktion H(q, p) in geeigneten generalisierten
Koordinaten und Impulsen aufstellen, indem wir die gesamte kinetische Energie T (q, p) und
potentielle Energie U (q, p) der Wechselwirkung mit äußeren Feldern (z.B. Schwerkraft, elektrische und magnetische Felder, Wände eines einschließenden Behälters) und der inneren
Wechselwirkung zur Gesamtenergie E = H(q, p) = T (q, p) + U (q, p) aufaddieren und die
Hamiltonschen Gleichungen aufstellen
q̇i =
∂H(q, p)
∂pi
i = 1, 2, . . . , f
ṗi = −
(2.1)
∂H(q, p)
.
∂qi
Zur Lösung brauchen wir die Kenntnis von q1 (0), . . . , pf (0), die wir uns praktisch, z.B. durch
Messung, nicht verschaffen können.
Quantenmechanisch wird H(q, p) zum Hamiltonoperator durch die Quantisierungsregel
(wenn speziell die qi kartesische Koordinaten sind, was wir für diesen Zweck der Einfachheit
halber voraussetzen)
h̄ ∂
pi =
i ∂qi
und statt (2.1) haben wir die Vielteilchen-Schrödingergleichung
!
h̄ ∂
ih̄ψ̇(q1 , q2 , . . . , qf , t) = H q,
ψ(q1 , q2 , . . . , qf , t)
i ∂q
zu lösen. Zur Lösung brauchen wir hier die Kenntnis von ψ(q1 , q2 , . . . , qf , 0), die auch wiederum unmöglich zu beschaffen ist.
3
Zeitmittelwerte
Wenn f sehr groß wird, z.B. f ' 1023 , ist es impraktikabel, klassisch und quantenmechanisch, die erforderlichen Anfangsbedingungen zu bestimmen, etwa durch Messung aller q’s
16
und p’s, oder durch Messung des quantenmechanischen Zustands des Vielteilchensystems,
etwa durch Messung eines vollständigen Satzes von kommutierenden Observablen (z.B. alle
Orte und Spins). Ebenso impraktikabel ist die daran anschließende Lösung des Vielteilchenproblems. Schließlich, selbst wenn diese beiden Schritte doch bewältigt werden könnten,
wäre die Lösung am Ende praktisch wertlos, da sie Auskunft über die {qi (t), pi (t)} oder über
ψ(q1 , . . . , qf , t) geben würde, die für sehr viele Teilchen im einzelnen nicht meßbar sind!
Wir müssen also einen Weg finden, wie wir die begrenzte Information über unser Vielteilchensystem, welche der Messung zugänglich ist, direkt aus H(q, p) (und eventuell weiteren
Konstanten der Bewegung) extrahieren können, ohne die Bewegungsgleichungen im einzelnen
zu lösen. Doch welche Größen kann man in Vielteilchensystemen messen?
Meßbare Größen in der klassischen Physik sind allgemein Phasenraumfunktionen
A(q1 , . . . , qf , p1 , . . . , pf ) = A(q, p). Diese werden zeitabhängig A(q(t), p(t)), da sich die qi (t),
pi (t) gemäß der Hamiltonschen Gleichungen zeitlich ändern. Eine Messung von A(q(t), p(t))
in einem Vielteilchensystem kann jedoch im allgemeinen den sehr raschen zeitlichen Änderungen von A(q(t), p(t)) nicht folgen. Im Experiment wird daher nur ein zeitlicher Mittelwert
von A(q(t), p(t)) gemessen
A(t)
∆T
=
1
∆T
Z
t
t−∆T
A(q(t), p(t))dτ .
Die Größe von ∆T wird dabei zunächst natürlich vom Meßverfahren abhängen. Je größer
∆T ist, desto weniger zeitliche Details der Funktion A(q(t), p(t)) kann die Messung auflösen.
In jedem thermodynamischen System (mit der wichtigen Ausnahme von Gläsern) gibt es
eine sytemabhängige Zeitskala τrelax , so daß für ∆T τrelax die gemessenen Zeitmittelwerte
sogar ganz unabhängig von der Zeit werden. Wir sprechen dann von (automatisch zeitunabhängigen) Gleichgewichtsmittelwerten. Für ∆T < τrelax kann dagegen die Messung noch
die zeitabhängige Relaxation des Zeitmittelwerts auf seinen Gleichgewichtswert auflösen,
wenn auch t < τrelax gilt (wobei der Zeitpunkt t = 0 ausgezeichnet ist als Zeitpunkt, zu dem
ein Anfangszustand vorgegeben sei). Ist dagegen zwar ∆T < τrelax , aber t τrelax , so hat
zwar einerseits der gemessene Mittelwert genügend Zeit t, auf seinen zeitunabhängigen Wert
zu relaxieren, doch ist andererseits die zeitabhängige Messung mit ∆T < τrelax in der Lage,
die Fluktuationen von A(q(t), p(t)) um seinen Gleichgewichtsmittelwert herum, die ebenfalls
auf der charakteristischen Zeitskala τrelax erfolgen, bis zu einem gewissen Grad (nämlich bis
zur Zeitskala ∆T ) aufzuloesen. Es zeigt sich, daß es in vielen thermodynamischen Systemen
(Ausnahmen existieren) für die Wahl von ∆T ein Zeitskalenfenster τstoß ∆T τrelax gibt,
in dem die Zeitmittelwerte sogar praktisch unabhängig von der Wahl von ∆T werden. Ginge
man aber mit ∆T sogar noch unter die untere Grenze dieses Intervalls (was in der Praxis
schwer möglich ist), so würde die Messung die komplizierte mikroskopische Stoßdynamik
der mikroskopischen Konstituenten des Systems zeitlich aufloesen können. (Zuweilen gelingt
dies mit der (in der Arbeitsgruppe von der Linde perfektionierten) Technik ein System bei
t = 0 mit einem ultrakurzen Laserimpuls (Dauer∼ ∆T von der Größenordnung 10−13 s = 1fs)
anzuregen und seinen Zustand kurz danach (zur Zeit t) mit einem ebenso kurzen Laserimpuls wieder abzufragen.) Man nennt τstoß die charakteristische Stoßzeit des Systems, und wir
werden im folgenden immer annehmen, daß ∆T >> τstoß .
Bei quantenmechanischer Beschreibung interessiert man sich für Erwartungswerte von
Operatoren A(q, h̄i ∂/∂q), (wir schreiben q und meinen alle Koordinaten, die Integration über
17
alle q soll die Summation über die Spineinstellungen mit symbolisieren)
Z
dq1 . . .
Z
!
h̄ ∂
ψ(q, t) = hψ(t)|A|ψ(t)i .
dqf ψ (q, t)A q,
i ∂q
∗
Wiederum ist es im allgmeinen unmöglich, die Zeitabhängigkeit von hψ(t)|A|ψ|(t)i im einzelnen aufzulösen und nur Zeitmittelwerte
∆T
hψ(t)|A|ψ(t)i
1
=
∆T
Z
t
t−∆T
hψ(τ )|A|ψ(τ )idτ
sind von Interesse. Wie berechnet man solche Mittelwerte klassisch oder quantenmechanisch?
4
Statistische Ensemble – klassisch
Die Grundidee (L. Boltzmann, J.W. Gibbs) ist die Ersetzung des Mittelwerts eines Systems
über ein Zeitintervall ∆T von τ , t − ∆T ≤ τ ≤ t
A(t)
∆T
1
=
∆T
Z
t
t−∆T
A(q(τ ), p(τ ))dτ
(4.1)
durch den Mittelwert über (unendlich) viele Systeme zu einem Zeitwert:
A(t)
∆T
→ hA(t)i =
Z
df qdf p%(q, p, t)A(q, p) .
(4.2)
Man nennt die vielen Systeme, die hier zu Berechnung des Mittelwerts hilfsweise eingeführt
werden, ein Ensemble von Systemen, welches das tatsächlich vorliegende eine physikalische
System repräsentiert. %(q, p, t) ist eine Wahrscheinlichkeitsdichte im Phasenraum (oder ΓRaum), d.h. eine positive Funktion der qi , pi , wobei %(q, p, t)df qdf p die Wahrscheinlichkeit
(d.h. die relative Häufigkeit) ist, mit der ein System mit (q, p)-Werten im Volumenelement
dVΓ = df qdf p bei q, p im Ensemble vorkommt. (Die entsprechende quantenmechanische
Größe betrachten wir weiter unten.) Wegen h1i = 1 ist %(q, p, t) normiert. %(q, p, t) heißt
∆T
(Gibbssche) Phasenraumdichte. Gibt es ein %(q, p, t), so daß A(t) = hA(t)i?
Formal läßt sich unschwer ein solches %(q, p, t) angeben als
1 Zt
%∆T (q, p, t) =
dτ δ (2f ) (q − q(τ ), p − p(τ )) .
∆T t−∆T
(4.3)
Wir konstruieren das Ensemble also, indem wir die Trajektorie des Systems im Phasenraum
für t − ∆T ≤ τ ≤ t gleichförmig mit konstanter Dichte belegen. Indem wir diesen Ausdruck
in die Formel für hA(t)i einsetzen, die Integrationen über df qdf p mit der Zeitintegration
vertauschen und mit Hilfe der 2f -dimensionalen δ-Funktion ausführen, erhalten wir die For∆T
∆T
zurück, woraus also A(t)
= hA(t)i folgt. Wir erkennen in der formalen
mel für A(t)
(weil praktisch nicht durchführbaren) Vorschrift (4.3) ein Beispiel für die Konstruktion der
Wahrscheinlichkeitsdichte fY (y) = hδ(Y − fX (x))i aus fX (x). Im gegenwärtigen Fall sind die
Wahrscheinlichkeiten von p, q durch die Häufigkeit ihres zeitlichen Auftretens gegeben.
Die Einführung von % bedeutet den Übergang von einer deterministischen Beschreibung
zu einer statistischen.
18
5
Liouville-Gleichung
In der Ensemble-Beschreibung, die wir im letzten Abschnitt einführten, verlagert sich das
Interesse von den praktisch nicht konstruierbaren Lösungen der Bewegungsgleichungen qi (t),
pi (t), i = 1, 2, . . . , f auf die Phasenraumdichte (4.3), die wir durch Verschiebung der Integrationsvariablen τ um t auch schreiben können als
%∆T (q, p, t) =
1
∆T
Z
0
−∆T
dτ δ 2f (q − q(t + τ ), p − p(t + τ )) .
(5.1)
Welche Bewegungsgleichung hat die Phasenraumdichte? Betrachten wir ein System mit f
Freiheitsgraden. Durch Bildung der Zeitableitung finden wir durch Differentiation unter dem
τ -Integral und Ausnützen der Kettenregel
Z
f 1 X
∂
∂%∆T (q, p, t)
dτ q̇i (t + τ )δ 2f (q − q(t + τ ), p − p(t + τ ))
=−
∂t
∆T i=1 ∂qi
Z
∂
2f
dτ ṗi (t + τ )δ (q − q(t + τ ), p − p(t + τ )) .
+
∂pi
Für q̇i und ṗi setzen wir die Hamiltonschen Gleichungen ein
q̇i =
∂H
∂H
, ṗi = −
.
∂pi
∂qi
Schließlich verwenden wir, daß in Faktoren der δ-Funktion qi (t + τ ) bzw. pi (t + τ ) durch die
von τ und t unabhängigen qi bzw. pi ersetzt werden können, da nur dort wo diese Ersetzung
möglich ist, die δ-Funktion nicht verschwindet. Solche nur von q, p und nicht mehr von τ
abhängige Faktoren können wir vor das τ -Integral ziehen. Wir erhalten
f
X
∂
∂%∆T (q, p, t)
=−
∂t
i=1 ∂qi
!
f
X
∂
∂H
%∆T (q, p, t) +
∂pi
i=1 ∂pi
!
∂H
%∆T (q, p, t) .
∂qi
Diese Gleichung hat natürlich allgemeinere Lösungen als nur solche der Form (5.1). Wir
lassen daher im folgenden den Index ∆T weg und betrachten die Gleichung allgemein.
Es ist eine Kontinuitätsgleichung im Phasenraum
2f
∂% X
∂
+
vi % = 0
∂t i=1 ∂xi
mit
xi = qi , xf +i = pi ,
vi = q̇i =
∂H
∂H
, vf +i = ṗi = −
∂pi
∂qi









i = 1, 2, . . . , f .
Die Kontinuitätsgleichung drückt einfach nur die Erhaltung der Wahrscheinlichkeit in differentieller Weise aus. Nichtdifferentiell formuliert lautet dieser Erhaltungssatz: Die Wahrscheinlichkeit einen Zustand in einem endlichen Phasenraumvolumen VΓ vorzufinden, kann
19
sich nur ändern, wenn es einen Wahrscheinlichkeitsfluß durch die Oberfläche ∂VΓ des Volumens hindurch gibt
d
dt
Z
VΓ
dVΓ %(q, p, t) = −
Z
∂VΓ
dFΓ · v%(q, p, t) ,
wobei dFΓ das (2f −1)-dimensionale Oberflächenelement von ∂VΓ mit nach außen gerichteter
Normalen ist, und v = {ẋi ; i = 1, . . . , 2f } der Geschwindigkeitsvektor im Phasenraum. Die
Strömungsgeschwindigkeit im Phasenraum vi , i = 1, 2, . . . , 2f hat die wichtige Eigenschaft
2f
X
i=1
f
X
∂
∂2H
∂2H
vi =
−
∂xi
∂pi ∂qi
i=1 ∂qi ∂pi
!
= 0 (Liouvillescher Satz) .
In der Hydrodynamik gilt ein vollkommen analoges Gesetz im 3-dimensionalen Raum für die
Strömungsgeschwindigkeit v von inkompressiblen Flüssigkeiten
∇·v =0
inkompressible Strömung.
Sie besagt, daß die Flüssigkeitsteilchen, die anfangs ein Volumen der Größe V ausfüllen, für
alle späteren Zeiten immer ein Volumen mit dem gleichen Inhalt V ausfüllen
V
V
t>0
t=0
Mitschwimmendes Flüssigkeitsvolumen in einer inkompressiblen Strömung
In vollständiger Analogie hierzu lassen sich die verschiedenen Ensemble-Mitglieder, Punkte
im Phasenraum, als Teilchen einer Flüssigkeit im Phasenraum auffassen mit Teilchendichte
%(q, p, t). Die Teilchendichte ändert sich zeitlich, weil die Punkte (aufgrund der Hamiltonschen Gleichungen) mit der Strömungsgeschwindigkeit vi , i = 1, 2, . . . , 2f durch den PhaP
senraum strömen. Wegen 2f
i=1 ∂vi /∂xi = 0 ist diese Strömung inkompressibel, d.h. die Phasenraumpunkte aus einem anfangs gegebenen Volumenelement ∆VΓ füllen zu allen späteren
Zeiten ein Volumen des Inhalts ∆VΓ aus.
Zum Beweis der letzteren Aussage betrachten wir allgemein in n-Dimensionen ein ndimensionales Volumen V mit (n − 1)-dimensionaler Oberfläche ∂V , Oberflächenelement
dn−1 σ und n-dimensionalem nach außen gerichteten Normalvektor n. Die Oberfläche möge
sich lokal mit der Strömungsgeschwindigkeit v verschieben, von der wir annehmen, daß sie
Pn
i=1 ∂vi /∂xi = 0 erfülle. Nur die Normalverschiebung der Oberfläche ∂V kann eine Volumenänderung bewirken. Geometrisch ist klar, daß die Normalverschiebung von dσ um die
20
Strecke n · vdt eine Volumenänderung von dσn · vdt bewirkt. Die gesamte Volumenänderung
ergibt sich durch Aufintegration über die Oberfläche, also, nach Division mit dt
dV
=
dt
Z
∂VΓ
dσn · v .
Mit Hilfe des Gaußschen Satzes ergibt sich wie behauptet
dV
=
dt
Z
V
dn x
X
i
∂vi
= 0.
∂xi
Mit Hilfe der Liouville-Gleichung läßt sich die Kontinuitätsgleichung für %(q, p, t) etwas
umformen. Sie lautet dann
f
∂H ∂%
∂% X
∂H ∂%
+
−
∂t i=1 ∂pi ∂qi
∂qi ∂pi
!
= 0 (Liouville-Gleichung)
oder, in der Schreibweise mit Poisson-Klammer
{A, B} =
f
X
i=1
∂A ∂B ∂A ∂B
−
∂qi ∂pi ∂pi ∂qi
!
∂%
− {H, %} = 0 .
∂t
Auf der linken Seite der Liouville-Gleichung erscheint nun gerade die totale Zeitableitung
von %, und wir finden demzufolge, daß
d%
= 0 (Liouville-Gleichung)
dt
ist, d.h. % erweist sich allgemein als eine explizit zeitabhängige Konstante der Bewegung. In
der Sprache der Hydrodynamik: % ist im lokal mitschwimmenden Koordinatensystem zeitlich
konstant, was wiederum die Inkompressibilität der Strömung ausdrückt. Diese Eigenschaft
erweist sich als von ganz zentraler Bedeutung für die statistische Mechanik. Sie erlaubt es
nämlich, einfache zeitunabhängige Lösungen für % anzugeben. Z.B. in Systemen, denen nur
ein endliches Volumen VΓ des Phasenraums zugänglich ist, z.B. aufgrund des Energieerhaltungssatzes H = E = const ist offenbar
%=


 const


0
im zugänglichen Teil des Phasenraums
sonst
eine zeitunabhängige Lösung. Die Konstante ergibt sich durch Normierung
Z
VΓ
%df qdf p = 1
als const. = 1/VΓ . Diese konstante Lösung ordnet jeder Volumenzelle df qdf p des zugänglichen
Teils des Phasenraums die gleiche Wahrscheinlichkeit
P (df qdf p) =
21
df qdf p
VΓ
zu. Ist das dem System zugängliche Phasenraumvolumen nicht beschränkt, VΓ = ∞, ist diese
Lösung nicht brauchbar. Doch ist jede Funktion % von zeitunabhängigen Erhaltungsgrößen,
z.B. % = f (H(q, p)), eine zeitunabhängige Lösung von d%/dt = 0. Wir werden auf solche
zeitunabhängigen Lösungen bei der Diskussion thermodynamischer Gleichgewichte zurückgreifen. Zuvor jedoch werden wir die entsprechende quantenmechanische Beschreibung analog
zur klassischen entwickeln.
6
Statistische Ensemble – quantenmechanisch
Nun entwickeln wir in analoger Weise die Bildung von Mittelwerten in der Quantenstatistik.
Ausgangspunkt ist der zeitliche Mittelwert des quantenmechanischen Erwartungswerts
hψ(t)|A|ψ(t)i
∆T
Z
1
=
∆T
t
t−∆T
hψ(τ )|A|ψ(τ )idτ .
(6.1)
Durch Einschieben eines vollständigen Orthonormalsystems {|ni} mit Hilfe seiner Vollständigkeitsrelation
X
|nihn| = 1
n
23
(wobei im Symbol n sehr viele (∼ 10 ) Qantenzahlen zusammengefaßt sein können) können
wir (6.1) umschreiben in
∆T
hψ(t)|A|ψ(t)i
=
1
∆T
Z
t
t−∆T
dτ
X
(hψ(τ )|A|ni)(hn|ψ(τ )i) .
n
Durch Umordnen der beiden eingeklammerten Faktoren unter der Summe sowie Vertauschen
der Reihenfolge der Integration über τ mit der Summation über n erhalten wir
∆T
hψ(t)|A|ψ(t)i
=
X
n
hn|%(t)A|ni
mit dem sog. statistischen Operator
%(t) =
Z
1
∆T
t
t−∆T
dτ |ψ(τ )ihψ(τ )| .
(6.2)
Er tritt an die Stelle der Phasenraumdichte %(q, p) in der klassischen Beschreibung. Mit Hilfe
des statistischen Operators %(t) kann nun der gewünschte Mittelwert von A unabhängig von
der orthonormalen Basis {|ni} geschrieben werden
∆T
hψ(t)|A|ψ(t)i
= T r%(t)A ≡ hA(t)i .
Erinnern wir uns an (oder lernen wir hier neu) zwei wichtige Eigenschaften der Spurbildungsoperation T r:
(1.) Die Spur eines Operators ist unabhängig vom Orthonormalsystem, das zur Ausführung
benutzt wird: Seien |ni1 , |mi2 zwei verschiedene Orthonormalsysteme mit
X
n
|ni1 1 hn| = 1 =
22
X
m
|mi2 2 hm|
und sei B ein beliebiger Operator, für den die im folgenden auftretenden Summen
existieren: Dann ist
X
n
1 hn|B|ni1
=
XX
n
m
1 hn|B|mi2 2 hm|ni1
.
Nach Vertauschen der Reihenfolgen der Summen über n und m
X
n
1 hn|B|ni1
=
XX
m
n
2 hm|ni1 1 hn|B|mi2
.
Die Summe über n kann man mit Hilfe der Vollständigkeitsrelation ausgeführt werden
und wir erhalten
X
X
2 hm|B|mi2 ≡ T r B .
1 hn|B|ni1 =
m
n
(2.) Unter der Spurbildung sind Operatoren zyklisch permutierbar, z.B.
T r ABC = T r CAB = T r BCA ,
denn
T r ABC =
=
n
X
hn|ABC|ni =
XX
m
n
XX
n
m
hn|AB|mihm|C|ni
hm|C|nihn|AB|mi =
= T r CAB
etc.
X
m
hm|CAB|mi
Dabei haben wir im 3. Schritt die Reihenfolge der Summationen über n und m vertauscht.
Der statistische Operator %(t) beschreibt ein quantenmechanisches Ensemble, auch ein “Gemisch von Zuständen” genannt oder kurz ein “gemischter Zustand“: An die Stelle einer Wellenfunktion |ψ(t)i (nun auch “reiner Zustand“ genannt) tritt ein Ensemble von (unendlich)
vielen Zuständen, hier alle Zustände |ψ(τ )i für t−∆T ≤ τ ≤ t. Erwartungswerte in gemischten Zuständen sind so zu berechnen, daß zunächst der quantenmechanische Erwartungswert
mit jeder Wellenfunktion berechnet wird, die Mitglied des Ensembles ist; dann wird der Mittelwert über das Gemisch gebildet, wobei jeder quantenmechanische Erwartungswert mit dem
Gewicht eingeht (hier mit dτ /∆T ), mit dem die betreffende Wellenfunktion im Ensemble
vertreten ist. Diese Vorschrift ist letztlich Inhalt der allgemeinen Formel hAi = T r%A. Man
beachte, daß die verschiedenen im Ensemble vertretenen Wellenfunktionen
nicht notwendig
Rt
dτ |ψ(τ )ihψ(τ )|
aufeinander orthogonal zu sein brauchen; in unserem Fall %(t) = 1/∆T t−∆T
sind z.B. die |ψ(τ )i für verschiedene τ im allgemeinen nicht orthogonal. Statistische Operatoren % haben allgemein folgende Eigenschaften:
(1) % ist hermitisch, % = %†
(2) % ist positiv semi-definit, d.h. alle Eigenwerte (diskret oder kontinuierlich, sind ≥ 0)
(3) T r% = 1
23
Wegen (1) hat % eine Spektralzerlegung nach Eigenzuständen, z.B. für diskretes Spektrum
von %
X
pi |iihi|, hi|ji = δi,j .
%=
i
Die Eigenschaft (2) ist zu fordern, damit für jeden Zustand |ϕi der Erwartungswert
h|ϕihϕ|i = T r%|ϕihϕ| = hϕ|%|ϕi = w(|ϕi)
interpretiert werden kann als Wahrscheinlichkeit w(|ϕi) den Zustand |ϕi, in dem mit %
beschriebenen Ensemble vorzufinden. Denn zum einen erfordert diese Interpretation, mit
|ϕi = |ii,
X
pj |hi|ji|2 = pi ≥ 0 ,
hi|%|ii =
j
daß die pi positive Wahrscheinlichkeiten sind, zum andern wird dann
w(|ϕi)hϕ|%|ϕi =
X
i
pi |hϕ|ii|2 .
Auf der rechten Seite ist, wie aus der Quantentheorie bekannt, |hϕ|ii|2 allgemein die Wahrscheinlichkeit den Zustand |ϕi vorzufinden, falls der Zustand |ii vorliegt, wobei sich die |ii
wegen ihrer Orthogonalität gegenseitig ausschließen, zum andern ist pi wie gerade gezeigt,
die Wahrscheinlichkeit mit der |ii im Ensemble vertreten ist. Nach dem Satz von der totalen
Wahrscheinlichkeit ist also hϕ|%|ϕi wirklich die gesamte Wahrscheinlichkeit |ϕi im Ensemble
vorzufinden.
7
Von Neumann-Gleichung
Wir suchen nun die Bewegungsgleichung der %(t) genügt. Dazu verschieben wir in (6.2) die
Integrationsvariable τ und bringen es in die Form
1 Z0
%(t) =
dτ |ψ(t + τ )ihψ(t + τ )| .
∆T −∆T
Durch Differentiation nach t, die auf der rechten Seite unter dem Integral ausgeführt wird,
und Zuhilfenahme von
1
H|ψ(t + τ )i
ih̄
−1
hψ(t + τ )|H,
hψ̇(t + τ )| =
ih̄
|ψ̇(t + τ )i =
und indem wir H, das von τ nicht abhängt, nach links, bzw. rechts, aus dem Integral herausziehen, ergibt sich
1
%̇(t) = (H%(t) − %(t)H) ,
ih̄
was auch in der Form
ih̄%̇ = [H, %] (vonNeumann-Gleichung)
24
geschrieben werden kann. Durch die Ersetzung
1
(h̄→0)
[H, %] −→ {H, %} ,
ih̄
welche, wie stets, Kommutatoren in klassische Poisson-Klammern überführt, finden wir die
klassische Liouville-Gleichung wieder, wenn wir den klassischen Limes des statistischen Operators mit der klassischen Phasenraumdichte identifizieren. Die von-Neumann-Gleichung ist
also das quantenmechanische Analogon der Liouville-Gleichung. Es ist übrigens bemerkenswert, daß die Herleitung der von-Neumann-Gleichung beträchtlich einfacher ist als die der
Liouville-Gleichung.
8
Thermodynamisches Gleichgewicht
Betrachten wir nun ein Vielteilchensystem, das in einen Behälter fest eingeschlossen und
von der Umgebung vollständig isoliert ist. Ein derartiges System heißt abgeschlossen. Erfahrungsgemäß geht ein abgeschlossenes System, das sich selbst überlassen bleibt, nach einer
gewissen systemabhängigen Relaxationszeit τrelax τstoß in einen dynamischen Zustand
∆T
∆T
über, in dem die zeitabhängigen Zeitmittelwerte A(t)
bzw. hψ(t)|A|ψ(t)i
für hinreichend große ∆T (∆T /τrelax 1) konvergieren (d.h. nicht nur von ∆T , sondern auch von t
unabhängig werden).
1
∆T →∞ ∆T
A = lim
hψ|A|ψi = lim
Z
t
Z
∆T →∞ t−∆T
t
t−∆T
A(q(τ ), p(τ ))dτ
hψ(τ )|A|ψ(τ )idτ .
Dennoch bleiben sogar für t τrelax die ungemittelten Größen A(q(t), p(t)) und hψ(t)|A|ψ(t)i,
∆T
und wie bei den Zeitmittelwerten schon diskutiert, bis zu einem gewissen Grad auch A(t)
für ∆T τrelax selbst in diesem Zustand zeitabhängig und fluktuieren um ihre zeitlichen
Mittelwerte. Es handelt sich um einen Gleichgewichtszustand, der aber dennoch dynamisch
ist, man spricht vom thermodynamischen Gleichgewicht. Den Übergang eines Systems ins
thermodynamische Gleichgewicht behandelt die sog. kinetische Theorie mit Hilfe von sog. kinetischen Gleichungen (Boltzmann-Gleichung, Master-Gleichung, Fokker-Planck–Gleichung,
Langevin-Gleichung). Den thermodynamischen Gleichgewichtszustand selbst behandelt die
Statistische Mechanik des thermodynamischen Gleichgewichts, der wir uns nun zuwenden.
Wie kann man die zeitunabhängigen Zeitmittelwerte Ā bzw. hψ(t)|A|ψ(t)i im thermodynamischen Gleichgewicht berechnen? Nehmen wir an, unser klassisches abgeschlossenes
System habe die Gesamtenergie E. Dann bewegt es sich im Phasenraum auf der festen
Energiehyperfläche H(q, p) = E. Nehmen wir weiter an, daß die Gesamtenergie für unser System das einzige Integral der Bewegung ist, welches eine derartige Hyperfläche im
Phasenraum bildet. (Solche Integrale der Bewegung heißen “isolierend“. Sie ordnen jedem
Phasenraumpunkt (q, p) einen eindeutigen Wert des Bewegungsintegrals zu. Die meisten der
2f − 1 zeitunabhängigen Integrale der Bewegung (Integrationskonstanten) eines Systems mit
f Freiheitsgraden sind dagegen nichtisolierend, d.h. ordnen ein- und demselben Phasenraumpunkt mehrere, evtl. gar unendlich viele Werte zu und definieren keine Phasenraumhyperfläche). Für ein abgeschlossenes Vielteilchensystem in einem festen Behälter (dessen Wände
25
die Drehimpulserhaltung und Impulserhaltung aufheben) ist dies eine sehr plausible (wenn
auch schwer streng beweisbare) Annahme. In diesem Fall bewegt sich der Systempunkt auf
der Energiehyperfläche mehr oder weniger ungehindert. Das System wird ergodisch genannt,
wenn der Systempunkt im Laufe seiner Bewegung tatsächlich jedes beliebig kleine Flächenelement auf der Hyperfläche durchläuft. Birkhoffs Ergodentheorem von 1931 besagt, daß ein
System dann und nur dann ergodisch ist, wenn für alle Phasenraumpunkte (evtl. mit Ausnahme einer Punktmenge von verschwindendem Lesbeque-Maß df qdf p) der Zeitmittelwert
Ā von Phasenraumfunktionen existiert und gleich dem Mittelwert hAi über das Ensemble
1
Ā = hAi =
Σ(E)
Z
Γ
A(q, p)δ(H(q, p) − E)df qdf p
(8.1)
ist, mit dem Flächeninhalt der Energiehyperfläche
Σ(E) =
Z
Γ
δ(H(q, p) − E)df qdf p .
Die spezielle zugehörige Phasenraumdichte
%(q, p) =
1
δ(H(q, p) − E)
Σ(E)
(8.2)
ist von q, p nur über die Erhaltungsgröße H(q, p) abhängig und daher wie wir sahen automatisch eine zeitunabhängige Lösung der Liouville-Gleichung. Sie definiert das mikrokanonische
Ensemble. Für ein System mit zusätzlichen isolierenden Integralen Ci (q, p) = Ci verallgemeinert sich das Ergodentheorem entsprechend mit dem verallgemeinerten mikrokanonischen
Ensemble
n
Y
1
%(q, p) =
δ(H(q, p) − E) δ(Ci (q, p) − Ci ) .
Σ(E, C1 , . . . , Cn )
i=1
Gleichung (8.1) löst nun endlich unser Problem, wie wir für ein abgeschlossenes System im
thermodynamischen Gleichgewicht die meßbaren zeitunabhängigen Zeitmittelwerte Ā berechnen können ohne die mikroskopischen Bewegungsgleichungen zu lösen: Wir müssen nur
die Hamiltonfunktion H(q, p) kennen, damit die Phasenraumdichte (8.2) des mikrokanonischen Ensembles bilden und Mittelwerte der Form (8.1) durch Integration über den Phasenraum auswerten. Die Form (8.2) von %(q, p) im Gleichgewicht ist die einzig mögliche, welche
den Bedingungen genügt
1) %(q, p) = 0 falls H(q, p) 6= E
2) %(q, p) ≥ 0
3) %(q, p) = f (H(q, p))
4)
R
Γ
%(q, p)df qdf p = 1.
Im praktischen Umgang ist allerdings die δ-Distribution manchmal unhandlich. Man rechnet
dann bequemer und ohne Verlust an Genauigkeit, wenn man sie durch eine auf 1 normierte
Rechtecksfunktion der kleinen, endlichen Breite ∆E ersetzt
δ(H(q, p) − E) → δ∆E (H(q, p) − E) =
26
 1

 ∆E


0
0 ≤ H − E ≤ ∆E
sonst
.
Dann erhält man für %(q, p) des mikrokanonischen Ensembles

1

 ∆E·Σ(E)
mit
%(q, p) = 

0
0 ≤ H(q, p) − E ≤ ∆E
(8.3)
sonst
Σ(E)∆E =
Z
dVΓ
gleich dem Phasenraumvolumen der Energieschale (0 ≤ H(q, p) − E ≤ ∆E).
Nach dieser “Aufweichung” der δ-Funktion sind in unserem Ensemble Systeme mit allen Energien H(q, p) im Intervall (E, E + ∆E) vertreten. Dies ist nicht schlimm. Zwar hat
unser ursprüngliches physikalisches System nur einen Energiewert E, doch ist dieser Wert
weder genau bekannt noch genau auf einen vorgegebenen Wert einstellbar. Von Interesse
sind daher nur Eigenschaften, die sich nicht ändern, wenn eine hinreichend kleine endliche
Energieunschärfe ∆E 6= 0 zugelassen wird. In der neuen Form für %(q, p) ist nun der zugängliche Teil des Phasenraums die Energieschale E ≤ H(q, p) ≤ E + ∆E. In der Energieschale
ist %(q, p) = const , außerhalb ist %(q, p) = 0. Das Volumen der Energieschale ist die Dicke
der Schale ∆E mal dem Inhalt der Energiehyperfläche Σ(E), also ∆E · Σ(E).
Betrachten wir nun sofort auch Quantensysteme wiederum unter der Annahme, daß das
System abgeschlossen sei, und die Energie, d.h. der Hamiltonoperator, die einzige relevante Erhaltungsgröße ist. Dies heißt strikt genommen, daß keine Entartung der Eigenwerte
des Hamiltonoperators auftritt. Allerdings ist diese Aussage ohne große praktische Relevanz, denn für Vielteilchensysteme liegen die Energieniveaus außerordentlich dicht nebeneinander. Daher müßte man die Energienievaus mit unvorstellbarer Genauigkeit vermessen,
um sie unterscheiden zu können: ein hoffnungsloses Unterfangen. Stattdessen führen wir
eine “Grobkörnung“ (coase-graining) der Energieachse in kleine Zellen der Größe ∆E ein
(∆E E vorausgesetzt) und zählen alle Energienieveaus in der Energieschale als effektiv
entartet. Wenn H die einzige Erhaltungsgröße ist, kann jedenfalls der statistische Operator
für ein zeitunabhängiges Gleichgewichtsensemble gemäß der von-Neumann-Gleichung nur
von H abhängen und ist demzufolge diagonal in der Energiedarstellung
H|ε, qεi = ε|ε, qε i .
Hier soll ε die Energie unserer Energiezellen angeben und q möge die vielen Zustände
mit Energien innerhalb der gleichen Energiezelle (also die effektiv entarteten Energieeigenzustände) durchnumerieren. Der statistische Operator hat dann die Form
% = %(H) =
XX
ε
qε
%(ε)|ε, qε ihε, qε | ,
wobei %(ε) innerhalb einer Energiezelle als konstant, also als von qε unabhängig, angenommen
werden kann: alle effektiv entarteten Energieeigenzustände sind gleich wahrscheinlich.
Betrachten wir abgeschlossene Systeme mit fester Energie, dann ist
%(ε) = 0 für ε 6= E
%(ε) ≥ 0 ,
27
was eindeutig %(ε) festlegt auf
%(ε) =
mit
∆EΣQ (E) =
X

1

 ∆EΣQ (E)


E ≤ ε ≤ E + ∆E
0
sonst
1 = Zahl der Zustände in der Energieschale
E, E + ∆E .
qε
Alle Zustände in einer Energieschale sind also gleich wahrscheinlich. Die Größe ΣQ (E) ist
die Zahl der Energieeigenzustände pro Energieeinheit und wird Zustandsdichte des Systems
genannt. Der Index Q soll in Erinnerung halten, daß es die quantenmechanische Zustandsdichte ist. Es ist die vielleicht wichtigste physikalische Größe zur Charakterisierung eines
Vielteilchensystems. Eine kürzere Form, den gleichen statistischen Operator anzugeben, ist
für ∆E → 0
1
δ(H − E)
%=
ΣQ (E)
mit der Zustandsdichte
ΣQ (E) = T rδ(H − E) .
9
Maxwellsche Geschwindigkeitsverteilung
Betrachten wir als erste Anwendung des mikrokanonischen Ensembles ein beliebiges abgeschlossenes klassisches Vielteilchensystem, von dem wir nur verlangen, daß die kinetische
Energie die Form hat
N
X
p2i
Ekin =
, p i = m i vi
i=1 2mi
und die potentielle Energie nicht von den Impulsen p abhängt. Z.B. für ein System mit
2-Teilchen Wechselwirkung
H = Ekin +
X
i
0
1X
U (~xi ) +
U (~xi , ~xj ) .
2 i,j
Wir fragen nach der Geschwindigkeitsverteilung für ein beliebig herausgegriffenes Teilchen i
P (v) = hδ (3) (vi − v)i
im thermodynamischen Gleichgewicht. Die Mittelung ist hier über das Gleichgewichtsensemble, also die mikrokanonische Verteilung, vorzunehmen, also
1
P (v) =
Σ(E)
Z
dVΓ δ
(3)
pi
− v δ(H(q, p) − E) .
mi
Bei Ausführung des Phasenraumintegrals sorgt die erste δ-Funktion dafür, daß der Impuls
für das i-te Teilchen auf dem festen Wert mi v bleibt. Daher steht nur die restliche Energie
E − 21 mi v 2 für die zu mittelnde Teilchenbewegung zur Verfügung. Die Integration über die
Koordinaten und die Impulse aller andern Teilchen liefert in sehr guter Näherung, da es auf
28
1 Teilchen unter ∼ 1023 nicht ankommt, wiederum
E − 21 mi v2
P
, aber für die leicht verschobene Energie
1
P (v) = const (E)Σ(E − mi ) .
2
1
2
Da 2 mi v E und 1 N , können wir den Logarithmus von Σ(E) bis zum ersten Glied
entwickeln und dann abbrechen
∂ ln Σ(E) 1
1
mi v 2 .
ln Σ(E − mi v2 ) = ln Σ(E) −
2
∂E
2
Der Koeffizient β = ∂ ln Σ(E)/∂E hängt nur von der Energie des Systems ab, ist also für
alle Atome gleich. (Wir werden ihn später als die inverse absolute Temperatur identifizieren.)
Also erhalten wir das Ergebnis
1
P (v) = const e− 2 βmi v
mit
2
Maxwellsche Geschwindigkeitsverteilung
const =
q
(mi β)3
q
(2π)3
2
2
2
aus der Normierung und den Mittelwerten hvi i = 0, hvix
i = hviy
i = hviz
i = 1/mβ, hvi2 i =
3/mi β. Definieren wir die absolute Temperatur T durch die gewohnte Relation (m/2)hvi2 i =
(3/2)kB T , dann wird
1
∂ ln Σ(E)
β=
=
.
kB T
∂E
Der Vergleich mit der thermodynamischen Definition des Inversen der absoluten Temperatur
als Energieableitung der Entropie S(E), 1/T = ∂S(E)/∂E, zeigt, daß wir die Entropie
statistisch offenbar definieren sollten als
S(E) = kB ln ∆EΣ(E) ,
wobei wir den Faktor ∆E aus Dimensionsgründen wieder eingefügt haben. Dies ist in der
Tat die zuerst von Boltzmann gegebene statistische Entropiedefinition, auf die wir in § 11
zurückkommen werden. Sie ist, wegen Σ(E) = (1/∆E)eS(E)/kg , ein logarithmisches Maß für
das (extrem rasche) Anwachsen der Zustandsdichte (quantenmechanisch) bzw. des Volumens
der Energieschale (klassisch) mit der Energie.
10
Volumen der Energieschale und
Zustandsdichte für ein ideales Gas
Ein ideales einatomiges Gas von N Atomen mit Atommasse m hat die einfache Hamiltonfunktion
3N
X
p2i
.
H=
i=1 2m
Um Ergodizität annehmen zu können, müssen wir eine nicht verschwindende Wechselwirkung
zwischen den Teilchen zulassen, die aber einen so kleinen Beitrag zur Gesamtenergie leisten
möge, daß er im Vergleich zur kinetischen Energie vernachlässigbar sei. Ist das Gas in ein
29
Volumen V eingeschlossen, so gilt (bei kubischem Behälter der Länge L = V 1/3 ) für die
Atomkoordinaten 0 ≤ xi ≤ L. Daher ist
Σ(E) = V
N
Z
+∞
−∞
dp1 . . .
Z
+∞
−∞
X
dp3N δ
i
p2i
−E
2m
!
=
3N
1 N
V (2mE) 2 S3N −1 .
E
Um die Oberfläche Sn−1 der n-dimensionalen Einheitskugel zu berechnen, betrachten wir
das Gaußintegral
Z
Z
+∞
−∞
dx1 . . .
+∞
−∞
1
dxn e− 2
Pn
i=1
x2i
= (2π)n/2
und
qP führen dies in n-dimensionalen Kugelkoordinaten aus. Die linke Seite gibt, mit r =
n
2
i=1 xi ,
Sn−1
Das Radialintegral ergibt mit u =
1 2
r ,
2
Z
∞
0
r n−1 dr = (2u)
2
n−2
2
Z
∞
0
u
1 2
r n−1 e− 2 r dr .
n−2
2
n−2
2
e
−u
du
du = 2
also
Sn−1 = 2(π)n/2 /Γ
n−2
2
Γ
n
2
n
2
,
.
Damit erhalten wir das Ergebnis
Σ(E) =
3N
1 N
π 3N/2
V (2mE) 2 · 2 3N .
E
Γ( 2 )
Da N sehr groß ist, N ∼ 1023 , nimmt Σ(E) als Funktion von E und V enorm rasch zu. Dies
ist typisch für alle Vielteilchensysteme, nicht nur für das ideale Gas.
Berechnen wir nun die analoge Größe, die Zahl der Zustände in der Energieschale E, E +
∆E, auch quantenmechanisch. Die Energieeigenwerte für die im Kasten V = L3 eingesperrten
wechselwirkungsfreien Gasatome bei zyklischen Randbedingungen sind
ε=
N
X
h̄k2i
.
i=1 2m
(10.1)
Die Energieeigenfunktionen für alle N -Teilchen zusammen in einem kubischen Kasten der
Länge L mit zyklischen Randbedingungen sind
ϕε,k =
1
V
N/2
mit Impulsquantenzahlen
kj =
N
Y
j=1
2π
nj
L
30
eikj ·x
wobei die 3-dimensionalen Vektoren


nxj

nj =  nyj 

nzj
ganzzahlige Komponenten haben und ein kubisches Gitter mit Gitterkonstante 1 bilden.
Die kj erfüllen dabei die Bedingung (10.1) für vorgegebenen Energieeigenwert ε = E. Sie
spielen die Rolle der Quantenzahlen q in der allgemeinen Formulierung. Also ist die Zahl der
Zustände pro Energieintervall in der Energieschale E
ΣQ (E) =
0
X
...
0
X
kN
k1
h̄2 k2i
δ E−
i=1 2m
N
X
!
,
wobei die Summen durch die Nebenbedingungen eingeschränkt sind, daß Zustände, die sich
nur durch Permutationen der N Werte der ki unterscheiden für ununterscheidbare Teilchen wegen der Symmetrie der Wellenfunktion nicht gesondert zu zählen sind. Von dieser
Einschränkung befreien wir uns, indem wir solche Zustände zunächst mehrfach zählen und
dafür das Ergebnis mit der Zahl der Permutationen N ! durchdividieren. Allerdings ist dies
nur die richtige Zahl von Permutationen, wenn keine Quantenzustände
mehrfach besetzt
q
sind, was für hinreichend große Energie E, so daß ∆p ' 2mE/N h/∆x = h/(L/N 1/3 ),
in guter Näherung erfüllt ist. Wir formen um
X
ki
=
X
ni
3
∆ ni ≈
Z
d 3 ni ,
wobei wir ∆3 ni = 1 eingesetzt haben, da wegen der Quantisierung gerade 1 Quantenzustand
nj auf eine Volumenzelle ∆3 ni = 1 kommt. Schließlich haben wir die Summe durch ein
Integral approximiert, was für große Impulsquantenzahlen |ni | 1, also im semiklassischen
Limes (h̄ sehr klein gegen alle relevanten klassischen Größen von gleicher Dimension), erlaubt
ist. Mit
L 3 3
3
d ni =
d ki
2π
gilt schließlich
1
ΣQ (E) =
N!
V
(2π)3
!N Z
3
d k1 . . .
Z
h̄2 k2i
d kN δ E −
i=1 2m
3
N
X
!
.
Indem wir die Impulse pi = h̄ki als neue Integrationsvariable einführen sehen wir, daß sich
ΣQ (E) vom klassischen Σ(E) nur durch einen Faktor unterscheidet
ΣQ (E) =
Σ(E)
,
N !(2πh̄)3N
dessen N -Abhängigkeit allerdings extrem stark und äußert wichtig ist zur Vermeidung des
sog. Gibbs’schen Paradoxons der klassischen Physik. Wir kommen darauf bei der Diskussion
der Mischungsentropie zurück. Tatsächlich läßt sich diese Betrachtung für das ideale Gas für
beliebige Hamiltonfunktion für identische Teilchen, auch mit Wechselwirkung wiederholen
31
und man findet die allgemeine Beziehung für die semiklassische Zustandsdichte ΣQ (E) =
T rδ(E − H) und den Flächeninhalt der klassischen Energieschale Σ(E)
∆EΣQ (E) =
∆EΣ(E)
.
(2πh̄)3N N !
Sie zeigt, daß ein Quantenzustand semiklassisch ein Phasenraumvolumen (2πh̄)3N einnimmt.
11
Entropie
Die Mitglieder eines Ensembles (klassisch repräsentiert durch Punkte im Phasenraum mit
der Punktdichte %(q, p, t)) bewegen sich unabhängig voneinander, also im Phasenraum wechselwirkungsfrei. Sie lassen sich also anschaulich mit den Atomen eines idealen Gases vergleichen, die sich, ebenfalls wechselwirkungsfrei im allerdings nur 3-dimensionalen Raum bewegen. Ebenso wie die Atome eines Gases jedes ihnen zugängliche Volumen im Laufe der
Zeit mit gleicher mittlerer Teilchendichte ausfüllen, so erfüllen auch die Ensemblepunkte
im Phasenraum jedes ihnen zugängliche Phasenraumvolumen mit konstanter Dichte %(q, p),
wie das mikrokanonische Ensemble zeigt. Dieses anchauliche Bild legt die Vermutung nahe,
daß abgeschlossene Vielteilchensysteme nur solche Zustandsänderungen von selbst durchlaufen werden, bei denen das von den Ensemblepunkten ausgefüllte Phasenraumvolumen
zunimmt (oder gleichbleibt) und daß im thermodynamischen Gleichgewicht das ausgefüllte
Phasenraumvolumen maximal ist. Betrachten wir dazu ein Beispiel: Ein ideales Gas wird
sich nach Herausziehen einer Trennwand in ein vorher evakuiertes Volumen spontan ausdehnen. In welches Phasenraumvolumen breiten sich dabei die Systempunkte des Ensembles im
Phasenraum aus?
Trennwand
V/2
V/2
ideales Gas
Vakuum
Gedankenexperiment zur Expansion eines wechselwirkungsfreien Gases
Das physikalische Volumen verdoppelt sich von V /2 auf V , doch E und N ändern sich
nicht, da das System abgeschlossen ist. Dabei nimmt das zugängliche Phasenraumvolumen
∆EΣ(E, V /2, N ) wegen Σ(E, V, N ) ∼ V N um den Faktor 2N zu
∆EΣ(E, V, N ) ∼ V
N
N
= 2 ∆E
P
V
E, , N ∼ 2N (V /2)N .
2
Für N ∼ 1023 ist 2N eine unvorstellbar große Zahl. Wegen der Zunahme exponentiell mit N
fand es L. Boltzmann sinnvoll, allgemein den Logarithmus des vom Ensemble ausgefüllten
32
Phasenraumvolumens
S = kB log[∆E
P
Q (E, V, N )]
(11.1)
als Maß für die Unordnung im System zu betrachten und damit die (Boltzmannsche) Entropie
zu definieren. Hierbei ist kB die vom Maßsystem abhängige Boltzmann Konstante. Demnach
nimmt in unserem Beispiel des von V /2 auf V expandierenden abgeschlossenen Gases die
Entropie zu um ∆S = kB N ln 2. Allgemein kann in einem abgeschlossenen System die Boltzmannsche Entropie bei einem von selbst ablaufenden Übergang von einem Gleichgewichtszustand zu einem andern nach Aufhebung einer Einschränkung von selbst nur zunehmen, da im
mikrokanonischen Ensemble stets das maximal zur Verfügung stehende Phasenraumvolumen
ausgefüllt wird. Eine zeitabhängige Variante der Boltzmannschen Entropie läßt sich analog zu
(11.1) definieren, wenn die gesamte Zahl der Zustände in der Energieschale ∆EΣQ (E, V, N )
im Argument des Logarithmus ersetzt wird durch die kleinere oder höchstens gleiche Zahl
der davon tatsächlich im Ensemble enthaltenen Zustände. Wir werden von der zeitabhängigen Boltzmannschen Entropie hier jedoch keinen Gebrauch machen, bemerken aber, daß sie
das “H-Theorem” befriedigt, nämlich
dS(t)
≥ 0.
dt
Neben der Boltzmannschen Entropiedefinition gibt es weitere, insbesondere die Gibbssche
Entropie
SG = −kB T r% ln %
bzw. klassisch
SG = −kB
Z
df qdf p%(q, p, t) ln[%(q, p, t)(2πh̄)f CN ] ,
wobei CN ein kombinatorischer Faktor ist, der die Ununterscheidbarkeit identischer Teilchen
berücksichtigt und für N ununterscheidbare Teilchen gegeben ist durch CN = N !. Setzt man
für %(q, p, t) speziell die mikrokanonische Verteilung (8.3) ein, so geht SG über in
SG = kB ln[∆E · Σ(E)/CN · (2πh̄)f ] = S .
Gleichzeitig ist dies der maximal mögliche Wert von SG unter der Bedingung, daß %(q, p, t)
nur im zugänglichen Teil des Phasenraums, also in der Energieschale, ungleich Null ist. Denn
nehmen wir an, daß %(q, p, t) in der Energieschale ∂E eine beliebige normierte Funktion ist
R f f
f
und außerhalb verschwindet, so liefert die Variation
von
S
G = −kB d qd p% ln[%(2πh̄) CN ]
R
nach % unter Beachtung der Nebenbedingung ∂E %df qdf p = 1 mit dem Lagrange-Parameter λ
Z
∂E
df qdf pδ%{−kB ln[%(2πh̄)f CN ] − kB + λ} = 0 .
Da δ% beliebig ist, muß der Faktor von δ% verschwinden. Die Lösung ist
%=
 λ/k −1
B
e


 (2πh̄)f CN
= const in ∂E


0
sonst ,
also das mikrokanonische Ensemble. Die Konstante const. (und damit auch λ) ergibt sich
wie früher aus der Normierung, also als const = (1/∆EΣ(E)). Da SG ein konvexes Funktional von % ist (d.h. nach unten gekrümmt mit überall negativer 2. Funktionalableitung,
33
was man am leichtesten einsieht, wenn man sich klarmacht, daß −x ln x als Funktion von
x überall nach unten gekrümmt ist, da −x schneller fällt als ln x anwächst), ist das Extremum ein Maximum. Anders als die Boltzmannsche Entropie ist die Gibbssche Entropie SG
für beliebige %(q, p, t) definiert, doch hat sie einen ganz gravierenden Schönheitsfehler: da
%(q, p, t) allgemein eine zeitabhängige Konstante der Bewegung ist, ändert sich SG unter der
Hamiltonschen Dynamik nicht in der Zeit,
SG (t) = const .
Am leichtesten läßt sich dies quantemechanisch mit der von-Neumann-Gleichung zeigen. SG
ist also kein sehr geeignetes Maß für den heuristischen Begriff “Unordnung“, da es anders
als die Unordnung nicht von selbst wächst. Stattdessen ist SG interpretierbar als “Unkenntnis” oder negative “Information“ die aus einem andern Grunde sehr nützlich ist: So wie
die Boltzmannsche Entropie S für abgeschlossene Systeme das Maximum der Gibbsschen
Entropie über alle möglichen % ist, und das maximierende mikrokanonische Ensemble somit
die maximale Unkenntnis des Systems bei gegebener Energie und evtl. weiterer isolierender
Bewegungskonstanten ausdrückt, so ist das auch noch für nicht-abgeschlossene Systeme der
Fall, wie wir etwas später sehen werden, wo die Maximierung der Unkenntnis SG über die
Ensembles andere kanonische Gleichgewichtsensembles liefert, für die SG wiederum gleich
wird zur Boltzmannschen Entropie.
12
Entropie des idealen Gases
Für die Thermodynamik ist die Boltzmannsche Entropiedefinition die entscheidende. Werten
wir die Boltzmannsche Entropie für ein einatomiges ideales Gas aus. Da N ∼ 1023 1
verwenden wir die Stirlingsche Formel
√
N N
N ! ' 2πN
e
s
3N
3N
3N
3N
1 2 −1
Γ
' 2π
−1
−
2
2
2e
e
und erhalten aus
S=


3N
 2∆EV N (2mE) 3N
2 π 2 
kB ln
 EN !(2πh̄)3N Γ 3N 
2
durch Einsetzen
S = kB ln
Damit erhalten wir




4m∆E
√


 2πN
r
2π
3N
2
−1
eV
(2πh̄)3 N
(
!N
2meE
3
N −1
2
V
3 E
e5/2 m3/2
S = kB N ln + ln + ln 3 3
N
2 N
π 2 h̄ 33/2
√
1
6∆E
.
+O
+kB ln
πE
N
34
)
! 3N −1
2
π




3N
2



.
Da N ∼ 1023 interessieren wir uns nur für den führenden Term für große N , der proportional
zu N wird, falls V /N und E/N festgehalten werden, und der in der ersten Zeile angegeben
ist. Der nächste Term, der explizit in der zweiten Zeile angegeben ist, wächst höchstens noch
logarithmisch mit N (falls wir uns ∆E festgehalten oder proportional zu N 1/2 denken und
bedenken, daß E proportional zur Teilchenzahl skaliert), und ist in jedem Fall im Limes
N → ∞, V /N und E/N fest (thermodynamischer Limes) und ist relativ zum führenden
Term vernachlässigbar. Der konstante Anteil s00 der Entropie pro Gasatom s = S/N , auch
Entropiekonstante genannt, ist
s00 = kB ln
e5/2 m3/2
.
π 3/2 33/2 h̄3
Wir können an unserem Ergebnis nochmals kontrollieren, daß bei Verdopplung des Volumens
bei konstanter Energie und Teilchenzahl (d.h. also im abgeschlossenen System) die Entropie
pro Gasatom um kB ln 2 zunimmt. Die Unordnung hat also zugenommen (die Gasatome
sind nun über ein größeres Volumen verstreut) und unsere Information hat abgenommen
(wir wissen weniger genau, wo jedes Gasatom ist) und zwar um 1 Bit pro Gasatom.
13
Mischungsentropie
Betrachten wir eine Mischung von 2 idealen einatomigen Gasen, deren Atommassen verschieden sind. Die Hamiltonfunktion lautet nun in offensichtlicher Notation
H=
2 3N
X
Xk
k=1 i=1
p2ki
.
2mk
Wir beginnen mit der Berechnung des Volumens der Energieschale
Σ1,2 (E, V, N1 , N2 ) = V N1 +N2
Z
+∞
−∞
dp11 . . .
Z
+∞
−∞

Nk
2 X
X

p2ki
− E .
dp2(3N2 ) δ 
k=1 i=1 2mk
Durch Herausziehen
√ des Faktors E aus der δ-Distribution und Umskalieren der Integrationsvariablen in pki = 2mk Ezki geht Σ12 über in
Σ1,2 (E, V, N1 , N2 ) = V
N1 +N2 (2m1 E)
3N1
2
(2m2 E)
E
3N1
2
S3(N1 +N2 )−1 ,
wobei wie früher Sn−1 die Oberfläche der n-dimensionalen Einheitskugel bezeichnet. Wir
P
sehen, daß bis auf die unterschiedlichen Atommassen 12 nur von der Summe der Teilchenzahlen abhängt. Führen wir die effektive von den Konzentrationen
c1 =
N1
N1 + N 2
,
c2 =
N2
N1 + N 2
abhängige Masse
ein, so gilt
m = mc11 · mc22
Σ12 (E, V, N1 , N2 ) = Σ(E, V, N1 + N2 ) ,
35
(13.1)
wobei Σ der Flächeninhalt der Energiefläche für ein einkomponentiges Gas mit effektiver
Masse m ist. Ein wichtiger Unterschied des Gasgemisches zum 1-komponentigen Gas tritt erst
P
auf, wenn wir vom Volumen der Energieschale
zur Zustandsdichte ΣQ übergehen. Denn
anstelle des kombinatorischen Faktors 1/N !, der die Ununterscheidbarkeit aller Atome im
1
, da nur die Atome innerhalb
1-komponentigen Gas berücksichtigt, tritt nun der Faktor N1 !N
2!
jeder Komponente ununterscheidbar sind. Also gilt
ΣQ12 (E, V, N1 , N2 ) =
P
12 (E, V, N1 + N2 )
N1 !N2 !(2πh̄)3(N1 +N2 )
.
Durch Erweiterung mit N ! und Benutzen von (13.1) finden wir
ΣQ12 (E, V, N1 , N2 ) =
(N1 + N2 )! P
Q (E, V, N1 + N2 ) ,
N1 !N2 !
wobei ΣQ die Zustandsdichte für ein einkomponentiges Gas mit effektiver Masse m ist. Durch
Bildung des Logarithmus finden wir die Entropie S12 des Gasgemisches
S12 (E, V, N1 , N2 ) = S1 (E, V, N1 + N2 ) + Smisch
als Entropie S1 eines einkomponentigen Gases mit effektiver Masse m (die aber nur in die
Entropiekonstante s00 eingeht) und einem Zusatzanteil
Smisch = kB ln
(N1 + N2 )!
' kB {(N1 + N2 ) ln (N1 + N2 ) − N1 ln N1 − N2 ln N2 + O(ln N )}
N1 !N2 !
= −kB (N1 + N2 )(c1 ln c1 + c2 ln c2 ) ,
der als Mischungsentropie bezeichnet wird. Hier haben wir natürlich wieder Stirling’s Formel
benutzt. Für eine binäre Mischung mit c1 = x, c2 = 1 − x zeigt die folgende Figur die
Mischungsentropie als Funktion von x
1
s/k ln2
0.8
0.6
0.4
0.2
0
0
0.2
0.4
x
0.6
0.8
1
Mischungsentropie pro Molekül in Einheiten kln(2)
Tatsächlich rührt dieser (wegen 0 ≤ ci ≤ 1) stets positive Anteil zur Entropie jedes mehrkomponentigen Systems von der zusätzlichen Unordnung her, die bei der Vermischung verschiedener Atomsorten entsteht. Ihr Ursprung liegt in der Unterscheidbarkeit der vermischten
Teilchen. Ohne die Division des Flächeninhalts der Energieschale eines reinen Gases mit dem
36
nur quantenmechanisch begründeten Faktor N !, der von der Symmetrie der Wellenfunktion für ununterscheidbare Teilchen herrührt, hätte schon das einatomige Gas eine enorme
Mischungsentropie kB N ln N . Tatsächlich müßte diese auftreten, wenn die Gasatome alle
unterscheidbar wären. Die klassisch unverständliche Abwesenheit der Mischungsentropie in
Gasen identischer Atome wurde vor der Entwicklung der Quantentheorie identischer Teilchen
von Gibbs bemerkt. Dies “Gibbssche Paradoxon“ wurde erst später durch die Quantentheorie aufgelöst. Die Mischungsentropie, die also letzten Endes quantenmechanischen Ursprungs
ist (da sie von dem fundamentalen Unterschied herrührt zwischen identischen Teilchen und
nicht-identischen, somit unterscheidbaren Teilchen, den es nur in der Quantentheorie gibt),
steckt hinter so wichtigen Tatsachen wie dem Massenwirkungsgesetz und dem osmotischen
Druck, die später behandelt werden.
14
Temperatur
Betrachten wir zwei zunächst getrennte Systeme mit Energien E1 , E2 . Solange beide Systeme
abgeschlossen sind, behalten sie ihre Energien E1 und E2 bei. Die Energiehyperflächeninhalte
P
P
der beiden Systeme seien 1 (E1 ) und 2 (E2 ). Nun bringen wir beide Systeme miteinander
in Kontakt, so daß sie Energie austauschen können, ohne daß sich ihre Volumina oder ihre Teilchenzahlen oder weitere Variable (z.B. Magnetfeld) dabei ändern. Es wird also keine
Arbeit geleistet, nur kinetische Energie ausgetauscht, die in der Energie der ungeordneten
Bewegung der beiden Vielteilchensysteme steckt. Dieser Energieaustausch findet statt, indem
die Teilchen aus den beiden Teilsystemen an ihrer Kontaktfläche miteinander zusammenstoßen. Man spricht dann auch von Wärmeaustausch und von thermischem Kontakt zwischen
beiden Teilsystemen. Nach hinreichend langer Zeit wird ein neuer thermodynamischer Gleichgewichtszustand erreicht. Da das Gesamtsystem noch immer abgeschlossen ist, können wir
das mikrokanonische Ensemble für den Gleichgewichtszustand des Gesamtsystems
%=
verwenden. Der Flächeninhalt
P
P
δ(H1 + H2 − E)
P
(E)
(E) der Gesamtenergiehyperfläche ist gegeben durch
(E) =
Z
dVΓ1
Z
dVΓ2 δ(H1 + H2 − E) .
dVΓ1 , dVΓ2 sind die Volumenelemente in den Phasenräumen der beiden Teilsysteme. Wir
haben hier die Wechselwirkungsenergie zwischen beiden Teilsystemen vernachlässigt, was
erlaubt ist, weil ihr Kontakt nur auf einen Teil ihrer Oberfläche beschränkt ist und wir hier
nur an Volumeneffekten interessiert sind. Betrachten wir zunächst die Wahscheinlichkeitsverteilung der Energie E1 im Teilsystem 1. Im mikrokanonischen Ensemble des Gesamtsystems
gilt
Z
Z
1
P (E1 ) = hδ(H1 − E1 )i =
dVΓ1 dVΓ2 δ(H1 − E1 )δ(H1 + H2 − E)
Σ(E)
P
P
eS(E1 ,E)/kB
1 (E1 )
2 (E − E1 )
∼ S(E)/k = e∆S(E1 ,E)/kB .
=
B
Σ(E)
e
37
(14.1)
Hierbei haben wir die Entropie S(E1 , E) = kB ln(δE)2 Σ2 (E − E1 )Σ1 (E1 ) des Gesamtsystems
der Energie E bei festgehaltenem E1 definiert, mit
∆S(E1 , E) = S(E1 , E) − S(E) .
Die Wahrscheinlichkeitsverteilung ist richtig normiert, da
Σ(E) =
Z
E
0
dE1
P
2 (E
− E1 )
P
1 (E1 ) .
P
Diese Verteilung hat ein extrem scharfes Maximum, da 1 (E1 ) mit wachsendem E1 enorm
P
rasch zunimmt, während 2 (E − E1 ) ebenso rasch abnimmt. Wir können daher in hervorragender Näherung den Logarithmus der Verteilung um sein Maximum entwickeln. Zunächst
bestimmen wir nur den Ort des Maximums. Zur Breite der Verteilung kehren wir erst etwas
später zurück. Der Maximalwert der Verteilung wird angenommen für die Energie E1 max die
sich aus
P
P
1
∂ 1 (E1 ) ∂ 2 (E2 ) 1
= P
(14.2)
P
∂E1 V1 ,N1
∂E2 V2 ,N2
1 (E1 )
2 (E2 )
mit E = E1 + E2 ergibt. Wegen der extremen Schärfe des Maximums (siehe weiter unten)
stimmt E1 max mit dem Mittelwert hE1 i praktisch überein. Die Gleichgewichtsbedingung
(14.2) für Wärmeaustausch läßt sich unmittelbar durch die Entropie ausdrücken als
∂S1 (E1 , V1 , N1 )) ∂S2 (E2 , V2 , N2 )) =
,
∂E1
∂E2
V1 ,N2
V2 ,N2
wobei Volumen und Teilchenzahl und eventuell weitere Variable festgehalten werden bei der
Differentiation. Da S und E beide “extensiv“ sind, d.h. proportional zur Teilchenzahl, ist der
Differentialquotient ∂S/∂E, der im thermischen Gleichgewicht für beide Systeme gleich sein
muß, von N unabhängig, d.h. “intensiv“. Wir nennen das Inverse dieser intensiven Größe
die absolute Temperatur T ,
1
∂S(E, V, N ) =
T
∂E
V,N
Definition der absoluten Temperatur
(V, N stehen hier und im folgenden auch stellvertretend für alle weiteren Variablen von
denen Σ(E, V, N, . . .) sonst noch abhängt) und die Gleichgewichtsbedingung für thermischen
Kontakt lautet
T1 = T 2 .
Zwei absolut verschiedene physikalische Systeme haben also im thermischen Gleichgewicht
(d.h. Gleichgewicht bei Energieaustausch; thermischem Kontakt) mindestens eines gemeinsam: ihre Temperatur. Bei mehr als 2 Teilsystemen verallgemeinert sich die bisherige Betrachtung auf
T1 = T 2 = T 3 = . . . = T ,
d.h. wenn Teilsysteme 1 und 2 im thermischen Gleichgewicht sind, sowie 1 und 3, so sind
automatisch auch 2 und 3 im thermischen Gleichgewicht. Dieser Befund, der hier aus der
Statistischen Mechanik hergeleitet wurde, wird auch manchmal “0. Hauptsatz der Thermodynamik” genannt. Auf ihm beruht die Möglichkeit der objektiven Temperaturmessung.
38
Wenden wir als Beispiel unsere Temperaturdefinition auf das ideale 1-atomige Gas an.
Die Energieabhängigkeit seiner Entropie ist enthalten in
E
3
S = N kB ln + . . . ,
2
N
woraus sich
∂S 1
3 E
=
kB
=
T
∂E V,N
2N
oder
3
E = N kB T
2
ergibt, d.h. jedes Gasatom trägt mit (3/2)kB T zur Energie des Gases bei. Ist ν die Molzahl
unserer Gasmenge, so ist N = νL wo L die Loschmidtsche Zahl ist. Mit der idealen Gaskonstanten R = kB L finden wir also für das 1-atomige Gas die sog. kalorische Zustandsgleichung
3
E = νRT .
2
Da in dieser Rechnung S eine Funktion von E, V, N (oder ν) ist, müssen wir auch seine
Ableitung 1/T als Funktion dieser Größen auffassen. Es ist also bei nochmaliger Ableitung
nach E bei festem V, N
1
2
1
∂T =
=
=
.
∂E V,N
∂E/∂T |V, N
3N kB
CV
Das Inverse, die Energieänderung durch Temperaturänderung bei festem Volumen heißt Wärmekapazität CV bei festem Volumen, CV /N heißt spezifische Wärme cv . Für das ideale 1atomige Gas ist also
3
cv = k B .
2
15
Energieschwankungen
Kehren wir nun zur Energieverteilung (14.1) im Teilsystem E1 zurück und entwickeln ln P (E1 )
aus (14.1) bis zum quadratischen Glied um sein Maximum
ln P (E1 ) = const −
1
(E1 − hE1 i)2 + . . . .
2σE2 1
Der Koeffizient des quadratischen Gliedes ist das Inverse der Varianz der Energieschwankungen
P
P 1
∂ 2 ln 1 ∂ 2 ln 2 − 2 =
+
.
σE 1
∂E12
∂E22 E2 =E−E1
Betrachten wir die beiden Terme der rechten Seite für sich. Allgemein gilt
P ∂ 2 ln
∂E 2
V,N
∂ 1
∂E T
∂T ∂E 
1 ∂ 2 S 1
=
=
2
kB ∂E V,N
kB
1
=−
kB T 2
V,N
!
V,N
−1
∂E 
= − kB T 2
∂T V,N
39
=−
1
.
kb T 2 N c V
Die Temperaturableitung der Energie bei konstantem Volumen (und Teilchenzahl) ist die
schon erwähnte Wärmekapazität bei konstanten Volumen CV . Also ist
1
1
1
+
.
=
2
2
σE 1
k B T CV 1 k B T 2 CV 2
Meist (aber nicht immer!) ist das Teilsystem 2, das Energiereservoir oder Wärmebad, viel
größer als Teilsystem 1. Dann ist N2 N1 , CV 2 CV 1 und σE2 1 ist gegeben durch
σE2 1 = kB T 2 CV 1 .
Z.B. für ein ideales einatomiges Gas σ 2 = (3/2)(kB T )2 N = 2E 2 /3N . Dies ist ein wunderbares
Resultat: Eine rein makroskopische Messung von Temperatur und Wärmekapazität gibt uns
Auskunft über eine rein statistische Eigenschaft, die Stärke der Energieschwankungen in
einem System. Da CV 1 ebenso wie hE1 i extensiv ist, also proportional zu Teilchenzahl N1 ,
ist die relative Standardabweichung der Energie
1
σE 1
∼√
hE1 i
N1
und wird für makroskopische Systeme (N1 ∼ 1023 ) unmeßbar klein, außer in der unmittelbaren Umgebung von kritischen Punkten, an denen, wie wir später sehen werden, die spezifische
Wärme und somit auch σE12 divergiert.
Fassen wir zusammen: Ein System 1 im Kontakt mit einem zweiten hat eine Entropie
S(E1 , E), die von der Gesamtenergie E beider Systeme aber außerdem auch von E1 abhängt.
Letztere Energie kann bei kleinen Systemen 1 fluktuieren. Der Gleichgewichtszustand wird
durch das Maximum von S(E1 , E) bezüglich E1 festgelegt und liefert die Zustandsgleichung,
welche die Temperatur mit anderen Systemvariablen verknüpft:
∂S(E1 , E)
=0.
∂E1
Die Fluktuationen von E1 werden durch die Boltzmann-Einsteinsche Formel
1
e∆S(E1 ,E)/kB
1
eS(E1 ,E /kB
1 (E1 − Ē1 )2
q
=
'
P (E1 ) =
exp
−
∆EeS(E)/kB
∆E
2
σE2
2πσE2
!
,
beschrieben mit
σE2 = kB T 2 N cV 1 .
16
Kanonisches Ensemble
Wie wir sahen ist ein System, das im thermischen Gleichgewicht mit einem anderen System
steht, nicht mehr abgeschlossen. Auch im thermodynamischen Gleichgewicht hat es keine
feste Energie mehr, sondern seine Energie kann schwanken, indem es Energie aus dem andern System aufnimmt oder an dieses abgibt. Welches Ensemble, welche Phasenraumdichte
beschreibt ein solches System im thermodynamischen Gleichgewicht?
40
Für die gesamte Phasenraumdichte setzen wir wie immer das mikrokanonische Ensemble
an
%(q1 , . . . , pf , Q1 , . . . , Pf 0 ) =
δ(H1 (q, p) + H2 (Q, P ) − E)
sum(E)
unter Vernachlässigung der Wechselwirkungsenergie (aus den gleichen Gründen). Die Phasenraumdichte des durch die qi , pi beschriebenen Teilsystems ergibt sich hieraus durch Integration über die Variablen Q1 , . . . Pf 0 des als “Energiereservoir” oder “Wärmebad” fungierenden zweiten und als viel größer angenommenen Systems. Die gewünschten Integrationen
werden leicht ausgeführt, wenn wir zuvor wieder substituieren
δ(H1 + H2 − E) =
Z
E
0
dE1 δ(H1 − E1 )δ(H2 − E + E1 ) .
Wir finden dann unmittelbar
Z
P
− E1 )
Σ(E)
0
P
(E − H1 (q1 , . . . , pf ))
.
= 2
Σ(E)
%1 (q1 , . . . , pf ) =
E
dE1 δ(H1 − E1 )
2 (E
(16.1)
Tatsächlich wird %1 für das Teilsystem allein eine Funktion der Erhaltungsgrößen
H1 (q1 , . . . , pf ) und ist damit eine zeitunabhängige Lösung der Liouville-Gleichung. Ist das
Energiereservoir, d.h. Teilsystem 2, viel größer als Teilsystem 1 so ist die Energie H1 − hE1 i
für alle im Ensemble vertretenen Zustände viel kleiner als E2 = E − hE1 i und wir können
entwickeln
ln
Hierbei ist
P
2 (E
− H1 ) = ln
P
2 (E2 )
−
H1 − hE1 i 1 (H1 − hE1 i)2
−
+... .
kB T
2 2kB T 2 CV 2
P
P
∂ 2 ln 2 (E2 ) 1
−1 1
∂ ln 2 (E2 ) ,
=
=
.
2
kB T
∂E2
∂E2
k B T 2 CV 2
V2 ,N2
V2 ,N2
Wenn die Wärmekapazität CV 2 des Wärmebads bei der Energie E2 = E − hE1 i sehr groß
ist, kB CV 2 T 2 (H1 − hE1 i)2 ∼ kB CV 1 T 2 , dann ist der Term quadratisch in (H1 − hE1 i) in
der Entwicklung vernachlässigbar. Dann gilt
%1 (q1 , . . . , pf ) =
1 −βH1 (q1 ,...,pf )
e
Z
kanonisches Ensemble
(16.2)
wobei β ≡ 1/kB T . Unsere Herleitung zeigt, daß der Normierungsfaktor Z geschrieben werden
kann als
Σ(E)e−βhE1 i
P
Z=P
= 1 (hE1 i)e−βhE1 i ,
(16.3)
2 (E − hE1 i)
doch berechnet wird es nicht hieraus, sondern aus der Normierung von %1 (qq , . . . , pf )
Z
was
Z=
Z
dq1 . . . dpf %(q1 , . . . , pf ) = 1
dq1 . . . dpf e−βH1 (dq1 ...dpf ) = Z(β, V, N )
41
(16.4)
ergibt. Ähnlich wie schon beim mikrokanonischen Ensemble wird die Teilchenzahlabhängigkeit von Z durch diese klassische Formeln noch nicht richtig wiedergegeben, da die quantenmechanisch bedingte Ununterscheidbarkeit von identischen Teilchen nicht berücksichtigt
wird. Um diese in den Ausdruck für Z einzubauen, teilen wir den Phasenraum in kleine
Zellen der Größe
∆q1 . . . ∆pf = (2πh̄)f
ein, ersetzen H(q, p) durch einen konstanten Wert in jeder Zelle, und normieren die Phasenraumdichte
1 −βH
%1 =
e
Zq
nun durch Summation über die Zellen, wobei wir Zustände, die nur durch Permutation
identischer Teilchen unterschieden sind, nur einmal zählen. Also, indem wir uns von letzterer
Einschränkung durch Einführung eines kombinatorischen Faktors CN befreien,
1 X −βH1
e
CN (Zellen)
Z
1
dq1 . . . dpf e−βH1 .
=
f
CN (2πh̄)
Z=
Der kombinatorische Faktor für identische Teilchen ist CN = N ! Die analogen quantenmechanischen Gleichungen lauten
1 −βH1
e
Z
Z = T re−βH1 .
%1 =
(16.5)
Ihre Herleitung verläuft ganz analog, wobei Phasenraumintegrale durch Spuren über die
Hilberträume der entsprechenden Teilsysteme zu ersetzen sind.
Z heißt kanonisches Zustandsintegral (klassisch) oder kanonische Zustandssumme (quantenmechanisch). Aus Z als Funktion von β ergeben sich durch Differentiation:
∂
ln Z
∂β
∂2
ln Z .
=
∂β 2
hE1 i = −
σE2 1
Zur Deutung von Z können wir auf (16.3) zurückgreifen, wenn wir zuvor Σ(E) für das
Gesamtsystem aus Gl. (14.2) auswerten, indem wir das Integral durch den Maximalwert
des Integranden multipliziert mit der Breite des Maximums ∆E approximieren Σ(E) '
P
P
∆E 2 (E − E1 max ) 1 (E1 max ). Also erhalten wir
Z = ∆E
P
1 (E1 max )e
−βE1 max
und daraus bis auf Größen, die im thermodynamischen Limes vernachlässigbar sind
kB ln Z = S1 (E1 max , V1 , N1 ) −
42
E1 max
.
T
Hierbei ist E1 max die mittlere Energie im Teilsystem 1, die sich im Prinzip durch Lösung
der Gleichgewichtsbedingung (14.2), also durch Vorgabe seiner Temperatur T , ergibt. Im
folgenden schreiben wir daher statt E1 max nur E1 . Also ist die Temperatur (nicht die Energie)
hier die unabhängig vorgebbare Variable (durch Vorgabe der Temperatur des Wärmebads).
Wir können aus der durch −kB T ln Z gegebenen Funktion
−kB T ln Z = −T S1 (E1 , V1 , N1 ) + E1
die Energie E1 mit Hilfe der Beziehung
1
∂S1
=
T
∂E1
eliminieren. Dies ist eine Legendre-Transformation und die entstehende Funktion F (T, V1 , N1 )
F (T, V1 , N1 ) = E1 (T, V1 , N1 ) − T S1 (E1 (T, V1 , N1 ), V1 , N1 )
ist in der Thermodynamik bekannt als freie Energie (genauer: Helmoltzsche freie Energie).
Offenbar gilt also
F (T, V1 , N1 ) = −kB T ln Z(β, V1 , N1 ) .
Die Variablen T, V1 , N1 heißen die “natürlichen“ Variablen von F . Es sind wunderschönerweise die selben Variablen von denen auch Z abhängt. Die Auswertung der kanonischen
Zustandssumme liefert also direkt die freie Energie als Funktion ihrer natürlichen Variablen. Analog sind die extensiven Variablen E, V, N die natürlichen Variablen der Entropie
S = S(E, V, N ), deren statistische Bestimmung durch S = kB ln ∆EΣQ (E, V, N ) sie ebenfalls
als Funktion ihrer natürlichen Variablen liefert. Die Ableitung von S nach seiner natürlichen
Variablen E liefert die Temperatur T −1 = ∂S/∂E. Die Ableitung von F nach seiner natürlichen Variablen bei festem V, N liefert −S gemäß dF = dE − T dS − SdT = −SdT (falls V, N
fest) da dE = T dS (falls V, N fest), also
∂F = −S .
∂T V,N
Eine sehr einfache Anwendung des kanonischen Ensembles ist die Herleitung der Maxwellschen Geschwindigkeitsverteilung. Eine damit eng verknüpfte noch allgemeinere Aussage der
klassischen statistischen Mechanik behandeln wir als nächstes.
17
Gleichverteilungssatz
Der Gleichverteilungssatz der klassischen statistischen Mechanik lautet: Jede kanonische Koordinate und jeder kanonische Impuls, der quadratisch in die Hamiltonfunktion eingeht, trägt
zur mittleren Energie den Betrag (1/2)kB T bei und zur Wärmekapazität cv den Betrag kB /2.
Der Beweis ist mit Hilfe des kanonischen Ensembles leicht geführt: Man spaltet dazu die Hamiltonfunktion in den quadratischen Teil und den Rest auf, H = Hquadr. + HRest . Für die
Zustandssumme bedeutet dies eine entsprechende Faktorisierung
Z = Zquadr. · ZRest ,
43
was zur Aufspaltung
F = −kB T ln Z = Fquadr. + FRest
führt. Der Beitrag vom quadratischen Teil der Hamiltonfunktion ist dabei
Fquadr. = −kB T ln Zquadr. .
Die Temperaturabhängigkeit von Zquadr. wertet man am leichtesten aus, indem man durch
Reskalierung aller in die Hamiltonfunktion quadratisch eingehenden Variablen q oder p
q=
q
kB T Q ,
p=
q
kB T P
den Integranden exp(−βHquadr. (q, p)) = exp(−Hquadr. (Q, P )) temperaturunabhängig macht.
Im Volumenelement bedeutet dies
fq
dVΓquadr. (q, p) = (kB T ) 2 dVΓquadr. (Q, P ) ,
wobei dVΓquadr. (q, p) das Volumenelement für die quadratisch eingehenden Variablen ist
und fq die Gesamtzahl der quadratisch eingehendenn q’s und p’s, also die Dimension von
dVΓquadr. (q, p). Daher hat Zquadr. die Form
Zquadr. (T, V, N ) = (kB T )fq /2 Z̃quadr. (V, N ) ,
wobei Z̃quadr. (V, N ) unabhängig von der Temperatur ist. Also gilt
Fquadr. (T, V, N ) = −
kB T
fq ln kB T − kB T ln Z̃quadr. (V, N )
2
und
Squadr. = −
kB
kB
∂Fquadr.
=
fq ln kB T −
fq
∂T
2
2
+kB ln Z̃quadr. (V, N )
kB fq
∂Squadr. CV quadr.
=
=
T
∂T V
2 T
was CV quadr. /fq = kB /2 liefert, wie behauptet, und nach Integration bezüglich T
hE quadr. i =
kB T
fq .
2
Den Erwartungswert hEquadr. i kann man auch direkter bestimmen aus
hEquadr. i = −
fq
∂
ln Zquadr. = kB T ,
∂β
2
woraus ebenfalls CV quadr. = fq kB /2 folgt.
Eine Anwendung des Gleichverteilungssatzes ist die Berechnung der spezifischen Wärme von
Festkörpern bei so hohen Temperaturen, daß die klassische statistische Mechanik anwendbar ist. Die Atome des Kristalls führen in guter Näherung harmonische Schwingungen um
44
ihre Gleichgewichtslagen aus, d.h. sämtliche 3N Koordinaten und 3N Impulse gehen in die
Hamiltonfunktion quadratisch ein. Dies ergibt nach dem Gleichverteilungssatz
1
CV = kB · 6N = 3N kB
2
(Dulong Petitsche Regel) .
Diese “Dulong Petitsche Regel“ ist empirisch recht gut bestätigt. Harmonische Schwingungen
(dies stets mit Impuls und Koordinate quadratisch in die Hamiltonfunktion eingehen) sind
nur dann klassisch behandelbar, wenn ihre Frequenz ω die Bedingung h̄ω hEiklass = kB T
erfüllt. Andernfalls, für kB T <h̄ω, ist die Schwingung “eingefroren“ und nimmt nicht mehr
∼
an der gleichförmigen Energieverteilung (Äquipartition) teil.
Um dies zu sehen, berechnen wir die Wärmekapazität eines harmonischen Oszillators
quantenmechanisch. Aus
1
% = e−βH
Z
2
2 2
folgt mit H = p /2m + (m/2)ω q
Z = T re−βH =
X
n
hn|e−βH |ni
unter Verwendung des vollständigen Systems von Eigenzuständen |ni des Hamiltonoperators
1
|ni
H|ni = h̄ω n +
2
Z=
∞
X
1
e−βh̄ω(n+ 2 ) =
n=0
Also
hEi = −
e−βh̄ω/2
.
1 − e−βh̄ω
1
∂ ln Z
= h̄ω hni +
∂β
2
mit
hni =
1
eβh̄ω
Für die spezifische Wärme liefert dies
∂hEi
C=
= kB
∂T
−1
.
βh̄ω/2
sinh βh̄ω
2
!2
mit folgendem Temperaturverlauf, wobei kB T in Einheiten von h̄ω genommen wird
45
1
C/k
0.8
0.6
0.4
0.2
0
0.2 0.4 0.6 0.8
1
1.2 1.4 1.6 1.8
2
kT
Spezifische Wärme C/k einer harmonischen Schwingung
Wir sehen, daß für kB T h̄ω der Beitrag C der harmonischen Schwingung zur spezifischen Wärme den klassischen Wert 2kB /2 gemäß dem Gleichverteilungssatz annimmt, aber
auch wie die beiden “Schwingungsfreiheitsgrade“ fq = 2 für kB T <h̄ω aus der spezifischen
∼
Wärme herausfallen. Ähnliches gilt für die Rotationsfreiheitsgrade, z.B. in Gasmolekülen,
deren kinetische Energie der Rotation sich schreiben läßt als
Hrot =
3
1X
Θi ωi2 ,
2 i=1
wobei die Θi die Hauptträgheitsmomente und die ωi die Winkelgeschwindigkeiten um die
Hauptträgheitsachsen sind. Solange keine der Rotationen ausgefroren ist, und falls die nichtlineare Kopplung zwischen Rotationen und Vibrationen (durch Veränderung der Trägheitsmomente durch die Vibrationen) vernachlässigbar sind, nimmt jedes derartige Gasmolekül
mit 3 zusätzlichen “Rotationsgraden“ fq = 3 an der Energiepartition teil. Quantenmechanisch haben die ersten Rotationsniveaus Energien der Größe h̄2 /2Θi . Äquipartition kann
man daher annehmen falls kB T h̄2 /2Θi . Andernfalls werden auch die Rotationsfreiheitsgrade ausgefroren. Insbesondere bei hantelförmigen Molekülen ist das Trägheitsmoment um
die Achse parallel zur Hantel verschwindend klein, die Rotation um diese Achse ist also
stets ausgefroren. Gase wie N2 , O2 haben Moleküle mit 3 Translationsimpulskomponenten,
2 Streckschwingungskoordinaten (Koordinate und Impuls) und 2 Drehimpulskoordinaten
die (näherungsweise) quadratisch in die Hamiltonfunktion eingehen. Ihre spezifische Wärme
bei sehr hohen Temperaturen beträgt daher cv = 7kB T /2, die für T ≤ h̄ω/kB (ω= Frequenz der Streckschwingung) auf cv = 5kB T /2 abfällt und dann für T ≤ h̄2 /2ΘkB auf
cv = 3kB T /2 ausfriert. Bei Zimmertemperatur sind meist die Schwingungsbeiträge schon
ausgefroren, die Rotationsbeiträge dagegen noch nicht. Ein Gas wie CO2 hat noch immer
hantelförmige Moleküle, doch gibt es eine symmetrische und eine unsymmetrische Streckschwingung mit je 2 Schwingungsfreiheitsgraden und zwei unabhängige Knickschwingungen
transversal zur Hantelachse nochmals mit je 2 Schwingungsfreiheitsgraden, was eine spezifische Wärme cv = 13kB T N/2 bei sehr hohen Temperaturen ergibt. Planare 3-atomige und
komplizierte 3-dimensionale Moleküle haben 3 Rotationsfreiheitsgrade und cv = 6kB T /2 bei
Temperaturen, für die die Schwingungsfreiheitsgrade nicht aber die Rotationsfreiheitsgrade
46
ausgefroren sind.
18
Paramagnetismus
Betrachten wir ein Gas von Molekülen mit magnetischen Momenten µ in einem äußeren
Magnetfeld H. Die magnetische Energie eines Moleküls ist die Zeeman-Energie
hz = −µ · H .
m ist proportional zum Gesamtdrehimpuls h̄J des Moleküls µ = gµo J, wobei g der LandéFaktor ist und µ0 = eh̄/2me c das Bohrsche Magneton mit der Elektronenmasse me . Zeigt H
in z-Richtung gilt
hz = −gµ0 Jz H .
Jz = m kann 2J + 1 Werte zwischen −J und J annehmen. Der Mittelwert der magnetischen
Energie pro Molekül wird daher
hhz i =
J
1 X
∂
ln Z
hz e+βgµ0 mH = −
Z m=−J
∂β
mit
Z=
X
e
βgµ0 mH
m
1 − e−(2J+1)βgµ0 H
=e
1 − e−βgµ0 H
sinh[(J + 12 )βgµ0 H]
.
=
sinh[ 12 βgµ0 H]
βgµ0 mJH
Dies ergibt
E/N = hhz i = −
1
1
gµ0 H
(2J + 1) coth[ J +
βgµ0 H] − coth[ βgµo H]
2
2
2
mit den beiden Grenzfällen
hhz i → −gµ0 HJ (kB T Jgµo H)
1 (gµ0 H)2
J(J + 1) (kB T Jgµo H) .
hhz i → −
3 kB T
Die mittlere Zeeman-Energie pro Spin als Funktion von Temperatur und Magnetfeldstärke
zeigt die folgende Figur:
47
0
-2
-4
E/N
-6
-8
-10
0
-10
-5
5
10
kT
0
gµH
5
15
20 10
Mittlere Energie pro Spin als Funktion von T und H für J = 1
wobei in der Figur µ0 als µ abgekürzt wird und für alle Achsen die gleiche willkürliche Energieeinheit gewählt wird. In beiden Grenzfällen strebt der magnetische Anteil zur spezifischen
Wärme
∂hhz i
ch =
∂T
gegen Null ch → 0, mit einem Maximum für kB T ∼ (1/2)Jgµ0H.
0.6
0.5
c/k
0.4
0.3
0.2
0.1
0
0
0
2
5
4
10
kT
6
15
gµH
8
20 10
Spezifische Wärme c als Funktion von T und H für J = 1
Die mittlere Magnetisierung pro Molekül können wir ebenfalls aus Z berechnen mit
hµz i = gµ0 hJz i =
1 ∂ ln Z
hhz i
=−
,
β ∂H
H
was die Grenzfälle
hµz i → gµ0 J
(kB T Jgµ0 H)
48
hµz i → −
1 (gµ0 )2
HJ(J + 1) (kB T Jgµo H)
3 kB T
ergibt. Die mittlere Magnetisierung pro Spin in Einheiten gµ0 für verschiedene Werte von J
zeigt die nächste Figur:
2
<m>
1.5
1
0.5
0
1
2
3
4
gHµ/kT
5
6
Mittlere Magnetisierung pro Spin für J = 1/2, 1, 3/2, 2
Die magnetische Suszeptibilität des Gases pro Molekül erhalten wir damit als
∂hµz i
1 ∂ 2 ln Z
1 ∂hhz i
=
= − 2β
2
∂H
β ∂H
H
∂β
T
kB T ∂hhz i
= 2 ch .
=
2
H ∂(kB T )
H
χ=
die wir ebenfalls auftragen
5
4
χ
3
2
1
1
1.5
2
2.5
0
0
1
2
3
4
5
0
0.5
gµH
6 3
kT
Suszeptibilität χ/(gµ)2 als Funktion von T und H für J = 1
49
Insbesondere gilt für kB T Jgµ0 H
χ=
gµ20
J(J + 1) .
3kB T
Die Abhängigkeit χ = D/T ist als Curiesches Gesetz bekannt mit der Curieschen Konstanten
D. Wir sehen, daß das Curiesche Gesetz einhergeht mit einer Magnetfeldabhängigkeit der
Wärmekapazität
2N DH
∂CH =
,
(18.1)
∂H T
T2
aus deren Messung man die Curiesche Konstante für ein gegebenes Gas bestimmen kann.
Paramagnetismus kann von einem nichtverschwindenden Gesamtdrehimpuls der Elektronenhülle stammen, in welchem Fall |µ| von der Größenordnung des Bohrschen Magnetons ist,
oder, falls dieser verschwindet, vom Kernspin mit einem viel (etwa 1000-mal) kleineren magnetischen Moment. Kernspins richten sich daher im Magnetfeld erst bei einer ca. 1000-mal
kleineren Temperatur kB T <Jgµ0 H aus als Elektronenspins oder Drehimpulse der Elektro∼
nenhülle. Diese Eigenschaft macht man sich bei dem später zu diskutierenden Kühlverfahren
durch adiabatische Entmagnetisierung zunutze.
Eine Besonderheit von Spinsystemen ist es, daß die Energie nach unten und auch nach
oben beschränkt ist. Die Entropie nimmt für große Energien wieder ab,
1
0.8
0.6
S/kN ln(2J+1)
0.4
0.2
-1
-0.5
00
0.5
E/NgµH
1
Entropie s(e, H) für |T | < 4gµH im Fall J = 1
was zu negativen Temperaturen führt. Diese sind in gewisser Weise noch heißer als T =
∞, denn von kleinen zu großen Energien durchläuft man erst T von 0 bis ∞ und dann
anschließend von −∞ bis −0.
19
1-dimensionales Ising Modell
und Transfer-Matrix Methode
Das Ising-Modell ist zunächst ein klassisches Modell für einen Ferromagneten mit einer eventuell durch das Kristallgitter vorgegebenen leichten Richtung der Magentisierung. Darüber
50
hinaus kann es zur Modellierung einer Unzahl von Vielteilchensystemen verwendet werden.
Mikroskopisch besteht der Magnet in diesem Modell aus Spins mit dem Wert s = 1/2,
die auf einem regelmäßigen Kristallgitter gegebener Symmetrie (z.B. ein kubisches Gitter)
angeordnet sind. Die Spins haben nur 2 Einstellmöglichkeiten in die magnetisch leichte Richtung ms = 1/2 und ms = −1/2. Nächst benachbarte Spins auf dem Kristallgitter können
wechselwirken, und zwar erhält man Energieabsenkung um −J bei Parallelstellung und Energieerhöhung um +J bei Antiparallelstellung. J wäre quantenmechanisch proportional zum
Überlappungsintegral der Elektronenwellenfunktionen in den d-Schalen benachbarter Atome des ferromagnetischen Materials: Bei Parallelstellung der benachbarten Elektronenspins
werden diese Elektronen wegen des Pauli-Prinzips auf Abstand gehalten, wodurch ihre positive Coulombenergie verringert, also abgesenkt wird. Führen wir an jedem Gitterpunkt i
eine Spinzufallsvariable si = 2msi mit den möglichen Werten +1, -1 ein, so schreibt sich die
Energie des Ising-Modells in einem äußeren Magnetfeld Hz entlang der magnetisch leichten
Richtung
X
JX
si
H=−
si sj − h
2 hiji
i
mit h = 1/2gµoHz . Hierbei bedeutet hiji in der Doppelsumme, daß nur über Paare von
nächsten Nachbarn auf dem Gitter summiert wird. Es gibt natürlich Verallgemeinerungen
des Ising-Modells, wo jeder Spin statt 2 nun p > 2 Einstellmöglichkeiten hat (Potts-Modell),
oder wo auch übernächste Nachbarwechselwirkungen betrachtet werden, oder wo das Austauschintegral negativ ist, oder oszilliert vom nächsten zum übernächsten Nachbarn etc.
Außerdem kann das Ising-Modell zur Beschreibung von Gittergasen verwendet werden, in
denen Atome nur auf den Punkten eines festen Gitters sitzen können, die entweder besetzt
sind, pi = (1 + si )/2, oder nicht pi = (1 − si )/2.
Das 1-dimensionale Ising-Modell wurde schon von Ising exakt gelöst. Das zweidimensionale Ising-Modell ohne äußeres Magnetfeld, Hz = 0, konnte in einer spektakulären Arbeit
von Onsager exakt gelöst werden. Die Lösung des zweidimensionalen Modells mit Hz 6= 0
wurde später von Yang gegeben. Das 3-dimensionale Ising-Modell ist dagegen bis heute nur
näherungsweise lösbar. Betrachten wir hier die Lösung des 1-dimensionalen Ising-Modells mit
Hilfe der Transfer-Matrix Methode, die leicht abgewandelt auf alle 1-dimensionalen Systeme
mit kurzreichweitiger Wechselwirkung anwendbar ist.
Die Hamiltonfunktion lautet:
H = −J
N
X
k=1
sk sk+1 − h
N
X
sk
k=1
wobei wir N Gitterplätze auf einer geschlossenen linearen Kette angenommen haben (zyklische Randbedingungen). Die auszuwertende Zustandssumme im kanonischen Ensemble hat
die Form
"
#
Z=
X
s1
...
X
sN
exp β
N
X
(Jsk sk+1 + hsk ) ,
k=1
wobei sn+1 = s1 angenommen wird (zyklische Randbedingung). In 1-dimensionalen Systemen
können wir uns bei der Ausführung der Summen z.B. von links nach rechts durch das Gitter
hindurcharbeiten. Zur Auswertung definieren wir die symmetrische reelle Matrix
Qss0 = hs|Q|s0 i
51
in bewußt quantenmechanisch inspirierter Notation, welche die Zustandssumme in die Form
bringt
X
X
. . . hs1 |Q|s2 ihs2 |Q|s3 i . . . hsN |Q|s1 i .
Z=
s1
sN
Offenbar leistet die Wahl
0
Qss0 = eβJss +
βh
(s+s0 )
2

=

eβJ+βh
e
−βJ
e−βJ
e
βJ−βh



(19.1)
0
genau dieses. Denn im Produkt steuert dies Qss0 den richtigen Term eβJss bei jeweils der
Hälfte von βhs und βhs0 im Exponenten, wobei aber jedes s und s0 als erster und als zweiter
Matrix-Index vorkommt. Qss0 heißt Transfer-Matrix, weil sie in der Zustandssumme einen
Transfer von einem Gitterplatz zum nächsten auf unserer 1-dimensionalen Kette bewirkt.
Tatsächlich kann man die Summen über s2 , s3 , . . . , sn in (19.1) nun sofort ausführen mit
dem Ergebnis
X
Z = hs1 |QN |s1 i = T rQN .
s1
Die Zustandssumme ist also als Spur der N -ten Potenz (N =Zahl der Gitterplätze) der
Transfer-Matrix gegeben. Die Wechselwirkung steckt allein in den Matrixelementen. Die Faktoren von QN wechselwirken dagegen untereinander nicht. Diagonalisieren wir die TransferMatrix, so erhalten wir die beiden Eigenwerte
λ± = e
βJ
cos βh ±
q
2
cosh βh −
2e−2βJ
sinh 2βJ
,
wobei λ+ > λ− . Die freie Energie pro Spin erhalten wir aus
ln Z(T, h, N )
.
N →∞
N
f (T, h) = −kB T lim
Die Zustandssumme ergibt sich als
N
Z = T rQN = λN
+ + λ− ,
also
N
f (T, h) = −kB T lim N −1 ln(λN
+ + λ− ) ,
N →∞
= −kB T ln λ+ .
Im thermodynamischen Limes wird also die freie Energie pro Teilchen proportional zum
Logarithmus des größten Eigenwerts der Transfer-Matrix. Dies ergibt explizit:
f (T, h) = −J − kB T ln cosh βh +
q
2
cosh βh −
2e−2βJ
sinh 2βJ
woraus sich Entropie pro Spin s = −∂f (h, T )/∂T ), spezifische Wärme pro Spin ch =
und Suszeptibilität pro
T ∂s/∂T = −T ∂ 2 f (h, T )/∂T 2 Magnetisierung pro Spin m = ∂f
δh
T
52
Spin χ = ∂m/∂h = −∂ 2 f /∂h2 durch Differentiationen ergibt. Für die Magnetisierung finden
wir
∂f
sinh βh
m=−
=q
∂h
cosh2 (βh) − 2e−2βJ sinh 2βJ
und für die Suszeptibilität bei h = 0
χ=
∂m
= β(1 − 2e−2βJ sinh βJ)1/2 .
∂h
Die Isothermen m = m(T, h) für feste Werte von T zeigt die nächste Figur:
1
<m>
4
3
2
0.4
0.5
0
-0.5
-1
-4
-2
0
2
4
gµH / 2J
Magnetisierung m pro Spin in Einheiten von gµ/2 für kT /J = 0.4, 2, 3, 4
Die Einheit m = 1 entspricht physikalisch mphys = 21 gµ0 . Das eindimensionale System
hat (anders als 3-dimensionale uniaxiale Ferromagnete) keinen Phasenübergang für endliche Temperaturen T > 0. Dies gilt allgemein für 1-dimensionale Vielteilchensysteme mit
kurzreichweitiger Wechselwirkung. Doch findet man für T → 0, h → 0, daß die freie Energie
und die aus ihr abgeleiteten Größen singulär wird. Einen solchen Punkt im Zustandsraum
nennt man einen kritischen Punkt. Betrachten wir den kritischen Punkt des 1-dimensionalen
Ising-Modells für T = 0, h = 0 genauer. Im Grundzustand zeigen bei verschwindendem
äußeren Magnetfeld alle Spins nach oben oder unten. Um einen einzelnen Spin umzudrehen,
braucht man eine Energie von 4J, da die Wechselwirkungsenergie für zwei Nachbarn aufgebracht werden muß. Der Boltzmann-Faktor für einen einzelnen Spin-Flip ist also x = e−4βJ .
Die freie Energie ist eine Funktion von y = (βh) und x
q
F + NJ
= g(x, y) = − ln cosh yh + sinh2 y + x .
N kB T
g(x, y) nicht analytisch in x für x → 0, sondern (für y → 0, d.h. → 0)
s
g(x, y) = gsing (x, y) = −|y| 1 +
x
.
y2
Außerdem hat m = M/N einen Sprung für T = 0 bei y = 0(h = 0)
(kB T )msing = −
sgn(y)
∂gsing
y
=q
=√
2
∂y
x+y
1 + (yx2 )2
53
und
2
(kB T ) χsing
∂msing ∂msing sgn(y)
= (kB T )
= (kT )
= √
∂h T
∂y x
x
2
(y)2
+1
x
!−3/2
eine Singularität für y → 0, x → 0. Tatsächlich ist (F + N J)/N kB T für T → 0, d.h. x → 0,
√
˜ y2 ) mit g̃(u) = 1 + u und
h → 0 eine Skalenfunktion g(x, y) = −|y|g̃(x/y 2 ) = −x1/2 g̃(
x
√
˜
g̃(v)
= 1 + v in x und y und x = 0, y = 0 ein kritischer Punkt.
20
Arbeit äußerer Kräfte und Druck
Statt durch thermische Kontakte kann der Abschluß eines Systems auch dadurch aufgehoben werden, daß es zwar thermisch isoliert bleibt, aber äußere Kräfte auf es einwirken.
Z.B. können wir, wie in den beiden vorangehenden Abschnitten, ein äußeres Magnetfeld anlegen und ändern oder die Wände des Behälters verschieben. Im ersten Fall sprechen wir
von magnetischer Arbeit, im zweiten von Volumenarbeit. In all diesen Fällen verändern wir
Parameter λ, die in die Hamiltonfunktion eingehen. Wir können diese Parameter natürlich
schnell verändern oder sehr langsam (“quasistatisch“), insbesondere auch so langsam, daß
stets das System im Gleichgewicht bleibt, welches dann durch das mikrokanonische Ensemble
des abgeschlossenen Systems mit dem augenblicklich vorliegenden Wert der sich (langsam)
ändernden Parameter ist. Solche Parameteränderungen heißen “quasistatisch-reversibel“, da
sie jeder Zeit umkehrbar sind. Bei einer “quasistatisch reversiblen” kurz: adiabatischen Änderung von Parametern λ in einem Hamiltonschen System ändert sich einerseits die Hamiltonfunktion H(q, p, λ) mit λ, andererseits auch die gesamt Energie des mechanischen Systems,
E = E(λ). D.h. bei der Parameteränderung wird Arbeit an dem System, oder von dem
System, geleistet. Wie bestimmt man E(λ) für ein mechanisches System? Im Prinzip hat
man so vorzugehen, daß man die (für festgehaltenes λ) erhaltene Energie des Systems, die
Hamiltonfunktion H(q, p, λ), durch adiabatische Invarianten wie in integrablen Systemen,
die Wirkungsintegrale
Z
1
Ii =
Σfε=1 pε dqε ,
2π Ci
ausdrückt
1
H(q, pλ) = H(I, λ).
Die sich ergebende Funkton E(λ) = H(I, λ) bestimmt die λ-Abhängigkeit der Gesamtenergie. Demzufolge ändert sich bei einer adiabatischen Zustandsänderung die mikrokanonische
Verteilung gemäß
1
%(q, p, λ) =
δ(H(q, p, λ) − E(λ)),
Σ(E(λ), λ)
d.h. es verschieben sich also sowohl die Hamiltonfunktion, als auch die Energie. Dabei gilt
für jeden instantanen Wert von λ die Energieerhaltung in der quasistatischen Form
H(q, p, λ) = E(λ)
1
Wir müssen dies nie wirklich praktisch auch tun. Wichtig ist allein, daß wir dies tun könnten, so daß
E(λ) im Prinzip so definierbar ist.
54
für den jeweiligen instantanen Wert von λ, aber eben mit λ-abhängigem E(λ). Wie ändert
sich die Entropie bei einer adiabatischen Zustandsänderung?
S(λ) = kB ln
mit
Σ(E(λ), λ) =
Also
∂
∂S
kB
dS =
=P
(E(λ), λ)
∂λ
∆E
Σ(E(λ), λ)
CF DN (2πh̄)f
Z
dVΓ δ(H(q, p, λ) − E(λ)).
P
(E(λ), λ)
kB
=
∂λ
Σ(E(λ), λ)
Berechnen wir die Terme der rechten Seite:
∂Σ(E, λ) =−
∂E λ
Z
!
∂Σ ∂E(λ)
∂Σ .
+
∂E λ ∂λ
∂λ E
dVΓ δ 0 (H(q, p, λ) − E)
Z
∂Σ(E, λ) ∂H(q, p, λ)
= + dVΓ δ 0 (H(q, p, λ) − E)
∂λ E
∂λ
Z
∂E(λ)
= dVΓ δ 0 (H(q, p, λ) − E)
.
∂λ
Setzen wir dies ein, so finden wir
dS =
∂S
dλ = 0 ,
∂λ
d.h. die Entropie ändert sich nicht bei adiabatischen Zustandänderungen, sie ist eine adiabatische Invariante. Quasistatisch-reversible Prozesse in thermisch isolierten Systemen verlaufen also mit dS = 0 und heißen “adiabatisch“. Durch Umkehrung der Parameteränderung
können wir die gleiche Folge von Gleichgewichtszuständen in umgekehrter Richtung durchlaufen, wobei die vorher dem System zugeführte Energie nun wieder abgegeben wird. Die
reversible Energieänderung für ein thermisch isoliertes System bei einer Parameteränderung dλ können wir aus der Bedingung dS = 0 berechnen, wenn wir die Entropie aus
S = kB ln Σ(E, V, N, λ) berechnet haben, wobei die Abhängigkeit von λ von der λ-Abhängigkeit der Hamiltonfunktion herrührt. Werden V, N konstant gehalten, so gilt nämlich
0 = dS =
woraus
∂S
∂S
dE +
dλ ,
∂E
∂λ
∂E ∂S = −T
.
∂λ S,V,N
∂λ E,V,N
Wenn insbesondere der Parameter λ mit dem Volumen identifiziert wird, so ändert sich die
Energie durch Volumenarbeit
d− A = −pdV
am System. Der Querstrich an d− A soll daran erinnern, daß die Arbeit vom Weg abhängt,
d− A also nicht das Differential einer Funktion A ist. Für einen adiabatischen Prozeß (dS = 0)
55
ist die Energieänderung dE = d− A = −pdV . In diesem Fall ist also der Druck p definiert
durch
∂E p=−
∂V S,N
und läßt sich bei Kenntnis von S = kB ln Σ(E, V, N ) als Funktion von E, V, N berechnen aus
∂S .
p=T
∂V E,N
Als Beispiel betrachten wir das ideale 1-atomige Gas. Die Volumenabhängigkeit seiner Entropie ist in
V
S = kB N ln + . . .
N
enthalten, woraus sich durch Differentiation
p=
kB N T
V
ergibt, also die bekannte Zustandsgleichung des idealen Gases. Wir können den Druck auch
durch Auswertung der kanonischen Zustandssumme Z aus ln Z berechnen, denn aus
F = E − TS
dF = dE − T dS − SdT
folgt, falls nur T und V variiert werden (also N und alle weiteren λ konstant bleiben)
dF = dE − T
also
∂S
∂S
dE − T
dV − SdT = −pdV − SdT ,
∂E
∂V
∂ ln Z(β, V, N, λ) ∂F = kB T
p=−
∂V T,N,λ
∂V
T,N,λ
und allgemein
∂E ∂S ∂F ∂ ln Z =
−T
=
=
−k
T
.
B
∂λ S,V,N
∂λ E,V,N
∂λ T,V,N
∂λ T,V,N
Können zwei thermisch isolierte Systeme Volumen miteinander austauschen, z.B. über eine
thermisch isolierende aber bewegliche Trennwand, so zeigt eine Betrachtung ganz analog
zum Energieaustausch, daß Σ(E)
∂S1
∂S2
=
∂V1
∂V2
also
p
p
=
T 1
T 2
56
die Gleichgewichtsbedingung ist. Besteht außerdem noch thermischer Kontakt, so gilt im
Gleichgewicht zusätzlich T1 = T2 und es besteht auch ein Druckgleichgewicht p1 = p2 .
Wie stark ein System auf Druckänderungen reagiert wird durch die Kompressibilitäten
adiabatische Kompressibilität
isotherme Kompressibilität
1 ∂V κS = −
V ∂p S
1 ∂V κT = −
V ∂p T
charakterisiert. Weitere Größen, welche die Antwort eines Systems auf Temperaturänderungen charakterisieren, sind neben der schon bekannten Wärmekapazität CV
∂E ∂S CV =
=
T
∂T V,N
∂T V,N
(wegen dE|V,N = T dS|V,N )
die Wärmekapazität bei konstantem Druck
∂H ∂S =
Cp = T
∂T p,N
∂T p,N
(mit der Enthalpie H = E + pV )
und der thermische Volumenausdehnungskoeffizient
1 ∂V αp =
.
V ∂T p,N
Folgende Identitäten lassen sich durch Umrechnung der partiellen Ableitungen herleiten
κT (Cp − CV ) = T V αp2
Cp (κT − κS ) = T V αp2
und daraus
κT
Cp
=
.
CV
κS
Leiten wir als Beispiel die erste der obigen Identitäten ab:
∂E ∂V ∂E ∂H =
+
p
=
+
Cp =
∂T p,N
∂T p,N
∂T p,N
∂T V,N
= CV − V
Nun ist
!
∂E + p αp .
∂V T
∂E +p
∂V T
∂E ∂E ∂E ∂S ∂S =
+
= −p + T
∂V T
∂V S
∂S V,N ∂V T
∂V T
und, gemäß einer “Maxwell-Relation“
∂S ∂ ∂F
∂ ∂F
∂p =−
.
=−
=
∂V T
∂V ∂T
∂T ∂V
∂T V
57
!
∂V ∂T p,N
Also ist
∂p ∂E = −p + T
.
∂V T
∂T V
Aus der Zustandsgleichung V = V (T, p) folgt bei konstantem Volumen
∂V ∂V dV =
dT +
dp = 0 ,
∂T p
∂p T
daß
αp
∂p .
=−
∂T V
κT
Also ist
αp
∂E = −p − T
∂V T
κT
und schließlich
Cp − C V = T V
21
αp2
.
κT
van der Waals Gleichung
Betrachten wir ein klassisches Gas von wechselwirkenden Teilchen mit einem harten Kern
mit Radius a/2 und einer sehr langreichweitigen anziehenden Wechselwirkung −W (|xi − xj |)
und einem harten Kern bei kurzen Abständen a/2. Dichte des Gases und Reichweite der
Wechselwirkung seien so groß, daß immer viele Teilchen untereinander wechselwirken. Die
Zustandsumme ist
Z(T, V, N ) =
1
N !(2πh̄)3N
mit
V (|xi − xj |) =
V
0
Z





d3N pd3N x e
∞
−β
X
p2
i +1
2m
2
i
X
i,j
|xi − xj | ≤ a
V (|xi −xj 1)
.
−W (|xi − xj |) |xi − xj | > a
a
r
Form des Wechselwirkungspotentials in der Herleitung der van der Waals Gleichung
58
Durch Ausführen der Impulsintegrale reduziert sich das Zustandsintegral auf
1 1
Z(T, V, N ) =
N ! λ3N
T
Z
d
3N
xe
− β2
X
i,j
V (|xi −xj |)
mit der thermischen deBroglie Wellenlänge
λT =
2πh̄2
mkB T
!1/2
.
Nun folgen eine Reihe von Näherungen, die qualitativer Natur sind. Ziel ist eine Zustandsgleichung herzuleiten, die qualitativ Vielteilchensysteme im ganzen Bereich zwischen dem
idealen Gas, für geringe Dichte und hohe Temperaturen und Flüssigkeiten, für hohe Dichte
und tiefe Temperaturen beschreibt. Wir führen dazu eine Zelleneinteilung des Gasvolumens
in unterscheidbare Zellen mit Volumen ∆ durch, so daß stets viele Teilchen Nα in jeder Zelle
α sind. Innerhalb jeder Zelle vernachlässigen wir die langreichweitige anziehende Wechselwirkung. Jede Zelle trägt mit einem Faktor
γ(Nα ) = (∆ − Nα δ)Nα
R
zum Integral dq1 . . . dq3N bei, wobei δ das Volumen 4πa3 /3 des harten Kerns ist. Außerdem
Q
gibt N !/ α Nα ! verschiedene Arten N ununterscheidbare Teilchen auf unterscheidbare Zellen
zu verteilen, so daß in jeder Zelle Nα Teilchen sind. Die Ununterscheidbarkeit der Teilchen
wird durch Division mit N ! schon berücksichtigt. Zwischen den Zellen herrscht dann die
P
P
anziehende Wechselwirkung −Wαα0 Nα Nα0 . Wir erhalten (mit 0 . . . = δN,P Nα . . .)
α
Z(T, V, N ) =
0
X
1
1
N!
Q
3N
N ! (λT ) {Nα } α Nα0
Y
α
!
β
γ(Nα ) e 2
P
αα0
Wαα0 Nα Nα!
woraus mit Stirlings Formel wird
Z(T, V, N ) =
mit
φ({Nα }) =
X
α
(
0
1 X
eφ({Nα })
3N
λT {Nα }
∆ − Nα δ
βX
Nα ln
+ Nα +
Wαα0 Nα Nα0
Nα
2 α0
)
.
Die Summen über Nα werden vom großen Term dominiert, wenn die Nα alle groß sind. ExP
trema von φ unter der Nebenbedingung α Nα = N erfüllen mit dem Lagrange-Parameter χ
X
∂
(φ({Nα }) − χ
N α0 ) = 0
∂Nα
0
α
oder
ln
X
∆ − Nα δ
Nα δ
−
+β
Wαα0 Nα0 = χ .
Nα
∆ − Nα δ
α0
Eine räumlich homogene Lösung, welche die Nebenbedingung erfüllt, ist natürlich
Nα = N ∆/V ,
χ = ln
V − Nδ
Nδ
N
−
+ β W0
N
V − Nδ
V
59
mit
W0 =
X
Wαα0 ∆ =
α0
Z
d3 rw(r) .
Die freie Energie im thermodynamischen Limes ist mit n = N/V = 1/v
ln Z(β, V, N )
= −kB T lim φmax /N + 3kB T ln λT (T ) (21.1)
N,V →∞
N,V →∞
N
)
(
β
1 − nδ
= −kB T ln
+ 1 + nW0 + 3kB T ln λT (T ) .
(21.2)
n
2
f (n, T ) = −kB T
lim
Die Zustandsgleichung ergibt sich aus
∂f (n) ∂F =−
p=−
∂V T,N
∂(1/n) T
=
1
nkB T
− n2 W 0 .
(1 − nδ) 2
Diese Zustandsgleichung läßt sich umschreiben in die Form
!
aN 2
p + 2 (V − N b) = N kB T
V
mit a = W0 /2, b = δ und ist als van der Waalsche Zustandsgleichung bekannt. Die hier
gegebene Ableitung stammt von L.S. Ornstein, Doktorarbeit, Leiden 1908. Die Isothermen
im (p, V )-Diagramm zeigt die nächste Figur
0.14
0.12
0.1
kritischer
Punkt
0.08
2
pb /a
Isotherme T/Tc =.85
0.06
0.04
B
0.02
C
D
A
0
2
4
6
8
10
v/b
Isothermen des van der Waals Gases zwischen T /T c = 0.8 und 1.15
Die niedrigste eingezeichnete Isotherme (für T = 0.8Tc ) ist teilweise unphysikalisch, da negative Drucke auftreten, die in der Figur abgeschnitten wurden. Für T < Tc = (8/27)(a/kB b)
haben die Isothermen einen Teil mit (∂p/∂v)T > 0, wo also bei Reduzierung des Volumens
60
der Druck abnimmt, was rein intuitiv auf eine Instabilität hinweist! Unsere räumlich homogene Lösung ist allerdings nur dann korrekt, wenn sie auch wirklich dem absoluten Maximum
von φ (d.h. dem absoluten Minimum) entspricht. Das kann nur dann der Fall sein, wenn
wenigstens ein lokales Maximum von φ vorliegt, d.h. wenn
∂ 2 φmax /V
<0
∂n2
ist, was äquivalent ist zu
∂p(T, n)
∂p(T, v) 2
∂ 2 nf (n, T ) =
=−
v
0<n
2
∂n
∂n
∂v
max
d.h. also zu (∂p/∂v)T < 0. Doch reicht diese Bedingung für ein globales Maximum von φ
noch nicht aus. Denn im Bereich T < Tc gibt es auch bei gleichem Druck inhomogene Lösungen, wo zwei homogene Lösungen aus dem lokal stabilen Bereich räumlich koexistieren. Eine
ausführliche Diskussion im Rahmen der hier betrachteten Herleitung gibt N.G. van Kampen,
Phys. Rev. 135A, 362 (1964). Hier geben wir uns mit einer vereinfachten (aber allgemeiner anwendbaren) Betrachtung zufrieden.Tragen wir zunächst unser bisheriges Ergebnis für
f (N/V, T ) als Funktion von v = V /N für festes T < Tc auf.
Wendepunkte
-0.7
A
B
-0.8
Fb / Na
-0.9
-1
2
4
6
8
v/b
10
12
14
16
Freie Energie F/N des van der Waals Gases für T /T c = 0.85
Aus diesem Diagramm und dem Diagramm der Isothermen p = −∂F/∂V lesen wir ab, daß
F (V ) zwei Wendepunkte hat, welche den Punkten A und B entsprechen, und eine stark
negative Steigung für V → N b und Steigung 0 für V → ∞. Dabei fällt F (V ) für alle
V > N b monoton mit wachsendem V , da p = −∂F/∂V > 0. Damit stets Stabilität gewahrt
ist, ∂p/∂V < 0, sollte ∂p/∂V = −∂ 2 F/∂V 2 < 0 überall gelten, d.h. F sollte eine nach unten
konvexe Funktion sein. Wenn wir 2 koexistierende Lösungen (“Phasen“) im stabilen Bereich
einführen, die nach dem gerade festgestellten 2 verschiedenen Punkten auf dem nach unten
konvexen Teil der F -Kurve entsprechen müssen, also dem Bereich außerhalb des Intervalls
(A, B), so wird die F -Kurve in dem Bereich zwischen diesen Punkten durch die gerade
Verbindungslinie zwischen beiden Punkten ersetzt, da sich in diesem Bereich das Volumen
61
und die freie Energie ändern, indem Teilchen von einer Phase in die anderen übergehen und
es gilt
N1 N2
V =
+
, F = f 1 N1 + f 2 N2 , N = N 1 + N 2 .
n1
n2
Hierbei beziehen sich die Indizes 1, 2 auf die koexistierende Phasen. Elimination von N1 , N2
aus diesen Gleichungen liefert die behauptete lineare Funktion für F im Koexistenzbereich
F =
n1 f1 (n2 V − N ) − n2 f2 (n1 V − N )
.
n2 − n 1
Damit nun längs der gesamten F -Kurve Stabilität herrscht (und in unserer Rechnung φ wirklich maximiert wird) müssen, die beiden koexistierenden Phasen so eingeführt werden, daß
die gesamte F -Kurve nach unten konvex wird. Die entsprechende Konstruktion ist eindeutig
und heißt “Bildung der konvexen Hülle“ der Kurve. Das Ergebnis ist
-0.7
konvexe Hülle
C A
B
-0.8
Fb/Na
D
-0.9
-1
2
4
6
8
10
12
14
16
v/b
Freie Energie F/N des van der Waals Gases für T /T c = 0.85
Per Konstruktion liegt nun F im 2-Phasengebiet unter dem F der 1-Phasenzustände, d.h. die
Koexistenz der beiden Phasen bildet das wahre Minimum von F . Man macht sich leicht klar,
daß die beschriebene Konstruktion im p−V -Diagramm der bekannten Maxwell-Konstruktion
R
äquivalent ist, denn CD pdV über die 1-Phasen-Zustände und die Koexistenzlinie muß gleich
sein, damit in C und D die konvexe Hülle die ursprüngliche F -Kurve berührt. C und D
sind die koexistierenden Phasen, A und B sind die “Spinodalpunkte“ bis zu denen man
höchstens Flüssigkeiten überhitzen (B) und Gase unterkühlen kann (A), bevor endgültig
auch lokal Instabilität (∂p/∂V |T > 0) einsetzt.
62
22
Hauptsätze der Thermodynamik
Wir sind nun in der Lage, die Hauptsätze der Thermodynamik auf statistischer Grundlage
zu formulieren:
0. Hauptsatz
Sind zwei Systeme mit einem dritten im thermischen Gleichgewicht, so sind sie auch
untereinander im thermischen Gleichgewicht. Dieser Satz wurde im “Temperatur“ Abschnitt aus der statistischen Gleichgewichtsbedingung beim thermischen Kontakt zweier Systeme bewiesen: Aus
P
P
∂ ln 1
∂ ln 3
=
∂E1
∂E3
P
P
∂ ln 3
∂ ln 2
=
∂E2
∂E3
folgt trivialer Weise
P
∂ ln
∂E1
1
P
∂ ln 2
=
.
∂E2
1. Hauptsatz (Energiesatz)
Jeder Systemzustand besitzt eine mittlere Energie E, welche in abgeschlossenen Systemen gleich der Gesamtenergie ist und erhalten bleibt. In nicht abgeschlossenen Systemen ändert sich die mittlere Energie sowohl durch Arbeit, die am System geleistet
(positiv gezählt) oder vom System verrichtet (negativ gezählt) wird, als auch durch
Energieübertrag (positiv, falls dem System zugeführt) bei thermischem Kontakt. Der
Energieübertrag bei thermischem Kontakt heißt die übertragene Wärmemenge. Differentiell
dhEi = d− A + d− Q .
Hierbei drückt die Notation d− aus, daß die betreffenden Größen zwar differentiell klein
aber wegabhängig sind, d.h. nicht die Differentiale von Funktionen. Der erste Hauptsatz
drückt nur den Energiesatz aus. Arbeit wird geleistet, wenn Parameter λ, die in die
Hamiltonfunktion eingehen, wie z.B. das Volumen V (Volumenarbeit), Teilchenzahlen
Ni (chemische Arbeit) oder Magnetfeld H (magnetische Arbeit) geändert werden, so
daß sich die Hamiltonfunktion ändert
d− A =
Z
dVΓ (dH(q, p, λ))%(q, p, λ) =
*
∂H
∂λ
+
dλ .
Wärme wird übertragen, wenn sich die Verteilungsfunktion ändert, was auch zu einer
Änderung der mittleren Energie führen kann
−
dQ=
Z
dVΓ H(q, p, λ)d%(q, p, λ) .
Beide Größen zusammen liefern die Änderung der mittleren Energie,
dhEi = d
Z
dVΓ H(q, p)%(q, p) .
63
Im thermischen Gleichgewicht zwischen zwei Systemen ist der Wärmeübetrag reversibel, da Energie bei Schwankungen zwischen beiden Systemen hin- und herfließt. In
diesem Fall ist, ohne Arbeitsleistung, wie wir sahen
dhEi = d− Q = d− Qrev = T dS
mit der Boltzmannschen Entropie
S = kB ln
P
Q (E)
.
Kontrollieren wir, daß die statistische Definition des Wärmeübetrags
R
d− Q = dVΓ H(q, p, λ)d%(q, p, λ)
sich im reversiblen Fall auf T dS reduziert: Ändern wir durch reversiblen Wärmeübertrag die Temperatur um dT , so ändert sich die kanonische Verteilung nicht in ihrer
Form, sondern nur durch Verschiebung der Temperatur um dT , also
d%(q, p)rev
1
∂ ln Z
=
H+
2
kB T
∂β
!
e−βH
dT .
Z
Mit ∂ ln Z/∂β = −hEi ergibt sich daraus
−
d Qrev =
Z
1
dT (hE 2 i − hEi2 ) = CV dT
kB T 2
∂E = dE|V =const =
dS = T dS ,
∂S V
dVΓ Hd%(q, p)rev =
womit die Kontrolle durchgeführt ist.
Wird zusätzlich am System reversibel quasistatisch Arbeit verrichtet, wird, wie wir
sahen, die Entropie dadurch nicht zusätzlich verändert, und entsprechend dem ersten
Hauptsatz gilt
dhEi = T dS + d− Arev
Liegt kein Gleichgewicht vor, und auch bei nicht quasistatischer Arbeitsleistung, nimmt
S = kB ln ΣQ (E) durch Vergrößerung des erreichbaren Phasenraumvolumens zusätzlich
irreversibel zu, d.h.
dS =
1
d− Qrev
d− Q
dhEi − d− Arev =
>
T
T
T
oder kurz
d− Qrev > d− Q .
Entsprechend gilt d− Arev < d− A, da d− Arev + d− Qrev = dE = d− A + d− Q. Diese statistisch
begründeten Aussagen machen zusammen den 2. Hauptsatz aus, der den zentralen
Kern der Thermodynamik bildet und lautet:
2. Hauptsatz
Jedem Systemzustand ist eine Funktion zugeordnet, die Entropie S, mit den Eigenschaften
(a) Bei reversiblem Wärmeaustausch ist dS = d− Qrev /T
64
(b) Bei beliebigem Wärmeaustausch ist dS ≥ d− Q/T und nimmt insbesondere in
abgeschlossenen Systemen (d− Q = 0) zu oder bleibt gleich.
Schließlich gibt es eine letzte allgemeine Eigenschaft der Entropie, die zusammengefaßt
wird im sogenannten
3. Hauptsatz
Für T → 0 strebt die Entropie gegen eine von Details des Systems unabhängige Konstante s0 :
S(T )
= s0 .
lim lim
T →0 N →0 N
Diese Aussage folgt ebenfalls unmittelbar aus der statistischen Definition der Entropie.
Dazu müssen wir bedenken, daß der Grenzfall T → 0 der gleiche Grenzfall ist, in dem
die Energie E des Systems gegen die Energie E0 des Grundzustands strebt
T → 0 ⇐⇒ E → E0 .
Ist der Grundzustand nicht entartet, so ist
s0 = s(E0 ) = +kB ln 1 = 0 .
Nun kann allerdings in Vielteilchensystemen der Grundzustand durchaus entartet sein
(mit Entartungsgrad g(E0 )) und
s0 = kB ln g(E0 ) .
Doch ist der Entartungsgrad in der Regel keine exponentiell mit der Teichenzahl wachsende Funktion, sondern typisch wäre g(E0 ) < KN α mit von N unabhängigen Exponenten α und Konstanten K, die vom System abhängen. Also ist
S
1
< kB lim
(α ln N + ln K) = 0 .
T →0 N →0 N
N →∞ N
0 < s0 = lim lim
Daher gilt auch in diesem Fall s0 = 0.
Schließlich kann noch der Fall eintreten, wo das System Freiheitsgrade besitzt, die so
schwach an andere Freiheitsgrade gekoppelt sind, daß diese selbst bei den kleinsten
erreichten Temperaturen noch nicht ordnen und daher eine endliche Entropie liefern,
die im thermodynamischen Limes proportional zur Teilchenzahl ist. Ein Beispiel sind
die Spins von Atomkernen, welche z.B. in einem Festkörper noch völlig ungeordnet
sein können, wenn schon alle anderen Freiheitsgrade (z.B. die Position der Atome im
Kristallgitter, die Richtung der Elektronenspins) geordnet sind. Die von solchen Freiheitsgraden herrührende Restentropie s0 6= 0 ist dann aber universell für das System,
da sie von allen anderen Freiheitsgraden, die geordnet sind, nicht mehr abhängt. Außerdem ist anzunehmen, daß auch diese Restentropie bei noch weiterer Abkühlung
ebenfalls verschwindet.
65
23
Thermodynamische Prozesse
In diesem Abschnitt betrachten wir mit Hilfe der Hauptsätze der Thermodynamik und einiger Zustandsgleichungen für die verwendeten Materialien einige charakteristische thermodynamische Prozesse. Einige davon (Joule-Thomson Prozeß, Carnot-Prozeß, adiabatische
Entmagnetisierung) sind für Kühlverfahren bzw. deren Umkehrung-Wärmepumpen (z.B.
bei der Schwimmbadheizung) von praktischem Interesse.
23.1
Joulsches Experiment der freien Expansion eines Gases
Wir betrachten ein Gas, das durch eine Trennwand auf einen Teil eines Behälters eingeschränkt sei. Der gesamte Behälter sei gegenüber der Außenwelt isoliert. Wir analysieren
nun die Zustandsänderung des Gases, die eingetreten ist, falls es nach Öffnen eines Ventils
in den Rest des Behälters irreversibel ausgeströmt ist. (Gay-Lussac 1807, Joule 1843). Der
betrachtete Prozeß ist weder quasistatisch noch reversibel. Da der Behälter thermisch isoliert ist, gilt ∆Q = 0, also ist ∆S ≥ ∆Q = 0 positiv. Da das System abgeschlossen ist,
gilt für die Energieänderung zwischen Anfangs- und Endzustand ∆E = 0. Betrachten wir
zunächst nur eine differentielle Zustandsänderung der beschriebenen Art, d.h. das zusätzliche Volumen, in welches das Gas ausströmen kann, sei differentiell klein. Dann gilt für die
Temperaturänderung zwischen Anfangs- und Endzustand
∂T dV .
dT =
∂V E,N
Der Proportionalitätsfaktor soll durch die Zustandsgleichung des Gases ausgedrückt werden.
Aus
∂E ∂E dE =
dT +
dV = 0 (abgeschlossenes System)
∂T V
∂V T
gewinnen wir die Aussage
∂T 1 ∂E =−
.
∂V E,N
CV ∂V T,N
Ferner gilt wegen dE = T dS − pdV
∂E ∂S =T
−p.
∂V T,N
∂V T,N
Schließlich nutzen wir aus, daß ∂S/∂V |T,N proportional zu einer gemischten 2. Ableitung der
freien Energie F (T, V, N ) ist
∂ 2 F ∂2F
∂S =
−
=−
∂V T,N
∂V ∂T N
∂T ∂V
N
∂p =
.
∂T V,N
Thermodynamische Relationen dieses Typs heißen “Maxwell Relationen”. Listen wir noch
einige auf:
∂ 2 F ∂2F
=
∂V ∂T N
∂T ∂V
:
N
∂S ∂p =
∂V T,N
∂T V,N
66
∂2E
∂S∂V
∂2E
∂T ∂V
N
N
∂ 2 E ∂p ∂T =
=
:−
∂V ∂S N
∂S V,N
∂V S,N
∂ 2 E :
=
∂V ∂T N
∂S ∂2S
+T
∂V T,N
∂T ∂V
2
∂ S
∂T ∂V
bzw. T
N
V,N
!
=
=
∂p ∂CV
−
=
∂T V,N
∂V
∂CV
∂V
=
N
∂ p ∂T 2 2
bzw. T
∂CV
∂V
T,N
T,N
T,N
usw. Wir erhalten also für den Ausströmungsversuch ins Vakuum
∂T 1
=
∂V E,N
CV
∂p
p−T
∂T
V,N
−T 2 ∂
CV ∂T
p
T
.
V,N
Für ein ideales Gas ist p/T = N kB V unabhängig von T bei festem N, V . Daher liefert der
Ausströmungsversuch keine Temperaturänderung für ein ideales Gas, im Einklang damit, daß
E = N cv T gilt, also T = E/N cv unabhängig von V für festes E. Physikalisch rührt dies von
der fehlenden Wechselwirkung zwischen den Gasatomen her, die ihre Energie unabhängig von
ihrem mittleren Abstand macht. Die Entropie des idealen Gases nimmt bei diesem Prozeß
wie schon früher erwähnt stark zu, nämlich um dS = (∂S/∂V )E dV = Tp dV = NVkB dV .
Für ein van der Waals Gas ist
p
N kB
aN 2
=
−
T
(V − N b) V 2 T
also
und
∂
∂T
p
T
=
V,N
aN 2
V 2T 2
∂T aN 2
=− 2
.
∂V E,N
V CV
Die Volumenabhängigkeit der spezifischen Wärme CV des van der Waals Gases (oberhalb
von dessen kritischen Punkt) gewinnen wir ebenfalls aus seiner Zustandsgleichung als
∂CV
∂V
=T
T,N
∂2p
= 0.
∂T 2
d.h. die Wärmekapazität des van der Waals Gases ist wie beim idealen Gas von seiner
Teilchenzahl, nicht aber von seinem Volumen abhängig. Für den Ausströmungsversuch in
ein endliches Volumen ∆V können wir die Temperaturänderung durch Integration über V
mit CV = const bestimmen zu
∆T =
−aN 2
∆V
.
CV V (V + ∆V )
67
Bei einem wirklichen Versuch ist die Temperaturänderung geringer wegen der endlichen
Wärmekapazität CB des Behälters. Die gesamte Energieänderung ist dann
dE =
!
∂E ∂E + CB dT +
dV = 0 ,
∂T V
∂V T
d.h. in den bisherigen Beziehungen ist zu ersetzen
CV → C V + C B
was ∆T verringern wird.
23.2
Joule-Thomson-Prozeß
Die kontrollierte Entspannung eines thermisch isolierten Gases von einem Druck p1 auf einen
kleineren Druck p2 durch eine Drossel, d.h. eine poröse Trennwand, heißt Drosselpropzeß,
oder Joule-Thomson-Prozeß. Schematisch läuft der Prozeß wie folgt ab
Drossel
p1, T1
p2, T2
Joule-Thomson Prozeß
Auch dieser Prozeß ist weder quasistatisch, da er im allgemeinen bei endlicher Druckdifferenz
abläuft, noch reversibel. Die Arbeit und damit die Energie, welche pro Mol des umgesetzten
Gases dem System zugeführt wird, ist
∆a = +p1 v1 − p2 v2 = e2 − e1 ,
wobei die molaren extensiven Größen durch kleine Buchstaben symbolisiert sind, und das
Volumen des Gases links um |v1 | abnimmt, rechts um |v2 | zunimmt. Also ist bei dem Prozeß
die Zustandsfunktion H = E + pV pro umgesetztes Mol konstant. H heißt Enthalpie. Es ist
eine Legendre-transformierte Energie mit dem Differential
dH = dE + pdV + V dp = T dS − pdV + pdV + V dp = T dS + V dp .
Die natürlichen Variablen von H sind daher S, p und N . Die Temperaturänderung beim
Joule-Thomson-Prozeß bei differentiellem Druckunterschied p1 − p2 = −dp > 0 bestimmt
sich aus
∂H ∂H dH =
dT +
dp = 0 .
∂T p
∂p T
Wegen dH = T dS + V dp ist
∂S ∂H =T
= Cp .
∂T p
∂T p
68
Außerdem ist (∂H/∂p)T = T (∂S/∂p)T + V = −T (∂V /∂T )p + V , wobei die Maxwellsche
Relation (∂S/∂p)T = −(∂V /∂T )p benutzt wurde. Zusammengenommen erhalten wir
T 2 ∂V /T ∂T =
.
∂p H
Cp ∂T p
Für ein ideales Gas gilt also
∂T =0,
∂p H
d.h. die Temperatur eines idealen Gases ändert sich beim Drosselprozeß nicht. Dagegen
nimmt die Entropie auch bei diesem Prozeß zu um
V
|dp|
∂S dp = − dp = N kB
.
dS =
∂p H
T
p
Daran erkennen wir die Irreversibilität des Prozesses. Denn d− Q = 0 ist ja erfüllt, und wäre
der Prozeß reversibel, dann wäre 0 = d− Q = d− Qrev = T dS. Für ein van der Waals Gas findet
man mit der Annahme CV = (3/2)N kB

∂T 1  2a
=
∂p H
kB kB T
V − Nb
V
!2


5
−3a
− b /  −
2 kB T V
V − Nb
V
!2 

.
Für kleine Dichten N/V kB T /a, N/V b−1 vereinfacht sich dies auf (∂T /∂p)H '
(4a/kB T − 2b)/5kB . Für kleine Temperaturen kB T < b/2a ist (∂T /∂p)H > 0 und der Drosselversuch führt zur Kühlung. Allerdings wechselt der Koeffizient bei hohen Temperaturen
b 2
T > Tinv = (2a/kB b), genauer kB Tinv = 2a
( V −N
) , oder mit nochmaligem Gebrauch der
b
V
van der Waals Gleichung
2
p=
b
s
2akB Tinv
3 kB Tinv
a
−
− 2,
b
2 b
b
sein Vorzeichen, und beim Drosselversuch tritt Erwärmung ein. Der maximale Druck, bei
dem Inversion eintritt wird, bei
max
kB Tinv
=
8a
9b
2
erreicht und beträgt pmax
inv = a/3b .
Die Inversion des Joule-Thomson-Kühleffekts bei hohen Temperaturen wird wirklich bemax
max
max
obachtet (für CO2 gemessen: Tinv
= 1500K, Tinv
|vdw = 911K; für H2 : Tinv
= 202K
max
Tinv |vdw = 99K. Der Joule-Thomson-Prozeß wird zur technischen Verflüssigung von Gasen
(nach Vorkühlung unter die Inversionstemperatur) verwendet.
23.3
Adiabatische Entspannung von Gasen
Ein Gas wird in einem thermisch isolierten Behälter quasistatisch entspannt, wobei es reversibel Arbeit leistet. Bei diesem Prozeß ist die Entropie konstant da 0 = d− Q = d− Qrev = T dS
und die Energie nimmt ab
dE = −pdV .
69
Die Temperaturänderung ergibt sich aus
∂S ∂S dS =
dT +
dp = 0 (adiabatischer Prozeß) ,
∂T p
∂p T
also
∂T T ∂S T ∂V =−
=+
.
∂p S
Cp ∂p T
Cp ∂T p,N
Für ein ideales Gas liefert dies
N kB T
∂T =+
∂p S
Cp p
was integriert die Adiabatengleichungen ergibt:
T
=
T0
p
p0
! N kB
Cp
,
p
p0
V
=
V0
! N kB −1
Cp
T
=
T0
1− NCkp
B
,
die mit der aus der Zustandsgleichung folgenden Relation Cp − CV = N kB noch auf verschiedene andere Formen gebracht werden können. Für ein van der Waals Gas oberhalb
der kritischen Temperatur ist (∂V /∂T )p,N > 0 und adiabatische Entspannung führt zur
Abkühlung.
23.4
Adiabatische Entmagnetisierung
Ein paramagnetisches Salz wird im äußeren Magnetfeld bei fester Temperatur T0 magnetisiert, dann thermisch isoliert und quasistatisch entmagnetisiert, indem das äußere Magnetfeld langsam bis auf 0 zurückgefahren wird. Bei diesem letzteren Prozeß ist wiederum
dS = 0 und es gilt
∂S ∂S dS =
dT +
dH = 0 .
∂T H
∂H T
Der Prozeß und die Berechnung des Temperaturkoeffizienten (∂T /∂H)S sind weitgehend
analog zur adiabatischen Entspannung eines Gases. Wir erhalten analog zu dort mit dE =
T dS − hM idH
∂T T ∂S T ∂hM i =−
=−
.
∂H S
CH ∂H T
CH ∂T H,N
Für ein paramagnetisches Salz dessen Magnetisierung hM i dem Curieschen Gesetz genügt
hM i =
finden wir
wobei nach (18.1)
ND
H ,
T
∂T DH
>0,
=+
∂H S
cH (T, H)T
cH (T, H) = cV (T, 0) +
70
N DH 2
.
T2
Adiabatische Entmagnetisierung von elektronischem Paramagnetismus kann als Vorkühlmethode verwendet werden, um dann im 2. Schritt ein vorgekühltes System mit Kernspinparamagnetismus ebenfalls adiabatisch zu entmagnetisieren.
Ein qualitatives mikroskopisches quantenmechanisches Bild der beiden Prozesse isotherme Magnetisierung – adiabatische Entmagnetisierung, sieht wie folgt aus: Ein paramagnetisches Salz von (praktisch wechselwirkungsfreien) Atomen z.B. mit Spin J = 3/2 hat bei
hoher Temperatur T0 und kleinem Magnetfeld H0 vier praktisch gleich besetzte Energieniveaus pro Atom (a) .
e
(a)
e
(b)
S = const.
T = const.
P(h)
T, H
(c)
e
P(h)
T, H’>H
P(h)
T’<T, H
Kühlung durch isotherme Magnetisierung und adiabatische Entmagnetisierung
Bei isothermer Magnetisierung steigen die Abstände der Niveaus und es bildet sich bei gleicher Temperatur eine Boltzmann-Verteilung mit schwächerer Besetzung der höheren Niveaus
aus (b). Adiabatische Entmagnetisierung bedeutet Reduzierung von H ohne Änderung der
Besetzung der Niveaus (c). Es resultiert eine Boltzmann-Verteilung mit T1 < T0 .
23.5
Thermodynamische Kreisprozesse
Thermodynamische Kreisprozesse sind Sequenzen von Zustandsänderungen, bei denen der
Endzustand des Systens mit seinem Anfangszustand übereinstimmt. Bei einem thermodynamischen Kreisprozeß gilt für alle Zustandsgrößen Z wie z.B. Energie E, Entropie S, Volumen
V , Teilchenzahl N , Temperatur T , Druck p, freie Energie F , Enthalpie H, Magnetisierung
M etc. daß
I
dZ = 0 ,
wobei das Integral der Änderungen der Zustandsgrößen über den durchlaufenen Kreisprozeß
zu erstrecken ist. Zwei Kreisprozesse, die nicht existieren, sind gerade deshalb besonders
wichtig: Das Perpetuum
mobile 1. Art ist ein Kreisprozeß ohne Wärmeaustausch,
d− Q = 0,
H −
H
H
der Arbeit leistet, − d A > 0. Das ist unmöglich, da für d− Q = 0 gilt d− A = d− E = 0. Ein
Perpetuum mobile H2. Art ist
ein Kreisprozeß,
der ein Wärmereservoir abkühlt und Arbeit
H −
H −
−
leistet, also
0 < −H d A = (d HQ − dE) = dHQ. Er ist unmöglich, da nach dem 2. HauptH
satz 0 = dS > d− Q/T = T1 d− Q, woraus d− Q < 0 folgt. Ein spezieller auch technisch
wichtiger Kreisprozeß ist der bekannte Carnot-Prozeß, mit dessen Hilfe durch allmähliche
71
Abkühlung eines heißen Wärmereservoirs und Erwärmung eines kühleren Wärmereservoirs
von einem komprimierbaren und expandierbaren System Arbeit geleistet werden kann. Ein
Zyklus dieses Prozesses besteht aus 4 Phasen: Zuerst wird das System bei der kühleren Temperatur T1 unter Zufuhr von Arbeit ∆A1 isotherm komprimiert, sodann thermisch isoliert
und unter weiterer Zufuhr von Arbeit ∆A2 adiabatisch komprimiert solange bis es sich auf
die Temperatur T2 des heißeren Wärmereservoirs erwärmt hat, dann wird es im thermischen
Kontakt diesem zweiten Wärmebad bei der Temperatur T2 isotherm entspannt, wobei es
die Arbeit −∆A3 leistet und schließlich wieder thermisch isoliert und unter weiterer Arbeitsleistung −∆A4 adiabatisch auf sein ursprüngliches Volumen und seine ursprüngliche
Temperatur T1 expandiert. Die gesamte geleistete Arbeit ist
−∆A = −
I
d− A =
4
X
∆Ai .
i=1
Von technischem Interesse ist der Wirkungsgrad η dieses Prozesses, der definiert ist als
das Verhältnis insgesamt der geleisteten Arbeit −∆A zur Wärmeenergie ∆Q2 , die bei der
höheren Temperatur T2 (während der isothermen Expansionsphase) aufgenommen wurde.
Da während der isothermen Kompression eine Wärmemenge −∆Q1 an das kühlere Wärmereservoir abgegeben wird, kann −∆A nicht so groß werden wie ∆Q2 , sondern es gilt, weil es
sich um einen Kreisprozeß handelt,
∆E =
I
dE = ∆A + ∆Q1 + ∆Q2 = 0
also
η=
−∆A
∆Q1
= 1+
.
∆Q2
∆Q2
Die Existenz der Entropie als Zustandsgröße erlaubt es, eine universelle obere Grenze für
η abzuleiten, die als Carnotscher Wirkungsgrad ηc bekannt ist. Sind nämlich sämtliche Zustandsänderungen quasistatisch und reversibel, so gilt während der adiabatischen Phasen
des Prozesses
0 = d− Q = d− Qrev = T dS
und während der isothermen Phasen des Prozesses
∆Q1,2 = T1,2 ∆S1,2
und, wegen ∆S = 0 für den Kreispropzeß, ∆S1 = −∆S2
∆Q1
T1
=−
∆Q2
T2
also
T1
T2
unabhängig von der Arbeitssubstanz! Ein realer Prozeß läuft natürlich nicht quasistatisch
und reversibel. In den wärmeisolierten Phasen des Prozesses gilt dann
ηc = 1 −
0 = d− Q < T dSis
72
und während der isothermen Phasen
∆Q1,2 < T1,2 ∆S1,2 .
Aus der Bedingung ∆Sis + ∆S1 + ∆S2 = 0 mit der Entropiezunahme ∆Sis > 0 während der
wärmeisolierten Phase, folgt nun
∆Q1 ∆Q2
+
< ∆S1 + ∆S2 = −∆Sis < 0
T1
T2
und daher, wegen ∆Q2 > 0, T1 > 0
∆Q1 ∆Q2
+
< 0,
T1
T2
also
η =1+
∆Q1
T1
<
∆Q2
T2
∆Q1
T1
<1−
= ηc .
∆Q2
T2
Bekanntlich kann man den Carnotschen Wirkungsgrad für ein ideales Gas als Arbeitssubstanz auch ohne Einführung der Entropie explizit leicht ausrechnen. Die Existenz der Entropie als zusätzliche Zustandsgröße folgt dann rein phänomenologisch aus der phänomenologischen Formulierung des 2. Hauptsatzes als Unmöglichkeit eines perpetuum mobiles 2. Art:
es gibt keine periodisch arbeitende Maschine (Kreisprozeß), die nichts anderes bewirkt, als
die Abkühlung eines Wärmereservoirs und das Leisten von Arbeit.
Denn nach diesem Satz muß zum einen jeder reversible Kreisprozeß zwischen T1 und T2
genau den Carnotschen Wirkungsgrad haben, andernfalls könnte man ein perpetuum mobile
2. Art bauen, indem man den besseren Prozeß Arbeit leisten läßt und mit dem umgekehrt
geschalteten Carnot-Prozeß die Wärme −∆Q1 ins heißere Wärmebad zurückpumpt (d.h.
man benutzt in diesem Fall den Carnot-Prozeß zur Kühlung des kühleren Reservoirs (Kühlschrank!) und zur Heizung des wärmeren Reservoirs (Schwimmbadheizung mit Wärmepumpen)). Zum andern kann man jeden Kreisprozeß in infinitesimale Carnot-Prozesse zerlegen
oder jedenfalls zerlegt denken.
p
Adiabaten
Isothermen
V
Beliebiger Kreisprozeß überdeckt von Carnot-Prozessen
73
H
Für jeden kleinen Carnot-Prozeß gilt aber dS = 0. Nimmt man alle Carnot-Prozesse zusammen, so heben sich die inneren Beiträge weg und es bleibt nur noch das Integral über
dem ursprünglichen beliebigen Kreisprozeß, für den also gelten muß
I
dS = 0
mit einer Zustandsfunktion S, deren Differential definiert ist durch
d− Qrev
.
T
Diese Beziehung ist fundamental, sie ist aber mit viel Verstand zu benutzen. Sie besagt
nicht, daß dS nur für reversible Zustandsänderungen, an deren Anfang und Ende thermodynamische Gleichgewichtszustände liegen, definiert ist. Tatsächlich is dS für beliebige
Zustandsänderungen definiert. Sie besagt stattdessen: Um dS für eine beliebige irreversible Zustandsänderung mit beliebigem d− Q zu bestimmen, führe man zum Vergleich eine
Zustandsänderung mit dem gleichen Ergebnis auch reversibel durch und messe (oder berechne) die dabei aufgenommene Wärmemenge d− Qrev . Tatsächlich ist d− Qrev > d− Q. Dann ist
dS = d− Qrev /T , also dS > d− Q/T .
dS =
24
Chemisches Potential und
Gibbssche freie Enthalpie
Auch die Teilchenzahl N (oder Ni in mehrkomponentigen Systemen) ist ein Parameter, der
von außen änderbar ist. Dies geschieht, wenn zwei Systeme miteinander Teilchen derselben
Sorte austauschen können, z.B. durch eine Membran. Die Größe
∂E µi =
∂Ni S,V
heißt chemisches Potential der Teilchensorte i. Da die Teilchenzahlen Ni Beispiele für die
∂S Parameter λ des §20 sind, gilt insbesondere (wegen 0 = dS = dE
dN )
+ ∂N
T
E,V
µi = −T
∂S ∂Ni =
E,V
∂F ∂Ni T,V
= −kB T
∂ ln Z ∂Ni .
T,V
Damit kennen wir nun auch die Ableitung der Entropie nach ihren letzten natürlichen Variablen Ni und es gilt die fundamentale Relation für dS
dS =
1
p
1X
dE − dV −
µi dNi .
T
T
T i
Die Entropie ist extensiv, d.h. eine homogene Funktion ersten Grades ihrer natürlichen
Variablen E, V, Ni . Es gilt daher auch die Eulersche Gleichung für homogene Funktionen
ersten Grades
X ∂S
∂S
∂S
E+
V +
Ni
S=
∂E
∂V
i ∂Ni
X µi
E
p
= + V −
Ni .
T
T
i T
74
Insbesondere für einkomponentige Systeme, wo nur ein µ auftritt, können wir nach µ auflösen
µ=
E
pV
TS
+
−
.
N
N
N
(24.1)
Die Funktion
G = E + pV − T S = F + pV
heißt Gibbssche freie Enthalpie (im Unterschied zur Enthalpie H = E + pV ). Sie entsteht
durch eine zweifache Legendre-transformation aus E(S, V, N ), welche ihre natürlichen Variablen T , p einführt, neben der Variablen N . Doch ist die Abhängigkeit von N trivial,
da G extensiv, N extensiv und T, p intensiv sind. Also ist notwendig G = N f (p, T ) für
einkomponentige Systeme und
G
= µ(T, p) .
µ=
N
Speziell für das ideale einatomige Gas erhalten wir
3kB 3
5
ln
µ = kB T (1 − ln kB T ) + kB T ln p − T s00 +
2
2
2
!
.
Im Falle des Vorliegens von mehreren Komponenten Ni gilt mit G = E + pV − T S für die
Gibbssche freie Enthalpie
X
G=
µi N i .
i
Die Bildung des Differentials von G
dG = dE + pdV + V dp − T dS − SdT =
liefert mit der Relation
T dS = dE + pdV −
X
X
(µi dNi + Ni dµi )
i
µi dNi
i
das Differential von G(T, p, N )
dG = −SdT + V dp +
X
µi dNi
i
sowie die Gibbs-Duhem Relation
0 = SdT − V dp +
X
Ni dµi .
i
Insbesondere für einkomponentige Systeme liefert die Gibbs-Duhem Relation
S
∂µ =−
∂T p
N
,
∂µ V
.
=
∂p T
N
Als kleine Anwendung berechnen wir die Entropie eines einatomigen idealen Gases als Funktion von Druck und Temperatur
5
∂µ = N kB ln T − kB N ln p + N s0
S = −N
∂T p 2
75
mit der sog. Entropiekonstanten für ein einatomiges Gas
5
3
s0 = s00 + kB ln kB + kB ln 3/2
2
2
5/2
(ekB ) (2πm)3/2
= kB ln
.
(2πh̄)3
∂S
mit unserem früheren
Für ein Gemisch idealer Gase liefert die Beziehung µi = −T ∂N
i E,V
Ergebnis für S
X
3 E
Ni
V
0
Ni ln X
S = kB N ln + ln + s0 + kB
N
2 N
Nk
i
k
nach Einsetzen der mittleren Masse m =
nach Ni
Q
j
mj c j , c j = N j /
P
k
Nk in s00 und Differentiation
5
Ni
3
ln E/N + s00i ) + kB T + kB T ln
2
2
N
Ni
.
= µi0 (T, P ) + kB T ln
N
µi = −kB T (ln V /N +
Die letzte Beziehung folgt nach Einsetzen der Zustandsgleichugen
3
E = N kB T
2
,
V = N kB T /p
und unter Verwendung der Bezeichnung µi0 (T, p) für das chemische Potential der reinen
Gaskomponente i bei gleichem Druck und gleicher Temperatur. Interessant ist, daß die (temperaturunabhängige) Mischungsentropie pro Teilchen −kB ln Ni /N das chemische Potential
jeder Komponente verändert, und zwar stets proportional zur Temperatur absenkt.
25
Gleichgewichtsbedingungen
als Extrema von thermodynamischen Potentialen
Betrachten wir den ersten Hauptsatz in einem p − V System
dE = −pdV + d− Q
und die allgemeine Formulierung des zweiten Hauptsatzes
T dS > d− Q
zusammen
T dS > dE + pdV .
(25.1)
Dann sehen wir, daß in abgeschlossenen Systemen (V = const , E = const ) nur solche
Prozesse ablaufen, bei denen die Entropie zunimmt, dS > 0. Insbesondere ist im thermodynamischen Gleichgewicht in solchen Systemen dann
S = max
(E, V = const ) .
76
Ist dagegen das System im thermischen Kontakt mit einem Wärmebad der Temperatur T ,
so ist T = const , V = const die relevante Nebenbedingung und die Ungleichung (25.1) kann
in die Form
d(E − T S) ≡ dF > 0
also
F = min
(T, V = const )
gebracht werden. Also nimmt die freie Energie in einem System mit T , V = const solange
ab, bis das (absolute) Minimum von F zu gegebenem T , V erreicht ist, wo das System im
Gleichgewicht ist.
Ist schließlich das System im Temperatur- und Druckgleichgewicht mit der Umgebung, so
ist p, T const. und (25.1) reduziert sich auf
d(E + pV − T S) ≡ dG < 0
d.h. die Gibbssche freie Enthalpie ist im Gleichgewicht bei p, T = const minimal
G = min
26
(p, T = const )
Gleichgewicht unter Energie- und Teilchenaustausch
Die Gleichgewichtsbedingungen lauten in diesem Fall
∂S2 ∂S1 =
∂E1 V1 ,N1
∂E2 V2 ,N2
und
∂S1 ∂S2 =
,
∂N1 E1 ,V1
∂N2 E2 ,V2
woraus T1 = T2 und µ1 = µ2 für alle Teilsysteme 1, 2, die am Austausch beteiligt sind,
folgt. Eine Anwendung ist die Osmose, bei der 2 Teilsysteme A, B im Temperaturgleichgewicht durch eine Membran die Moleküle eines Lösungsmittels (1), z.B. H2 O, frei austauschen
können, nicht aber die größeren Moleküle des gelösten Stoffes (2). Es gilt also im Gleichgewicht für das dynamische Potential des Lösungsmittels
(A)
(B)
µ1 (T, p(A) ) = µ1 (T, p(B) ) ,
(26.1)
während das chemische Potential des gelösten Stoffes in den beiden getrennten Teilen des
Systems verschieden ist. Sei z.B. im Teilsystem (A) eine verdünnte Lösung vorhanden, für die
das chemische Potential des Lösungsmittels nur durch den Mischungsterm vom chemischen
Potential des reinen Lösungsmittels abweicht.
(A)
µ1 (T, p(A) , c1 ) ' µ10 (T, p(A) ) + kB T ln c1 .
Sei weiter im Teilsystem (B) nur das reine Lösungsmittel vorhanden
(B)
µ1 (T, p(B) ) = µ10 (T, p(B) ) .
77
(26.2)
Aus der Gleichgewichtsbedingung erhalten wir für c1 = 1 − c2 , c2 1 durch Taylorentwicklung nach den kleinen Größen p(A) − p(B) , c2 bis zum Glied erster Ordnung
(p
(A)
−p
(B)
∂µ10 ) (A) − kB T c2 = 0 .
∂p
T
Aus der Gibbs-Duhem Gleichung entnehmen wir
∂µ10 V (A)
,
=
∂p(A) T
N1
woraus wir mit c2 = N2 /N für den osmotischen Druck
pos = pA − pB =
N2 kB T
V (A)
erhalten. Die gelösten Teilchen erzeugen also in einer Lösung einen zusätzlichen Druck, den
osmotischen Druck, der speziell in einer stark verdünnten Lösung gerade gleich dem entsprechenden Druck eines idealen Gases aus den gelösten Teilchen bei gleicher Teilchendichte
und Temperatur ist. Osmotische Druckdifferenzen sind besonders in biologischen Systemen
allgegenwärtig.
-----------------
Massendichte
mn = n1 m1 + n2 m2
h = p / (mng)
-------------------
A
B
c1
c1 = 1
c2
Semipermeable Membran (durchlässig für 1)
Osmotischer Druck in einem System im Schwerefeld
27
Chemische Reaktionsgleichgewichte
und Massenwirkungsgesetz
Betrachten wir nun Umwandlungen von Atomen oder Molekülen in chemischen Reaktionen,
z.B.
− νA A − νB B *
) νC C + ν D D .
Die νi sind ganze Zahlen und heißen stöchiometrische Koeffizienten, die wir links negativ
und rechts positiv zählen werden, da wir annehmen, daß die Reaktion von links nach rechts
78
verläuft (A, B verschwinden, C, D entstehen), bevor ein chemisches Gleichgewicht besteht, in
dem sich die mittleren Konzentrationen cA , cB , cC , cD nicht mehr ändern. Für jede chemische
Reaktion definieren wir eine eigene Reaktionslaufzahl ξ. Bei Änderung von ξ um +1 sollen
gemäß der Reaktion νi -Mole des Stoffes i entstanden (νi > 0) oder verschwunden (νi < 0)
sein, also mit der Loschmidtschen Zahl L
dNi = νi Ldξ .
(27.1)
Im folgenden wird immer Druck- und Temperaturgleichgewicht angenommen. Die Wärmetönung ∆qp der Reaktion bei konstantem Druck ist dann die Wärmeenergie bezogen auf die
Teilchenzahl, die man zuführen (∆qp > 0 endotherm) oder abführen (∆qp < 0 exotherm)
muß, um bei ∆ξ = 1 die Temperatur konstant zu halten. Die Gleichgewichtsbedingungen
für das chemische Gleichgewicht (bei p, T konstant) folgen aus G = min unter einer Nebenbedigung (27.1) für jede chemische Reaktion. Dies liefert für jede Reaktion
X
i
X ∂G
∂G
dNi =
νi Ldξ = 0 ,
∂Ni
i ∂Ni
woraus wir folgern, daß für jede Reaktion im Gleichgewicht gilt
X
ν i µi = 0 .
(27.2)
i
Werten wir diese Relationen für ideale Mischungen (Reaktionen in idealen Gasen oder
verdünnten idealen Lösungen) aus: Für die Wärmetönung bei konstantem Druck können
wir den 1. Hauptsatz anwenden. Für ideale Mischungen ist die Energieänderung
∆E =
X
i
νi ei L∆ξ = L(∆qp − p
X
νi vi )∆ξ .
i
Wir schreiben hier auf die Teilchenzahl bezogene Größen ei , vi klein. Auf der rechten Seite der Energiebilanz muß außer der Wärmetönung auch die wegen p = const zugeführte
Volumenarbeit berücksichtigt werden. Wir lösen nach ∆qp auf und erhalten
∆qp =
X
νi hi (T, p) ,
i
wobei hi (T, p) die Enthalpie der reinen Komponente i ist. Die Gleichgewichtsbedingung
werten wir für ideale Mischungen aus, indem wir ansetzen
µi (T, p, c1 , c2 , . . .) = µi0 (T, p) + kB T ln ci .
Wir erhalten damit aus (27.2) sofort für jede chemische Reaktion im System eine Gleichung
Y
i
cνi i
= exp −
P
i
νi µi0 (T, p)
kB T
!
= Kc (T, p) (Massenwirkungsgesetz) ,
wobei die hiermit definierten Gleichgewichtskonstanten Kc (T, p) (für jede Reaktion eine eigene!) nur noch von Druck und Temperatur abhängen. Für die Druck- und Temperaturabhängigkeit von Kc (T, p) liefert die Gibbs-Duhem Relation
1 X ∂µi0 (T, p)
∂ ln Kc (T, p) 1 X
∆V
=−
=−
νi
νi vi = −
∂p
kB T i
∂p
kB T i
RT
T
1 X ∂(µi0 (T, p)/T )
∂ ln Kc (T, p) µi0
1 X
1 ∂µi0
=−
νi
=
νi
−
2
∂/T
kB i
∂T
kB T i
T
T ∂T
p
79
!
,
wobei ∆V die Volumenänderung bei ∆ξ = 1 ist und R = kB L die ideale Gaskonstante.
Mit
und
∂µi0
= −si
∂T
µi0 + T si = hi
X
νi hi = ∆qp
i
bleibt schließlich
∆Qp
∂ ln Kc (T, p) ,
=
∂T
RT 2
p
wobei ∆Qp = L · ∆qp bedeutet. Durch Messung der Volumenänderung ∆V als Funktion des
Druckes bei fester Temperatur T0 und der Wärmetönung ∆Qp bei festem Druck p als Funktion der Temperatur kann man die Gleichgewichtskonstante Kc (T, p) bis auf eine Konstante
bestimmen aus
ln
28
−1 Z p
1 ZT
∆Qp (T, p)
Kc (p, T )
=
.
dp∆V (p, T0 ) +
dT
Kc (p0 , T0 )
RT0 p0
R T0
T2
Koexistenz von Phasen
Am Beispiel der van der Waals Gleichung sahen wir, daß Teilchen in verschiedenen Phasen
koexistieren. Betrachten wir das Gleichgewicht dieser Koexistenz unter Teilchenaustausch,
wobei keine chemischen Reaktionen ablaufen sollen.
28.1
Wieviele Phasen können koexistieren?
Sei k die Zahl der Stoffe oder Komponenten und p die Zahl der koexistierenden Phasen. Sei
ferner ciq die Konzentration der Komponente i in der Phase q,
P
Niq
ciq = Pk
.
j=1 Njq
Pro Phase gibt es also wegen i ciq = 1 genau (k − 1) unabhängige Konzentrationen. Das
System hat also 2 + p(k − 1) Variable, nämlich p, T und die ciq . Dem stehen die Gleichgewichtsbedingungen
q = 1, 2, . . . , p
µiq = µi
i = 1, 2, . . . , k
gegenüber, was nach Elimination der k unbekannten µi noch (p − 1)k unabhängige Gleichungen sind. Diese sind nicht überbestimmt, falls
(p − 1)k ≤ 2 + p(k − 1) ,
woraus
p≤k+2
folgt. Dies ist die Gibbssche Phasenregel. Die Differenz f = k + 2 − p gibt die Zahl der
thermodynamischen Freiheitsgrade an. Z.B. für einkomponentige Systeme ist bei einer Phase
80
f = 2, d.h. p und T sind frei wählbar. Bei Koexistenz von zwei Phasen ist f = 1, d.h.
es existiert eine Relation zwischen p und T , p = p(T ). Bei Koexistenz von 3 Phasen ist
schließlich f = 0, d.h. p, T sind festgelegt (Tripelpunkt). Z.B. Phasendiagramm eines 1Komponenten-Systems
Schmelzkurve
p
fest
kritischer
Punkt
flüssig
Tripel-Punkt
Dampfdruckkurve
gasförmig
Sublimationskurve
T
Phasendiagramm eines 1-Komponentensystems
Betrachten wir noch einige Beispiele von Phasendiagrammen:
(i.) Koexistenz verschiedener Mischungen eines binären Systems
kritischer Punkt
T
p = const
Tc
II
I
B
A
Koexistenz von 2 Phasen
c
0
1c
c1
1
Phasendiagramm einer binären Mischung
T > Tc : Phase für 0 ≤ c1 ≤ 1, d.h. die Komponenten sind in beliebigem
Verhältnis mischbar
81
T < Tc : Bei allmählicher Erhöhung von c1 angefangen bei c1 = 0 durchläuft
man nacheinander:
(a) Reine Phase I (reich an Komponente 2, arm an Komponente
1). Hier f = 3; (p, T, c1 ) sind beliebig variierbar.
(b) Koexistenz von Phase I und Phase II, deren Zusammensetzung c1 , c2 durch die Koexistenzkurve bei gegebenem
p, T (f = 2) festgelegt ist.
(c) Reine Phase II (reich an Komponente 1, arm an Komponente 2)
(ii.) Koexistenz binärer Mischungen in verschiedenen Aggregatzuständen (z.B. flüssig-gasförmig)
p = const
T
T2
Taukurve
Gas (f = 3)
Koexistenz
Siedekurve
(f = 2)
T1
Flüssigkeit (f = 3)
0
c
1
Gas
c
1
flüssig
1
c
1
Koexistenz einer binären Flüssigkeit mit ihrem Dampf
Die Deutung des Diagramms ist analog zum vorherigen Beispiel.
Eine Mischung bei cf1 ` erzeugt bei Verdampfen einen Dampf mit cg1 + cf1 ` . Daher ändert
sich die Konzentration in einer siedenden Mischung im Laufe der Zeit unter gleichzeitiger Änderung der Siedetemperatur.
(iii.) Kompliziertere Phasendiagramme binärer Mischungen:
Der Punkt E heißt eutektischer Punkt. Dort gilt f = 1, z.B. ist der Druck variierbar.
82
p = const
T
Gas f = 3
II + Gas
I + Gas
I
flüssig
f=3
f=2
f=2
II
flüssig
f=3
E
eutektischer Punkt
f=1
I + II
f=2
c1
0
1
binäres System, das ich flüssig “nicht” mischt
28.2
Koexistenzkurven. Clausius Clapeyronsche Gleichung
Betrachten wir die Koexistenz von 2 Phasen (1) und (2) in einem 1 komponentigen System,
also f = k + 2 − p = 1. Längs der Koexistenzkurve gilt
µ(1) (p, T ) = µ(2) (p, T ) ⇒ p = p(T ) .
Durch Differentiation längs der Koexistenzkurve erhalten wir
∂µ(1) ∂µ(1) ∂µ(2) ∂µ(2) dp +
dT =
dp +
dT .
∂p T
∂T p
∂p T
∂T p
Für jede Phase gilt die Gibbs-Duhem Gleichung, wonach
dµ = −
also
und wir erhalten
V
S
dT + dp
N
N
∂µ = −s ,
∂T p
∂µ =v
∂p T
∂p ∆s
∆S
s(2) − s(1)
=
=
,
= (2)
(1)
∂T koex
v −v
∆v
∆V
wobei ∆S= Entropieänderung pro Mol bei Umwandlung von Phase 1 nach 2. ∆V = Volumenänderung pro Mol bei dieser Umwandlung. Die Größe ∆S läßt sich auf verschiedene Weisen
ausdrücken, z.B.
1
1
∆S = ∆Qrev = ∆H ,
T
T
83
wobei Qrev die Wärmemenge ist, die man bei reversibler Umwandlung eines Mols bei der
Temperatur T und dem Druck p dem System zuführen muß. Daher gilt
1 ∆H
dp ∆S
=
=
dT koex
∆V
T ∆V
(Clausius Clapeyronsche Gleichung) .
Betrachten wir einige Beispiele:
(i.) Dampfdruckkurve:
Das Volumen pro Teilchenzahl der flüssigen Phase kann gegen das der Gasphase vernachlässigt werden.
∆v = vGas − vFlßsig ≈
kB T
p
(vFlßsig vGas ) .
Für die spezifische Verdampfungsenthalpie ∆h können wir ansetzen
∆h ≈ ∆h0 ,
wobei ∆h0 eine spezifische Bindungsenergie in der Flüssigkeit ist und näherungsweise
als konstant betrachtet werden kann. Dann gilt
∆h0 p
dp
=
dT
kB T 2
∆h0
p = const exp −
kB T
;
!
.
Die Steigung der Dampfdruckkurve ist stets positiv, da ∆h > 0, ∆v > 0. Die spezifische
Wärme vom Dampf in Koexistenz mit der Flüssigkeit unterscheidet sich drastisch von
der reinen Dampfphase:
Ckoex =
=T
!
d− Qrev
dT
∂∆S ∂T p
= ∆Cp − T
=T
koex
d∆S
dT
!
koex
!
∂∆S dp
+T
∂p T dT koex
∂∆V 1 ∆H
.
.
∂T T ∆V
p
Approximieren wir ∆V ≈ V , (∂∆V /∂T )p ≈ V /T (ideales Gas). so ergibt sich
Ckoex = ∆Cp −
∆H
.
T
Ckoex kann sogar negativ werden, falls nämlich ∆H > T ∆Cp , d.h. der Dampf wird dann
heißer bei Entzug von Wärme, wenn nämlich der Wärmenentzug zur Kondensation in
die Flüssigkeit führt und dabei mehr Wärme frei wird, als dem System entzogen wurde,
was den Prozeß explosionsartig verstärken kann, falls nun noch mehr Wärme dem
System entzogen wird. Offensichtlich ist es sehr wichtig, auf solche thermodynamischen
Zusammenhänge zu achten, wenn man z.B. in Kraftwerken Unfälle vermeiden will!
84
(ii.) Schmelzkurve:
Betrachten wir die Steigung dieser Kurve. ∆h > 0 für Übergang ‘fest−→flüssig’, aber
>
∆v < 0 kommt beides vor, d.h. Schmelzkurven existieren mit positiver oder negativer
Steigung. Insbesondere bei H2 O ist ∆v < 0 für ‘Eis−→Wasser’, denn Eisberge schwimmen, wie wir alle aus dem Film Titanic wissen, was wegen ∆h > 0 zu einer abfallenden
Schmelzkurve führt.
(iii.) Sublimationskurve:
dp
> 0. Der Verlauf der
Da für ‘fest−→gasförmig’ stets ∆h > 0, ∆v > 0 ist immer dT
Sublimationskurve ist ähnlich zu dem der Dampfdruckkurve nur viel steiler ansteigend,
da die Sublimationswärme viel größer ist als die Verdampfungswärme.
29
Großkanonische Verteilung
Eine einfache Verallgemeinerung der Rechnung die zu (14.1) führte liefert für Systeme mit
Teilchenaustausch, für die N1 schwankt
%1 (q1 . . . p3N1 , N1 ) =
P
2 (E
− H1 , N − N 1 )
Σ(E)
und für die Energie und Teilchenzahlverteilung
P (E1 , N1 ) =
P
1 (E1 , N1 )
P
2 (E
− E1 , N − N1 )
.
Σ(E, N )
Das Maximum von P (E1 , N1 ) liefert die Gleichgewichtsbedingungen
1
1
=
,
T1
T2
die wir schon kennen, und zusätzlich
P
P
∂ ln 1
∂ ln 2
=
,
∂N1
∂N2
die gleichbedeutend sind mit
µ2
µ1
=
.
T1
T2
Entwickeln wir den Ausdruck für %1 um den Gleichgewichtspunkt und brechen schon nach
dem linearen Glied ab (was erlaubt ist, falls Cv1 Cv2 und κT 1 hN1 i2 /V1 κT 2 hN2 i2 /V2 ),
so erhalten wir
%1 (q1 , . . . , p3N1 , N1 ) =
1 −β(H1 −µN1 )
e
Zg
(großkanonisches Ensemble) ,
wobei Zg aus der Normierung bestimmt ist
Zg =
X
eβµN1 Z(β, V, N1 )
N1
85
und gleichzeitig mit der Zustandsdichte verknüpft ist über
Zg = P
Σ(E)e−β(hE1 i−µhN1 i)
P
= ∆E1 1 (hE1 i, hN1 i)e−β(hE1 i−µhN1 i) .
2 (E − hE1 i, N − hN1 i
Daraus erhalten wir das sogenannte großkanonische Potential Ω(T, V, µ)
−Ω(T, V, µ) ≡ kB T ln Zg = T S − hE1 i + µhN1 i = pV ,
wobei wir im letzten Schritt (24.1) verwendet haben. Man beachte, daß wegen der Extensivität von Ω und V und der Intensivität von p, T , µ die ganze V -Abhängigkeit von
Ω = −V p(T, µ) im Faktor V steckt, während p nur noch von T und µ abhängt. Weiter folgt
aus −dΩ = T dS + SdT − dE + µdN + N dµ, unter Benutzung von T dS = dE + pdV − µdN ,
daß
∂p ∂Ω ∂p ∂Ω ∂Ω = −V
= −S ;
= −p − V
= −p ;
= −N .
∂T V,µ
∂T V,µ
∂V T,µ
∂V T,µ
∂µ T,V
Aus Zg bekommt man unmittelbar den Druck
p=
kB T
ln Zg (β, V, µ) ,
V
in den natürlichen Variablen T, µ. Weitere unmittelbar zugängliche Größen sind
∂ ln Zg ∂hEi 1
∂ 2 ln Zg hEi = −
, σE2 = −
=
=
∂β βµ,V
∂β βµ,V
k B T 2 CV
∂β 2 βµ,V
∂ ln Zg ∂ 2 ln Zg ∂hN i 2
hN i = kB T
=
k
T
, σN
= (kB T )2
.
B
∂µ β,V
∂µ2 β,V
∂µ T,V
Die letztere Größe ist interessant, weil sie uns die Breite der Teilchenzahlverteilung gibt.
Durch Umformen von Ableitungen kann man zeigen
∂hN i hN i ∂hN i hN i2
κT
=
=
∂µ T,V
V
∂p T,V
V
denn
∂hN i ∂p hN i
∂hN i ∂hN i =
=
∂µ T,V
∂p T,V ∂µ T,V
∂p T,V V
(nach Gibbs-Duhem)
hN i2
hN i3 ∂(V /hN i) V ∂(hN i/V ) =
−
=
hN i
∂p
V
V2
∂p
T,V
T,V
=
hN i2
κT .
V
Wir stellen fest, daß
2
σN
=
kB T hN i2
κT ∼ N .
V
86
Also ist σN /N ∼ N −1/2 wieder verschwindend klein, außer in der Nähe von kritischen Punkten, wo die isotherme Kompressibilität divergiert.
Für ein ideales Gas ist
1
V
1 ∂V = =
κT = −
V ∂p T
p
hN ikB T
2
also σN
= hN i: ein Ergebnis, das auf eine Poissonverteilung hinweist und das wir schon von
§ 1c her kennen.
Für das van der Waals in der Nähe des kritischen Punkts und für T >Tc gilt
∼
p − pc = const 1 (vc − v)3 + const 2 (T − Tc )(vc − v)
∂p = −3const 1 (vc − v)2 − const 2 (T − Tc )
∂v T
woraus also
1
1 ∂v ,
'
κT = −
v ∂p T
3vc (const 1 (vc − v)2 + const 2 (T − Tc ))
2
1
1
σN
∼ κT ∼
∼
2
N
(vc − v)
(p − pc )2/3
1
∼
für v = vc folgt .
T − Tc
für T = Tc
Man nennt Potenzgesetze in der Nähe des kritischen Punkts wie (p − pc ) ∼ (vc − v)δ oder
1
κT ∼ (T −T
γ Skalengesetze und die Exponenten γ, δ (und eine Reihe weiterer ähnlicher
c)
Exponenten) “kritische Exponenten“. Experimentell haben diese nicht den von der van der
Waals Gleichung und ähnlichen “mean-field“ oder “Molekularfeld“-Theorien vorhergesagten
Wert, sondern weichen im 10%-Bereich davon ab. Dies wird durch die Theorie kritischer
Phänomene erklärt, zu der öfters Spezialvorlesungen angeboten werden.
30
Ideale Quantengase
Ideale Gase sind Gase von wechselwirkungsfreien Teilchen. Von Quantengasen sprechen wir,
wenn die Unschärferelation eine wichtige Einschränkung darstellt, d.h. wenn ∆x · ∆px für
1/3
ein
√ einzelnes Teilchen nicht mehr sehr viel größer als 2πh̄ ist. Mit ∆x ' (V /N ) , ∆px '
kB T · 2m ist also für Quantengase die Ungleichung
λdB verletzt, wobei
λdB =
q
3
v
u
u
t
V /N
2πh̄2
mkB T
die “thermische deBroglie Wellenlänge“ ist.
Seien die Energieniveaus eines Teilchens εν . Hierbei sind die ν Quantenzahlen eines Teilchens.
87
Z.B. für ein Teilchen in einem kubischen Kasten der Länge L mit zyklischen Randbedingungen
 
νx
2 2
h̄ kν
  2π
, kν =  ν y 
.
εν =
2m
L
νz
Hier, wie auch im nächsten Beispiel, sind νxi , νyi , νzi ganzzahlige 1-Teilchen Quantenzahlen.
Für ein Teilchen in einem harmonischen Fallenpotential gilt
εν = h̄ (ωx (νx + 1/2) + ωy (νy + 1/2) + ωz (νz + 1/2))
oder für ein Elektron in einem Kristall mit Energiebändern gilt
εν = ε` (k) ,
wobei ` die Energiebänder durchnumeriert und k Werte innerhalb der 1. Brillouin-Zone
annimmt, die wie im ersten Beispiel quantisiert sind, wenn der Kristall ein endliches Volumen
V ausfüllt. Meist sind nur zwei der Energiebänder von Interesse, das letzte gefüllte Band oder
Valenzband und das erste ganz oder teilweise gefüllte Leitfähigkeitsband.
In jedem Fall läßt sich die Energie des Systems schreiben als
E=
X
ε ν nν ,
ν
wobei die ganzen Zahlen nν die Zahl der Teilchen im 1-Teilchen-Zustand ν angibt. Die nν sind
nun die mikroskopischen Variablen. Für Fermionen gilt das Pauli-Prinzip, welches besagt,
daß
nν = 0, 1
Pauli-Prinzip, Fermionen .
Für Bosonen hingegen ist
nν = 0, 1, 2, . . . .
Weiter müssen wir unterscheiden zwischen masselosen Teilchen wie Neutrinos (Fermionen)
und Photonen, Phononen auf der einen Seite und massiven Teilchen wie Elektronen, Atomen
etc. auf der andern. Für masselose Teilchen kostet es keine Energie, um die Teilchenzahl zu
verändern, d.h. die Teilchenzahl ändert sich von selbst und ist keine unabhängige Systemvariable. Anders für massive Teilchen: hier ist die Teilchenzahl eine Erhaltungsgröße, solange
keine chemischen Reaktionen oder relativistische Teilchen-Erzeugungs- und Vernichtungsprozessedie Teilchenzahl ändern. Im Fall massiver Teilchen gilt also
N=
X
nν
massive Teilchen .
ν
Im großkanonischen Ensemble gilt
%({nν }) =
mit
Zg =
X
{nν }
1 −β P (εν nν −µnν )
ν
e
Zg
e−β
P
ν
(εν −µ)
88
nν .
Uns interessieren Größen wie
pV = kB T ln Zg ,
die mittlere Teilchenzahl
X
hN i =
ν
hnν i
und natürlich auch die mittleren Besetzungszahlen hnν i selbst; die mittlere Energie
hEi =
die Entropie
X
ν
εν hnν i ,
∂
hEi − µhN i
S=
kB T ln Zg = kB T ln Zg +
∂T
T
V,µ
und z.B. bei Spin-behafteten Teilchen wie Elektronen die mittlere Magnetisierung
hMi =
X
ν
gµB sν hnν i ,
wobei sν der mit dem Zustand |νi verknüpfte Spineigenwert ist. All diese Größen ergeben
sich durch Differentiation direkt aus Zg , das wir leicht auswerten aus
Zg =
YX
e−βn(εν −µ) =
(ν) n
ln Zg = ∓
X
ν
Y
(ν)
ln 1 ∓ e
−β(εν −µ)
1 ∓ e−β(εν −µ)
∓1
,
wobei hier und im folgenden das obere (untere) Vorzeichen für Bosonen (Fermionen) gilt.
Dann können wir nach εν differenzieren, um
hnν i = −
1
1 ∂ ln Zg
= β(εν −µ)
β ∂εν
e
∓1
zu erhalten.
n (ε)
kT
µ
ε
Fermi-Dirac Verteilung bei endlicher Temperatur
89
Für massive Fermionen ist die Fermi-Energie εF als Funktion der Teilchenzahl definiert durch
ν
X
ν
Θ(εF − εν ) = N ,
woraus wegen limβ→∞ (eβ(εν −µ) + 1)−1 = Θ(µ − εν ) folgt µ(T = 0) = εF . Die mittlere
Besetzungszahl hnν i = n(εν ) eines Zustands ν mit Energie εν gibt noch nicht die mittlere Zahl
von Teilchen bei der Energie εν an, da letztere auch noch von der Zahl der Zustände bei der
Energie εν abhängt. Die mittlere Zahl von Teilchen pro Volumeneinheit pro Energieeinheit
ist N (ε) = g(ε)n(ε), wo g(ε)dε = Zahl der Zustände pro Volumeneinheit im Energieintervall
dε (g(ε) = Zustandsdichte). Z.B. in einem Kristall ist die 1-Teilchen Zustandsdichte g(ε) für
die Valenzelektronen qualitativ von der Form
Fermiverteilung n(E)
Zustandsdichte g(E)
Isolator
Halbleiter
Metall
n
g
g
µ
µ
Valenzband
µ
E
Leitungsband
Fermi-Verteilung n und Zustandsdichte g in verschiedenen Typen von Festkörpern
Daraus ergibt sich die mittlere Zahl von Elektronen pro Energieinheit als
dN (ε)
g(ε)
= g(ε)n(ε) = β(ε−µ)
.
dε
e
+1
Die Fermi-Energie εF N = µ(T = 0, N ) ergibt sich aus
N=
X
ν
Θ(εF − εν ) =
Z
dεg(ε)Θ(εF − ε) =
Z
εF
εv0
dεg(ε) ,
wobei εv0 der Boden des Valenzbandes und N die Zahl der Valenzelektronen ist. Liegt εF
innerhalb eines Bandes, so hat man ein Metall. Ist dagegen das oberste Band gefüllt, das
nächste leer, so hat man einen Isolator (falls die Bandlücke kB T ) oder einen Halbleiter
(falls die Bandlücke <kB T ) vor sich. In einem reinen Kristall legt man dann εF per Defini∼
tion in die Mitte zwischen Valenz- und Leitfähigkeitsband. In einem dotierten Kristall gibt
es auch zwischen den Bändern Energieniveaus durch Störstellen. Dann wird die Lage von εF
bestimmt durch die Energie der gerade noch besetzten und der gerade nicht mehr besetzten
Störstellen-Niveaus (Akzeptor-Niveaus falls die Fremdatome weniger Valenzelektronen haben, also Elektronen aus dem Valenzband aufnehmen können, und Donator-Niveaus falls die
90
Fremdatome zusätzliche Valenzelektronen haben, und Elektronen ans Leitungsband abgeben
können). Mit der Zustandsdichte g(ε) schreiben sich die interessierenden Erwartungswerte
R
P
durch Ersetzen von ν . . . → dεg(ε) . . . als
pV = kB T
hN i =
hEi =
Z
Z
Z
g(ε)dε ln 1 + e−β(ε−µ)
g(ε)dε
1
eβ(ε−µ)+1
g(ε)d(ε)
ε
eβ(ε−µ) + 1
etc. Im Fall masseloser Teilchen entfällt hN i als unabhängige Variable und wir setzen einfach
µ = 0. Dies bedeutet den Übergang zum kanonischen Ensemble. Für εν kB T ist hnν i 1
und
hnν i ' e−β(εν −µ)
ist die klassische Boltzmann-Verteilung. Doch für εν − µ <kB T ist die quantenmechanische
∼
von der klassischen Verteilung wesentlich verschieden.
31
Freies Elektronengas
Überraschend viele Eigenschaften von Metallen bei tiefen Temperaturen lassen sich verstehen, wenn man die Elektronen trotz ihrer Coulombwechselwirkung als ein Gas von wechselwirkungsfreien Teilchen auffaßt. Daß die Coulombwechselwirkung hier trotz ihrer Stärke und
ihrer Langreichweitigkeit in vieler Hinsicht nur eine zweitrangige Rolle spielt, liegt an der
Eigenschaft der Abschirmung: Die Elektronen bewegen sich vor einem Hintergrund von positiv geladenen Ionenrümpfen. Betrachten wir ein herausgegriffenes Elektron. Auf kurzen
Abständen hat es eine stark abstoßende Wechselwirkung mit den anderen Elektronen, so
daß in der unmittelbaren Umgebung des Elektrons mit geringer Wahrscheinlichkeit weitere
Elektronen gefunden werden. Daher überwiegt in dieser Zone die positive Hintergrundladung.
Die weiter entfernten Elektronen sehen daher nur die wegen der positiven Hintergrundladung
abgeschirmte Ladung des Elektrons. Das Ergebnis ist eine sog. abgeschirmte Coulombwechselwirkung mit dem Potential U (r) = e2 e−κr /r, wobei 1/κ die Abschirmlänge ist. Die Vielteilchentheorie eines wechselwirkenden Coulombgases liefert dafür κ = (ne2 /kB T )1/2 . Damit
erhält die effektive Wechselwirkung eine endliche Reichweite und kann in dieser Form in
vielen Fällen als kleine Störung angesehen werden. Im folgenden betrachten wir daher ein
wechselwirkungsfreies Elektronengas.
P
V R 3
h̄2 2
kν , falls kein Magnetfeld anliegt und ν . . . → 2 (2π)
d k. Der Faktor 2
Hier ist εν = 2m
3
berücksichtigt die beiden verschiedenen Spineinstellungen pro Zustand. Wir erhalten
hEi = 2
V
(2π)3
Z
d3 k
hN i = 2
V
(2π)3
Z
d3 k
V
pV = 2
(2π)3
Z
3
h̄2 k 2 /2m
2 2
exp(β h̄2mk − βµ) + 1
h̄2 k 2 /2m
2 2
exp(β h̄2mk − βµ) + 1
d k ln 1 + e
91
2 2
−( βh̄2mk −µ)
Z
2 2
∞
4πV
2
−( βh̄2mk −µ)
= 2kB T
dk
k
ln
1
+
e
(2π)3 0
Z
1
kB T V βh̄2 ∞
.
dk k 4
=
2 2
3
k
βh̄
π
3m 0
− βµ) + 1
exp(
2m
Die auftretenden Integrale lassen sich durch Reihenentwicklung
(z −1 exp(βh̄2 k 2 /2m) + 1)−1 =
∞
X
(−z)n e−nβh̄
2 2
k /2m
n=1
mit z = eβµ und gliedweise Integration durch die “Fermifunktionen”
fα (z) =
∞
X
(−1)`+1 z `
2
=
`α
Γ(α)
`=1
Z
∞
0
dx
x2α−1
z −1 ex2 + 1
ausdrücken, und zwar
kB T V
f5/2 (eβµ )
λ3dB
3 V kB T
3
hEi = 2
f5/2 (eβµ ) = pV
3
2 λdB
2
V
hN i = 2 3 f3/2 (eβµ ) .
λdB
pV = 2
Es gilt fα−1 = z∂/∂zfα (z). Die Größe z = eβµ heißt “Fugazität“ und wird oft anstelle von µ
als unabhängige Variable benutzt.
Hochtemperaturlimes z 1: Im klassischen Grenzfall wird µ negativ, dann wird also z klein.
Mit der Reihenentwicklung für fα (z) ergibt sich
2
hN i
= 3
V
λdB
eβµ −
1
2
e2βµ + . . .
3/2
λ3dB hN i
1 λ6dB hN i2
µ = kB T ln
+ 3/2
+...
2V
2
(2V )2
1 2βµ
kB T
βµ
e − 5/2 e + . . .
p=2 3
λdB
2
!
λ3dB hN i
kB T hN i
1 + 5/2
+... .
=
V
2 (2V )
!
Im klassischen Grenzfall ergibt sich also die Zustandsgleichung des idealen Gases. Wegen der
Kleinheit der Elektronenmasse ist jedoch ein Elektronengas in Metallen bei Zimmertemperatur schon ein Quantengas.
!
hEi
3
λ3dB hN i
= kB T 1 + 5/2
+...
hN i
2
2 (2V )
!
3
λ3dB hN i
cV = kB 1 − 7/2
+... .
2
2 (2V )
92
Tieftemperaturlimes z 1: Für T → 0 geht
exp βh̄2 k 2 /2m − βµ + 1
und
−1
→ Θ(µ − h̄2 k 2 /2m)
−1
∂ h̄2
h̄2 ∂
2 2
2 2
Θ(µ
−
h̄
k
/2m)
=
−
δ(µ − h̄2 k 2 /2m) .
→
−
exp
βh̄
k
/2m
−
βµ
+
1
2
∂k
2m ∂µ
2m
Daher findet man mit Hilfe von partieller Integration (oder direkt durch Benutzung der
asymptotischen Entwicklungen)
!
4
∂
π2
z f5/2 (z) = f3/2 (z) ' √
(ln z)3/2 + (ln z)−1/2 + . . .
∂z
3 π
8
!
8
5π 2
5/2
1/2
f5/2 (z) ' √
(ln z) +
(ln z) + . . . ):
15 π
8
!
8
π2
1
3/2
3 hN i
= √
+...
(βµ) +
λdB
V
3 π
8 (βµ)1/2

π2
µ = εF (N ) 1 −
12
kB T
εF (N )
!2

+ . . . .
µ / εF
1
kT/ ε
0
0.5
1.0
1.5
F
-1
Chemisches Potential des Fermi-Gases
Mit der von der Teilchendichte n-abhängigen Fermi-Energie (und dem zugehörigen FermiImpuls)
!2/3
p2f
6π 2 N
h̄2
≡
,
εF (N ) =
2m V (2s + 1)
2m
wobei s der Spin ist, also s = 1/2 für Elektronen.
!
kB T 8
5π 2
√
p=2 3
(βµ)5/2 +
(βµ)1/2 + . . .
λdB 15 π
8
!
1
5π 2
2 εF (N )
+...
1+
=
5 v
12 β 2 ε2F (N )
93
P
Isochore V=const
T
Isochore des idealen Fermi-Gases
!
5π 2
3
3 εF (N )
hEi
1
1+
= p=
+...
2
2
hN i
2
5 v
12 β εF (N )
!!
kB T
kB π 2 kB T
1 ∂E =
1+O
cV =
hN i ∂T V
2 εF (N )
εF
Z T
cV
k2 π2 T
S
=
dT = B
+...
hN i
2 εF (N )
0 T
Cv
3 NK
2
Cv ~ T/T
F
T
Spezifische Wärme des idealen Fermi-Gases
Für eine normale Fermiflüssigkeit geht also die spezifische Wärme cV → 0 und die Entropie
s → 0 für T → 0 proportional zu T . Ein ideales Fermi-Gas hat selbst bei Temperatur
T = 0 noch einen positiven Druck, der rein quantenmechanischer Natur und eine Folge des
Pauli-Prinzips ist.
94
32
Paulischer Paramagnetismus
des freien Elektronengases
Ein freies Elektronengas (ideales Fermi-Gas) zeigt im homogenen Magnetfeld 2 verschiedene
magnetische Effekte, die sich gegenseitig teilweise kompensieren:
1. Diamagnetismus: hervorgerufen durch die Quantisierung der Bahnbewegung auf
Landau-Niveaus.
2. Paramagnetismus: hervorgerufen durch die Ausrichtung der Elektronenspins im Magnetfeld.
Der 1-Teilchen Hamiltonoperator ist
e
1
(p − A)2 − µ · B .
2m
c
Wir betrachten in diesem Abschnitt den Spin-Anteil, im nächsten Abschnitt den BahnAnteil. Also reduziert sich H auf
H=
p2
−µ·B
2m
p2
1
eh̄
εps =
− sgµ0 B
s = ±1 , µ0 =
, g = 2.
2m 2
2mc
In Besetzungszahl-Darstellung
X
H=
εp,s np,s
H=
p,s
Großkanonische Zustandssumme:
Zg =
X
e−β
{n}
=
P
YY
p
p,s
(εps −µ)nps
1 + e−β(εps −µ)
s
−pV = Ω = −kB T ln Zg ≡ kB T
= Ω0 (µ+ ) + Ω0 (µ− ) ,
XX
s
ln 1 + e−β(εps −µ)
p
wobei Ω0 (µ) das großkanonische Potential für B = 0 ist für eine Spineinstellung
Ω0 (µ) =
X
p2
ln(1 + e−β( 2m −µ) )
p
und
µ± = µ ± µ 0 B .
Wir haben als für die beiden Spineinstellungen gesonderte chemische Potentiale µ+ , µ− .
∂
1 ∂
ln Zg = − (Ω0 (µ+ ) + Ω0 (µ− ))
β ∂µ
∂µ
∂
∂
=−
Ω0 (µ+ ) −
Ω0 (µ− )
∂µ+
∂µ−
= hN+ i + hN− i
hN i =
95
P
mit hN± i = p hnp± i. Das Elektronengas verhält sich also wie 2 verschiedene Elektronengase
mit 2 verschiedenen chemischen Potentialen entsprechend den Spineinstellungen.
Für jedes einzelne der beiden Elektronengase gilt für T → 0

π2
µ± = εF (N± ) 1 −
12
h̄
=
2m
kB T
εF (N± )
!2
!2/3 
6π 2 N±
V
Aus
π2
1 −
12

+ . . .
kB T
2m
h̄2
µ± ≈ εF (N± )(1 −
h̄2
2µ0 B =
2m
6π 2
V
π2
−
12
!2/3 "
kB T 2m
h̄2
2/3
2/3
N+
−
1
2/3
N+
2/3
N−
!2 −
1
2/3
N−
M=
π2
( kB T ) 2
12 εF (N± )
!4/3

+ . . . .
+ . . .)
2/3
(N+ − N− )
V
6π 2
1/3
Für |N+ − N− | 1 folgt
Also
V
6π 2 N±
µ+ − µ− = 2µ0 B
folgt für tiefe Temperaturen:
!2


#
1
1 

+... .
−
2/3
2/3
N+
N−
2 N −1/3
=
(N+ − N− )
3 2
2 N −5/3
(N+ − N− ) .
=−
3 2
µ0 (N+ − N− )
= χB
V
mit der Suszeptibilität
2µ2 2m V
χ= 0 2
V h̄
6π 2

2/3
π2
3µ20 N 
=
1−
2εF (N ) V
12
Für hohe Temperaturen

3 N
2
2
1/3
kB T
εF (N )
π2
+
12
!2
2mkB T
h̄2
!2 V
6π 2
4/3 N
2

+ . . . .
µ± ≈ kB T ln
λ3 N ±
V
N±
1
' 3 eµ± /kB T
V
λ
V
µ0 B
V
≈ 2 3 eβµ
N = N+ + N− = 3 eβµ 2 cosh
λ
kB T
λ
µ+
µ− µ0
µ0 (N+ − N−
' 3 e kB T − e kB T
M=
V
λ
96
−5/3
−1
+ . . .
µ0 k µ T
µ0 B
e B 2 sinh
3
λ
kB T
µ0 N µ0 B
2
≈
2V kB T
=
also
χ=
µ20 N
kB T V
χ
kT/E F
1
Paramagnetische Suszeptibilität χ als Funktion der Temperatur in Einheiten der
Fermi-Energie
33
Diamagnetismus des freien Elektronengases
Wir wissen, daß die einzelnen Elektronen quantisierte Landau-Niveaus einnehmen mit Energien
p2
eh̄B
ε(pz , `) = z +
(` + 1/2) ` = 0, 1, 2, . . .
2m
mc
Jedes Landau-Niveau ist entartet, da es alle klassischen Kreisbahnen mit
p2x + p2y
eh̄B
eh̄B
` <
<
(` + 1)
(33.1)
mc
2m
mc
enthält. Also ist der Entartungsgrad des `-ten Landau-Niveaus
g` = 2
X
px ,py
2L2 Z
V 2/3
eh̄B
=
dp
dp
=
2
≡ g.
π2m
x
y
2
2
2
h
mc
(2π) h̄ (33.1)
Großkanonische Zustandssumme:
Zg =
X
{n}
e
−β
P
p,`,α
(εp,` −µ)np,`α
=
X
{n}
e
−βg
P
p,`
(εp,` −µ)np,`
α numeriert die g-entarteten Subniveaus von εp,` durch np,`,α ist die Besetzungszahl des
Subniveaus α von εp,` . Wir erhalten wie üblich
ln Zg = g
X
ln(1 + e−β(εp,` −µ) )
p,`
Z +∞
∞
p2
2V 2/3
eh̄B X
L
+ eh̄B
(`+1/2)−µ)
−β( 2m
mc
=
).
π
·
2
dp
ln(1
+
e
2
2
c `=0 2πh̄ −∞
(2π) h̄
97
Für hohe Temperaturen ergibt sich durch Entwicklung des Logarithmus unter dem Integral
nach der Exponentialfunktion
eh̄B
V eh̄B q
1
2πmkB T e−β( 2mc −µ)
ln Zg ≈ 4 3 π
.
eh̄B
h
c
1 − e− mc β
Die Magnetisierung ist definiert durch
hM i = +
Für kleine B
Daraus
1 ∂
ln Zg .
βV ∂B

1
1
ln Zg ≈ 2V eβµ 3 1 −
λ
6
eh̄
2mc
!2 2eβµ · 2
hM i = −
6 · k B T λ3
eh̄
2mc
!2
B
kB T
2

+ . . . .
B = χdia B .
Benutzen wir die Gleichung für hN i
2eβµ ≈
λ3 hN i
V
so erhalten wir das einfache Resultat, für kB T χdia
hN i
≈−
3V kB T
eh̄
2mc
eh̄B
mc
!2
1
= − χpara .
3
Wir schließen, daß der Paramagnetismus des Elektronengases zwar durch den entgegengesetzten Diamagnetismus abgeschwächt wird, aber überwiegt.
Bei tiefen Temperaturen hängt χdia in unstetiger Weise, oszillatorisch, von B ab (DeHaas–
VanAlphen-Effekt). Die unstetigen Änderungen treten immer dann auf, wenn ein LandauNiveau mit wachsendem B die Fermi-Energie überstreicht, da sich dann dieses oberste besetzte Landau-Niveau plötzlich entleert und sich damit die Besetzungszahl dieses Niveaus
in unstetiger Weise ändert. Da g ∼ B zunimmt, gehen die Elektronen in die verbleibenden
tiefer liegenden Landau-Niveaus.
34
Einige astrophysikalische Anwendungen der
Theorie des idealen Fermi-Gases
Wichtige Fermi-Gase sind:
Elektronen in Metallen, Elektronen und Löcher in Halbleitern, Nukleonen in Atomkernen,
Neutronen in Neutronensternen, Elektronen in weißen Zwergen, 3 He als Gas und Flüssigkeit.
Eine wichtige Kenngröße für diese Systeme ist die Fermitemperatur
εF
h̄2
TF =
=
kB
2mkB
6π 2
2S + 1
98
!2/3 N
V
2/3
.
Sie hängt von der Masse der Fermionen ab (kleines m heißt großes TF ) und vor der Teilchendichte (große Teilchendichte heißt großes TF ). Typische Fermitemperaturen sind:
Metall: Die Dichte der Leitungelektronen ist ca. 1 pro Gitterzelle (allgemein die chemische
Wertigkeit des Metallatoms pro Gitterzelle)
1023
N
'
,
V
cm3
TF ' 106 K
Halbleiter: TF kann in Bereich der Zimmertemperatur liegen oder kleiner sein.
Nukleonen in Atomkernen und Neutronen in Neutronensternen:
TF ' 3 × 1011 K
εF ' 30M eV ,
Elektronen in weißen Zwergen:
1030
N
'
,
V
cm3
TF ' 1011 K
εF ' 20M eV
dies sind Sterne der Größe etwa der Sonne, deren Wasserstoff zu Helium fusioniert ist.
% ' 107 g/cm3 ,
T ' 107 K TF .
In flüssigem 3 He ist das mittlere Volumen pro Atom ca 46,3Å3 , woraus TF ' einige ◦ K folgt.
Die Tatsache, daß Metallelektronen bei Zimmertemperatur entartete Fermi-Gase sind hat
wichtige Konsequenzen: Der Beitrag der Metallelektronen zur spezifischen Wärme ist proportional zu T /TF und etwa um diesen Faktor kleiner, als der Beitrag des Gitters bei Zimmertemperatur. Wir werden sehen, daß der Beitrag des Gitters (der Phononen) verschwindet
wie T 3 für T → 0. Dann dominiert der lineare Beitrag in T der Leitungselektronen.
Um astrophysikalische Anwendungen zu betrachten, wollen wir das Fermi-Gas auch relativistisch behandelt, d.h.
q
εp = p 2 c2 + m 2 c4 .
Die Energie des Grundzustands wird dann
E0 = 2
X q
p 2 c2 + m 2 c4 =
|p|<pF
2V
h3
Z
pF
0
q
4πp2 dp p2 c2 + m2 c4 .
Für pF mc:
2V
E0 = 3
h
!
4π 3
4π p5F
4πV
pF mc2 +
+ . . . = N · mc2 + 3 p5F + . . .
3
5 2m
5h m
Für pF mc (hochrelativistischer Grenzfall)
m4 c 5 1 p F
E0 = 2 3 V
π h̄ 4 mc
3π 2 N
pF = h̄
V
4
!1/3
.
99


1 + 1
pF 2
mc

+ . . .

Der Druck bei T = 0 ist
m4 c 5
∂F ∂E0
=
p0 = −
=−
∂V T =0
∂V
12π 2h̄3
pF
mc
4


1 − 1
pF 2
mc


+ . . . .
Der Druck im Zentrum eines Sterns mit Radius R muß im Gleichgewicht die Gravitationsenergie pro Volumeneinheit aufwiegen, also mit der Gravitationskonstanten γ,
p0 = α
γM 2
mit einem dimensionslosen Proportionalitätsfaktor α = O(1)
R4
(bei inkompressibler Materie und nicht-relativistischer Gravitation findet man z.B. α =
1/3
(3/8π)). Da pF ∼ NR und V ∼ R3 erhält man eine Gleichung der Form
N 4/3
C2 R 2
C1 4 1 − 2/3
R
N
!
C3 N 2
=
R4
mit
C1 =
π −2/3 35/3
c h̄(3π 2 )4/3 N 1/3
=
ch̄
4/3
12π 2
214/3
4π
3
C2 =
2/3
4π
3
2
2
h̄ (3π )2/3
m2 c 2
= π −2/3 3−4/3 24/3
m2 c 2
h̄2
C3 = αγm20
wobei m0 die Masse eines Nukleons (Proton oder Neutron) ist. Dagegen ist m die Masse
desjenigen Teilchens, dessen Fermi-Entartung den stabilisierenden Druck liefert (Elektronenmasse bei weißen Zwergen, Neutronenmasse bei Neutronensternen). Die Lösung für R
ist
N 1/3
C3 2/3 1/2
√
R=
1−
,
N
C1
C2
falls
C1 3/2
.
C3
Andernfalls gibt es keine stabile Gleichgewichtslage. Die Zahl
N<
C1
NC =
C3
3/2
=
35/3
ch̄
14/3
2/3
2 π
αγm20
!3/2
'
ch̄
γm20
!3/2
gibt eine kritische Schranke an. Überschreitet die Teilchenzahl eines Sterns diese Schranke (Chandrasekhar-Schranke), so kollabiert er (Gravitationskollaps). Setzt man für m0 die
Masse des Protons ein, so erhält man
h̄c
' 1039
γm2p
100
und
Mc = m 0 N c ' M Θ
Sonnenmasse .
Also:
Massen, die wesentlich schwerer sind als die Sonne, können keine stabilen Sterne mehr bilden
und kollabieren (Gravitationskollaps).
Für kleinere Dichten genügt die nichtrelativistische Rechnung. Die Gleichgewichtsbedingung
p0 = α
liefert dann mit p0 =
2
2 pf
5 2mV
γM 2
γm20 N 2
=
α
R4
R4
N
1
2
N
2
2 1/3
4π 3 h̄ (3π )
5 2m 3 R
4π
3
!4/3 N
R3
2/3
woraus N 1/3 R = C4
2 3(3π 2 )1/3 34/3
folgt, mit C4 =
5 2α4π(4π)4/3
γm20 N 2
=α
R4
h̄2
γm m20
!
'
h̄2
γm m20
!
.
Weiße Zwerge werden durch den Nullpunktsdruck des Elektronengases stabilisiert und bestehen hauptsächlich aus Helium, also
m = mel
m0 = mHe .
Ihre Teilchendichte bei gegebener TeilchenzahlN ist also
N
'
R3
γm m20
h̄2
!3
N2 .
Wird das stabilisierende Elektron durch Vergrößerung von N auf den Raum des Atomkerns
eingeschränkt, bilden sich durch inversen β-Zerfall Neutronen, welche nun die Rolle des
stabilisierenden Fermi-Gases übernehmen, d.h. nun ist
m = mNeutron .
Damit steigt die Gleichgewichtsdichte um einen Faktor
mNeutron
mel
3
' 106
an, d.h. der Radius kollabiert auf 1/100 (Supernova) und es bildet sich ein Neutronenstern.
Wird N weiter erhöht, bei wesentlich über 1039 hinaus, dann wird das Neutronengas extrem
relativistisch und kann schließlich den Gravitationskollaps nicht mehr verhindern, wenn die
Chandrasekhar-Grenze überschritten wird. Es bildet sich ein schwarzes Loch.
101
35
Thermische Strahlung: Photonengas
Photonen sind die Teilchen eines Vektorfeldes und tragen daher den Spin 1. Allerdings haben sie wegen der Transversalität elektromagnetischer Wellen nur zwei Spineinstellungen,
welche den beiden Polarisationsrichtungen von Licht entsprechen. Ihre Ruhemasse ist Null.
Gemäß der speziellen Relativitätstheorie bewegen sich masselose Teilchen stets mit Lichtgeschwindigkeit, sind also stets relativistisch zu behandeln. Photonen werden bei Emission
elektromagnetischer Strahlung frei erzeugt und bei Absorption vernichtet. Da für Photonen keine Teilchenzahlerhaltung gilt, ist die einzige Einschränkung, der das Gleichgewichtsensemble unterliegt, die Energieerhaltung, d.h. bei Energieaustausch ist im Gleichgewicht
die Temperatur vorgegeben durch das Wärmebad und die Energie liegt nur im Mittel fest.
hEi =
X
k
h̄ωk hb+
kλ bkλ i .
Hier sind bkλ und b+
kλ die Vernichtungs- und Erzeugungsoperatoren der Schwingungsquanten
des Lichtfelds mit Wellenvektor k und Polarisationsindex λ (z.B. λ = + für rechtszirkular
und λ = − für linkszirkular). Die Winkelfrequenz ωk = ck ist im Vakuum unabhängig von
λ. Also gilt im Gleichgewicht für den statistischen Operator
X
1
% = exp −β
h̄ωk b+
kλ bkλ
Z
kλ
!
.
In Photonenzahldarstellung mit b+
kλ bkλ |{n}i = nkλ |{n}i gilt
%=
X
W ({n})|{n}ih{n}|
{n}
1 −β P h̄ωk nkλ
kλ
.
e
Z
Die mittlere Besetzungszahl der Mode (q, κ) ist
mit
W ({n}) =
hnqκ i =
X
=
X
1 −β Pk,λ h̄ωk nkλ
nq,κ
e
Z
{n}
nq,κ
=−
1 −βh̄ωk nqκ
e
nq,κ
Zq,κ
1 ∂
ln Zq,κ ,
h̄ωk ∂β
1
.
1 − e−βh̄ωq
Damit ergibt sich die Plancksche mittlere Photonenzahl
wobei
Zqκ =
hnqκ i =
1
eβh̄ωq
−1
.
Um die mittlere spektrale Energiedichte u(ω)dω der thermischen Strahlung zu bestimmen
in einem (gegenüber der mittleren Wellenlänge) großen Volumen V = L3 , müssen wir die
Moden im Frequenzintervall dω um ω abzählen. Ist ihre Anzahl V g(ω)dω, so ist
u(ω) =
h̄ω
g(ω)dω .
−1
eβh̄ω
102
Die Anzahl V g(ω)dω für großes V ist gleich dem doppelten (wegen der beiden Polarisationsrichtungen) Volumen 4πn2 dn im n-Raum, welches über k = 2π
n dem Volumen der
L
Kugelschale im k-Raum entspricht, mit Radius |k| = ω/c und Dicke d|k| = dω/c. Also
L
V g(ω)dω = 2
2π
3
4π
ω 2 dω
.
c2 c
Das Volumen V hebt sich heraus, wie es für die Existenz des Grenzübergangs V → ∞
erforderlich ist, und wir erhalten für die Modendichte (Anzahl der Moden pro Volumen und
Frequenzeinheit) der elektromagnetischen Strahlung
g(ω)dω =
ω2
dω .
π 2 c3
Damit haben wir die Plancksche Strahlungsformel für thermische Strahlung abgeleitet. Das
heute wichtigste Beispiel ist die elektromagnetische kosmische Hintergrundstrahlung mit
T = 2.7 ◦ K. Bestimmen wir die mittlere Photonenzahl pro Volumeneinheit der thermischen
Strahlung. Da keine Teilchenzahlerhaltung gilt, ist sie wie schon erwähnt kein unabhängiger Parameter, welcher den Gleichgewichtszustand einschränkt und festlegt, sondern sie ist
eine eindeutige Funktion der Temperatur T , des einzigen Parameters, von dem (neben dem
Volumen) der Gleichgewichtszustand abhängt:
hN i =
Z ∞
1 X
1
.
hnkλ i =
g(ω)dω βh̄ω
V k,λ
e
−1
0
Hierbei haben wir den Limes V → ∞ gebildet, in dem die diskrete Summe über k in
ein Integral über das im Limes kontinuierliche Modenspektrum übergeht, mit der gerade
bestimmten Modendichte g(ω). Durch Entwicklung der Planckschen Besetzungszahl in eine
geometrische Reihe und Einführung der Integrationsvariablen nβh̄ω = x erhalten wir
hN i
1
= 2
V
π (βh̄c)3
Z
∞
0
∞
X
1
2
x e dx
= 2
3
π
n=1 n
2 −x
kB
h̄c
!3
P
T 3 ζ(3) ,
−p
wo ζ(p) = ∞
die Riemannsche ζ-Funktion ist. Es ist ζ(3) = 1.202 . . . .. Für T → 0
n=1 n
nimmt also die Photonenzahldichte proportional zu T 3 ab.
4
Die mittlere Energiedichte ergibt sich ganz analog in den folgenden Schritten mit ζ(4) = π90
1 X
hEi
=
h̄ωk hb+
kλ bkλ i
V
V k,λ
=
=
1 X
h̄ωk hnkλ
V k,λ
Z
∞
0
g(ω)
h̄ω
dω
−1
eβh̄ω
∞
1
(kB T )4 Z ∞ 3 −x X
x
e
dx
= 2
3
4
π (h̄c) 0
n=1 n
=
3! (kB T )4
2π 2 (kB T )4
ζ(4)
=
.
π 2 (h̄c)3
30(h̄c)3
103
Die spezifische Wärme cv des Photonengases ist also
4kB π 2
∂ hEi =
cv =
(kB T )3
3
∂T V V
15(h̄c)
und die Entropie
S
=
V
Z
T
0
dT 0
cv (T 0 )
8kB
2π 4 hN i
3
=
ζ(4)(k
T
)
=
.
B
T0
π 2 (h̄c)3
45 V
Es ist interessant, sich die Entropiedichte des Weltalls aufgrund der kosmischen Hintergrundstrahlung zu überlegen, und diese mit der Nukleonendichte (∼ 1/m3 ) zu vergleichen, was
ein Verhältnis von ca 109 ergibt. Das Ergebnis besagt, daß das Universum im Verhältnis zu
seinem Materieinhalt eine enorm hohe Entropie besitzt. Würde man es adiabatisch wieder
zurückkomprimieren auf eine mittlere Dichte, die der von normaler Materie entspricht, hätte
die kosmische Hintergrundstrahlung eine Temperatur von T ∼ 1010 K.
Den Druck des Photonengases finden wir schließlich aus
1 hEi
∂hEi =+
p=−
.
∂V S
3 V
Letztere Relation folgt auch aus der Elektrodynamik (z.B. indem man benutzt, daß der Druck
der isotrope Anteil des Spannungstensors ist, und man den Maxwellschen Spannungstensor
benutzt)
36
Phononengase
Ein Festkörper aus N -Atomen (f = 3N ), bei kleiner Auslenkung aus den Ruhelagen, hat
3N -Normalschwingungen mit den Frequenzen
ω1 , ω2 . . . ω3N .
Die quantisierte Version dieser Normalschwingungen heißen Phononen. Ein Kristall mit einem Atom pro Elementarzelle besitzt nur akustische Phononen d.h. Gitterschwingungen,
deren Frequenzen ω(k) gegen Null gehen für k → 0.
Grenze der Brillouin-Zone
Ω(k)
k
in eine feste Richtung im k-Raum
Dispersionsrelation akustischer Phononen
104
Phononen sind ein Vektorfeld, haben also Spin 1. Die 3 Spineinstellungen entsprechen 3
unabhängigen Polarisationsrichtungen, eine longitudinale und zwei transversale. Die Dispersionsrelation für verschiedene Polarisationsrichtungen stimmen im allgemeinen nicht überein.
Also hat man 3 Zweige von akustischen Phononen. Hat man einen Kristall mit mehreren Atomen pro Elementarzelle p Stück), so können diese Atome entweder miteinander, d.h. in Phase
schwingen – was wieder zum 1-atomigen Fall zurückführt (also zu akustischen Phononen,
oder sie schwingen gegeneinander, was zu optischen Phononen führt (3(p − 1) verschiedene
Zweige) z.B. 2 Atome pro Elementarzelle (N aCl).
Ω (k)
Grenze der Brillouin-Zone
optische
Zweige
akustische
Zweige
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
k
N/p diskrete Werte von k, z.B. (k 1, k 2, k3 ) = (2 π / L) (n 1, n2 , n3 )
Akustische und optische Phononen in einem Kristall aus N -Atomen mit Volumen L 3 und
p = 2 Atomen pro Einheitszelle
In einem endlichen Kristall mit N/p Einheitszellen: N/p diskrete k-Werte, kl = 2π
l. Optische
L
Phononen haben eine Frequenzlücke ω0 bei k = 0. Sie sind für kB T h̄ω0 praktisch nicht
angeregt. Bei tiefen Temperaturen sind also vor allem akustische Phononen wichtig, und hier
vor allem langwellige akustische Phononen, für die ωs (k) = cS k. Der Hamiltonoperator in
Besetzungszahl-Darstellung lautet
H=
XX
n̂lλ +
l
λ
1
h̄ωλ (kl )
2
in Zukunft ωλ (kl ) = ωlλ .
Hierbei soll λ über alle 3p Phononenzweige laufen (akustische und optische). Wiederum gibt
es keine Teilchenzahlerhaltung, da Phononen beliebig erzeugt und vernichtet werden: µ = 0.
Zg =
X
=
Y
{n}

exp −β
e
− 21 βh̄ωlλ
l,λ
X
l,λ
h̄ωlλ nlλ +
1
.
1 − e−βh̄ωlλ

1 
2
Daraus
hnlλ i + 1/2 = −
1 ∂
1
1
ln Zg = βh̄ω
+
lλ
h̄β ∂ωlλ
e
−1 2
105
hEi = E0 +
X
1X
h̄ωlλ
.
h̄ωlλ +
βh̄ω
2 l,λ
e lλ − 1
l,λ
Spezifische Wärme
X h̄ωlλ /kB T
∂hEi
= kB
Cv =
∂T
eβh̄ωlλ − 1
l,λ
36.1
!2
eβh̄ωlλ .
Einstein Näherung für optische Phononen:
Die 1. Brillouin Zone wird durch eine Kugel um k = 0 mit gleichem Volumen (im k-Raum)
ersetzt. Die Frequenz eines jeden optischen Zweiges wird durch eine Konstante ωEi ersetzt
P
(i = 1 . . . 3(p − 1)). Dann ist l ausführbar und gibt einfach die Zahl der Einheitszellen im
Kristall an: N/p (p= Zahl der Atome pro Einheitszelle). Also
Cv =
3(p−1)
h̄ωEi
∂ N X
·
.
βh̄ωEi
∂T p i=1 e
−1
Jeder optische Zweig trägt also bei mit
N
h̄ωEi
Cvi = k B
p
kB T
!2
eh̄ωEi /kB T
.
(eh̄ωEi /kB T − 1)2
Man sieht, wie Cv exponentiell gegen 0 geht für T → 0. Die Näherung ωEi konstant zu setzen
ist natürlich nur gut für enge optische Zweige.
N
h̄ωEi
Cvi −→ kB
p
kB tT
!2
e−h̄ωEi /kB T
für T → 0
Wir sehen, wie der Beitrag optischer Phononen zur spezifischen Wärme exponentiell gegen
N kB
und
Null geht für T → 0. Für T → ∞: Cvi →
p
X
optische
Zweige
Cvi =
3p − 1
N kB
p
(Dulong-Petit)
In diesem Limes ergibt sich also das Ergebnis des Gleichverteilungssatzes.
36.2
Debye Näherung für akustische Zweige:
Die 1. Brillouin-Zone wird durch eine Kugel gleichen Volumens im k-Raum ersetzt (Radius
kD ). Die Frequenz eines jeden akustischen Zweigs wird ersetzt durch
ωkλ = cλ k .
Bestimmen wir kD : Da
X
1=
Zahl der Einheitszellen im Kristall
k
=
N
p
p = Zahl der Atome pro Einheitszelle
106
(Achtung: p nicht mit dem Druck verwechseln, der im folgenden nicht vorkommt), und
X
k
1→
Z kD
V Z 3
V
V 4π 3
2
d
k
=
4π
k
k
dk
=
(2π)3
(2π)3
(2π)3 3 D
0
ist
p 3
N
= 2 kD
V
6π
kD = Debyesche Wellenzahl
ωDλ = cλ kD = Debye Frequenz
kB ΘDλ = h̄ωDλ : Debye Temperatur
Dann erhält man für jeden akustischen Zweig λ den Beitrag zur spezifischen Wärme
∂ X h̄ωkλ
∂T k eβh̄ωkλ − 1
h̄cλ k
∂
V Z kD
4πk 2 βh̄c k
=
dk
3
∂T (2π) 0
e λ −1
Cv(λ) =
mit der Substitution
x=
h̄cλ k
kB T
V =
6π 2
N
3
pkD
und
wird daraus
cv(λ)
C (λ)
T
3
= v = kB
N
p
ΘDλ
3 Z
ΘDλ /T
0
|
T
x4 e x
4π 4
kB
dx
→
x
2
(e − 1)
5p
ΘDλ
{z
}
für T →0: 154 π4
3
.
Für T → 0 erhält man für den Beitrag der akustischen Phonen zur spezifischen Wärme
cv =
mit
Für T ΘD :
1 12π 4
T
kB
p 5
ΘD
3
3
1
1X
1
kB ΘD = h̄ωD = h̄c̄kD , ¯3 ≡
.
3 λ=1 c3λ
c
Cv →
3N
kB
p
Dulong Petit
Den Verlauf des Beitrags akustischer Phononen zur spezifischen Wärme eines Kristalls (für
p = 1) zeigt die folgende Figur
107
~
Typische Debye-Temperaturen sind:
Eisen
ΘD = 420 ◦ K
mittlerer Wert
C (Diamant)
ΘD = 1860 ◦ K
sehr hoch.
Je härter ein Material, desto höher c̄ und damit auch ΘD .
Vergleich der Debye Näherung für tiefe Temperaturen mit der Theorie des Photonengases:
(1) Die mittlere Schallgeschwindigkeit tritt an die Stelle der Lichtgeschwindigkeit.
(2) Ein zusätzlicher Faktor 2/3 tritt für das Photonengas auf, da ein Ast fehlt (es gibt
keine longitudinalen Photonen).
(3) Das Wellenzahl-Integral für das Photonengas geht nach ∞, nicht bis kD , da es keine
Gitterstruktur des leeren Raumes gibt im Photonengas (mindestens nicht bis hin zu
den kleinsten bis heute zugänglichen Längenskalen). D.h. im Kristall gibt es nur endlich
viele (3N ) Gitterschwingungen, im Vakuum dagegen unendlich viele elektromagnetische Schwingungen (“Moden“ des elektromagnetischen Feldes).
37
Massives Bose-Gas und
Bose-Einstein Kondensation
(Literatur: K. Huang, Band II, Kapitel XII)
Im Jahre 1924 sagten der (vorher völlig unbekannte) indische Physiker Bose, und später
dadurch angeregt der damals schon weltberühmte Einstein die Kondensation eines idealen
Gases bei tiefen Temperaturen in einen rein quantenmechanisch bestimmten Zustand, das
Bose-Einstein Kondensat, voraus. Heute weiß man, daß nur Teilchen mit ganzzahligem Spin
der von Bose und Einstein zuerst benutzten Statistik folgen, sie heißen daher Bosonen. Seit
Boses und Einsteins Vorhersage gab es viele Versuche, die Bose-Einstein Kondensation im
Labor zu realisieren oder beobachtete Systemeigenschaften damit in Verbindung zu bringen
oder zu erklären. Doch erst 1995 gelang es kurz nacheinander zwei amerikanischen Gruppen, Bose-Einstein Kondensate in verdünnten, nahezu idealen Gasen von Alkaliatomen zu
realisieren. Das Rennen gewann eine Gruppe um C. E. Wieman und E. A. Cornell am JILA in Boulder/ Colorado, denen es gelang, einige Tausend Rb87 -Atome im 5S1/2 , F = 2,
108
mF = −2 Zustand in einer Magnetfalle bis auf eine Temperatur von ca. 100nK abzukühlen,
wobei Bose-Einstein Kondensation im quantenmechanischen Grundzustand der Falle bei
TBE = 170nK beobachtet wurde. Dicht gefolgt wurde dieser Erfolg von einer Gruppe um
W. Ketterle am MIT in Boston, die andere Magnetfallen und Na23 -Atome im 3S1/2 , F = 1,
mF = −1 Zustand benutzen, die bis auf ca 2µK abgekühlt werden, wo sie ebenfalls ein BoseEinstein Kondensat bilden. In den MIT Experimenten handelt es sich um Kondensate von
106 −107 Atomen. Ein drittes etwa zeitgleiches Experiment mit Lithium Atomen (Li7 ) wurde
von R. G. Hulet et al an der Rice University in Houston durchgeführt. Auch dieses Experiment zeigt inzwischen in klarer Weise Bose-Einstein Kondensation für die Atome im 2S1/2 ,
F = 2, mF = −2 Zustand. Während sich sowohl Rb-Atome als auch Na-Atome schwach
abstoßen, ziehen sich Li-Atome schwach an, was für die Bose-Einstein Kondensation einen
wichtigen Unterschied macht.
Diese kurz nacheinander erzielten Erfolge beruhen auf experimentellen Fortschritten bei
der Konstruktion von Magnetfallen, und der Kühltechnik für Atomgase in solchen Fallen.
Die verwendete Kühltechnik ist eine Kombination von Laserkühlung, mit der Atome bis auf
ca 100µK vorgekühlt werden, und anschließender Verdampfungskühlung auf die benötigte
Endtemperatur.
Die Realisierung von Bose Einstein Kondensaten im Labor hat das Interesse an der Theorie dieses Phänomens neu belebt – u.a. auch in meiner Arbeitsgruppe. Betrachten wir ein
ideales Bose-Gas von Atomen der Masse m im thermodynamischen Gleichgewicht bei der
Temperatur T in einem festen Volumen V , das wir zunächst als endlich voraussetzen. Wir
nehmen der Einfachheit halber an, daß die Atome Spin S = 0 haben. Für den Hamiltonoperator
X
εk a+
H=
k ak
k
und
Nop =
X
a+
k ak
k
lautet das großkanonische Ensemble
%G =
1 −β P a+ ak (εk −µ)
k k
e
.
ZG
Es führt in der schon bekannten Weise auf die Plancksche mittlere Besetzungszahl
hnk (β, µ)i = eβ(εk −µ) − 1
−1
.
Da hnk i ≥ 0 für alle k gilt, und insbesondere auch für k = 0, muß für das massive ideale
P
Bose-Gas µ < ε0 sein. Zur Fixierung von µ (in D Dimensionen) ist hN i = k hnk i zu erfüllen.
Unser Ziel ist es, die Besetzungszahl im energetisch tiefsten Einteilchenzustand k = 0, ε0 = 0
zu bestimmen. Daher spalten wir die Summe auf in
hN i = hN0 i +
mit hN0 i =
z
,
1−z
X
k6=0
hnk i
z = eβµ = e−β|µ| , hnk i = z/(eβεk − z).
Für endliches Volumen muß die Summe im allgemeinen numerisch ausgewertet werden. Doch
109
für kB T sehr viel größer als der größte Abstand benachbarter
1-Teilchenniveaus (der wie
R
P
−2/3
V
skalt) können wir zum Integral übergehen, k → dεg(ε).
Es ist von einigem Interesse die folgende Diskussion für beliebige Dimension D zu führen,
nicht nur für D = 3. Für ein D-dimensionales Volumen V = LD für Λ L, wobei
Λ=
q
2πh̄2 β/m
die thermische deBroglie Wellenlänge ist, gilt
X
k
V
→
(2π)D
mit
X
k6=0
Z
V SD−1
d k→
(2π)D
D
V
g(ε) =
2
m
πh̄2
hnk i = V SD−1
Z
∞
0
SD−1
=V
(2π)D
Z
D
∞
0
dkk
D−1
=
Z
∞
0
g(ε)dε
D
SD−1 ε 2 −1 ,
1
k D−1 dk
D
−1
βε
(2π) z e k − 1
2m
βh̄2
!D/2 Z
∞
0
xD−1 dx
.
z −1 ex2 − 1
Hierbei ist SD−1 das Volumen der (D −1)-Sphäre (d.h. der (D −1)-dimensionalen Oberfläche
der D-dimensionalen Einheitskugel)
SD−1 =
2π D/2
.
(D/2 − 1)!
Durch Entwicklung des Integranden in eine geometrische Reihe und Übergang zur Integrationsvariablen y = (n − 1)x2 erhalten wir
hN i − hN0 i
1
=
V
(2π)D/2 D2 − 1 !
m
βh̄2
!D/2 Z
∞
0
D
dye−y y 2 −1
∞
X
zn
= Λ−D gD/2 (z) . (37.1)
D/2
n
n=1
Für D = 3 ist also g3/2 (z) relevant. Den Verlauf dieser Funktion zeigt die folgende Figur
g 3/2 (z)
2.612
0
1
110
z
Die Funktionenschar gp (z) ist definiert durch
gp (z) =
∞
X
zn
p
n=1 n
(Re(p) > 1, |z| ≤ 1) .
Für reelle p > 1 ist gp (z) auf der reellen z-Achse im Intervall 0 < z ≤ 1 monoton wachsend
und erreicht seinen Maximalwert gp (1) = ζ(p)(p > 1) für z = 1, d.h. µ = 0. Die Funktionen
gp (z) haben die folgenden asymptotischen Entwicklungen für z = e−α , α → 0:
p = 1:
p = 2:
p > 0,
Hier kann man das Integral exakt auswerten
mit dem Ergebnis
g1 (e−α ) = − ln(1 − e−α )
Asymptotisch für α → 0 gilt
g2 (e−α ) ∼ ζ(2) − α(1 − ln α) + 0(α2 )
nicht ganzzahlig
P
(−α)k
gp (e−α ) ∼ ζ(p) + Γ(1 − p)αp−1 + ∞
k=1 ζ(p − k) k!
speziell für p = 3/2
g3/2 (e−α ) ∼ 2.612.. − 3.545..α1/2 + 1.460..α + 0(α)2
Man findet diese Darstellungen (die auch für die analytische Fortsetzung für α < 0 verwendet
werden können) über die Mellin-Transformierte
Gp (s) =
Z
∞
0
gp (e−α )αs−1 = ζ(p + s)Γ(s) ,
die in der komplexen s-Ebene definiert ist und deren Umkehrung
gp (e−α ) =
1
2πi
Z
c+i∞
c−i∞
dsα−s ζ(p + s)Γ(s) ,
wobei der Integrationsweg s = c rechts aller Singularitäten von Gp (s) verläuft.
D > 2: Liegt hN i/V unter einem kritischen Wert, so ist die Gleichung (37.1) lösbar und
liefert z = e−β|µ| als Funktion von hN i/V . Dies ist für hinreichend hohe Temperaturen, oder
bei jeder gegebenen Temperatur bei hinreichend kleinen Teilchenzahldichten, stets der Fall.
Liegt jedoch die mittlere Teilchendichte hN i/V über dem temperaturabhängigen kritischen
Wert
Nc /V = ζ(D/2)/ΛD = const T D/2 ,
m 3/2
(für D = 3: Nc /V = 2.612 . . . ( 2πh̄
(kB T )3/2 ) der bis auf einen numerischen Faktor der
2)
Größenordnung 1 gleich dem inversen deBroglie-Volumen ΛD ist, so ist µ = 0 und es sammeln
sich alle überschüssigen Teilchen im 1-Teilchen Grundzustand k = 0, ε0 = 0 an. Dies ist die
Bose-Einstein Kondensation. Es gibt im Prinzip zwei Möglichkeiten, in einem Bose-Gas die
Bose-Einstein Kondensation zu erzwingen
1. Erniedrigung der Temperatur bei fester Teilchendichte unter die von der Teilchendichte
abhängige kritische Temperatur
k B Tc =
N
V ζ(D/2)
111
!2/D
2πh̄2
m
oder
2. Erhöhung der Teilchendichte bei fester Temperatur über den temperaturabhängigen
kritischen Wert Nc /V .
Wegen z = 1 für T < Tc oder hN i > Nc ist
hN i − hN0 i = V Λ
−D
T
ζ(D/2) = Nc = hN i
Tc
D/2
,
so daß wir hN0 i, im thermodynamischen Limes V → ∞, hN i/V fest, darstellen können
in den Formen

0
T > Tc
(hN i < Nc )
hN0 i
D/2
=
1 − T
hN i→∞ hN i
= 1 − NNc
T < Tc
Tc
lim
(hN i > Nc )
Hier haben wir benutzt, daß z < 1 für T > Tc und daher limhN0 i/V = lim(z/V (1 −
z)) = 0.
Für großes aber endliches Volumen V (und entsprechend endliche Teilchenzahl hN i) erfährt
der im Limes scharfe Übergang eine Abrundung, weil z nun über einen endlichen Übergangsbereich hinweg gegen 1 strebt.
Isotherme in der (|µ|, hN i) Ebene bei endlichem Volumen
In endlichen Systemen gibt es also keine vollkommen scharfe Phasenübergänge. Dies muß so
sein, da in endlichen Systemen Mittelwerte keine Singularitäten aufweisen können. Um den
Übergangsbereich aufzulösen, müssen wir die Bestimmungsgleichung für z
ΛD
hN i
ΛD z
= gD/2 (z) +
V
V 1−z
(37.4)
für endliches aber großes V lösen. Hierbei wird sich eine Lösung für z ergeben, die für
hN i > Nc und 0 < (Nc − hN i)/hN i 1 dicht unter z = 1 liegt. Setzen wir also z = e−β|µ| =
112
1 − β|µ| + 21 β 2 µ2 + . . . und entwickeln obige Gleichung nach β|µ|, so nimmt sie die Form an
für 2 < D < 4
!
D−2
ΛD 1
D
|βµ| 2 + O(β|µ|) .
+Γ 1−
V β|µ|
2
√
Speziell für D = 3 ist z.B. Γ(1 − D/2) = −2 π < 0. Wir erhalten also glatte Isothermen
c
= F (β|µ|), die hier dargestellt sind.
der Form hN i−N
V
Im Limes V → ∞, hN i/V fest, schmiegt sich diese Isotherme für D > 2 immer mehr der
gestrichelten Kurve an falls µ = −|µ| 6= 0, wo also dann hN i > Nc in diesem Limes |µ| = 0
ist: D.h. im Limes V → ∞ ergibt sich wieder der scharfe Phasenübergang.
Für D = 2 hat die Funktion gD/2 (z) die geschlossene Form
Λ
D
hN i − Nc
V
=
g1 (z) = − ln(1 − z) .
In diesem Fall tritt auch im Limes V → ∞, hN i/V fest, keine Bose-Einstein Kondensation
ein. Die Gleichung (37.4) ist nämlich selbst im Grenzfall V → ∞, in dem der letzte Term auf
der rechten Seite N0 /V gegen 0 tendiert, für beliebig große Teilchendichten immer lösbar.
i
Im Grenzfall Λ2 hN
1 ergibt sich z.B. das Ergebnis
V
−βµ ' e−
Λ2 hN i
V
D=2,
womit die Besetzungszahl im Grundzustand asymptotisch geht wie
N0 ' e Λ
2 hN i/V
D=2,
so daß N0 /hN i = 0 im thermodynamischen Limes V → ∞, hN i/V = const . Im ganzen
Bereich D ≤ 2 tritt keine Bose-Einstein Kondensation auf. Zwar ist gD/2 (z) nicht in geschlossener Form bekannt, doch kann man für ΛD hN i/V die asymptotische Entwicklung für
z → 1 benutzen, und wir erhalten im thermodynamischen Limes
Λ
D hN i
V
D
'Γ 1−
2
woraus

−βµ ' 
Γ 1−
D
2
ΛD hN i
V
1
(β|µ|)1−D/2
2
 2−D

∼
1
N0
D<2,
D<2
folgt. Kehren wir nun zum Fall D = 3 im thermodynamischen Limes zurück und diskutieren
dessen thermodynamische Eigenschaften
1. Fugazität z = eβµ :
Für T < Tc , N > Nc ergab sich z = 1. Für T > Tc ist der Beitrag des Grundzustands in
Gl. (37.4) im thermodynamischen Limes vernachlässigbar, und wir erhalten für z → 1
Λ3
hN i − Nc
' −2Γ(1/2)(ln z −1 )1/2 + O(ln z −1 )
V

!2 
3
Λ
(N
−
hN
i)
T > Tc
c

√
z = eβµ ' exp −
hN
i < Nc
2 πV
113
P
2. Energie E = k εk hnk i:
Beim Übergang zum Integral braucht in diesem Fall, im Gegensatz zur Berechnung der
mittleren Teilchenzahl, der Grundzustand nicht abgespalten zu werden, da er selbst im
Bose-Einstein kondensierten Zustand nicht zur Energie beiträgt (ε0 = 0).
Die Auswertung des Integrals nach der schon bekannten Methode liefert
hEi =
3

2
V
g (z)
βΛ3 5/2
T > Tc ,
hN i < Nc
V
g (1)
2 βΛ3 5/2
T < Tc ,
hN i > Nc

3
.
Durch Differentiation nach V , bei festgehaltenen Besetzungszahlen der 1-Teilchenzustände,
und nach T bei konstanten V , gewinnen wir aus diesem Ergebnis den Druck und die spezifische Wärme cV .
1 ∂hEi ∂hEi
.
|s , c V =
p=−
∂V
V ∂T V
Aus den Energieeigenwerten
E{n} =
X 2π 2
L
n
folgt mit L = V 1/3
h̄2 n2
nn
2m
∂E{n}
2
|{n} = − E{n} .
∂V
3V
Daher gilt


1
2hEi  βΛ
p=
=

3V
 1
3
g5/2 (z)
T > Tc , hN i < Nc
g (1)
βΛ3 5/2
T < Tc , hN i > Nc
Die Isothermen sind im folgenden dargestellt.
p
Übergangskurve
A
B
T
Isothermen bei BEC
114
.
Die Übergangskurve, zunächst in der (T, P )-Ebene, erhalten wir, indem wir z = 1 setzen.
Sie ist gegeben durch
kB T
m
p= 3
g5/2 (1) = (kB T )5/2
Λ (T )
2πh̄
3/2
g5/2 (1) .
Auch im Bose-Einstein kondensierten Gebiet hN i/V > (N/V )c sind sämtliche Isochoren
(Kurven mit V =const) durch diese eine Kurve gegeben, wobei die Isochoren dann aber
bei der jeweiligen kritischen Temperatur Tc (N/V ) enden, während auf der Übergangskurve
hN i/V = Nc (T )/V nicht konstant bleibt, sondern sich T -abhängig einstellt.
In der (V, p)-Ebene ergibt sich die Übergangskurve aus Tc = Tc (N/V ) als
hN i
V
p=
!5/3
2πh̄2 ζ(5/2)
.
m (ζ(3/2))5/3
Die explizite Form der Isothermen für V /hN i > (V /N )c in der Nähe der Übergangskurve
folgt aus der asymptotischen Darstellung von g5/2 (z) und g3/2 (z) für z → 1,
g5/2 (z) ' ζ(5/2) − ζ(3/2)(1 − z) + O (1 − z)3/2
für die Isothermen ergibt sich



!2
!3

N
−
hN
i
Λ3 (Nc − hN i)
1 
c

 .
√
+
O
ζ(5/2)
−
ζ(3/2)
p'

βΛ3 
2 πV
V
Um die spezifische Wärme cV aus hEi zu berechnen, brauchen wir die Ableitung
∂g5/2 (z)
∂T
!
N
V
dg5/2 (z)
=
dz
∂z
∂T
!
.
N
V
Allgemein gilt dgn (z)/dz = gn−1 (z)/z. Um auch (∂z/∂T )N/V zu bestimmen, lösen wir die
Identität
!
!
∂(N/V )
∂z
1
3 1
0=
=
g3/2 (z) + 3 g1/2 (z)
∂T
2 Λ3 T
Λ z
∂T N
N
V
V
nach der gesuchten Größe auf. Damit erhalten wir schließlich

h
15 V


3
 4 Λ g5/2 (z) −
CV
=

kB

 15
2
3 (g3/2 (z))
5 g1/2 (z)
V
ζ(5/2)
4 Λ3
i
T > Tc
.
T < Tc
Durch Anwendung der asympotischen Entwicklungen ist es wieder möglich CV auch für
T > Tc explizit als Funktion von T darzustellen.
115
3
2
-
~
T
Spezifische Wärme als Funktion der Temperatur
Die Entropie schließlich kann durch die Integralbeziehung
S=
Z
T
0
dt
CV
T
ausgewertet werden. Für T < Tc ergibt sich wegen CV ∼ T 3/2 unmittelbar
5 hEi
2
S = CV =
3
3 T
T < Tc .
Die spezifische Wärme CV (T ) hat bei T = Tc eine Singularität, nämlich einen Sprung in der
(g (z))2
asymptotisch entwickelt und
Ableitung, der sich berechnen läßt, indem g5/2 (z) − 53 g3/2
1/2 (z)
nach T differenziert wird, unter Benutzung des schon hergeleiteten Ausdrucks für dz/dT .
38
Molekularfeldtheorie kritischer Phänomene
(Literatur: W. Brenig, Kapitel 43, 44, 45)
38.1
Phasenübergänge 1. und 2. Ordnung
Wir kennen schon die verschiedenen Phasen fest, flüssig, gasförmig. Im festen Zustand gibt es
weitere unterschiedliche Phasen, die sich bezüglich anderer Eigenschaften unterscheiden, z.B.
verschiedene Kristallarten ein und derselben Substanz, ferromagnetische, antiferromagnetische, ferroelektrische, supraleitende Phasen. Verschiedene Phasen unterscheiden sich durch
Symmetrien, z.B. zeichnet die ferromagnetische und auch die antiferromagnetische Phase
eine bestimmte Richtung (die Richtung der Magnetisierung (Ferromagnet) oder der alternierenden Magnetisierung (Antiferromagnet) aus. Innerhalb einer Phase sind alle Zustandsänderungen immer stetig, ohne Singularitäten. Phasenübergänge sind natürlich Übergänge zwischen verschiedenen Phasen. Diese können unstetig in ersten Ableitungen der freien Enthalpie
(Phasenübergänge 1. Ordnung) oder stetig in diesen ersten Ableitungen der freien Enthalpie
verlaufen (Phasenübergänge 2. Ordnung). Nehmen wir an, ein Phasenübergang verläuft zwischen zwei Phasen A,B, von denen die Phase A weniger symmetrisch sei als B, und zwar so,
116
daß A nur noch eine Untersymmetrie von B aufweist. Z.B. sei in B keine Richtung ausgezeichnet, d.h. man hat volle Rotationssymmetrie, während in A eine Richtung ausgezeichnet
sei, so daß A nur noch Rotationssymmetrie um eine Achse in der Vorzugsrichtung besitzt.
Dies ist eine Untersymmetrie der Symmetrie in B, d.h. die Symmetriegruppe von A ist eine
Untergruppe der Symmetriegruppe von B. Dann muß der Phasenübergang von A nach B
(und von B nach A) stetig verlaufen, denn am Übergangspunkt muß die Symmetriegruppe
von A mit der von B übereinstimmen, was nur dann sein kann, wenn ein Parameter in A
am Übergangspunkt stetig gegen 0 geht, womit A stetig in B übergeht. Solche stetigen Phasenübergänge, d.h. Phasenübergänge 2. Ordnung, treten an sog. kritischen Punkten oder an
Linien von kritischen Punkten auf. Ein Beispiel ist der flüssig-gasförmige Übergang. Er ist
unstetig (1. Ordnung) für T < Tc . D.h. am Phasenübergang ändert sich z.B. das spezifische Volumen unstetig. Für T = Tc ist dagegen die Änderung des spezifischen Volumens bei
p = pc stetig, der Phasenübergang ist dort von 2. Ordnung.
Ein anderes Beispiel ist ein Ferromagnet. Liegt kein äußeres Magnetfeld an, so ist oberhalb der Curie-Temperatur Tc keine Vorzugsrichtung ausgezeichnet. Kühlt man ab, so hat
das System bei Tc einen kontinuierlichen Phasenübergang, bei dem spontan eine Magnetisierung hMi entsteht, die bei T = Tc Null ist, aber für T ≤ Tc stetig von Null auf einen
endlichen Gleichgewichtswert anwächst. Legt man dagegen ein äußeres Magnetfeld an, so
ist für T < Tc die Magnetisierung eine unstetige Funktion des äußeren Magnetfeldes, da sie
sich sprunghaft ändert, z.B. von +|Mz | zu −|Mz |, wenn das Magnetfeld in z-Richtung stetig
reduziert wird, so daß es sein Vorzeichen wechselt. Der Phasenübergang ist nun 1. Ordnung.
Das Verhalten von Systemen in der Umgebung von kritischen Punkten ist besonders faszinierend: Wie kommt es zur spontanen Symmetriebrechung? Wie findet das System in der
weniger symmetrischen Phase z.B. seine Vorzugsrichtung? Man kann erwarten, daß große
Fluktuationen auftreten werden, wenn das System hin- und hergerissen ist zwischen den
verschiedenen Möglichkeiten, die alle gleichberechtigt sind, bis es sich schließlich für eine
wie auch immer entscheidet. Die physikalischen Phänomene, die dabei auftreten, nennt man
kritische Phänomene. Hier behandeln wir diese in einer einfachen, aber nur im 10% Bereich
richtigen Theorie: der Molekularfeldtheorie.
38.2
Molekularfeldtheorie
Betrachten wir einen uniaxialen Ferromagneten mit Hamiltonfunktion (für Spin 1/2)
H = −µB gB
X
n
sz (n) −
1 X
Jnn0 sz (n)sz (n0 ) .
2 hn,n0 i
(38.1)
Wegen der Wechselwirkung handelt es sich um kein 1-Teilchen Problem mehr. Die Idee
der Molekularfeldtheorie ist es, das Problem (38.1) durch ein effektives 1-Teilchenproblem
zu ersetzen, indem man jeden Spin im effektiven Feld alle übrigen Spins betrachtet. Dabei
müssen allerdings Fluktuationen vernachlässigt werden. Mit
− 12
X
Jnn0 sz (n)sz (n0 )
hn,n0 i
'−
1 X
1 X
(Jnn0 hsz (n)isz (n0 ) + Jnn sz (n)hsz (n0 )i) +
Jnn0 hSz (n)ihSz (n0 )i
2 hn,n0 i
2 hn,n0 i
117
=−
1 J hM i2
hM i X
sz (n) +
J
µB gN n
2 (µB g)2 N
wobei
J=
X
Jnn0
hM i
= N hsz (n)i
µB g
,
n0
erhalten wir näherungsweise
!
V
hM i X
sz (n) + W
H ' Heff = −µB g B + W
V
2
n
wobei
W =
hM i
V
!2
J
.
n(µB g)2
Der letzte Term in Heff ist unabhängig von der Spinvariablen sz (n) und fällt in der kanonischen Verteilung bei der Normierung weg. Für dieses 1-Teilchenproblem können wir nun die
mittlere Magnetisierung berechnen aus
hM i = N µB g
und erhalten
sz (n) −βHeff
e
Z
{sz (n)}
X
"
hM i
hM i = µB gN tanh βµB g B + W
V
!#
,
was wir nach B auflösen können
kB T
B=
artanh
µB g
hM i
µB gN
!
−W
hM i
V
M
Ms
M∞
T
T= c
T>Tc
T<Tc
B
-M∞
Magnetisierung in der Molekularfeld-Theorie
Am kritischen Punkt gilt
∂B
∂2B
=0 ,
=0
∂M
∂M 2
was hM ic = 0, kB Tc = (µB g)2 nW = J ergibt.
Auch die van der Waalssche Zustandsgleichung ist eine Molekularfeldtheorie: Jedes Atom
118
bewegt sich im Potentialfeld aller anderen, was zu einer globalen Verringerung des effektiven
Volumens führt v → v − b, wegen der harten Kerne der Atome (Parameter b), und zu einer
Erhöhung des effektiven Drucks p → p + a/v 2 wegen der globalen attraktiven Wechselwirkung. An die Stelle des “Ordnungsparameters“ hM i/V tritt die Teilchendichte n − nc , an
die Stelle der zugehörigen “generalisierten Kraft“ B (mit dF = BdhM i) tritt das chemische
Potential µ (mit dF
= µd(n − nc )). Für das van der Waals Gas gilt
V
#
"
bn
λ3 (T )n
+
− 2an .
µ = kB T ln dB
1 − bn
1 − bn
Am kritischen Punkt gilt
∂2µ
∂µ
=0 ,
=0
∂n
∂n2
was nc = 1/(3b), kB Tc = 8a/(27b) ergibt, und aufgetragen. Entwickeln wir um den kritischen
Punkt:
9
µ − µc (T ) = 2aτ (n − nc ) + ab2 (n − nc )3
2
wobei
"
λ3
µc (T ) = kB T ln dB
2b
T
−1
τ=
Tc
und
!
#
1
2a
+
−
2
3b
M 2
W
M
.
+
B = Wτ
V
3(nµB )2 V
Die Dichte der freien Energie in der Nähe des kritischen Punktes hat dann die Form, wegen
∂f
∂f
µ = ∂n
, bzw. B = ∂(M/V
. Hier ist f definiert als f = F/V und nicht wie früher in Kap. 21
)
als f = F/N . Also nf (Kap. 21)−→ f .
f = f0 + µc (t)(n − nc ) + aτ (n − nc )2 +
bzw.
f = f0 +
Führen wir f˜ ein mit µ − µc (T ) =
W
M
τ
2
V
∂ f˜
,
∂n
2
+
W
12(µB n)2
9 2
ab (n − nc )4
8
M
V
4
.
dann ist
9
f˜ = f0 + aτ (n − nc )2 + ab2 (n − nc )4
8
Als nächstes betrachten wir die Verallgemeinerung auf den inhomogenen Fall: Addieren wir
a`2 (∇n)2 /2 bzw. W `2 (∇hM i/V )2 /2 zur freien Energiedichte. Höhere Gradiententerme sind
natürlich auch möglich, werden aber bei langwelligen Schwankungen kleiner sein. ` ist eine
Länge und parametrisiert die Reichweite der Wechselwirkung. Führen wir allgemein ein
Ordnungsparameter-Feld ϕ(x) ein mit
ϕ2 (x) =

2
2

 a` (n − nc ) /kB Tc


W `2 M 2 /(V 2 kB Tc )
119
dann schreibt sich die freie Energie als
F − F 0 = k B Tc
Z
κ
g
1
d x (∇ϕ)2 + ϕ2 (x) + ϕ4 (x) − hϕ(x)
2
2
4
3
mit
κ = τ /`2
ξ = `/|τ |1/2
,
wobei
h=
,
τ=
T − Tc
Tc


 (µ − µc ) · const


B · const
Die Entropie S = −∂F/∂T erhält man, wenn man nach der T -Abhängigkeit in κ differenziert
als
kB Z
S − S 0 = − 2 ϕ2 d 3 x .
2`
38.3
Molekularfeldtheorie kritischer Phänomene
Der Ordnungsparameter ϕ fluktuiert mit der Wahrscheinlichkeitsverteilung
W ({ϕ}) ∼ exp(−F ({ϕ})/κB T ). Wir vernachlässigen jedoch die Fluktuationen und ersetzen
Mittelwerte durch wahrscheinlichste Werte, die sich aus F = min, d.h. δF = 0 ergeben. Bei
Variation δϕ(x) ergibt δF = 0
δF = kB Tc
Z
n
o
d3 xδϕ(x) −∇2 ϕ + κϕ + gϕ3 − h = 0 .
Also
h(x) = (κ − ∇2 )hϕi + ghϕi3 .
Für
h=0
hϕi = 0 r
hϕi = ±
|κ|
g
=±
r
,κ>0
|τ |
`2 g
,κ<0
spontane Symmetriebrechung
hϕi ist stetig bei T = Tc . Für die Entropie
kB V
|τ |
T < Tc
2`4 g
!
!
∂S
∂S
kB V
−
= 4 .
∂T T →Tc −0
∂T T →Tc +0
2` g
S − S0 = −
∆C =
Die spezifische Wärme macht einen Sprung.
Kritische Isotherme:
Für T = Tc gilt h = ghϕi3 . Daher erhält man für die Suszeptibilität für T = Tc
χ=
1
∂hϕi
1
1
= ∂h =
= 1/3 2/3
2
∂h
3ghϕi
3g h
∂hϕi
120
d.h. χ divergiert für h → 0 wie h−2/3 .
Suszeptibilität bei räumlich inhomogenem Feld
δh(r) =
Z
d3 k ik·x
e δh(k) .
(2π)3
Durch Fouriertransformation
Für k → 0
δh(k) = (k 2 + κ + 3ghϕi2 )δϕ(k)
≡ χ−1 (k)δϕ(k)
 1
T > Tc

 k2 +κ
χ(k) =


1
T < Tc
k 2 +2|κ|
χ(k) → χ(0) =
1

κ


T > Tc
1
2|κ|
T < Tc
Für Ferromagneten ist dies das Curie-Weissche Gesetz, das also für alle Phasenübergänge
2. Ordnung (in Molekularfeldnäherung) gilt.
2
2 2
−1/2
Für k 6= 0: χ(k)
=
q hängt nur von k /κ = ξ k ab, wobei ξ = |κ|
`/ |τ | die für T → Tc divergierende Korrelationslänge
im System ist.
Die Divergenz der Korrelationslänge am kritischen Punkt ist gewissermaßen die “Ursache“ für die am kritischen Punkt auftretenden Singularitäten. Insbesondere ist dies auch der
Grund für das Anwachsen der Streuintensität von Licht am kritischen Punkt.
38.4
Ginzburg-Kriterium
Aber sind Fluktuationen wirklich vernachlässigbar? Betrachten wir zunächst die Fluktuationen von ϕ(x) = hϕ(x)i + δϕ(x). Wegen
T δ ln Z
Tc δh(x)
2
δ 2 ln Z
T
2
h(δϕ(x)) i = lim
x0 →x Tc
δh(x0 )δh(x)
δhϕ(x)i
' lim
0
x →x δh(x0 )
= lim
χ(x − x0 )
0
hϕ(x)i =
x →x
=
1
(2π)d
Z
dd kχ(k) .
(38.2)
Wir benutzen hier einen für die Theorie kritischer Phänomene wichtigen Trick: Wir untersuchen das Problem zunächst in beliebigen Dimensionen d. In das Integral (38.2) setzen
wir
1
χ(k) = 2
k + |κ|
121
ein, wobei = 1 für T > Tc oder = 2 für T < Tc ist. Also
h(δϕ)2 i =
1
1 Z kc d
d k 2
.
d
(2π) 0
k + |κ|
Dabei ist kc = (Gitterkonstante)−1 ein “Cut-off“, der von den mikroskopischen Gitterstruktur des Systems herrührt. Das Integral konvergiert bei k = 0 auch für |κ| = 0, falls
d − 1 − 2 > −1, also d > 2 ist – auch untere kritische Dimension genannt. Nun wollen wir
untersuchen, wann diese Fluktuationen in der eigentlich vorliegenden exakten MittelwertGleichung
1 T
h= 2
− 1 hϕi + ghϕ3 i
` Tc
vernachlässigbar sind, so daß näherungsweise, wie in der Molekularfeldtheorie angenommen,
hϕ3 i ' hϕi3 gilt, d.h. die bisher betrachtete Gleichung in Molekularfeldnäherung (in der wir
nun κm statt κ schreiben)
1
h' 2
`
T
−1
Tcm
hϕi + ghϕi3 ≡ κm hϕi + ghϕi3 .
Mit ϕ = hϕi + δϕ gilt für kleine Gaußsche Fluktuationen hϕ3 i ' hϕi3 + 3hϕihδϕ2 i, wobei
wir hδϕ3 i vernachlässigt haben. Also
h=
1
`2
T
− 1 + 3ghδϕ2 i hϕi + ghϕi3 ≡ κhϕi + ghϕi3 .
Tcm
Jetzt sehen wir, daß sich die wirkliche kritische Temperatur, definiert durch das Verschwinden
des neuen Vorfaktors κ von hϕi, etwas verschiebt durch die Fluktuationsbeiträge, und zwar
ist
Tc
= 1 − 3g`2 hδϕ2 (Tc )i .
Tcm
Diese Verschiebung macht die Molekularfeldtheorie noch nicht ungültig. Um sie verläufig
zu retten, müssen wir nur die kritische Temperatur Tc als verschieden von Tcm zulassen.
Führen wir also τ = TTc − 1 als neue reduzierte Temperatur ein. Dann lautet unsere durch
kleine Fluktuationsbeiträge korrigierte Zustandsgleichung
1
h= 2
`
T
Tc
−1
+ 3g hδϕ2 (T )i − hδϕ2 (Tc )i hϕi + ghϕi3 .
Tc
Tcm
Unser Koeffizient κ ist durch den Vorfaktor von hϕi gegeben. Er geht nun auch in die Formel
1
für χ(k) = k2 +|κ|
und für hδϕ2 i ein. Also haben wir die Beziehung
Z
kc
Tc
1
3g
1
1 T
d
−1
+
d
k
−
κ= 2
` Tc
Tcm (2π)d
k 2 + |κ| k 2
Z kc
Tc
1 T
3g|κ|
1
= 2
−1
−
dd k 2
.
d
` Tc
Tcm
(2π)
(k + |κ|)k 2
!
Allerdings: Nur wenn das Integral konvergiert für |κ| → 0 ergibt sich wirklich κ ∼ TTc − 1
im Einklang mit der Molekularfeldtheorie. Dies ist erfüllt für Dimension d > 4. In Dimension
122
d < 4 dagegen bricht die Molekularfeldtheorie hinreichend dicht am kritischen Punkt (also
für kleine |τ |) zusammen. Wie dicht darf man an τ = 0 herangehen, ehe das passiert?
Offenbar muß gelten (Ginzburg Kriterium)
3g
(2π)d
bzw. für τ → 0
Z
kc
0
dd k
k 2 (k 2
1
1
+ |κ|)
d
3g|τ /`2 | 2 −2 · J 1
wobei (wohl gemerkt für d < 4)
J=
Z
∞
0
dd x
1
x2 (x2 + )
eine Konstante ist. Für d = 3 also wird der kritische Bereich, in dem die Molekularfeldtheorie versagt, umso enger, je größer `2 ist (langreichweitige Wechselwirkung) und je kleiner
g ist. Innerhalb des kritischen Bereichs muß die Molekularfeldtheorie durch die moderne
Renormierungsgruppentheorie kritischer Phänomene ersetzt werden (siehe Z.B. D. J. Amit,
Field Theory, the Renormalization Group, and Critical Phenomena, McGraw-Hill, Düsseldorf 1978).
123

Zugehörige Unterlagen

∑ ∑ ∑

Grundlagen der Stochastik

Diskrete Mathematik II - CITS - Ruhr

Statistische Mechanik und Thermodynamik

Zugehörige Unterlagen

Produkte

Unterstützung

Statistische Mechanik und Thermodynamik

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können