Thermodynamik und Statistische Physik

Werbung
Thermodynamik und Statistische Physik
A. Klümper
Theoretische Physik, Bergische Universität Wuppertal
Inhaltsverzeichnis
Thermodynamik und Statistische Physik
A. Klümper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
2
3
4
1
Grundlagen der Statistischen Physik . . . . . . . . . . . . . . . . .
5
1.1 Grundbegriffe der Dynamik und Statistik . . . . . . . . . . .
5
1.2 Statistische Gesamtheiten . . . . . . . . . . . . . . . . . . . .
8
1.3 Das thermische Gleichgewicht . . . . . . . . . . . . . . . . . . 12
1.4 Mikrokanonische Gesamtheit . . . . . . . . . . . . . . . . . . 16
1.5 Die kanonische Gesamtheit . . . . . . . . . . . . . . . . . . . 17
1.6 Großkanonische Gesamtheit . . . . . . . . . . . . . . . . . . . 21
1.7 Thermodynamische Potentiale . . . . . . . . . . . . . . . . . 22
1.8 Die Entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Thermodynamik des Gleichgewichts . . . . . . . . . . . . . . . . . 29
2.1 Abriß der klassischen Thermodynamik . . . . . . . . . . . . . 29
2.2 Thermodynamische Größen . . . . . . . . . . . . . . . . . . . 38
2.3 Thermodynamische Relationen (Maxwell Relationen) . . . . 45
2.4 Irreversible Prozesse . . . . . . . . . . . . . . . . . . . . . . . 48
2.5 Tieftemperaturverhalten: Nernst’sches Theorem (3. Hauptsatz) 50
2.6 Phasengleichgewichte . . . . . . . . . . . . . . . . . . . . . . 51
2.7 Mehrkomponentige Systeme, Lösungen . . . . . . . . . . . . 56
Gleichgewichtseigenschaften makroskopischer Systeme . . . . . . . 61
3.1 Die klassische Näherung . . . . . . . . . . . . . . . . . . . . . 61
3.2 Die idealen Gase . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.3 Photonen-Gas als ideales Bose-Gas . . . . . . . . . . . . . . . 72
3.4 Ideales Fermionen-Gas bei tiefen Temperaturen . . . . . . . . 75
3.5 Thermodynamik eines Gases aus mehratomigen Molekülen . 80
3.6 Allgemeines ideales Bosegas . . . . . . . . . . . . . . . . . . . 83
3.7 Verdünnte Systeme, Virialentwicklung . . . . . . . . . . . . . 90
3.8 Magnetische Erscheinungen . . . . . . . . . . . . . . . . . . . 94
Phasenübergänge und kritische Systeme . . . . . . . . . . . . . . . 102
4.1 Vorüberlegungen . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.2 Van-der-Waals-Modell für Phasenübergänge . . . . . . . . . . 103
4.3 Ising-Modell in Molekularfeld-Näherung . . . . . . . . . . . . 106
4.4 Bogoliubov’sches Variationsprinzip . . . . . . . . . . . . . . . 108
4.5 Eindimensionale klassische Systeme und Transfermatrix-Zugang113
Thermodynamik und Statistische Physik
5
4.6 Monte-Carlo-Verfahren . . . . . . . . . . . . . . . . . . .
4.7 Elementares zur Renormierungsgruppe (RG) . . . . . . .
4.8 Das Ginzburg-Landau-Modell . . . . . . . . . . . . . . . .
Vermischtes . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1 Chemische Reaktionen . . . . . . . . . . . . . . . . . . . .
5.2 Osmotischer Druck . . . . . . . . . . . . . . . . . . . . . .
5.3 Rotationsfreiheitsgrade von Molekülen identischer Atome
5.4 Globale Konvexität der thermodynamischen Potentiale .
.
.
.
.
.
.
.
.
3
.
.
.
.
.
.
.
.
116
119
127
136
136
137
138
138
4
A. Klümper
Historisch gesehen wurde die Statistische Physik (bzw. Statistische Mechanik) konzipiert, um Begriffe und Gesetzmäßigkeiten der Thermodynamik
(auch “Wärmelehre”) atomistisch zu deuten. Der Inhalt der Thermodynamik
ist dabei die Beschreibung von makroskopischen Eigenschaften von makroskopischen Systemen unter Benutzung von thermodynamischen Begriffen wie
Temperatur, Druck, Wärme, Entropie etc. Ein makroskopisches System ist
dabei ein “großes” System mit einer Zahl von Freiheitsgraden ≃ 1023 , o.ä.
Viele Lehrbücher beginnen im Sinne der historischen Entwicklung mit der
Thermodynamik, d.h. den Hauptsätzen und ihren Anwendungen, und beschäftigen
sich erst später mit der Herleitung der Thermodynamik auf der Grundlage
von Quantenmechanik und Statistik.
Wir wollen hier den logischen Weg einschlagen und folgen etwa dem folgenden Blockdiagramm
Quantenmechanik
(klassische Mechanik)
Statistik
Statistische Physik
(Kapitel I)
Thermodynamik
(Kapitel II)
Anwendungen
(Kapitel III,IV)
Wir gehen aus von der Quantenmechanik (falls angebracht, werden wir auch
den Grenzfall der klassischen Mechanik betrachten) und mit den Prinzipien
einer statistischen Beschreibung werden wir das thermodynamische Gleichgewicht behandeln. Die eigentliche Thermodynamik folgt dann ganz zwangsläufig.
Schließlich werden wir einige wichtige Anwendungen besprechen.
Thermodynamik und Statistische Physik
1
1.1
5
Grundlagen der Statistischen Physik
Grundbegriffe der Dynamik und Statistik
Betrachte: N ≃ 1023 wechselwirkende Teilchen bzw. Freiheitsgrade, typisch
für ein makroskopisches System.
Unter einem quantenmechanischen Zustand, im folgenden auch Mikrozustand genannt, verstehen wir einen Vektor |ψ(t)i im Hilbertraum, dessen
zeitliche Entwicklung durch die Schrödingergleichung bestimmt ist
˙ = H|ψi.
ih̄|ψi
(1.1)
Physikalische Meßgrößen entsprechen den quantenmechanischen Erwartungswerten von Observablen A
hAiq.m. = hψ|A|ψi.
(1.2)
Der Zustand |ψi für ein makroskopisches System enthält sehr viele Detailinformationen. Man denke beispielsweise an die Ortsdarstellung
ψ = ψ(r1 , ..., rN ; t)
(1.3)
Selbst wenn die Ortsvariablen ri nur jeweils zwei (!) verschiedene Werte annehmen könnten, wäre der zugrunde liegende Hilbertraum 2N -dimensional,
wobei typischerweise N ≃ 1023 . Dies liefert eine (super-) astronomische Zahl,
die jenseits der Leistungsfähigkeit aller Rechner liegt.
Dennoch existiert der Zustand eines derart großen Systems. Wir sprechen
synonym zum Mikrozustand auch von einem reinen Zustand |ψi, zu dem
der Projektor Pψ = |ψihψ| definiert wird. (Hier wurde Normierung hψ|ψi =
1 vorausgesetzt.)
Im allgemeinen ist ein betrachtetes physikalisches System nicht hinreichend
isoliert, daß eine Beschreibung durch einen reinen Zustand möglich wäre.
Beispiel: Gesamtsystem bestehend aus Laborsystem und Umwelt kann durch
einen reinen Zustand beschrieben werden, die Beschränkung auf das Laborsystem gibt Anlaß zur Definition des gemischten Zustandes, siehe auch
Übungen: viele Mikrozustände |ni mit hn|ni = 1 repräsentieren das System
mit den Wahrscheinlichkeiten
X
wn ,
wn = 1
(1.4)
n
in der Weise, daß Erwartungswerte von Observablen sich ergeben zu
X
A=
wn hn|A|ni
n
(1.5)
6
A. Klümper
Diese Erwartungswerte lassen sich kompakt schreiben durch Verwendung des
Dichteoperators (Verteilungsfunktion)
X
ρ=
wn |nihn|
(1.6)
n
bzw. ρ(t) =
X
n
wn |n, tihn, t|
(1.7)
ρ ist eine gewichtete Summe von Projektionsoperatoren |nihn|, wobei die |ni
normiert seien, aber nicht notwendigerweise orthogonal! Es gilt
hAi = Sp ρA
(1.8)
Beweis:
Sp ρA = Sp
X
n
wn |nihn|A =
X
n
wn Sp |nihn|A = hAi
| {z }
(1.9)
hn|A|ni
Also charakterisiert ρ den Zustand des Systems vollständig.
Die Eigenschaften von Dichteoperatoren sind:
a) ρ hermitisch
b) positiv semidefinit
c) Sp ρ = 1
Beweis: a) klar, b) für einen beliebigen Zustand ψ gilt
X
X
hψ|ρ|ψi =
wn hψ|nihn|ψi =
wn |hψ|ni|2 ≥ 0,
n
(1.10)
n
c) klar.
Man kann zeigen, daß jeder Operator mit den Eigenschaften a),b),c) eine
Darstellung wie in (1.7) hat, mit sogar orthonormierten |ni. Dazu gehe man
in die Spektraldarstellung (d.h. Eigenbasis) zu ρ.
Bemerkung: Darstellungen wie (1.7) sind nicht eindeutig!
Der Grenzfall eines Dichteoperators ist der Projektor (d.h. der reine Zustand):
w1 = 1, Rest wn = 0 für n 6= 1. Wie schon besprochen ist dies der Fall der
üblichen Quantenmechanik. Im Zusammenhang mit dem “Gemisch” spricht
man auch von “Quantenstatistik”.
Zeitabhängigkeit: Dynamische Gleichung
˙ = H|ni mit dem Hamiltonoperator H
Aus der Schrödingergleichung ih̄|ni
folgt
Thermodynamik und Statistische Physik
ih̄ρ̇ = ih̄
Xh
n
7
i
˙
˙ = Hρ − ρH
|nihn|
+ |nihn|
(1.11)
i
ρ̇ = − [H, ρ].
h̄
(1.12)
woraus die von-Neumann-Gleichung folgt
(Beachte: die Zustände |ni sind der Zeitentwicklung unterworfen, nicht jedoch
die Wahrscheinlichkeiten wn .) Diese Gleichung gestattet es, im Schrödingerbild
die Zeitabhängigkeit von ρ(t) zu berechnen, sofern die Anfangsbedingung
ρ(t0 ) = ρ0 zu einer Zeit t0 (=0 z.B.) bekannt ist. Für nicht explizit zeitabhängige
H gilt
ρ(t) = e−(i/h̄)Ht ρ0 e(i/h̄)Ht
(1.13)
Alternativ kann natürlich im Heisenbergbild mit zeitunabhängigen Zuständen
und zeitabhängigen Observablen
A(t) = e(i/h̄)Ht Ae−(i/h̄)Ht
(1.14)
hAi(t) = Sp ρ(t)A = Sp ρA(t)
(1.15)
gerechnet werden, so daß
Klassische Mechanik: In vielen Fällen (insbes. bei hoher Temperatur)
können wir von der quantenmechanischen Beschreibung absehen und zum
Grenzfall der klassischen Mechanik übergehen (Achtung: auch hier gibt es
Überbleibsel der Quantenstatistik, s. Gibbsches Paradoxon). Wir betrachten
also N -viele Massenpunkte im 3-dimensionalen Raum. Die Mikrozustände des
N -Teilchen-Systems sind realisiert durch die Punkte des 6N -dimensionalen
Phasenraumes der kombinierten Orts- und Impuls-Koordinaten (q, p), wobei
q(t) = q1 (t), ..., q3N (t) und p(t) = p1 (t), ..., p3N (t) im Zeitverlauf eine Trajektorie beschreibt.
Analog zum quantenmechanischen Fall wird der gemischte Zustand durch
viele Phasenpunkte
(q n , pn ) repräsentiert, jeder mit einer Wahrscheinlichkeit
P
wn ≥ 0, n wn = 1. Die Verteilungsfunktion (entspricht Dichteoperator)
lautet
X
ρ(q, p) =
δ(q − q n (t))δ(p − pn (t))wn
(1.16)
n
R
mit den Eigenschaften ρ(q, p) ≥ 0, dqdpρ(q, p) = 1 (entspricht den Eigenschaften a), b), c) des Dichteoperators).
Wir deuten ρ(q, p)dqdp als die Wahrscheinlichkeit, den Phasenpunkt in dem
Volumenelement dqdp bei (q, p) zu finden.
Physikalische Meßgrößen sind durch Funktionen A(q, p) gegeben, deren Erwartungswerte sich berechnen nach
8
A. Klümper
hAi =
Z
dqdpA(q, p)ρ(q, p).
(1.17)
Daher charakterisiert die Verteilungsfunktion ρ den Mischzustand vollständig.
Die Zeitentwicklung von ρ wollen wir mittels der Hamiltonfunktion H(q, p)
berechnen. Für jede Trajektorie (q n (t), pn (t)) gilt
q˙n =
∂H
,
∂pn
p˙n = −
∂H
,
∂q n
(1.18)
womit folgt
·
¸
∂
∂
n
n
˙
˙
ρ̇ =
wn q
δ(q − q n )δ(p − pn )
+p
∂q n
∂pn
n
·
¸
X
∂H ∂
∂H ∂
=
wn
δ(q − q n )δ(p − pn ).
−
n ∂q n
n ∂pn
∂p
∂q
n
X
(1.19)
(1.20)
Nun können wir die Gradienten nach q n , pn durch solche nach q, p ersetzen, wobei ein Vorzeichenwechsel stattfindet. Ausserdem können wegen der
auftretenden δ-Funktionen die Argumente q n , pn in den Gradienten von H
durch q, p ersetzt werden. Ergebnis
¸
·
∂H ∂
∂H ∂
ρ = −{H, ρ}
Liouville-Gleichung
(1.21)
−
ρ̇ = −
∂p ∂q
∂q ∂p
Diese dynamische Gleichung entspricht natürlich genau der von-NeumannGleichung im quantenmechanischen Fall, d.h. die Ersetzung {H, ρ} → h̄i [H, ρ]
führt von der klassischen Mechanik zur Quantenmechanik.
1.2
Statistische Gesamtheiten
Wir betrachten ein makroskopisches System von Teilchen mit typischerweise 1023 Teilchen. Obwohl ein derartiges System im Prinzip den Gesetzen
der Quantenmechanik genügt (im Grenzfall h̄ → 0 der klassischen Mechanik), sind wir gezwungen auf eine mikroskopische Beschreibung zu verzichten.
Gründe:
a) Unmöglichkeit: Schrödingergleichung für 1023 Teilchen zu lösen
b) Unmöglichkeit: Anfangsbedingungen für 1023 Teilchen zu bestimmen
Wir hatten schon oben gesehen, daß der zugrundeliegende Hilbertraum zu
hochdimensional ist. Nur im Falle von nichtwechselwirkenden Teilchen können
wir eine mikroskopische Beschreibung erzielen.
Thermodynamik und Statistische Physik
9
Nun gibt es zu den genannten Argumenten, die sich auf die Undurchführbarkeit
beziehen, auch positive Gründe, von einer mikroskopischen Beschreibung abzusehen. Wir sind häufig gar nicht interessiert an der Detailinformation über
die genaue Zeitabhängigkeit der Trajektorien von Teilchen.
• Beschränkung in den (experimentellen) Eingriffsmöglichkeiten
Typische Messungen an großen Systemen beziehen sich auf Größen, an denen alle Teilchen beteiligt sind, d.h. spezifische Wärme, Druck, Kompressibilität, elektrische Leitfähigkeit, elektrische und magnetische Suszeptibilität,
Absorption und Streuung von Licht und Neutronen etc. Selbst bei den zuletzt genannten Streuexperimenten, die mehr mikroskopische Informationen
ermitteln, wird über Zeiten und räumliche Ausdehnungen gemittelt, die groß
sind gegen atomare Skalen.
Neben dem Mikrozustand des Systems (für “Zustand” in QM-Terminologie)
gibt es den Makrozustand, der durch wenige Parameter bestimmt ist, z.B.
Temperatur, Druck, Teilchendichte, Volumen, Energie etc. Einem derartigen
Makrozustand entsprechen dabei sehr viele Mikrozustände, z.B. haben sehr
viele Mikrozustände die gleiche Gesamtenergie.
Wir lassen daher zur Bestimmung der Eigenschaften des Makrozustandes alle
möglichen Mikrozustände zu, die zum gleichen Makrozustand gehören. Wir
definieren
Statistische Gesamtheit (Ensemble) = Gesamtheit von Systemen in verschiedenen Mikrozuständen, die alle zum gleichen Makrozustand gehören.
Offensichtlich entspricht eine solche statistische Gesamtheit einem gemischten Zustand wie in (I.1) definiert. Daher wird die statistische Gesamtheit
durch einen geeigneten Dichteoperator ρ beschrieben, wobei Ergebnisse von
Messungen durch Erwartungswerte mittels ρ gegeben sind.
Die Aufgabe der Statistischen Physik ist es nun, den Dichteoperator zu bestimmen, der den makroskopischen Bedingungen genügt.
Wir wollen noch drei Gründe für eine statistische Beschreibung von großen
Systemen besprechen und warum viele Mikrozustände eingehen:
i) Ein makroskopisches System ist niemals völlig isoliert. Während einer
Messung wird es durch äußere Einflüsse (oder auch durch den Meßprozess)
zwischen vielen Mikrozuständen hin und her geworfen. Man denke an die
Spezifische-Wärme-Messung von Wasser.
10
A. Klümper
ii) Die Erfahrung zeigt, daß viele Systeme extensiv sind, d.h. Messungen an
verschieden großen Substanzmengen führen zu gleichen Ergebnissen, wenn
sie auf die Substanzmenge bezogen werden. Die einzige Bedingung ist, daß
die benutzten Substanzmengen noch makroskopisch sind. Wir führen die folgende Einteilung durch
10
10
10
10
10
10
10
. . . . . . . .
10
23
13
Untersysteme, Gesamtzahl der Teilchen 10
10
Eine Messung an den 1023 Teilchen ist damit äquivalent dem Mittelwert von
Messungen an 1013 Untersystemen von jeweils 1010 Teilchen. Wir haben dann
1013 Mikrozustände |ni i, i = 1, ..., 1013 , für 1010 Teilchen. Der Dichteoperator
ist gegeben durch
ρ=
13
10
X
i=1
wi |nii hn|i ,
wi = 10−13
(1.22)
Jede Messung läßt sich auffassen als Mittelwert über die Messungen an den
Untersystemen hAi = Sp Aρ.
Achtung: Messungen eines einzelnen Atoms an der Oberfläche eines makroskopischen Körpers sind dabei natürlich ausgeschlossen.
iii) “Zeitmittel = Scharmittel” und Ergodenproblem der klassischen Mechanik
Wir führen eine Messung über eine große Zeitspanne τ durch. Der Phasenpunkt (q(t), p(t)) durchläuft dabei den Phasenraum. Das Ergebnis der Messung wird durch folgende Mittelung bestimmt
Z
1 τ
dtA(q(t), p(t))
(1.23)
hAi =
τ 0
Wir betrachten nun ein Element dqdp um den Punkt (q, p). Während der
Zeitspanne τ hält sich der Phasenpunkt des Systems mit einer Gesamtverweilzeit dt (evtl. aus vielen Teilintervallen bestehend) in diesem Volumen auf
und gibt Anlaß zur Definition einer Verteilungsfunktion ρ durch
dt
=: ρ(q, p)dqdp
τ
Mit dieser Verteilungsfunktion gilt natürlich
Z
Z τ
dt
hAi =
A(q(t), p(t)) = dqdpA(q, p)ρ(q, p) .
τ
{z
}
{z
} |
|0
Ensemblemittel
Zeitmittel
(1.24)
(1.25)
Thermodynamik und Statistische Physik
11
Das Ergodenproblem besteht nun darin, nachzuweisen, daß die Verteilungsfunktionen, die sich aus Zeitmittelungen ergeben, mit den Verteilungsfunktionen, die wir in Kürze kennenlernen werden, identisch sind. Siehe hierzu
A.J. Chintschin: BI Taschenbuch 58/58a. Wir werden das Ergodenproblem
im Rahmen dieser Vorlesung nicht mehr aufgreifen.
Zum Abschluß dieses Paragraphen führen wir noch einige Begriffe ein. Die
Wahrscheinlichkeitdichte, daß die Observable A in der Gesamtheit den Meßwert a annimmt, ist
wA (a) = hδ(a − A)i := Sp ρδ(a − A).
Offenbar gilt
R∞
−∞
(1.26)
dawA (a) = 1 und für beliebige Funktionen f (...) gilt
hf (A)i = Sp ρf (A) = Sp ρ
Z
∞
−∞
daδ(a − A)f (a) =
Insbesondere gilt
hAn i =
Z
∞
Z
∞
dawA (a)f (a). (1.27)
−∞
dawA (a)an .
(1.28)
−∞
Wir definieren nun die Schwankung ∆A von A um den Mittelwert hAi
(∆A)2 := h(A − hAi)2 i = hA2 i − hAi2 ≥ 0
(1.29)
Als relative Schwankung wird ∆A/hAi definiert.
Je kleiner die Schwankung ist, desto seltener ist das System in einem Mikrozustand, in dem der Wert von A vom Mittelwert abweicht. Wir betrachten
später fast ausschließlich Observable, die sich
PNals Summen über die einzelnen
Freiheitsgrade schreiben lassen, d.h. A = i=1 A(i). Für diese Observablen
ergibt sich
hAi = O(N )
und
µ
¶
1
∆A
=O √
→
hAi
N
(∆A)2 = O(N )
(1.30)
(1.31)
Die Schwankungen werden also sehr klein, speziell im thermodynamischen
Limes (N → ∞) gilt lim ∆A/hAi = 0.
Statistische Unabhängigkeit
Ein System von N Teilchen zerfalle in zwei Untersysteme mit N0 und N − N0
Teilchen. Die beiden Untersysteme heißen statistisch unabhängig, wenn der
Dichteoperator ρ des Gesamtsystems zerfällt in ein Produkt der Dichteoperatoren ρI und ρII der beiden Untersysteme
12
A. Klümper
ρ = ρI · ρII .
(1.32)
Mathematisch ist dies eine Definition, physikalisch ist Unabhängigkeit realisiert, wenn keine Wechselwirkung zwischen den beiden Untersystemen existiert. Eine direkte Folgerung der letzten Beziehung ist
ln ρ = ln ρI + ln ρII ,
(1.33)
d.h. ln ρ ist eine additive Größe (bei statistischer Unabhängigkeit).
1.3
Das thermische Gleichgewicht
Im folgenden betrachten wir konservative Systeme, d.h. solche deren Hamiltonoperatoren H nicht explizit zeitabhängig sind. Wir verstehen unter einem
abgeschlossenen System ein System ohne Kontakt bzw. Wechselwirkung mit
der Umgebung.
Eine empirische Tatsache ist, daß jedes mehr oder weniger abgeschlossene
System im Laufe der Zeit einem stationären Zustand entgegen strebt, also Meßwerte gegen zeitlich unabhängige “Gleichgewichtswerte” streben. Der
stationäre Makrozustand, der sich einstellt, heißt auch Zustand des thermischen Gleichgewichtes oder Gleichgewichtszustand.
Obige Formulierung enthält ein Element der Unbestimmtheit (“mehr oder
weniger abgeschlossen”). Streng genommen gibt es keine abgeschlossenen
(isolierten) Systeme, da immer Wärmeaustausch mit der Umgebung erfolgt
und auch der Meßprozeß eine Störung darstellt. (Außerdem kennen wir mit
dem Poincaréschen Wiederkehr-Theorem prinzipielle Einschränkungen des
Erreichens des Gleichgewichtes: in Praxis irrelevant wegen riesiger Zeitskalen.)
Wir wollen nun den Dichteoperator des Gleichgewichtes ermitteln und halten
zunächst fest, daß aus
hAi(t) = Sp Aρ(t)
zeitunabhängig
(1.34)
für jede Observable schon folgt, daß ρ(t) zeitunabhängig ist also ρ̇ = 0 und
vermöge der von-Neumann-Gleichung gilt
[H, ρ] = 0,
(1.35)
damit ist ρ eine Erhaltungsgröße.
Ferner ist ln ρ additiv, wenn statistische Unabhängigkeit der zusammengesetzten Teilsysteme gegeben ist
ln ρ = ln ρI + ln ρII .
(1.36)
Thermodynamik und Statistische Physik
13
Aus (1.35), (1.36) folgt, daß ln ρ eine Linearkombination aller möglichen additiven Erhaltungsgrößen F̂i , i = 1, ..., k, ist. (F̂ bezeichnet hier den Operator,
F wird Eigenwerte oder Erwartungswerte bezeichnen.)
Wir wollen die wichtigsten Erhaltungsgrößen Revue passieren lassen
0. das Volumen V eines Systems ist streng additiv
1. der Hamiltonoperator H ist additiv bei statistischer Unabhängigkeit
erhalten, aber nicht additiv sind H 2 , H 3 ...
2. Gesamtteilchenzahl N̂
• (Dreh-)Impuls ist hier nicht relevant, da im Gleichgewicht immer 0
Weitere, für uns wichtige Erhaltungsgrößen werden wir bei den Anwendungen
besprechen und hier nur allgemein erinnern, daß Erhaltungsgrößen immer mit
Symmetrien bzw. Invarianzeigenschaften der Dynamik unter gewissen Transformationen zu tun haben.
Wir gehen nun von einem vollständigen Satz von erhaltenen Größen F̂i (i =
1, ..., k) aus, wobei wir annehmen können, daß F̂1 = H, F̂2 = N̂ . Es gilt
Kommutieren mit H
[H, F̂i ] = 0
(1.37)
und Additivität. Ferner wollen wir paarweises Vertauschen voraussetzen, d.h.
[F̂i , F̂i ] = 0 (evtl. einige Größen “streichen”, siehe später Magnetismus).
ln ρ muß
Pk eine Linearkombination der Erhaltungsgrößen F̂i sein ln ρ = a ·
Id + i=1 λi F̂i , wobei λi und a Konstante (Zahlen) sind. Der nichttriviale
Teil dieser Beziehung wird durch die F̂ -Terme ausgedrückt, der erste Term
sichert nur die Normierung (Sp ρ = 1). Aus praktischen Erwägungen wollen
wir aber a = λ0 · V schreiben (formal ist das Volumen streng additiv und
natürlich erhalten, fügt sich also als F̂0 in die obige Liste ein) und erhalten
ln ρ = λ0 V +
k
X
λi F̂i ,
(1.38)
i=1
bzw.
ρg =
1 Pk λi F̂i
,
e i=1
Zg
(1.39)
wobei Zg = e−λ0 V . Der Dichteoperator wie in (1.39) ist der Dichteoperator
der (allgemeinen) großkanonischen Gesamtheit, Zg heißt die großkanonische Zustandssumme. Zg ergibt sich aus Sp ρ = 1 zu
Pk
Zg = Sp e i=1 λi F̂i .
(1.40)
Die physikalischen Meßgrößen Fi hängen ab von der Größe des Systems, d.h.
sind proportional zu der Anzahl der Freiheitsgrade (Teilchen) bzw. Volumen
14
A. Klümper
V . Die “Felder” λi sind von der Größe unabhängig.
Definition: extensiv: proportional zur Systemgröße,
intensiv: unabhängig.
Extensive Größen bezogen auf das Volumen geben Anlaß zur Definition von
Dichten, z.B. für Energie und Teilchenzahl: Energie- und Teilchen-Dichte
e = lim E/V , n = lim N/V .
Wir notieren nun eine nützliche Relation zur Bestimmung von Fj allein unter
Benutzung der Zustandssumme
Es folgt direkt
Pk
Sp e i=1 λi F̂i F̂j
Pk
.
Fj = hF̂j i = Sp ρg F̂j =
Sp e i=1 λi F̂i
Fi =
∂
ln Zg .
∂λi
(1.41)
(1.42)
Es besteht eine Reziprozität zwischen den extensiven Meßgrößen Fi und den
intensiven Feldern λi .
Bemerkung: ρg und Zg sind Funktionen der intensiven Größen λi und des
Volumens V . Dies sind die sogenannten “natürlichen Variablen” der großkanonischen Gesamtheit.
Die Observablen F̂i nehmen in der großkanonischen Gesamtheit keine scharfen Werte an, sondern es gilt nur Fi = hF̂i i. Mit anderen Worten: die großkanonische Gesamtheit enthält Mikrozustände mit unterschiedlichen Eigenwerten zu F̂i , z.B. der Energie. In dieser Gesamtheit ist das System also offen
bzgl. des Austausches der Erhaltungsgrößen mit der Umgebung (Wärme-,
Teilchen-Austausch). Wir werden aber die Schwankung der Observablen um
ihre Mittelwerte betrachten und feststellen, daß diese klein (“unterextensiv”)
ist, s. (1.31).
Wir können uns nun auf den Standpunkt stellen, daß bei hinreichend guter
Isolierung der Austausch unterbunden wird und die Eigenwerte von einigen
(oder allen) Erhaltungsgrößen scharf sind. Daher sollten in dieser Gesamtheit auch nur Mikrozustände mit festen Eigenwerten auftreten. Die Verkleinerung der großkanonischen zur (allgemeinen) kanonischen Gesamtheit wird
durch Hinzufügen von δ-Funktionen erzielt, o.B.d.A. seien dies δ(F̂i − Fi ) für
i = 1, ..., l wobei die Anzahl l der festen Eigenwerte 0, 1 ... k sein kann.
ρkan,l = αρg δ(F̂1 − F1 ) · ... · δ(F̂l − Fl )
(1.43)
Thermodynamik und Statistische Physik
15
Der konstante Faktor α wurde aus Normierungsgründen eingeführt. Wegen
der δ-Funktionen können in dem Ausdruck für ρg die entsprechenden Operatoren durch ihre Eigenwerte ersetzt werden und wir erhalten den kanonischen Dichteoperator
ρkan,l =
1
Zkan,l
l
Y
i=1
δ(F̂i − Fi ) · e
Pk
i=l+1
λi F̂i
,
mit der kanonischen Zustandssumme
!
à l
Pk
Y
λi F̂i
.
Zkan,l = Sp
δ(F̂i − Fi ) · e i=l+1
(1.44)
(1.45)
i=1
Der Grenzfall l = 0 ist der großkanonische Fall, für l = k erhalten wir die
(allgemeine) mikrokanonische Gesamtheit mit
ρmik =
1
Zmik
k
Y
i=1
δ(F̂i − Fi ),
Zmik = Sp
k
Y
i=1
δ(F̂i − Fi ).
(1.46)
Wir notieren noch die “natürlichen Variablen” der kanonischen Gesamtheit
ρkan,l = ρkan,l (F1 , ..., Fl ; λl+1 , ..., λk ; V ),
(1.47)
analog ist auch Zkan,l eine Funktion der (k − l) intensiven Felder λi und der
l extensiven Meßgrößen F1 ,...,Fl sowie V .
Die Mittelwerte der Operatoren F̂i mit i = l + 1, ..., k berechnen sich wie in
(1.42)
∂
ln Zg .
(1.48)
Fi =
∂λi
Die verschiedenen Gesamtheiten beschreiben alle das thermische Gleichgewicht. Wir werden noch sehen, daß die Gesamtheiten äquivalent sind (s. weitere Paragraphen). In den Übungen wird besprochen, daß für Systeme in
mikrokanonischer Gesamtheit “kleine” (aber noch makroskopische) Untersysteme immer durch kanonische Gesamtheiten beschrieben werden. Dies stellt
einen Zusammenhang der verschiedenen Gesamtheiten dar mit im Vergleich
zu obiger Besprechung umgekehrter Richtung.
Bemerkung: Extensivität
Offensichtlich sind additive Größen auch extensiv. Wir wollen hier überlegen,
daß auch bei nicht streng additiven Größen Extensivität vorliegen kann. Wir
betrachten zwei gleichgroße Systeme mit Volumen Vi = V und Hamiltonoperator Hi , und setzen diese Systeme zu einem Gesamtsystem des Volumens
2V mit Hamiltonoperator
16
A. Klümper
H = H1 + H2 + W,
(1.49)
zusammen, wobei W eine Wechselwirkung zwischen den beiden Systemen
darstellt und typischerweise entlang der Grenzfläche mit Reichweite a wirkt.
1
2
V1 = V
V2 = V
a
Wir können den Erwartungswert von W abschätzen, da die Grenzfläche von
der Größe V 2/3 ist:
hW i ≃ aV 2/3 −→ lim
V →∞
1
hW i
= lim
= 0.
V →∞ V 1/3
V
(1.50)
Damit ist die Energie extensiv, d.h. die Energiedichte für jedes Einzelsystem
gleich der Energie des Gesamtsystems.
Schlußbemerkung: die eingeführten Gesamtheiten beschreiben alle das thermische Gleichgewicht. Der Unterschied besteht lediglich darin, daß die Systeme in verschiedener Weise offen oder abgeschlossen sind. Wir werden in den
Übungen besprechen, daß die Äquivalenz nicht nur mathematisch gültig ist,
sondern für ein jedes System in mikrokanonischer Gesamtheit, kleine (aber
noch makroskopische) Subsysteme durch kanonische Gesamtheiten beschrieben werden (Gibb’sches Theorem).
1.4
Mikrokanonische Gesamtheit
Wir wollen hier die eigentliche mikrokanonische Gesamtheit besprechen, bei
der Volumen V , Energie E (F̂1 = H), Teilchenzahl N (F̂2 = N̂ ) fest sind.
Wir haben statt (1.46)
ρmik =
1
Zmik
δ(E − H),
Zmik = Sp δ(E − H).
(1.51)
Wir wollen hier die Eigenwerte von Teilchenzahloperator und das Volumen
implizit als konstant voraussetzen (also V und N implizit – wie üblich –
in H enthalten). In der mikrokanonischen Gesamtheit sind also alle Mikrozustände gleicher Energie E gleichwahrscheinlich. Als Variablen treten 3 extensive Größen auf:
ρmik = ρmik (E, N, V ),
Zmik = Zmik (E, N, V ).
(1.52)
Thermodynamik und Statistische Physik
17
Wir betrachten die Anzahl aller Zustände mit Energie ≤ E und bezeichnen
diese Zahl mit Φ(E)
Φ(E) = Sp Θ(E − H).
(1.53)
Hier ist Θ(x) (wie immer) gleich 1 für x > 0, und 0 für x < 0. Die Zustandsdichte Ω(E) ist definiert als die Anzahl der Zustände im Energieintervall
[E, E + dE] bezogen auf die Breite dE
Φ(E + dE) − Φ(E)
= Φ′ (E)
dE
= Sp δ(E − H).
Ω(E) =
(1.54)
(1.55)
Spätestens hier wollen wir anmerken, daß für endliche Systeme das Spektrum
diskrete Teile umfassen mag, diese jedoch im thermodynamischen Limes
√ auf
einer extensiven Energie-Skala, bei der dE groß ist (z.B. proportional zu N ),
durch ein Kontinuum beschrieben werden.
Durch Vergleich mit (1.51) sehen wir
Ω(E) = Zmik (E, N, V ).
(1.56)
Da H und N̂ fest sind, gilt
hHi = E, hH 2 i = E 2 ;
hN̂ i = N, hN̂ 2 i = N 2 ,
(1.57)
damit verschwinden die Schwankungen ∆H = ∆N = 0.
1.5
Die kanonische Gesamtheit
Als eigentliche kanonische Gesamtheit versteht man das Ensemble, in dem
das System nur bezüglich H offen ist, aber N und V fest. Der Dichteoperator
lautet
1 −βH
e
,
Zkan = Sp e−βH ,
(1.58)
ρkan =
Zkan
wobei wir im Vergleich zu (1.44) die Konstanz von N als implizit in H enthalten vorausgesetzt haben und ferner λ1 = −β gesetzt haben. Die Vorzeichenwahl entspricht üblichen Konventionen und garantiert, daß Konvergenz der
Zustandssumme vorliegt, da die Spektren aller (thermodynamisch stabilen)
Systeme nach unten, aber nicht nach oben beschränkt sind.
Als Variablen treten 2 extensive Größen V , N , und 1 intensives Feld β auf:
ρkan = ρkan (β, N, V ),
Zkan = Zkan (β, N, V ).
(1.59)
∂
ln Zkan
∂β
(1.60)
Wir notieren die Beziehung (1.48)
E = hHi = −
18
A. Klümper
Damit legt β die mittlere Energie E = E(β, N, V ) fest. Wir können uns auch
umgekehrt β als Funktion von E, N, V denken, da die Beziehung umkehrbar
ist. Dies folgt aus
∂
2
E = −hH 2 i + hHi = −(∆H)2 ≤ 0,
∂β
(1.61)
womit E eine monoton fallende Funktion von β ist.
Wir definieren nun die Temperatur
T =
1
,
βkB
kB = 10−16
erg
(approx.)
K
(1.62)
Da in der Mechanik-Vorlesung, die Sie besucht haben, der Begriff der Temperatur nicht eingeführt wurde, haben wir hier die Möglichkeit, es in geeigneter
Weise zu tun. Wir wollen natürlich später im Kapitel II verstehen, daß die hier
eingeführte Temperatur mit der sog. absoluten Temperatur übereinstimmt.
Die Boltzmann-Konstante tritt nur aus historischen Gründen auf, da man T
in Kelvin (K) mißt. (Gasthermometer sind vor der Statistischen Mechanik
eingeführt worden.) kB ist an sich völlig überflüssig, da T auch in Einheiten
der Energie (erg) gemessen werden könnte. kB ist keine Fundamentalkonstante wie c oder h̄.
Wir wollen aus (1.61) noch etwas über die Stärke der Energieschwankung
lernen. Da E extensiv, aber β intensiv ist, ist auch dE/dβ extensiv, also
(∆H)2 der Ordnung O(N ) bzw
µ
¶
1
∆H
=
∆H = O(N 1/2 ),
→ 0 im thermodyn. Limes (1.63)
hHi
N 1/2
Dies bedeutet, daß die Energie zwar schwankt, daß aber die Verteilung der
Eigenwerte ein scharfes Maximum beim Mittelwert haben muß. Den Grund
für diese Eigenschaft wollen wir nun verstehen. Die Wahrscheinlichkeit wH (E)
wie in (1.26) definiert berechnet sich zu
1
Sp e−βH δ(E − H)
Zkan
1 −βE
1 −βE
=
e
Sp δ(E − H) =
e
Ω(E)
Zkan
Zkan
wH (E) = hδ(E − H)i =
(1.64)
(1.65)
Diese Funktion hat die bemerkenswerte Eigenschaft, daß für große Systeme
gilt
£
¤N
e−βE = e−βe
Ω(E, N, V ) = [ω(e, n)]N
(1.66)
(1.67)
Thermodynamik und Statistische Physik
19
wobei e = E/N die Energiedichte, n = N/V die Teilchendichte, und ω eine
intensive Größe bzw. Funktion der intensiven Variablen e und n ist. (Unter
anderem ist die Zustandsdichte Ω eine mit N und E extrem schnell anwachsende Funktion.) Daher ist
wH (E) =
1
£ −βe
¤N
e
ω(e, n)
(1.68)
Zkan
£
¤N
R
wobei Zkan = N de e−βe ω(e, n) . Da das Spektrum durch die Grundzustandsenergie nach unten beschränkt ist, hat die Verteilungsfunktion Ω bzw.
ω die Eigenschaft, für hinreichend niedrige Energien gegen 0 zu tendieren.
Für e gegen +∞ mag zwar ω(e) wie eine Potenzfunktion divergieren, der
Faktor exp(−βe) fällt jedoch exponentiell ab, so daß f (e) := e−βe ω(e, n) eine Funktion mit Maximum bei einem eM ist und wH (E) = f (E/N )N /Zkan
eine Funktion mit im thermodynamischen Limes (N → ∞) extrem scharfem
Maximum bei E/N = eM und Integral 1.
[f(e)] N
f(e)
eM
e
Bei der Berechnung von Erwartungswerten zählt dann nur noch die enge
Nachbarschaft von eM . Es folgt
Z ∞
dE ′ E ′ wH (E ′ ) = N eM =: E
(1.69)
hHi =
−∞
Die hier besprochene Methode der Auswertung von Integralen des Typs
Z
dxg(x)f (x)N = (...)g(xM )f (xM )N für N → ∞,
(1.70)
wobei die Funktion f (x) ihr Maximum bei xM annimmt, ist bekannt als
Sattelpunkts-Integration. Wir wollen uns an dieser Stelle nicht mit der
genauen Auswertung des Faktors (...) beschäftigen und nur darauf hinweisen,
daß dieser im wesentlichen nicht von g(x) abhängt, so daß
R
dxg(x)f (x)N
R
= g(xM ).
(1.71)
dxf (x)N
20
A. Klümper
Wir wollen nun die Berechnung der kanonischen Zustandssumme aus der
mikrokanonischen vornehmen. Wir bemerken
Z
Z
Zkan (β) = Sp e−βH dEδ(E − H) = dESp e−βH δ(E − H) (1.72)
Z
Z
−βE
= dEe
Sp δ(E − H) = dEe−βE Zmik (E),
(1.73)
ein derartiger Zusammenhang ist als Laplace-Transformation bekannt. Nach
dem oben Gesagten erwarten wir im thermodynamischen Limes (SattelpunktIntegration) einen wesentlichen Beitrag durch das Maximum des Integranden
bei E. Dieses Maximum bestimmen wir für vorgegebenes β indem wir den
Logarithmus des Integranden nach E differenzieren
β=
d
ln Zmik (E),
dE
(1.74)
der extensive Anteil von ln Zkan (β) ergibt sich dann durch
ln Zkan (β) = −βE + ln Zmik (E).
(1.75)
Ein derartiger Zusammenhang ist bekannt als Legendre-Transformation
von der Funktion ln Zmik (E) auf die Funktion ln Zkan (β), wobei das Argument E durch (1.74) aus β bestimmt ist.
Die Differentialschreibweise von (1.74) ist
d ln Zmik (E) = βdE,
(1.76)
und mit (1.75) folgt äquivalent
d ln Zkan (E) = −Edβ.
(1.77)
Wir wollen diesen Paragraphen mit zwei Bemerkungen abschließen. Wir hatten den Parameter β oben mit der Begründung eingeführt, daß die meisten
Spektren nach oben unbeschränkt sind und aus Konvergenzgründen β ≥ 0
sein sollte. Offensichtlich gilt diese Begründung nicht für Spektren, die sowohl
nach unten wie oben beschränkt sind. Als Realisierungen derartiger Systeme
werden wir in den Übungen Spinsysteme kennenlernen, bei denen auch β < 0
(und damit (T < 0) möglich ist. Etwas weniger formal, können negative Temperaturen mittels (1.74) verstanden werden. Für Spektren, die sowohl nach
unten wie oben beschränkt sind, ist die Zustandsdichte Ω(E) = Zmik (E) eine Funktion, die bei hinreichend niedrigen wie hohen Energien verschwindet,
also sowohl monoton steigende als auch fallende Flanken besitzt. Daher ist
die Ableitung wie in (1.74) positiv wie auch negativ.
Wir wollen uns zuletzt die Frage stellen, wie in der kanonischen Gesamtheit
der Druck eines Systems charakterisiert durch β, N, V zu berechnen ist. Die
Thermodynamik und Statistische Physik
21
erste Erwartung könnte sein, die Volumenabhängigkeit des Erwartungswertes
der Energie E zu berechnen. Dies führt auf folgenden Ausdruck
p |{z}
= −
(?)
X
∂
E=
(wn En′ + wn′ En )
∂V
n
(1.78)
wobei wn die Boltzmann-Gewichte e−βEn /Zkan bezeichnet, und ’ die Ableitung nach V . Wenn wir jedoch typische thermodynamische Experimente
betrachten, wird uns auffallen, daß diese nur langsame Volumenänderungen
erlauben, d.h. quasi-statische bzw. adiabatische Prozesse, bei denen das
System immer im thermodynamischen Gleichgewicht bleibt. Derartige adiabatische Prozesse sind durch Abwesenheit von Übergängen zwischen einzelnen Mikrozuständen charakterisiert. M.a.W.: die Wahrscheinlichkeiten wn
der einzelnen Mikrozustände ändern sich nicht. Wir werden somit den Mittelwert der Drücke der individuellen Mikrozustände messen mit festen wn .
Daher gilt
X
p=
wn En′ .
(1.79)
n
Diese Größe ist jedoch nicht die Volumenabhängigkeit der mittleren Energie,
sondern die Volumenabhängigkeit der sog. “freien Energie” F
F := −
−
1.6
∂
F = −
∂V
1
ln Zkan (β),
β
X e−βEn ∂
n
Zkan ∂V
(1.80)
En =
X
wn pn = p
(1.81)
n
Großkanonische Gesamtheit
Im (eigentlichen) großkanonischen Ensemble ist nur das Volumen fest, neben Energie- soll auch Teilchenaustausch möglich sein (F̂1 = H, F̂2 = N̂ ),
beschrieben durch zwei intensive Variable λ1 und λ2 . Wir setzen
λ1 = −β,
λ2 = βµ,
(1.82)
wobei wie oben die Temperatur als T = 1/(kB β) definiert wird und das der
Teilchenzahl zugeordnete “Feld” µ per definitionem chemisches Potential
heißt. Anstelle von (1.39) haben wir
ρg =
1 −β(H−µN̂ )
e
,
Zg
Zg = Sp e−β(H−µN̂ ) .
(1.83)
Als Variable treten 1 extensive Größe V , und 2 intensive Felder β, µ auf:
ρg = ρg (β, µ, V ),
Zg = Zg (β, µ, V ).
(1.84)
22
A. Klümper
Wie in der kanonischen Gesamtheit ist die Beziehung E = E(β) umkehrbar.
Analoges gilt für N = N (µ). (1.48) lautet
1 ∂
ln Zg (β, µ, V ),
β ∂µ
ln Zg (β, µ, V ) = βµN + ln Zkan (β, N, V ),
N=
und weiter
2
∂
N = β[hN̂ 2 i − hN̂ i ] = β(∆N )2 ≥ 0.
∂µ
(1.85)
(1.86)
(1.87)
√
Außerdem ist (∆N )2 = O(N ), die Schwankung ∆N/N = O(1/ N ).
1.7
Thermodynamische Potentiale
Wir nehmen hier wieder die allgemeine Betrachtung und Entwicklung der
Statistischen Physik auf und wenden uns den allgemeinen kanonischen Gesamtheiten zu. Wir hatten schon gesehen wie der Übergang von der mikrokanonischen zur kanonischen Gesamtheit im thermodynamischen Limes durch
eine Legendre-Transformation bewerkstelligt wird (1.74) und (1.75). Ganz
allgemein lautet dieser Zusammenhang
ln Zkan,l−1 (F1 , ..., Fl−1 , λl , λl+1 , ..., λk ) = λl Fl +ln Zkan,l (F1 , ..., Fl , λl+1 , ..., λk ),
(1.88)
mit der Bestimmungsgleichung für Fl bei vorgegebenem λl
λl = −
∂
ln Zkan,l (..., Fl , ...).
∂Fl
(1.89)
Mit den Relationen (1.42) und (1.89) haben wir die Möglichkeit innerhalb
einer beliebigen kanonischen Gesamtheit die intensiven und extensiven Parameter einer beliebigen anderen kanonischen Gesamtheit zum gleichen Makrozustand zu berechnen. In Differentialschreibweise haben wir
d ln Zkan,l = −λ1 dF1 ... − λl dFl + Fl+1 dλl+1 + ... + Fk dλk
(1.90)
was “mehr oder weniger” äquivalent zu (1.88) und (1.89) ist (s. Übungen).
Anstelle der Logarithmen der Zustandssummen führt man sog. thermodynamische Potentiale Φkan,l ein durch
1
ln Zkan,l (F1 , ..., Fl , βµl+1 , ..., βµk ),
β
(1.91)
sowie die (allgemeinen) chemischen Potentiale µi durch
Φkan,l (F1 , ..., Fl , µl+1 , ..., µk ) = −
λi = βµi .
(1.92)
Thermodynamik und Statistische Physik
23
(Für Fi = H gilt also µi = −1, für Fi = N̂ gilt µi = µ).
Es gilt für (1.88) nun
Φkan,l−1 = −µl Fl + Φkan,l ,
(1.93)
und es gilt natürlich
∂
Φkan,l (i = 1, ..., l)
∂Fi
∂
Fi = −
Φkan,l (i = l + 1, ..., k).
∂µi
µi =
(1.94)
(1.95)
Hier ist nur die Sonderrolle der Energie bzw. der Temperatur zu beach∂
βΦkan,l und E =
ten: falls Fi = E, heißen die letzten Relationen −β = ∂E
∂
βΦ
(sofern
E
bzw.
β
zu
den
natürlichen
Variablen
gehört).
kan,l
∂β
Das Differential lautet
dβΦkan,l = βµ1 dF1 + ... + βµl dFl − Fl+1 dβµl+1 ... − Fk dβµk
(1.96)
Bevor wir uns mit Beispielen beschäftigen, wollen wir bemerken, daß wir auf
Grund der Beziehung (1.81) das Volumen V und (-) Druck −p wie Erhaltungsgröße F̂i und chemisches Potential µi behandeln können (Frage: “Volumenoperator”?).
Beispiel: mikrokanonische Gesamtheit (l = k = 3)
Hier haben wir F1 = H, F2 = N , F3 = V , Wir werden im nächsten Abschnitt
die Entropie S detailliert besprechen. In der mikrokanonischen Gesamtheit
lautet sie
S = kB ln Zmik ,
(1.97)
also eine extensive Größe. Das thermodynamische Potential der mikrokanonischen Gesamtheit ist
Φmik = −T S
(1.98)
und es gilt
β=
1 ∂S
∂
ln Zmik =
∂E
kB ∂E
(1.99)
Wir notieren (1.96) und erhalten
T dS = dE − µdN + pdV.
(1.100)
Nutzen wir nun die Extensivität der Entropie, so erhalten wir
S((1 + ǫ)E, (1 + ǫ)N, (1 + ǫ)V ) = (1 + ǫ)S(E, N, V ).
(1.101)
Differenzieren nach ǫ und anschließendes Setzen auf 0 liefert
E
∂
∂
∂
S+N
S+V
S = S,
∂E
∂N
∂V
(1.102)
24
A. Klümper
oder unter Benutzung von (1.100), d.h.
p/T , folgt
T S = E − µN + pV
∂
∂E S
= 1/T ,
∂
∂N S
Duhem-Gibbs.
∂
∂V
= −µ/T ,
S=
(1.103)
Bilden wir das Differential der wichtigen Duhem-Gibbs-Relation und subtrahieren (1.100), so erhalten wir die differentielle Duhem-Gibbs-Relation
SdT + N dµ − V dp = 0.
(1.104)
Bemerkung: Wir wollen hier die Extensivität des allgemeinen thermodynamischen Potentials nutzen und leiten genau wie eben aus (1.96) her
Φkan,l = µ1 F1 + ...µl Fl .
(1.105)
Merkwürdigerweise ist das großkanonische Potential (l = 0, wichtig: Offenheit auch bezüglich des Volumens) gleich 0. Dies ist nicht mehr verwunderlich,
wenn man erkennt, daß ein extensives System nicht allein durch intensive Variable beschrieben werden kann.
1.8
Die Entropie
Wir kommen nun zum zentralen Begriff der Thermodynamik. Wir definieren
für einen beliebigen Dichteoperator ρ die Entropie S durch
S[ρ] = −kB hln ρi = −kB Sp ρ ln ρ.
(1.106)
Wie schon bei der Definition der Temperatur bemerkt, tritt kB nur aus historischen Gründen auf. In der Informationstheorie entspricht “Entropie”
↔ “−Informationsgehalt”. Da für die Eigenwerte ρν gilt 0 ≤ ρ ≤ 1 und
x ln x ≤ 0 für 0 ≤ x ≤ 1 folgt
X
S[ρ] = −kB
ρν ln ρν ≥ 0.
(1.107)
ν
Für (und nur für) einen reinen Zustand ρ (ρ1 = 1, ρν = 0, ν > 1) gilt
S[ρ] = 0.
(1.108)
Dies bedeutet volle Information, da der Mikrozustand den das System annimmt eindeutig ist. Für S > 0 ist der Mikrozustand des gemischten Systems
unbestimmt. Je größer S ist, desto größer ist unsere Unkenntnis, desto größer
die “Unordnung”.
Für Gleichgewichtszustände ist die Entropie allein eine Funktion des Makrozustandes, d.h. in jedem Ensemble nimmt S den gleichen Wert an. Wir
hatten in (1.97) schon benutzt, daß in mikrokanonischer Gesamtheit
S[ρmik ] = kB ln Zmik =
E − µN + pV
T
(1.109)
Thermodynamik und Statistische Physik
25
Beweis: In mikrokanonischer Gesamtheit lautet der Dichteoperator (1.46)
bzw.
1
ρmik =
δ(E − H),
Zmik = Sp δ(E − H)
(1.110)
Zmik
wobei wir N , V implizit festhalten. Wir müssen hier die Diskussion einer
“Subtilität” nachholen, nämlich die Wohldefiniertheit des δ(...)-Ausdruckes,
womit wir immer eine Regularisierung in Form einer hohen Stufenfunktion
verstehen wollen.
½
1/dE, für |x| ≤ dE/2,
(1.111)
δ(x) =
0,
sonst.
Hier soll dE ein Energieintervall mit einer Breite groß gegen mikroskopische
Energie-Niveaus und -Abstände aber klein gegen extensive Größen sein. Mit
der Zustandsdichte Ω(E) = Zmik ergibt sich die Anzahl der Zustände im
Energieintervall [E − dE/2, E + dE/2] zu Ω(E)dE. Die Eigenwerte von ρ (in
der besprochenen Regularisierung) sind 0 oder 1/(ZdE), wobei die Anzahl
letzterer Eigenwerte (natürlich) gleich ZdE ist. Die Gleichung (1.107) liefert
S[ρmik ] = −kB ·Zmik dE·
1
Zmik dE
ln
1
Zmik dE
= kB ln Zmik +kB ln dE. (1.112)
Wir erinnern uns an (1.56) und (1.67) und sehen, daß in dem letzten Ausdruck genau kB ln Zmik extensiv ist, nicht jedoch kB ln dE. Damit ist die erste
Gleichung in (1.109) bewiesen, d.h. es wurde gezeigt, daß die allgemeine Definition der Entropie dieses Paragraphen in mikrokanonischer Gesamtheit auf
(1.97) führt. Die zweite Gleichung ist sodann nichts weiter als (1.103).
Wir wollen nun zeigen, daß die Entropie allein durch den Makrozustand definiert ist. Dazu wollen wir exemplarisch die großkanonische Gesamtheit benutzen und zeigen, daß sich der gleiche Ausdruck wie in (1.109) (r.S.) ergibt.
Unter Benutzung von (1.83) folgt
S[ρg ] = −kB h−β(H − µN̂ ) − ln Zg i =
E − µN
+ kB ln Zg .
T
(1.113)
Nun ist aber das thermodynamische Potential Φg (T, µ, V ) = − β1 ln Zg (T, µ, V )
extensiv. Wie schon gehabt folgt nun
Φg = V
∂
Φg = −pV,
∂V
| {z }
(1.114)
=−p
wobei die Beziehung der partiellen Ableitung zum Druck p genauso gilt wie
die analoge Beziehung (1.81), die in der kanonischen Gesamtheit formuliert
war. Also ist (1.113) mit (1.114) zu (1.109) äquivalent, d.h. S[ρmik ] = S[ρg ].
26
A. Klümper
Ganz allgemein haben erhalten wir S in der kanonischen Gesamtheit zu
" k
#
" k
#
X
1 X
S = −kB
λi Fi − ln Zkan,l = −
µi Fi + Φkan,l ,
(1.115)
T
i=l+1
i=l+1
und die Unabhängigkeit von der Gesamtheit folgt aus z.B. (1.93).
Innerhalb der großkanonischen Gesamtheit sind Subsysteme, die Austausch
bzgl. aller Erhaltungsgrößen erlauben, statistisch unabhängig und die Entropie ist hier additiv
ρI+II = ρI · ρII
S[ρI+II ] = −kB Sp ρI+II ln ρI+II = −kB Sp ρI+II ln ρI − kB Sp ρI+II ln ρII
(1.116)
= −kB Sp I ρI ln ρI Sp II ρII +(I ↔ II) = S[ρI ] + S[ρII ],
{z
} | {z }
|
=1
=S[ρI ]
wobei zuletzt benutzt wurde Sp I+II AI BII = (Sp I AI ) · (Sp II BII ).
Für nicht offene Systeme gilt die Additivität der Entropie nicht streng. Die
statistische Unabhängigkeit ist nicht all zu sehr gestört, so daß die Entropie
eine extensive Größe ist.
Extremaleigenschaften der Entropie
Die Entropie ist ein nichtnegatives Funktional auf der Menge aller Dichteoperatoren. Aus dieser Menge wird durch Nebenbedingungen der Art hF̂i i =
Sp ρF̂i = Fi eine Teilmenge ausgesondert. Einer der Dichteoperatoren dieser
Teilmenge ist der kanonische DO ρkan,l .
Satz:
Für alle DO ρ mit
Fi fest (i = 1, ..., l),
Sp ρF̂i = Fi
(i = l + 1, ..., k),
(1.117)
gilt
S[ρ] ≤ S[ρkan,l ],
(1.118)
d.h. die kanonische Verteilung ist diejenige, die unter den genannten Nebenbedingungen die Entropie maximiert.
Beweis: siehe Übungen. Ein zentraler Schritt ist der Beweis der Ungleichung
Sp ρ̄(ln ρ − ln ρ̄) ≤ 0,
(1.119)
für beliebige Dichteoperatoren ρ und ρ̄.
Unter allen Zuständen mit den Nebenbedingungen (1.117) ist der Gleichgewichtszustand der ungeordnetste. Dies ist eine durchaus plausible Eigenschaft
Thermodynamik und Statistische Physik
27
des Gleichgewichts.
Wir betrachten jetzt einen Prozeß in einem System von einem beliebigen
Anfangszustand, nicht notwendig ein Gleichgewichtszustand, d.h. ρ̄(t), wobei
die Größen H, N̄ , V̄ (wir können das Volumen formal durch einen Operator
beschreiben, s. Bemerkung im Anschluß an (1.96)) die Werte
Ē = Sp ρ̄H, N̄ = Sp ρ̄N̂ , V̄ = Sp ρ̄V̂ , Entropie S̄,
(1.120)
annehmen. Am Ende des Prozesses, bei dem sich Energie, Teilchenzahl, Volumen geändert haben können, sei das System im thermischen Gleichgewicht
beschrieben durch ein großkanonisches Ensemble mit Parametern T , µ, p
ρg = e−β(H−µN̂ +pV̂ ) ,
(1.121)
wobei wir (1.83) mit (1.114) benutzt haben. Mit den Gleichgewichtsmittelwerten
E = Sp ρH, N = Sp ρN̂ , V = Sp ρV̂ , Entropie S,
(1.122)
sind die (nicht notwendig infinitesimalen) Änderungen
∆S = S − S̄, ∆E = E − Ē, ∆N = N − N̄ , ∆V = V − V̄ .
(1.123)
Es gilt
T ∆S ≥ ∆E − µ∆N + p∆V.
(1.124)
Beweis:
S̄ = −kB Sp ρ̄ ln ρ̄
1
=
≤ −kB Sp ρ̄ ln ρg |{z}
Sp ρ̄[H − µN̂ + pV̂ ]
|{z}
T
(1.119)
(1.121)
1
1
= S − [∆E − µ∆N + p∆V ].
= [Ē − µN̄ + pV̄ ] |{z}
T
T
(1.125)
(1.103)
Bei Abgeschlossenheit gilt ∆E = 0, ∆N = 0, ∆V = 0, so daß ∆S ≥ 0.
Außerdem zeigt die Erfahrung, daß ein abgeschlossenes System immer ins
Gleichgewicht strebt. Folglich strebt jedes abgeschlossene System dem Maximum der Entropie zu. Ferner ist die Entropie eines abgeschlossenen Systems
am größten im Gleichgewicht, d.h. S̄ ≤ SGleichgewicht .
Dies ist der 2. Hauptsatz der Thermodynamik.
Beispiel: Thermodynamische Potentiale
Eine typische Aufgabe lautet:
(a) gegeben sei die freie Energie F = F (T, N, V ) (thermodynamisches Potential der kanonischen Gesamtheit), wie lautet die Entropie in den natürlichen
28
A. Klümper
Variablen der mikrokanonischen Gesamtheit?
(b) Anwendung auf ein Gas aus klassischen Teilchen
µ
¶
V 3/2
F (T, N, V ) = −N kB T ln
T α
N
(1.126)
wobei α eine Konstante ist.
Lösung:
(a) Spezialisieren von (1.96) liefert
dβF = βµdN − βpdV + Edβ,
(1.127)
woraus folgt
∂F ¯¯
∂βF ¯¯
= βµ ⇒
= µ,
¯
¯
∂N ¯ V,T
∂N V,T
¯
∂βF ¯
∂F ¯
= −βp ⇒
= −p,
¯
¯
∂V ¯ N,T
∂V N,T
∂βF ¯
∂F ¯¯
∂F ¯¯
=E ⇒E =F +β
=F −T
.
¯
¯
¯
∂β N,V
∂β N,V
∂T N,V
(1.128)
Aus der letzten Gleichung folgt
F −E
∂F ¯¯
=
= −S.
¯
|{z}
∂T N,V
T
(1.129)
(1.115)
Dies ist die gesuchte Beziehung. Die Entropie ergibt sich aus Differentiation
von F als Funktion von T , V , N . Im letzten Schritt ergibt sich E = F + T S
als Funktion von T , V , N , und durch Umkehrung T = T (E, N, V ).
Die Gleichungen für die partiellen Ableitungen nach V , N und nun T lassen
sich ferner zum Differential zusammenfassen
dF = µdN − pdV − SdT.
(1.130)
(b) Anwendung
¶
µ
∂F ¯¯
3
V 3/2
S=−
T α + N kB
= N kB ln
¯
∂T N,V
N
2
3
E = F + T S = N kB T
à 2µ
¶3/2 !
2E
3
V
α + N kB .
⇒ S = N kB ln
N 3N kB
2
(1.131)
Thermodynamik und Statistische Physik
2
29
Thermodynamik des Gleichgewichts
Wir wollen hier allgemeine Relationen zwischen thermodynamischen Größen
im wesentlichen auf der im letzten Kapitel geschaffenen Basis herleiten und
anwenden. Zunächst wollen wir einen kurzen Überblick über die klassische
Thermodynamik geben und zeigen, wie unter anderem die Begriffe Temperatur und Entropie eingeführt werden, und warum diese mit denen des letzten
Kapitels identisch sind.
2.1
Abriß der klassischen Thermodynamik
Der Ausgangspunkt ist hier eine empirische Beschreibung makroskopischer
Systeme durch Zustandsvariable. Ein System im Gleichgewicht heißt thermodynamisches System und wird beschrieben durch wenige Makrovariable
Extensive Größen: E, V , N , (siehe später S),
Intensive Größen: p, θ (empirische Temperatur, siehe später: µ).
Drei dieser Größen sind unabhängig und definieren den Zustand, die restlichen sind festgelegt, d.h. Funktionen der übrigen Größen. (Dies gilt für ein
einkomponentiges System. Für mehrere Komponenten führt man Teilchenzahlen Ni der einzelnen Komponenten i ein.) Ein Beispiel für eine derartige
Abhängigkeit ist
p = p(T, N, V ) = p(T, N/V ),
(2.1)
und heißt auch Zustandsgleichung. (Für ein klassisches, ideales Gas gilt
p= N
V kB T .) Häufig hält man auch N fest und betrachtet dann nur noch die
Abhängigkeit von zwei unabhängigen Variablen, die den Zustand, in einem
Zustandsdiagramm durch einen Punkt dargestellt, festlegen.
p
p
2
1
2
1
V
T
Prozeß: Änderung von einem Zustand (1) in einen anderen Zustand (2)
durch Veränderung der äußeren Bedingungen.
Quasistatischer (qs) Prozeß: ein Prozeß, der langsam (quasistatisch) im
Vergleich zu Relaxationszeiten verläuft, so daß nur Gleichgewichtszustände
durchlaufen werden.
30
A. Klümper
Bemerkung: manchmal wird der Begriff “quasistatisch” im weiteren Sinne
(“langsam”) benutzt, ohne zu fordern, daß sich das (Gesamt-)System zu jedem Zeitpunkt im Gleichgewicht befindet. Wir werden an geeigneter Stelle
den Unterschied betonen.
Ein quasistatischer Prozeß läßt sich also in einem Zustandsdiagramm durch
eine Linie zwischen Anfangszustand (1) und Endzustand (2) darstellen. Nichtquasistatische Prozesse durchlaufen Nichtgleichgewichtszustände, die nicht
im Zustandsdiagramm verlaufen. Bestenfalls kann eine “Projektion” auf die
Diagrammebene dargestellt werden, in unserem Beispiel durch eine gestrichelte Linie.
p
p
qs
2
qs
1
2
1
nicht−qs
nicht−qs
V
T
Beispiel:
Expansion eines Gases von Volumen V1 auf V2 > V1 . Für Zustandsgrößen wie
E, V , N etc. gilt dann
Z 2
dE ist unabhängig vom Weg,
(2.2)
∆E = E2 − E1 =
1
d.h. dE ist ein vollständiges Differential.
Man verwendet δ-Differentiale bei infinitesimalen Größen δu, wenn dazu keine
Zustandsgröße u existiert.
Beispiel: f = f (x, y)
µ ¶
µ ¶
∂f
∂f
dx +
dy = δu + δv,
df =
(2.3)
∂x y
∂y x
| {z } | {z }
δu
δv
R2
wobei ∆u = u2 − u1 = 1 δu im allgemeinen wegabhängig ist, ebenso ∆v.
Natürlich ist ∆u + ∆v wegunabhängig.
Der erste entscheidende empirische Gesichtspunkt ist die Feststellung, daß
Wärme eine Form der Energie darstellt. Dies führt zum
1. Hauptsatz der Thermodynamik
Bei einer beliebigen Zustandsänderung zwischen einem Anfangszustand (1)
und einem Endzustand (2) ist die Summe der zugefügten Wärme ∆Q und der
von außen geleisteten Arbeit ∆A wegunabhängig und gleich der Änderung
der gesamten inneren Energie (die dadurch als Zustandsgröße definiert wird)
Thermodynamik und Statistische Physik
∆E = ∆Q + ∆A.
31
(2.4)
Bemerkung: Bei infinitesimalen Änderungen schreiben wir
∆E = δQ + δA,
(2.5)
wodurch wir andeuten, daß Wärme und Arbeit selbst vom Weg abhängig
sind. Für die am System geleistete Arbeit ist dies direkt einsichtig, da
δA = −pdV,
(2.6)
so daß in einem p − V -Diagramm die (vom System geleistete) Arbeit gleich
der Fläche unter der Prozeßlinie ist.
Die weitere Entwicklung der Thermodynamik hängt ab von der Möglichkeit,
von δQ ausgehend ein vollständiges Differential zu definieren. Im Rahmen
der klassischen Thermodynamik gelingt dies mit Hilfe des
2. Hauptsatz der Thermodynamik
Wir notieren zwei äquivalente Formulierungen
Es gibt keine thermodynamischen Prozesse, deren einzige Wirkung darin besteht, daß eine Wärmemenge einem Wärmespeicher entzogen und
(a) vollständig in Arbeit umgesetzt wird (Kelvin, Perpetuum mobile 2. Art),
(b) an einen wärmeren abgegeben wird (Clausius).
(Das Wort “einzig” soll andeuten, daß alle weiteren Komponenten einer Maschine nach Ausführung des Prozesses sich wieder im Ausgangszustand befinden.)
Wir wollen nun zeigen, daß beide Formulierungen äquivalent sind. Dazu
bemühen wir an geeigneter Stelle eine thermodynamische Maschine, die eine Wärmemenge Q2 einem Wärmespeicher mit Temperatur θ2 entnimmt,
Wärme Q1 an einen Wärmespeicher der Temperatur θ1 (< θ2 ) abgibt, und
die Differenz in Form von Arbeit A (= Q2 − Q1 ) leistet. Nach Durchführung
des Prozesses soll die Arbeitssubstanz (S) im Ausgangszustand vorliegen
(Kreisprozeß). Für eine derartige Maschine definieren wir den Wirkungsgrad durch
Q1
A
=1−
.
(2.7)
η=
Q2
Q2
Schematisch stellen wir die Maschine dar durch:
32
A. Klümper
θ2
Q
2
A= Q − Q 1
2
C
Q1
θ1
“(a) ⇐ (b)” Wir nehmen also an, daß Aussage (a) nicht gilt, m.a.W. wir
können Wärme Q einem Wärmespeicher entnehmen und vollständig in Arbeit umwandeln A = Q. Diese Arbeit kann dann natürlich an ein beliebiges
Reservoir der Temperatur θ2 > θ1 abgegeben werden (“Tauchsieder”). Dies
steht im Widerspruch zu (b).
“(a) ⇒ (b)” Wir nehmen nun an, daß (b) nicht gilt, also ein Prozeß existiert,
der Wärme von einem Reservoir bei Temperatur θ1 nach θ2 > θ1 transportiert. Wir lassen nun eine thermodynamische Maschine laufen, die wie oben
aus eine Wärmemenge Q2 bei Temperatur θ2 entnimmt, die Wärmemenge
Q1 bei Temperatur θ1 abgibt und Arbeit A = Q2 − Q1 leistet. Wir können
dann die Wärmemenge Q1 von Temperatur θ1 nach θ2 transportieren und
haben einen Gesamtprozeß, der die Wärmemenge Q2 − Q1 vollständig in Arbeit umwandelt im Widerspruch zu (a)!
Wir können aus dem 2. Hauptsatz nicht nur qualitative, sondern auch quantitative Aussagen ziehen. Wir notieren dazu den Begriff der
Reversibilität Prozesse, die auch zeitlich umgekehrt durchlaufen, thermodynamisch erlaubt sind. Ein Prozeß ist reversibel genau dann, wenn das
Gesamtsystem (System+Umgebung) sich quasistatisch ändert und zu jedem
Zeitpunkt im Gleichgewicht ist.
Bemerkung: Besteht das Gesamtsystem aus mehreren Teilen, so erstreckt
sich die letzte Aussage (quasistatisch, Gleichgewicht) auf jede Komponente.
Beachte, daß es quasistatische (langsame) Prozesse gibt, die Nichtgleichgewichtszustände durchlaufen, z.B. realisiert ein Wärmekontakt zwischen ungleich warmen Körpern einen quasistatischen Wärmeaustausch. Die ungleich
warmen Körper in Kontakt befinden sich jedoch nicht im Gleichgewicht.
Ein nichtquasistatischer Prozeß wie die instantane Expansion eines Gases ist
natürlich nicht reversibel.
Wir betrachten nun spezielle thermodynamische Maschinen, die reversibel
arbeiten: Carnot-Maschinen. Wir wollen an dieser Stelle zur Realisierung
Thermodynamik und Statistische Physik
33
von Carnot-Maschinen auf weiter unten und insbesondere auf die Übungen
verweisen. Hier wollen wir den wichtigen Satz beweisen:
(a) alle Carnot-Maschinen, die die gleichen Wärmespeicher mit Temperaturen θ1 < θ2 benutzen haben gleichen Wirkungsgrad,
(b) keine Maschine (weder reversibel noch irreversibel), die einen Kreisprozeß zwischen denselben Temperaturen ausführt, hat einen größeren Wirkungsgrad als ein Carnot-Prozeß.
zu (a): Wir nehmen an, daß zwei Carnot-Prozesse gegeben seien (C und C ′ )
mit unterschiedlichen Wirkungsgraden, o.B.d.A. η > η ′ . Dann können wir
den Prozeß C ′ (reversibel!) rückwärts laufen lassen als Wärmepumpe. Wir
koppeln dann C und C ′ (rückwärts) in der folgenden Weise
θ2
Q
Q’
2
2
A
C
C’
Q ’1
Q1
θ1
so daß C die Arbeit A leistet, die von C ′ vollständig verbraucht wird. Die
Gesamt-Maschine leistet folglich keine Arbeit, sondern transportiert Wärme.
Es gilt
ηQ2 = A = η ′ Q′2 ,
(2.8)
woraus direkt folgt
Q′2 =
η
Q2 > Q2 .
η′
(2.9)
Folglich wird an das Reservoir mit Temperatur θ2 eine positive Wärmemenge
(Q′2 − Q2 ) transportiert, die aus dem Reservoir der Temperatur θ1 (< θ2 )
stammt. Ein derartiger Wärmetransport ist jedoch nach dem 2. Hauptsatz
der Thermodynamik verboten!
zu (b): Wir nehmen an, daß es einen (evtl. irreversiblen) Prozeß P gibt, mit
höherem Wirkungsgrad als zu C. Wir können nun die gleiche Überlegung
wie oben durchführen mit der Ersetzung (C, C ′ ) ↔ (P, C), insbesondere ist
C reversibel und kann rückwärts ablaufen. Genau wie oben realisiert die gekoppelte Maschine einen nicht erlaubten Wärmetransport.
34
A. Klümper
Wir haben nun erkannt, daß der Wirkungsgrad eines Carnot-Prozesses nur
abhängt von den Temperaturen θ1 und θ2 der benutzten Wärmereservoirs
(η = η(θ1 , θ2 ), nicht jedoch von der tatsächlichen Realisierung, d.h. benutzte
Substanz etc.
Wir definieren nun die absolute Temperatur T = T (θ) derart, daß
1 − η(θ1 , θ2 ) =
T (θ1 )
.
T (θ2 )
(2.10)
Achtung: diese Beziehung ist keine (reine) Definition der Funktion T (θ). Es
wird implizit behauptet, daß eine derartige Funktion existiert. Dies erkennen
wir, wenn wir uns auf den Standpunkt stellen, daß T (θ) gegeben ist und
gemäß (2.10) eine Funktion η = η(θ1 , θ2 ) definiert ist. Für diese Funktion gilt
dann
T (θ1 )
= [1 − η(θ1 , θ3 )].
[1 − η(θ1 , θ2 )] [1 − η(θ2 , θ3 )] =
{z
}|
{z
} T (θ3 )
|
T (θ1 )
T (θ2 )
(2.11)
T (θ2 )
T (θ3 )
Offenbar bedingt (2.10) die Beziehung (2.11). Man kann auch umgekehrt
(selbst) zeigen, daß aus (2.11) schon (2.10) folgt mit einer geeigneten Funktion T (θ). Diese Funktion ist eindeutig definiert, wenn man von einem konstanten Skalierungsfaktor absieht.
Wir wollen nun (2.11) beweisen. Dazu halten wir fest
[1 − η(θ1 , θ2 )]Q2 = Q2 − A = Q1 .
(2.12)
Wenn wir nun für die Temperaturen θ1 < θ2 < θ3 die beiden Arbeitsmaschinen wie im Diagramm koppeln
θ3
Q
3
Q− Q2
3
Q2
θ2
Q
2
Q− Q1
2
Q1
θ1
Thermodynamik und Statistische Physik
35
liefert die “obere” Maschine an das Wärmereservoir mit Temperatur θ2 genausoviel Wärme, wie die “untere” verbraucht. Der Wirkungsgrad berechnet
sich aus einer konsekutiven Anwendung von (2.10)
Q1 = [1 − η(θ1 , θ2 )]Q2 ,
Q2 = [1 − η(θ2 , θ3 )]Q3 ,
⇒ Q1 = [1 − η(θ1 , θ2 )][1 − η(θ2 , θ3 )]Q3 ,
(2.13)
(2.14)
andererseits gilt für die kombinierte Maschine, die ein Carnotprozeß allein
zwischen den Temperaturen θ1 und θ3 darstellt
Q1 = [1 − η(θ1 , θ3 )]Q3 ,
(2.15)
[1 − η(θ1 , θ2 )][1 − η(θ2 , θ3 )] = [1 − η(θ1 , θ3 )],
(2.16)
der Vergleich liefert
also tatsächlich (2.11).
Wir haben schließlich die absolute Temperatur gemäß (2.10) definiert. Der
freie Skalierungsfaktor soll nach der üblichen Konvention so festgelegt werden,
daß
T (Tripelpunkt des Wassers) = 273, 16 K(elvin).
(2.17)
Unter anderem fixiert dies die Boltzmann-Konstante auf den Wert wie in
(1.62) angegeben. In den Übungen werden Sie sich davon überzeugen, daß
die hier definierte Temperatur mit der in Kapitel I gegebenen übereinstimmt.
Unter Verwendung der absoluten Temperatur kann man nun eine Zustandsfunktion definieren, die man Entropie nennt. Bei einem beliebigen quasistatischen Kreisprozeß gilt
Z
δQ
= 0,
(2.18)
geschl.Weg T
wobei δQ positiv (negativ) gewertet wird, wenn die Wärme aufgenommen
(abgegeben) wird. (Der Beweis ergibt sich durch eine Parkettierung der eingeschlossenen Fläche durch infinitesimale Streifen, die durch Isothermen begrenzt sind. Hierdurch werden infinitesimale Carnot-Prozesse mit
µ
¶
Z
Q2
−Q1
Q2 T1
Q1
δQ
=
+
=
−
=0
(2.19)
T2
T1
T1 T2
Q2
inf.Carnot−P. T
definiert, wobei wir benutzt haben (2.7) und (2.10). In der Summe dieser
Integrale heben sich die Integrationswege innerhalb der umrandeten Fläche
gerade paarweise auf, nicht so die Stücke, die am Flächenrand verlaufen.
36
A. Klümper
Dieser Rest ist identisch zur linken Seite von (2.18), aber wegen (2.19) letztendlich gleich 0.)
Wegen (2.18) ist nun für alle Prozesse, die vom Zustand (1) zu Zustand (2)
R2
führen, das Integral 1 δQ/T dasselbe, so daß eine Zustandsfunktion S, die
Entropie, durch
Z 2
δQ
= S(2) − S(1),
(2.20)
T
1
definiert wird. Jetzt ist auch unsere frühere Frage, wie δQ (durch einen geeigneten Multiplikator) durch ein vollständiges Differential ausgedrückt werden
kann, beantwortet
δQ = T dS.
(2.21)
Irreversible Prozesse
Für beliebige nichtreversible Zustandsänderungen (also nichtquasistatische
mit beispielsweise plötzlicher Volumenzunahme, oder mit langsamen Prozessen, die Wärmetransport von warmen zu kälteren Teilen der “Arbeitssubstanz” beinhalten, und damit keine Gleichgewichtszustände realisieren) gilt
Z
1
2
δQ
< S(2) − S(1),
T
(2.22)
wobei hier δQ die Wärmemenge ist, die vom System aus der Umgebung
aufgenommen wird durch einen Substanzteil, der die (wohldefinierte!?) Temperatur T besitzt.
Der Grund für die Ungleichung ist verständlich, wenn man beachtet, daß die
rechte Seite die Änderung einer Zustandsgröße ist, die sich im Prinzip durch
ein Integral wie auf der linken Seite (Ersatzprozeß) berechnet, wobei allerdings im Falle der nichtreversiblen Zustandsänderung das Gesamtsystem in
viele Subsysteme, die einzeln im Gleichgewicht sind, zerlegt und der gesamte
Wärmetransport berücksichtigt werden muß. Auf der linken Seite von (2.22)
ist der Wärmeaustausch mit der Umgebung berücksichtigt, nicht jedoch der
Austausch von Wärme innerhalb des Körpers von wärmeren zu kälteren Teilen. Dadurch ist vernachlässigt
µ
¶
1
−Q
1
Q
+
= Q
−
>0
(2.23)
|{z} T1
T1
T2
T2
|
{z
}
>0
>0
wobei Q exemplarisch die Wärmemenge ist, die von T2 nach T1 (< T2 ) transportiert wird. Dies ist der Teil, der die Differenz von l.S. zu r.S. in (2.22)
ausmacht.
Thermodynamik und Statistische Physik
37
Im Falle nichtquasistatischer Änderungen in Form einer plötzlichen Volumenzunahme wollen wir statistisch-mechanisch argumentieren, indem wir auf das
vergrößerte Phasenvolumen hinweisen, das mit einer größeren Unordnung,
d.h. Entropie verbunden ist. Oder aber wir verweisen einfach auf (1.124) des
Kapitels I.
Für ein thermisch isoliertes System gilt immer δQ = 0 und mit (2.22)
S(2) ≥ S(1),
(2.24)
wobei das Gleichheitszeichen genau für reversible Prozesse und das Ungleichheitszeichen für irreversible Prozesse steht.
Wir sammeln zum Abschluß dieses Paragraphen noch einige Begriffe und Eigenschaften zu
Thermodynamische Maschinen und Kreisprozesse
Viele Maschinen benutzen eine Arbeitssubstanz, die einen zyklischen Prozeß
durchläuft. In einem p − V –Diagramm sieht ein derartiger Prozeß wie folgt
aus
p
p
qs
qs
nicht−qs
V
V
Im ersten Fall ist ein Kreisprozess gezeigt, der allein Gleichgewichtszustände
durchläuft. Der dargestellte Prozeß ist ein reversibler Prozeß der Arbeitssubstanz. Je nachdem wie der Wärmetransport mit der Umgebung erfolgt,
mag der Gesamtprozeß reversibel sein oder auch nicht! (Bei Verwendung nur
zweier Wärmereservoirs arbeitet ein generischer, reversibler Kreisprozeß nur
in irreversibler Weise mit der Umgebung, siehe Übungen). Im zweiten Fall
verlaufen Teile des Prozesses in nichtquasistatischer Weise. Hier ist weder der
Prozeß der Arbeitssubstanz noch der Gesamtprozeß reversibel.
Maschinen, die wie in der Abbildung rechts herum laufen (Rechtsprozesse),
leisten Arbeit. Da pdV die vom System geleistete (infinitesimale) Arbeit ist,
ergibt sich die gesamte geleistete Arbeit A als eingeschlossene Fläche im
p − V –Diagramm. Diese Prozesse realisieren Arbeitsmaschinen. Die aufgenommene Wärmemenge Q2 ist größer als die abgegebene Wärmemenge Q1 ,
Q2 = A + Q1 . Wir hatten schon den Wirkungsgrad einer Arbeitsmaschine
definiert als
η=
Q2 − Q1
Q1
geleistete Arbeit
=
=1−
.
aufgenommene Wärme
Q2
Q2
(2.25)
38
A. Klümper
Maschinen, die links herum laufen (Linksprozesse), nehmen Arbeit auf. Die
vom System aufgenommene Arbeit −A ergibt sich als eingeschlossene Fläche
im p − V –Diagramm. Diese Prozesse realisieren Wärmepumpen. Die aufgenommene Wärmemenge −Q1 ist kleiner als die abgegebene Wärmemenge
−Q2 , Q2 = A + Q1 . Der Wirkungsgrad der Wärmepumpe ist definiert als
ηW =
abgegebene Wärme
Q2
=
=
aufgenommene Arbeit
Q2 − Q1
µ
1−
Q1
Q2
¶−1
.
(2.26)
Beachte, daß η und η W reziprok aussehen. Es scheint, daß eine schlechte Arbeitsmaschine eine gute Wärmepumpe darstellt. Dies setzt aber voraus, daß
der Rechtsprozeß umgekehrt als Linksprozeß durchlaufen werden kann, also
reversibel ist!
Kreisprozesse bestehen häufig aus einer Kombination von einfachen Teilprozessen, mit festgehaltener Temperatur (Isotherme), Entropie (Adiabate/Isentrope), Druck (Isobare), Volumen (Isochore). Beispiel des “StandardCarnot-Prozesses”:
p
isotherm
adiabatisch
adiabatisch
isotherm
V
Zu Kreisprozessen im T −S–Diagramm siehe Übungen, ebenso die Diskussion
von (Ir-)Reversibilität von Kreisprozessen.
2.2
Thermodynamische Größen
Wir haben jetzt die Diskussion der klassischen Thermodynamik abgeschlossen und erlauben wieder eine vollständige Nutzung der Kenntnisse aus Kapitel I, “Statistische Physik”. Wir wollen hier die üblichen thermodynamischen
Variablen E, N , V , S, T , µ, p als Zustandsvariablen auffassen, die einen
Makrozustand charakterisieren, der auf einer 3-dimensionalen Mannigfaltigkeit “lebt” (also durch 3 unabhängige Variable charakterisiert ist). Welche 3
Größen die “natürlichen” Variablen sein sollen, können wir für den Moment
unbestimmt lassen und abstrakt von Funktionen f und deren Differentialen
df sprechen. In diesem Sinne erinnern wir an (1.100), d.h.
T dS = dE − µdN + pdV.
(2.27)
Wenn wir die Größen N und V festhalten, sondern wir eine 1-dimensionale
Untermannigfaltigkeit aus, d.h. einen Weg entlang dessen wir die Variation
Thermodynamik und Statistische Physik
39
von E bei Variation von S bestimmen können. In dieser Weise erhalten wir
aus (2.27)
¶
¶
µ
µ
1
∂S
∂E
bzw.
(2.28)
=
T =
∂S N,V
T
∂E N,V
In analoger Weise erhalten wir
µ
¶
∂E
µ=
∂N S,V
bzw.
µ
=−
T
µ
∂S
∂N
¶
,
(2.29)
E,V
das chemische Potential ist also die Energie, die ein Teilchen mitbringen muß,
um das Gleichgewicht bei festem S, V nicht zu stören. Ferner
¶
¶
µ
µ
p
∂S
∂E
bzw.
.
(2.30)
=
p=−
∂V S,N
T
∂V E,N
Gleichgewichtsbedingungen
Wir wissen, die Entropie eines abgeschlossenen Systems ist im Gleichgewicht
im Maximum. Wir betrachten nun ein Gesamtsystem bestehend aus zwei
Subsystemen in Kontakt.
111111111111
00000
0000000
00000
11111
0000000
1111111
00000
11111
0000000
1111111
00000
11111
0000000
1111111
000001111111
11111
0000000
1
2
Wegen Abgeschlossenheit ist die Summe der Energien (Volumina, Teilchenzahlen) der Subsysteme gleich der Gesamtenergie und damit eine Konstante
E = E1 + E2 ,
V = V1 + V2 ,
N = N1 + N 2 .
(2.31)
Die Gesamtentropie berechnet sich ebenfalls als Summe der Entropien der
Subsysteme
S = S1 (E1 , V1 , N1 ) + S2 (E2 , V2 , N2 ),
(2.32)
wobei die Aufteilung der Erhaltungsgrößen Energie etc. auf die Subsysteme so
erfolgt, daß S maximal ist, insbes. bei Variation δEi , δVi , δNi ein stationärer
Punkt vorliegt. Wir betrachten zunächst eine Variation δEi und halten die
anderen Größen fest
0 = δE1 + δE2 ,
µ
¶
∂S
∂S1
∂S2
∂S1
∂S2
1
1
0=
=
+
=
−
=
−
.
∂E1
∂E1
∂E1
∂E1
∂E2 |{z} T1
T2
(2.28)
(2.33)
40
A. Klümper
Nun gilt Gleichheit der Temperaturen T1 = T2 .
Führen wir eine ähnliche Überlegung durch und betrachten Variation des
Volumens, aber halten die übrigen Größen fest, so folgt mittels (2.29)
p2
p1
=
,
T1
T2
(2.34)
also mit der Gleichheit der Temperaturen gilt auch p1 = p2 . Und schließlich
folgt bei Variation der Teilchenzahl µ1 = µ2 .
Fazit: ein System ist genau dann im thermischen Gleichgewicht, wenn die intensiven Größen T , p, µ (allgemeiner: alle Felder) in beliebigen Subsystemen
gleiche Werte annehmen.
Wärmefluß
Wir schauen uns zwei Teilsysteme, die gerade in Kontakt gebracht werden,
genauer an. Zunächst sind die Temperaturen T1 und T2 im allgemeinen nicht
gleich, aber der Gleichgewichtszustand wird angestrebt (empirisch), in dem
sich die Temperaturen angeglichen haben (siehe oben). In Abhängigkeit von
der Zeit t haben wir
E = E1 (t) + E2 (t),
S(t) = S1 (E1 (t)) + S2 (E2 (t)),
Nach dem 2. Hauptsatz (z.B. nach Formulierung in Kapitel I) folgt
¶
µ
¶
µ
dS
dE1
∂S2 dE1
1
∂S1
1
0<
=
−
=
−
,
dt
∂E1
∂E2
dt
T1 (t) T2 (t)
dt
(2.35)
(2.36)
1
Wenn also T1 > T2 muß dE
dt < 0 sein, d.h. Wärme fließt von der höheren zur
niedrigeren Temperatur. Damit ist der 2. Hauptsatz, wie der Abhandlung der
klassischen Thermodynamik zu Grunde gelegt, abgeleitet.
Bemerkung: In den Übungen werden Sie eine ähnliche Überlegung für Spinsysteme durchführen, wobei T > 0 und T < 0 erlaubt sind, also auch negative
Temperaturen auftreten können. Sie werden sehen, daß im obigen Sinne negative Temperaturen immer als heißer als jede positive Temperatur angesehen
werden können!
Thermodynamische Potentiale
Wir hatten schon thermodynamische Potentiale in verschiedenen Gesamtheiten eingeführt als Funktionen der “natürlichen Variablen” Fi und λj , so daß
sich λi und Fj durch geeignete partielle Ableitungen ergeben. Wir finden es
jedoch praktischer mit T und µj zu arbeiten, wobei λT = −β = −1/kB T ,
λj = βµj .
Thermodynamik und Statistische Physik
41
(1) Wir wollen nochmal die thermodynamischen Potentiale Revue passieren
lassen, wobei wir nur fordern, daß Ableitungen nach den extensiven Größen Fi
die intensiven liefern (T , µi ) und umgekehrt. Wir haben (1.100) und DuhemGibbs (1.103)
dE = T dS − pdV + µdN,
E = T S − pV + µN.
(2.37)
(2.38)
Wenn wir in der mikrokanonischen Gesamtheit statt der 3 extensiven
Größen E, V , N den Satz S, V , N als Variable benutzen, kann E = E(S, V, N )
als thermodynamisches Potential der mikrokanonischen Gesamtheit aufgefaßt werden. (Achtung: hier gibt es einen leichten Unterschied zu Kapitel I
wo Φmik = −T S = Φmik (E, V, N ). Der Grund liegt in der Sonderrolle, die die
Temperatur T spielt. In Kapitel I waren konjugiert Fi und λi , insbesondere
hatten alle Produkte λi Fi die gleiche Einheit, tatsächlich dimensionslos. Hier
in Kapitel II wollen wir als konjugiert betrachten Fi und µi , deren Produkte
immer die Einheit der Energie haben. Wenn wir neben den µi als gleichartige
intensive Variable die Temperatur T behandeln wollen, so kann die dazu konjugierte Größe nicht die Energie selbst sein, aber die Entropie hat die richtige
Dimension!) Wir werden jedoch sehen, daß in vielen Fällen, wenn wir thermodynamische Potentiale in Abhängigkeit von T (statt S) behandeln, genau
die “alten” aus Kapitel I erscheinen.
Die Energie bezeichnet man auch als 1. thermodynamisches Potential. Als
weitere thermodynamische Potentiale erhalten wir die Größen, wenn wir in
(2.38) Legendre-Transformationen für einige bis zu allen Argumenten durchführen. Hier gibt es insgesamt 2×2×2 = 8 Möglichkeiten. Bei jeder LegendreTransformation wird einer der Terme T S, pV , µN von der rechten Seite von
(2.38) auf die linke Seite geschafft. Dies wollen wir im einzelnen studieren.
In der Praxis betrachtet man jedoch nicht alle 8 Potentiale, sondern zu dem
mikrokanonischen Potential zusätzlich nur 4 weitere.
(2) Freie Energie
Wir führen eine Legendre-Transformation bzgl. der ersten Variable (S) aus
F = F (T, V, N ) := E − S
∂E
= E − T S |{z}
= −pV + µN,
∂S |{z}
(2.37)
(2.39)
(2.38)
wobei in E die Abhängigkeit von der neuen Variablen T über S = S(T, V, N )
nach Umkehrung von T = T (S, V, N ) erscheint. Das Differential berechnet
sich nach (2.37)
dF = dE − T dS − SdT = −SdT − pdV + µdN,
(2.40)
im Vergleich zu (2.37) sind im ersten Term T und S vertauscht worden und
das Vorzeichen hat sich geändert.
42
A. Klümper
Explizit bedeutet dies
µ
¶
∂F
−S =
,
∂T V,N
−p =
µ
∂F
∂V
¶
,
µ=
T,N
µ
∂F
∂N
¶
.
(2.41)
T,V
Mit einem Blick auf (1.115) folgt auch
ρkan = eβ(F −H) ,
F = −kB T ln Zkan ,
(2.42)
d.h. F ist in der kanonischen Gesamtheit über die Zustandssumme berechenbar.
Bemerkung: In Kapitel I lieferte die Legendre-Transformation ausgehend
von Φmik = −T S −→ Φmik − (−E) = E − T S, was identisch ist mit E −→
E − T S, d.h. gleich F .
Bedeutung: die Arbeitsleistung am System −pdV bei konstantem N und
T geht nicht direkt in die Energie, sondern in die freie Energie dF = −pdV
(dN = dT = 0).
(3) Enthalpie
Wir führen eine Legendre-Transformation bzgl. der zweiten Variablen (V )
aus
H = H(S, p, N ) := E − V
∂E
= E + pV |{z}
= T S + µN,
∂V |{z}
(2.37)
(2.43)
(2.38)
wobei in E die Abhängigkeit von der neuen Variablen p über V = V (S, p, N )
nach Umkehrung von p = p(S, V, N ) erscheint. Das Differential berechnet
sich aus (2.37), wobei im zweiten Term p und V ausgetauscht werden und
sich das Vorzeichen ändert
dH = T dS + V dp + µdN.
Explizit bedeutet dies
¶
µ
∂H
,
T =
∂S p,N
V =
µ
∂H
∂p
¶
,
S,N
µ=
(2.44)
µ
∂H
∂N
¶
.
(2.45)
S,p
(4) Freie Enthalpie
Wir führen eine Legendre-Transformation bzgl. der ersten und zweiten Variablen aus
G = G(T, p, N ) := E − T S + pV = µN,
(2.46)
mit
dG = −SdT + V dp + µdN,
(2.47)
Thermodynamik und Statistische Physik
43
explizit
−S =
µ
∂G
∂T
¶
,
V =
p,N
µ
∂G
∂p
¶
,
T,N
µ=
µ
∂G
∂N
¶
.
(2.48)
T,p
Mit (1.115) folgt auch
G = −kB T ln Zkan,2 ,
ρkan,2 = eβ(G−H−pV ) ,
(2.49)
d.h. G ist in der (allg.) kanonischen Gesamtheit mit Austausch von E und V
über die Zustandssumme berechenbar.
(5) Großkanonisches Potential
Wir führen eine Legendre-Transformation bzgl. der ersten und dritten Variablen aus
Φ = Φ(T, V, µ) := E − T S − µN = −pV,
(2.50)
mit
dΦ = −SdT − pdV − N dµ,
(2.51)
explizit
−S =
µ
∂Φ
∂T
¶
,
V,µ
−p =
µ
∂Φ
∂V
¶
,
T,µ
−N =
µ
∂Φ
∂µ
¶
.
(2.52)
T,V
Mit (1.115) folgt
Φ = −kB T ln Zg ,
ρg = eβ(Φ−H+µN̂ ) ,
(2.53)
d.h. Φ ist in der großkanonischen Gesamtheit mit Austausch von E und N
über die Zustandssumme berechenbar.
Bemerkung: alle Potentiale sind extensiv. Wir werden manchmal Dichten
dieser Potentiale und anderer extensiver Größen betrachten und dann durch
kleine Bustaben kennzeichnen. Damit erhalten wir
¶
µ
S V
,
,
E = E(S, V, N ) = N e
µN N¶
V
,
F = F (T, V, N ) = N f T,
N
¶
µ
S
,p ,
H = H(S, p, N ) = N h
N
G = G(T, p, N ) = N g(T, p),
mit µ = g,
Φ = Φ(T, V, µ) = −V p(T, µ).
(2.54)
Abgeleitete Größen
44
A. Klümper
Man interessiert sich z.B. dafür, wieviel Wärme nötig ist, um in einem quasistatischen Prozeß die Temperatur zu ändern (Wärmekapazität), Druckabhängigkeit des Volumens (Kompressibilität), oder Temperaturabhängigkeit
des Volumens (thermischer Ausdehnungskoeffizient):
Wärmekapazität (spezifische Wärme)
(δQ)qs
∂S
=T
,
(2.55)
dT
∂T
(extensive Größe). Üblicherweise ist N fest, wobei dann noch p oder V festgehalten werden und man einführt
¶
¶
µ
µ
∂E
∂S
=
,
CV,(N ) = T
∂T N,V |{z} ∂T N,V
(2.37)
µ
¶
¶
µ
∂S
∂H
Cp,(N ) = T
=
,
(2.56)
∂T N,p |{z} ∂T N,p
C=
(2.44)
Kompressibilität
κ=−
1 ∂V
,
V ∂p
(2.57)
(intensive Größe). Bei festem N können dann noch T (isotherm) oder S
(adiabatisch) festgehalten werden
µ
¶
1 ∂V
κT,(N ) = −
,
V
∂p T,N
µ
¶
1 ∂V
.
(2.58)
κS,(N ) = −
V
∂p S,N
Thermischer Ausdehnungskoeffizient
µ
¶
1 ∂V
α=
,
V ∂T p,N
(2.59)
(intensive Größe).
Die hier aufgeführten C, κ, α sind die gebräuchlichsten, da sie direkt meßbar
sind. Wir wollen zeigen, daß die c’s und κ’s nichtnegativ sind.
Als erstes zeigen wir
CV,N ≥ 0.
(2.60)
Beweis: Ausgehend von (1.61) in der kanonischen Gesamtheit haben wir
¶
µ
∂E
∂
2
2
= kB T 2 CV,N .
(2.61)
0 ≤ (∆H) = − E = kB T
∂β
∂T V,N
Thermodynamik und Statistische Physik
45
Die Wärmekapazität mißt die Energieschwankungen in der kanonischen Gesamtheit!
Wir wollen weiterhin zeigen
κT,N ≥ 0.
(2.62)
Beweis: Ausgehend von der großkanonischen Gesamtheit und (1.87) haben
wir
¶
µ
∂N
.
(2.63)
0 ≤ β(∆N )2 =
∂µ T,V
Aus der differentiellen Formulierung von Duhem-Gibbs (1.104) folgt für festes
T : N dµ = V dp. Daher
µ
¶
µ
¶
∂N
N ∂N
0≤
=
.
(2.64)
∂µ T,V
V
∂p T,V
Weiterhin ist p = p(T, V /N ), woraus folgt
¶
µ
¶
µ
V
∂p
∂p
=−
,
∂N T,V
N ∂V T,N
also
0≤
2.3
N
V
µ
∂N
∂p
¶
T,V
=−
N2
V2
µ
∂V
∂p
¶
=
T,N
(2.65)
N2
κT,N .
V
(2.66)
Thermodynamische Relationen (Maxwell Relationen)
Wir untersuchen hier Relationen (Gleichungen und Ungleichungen) zwischen
thermodynamischen Größen und ihren Ableitungen. Ab hier soll immer N
fest sein, so daß alle Größen Funktionen von nur zwei unabhängigen Variablen sind. Es gibt drei Prinzipien aus denen wir Relationen ableiten.
(i) Integrabilitätsbedingung
Viele thermodynamische Größen stellen sich als partielle Ableitungen geeigneter therm. Potentiale dar. Da partielle Ableitungen 2. Ordnung unabhängig
von der Reihenfolge sind, d.h.
f = f (x, y) → df =
∂f
∂ ∂f
∂ ∂f
∂f
dx +
dy →
=
,
∂x
∂y
∂y ∂x
∂x ∂y
folgt eine Fülle von Relationen. Wir notieren:
(1)
¶
¶
µ
µ
∂p
∂S
=
,
dF = −SdT − pdV →
∂V T
∂T V
mit dE = T dS − pdV folgt
(2.67)
(2.68)
46
A. Klümper
µ
∂E
∂V
¶
=T
T
µ
∂S
∂V
¶
T
µ
−p=T
∂p
∂T
¶
V
− p,
(2.69)
und auch
¶
µ
¶ ¶
µ
µ
¶ ¶
µ 2 ¶
µ
µ
∂S
∂
∂S
∂ p
∂cV
∂
=T
=T
=T
.
∂V T
∂V ∂T V T
∂T ∂V T V
∂T 2 V
(2.70)
(2)
µ ¶
¶
µ
∂S
∂V
dG = −SdT + V dp → −
=
= V α,
(2.71)
∂p T
∂T p
und
µ
∂cp
∂p
¶
=T
T
Ã
∂
∂p
µ
¶ !
∂S
∂T
p
=T
T
µ
∂
∂T
µ
∂S
∂p
¶ ¶
T
p
= −T
µ
∂2V
∂T 2
¶
,
p
(2.72)
etc.
(ii) Jacobi-Determinante
Hier faßt man zwei thermodynamische Größen, f = f (x, y), g = g(x, y), zu einer zweikomponentigen Funktion zusammen, für die die Jacobi-Determinante
wie in der Analysis definiert ist
∂(f, g)
:= Det
∂(x, y)
µ ∂f
∂x
∂g
∂x
∂f
∂y
∂g
∂y
¶
=
µ
∂f
∂x
¶ µ
y
∂g
∂y
¶
x
−
µ
∂f
∂y
¶ µ
x
∂g
∂x
¶
.
(2.73)
y
(Verallgemeinerung auf 3 bzw. mehrdimensionalen Fall direkt möglich.) Viele
therm. Relationen ergeben sich aus der Möglichkeit, die Jacobi-Determinante
mittels Kettenregel zu berechnen. Seien f , g Funktionen von u, v, d.h. f =
f (u, v), g = g(u, v), und u, v Funktionen von x, y, d.h. u = u(x, y), v =
v(x, y), dann gilt
∂(f, g)
∂(f, g) ∂(u, v)
=
.
(2.74)
∂(x, y)
∂(u, v) ∂(x, y)
Eine Vereinfachung findet statt, wenn im Zähler und Nenner gleiche Größen
auftreten
µ ¶ µ ¶
µ ¶
µ ¶ µ ¶
∂y
∂y
∂f
∂f
∂f
∂(f, y)
−
=
.
(2.75)
=
∂(x, y)
∂x y ∂y x
∂y x ∂x y
∂x y
Analog gilt
∂(y, f )
∂(f, y)
∂(y, f )
∂(f, y)
=
=−
=−
=
∂(x, y)
∂(y, x)
∂(y, x)
∂(x, y)
µ
∂f
∂x
¶
y
.
(2.76)
Thermodynamik und Statistische Physik
47
Wir notieren vier Anwendungen:
(1)
µ
∂p
∂T
¶
V
¡ ∂V ¢
α
∂(p, V )
∂(p, V ) ∂(p, T )
∂T p
=
=
= −³ ´ =
,
∂V
∂(T, V )
∂(p, T ) ∂(T, V )
κT
∂p
(2.77)
T
(2)
µ
∂p
∂V
¶
S
¡ ∂S ¢ µ
¶
∂(p, S)
∂p
∂(p, S) ∂(p, T ) ∂(V, T )
∂T p
=
,
=
= ¡ ∂S ¢
∂(V, S)
∂(p, T ) ∂(V, T ) ∂(V, S)
∂V T
∂T V
(2.78)
bzw. bei Benutzung von (2.56) und (2.58)
Cp
κT
=
.
CV
κS
(2.79)
(3)
¶
∂(S, V )
∂(S, V ) ∂(T, p)
∂S
=T
=T
∂T V " ∂(T, V )
∂(T, p) ∂(T, V )
µ
¶ µ
¶ µ
¶
¶ #
µ ¶ µ
∂S
∂V
∂V
∂p
∂S
=T
−
∂V T
∂T p ∂p T
∂p T ∂T p
1
= Cp + T
(V α)2 ,
|{z}
−V κT
CV = T
µ
(2.80)
(2.72)
oder umgestellt
Cp − CV = T V
α2
≥ 0.
κT
(2.81)
Mit (2.79) folgt auch
κT − κS = κT
µ
CV
1−
Cp
¶
= TV
α2
.
Cp
(2.82)
Nun folgen die Ungleichungen
Cp ≥ CV ≥ 0,
(4) Es gilt
κT ≥ κS ≥ 0.
(2.83)
¡ ∂T ¢
∂(T, S) ∂(V, S)
∂(T, S)
=
= − ³ ∂V ´S = 1,
∂p
∂(p, V )
∂(V, S) ∂(p, V )
∂S
(2.84)
V
wobei die letzte Gleichung mittels (i) “Integrabilitätsbedingung” für E, d.h.
dE = T dS − pdV gewonnen wurde.
48
A. Klümper
(iii) Stabilität: da die Entropie eines abgeschlossenen Systems im Gleichgewicht ihr Maximum annimmt, gilt für Fluktuationen zwischen zwei Untersystemen die Erhaltung (2.31) und (2.32). Wir hatten schon Stationarität
ausgenutzt. Es gilt natürlich mehr, wir haben ein negativ-definites 2. Differential. In den Übungen wird diese Überlegung genauer besprochen. (Zerlege
Gesamtsystem in zwei identische Subsysteme.) Wir wollen hier das Ergebnis
festhalten
1 ∂2S
1 ∂2S
∂2S
2
2
(δE)
+
(δV
)
+
δEδV ≤ 0.
2 ∂E 2
2 ∂V 2
∂E∂V
(2.85)
In den Übungen wird besprochen, wie hieraus c ≥ 0 und κT ≥ 0 folgt.
2.4
Irreversible Prozesse
Zusätzlich zu den in Abschnitt II.1 besprochenen (im wesentlichen reversiblen) Kreisprozessen wollen wir hier zwei wichtige irreversible Prozesse untersuchen.
Es wurde schon erwähnt: Expansion ins Vakuum: Wir betrachten ein Gas
in einem Volumen V1 . Nach plötzlichem Entfernen einer Trennwand expandiert das Gas frei in ein größeres Volumen V2 .
qs−Ersatzprozess
V
111
000
000
111
000
111
000
111
1
E
(1)
(2)
nicht−qs Prozess
V
V1
V2
Es wird weder Arbeit geleistet noch Wärme übertragen
V2
δA = δQ = 0 → ∆E = 0 : E1 = E2 .
(2.86)
In einem Zustandsdiagramm ist der Prozeß natürlich nicht eintragbar, da
die Zwischenzustände Nichtgleichgewichtszustände sind (punktiert). Da die
Änderung von Zustandsgrößen wegunabhängig ist, kann die Änderung durch
einen beliebigen, quasistatischen Ersatzprozeß berechnet werden.
Entropieänderung:
∆S = S2 −S1 =
Z
1
2
dS =
Z
1
2
µ
∂S
∂V
¶
dV
E
=
|{z}
p
dS= dE
T + T dV
Z
1
2
p
dV > 0. (2.87)
T
Thermodynamik und Statistische Physik
49
Temperaturänderung:
∆T = T2 − T1 =
mit
µ
∂T
∂V
¶
=
E
∂(T, E) ∂(V, T )
1
=−
∂(V, T ) ∂(V, E)
CV
µ
Z
2
µ
∂E
∂V
1
∂T
∂V
¶
¶
1
=
|{z}
CV
T
dV,
(2.88)
E
(2.69)
·
p−T
µ
∂p
∂T
¶ ¸
.
V
(2.89)
Für die explizite Rechnung brauchen wir ab jetzt eine Zustandsgleichung.
In den Übungen werden Sie ∆S und ∆T für das ideale Gas berechnen.
Joule-Thomson-Prozeß
Ein Gas wird über ein Drosselventil vom Druck p1 auf einen Druck p2 (<
p1 ) entspannt. Der Prozeß soll langsam (stationär) ablaufen, insbes. soll der
Druck im linken Volumen konstant bei p1 gehalten werden, gleiches gelte für
den Druck p2 im rechten Volumen. Dies wird durch geeignetes Nachführen
der Stempel erreicht, wodurch der Verlust (Gewinn) durch die Strömung
durch das Ventil ausgeglichen wird. Der Prozeß ist irreversibel, da es im
Drosselventil zu Reibung kommt bzw. die Moleküle aus einem Bereich hoher
Dichte (links) in einen Bereich niedriger Dichte (rechts) wechseln und das
verfügbare Phasenvolumen vergrößert wird.
Es wird keine Wärme zugeführt δQ = 0, aber es wird Arbeit geleistet δA =
p1 V1 − p2 V2 . Daher ist die Enthalpie H eine Konstante (s. Übungen)! Es gibt
eine Entropieerhöhung
Z 2
V
dp > 0,
(2.90)
∆S = −
1 T
da V /T > 0 aber dp < 0 (für einen geeigneten Ersatzprozeß). Damit haben
wir unsere Erwartung von oben auch formal bestätigt.
Für die Temperaturänderung gilt (s. auch wieder die Übungen)
¶
Z 2µ
Z 2
∂T
dp,
dT =
T2 − T1 =
∂p H
1
1
µ
¶
∂T
V
=
(αT − 1).
(2.91)
∂p H
Cp
Da Cp /V > 0 haben wir beim Joule-Thomson-Prozeß mit dp < 0
Temperaturerhöhung
wenn α < 1/T ,
Temperaturerniedrigung wenn α > 1/T ,
Bei Gasen und Flüssigkeiten ist für tiefe Temperaturen α > 1/T , daher dient
der Joule-Thomson-Prozeß, evtl. kaskadenförmig, zum Abkühlen und Verflüssigen.
50
A. Klümper
Ideales Gas: Anwendung auf diesen Fall in den Übungen.
2.5 Tieftemperaturverhalten: Nernst’sches Theorem (3.
Hauptsatz)
¡ ¢
Da CV > 0 und CV = ∂E
∂T V ist die Energie eines Systems bei festem V
eine monotone Funktion der Temperatur. Bei T = 0 nimmt das System die
kleinstmögliche Energie an: E(T = 0) = E0 = Grundzustandsenergie. Im
allgemeinen ist der Grundzustand eindeutig, falls Entartung vorliegt soll g
die Anzahl der Grundzustände bezeichnen. Bei T = 0 ist die Entropie
S(T = 0) = kB ln g,
(2.92)
siehe auch Übungen. Falls g = 1 gilt
S(T = 0) = 0,
für beliebige V , N .
(2.93)
Selbst wenn g > 1, gilt bei realen Systemen höchstens g = O(N ) und damit
S
O(ln N )
=
→ 0 für N → ∞,
N
N
(2.94)
also bei T = 0 nur subextensiv.
Dies ist das Nernst-Theorem: Die Entropie eines realistischen Systems verschwindet für T = 0 bei beliebigem V , N .
In der axiomatischen Thermodynamik wird dieses Theorem empirisch als 3.
Hauptsatz der Thermodynamik eingeführt.
Folgerungen aus dem Nernst-Theorem sind:
Verschwinden des therm. Ausdehnungskoeffizienten
µ
¶
1 ∂V
= 0,
α=
V ∂T p
¶
µ
α
∂p
= 0, bei T = 0.
=
κT
∂T V
Beweis:
µ
∂V
∂T
¶
p
=−
µ
∂S
∂p
¶
,
T
µ
∂p
∂T
¶
=
V
µ
∂S
∂V
(2.95)
¶
mit S(T = 0) = 0 unabhängig von weiteren Parametern.
Verschwinden der Wärmekapazität
,
T
(2.96)
Thermodynamik und Statistische Physik
Cx = T
µ
∂S
∂T
¶
x
→0
für T → 0.
51
(2.97)
Siehe hierzu die Übungen.
Unerreichbarkeit des absoluten Nullpunktes
In üblichen thermodynamischen Prozessen werden abwechselnd adiabatische
Expansionen und isotherme Kompressionen einer Substanz durchgeführt, um
diese abzukühlen. Wählen wir zur Beschreibung der Substanz eine Zustandsgröße x (z.B. Volumen oder Druck ...) wird diese Größe zwischen zwei Extrema geführt x1 ≤ x ≤ x2 . Nun mündet jedoch jede Funktion S(T, xi ) bei
T → 0 in 0 ein.
T
x=x 1
x=x 2
S
Die horizontalen Teilprozesse gehören zu isothermen Kompressionen, bei denen im Idealfall Substanz und Reservoir konstante Temperatur haben. Insgesamt sieht man, daß eine unendliche Kaskade durchlaufen werden muß, um
T = 0 zu erreichen.
2.6
Phasengleichgewichte
Erfahrungsgemäß legen die Werte der intensiven Variablen T , p nicht immer den Zustand eines thermodynamischen Systems fest (wir betrachten
hier durchaus den Fall eines einkomponentigen Systems mit fester Teilchenzahl N ). An sogenannten Koexistenz-Punkten, -Linien etc. (bzw. PhasenGrenzen) liegt eine Substanz in verschiedenen Zuständen (Phasen) vor, z.B.
Wasser bei T = 373 K und p = 1 atm kann “flüssig” oder “gasförmig” sein
mit beliebigen Mengenverhältnissen. Um den Zustand genau zu charakterisieren, ist bei Phasenkoexistenz noch die Angabe einer weiteren extensiven
Variablen notwendig. Mit dieser Frage wollen wir uns später beschäftigen.
Hier halten wir fest, daß bei geeigneten Werten der intensiven Variablen dieselbe Substanz in (zwei oder mehr) verschiedenen Phasen vorliegen kann. Die
wichtigsten sind
52
A. Klümper
fest, flüssig, gasförmig,
mit verschiedenen Werten für Dichte etc. bei gleicher Temperatur und Druck.
Eine weitere Einteilung von festen und flüssigen Phasen (mit zugehörigen
Phasenübergängen) kann vorgenommen werden nach verschiedenen Kristallstrukturen etc. Auch bei Beachtung von magnetischen und elektrischen Eigenschaften egeben sich reichhaltige Phasendiagramme: (anti-) ferromagnetisch–paramagnetisch, supraleitend–normalleitend, suprafluid–normalflüssig
etc.
Wir wollen uns im Rahmen dieser Vorlesung mit zwei Fragenkreisen befassen.
1.) Wie läßt sich in einer phänomenologischen Thermodynamik die Koexistenz von Phasen und die Unterscheidung von Phasen beschreiben? Welche Zusammenhänge folgen aus den Hauptsätzen angewandt auf den Phasenübergang?
2.) Können wir eine mikroskopische Theorie entwickeln, d.h. thermodynamische Potentiale bzw. Zustandsgleichungen berechnen, die die Existenz von
verschiedenen Phasen zeigen?
Die Antwort auf Frage 2.) wollen wir in einigen Details erst zu Ende dieser
Vorlesung geben. Im Augenblick wollen wir nur soviel sagen, daß grundsätzlich
mikroskopische Theorien aufgestellt werden können. Wir hatten ja in Kapitel
I diesen Weg beschritten, uns aber nicht über die tatsächliche Berechenbarkeit der Zustandssummen Klarheit verschafft. Diese Berechnungen sind sehr
schwierig und Gegenstand der aktuellen Forschung (und wahrscheinlich auch
der Forschung der nächsten Jahrzehnte). Eine Frage, die sich an die technische Komplexität anlehnt, aber direkte physikalische Konsequenzen hat, ist
die Sorge, ob denn überhaupt Zustandssummen wie in Kapitel I eingeführt,
Singularitäten zeigen können. Dies ist notwendig, um bei bestimmten Bedingungen für T , p einen Sprung z.B. in der Dichte zu beobachten. Man denke
daran, daß die Temperatur T in analytischer Weise in Z = Sp exp(−βT )
eingeht und damit die Zustandssumme (für feste Systemgröße N ) eine analytische Funktion von T ist. Die Auflösung dieses Rätsels liegt im thermodynmischen Limes, in dem die notwendigen Singularitäten entstehen: für jedes
endliche System sind die Abhängigkeiten der physikalischen Größen von T ,
p analytische Funktionen (d.h. in Potenzreihen entwickelbar, insbes. beliebig
häufig differenzierbar). Dies gilt nicht mehr im thermodynamischen Limes (s.
Übungen).
Wir wollen uns jetzt intensiver mit dem Fragenkreis 1. befassen. Wir betrachten ein einkomponentiges System an einem T , p–Punkt mit Phasen-
Thermodynamik und Statistische Physik
53
gleichgewicht von zwei Phasen, z.B. “flüssig” und “gasförmig”. Energie, Volumen, Teilchenzahl des Untersystems in Phase 1 seien E1 , V1 , N1 ; analog seien definiert E2 , V2 , N2 . Bei Abgeschlossenheit des Gesamtsystems
sind E = E1 + E2 , V = V1 + V2 , N = N1 + N2 fest. Die Entropie S =
S1 (E1 , V1 , N1 ) + S2 (E2 , V2 , N2 ) ist im Gleichgewicht maximal. Es folgt wie
schon früher
∂S2
∂S1
=
→ T1 = T2 = T,
∂E1
∂E2
∂S1
∂S2
=
→ p1 = p2 = p,
∂V1
∂V2
∂S1
∂S2
=
→ µ1 = µ2 .
∂N1
∂N2
(2.98)
(Gleichheit der freien Enthalpie G1 = G2 bzw. Stetigkeit von G im p − T −
Diagramm.) Wir wollen wie oben als natürliche Variablen betrachten T , p,
N , so daß folgt
µ1 (p, T ) = µ2 (p, T ),
(2.99)
wobei µ1 (µ2 ) das chemische Potential ist, wie durch linksseitigen (rechtsseitigen) Grenzprozeß gewonnen
µ
µ 1 (T)
µ 2(T)
T=T(p)
T
Die beiden Phasen i = 1, 2 unterscheidet die verschiedene Abhängigkeit µi =
µi (T, p)! Jede einzelne Funktion mag über den Grenzpunkt analytisch fortsetzbar sein, ohne jedoch mit der jeweils anderen Funktion übereinzustimmen!
Thermodynamisch stabil ist der jeweils niedrigere Zweig. Zur Minimalitätseigenschaft
der thermodynamischen Potentiale siehe die Übungen.
Bei zwei verschiedenen Funktionen µ1 und µ2 , die von zwei Variablen abhängen
liegt Gleichheit üblicherweise entlang einer Linie vor: p = p(T ). Man spricht
von dieser Kurve als
Dampfdruckkurve bei flüssig-gasförmig,
Schmelzkurve
bei fest-flüssig,
Sublimationskurve bei fest-gasförmig.
54
A. Klümper
Es können auch alle drei Phasen im Gleichgewicht vorliegen (koexistieren),
µ1 (p, T ) = µ2 (p, T ) = µ3 (p, T ), an einem Punkt in der p, T Ebene: Tripelpunkt.
Für vier oder mehr Phasen einer Substanz gibt es keine Koexistenz, es sei
denn durch “Zufall”.
Wir halten das Vorliegen der einzelnen Phasen im Phasen- oder ZustandsDiagramm fest.
p
Typische Substanz
Wasser
p
negative Steigung
fest
fluessig
217.5 at
kritischer
Punkt
gas
Tripelpunkt
fluessig
fest
4.6 mm
Hg
gas
T
0.0075 C
374.2 C
T
(pc = 221 bar, Tc = 647, 1 K und pt = 6 mbar = 611 Pa, Tt = 273, 16 K.)
Außerhalb der Kurven gibt es eine einzige wohldefinierte Phase. Auf den
Kurven p = p(T ) koexistieren 2 Phasen, im Tripelpunkt (Tt , pt ) 3 Phasen.
Am kritischen Punkt (Tc , pc ) verschwindet der Unterschied zwischen Gas und
Flüssigkeit: bei einem Druck p oberhalb des kritischen Wertes pc wird kein
Phasenübergang (Singularität in Dichte oder anderen Eigenschaften) durchlaufen, wenn die Temperatur T von niedrigen zu hohen Werten geführt wird
(analoge Aussage mit p und T vertauscht.)
p
p=p(T)
Phase 1 x
x
Phase 2
T
An den Phasengrenzlinien springen nicht nur die Dichten bzw. das pro Teilchenzahl N eingenommene Volumen V des thermodynamischen Zustandes,
sondern auch andere Größen wie die Entropie. Bezeichnen wir das chemische
Potential (Entropie, Volumen) des Systems in der Phase i = 1, 2 mit µi (Si ,
Vi ), so gilt auf der Koexistenzlinie p = p(T )
µ1 (T, p(T )) = µ2 (T, p(T )).
(2.100)
Thermodynamik und Statistische Physik
Differenzieren nach T liefert
µ
µ
µ
¶
¶
¶
¶
µ
∂µ1
∂µ1
dp
∂µ2
dp
∂µ2
+
+
=
.
∂T p
∂p T dT
∂T p
∂p T dT
55
(2.101)
Mit der Duhem-Gibbs-Relation (1.104) gilt
¶
¶
µ
µ
Si
Vi
∂µi
∂µi
=− ,
= ,
∂T p
N
∂p T
N
(2.102)
und mit der obigen Relation ergibt sich direkt die Clausius-ClapeyronRelation
³
´
³
´
∂µ1
∂µ2
−
∂T
∂T
S − S1
Q(T )
q(T )
dp
´p ³
´p = 2
=³
=
=
, (2.103)
∂µ
∂µ
dT
V2 − V1
T (V2 − V1 )
T (v2 − v1 )
2
− ∂p1
∂p
T
T
wobei Q(T ) die latente Wärme beim Phasenübergang bei p = p(T ) ist,
d.h. Q = T (S2 − S1 ) ist die Wärmemenge, deren Aufnahme zur Umwandlung
von Phase 1 in Phase 2 notwendig ist. Im allgemeinen ist Q = Q(T ), d.h.
abhängig von der Position auf der Phasengrenzlinie. Ferner wurden die molaren Größen (Bezug auf Stoffmenge) q = Q/N , s = S/N , v = V /N eingeführt.
Bemerkung: Wir haben immer positive Verdampfungs- und SublimationsWärme, und im allgemeinen auch positive Schmelz-Wärme, die aber im Fall
von He3 tatsächlich negativ ist. Im Regelfall ist dann mit v2 > v1 (v1 > v2 )
der Anstieg von p = p(T ) positiv (negativ). Beim Verdampfen und Sublimieren ist immer v2 > v1 . Beim Schmelzen ist im allgemeinen auch v2 > v1 , aber
Ausnahmen gibt es, unter anderem Wasser, so daß die Schmelzkurve negative
Steigung hat.
p
p
[Bar]
4
[Bar]
He
fest
fest
He
3
30
30
normal fluessig
fluessig
20
20 superfluessig
10
10
gas
gas
1
2
3
4
5
T [Kelvin]
1
2
3
4
5
T [Kelvin]
Bei He3 gilt für die Schmelzkurve zwar vfl > vfest , aber hier ist bei tiefen Temperaturen Sfl < Sfest , was der Entropie als Maß für Unordnung entgegen zu
laufen scheint. Man hat hier zu berücksichtigen, daß (Un-)Ordnung nicht nur
im Ortsraum, sondern auch im Impulsraum vorliegen kann. Bei noch tieferen
als den gezeigten Temperaturen treten bei He3 noch zwei supraflüssige Phasen (A, B) auf.
56
A. Klümper
Schwefel
p
fluessig
fest I
(rhombisch)
fest II
gas
T
Kristallsymmetrien: I: rhombisch
II: monoklin
3 Tripelpunkte
(Kristallgitter: rhombisch – drei 90o Winkel, beliebige Kantenlängen; monoklin – zwei 90o Winkel, einer ungleich 90o .)
Wir betrachten nun weiter die Übergänge fest, flüssig (1) → gasförmig (2).
Im allgemeinen gilt hier v1 << v2 . Behandeln wir die gasförmige Phase als
ideales Gas, so gilt pv = kB T . Damit ist
dp
q(T )
qp
=
=
,
dT
T v2
kB T 2
(2.104)
wobei wir noch die grobe Näherung einer temperaturunabhängigen latenten
Wärme benutzt haben. Die letzte Gleichung läßt sich als DGL mit getrennten
Variablen behandlen mit Lösung
p(T ) = p0 e
2.7
− k qT
B
.
(2.105)
Mehrkomponentige Systeme, Lösungen
Wir wollen die bisherigen Betrachtungen einkomponentiger Systeme auf den
Fall mehrerer (k-viele) Komponenten verallgemeinern, bei denen die Teilchenzahl N̂i zu jeder Komponente i (=1,...,k) erhalten ist. Jede Komponente
hat ihr eigenes chemisches
Potential
µi . An den geeigneten Stellen können
P
P
wir µN̂ (µN ) durch i µi N̂i ( i µi Ni ) ersetzen, Ni = hN̂i i. Wir fassen die
resultierenden Modifikationen zusammen:
X
Energiesatz dE = T dS − pdV +
µi dNi ,
i
X
Duhem-Gibbs E = T S − pV +
µi Ni ,
iX
0 = SdT − V dp +
Ni dµi ,
i
X
freie Enthalpie G = G(T, p, Ni ) =
µi Ni =
i
µ
¶
∂G
da µi =
.
∂Ni T,p,Nj (6=Ni )
X ∂G
Ni ,
∂Ni
i
(2.106)
Thermodynamik und Statistische Physik
57
P
Die Gesamtteilchenzahl ist N =
Ni , und ci = Ni /N ist die Konzentration
P
der Komponente i. Von den k-vielen ci sind nur k − 1 wegen
ci = 1 unabhängig.
Die Dichte der freien Enthalpie g ist eine Funktion der Konzentrationen
G(T, p, Ni ) = N g(T, p, ci ),
g=
X
ci µi .
(2.107)
i
Die Bedingungen der Phasenkoexistenz sind wie beim einkomponentigen
System ableitbar. Es folgt wieder, daß alle intensiven Variablen T , p, µi
für alle Phasen im Gleichgewicht identisch sein müssen. Den allgemeinsten
Fall stellt ein System mit k Komponenten und r Phasen in Koexistenz dar.
(s)
Bezeichnen wir mit µi das chemische Potential der Komponente i in Phase
s, so muß gelten
(1)
(2)
(r)
µi = µi = ... = µi , für alle i = 1, ..., k,
T, p gleich in allen Phasen.
(2.108)
Dies sind r − 1 Gleichungen für jedes i = 1, ..., k, d.h. insgesamt k(r − 1)
(s)
Bestimmungsgleichungen für 2+r(k−1) Variable, d.i. T , p, ci für s = 1, ..., r,
i = 1, ..., k − 1. Damit dieses Gleichungssystem lösbar ist muß gelten
0 ≤ f := Anzahl Variable − Anzahl Gleichungen
= 2 + r(k − 1) − k(r − 1) = 2 + k − r.
(2.109)
Dies ist die Gibb’sche Phasenregel. f ist die Anzahl der Freiheitsgrade,
die bei Koexistenz im allgemeinen Phasendiagramm bleiben.
Als erstes Beispiel wollen wir schnell den einkomponentigen Fall (k = 1)
durchspielen. Hier ist f = 3 − r und liefert bei 1, 2, 3 Phasen die Werte f =
2, 1, 0, wie bekannt.
Als zweites Bespiel wollen wir ein zweikomponentiges System, Gemisch aus
H2 O und N H3 , k = 2, betrachten. Hier ist f = 4 − r=3, 2, 1, 0, für 1, 2, 3,
4 Phasen in Koexistenz. Im (p, T, c)-Phasendiagramm, wobei c die Konzentration von N H3 darstellt, bekommen wir ganz allgemein für jeden Punkt
eine eindeutige Phase, die auch in einer ganzen 3-dim. Umgebung existiert,
zwei Phasen sind auf einer 2-dim. Untermannigfaltigkeit realisiert, drei Phasen auf einer 1-dim. Untermannigfaltigkeit, und vier Phasen an einem Punkt.
58
A. Klümper
T
B
I
A
III
II
C
D
E
IV
c
0
1
1
0
NH 3
c
H2O
I:
Lösung (N H3 + H2 O)
II:
Eis + Lösung (2 Phasen)
III:
festes N H3 + Lösung
IV:
Eis und festes N H3
Grenzkurve C–D:
Eis+festes N H3 +Lösung (3 Phasen)
Entektischer Punkt E: 4 Phasen im Gleichgewicht
Anwendung auf verdünnte Lösungen
Wir betrachten eine Substanz A (Lösungsmittel), die in zwei Phasen i = 1, 2
vorliegen kann und lösen eine zweite Substanz B in geringer Konzentration,
z.B. Salz in Wasser bzw. Eis. Wir wollen das chemische Potential der Substanz
A mit µ bezeichnen, genauer soll µi (T, p) das chemische Potential der reinen
Substanz A in Phase i = 1, 2 sein. Das chemische Potential der Substanz A in
der verdünnten Lösung mit einer Konzentration c der Substanz B werde mit
µ̄i (T, p, c) bezeichnet. Wir werden noch später sehen, daß für geringe Werte
von c gilt
µ̄i (T, p, c) = µi (T, p) − kB T c.
(2.110)
Die Koexistenzlinie der reinen Substanz A ist p = p(T ) und erfüllt
µ1 (T, p) = µ2 (T, p),
für p = p(T ).
(2.111)
Wir fragen nun nach der Koexistenzline p̄ = p̄(T̄ ) der Phasen i = 1, 2 wenn
die Substanz mit Konzentration ci gelöst ist. Die Bestimmungsgleichung ist
µ̄1 (T̄ , p̄, c1 ) = µ̄2 (T̄ , p̄, c2 ).
(2.112)
Wir schreiben einen Punkt (T̄ , p̄) = (T + ∆T, p + ∆p) und erhalten mit
(1.104), d.h.
¶
µ ¶
µ
S
V
∂µ
∂µ
= − = −s,
=
= v,
(2.113)
∂T p
N
∂p T
N
für jede Seite der letzten Gleichung
µ̄i (T̄ , p̄, ci ) = µi (T + ∆T, p + ∆p) − kB T ci = µi (T, p) − si ∆T + vi ∆p − kB T ci .
(2.114)
Thermodynamik und Statistische Physik
59
Gleichsetzen und Nutzen von (2.111) liefert
(v1 − v2 )∆p − (s1 − s2 )∆T = kB T (c1 − c2 ).
(2.115)
Wir wollen nun die Verschiebung der Koexistenzlinie im Detail diskutieren.
Zunächst halten wir den Druck fest, d.h. ∆p = 0, und fragen uns nach der
Verschiebung der Übergangstemperatur
∆T = −
kB T
kB T 2
(c1 − c2 ) = −
(c1 − c2 ),
s1 − s2
q
(2.116)
wobei q = T (s1 − s2 ) die latente Wärme der reinen Substanz A ist.
Schmelzen: flüssig (1) ↔ fest (2)
Hier gilt q > 0, c1 = c, c2 ≃ 0, da Stoff B in Festkörper A schlechter lösbar
als in der Flüssigkeit, so daß
∆T = −
kB T 2
c < 0,
q
Gefrierpunktserniedrigung,
(2.117)
man denke hier an den Zweck des Streusalzes im Winter.
Verdampfen: gas (1) ↔ flüssig (2)
Hier gilt q > 0, c1 ≃ 0, c2 = c, da Stoff B im allgemeinen nicht leicht flüchtig,
so daß
kB T 2
c > 0, Siedepunktserhöhung.
(2.118)
∆T =
q
Nun halten wir T fest, d.h. ∆T = 0 und fragen nach der Verschiebung des
Druckes:
kB T
(c1 − c2 ).
(2.119)
∆p =
v1 − v2
Verdampfen: gas (1) ↔ flüssig (2)
Hier gilt v1 − v2 > 0, c1 ≃ 0, c2 = c, da Stoff B im allgemeinen nicht leicht
flüchtig, so daß
∆p = −
kB T
c < 0,
v 1 − v2
Dampfdruckerniedrigung.
(2.120)
Wenn wir wieder grob nähern v1 >> v2 und ferner in der Gasphase ein ideales
Gas-Verhalten annehmen, kB T /(v1 − v2 ) ≃ kB T /v1 ≃ p erhalten wir
∆p
= −c,
p
Raoult’sches Gesetz.
(2.121)
60
A. Klümper
Abschlußbemerkung: Wir werden die Untersuchung von Phasenübergängen
noch ausführlich besprechen. An dieser Stelle soll noch bemerkt werden, daß
Phasenübergänge nach ihrer Ordnung klassifiziert werden. Man spricht von
einem Phasenübergang n.-Ordnung, wenn alle (partiellen) Ableitungen des
(großkanonischen) thermodynamischen Potentials bis zur Ordnung n existieren, insbes. die Ableitungen bis Ordnung n − 1 keine Sprünge oder Divergenzen auftreten, diese Singularitäten jedoch in den (einigen) Ableitungen der
Ordnung n vorhanden sind.
In diesem Sinne sind die bisher betrachteten Übergänge von der Ordnung n =
1 gewesen, da Sprünge in S und V auftraten und diese Größen Ableitungen 1.
Ordnung des Potentials sind. Wir haben auch einen Phasenübergang 2. Ordnung gehabt: der kritische Punkt, der das Ende der flüssig-gas-Koexistenzlinie
darstellt. Hier gibt es weder latente Wärme noch einen Dichtesprung, aber
z.B. die spezifische Wärme divergiert. Dies ist eine 2. Ableitung des thermodynamischen Potentials nach T .
Thermodynamik und Statistische Physik
61
3 Gleichgewichtseigenschaften makroskopischer
Systeme
Wir wollen uns in diesem Kapitel dem Programm der Berechnung thermodynamischer Potentiale aus den mikroskopischen Wechselwirkungen zuwenden.
Dies bedeutet eine Erinnerung an den Aufbau der Thermodynamik und Statistischen Physik wie in Kapitel I angelegt. Zum Hamiltonoperator
H=
N
X
p̂2i
+ V (x̂1 , ..., x̂N ),
2m
i=1
(3.1)
ist die Zustandssumme (kanonisch, großkanonisch) zu berechnen
Zkan,N = Sp e−βHN ,
Zg = Sp e−β(H−µN̂ ) =
∞
X
Zkan,N eβµN .
(3.2)
N =0
Obwohl wir heute für sehr viele Systeme den Hamiltonoperator kennen, werden wir große Schwierigkeiten haben, das Programm angesichts der großen
Zahl an Freiheitsgraden durchzuführen. Wir werden zwei Strategien verfolgen:
(i) Idealisierung von Modellen,
(ii) Näherungsverfahren, die in Grenzfällen gültig sind.
Es ist klar, daß dies eine grobe und nicht strenge Unterteilung ist. Als Beispiel für (i) werden wir bald die sogenannten idealen Gase kennenlernen, die
wechselwirkungsfreie Teilchen beschreiben. Beispiele zu (ii) sind:
klassische Näherung:
h̄ → 0, anwendbar für hinreichend hohe
Temperaturen,
Virialentwicklung:
Dichte V /N → 0, verdünnte Gase,
Hochtemperaturentwicklung, 1/T → 0, (z.B. bei Spinsystemen für T → ∞,)
Quasiteilchennäherung:
T → 0,
im letzteren Fall werden die niedrigliegenden Zustände eines Systems durch
Anregungen beschrieben, die selbst Teilchencharakter haben. Diese Anregungen werden in diesem Sinne ernst genommen und ihr Beitrag zur Thermodynamik etwa in der Weise eines idealen Gases bestimmt.
3.1
Die klassische Näherung
Prinzipiell sollte jedes System quantenmechanisch beschrieben werden. Häufig
(und werden noch sehen wann) sind quantenmechanische Effekte nicht wichtig, so daß eine Beschreibung auf der Basis klassischer Mechanik ausreichend
ist. Formal sind wir am Übergang h̄ → 0 interessiert.
62
A. Klümper
Auch in der klassischen Näherung wird es (zwei!) quantenmechanische Relikte geben. Zur Untersuchung eines der Überbleibsel, und auch zur Einführung
der Notation, wollen wir die Quantenmechanik eines einzelnen Teilchens in
einer Raumdimension besprechen. Operatoren kennzeichnen wir mit Â. Der
Kommutator von Impuls- und Ortsoperator lautet [p̂, x̂] = h̄/i. Die Eigenbasen zum Impuls- und Ortsoperator heißen (|pi) bzw. (|xi) und haben die
Eigenschaften
Z
x̂|xi = x|xi,
dx|xihx| = 1, hx′ |xi = δ(x − x′ ),
(3.3)
Z
dp
|pihp| = 1, hp′ |pi = 2πh̄δ(p − p′ ),
(3.4)
p̂|pi = p|pi,
2πh̄
mit
hx|pi = eipx/h̄ .
(3.5)
Wir wollen jedem Operator  eine Funktion A(p, x) nach folgender Vorschrift
zuordnen:
A(p, x) := hp|Â|xihx|pi.
(3.6)
Für Operatoren,
P die in Summen von Produkten von p̂, x̂ geschrieben werden
können, B̂ = n fn (p̂)gn (x̂), gilt
X
X
B(p, x) =
hp|fn (p̂)gn (x̂)|xihx|pi =
fn (p)gn (x) hp|xihx|pi
| {z }
n
n
=1
X
=
fn (p)gn (x),
(3.7)
n
und speziell für den Hamiltonoperator folgt
p̂2
+ U (x̂), Hamiltonoperator,
2m
p2
+ U (x), Hamiltonfunktion.
⇒ H(p, x) =
2m
Ĥ =
(3.8)
(3.9)
Für den Kommutator zweier Operatoren Â, B̂ zeigt man
hp|[Â, B̂]|xihx|pi =
h̄ ∂(A, B)
h̄
+ O(h̄2 ) ≡ {A, B} + O(h̄2 ),
i ∂(p, x)
i
(3.10)
∂B
∂A ∂B
mit der Poissonklammer {A, B} = ∂A
∂p ∂x − ∂x ∂p . In Worten: die dem
Kommutator zugeordnete Funktion berechnet sich aus der Poissonklammer
der einzelnen zugeordneten Funktionen.
Beweis: Wir wollen einen Beweis nur skizzieren. Wir stellen uns vor (tatsächlich
in allen Fällen von Bedeutung schon explizit so gegeben), daß Â und B̂ als
Polynome in p̂ und x̂ gegeben sind. Dann berechnet sich der Kommutator von
 und B̂ wieder als Polynom in p̂ und x̂, wobei in Ordnung h̄ die fundamentale Relation [p̂, x̂] = h̄/i nur einmal pro Produkt angewandt werden muß.
Thermodynamik und Statistische Physik
63
Die Funktionen A(p, x) und B(p, x) sind selbst Polynome und somit auch die
Poissonklammer. Man rechnet leicht nach, daß beide Polynome, d.h. auf der
linken wie der rechten Seite von (3.10), identisch sind.
Wir wollen auf weitere Details nicht eingehen, da der klassische Limes eh
alle Beiträge der Ordnung h̄ und höher vernachlässigt! Die Beziehung (3.10)
besagt dann, daß systematisch alles Nichtkommutieren vernachlässigt werden
kann. Der Fehler, den wir in der Thermodynamik begehen, kann abgeschätzt
werden




1

e−β Ĥ = e−β(Ĥkin +Û ) = e−β Ĥkin e−β Û 
1 − 2 [β Ĥkin , β Û ] +... .
{z
}
|
(3.11)
O(β 2 h̄)
Also folgt für die Zustandssumme
Z
dpdx
hp|e−β Ĥ |xihx|pi
Zkan = Sp e−β Ĥ =
2πh̄
Z
dpdx −βHkin (p) −βU (x)
=
e
e
[1 + O(β 2 h̄)]
Z 2πh̄
dpdx −βH(p,x)
[1 + O(β 2 h̄)]
=
e
2πh̄
{z
}
|
(3.12)
=:Zklassisch
Man sieht, daß auch im klassischen Grenzfall ein Faktor 1/h̄ übrigbleibt. Dies
ist im wesentlichen eine Normierung, die bei der Berechnung von Mittelwerten
wegfällt
R
Z
dpdxA(p, x)e−βH(p,x)
dpdx
e−βH(p,x)
R
hÂi = Sp ρ̂Â →
A(p, x)
=
2πh̄
Zklassisch
dpdxe−βH(p,x)
Z
= dpdxA(p, x)ρ(p, x) =: hAiklassisch ,
(3.13)
wobei
e−βH(p,x)
.
(3.14)
dpdxe−βH(p,x)
Die bisherigen Unterschiede zwischen klassischer und quantenmechanischer
statistischer Physik resultierten aus der Nichtvertauschbarkeit der Operatoren. In niedrigster Ordnung in h̄ sind klassische und quantenmechanische
Ergebnisse identisch. Höhere Ordnungen in h̄ sind tatsächlich Kombinationen von βh̄ und folglich bei nicht zu tiefen Temperaturen vernachlässigbar.
Wir werden ein genaueres, quantitatives Kriterium bald kennenlernen.
ρ(p, x) := R
Eine zweite Quelle quantenmechanischer Korrekturen bilden die Symmetriekorrelationen. Physikalische Zustände von N identischen Teilchen sind entweder total symmetrisch (Bose) oder total antisymmetrisch (Fermi). Basiszustände eines allgemeinen N -Teilchen-Hilbertraumes sind
64
A. Klümper
|pi = |p1 i|p2 i...|pN i,
|xi = |x1 i|x2 i...|xN i,
(3.15)
wobei |pi i und |xi i 1-Teilchen-Basen sind bestehend aus Eigenzuständen
zu Impuls- bzw. Ortsoperator. Basiszustände des (anti-)symmetrischen N Teilchen-Hilbertraumes sind dann natürlich geeignet (anti-) symmetrisierte
Produkte (3.15)
X
1
|piS := √
(±1)P P |pi,
N ! PermutationenP
(3.16)
analog für |xiS . P |pi ist eine Permutation der 1-Teilchenzustände im Produktzustand |pi. Es gilt immer (+1)P = +1, (−1)P = +1 bzw. -1 für gerade
bzw. ungerade Permutationen, d.h. solchen, die Verkettungen einer geraden
bzw. ungeraden Anzahl von elementaren Permutationen (Transpositionen)
√
sind. Die Summe in (3.16) läuft über N ! viele Terme. Der Vorfaktor 1/ N !
garantiert die Normierung des Zustandes, da im Skalarprodukt zu jedem
der N ! vielen Terme im Ket-Vektor genau ein Term im Bra-Vektor korrespondiert, so daß das gewünschte Produkt von δ-Funktionen entsteht. Jedes
derartige Produkt
√ tritt N !-mal auf. Der Normierungsfaktor ist folgerichtig
identisch zu 1/[ N !]2 .
Bemerkung: Für den Fall, daß in |pi = |p1 i|p2 i...|pN i Einteilchenzustände
identisch sind ist der gemäß (3.16) antisymmetrisierte Zustand gleich 0, im
Falle der Symmetrisierung ist die Normierung nochmal zu bedenken. Für
unsere Anwendungen, d.h. den klassischen Limes, spielen diese Fragen keine
Rolle, da die Menge der Einteilchenimpulse eine Nullmenge bzgl. der Integration darstellt.
Wir nutzen nun, daß zu N !-vielen verschiedenen Punkten p1 , p2 , ..., pN der
gleiche Zustand |piS gehört. Damit läßt sich die Spur eines Operators wie
folgt berechnen
Z
d3N p
1
(3.17)
Sp  =
S hp|Â|piS .
N!
(2πh̄)3N
R
Wir schieben nun eine Darstellung der Eins 1 = d3N x|xihx| ein (nicht
symmetrisiert!), so daß
Sp  =
1
N!
Z
d3N pd3N x
S hp|Â|xihx|piS .
(2πh̄)3N | {z }
(3.18)
=hp|Â|xiS
da  symmetrischer Operator. Da ferner über alle x integriert wird, kann
ersetzt werden |xiS hx| → |xi S hx| und wir erhalten
1
Sp  =
N!
Z
d3N pd3N x
(2πh̄)3N
hp|Â|xiS hx|piS
|
{z
}
hp|Â|xihx|pihp|xiS hx|piS
Thermodynamik und Statistische Physik
=
1
N!
Z
d3N pd3N x
A(p, x) hp|xiS hx|piS ,
|
{z
}
(2πh̄)3N
65
(3.19)
=1
2
die letzte Beziehung gilt im Limes h̄ →
√ 0, da von den N ! vielen Termen im
Produkt genau N ! viele den Wert 1/[ N !]2 liefern und die anderen oszillierende Exponentialfunktionen sind, die sich im Integral wegheben.
Wenden wir diese Ergebnisse auf die Zustandssumme an, so erhalten wir
Z 3N 3N
d pd x −βH(p,x)
1
e
,
Zkan,klassisch =
N!
(2πh̄)3N
N
X
p2i
+ U (x1 , ..., xN ).
(3.20)
H(p, x) =
2m
i=1
Wir fassen unsere Ergebnisse zusammen und notieren die zwei Überreste der
Quantenmechanik in der klassischen Näherung:
(1) dpdx
2πh̄ für jeden Freiheitsgrad,
(2) Faktor 1/N !.
Beide Punkte rühren her vom richtigen Abzählen: nach (1) entspricht einem
Phasenraumvolumen 2πh̄ = h ein quantenmechanischer Zustand, gemäß (2)
werden Zustände, die durch Vertauschen von identischen Teilchen auseinander hervorgehen, nur einmal gezählt.
Wir schauen (3.20) genauer an und sehen, daß die Impulsintegration in eindimensionale Integrale faktorisiert
Z ∞
p
p2
e−β 2m = 2πmkB T .
(3.21)
−∞
Daher erhalten wir eine Reduktion auf ein Konfigurationsmittel
Z
1
d3N xe−βU (x1 ,...,xN ) ,
Zkan,klassisch =
N !λ3N
(3.22)
in das nur noch die potentielle Energie der N Teilchen eingeht. Wir haben
benutzt die Thermische de-Broglie-Wellenlänge λ
λ= √
2πh̄
.
2πmkB T
(3.23)
Wir hatten schon motiviert, daß die klassische Näherung für hinreichend
hohe Temperaturen gültig ist, da es sich um eine Entwicklung in βh̄ handelt.
Wir sind nun in der Lage den Temperaturbereich abzuschätzen durch das
Kriterium
66
A. Klümper
λ << jede andere typische Länge des Systems (mittlerer
Teilchenabstand, Reichweite der Wechselwirkung...)
(3.24)
Dies ist offensichtlich für hinreichend hohe Temperaturen erfüllt. Einige quantitative Abschätzungen werden weiter unten gegeben.
Die großkanonische Zustandssumme ergibt sich aus der klassischen wie üblich
durch
Zgk,klassisch (T, V, µ) =
∞
X
z N Zkan,klassisch (T, V, N ) = e−βΦ = eβpV , z = eβµ .
N =0
(3.25)
Gleichverteilungssatz
Sei y eine der Orts- oder Impulsvariablen in H(p, x), d.h. gleich einem pi,α
oder xi,α mit α = 1, 2, 3 für die Raumkoordinate. Wegen
−
1 ∂ −βH
∂H −βH
e
=
e
,
β ∂y
∂y
(3.26)
folgt
∂H
i=
hy
∂y
R
−βH
dpdxy ∂H
1
∂y e
R
= −
dpdx e−βH |{z} β
(3.26)
R
∂ −βH
dpdx y ∂y
e
1
R
= ,
β
dpdx e−βH
(3.27)
wobei zuletzt partiell integriert wurde (heikel bei der Ortsvariablen, dort
nicht gültig wenn mit Ort gegen unendlich, H endlich bleibt).
Anwendungen:
y = pi,α → h
y = xi,α →
pi,α 2
2m i
∂H
i = 21 kB T
= 12 hpi,α ∂p
i,α
∂H
i = kB T
hxi,α ∂x
i,α
(3.28)
damit entfällt auf jeden Impulsfreiheitsgrad die mittlere Energie 12 kB T .
∂H
Virialsatz: wir benutzen ṗi = − ∂x
i
N
N
N
X
1 X
1 X ∂H
p2i
3N
− h
ṗi xi i = h
xi
i |{z}
=
kB T = h
i = hHkin i
2 i=1
2 i=1 ∂xi
2
2m
i=1
(3.29)
(∗)
bei (∗) wurde der Gleichverteilngssatz benutzt und beachtet, daß für jedes
Teilchen i drei Freiheitsgrade α = 1, 2, 3 vorhanden sind.
Zusammenbruch der klassischen Näherung
Thermodynamik und Statistische Physik
67
Bevor wir an eine quantitative Abschätzung des Gültigkeitsbereichs der klassischen Näherung gehen, wollen wir uns davon überzeugen, daß die klassische
Näherung bei tiefen Temperaturen quantitativ und qualitativ zusammenbricht. Mit dem Gleichverteilungssatz haben wir zunächst für die mittlere
Energie
3
(3.30)
E = E(T, V, N ) = hHkin + U i = N kB T + hU i.
2
Damit folgt für die Wärmekapazität
µ
¶
3
∂E
3
(∆U )2
CV =
= N kB +
≥ N kB .
(3.31)
∂T N,V
2
kB T 2
2
Bei der letzten Gleichung haben wir benutzt, daß der Mittelwert hU i als Konfigurationsmittel (3.22) zu bestimmen ist mit ebenfalls U im Exponenten. Die
Ableitung nach T liefert dann die Schwankung von U wie aus (1.61) etc. bekannt. Da in der klassischen Näherung CV nie gegen 0 gehen kann, auch nicht
mit T → 0, haben wir einen Widerspruch gegen das Nernst-Theorem.
Die klassische Näherung muß nach dem Kriterium (3.24) zusammenbrechen,
da für T → 0 die Länge λ über alle Schranken wächst. Der mittlere Teilchenabstand ist l ≃ (V /N )1/3 . Mit dem Kriterium λ << l folgt für den
Temperaturbereich, in dem die klassische Näherung gültig ist
T [Kelvin] >>
me 1
2πh̄2
≃ 5 · 105
≡ T0 ,
2
mkB l
m l[A]2
(3.32)
wobei me die Elektronenmasse ist und l in Angstrom gemessen wird. Für
Elektronen im Festkörper ist l ≃ 1A, dann ist
T0 (Elektronen) = 5 · 105 Kelvin,
(3.33)
womit die klassische Näherung immer verboten ist. Für ein Gas aus Atomen
mit Masse m = A · mProton und l ≃ 10A gilt
T0 ≃
3
Kelvin,
A
(3.34)
hier haben wir also einen großen Temperaturbereich in dem die klassische
Näherung gültig ist. Tatsächlich ist für z.B. Helium unterhalb von wenigen
Kelvin das Phasendiagramm sehr reichhaltig mit suprafluiden Phasen.
3.2
Die idealen Gase
Unter einem idealen Gas versteht man Teilchen ohne Wechselwirkung. Bevor
wir die idealen Gase ordentlich quantenmechanisch behandeln, wollen wir die
68
A. Klümper
klassische Näherung anwenden.
Klassisches ideales Gas
Das Konfigurationsmittel (3.22) ist mit U = 0 leicht durchgeführt
µ ¶N
1
V
Zkan,klassisch =
N ! λ3
(3.35)
Nach Benutzung der Stirling-Formel ln N ! = N ln(N/e) + O(ln N ) folgt
F (T, V, N ) = −
1
nλ3
ln Zkan,klass = N kB T ln
.
β
e
(3.36)
Mit λ ≃ T −1/2 folgt
∂F
=
p = − ∂V
N kB T
V h=
nkB T,
i
3
= N kB − ln nλe + 32 ,
S=
E = F + T S = 23 N kB T,
H = E + pV = 25 N kB T,
3
5
cV = ∂E
, cp = ∂H
∂T
∂T = 2 N kB ,
¡ =¢2 N kB
1
1
1 ∂V
α = V ∂T p = T , κT = p , κS = κT ccVp =
− ∂F
∂T
3
5p ,
etc.
Dieselben Ergebnisse hätten wir auch in großkanonischer Gesamtheit (3.25)
bekommen mit
¡ ¢N
P∞
P∞
Zgk,klass (T, V, µ) = N =0 z N Zkan,klass (T, V, N ) = N =0 N1 ! zV
λ3
¡ zV ¢
= exp λ3 , z = eβµ .
(3.37)
Das großkanonische Potential ergibt sich zu
βpV = −βΦ(T, V, µ) = ln Zgk,klass =
zV
λ3
(3.38)
woraus sich die Teilchenzahl als Funktion u.a. des chemischen Potentials ergibt
zV
∂Φ
= 3 → z = nλ3 .
(3.39)
N =−
∂µ
λ
Daher lautet das Kriterium für die Gültigkeit der klassischen Näherung z =
nλ3 << 1, d.h. µ → −∞. Jedes Teilchensystem geht entweder bei fester
Dichte mit wachsender Temperatur in ein klassisches Gas über, oder bei fester Temperatur mit hinreichender Verdünnung. Diese Ergebnisse müssen
sich auch als Grenzfälle der folgenden quantenmechanischen Behandlung ergeben.
Ideale Quantengase
Thermodynamik und Statistische Physik
69
Hier unterscheiden wir
Teilchen mit ganzzahligem Spin →
→
Teilchen mit halbzahligem Spin →
→
total-symmetrische Zustände
Bose-Teilchen
total-antisymmetrische Zustände
Fermi-Teilchen
Freie Teilchensysteme zeichnen sich durch Hamiltonoperatoren mit allein
Einteilchen-Termen aus
H = h1 + h2 + ... + hN ,
(3.40)
wobei jedes hi nur auf Teilchen Nr. i wirkt, alle hi gleich sind, insbesondere
gleiche Spektren haben, d.h.
h|νi = e(ν)|νi,
(3.41)
mit Einteilchen-Quantenzahl ν, -Energie e(ν) und -Zustand |νi. Das Vielteilchenproblem faktorisiert, d.h. wir haben Eigenzustände und Energien zu
H
H|ν1 , ν2 , ..., νN i = [e(ν1 ) + e(ν2 ) + ... + e(νN )] |ν1 , ν2 , ..., νN i.
{z
}
|
(3.42)
=E
Hier sind νi aus der Menge der Einteilchenquantenzahlen {ν}. Für translationsinvariante Systeme “enthält” der Parameter ν immer den Impuls des
freien Teilchens p (bzw. p~), und daneben auch innere Quantenzahlen wie
Spin σ = −s, −s + 1, ..., s − 1, s (bei Fermionen ist meistens der Minimalwert
s = 1/2 realisiert, z.B. bei Elektronen), oder bei Teilchen mit innerer Struktur auch innere Anregungen, z.B. bei Atomen und Molekülen. Wir werden
dann die Notation ν = (p, νi ) benutzen.
Wir wollen im weiteren annehmen, daß das Einteilchenproblem (3.41) gelöst
ist. Das Vielteilchenproblem ist mit (3.42) gelöst, wenn noch die Symmetriekorrelationen respektiert werden. Für Fermi- bzw. Bose-Systeme sind nicht
beliebige Produkte |ν1 , ν2 , ..., νN i erlaubt, sondern nur total-antisymmetrische
bzw. total-symmetrische Zustände. Wir wollen dazu einen Zustand |ν1 , ν2 , ..., νN i
durch Besetzungszahlen nν kennzeichnen, wobei ν jede Einteilchenquantenzahl durchläuft. Nichtunterscheidbarkeit wird dadurch berücksichtigt, daß
nur die Besetzungszahlen der Zustände angegeben werden und jede Kombination von Besetzungszahlen als genau ein Zustand gezählt wird. Durch die
(Anti-)Symmetrisierung von Produkten |ν1 , ν2 , ..., νN i entfällt die Notwendigkeit, eine Reihenfolge zu notieren.
Offenbar können Boseteilchen beliebige Besetzungszahlen annehmen, Fermiteilchen jedoch nicht nν > 1, da ein antisymmetrisiertes Produkt mit mindestens zwei identischen Faktoren schon 0 ist (Pauliprinzip):
70
A. Klümper
Fermiteilchen: nν = 0, 1
Boseteilchen: nν = 0, 1, 2, ....
In Besetzungszahldarstellung sind Hamilton- und Teilchenzahl-Operator einfach
X
X
H=
e(ν)nν , N̂ =
nν .
(3.43)
ν
ν
Zur Behandlung der Thermodynamik ist die großkanonische Gesamtheit bestens geeignet, da wir in der Besetzungszahldarstellung bei Erlauben beliebiger Gesamtteilchenzahlen eine “unkorrelierte” Zustandssumme erhalten, die
in Einteilchenterme faktorisiert


P
X
Y 1(∞)
X −β P [e(ν)−µ]n
ν
 e−β ν [e(ν)−µ]nν
ν
Zgk = Sp e−β(H−µN̂ ) =
=
e
=
Y
ν


1(∞)
X
nν =0
{nν }
ν nν =0

e−β[e(ν)−µ]nν  ,
(3.44)
wobei die obere Summationsgrenze 1 bzw. ∞ ist für Fermionen bzw. Bosonen. Dies ist fast das Endergebnis, wenn wir im Falle der Bosonen noch die
geometrische Reihe aufsummieren:
i
Yh
−β[e(ν)−µ]

1
+
e
, Fermi,


ν ·
¸
(3.45)
Zgk = Y
1


,
Bose.

1 − e−β[e(ν)−µ]
ν
Das großkanonische Potential Φ ist
i
 X h
−β[e(ν)−µ]

, Fermi,
−
ln
1
+
e


ν
i
βΦ(T, V, µ) = −βpV =
X h


ln 1 − e−β[e(ν)−µ] , Bose.
+
(3.46)
ν
Die Gesamtteilchenzahl ist
¸
X·
1


, Fermi,

∂Φ  ν eβ[e(ν)−µ] + 1
·
¸
= X
N =−
1
∂µ 


, Bose,

β[e(ν)−µ] − 1
e
ν
(3.47)
wobei jeder Einteilchenzustand |νi die mittlere Besetzungszahl
hnν i =
1
= f± (e(ν) − µ),
eβ[e(ν)−µ] ± 1
wobei die Funktion auf der rechten Seite
(3.48)
Thermodynamik und Statistische Physik
f± (ǫ) =
eβǫ
1
±1
71
(3.49)
als Fermi-Verteilungsfunktion bzw. Bose-Verteilungsfunktion bekannt
ist. An dieser Stelle ist (3.48) eine Interpretation von (3.47). Zur strengen
Herleitung beachte man gemäß (3.43)
hnν i =
Sp nν e−β(H−µN̂ )
Sp e−β(H−µN̂ )
=−
1 ∂
∂Φ
ln Sp e−β(H−µN̂ ) =
,
β ∂e(ν)
∂e(ν)
(3.50)
wobei nach e(ν) im Sinne eines freien Parameters in H abgeleitet wird, der
danach auf seinen physikalischen Wert gesetzt wird. Die obigen Formeln bestimmen die gesamte Thermodynamik der idealen Quantengase.
In den Übungen werden wir sehen, daß die Entropie gegeben ist durch
X
S/kB = −
[hnp,s i lnhnp,s i ± (1 ∓ hnp,s i) ln(1 ∓ hnp,s i)].
(3.51)
p,s
für Fermionen/Bosonen.
Quantisierung des Einteilchenimpulses
Wir werden immer wieder Impulssummen zu berechnen haben, oben beispielsweise traten auf
X
XX
X
g(e(p, νi )) =
g(e(ν)) =
G(p),
(3.52)
p
ν=(p,νi )
νi
|
p
{z
}
Z
d3 p
=:G(p)
mit einer Funktion G(p) allein abhängig vom Impuls. Hier ist über alle Impulse, d.h. über alle Eigenwerte des Impulsoperators p̂ eines einzelnen Teilchens,
zu summieren. Dies ist nichts weiter als die Spur über G(p̂) im EinteilchenHilbertraum. Bei der klassischen Näherung haben wir gesehen, wie diese Spuren (für geometrisch unbeschränkte Systeme) auf Integrale im Phasenraum
zurückgeführt werden können
¶
µ Z 3 3
Z
X
V
d pd x
G(p) =
d3 pG(p).
(3.53)
G(p) = Sp G(p̂) =
(2πh̄)3
(2πh̄)3
p
Als Merkregel haben wir
X
p
=⇒
V
(2πh̄)3
und analog in beliebigen Raumdimensionen d = 1, 2, 3, ....
(3.54)
72
A. Klümper
Wir können dieses Ergebnis auch wesentlich expliziter verstehen, wenn wir
einen Quader der Kantenlängen L1 × L2 × L3 = V betrachten mit geeigneten Randbedingungen. “Physikalisch” sind offene Randbedingungen, vom
theoretischen Standpunkt sind jedoch periodische Randbedingungen häufig
vorzuziehen, da sie einfacher zu behandeln sind und im thermodynamischen
Limes das gleiche Ergebnis liefern. Eigenzustände sind auf Grund der Translationsinvarianz durch ebene Wellen ψ(~x) = ei~p~x/h̄ gegeben. Periodische Randbedingungen ψ(x1 + L1 , x2 , x3 ) = ψ(x1 , x2 , x3 ) etc. verlangen
pi Li /h̄ = 2πn,
n = 0, ±1, ±2, ...
(3.55)
womit die Impulse diskret sind mit Abständen ∆pi = 2πh̄
Li . Zu jedem Impulspunkt im Impulsraum gehört ein Volumen (2πh̄)3 /(L1 L2 L3 ) = (2πh̄)3 /V .
Damit können wir im thermodynamischen Limes V → ∞ Summen in Integrale umwandeln
Z
X
X V
V
... =
d3 p...
(3.56)
∆p
∆p
∆p
...
=⇒
1
2
3
3
3
(2πh̄)
(2πh̄)
p
p
Einatomiges (strukturloses) Gas: Hier gibt es keine inneren Quantenzahlen, da wir von elektronischen Anregungen bei üblichen Temperaturen
p2
.
absehen können: {ν} = {p}, e(ν) = e(p) = 2m
Aus (3.46) folgt
V
βΦ = ∓
(2πh̄)3
Z
¸
·
2
− βp
2m
,
d p ln 1 ± ze
3
z = eβµ .
(3.57)
Nach (3.47) wissen wir auch, daß βµ → −∞ (z → 0) geringe Teilchenzahl,
d.h. extreme Verdünnung bedeutet. In diesem Limes folgt aus (3.57)
Z
βp2
V
Vz
−βΦ =
d3 p z e− 2m
=
⇔ (3.25, 3.37),
(3.58)
3
|{z}
(2πh̄)
λ3
(3.21),(3.23)
d.h. im Grenzfall starker Verdünnung gilt das klassische Ergebnis.
3.3
Photonen-Gas als ideales Bose-Gas
Wir behandeln nun den wichtigsten Fall eines idealen Gases: die Hohlraumstrahlung. Die Teilchen der elektromagnetischen Strahlung sind die Photonen oder Lichtquanten. Da die Wechselwirkung der Photonen untereinander
unmeßbar klein ist, können wir von einem idealen Gas ausgehen.
Photonen haben die Einteilchenenergie
Thermodynamik und Statistische Physik
p~ = h̄~k,
e(~
p) = c|~
p|,
73
(3.59)
wobei ~k der Wellenvektor ist. Als innere Quantenzahl (νi = 1, 2) tritt noch
die Polarisationsrichtung auf, elektromagnetische Wellen sind transversal und
entweder rechts- oder linkspolarisiert. Vom Photonenspin S = 1 sind nur die
Spinprojektionen ±1 (Helizität) auf die Ausbreitungsrichtung ~k realisiert,
nicht jedoch der Wert 0. Dies ist möglich, d.h. die Theorie ist konsistent, da
Photonen keine Ruhemasse besitzen, also der Übergang in das Ruhsystem
nicht möglich ist (siehe Quantenmechanik).
Wir können nun direkt unsere allgemeinen Beziehungen für ideale Quantengase anwenden, wenn wir uns von einer Eigentümlichkeit der Hohlraumstrahlung überzeugt haben: die Gesamtzahl der Photonen ist keine Erhaltungsgröße. Photonen können absorbiert und spontan emittiert werden. Mit
anderen Worten: wir haben mit einem kanonischen Ensemble für vorgegebenes Volumen V und Temperatur T zu arbeiten. Die Eigenzustände der Hohlraumstrahlung sind durch Besetzungszahlen der Einzelmoden gegeben. Man
überlegt leicht, daß die freie Energie F (T, V ) durch die Formel des großkanonischen Potentials Φ(T, V, µ = 0) gegeben ist. Wir benutzen also die obigen
Formeln der Quantengase mit chemischem Potential µ = 0, mit (3.46)
i
i
h
X h
X
βF (T, V ) = βΦ(T, V, µ = 0) =
ln 1 − e−βe(p)
ln 1 − e−βe(p) = 2
Z ∞ p,νi =1,2
£
¤
V
dp p2 ln 1 − e−βcp
4π
=2
3
(2πh̄)
¶30Z ∞
µ
£
¤
V kB T
= 2
dx x2 ln 1 − e−x
π
h̄c
{z
}
|0
p
(3.60)
4
=− π45
Wir definieren nun die Stefan-Boltzmann-Konstante
4
π 2 kB
erg
−5
,
3 2 = 5.67 · 10
sec cm2 K4
60h̄ c
und erhalten nacheinander
4σ
V T 4,
F (T, V ) = −
3c
∂F
16 σ
S=−
=
V T 3,
∂T
3 c
σ
E = F + T S = 4 V T 4,
c
∂S
σ
CV = T
= 16 V T 3 ,
∂T
c
4σ 4
1E
∂F
=
T =
.
p=−
∂V
3c
3V
σ=
Beim klassischen idealen Gas steht hier p =
2E
3V .
(3.61)
(3.62)
74
A. Klümper
Die mittlere Besetzungszahl (Bose-Verteilungsfunktion)
hnp i =
1
,
−1
(3.63)
eβcp
divergiert bei p → 0 und T > 0, ist jedoch identisch 0 bei T = 0, d.h. kein
Photon vorhanden.
<np >
p
Für die mittlere Zahl aller Photonen erhalten wir nach Summation über hnp i
aller Impulse und der beiden Helizitäten
¶3
µ
Z ∞
2 X
x2
2ζ(3) kB T
π
N
=
dx =
hnp i = ... =
V
V p
(πh̄βc)3 0 ex − 1
π2
h̄c
(3.64)
Wir fragen nun nach der spektralen Verteilung der Energiedichte E/V . Wir
kennen die Verteilungsfunktion hnp i zum Impuls p mit Energie e(p) = cp und
Frequenz ω = cp/h̄ = ck. Die spektrale Energie-Verteilung ist
1 X
e(p)hnp iδ(ω − e(p)/h̄)
V p,ν
i
Z ∞
cp
1
dp p2 βcp
4π
δ(ω − cp/h̄)
=2
3
(2πh̄)
e
−1
0
h̄
ω3
= 2 3 βh̄ω
Planck
π c e
−1
u(ω) =
u (ω)
Rayleigh−
Jeans
ωmax
ω
Wien
(3.65)
Thermodynamik und Statistische Physik
75
Das Maximum der Planck-Verteilung u′ (ω) = 0 liegt bei h̄ωmax = 2.82kB T
(Wien’sches Verschiebungsgesetz).
Wir betrachten zwei Grenzfälle:
h̄ω << kB T : Rayleigh-Jeans, klassische Strahlungsformel, da unabhängig
von h̄
ω2
u → uR−J (ω) = kB T 2 3 .
(3.66)
π c
h̄ω >> kB T : Wien
h̄ω 3
u → uW (ω) = 2 3 e−βh̄ω .
(3.67)
π c
3.4
Ideales Fermionen-Gas bei tiefen Temperaturen
Wir wollen ideale Fermionen-Gase behandeln, dazu gehören natürlich freie
(nichtwechselwirkende) Fermionen. Aber auch wechselwirkende Systeme wie
Elektronen und Kerne, aus denen Festkörper aufgebaut sind, und wechselwirkende He3 Atome, Kernmaterie aus Nukleonenflüssigkeit, besitzen niedrigliegende Anregungen die Teilchen-Charakter haben und fermionisch sind.
Wir gehen nun von derartigen (Quasi)-Fermionen aus mit Energie-ImpulsDispersion e(p) die in Festkörpern nahezu “beliebige” Form (Bänder) haben
kann. Um konkret zu sein, wollen wir jedoch eine Parabelform benutzen, d.h.
e(p) =
p2
,
2m∗
(3.68)
wobei m∗ die sogenannte effektive Masse des Teilchens ist und mit der nackten
Elektronenmasse übereinstimmen kann oder auch nicht. Meistens ist die effektive Masse größer (in manchen Fällen jedoch kleiner) als die nackte Masse
des Fermions, da das Quasifermion als nacktes Fermion + Wolke von umgebenden Teilchen, die mitgeschleppt werden muß, aufgefaßt werden kann.
Bei tiefen Temperaturen kann also das stark-wechselwirkende Fermionsystem
durch schwachwechselwirkende Quasifermionen ersetzt werden. Wir gehen
jetzt von einem idealen (Quasi-) Fermionengas aus. Wir erinnern uns an
(3.43), d.h. in Besetzungszahldarstellung sind Hamilton- und TeilchenzahlOperator gegeben durch
X
X
H=
e(p, s)np,s , N̂ =
np,s .
(3.69)
p,s
p,s
mit Impuls p, Spin s = ±1/2. Die Fermi-Verteilungsfunktion (wobei f := f+
wie in (3.70) erklärt ist.) für Fermionen und Löcher ist
hnp,s i =
1
eβ[e(p,s)−µ]
+1
=: f (e(p, s) − µ),
76
A. Klümper
1 − hnp,s i =
1
e−β[e(p,s)−µ]
+1
.
(3.70)
Im Grenzfall T = 0 ist f ein “Block”, der für T > 0 “abschmilzt” auf einer
charakteristischen Breite kB T .
f
T=0
T>0
µ
ε
Eine derartige Verteilung, die vollständig von einer klassischen BoltzmannVerteilung (exponentiell) abweicht, wird auch entartet genannt und das zugehörige Fermigas entartetes Fermigas.
Wir definieren die Fermi-Energie ǫF als das chemische Potential bei T = 0
sowie die verwandten Größen Fermi-Temperatur TF und Fermi-Impuls
PF
P2
ǫF = µ(T = 0), ǫF = kB TF = F∗ .
(3.71)
2m
Diese Größen hängen ab von der Teilchendichte. Bei T = 0 gilt
Z
X
V ³ p F ´3
V
3
d
p
=
,
(3.72)
2
N=
hnp,s i =
(2πh̄)3 ǫ<ǫF
3π 2 h̄
p,s
also
³ p ´3
F
h̄
= 3π 2 n ∼ 1024 cm−3 für Elektronen im Metall,
(3.73)
p2
m0
4
5
damit pF /h̄ ≃ 108 cm−1 → µ0 = ǫF = 2mF∗ ≃ 10−11 m
∗ erg → TF ≃ 10 − 10
K, so daß TF größer ist als alle realistischen Temperaturen, bei denen ein
Festkörper existiert. Ebenso gilt µ/kB >> T . Mit anderen Worten: Elektronen im Metall sind immer stark entartet.
Wir wollen das Tieftemperaturverhalten bestimmen. Neben der Fermi-Temperatur
gibt es noch andere Energieskalen, wie z.B. die Breite eines Energiebandes
bzw. andere Charakteristika der Zustandsdichte D(ǫ), die wie folgt definiert
ist
V D(ǫ)dǫ := Anzahl der Einteilchen-Zustände in [ǫ, ǫ + ǫ],
(3.74)
wobei wir vorweggenommen haben, daß die Anzahl der Zustände eine extensive Größe ist.
Beispiel: Wir wollen nun für ein isotropes Einteilchen-Spektrum, d.h. e(~
p) =
e(|~
p|) die Zustandsdichte nach (3.74) bestimmen
Thermodynamik und Statistische Physik
ǫ≤e(p)≤ǫ+dǫ
X
V D(ǫ)dǫ =
p,s
V
1=2
(2πh̄)3
V
= 2 3 p2 (ǫ)dp
π h̄
1
dp
→ D(ǫ) = 2 3 p2 .
dǫ
π h̄
Z
77
d3 p 1
ǫ≤e(p)≤ǫ+dǫ
(3.75)
Mit (3.68) folgt
m∗
p.
(3.76)
π 2 h̄3
Teilchenzahl und Energie als Integrale über D(ǫ)
Da die mittlere Besetzungszahl nur von der Energie ep abhängt, nicht jedoch direkt von p, können wir die Teilchenzahl durch ein Integral über die
Zustandsdichte ausdrücken
Z ∞
X
N
N=
hnp,s i → n =
dǫD(ǫ)f (ǫ − µ).
(3.77)
=
V
−∞
p,s
D(ǫ) =
Wir haben hier formal auch über negative Energien integriert. Hier ist die
Zustandsdichte einfach 0
D(ǫ) = 0 (ǫ hinreichend negativ),
f (ǫ → ∞) ≃ e−βǫ → 0 exponentiell schnell.
(3.78)
Die mittlere Energie lautet
E
=
V
Z
∞
−∞
dǫǫD(ǫ)f (ǫ − µ).
Wir wollen nun allgemein Integrale vom Typ
Z ∞
dǫF ′ (ǫ)f (ǫ − µ),
I=
(3.79)
(3.80)
−∞
berechnen, wobei F ′ (ǫ) = D(ǫ) und F ′ (ǫ) = ǫD(ǫ) von besonderem Interesse
sind. Wir können in diesen Fällen ausgehen von folgenden Eigenschaften
F (ǫ) = 0 (ǫ hinreichend negativ),
lim F (ǫ)f (ǫ − µ) = 0.
ǫ→∞
(3.81)
Partielle Integration liefert
I=−
Da
Z
∞
−∞
dǫF (ǫ)f ′ (ǫ − µ).
∂f
1
∂
ex
=β
= −β x
,
x
∂ǫ
∂x e + 1
(e + 1)2
x = β(ǫ − µ),
(3.82)
(3.83)
78
A. Klümper
folgt mit dǫ = βdx
I=
Z
∞
dx
−∞
ex
F (µ + kB T x).
(ex + 1)2
(3.84)
Für kleine Temperaturen können wir nach kB T x entwickeln. Für hinreichend
großes x ist kB T x auch für kleines T beliebig groß, der Fehler in der Entwicklung wird jedoch durch den exponentiell abfallenden Faktor vor F nivelliert.
Mit
1
F (µ + kB T x) = F (µ) + kB T xF ′ (µ) + (kB T x)2 F ′′ (µ) + ...,
2
(3.85)
gilt
I=
Z
∞
−∞
=
=
dx
1
[F (µ) + kB T xF ′ (µ) + (kB T x)2 F ′′ (µ) + ...],
|
{z
} 2
(ex + 1)(e−x + 1)
→0
π2
+ (kB T )2 F ′′ (µ) + O(T 4 )
6
F (µ)
R |µ {z }
0
(3.86)
dǫF ′ (ǫ)
wobei benutzt wurde
Z ∞
dx
= 1,
x
−x + 1)
−∞ (e + 1)(e
Z
∞
−∞
dx
x2
π2
=
.
(ex + 1)(e−x + 1)
3
(3.87)
Wir wenden die obige Entwicklung an auf: Teilchenzahl (F ′ (ǫ) = D(ǫ))
Z µ
π2
N
dǫD(ǫ) +
(T > 0)
=
(kB T )2 D′ (µ),
V
6
Z0 µ0
N
=
dǫD(ǫ),
(3.88)
(T = 0)
V
0
wir nehmen die Differenz
π2
π2
D′ ¯¯
(kB T )2 D′ (µ0 )+O(T 4 ) → µ−µ0 = − (kB T )2 ¯ .
6
6
D µ0
(3.89)
Energie (F ′ (ǫ) = ǫD(ǫ))
Z µ
π2
E
dǫǫD(ǫ) +
(T > 0)
=
(kB T )2 [D(µ) + µD′ (µ)],
V
6
Z0 µ0
E0
dǫǫD(ǫ),
(3.90)
=
(T = 0)
V
0
0 = (µ−µ0 )D(µ0 )+
Differenz
E − E0
=
V
Z
µ
µ0
dǫǫD(ǫ) +
π2
(kB T )2 [D(µ0 ) + µ0 D′ (µ0 )] + O(T 4 ),
6
Thermodynamik und Statistische Physik
= (µ − µ0 )µ0 D(µ0 ) +
79
π2
(kB T )2 [D(µ0 ) + µ0 D′ (µ0 )] + O(T 4 ).
6
(3.91)
Wenn wir nun von (3.91) abziehen (3.89) ×µ0 , erhalten wir
π2
E − E0
=
(kB T )2 D(µ0 ) + O(T 4 ).
V
6
(3.92)
Die obige Entwicklung ist die sog. Sommerfeld-Entwicklung. Sie ist gültig
in dem Temperaturbereich, in dem (kB T )2 F ′′ , mit F wie oben, klein ist.
Die Wärmekapazität ist
CV
1
=
V
V
µ
∂E
∂T
¶
= γT + O(T 3 ),
(3.93)
V
also linear in T für ein beliebiges Spektrum. Die Sommerfeld-Konstante γ ist
gleich
π2 2
k D(µ0 ).
(3.94)
γ=
3 B
Da der Fermi-Impuls pF aus der Teichendichte folgt, liefert die Messung der
Wärmekapazität γ und über D(µ0 ) sowie (3.76) die effektive Masse m∗ .
In den Übungen wird der Druck eines Fermigases
bestimmt. Da auch bei
Rµ
T = 0 aufgrund des Pauliprinzips E0 = V 0 0 dǫǫD(ǫ) = E0 (V ) eine Funktion des Volumens ist, gibt es einen Nullpunktsdruck für Fermionen.
Nachtrag zu verdünnten Lösungen: Beweis von (2.110)
Mit Indizes 1 und 2 unterscheiden wir die physikalischen Größen für das
Lösungsmittel und die gelöste Substanz. Bei geringer Konzentration der SubN2
2
≃N
<< 1. Wenn c → 0 gilt auch n2 = NV2 → 0
stanz 2 gilt c := c2 = N1N+N
2
1
und damit auch z2 = eβµ2 → 0. Das großkanonische Potential Φ(T, V, µ1 , µ2 )
kann um das Potential des reinen Lösungsmittel Φ(T, V, µ1 ) in der Variablen
z2 entwickelt werden
Φ(T, V, µ1 , µ2 ) = Φ(T, V, µ1 ) − V φ(T, µ1 )z2 + O(z22 ),
(3.95)
mit einer geeigneten Funktion φ. Die Teilchenzahl N2 berechnet sich zu
∂Φ
= V φβz2 →
(3.96)
∂µ2
µ2 = kB T [ln n2 + O(n2 ) − ln(βφ)] = kB T [ln c + O(c) − ln(βφ/n)],
| {z }
N2 = −
=f (p,T )
wobei n2 = NV2 = NN2 · N
V ≃ cn benutzt wurde und in Abhängigkeit von
den (vollständigen) Variablen p, T, c, N1 das chemische Potential µ2 nur von
80
A. Klümper
p, T, c und die Funktion f nur von p, T abhängen kann.
Wir bemühen nun die freie Enthalpie
G(T, p, N1 , N2 ) = N1 µ1 + N2 µ2 ,
dG = −SdT + V dp + µ1 dN1 + µ2 dN2 .
Es gilt
µ
∂µ1
∂N2
¶
=
p,T
µ
∂µ2
∂N1
¶
p,T
= −kB T
1
[1 + O(c)],
N
(3.97)
(3.98)
Integration ergibt
µ̄i (T, p, c) = µi (T, p) − kB T c + O(c2 ),
(3.99)
d.h. (2.110).
3.5
Thermodynamik eines Gases aus mehratomigen Molekülen
Bei hinreichender Verdünnung (z = nλ3 << 1) können wir von der MolekülMolekül-Wechselwirkung absehen und auch in erster Ordnung in z (3.46)
entwickeln
i
X h
X
−βΦ(T, V, µ) = βpV = ±
ln 1 ± ze−βe(ν) = z
e−βe(ν) .
(3.100)
ν
ν
Für Moleküle ist ν = (p, νi ), wobei p der Impuls ist und νi für innere Anregungen (Rotation, Vibration, elektronisch) steht:
e(ν) =
p2
+ ǫ(νi ).
2m
Für das großkanonische Potential erhalten wir
!
!Ã
Ã
X
X βp2
zV
−βǫ(νi )
− 2m
e
−βΦ(T, V, µ) = z
= 3 Zi ,
e
λ
νi
p
|
{z
}
(3.101)
(3.102)
=:Zi
wobei Zi = Zi (T ) die Zustandssumme der inneren Anregungen ist und unabhängig von V und N ist. Es folgt
∂Φ
∂
zV
= z (−βΦ) = 3 Zi = −βΦ = βpV,
∂µ
∂z
λ
→ p = nkB T thermische Zustandsgl. des kl. ideal. Gases.
→ z = λ3 n/Zi → βµ = ln(λ3 n) − ln Zi .
(3.103)
N =−
Die freie Energie ergibt sich durch Legendre-Transformation
Thermodynamik und Statistische Physik
βF (T, V, N ) = βΦ + βµN = (βµ − 1)N = [ln(λ3 n/e) − ln Zi ]N.
81
(3.104)
Mit (3.36) folgt
F (T, V, N ) = Ftrans (T, V, N ) + Fi (T, N ),
Fi = −N kB T ln Zi .
(3.105)
Der erste Teil ist der uns bekannte translatorische Anteil an der freien Energie, der zweite Teil ist die innere freie Energie.
Bei Zimmertemperatur sind die elektronischen Freiheitsgrade noch nicht angeregt. Wir können uns auf die Rotations- und Vibrations-Freiheitsgrade beschränken und betrachten konkret zweiatomige Moleküle.
Wir gehen von streng entkoppelten Rotations- und Schwingungsmoden aus
(dies ist sicherlich nur eine bequeme Näherung):
ǫi = ǫrot + ǫvib ,
ǫrot =
h̄2 j(j + 1)
,
2I
ǫvib = h̄ω(n + 1/2),
(3.106)
mit Trägheitsmoment I, Schwingungsfrequenz ω, und ganzzahligen Quantenzahlen j = 0, 1, 2, ..., n = 0, 1, 2, ... .
Die innere Zustandssumme faktorisiert
Zi = Zrot · Zvib → Fi = Frot + Fvib ,
(3.107)
mit
Frot = −N kB T ln Zrot ,
Fvib = −N kB T ln Zvib .
(3.108)
Wir behandeln zuerst den
Rotationsanteil:
Zrot =
∞
X
(2j + 1)e−
j(j+1) θr
2
T
,
(3.109)
j=0
wobei wir die Entartung 2j + 1 des Energieniveaus mit Drehimpulsquantenzahl j benutzt haben und ferner lästige Konstanten in der charakteristischen
Temperatur
h̄2
θr =
,
(3.110)
kB I
zusammengeführt haben. Wir können leider (3.109) nicht durch elementare Funktionen ausdrücken, daher wollen wir uns mit den Tief- und HochTemperatur-Asymptoten explizit befassen. Bei tiefen Temperaturen stellt
(3.109) schon eine legitime Entwicklung dar
T << θr :
Zrot = 1 + 3e−θr /T + 5e−3θr /T + ...,
(3.111)
82
A. Klümper
da nur wenige Rotationen angeregt sind. Bei hohen Temperaturen sind (fast)
alle Terme in der Reihe (3.109) gleichbedeutend und die Variation zweier
aufeinander folgender Terme gering. Daher bietet sich eine Auswertung der
Reihe durch ein Integral mit Korrekturtermen à la Eulersche Summenformel
an
Z ∞
∞
X
1
1
djf (j) + f (0) − f ′ (0) + ....
(3.112)
f (j) =
2
12
0
j=0
Es gilt in unserem Fall
Z ∞
Z ∞
T
d j(j+1) θr
T
djf (j) = 2
dj(−) e− 2 T = 2 ,
θ
dj
θ
r 0
r
0
µ ¶
µ ¶
1
1 ′
1
2
1
θr
θr
= +O
f (0) − f (0) = −
+O
2
12
2 12
T
µT ¶ 3
1
θr
T
Zrot = 2 + + O
θr
3
T
(3.113)
woraus folgt
Frot = −N kB T
(
Hieraus folgt direkt
Srot = −
¡
¢
r /T
3e−θr /T + O e−2θ
³¡ ¢2, ´ T << θr ,
θr
1 θr
ln 2T
, T >> θr .
θr + 6 T + O
T
∂Frot
= N kB
∂T
und
Erot = Frot + T Srot = N kB
sowie die Wärmekapazität
Crot = T
∂Srot
∂T
½
½
3 θTr e−θr /T , T << θr ,
ln 2T
T >> θr ,
θr + 1,
3θr e−θr /T , T << θr ,
T >> θr ,
T − 61 θr ,
 ¡ ¢
 3 θr 2 e−θr /T ,
T ³
¡ ¢2 ´
= N kB
 1 + O θTr
,
T << θr ,
T >> θr .
Gesamtverlauf von Crot :
Cr
NkB
1
2
3
T/ θ
r
(3.114)
(3.115)
(3.116)
(3.117)
Thermodynamik und Statistische Physik
83
Nun behandeln wir den
Vibrationsanteil:
Die zu summierende Reihe ist harmonisch und ergibt
Zvib =
∞
X
θv
e−(n+1/2) T =
n=0
1 θv
T
e− 2
1−
θv
e− T
mit der charakteristischen Temperatur
θv =
=
1
¡θ ¢
v
2 sinh 2T
h̄ω
.
kB
(3.118)
(3.119)
Wir erhalten direkt
Fvib
Svib
Cvib
·
´¸
³
1 θv
− θTv
= N kB T
+ ln 1 − e
,
2T
·
´¸
³
1
θv
∂Fvib
− θTv
,
= N kB
=−
−
ln
1
−
e
θv
∂T
( T¡ e ¢T2 − 1
θv
∂Svib
e−θv /T , T << θv ,
T
=T
= N kB
¡ θ ¢2
1
v
∂T
, T >> θv .
1 − 12
T
(3.120)
Wir wollen uns jetzt einen Überblick über Cges = Ctrans +Crot +Cvib verschaffen. Ganz allgemein gilt θr < θv . Daher wollen wir drei Temperaturbereiche
betrachten:

3/2, T << θr < θv (aber nicht so tief, daß die


Cges
klassische Näherung zusammenbricht)
≃
(3.121)
5/2,
θr << T << θv ,

N kB

7/2, θr < θv << T ,
Bei sehr niedrigen Temperaturen sind also nur Translationsfreiheitsgrade,
nicht aber Rotationen und Vibrationen angeregt. Letztere kommen bei höheren
Temperaturen vor: zunächst die beiden Rotationen des Moleküls. Oberhalb
der charakteristischen Temperatur tragen zur mittleren Energie Erot = 2 ·
( 21 kB T ) zwei Freiheitsgrade bei (Gleichverteilungssatz). Schließlich kommen
die kinetische und die potentielle Energie der Schwingung mit je 21 kB T hinzu. Bei noch höheren Temperaturen dissoziiert das Molekül und jedes Atom
trägt 32 kB T bei.
3.6
Allgemeines ideales Bosegas
Als zweites Beispiel eines idealen Bosegases behandeln wir ein nichtrelativistisches Gas aus Bosonen mit endlicher Ruhemasse und erhaltener Teilchenzahl. Wir werden daher in der großkanonischen Gesamtheit mit einem von
84
A. Klümper
0 verschiedenen chemischen Potential µ arbeiten. Damit der Druck wie in
(3.46) reell und die mittlere Besetzungszahl wie in (3.48) positiv ist, insbes.
hnp=0 i = 1/(1/z − 1) ≥ 0, darf das chemische Potential nicht größer als 0
sein, d.h. µ ≤ 0 bzw. Fugazität z ≤ 1.
Wir wollen nun wie schon beim Fermigas die Impulssumme im thermodynamischen Limes in ein Integral umschreiben. Wir wollen hier schon bemerken,
daß diese Manipulation nur gerechtfertigt ist, wenn der Integrand nicht singulär ist. Wir werden den Fall z → 1− noch detailliert besprechen. Für z < 1
gilt (wir wollen den Fall der Fermionen mit beliebigem z weitestgehend mitbehandeln)
i
X h
−βΦ = βpV = ±
ln 1 ± e|−β[e(p)−µ]
{z }
p
−
βp2
· ze 2m 2 ¸
βp
V
=±
d3 p ln 1 ± ze− 2m
(2πh̄)3
µ
¶3 Z
i
h
V
2m 2
3
−x2
d
x
ln
1
±
ze
=±
(2πh̄)3 Z β
∞
i
h
2
V 4
=± 3√
dx x2 ln 1 ± ze−x ,
λ
π 0
Z
(3.122)
wobei die Definition von λ (3.23) benutzt wurde und die Isotropie des Integranden in 3d. Wir entwickeln nun die Logarithmsfunktion und vertauschen
Reihe und Integration
Z ∞
i
h
2
dx x2
ln 1 ± ze−x
±
0
|
{z
}
P∞ (−1)l−1
l −lx2
=
= ∓
= ∓
l=1
∞
X
(−1)l
l
(±z) e
l
(±z)l
l=1
Z
∞
X
(∓z)l
l=1
l5/2
Z
∞
dx x2 e−lx
2
0
∞
2
dy y 2 e−y
0
}
| R {z
√
∞
2
π
1
dye−y =
=
2 0
√
π
=
[∓g5/2 (∓z)],
4
4
(3.123)
wobei die Funktion gν wie folgt erklärt ist
gν (z) =
∞
X
zl
l=1
lν
.
Damit erhalten wir für das großkanonische Potential
(3.124)
Thermodynamik und Statistische Physik
−βΦ = βpV = ∓
V
g5/2 (∓z),
λ3
85
(3.125)
und für die Teilchenzahl
N =−
∂Φ
∂βΦ
V
= −z
= ∓ 3 g3/2 (∓z).
∂µ
∂z
λ
(3.126)
Die Zustandsgleichung p = p(T, N/V ) folgt durch Auflösen von (3.126) nach z
und Einsetzen in (3.125). Bei diesem Programm tritt sofort die Schwierigkeit
auf, daß in (3.126) oder äquivalent in
λ3 n = ∓g3/2 (∓z),
(3.127)
die linke Seite beliebig große Werte annehmen kann, aber die rechte Seite
durch g3/2 (1) = ζ(3/2) = 2, 612... beschränkt ist (gν (1) = ζ(ν) Riemannsche
Zetafunktion).
2,612...
g3/2(z)
1
z
Nimmt die linke Seite von (3.127) bei niedrigen Temperaturen und/oder hohen Dichten einen Wert an, der g3/2 (1) übersteigt, nimmt z einen Wert beliebig dicht bei 1 an (z > 1 ist nicht erlaubt). Für diese Situation ist der obige
Übergang von der Impulssumme zum Integral nicht erlaubt, da der Integrand
bei p = 0 singulär ist. Eine genauere Rechnung liefert
N =−
∂βΦ
V
∂Φ
= −z
= 3 g3/2 (z) + N0 ,
∂µ
∂z
λ
(3.128)
wobei N0 = hn0 i die Besetzungszahl des Impuls-p = 0-Zustandes ist, d.h.
N0 =
1
z
1
.
−1
(3.129)
Üblicherweise ist N0 endlich, d.h. intensiv. Ist jedoch z = 1 − O(1/V ), dann
ist N0 extensiv und (3.128) bzw.
λ3 n = g3/2 (z) + λ3
kann gelöst werden für λ3 n > g3/2 (1) mit
N0
,
V
(3.130)
86
A. Klümper
N0
N0
= n − g3/2 (1)/λ3 und z =
= O(1 − 1/V ).
V
N0 + 1
(3.131)
Wir haben nun das interessante Phänomen, daß für λ3 n > g3/2 (1) ein endlicher Bruchteil N0 /N der Bosonen das tiefste (p = 0) Einteilchenniveau
besetzt. Dieser Vorgang ist als Bose-Einstein-Kondensation bekannt und
wurde 1924/25 vorhergesagt. Es handelt sich hierbei um einen Phasenübergang
(2. Ordnung) mit kritischer Temperatur
kB Tc (v) =
2πh̄2 /m
,
[vg3/2 (1)]2/3
v = V /N,
(3.132)
bzw. kritischer Teilchendichte
vc (T ) =
λ3
.
g3/2 (1)
(3.133)
T
Gasphase
Phasengrenzline
Tc (v)~v−2/3
Kondensat
Mischphase
v
Der kondensierte Anteil ergibt sich aus (3.131) zu
(
0,
Gasphase,
N0
³ ´3/2
=
vg3/2 (1)
= 1 − vvc , Mischphase,
1 − λ3 = 1 − TTc
N
(3.134)
insbes. ist N0 /N = 1 für T = 0 unabhängig vom Volumen.
N0 /N
1
N0 /N
v fest
1
T fest
Tc
T
vc
v
Die Herleitung von (3.125) bleibt von der Kondensation unberührt. Es tritt
in der Impulssumme im Prinzip auch ein divergenter p = 0-Term auf, der
jedoch nur logarithmisch divergiert. Der Beitrag zum Druck ist
Thermodynamik und Statistische Physik
lim
V →∞
µ
µ
¶
¶
1
1
ln(1 − z(V )) ∼ lim
ln V = 0.
V →∞ V
V
Die Zustandsgleichung wird explizit
½
kB T g5/2 (z),
p= 3
g5/2 (1) = 1, 342...,
λ
Gasphase,
Mischphase.
87
(3.135)
(3.136)
Im (p, T )-Phasendiagramm hat die Phasengrenzlinie ein p ∼ T 5/2 Verhalten.
Das Gebiet links von dieser Kurve wird nicht erreicht, da der Druck bei noch
so hoher Dichte den Druck der Mischphase nicht übersteigt. In der Mischphase wird 100%-Kondensation nur bei unendlicher Dichte erreicht (außer
bei T = 0).
p
p
Gasphase
Phasengrenzline
−5/3
"verboten"
~v
~T 5/2
Isotherme
~1/v
Kondensat
Mischphase
Phasengrenzline
v
T
Helium versus Bose-Einstein-Kondensation
Häufig wird der λ-Übergang zwischen normalflüssiger und supraflüssiger Phase von He4 mit der Bose-Einstein-Kondensation in Verbindung gebracht. Um
jedes Mißverständnis im Keim zu ersticken, sei hier direkt gesagt, daß dies
falsch ist. Die He4 -Atome sind zwar Spin-0-Teilchen und damit Bosonen. He
stellt jedoch kein ideales, sondern ein stark-wechselwirkendes System dar. Das
(p, T )-Phasendiagramm, siehe Abschnitt 2.6, zeigt auch keine Ähnlichkeit mit
dem des Bose-Einstein-Systems (s.o.). Ferner gibt es zwar in der suprafluiden
Phase eine makroskopische Besetzung des p = 0-Zustandes, die jedoch nicht
100% erreicht, sondern nur etwa 6% bei T = 0.
C(T)
Tλ
T
Die spezifische Wärme divergiert am λ-Übergang mit einer logarithmischen
Singularität, d.h. der Graph von C(T ) ähnelt dem Buchstaben λ, daher die
Namensgebung. Die spezifische Wärme bei der Bose-Einstein-Kondensation
88
A. Klümper
zeigt nicht diese Divergenz. Damit sind drei Unterschiede genannt!
Modellmäßig faßt man die suprafluide Phase als 2-Flüssigkeitssystem auf mit
– normaler Anteil,
– suprafluider Anteil = Kondensat (nicht zu verwechseln mit dem BoseEinstein-Kondensat.
Die folgende Deutung stammt von Landau.
Das Kondensat ist der Grundzustand bei T = 0 und besitzt Entropie 0.
Der Normalanteil besteht aus den Anregungen des Systems, d.h. einem Gas
aus Quasiteilchen. Diese Quasiteilchen genügen der Bosestatistik, haben aber
nicht direkt zu tun mit den He4 -Bosonen. Folgendes Anregungsspektrum wurde mittels Neutronenstreuung experimentell bestimmt und auch theoretisch
abgeleitet
e
10 kB
5
Steigung: vkrit
1
2
mit Verhalten bei den Minima 0 und p0 6= 0
p → 0: e(p) = u · p, (p = |~
p|), Phonon ,
p → p0 : e(p) ≃ ∆ +
(p−p0 )2
2m∗ ,
p
−1
h [A ]
Roton,
mit folgenden Daten
∆
= 8.5K,
kB
p0
= 1.9 · 108 cm−1 ,
h̄
m∗ = 0.16mHe4 .
Der Hamiltonoperator lautet
X
H=
e(p)np , np = 0, 1, 2, ... (Bosestatistik),
(3.137)
(3.138)
p
wobei die Zahl der Quasi-Bosonen nicht erhalten ist. Mit chemischem Potential µ = 0 ist die mittlere Energie
X
1
,
E=
e(p)hnp i, hnp i = βe(p)
e
−1
p
≃ Eph + Erot .
(3.139)
Wie bei der Hohlraumstrahlung liefert der Phonon-Anteil einen T 4 -Beitrag,
und wie alle Anregungen mit Lücke liefern die Rotonen ein Aktivierungsverhalten
Thermodynamik und Statistische Physik
π 2 (kB T )4
(T → 0) −→ cph ∼ T 3 ,
30 (h̄u)3
≃ e−∆/kB T −→ crot ∼ e−∆/kB T .
89
Eph = V
Erot
(3.140)
Aus dem eigentümlichen Spektrum mit einem endlichen Wert für
vkrit := min
p
e(p)
(siehe auch die Figur),
p
(3.141)
folgt, daß das Kondensat sich reibungsfrei durch ein Rohr bewegen kann,
sofern nur die Fließgeschwindigkeit v kleiner ist als vkrit . Wir benutzen das
Argument nach Landau und betrachten das System bei T = 0.
Behauptung: Zeigt Materie in Ruhe elementare Anregungen mit Dispersion
e = e(~
p) dann hat Materie mit Schwerpunktgeschwindigkeit ~v Anregungen
mit Dispersion e~v = e(~
p) + ~v · p~.
Beweis: In Ruhe, d.h. mit Fließgeschwindigkeit v = 0 hat (i) der Grundzustand, (ii) der Grundzustand + Anregung mit Impuls p die Energie
(i)
E = E0 ,
(ii)
E = E0 +
p2
+ Eint ,
|2M {z }
(3.142)
=:e(p)
wobei sich die Anregungsenergie aus kinetischer Energie (M ist die Gesamtmasse) und interner Anregung ergibt. Diese Überlegung wurde durchgeführt,
um die einzelnen Beiträge zu e(p) zu ermitteln. Wir sind natürlich interessiert
an Helium, das mit einer Geschwindigkeit v fließt. Hier sehen die Energien
für Grundzustand und Anregung mit Impuls p wie folgt aus
(i)
(ii)
(M v)2
,
2M
(M~v + p~)2
+ Eint ,
E = E0 +
2M
2
p2
(M v)
+ ~v p~ +
+ Eint
= E0 +
2M
|2M {z }
E = E0 +
q.e.d.
(3.143)
=e(p) s.oben
Reibung findet statt, wenn es Anregungen gibt, die die Gesamt-Energie des
Heliums erniedrigen (der Energiegewinn geht beispielsweise als Wärme in die
Umgebung). Die Frage ist, kann ~v p~ + e(p) negativ werden? Wir stellen dies
um
~v p~ + e(p) < 0 ⇔ e(p) < −~v p~ ≤ vp.
(3.144)
90
A. Klümper
Die Bedingung ist, daß es ein p gibt, so daß v > e(p)/p. Ist also v > vkrit
(v < vkrit ) so gibt es (keine) Reibung! Für v < vkrit haben wir Superfluidität.
Bei T > 0 sind schon Anregungen vorhanden. Diese können mit der Wand
stoßen und (beliebig kleine) Energie und Impuls austauschen, was der Reibung des Normalteils entspricht. Von T = 0 bis zu einem Tλ , das mit obigem
Hintergrund abgeschätzt werden kann, existiert ein makroskopisches Kondensat.
Experimentelle Realisierung der Bose-Einstein-Kondensation
Aufgrund der immer in realen Bosesystemen mit erhaltener Teilchenzahl vorkommenden Wechselwirkung wurde die Bose-Einstein-Kondensation erst 70
Jahre nach ihrer Vorhersage experimentell realisiert (Nobelpreis 2001 an Eric
A. Cornell, Wolfgang Ketterle, Carl E. Wieman)
– Gas aus 2000 spinpolarisierten Rb87 -Atomen, eingeschlossen in einer Quadrupol-Falle. Die Übergangstemperatur liegt bei 170 × 10−9 K. Trotz dieser extrem tiefen Temperaturen konnte ein Übergang in die feste Phase
verhindert werden. Der gasförmige Zustand erwies sich als hinreichend
metastabil, so daß die Kondensat-Phase für etwa 10 Sekunden aufrechterhalten werden konnte. Literatur: M. H. Anderson et al., Science 269,
S. 198 (1995)
– Gas aus 2 × 105 spinpolarisierten Li7 -Atomen, Übergangstemperatur bei
400 × 10−9 K (C.C. Bradley et al., Phys. Rev. Lett. 75, S. 1687 (1995)).
– atomarer Wasserstoff mit > 108 Atomen, Übergangstemperatur bei 50µK
(D. Kleppner et al., Phys. Rev. Lett. 81, S. 3811 (1998)).
Stichworte: makroskopische Wellenfunktion, Materiewellen, makroskopische
Quantenphänomene...
3.7
Verdünnte Systeme, Virialentwicklung
Wir wollen uns der Berechnung wechselwirkender Systeme nähern vom Grenzfall starker Verdünnung. Hierfür ist die thermische de-Broglie-Wellenlänge λ
klein gegen die Reichweite der Wechselwirkung r0 und den mittleren Abstand der Teilchen v 1/3 , letztere Längen sind jedoch durchaus vergleichbar.
Wir können nun die klassische Entwicklung anwenden. Die Wechselwirkung
wird beschrieben durch
H=
N
X
X
p2i
+
v(ri − rj ).
2m i<j
i=1
(3.145)
Thermodynamik und Statistische Physik
91
Wir wollen die großkanonische Zustandssumme berechnen
Zgk (T, V, µ) =
∞
X
z N Zk (T, V, N ),
(3.146)
N =0
wobei wir nach (3.22) nur das Konfigurationsmittel
Z
1
Zk =
d3N xe−βU (x1 ,...,xN ) ,
N !λ3N
(3.147)
zu berechnen haben. Für kleine Dichten ist z = eβµ << 1 und wir können z
als Entwicklungsparameter verwenden
−βΦ = βpV = ln Zgk = ln[1 + zZ(1) + z 2 Z(2) + z 3 Z(3) + O(z 4 )]
= zZ1 + z 2 Z2 + z 3 Z3 + O(z 4 ),
(3.148)
wobei
Z1 = Z(N = 1) =
V
,
λ3
1
Z2 = Z(2) − Z(1)2 ,
2
Z3 = ....
(3.149)
Die erste Frage, die sich hier stellt, ist, ob Φ in dieser Entwicklung, d.h. alle
Koeffizienten Zn extensiv sind. In obiger Darstellung ist beispielsweise Z2
ausgedrückt durch Terme, die O(V 2 ) sind. Wir werden jedoch bald sehen,
daß sich diese Terme wegheben und das Ergebnis allein von der Ordnung
O(V ) ist. Die Teilchenzahl ergibt sich nun ebenfalls als Reihe in z
N =−
∂βΦ
∂Φ
= −z
= zZ1 + 2z 2 Z2 + 3z 3 Z3 + O(z 4 ).
∂µ
∂z
(3.150)
Zustandsgleichung
In niedrigster Ordnung ergibt sich aus (3.150) iterativ
N
N
z=
= λ3 = nλ3 → zZ1 = N − 2Z2
Z1
V
µ
N
Z1
¶2
+ O(n3 ).
(3.151)
Nun folgt aus (3.148) in der bis hier behandelten Ordnung
pV
= N − Z2
kB T
µ
N
Z1
¶2
+ O(n3 ),
(3.152)
p = nkB T [1 + b(T )n + c(T )n2 + O(n3 )].
(3.153)
βpV =
oder auch
Dies ist der Beginn der sogenannten Virialentwicklung der Zustandsgleichung
nach Potenzen von n. Der Name rührt historisch von dem Virialsatz her, mit
Hilfe dessen diese Entwicklung zuerst gewonnen wurde. Die Koeffizienten
92
A. Klümper
a(T ) = 1, b(T ), c(T ) ... heißen Virialkoeffizienten. Der 2. Virialkoeffizient ist
nach (3.149,3.152) gegeben durch
¸
·
Z2
Z(T, V, 2) 1
b(T ) = −V 2 = −V
.
(3.154)
−
Z1
Z12
2
Mit
Z(T, V, 2) =
1 1
2 λ6
Z
d3 r1 d3 r2 e−βv(r1 −r2 ) =
V
2λ6
Z
d3 re−βv(r) ,
(3.155)
wobei das Integral über r1 und r2 durch Einführen von Schwerpunkts- und
Relativ-Koordinaten vereinfacht wurde. Man sieht nun
Z
1
d3 rf (r), f (r) := e−βv(r) − 1,
(3.156)
b(T ) = −
2
wobei f auch als “Mayer”-f -Funktion bekannt ist. Man sieht nun explizit,
daß für hinreichend schnell abfallende v(r) (und somit auch f (r)) das Integral
in (3.156) existiert und insbesondere b(T ) intensiv ist, wie gewünscht.
Die Zwei-Teilchen-Wechselwirkung bestimmt also eindeutig den 2. Virialkoeffizienten. Umgekehrt liefert die Ausmessung der Zustandsgleichung den 2. Virialkoeffizienten und somit Information über die Zwei-Teilchen-Wechselwirkung.
Beispiel: Ein gutes Modell für reale Gase ist gegeben durch das LennardJones-Potential
·³ ´
¸
σ 12 ³ σ ´6
v(r) = 4ǫ
,
(3.157)
−
r
r
mit zwei freien Parametern. (Herleitung: quantenmechanisch, Störungstheorie
2. Ordnung für zwei harmonische Oszillatoren mit Dipolkopplung der Auslenkungen ~x1 und ~x2 gemäß: const. ~x1 · ~x1 /R3 .)
v(r)
r
Bei großen Abständen verhält sich diese Wechselwirkung attraktiv und entspricht der van-der-Waals-Wechselwirkung, die auf der Wechselwirkung induzierter Dipole basiert mit einem exakten Exponenten 6. Bei kurzen Abständen
ist obiges v(r) stark repulsiv, der Exponent 12 ist lediglich ein bequemer Wert.
Thermodynamik und Statistische Physik
93
Gas σ[A−1 ] ǫ/kB [K]
He 2,56
10,2
Ne 2,78
34,9
Ar 3,4
120
Kr 3,6
171
Xe 4,1
221
Ein Vergleich von Rechnungen zu (3.157) und Messungen zu Edelgasen liefert
die in der Tabelle angegebenen Daten.
Beispiel: Wir wollen nun einen Fall betrachten, den wir etwas konkreter
behandeln können: harte Kugeln. Hier ist die Wechselwirkung gegeben durch
½
½
+∞,
für r ≤ 2r0 ,
−1,
für r ≤ 2r0 ,
v(r) =
→ f (r) =
−|v(r)|, für r ≥ 2r0 ,
∼ −βv(r), für r ≥ 2r0 ,
(3.158)
wobei letzte Näherung für große Temperaturen oder große Abstände r gilt.
In jedem Fall ist f (r) integrabel genau dann, wenn v(r) integrabel ist. Es gilt
nun
Z
Z
1
1
d3 rf (r) −
d3 rf (r),
(3.159)
b(T ) = −
2 |r|≤2r0
2 |r|≥2r0
wobei
−
1
2
Z
Z
1
1 4π
(2r0 )3
d3 r =
2 |r|≤2r0
2 3
16π 3
r = 4 × Eigenvolumen der Kugel, (3.160)
=
3 0
d3 rf (r) =
|r|≤2r0
und
1
−
2
Z
β
d rf (r) ≃
2
|r|≥2r0
3
Z
d3 rv(r) < 0.
(3.161)
|r|≥2r0
Bemerkung:
• Das Integral über f (r) existiert, falls v(r) algebraisch für große Abstände
abfällt: v(r) ≃ 1/rα mit α > 3. Dies ist für die van-der-Waals-Wechselwirkung
erfüllt, nicht jedoch für Coulomb-Potentiale von geladenen Teilchen (Plasmen, Elektrolyte). In diesen Fällen gibt es keine Virialentwicklung der Zustandsgleichung (sind diese Systeme überhaupt extensiv?). Statt dessen gilt
√
p = nkB T [1 + γ n + ...],
für kleine n,
(3.162)
was bei n = 0 nicht in eine Reihe in n entwickelbar ist. Dies ist kein Widerspruch zur Divergenz des Integrals für b(T ). Dieses Integral kann gedeutet
94
A. Klümper
werden als Wert für limn→0
γ
√
n
n
= ∞.
• Die Entwicklung in z wie in (3.148) kann in systematischer Weise sehr
übersichtlich dargestellt werden. Dies geschieht im Rahmen einer graphischen
Störungstheorie, bei der algebraische Ausdrücke durch geeignete Symbole
repräsentiert werden, z.B. Punkte i stehen für Integrationsvariable ri und
Verbindungslinien zwischen zwei Punkten stehen für Faktoren f (ri − rj ).
Der dargestellte Ausdruck muß schließlich über alle Variable integriert werden. Die Entwicklung von Zgk wird durch viele Graphen repräsentiert, die
Entwicklung (3.148) des thermodynamischen Potentials umfaßt dagegen nur
sogenannte verbundene Graphen. Dies macht auch die Extensivität des Potentials transparent.
3.8
Magnetische Erscheinungen
Die magnetischen Phänomene bilden ein außerordentlich reichhaltiges Gebiet,
das sich intensiver aktueller Forschung erfreut. Auch wenn Ihnen magnetische
Phänomene seit langer Zeit vertraut sind und ein klassischer Begriffsapparat
zur Beschreibung vorhanden ist, wird sich schnell zeigen, daß jedes magnetische Phänomen grundsätzlich quantenmechanischer Natur ist. Dies erklärt
auch die andauernde Forschung trotz der frühen Entdeckung des Magnetismus.
Wir betrachten nun eine allgemeine Beschreibung der Materie in einem äußeren
~ (= ∇
~ × A).
~ Dieses greift an ein Elektron in zweifacher Weise
Magnetfeld B
an
e~
1
i
~ ri ).
ri ))2 − µ
~ i · B(~
(3.163)
(~
pi − A(~
Hel
=
2m
c
Hierbei ist e die Ladung des Elekrons, c die Lichtgeschwindigkeit, und der
Index i nummeriert die vorhandenen Elektronen. Die Ersetzung des Impulses
durch den eichinvarianten Term ist die quantenmechanische Modellierung
der klassischen Lorentzkraft, die die Elektronenbahn krümmt. Der zweite
~ ist die Zeeman-Energie, die einem magnetischen Dipol in einem
Term µ
~i · B
Magnetfeld B zukommt. Hier ist µ
~ = gµB · ~s, mit dem Bohrschen Magneton
µB = |e|h̄/2mc, Landé-Faktor g = 2, 023... und Vektor der Spin-Operatoren
~s = 21 ~σ , wobei ~σ der Vektor der Pauli-Matrizen ist. Der Hamilton-Operator
eines Systems aus Elektronen und Kernen wird nun zu
H=
X
i
i
Hel
+
X
Hkj + W,
(3.164)
j
wobei Hkj die Energie des j-ten Kerns und W die Coulomb-Wechselwirkung
aller Teilchen ist. Für viele Zwecke ist der Einfluß des Magnetfeldes auf die
Thermodynamik und Statistische Physik
95
Kerne vernachlässigbar. Die Zeeman-Energie ist wegen der viel größeren Masse der Kerne um Größenordnungen kleiner als im Falle der Elektronen. Magnetische Ordnungserscheinungen werden also im wesentlichen auf die Elektronen zurückzuführen sein.
Aus der Elektrodynamik und Quantenmechanik wissen Sie, daß das Magnetfeld in der Materie Ströme bewirkt, die ihrerseits eine Magnetisierung erzeugen. Es gilt für die Operatoren
~ = − ∂H ,
M
~
∂B
(3.165)
~ = hM
~ i = −h ∂H i mit einem leichten Mißbrauch der Notation für M
bzw. M
~
∂B
(sowohl Operator als auch Erwartungswert). Die Mittelung ist mit dem DO
des thermischen Gleichgewichtes durchzuführen. In kanonischer Gesamtheit
gilt
~
~ = − ∂H = 1 ∂ ln Sp e−βH = − ∂Φ(T, B) ,
(3.166)
M
~
~
~
β ∂B
∂B
∂B
wobei Φ = − β1 ln Z das thermodynamische Potential ist. Man erkennt, die
Entsprechung des Paares (M, B) mit (N, µ).
Wir definieren die magnetische Suszeptibilität χ durch
χ :=
∂M
,
∂B
(3.167)
wobei χ und M extensiv sind, B intensiv.
Wir wollen nun vier grundlegende magnetische Phänomene besprechen.
Diamagnetismus
Der Einfluß des Magnetfeldes auf die Teilchenbahnen der Ladungen läßt einen
negativen Beitrag zur Suszeptibilität erwarten. Wir wollen uns zunächst davon überzeugen, daß eine Behandlung des Diamagnetismus nur quantenmechanisch erfolgen kann, m.a.W.: in der klassischen Statistik gibt es keinen
Diamagnetismus (van-Leeuwensches Theorem). Der Beweis ist einfach und
basiert auf (3.20) für die Zustandssumme und lautet in Gegenwart eines
äußeren Magnetfeldes
1
Zkan,klassisch (T, B) =
N!
Z
d3N pd3N x −βH({pi − e A(ri ),xi })
c
e
.
(2πh̄)3N
(3.168)
Nach einer Variablensubstitution p′i := pi − ec A(ri ), wobei das Volumenelement invariant bleibt, erhalten wir
96
A. Klümper
Zkan,kl. (T, B) =
1
N!
Z
d3N p′ d3N x −βH({p′i ,xi })
e
= Zkan,kl. (T, 0),
(2πh̄)3N
(3.169)
mit einer beliebigen Form von H, d.h. mit und ohne Wechselwirkung. Dieses
durchsichtige, aber formale Argument ist auch anschaulich zu verstehen. Wir
betrachten die (Kreis-) Bahnen der Ladungen in einem endlichen Volumen.
Wir sehen, daß es an den Rändern zu Reflexionen kommt, so daß die Ladungen im Volumen im Gegenuhrzeigersinn, die Randteilchen jedoch effektiv im
Uhrzeigersinn bewegen. Beide Beiträge kompensieren sich exakt.
Der Diamagnetismus ist tatsächlich ein quantenmechanisches Phänomen, d.h.
proportional zu h̄, und wurde erstmalig von Landau für ein ideales Fermigas
behandelt (Landauscher Diamagnetismus). Dies soll in den Übungen nachvollzogen werden. Eine extreme Form des Diamagnetismus zeigen Supraleiter
(siehe Festkörper-Physik, -Theorie): hier wird durch die induzierte Magnetisierung das äußere Feld vollständig kompensiert.
Paramagnetismus
Wir diskutieren hier den Einfluß des Zeeman-Terms auf unabhängige Spins
(klassisches Gas paramagnetischer Moleküle; Festkörper: lokalisierte Spins
an Gitterplätzen des Kristalls und ohne gegenseitige Wechselwirkung.) Jedes
Molekül bzw. Ion habe einen Gesamtdrehimpuls h̄J mit ganz- oder halbzah~ des Drehimpulses h̄S z kann
ligem J. Die z-Komponente (Projektion auf B)
die Eigenwerte −J, −(J − 1), ..., J − 1, +J in Einheiten von h̄ annehmen, die
zugehörigen Eigenwerte des Hamiltonoperators
H=−
N
X
gµB Siz B,
(3.170)
i=1
sind damit äquidistant verteilt. Die Zustandssumme ist leicht zu berechnen,
" J
#
N
X PN βgµ S z B Y
X
z
−βH
βgµ
S
B
B i
B
Z = Sp e
=
=
e i=1
e
(3.171)
{Siz }
i=1
S z =−J
Thermodynamik und Statistische Physik
=
"
J
X
e
βgµB S z B
S z =−J
#N
"
sinh 2J+1
2J y
=
y
sinh 2J
#N
,
97
y = βgµB JB,
wobei nur eine “endliche geometrische Reihe” beherrscht werden mußte
J
X
j=−J
zj =
z (2J+1)/2 − z −(2J+1)/2
,
z 1/2 − z −1/2
z = eβgµB B .
Es folgt direkt das thermodynamische Potential
#
"
sinh 2J+1
N
2J y
,
Φ(T, B) = − ln
y
β
sinh 2J
(3.172)
(3.173)
sowie die Magnetisierung
M =−
N
X
∂Φ
gµB Siz i = N gµB J · BJ (y),
=h
∂B
i=1
(3.174)
wobei die “Brillouin-Funktion” BJ (y) definiert ist durch
BJ (y) =
2J + 1
1
y
2J + 1
coth
y−
coth
.
2J
2J
2J
2J
(3.175)
Die Brillouin-Funktion ist ungerade, mit coth x = 1/x + x/3 + O(x3 ) folgen
die Eigenschaften
BJ (y) =
J +1
y + O(y 3 ),
3J
BJ (∞) = 1,
B1/2 (y) = 2 coth 2y − coth y =
1
B∞ (y) = coth y − ,
y
2(cosh2 y + sinh2 y) cosh y
−
= tanh y,
2 sinh y cosh y
sinh y
(3.176)
mit einer schwachen Abhängigkeit von J.
1
B1/2
B00
T gross
B klein
1
B gross
T klein
y
Die Funktion B∞ entspricht dem Fall unendlich vieler Spineinstellungen, d.h.
dem Fall eines klassischen Spins. Die Funktion B∞ heißt auch LangevinFunktion.
98
A. Klümper
Für die Suszeptibilität unabhängiger Spins erhält man
χ = N (gµB J)2 β · BJ′ (y),
(3.177)
speziell für den Fall der Nullfeld-Suszeptibilität (B = 0)
χ(T, B = 0) = N (gµB )2
J(J + 1)
.
3kB T
(3.178)
Diese Curie-Suszeptibilität wird bei kleinen Temperaturen beliebig groß, reflektiert also die beliebig leichte Ausrichtbarkeit der Spins. Bei hohen Temperaturen geht χ gegen 0, da thermische Unordnung der Ausrichtung entgegen
wirkt.
Eine Besonderheit von Spin-Systemen ist die Beschränktheit ihrer HamiltonOperatoren nach unten und oben. Für den Fall unabhängiger Spins ist das
Spektrum sogar symmetrisch mit Minimum −E0 und Maximum +E0 , wobei
E0 = N gµB JB. Für Temperatur T ist der Erwartungswert der Energie E
N
X
gµB Siz Bi |{z}
= −M B.
E = hHi = −h
i=1
(3.179)
(3.174)
Die Energie wächst also von −E0 bei T = 0 bis E = 0 bei T = ∞. Positive Werte werden nicht erreicht, es sei denn die Temperatur nimmt negative
Werte an T < 0, für die die Thermodynamik wohldefiniert ist, d.h. Zustandssumme etc. existieren.
relative Niveaubesetzung:
exp(−β E)
T>0
T<0
1
−E
0
T=00
+E
E
Eine Vorzeichenumkehr von T entspricht einer Vorzeichenumkehr von H, und
dies im Fall eines wechselwirkungsfreien Systems einer Vorzeichenumkehr des
Magnetfeldes. Ein thermodynamischer Zustand mit T < 0 läßt sich folglich
erreichen, wenn ausgehend von T > 0 das Magnetfeld schnell umgekehrt
wird bei Beibehaltung der Verteilung der Zustände. Diese Idee wurde erstmals 1951 mit den Kernspins von LiF erfolgreich durchgeführt. Dieser T < 0
Zustand blieb dank der langen Relaxationszeiten der Kernspins für einige
Zeit erhalten.
Thermodynamik und Statistische Physik
99
Pauli-Paramagnetismus
Für die meisten realen Systeme ist statistische Unabhängigkeit der Spins nicht
gegeben. Wir betrachten hier den Fall eines wechselwirkungsfreien Systems,
konkret ein ideales Elektrongas mit der Einteilchen-Energie
E(p, s) =
p2
− gµB B · s,
2m
(s = ±1/2).
(3.180)
Wir betrachten zunächst den Fall T = 0, d.h. den Grundzustand (für B > 0).
Aufgrund des Pauliverbotes können wir nicht einfach alle Teilchen in den
Einteilchen-Zustand mit p = 0 und s = +1/2 setzen. Wir müssen vielmehr
nach und nach höhere p-Werte besetzen. Die zugehörigen Energien werden
bald größer sein als die niedrigsten für s = −1/2. (Im obigen Fall “Paramagnetismus unabhängiger Spins” gab es zwar ein Analogon zu der Quantenzahl p, die Einteilchenenergie war jedoch unabhängig von (entartet in) dieser
Quantenzahl.)
E
s=−1/2
B>0
s=+1/2
s=−1/2
B=0
Fermi−Kugeln
p
B=0
s=+1/2
B>0
Wir sehen also, daß es für B > 0 zwei Fermi-Kugeln zu Spin s = +1/2 und
−1/2 gibt mit (natürlich) gleicher Fermi-Energie, aber verschiedenen FermiImpulsen pF (s = −1/2, B) < pF (B = 0) < pF (s = +1/2, B). Die Summe
der besetzten Einteilchen-Zustände für s = ±1/2 ergibt die Teilchenzahl, die
Differenz die Magnetisierung. Im Gegensatz zu obigem Fall haben wir hier
keine vollständige Polarisierung, sondern nur einen gewissen Überschuß an
s = +1/2 Elektronen.
Die Eigenschaften bei T > 0 lassen sich mit dem bereitgestellten Werkzeug (“ideales Fermi-Gas”) bestimmen. Hier muß lediglich beachtet werden, daß das großkanonische Potential mit zwei verschiedenen EinteilchenDispersionen bestimmt werden muß. Im bisherigen Fall (B = 0) lief die Existenz zweier Spinrichtungen auf einen Entartungsfaktor 2 hinaus.
Wechselwirkende Spins
100
A. Klümper
Auch Spins, die in Festkörpern auf Ionen oder Atomen lokalisiert sind, können
in aller Regel nicht als unabhängig voneinander angesehen werden. Zusätzlich
zu (3.170) gibt es einen Wechselwirkungsterm, der oft in der Form
N
~1 , ..., S
~N ) = −
W (S
1 X X αβ α β
Jij Si Sj ,
2 i,j
(3.181)
α,β
angesetzt wird. Hier bezeichnen i, j Gitterplätze und α, β die Komponenten
~ wobei der Gesamtspin halb- oder ganz-zahligen Werte
der Spin-Vektoren S,
annimmt, und die Komponenten die Drehimpuls-Algebra zu erfüllen haben.
Der Hamiltonoperator stellt also ein respektables quantenmechanisches Diaαβ
gonalisierungsproblem dar. Jij
ist die jeweilige Wechselwirkungsstärke, die
nicht so sehr auf magnetischer Dipol-Dipol-Wechselwirkung beruht, sondern
als “Austausch-Wechselwirkung” elektrostatischer Natur ist. In der Quantenmechanik haben Sie ein Zwei-Kern–Zwei-Elektron–System kennengelernt,
für welches sich in Abwesenheit der Elektron-Elektron-Wechselwirkung der
Grundzustand 4-fach entartet ist. Bei Anwesenheit der Coulomb-Abstoßung
spalten diese Niveaus auf in ein höherliegendes Triplett und ein niedrigerliegendes Singlett. Diese Aufspaltung wird durch eine effektive Spin-SpinWechselwirkung modelliert, die aus einem Wechselspiel von Coulomb-Wechselwirkung und dem Pauli-Verbot herrührt.
Wir wollen nun nicht genauer den Geltungsbereich der konkreten Form der
Wechselwirkung W , wie in (3.181) angesetzt, besprechen. Es sei kurz bemerkt, daß grundsätzlich höhere Ordnungs-Terme (biquadratisch,..) auftreten können, aber auch Drei-Spin-Terme etc.
Zwei wichtige Spezialfälle werden auch heute noch intensiv untersucht. Das
isotrope Heisenberg-Modell (α = β) ist
N
W =−
1X
~i S
~j .
Jij S
2 i,j
(3.182)
Hier haben wir volle SU (2)-Symmetrie, aber es treten wie im allgemeinen Fall
nichtkommutierende Terme auf. Das Spektrum ist schwierig zu berechen. Im
Falle der Nächst-Nachbar-Wechselwirkung sind die niedrigliegenden Anregungen teilchenartig mit elementarer Energie-Impuls-Dispersion E(p) ≃ p2
(ferromagnetisches Vorzeichen) und E(p) ≃ p (antiferromagnetisches Vorzeichen), in beiden Fällen lückenlos. (Es gibt “Ausnahmen”!) Bei tiefen Temperaturen erwarten wir eine spezifische Wärme, die algebraisch von T abhängt,
wie etwa bei Photonen, Phononen etc.
Im extrem anisotropen Fall (α = β = z) sprechen wir vom Ising-Modell,
das höchstens noch diskrete Symmetrien besitzt, aber ein klassisches Modell
ist (im Sinne des Kommutierens aller Einzelterme in H):
Thermodynamik und Statistische Physik
101
N
W =−
1X
Jij Siz Sjz .
2 i,j
(3.183)
Hier ist das Spektrum einfach zu bestimmen; es ist diskret, insbesondere ist
der Grundzustand durch eine Lücke ∆ vom Rest des Spektrums getrennt.
Daher erwarten wir bei tiefen Temperaturen ein thermisch aktiviertes Verhalten, z.B. C(T ) ≃ exp(−∆/kB T ).
Die Eigenschaften des isotropen Heisenberg-Modells und des Ising-Modells
bei endlicher Temperatur unterscheiden sich. Wir haben typischerweise Übergänge von einer ungeordneten Hochtemperatur-Phase zu einer geordneten
Tieftemperatur-Phase bei endlicher Temperatur Tc > 0, wenn im isotropen
Fall die Raumdimension d ≥ 3 und im Isingfall d ≥ 2 ist. Exakte Lösungen
sind im wesentlichen nur für das Isingmodell bekannt mit d = 1 (T , B beliebig), und d = 2 (T beliebig, B = 0) nach Onsager 1944.
102
4
4.1
A. Klümper
Phasenübergänge und kritische Systeme
Vorüberlegungen
Wir wollen uns nun mit den schon früher besprochenen Phasenübergängen intensiver beschäftigen. Dazu gehören der Gas-Flüssig-Übergang (s. Abschnitt 2.1),
oder auch magnetische Phasenübergänge wie im letzten Kapitel angesprochen, und viele weitere.
Das (p, T )-Phasendiagramm wie in Abschnitt 2.1 benutzt und analog andere
Phasendiagramme zu intensiven Variablen haben den Nachteil, daß sie den
Sprung in der Entropie und Volumen nicht erkennen lassen. Man benutzt zur
Verdeutlichung dieser Größen ein (T, S) oder (p, V ) Diagramm.
p
Isotherme (T const.)
T= Tc
T>Tc
kritischer
Punkt
T<Tc
Phasen−
gemisch
Vfl
V
Vg
Hier sind drei Isothermen eingezeichnet für T > Tc , T = Tc und T < Tc . Im
letzteren Fall durchläuft die Isotherme einen Bereich mit Phasenkoexistenz.
Hier wird der Anteil der betrachteten Substanz nach und nach von der einen
in die andere Phase umgewandelt, wobei sich das Volumen und die Entropie
ändern, aber der Druck konstant bleibt. Aus p = p(V ) ergibt sich auch die
Volumenabhängigkeit der freien Energie. Wegen
Z V
∂F
p(V ′ )dV ′ , alles bei T const., (4.1)
= −p, F (V ) − F (V0 ) = −
∂V
V0
hat F (V ) zwischen Vf l und Vg , wo p = const., ein Segment linearen Verlaufes.
F(V)
Vfl
G(p)
Vg V0
Achsenabschnitt
=G0
Steigung
=−p0
V
p0 p(T)
p
Aus F = F (V ) ergibt sich die freie Enthalpie G = G(p) = F + pV mit
∂F
p = − ∂V
, d.h. durch Legendre-Transformation. Praktisch wird diese Transformation so durchgeführt, daß bei einem Wert V0 die Sekante an den Graphen von F (V ) gebildet wird, die (negative) Steigung definiert den Druck
Thermodynamik und Statistische Physik
103
p0 , der Ordinatenabschnitt definiert G0 (d.h. G für Druck p0 ). Alle Paare
(p0 , G0 ) definieren die Funktion G = G(p). Beachte, daß dem linearen Segment von F = F (V ) ein Sprung in der ersten Ableitung von G = G(p)
entspricht (wie sieht man dies anhand der graphischen Konstruktion?). Der
singuläre Punkt liegt bei dem Druck p(T ), wobei p(...) die Koexistenzlinie im
(p, T )-Diagramm bezeichnet.
Die Legendre-Transformation kann umgekehrt werden. Die Funktionen p(V ),
F (V ), und G(p) (alle bei derselben festen Temperatur T ) enthalten identische
Information über das physikalische System und den Phasenübergang. Man
beachte ferner, daß Größen wie
cp , κT , α = ∞,
im Phasengemisch,
(4.2)
da hier beispielsweise cp = ∆Q/∆T , wobei ∆Q die Wärmemenge ist die bei
Temperaturänderung ∆T bei festem Druck (intensive Variable!) aufzuwenden
ist, wir allerdings wissen, daß wir ∆Q =endlich haben mit ∆T = 0! Analog
erfolgt die Begründung der anderen Größen. Anders sieht es aus, wenn wir
Wärmekapazitäten etc. bei Konstanz von extensiven Variablen betrachten.
Es gilt
cV , κS endlich im Phasengemisch.
(4.3)
In obigen Figuren waren F (V ) konvex und G(p) konkav. Wir hatten diese
Eigenschaft schon lokal gewonnen, da die zweite Ableitung von F nach V
positiv ist
∂2F
∂2F
≥
0,
≤ 0.
(4.4)
∂V 2
∂T 2
Konkavität von G(p) folgt gemäß allgemeiner Eigenschaften der LegendreTransformation. Es gilt übrigens ganz allgemein, daß thermodynamische Potentiale konvex/konkav sind bezüglich ihrer (natürlichen) extensiven/intensiven Variablen. Zum Aspekt der globalen Konvexität von F (V ) kommen wir
noch zurück.
4.2
Van-der-Waals-Modell für Phasenübergänge
Wir nutzen hier unser Ergebnis für die Virialentwicklung (3.153) harter Kugeln mit attraktiver Wechselwirkung (3.160,3.161)
p = nkB T [1 + b(T ) n + c(T ) n2 + O(n3 )],
|{z}
|{z}
=b− k a T
B
2
=c
⇔ p + an = nkB T [1 + bn + cn2 + ...],
(4.5)
wobei b das vierfache Eigenvolumen der harten Kugeln ist und a ein gewisses
Integral über die 2-Teilchen-Wechselwirkung. Wir können die rechte Seite in
gleicher Ordnung in n (c haben wir nicht bestimmt) umschreiben zu
104
A. Klümper
p + an2 =
nkB T
.
1 − bn
(4.6)
Dies wollen wir konsequent diskutieren. Die “physikalische” Rechtfertigung,
also über das formale Argument hinausgehend, ist, daß (4.6) auch einige
höhere Ordnungsbeiträge mitberücksichtigt, die in (4.5) unbestimmt geblieben sind. So kann (4.6) äquivalent geschrieben werden als
p + an2 =
N kB T
,
V − bN
(4.7)
was sich aus der idealen Gasgleichung ergibt, wenn dort V durch das effektive
den Teilchen zur Verfügung stehende Volumen = V -ausgeschlossenes Volumen = V − N b ersetzt wird und p durch den effektiven, im Gas wirkenden
Druck p + an2 ersetzt wird (der an den Behälterwänden gemessene Druck
p ist um an2 kleiner, da die Randteilchen eine nach innen wirkende Kraft
verspüren).
Wir wollen keine wirklich ernsthafte Begründung zu (4.6) liefern, da diese
Gleichung tatsächlich nur eine Approximation ist und in gewissenen Bereichen des Phasendiagramms falsch ist (aber in geeigneter Weise korrigiert
werden kann).
Wir diskutieren nun (4.6)
p=
a
kB T
− ,
v − b v2
v=
1
= spezifisches Volumen,
n
(4.8)
Bei hinreichend hohen Temperaturen T ist p = p(V ) streng monoton fallend,
wie im Fall T > Tc des (p, V )-Phasendiagramms des letzten Abschnitts. Es
gibt auch eine kritische Temperatur Tc , bei der die Isotherme p = p(V ) einen
horizontalen Wendepunkt besitzt
∂2p
∂p
=
= 0.
∂V
∂V 2
(4.9)
Mit (4.8) folgen die Bestimmungsgleichungen
0=
kB T
2a
− 3,
2
(v − b)
v
0=
2kB T
6a
− 4,
3
(v − b)
v
(4.10)
mit der Lösung
vkrit = 3b,
kB Tkrit =
8 a
a
→ pkrit =
,
27 b
27b2
(4.11)
mit dem universellen Verhältnis
pkrit vkrit
3
= ,
kB Tkrit
8
(4.12)
Thermodynamik und Statistische Physik
105
in das nur meßbare Größen eingehen. Angesichts der einfachen Näherung, die
zu diesem Ergebnis geführt hat, ist der Vergleich mit experimentellen Daten
zu Gasen sphärischer Moleküle erstaunlich gut.
Für T < Tkrit ergibt sich nun leider nicht wie im letzten Abschnitt ein Plateau, sondern ein nichtmonotones Verhalten (einfache rationale Funktionen
“können nicht anders”).
p
D
A
p
E
C
0
B
v
Da allgemein κT = − V1
³
∂V
∂p
´
T
> 0, müssen wir schließen, daß (4.8) nicht
nur nicht das gewünschte Verhalten liefert, sondern sogar falsch ist (zwischen B und D). Da im Koexistenzbereich der Druck unabhängig vom Volumen ist, wollen wir die Kurve durch eine geeignete Horizontale mit einem
zu bestimmenden Wert p0 korrigieren. Dies erfolgt mit Hilfe der MaxwellKonstruktion.
Für die Koexistenzbedingung haben wir µfl (T, p) = µg (T, p). Aus F = −pV +
µN folgt pV = µN −F . Wegen µfl (T, p) = µg (T, p) und p = p0 = const. haben
wir
p0 (Vg − Vfl ) = Ffl − Fg
=
|{z}
auch mit unphys. F
−
Z
Vg
Vfl
µ
∂F
∂V
¶
T
dV =
Z
Vg
p(V )dV.
Vfl
(4.13)
Diese Bedingung fixiert p0 , Vfl , Vg , und kann geometrisch interpretiert werden
als Gleichheit der Flächen die zwischen p = p(V ) und p0 liegen von A bis C
und C bis E.
Fazit: die van-der-Waals-Gleichung plus Maxwell-Konstruktion liefert ein qualitativ richtiges Verhalten für den Phasenübergang.
Bemerkung: : Manchmal werden die Zweige A−B und D−E als metastabile Zustände, d.h. überhitzte Flüssigkeit und unterkühltes Gas, interpretiert.
Bei Gelegenheit wollen wir mehr dazu sagen.
106
4.3
A. Klümper
Ising-Modell in Molekularfeld-Näherung
Wir hatten im letzten Kapitel wechselwirkende Spins betrachtet. Das Isingmodell berücksichtigt allein Wechselwirkung der z-Komponenten der Spinvektoren, ist also rein klassisch mit Hamilton-Operator bzw. -Funktion nach
(3.170,3.183)
N
N
X
1X
z z
gµB Siz B.
(4.14)
Jij Si Sj −
H=−
2 i,j
i=1
Für im wesentlichen positive Kopplungen Jij wird bei tiefen Temperaturen
eine parallele Ausrichtung der Spins bevorzugt, d.h. der Grundzustand ist
vollpolarisiert auch wenn B = 0. Dieser Zustand ist jedoch nicht eindeutig,
sondern zweifach entartet. Damit haben wir spontane Magnetisierung (Ferromagnetismus). Das Vorzeichen der spontanen Magnetisierung ist offen bzw.
durch das Vorzeichen des infinitesimalen Feldes bestimmt. Bei hohen Temperaturen gewinnt die Entropie, d.h. thermische Unordnung erzwingt M = 0
(Paramagnetismus). Wir haben also einen Phasenübergang 1. Ordnung bei
T < Tc und B = 0, und 2. Ordnung bei T = Tc und B = 0. Für T > Tc und
auch sonst weg von der Achse B = 0 ist die Abhängigkeit aller physikalischen
Größen von T und B analytisch.
B
M T< Tc
2. Ordnung
+MS
T
Tc
1. Ordnung
T< Tc
T> Tc
−MS
B
keine
Singularitaet
T> Tc
Wir wollen diesen Hamiltonoperator umschreiben, wobei wir benutzen Jii = 0
H=−
N
X
i=1
N
(gµB B +
1X
Jij Sjz )Siz ,
2 j=1
(4.15)
dies sieht so aus, als ob auf den i-ten Spin ein zusätzliches “Magnetfeld” wirkt,
das von den anderen Spins hervorgerufen wird. Nach Weiss kann der exakte
Zusatzterm näherungsweise durch ein mittleres Zusatzfeld ersetzt werden
N
N
X
1X
Jij hSjz i,
Jij Sjz →
2 j=1
j=1
(4.16)
Zu beachten ist, daß in der Ersetzung der Faktor 21 fallengelassen wurde,
da jeder Platz i in der Doppelsumme (4.15) zweimal vorkommt bzw. alle
Terme, die ein Siz enthalten, genau zweimal den Zusatzterm wie links in
Thermodynamik und Statistische Physik
107
(4.16) ergeben. Alternativ kann dies verstanden werden als Vernachlässigung
von Fluktuationen bzw. Korrelationen
Si · Sj = Si · hSj i + hSi i · Sj − hSi i · hSj i + (Si − hSi i) · (Sj − hSj i) . (4.17)
{z
}
|
Fluktuation →0
Mit den Abkürzungen
I0 =
N
X
Jij ,
(4.18)
j=1
unabhängig von i wegen Translationsinvarianz etc.,
Θ :=
I0 J 2
,
kB
b :=
gµB B
,
JI0
m :=
hSjz i
M
=
,
gµB JN
J
(4.19)
wobei J der Gesamt-Drehimpuls (-Spin) ist, bekommen wir auf der rechten
Seite von (3.174) die Ersetzung gµB B → gµB B + I0 hS z i bzw.
b → b + m,
(4.20)
und damit statt (3.174)
m = BJ
µ
¶
Θ
(m + b) .
T
(4.21)
Wir können uns schnell graphisch von der Lösbarkeit dieser Gleichung ein
Bild machen.
m
1
T<Tc
BJ( θ m)
T
T>Tc
m
Für T > Tc := J+1
3J Θ (=Curie-Temperatur) bleibt für b = 0 nur die Lösung
m = 0 (Paramagnetismus). Für T < Tc gibt es zusätzlich zu m = 0 auch
noch eine Lösung mS (T /Θ) > 0. Diese Lösung bedeutet spontane Magnetisierung, d.h. Magnetisierung ohne ein dies erzwingendes Magnetfeld. Diese
Lösung korrespondiert zu einer ferromagnetischen Phase (wir hatten stillschweigend I0 > 0 angenommen, für I0 < 0 hätten wir antiferromagnetische
Ordnung erhalten).
Die Idee des mittleren Feldes, oder auch Molekularfeld oder auch Methode
des selbstkonsistenten Feldes, war äußerst wichtig für das grundsätzliche
Verständnis von Phasenübergängen. Wir werden jedoch weitere Fragen stellen, insbesondere nach der Gültigkeit der Molekularfeldnäherung. Im nächsten
108
A. Klümper
Abschnitt wollen wir untersuchen, ob die nichttriviale Lösung mit mS 6= 0
tatsächlich die thermodynamisch stabile ist. Außerdem wollen wir in der Nähe
der kritischen Temperatur Θ die Singularitäten (2. Ordnung) näher untersuchen. Hier wollen wir kurz festhalten, daß für T < Θ ein Phasenübergang 1.
Ordnung stattfindet bei B = 0: es gibt einen Sprung in der Magnetisierung
von +mS zu −mS beim Wechsel von B = 0+ zu B = 0−.
4.4
Bogoliubov’sches Variationsprinzip
In der (groß-) kanonischen Gesamtheit ist die freie Energie gegeben durch
¶¸
· µ
1
1
−βH
(4.22)
F = − ln Sp e
= Sp ρ̂k H + ln ρ̂k ,
β
β
da ρ̂k = exp(−βH)/Sp exp(−βH). Dieses F ergibt sich aus der Minimierung
des Funktionals F [ρ̂] über alle DO ρ̂, wobei
· µ
¶¸
1
F [ρ̂] = Sp ρ̂ H + ln ρ̂ ,
(4.23)
β
bei fest vorgegebenen H und T . Mit anderen Worten
F [ρ̂] ≥ F [ρ̂k ] = F.
(4.24)
Gleichheit bzw. das Minimum wird natürlich für ρ̂ = ρ̂k erreicht.
Beweis: Wir hatten schon die allgemeine Ungleichung (1.119)
Sp ρ ln ρ ≥ Sp ρ ln ρ̄
(4.25)
kennengelernt. Es folgt mit ρ = ρ̂ und ρ̄ = ρ̂k
· µ
¶¸
1
1
F [ρ̂] = Sp ρ̂ H + ln ρ̂
= Sp [ρ̂H] + Sp [ρ̂ ln ρ̂)]
β
β
1
1
≥ Sp [ρ̂H] + Sp [ρ̂ ln ρ̂k ] = Sp [ρ̂H] + Sp [ρ̂(−βH − ln Z)]
β
β
1
= − ln Z = F.
(4.26)
β
Die meisten Anwendungen dieses Variationsprinzips setzen den approximativen DO in der Form
e−βHx
,
(4.27)
ρ̂ = ρ̂x =
Sp e−βHx
an mit einem häufig korrelationsfreien Hamiltonoperator, der jedoch noch
einen Variationsparameter x besitzt. Hier berechnet sich F [ρ̂] zu
Thermodynamik und Statistische Physik
· µ
¶¸
1
F [ρ̂x ] = Sp ρ̂ H − Hx + Hx + ln ρ̂x
= hH − Hx ix + FHx ,
β
109
(4.28)
wobei h...ix Mittelung mit ρ̂x bezeichnet und FHx ganz einfach die freie Energie von Hx bei Temperatur T ist. Die Minimierung lautet natürlich
∂
Fx = 0,
∂x
(4.29)
die Methode ist auch als Hartree-Fock-Verfahren bekannt.
Beispiel: Ising-Modell
Wir wählen
Hx = −
und erhalten
N
X
(gµB B + x)Siz ,
N
X
∂Hx
Siz ,
=−
∂x
i=1
sowie
(4.30)
i=1
¡ x −βH ¢
¶
µ
x
Sp ∂H
1
∂
∂FHx
−βHx
∂x e
=
− ln Sp e
,
=
−βH
x
)
∂x
∂x
β
Sp (e
X
∂Hx
ix = −
hSiz ix = −N hS z ix
=h
∂x
i
Nach Definition von H (4.14) und Hx (4.30) gilt


N
X
X
1
Siz x −
H − Hx =
Jij Sjz  .
2
i=1
j
(4.31)
(4.32)
(4.33)
Der Erwartungswert bezüglich ρx berechnet sich nun einfach, da ρx korrelationsfrei ist. Mit
hSiz Sjz ix = hSiz ix hSiz ix = hS z i2x ,
(4.34)
folgt direkt
hH − Hx ix = −
X
NX
1X
Jij hS z i2x + x
Jij hS z i2x + N xhS z ix ,
hS z ix = −
2 i,j
2
j
j
(4.35)
und auch
F [ρ̂x ] = −
NX
Jij hS z i2x + N xhS z ix + FHx .
2 j
Jetzt leiten wir F [ρ̂x ] nach x ab
(4.36)
110
A. Klümper
∂
∂
F [ρ̂x ] =
(hH − Hx ix + FHx )
∂x
∂x
X
N
∂hS z ix
∂hS z ix
=−
+ N hS z ix + N x
− N hS z ix
Jij 2hS z ix
2 j
∂x
∂x


X
∂hS z ix
(4.37)
= N x −
Jij hS z ix 
∂x
j
{z
}
|
0=
=0
Also folgt
x=
X
j
Jij hS z ix = I0 JBJ (βJ(gµB B + x)).
(4.38)
Mit der Abkürzung (4.18) und (4.19) folgt aus der ersten Gleichung in (4.38)
x = I0 hS z ix = I0 Jm,
(4.39)
Dies in (4.38) eingesetzt liefert
2
m = BJ (βI0 J (b + m)) = BJ
µ
¶
Θ
(b + m) ,
T
(4.40)
also die frühere Selbstkonsistenzbeziehung (4.21). Die freie Energie in HartreeFock-Näherung (4.36) ist mit (4.38)
N
N
xhS z ix + FHx = I0 J 2 m2 + FHx
2"
2 (
)#
2J+1 Θ
(
(b
+
m))
sinh
1
2J
T
.
=N
I0 J 2 m2 − kB T ln
Θ
(b+m))
2
sinh T
F [ρ̂x ] =
(4.41)
2J
Bemerkung: weitere Anwendungen findet das Variationsprinzip in der BCSTheorie der Supraleitung zur Entkopplung von 2-Teilchen-Wechselwirkungen
(Bardeen-Cooper-Schrieffer).
Thermodynamische Stabilität, kritisches Verhalten
Wir wollen uns nun das Leben etwas erleichtern und den wichtigsten und
qualitativ repräsentativen Fall J = 1/2 näher vornehmen. Der Quotient der
hyperbolischen Funktionen in (4.41) vereinfacht sich zu einem cosh-Term und
mit den Abkürzungen
K :=
folgt aus
f :=
β
I0 ,
4
h :=
β
gµB B,
2
¸
·
1
F
= −kB T ln 2 cosh(Km + h) − Km2 ,
N
2
(4.42)
(4.43)
Thermodynamik und Statistische Physik
111
und die Selbstkonsistenzbeziehung (4.40)
m = tanh(Km + h)
(4.44)
für die Größe m.
In der Nähe des kritischen Punktes T = Tc , B = 0 sind m und h klein.
Entwickeln der Selbstkonsistenzgleichung liefert
1
m = Km + h − (Km + h)3 + ...
3
(4.45)
mit Lösungen für h = 0
m=
½
0,
¢1/2
¡
,
± 3 K−1
K3
T beliebig,
nur für T < Tc .
(4.46)
Die freie Energie für B = 0 hat die Entwicklung
f (T, B = 0) = −kB T {
ln[2 cosh(Km)]
|
{z
}
1
− Km2 }
2
2
1
=ln 2+ K2 m2 − 12
(Km)4 +...
= −kB T (ln 2 +
1 4 4
K m + ...),
12
(4.47)
wobei zuletzt (4.46) bzw. (K − 1)m = 13 (Km)3 benutzt wurde. Wir sehen
insbesondere, daß die nichttriviale Lösung den niedrigeren Wert für das freieEnergie-Funktional liefert.
Als nächstes betrachten wir die Nähe des kritischen Punktes. Hier zeigen die
physikalischen Observablen als Funktionen von T und B singuläres Verhalten,
das in führender Ordnung durch algebraische Funktionen mit charakteristischen, sog. kritischen Exponenten, beschrieben werden kann
2
∂ f
−α
c(T ) = −T ∂T
Wärmekapazität,
2 ≃ |T − Tc |
β
M (T ) ≃ (Tc − T ) ,
spontane Magnetisierung (T < Tc ),
−γ
(Nullfeld-) Suszeptibilität,
χ(T ) =¯ ∂M
∂B ≃ |T − Tc |
δ
Beziehung von Magnetisierung und Feld,
B ¯T =Tc ≃ M ,
wodurch die Exponenten α, β, γ, und δ definiert sind.
Die Ergebnisse der Molekularfeldnäherung sind
α = 0,
β = 1/2,
γ = 1,
δ = 3.
(4.48)
Zur Herleitung beachte man, daß in (4.47) mit (4.46) der Parameter K eine
analytische Funktion der Temperatur mit Ableitung ungleich 0 ist. Dies liefert
einen Sprung in c(T ), d.h. α = 0, und β = 1/2.
112
A. Klümper
M(T)
c(T)
β=1/2
α=0
Tc
T
Tc
T
Für γ und δ bemüht man (4.45) und leite ab nach B bzw. h (→ γ = 1). Für
T = Tc bzw. K = 1 liefert (4.45) den Wert δ = 3.
Die hier zitierten Ergebnisse sind unabhängig von der konkreten Form der
Wechselwirkung. Betrachten wir reguläre Gitter (Kristalle), mit Spins an den
Gitterplätzen und kurze Reichweite der Wechselwirkung, z.B. nur NächstNachbar-Wechselwirkung, so verbleibt neben der Wechselwirkungsstärke noch
die Dimension d des Gitters als nichttrivialer Parameter. Die Werte d =
1, 2, 3, ... entsprechen Ketten, Schichten, Volumen, ... . Im Gegensatz zu dem
Ergebnis der Molekularfeldtheorie (4.49) liefert die exakte Lösung des d = 2dimensionalen Ising-Modells nach Onsager (+Yang+...)
α = 0(log),
β = 1/8,
γ = 7/4,
δ = 15.
(4.49)
Hier bedeutet α = 0(log), daß die spezifische Wärme logarithmisch divergiert, also schwach
c(T)
α=0 (log)
Tc
T
Diese Ergebnisse besagen, daß die Molekularfeldtheorie zur Beschreibung
quantitativer Aspekte von Phasenübergängen versagt. Wir können jedoch
hoffen, daß qualitative Aussagen, z.B. über die Topologie des Phasendiagramms, verläßlich sind. Wir werden jedoch im nächsten Abschnitt erfahren,
daß auch dies nicht immer gesichert ist. Im Falle des d = 1-dimensionalen
Ising-Modells liefert die exakte Lösung eine einheitliche Phase für T > 0, d.h.
einen Phasenübergang bei Tc = 0, entgegen der Vorhersage der Molekularfeldtheorie mit endlichem Tc .
Thermodynamik und Statistische Physik
113
4.5 Eindimensionale klassische Systeme und TransfermatrixZugang
Transfermatrizen stellen eine ökonomische Verwaltung von Zustandssummen
dar. Die Beschreibung durch Transfermatrizen ist sinnvoll bei lokalen Wechselwirkungen. Die grundsätzliche Idee beginnt mit folgender Identifizierung:
Spinvariable
≡ Indizes,
lokale Boltzmann-Gewichte ≡ Matrixelemente,
Zustandssumme
= Summe von Produkten von Mattrixelementen,
= Matrix-Produkt.
Vollständig lösbar ist die Thermodynamik eindimensionaler klassischer Modelle.
Beispiel: 1d-Isingmodell mit Nächst-Nachbar-Wechselwirkung im äußeren
Magnetfeld
X
ZN =
e
alle {σ1 ,...,σN }
kurz: ~
σ
N
=
X
~
σ
=
K
P
hi,ji
σi σj +h
P
i
σi
P
+h
2 (σi +σi+1 )]
e| i=1 [Kσi σi+1
{z
}
Q Kσi σi+1 + h (σi +σi+1 )
i
e
2
(4.50)
=:τσi ,σi+1
wobei die 2 × 2-Matrix τ definiert wurde. Explizit erhalten wir für diese auch
Transfermatrix genannte Größe
µ K+h
¶
e
e−K
τ=
,
(4.51)
e−K eK−h
wobei Matrixindizes i = 1, 2 identifiziert wurden mit den Spinwerten +1, −1.
Wir erhalten nun im Falle periodischer Randbedingung (σN +1 = σ1 )
ZN =
X
alle {σ1 ,...,σN }
=
X
σ1
τσ1 ,σ2 · τσ2 ,σ3 · ... · τσN −1 ,σN ·
τσN ,σN +1
| {z }
=τσN ,σ1 (period.Rdbg.)
N
(τ · τ · ... · τ )σ1 ,σ1 = Sp τ .
(4.52)
Bemerkung:
– Summation über wiederholte Indizes wird zum Matrixprodukt,
– Periodische Randbedingung führt auf Spurbildung,
– die Symmetrisierung vor der Definition der Transfermatrix ist nicht nötig,
macht τ jedoch selbstadjungiert, was manchmal bequem ist.
114
A. Klümper
Die Zustandssumme ergibt sich nun aus den Eigenwerten λi von τ . Es seien
(λ1 , λ2 , ...) der Größe nach geordnet, d.h. |λ1 | ≥ |λ2 | ≥ ... . Es gilt


µ ¶N


λ2
N
N 
(4.53)
+ ..., 
ZN = λN
1 + λ2 + ... = λ1 1 +

λ1
|
{z
}
→0
wobei der Grenzprozeß stattfindet, wenn λ1 betraglich strikt größer ist als
alle anderen Eigenwerte. Dies ist tatsächlich für alle 1-d Systeme erfüllt. Wir
werden die Eigenwerte für das Isingmodell gleich angeben. Aus der letzten
Beziehung folgt im thermodynamischen Limes
f=
F
= −kB T ln λ1 .
N
(4.54)
Die Eigenwerte von (4.51) sind
i
h
p
λ1,2 = eK cosh h ± sinh2 h + e−4K .
(4.55)
Man sieht, daß der größte Eigenwert (tatsächlich beide) als Funktion der
Temperatur für alle T > 0 analytisch ist (die einzigen Singularitäten treten auf, wenn das Argument der Wurzelfunktion gleich 0 ist). Es gilt mittels
Perron-Frobenius-Theorem (hier nicht ausgeführt) für alle eindimensionalen
Systeme:
kein Phasenübergang bei T > 0!
Es gibt jedoch einen Phasenübergang bei T = 0 und B = 0
½
= 0, für T > 0,
lim M
6= 0, für T = 0,
B→0±
Magnetisierung
M
(4.56)
c(T) Waermekapazitaet
T=0
T>0
O(1/T2)
B
O(exp(−J/T))
T
Bemerkung: Für höherdimensionale Systeme geht die Zahl der Eigenwerte
der Transfermatrizen im thermodynamischen Limes gegen unendlich. Hier ist
sind die Mathematik und Physik reichhaltiger.
Korrelationsfunktionen im Transfermatrix-Zugang Seien Ari lokale
Operatoren, d.h. lokal-wirkende Operatoren. Beispielsweise haben wir Ari =
Thermodynamik und Statistische Physik
115
A(σri ) mit einer geeigneten Funktion A, im einfachsten Fall mit A(σri ) = σri .
Dann heißt
(4.57)
C(r1 , ..., rn ) := hAr1 · ... · Arn i,
Korrelationsfunktion oder auch n-Punkt-Funktion. Konkret ist
C(r1 , r2 ) := hσr1 σr2 i,
(4.58)
die Spin-Spin-Korrelationsfunktion. Wir wollen die Bedeutung von Korrelationsfunktionen anhand dieses Beispiels erläutern. Offenbar mißt hσr1 σr2 i die
Wahrscheinlichkeit, daß σr2 in + (−) Richtung zeigt, unter der Bedingung,
daß auch σr1 in + (−) Richtung zeigt. In der paramagnetischen Hochtemperaturphase von magnetischen Systemen wird hσr1 σr2 i gegen 0 gehen, wenn
|r1 − r2 | → ∞. In der ferromagnetischen Tieftemperaturphase (sofern das
System ferromagnetisch ordnet) wird hσr1 σr2 i für |r1 − r2 | → ∞ gegen einen
endlichen Grenzwert gehen. Dieser Grenzwert ist hσr1 ihσr2 i = hσi2 , d.h. die
spontane Magnetisierung zum Quadrat. Man beachte folgenden feinen, aber
wichtigen Punkt. Die Größe hσi ist im obigen Sinne eine 1-Punkt-Funktion
und für B = 0 im strikten Sinne immer 0. Dies gilt sogar in der ferromagnetischen Phase wegen der Spinumkehr-Symmetrie des Hamiltooperators.
Wir meinen häufig in der ferromagnetischen Phase mit der Größe hσi den
Grenzwert limB→0+ hσi, dieser ist von 0 verschieden. Wenn wir die spontane
Magnetisierung oder langreichweitige Ordnung messen wollen, haben wir
entweder ein infinitesimales, symmetriebrechendes Feld anzulegen und
die 1-Punkt-Funktion zu untersuchen, oder aber wir untersuchen die 2-PunktFunktion bei B = 0, aber im Limes unendlicher Separierung der Aufpunkte
(d.h. |r1 − r2 | → ∞).
Wir wollen nun u.a. für das 1-d Isingmodell die 2-Punkt-Funktion
P
P
K
...
A
A
e
1
r+1
P
hA1 Ar+1 i = ~σ P
,
K
...
~
σe
(4.59)
berechnen. Mittels Transfermatrix
P
[A1 τσ1 ,σ2 τσ2 ,σ3 · ... · τσr ,σr+1 · Ar+1 · τσr+1 ,σr+2 ...]
P
hA1 Ar+1 i = ~σ
′
~
σ [ohne A s]
r
N −r
Sp [Aτ Aτ
]
,
(4.60)
=
Sp τ N
wobei A (diagonale) Matrizen sind mit Einträgen Aσ,σ′ = A(σ)δ(σ, σ ′ ).
Nun schieben wir zwei Darstellungen der Eins aus Eigenzuständen der Transfermatrix ein
X
1=
|ψi ihψi |,
(4.61)
i
116
A. Klümper
und erhalten
hA1 Ar+1 i
=
=
N →∞
=
P
N −r
r
Aτ N −r |ψi i
i hψi |Aτ A|ψi iλi
P
=
N
N
i hψi |τ |ψi i
i λi
X
−r
r
r
hψ1 |Aτ A|ψ1 iλ1 =
hψ1 |Aτ |ψj ihψj |A|ψ1 iλ−r
1
P
|Aτ
i hψ
Pi
X
j
r
2
|hψ1 |A|ψj i| ·
µ
j
λj
λ1
¶r
(4.62)
wobei u.a. benutzt wurde, daß im thermodynamischen Limes im Zähler wie
im Nenner der Term mit i = 1 dominiert. Dies liefert
µ ¶r
λ2
2
2
. (4.63)
+...
hA1 Ar+1 i = |hψ1 |A|ψ1 i| + |hψ1 |A|ψ2 i|
|{z}
λ1
fällt weg für Ising
Der erste Term beschreibt langreichweitige Ordnung (wenn von 0 verschieden), der zweite beschreibt den exponentiellen Abfall e−r/ξ mit Korrelationslänge
1
.
(4.64)
ξ=
ln λλ21
Für das 1-d Isingmodell ist für A(σ) = σ keine langreichweitige Ordnung
vorhanden, da in Standardbasis ψ1 = (1, 1), so daß der erste Term in (4.63)
gleich 0 ist. Generell ist für alle 1-d Modelle das Verhalten der Korrelationsfunktionen C(r1 , r2 ) bei |r1 − r2 | → ∞ rein exponentiell. In höheren Dimensionen haben wir allgemein eine Ornstein-Zernike-Form, d.h. ein gemischt
exponentiell-algebraisches Verhalten bei großen Anständen
C(r1 , r2 ) = const. +
e−r/ξ
.
rη′
(4.65)
Bemerkung:
– der größte Eigenwert liefert die freie Energie,
– der nächstführende Eigenwert liefert die Korrelationslänge (bei Entartung
mit größtem Eigenwert → Oberflächenspannung, hier nicht ausgeführt).
4.6
Monte-Carlo-Verfahren
Wir wollen uns nun die Frage stellen, wie durch numerische Verfahren thermodynamische Erwartungswerte berechnet werden können. Natürlich haben
wir hier zunächst wechselwirkende, klassische Modelle vor Augen. Das Paradebeispiel wird das 2-d Ising-Modell mit Nächst-Nachbar-Wechselwirkung J¯
(zunächst ohne Magnetfeld) sein mit Hamilton-”Operator”
Thermodynamik und Statistische Physik
H=−
N
X
1X
Jij Siz Sjz = J¯
σi σj ,
2 i,j
<i,j>
σi = ±1,
117
(4.66)
¯
also J<i,j> = 4J.
Alle thermodynamischen Mittelwerte sind Summen über die erlaubten Konfigurationen. Wir könnten auf Idee Nr. 0 kommen und numerisch alle Konfigurationen, die zugehörigen Energien, die Boltzmann-Gewichte und dann
Mittelwerte bestimmen. Wir überlegen uns aber schnell, daß bei einem System der linearen Ausdehnung L, insgesamt L×L Spins vorhanden sind, die je
2 Einstellrichtungen haben, also 2L·L Konfigurationen ermöglichen. M.a.W.:
der Rechenaufwand steigt exponentiell mit der Systemgröße angesichts unseres Bestrebens L → ∞ gehen zu lassen. Dies ist hoffnungslos!
Idee Nr. 1: wir würfeln einfach Zustände bzw. Konfigurationen aus. Dies kann
z.B. dadurch geschehen, daß wir einen von den L2 vielen Spins auswürfeln,
dann einen Spinflip durchführen und dies immer wieder und wieder durchführen. Für jede Konfiguration kann die Gesamtenergie bestimmt werden, der
Boltzmannfaktor etc. Wir wollen diese Idee nicht wesentlich weiterverfolgen,
da wir uns schnell klar werden, daß dieses “simple sampling” unabhängig von
der thermodynamischen Bedeutung der einzelnen Konfigurationen arbeitet,
d.h. viel Rechenzeit mit nichtrepräsentativen Zuständen verbringt, z.B. mit
den vielen Zuständen zu hoher Energie.
Idee Nr. 2: Wir wollen Konfigurationen nach ihrem Boltzmann-Gewicht auswürfeln (“importance sampling”). Dies geschieht im Metropolis-Algorithmus.
Wir wollen eine Reihe von Konfigurationen generieren (i1 , i2 , ...), wobei wir
mit einem (nahezu) beliebigen i1 starten und iterativ vorgehen, d.h. aus in
das in+1 erzeugen. Wir führen folgende 4 Schritte aus:
– Bestimme aus i = in durch Spinflip (s.o.) ein j. Dieses j sowie i selbst
sind Kandidaten für in+1 .
– Würfel eine Zufallszahl w ∈ [0, 1].
– Wenn w < e−β(Ej −Ei ) setze in+1 := j, sonst in+1 := i.
– Zurück zum ersten Schritt.
In der Sequenz (i1 , i2 , ...) taucht jeder Zustand i mit der Wahrscheinlichkeit
e−βEi /Z auf. Dies ist wie folgt einzusehen. Wir bezeichnen die Übergangswahrscheinlichkeit
von Zustand i zu j mit P (i → j), die von j zu i mit P (j → i). Sei nun o.B.d.A.
Ei ≤ Ej , dann gilt
118
A. Klümper
P (i → j) = e−β(Ej −Ei ) ,
P (j → i) = 1.
(4.67)
Hier wurde nur vorausgesetzt, daß der Spinflip (1. Schritt wie oben) in gleicher
Weise von i nach j führt wie umgekehrt. Die Exp-Faktoren ergaben sich aus
der Wahrscheinlichkeit der Annahme der neuen Konfiguration.
Also gilt
(4.68)
e−βEi P (i → j) = e−βEj P (j → i),
sogar für beliebige Größenverhältnisse von Ei und Ej . Wir können uns nun
die obige Sequenz (i1 , i2 , ...) so erzeugt denken, daß Übergänge zwischen den
einzelnen Zuständen stattfinden und ein dynamisches Gleichgewicht herrscht,
d.h. es gibt genausoviele Übergänge weg von i, wie zu i hin. Sei pi die Wahrscheinlichkeit für i, dann gilt
X
X
pi P (i → j) =
pj P (j → i).
(4.69)
j(6=i)
j(6=i)
Sei N die Anzahl der Zustände i, dann gibt es N homogene, lineare Gleichungen
P obiger Art. Bis auf einen Skalenfaktor, der sich aus der Normierung i pi = 1 ergibt, ist dieses Gleichungssystem eindeutig lösbar. (Es geht
tatsächlich noch die Bedingung ein, daß jeder Zustand, evtl. über Zwischenzustände, in jeden anderen übergehen kann; Ergodizität. Dies ist beim Spinflip gewährleistet.)
Wir können uns eine Lösung leicht verschaffen. Offenbar ist das globale
Gleichgewicht (4.69) erfüllt, wenn das detaillierte Gleichgewicht gilt
pi P (i → j) = pj P (j → i),
also folgt schon, daß pi e
tung pi = e−βEi /Z.
βEi
(4.70)
unabhängig von i ist und damit folgt die Behaup-
Wir wollen an einige Ergebnisse für das 2-d Ising-Modell erinnern:
ˆ die spezifische Wärme diver– nach Molekularfeldtheorie ist kB Tc = 4J,
giert nicht.
– exakte Lösung bzw. Kramers-Wannier-Dualität
sinh 2Kc = 1,
ˆ
K = β J,
(4.71)
hieraus folgt kB Tc = 2.269....
Wir lassen das Program “Ising” laufen und diskutieren die Monte-Carlo-Läufe
für verschiedene Systemgrößen. Siehe auch
http://www.ruph.cornell.edu/sss/sss.html
Spezielle Beachtung verdienen die Größen
Thermodynamik und Statistische Physik
119
– h(M − hM i)2 i, liefert Suszeptibilität,
– h(E − hEi)2 i, liefert Wärmekapazität.
4.7
Elementares zur Renormierungsgruppe (RG)
Die Monte-Carlo-Simulationen des letzten Abschnitts zeigten charakteristische Konfigurationen mit unterschiedlichem Verhalten bei T > Tc (“Domänen”
gleicher Ausrichtung der Spins mit endlichem Durchmesser), T = Tc (“Domänen” beliebig großer und kleiner Ausdehnung), T < Tc (“Domänen” makroskopischer Ausdehnung mit wenigen, endlichen Inseln entgegengesetzter
Ausrichtung). Da am kritischen Punkt Domänen beliebiger Größe existieren,
sieht jedes Bild auf beliebigen Längenskalen ähnlich aus. Dies ist oberhalb
und unterhalb des kritischen Punktes völlig anders. Führen wir in den Bildern typischer Konfigurationen eine Skalenänderung durch, im einfachsten
Fall durch extremes Dezimieren der Spins (4 → 1), so erhalten wir für T > Tc
Bilder mit nur halb so größen Domänen, d.h. wie im Falle einer Temperatur
höherer als T . Betrachten wir eine typische Konfiguration bei T < Tc , so
führt die genannte Dezimierung auf ein Bild mit makroskopischen Domänen
mit nur noch halb so großen Inseln entgegengesetzter Ausrichtung, d.h. wie
im Falle einer Temperatur niedriger als T .
In jedem Fall führt die Skalenänderung mit linearem Dezimierungsfaktor
b > 1 weg vom kritischen Punkt, außer bei Start exakt bei Tc . Die schon
eingeführte Korrelationslänge ξ entspricht dem mittleren Durchmesser von
“Domänen”.
Die genannten Beobachtungen legen folgende Frage nahe: Kann eine Skalenänderung exakt äquivalent zu einer Änderung der Temperatur und weiteren Wechselwirkungen sein?
“Äquivalent” soll hier heißen, daß Zustandssumme und Korrelationsfunktionen (soweit an den nicht-dezimierten Spins auswertbar) übereinstimmen. Wir
wollen ein einfaches Beispiel besprechen für welches die Antwort auf die obige
Frage “ja” lautet.
Beispiel: Eindimensionales Isingmodell mit Dezimierungsprozedur.
120
A. Klümper
Dezimierungsprozedur mit b=2
1
2
3
4
5
6
Summation ueber Spins an Plaetzen
1’
2’
3’
Wir wollen die Zustandssumme einer Kette mit N Spins betrachten und die
Summation über jeden zweiten Spin (b = 2) explizit durchführen.
P
P
P
1 X K j σj σj+1 +h j σj +C j 1
ZN = N
e
2 σ ,σ ,...
1
2
X
=
[P (σ1 , σ2 )P (σ2 , σ3 ) · ... · P (σN , σ1 )],
(4.72)
σ1 ,σ2 ,...
wobei der Faktor 1/2N und C aus Bequemlichkeitsgründen eingeführt wurden
und nur die Lage der Grundzustandsenergie betreffen; P (., .) ist definiert
durch
h
1
P (σi , σi+1 ) = eKσi σi+1 2 (σi +σi+1 )+C .
(4.73)
2
Die Summation über σ2 , σ4 , ... führt zu
X
′
ZN =
[P ′ (σ1 , σ3 )P (σ3 , σ5 ) · ... · P (σN −1 , σ1 )] = ZN/2
,
(4.74)
σ1 ,σ3 ,...
wobei
P ′ (σ1 , σ3 ) =
X
P (σ1 , σ2 )P (σ2 , σ3 ).
(4.75)
σ2 =±1
Man überlegt sich leicht, daß auch P ′ vom Ising-Typ ist [im wesentlichen
hat mit P auch P ′ die Symmetrie P (σ1 , σ2 ) = P (σ2 , σ1 ), also gibt es nur 3
verschiedene Funktionswerte, die für geeignete Änderung der 3 Parameter K,
h, C reproduziert werden]. Die renormierten Wechselwirkungsparameter K ′ ,
h′ , C ′ sind
′
cosh(2K + h) cosh(2K − h)
,
cosh2 h
cosh(2K + h)
= e2h
,
cosh(2K − h)
= e8C cosh(2K + h) cosh(2K − h) cosh2 h.
e4K =
′
e2h
e4C
′
Bei der hier nicht durchgeführten Rechnung wurde benutzt
(4.76)
Thermodynamik und Statistische Physik
′
′
P (+, +)
P (+, +)P (−, −)
, e2h =
,
P (+, −)P (−, +)
P (−, −)
= P (+, +)P (−, −)P (+, −)P (−, +).
121
e4K =
e4C
′
(4.77)
Wir haben mit der Abbildung (4.76) eine Realisierung von Renormierungsgruppen-Transformationen Rb gefunden mit den Eigenschaften
Rb : H → H,
(4.78)
wobei H der Raum der Wechselwirkungen bzw. Hamiltonfunktionen (hier
3-dim. für Ising-Kette, im allgemeinen ∞-dimensional, siehe unten) und
– b > 1 und R beschreibt eine Reduktion von N auf N ′ = N/bd viele
Freiheitsgrade (d= Raumdimension),
– Rb ist im thermodynamischen Limes wohldefiniert und differenzierbar,
– “Unitarität”; d.h. freie Energie pro Freiheitsgrad f [H] = b−d f [H ′ ]
′
′
Grund: ln ZN /N = b−d ln ZN
′ /N ,
– Korrelationslänge ξ ′ = ξ/b,
– Halbgruppeneigenschaft, Rb1 ◦ Rb2 = Rb1 b2 , für “erlaubte” Skalenfaktoren, (die Inverse existiert nicht!).
Unter dem Renormierungsgruppen-Fluß versteht man die Menge aller
Trajektorien, die sich durch wiederholtes Anwenden von Rb auf ein festes
Startelement ∈ H ergeben.
Beispiel: 1-d Isingmodell in geeigneten Variablen K, h
1−e−2h
B= ∞
Linie trivialer FP’s
1
T= ∞
0
1
e−2K
kritischer FP
In Raumdimensionen d > 1 treffen wir auf die Komplikation, daß im Gegensatz zu d = 1 H nicht endlichdimensional gewählt werden kann. Die RGProzedur generiert ausgehend von einfachen Nächst-Nachbar-Wechselwirkungen
(“Bond”-Wechselwirkung) unter anderem längerreichweitige Wechselwirkungen und Mehr-Spin-Wechselwirkungen. Dies wird anhand des Vergleiches von
d = 1 und d = 2 klar.
122
A. Klümper
Vergleich
d=2
d=1
Summation ueber
Zentralspin
11111111
00000000
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
"Bond"−Wechselwirkung
"Bond"− und
Plaquetten−Wechselwirkung
In den mathematischen Gründen ist der Unterschied wie folgt zu finden. Wir
hatten schon bei d = 1 gesehen, daß die renormierte Wechselwirkung für alle
4 verschiedenen Spin-Konfigurationen nur 3 unabhängige Boltzmanngewichte
liefert, was auf 3 Gleichungen für die 3 “Bond”-Wechselwirkungsparameter
hinausläuft und exakt lösbar ist. Für d = 2 gibt es 16 Spin-Konfigurationen
mit etwas weniger unabhängigen Boltzmanngewichten, aber deutlich mehr
als 3! Dies führt auf ein überbestimmtes Gleichungssystem, was typischerweise nicht lösbar ist.
Bemerkung: Es gibt jedoch in d = 2 Ausnahmefälle, bei denen “mysteriöserweise” keine Überbestimmung vorliegt (→ Integrabilität). Das feldfreie
Isingmodell kann als derartiges Beispiel angesehen werden.
Wir wollen hier nur noch bemerken, daß es verschiedene Näherungsverfahren
der Konstruktion von RG’s gibt. Allen diesen Verfahren ist gemeinsam, daß
mit einer endlichen Anzahl von Kopplungen gearbeitet wird. Beispiele von
Ortsraum-RG (“real space” RG) sind
Kumulanten-Verfahren,
Finite-Cluster,
(Ortsraum-RG’s
Migdal-Kadanoff,
b nimmt diskrete Werte an)
Monte-Carlo (→ präzise Exponenten).
Anstelle von Spin-Variablen mit Ortsindizes können wir in den Wechselwirkungen alternativ Spin-Variable mit Impulsindizes haben. Dies läßt sich immer durch eine Fourier-Transformation erreichen. Der Vorteil dieser Darstellung ist, daß Impulsindizes ein Kontinuum überstreichen. Wenn wir mit Spin-
Thermodynamik und Statistische Physik
123
Systemen auf einem regulären Gitter arbeiten, liegen die Impulse nicht nur
dicht, sondern ferner in einem kompakten geometrischen Objekt (BrillouinZone, = Quadrat beim Quadratgitter). Die Dezimierung wird nun geschickterweise über die Freiheitsgrade zu den größten Impulsen bzw. über den Rand
der Brillouin-Zone durchgeführt. Diese Verfahren sind sogenannte ImpulsraumRG bzw. feldtheoretische Verfahren mit b kontinuierlich und beliebig dicht
an b = 1. Beispiele sind
ǫ-Entwicklung,
(Impulsraum-RG’s, b bei 1)
Callan-Symanzik-Gleichung.
Wir wollen wegen der Kürze der verfügbaren Zeit uns nicht mit der Herleitung von RG’s beschäftigen. Stattdessen fragen wir uns, welche Eigenschaften
des physikalischen Systems aus welcher Information zu der RG folgen. Wir
wollen verstehen
Skalengesetze, (für kritische Exponenten)
Universalität, (Unabhängigkeit der Exp. von mikroskop. Details).
Die Wirkung einer RG-Transformation ist auf
– nichtkritische Systeme: ξ ′ = ξ/b < ξ, d.h. die fortgesetzte Anwendung
führt immer weiter weg vom kritischen Punkt,
– kritische Systeme: ξ ′ = ξ/b = ∞, bleibt kritisch.
Der Fluß der RG wird durch Fixpunkte regiert (FP), für die gilt
ξ ′ = ξ als auch ξ ′ = ξ/b
mit Lösung für ξ:
ξ = 0 (“Hochtemperatur”-FP) oder ξ = ∞ (kritischer FP)
Wir interessieren uns für die letzteren Fixpunkte. Wir formulieren die plausible Annahme: Der Raum H zerfällt in verschiedene Bereiche, die durch
verschiedene Fixpunkte regiert werden, d.h. die durch den RG-Fluß von diesen FP’s erreicht werden. Der Existenz von wenigen Fixpunkten entspricht
die Aussage der Universalität.
Wir wollen nun zeigen, daß die kritischen Eigenschaften der Systeme durch
die Eigenschaften der RG-Transformation in der Nähe der nichttrivialen FP’s
bestimmt sind. Sei H ∗ ein Fixpunkt und H = H ∗ + g · Q ein benachbartes
(gestörtes) System, wobei Q ∈ H die Störung und g die Kopplungsstärke ist;
g wird als kleiner (reeller) Parameter angesehen. Wir linearisieren nun Rb
bei H ∗ durch das Differential Lb
H ′ := Rb [H] = Rb [H ∗ + gQ] = Rb [H ∗ ] +g · Lb Q.
| {z }
=H ∗
Wir suchen nun nach Eigenvektoren Qj von Lb
(4.79)
124
A. Klümper
Lb Qj = Λj (b) · Qj ,
(4.80)
wobei Qj unabhängig von b ist, da Qj für alle Lb mit beliebigem b als simultaner Eigenzustand gewählt werden kann. Dies gilt wegen der Kommutativität
aller Lb
(4.81)
Lb1 ◦ Lb2 = Lb1 b2 = Lb2 ◦ Lb1 ,
insbesondere folgt für die b-Abhängigkeit der Eigenwerte
Λj (b1 )Λj (b2 ) = Λj (b1 b2 ) =⇒ Λj (b) = bλj ,
(4.82)
mit einem geeigneten λj . Wir können nun einen beliebigen Punkt H(∈ H)
nach dem vollständigen Satz Qj entwickeln
X
H = H∗ +
gj · Qj ,
(4.83)
j
wobei die Qj auch als Skalen-“Operatoren” und die gj als Skalenfelder bezeichnet werden.
Das Verhalten der freien Energie in der Nähe eines Fixpunktes nach l-maliger
Iteration der RG lautet
f (g1 , g2 , ...) = b−dl f (bλ1 l g1 , bλ2 l g2 , ...).
(4.84)
Wir beobachten unterschiedliches Verhalten je nach λj
– λj > 0: hier wächst gj beständig, der RG-Fluß trägt den Punkt vom
Fixpunkt weg: relevante Störung,
– λj < 0: hier schrumpft gj beständig, irrelevante Störung,
– λj = 0: marginale Störung
Beispiel: relevante Skalenfelder sind üblicherweise Temperatur und Magnetfeld bzw. die einheitenlosen Größen t := (T − Tc )/Tc ≡ g1 und h ≡ g2 .
Irrelevant sind üblicherweise symmetrieerhaltende Übernächste-Nachbar-Wechselwirkungen etc. (siehe Universalität). Im folgenden nehmen wir an λj < 0
für alle j > 2.
Herleitung der Skalengesetze Wir wählen l derart, daß bλ1 l = 1/t, d.h.
bl = t−1/λ1
´
³
gj
h
...
,
(4.85)
f (t, h, ...gj ...) = td/λ1 f 1, λ /λ , ...
λj /λ1
t 2 1
|t {z }
→0 fuer t→0
analog folgert man
Thermodynamik und Statistische Physik
f (t, h) = hd/λ2 f
µ
t
hλ1 /λ2
¶
,1 .
125
(4.86)
Durch entsprechend häufiges Ableiten nach t und h erhält man den Zusammenhang von kritischen Exponenten und den Eigenwerten der RG
d
,
λ1
d − λ2
β=
,
λ1
2λ2 − d
γ=
,
λ1
1
d − λ2
=
.
δ
λ2
2−α=
(4.87)
Wir wollen nun die kritischen Exponenten der Korrelationsfunktionen finden.
Dazu müssen wir die RG anwenden auf ein Modell mit räumlich inhomogenem
Feld h(r): homogen auf Längen ∆r >> 1, d.h. viel größer als mikroskopische
Längenskalen; Variation auf Längen r >> ∆r.
∆r
∆r
r
∆r
∆r
Transformierte Koordinaten r und Magnetfeld h
r′ = r/b,
h′ (r′ ) = bλ2 h(r).
(4.88)
Die (logarithmierte) Zustandssumme ln Z(= ln Z ′ ) zu Feld h(r) ist erzeugende Funktion der Zwei-Punkt-Funktion C(r, t) (mit Temperaturvariable t)
∂ ∂
ln Z
∂h0 ∂hr
∂ ∂
= b2λ2 ′
ln Z ′
∂h0 ∂h′r′
¶2d
µ
∆r
C(r′ , t′ )
= b2λ2
b
= b2(λ2 −d) (∆r)2d C(r/b, tbλ1 ).
(∆r)2d C(r, t) =
(4.89)
Es folgt direkt
C(r, t) = b2(λ2 −d) C(r/b, tbλ1 ).
(4.90)
126
A. Klümper
Durch Vergleich mit
e−r/ξ
e−r/ξ
bzw.
,
(4.91)
2x
r 2
rd−2+η
wobei die Exponenten des algebraischen Anteils definitionsmäßig mit x2 bzw.
η geschrieben wurden. Man erhält
C(r, t) =
1
,
λ1
x2 = d − λ2 bzw. d − 2 + η = 2(d − λ2 ).
(4.92)
P
Ganz allgemein ist jedes Qj (= r φj (r)) Summe von lokalen Termen, die
zugehörigen Korrelationsfunktionen hφj (0)φj (r)i können genauso behandelt
werden wie der Fall j = 2
ξ(t′ ) = bξ(t) =⇒ ξ(t) ∼ |t|−ν ,
Cj (r) = hφj (0)φj (r)i ∼
mit xj = d − λj .
1
,
r2xj
ν=
am kritischen Punkt,
(4.93)
Im üblichen Sprachgebrauch heißen C1 und C2 Energie-Energie- und SpinSpin-Korrelation.
Mit (4.87,4.92) haben wir die sogenannten Skalenrelationen gefunden
α, β, γ, δ, ν, η
↔
λ 1 , λ2
↔
x1 , x2 .
(4.94)
Der erste Satz Exponenten beschreibt das physikalische Verhalten des Systems bei Abweichungen vom kritischen Punkt, der zweite Satz Zahlen charakterisiert die Eigenwerte der RG, der dritte Satz Exponenten beschreibt
das Verhalten des Systems exakt am kritischen Punkt.
Eine mögliche Anwendung der Skalenrelationen kann wie folgt aussehen. Wir
sind beispielsweise an dem ersten Satz Exponenten interessiert, können aber
den zweiten (oder dritten) Satz einfacher berechnen. Eine weitere Anwendung
ist die Eliminierung der Größen λ1 und λ2 in (4.87), was von 6 Relationen
genau 4 übrig läßt. Diese Skalenrelationen im engeren Sinne sind
γ = ν(2 − η),
α + 2β + γ = 2,
γ = β(δ − 1),
νd = 2 − α, (“Hyperskalen-Relation”).
(4.95)
Wir wollen diese Relationen an Hand einiger wichtiger Modelle überprüfen
α
β
γ δ η
ν
Ising d = 2
0 (log) 1/8 7/4 15 1/4
1
Ising d = 3
0,11 0,32 1,24 4,8 0,05 0,63
klass. Heisenberg d = 3 -0,12 0,36 1,37 4,6 0,04 0,7
MFA, beliebiges d
0
1/2 1
3 0
1/2
Thermodynamik und Statistische Physik
127
Wir bemerken, daß die Skalenrelationen für alle aufgelisteten Modelle erfüllt
sind, bis auf die Molekularfeldapproximation (MFA). Hier ist die Hyperskalenrelation genau für d = 4 erfüllt. Wir schließen daher, daß die MFA zur
Beschreibung des kritischen Verhaltens ungeeignet ist. Dieser weitere Widerspruch (zu Skalenrelationen der RG) zusammen mit dem Widerspruch zur
exakten Lösung des d = 2 Isingmodells sollte das MFA-Verfahren endgültig
dikreditieren.
Wir wollen aber einen amüsanten Schwenk nicht verschweigen: Die Inkonsistenz von MFA und Hyperskalenrelation bei d < 4 liegt am Versagen der
MFA. Bei d > 4 jedoch ist die MFA korrekt (!), unsere Ableitung der Skalenrelationen ist für d > 4 zu naiv!. Wir wollen hier nur auf die Auflösung des
Rätsels hinweisen, aber nicht ausführen. Für d > 4 ist die Betrachtung der
irrelevanten Skalenfelder wichtig (“gefährliche irrelevante Operatoren”)! Im
Gegensatz zu d < 4 ist für ein gewisses j die freie Energie f (gj → 0) singulär!
Wir bemerken die Universalität des kritischen Verhaltens: kritische Exponenten hängen nicht von den vielen mikroskopischen Details der Wechselwirkung
ab, da am kritischen Punkt die Korrelationslänge des Systems divergiert. “Irrelevant” sind Parameter wie Reichweite der Wechselwirkung (solange endlich), Mehrspinwechselwirkung (solange symmetrieerhaltend) und Kristallgitterstruktur. “Relevant” sind die Dimensionalität d des Raumes, die Anzahl
n der Komponenten des lokalen Ordnungsparameters bzw. Feldes und Symmetrie der Wechselwirkung.
4.8
Das Ginzburg-Landau-Modell
Wir wollen im Sinne der zuletzt angesprochenen Irrelevanz der Kristallstruktur ein phänomenologisches, kontinuierliches Modell betrachten. Wir verstehen hier “Kontinuum” im räumlichen Sinne, d.h. wir betrachten eine sog.
Ordnungsparameterdichte m(x), die auf Längenskalen klein gegen Systemabmessungen, aber groß gegen die Gitterkonstante definiert ist. Ferner soll diese Ordnungsparameterdichte kontinuierliche, reelle Werte in einem gewissen
(möglicherweise unendlichen) Intervall annehmen. Es gibt auch Verallgemeinerungen auf mehrkomponentige reelle und auch komplexe m(x).
~
Es gibt
ein (Freies-)Energie-Funktional F[m, B], das jeder Realisierung bzw. Konfiguration m(x) und jedem auch inhomogenem Magnetfeld B(x) eine (reelle)
Zahl zuordnet. Die Freie Energie bzw. Zustandssumme ist dann durch ein
Funktionalintegral über alle Funktionen m(x) gegeben
e
−F (T,B)/kB T
=Z=
Z
(Dm)
| {z }
Funktionalintegral
e−F [m,B] ,
(4.96)
128
A. Klümper
wobei im folgenden erklärt werden muß, wie derartige Integrale definiert sind.
Wir bemerken zunächst, daß typischerweise das Funktional F lokal und von
Integralform ist
Z
F[m, B] =
dd xφ(m(x), B(x)),
(4.97)
wobei wir ganz allgemein eine Entwicklung nach Potenzen und Gradienten
in m(x) vorliegen
φ(m(x), B(x)) =
1
B(x)
1
1
|∇m(x)|2 −
m(x) + A(T )m2 (x) + B(T )m4 (x) + ...
2
kB T
2
4
| {z
}
=:h(x)
(4.98)
Dies ist die Landausche Freie Energie, wobei der Koeffizient vor dem Gradiententerm durch Normierung des Feldes m(x) auf 1/2 gesetzt wurde, ungerade
Ordnungen in ∇ und m wegen Paritäts- und Spinumkehr-Invarianz nicht auftreten können. Höhere Ordnungen sind vernachlässigt worden, da sie sich im
Sinne der RG als irrelevant herausstellen (hier nicht gezeigt). Die Temperatur T geht in die Koeffizienten A(T ) und B(T ) ein. Wir werden uns bald mit
der Auswertung des Modells (4.96) befassen, wollen aber schon anmerken,
daß (4.96) das kritische Verhalten beispielsweise des Isingmodells richtig beschreibt, die sog. Landau-Näherung “falsch” ist.
Wir wollen nun zwei mögliche Herleitungen von (4.96) besprechen und dabei
das Funktionalintegral definieren.
I) Mittelungen über Zellen Wir zerlegen das System in Zellen, die groß
gegenüber mikroskopischen Abständen sind, aber klein im Vergleich zum Gesamtsystem. Für jede Konfiguration der Spinvariablen σi auf den Gitterplätzen i definieren wir den lokalen Ordnungsparameter m = m(x), indem
wir für jede Zelle mit Ortsvektor x das arithmetische Mittel der enthaltenen
Spins σi bestimmen. Dies liefert kontinuierliche Werte für m(x) auch bei diskreten Werten für σi .
m(x)
σi
Es ist klar, daß jeder Spinkonfiguration genau eine Funktion m = m(x) zugeordnet wird. Umgekehrt gibt es zu jeder Funktion m mehrere Spinkonfigurationen, diese Anzahl heiße W [m]. Die typische Energie der Spinkonfigu-
Thermodynamik und Statistische Physik
129
rationen zu m ist E[m, B], wobei B das (inhomogene) Magnetfeld ist. Die
Zustandssumme ist
Z
¡ −βH ¢
Z = Sp e−βH =
(Dm)
e
| {z m}
| R{z }
Summe ueber alle
Q ∞
Spinkonfigurationen
:=
dm(x)
passend zu m
x −∞
Z
−βE[m,B]
= (Dm)W [m]e
,
(4.99)
wobei hier der Integrand zu festem m = m(x) gemäß unserer Vorüberlegungen
umgeschrieben wurde. Der letzte Ausdruck hat die gewünschte Form, wenn
wir setzen
F[m, B] = βE[m, B] − ln W [m].
(4.100)
Es ist plausibel, daß E und ln W als Integrale über geeignete Funktionen von
m(x) dargestellt werden können. Es ist auch klar, daß die Koeffizienten der
Landauschen freien Energie ganz allgemein temperaturabhängig sind.
Wir sind hier recht formal vorgegangen. Wir können uns physikalisch fragen,
warum es Sinn macht, eine Dichte des Ordnungsparameters einzuführen bzw.
in einem Zwischenschritt m(x) festzuhalten? Wir erwarten einfach, daß Ordnungsparameter erhalten sind und langsam fluktuieren. Die schnellen Fluktuationen wurden aufsummiert und definieren W (und auch E). Die langsamen Fluktuationen, die am kritischen Punkt besonders wichtig sind, werden
durch die effektive Kontinuumstheorie beschrieben.
Wir werden häufig Funktionalintegrale definieren und auswerten, indem wir
ein effektives Gitter (wie oben) zu Grunde legen. Dann müßten wir den Kontinuumslimes durchführen, was für uns nicht so wichtig ist, da wir ohnehin
an Gittermodellen interessiert sind. Kritische Exponenten hängen nicht ab
von der Größe der Gitterkonstanten a. Wichtiger als der formale Kontinuumslimes a → 0 ist der thermodynamische Limes, da jedes endliche System
analytisch ist, d.h. keine Kritikalität zeigt.
II) Kac-Hubbard-Stratonovich-Transformation Wir können, ausgehend von einem Isingmodell mit diskreten Spins, auch unter Beibehalten des
diskreten Gitters ein Modell mit kontinuierlich variierenden Feldern herleiten.
Dies wird erreicht durch gewisse Gauß-Integrale über kontinuierliche Hilfsvariable, wodurch die bilinearen Ausdrücke der Isingspins entkoppelt werden.
Details werden wir nicht besprechen. Wir wollen anmerken, daß die hier angedeutete Prozedur vollständig beherrscht wird und alle Terme, die oben auf
Grund von Universalität bzw. Irrelevanz ignoriert wurden, einfach beherrscht
werden.
130
A. Klümper
Landau-Näherung Wir wollen nun eine einfache Näherungauswertung von
(4.96-4.98) besprechen. Diese Näherung ist die Sattelpunktsintegration in
dem Sinne, daß das Integral durch den Integranden am Maximum ersetzt
wird. Das Minimum von F[m, B] bezüglich m ergibt sich aus den EulerLagrange-Gleichungen
∂ ∂φ
∂φ
=
,
(4.101)
∂x ∂∇m
∂m
was unter Vernachlässigung höherer Ordnungsterme
∂ 2 m(x)
= −h(x) + A(T )m(x) + B(T )m3 (x) + ...,
∂x2
(4.102)
liefert.
Alternativ kann man diese Gleichungen erhalten, indem wir eine partielle
Integration in (4.97) durchführen und erhalten
·
¸
Z
1
1
d
2
2
F[m, B] = d x − m(x)∇ m(x) − h(x)m(x) + A(T )m (x) + ... .
2
2
(4.103)
Wenn wir hier die Variation nach m(x) durchführen, beachten wir, daß auch
der Laplace-Term zweimal den gleichen Beitrag liefert, wie jeder Term bilinear in m(x). Dies ergibt (4.102).
Nennen wir die Lösung zu (4.102) m̄(x), so ergibt sich die freie Energie in
Landauscher Näherung als
− ln Z = βF (T, B) = F(m̄, B).
(4.104)
Wir lösen (4.102) zunächst für den Fall eines räumlich homogenen Magnetfeldes und überzeugen uns davon, daß die Landau-Näherung der Molekularfeldtheorie entspricht. Wir können von einem räumlich homogenen m ausgehen
mit Gradient 0, damit folgt
0 = −h + A(T )m + B(T )m3 .
(4.105)
Dies ist die aus (4.45) bekannte Selbstkonsistenzbeziehung in der Nähe des
kritischen Punktes. Wir lernen hieraus unter anderem, daß die kritische Temperatur (in der betrachteten Näherung) durch den Nulldurchgang A(Tc ) = 0
bestimmt ist.
Wir wollen nun nicht unsere alten Rechnungen reproduzieren, sondern vielmehr die bisher nur zitierten Ergebnisse für die Korrelationsfunktion ableiten.
Dazu benutzen wir die logarithmierte Zustandssumme für ein inhomogenes
äußeres Feld als erzeugende Funktion
G(x) := hm(0)m(x)i − hm(0)ihm(x)i =
δ
δ
ln Z,
δh(0) δh(x)
(4.106)
Thermodynamik und Statistische Physik
131
und mit (4.104)
G(x) = −
δ
δ
δ
F(m̄) =
m̄(x).
δh(0) δh(x)
δh(0)
(4.107)
R
Wir haben bei der Ableitung von F(m̄, B) = dd xφ(m(x), B(x)) nach h(0) =
B(0)/kB T nur den Term berücksichtigt, der sich bei der expliziten Ableitung
nach dem zweiten Argument ergibt. Die Ableitung nach dem ersten Argument
lieferte
δF δm
= 0,
δm
|{z} δh(x)
(4.108)
=0
wobei das Ergenis 0 ist wegen der Minimalitätseigenschaft bezüglich Variation
nach m. Wir wenden die Variationsableitung auf (4.102) an
∂ 2 G(x)
= −δ(x) + A(T )G(x) + ...
µ ∂x2 2
¶
∂
⇔ − 2 + A G(x) = δ(x).
∂x
(4.109)
Die letzte Gleichung lösen wir per Fourier-Transformation
1
G(~x) =
(2π)d
Z
~
dd k
e−|x|/ξ
eik~x
∼
,
k2 + A
xd−2
1
ξ=√ ,
A
(4.110)
wobei die Asymptotik für große x zu verstehen ist. Dieses Ergebnis hatten
wir schon früher zitiert mit den kritischen Exponenten η = 0 und ν = 1/2,
wobei hier von einer Nullstelle erster Ordnung in A(T ) bei Tc ausgegangen
wurde.
Wir wollen hier einen Überblick gegeb über das Phasendiagramm des GinzburgLandau-Modells in Landau-Näherung. Für B > 0 erhalten wir einen Phasenübergang 2. Ordnung, wenn A = 0 ist. Für B < 0 brauchen wir zur Wohldefiniertheit von (4.96-4.98) einen positiven Term 6. Ordnung (Cm6 (x)). Hier
stellt sich ein Phasenübergang 1. Ordnung ein. Der Grenzpunkt der Linien 1.
Ordnung und 2. Ordnung ist der sog. trikritische Punkt mit seinen eigenen
kritischen Exponenten. In Landau-Näherung sind dies α = 1/2, β = 1/4,
γ = 1, δ = 5, und wie gehabt η = 0, ν = 1/2.
132
A. Klümper
B
2. Ordnung
trikritischer Punkt
A
1. Ordnung
Wir wollen uns mit der Frage beschäftigen, für welche Raumdimensionen d
die kritischen Exponenten der Landau-Näherung für den Phasenübergang 2.
Ordnung und den trikritischen Punkt korrekt sind. Es wird sich zeigen, daß
dies für hinreichend hohe Dimension erfüllt ist. Die Minimaldimension, die
dies liefert heißt obere kritische Dimension.
Das Ginzburg-Kriterium Die Landau-Näherung ist eine Sattelpunktintegration, d.h. sie vernachlässigt Abweichungen von der stationären Konfiguration (stationärer Weg). Im Rahmen der Molekularfeldtheorie sind es die Korrelationen zwischen Nächst-Nachbar-Spins, die vernachlässigt werden. Wir
werden noch sehen, wie derartige Fluktuationen quantitativ behandelt werden. Wir wollen uns hier mit einer qualitativen Überlegung von den Konsequenzen dieser Rechnungen ein Bild machen. Innerhalb der Landau-Näherung
ist es sicher legitim zu verlangen, daß Fluktuationen einen gewissen Grenzwert nicht überschreiten sollten, damit diese “Theorie” wenigstens in sich
“stimmig” ist. Wir nehmen als Maß für Fluktuationen den Wert der SpinSpin-Funktion bei einem räumlichen Abstand, der der Korrelationslänge ξ
entspricht, d.h. G(ξ). Dieser Wert ist zu vergleichen mit dem Mittelwert des
Ordnungsparameters zum Quadrat m̄2 . Dies ist natürlich nur in der Tieftemperaturphase sinnvoll. Unsere Berechnung von G(x) galt der Hochtemperaturphase, d.h. (4.110) ist für A > 0 gültig. Tatsächlich ist auch die Tieftemperaturphase erfaßt, wenn in (4.110) A durch |A| ersetzt wird.
Thermodynamik und Statistische Physik
133
Das Ginzburg-Kriterium für die Gültigkeit der Landau-Näherung ist
d−4
G(ξ)
ξ 2−d
|A|(d−2)/2
<< 1 ⇔
<< 1 ⇔
= |A| 2 << 1,
2
2
m̄
m̄
|A|
(4.111)
dies bedeutet, daß für d < 4 der Parameter A nicht zu klein bzw. die Temperatur nicht zu nah an der kritischen Temperatur liegen darf. Für d > 4 gibt es
diese Beschränkung nicht. Folglich dürfen wir annehmen, daß die kritischen
Exponenten der Molekularfeldtheorie (4.49) (nur) für d > 4 korrekt sind, d.h.
die obere kritische Dimension ist 4.
Wenn wir das Ginzburg-Kriterium auf die Landau-Näherung zum trikritischen Punkt (d.h. A = B = 0) anwenden, finden wir als obere kritische
Dimension 3.
Korrekturen zur Landau-Näherung Wir berücksichtigen in F[m, B] genau die Terme 2. Ordnung in m (für beliebiges B und insbesondere in der
Tieftemperaturphase müßten wir um den Sattelpunkt entwickeln.), dies führt
zu (4.103). Mittels des eindimensionalen Gauß-Integrals
Z ∞
K 2
dΦ
1 η2
√ e− 2 Φ +ηΦ = √ e 2K ,
(4.112)
2π
K
−∞
zeigt man für hermitische Operatoren K in einem n-dimensionalen Raum
mittels unitärer Transformation
Z
−1
1
1
1
e 2 hη|K ηi ,
(4.113)
(DΦ)e− 2 hΦ|KΦi+hη|Φi = √
detK
wobei hier Φ und η n-dimensionale reelle Vektoren sind.
In (4.103) ist K = −∇2 + A; wenn wir ein endliches Volumen V und Gitterkonstante a voraussetzen, sind die Eigenvektoren durch ebene Wellen der
~
Ortsvariablen x gegeben eik~x mit Eigenwert k 2 + A.
Y
detK =
(k 2 + A),
Zk
,
hh|K −1 hi = dd x h(x) (−∇2 + A)−1
h(x)
|{z}
P
1
i~
k~
x
=V
|
= V1
P
k
{z
k
e
h̃(k)
x (k 2 +A)−1 h̃(k)
ei~k~
}
1X
1 X h̃(−k)h̃(k)
ln Z = −
,
log(k 2 + A) +
2
2V
k2 + A
k
k
(4.114)
134
A. Klümper
wobei die k-Summen im wesentlichen wie schon früher durchzuführen sind,
d.h. mit einer Diskretisierung (∆k)d = (2π)d /V mit dem d-dimensionalen Volumen V . Wegen des zugrundegelegten Gitters mit Gitterkonstanten a gibt
es eine obere Schranke |k| ≤ Λ := 2π
a .
Wenn wir zunächst den feldfreien Fall betrachten erhalten wir
Z
kB T V
kB T X
dd k log(k 2 + A).
log(k 2 + A) =
F (T ) =
2
2(2π)d
(4.115)
k
Derartige Integrale haben zwei mögliche Arten von Singularitäten
– Λ → ∞, d.h. Ultraviolett (UV)
– A → 0, d.h. Infrarot (IR)
Für das kritische Verhalten ist das IR-Verhalten maßgeblich.
Leiten wir F (T ) zweimal nach T ab, treffen wir auf folgendes Integral
C∼
Z
0
Λ
dd k
,
(k 2 + A)2
(4.116)
mit dem Verhalten
– d ≤ 4: divergent für A → 0 (logarithmisch für d = 4),
– d > 4: konvergent!
Wir sehen, daß für d ≤ 4 die Korrektur größer ist als das Ergebnis in 0. Ordnung. Dies gilt auch für höhere Korrekturen (Loop-Entwicklung). Für d > 4
scheint Störungstheorie – wenigstens Ordnung für Ordnung – sinnvoll zu sein.
Wir betrachten nun (4.98) mit strikt quadratischen Termen, was das sog.
Gauß-Modell definiert. Der Vorteil des Gauß-Modells ist, daß die obige
Rechnung die vollständige Lösung darstellt, der Nachteil ist die Abwesenheit
einer Tieftemperaturphase (dies stellr eine Pathologie des Modells dar). Wir
fassen zusammen
Z Λ/√A
d−4
d−4
dd y
∼t 2 ,
d<4: C∼t 2
2
2
(y + 1)
{z
}
|0
konvergent
d = 4 : C ∼ const. + log t ∼ log t,
d > 4 : C ∼ const.
(4.117)
wobei t = T − Tc wie schon früher definiert.
Wir wollen nun die 2-Punkt-Korrelationsfunktionen berechnen. Dazu bemühen
wir wieder die Fourierdarstellung
Thermodynamik und Statistische Physik
1 X ikx
e m̃(k),
V
k
1 X ikx
e h̃(k),
h(x) =
V
135
m(x) =
(4.118)
k
womit das Funktional des Gauß-Modells die Form
¸
·
1 X
1 2
F[m, B] =
m̃(−k) (k + A)m̃(k) − h̃(−k)m̃(k) ,
V
2
(4.119)
k
annimmt.
hm(x)m(y)i =
1 X i(kx+py)
e
hm̃(k)m̃(p)i
V2
(4.120)
k,p
Wir wissen außerdem
hm̃(k)m̃(p)i = V 2
¯
∂ 2 ln Z
δk,−p
¯
=V 2
,
¯
k
+A
h̃=0
∂ h̃(−k)∂ h̃(−p)
(4.121)
wobei das erste Gleichheitszeichen nach Definition und das zweite mit dem
konkreten Ergebnis (4.114) gilt. Die letzte Beziehung zusammengefaßt mit
(4.119) liefert zufällig (!?) genau die Formel in (4.110).
136
5
A. Klümper
Vermischtes
Wir wollen hier einige nicht ganz unwesentliche Fakten und Zusammenhänge
nachtragen, die aus Zeitgründen nicht an ihren logischen Stellen im Hauptteil
der Vorlesung besprochen wurden.
5.1
Chemische Reaktionen
Wir wollen Gase betrachten, die aus mehreren Teilchensorten bestehen. Die
unterschiedlichen Spezies werden mit i indiziert. Wir wollen das Gleichgewicht untersuchen. Unter gewissen Voraussetzungen können wir vom idealen
Gas sprechen, d.h. von nichtwechselwirkenden Teilchen, die aber dennoch chemisch reagieren können (d.h. Limes schwacher Wechselwirkung). Als Beispiel
nennen wir
2H2 + O2 − 2H2 O = 0,
(5.1)
oder allgemein
X
νi Ai = 0,
(5.2)
i
wobei νi irgendwelche ganzen Zahlen und Ai “chemische Sysmbole” sind, die
die Teilchen charakterisieren. Beachte, daß (5.2) nur Auskunft gibt über die
Änderung der Teilchenzahlen, nicht aber über den Energiegewinn bzw. Verlust.
Wir wollen jeder Teilchensorte i ein chemisches Potential µi zuordnen, das
konjugiert ist zur Teilchenzahl Ni . Wir wollen direkt anmerken, daß nicht
jede Teilchenzahl separat erhalten ist, da Reaktionen mit
∆Ni /νi = unabhngig von i,
(5.3)
erlaubt sind. Streng genommen gibt es zu einer nichterhaltenen Größe keine
intensive Variable wie in Kapitel 1 besprochen. Wir hatten schon im Fall des
Photonengases gesehen, daß wir konsistent arbeiten können, indem wir zwar
vom chemischen Potential µ sprechen, aber in den entsprechenden großkanonischen Ausdrücken immer µ = 0 einsetzen. Im mehrkomponentigen Fall
führt dies zu
X
νi µi = 0,
(5.4)
i
und die entsprechende (großkanonische) Zustandssumme liefert wie im Fall
des Photonengases das Gewünschte.
Eine etwas weniger formale Argumentation könnte so lauten: wir arbeiten
mit der freien Enthalpie G(T, p, Ni ) mit den Teilchenzahlen Ni (die nicht alle
unabhängig sind). Da im Gleichgewicht G den minimalen Wert annimmt,
muß gelten
Thermodynamik und Statistische Physik
dG ¯¯
= 0,
¯
dN1 p,T
137
(5.5)
wobei mit N1 auch alle anderen Ni variiert werden unter der Nebenbedingung
(5.3). Wir finden dann
Ã
!
X ∂G dNi
X
dG
=
= const.
µi νi .
(5.6)
0=
dN1
∂Ni dN1
i
i
In Verallgemeinerung zu (3.37) finden wir für ein mehrkomponentiges ideales
Gas
X zi
zi = eβ(µi −ǫi ) ,
(5.7)
ln Zgk,klass (T, V, µi ) = V
3,
λ
i
i
wobei die de Broglie-Wellenlänge über die Masse von der Teilchenspezies
abhängen mag und die Fugazität zi nicht nur durch das “von außen manipulierbare” chemische Potential µi , sondern auch von einem Wert ǫi abhängt,
der die intrinsische Energie der Komponente i berücksichtigt. Beachte, daß
µi zur Teilchenzahl konjugiert ist, aber Relationen wie (5.2) nichts über die
energetischen Verhältnisse aussagen. Dies wird durch ǫi kontrolliert. Es gilt
Ni =
∂ ln Zgk
zi
= V 3 ⇒ βµi = ln ni + βǫi + 3 ln λi .
{z
}
|
∂βµi
λi
(5.8)
=:βκi (T )
Mit (5.4) folgt das Massenwirkungsgesetz
Y
X
nνi i = exp(−β
νi κi ) = K(T ),
i
(5.9)
i
wobei die rechte Seite nur eine Funktion der Temperatur ist.
5.2
Osmotischer Druck
Wir betrachten Lösungen bestehend aus Lösungsmittel und gelöster Stoff mit
niedriger Konzentration c, wobei für das chemische Potential des Lösungsmittels
µ̄ die Beziehung (??) gilt
µ̄(T, p, c) = µ(T, p) − kB T c,
(5.10)
wobei µ das chemische Potential des reinen Lösungsmittels ist.
Wir betrachten nun zwei Lösungen mit unterschiedlichen Drücken p1 , p2 und
Konzentrationen c1 , c2 , die durch eine semipermeable Membran getrennt
sind, d.h. durchlässig für das Lösungsmittel, nicht für den gelösten Stoff.
Wegen des sich einstellenden Gleichgewichtes muß das chemische Potential
138
A. Klümper
des Lösungsmittels auf beiden gleich sein, d.h. µ̄(T, p1 , c1 ) = µ̄(T, p2 , c2 ), oder
mit (5.10)
µ(T, p1 ) − kB T c1 = µ(T, p2 ) − kB T c2 ,
(5.11)
und mit
Druck
∂µ
∂p
= V /N = v folgt für die Druckdifferenz bzw. den osmotischen
∆p = ∆c
5.3
kB T
.
v
(5.12)
Rotationsfreiheitsgrade von Molekülen identischer Atome
Wir hatten in (3.109) den Fall der Rotationsfreiheitsgrade eines zweiatomigen
Moleküls behandelt, wobei wir Fragen nach der Symmetrie der Wellenfunktion außer Acht gelassen hatten. In
Zrot =
∞
X
(2j + 1)e−
j(j+1) θr
2
T
,
(5.13)
j=0
korrespondieren tatsächlich gerade (ungerade) j zu einem symmetrischen (antisymmetrischen) Ortsanteil der Wellenfunktion bezüglich Vertauschung der
Kernpositionen. Die Gesamtwellenfunktion sollte eine wohldefinierte Symmetrie besitzen.
Im Falle des Wasserstoff-Moleküls sind die Kerne Protonen und damit Fermionen. Die Gesamtwellenfunktion des Rotationsfreiheitsgrades besteht aus
dem Orts- und Spinanteil! Für den letzteren ist zu beachten, daß sich die
Kernspins, je Spin S = 1/2, zu einem symmetrischen Triplett J = 1 und
einem antisymmetrischen Singulett J = 0 kombinieren. Eine antisymmetrische Gesamtwellenfunktion ist daher realisiert durch j gerade, J = 0 und j
ungerade, J = 1. Daher ist (5.13) zu ersetzen durch
Zrot = 3 ·
∞
X
j ungerade
(2j + 1)e−
j(j+1) θr
2
T
+1·
∞
X
(2j + 1)e−
j(j+1) θr
2
T
, (5.14)
j gerade
wobei die Entartungsfaktoren 3 und 1 sich aus der Multiplizität des Spinanteils ergeben.
Bemerkung: Wasserstoff mit J = 1(0) wird Ortho- (Para-) Wasserstoff genannt. Die Umwandlung ineinander ist schwierig.
5.4
Globale Konvexität der thermodynamischen Potentiale
Wir betrachten stellvertretend für alle Potentiale die freie Energie F (T, V, N )
und berücksichtigen in der weiteren Notation nur noch die Abhängigkeit von
Thermodynamik und Statistische Physik
139
den extensiven Variablen. Wir wollen zeigen, daß in Abhängigkeit dieser Variablen F konvex ist. Geben wir N Teilchen in einem Volumen V vor, so ist
F das Minimum des freien Energiefunktionals wie zuletzt in Abschnitt 4.4
besprochen. Eine obere Schranke für F (V, N ) ergibt sich aus folgender Konstruktion. Wir zerlegen V in zwei Teile V1 und V2 , ebenso die Teichenzahl N
in N1 und N2
F (V, N ) ≤ F (V1 , N1 ) + F (V2 , N2 ).
(5.15)
Unter Berücksichtigung der Extensivität haben wir F (V, N ) = V f (N/V ) und
damit
µ ¶
µ ¶
µ ¶
N
V1
V2
N1
N2
f
≤
f
+ f
.
(5.16)
V
V
V1
V
V2
Dies ist von der Form f (c1 x1 + c2 x2 ) ≤ c1 f (x1 ) + c2 f (x2 ), der definierenden
Eigenschaft von Konvexität.
Index
n-Punkt-Funktion 114
1. Hauptsatz der Thermodynamik
2. Hauptsatz der Thermodynamik
3. Hauptsatz 50
30
31
abgeschlossenen System 12
absolute Temperatur 34
absoluten Temperatur 18
adiabatische 20
Besetzungszahlen 69
Boltzmann-Gewichte 20
Bose-Einstein-Kondensation 85
Bose-Verteilungsfunktion 71
Brillouin-Funktion 96
Carnot-Maschinen 32
chemischen Potentiale 22
chemisches Potential 21
Clausius-Clapeyron 55
Curie-Suszeptibilität 97
Dampfdruckerniedrigung 59
detaillierte Gleichgewicht 117
Diamagnetismus 95
Dichteoperators 6
Duhem-Gibbs 23
Einatomiges (strukturloses) Gas 72
Ensemble 9
entartetes Fermigas 80
Enthalpie 42
Entropie 24
Ergodenproblem 10
Euler-Lagrange-Gleichungen 129
Expansion ins Vakkum 48
Extremaleigenschaften 25
Fermi-Energie 80
Fermi-Impuls 80
Fermi-Temperatur 80
Fermi-Verteilungsfunktion 71
ferromagnetischen Phase 106
Ferromagnetismus 105
Fixpunkt 122
Freie Energie 41
Freie Enthalpie 42
Funktionalintegral 126
Gauß-Modell 133
Gefrierpunktserniedrigung 59
gemischten Zustandes 5
Gibb’sche Phasenregel 57
Ginzburg-Kriterium 131
Ginzburg-Landau-Modell 126
Gleichgewichtsbedingungen 39
Gleichgewichtszustand 12
Gleichverteilungssatz 66
großkanonische Zustandssumme 13
großkanonischen Gesamtheit 13
Großkanonisches Potential 43
Hartree-Fock-Verfahren 108
He4 87
Helizität 77
Hohlraumstrahlung 77
idealen Gase 68
Idealisierung 61
importance sampling 116
Impulsraum-RG 122
Infrarot (IR) 133
Integrabilitätsbedingung 45
irrelevant 123
Ising-Modell 100
Thermodynamik und Statistische Physik
isotrope Heisenberg-Modell
100
Jacobi-Determinante 46
Joule-Thomson-Prozeß 49
kanonischen Dichteoperator 14
kanonischen Gesamtheit 14
kanonischen Zustandssumme 14
klassische Näherung 61
Koexistenz 51
Kompressibilität 44
konkav 102
konvex 102
Korrelationsfunktion 114
Kreisprozeß 31
kritischen Exponenten 110
Landau 87, 95
Landau-Näherung 129
Langevin-Funktion 97
langreichweitige Ordnung 114
Laplace-Transformation 19
latente Wärme 55
Legendre-Transformation 20
Lennard-Jones-Potential 92
Linksprozesse 37
Liouville-Gleichung 8
magnetische Suszeptibilität 94
makroskopisches System 5
Makrozustand 9
marginal 123
Massenwirkungsgesetz 136
Maxwell-Konstruktion 104
Metropolis-Algorithmus 116
mikrokanonische Gesamtheit 15
Mikrozustand 5
Molekularfeld 106
Molekularfeldtheorie 129
Näherungsverfahren 61
Nernst’sches Theorem 50
Nullpunktsdruck 83
obere kritische Dimension 131
Ordnung 60
Ordnungsparameter 126
Ordnungsparameterdichte 126
Ornstein-Zernike-Form 115
141
Ortsraum-RG 121
Osmotischer Druck 136
Paramagnetismus 96
Pauli-Paramagnetismus 98
Phasen 51
Phasengleichgewichte 51
Phasengleichgewichtes 57
Phasenkoexistenz 51
Photonen 77
Planck 78
Poissonklammer 62
Projektor 5
Prozeß 29
quantenmechanischen Zustand 5
quasi-statische 20
Quasistatischer (qs) Prozeß 29
Quasiteilchennäherung 61
Raoult’sches Gesetz 59
Rayleigh-Jeans 79
Rechtsprozesse 37
reinen Zustand 5
relevant 123
Renormierungsgruppen-Transformationen
119
Renormierungsgruppe 118
Renormierungsgruppen-Fluß 120
reversibel 32
Reversibilität 32
Rotationsanteil 74
Sattelpunkts-Integration 19
selbstkonsistenten Feldes 106
Siedepunktserhöhung 59
simple sampling 116
Skalen-“Operatoren” 123
Skalenfelder 123
Skalengesetze 122
Skalenrelationen 125
Sommerfeld-Entwicklung 83
Sommerfeld-Konstante 83
spezifische Wärme 44
Spinflip 116
spontane Magnetisierung 106
statistisch unabhängig 11
Statistische Gesamtheit 9
Statistische Gesamtheiten 8
142
A. Klümper
Statistische Physik 4
Statistische Unabhängigkeit 11
Stefan-Boltzmann-Konstante 77
Supraleiter 95
symmetriebrechendes Feld 114
Temperatur 17
Thermische de-Broglie-Wellenlänge
65
thermischen Gleichgewichtes 12
Thermischer Ausdehnungskoeffizient
44
Thermodynamik 4
Thermodynamische Potentiale 40
thermodynamische Potentiale 22
Transfermatrix 112
Ultraviolett (UV) 133
Unerreichbarkeit 50
Universalität 122
Van-der-Waals-Modell 102
van-der-Waals-Wechselwirkung 92
van-Leeuwensches Theorem 95
verbundene Graphen 93
verdünnte Lösungen 58
Verteilungsfunktion 7
Vibrationsanteil 76
Virialsatz: 66
vollständiges Differential 30
von-Neumann-Gleichung 7
Wärmefluß 40
Wärmekapazität 44
Wahrscheinlichkeit 11
Wechselwirkende Spins 99
Weiss 105
Wien 79
Wien’sches Verschiebungsgesetz
Wirkungsgrad 31
Zeitentwicklung 8
Zustandsgleichung 29
79
Herunterladen