Thermodynamik und Statistische Physik A. Klümper Theoretische Physik, Bergische Universität Wuppertal Inhaltsverzeichnis Thermodynamik und Statistische Physik A. Klümper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 3 4 1 Grundlagen der Statistischen Physik . . . . . . . . . . . . . . . . . 5 1.1 Grundbegriffe der Dynamik und Statistik . . . . . . . . . . . 5 1.2 Statistische Gesamtheiten . . . . . . . . . . . . . . . . . . . . 8 1.3 Das thermische Gleichgewicht . . . . . . . . . . . . . . . . . . 12 1.4 Mikrokanonische Gesamtheit . . . . . . . . . . . . . . . . . . 16 1.5 Die kanonische Gesamtheit . . . . . . . . . . . . . . . . . . . 17 1.6 Großkanonische Gesamtheit . . . . . . . . . . . . . . . . . . . 21 1.7 Thermodynamische Potentiale . . . . . . . . . . . . . . . . . 22 1.8 Die Entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Thermodynamik des Gleichgewichts . . . . . . . . . . . . . . . . . 29 2.1 Abriß der klassischen Thermodynamik . . . . . . . . . . . . . 29 2.2 Thermodynamische Größen . . . . . . . . . . . . . . . . . . . 38 2.3 Thermodynamische Relationen (Maxwell Relationen) . . . . 45 2.4 Irreversible Prozesse . . . . . . . . . . . . . . . . . . . . . . . 48 2.5 Tieftemperaturverhalten: Nernst’sches Theorem (3. Hauptsatz) 50 2.6 Phasengleichgewichte . . . . . . . . . . . . . . . . . . . . . . 51 2.7 Mehrkomponentige Systeme, Lösungen . . . . . . . . . . . . 56 Gleichgewichtseigenschaften makroskopischer Systeme . . . . . . . 61 3.1 Die klassische Näherung . . . . . . . . . . . . . . . . . . . . . 61 3.2 Die idealen Gase . . . . . . . . . . . . . . . . . . . . . . . . . 67 3.3 Photonen-Gas als ideales Bose-Gas . . . . . . . . . . . . . . . 72 3.4 Ideales Fermionen-Gas bei tiefen Temperaturen . . . . . . . . 75 3.5 Thermodynamik eines Gases aus mehratomigen Molekülen . 80 3.6 Allgemeines ideales Bosegas . . . . . . . . . . . . . . . . . . . 83 3.7 Verdünnte Systeme, Virialentwicklung . . . . . . . . . . . . . 90 3.8 Magnetische Erscheinungen . . . . . . . . . . . . . . . . . . . 94 Phasenübergänge und kritische Systeme . . . . . . . . . . . . . . . 102 4.1 Vorüberlegungen . . . . . . . . . . . . . . . . . . . . . . . . . 102 4.2 Van-der-Waals-Modell für Phasenübergänge . . . . . . . . . . 103 4.3 Ising-Modell in Molekularfeld-Näherung . . . . . . . . . . . . 106 4.4 Bogoliubov’sches Variationsprinzip . . . . . . . . . . . . . . . 108 4.5 Eindimensionale klassische Systeme und Transfermatrix-Zugang113 Thermodynamik und Statistische Physik 5 4.6 Monte-Carlo-Verfahren . . . . . . . . . . . . . . . . . . . 4.7 Elementares zur Renormierungsgruppe (RG) . . . . . . . 4.8 Das Ginzburg-Landau-Modell . . . . . . . . . . . . . . . . Vermischtes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Chemische Reaktionen . . . . . . . . . . . . . . . . . . . . 5.2 Osmotischer Druck . . . . . . . . . . . . . . . . . . . . . . 5.3 Rotationsfreiheitsgrade von Molekülen identischer Atome 5.4 Globale Konvexität der thermodynamischen Potentiale . . . . . . . . . 3 . . . . . . . . 116 119 127 136 136 137 138 138 4 A. Klümper Historisch gesehen wurde die Statistische Physik (bzw. Statistische Mechanik) konzipiert, um Begriffe und Gesetzmäßigkeiten der Thermodynamik (auch “Wärmelehre”) atomistisch zu deuten. Der Inhalt der Thermodynamik ist dabei die Beschreibung von makroskopischen Eigenschaften von makroskopischen Systemen unter Benutzung von thermodynamischen Begriffen wie Temperatur, Druck, Wärme, Entropie etc. Ein makroskopisches System ist dabei ein “großes” System mit einer Zahl von Freiheitsgraden ≃ 1023 , o.ä. Viele Lehrbücher beginnen im Sinne der historischen Entwicklung mit der Thermodynamik, d.h. den Hauptsätzen und ihren Anwendungen, und beschäftigen sich erst später mit der Herleitung der Thermodynamik auf der Grundlage von Quantenmechanik und Statistik. Wir wollen hier den logischen Weg einschlagen und folgen etwa dem folgenden Blockdiagramm Quantenmechanik (klassische Mechanik) Statistik Statistische Physik (Kapitel I) Thermodynamik (Kapitel II) Anwendungen (Kapitel III,IV) Wir gehen aus von der Quantenmechanik (falls angebracht, werden wir auch den Grenzfall der klassischen Mechanik betrachten) und mit den Prinzipien einer statistischen Beschreibung werden wir das thermodynamische Gleichgewicht behandeln. Die eigentliche Thermodynamik folgt dann ganz zwangsläufig. Schließlich werden wir einige wichtige Anwendungen besprechen. Thermodynamik und Statistische Physik 1 1.1 5 Grundlagen der Statistischen Physik Grundbegriffe der Dynamik und Statistik Betrachte: N ≃ 1023 wechselwirkende Teilchen bzw. Freiheitsgrade, typisch für ein makroskopisches System. Unter einem quantenmechanischen Zustand, im folgenden auch Mikrozustand genannt, verstehen wir einen Vektor |ψ(t)i im Hilbertraum, dessen zeitliche Entwicklung durch die Schrödingergleichung bestimmt ist ˙ = H|ψi. ih̄|ψi (1.1) Physikalische Meßgrößen entsprechen den quantenmechanischen Erwartungswerten von Observablen A hAiq.m. = hψ|A|ψi. (1.2) Der Zustand |ψi für ein makroskopisches System enthält sehr viele Detailinformationen. Man denke beispielsweise an die Ortsdarstellung ψ = ψ(r1 , ..., rN ; t) (1.3) Selbst wenn die Ortsvariablen ri nur jeweils zwei (!) verschiedene Werte annehmen könnten, wäre der zugrunde liegende Hilbertraum 2N -dimensional, wobei typischerweise N ≃ 1023 . Dies liefert eine (super-) astronomische Zahl, die jenseits der Leistungsfähigkeit aller Rechner liegt. Dennoch existiert der Zustand eines derart großen Systems. Wir sprechen synonym zum Mikrozustand auch von einem reinen Zustand |ψi, zu dem der Projektor Pψ = |ψihψ| definiert wird. (Hier wurde Normierung hψ|ψi = 1 vorausgesetzt.) Im allgemeinen ist ein betrachtetes physikalisches System nicht hinreichend isoliert, daß eine Beschreibung durch einen reinen Zustand möglich wäre. Beispiel: Gesamtsystem bestehend aus Laborsystem und Umwelt kann durch einen reinen Zustand beschrieben werden, die Beschränkung auf das Laborsystem gibt Anlaß zur Definition des gemischten Zustandes, siehe auch Übungen: viele Mikrozustände |ni mit hn|ni = 1 repräsentieren das System mit den Wahrscheinlichkeiten X wn , wn = 1 (1.4) n in der Weise, daß Erwartungswerte von Observablen sich ergeben zu X A= wn hn|A|ni n (1.5) 6 A. Klümper Diese Erwartungswerte lassen sich kompakt schreiben durch Verwendung des Dichteoperators (Verteilungsfunktion) X ρ= wn |nihn| (1.6) n bzw. ρ(t) = X n wn |n, tihn, t| (1.7) ρ ist eine gewichtete Summe von Projektionsoperatoren |nihn|, wobei die |ni normiert seien, aber nicht notwendigerweise orthogonal! Es gilt hAi = Sp ρA (1.8) Beweis: Sp ρA = Sp X n wn |nihn|A = X n wn Sp |nihn|A = hAi | {z } (1.9) hn|A|ni Also charakterisiert ρ den Zustand des Systems vollständig. Die Eigenschaften von Dichteoperatoren sind: a) ρ hermitisch b) positiv semidefinit c) Sp ρ = 1 Beweis: a) klar, b) für einen beliebigen Zustand ψ gilt X X hψ|ρ|ψi = wn hψ|nihn|ψi = wn |hψ|ni|2 ≥ 0, n (1.10) n c) klar. Man kann zeigen, daß jeder Operator mit den Eigenschaften a),b),c) eine Darstellung wie in (1.7) hat, mit sogar orthonormierten |ni. Dazu gehe man in die Spektraldarstellung (d.h. Eigenbasis) zu ρ. Bemerkung: Darstellungen wie (1.7) sind nicht eindeutig! Der Grenzfall eines Dichteoperators ist der Projektor (d.h. der reine Zustand): w1 = 1, Rest wn = 0 für n 6= 1. Wie schon besprochen ist dies der Fall der üblichen Quantenmechanik. Im Zusammenhang mit dem “Gemisch” spricht man auch von “Quantenstatistik”. Zeitabhängigkeit: Dynamische Gleichung ˙ = H|ni mit dem Hamiltonoperator H Aus der Schrödingergleichung ih̄|ni folgt Thermodynamik und Statistische Physik ih̄ρ̇ = ih̄ Xh n 7 i ˙ ˙ = Hρ − ρH |nihn| + |nihn| (1.11) i ρ̇ = − [H, ρ]. h̄ (1.12) woraus die von-Neumann-Gleichung folgt (Beachte: die Zustände |ni sind der Zeitentwicklung unterworfen, nicht jedoch die Wahrscheinlichkeiten wn .) Diese Gleichung gestattet es, im Schrödingerbild die Zeitabhängigkeit von ρ(t) zu berechnen, sofern die Anfangsbedingung ρ(t0 ) = ρ0 zu einer Zeit t0 (=0 z.B.) bekannt ist. Für nicht explizit zeitabhängige H gilt ρ(t) = e−(i/h̄)Ht ρ0 e(i/h̄)Ht (1.13) Alternativ kann natürlich im Heisenbergbild mit zeitunabhängigen Zuständen und zeitabhängigen Observablen A(t) = e(i/h̄)Ht Ae−(i/h̄)Ht (1.14) hAi(t) = Sp ρ(t)A = Sp ρA(t) (1.15) gerechnet werden, so daß Klassische Mechanik: In vielen Fällen (insbes. bei hoher Temperatur) können wir von der quantenmechanischen Beschreibung absehen und zum Grenzfall der klassischen Mechanik übergehen (Achtung: auch hier gibt es Überbleibsel der Quantenstatistik, s. Gibbsches Paradoxon). Wir betrachten also N -viele Massenpunkte im 3-dimensionalen Raum. Die Mikrozustände des N -Teilchen-Systems sind realisiert durch die Punkte des 6N -dimensionalen Phasenraumes der kombinierten Orts- und Impuls-Koordinaten (q, p), wobei q(t) = q1 (t), ..., q3N (t) und p(t) = p1 (t), ..., p3N (t) im Zeitverlauf eine Trajektorie beschreibt. Analog zum quantenmechanischen Fall wird der gemischte Zustand durch viele Phasenpunkte (q n , pn ) repräsentiert, jeder mit einer Wahrscheinlichkeit P wn ≥ 0, n wn = 1. Die Verteilungsfunktion (entspricht Dichteoperator) lautet X ρ(q, p) = δ(q − q n (t))δ(p − pn (t))wn (1.16) n R mit den Eigenschaften ρ(q, p) ≥ 0, dqdpρ(q, p) = 1 (entspricht den Eigenschaften a), b), c) des Dichteoperators). Wir deuten ρ(q, p)dqdp als die Wahrscheinlichkeit, den Phasenpunkt in dem Volumenelement dqdp bei (q, p) zu finden. Physikalische Meßgrößen sind durch Funktionen A(q, p) gegeben, deren Erwartungswerte sich berechnen nach 8 A. Klümper hAi = Z dqdpA(q, p)ρ(q, p). (1.17) Daher charakterisiert die Verteilungsfunktion ρ den Mischzustand vollständig. Die Zeitentwicklung von ρ wollen wir mittels der Hamiltonfunktion H(q, p) berechnen. Für jede Trajektorie (q n (t), pn (t)) gilt q˙n = ∂H , ∂pn p˙n = − ∂H , ∂q n (1.18) womit folgt · ¸ ∂ ∂ n n ˙ ˙ ρ̇ = wn q δ(q − q n )δ(p − pn ) +p ∂q n ∂pn n · ¸ X ∂H ∂ ∂H ∂ = wn δ(q − q n )δ(p − pn ). − n ∂q n n ∂pn ∂p ∂q n X (1.19) (1.20) Nun können wir die Gradienten nach q n , pn durch solche nach q, p ersetzen, wobei ein Vorzeichenwechsel stattfindet. Ausserdem können wegen der auftretenden δ-Funktionen die Argumente q n , pn in den Gradienten von H durch q, p ersetzt werden. Ergebnis ¸ · ∂H ∂ ∂H ∂ ρ = −{H, ρ} Liouville-Gleichung (1.21) − ρ̇ = − ∂p ∂q ∂q ∂p Diese dynamische Gleichung entspricht natürlich genau der von-NeumannGleichung im quantenmechanischen Fall, d.h. die Ersetzung {H, ρ} → h̄i [H, ρ] führt von der klassischen Mechanik zur Quantenmechanik. 1.2 Statistische Gesamtheiten Wir betrachten ein makroskopisches System von Teilchen mit typischerweise 1023 Teilchen. Obwohl ein derartiges System im Prinzip den Gesetzen der Quantenmechanik genügt (im Grenzfall h̄ → 0 der klassischen Mechanik), sind wir gezwungen auf eine mikroskopische Beschreibung zu verzichten. Gründe: a) Unmöglichkeit: Schrödingergleichung für 1023 Teilchen zu lösen b) Unmöglichkeit: Anfangsbedingungen für 1023 Teilchen zu bestimmen Wir hatten schon oben gesehen, daß der zugrundeliegende Hilbertraum zu hochdimensional ist. Nur im Falle von nichtwechselwirkenden Teilchen können wir eine mikroskopische Beschreibung erzielen. Thermodynamik und Statistische Physik 9 Nun gibt es zu den genannten Argumenten, die sich auf die Undurchführbarkeit beziehen, auch positive Gründe, von einer mikroskopischen Beschreibung abzusehen. Wir sind häufig gar nicht interessiert an der Detailinformation über die genaue Zeitabhängigkeit der Trajektorien von Teilchen. • Beschränkung in den (experimentellen) Eingriffsmöglichkeiten Typische Messungen an großen Systemen beziehen sich auf Größen, an denen alle Teilchen beteiligt sind, d.h. spezifische Wärme, Druck, Kompressibilität, elektrische Leitfähigkeit, elektrische und magnetische Suszeptibilität, Absorption und Streuung von Licht und Neutronen etc. Selbst bei den zuletzt genannten Streuexperimenten, die mehr mikroskopische Informationen ermitteln, wird über Zeiten und räumliche Ausdehnungen gemittelt, die groß sind gegen atomare Skalen. Neben dem Mikrozustand des Systems (für “Zustand” in QM-Terminologie) gibt es den Makrozustand, der durch wenige Parameter bestimmt ist, z.B. Temperatur, Druck, Teilchendichte, Volumen, Energie etc. Einem derartigen Makrozustand entsprechen dabei sehr viele Mikrozustände, z.B. haben sehr viele Mikrozustände die gleiche Gesamtenergie. Wir lassen daher zur Bestimmung der Eigenschaften des Makrozustandes alle möglichen Mikrozustände zu, die zum gleichen Makrozustand gehören. Wir definieren Statistische Gesamtheit (Ensemble) = Gesamtheit von Systemen in verschiedenen Mikrozuständen, die alle zum gleichen Makrozustand gehören. Offensichtlich entspricht eine solche statistische Gesamtheit einem gemischten Zustand wie in (I.1) definiert. Daher wird die statistische Gesamtheit durch einen geeigneten Dichteoperator ρ beschrieben, wobei Ergebnisse von Messungen durch Erwartungswerte mittels ρ gegeben sind. Die Aufgabe der Statistischen Physik ist es nun, den Dichteoperator zu bestimmen, der den makroskopischen Bedingungen genügt. Wir wollen noch drei Gründe für eine statistische Beschreibung von großen Systemen besprechen und warum viele Mikrozustände eingehen: i) Ein makroskopisches System ist niemals völlig isoliert. Während einer Messung wird es durch äußere Einflüsse (oder auch durch den Meßprozess) zwischen vielen Mikrozuständen hin und her geworfen. Man denke an die Spezifische-Wärme-Messung von Wasser. 10 A. Klümper ii) Die Erfahrung zeigt, daß viele Systeme extensiv sind, d.h. Messungen an verschieden großen Substanzmengen führen zu gleichen Ergebnissen, wenn sie auf die Substanzmenge bezogen werden. Die einzige Bedingung ist, daß die benutzten Substanzmengen noch makroskopisch sind. Wir führen die folgende Einteilung durch 10 10 10 10 10 10 10 . . . . . . . . 10 23 13 Untersysteme, Gesamtzahl der Teilchen 10 10 Eine Messung an den 1023 Teilchen ist damit äquivalent dem Mittelwert von Messungen an 1013 Untersystemen von jeweils 1010 Teilchen. Wir haben dann 1013 Mikrozustände |ni i, i = 1, ..., 1013 , für 1010 Teilchen. Der Dichteoperator ist gegeben durch ρ= 13 10 X i=1 wi |nii hn|i , wi = 10−13 (1.22) Jede Messung läßt sich auffassen als Mittelwert über die Messungen an den Untersystemen hAi = Sp Aρ. Achtung: Messungen eines einzelnen Atoms an der Oberfläche eines makroskopischen Körpers sind dabei natürlich ausgeschlossen. iii) “Zeitmittel = Scharmittel” und Ergodenproblem der klassischen Mechanik Wir führen eine Messung über eine große Zeitspanne τ durch. Der Phasenpunkt (q(t), p(t)) durchläuft dabei den Phasenraum. Das Ergebnis der Messung wird durch folgende Mittelung bestimmt Z 1 τ dtA(q(t), p(t)) (1.23) hAi = τ 0 Wir betrachten nun ein Element dqdp um den Punkt (q, p). Während der Zeitspanne τ hält sich der Phasenpunkt des Systems mit einer Gesamtverweilzeit dt (evtl. aus vielen Teilintervallen bestehend) in diesem Volumen auf und gibt Anlaß zur Definition einer Verteilungsfunktion ρ durch dt =: ρ(q, p)dqdp τ Mit dieser Verteilungsfunktion gilt natürlich Z Z τ dt hAi = A(q(t), p(t)) = dqdpA(q, p)ρ(q, p) . τ {z } {z } | |0 Ensemblemittel Zeitmittel (1.24) (1.25) Thermodynamik und Statistische Physik 11 Das Ergodenproblem besteht nun darin, nachzuweisen, daß die Verteilungsfunktionen, die sich aus Zeitmittelungen ergeben, mit den Verteilungsfunktionen, die wir in Kürze kennenlernen werden, identisch sind. Siehe hierzu A.J. Chintschin: BI Taschenbuch 58/58a. Wir werden das Ergodenproblem im Rahmen dieser Vorlesung nicht mehr aufgreifen. Zum Abschluß dieses Paragraphen führen wir noch einige Begriffe ein. Die Wahrscheinlichkeitdichte, daß die Observable A in der Gesamtheit den Meßwert a annimmt, ist wA (a) = hδ(a − A)i := Sp ρδ(a − A). Offenbar gilt R∞ −∞ (1.26) dawA (a) = 1 und für beliebige Funktionen f (...) gilt hf (A)i = Sp ρf (A) = Sp ρ Z ∞ −∞ daδ(a − A)f (a) = Insbesondere gilt hAn i = Z ∞ Z ∞ dawA (a)f (a). (1.27) −∞ dawA (a)an . (1.28) −∞ Wir definieren nun die Schwankung ∆A von A um den Mittelwert hAi (∆A)2 := h(A − hAi)2 i = hA2 i − hAi2 ≥ 0 (1.29) Als relative Schwankung wird ∆A/hAi definiert. Je kleiner die Schwankung ist, desto seltener ist das System in einem Mikrozustand, in dem der Wert von A vom Mittelwert abweicht. Wir betrachten später fast ausschließlich Observable, die sich PNals Summen über die einzelnen Freiheitsgrade schreiben lassen, d.h. A = i=1 A(i). Für diese Observablen ergibt sich hAi = O(N ) und µ ¶ 1 ∆A =O √ → hAi N (∆A)2 = O(N ) (1.30) (1.31) Die Schwankungen werden also sehr klein, speziell im thermodynamischen Limes (N → ∞) gilt lim ∆A/hAi = 0. Statistische Unabhängigkeit Ein System von N Teilchen zerfalle in zwei Untersysteme mit N0 und N − N0 Teilchen. Die beiden Untersysteme heißen statistisch unabhängig, wenn der Dichteoperator ρ des Gesamtsystems zerfällt in ein Produkt der Dichteoperatoren ρI und ρII der beiden Untersysteme 12 A. Klümper ρ = ρI · ρII . (1.32) Mathematisch ist dies eine Definition, physikalisch ist Unabhängigkeit realisiert, wenn keine Wechselwirkung zwischen den beiden Untersystemen existiert. Eine direkte Folgerung der letzten Beziehung ist ln ρ = ln ρI + ln ρII , (1.33) d.h. ln ρ ist eine additive Größe (bei statistischer Unabhängigkeit). 1.3 Das thermische Gleichgewicht Im folgenden betrachten wir konservative Systeme, d.h. solche deren Hamiltonoperatoren H nicht explizit zeitabhängig sind. Wir verstehen unter einem abgeschlossenen System ein System ohne Kontakt bzw. Wechselwirkung mit der Umgebung. Eine empirische Tatsache ist, daß jedes mehr oder weniger abgeschlossene System im Laufe der Zeit einem stationären Zustand entgegen strebt, also Meßwerte gegen zeitlich unabhängige “Gleichgewichtswerte” streben. Der stationäre Makrozustand, der sich einstellt, heißt auch Zustand des thermischen Gleichgewichtes oder Gleichgewichtszustand. Obige Formulierung enthält ein Element der Unbestimmtheit (“mehr oder weniger abgeschlossen”). Streng genommen gibt es keine abgeschlossenen (isolierten) Systeme, da immer Wärmeaustausch mit der Umgebung erfolgt und auch der Meßprozeß eine Störung darstellt. (Außerdem kennen wir mit dem Poincaréschen Wiederkehr-Theorem prinzipielle Einschränkungen des Erreichens des Gleichgewichtes: in Praxis irrelevant wegen riesiger Zeitskalen.) Wir wollen nun den Dichteoperator des Gleichgewichtes ermitteln und halten zunächst fest, daß aus hAi(t) = Sp Aρ(t) zeitunabhängig (1.34) für jede Observable schon folgt, daß ρ(t) zeitunabhängig ist also ρ̇ = 0 und vermöge der von-Neumann-Gleichung gilt [H, ρ] = 0, (1.35) damit ist ρ eine Erhaltungsgröße. Ferner ist ln ρ additiv, wenn statistische Unabhängigkeit der zusammengesetzten Teilsysteme gegeben ist ln ρ = ln ρI + ln ρII . (1.36) Thermodynamik und Statistische Physik 13 Aus (1.35), (1.36) folgt, daß ln ρ eine Linearkombination aller möglichen additiven Erhaltungsgrößen F̂i , i = 1, ..., k, ist. (F̂ bezeichnet hier den Operator, F wird Eigenwerte oder Erwartungswerte bezeichnen.) Wir wollen die wichtigsten Erhaltungsgrößen Revue passieren lassen 0. das Volumen V eines Systems ist streng additiv 1. der Hamiltonoperator H ist additiv bei statistischer Unabhängigkeit erhalten, aber nicht additiv sind H 2 , H 3 ... 2. Gesamtteilchenzahl N̂ • (Dreh-)Impuls ist hier nicht relevant, da im Gleichgewicht immer 0 Weitere, für uns wichtige Erhaltungsgrößen werden wir bei den Anwendungen besprechen und hier nur allgemein erinnern, daß Erhaltungsgrößen immer mit Symmetrien bzw. Invarianzeigenschaften der Dynamik unter gewissen Transformationen zu tun haben. Wir gehen nun von einem vollständigen Satz von erhaltenen Größen F̂i (i = 1, ..., k) aus, wobei wir annehmen können, daß F̂1 = H, F̂2 = N̂ . Es gilt Kommutieren mit H [H, F̂i ] = 0 (1.37) und Additivität. Ferner wollen wir paarweises Vertauschen voraussetzen, d.h. [F̂i , F̂i ] = 0 (evtl. einige Größen “streichen”, siehe später Magnetismus). ln ρ muß Pk eine Linearkombination der Erhaltungsgrößen F̂i sein ln ρ = a · Id + i=1 λi F̂i , wobei λi und a Konstante (Zahlen) sind. Der nichttriviale Teil dieser Beziehung wird durch die F̂ -Terme ausgedrückt, der erste Term sichert nur die Normierung (Sp ρ = 1). Aus praktischen Erwägungen wollen wir aber a = λ0 · V schreiben (formal ist das Volumen streng additiv und natürlich erhalten, fügt sich also als F̂0 in die obige Liste ein) und erhalten ln ρ = λ0 V + k X λi F̂i , (1.38) i=1 bzw. ρg = 1 Pk λi F̂i , e i=1 Zg (1.39) wobei Zg = e−λ0 V . Der Dichteoperator wie in (1.39) ist der Dichteoperator der (allgemeinen) großkanonischen Gesamtheit, Zg heißt die großkanonische Zustandssumme. Zg ergibt sich aus Sp ρ = 1 zu Pk Zg = Sp e i=1 λi F̂i . (1.40) Die physikalischen Meßgrößen Fi hängen ab von der Größe des Systems, d.h. sind proportional zu der Anzahl der Freiheitsgrade (Teilchen) bzw. Volumen 14 A. Klümper V . Die “Felder” λi sind von der Größe unabhängig. Definition: extensiv: proportional zur Systemgröße, intensiv: unabhängig. Extensive Größen bezogen auf das Volumen geben Anlaß zur Definition von Dichten, z.B. für Energie und Teilchenzahl: Energie- und Teilchen-Dichte e = lim E/V , n = lim N/V . Wir notieren nun eine nützliche Relation zur Bestimmung von Fj allein unter Benutzung der Zustandssumme Es folgt direkt Pk Sp e i=1 λi F̂i F̂j Pk . Fj = hF̂j i = Sp ρg F̂j = Sp e i=1 λi F̂i Fi = ∂ ln Zg . ∂λi (1.41) (1.42) Es besteht eine Reziprozität zwischen den extensiven Meßgrößen Fi und den intensiven Feldern λi . Bemerkung: ρg und Zg sind Funktionen der intensiven Größen λi und des Volumens V . Dies sind die sogenannten “natürlichen Variablen” der großkanonischen Gesamtheit. Die Observablen F̂i nehmen in der großkanonischen Gesamtheit keine scharfen Werte an, sondern es gilt nur Fi = hF̂i i. Mit anderen Worten: die großkanonische Gesamtheit enthält Mikrozustände mit unterschiedlichen Eigenwerten zu F̂i , z.B. der Energie. In dieser Gesamtheit ist das System also offen bzgl. des Austausches der Erhaltungsgrößen mit der Umgebung (Wärme-, Teilchen-Austausch). Wir werden aber die Schwankung der Observablen um ihre Mittelwerte betrachten und feststellen, daß diese klein (“unterextensiv”) ist, s. (1.31). Wir können uns nun auf den Standpunkt stellen, daß bei hinreichend guter Isolierung der Austausch unterbunden wird und die Eigenwerte von einigen (oder allen) Erhaltungsgrößen scharf sind. Daher sollten in dieser Gesamtheit auch nur Mikrozustände mit festen Eigenwerten auftreten. Die Verkleinerung der großkanonischen zur (allgemeinen) kanonischen Gesamtheit wird durch Hinzufügen von δ-Funktionen erzielt, o.B.d.A. seien dies δ(F̂i − Fi ) für i = 1, ..., l wobei die Anzahl l der festen Eigenwerte 0, 1 ... k sein kann. ρkan,l = αρg δ(F̂1 − F1 ) · ... · δ(F̂l − Fl ) (1.43) Thermodynamik und Statistische Physik 15 Der konstante Faktor α wurde aus Normierungsgründen eingeführt. Wegen der δ-Funktionen können in dem Ausdruck für ρg die entsprechenden Operatoren durch ihre Eigenwerte ersetzt werden und wir erhalten den kanonischen Dichteoperator ρkan,l = 1 Zkan,l l Y i=1 δ(F̂i − Fi ) · e Pk i=l+1 λi F̂i , mit der kanonischen Zustandssumme ! à l Pk Y λi F̂i . Zkan,l = Sp δ(F̂i − Fi ) · e i=l+1 (1.44) (1.45) i=1 Der Grenzfall l = 0 ist der großkanonische Fall, für l = k erhalten wir die (allgemeine) mikrokanonische Gesamtheit mit ρmik = 1 Zmik k Y i=1 δ(F̂i − Fi ), Zmik = Sp k Y i=1 δ(F̂i − Fi ). (1.46) Wir notieren noch die “natürlichen Variablen” der kanonischen Gesamtheit ρkan,l = ρkan,l (F1 , ..., Fl ; λl+1 , ..., λk ; V ), (1.47) analog ist auch Zkan,l eine Funktion der (k − l) intensiven Felder λi und der l extensiven Meßgrößen F1 ,...,Fl sowie V . Die Mittelwerte der Operatoren F̂i mit i = l + 1, ..., k berechnen sich wie in (1.42) ∂ ln Zg . (1.48) Fi = ∂λi Die verschiedenen Gesamtheiten beschreiben alle das thermische Gleichgewicht. Wir werden noch sehen, daß die Gesamtheiten äquivalent sind (s. weitere Paragraphen). In den Übungen wird besprochen, daß für Systeme in mikrokanonischer Gesamtheit “kleine” (aber noch makroskopische) Untersysteme immer durch kanonische Gesamtheiten beschrieben werden. Dies stellt einen Zusammenhang der verschiedenen Gesamtheiten dar mit im Vergleich zu obiger Besprechung umgekehrter Richtung. Bemerkung: Extensivität Offensichtlich sind additive Größen auch extensiv. Wir wollen hier überlegen, daß auch bei nicht streng additiven Größen Extensivität vorliegen kann. Wir betrachten zwei gleichgroße Systeme mit Volumen Vi = V und Hamiltonoperator Hi , und setzen diese Systeme zu einem Gesamtsystem des Volumens 2V mit Hamiltonoperator 16 A. Klümper H = H1 + H2 + W, (1.49) zusammen, wobei W eine Wechselwirkung zwischen den beiden Systemen darstellt und typischerweise entlang der Grenzfläche mit Reichweite a wirkt. 1 2 V1 = V V2 = V a Wir können den Erwartungswert von W abschätzen, da die Grenzfläche von der Größe V 2/3 ist: hW i ≃ aV 2/3 −→ lim V →∞ 1 hW i = lim = 0. V →∞ V 1/3 V (1.50) Damit ist die Energie extensiv, d.h. die Energiedichte für jedes Einzelsystem gleich der Energie des Gesamtsystems. Schlußbemerkung: die eingeführten Gesamtheiten beschreiben alle das thermische Gleichgewicht. Der Unterschied besteht lediglich darin, daß die Systeme in verschiedener Weise offen oder abgeschlossen sind. Wir werden in den Übungen besprechen, daß die Äquivalenz nicht nur mathematisch gültig ist, sondern für ein jedes System in mikrokanonischer Gesamtheit, kleine (aber noch makroskopische) Subsysteme durch kanonische Gesamtheiten beschrieben werden (Gibb’sches Theorem). 1.4 Mikrokanonische Gesamtheit Wir wollen hier die eigentliche mikrokanonische Gesamtheit besprechen, bei der Volumen V , Energie E (F̂1 = H), Teilchenzahl N (F̂2 = N̂ ) fest sind. Wir haben statt (1.46) ρmik = 1 Zmik δ(E − H), Zmik = Sp δ(E − H). (1.51) Wir wollen hier die Eigenwerte von Teilchenzahloperator und das Volumen implizit als konstant voraussetzen (also V und N implizit – wie üblich – in H enthalten). In der mikrokanonischen Gesamtheit sind also alle Mikrozustände gleicher Energie E gleichwahrscheinlich. Als Variablen treten 3 extensive Größen auf: ρmik = ρmik (E, N, V ), Zmik = Zmik (E, N, V ). (1.52) Thermodynamik und Statistische Physik 17 Wir betrachten die Anzahl aller Zustände mit Energie ≤ E und bezeichnen diese Zahl mit Φ(E) Φ(E) = Sp Θ(E − H). (1.53) Hier ist Θ(x) (wie immer) gleich 1 für x > 0, und 0 für x < 0. Die Zustandsdichte Ω(E) ist definiert als die Anzahl der Zustände im Energieintervall [E, E + dE] bezogen auf die Breite dE Φ(E + dE) − Φ(E) = Φ′ (E) dE = Sp δ(E − H). Ω(E) = (1.54) (1.55) Spätestens hier wollen wir anmerken, daß für endliche Systeme das Spektrum diskrete Teile umfassen mag, diese jedoch im thermodynamischen Limes √ auf einer extensiven Energie-Skala, bei der dE groß ist (z.B. proportional zu N ), durch ein Kontinuum beschrieben werden. Durch Vergleich mit (1.51) sehen wir Ω(E) = Zmik (E, N, V ). (1.56) Da H und N̂ fest sind, gilt hHi = E, hH 2 i = E 2 ; hN̂ i = N, hN̂ 2 i = N 2 , (1.57) damit verschwinden die Schwankungen ∆H = ∆N = 0. 1.5 Die kanonische Gesamtheit Als eigentliche kanonische Gesamtheit versteht man das Ensemble, in dem das System nur bezüglich H offen ist, aber N und V fest. Der Dichteoperator lautet 1 −βH e , Zkan = Sp e−βH , (1.58) ρkan = Zkan wobei wir im Vergleich zu (1.44) die Konstanz von N als implizit in H enthalten vorausgesetzt haben und ferner λ1 = −β gesetzt haben. Die Vorzeichenwahl entspricht üblichen Konventionen und garantiert, daß Konvergenz der Zustandssumme vorliegt, da die Spektren aller (thermodynamisch stabilen) Systeme nach unten, aber nicht nach oben beschränkt sind. Als Variablen treten 2 extensive Größen V , N , und 1 intensives Feld β auf: ρkan = ρkan (β, N, V ), Zkan = Zkan (β, N, V ). (1.59) ∂ ln Zkan ∂β (1.60) Wir notieren die Beziehung (1.48) E = hHi = − 18 A. Klümper Damit legt β die mittlere Energie E = E(β, N, V ) fest. Wir können uns auch umgekehrt β als Funktion von E, N, V denken, da die Beziehung umkehrbar ist. Dies folgt aus ∂ 2 E = −hH 2 i + hHi = −(∆H)2 ≤ 0, ∂β (1.61) womit E eine monoton fallende Funktion von β ist. Wir definieren nun die Temperatur T = 1 , βkB kB = 10−16 erg (approx.) K (1.62) Da in der Mechanik-Vorlesung, die Sie besucht haben, der Begriff der Temperatur nicht eingeführt wurde, haben wir hier die Möglichkeit, es in geeigneter Weise zu tun. Wir wollen natürlich später im Kapitel II verstehen, daß die hier eingeführte Temperatur mit der sog. absoluten Temperatur übereinstimmt. Die Boltzmann-Konstante tritt nur aus historischen Gründen auf, da man T in Kelvin (K) mißt. (Gasthermometer sind vor der Statistischen Mechanik eingeführt worden.) kB ist an sich völlig überflüssig, da T auch in Einheiten der Energie (erg) gemessen werden könnte. kB ist keine Fundamentalkonstante wie c oder h̄. Wir wollen aus (1.61) noch etwas über die Stärke der Energieschwankung lernen. Da E extensiv, aber β intensiv ist, ist auch dE/dβ extensiv, also (∆H)2 der Ordnung O(N ) bzw µ ¶ 1 ∆H = ∆H = O(N 1/2 ), → 0 im thermodyn. Limes (1.63) hHi N 1/2 Dies bedeutet, daß die Energie zwar schwankt, daß aber die Verteilung der Eigenwerte ein scharfes Maximum beim Mittelwert haben muß. Den Grund für diese Eigenschaft wollen wir nun verstehen. Die Wahrscheinlichkeit wH (E) wie in (1.26) definiert berechnet sich zu 1 Sp e−βH δ(E − H) Zkan 1 −βE 1 −βE = e Sp δ(E − H) = e Ω(E) Zkan Zkan wH (E) = hδ(E − H)i = (1.64) (1.65) Diese Funktion hat die bemerkenswerte Eigenschaft, daß für große Systeme gilt £ ¤N e−βE = e−βe Ω(E, N, V ) = [ω(e, n)]N (1.66) (1.67) Thermodynamik und Statistische Physik 19 wobei e = E/N die Energiedichte, n = N/V die Teilchendichte, und ω eine intensive Größe bzw. Funktion der intensiven Variablen e und n ist. (Unter anderem ist die Zustandsdichte Ω eine mit N und E extrem schnell anwachsende Funktion.) Daher ist wH (E) = 1 £ −βe ¤N e ω(e, n) (1.68) Zkan £ ¤N R wobei Zkan = N de e−βe ω(e, n) . Da das Spektrum durch die Grundzustandsenergie nach unten beschränkt ist, hat die Verteilungsfunktion Ω bzw. ω die Eigenschaft, für hinreichend niedrige Energien gegen 0 zu tendieren. Für e gegen +∞ mag zwar ω(e) wie eine Potenzfunktion divergieren, der Faktor exp(−βe) fällt jedoch exponentiell ab, so daß f (e) := e−βe ω(e, n) eine Funktion mit Maximum bei einem eM ist und wH (E) = f (E/N )N /Zkan eine Funktion mit im thermodynamischen Limes (N → ∞) extrem scharfem Maximum bei E/N = eM und Integral 1. [f(e)] N f(e) eM e Bei der Berechnung von Erwartungswerten zählt dann nur noch die enge Nachbarschaft von eM . Es folgt Z ∞ dE ′ E ′ wH (E ′ ) = N eM =: E (1.69) hHi = −∞ Die hier besprochene Methode der Auswertung von Integralen des Typs Z dxg(x)f (x)N = (...)g(xM )f (xM )N für N → ∞, (1.70) wobei die Funktion f (x) ihr Maximum bei xM annimmt, ist bekannt als Sattelpunkts-Integration. Wir wollen uns an dieser Stelle nicht mit der genauen Auswertung des Faktors (...) beschäftigen und nur darauf hinweisen, daß dieser im wesentlichen nicht von g(x) abhängt, so daß R dxg(x)f (x)N R = g(xM ). (1.71) dxf (x)N 20 A. Klümper Wir wollen nun die Berechnung der kanonischen Zustandssumme aus der mikrokanonischen vornehmen. Wir bemerken Z Z Zkan (β) = Sp e−βH dEδ(E − H) = dESp e−βH δ(E − H) (1.72) Z Z −βE = dEe Sp δ(E − H) = dEe−βE Zmik (E), (1.73) ein derartiger Zusammenhang ist als Laplace-Transformation bekannt. Nach dem oben Gesagten erwarten wir im thermodynamischen Limes (SattelpunktIntegration) einen wesentlichen Beitrag durch das Maximum des Integranden bei E. Dieses Maximum bestimmen wir für vorgegebenes β indem wir den Logarithmus des Integranden nach E differenzieren β= d ln Zmik (E), dE (1.74) der extensive Anteil von ln Zkan (β) ergibt sich dann durch ln Zkan (β) = −βE + ln Zmik (E). (1.75) Ein derartiger Zusammenhang ist bekannt als Legendre-Transformation von der Funktion ln Zmik (E) auf die Funktion ln Zkan (β), wobei das Argument E durch (1.74) aus β bestimmt ist. Die Differentialschreibweise von (1.74) ist d ln Zmik (E) = βdE, (1.76) und mit (1.75) folgt äquivalent d ln Zkan (E) = −Edβ. (1.77) Wir wollen diesen Paragraphen mit zwei Bemerkungen abschließen. Wir hatten den Parameter β oben mit der Begründung eingeführt, daß die meisten Spektren nach oben unbeschränkt sind und aus Konvergenzgründen β ≥ 0 sein sollte. Offensichtlich gilt diese Begründung nicht für Spektren, die sowohl nach unten wie oben beschränkt sind. Als Realisierungen derartiger Systeme werden wir in den Übungen Spinsysteme kennenlernen, bei denen auch β < 0 (und damit (T < 0) möglich ist. Etwas weniger formal, können negative Temperaturen mittels (1.74) verstanden werden. Für Spektren, die sowohl nach unten wie oben beschränkt sind, ist die Zustandsdichte Ω(E) = Zmik (E) eine Funktion, die bei hinreichend niedrigen wie hohen Energien verschwindet, also sowohl monoton steigende als auch fallende Flanken besitzt. Daher ist die Ableitung wie in (1.74) positiv wie auch negativ. Wir wollen uns zuletzt die Frage stellen, wie in der kanonischen Gesamtheit der Druck eines Systems charakterisiert durch β, N, V zu berechnen ist. Die Thermodynamik und Statistische Physik 21 erste Erwartung könnte sein, die Volumenabhängigkeit des Erwartungswertes der Energie E zu berechnen. Dies führt auf folgenden Ausdruck p |{z} = − (?) X ∂ E= (wn En′ + wn′ En ) ∂V n (1.78) wobei wn die Boltzmann-Gewichte e−βEn /Zkan bezeichnet, und ’ die Ableitung nach V . Wenn wir jedoch typische thermodynamische Experimente betrachten, wird uns auffallen, daß diese nur langsame Volumenänderungen erlauben, d.h. quasi-statische bzw. adiabatische Prozesse, bei denen das System immer im thermodynamischen Gleichgewicht bleibt. Derartige adiabatische Prozesse sind durch Abwesenheit von Übergängen zwischen einzelnen Mikrozuständen charakterisiert. M.a.W.: die Wahrscheinlichkeiten wn der einzelnen Mikrozustände ändern sich nicht. Wir werden somit den Mittelwert der Drücke der individuellen Mikrozustände messen mit festen wn . Daher gilt X p= wn En′ . (1.79) n Diese Größe ist jedoch nicht die Volumenabhängigkeit der mittleren Energie, sondern die Volumenabhängigkeit der sog. “freien Energie” F F := − − 1.6 ∂ F = − ∂V 1 ln Zkan (β), β X e−βEn ∂ n Zkan ∂V (1.80) En = X wn pn = p (1.81) n Großkanonische Gesamtheit Im (eigentlichen) großkanonischen Ensemble ist nur das Volumen fest, neben Energie- soll auch Teilchenaustausch möglich sein (F̂1 = H, F̂2 = N̂ ), beschrieben durch zwei intensive Variable λ1 und λ2 . Wir setzen λ1 = −β, λ2 = βµ, (1.82) wobei wie oben die Temperatur als T = 1/(kB β) definiert wird und das der Teilchenzahl zugeordnete “Feld” µ per definitionem chemisches Potential heißt. Anstelle von (1.39) haben wir ρg = 1 −β(H−µN̂ ) e , Zg Zg = Sp e−β(H−µN̂ ) . (1.83) Als Variable treten 1 extensive Größe V , und 2 intensive Felder β, µ auf: ρg = ρg (β, µ, V ), Zg = Zg (β, µ, V ). (1.84) 22 A. Klümper Wie in der kanonischen Gesamtheit ist die Beziehung E = E(β) umkehrbar. Analoges gilt für N = N (µ). (1.48) lautet 1 ∂ ln Zg (β, µ, V ), β ∂µ ln Zg (β, µ, V ) = βµN + ln Zkan (β, N, V ), N= und weiter 2 ∂ N = β[hN̂ 2 i − hN̂ i ] = β(∆N )2 ≥ 0. ∂µ (1.85) (1.86) (1.87) √ Außerdem ist (∆N )2 = O(N ), die Schwankung ∆N/N = O(1/ N ). 1.7 Thermodynamische Potentiale Wir nehmen hier wieder die allgemeine Betrachtung und Entwicklung der Statistischen Physik auf und wenden uns den allgemeinen kanonischen Gesamtheiten zu. Wir hatten schon gesehen wie der Übergang von der mikrokanonischen zur kanonischen Gesamtheit im thermodynamischen Limes durch eine Legendre-Transformation bewerkstelligt wird (1.74) und (1.75). Ganz allgemein lautet dieser Zusammenhang ln Zkan,l−1 (F1 , ..., Fl−1 , λl , λl+1 , ..., λk ) = λl Fl +ln Zkan,l (F1 , ..., Fl , λl+1 , ..., λk ), (1.88) mit der Bestimmungsgleichung für Fl bei vorgegebenem λl λl = − ∂ ln Zkan,l (..., Fl , ...). ∂Fl (1.89) Mit den Relationen (1.42) und (1.89) haben wir die Möglichkeit innerhalb einer beliebigen kanonischen Gesamtheit die intensiven und extensiven Parameter einer beliebigen anderen kanonischen Gesamtheit zum gleichen Makrozustand zu berechnen. In Differentialschreibweise haben wir d ln Zkan,l = −λ1 dF1 ... − λl dFl + Fl+1 dλl+1 + ... + Fk dλk (1.90) was “mehr oder weniger” äquivalent zu (1.88) und (1.89) ist (s. Übungen). Anstelle der Logarithmen der Zustandssummen führt man sog. thermodynamische Potentiale Φkan,l ein durch 1 ln Zkan,l (F1 , ..., Fl , βµl+1 , ..., βµk ), β (1.91) sowie die (allgemeinen) chemischen Potentiale µi durch Φkan,l (F1 , ..., Fl , µl+1 , ..., µk ) = − λi = βµi . (1.92) Thermodynamik und Statistische Physik 23 (Für Fi = H gilt also µi = −1, für Fi = N̂ gilt µi = µ). Es gilt für (1.88) nun Φkan,l−1 = −µl Fl + Φkan,l , (1.93) und es gilt natürlich ∂ Φkan,l (i = 1, ..., l) ∂Fi ∂ Fi = − Φkan,l (i = l + 1, ..., k). ∂µi µi = (1.94) (1.95) Hier ist nur die Sonderrolle der Energie bzw. der Temperatur zu beach∂ βΦkan,l und E = ten: falls Fi = E, heißen die letzten Relationen −β = ∂E ∂ βΦ (sofern E bzw. β zu den natürlichen Variablen gehört). kan,l ∂β Das Differential lautet dβΦkan,l = βµ1 dF1 + ... + βµl dFl − Fl+1 dβµl+1 ... − Fk dβµk (1.96) Bevor wir uns mit Beispielen beschäftigen, wollen wir bemerken, daß wir auf Grund der Beziehung (1.81) das Volumen V und (-) Druck −p wie Erhaltungsgröße F̂i und chemisches Potential µi behandeln können (Frage: “Volumenoperator”?). Beispiel: mikrokanonische Gesamtheit (l = k = 3) Hier haben wir F1 = H, F2 = N , F3 = V , Wir werden im nächsten Abschnitt die Entropie S detailliert besprechen. In der mikrokanonischen Gesamtheit lautet sie S = kB ln Zmik , (1.97) also eine extensive Größe. Das thermodynamische Potential der mikrokanonischen Gesamtheit ist Φmik = −T S (1.98) und es gilt β= 1 ∂S ∂ ln Zmik = ∂E kB ∂E (1.99) Wir notieren (1.96) und erhalten T dS = dE − µdN + pdV. (1.100) Nutzen wir nun die Extensivität der Entropie, so erhalten wir S((1 + ǫ)E, (1 + ǫ)N, (1 + ǫ)V ) = (1 + ǫ)S(E, N, V ). (1.101) Differenzieren nach ǫ und anschließendes Setzen auf 0 liefert E ∂ ∂ ∂ S+N S+V S = S, ∂E ∂N ∂V (1.102) 24 A. Klümper oder unter Benutzung von (1.100), d.h. p/T , folgt T S = E − µN + pV ∂ ∂E S = 1/T , ∂ ∂N S Duhem-Gibbs. ∂ ∂V = −µ/T , S= (1.103) Bilden wir das Differential der wichtigen Duhem-Gibbs-Relation und subtrahieren (1.100), so erhalten wir die differentielle Duhem-Gibbs-Relation SdT + N dµ − V dp = 0. (1.104) Bemerkung: Wir wollen hier die Extensivität des allgemeinen thermodynamischen Potentials nutzen und leiten genau wie eben aus (1.96) her Φkan,l = µ1 F1 + ...µl Fl . (1.105) Merkwürdigerweise ist das großkanonische Potential (l = 0, wichtig: Offenheit auch bezüglich des Volumens) gleich 0. Dies ist nicht mehr verwunderlich, wenn man erkennt, daß ein extensives System nicht allein durch intensive Variable beschrieben werden kann. 1.8 Die Entropie Wir kommen nun zum zentralen Begriff der Thermodynamik. Wir definieren für einen beliebigen Dichteoperator ρ die Entropie S durch S[ρ] = −kB hln ρi = −kB Sp ρ ln ρ. (1.106) Wie schon bei der Definition der Temperatur bemerkt, tritt kB nur aus historischen Gründen auf. In der Informationstheorie entspricht “Entropie” ↔ “−Informationsgehalt”. Da für die Eigenwerte ρν gilt 0 ≤ ρ ≤ 1 und x ln x ≤ 0 für 0 ≤ x ≤ 1 folgt X S[ρ] = −kB ρν ln ρν ≥ 0. (1.107) ν Für (und nur für) einen reinen Zustand ρ (ρ1 = 1, ρν = 0, ν > 1) gilt S[ρ] = 0. (1.108) Dies bedeutet volle Information, da der Mikrozustand den das System annimmt eindeutig ist. Für S > 0 ist der Mikrozustand des gemischten Systems unbestimmt. Je größer S ist, desto größer ist unsere Unkenntnis, desto größer die “Unordnung”. Für Gleichgewichtszustände ist die Entropie allein eine Funktion des Makrozustandes, d.h. in jedem Ensemble nimmt S den gleichen Wert an. Wir hatten in (1.97) schon benutzt, daß in mikrokanonischer Gesamtheit S[ρmik ] = kB ln Zmik = E − µN + pV T (1.109) Thermodynamik und Statistische Physik 25 Beweis: In mikrokanonischer Gesamtheit lautet der Dichteoperator (1.46) bzw. 1 ρmik = δ(E − H), Zmik = Sp δ(E − H) (1.110) Zmik wobei wir N , V implizit festhalten. Wir müssen hier die Diskussion einer “Subtilität” nachholen, nämlich die Wohldefiniertheit des δ(...)-Ausdruckes, womit wir immer eine Regularisierung in Form einer hohen Stufenfunktion verstehen wollen. ½ 1/dE, für |x| ≤ dE/2, (1.111) δ(x) = 0, sonst. Hier soll dE ein Energieintervall mit einer Breite groß gegen mikroskopische Energie-Niveaus und -Abstände aber klein gegen extensive Größen sein. Mit der Zustandsdichte Ω(E) = Zmik ergibt sich die Anzahl der Zustände im Energieintervall [E − dE/2, E + dE/2] zu Ω(E)dE. Die Eigenwerte von ρ (in der besprochenen Regularisierung) sind 0 oder 1/(ZdE), wobei die Anzahl letzterer Eigenwerte (natürlich) gleich ZdE ist. Die Gleichung (1.107) liefert S[ρmik ] = −kB ·Zmik dE· 1 Zmik dE ln 1 Zmik dE = kB ln Zmik +kB ln dE. (1.112) Wir erinnern uns an (1.56) und (1.67) und sehen, daß in dem letzten Ausdruck genau kB ln Zmik extensiv ist, nicht jedoch kB ln dE. Damit ist die erste Gleichung in (1.109) bewiesen, d.h. es wurde gezeigt, daß die allgemeine Definition der Entropie dieses Paragraphen in mikrokanonischer Gesamtheit auf (1.97) führt. Die zweite Gleichung ist sodann nichts weiter als (1.103). Wir wollen nun zeigen, daß die Entropie allein durch den Makrozustand definiert ist. Dazu wollen wir exemplarisch die großkanonische Gesamtheit benutzen und zeigen, daß sich der gleiche Ausdruck wie in (1.109) (r.S.) ergibt. Unter Benutzung von (1.83) folgt S[ρg ] = −kB h−β(H − µN̂ ) − ln Zg i = E − µN + kB ln Zg . T (1.113) Nun ist aber das thermodynamische Potential Φg (T, µ, V ) = − β1 ln Zg (T, µ, V ) extensiv. Wie schon gehabt folgt nun Φg = V ∂ Φg = −pV, ∂V | {z } (1.114) =−p wobei die Beziehung der partiellen Ableitung zum Druck p genauso gilt wie die analoge Beziehung (1.81), die in der kanonischen Gesamtheit formuliert war. Also ist (1.113) mit (1.114) zu (1.109) äquivalent, d.h. S[ρmik ] = S[ρg ]. 26 A. Klümper Ganz allgemein haben erhalten wir S in der kanonischen Gesamtheit zu " k # " k # X 1 X S = −kB λi Fi − ln Zkan,l = − µi Fi + Φkan,l , (1.115) T i=l+1 i=l+1 und die Unabhängigkeit von der Gesamtheit folgt aus z.B. (1.93). Innerhalb der großkanonischen Gesamtheit sind Subsysteme, die Austausch bzgl. aller Erhaltungsgrößen erlauben, statistisch unabhängig und die Entropie ist hier additiv ρI+II = ρI · ρII S[ρI+II ] = −kB Sp ρI+II ln ρI+II = −kB Sp ρI+II ln ρI − kB Sp ρI+II ln ρII (1.116) = −kB Sp I ρI ln ρI Sp II ρII +(I ↔ II) = S[ρI ] + S[ρII ], {z } | {z } | =1 =S[ρI ] wobei zuletzt benutzt wurde Sp I+II AI BII = (Sp I AI ) · (Sp II BII ). Für nicht offene Systeme gilt die Additivität der Entropie nicht streng. Die statistische Unabhängigkeit ist nicht all zu sehr gestört, so daß die Entropie eine extensive Größe ist. Extremaleigenschaften der Entropie Die Entropie ist ein nichtnegatives Funktional auf der Menge aller Dichteoperatoren. Aus dieser Menge wird durch Nebenbedingungen der Art hF̂i i = Sp ρF̂i = Fi eine Teilmenge ausgesondert. Einer der Dichteoperatoren dieser Teilmenge ist der kanonische DO ρkan,l . Satz: Für alle DO ρ mit Fi fest (i = 1, ..., l), Sp ρF̂i = Fi (i = l + 1, ..., k), (1.117) gilt S[ρ] ≤ S[ρkan,l ], (1.118) d.h. die kanonische Verteilung ist diejenige, die unter den genannten Nebenbedingungen die Entropie maximiert. Beweis: siehe Übungen. Ein zentraler Schritt ist der Beweis der Ungleichung Sp ρ̄(ln ρ − ln ρ̄) ≤ 0, (1.119) für beliebige Dichteoperatoren ρ und ρ̄. Unter allen Zuständen mit den Nebenbedingungen (1.117) ist der Gleichgewichtszustand der ungeordnetste. Dies ist eine durchaus plausible Eigenschaft Thermodynamik und Statistische Physik 27 des Gleichgewichts. Wir betrachten jetzt einen Prozeß in einem System von einem beliebigen Anfangszustand, nicht notwendig ein Gleichgewichtszustand, d.h. ρ̄(t), wobei die Größen H, N̄ , V̄ (wir können das Volumen formal durch einen Operator beschreiben, s. Bemerkung im Anschluß an (1.96)) die Werte Ē = Sp ρ̄H, N̄ = Sp ρ̄N̂ , V̄ = Sp ρ̄V̂ , Entropie S̄, (1.120) annehmen. Am Ende des Prozesses, bei dem sich Energie, Teilchenzahl, Volumen geändert haben können, sei das System im thermischen Gleichgewicht beschrieben durch ein großkanonisches Ensemble mit Parametern T , µ, p ρg = e−β(H−µN̂ +pV̂ ) , (1.121) wobei wir (1.83) mit (1.114) benutzt haben. Mit den Gleichgewichtsmittelwerten E = Sp ρH, N = Sp ρN̂ , V = Sp ρV̂ , Entropie S, (1.122) sind die (nicht notwendig infinitesimalen) Änderungen ∆S = S − S̄, ∆E = E − Ē, ∆N = N − N̄ , ∆V = V − V̄ . (1.123) Es gilt T ∆S ≥ ∆E − µ∆N + p∆V. (1.124) Beweis: S̄ = −kB Sp ρ̄ ln ρ̄ 1 = ≤ −kB Sp ρ̄ ln ρg |{z} Sp ρ̄[H − µN̂ + pV̂ ] |{z} T (1.119) (1.121) 1 1 = S − [∆E − µ∆N + p∆V ]. = [Ē − µN̄ + pV̄ ] |{z} T T (1.125) (1.103) Bei Abgeschlossenheit gilt ∆E = 0, ∆N = 0, ∆V = 0, so daß ∆S ≥ 0. Außerdem zeigt die Erfahrung, daß ein abgeschlossenes System immer ins Gleichgewicht strebt. Folglich strebt jedes abgeschlossene System dem Maximum der Entropie zu. Ferner ist die Entropie eines abgeschlossenen Systems am größten im Gleichgewicht, d.h. S̄ ≤ SGleichgewicht . Dies ist der 2. Hauptsatz der Thermodynamik. Beispiel: Thermodynamische Potentiale Eine typische Aufgabe lautet: (a) gegeben sei die freie Energie F = F (T, N, V ) (thermodynamisches Potential der kanonischen Gesamtheit), wie lautet die Entropie in den natürlichen 28 A. Klümper Variablen der mikrokanonischen Gesamtheit? (b) Anwendung auf ein Gas aus klassischen Teilchen µ ¶ V 3/2 F (T, N, V ) = −N kB T ln T α N (1.126) wobei α eine Konstante ist. Lösung: (a) Spezialisieren von (1.96) liefert dβF = βµdN − βpdV + Edβ, (1.127) woraus folgt ∂F ¯¯ ∂βF ¯¯ = βµ ⇒ = µ, ¯ ¯ ∂N ¯ V,T ∂N V,T ¯ ∂βF ¯ ∂F ¯ = −βp ⇒ = −p, ¯ ¯ ∂V ¯ N,T ∂V N,T ∂βF ¯ ∂F ¯¯ ∂F ¯¯ =E ⇒E =F +β =F −T . ¯ ¯ ¯ ∂β N,V ∂β N,V ∂T N,V (1.128) Aus der letzten Gleichung folgt F −E ∂F ¯¯ = = −S. ¯ |{z} ∂T N,V T (1.129) (1.115) Dies ist die gesuchte Beziehung. Die Entropie ergibt sich aus Differentiation von F als Funktion von T , V , N . Im letzten Schritt ergibt sich E = F + T S als Funktion von T , V , N , und durch Umkehrung T = T (E, N, V ). Die Gleichungen für die partiellen Ableitungen nach V , N und nun T lassen sich ferner zum Differential zusammenfassen dF = µdN − pdV − SdT. (1.130) (b) Anwendung ¶ µ ∂F ¯¯ 3 V 3/2 S=− T α + N kB = N kB ln ¯ ∂T N,V N 2 3 E = F + T S = N kB T à 2µ ¶3/2 ! 2E 3 V α + N kB . ⇒ S = N kB ln N 3N kB 2 (1.131) Thermodynamik und Statistische Physik 2 29 Thermodynamik des Gleichgewichts Wir wollen hier allgemeine Relationen zwischen thermodynamischen Größen im wesentlichen auf der im letzten Kapitel geschaffenen Basis herleiten und anwenden. Zunächst wollen wir einen kurzen Überblick über die klassische Thermodynamik geben und zeigen, wie unter anderem die Begriffe Temperatur und Entropie eingeführt werden, und warum diese mit denen des letzten Kapitels identisch sind. 2.1 Abriß der klassischen Thermodynamik Der Ausgangspunkt ist hier eine empirische Beschreibung makroskopischer Systeme durch Zustandsvariable. Ein System im Gleichgewicht heißt thermodynamisches System und wird beschrieben durch wenige Makrovariable Extensive Größen: E, V , N , (siehe später S), Intensive Größen: p, θ (empirische Temperatur, siehe später: µ). Drei dieser Größen sind unabhängig und definieren den Zustand, die restlichen sind festgelegt, d.h. Funktionen der übrigen Größen. (Dies gilt für ein einkomponentiges System. Für mehrere Komponenten führt man Teilchenzahlen Ni der einzelnen Komponenten i ein.) Ein Beispiel für eine derartige Abhängigkeit ist p = p(T, N, V ) = p(T, N/V ), (2.1) und heißt auch Zustandsgleichung. (Für ein klassisches, ideales Gas gilt p= N V kB T .) Häufig hält man auch N fest und betrachtet dann nur noch die Abhängigkeit von zwei unabhängigen Variablen, die den Zustand, in einem Zustandsdiagramm durch einen Punkt dargestellt, festlegen. p p 2 1 2 1 V T Prozeß: Änderung von einem Zustand (1) in einen anderen Zustand (2) durch Veränderung der äußeren Bedingungen. Quasistatischer (qs) Prozeß: ein Prozeß, der langsam (quasistatisch) im Vergleich zu Relaxationszeiten verläuft, so daß nur Gleichgewichtszustände durchlaufen werden. 30 A. Klümper Bemerkung: manchmal wird der Begriff “quasistatisch” im weiteren Sinne (“langsam”) benutzt, ohne zu fordern, daß sich das (Gesamt-)System zu jedem Zeitpunkt im Gleichgewicht befindet. Wir werden an geeigneter Stelle den Unterschied betonen. Ein quasistatischer Prozeß läßt sich also in einem Zustandsdiagramm durch eine Linie zwischen Anfangszustand (1) und Endzustand (2) darstellen. Nichtquasistatische Prozesse durchlaufen Nichtgleichgewichtszustände, die nicht im Zustandsdiagramm verlaufen. Bestenfalls kann eine “Projektion” auf die Diagrammebene dargestellt werden, in unserem Beispiel durch eine gestrichelte Linie. p p qs 2 qs 1 2 1 nicht−qs nicht−qs V T Beispiel: Expansion eines Gases von Volumen V1 auf V2 > V1 . Für Zustandsgrößen wie E, V , N etc. gilt dann Z 2 dE ist unabhängig vom Weg, (2.2) ∆E = E2 − E1 = 1 d.h. dE ist ein vollständiges Differential. Man verwendet δ-Differentiale bei infinitesimalen Größen δu, wenn dazu keine Zustandsgröße u existiert. Beispiel: f = f (x, y) µ ¶ µ ¶ ∂f ∂f dx + dy = δu + δv, df = (2.3) ∂x y ∂y x | {z } | {z } δu δv R2 wobei ∆u = u2 − u1 = 1 δu im allgemeinen wegabhängig ist, ebenso ∆v. Natürlich ist ∆u + ∆v wegunabhängig. Der erste entscheidende empirische Gesichtspunkt ist die Feststellung, daß Wärme eine Form der Energie darstellt. Dies führt zum 1. Hauptsatz der Thermodynamik Bei einer beliebigen Zustandsänderung zwischen einem Anfangszustand (1) und einem Endzustand (2) ist die Summe der zugefügten Wärme ∆Q und der von außen geleisteten Arbeit ∆A wegunabhängig und gleich der Änderung der gesamten inneren Energie (die dadurch als Zustandsgröße definiert wird) Thermodynamik und Statistische Physik ∆E = ∆Q + ∆A. 31 (2.4) Bemerkung: Bei infinitesimalen Änderungen schreiben wir ∆E = δQ + δA, (2.5) wodurch wir andeuten, daß Wärme und Arbeit selbst vom Weg abhängig sind. Für die am System geleistete Arbeit ist dies direkt einsichtig, da δA = −pdV, (2.6) so daß in einem p − V -Diagramm die (vom System geleistete) Arbeit gleich der Fläche unter der Prozeßlinie ist. Die weitere Entwicklung der Thermodynamik hängt ab von der Möglichkeit, von δQ ausgehend ein vollständiges Differential zu definieren. Im Rahmen der klassischen Thermodynamik gelingt dies mit Hilfe des 2. Hauptsatz der Thermodynamik Wir notieren zwei äquivalente Formulierungen Es gibt keine thermodynamischen Prozesse, deren einzige Wirkung darin besteht, daß eine Wärmemenge einem Wärmespeicher entzogen und (a) vollständig in Arbeit umgesetzt wird (Kelvin, Perpetuum mobile 2. Art), (b) an einen wärmeren abgegeben wird (Clausius). (Das Wort “einzig” soll andeuten, daß alle weiteren Komponenten einer Maschine nach Ausführung des Prozesses sich wieder im Ausgangszustand befinden.) Wir wollen nun zeigen, daß beide Formulierungen äquivalent sind. Dazu bemühen wir an geeigneter Stelle eine thermodynamische Maschine, die eine Wärmemenge Q2 einem Wärmespeicher mit Temperatur θ2 entnimmt, Wärme Q1 an einen Wärmespeicher der Temperatur θ1 (< θ2 ) abgibt, und die Differenz in Form von Arbeit A (= Q2 − Q1 ) leistet. Nach Durchführung des Prozesses soll die Arbeitssubstanz (S) im Ausgangszustand vorliegen (Kreisprozeß). Für eine derartige Maschine definieren wir den Wirkungsgrad durch Q1 A =1− . (2.7) η= Q2 Q2 Schematisch stellen wir die Maschine dar durch: 32 A. Klümper θ2 Q 2 A= Q − Q 1 2 C Q1 θ1 “(a) ⇐ (b)” Wir nehmen also an, daß Aussage (a) nicht gilt, m.a.W. wir können Wärme Q einem Wärmespeicher entnehmen und vollständig in Arbeit umwandeln A = Q. Diese Arbeit kann dann natürlich an ein beliebiges Reservoir der Temperatur θ2 > θ1 abgegeben werden (“Tauchsieder”). Dies steht im Widerspruch zu (b). “(a) ⇒ (b)” Wir nehmen nun an, daß (b) nicht gilt, also ein Prozeß existiert, der Wärme von einem Reservoir bei Temperatur θ1 nach θ2 > θ1 transportiert. Wir lassen nun eine thermodynamische Maschine laufen, die wie oben aus eine Wärmemenge Q2 bei Temperatur θ2 entnimmt, die Wärmemenge Q1 bei Temperatur θ1 abgibt und Arbeit A = Q2 − Q1 leistet. Wir können dann die Wärmemenge Q1 von Temperatur θ1 nach θ2 transportieren und haben einen Gesamtprozeß, der die Wärmemenge Q2 − Q1 vollständig in Arbeit umwandelt im Widerspruch zu (a)! Wir können aus dem 2. Hauptsatz nicht nur qualitative, sondern auch quantitative Aussagen ziehen. Wir notieren dazu den Begriff der Reversibilität Prozesse, die auch zeitlich umgekehrt durchlaufen, thermodynamisch erlaubt sind. Ein Prozeß ist reversibel genau dann, wenn das Gesamtsystem (System+Umgebung) sich quasistatisch ändert und zu jedem Zeitpunkt im Gleichgewicht ist. Bemerkung: Besteht das Gesamtsystem aus mehreren Teilen, so erstreckt sich die letzte Aussage (quasistatisch, Gleichgewicht) auf jede Komponente. Beachte, daß es quasistatische (langsame) Prozesse gibt, die Nichtgleichgewichtszustände durchlaufen, z.B. realisiert ein Wärmekontakt zwischen ungleich warmen Körpern einen quasistatischen Wärmeaustausch. Die ungleich warmen Körper in Kontakt befinden sich jedoch nicht im Gleichgewicht. Ein nichtquasistatischer Prozeß wie die instantane Expansion eines Gases ist natürlich nicht reversibel. Wir betrachten nun spezielle thermodynamische Maschinen, die reversibel arbeiten: Carnot-Maschinen. Wir wollen an dieser Stelle zur Realisierung Thermodynamik und Statistische Physik 33 von Carnot-Maschinen auf weiter unten und insbesondere auf die Übungen verweisen. Hier wollen wir den wichtigen Satz beweisen: (a) alle Carnot-Maschinen, die die gleichen Wärmespeicher mit Temperaturen θ1 < θ2 benutzen haben gleichen Wirkungsgrad, (b) keine Maschine (weder reversibel noch irreversibel), die einen Kreisprozeß zwischen denselben Temperaturen ausführt, hat einen größeren Wirkungsgrad als ein Carnot-Prozeß. zu (a): Wir nehmen an, daß zwei Carnot-Prozesse gegeben seien (C und C ′ ) mit unterschiedlichen Wirkungsgraden, o.B.d.A. η > η ′ . Dann können wir den Prozeß C ′ (reversibel!) rückwärts laufen lassen als Wärmepumpe. Wir koppeln dann C und C ′ (rückwärts) in der folgenden Weise θ2 Q Q’ 2 2 A C C’ Q ’1 Q1 θ1 so daß C die Arbeit A leistet, die von C ′ vollständig verbraucht wird. Die Gesamt-Maschine leistet folglich keine Arbeit, sondern transportiert Wärme. Es gilt ηQ2 = A = η ′ Q′2 , (2.8) woraus direkt folgt Q′2 = η Q2 > Q2 . η′ (2.9) Folglich wird an das Reservoir mit Temperatur θ2 eine positive Wärmemenge (Q′2 − Q2 ) transportiert, die aus dem Reservoir der Temperatur θ1 (< θ2 ) stammt. Ein derartiger Wärmetransport ist jedoch nach dem 2. Hauptsatz der Thermodynamik verboten! zu (b): Wir nehmen an, daß es einen (evtl. irreversiblen) Prozeß P gibt, mit höherem Wirkungsgrad als zu C. Wir können nun die gleiche Überlegung wie oben durchführen mit der Ersetzung (C, C ′ ) ↔ (P, C), insbesondere ist C reversibel und kann rückwärts ablaufen. Genau wie oben realisiert die gekoppelte Maschine einen nicht erlaubten Wärmetransport. 34 A. Klümper Wir haben nun erkannt, daß der Wirkungsgrad eines Carnot-Prozesses nur abhängt von den Temperaturen θ1 und θ2 der benutzten Wärmereservoirs (η = η(θ1 , θ2 ), nicht jedoch von der tatsächlichen Realisierung, d.h. benutzte Substanz etc. Wir definieren nun die absolute Temperatur T = T (θ) derart, daß 1 − η(θ1 , θ2 ) = T (θ1 ) . T (θ2 ) (2.10) Achtung: diese Beziehung ist keine (reine) Definition der Funktion T (θ). Es wird implizit behauptet, daß eine derartige Funktion existiert. Dies erkennen wir, wenn wir uns auf den Standpunkt stellen, daß T (θ) gegeben ist und gemäß (2.10) eine Funktion η = η(θ1 , θ2 ) definiert ist. Für diese Funktion gilt dann T (θ1 ) = [1 − η(θ1 , θ3 )]. [1 − η(θ1 , θ2 )] [1 − η(θ2 , θ3 )] = {z }| {z } T (θ3 ) | T (θ1 ) T (θ2 ) (2.11) T (θ2 ) T (θ3 ) Offenbar bedingt (2.10) die Beziehung (2.11). Man kann auch umgekehrt (selbst) zeigen, daß aus (2.11) schon (2.10) folgt mit einer geeigneten Funktion T (θ). Diese Funktion ist eindeutig definiert, wenn man von einem konstanten Skalierungsfaktor absieht. Wir wollen nun (2.11) beweisen. Dazu halten wir fest [1 − η(θ1 , θ2 )]Q2 = Q2 − A = Q1 . (2.12) Wenn wir nun für die Temperaturen θ1 < θ2 < θ3 die beiden Arbeitsmaschinen wie im Diagramm koppeln θ3 Q 3 Q− Q2 3 Q2 θ2 Q 2 Q− Q1 2 Q1 θ1 Thermodynamik und Statistische Physik 35 liefert die “obere” Maschine an das Wärmereservoir mit Temperatur θ2 genausoviel Wärme, wie die “untere” verbraucht. Der Wirkungsgrad berechnet sich aus einer konsekutiven Anwendung von (2.10) Q1 = [1 − η(θ1 , θ2 )]Q2 , Q2 = [1 − η(θ2 , θ3 )]Q3 , ⇒ Q1 = [1 − η(θ1 , θ2 )][1 − η(θ2 , θ3 )]Q3 , (2.13) (2.14) andererseits gilt für die kombinierte Maschine, die ein Carnotprozeß allein zwischen den Temperaturen θ1 und θ3 darstellt Q1 = [1 − η(θ1 , θ3 )]Q3 , (2.15) [1 − η(θ1 , θ2 )][1 − η(θ2 , θ3 )] = [1 − η(θ1 , θ3 )], (2.16) der Vergleich liefert also tatsächlich (2.11). Wir haben schließlich die absolute Temperatur gemäß (2.10) definiert. Der freie Skalierungsfaktor soll nach der üblichen Konvention so festgelegt werden, daß T (Tripelpunkt des Wassers) = 273, 16 K(elvin). (2.17) Unter anderem fixiert dies die Boltzmann-Konstante auf den Wert wie in (1.62) angegeben. In den Übungen werden Sie sich davon überzeugen, daß die hier definierte Temperatur mit der in Kapitel I gegebenen übereinstimmt. Unter Verwendung der absoluten Temperatur kann man nun eine Zustandsfunktion definieren, die man Entropie nennt. Bei einem beliebigen quasistatischen Kreisprozeß gilt Z δQ = 0, (2.18) geschl.Weg T wobei δQ positiv (negativ) gewertet wird, wenn die Wärme aufgenommen (abgegeben) wird. (Der Beweis ergibt sich durch eine Parkettierung der eingeschlossenen Fläche durch infinitesimale Streifen, die durch Isothermen begrenzt sind. Hierdurch werden infinitesimale Carnot-Prozesse mit µ ¶ Z Q2 −Q1 Q2 T1 Q1 δQ = + = − =0 (2.19) T2 T1 T1 T2 Q2 inf.Carnot−P. T definiert, wobei wir benutzt haben (2.7) und (2.10). In der Summe dieser Integrale heben sich die Integrationswege innerhalb der umrandeten Fläche gerade paarweise auf, nicht so die Stücke, die am Flächenrand verlaufen. 36 A. Klümper Dieser Rest ist identisch zur linken Seite von (2.18), aber wegen (2.19) letztendlich gleich 0.) Wegen (2.18) ist nun für alle Prozesse, die vom Zustand (1) zu Zustand (2) R2 führen, das Integral 1 δQ/T dasselbe, so daß eine Zustandsfunktion S, die Entropie, durch Z 2 δQ = S(2) − S(1), (2.20) T 1 definiert wird. Jetzt ist auch unsere frühere Frage, wie δQ (durch einen geeigneten Multiplikator) durch ein vollständiges Differential ausgedrückt werden kann, beantwortet δQ = T dS. (2.21) Irreversible Prozesse Für beliebige nichtreversible Zustandsänderungen (also nichtquasistatische mit beispielsweise plötzlicher Volumenzunahme, oder mit langsamen Prozessen, die Wärmetransport von warmen zu kälteren Teilen der “Arbeitssubstanz” beinhalten, und damit keine Gleichgewichtszustände realisieren) gilt Z 1 2 δQ < S(2) − S(1), T (2.22) wobei hier δQ die Wärmemenge ist, die vom System aus der Umgebung aufgenommen wird durch einen Substanzteil, der die (wohldefinierte!?) Temperatur T besitzt. Der Grund für die Ungleichung ist verständlich, wenn man beachtet, daß die rechte Seite die Änderung einer Zustandsgröße ist, die sich im Prinzip durch ein Integral wie auf der linken Seite (Ersatzprozeß) berechnet, wobei allerdings im Falle der nichtreversiblen Zustandsänderung das Gesamtsystem in viele Subsysteme, die einzeln im Gleichgewicht sind, zerlegt und der gesamte Wärmetransport berücksichtigt werden muß. Auf der linken Seite von (2.22) ist der Wärmeaustausch mit der Umgebung berücksichtigt, nicht jedoch der Austausch von Wärme innerhalb des Körpers von wärmeren zu kälteren Teilen. Dadurch ist vernachlässigt µ ¶ 1 −Q 1 Q + = Q − >0 (2.23) |{z} T1 T1 T2 T2 | {z } >0 >0 wobei Q exemplarisch die Wärmemenge ist, die von T2 nach T1 (< T2 ) transportiert wird. Dies ist der Teil, der die Differenz von l.S. zu r.S. in (2.22) ausmacht. Thermodynamik und Statistische Physik 37 Im Falle nichtquasistatischer Änderungen in Form einer plötzlichen Volumenzunahme wollen wir statistisch-mechanisch argumentieren, indem wir auf das vergrößerte Phasenvolumen hinweisen, das mit einer größeren Unordnung, d.h. Entropie verbunden ist. Oder aber wir verweisen einfach auf (1.124) des Kapitels I. Für ein thermisch isoliertes System gilt immer δQ = 0 und mit (2.22) S(2) ≥ S(1), (2.24) wobei das Gleichheitszeichen genau für reversible Prozesse und das Ungleichheitszeichen für irreversible Prozesse steht. Wir sammeln zum Abschluß dieses Paragraphen noch einige Begriffe und Eigenschaften zu Thermodynamische Maschinen und Kreisprozesse Viele Maschinen benutzen eine Arbeitssubstanz, die einen zyklischen Prozeß durchläuft. In einem p − V –Diagramm sieht ein derartiger Prozeß wie folgt aus p p qs qs nicht−qs V V Im ersten Fall ist ein Kreisprozess gezeigt, der allein Gleichgewichtszustände durchläuft. Der dargestellte Prozeß ist ein reversibler Prozeß der Arbeitssubstanz. Je nachdem wie der Wärmetransport mit der Umgebung erfolgt, mag der Gesamtprozeß reversibel sein oder auch nicht! (Bei Verwendung nur zweier Wärmereservoirs arbeitet ein generischer, reversibler Kreisprozeß nur in irreversibler Weise mit der Umgebung, siehe Übungen). Im zweiten Fall verlaufen Teile des Prozesses in nichtquasistatischer Weise. Hier ist weder der Prozeß der Arbeitssubstanz noch der Gesamtprozeß reversibel. Maschinen, die wie in der Abbildung rechts herum laufen (Rechtsprozesse), leisten Arbeit. Da pdV die vom System geleistete (infinitesimale) Arbeit ist, ergibt sich die gesamte geleistete Arbeit A als eingeschlossene Fläche im p − V –Diagramm. Diese Prozesse realisieren Arbeitsmaschinen. Die aufgenommene Wärmemenge Q2 ist größer als die abgegebene Wärmemenge Q1 , Q2 = A + Q1 . Wir hatten schon den Wirkungsgrad einer Arbeitsmaschine definiert als η= Q2 − Q1 Q1 geleistete Arbeit = =1− . aufgenommene Wärme Q2 Q2 (2.25) 38 A. Klümper Maschinen, die links herum laufen (Linksprozesse), nehmen Arbeit auf. Die vom System aufgenommene Arbeit −A ergibt sich als eingeschlossene Fläche im p − V –Diagramm. Diese Prozesse realisieren Wärmepumpen. Die aufgenommene Wärmemenge −Q1 ist kleiner als die abgegebene Wärmemenge −Q2 , Q2 = A + Q1 . Der Wirkungsgrad der Wärmepumpe ist definiert als ηW = abgegebene Wärme Q2 = = aufgenommene Arbeit Q2 − Q1 µ 1− Q1 Q2 ¶−1 . (2.26) Beachte, daß η und η W reziprok aussehen. Es scheint, daß eine schlechte Arbeitsmaschine eine gute Wärmepumpe darstellt. Dies setzt aber voraus, daß der Rechtsprozeß umgekehrt als Linksprozeß durchlaufen werden kann, also reversibel ist! Kreisprozesse bestehen häufig aus einer Kombination von einfachen Teilprozessen, mit festgehaltener Temperatur (Isotherme), Entropie (Adiabate/Isentrope), Druck (Isobare), Volumen (Isochore). Beispiel des “StandardCarnot-Prozesses”: p isotherm adiabatisch adiabatisch isotherm V Zu Kreisprozessen im T −S–Diagramm siehe Übungen, ebenso die Diskussion von (Ir-)Reversibilität von Kreisprozessen. 2.2 Thermodynamische Größen Wir haben jetzt die Diskussion der klassischen Thermodynamik abgeschlossen und erlauben wieder eine vollständige Nutzung der Kenntnisse aus Kapitel I, “Statistische Physik”. Wir wollen hier die üblichen thermodynamischen Variablen E, N , V , S, T , µ, p als Zustandsvariablen auffassen, die einen Makrozustand charakterisieren, der auf einer 3-dimensionalen Mannigfaltigkeit “lebt” (also durch 3 unabhängige Variable charakterisiert ist). Welche 3 Größen die “natürlichen” Variablen sein sollen, können wir für den Moment unbestimmt lassen und abstrakt von Funktionen f und deren Differentialen df sprechen. In diesem Sinne erinnern wir an (1.100), d.h. T dS = dE − µdN + pdV. (2.27) Wenn wir die Größen N und V festhalten, sondern wir eine 1-dimensionale Untermannigfaltigkeit aus, d.h. einen Weg entlang dessen wir die Variation Thermodynamik und Statistische Physik 39 von E bei Variation von S bestimmen können. In dieser Weise erhalten wir aus (2.27) ¶ ¶ µ µ 1 ∂S ∂E bzw. (2.28) = T = ∂S N,V T ∂E N,V In analoger Weise erhalten wir µ ¶ ∂E µ= ∂N S,V bzw. µ =− T µ ∂S ∂N ¶ , (2.29) E,V das chemische Potential ist also die Energie, die ein Teilchen mitbringen muß, um das Gleichgewicht bei festem S, V nicht zu stören. Ferner ¶ ¶ µ µ p ∂S ∂E bzw. . (2.30) = p=− ∂V S,N T ∂V E,N Gleichgewichtsbedingungen Wir wissen, die Entropie eines abgeschlossenen Systems ist im Gleichgewicht im Maximum. Wir betrachten nun ein Gesamtsystem bestehend aus zwei Subsystemen in Kontakt. 111111111111 00000 0000000 00000 11111 0000000 1111111 00000 11111 0000000 1111111 00000 11111 0000000 1111111 000001111111 11111 0000000 1 2 Wegen Abgeschlossenheit ist die Summe der Energien (Volumina, Teilchenzahlen) der Subsysteme gleich der Gesamtenergie und damit eine Konstante E = E1 + E2 , V = V1 + V2 , N = N1 + N 2 . (2.31) Die Gesamtentropie berechnet sich ebenfalls als Summe der Entropien der Subsysteme S = S1 (E1 , V1 , N1 ) + S2 (E2 , V2 , N2 ), (2.32) wobei die Aufteilung der Erhaltungsgrößen Energie etc. auf die Subsysteme so erfolgt, daß S maximal ist, insbes. bei Variation δEi , δVi , δNi ein stationärer Punkt vorliegt. Wir betrachten zunächst eine Variation δEi und halten die anderen Größen fest 0 = δE1 + δE2 , µ ¶ ∂S ∂S1 ∂S2 ∂S1 ∂S2 1 1 0= = + = − = − . ∂E1 ∂E1 ∂E1 ∂E1 ∂E2 |{z} T1 T2 (2.28) (2.33) 40 A. Klümper Nun gilt Gleichheit der Temperaturen T1 = T2 . Führen wir eine ähnliche Überlegung durch und betrachten Variation des Volumens, aber halten die übrigen Größen fest, so folgt mittels (2.29) p2 p1 = , T1 T2 (2.34) also mit der Gleichheit der Temperaturen gilt auch p1 = p2 . Und schließlich folgt bei Variation der Teilchenzahl µ1 = µ2 . Fazit: ein System ist genau dann im thermischen Gleichgewicht, wenn die intensiven Größen T , p, µ (allgemeiner: alle Felder) in beliebigen Subsystemen gleiche Werte annehmen. Wärmefluß Wir schauen uns zwei Teilsysteme, die gerade in Kontakt gebracht werden, genauer an. Zunächst sind die Temperaturen T1 und T2 im allgemeinen nicht gleich, aber der Gleichgewichtszustand wird angestrebt (empirisch), in dem sich die Temperaturen angeglichen haben (siehe oben). In Abhängigkeit von der Zeit t haben wir E = E1 (t) + E2 (t), S(t) = S1 (E1 (t)) + S2 (E2 (t)), Nach dem 2. Hauptsatz (z.B. nach Formulierung in Kapitel I) folgt ¶ µ ¶ µ dS dE1 ∂S2 dE1 1 ∂S1 1 0< = − = − , dt ∂E1 ∂E2 dt T1 (t) T2 (t) dt (2.35) (2.36) 1 Wenn also T1 > T2 muß dE dt < 0 sein, d.h. Wärme fließt von der höheren zur niedrigeren Temperatur. Damit ist der 2. Hauptsatz, wie der Abhandlung der klassischen Thermodynamik zu Grunde gelegt, abgeleitet. Bemerkung: In den Übungen werden Sie eine ähnliche Überlegung für Spinsysteme durchführen, wobei T > 0 und T < 0 erlaubt sind, also auch negative Temperaturen auftreten können. Sie werden sehen, daß im obigen Sinne negative Temperaturen immer als heißer als jede positive Temperatur angesehen werden können! Thermodynamische Potentiale Wir hatten schon thermodynamische Potentiale in verschiedenen Gesamtheiten eingeführt als Funktionen der “natürlichen Variablen” Fi und λj , so daß sich λi und Fj durch geeignete partielle Ableitungen ergeben. Wir finden es jedoch praktischer mit T und µj zu arbeiten, wobei λT = −β = −1/kB T , λj = βµj . Thermodynamik und Statistische Physik 41 (1) Wir wollen nochmal die thermodynamischen Potentiale Revue passieren lassen, wobei wir nur fordern, daß Ableitungen nach den extensiven Größen Fi die intensiven liefern (T , µi ) und umgekehrt. Wir haben (1.100) und DuhemGibbs (1.103) dE = T dS − pdV + µdN, E = T S − pV + µN. (2.37) (2.38) Wenn wir in der mikrokanonischen Gesamtheit statt der 3 extensiven Größen E, V , N den Satz S, V , N als Variable benutzen, kann E = E(S, V, N ) als thermodynamisches Potential der mikrokanonischen Gesamtheit aufgefaßt werden. (Achtung: hier gibt es einen leichten Unterschied zu Kapitel I wo Φmik = −T S = Φmik (E, V, N ). Der Grund liegt in der Sonderrolle, die die Temperatur T spielt. In Kapitel I waren konjugiert Fi und λi , insbesondere hatten alle Produkte λi Fi die gleiche Einheit, tatsächlich dimensionslos. Hier in Kapitel II wollen wir als konjugiert betrachten Fi und µi , deren Produkte immer die Einheit der Energie haben. Wenn wir neben den µi als gleichartige intensive Variable die Temperatur T behandeln wollen, so kann die dazu konjugierte Größe nicht die Energie selbst sein, aber die Entropie hat die richtige Dimension!) Wir werden jedoch sehen, daß in vielen Fällen, wenn wir thermodynamische Potentiale in Abhängigkeit von T (statt S) behandeln, genau die “alten” aus Kapitel I erscheinen. Die Energie bezeichnet man auch als 1. thermodynamisches Potential. Als weitere thermodynamische Potentiale erhalten wir die Größen, wenn wir in (2.38) Legendre-Transformationen für einige bis zu allen Argumenten durchführen. Hier gibt es insgesamt 2×2×2 = 8 Möglichkeiten. Bei jeder LegendreTransformation wird einer der Terme T S, pV , µN von der rechten Seite von (2.38) auf die linke Seite geschafft. Dies wollen wir im einzelnen studieren. In der Praxis betrachtet man jedoch nicht alle 8 Potentiale, sondern zu dem mikrokanonischen Potential zusätzlich nur 4 weitere. (2) Freie Energie Wir führen eine Legendre-Transformation bzgl. der ersten Variable (S) aus F = F (T, V, N ) := E − S ∂E = E − T S |{z} = −pV + µN, ∂S |{z} (2.37) (2.39) (2.38) wobei in E die Abhängigkeit von der neuen Variablen T über S = S(T, V, N ) nach Umkehrung von T = T (S, V, N ) erscheint. Das Differential berechnet sich nach (2.37) dF = dE − T dS − SdT = −SdT − pdV + µdN, (2.40) im Vergleich zu (2.37) sind im ersten Term T und S vertauscht worden und das Vorzeichen hat sich geändert. 42 A. Klümper Explizit bedeutet dies µ ¶ ∂F −S = , ∂T V,N −p = µ ∂F ∂V ¶ , µ= T,N µ ∂F ∂N ¶ . (2.41) T,V Mit einem Blick auf (1.115) folgt auch ρkan = eβ(F −H) , F = −kB T ln Zkan , (2.42) d.h. F ist in der kanonischen Gesamtheit über die Zustandssumme berechenbar. Bemerkung: In Kapitel I lieferte die Legendre-Transformation ausgehend von Φmik = −T S −→ Φmik − (−E) = E − T S, was identisch ist mit E −→ E − T S, d.h. gleich F . Bedeutung: die Arbeitsleistung am System −pdV bei konstantem N und T geht nicht direkt in die Energie, sondern in die freie Energie dF = −pdV (dN = dT = 0). (3) Enthalpie Wir führen eine Legendre-Transformation bzgl. der zweiten Variablen (V ) aus H = H(S, p, N ) := E − V ∂E = E + pV |{z} = T S + µN, ∂V |{z} (2.37) (2.43) (2.38) wobei in E die Abhängigkeit von der neuen Variablen p über V = V (S, p, N ) nach Umkehrung von p = p(S, V, N ) erscheint. Das Differential berechnet sich aus (2.37), wobei im zweiten Term p und V ausgetauscht werden und sich das Vorzeichen ändert dH = T dS + V dp + µdN. Explizit bedeutet dies ¶ µ ∂H , T = ∂S p,N V = µ ∂H ∂p ¶ , S,N µ= (2.44) µ ∂H ∂N ¶ . (2.45) S,p (4) Freie Enthalpie Wir führen eine Legendre-Transformation bzgl. der ersten und zweiten Variablen aus G = G(T, p, N ) := E − T S + pV = µN, (2.46) mit dG = −SdT + V dp + µdN, (2.47) Thermodynamik und Statistische Physik 43 explizit −S = µ ∂G ∂T ¶ , V = p,N µ ∂G ∂p ¶ , T,N µ= µ ∂G ∂N ¶ . (2.48) T,p Mit (1.115) folgt auch G = −kB T ln Zkan,2 , ρkan,2 = eβ(G−H−pV ) , (2.49) d.h. G ist in der (allg.) kanonischen Gesamtheit mit Austausch von E und V über die Zustandssumme berechenbar. (5) Großkanonisches Potential Wir führen eine Legendre-Transformation bzgl. der ersten und dritten Variablen aus Φ = Φ(T, V, µ) := E − T S − µN = −pV, (2.50) mit dΦ = −SdT − pdV − N dµ, (2.51) explizit −S = µ ∂Φ ∂T ¶ , V,µ −p = µ ∂Φ ∂V ¶ , T,µ −N = µ ∂Φ ∂µ ¶ . (2.52) T,V Mit (1.115) folgt Φ = −kB T ln Zg , ρg = eβ(Φ−H+µN̂ ) , (2.53) d.h. Φ ist in der großkanonischen Gesamtheit mit Austausch von E und N über die Zustandssumme berechenbar. Bemerkung: alle Potentiale sind extensiv. Wir werden manchmal Dichten dieser Potentiale und anderer extensiver Größen betrachten und dann durch kleine Bustaben kennzeichnen. Damit erhalten wir ¶ µ S V , , E = E(S, V, N ) = N e µN N¶ V , F = F (T, V, N ) = N f T, N ¶ µ S ,p , H = H(S, p, N ) = N h N G = G(T, p, N ) = N g(T, p), mit µ = g, Φ = Φ(T, V, µ) = −V p(T, µ). (2.54) Abgeleitete Größen 44 A. Klümper Man interessiert sich z.B. dafür, wieviel Wärme nötig ist, um in einem quasistatischen Prozeß die Temperatur zu ändern (Wärmekapazität), Druckabhängigkeit des Volumens (Kompressibilität), oder Temperaturabhängigkeit des Volumens (thermischer Ausdehnungskoeffizient): Wärmekapazität (spezifische Wärme) (δQ)qs ∂S =T , (2.55) dT ∂T (extensive Größe). Üblicherweise ist N fest, wobei dann noch p oder V festgehalten werden und man einführt ¶ ¶ µ µ ∂E ∂S = , CV,(N ) = T ∂T N,V |{z} ∂T N,V (2.37) µ ¶ ¶ µ ∂S ∂H Cp,(N ) = T = , (2.56) ∂T N,p |{z} ∂T N,p C= (2.44) Kompressibilität κ=− 1 ∂V , V ∂p (2.57) (intensive Größe). Bei festem N können dann noch T (isotherm) oder S (adiabatisch) festgehalten werden µ ¶ 1 ∂V κT,(N ) = − , V ∂p T,N µ ¶ 1 ∂V . (2.58) κS,(N ) = − V ∂p S,N Thermischer Ausdehnungskoeffizient µ ¶ 1 ∂V α= , V ∂T p,N (2.59) (intensive Größe). Die hier aufgeführten C, κ, α sind die gebräuchlichsten, da sie direkt meßbar sind. Wir wollen zeigen, daß die c’s und κ’s nichtnegativ sind. Als erstes zeigen wir CV,N ≥ 0. (2.60) Beweis: Ausgehend von (1.61) in der kanonischen Gesamtheit haben wir ¶ µ ∂E ∂ 2 2 = kB T 2 CV,N . (2.61) 0 ≤ (∆H) = − E = kB T ∂β ∂T V,N Thermodynamik und Statistische Physik 45 Die Wärmekapazität mißt die Energieschwankungen in der kanonischen Gesamtheit! Wir wollen weiterhin zeigen κT,N ≥ 0. (2.62) Beweis: Ausgehend von der großkanonischen Gesamtheit und (1.87) haben wir ¶ µ ∂N . (2.63) 0 ≤ β(∆N )2 = ∂µ T,V Aus der differentiellen Formulierung von Duhem-Gibbs (1.104) folgt für festes T : N dµ = V dp. Daher µ ¶ µ ¶ ∂N N ∂N 0≤ = . (2.64) ∂µ T,V V ∂p T,V Weiterhin ist p = p(T, V /N ), woraus folgt ¶ µ ¶ µ V ∂p ∂p =− , ∂N T,V N ∂V T,N also 0≤ 2.3 N V µ ∂N ∂p ¶ T,V =− N2 V2 µ ∂V ∂p ¶ = T,N (2.65) N2 κT,N . V (2.66) Thermodynamische Relationen (Maxwell Relationen) Wir untersuchen hier Relationen (Gleichungen und Ungleichungen) zwischen thermodynamischen Größen und ihren Ableitungen. Ab hier soll immer N fest sein, so daß alle Größen Funktionen von nur zwei unabhängigen Variablen sind. Es gibt drei Prinzipien aus denen wir Relationen ableiten. (i) Integrabilitätsbedingung Viele thermodynamische Größen stellen sich als partielle Ableitungen geeigneter therm. Potentiale dar. Da partielle Ableitungen 2. Ordnung unabhängig von der Reihenfolge sind, d.h. f = f (x, y) → df = ∂f ∂ ∂f ∂ ∂f ∂f dx + dy → = , ∂x ∂y ∂y ∂x ∂x ∂y folgt eine Fülle von Relationen. Wir notieren: (1) ¶ ¶ µ µ ∂p ∂S = , dF = −SdT − pdV → ∂V T ∂T V mit dE = T dS − pdV folgt (2.67) (2.68) 46 A. Klümper µ ∂E ∂V ¶ =T T µ ∂S ∂V ¶ T µ −p=T ∂p ∂T ¶ V − p, (2.69) und auch ¶ µ ¶ ¶ µ µ ¶ ¶ µ 2 ¶ µ µ ∂S ∂ ∂S ∂ p ∂cV ∂ =T =T =T . ∂V T ∂V ∂T V T ∂T ∂V T V ∂T 2 V (2.70) (2) µ ¶ ¶ µ ∂S ∂V dG = −SdT + V dp → − = = V α, (2.71) ∂p T ∂T p und µ ∂cp ∂p ¶ =T T à ∂ ∂p µ ¶ ! ∂S ∂T p =T T µ ∂ ∂T µ ∂S ∂p ¶ ¶ T p = −T µ ∂2V ∂T 2 ¶ , p (2.72) etc. (ii) Jacobi-Determinante Hier faßt man zwei thermodynamische Größen, f = f (x, y), g = g(x, y), zu einer zweikomponentigen Funktion zusammen, für die die Jacobi-Determinante wie in der Analysis definiert ist ∂(f, g) := Det ∂(x, y) µ ∂f ∂x ∂g ∂x ∂f ∂y ∂g ∂y ¶ = µ ∂f ∂x ¶ µ y ∂g ∂y ¶ x − µ ∂f ∂y ¶ µ x ∂g ∂x ¶ . (2.73) y (Verallgemeinerung auf 3 bzw. mehrdimensionalen Fall direkt möglich.) Viele therm. Relationen ergeben sich aus der Möglichkeit, die Jacobi-Determinante mittels Kettenregel zu berechnen. Seien f , g Funktionen von u, v, d.h. f = f (u, v), g = g(u, v), und u, v Funktionen von x, y, d.h. u = u(x, y), v = v(x, y), dann gilt ∂(f, g) ∂(f, g) ∂(u, v) = . (2.74) ∂(x, y) ∂(u, v) ∂(x, y) Eine Vereinfachung findet statt, wenn im Zähler und Nenner gleiche Größen auftreten µ ¶ µ ¶ µ ¶ µ ¶ µ ¶ ∂y ∂y ∂f ∂f ∂f ∂(f, y) − = . (2.75) = ∂(x, y) ∂x y ∂y x ∂y x ∂x y ∂x y Analog gilt ∂(y, f ) ∂(f, y) ∂(y, f ) ∂(f, y) = =− =− = ∂(x, y) ∂(y, x) ∂(y, x) ∂(x, y) µ ∂f ∂x ¶ y . (2.76) Thermodynamik und Statistische Physik 47 Wir notieren vier Anwendungen: (1) µ ∂p ∂T ¶ V ¡ ∂V ¢ α ∂(p, V ) ∂(p, V ) ∂(p, T ) ∂T p = = = −³ ´ = , ∂V ∂(T, V ) ∂(p, T ) ∂(T, V ) κT ∂p (2.77) T (2) µ ∂p ∂V ¶ S ¡ ∂S ¢ µ ¶ ∂(p, S) ∂p ∂(p, S) ∂(p, T ) ∂(V, T ) ∂T p = , = = ¡ ∂S ¢ ∂(V, S) ∂(p, T ) ∂(V, T ) ∂(V, S) ∂V T ∂T V (2.78) bzw. bei Benutzung von (2.56) und (2.58) Cp κT = . CV κS (2.79) (3) ¶ ∂(S, V ) ∂(S, V ) ∂(T, p) ∂S =T =T ∂T V " ∂(T, V ) ∂(T, p) ∂(T, V ) µ ¶ µ ¶ µ ¶ ¶ # µ ¶ µ ∂S ∂V ∂V ∂p ∂S =T − ∂V T ∂T p ∂p T ∂p T ∂T p 1 = Cp + T (V α)2 , |{z} −V κT CV = T µ (2.80) (2.72) oder umgestellt Cp − CV = T V α2 ≥ 0. κT (2.81) Mit (2.79) folgt auch κT − κS = κT µ CV 1− Cp ¶ = TV α2 . Cp (2.82) Nun folgen die Ungleichungen Cp ≥ CV ≥ 0, (4) Es gilt κT ≥ κS ≥ 0. (2.83) ¡ ∂T ¢ ∂(T, S) ∂(V, S) ∂(T, S) = = − ³ ∂V ´S = 1, ∂p ∂(p, V ) ∂(V, S) ∂(p, V ) ∂S (2.84) V wobei die letzte Gleichung mittels (i) “Integrabilitätsbedingung” für E, d.h. dE = T dS − pdV gewonnen wurde. 48 A. Klümper (iii) Stabilität: da die Entropie eines abgeschlossenen Systems im Gleichgewicht ihr Maximum annimmt, gilt für Fluktuationen zwischen zwei Untersystemen die Erhaltung (2.31) und (2.32). Wir hatten schon Stationarität ausgenutzt. Es gilt natürlich mehr, wir haben ein negativ-definites 2. Differential. In den Übungen wird diese Überlegung genauer besprochen. (Zerlege Gesamtsystem in zwei identische Subsysteme.) Wir wollen hier das Ergebnis festhalten 1 ∂2S 1 ∂2S ∂2S 2 2 (δE) + (δV ) + δEδV ≤ 0. 2 ∂E 2 2 ∂V 2 ∂E∂V (2.85) In den Übungen wird besprochen, wie hieraus c ≥ 0 und κT ≥ 0 folgt. 2.4 Irreversible Prozesse Zusätzlich zu den in Abschnitt II.1 besprochenen (im wesentlichen reversiblen) Kreisprozessen wollen wir hier zwei wichtige irreversible Prozesse untersuchen. Es wurde schon erwähnt: Expansion ins Vakuum: Wir betrachten ein Gas in einem Volumen V1 . Nach plötzlichem Entfernen einer Trennwand expandiert das Gas frei in ein größeres Volumen V2 . qs−Ersatzprozess V 111 000 000 111 000 111 000 111 1 E (1) (2) nicht−qs Prozess V V1 V2 Es wird weder Arbeit geleistet noch Wärme übertragen V2 δA = δQ = 0 → ∆E = 0 : E1 = E2 . (2.86) In einem Zustandsdiagramm ist der Prozeß natürlich nicht eintragbar, da die Zwischenzustände Nichtgleichgewichtszustände sind (punktiert). Da die Änderung von Zustandsgrößen wegunabhängig ist, kann die Änderung durch einen beliebigen, quasistatischen Ersatzprozeß berechnet werden. Entropieänderung: ∆S = S2 −S1 = Z 1 2 dS = Z 1 2 µ ∂S ∂V ¶ dV E = |{z} p dS= dE T + T dV Z 1 2 p dV > 0. (2.87) T Thermodynamik und Statistische Physik 49 Temperaturänderung: ∆T = T2 − T1 = mit µ ∂T ∂V ¶ = E ∂(T, E) ∂(V, T ) 1 =− ∂(V, T ) ∂(V, E) CV µ Z 2 µ ∂E ∂V 1 ∂T ∂V ¶ ¶ 1 = |{z} CV T dV, (2.88) E (2.69) · p−T µ ∂p ∂T ¶ ¸ . V (2.89) Für die explizite Rechnung brauchen wir ab jetzt eine Zustandsgleichung. In den Übungen werden Sie ∆S und ∆T für das ideale Gas berechnen. Joule-Thomson-Prozeß Ein Gas wird über ein Drosselventil vom Druck p1 auf einen Druck p2 (< p1 ) entspannt. Der Prozeß soll langsam (stationär) ablaufen, insbes. soll der Druck im linken Volumen konstant bei p1 gehalten werden, gleiches gelte für den Druck p2 im rechten Volumen. Dies wird durch geeignetes Nachführen der Stempel erreicht, wodurch der Verlust (Gewinn) durch die Strömung durch das Ventil ausgeglichen wird. Der Prozeß ist irreversibel, da es im Drosselventil zu Reibung kommt bzw. die Moleküle aus einem Bereich hoher Dichte (links) in einen Bereich niedriger Dichte (rechts) wechseln und das verfügbare Phasenvolumen vergrößert wird. Es wird keine Wärme zugeführt δQ = 0, aber es wird Arbeit geleistet δA = p1 V1 − p2 V2 . Daher ist die Enthalpie H eine Konstante (s. Übungen)! Es gibt eine Entropieerhöhung Z 2 V dp > 0, (2.90) ∆S = − 1 T da V /T > 0 aber dp < 0 (für einen geeigneten Ersatzprozeß). Damit haben wir unsere Erwartung von oben auch formal bestätigt. Für die Temperaturänderung gilt (s. auch wieder die Übungen) ¶ Z 2µ Z 2 ∂T dp, dT = T2 − T1 = ∂p H 1 1 µ ¶ ∂T V = (αT − 1). (2.91) ∂p H Cp Da Cp /V > 0 haben wir beim Joule-Thomson-Prozeß mit dp < 0 Temperaturerhöhung wenn α < 1/T , Temperaturerniedrigung wenn α > 1/T , Bei Gasen und Flüssigkeiten ist für tiefe Temperaturen α > 1/T , daher dient der Joule-Thomson-Prozeß, evtl. kaskadenförmig, zum Abkühlen und Verflüssigen. 50 A. Klümper Ideales Gas: Anwendung auf diesen Fall in den Übungen. 2.5 Tieftemperaturverhalten: Nernst’sches Theorem (3. Hauptsatz) ¡ ¢ Da CV > 0 und CV = ∂E ∂T V ist die Energie eines Systems bei festem V eine monotone Funktion der Temperatur. Bei T = 0 nimmt das System die kleinstmögliche Energie an: E(T = 0) = E0 = Grundzustandsenergie. Im allgemeinen ist der Grundzustand eindeutig, falls Entartung vorliegt soll g die Anzahl der Grundzustände bezeichnen. Bei T = 0 ist die Entropie S(T = 0) = kB ln g, (2.92) siehe auch Übungen. Falls g = 1 gilt S(T = 0) = 0, für beliebige V , N . (2.93) Selbst wenn g > 1, gilt bei realen Systemen höchstens g = O(N ) und damit S O(ln N ) = → 0 für N → ∞, N N (2.94) also bei T = 0 nur subextensiv. Dies ist das Nernst-Theorem: Die Entropie eines realistischen Systems verschwindet für T = 0 bei beliebigem V , N . In der axiomatischen Thermodynamik wird dieses Theorem empirisch als 3. Hauptsatz der Thermodynamik eingeführt. Folgerungen aus dem Nernst-Theorem sind: Verschwinden des therm. Ausdehnungskoeffizienten µ ¶ 1 ∂V = 0, α= V ∂T p ¶ µ α ∂p = 0, bei T = 0. = κT ∂T V Beweis: µ ∂V ∂T ¶ p =− µ ∂S ∂p ¶ , T µ ∂p ∂T ¶ = V µ ∂S ∂V (2.95) ¶ mit S(T = 0) = 0 unabhängig von weiteren Parametern. Verschwinden der Wärmekapazität , T (2.96) Thermodynamik und Statistische Physik Cx = T µ ∂S ∂T ¶ x →0 für T → 0. 51 (2.97) Siehe hierzu die Übungen. Unerreichbarkeit des absoluten Nullpunktes In üblichen thermodynamischen Prozessen werden abwechselnd adiabatische Expansionen und isotherme Kompressionen einer Substanz durchgeführt, um diese abzukühlen. Wählen wir zur Beschreibung der Substanz eine Zustandsgröße x (z.B. Volumen oder Druck ...) wird diese Größe zwischen zwei Extrema geführt x1 ≤ x ≤ x2 . Nun mündet jedoch jede Funktion S(T, xi ) bei T → 0 in 0 ein. T x=x 1 x=x 2 S Die horizontalen Teilprozesse gehören zu isothermen Kompressionen, bei denen im Idealfall Substanz und Reservoir konstante Temperatur haben. Insgesamt sieht man, daß eine unendliche Kaskade durchlaufen werden muß, um T = 0 zu erreichen. 2.6 Phasengleichgewichte Erfahrungsgemäß legen die Werte der intensiven Variablen T , p nicht immer den Zustand eines thermodynamischen Systems fest (wir betrachten hier durchaus den Fall eines einkomponentigen Systems mit fester Teilchenzahl N ). An sogenannten Koexistenz-Punkten, -Linien etc. (bzw. PhasenGrenzen) liegt eine Substanz in verschiedenen Zuständen (Phasen) vor, z.B. Wasser bei T = 373 K und p = 1 atm kann “flüssig” oder “gasförmig” sein mit beliebigen Mengenverhältnissen. Um den Zustand genau zu charakterisieren, ist bei Phasenkoexistenz noch die Angabe einer weiteren extensiven Variablen notwendig. Mit dieser Frage wollen wir uns später beschäftigen. Hier halten wir fest, daß bei geeigneten Werten der intensiven Variablen dieselbe Substanz in (zwei oder mehr) verschiedenen Phasen vorliegen kann. Die wichtigsten sind 52 A. Klümper fest, flüssig, gasförmig, mit verschiedenen Werten für Dichte etc. bei gleicher Temperatur und Druck. Eine weitere Einteilung von festen und flüssigen Phasen (mit zugehörigen Phasenübergängen) kann vorgenommen werden nach verschiedenen Kristallstrukturen etc. Auch bei Beachtung von magnetischen und elektrischen Eigenschaften egeben sich reichhaltige Phasendiagramme: (anti-) ferromagnetisch–paramagnetisch, supraleitend–normalleitend, suprafluid–normalflüssig etc. Wir wollen uns im Rahmen dieser Vorlesung mit zwei Fragenkreisen befassen. 1.) Wie läßt sich in einer phänomenologischen Thermodynamik die Koexistenz von Phasen und die Unterscheidung von Phasen beschreiben? Welche Zusammenhänge folgen aus den Hauptsätzen angewandt auf den Phasenübergang? 2.) Können wir eine mikroskopische Theorie entwickeln, d.h. thermodynamische Potentiale bzw. Zustandsgleichungen berechnen, die die Existenz von verschiedenen Phasen zeigen? Die Antwort auf Frage 2.) wollen wir in einigen Details erst zu Ende dieser Vorlesung geben. Im Augenblick wollen wir nur soviel sagen, daß grundsätzlich mikroskopische Theorien aufgestellt werden können. Wir hatten ja in Kapitel I diesen Weg beschritten, uns aber nicht über die tatsächliche Berechenbarkeit der Zustandssummen Klarheit verschafft. Diese Berechnungen sind sehr schwierig und Gegenstand der aktuellen Forschung (und wahrscheinlich auch der Forschung der nächsten Jahrzehnte). Eine Frage, die sich an die technische Komplexität anlehnt, aber direkte physikalische Konsequenzen hat, ist die Sorge, ob denn überhaupt Zustandssummen wie in Kapitel I eingeführt, Singularitäten zeigen können. Dies ist notwendig, um bei bestimmten Bedingungen für T , p einen Sprung z.B. in der Dichte zu beobachten. Man denke daran, daß die Temperatur T in analytischer Weise in Z = Sp exp(−βT ) eingeht und damit die Zustandssumme (für feste Systemgröße N ) eine analytische Funktion von T ist. Die Auflösung dieses Rätsels liegt im thermodynmischen Limes, in dem die notwendigen Singularitäten entstehen: für jedes endliche System sind die Abhängigkeiten der physikalischen Größen von T , p analytische Funktionen (d.h. in Potenzreihen entwickelbar, insbes. beliebig häufig differenzierbar). Dies gilt nicht mehr im thermodynamischen Limes (s. Übungen). Wir wollen uns jetzt intensiver mit dem Fragenkreis 1. befassen. Wir betrachten ein einkomponentiges System an einem T , p–Punkt mit Phasen- Thermodynamik und Statistische Physik 53 gleichgewicht von zwei Phasen, z.B. “flüssig” und “gasförmig”. Energie, Volumen, Teilchenzahl des Untersystems in Phase 1 seien E1 , V1 , N1 ; analog seien definiert E2 , V2 , N2 . Bei Abgeschlossenheit des Gesamtsystems sind E = E1 + E2 , V = V1 + V2 , N = N1 + N2 fest. Die Entropie S = S1 (E1 , V1 , N1 ) + S2 (E2 , V2 , N2 ) ist im Gleichgewicht maximal. Es folgt wie schon früher ∂S2 ∂S1 = → T1 = T2 = T, ∂E1 ∂E2 ∂S1 ∂S2 = → p1 = p2 = p, ∂V1 ∂V2 ∂S1 ∂S2 = → µ1 = µ2 . ∂N1 ∂N2 (2.98) (Gleichheit der freien Enthalpie G1 = G2 bzw. Stetigkeit von G im p − T − Diagramm.) Wir wollen wie oben als natürliche Variablen betrachten T , p, N , so daß folgt µ1 (p, T ) = µ2 (p, T ), (2.99) wobei µ1 (µ2 ) das chemische Potential ist, wie durch linksseitigen (rechtsseitigen) Grenzprozeß gewonnen µ µ 1 (T) µ 2(T) T=T(p) T Die beiden Phasen i = 1, 2 unterscheidet die verschiedene Abhängigkeit µi = µi (T, p)! Jede einzelne Funktion mag über den Grenzpunkt analytisch fortsetzbar sein, ohne jedoch mit der jeweils anderen Funktion übereinzustimmen! Thermodynamisch stabil ist der jeweils niedrigere Zweig. Zur Minimalitätseigenschaft der thermodynamischen Potentiale siehe die Übungen. Bei zwei verschiedenen Funktionen µ1 und µ2 , die von zwei Variablen abhängen liegt Gleichheit üblicherweise entlang einer Linie vor: p = p(T ). Man spricht von dieser Kurve als Dampfdruckkurve bei flüssig-gasförmig, Schmelzkurve bei fest-flüssig, Sublimationskurve bei fest-gasförmig. 54 A. Klümper Es können auch alle drei Phasen im Gleichgewicht vorliegen (koexistieren), µ1 (p, T ) = µ2 (p, T ) = µ3 (p, T ), an einem Punkt in der p, T Ebene: Tripelpunkt. Für vier oder mehr Phasen einer Substanz gibt es keine Koexistenz, es sei denn durch “Zufall”. Wir halten das Vorliegen der einzelnen Phasen im Phasen- oder ZustandsDiagramm fest. p Typische Substanz Wasser p negative Steigung fest fluessig 217.5 at kritischer Punkt gas Tripelpunkt fluessig fest 4.6 mm Hg gas T 0.0075 C 374.2 C T (pc = 221 bar, Tc = 647, 1 K und pt = 6 mbar = 611 Pa, Tt = 273, 16 K.) Außerhalb der Kurven gibt es eine einzige wohldefinierte Phase. Auf den Kurven p = p(T ) koexistieren 2 Phasen, im Tripelpunkt (Tt , pt ) 3 Phasen. Am kritischen Punkt (Tc , pc ) verschwindet der Unterschied zwischen Gas und Flüssigkeit: bei einem Druck p oberhalb des kritischen Wertes pc wird kein Phasenübergang (Singularität in Dichte oder anderen Eigenschaften) durchlaufen, wenn die Temperatur T von niedrigen zu hohen Werten geführt wird (analoge Aussage mit p und T vertauscht.) p p=p(T) Phase 1 x x Phase 2 T An den Phasengrenzlinien springen nicht nur die Dichten bzw. das pro Teilchenzahl N eingenommene Volumen V des thermodynamischen Zustandes, sondern auch andere Größen wie die Entropie. Bezeichnen wir das chemische Potential (Entropie, Volumen) des Systems in der Phase i = 1, 2 mit µi (Si , Vi ), so gilt auf der Koexistenzlinie p = p(T ) µ1 (T, p(T )) = µ2 (T, p(T )). (2.100) Thermodynamik und Statistische Physik Differenzieren nach T liefert µ µ µ ¶ ¶ ¶ ¶ µ ∂µ1 ∂µ1 dp ∂µ2 dp ∂µ2 + + = . ∂T p ∂p T dT ∂T p ∂p T dT 55 (2.101) Mit der Duhem-Gibbs-Relation (1.104) gilt ¶ ¶ µ µ Si Vi ∂µi ∂µi =− , = , ∂T p N ∂p T N (2.102) und mit der obigen Relation ergibt sich direkt die Clausius-ClapeyronRelation ³ ´ ³ ´ ∂µ1 ∂µ2 − ∂T ∂T S − S1 Q(T ) q(T ) dp ´p ³ ´p = 2 =³ = = , (2.103) ∂µ ∂µ dT V2 − V1 T (V2 − V1 ) T (v2 − v1 ) 2 − ∂p1 ∂p T T wobei Q(T ) die latente Wärme beim Phasenübergang bei p = p(T ) ist, d.h. Q = T (S2 − S1 ) ist die Wärmemenge, deren Aufnahme zur Umwandlung von Phase 1 in Phase 2 notwendig ist. Im allgemeinen ist Q = Q(T ), d.h. abhängig von der Position auf der Phasengrenzlinie. Ferner wurden die molaren Größen (Bezug auf Stoffmenge) q = Q/N , s = S/N , v = V /N eingeführt. Bemerkung: Wir haben immer positive Verdampfungs- und SublimationsWärme, und im allgemeinen auch positive Schmelz-Wärme, die aber im Fall von He3 tatsächlich negativ ist. Im Regelfall ist dann mit v2 > v1 (v1 > v2 ) der Anstieg von p = p(T ) positiv (negativ). Beim Verdampfen und Sublimieren ist immer v2 > v1 . Beim Schmelzen ist im allgemeinen auch v2 > v1 , aber Ausnahmen gibt es, unter anderem Wasser, so daß die Schmelzkurve negative Steigung hat. p p [Bar] 4 [Bar] He fest fest He 3 30 30 normal fluessig fluessig 20 20 superfluessig 10 10 gas gas 1 2 3 4 5 T [Kelvin] 1 2 3 4 5 T [Kelvin] Bei He3 gilt für die Schmelzkurve zwar vfl > vfest , aber hier ist bei tiefen Temperaturen Sfl < Sfest , was der Entropie als Maß für Unordnung entgegen zu laufen scheint. Man hat hier zu berücksichtigen, daß (Un-)Ordnung nicht nur im Ortsraum, sondern auch im Impulsraum vorliegen kann. Bei noch tieferen als den gezeigten Temperaturen treten bei He3 noch zwei supraflüssige Phasen (A, B) auf. 56 A. Klümper Schwefel p fluessig fest I (rhombisch) fest II gas T Kristallsymmetrien: I: rhombisch II: monoklin 3 Tripelpunkte (Kristallgitter: rhombisch – drei 90o Winkel, beliebige Kantenlängen; monoklin – zwei 90o Winkel, einer ungleich 90o .) Wir betrachten nun weiter die Übergänge fest, flüssig (1) → gasförmig (2). Im allgemeinen gilt hier v1 << v2 . Behandeln wir die gasförmige Phase als ideales Gas, so gilt pv = kB T . Damit ist dp q(T ) qp = = , dT T v2 kB T 2 (2.104) wobei wir noch die grobe Näherung einer temperaturunabhängigen latenten Wärme benutzt haben. Die letzte Gleichung läßt sich als DGL mit getrennten Variablen behandlen mit Lösung p(T ) = p0 e 2.7 − k qT B . (2.105) Mehrkomponentige Systeme, Lösungen Wir wollen die bisherigen Betrachtungen einkomponentiger Systeme auf den Fall mehrerer (k-viele) Komponenten verallgemeinern, bei denen die Teilchenzahl N̂i zu jeder Komponente i (=1,...,k) erhalten ist. Jede Komponente hat ihr eigenes chemisches Potential µi . An den geeigneten Stellen können P P wir µN̂ (µN ) durch i µi N̂i ( i µi Ni ) ersetzen, Ni = hN̂i i. Wir fassen die resultierenden Modifikationen zusammen: X Energiesatz dE = T dS − pdV + µi dNi , i X Duhem-Gibbs E = T S − pV + µi Ni , iX 0 = SdT − V dp + Ni dµi , i X freie Enthalpie G = G(T, p, Ni ) = µi Ni = i µ ¶ ∂G da µi = . ∂Ni T,p,Nj (6=Ni ) X ∂G Ni , ∂Ni i (2.106) Thermodynamik und Statistische Physik 57 P Die Gesamtteilchenzahl ist N = Ni , und ci = Ni /N ist die Konzentration P der Komponente i. Von den k-vielen ci sind nur k − 1 wegen ci = 1 unabhängig. Die Dichte der freien Enthalpie g ist eine Funktion der Konzentrationen G(T, p, Ni ) = N g(T, p, ci ), g= X ci µi . (2.107) i Die Bedingungen der Phasenkoexistenz sind wie beim einkomponentigen System ableitbar. Es folgt wieder, daß alle intensiven Variablen T , p, µi für alle Phasen im Gleichgewicht identisch sein müssen. Den allgemeinsten Fall stellt ein System mit k Komponenten und r Phasen in Koexistenz dar. (s) Bezeichnen wir mit µi das chemische Potential der Komponente i in Phase s, so muß gelten (1) (2) (r) µi = µi = ... = µi , für alle i = 1, ..., k, T, p gleich in allen Phasen. (2.108) Dies sind r − 1 Gleichungen für jedes i = 1, ..., k, d.h. insgesamt k(r − 1) (s) Bestimmungsgleichungen für 2+r(k−1) Variable, d.i. T , p, ci für s = 1, ..., r, i = 1, ..., k − 1. Damit dieses Gleichungssystem lösbar ist muß gelten 0 ≤ f := Anzahl Variable − Anzahl Gleichungen = 2 + r(k − 1) − k(r − 1) = 2 + k − r. (2.109) Dies ist die Gibb’sche Phasenregel. f ist die Anzahl der Freiheitsgrade, die bei Koexistenz im allgemeinen Phasendiagramm bleiben. Als erstes Beispiel wollen wir schnell den einkomponentigen Fall (k = 1) durchspielen. Hier ist f = 3 − r und liefert bei 1, 2, 3 Phasen die Werte f = 2, 1, 0, wie bekannt. Als zweites Bespiel wollen wir ein zweikomponentiges System, Gemisch aus H2 O und N H3 , k = 2, betrachten. Hier ist f = 4 − r=3, 2, 1, 0, für 1, 2, 3, 4 Phasen in Koexistenz. Im (p, T, c)-Phasendiagramm, wobei c die Konzentration von N H3 darstellt, bekommen wir ganz allgemein für jeden Punkt eine eindeutige Phase, die auch in einer ganzen 3-dim. Umgebung existiert, zwei Phasen sind auf einer 2-dim. Untermannigfaltigkeit realisiert, drei Phasen auf einer 1-dim. Untermannigfaltigkeit, und vier Phasen an einem Punkt. 58 A. Klümper T B I A III II C D E IV c 0 1 1 0 NH 3 c H2O I: Lösung (N H3 + H2 O) II: Eis + Lösung (2 Phasen) III: festes N H3 + Lösung IV: Eis und festes N H3 Grenzkurve C–D: Eis+festes N H3 +Lösung (3 Phasen) Entektischer Punkt E: 4 Phasen im Gleichgewicht Anwendung auf verdünnte Lösungen Wir betrachten eine Substanz A (Lösungsmittel), die in zwei Phasen i = 1, 2 vorliegen kann und lösen eine zweite Substanz B in geringer Konzentration, z.B. Salz in Wasser bzw. Eis. Wir wollen das chemische Potential der Substanz A mit µ bezeichnen, genauer soll µi (T, p) das chemische Potential der reinen Substanz A in Phase i = 1, 2 sein. Das chemische Potential der Substanz A in der verdünnten Lösung mit einer Konzentration c der Substanz B werde mit µ̄i (T, p, c) bezeichnet. Wir werden noch später sehen, daß für geringe Werte von c gilt µ̄i (T, p, c) = µi (T, p) − kB T c. (2.110) Die Koexistenzlinie der reinen Substanz A ist p = p(T ) und erfüllt µ1 (T, p) = µ2 (T, p), für p = p(T ). (2.111) Wir fragen nun nach der Koexistenzline p̄ = p̄(T̄ ) der Phasen i = 1, 2 wenn die Substanz mit Konzentration ci gelöst ist. Die Bestimmungsgleichung ist µ̄1 (T̄ , p̄, c1 ) = µ̄2 (T̄ , p̄, c2 ). (2.112) Wir schreiben einen Punkt (T̄ , p̄) = (T + ∆T, p + ∆p) und erhalten mit (1.104), d.h. ¶ µ ¶ µ S V ∂µ ∂µ = − = −s, = = v, (2.113) ∂T p N ∂p T N für jede Seite der letzten Gleichung µ̄i (T̄ , p̄, ci ) = µi (T + ∆T, p + ∆p) − kB T ci = µi (T, p) − si ∆T + vi ∆p − kB T ci . (2.114) Thermodynamik und Statistische Physik 59 Gleichsetzen und Nutzen von (2.111) liefert (v1 − v2 )∆p − (s1 − s2 )∆T = kB T (c1 − c2 ). (2.115) Wir wollen nun die Verschiebung der Koexistenzlinie im Detail diskutieren. Zunächst halten wir den Druck fest, d.h. ∆p = 0, und fragen uns nach der Verschiebung der Übergangstemperatur ∆T = − kB T kB T 2 (c1 − c2 ) = − (c1 − c2 ), s1 − s2 q (2.116) wobei q = T (s1 − s2 ) die latente Wärme der reinen Substanz A ist. Schmelzen: flüssig (1) ↔ fest (2) Hier gilt q > 0, c1 = c, c2 ≃ 0, da Stoff B in Festkörper A schlechter lösbar als in der Flüssigkeit, so daß ∆T = − kB T 2 c < 0, q Gefrierpunktserniedrigung, (2.117) man denke hier an den Zweck des Streusalzes im Winter. Verdampfen: gas (1) ↔ flüssig (2) Hier gilt q > 0, c1 ≃ 0, c2 = c, da Stoff B im allgemeinen nicht leicht flüchtig, so daß kB T 2 c > 0, Siedepunktserhöhung. (2.118) ∆T = q Nun halten wir T fest, d.h. ∆T = 0 und fragen nach der Verschiebung des Druckes: kB T (c1 − c2 ). (2.119) ∆p = v1 − v2 Verdampfen: gas (1) ↔ flüssig (2) Hier gilt v1 − v2 > 0, c1 ≃ 0, c2 = c, da Stoff B im allgemeinen nicht leicht flüchtig, so daß ∆p = − kB T c < 0, v 1 − v2 Dampfdruckerniedrigung. (2.120) Wenn wir wieder grob nähern v1 >> v2 und ferner in der Gasphase ein ideales Gas-Verhalten annehmen, kB T /(v1 − v2 ) ≃ kB T /v1 ≃ p erhalten wir ∆p = −c, p Raoult’sches Gesetz. (2.121) 60 A. Klümper Abschlußbemerkung: Wir werden die Untersuchung von Phasenübergängen noch ausführlich besprechen. An dieser Stelle soll noch bemerkt werden, daß Phasenübergänge nach ihrer Ordnung klassifiziert werden. Man spricht von einem Phasenübergang n.-Ordnung, wenn alle (partiellen) Ableitungen des (großkanonischen) thermodynamischen Potentials bis zur Ordnung n existieren, insbes. die Ableitungen bis Ordnung n − 1 keine Sprünge oder Divergenzen auftreten, diese Singularitäten jedoch in den (einigen) Ableitungen der Ordnung n vorhanden sind. In diesem Sinne sind die bisher betrachteten Übergänge von der Ordnung n = 1 gewesen, da Sprünge in S und V auftraten und diese Größen Ableitungen 1. Ordnung des Potentials sind. Wir haben auch einen Phasenübergang 2. Ordnung gehabt: der kritische Punkt, der das Ende der flüssig-gas-Koexistenzlinie darstellt. Hier gibt es weder latente Wärme noch einen Dichtesprung, aber z.B. die spezifische Wärme divergiert. Dies ist eine 2. Ableitung des thermodynamischen Potentials nach T . Thermodynamik und Statistische Physik 61 3 Gleichgewichtseigenschaften makroskopischer Systeme Wir wollen uns in diesem Kapitel dem Programm der Berechnung thermodynamischer Potentiale aus den mikroskopischen Wechselwirkungen zuwenden. Dies bedeutet eine Erinnerung an den Aufbau der Thermodynamik und Statistischen Physik wie in Kapitel I angelegt. Zum Hamiltonoperator H= N X p̂2i + V (x̂1 , ..., x̂N ), 2m i=1 (3.1) ist die Zustandssumme (kanonisch, großkanonisch) zu berechnen Zkan,N = Sp e−βHN , Zg = Sp e−β(H−µN̂ ) = ∞ X Zkan,N eβµN . (3.2) N =0 Obwohl wir heute für sehr viele Systeme den Hamiltonoperator kennen, werden wir große Schwierigkeiten haben, das Programm angesichts der großen Zahl an Freiheitsgraden durchzuführen. Wir werden zwei Strategien verfolgen: (i) Idealisierung von Modellen, (ii) Näherungsverfahren, die in Grenzfällen gültig sind. Es ist klar, daß dies eine grobe und nicht strenge Unterteilung ist. Als Beispiel für (i) werden wir bald die sogenannten idealen Gase kennenlernen, die wechselwirkungsfreie Teilchen beschreiben. Beispiele zu (ii) sind: klassische Näherung: h̄ → 0, anwendbar für hinreichend hohe Temperaturen, Virialentwicklung: Dichte V /N → 0, verdünnte Gase, Hochtemperaturentwicklung, 1/T → 0, (z.B. bei Spinsystemen für T → ∞,) Quasiteilchennäherung: T → 0, im letzteren Fall werden die niedrigliegenden Zustände eines Systems durch Anregungen beschrieben, die selbst Teilchencharakter haben. Diese Anregungen werden in diesem Sinne ernst genommen und ihr Beitrag zur Thermodynamik etwa in der Weise eines idealen Gases bestimmt. 3.1 Die klassische Näherung Prinzipiell sollte jedes System quantenmechanisch beschrieben werden. Häufig (und werden noch sehen wann) sind quantenmechanische Effekte nicht wichtig, so daß eine Beschreibung auf der Basis klassischer Mechanik ausreichend ist. Formal sind wir am Übergang h̄ → 0 interessiert. 62 A. Klümper Auch in der klassischen Näherung wird es (zwei!) quantenmechanische Relikte geben. Zur Untersuchung eines der Überbleibsel, und auch zur Einführung der Notation, wollen wir die Quantenmechanik eines einzelnen Teilchens in einer Raumdimension besprechen. Operatoren kennzeichnen wir mit Â. Der Kommutator von Impuls- und Ortsoperator lautet [p̂, x̂] = h̄/i. Die Eigenbasen zum Impuls- und Ortsoperator heißen (|pi) bzw. (|xi) und haben die Eigenschaften Z x̂|xi = x|xi, dx|xihx| = 1, hx′ |xi = δ(x − x′ ), (3.3) Z dp |pihp| = 1, hp′ |pi = 2πh̄δ(p − p′ ), (3.4) p̂|pi = p|pi, 2πh̄ mit hx|pi = eipx/h̄ . (3.5) Wir wollen jedem Operator  eine Funktion A(p, x) nach folgender Vorschrift zuordnen: A(p, x) := hp|Â|xihx|pi. (3.6) Für Operatoren, P die in Summen von Produkten von p̂, x̂ geschrieben werden können, B̂ = n fn (p̂)gn (x̂), gilt X X B(p, x) = hp|fn (p̂)gn (x̂)|xihx|pi = fn (p)gn (x) hp|xihx|pi | {z } n n =1 X = fn (p)gn (x), (3.7) n und speziell für den Hamiltonoperator folgt p̂2 + U (x̂), Hamiltonoperator, 2m p2 + U (x), Hamiltonfunktion. ⇒ H(p, x) = 2m Ĥ = (3.8) (3.9) Für den Kommutator zweier Operatoren Â, B̂ zeigt man hp|[Â, B̂]|xihx|pi = h̄ ∂(A, B) h̄ + O(h̄2 ) ≡ {A, B} + O(h̄2 ), i ∂(p, x) i (3.10) ∂B ∂A ∂B mit der Poissonklammer {A, B} = ∂A ∂p ∂x − ∂x ∂p . In Worten: die dem Kommutator zugeordnete Funktion berechnet sich aus der Poissonklammer der einzelnen zugeordneten Funktionen. Beweis: Wir wollen einen Beweis nur skizzieren. Wir stellen uns vor (tatsächlich in allen Fällen von Bedeutung schon explizit so gegeben), daß Â und B̂ als Polynome in p̂ und x̂ gegeben sind. Dann berechnet sich der Kommutator von  und B̂ wieder als Polynom in p̂ und x̂, wobei in Ordnung h̄ die fundamentale Relation [p̂, x̂] = h̄/i nur einmal pro Produkt angewandt werden muß. Thermodynamik und Statistische Physik 63 Die Funktionen A(p, x) und B(p, x) sind selbst Polynome und somit auch die Poissonklammer. Man rechnet leicht nach, daß beide Polynome, d.h. auf der linken wie der rechten Seite von (3.10), identisch sind. Wir wollen auf weitere Details nicht eingehen, da der klassische Limes eh alle Beiträge der Ordnung h̄ und höher vernachlässigt! Die Beziehung (3.10) besagt dann, daß systematisch alles Nichtkommutieren vernachlässigt werden kann. Der Fehler, den wir in der Thermodynamik begehen, kann abgeschätzt werden 1 e−β Ĥ = e−β(Ĥkin +Û ) = e−β Ĥkin e−β Û 1 − 2 [β Ĥkin , β Û ] +... . {z } | (3.11) O(β 2 h̄) Also folgt für die Zustandssumme Z dpdx hp|e−β Ĥ |xihx|pi Zkan = Sp e−β Ĥ = 2πh̄ Z dpdx −βHkin (p) −βU (x) = e e [1 + O(β 2 h̄)] Z 2πh̄ dpdx −βH(p,x) [1 + O(β 2 h̄)] = e 2πh̄ {z } | (3.12) =:Zklassisch Man sieht, daß auch im klassischen Grenzfall ein Faktor 1/h̄ übrigbleibt. Dies ist im wesentlichen eine Normierung, die bei der Berechnung von Mittelwerten wegfällt R Z dpdxA(p, x)e−βH(p,x) dpdx e−βH(p,x) R hÂi = Sp ρ̂ → A(p, x) = 2πh̄ Zklassisch dpdxe−βH(p,x) Z = dpdxA(p, x)ρ(p, x) =: hAiklassisch , (3.13) wobei e−βH(p,x) . (3.14) dpdxe−βH(p,x) Die bisherigen Unterschiede zwischen klassischer und quantenmechanischer statistischer Physik resultierten aus der Nichtvertauschbarkeit der Operatoren. In niedrigster Ordnung in h̄ sind klassische und quantenmechanische Ergebnisse identisch. Höhere Ordnungen in h̄ sind tatsächlich Kombinationen von βh̄ und folglich bei nicht zu tiefen Temperaturen vernachlässigbar. Wir werden ein genaueres, quantitatives Kriterium bald kennenlernen. ρ(p, x) := R Eine zweite Quelle quantenmechanischer Korrekturen bilden die Symmetriekorrelationen. Physikalische Zustände von N identischen Teilchen sind entweder total symmetrisch (Bose) oder total antisymmetrisch (Fermi). Basiszustände eines allgemeinen N -Teilchen-Hilbertraumes sind 64 A. Klümper |pi = |p1 i|p2 i...|pN i, |xi = |x1 i|x2 i...|xN i, (3.15) wobei |pi i und |xi i 1-Teilchen-Basen sind bestehend aus Eigenzuständen zu Impuls- bzw. Ortsoperator. Basiszustände des (anti-)symmetrischen N Teilchen-Hilbertraumes sind dann natürlich geeignet (anti-) symmetrisierte Produkte (3.15) X 1 |piS := √ (±1)P P |pi, N ! PermutationenP (3.16) analog für |xiS . P |pi ist eine Permutation der 1-Teilchenzustände im Produktzustand |pi. Es gilt immer (+1)P = +1, (−1)P = +1 bzw. -1 für gerade bzw. ungerade Permutationen, d.h. solchen, die Verkettungen einer geraden bzw. ungeraden Anzahl von elementaren Permutationen (Transpositionen) √ sind. Die Summe in (3.16) läuft über N ! viele Terme. Der Vorfaktor 1/ N ! garantiert die Normierung des Zustandes, da im Skalarprodukt zu jedem der N ! vielen Terme im Ket-Vektor genau ein Term im Bra-Vektor korrespondiert, so daß das gewünschte Produkt von δ-Funktionen entsteht. Jedes derartige Produkt √ tritt N !-mal auf. Der Normierungsfaktor ist folgerichtig identisch zu 1/[ N !]2 . Bemerkung: Für den Fall, daß in |pi = |p1 i|p2 i...|pN i Einteilchenzustände identisch sind ist der gemäß (3.16) antisymmetrisierte Zustand gleich 0, im Falle der Symmetrisierung ist die Normierung nochmal zu bedenken. Für unsere Anwendungen, d.h. den klassischen Limes, spielen diese Fragen keine Rolle, da die Menge der Einteilchenimpulse eine Nullmenge bzgl. der Integration darstellt. Wir nutzen nun, daß zu N !-vielen verschiedenen Punkten p1 , p2 , ..., pN der gleiche Zustand |piS gehört. Damit läßt sich die Spur eines Operators wie folgt berechnen Z d3N p 1 (3.17) Sp  = S hp|Â|piS . N! (2πh̄)3N R Wir schieben nun eine Darstellung der Eins 1 = d3N x|xihx| ein (nicht symmetrisiert!), so daß Sp  = 1 N! Z d3N pd3N x S hp|Â|xihx|piS . (2πh̄)3N | {z } (3.18) =hp|Â|xiS da  symmetrischer Operator. Da ferner über alle x integriert wird, kann ersetzt werden |xiS hx| → |xi S hx| und wir erhalten 1 Sp  = N! Z d3N pd3N x (2πh̄)3N hp|Â|xiS hx|piS | {z } hp|Â|xihx|pihp|xiS hx|piS Thermodynamik und Statistische Physik = 1 N! Z d3N pd3N x A(p, x) hp|xiS hx|piS , | {z } (2πh̄)3N 65 (3.19) =1 2 die letzte Beziehung gilt im Limes h̄ → √ 0, da von den N ! vielen Termen im Produkt genau N ! viele den Wert 1/[ N !]2 liefern und die anderen oszillierende Exponentialfunktionen sind, die sich im Integral wegheben. Wenden wir diese Ergebnisse auf die Zustandssumme an, so erhalten wir Z 3N 3N d pd x −βH(p,x) 1 e , Zkan,klassisch = N! (2πh̄)3N N X p2i + U (x1 , ..., xN ). (3.20) H(p, x) = 2m i=1 Wir fassen unsere Ergebnisse zusammen und notieren die zwei Überreste der Quantenmechanik in der klassischen Näherung: (1) dpdx 2πh̄ für jeden Freiheitsgrad, (2) Faktor 1/N !. Beide Punkte rühren her vom richtigen Abzählen: nach (1) entspricht einem Phasenraumvolumen 2πh̄ = h ein quantenmechanischer Zustand, gemäß (2) werden Zustände, die durch Vertauschen von identischen Teilchen auseinander hervorgehen, nur einmal gezählt. Wir schauen (3.20) genauer an und sehen, daß die Impulsintegration in eindimensionale Integrale faktorisiert Z ∞ p p2 e−β 2m = 2πmkB T . (3.21) −∞ Daher erhalten wir eine Reduktion auf ein Konfigurationsmittel Z 1 d3N xe−βU (x1 ,...,xN ) , Zkan,klassisch = N !λ3N (3.22) in das nur noch die potentielle Energie der N Teilchen eingeht. Wir haben benutzt die Thermische de-Broglie-Wellenlänge λ λ= √ 2πh̄ . 2πmkB T (3.23) Wir hatten schon motiviert, daß die klassische Näherung für hinreichend hohe Temperaturen gültig ist, da es sich um eine Entwicklung in βh̄ handelt. Wir sind nun in der Lage den Temperaturbereich abzuschätzen durch das Kriterium 66 A. Klümper λ << jede andere typische Länge des Systems (mittlerer Teilchenabstand, Reichweite der Wechselwirkung...) (3.24) Dies ist offensichtlich für hinreichend hohe Temperaturen erfüllt. Einige quantitative Abschätzungen werden weiter unten gegeben. Die großkanonische Zustandssumme ergibt sich aus der klassischen wie üblich durch Zgk,klassisch (T, V, µ) = ∞ X z N Zkan,klassisch (T, V, N ) = e−βΦ = eβpV , z = eβµ . N =0 (3.25) Gleichverteilungssatz Sei y eine der Orts- oder Impulsvariablen in H(p, x), d.h. gleich einem pi,α oder xi,α mit α = 1, 2, 3 für die Raumkoordinate. Wegen − 1 ∂ −βH ∂H −βH e = e , β ∂y ∂y (3.26) folgt ∂H i= hy ∂y R −βH dpdxy ∂H 1 ∂y e R = − dpdx e−βH |{z} β (3.26) R ∂ −βH dpdx y ∂y e 1 R = , β dpdx e−βH (3.27) wobei zuletzt partiell integriert wurde (heikel bei der Ortsvariablen, dort nicht gültig wenn mit Ort gegen unendlich, H endlich bleibt). Anwendungen: y = pi,α → h y = xi,α → pi,α 2 2m i ∂H i = 21 kB T = 12 hpi,α ∂p i,α ∂H i = kB T hxi,α ∂x i,α (3.28) damit entfällt auf jeden Impulsfreiheitsgrad die mittlere Energie 12 kB T . ∂H Virialsatz: wir benutzen ṗi = − ∂x i N N N X 1 X 1 X ∂H p2i 3N − h ṗi xi i = h xi i |{z} = kB T = h i = hHkin i 2 i=1 2 i=1 ∂xi 2 2m i=1 (3.29) (∗) bei (∗) wurde der Gleichverteilngssatz benutzt und beachtet, daß für jedes Teilchen i drei Freiheitsgrade α = 1, 2, 3 vorhanden sind. Zusammenbruch der klassischen Näherung Thermodynamik und Statistische Physik 67 Bevor wir an eine quantitative Abschätzung des Gültigkeitsbereichs der klassischen Näherung gehen, wollen wir uns davon überzeugen, daß die klassische Näherung bei tiefen Temperaturen quantitativ und qualitativ zusammenbricht. Mit dem Gleichverteilungssatz haben wir zunächst für die mittlere Energie 3 (3.30) E = E(T, V, N ) = hHkin + U i = N kB T + hU i. 2 Damit folgt für die Wärmekapazität µ ¶ 3 ∂E 3 (∆U )2 CV = = N kB + ≥ N kB . (3.31) ∂T N,V 2 kB T 2 2 Bei der letzten Gleichung haben wir benutzt, daß der Mittelwert hU i als Konfigurationsmittel (3.22) zu bestimmen ist mit ebenfalls U im Exponenten. Die Ableitung nach T liefert dann die Schwankung von U wie aus (1.61) etc. bekannt. Da in der klassischen Näherung CV nie gegen 0 gehen kann, auch nicht mit T → 0, haben wir einen Widerspruch gegen das Nernst-Theorem. Die klassische Näherung muß nach dem Kriterium (3.24) zusammenbrechen, da für T → 0 die Länge λ über alle Schranken wächst. Der mittlere Teilchenabstand ist l ≃ (V /N )1/3 . Mit dem Kriterium λ << l folgt für den Temperaturbereich, in dem die klassische Näherung gültig ist T [Kelvin] >> me 1 2πh̄2 ≃ 5 · 105 ≡ T0 , 2 mkB l m l[A]2 (3.32) wobei me die Elektronenmasse ist und l in Angstrom gemessen wird. Für Elektronen im Festkörper ist l ≃ 1A, dann ist T0 (Elektronen) = 5 · 105 Kelvin, (3.33) womit die klassische Näherung immer verboten ist. Für ein Gas aus Atomen mit Masse m = A · mProton und l ≃ 10A gilt T0 ≃ 3 Kelvin, A (3.34) hier haben wir also einen großen Temperaturbereich in dem die klassische Näherung gültig ist. Tatsächlich ist für z.B. Helium unterhalb von wenigen Kelvin das Phasendiagramm sehr reichhaltig mit suprafluiden Phasen. 3.2 Die idealen Gase Unter einem idealen Gas versteht man Teilchen ohne Wechselwirkung. Bevor wir die idealen Gase ordentlich quantenmechanisch behandeln, wollen wir die 68 A. Klümper klassische Näherung anwenden. Klassisches ideales Gas Das Konfigurationsmittel (3.22) ist mit U = 0 leicht durchgeführt µ ¶N 1 V Zkan,klassisch = N ! λ3 (3.35) Nach Benutzung der Stirling-Formel ln N ! = N ln(N/e) + O(ln N ) folgt F (T, V, N ) = − 1 nλ3 ln Zkan,klass = N kB T ln . β e (3.36) Mit λ ≃ T −1/2 folgt ∂F = p = − ∂V N kB T V h= nkB T, i 3 = N kB − ln nλe + 32 , S= E = F + T S = 23 N kB T, H = E + pV = 25 N kB T, 3 5 cV = ∂E , cp = ∂H ∂T ∂T = 2 N kB , ¡ =¢2 N kB 1 1 1 ∂V α = V ∂T p = T , κT = p , κS = κT ccVp = − ∂F ∂T 3 5p , etc. Dieselben Ergebnisse hätten wir auch in großkanonischer Gesamtheit (3.25) bekommen mit ¡ ¢N P∞ P∞ Zgk,klass (T, V, µ) = N =0 z N Zkan,klass (T, V, N ) = N =0 N1 ! zV λ3 ¡ zV ¢ = exp λ3 , z = eβµ . (3.37) Das großkanonische Potential ergibt sich zu βpV = −βΦ(T, V, µ) = ln Zgk,klass = zV λ3 (3.38) woraus sich die Teilchenzahl als Funktion u.a. des chemischen Potentials ergibt zV ∂Φ = 3 → z = nλ3 . (3.39) N =− ∂µ λ Daher lautet das Kriterium für die Gültigkeit der klassischen Näherung z = nλ3 << 1, d.h. µ → −∞. Jedes Teilchensystem geht entweder bei fester Dichte mit wachsender Temperatur in ein klassisches Gas über, oder bei fester Temperatur mit hinreichender Verdünnung. Diese Ergebnisse müssen sich auch als Grenzfälle der folgenden quantenmechanischen Behandlung ergeben. Ideale Quantengase Thermodynamik und Statistische Physik 69 Hier unterscheiden wir Teilchen mit ganzzahligem Spin → → Teilchen mit halbzahligem Spin → → total-symmetrische Zustände Bose-Teilchen total-antisymmetrische Zustände Fermi-Teilchen Freie Teilchensysteme zeichnen sich durch Hamiltonoperatoren mit allein Einteilchen-Termen aus H = h1 + h2 + ... + hN , (3.40) wobei jedes hi nur auf Teilchen Nr. i wirkt, alle hi gleich sind, insbesondere gleiche Spektren haben, d.h. h|νi = e(ν)|νi, (3.41) mit Einteilchen-Quantenzahl ν, -Energie e(ν) und -Zustand |νi. Das Vielteilchenproblem faktorisiert, d.h. wir haben Eigenzustände und Energien zu H H|ν1 , ν2 , ..., νN i = [e(ν1 ) + e(ν2 ) + ... + e(νN )] |ν1 , ν2 , ..., νN i. {z } | (3.42) =E Hier sind νi aus der Menge der Einteilchenquantenzahlen {ν}. Für translationsinvariante Systeme “enthält” der Parameter ν immer den Impuls des freien Teilchens p (bzw. p~), und daneben auch innere Quantenzahlen wie Spin σ = −s, −s + 1, ..., s − 1, s (bei Fermionen ist meistens der Minimalwert s = 1/2 realisiert, z.B. bei Elektronen), oder bei Teilchen mit innerer Struktur auch innere Anregungen, z.B. bei Atomen und Molekülen. Wir werden dann die Notation ν = (p, νi ) benutzen. Wir wollen im weiteren annehmen, daß das Einteilchenproblem (3.41) gelöst ist. Das Vielteilchenproblem ist mit (3.42) gelöst, wenn noch die Symmetriekorrelationen respektiert werden. Für Fermi- bzw. Bose-Systeme sind nicht beliebige Produkte |ν1 , ν2 , ..., νN i erlaubt, sondern nur total-antisymmetrische bzw. total-symmetrische Zustände. Wir wollen dazu einen Zustand |ν1 , ν2 , ..., νN i durch Besetzungszahlen nν kennzeichnen, wobei ν jede Einteilchenquantenzahl durchläuft. Nichtunterscheidbarkeit wird dadurch berücksichtigt, daß nur die Besetzungszahlen der Zustände angegeben werden und jede Kombination von Besetzungszahlen als genau ein Zustand gezählt wird. Durch die (Anti-)Symmetrisierung von Produkten |ν1 , ν2 , ..., νN i entfällt die Notwendigkeit, eine Reihenfolge zu notieren. Offenbar können Boseteilchen beliebige Besetzungszahlen annehmen, Fermiteilchen jedoch nicht nν > 1, da ein antisymmetrisiertes Produkt mit mindestens zwei identischen Faktoren schon 0 ist (Pauliprinzip): 70 A. Klümper Fermiteilchen: nν = 0, 1 Boseteilchen: nν = 0, 1, 2, .... In Besetzungszahldarstellung sind Hamilton- und Teilchenzahl-Operator einfach X X H= e(ν)nν , N̂ = nν . (3.43) ν ν Zur Behandlung der Thermodynamik ist die großkanonische Gesamtheit bestens geeignet, da wir in der Besetzungszahldarstellung bei Erlauben beliebiger Gesamtteilchenzahlen eine “unkorrelierte” Zustandssumme erhalten, die in Einteilchenterme faktorisiert P X Y 1(∞) X −β P [e(ν)−µ]n ν e−β ν [e(ν)−µ]nν ν Zgk = Sp e−β(H−µN̂ ) = = e = Y ν 1(∞) X nν =0 {nν } ν nν =0 e−β[e(ν)−µ]nν , (3.44) wobei die obere Summationsgrenze 1 bzw. ∞ ist für Fermionen bzw. Bosonen. Dies ist fast das Endergebnis, wenn wir im Falle der Bosonen noch die geometrische Reihe aufsummieren: i Yh −β[e(ν)−µ] 1 + e , Fermi, ν · ¸ (3.45) Zgk = Y 1 , Bose. 1 − e−β[e(ν)−µ] ν Das großkanonische Potential Φ ist i X h −β[e(ν)−µ] , Fermi, − ln 1 + e ν i βΦ(T, V, µ) = −βpV = X h ln 1 − e−β[e(ν)−µ] , Bose. + (3.46) ν Die Gesamtteilchenzahl ist ¸ X· 1 , Fermi, ∂Φ ν eβ[e(ν)−µ] + 1 · ¸ = X N =− 1 ∂µ , Bose, β[e(ν)−µ] − 1 e ν (3.47) wobei jeder Einteilchenzustand |νi die mittlere Besetzungszahl hnν i = 1 = f± (e(ν) − µ), eβ[e(ν)−µ] ± 1 wobei die Funktion auf der rechten Seite (3.48) Thermodynamik und Statistische Physik f± (ǫ) = eβǫ 1 ±1 71 (3.49) als Fermi-Verteilungsfunktion bzw. Bose-Verteilungsfunktion bekannt ist. An dieser Stelle ist (3.48) eine Interpretation von (3.47). Zur strengen Herleitung beachte man gemäß (3.43) hnν i = Sp nν e−β(H−µN̂ ) Sp e−β(H−µN̂ ) =− 1 ∂ ∂Φ ln Sp e−β(H−µN̂ ) = , β ∂e(ν) ∂e(ν) (3.50) wobei nach e(ν) im Sinne eines freien Parameters in H abgeleitet wird, der danach auf seinen physikalischen Wert gesetzt wird. Die obigen Formeln bestimmen die gesamte Thermodynamik der idealen Quantengase. In den Übungen werden wir sehen, daß die Entropie gegeben ist durch X S/kB = − [hnp,s i lnhnp,s i ± (1 ∓ hnp,s i) ln(1 ∓ hnp,s i)]. (3.51) p,s für Fermionen/Bosonen. Quantisierung des Einteilchenimpulses Wir werden immer wieder Impulssummen zu berechnen haben, oben beispielsweise traten auf X XX X g(e(p, νi )) = g(e(ν)) = G(p), (3.52) p ν=(p,νi ) νi | p {z } Z d3 p =:G(p) mit einer Funktion G(p) allein abhängig vom Impuls. Hier ist über alle Impulse, d.h. über alle Eigenwerte des Impulsoperators p̂ eines einzelnen Teilchens, zu summieren. Dies ist nichts weiter als die Spur über G(p̂) im EinteilchenHilbertraum. Bei der klassischen Näherung haben wir gesehen, wie diese Spuren (für geometrisch unbeschränkte Systeme) auf Integrale im Phasenraum zurückgeführt werden können ¶ µ Z 3 3 Z X V d pd x G(p) = d3 pG(p). (3.53) G(p) = Sp G(p̂) = (2πh̄)3 (2πh̄)3 p Als Merkregel haben wir X p =⇒ V (2πh̄)3 und analog in beliebigen Raumdimensionen d = 1, 2, 3, .... (3.54) 72 A. Klümper Wir können dieses Ergebnis auch wesentlich expliziter verstehen, wenn wir einen Quader der Kantenlängen L1 × L2 × L3 = V betrachten mit geeigneten Randbedingungen. “Physikalisch” sind offene Randbedingungen, vom theoretischen Standpunkt sind jedoch periodische Randbedingungen häufig vorzuziehen, da sie einfacher zu behandeln sind und im thermodynamischen Limes das gleiche Ergebnis liefern. Eigenzustände sind auf Grund der Translationsinvarianz durch ebene Wellen ψ(~x) = ei~p~x/h̄ gegeben. Periodische Randbedingungen ψ(x1 + L1 , x2 , x3 ) = ψ(x1 , x2 , x3 ) etc. verlangen pi Li /h̄ = 2πn, n = 0, ±1, ±2, ... (3.55) womit die Impulse diskret sind mit Abständen ∆pi = 2πh̄ Li . Zu jedem Impulspunkt im Impulsraum gehört ein Volumen (2πh̄)3 /(L1 L2 L3 ) = (2πh̄)3 /V . Damit können wir im thermodynamischen Limes V → ∞ Summen in Integrale umwandeln Z X X V V ... = d3 p... (3.56) ∆p ∆p ∆p ... =⇒ 1 2 3 3 3 (2πh̄) (2πh̄) p p Einatomiges (strukturloses) Gas: Hier gibt es keine inneren Quantenzahlen, da wir von elektronischen Anregungen bei üblichen Temperaturen p2 . absehen können: {ν} = {p}, e(ν) = e(p) = 2m Aus (3.46) folgt V βΦ = ∓ (2πh̄)3 Z ¸ · 2 − βp 2m , d p ln 1 ± ze 3 z = eβµ . (3.57) Nach (3.47) wissen wir auch, daß βµ → −∞ (z → 0) geringe Teilchenzahl, d.h. extreme Verdünnung bedeutet. In diesem Limes folgt aus (3.57) Z βp2 V Vz −βΦ = d3 p z e− 2m = ⇔ (3.25, 3.37), (3.58) 3 |{z} (2πh̄) λ3 (3.21),(3.23) d.h. im Grenzfall starker Verdünnung gilt das klassische Ergebnis. 3.3 Photonen-Gas als ideales Bose-Gas Wir behandeln nun den wichtigsten Fall eines idealen Gases: die Hohlraumstrahlung. Die Teilchen der elektromagnetischen Strahlung sind die Photonen oder Lichtquanten. Da die Wechselwirkung der Photonen untereinander unmeßbar klein ist, können wir von einem idealen Gas ausgehen. Photonen haben die Einteilchenenergie Thermodynamik und Statistische Physik p~ = h̄~k, e(~ p) = c|~ p|, 73 (3.59) wobei ~k der Wellenvektor ist. Als innere Quantenzahl (νi = 1, 2) tritt noch die Polarisationsrichtung auf, elektromagnetische Wellen sind transversal und entweder rechts- oder linkspolarisiert. Vom Photonenspin S = 1 sind nur die Spinprojektionen ±1 (Helizität) auf die Ausbreitungsrichtung ~k realisiert, nicht jedoch der Wert 0. Dies ist möglich, d.h. die Theorie ist konsistent, da Photonen keine Ruhemasse besitzen, also der Übergang in das Ruhsystem nicht möglich ist (siehe Quantenmechanik). Wir können nun direkt unsere allgemeinen Beziehungen für ideale Quantengase anwenden, wenn wir uns von einer Eigentümlichkeit der Hohlraumstrahlung überzeugt haben: die Gesamtzahl der Photonen ist keine Erhaltungsgröße. Photonen können absorbiert und spontan emittiert werden. Mit anderen Worten: wir haben mit einem kanonischen Ensemble für vorgegebenes Volumen V und Temperatur T zu arbeiten. Die Eigenzustände der Hohlraumstrahlung sind durch Besetzungszahlen der Einzelmoden gegeben. Man überlegt leicht, daß die freie Energie F (T, V ) durch die Formel des großkanonischen Potentials Φ(T, V, µ = 0) gegeben ist. Wir benutzen also die obigen Formeln der Quantengase mit chemischem Potential µ = 0, mit (3.46) i i h X h X βF (T, V ) = βΦ(T, V, µ = 0) = ln 1 − e−βe(p) ln 1 − e−βe(p) = 2 Z ∞ p,νi =1,2 £ ¤ V dp p2 ln 1 − e−βcp 4π =2 3 (2πh̄) ¶30Z ∞ µ £ ¤ V kB T = 2 dx x2 ln 1 − e−x π h̄c {z } |0 p (3.60) 4 =− π45 Wir definieren nun die Stefan-Boltzmann-Konstante 4 π 2 kB erg −5 , 3 2 = 5.67 · 10 sec cm2 K4 60h̄ c und erhalten nacheinander 4σ V T 4, F (T, V ) = − 3c ∂F 16 σ S=− = V T 3, ∂T 3 c σ E = F + T S = 4 V T 4, c ∂S σ CV = T = 16 V T 3 , ∂T c 4σ 4 1E ∂F = T = . p=− ∂V 3c 3V σ= Beim klassischen idealen Gas steht hier p = 2E 3V . (3.61) (3.62) 74 A. Klümper Die mittlere Besetzungszahl (Bose-Verteilungsfunktion) hnp i = 1 , −1 (3.63) eβcp divergiert bei p → 0 und T > 0, ist jedoch identisch 0 bei T = 0, d.h. kein Photon vorhanden. <np > p Für die mittlere Zahl aller Photonen erhalten wir nach Summation über hnp i aller Impulse und der beiden Helizitäten ¶3 µ Z ∞ 2 X x2 2ζ(3) kB T π N = dx = hnp i = ... = V V p (πh̄βc)3 0 ex − 1 π2 h̄c (3.64) Wir fragen nun nach der spektralen Verteilung der Energiedichte E/V . Wir kennen die Verteilungsfunktion hnp i zum Impuls p mit Energie e(p) = cp und Frequenz ω = cp/h̄ = ck. Die spektrale Energie-Verteilung ist 1 X e(p)hnp iδ(ω − e(p)/h̄) V p,ν i Z ∞ cp 1 dp p2 βcp 4π δ(ω − cp/h̄) =2 3 (2πh̄) e −1 0 h̄ ω3 = 2 3 βh̄ω Planck π c e −1 u(ω) = u (ω) Rayleigh− Jeans ωmax ω Wien (3.65) Thermodynamik und Statistische Physik 75 Das Maximum der Planck-Verteilung u′ (ω) = 0 liegt bei h̄ωmax = 2.82kB T (Wien’sches Verschiebungsgesetz). Wir betrachten zwei Grenzfälle: h̄ω << kB T : Rayleigh-Jeans, klassische Strahlungsformel, da unabhängig von h̄ ω2 u → uR−J (ω) = kB T 2 3 . (3.66) π c h̄ω >> kB T : Wien h̄ω 3 u → uW (ω) = 2 3 e−βh̄ω . (3.67) π c 3.4 Ideales Fermionen-Gas bei tiefen Temperaturen Wir wollen ideale Fermionen-Gase behandeln, dazu gehören natürlich freie (nichtwechselwirkende) Fermionen. Aber auch wechselwirkende Systeme wie Elektronen und Kerne, aus denen Festkörper aufgebaut sind, und wechselwirkende He3 Atome, Kernmaterie aus Nukleonenflüssigkeit, besitzen niedrigliegende Anregungen die Teilchen-Charakter haben und fermionisch sind. Wir gehen nun von derartigen (Quasi)-Fermionen aus mit Energie-ImpulsDispersion e(p) die in Festkörpern nahezu “beliebige” Form (Bänder) haben kann. Um konkret zu sein, wollen wir jedoch eine Parabelform benutzen, d.h. e(p) = p2 , 2m∗ (3.68) wobei m∗ die sogenannte effektive Masse des Teilchens ist und mit der nackten Elektronenmasse übereinstimmen kann oder auch nicht. Meistens ist die effektive Masse größer (in manchen Fällen jedoch kleiner) als die nackte Masse des Fermions, da das Quasifermion als nacktes Fermion + Wolke von umgebenden Teilchen, die mitgeschleppt werden muß, aufgefaßt werden kann. Bei tiefen Temperaturen kann also das stark-wechselwirkende Fermionsystem durch schwachwechselwirkende Quasifermionen ersetzt werden. Wir gehen jetzt von einem idealen (Quasi-) Fermionengas aus. Wir erinnern uns an (3.43), d.h. in Besetzungszahldarstellung sind Hamilton- und TeilchenzahlOperator gegeben durch X X H= e(p, s)np,s , N̂ = np,s . (3.69) p,s p,s mit Impuls p, Spin s = ±1/2. Die Fermi-Verteilungsfunktion (wobei f := f+ wie in (3.70) erklärt ist.) für Fermionen und Löcher ist hnp,s i = 1 eβ[e(p,s)−µ] +1 =: f (e(p, s) − µ), 76 A. Klümper 1 − hnp,s i = 1 e−β[e(p,s)−µ] +1 . (3.70) Im Grenzfall T = 0 ist f ein “Block”, der für T > 0 “abschmilzt” auf einer charakteristischen Breite kB T . f T=0 T>0 µ ε Eine derartige Verteilung, die vollständig von einer klassischen BoltzmannVerteilung (exponentiell) abweicht, wird auch entartet genannt und das zugehörige Fermigas entartetes Fermigas. Wir definieren die Fermi-Energie ǫF als das chemische Potential bei T = 0 sowie die verwandten Größen Fermi-Temperatur TF und Fermi-Impuls PF P2 ǫF = µ(T = 0), ǫF = kB TF = F∗ . (3.71) 2m Diese Größen hängen ab von der Teilchendichte. Bei T = 0 gilt Z X V ³ p F ´3 V 3 d p = , (3.72) 2 N= hnp,s i = (2πh̄)3 ǫ<ǫF 3π 2 h̄ p,s also ³ p ´3 F h̄ = 3π 2 n ∼ 1024 cm−3 für Elektronen im Metall, (3.73) p2 m0 4 5 damit pF /h̄ ≃ 108 cm−1 → µ0 = ǫF = 2mF∗ ≃ 10−11 m ∗ erg → TF ≃ 10 − 10 K, so daß TF größer ist als alle realistischen Temperaturen, bei denen ein Festkörper existiert. Ebenso gilt µ/kB >> T . Mit anderen Worten: Elektronen im Metall sind immer stark entartet. Wir wollen das Tieftemperaturverhalten bestimmen. Neben der Fermi-Temperatur gibt es noch andere Energieskalen, wie z.B. die Breite eines Energiebandes bzw. andere Charakteristika der Zustandsdichte D(ǫ), die wie folgt definiert ist V D(ǫ)dǫ := Anzahl der Einteilchen-Zustände in [ǫ, ǫ + ǫ], (3.74) wobei wir vorweggenommen haben, daß die Anzahl der Zustände eine extensive Größe ist. Beispiel: Wir wollen nun für ein isotropes Einteilchen-Spektrum, d.h. e(~ p) = e(|~ p|) die Zustandsdichte nach (3.74) bestimmen Thermodynamik und Statistische Physik ǫ≤e(p)≤ǫ+dǫ X V D(ǫ)dǫ = p,s V 1=2 (2πh̄)3 V = 2 3 p2 (ǫ)dp π h̄ 1 dp → D(ǫ) = 2 3 p2 . dǫ π h̄ Z 77 d3 p 1 ǫ≤e(p)≤ǫ+dǫ (3.75) Mit (3.68) folgt m∗ p. (3.76) π 2 h̄3 Teilchenzahl und Energie als Integrale über D(ǫ) Da die mittlere Besetzungszahl nur von der Energie ep abhängt, nicht jedoch direkt von p, können wir die Teilchenzahl durch ein Integral über die Zustandsdichte ausdrücken Z ∞ X N N= hnp,s i → n = dǫD(ǫ)f (ǫ − µ). (3.77) = V −∞ p,s D(ǫ) = Wir haben hier formal auch über negative Energien integriert. Hier ist die Zustandsdichte einfach 0 D(ǫ) = 0 (ǫ hinreichend negativ), f (ǫ → ∞) ≃ e−βǫ → 0 exponentiell schnell. (3.78) Die mittlere Energie lautet E = V Z ∞ −∞ dǫǫD(ǫ)f (ǫ − µ). Wir wollen nun allgemein Integrale vom Typ Z ∞ dǫF ′ (ǫ)f (ǫ − µ), I= (3.79) (3.80) −∞ berechnen, wobei F ′ (ǫ) = D(ǫ) und F ′ (ǫ) = ǫD(ǫ) von besonderem Interesse sind. Wir können in diesen Fällen ausgehen von folgenden Eigenschaften F (ǫ) = 0 (ǫ hinreichend negativ), lim F (ǫ)f (ǫ − µ) = 0. ǫ→∞ (3.81) Partielle Integration liefert I=− Da Z ∞ −∞ dǫF (ǫ)f ′ (ǫ − µ). ∂f 1 ∂ ex =β = −β x , x ∂ǫ ∂x e + 1 (e + 1)2 x = β(ǫ − µ), (3.82) (3.83) 78 A. Klümper folgt mit dǫ = βdx I= Z ∞ dx −∞ ex F (µ + kB T x). (ex + 1)2 (3.84) Für kleine Temperaturen können wir nach kB T x entwickeln. Für hinreichend großes x ist kB T x auch für kleines T beliebig groß, der Fehler in der Entwicklung wird jedoch durch den exponentiell abfallenden Faktor vor F nivelliert. Mit 1 F (µ + kB T x) = F (µ) + kB T xF ′ (µ) + (kB T x)2 F ′′ (µ) + ..., 2 (3.85) gilt I= Z ∞ −∞ = = dx 1 [F (µ) + kB T xF ′ (µ) + (kB T x)2 F ′′ (µ) + ...], | {z } 2 (ex + 1)(e−x + 1) →0 π2 + (kB T )2 F ′′ (µ) + O(T 4 ) 6 F (µ) R |µ {z } 0 (3.86) dǫF ′ (ǫ) wobei benutzt wurde Z ∞ dx = 1, x −x + 1) −∞ (e + 1)(e Z ∞ −∞ dx x2 π2 = . (ex + 1)(e−x + 1) 3 (3.87) Wir wenden die obige Entwicklung an auf: Teilchenzahl (F ′ (ǫ) = D(ǫ)) Z µ π2 N dǫD(ǫ) + (T > 0) = (kB T )2 D′ (µ), V 6 Z0 µ0 N = dǫD(ǫ), (3.88) (T = 0) V 0 wir nehmen die Differenz π2 π2 D′ ¯¯ (kB T )2 D′ (µ0 )+O(T 4 ) → µ−µ0 = − (kB T )2 ¯ . 6 6 D µ0 (3.89) Energie (F ′ (ǫ) = ǫD(ǫ)) Z µ π2 E dǫǫD(ǫ) + (T > 0) = (kB T )2 [D(µ) + µD′ (µ)], V 6 Z0 µ0 E0 dǫǫD(ǫ), (3.90) = (T = 0) V 0 0 = (µ−µ0 )D(µ0 )+ Differenz E − E0 = V Z µ µ0 dǫǫD(ǫ) + π2 (kB T )2 [D(µ0 ) + µ0 D′ (µ0 )] + O(T 4 ), 6 Thermodynamik und Statistische Physik = (µ − µ0 )µ0 D(µ0 ) + 79 π2 (kB T )2 [D(µ0 ) + µ0 D′ (µ0 )] + O(T 4 ). 6 (3.91) Wenn wir nun von (3.91) abziehen (3.89) ×µ0 , erhalten wir π2 E − E0 = (kB T )2 D(µ0 ) + O(T 4 ). V 6 (3.92) Die obige Entwicklung ist die sog. Sommerfeld-Entwicklung. Sie ist gültig in dem Temperaturbereich, in dem (kB T )2 F ′′ , mit F wie oben, klein ist. Die Wärmekapazität ist CV 1 = V V µ ∂E ∂T ¶ = γT + O(T 3 ), (3.93) V also linear in T für ein beliebiges Spektrum. Die Sommerfeld-Konstante γ ist gleich π2 2 k D(µ0 ). (3.94) γ= 3 B Da der Fermi-Impuls pF aus der Teichendichte folgt, liefert die Messung der Wärmekapazität γ und über D(µ0 ) sowie (3.76) die effektive Masse m∗ . In den Übungen wird der Druck eines Fermigases bestimmt. Da auch bei Rµ T = 0 aufgrund des Pauliprinzips E0 = V 0 0 dǫǫD(ǫ) = E0 (V ) eine Funktion des Volumens ist, gibt es einen Nullpunktsdruck für Fermionen. Nachtrag zu verdünnten Lösungen: Beweis von (2.110) Mit Indizes 1 und 2 unterscheiden wir die physikalischen Größen für das Lösungsmittel und die gelöste Substanz. Bei geringer Konzentration der SubN2 2 ≃N << 1. Wenn c → 0 gilt auch n2 = NV2 → 0 stanz 2 gilt c := c2 = N1N+N 2 1 und damit auch z2 = eβµ2 → 0. Das großkanonische Potential Φ(T, V, µ1 , µ2 ) kann um das Potential des reinen Lösungsmittel Φ(T, V, µ1 ) in der Variablen z2 entwickelt werden Φ(T, V, µ1 , µ2 ) = Φ(T, V, µ1 ) − V φ(T, µ1 )z2 + O(z22 ), (3.95) mit einer geeigneten Funktion φ. Die Teilchenzahl N2 berechnet sich zu ∂Φ = V φβz2 → (3.96) ∂µ2 µ2 = kB T [ln n2 + O(n2 ) − ln(βφ)] = kB T [ln c + O(c) − ln(βφ/n)], | {z } N2 = − =f (p,T ) wobei n2 = NV2 = NN2 · N V ≃ cn benutzt wurde und in Abhängigkeit von den (vollständigen) Variablen p, T, c, N1 das chemische Potential µ2 nur von 80 A. Klümper p, T, c und die Funktion f nur von p, T abhängen kann. Wir bemühen nun die freie Enthalpie G(T, p, N1 , N2 ) = N1 µ1 + N2 µ2 , dG = −SdT + V dp + µ1 dN1 + µ2 dN2 . Es gilt µ ∂µ1 ∂N2 ¶ = p,T µ ∂µ2 ∂N1 ¶ p,T = −kB T 1 [1 + O(c)], N (3.97) (3.98) Integration ergibt µ̄i (T, p, c) = µi (T, p) − kB T c + O(c2 ), (3.99) d.h. (2.110). 3.5 Thermodynamik eines Gases aus mehratomigen Molekülen Bei hinreichender Verdünnung (z = nλ3 << 1) können wir von der MolekülMolekül-Wechselwirkung absehen und auch in erster Ordnung in z (3.46) entwickeln i X h X −βΦ(T, V, µ) = βpV = ± ln 1 ± ze−βe(ν) = z e−βe(ν) . (3.100) ν ν Für Moleküle ist ν = (p, νi ), wobei p der Impuls ist und νi für innere Anregungen (Rotation, Vibration, elektronisch) steht: e(ν) = p2 + ǫ(νi ). 2m Für das großkanonische Potential erhalten wir ! !à à X X βp2 zV −βǫ(νi ) − 2m e −βΦ(T, V, µ) = z = 3 Zi , e λ νi p | {z } (3.101) (3.102) =:Zi wobei Zi = Zi (T ) die Zustandssumme der inneren Anregungen ist und unabhängig von V und N ist. Es folgt ∂Φ ∂ zV = z (−βΦ) = 3 Zi = −βΦ = βpV, ∂µ ∂z λ → p = nkB T thermische Zustandsgl. des kl. ideal. Gases. → z = λ3 n/Zi → βµ = ln(λ3 n) − ln Zi . (3.103) N =− Die freie Energie ergibt sich durch Legendre-Transformation Thermodynamik und Statistische Physik βF (T, V, N ) = βΦ + βµN = (βµ − 1)N = [ln(λ3 n/e) − ln Zi ]N. 81 (3.104) Mit (3.36) folgt F (T, V, N ) = Ftrans (T, V, N ) + Fi (T, N ), Fi = −N kB T ln Zi . (3.105) Der erste Teil ist der uns bekannte translatorische Anteil an der freien Energie, der zweite Teil ist die innere freie Energie. Bei Zimmertemperatur sind die elektronischen Freiheitsgrade noch nicht angeregt. Wir können uns auf die Rotations- und Vibrations-Freiheitsgrade beschränken und betrachten konkret zweiatomige Moleküle. Wir gehen von streng entkoppelten Rotations- und Schwingungsmoden aus (dies ist sicherlich nur eine bequeme Näherung): ǫi = ǫrot + ǫvib , ǫrot = h̄2 j(j + 1) , 2I ǫvib = h̄ω(n + 1/2), (3.106) mit Trägheitsmoment I, Schwingungsfrequenz ω, und ganzzahligen Quantenzahlen j = 0, 1, 2, ..., n = 0, 1, 2, ... . Die innere Zustandssumme faktorisiert Zi = Zrot · Zvib → Fi = Frot + Fvib , (3.107) mit Frot = −N kB T ln Zrot , Fvib = −N kB T ln Zvib . (3.108) Wir behandeln zuerst den Rotationsanteil: Zrot = ∞ X (2j + 1)e− j(j+1) θr 2 T , (3.109) j=0 wobei wir die Entartung 2j + 1 des Energieniveaus mit Drehimpulsquantenzahl j benutzt haben und ferner lästige Konstanten in der charakteristischen Temperatur h̄2 θr = , (3.110) kB I zusammengeführt haben. Wir können leider (3.109) nicht durch elementare Funktionen ausdrücken, daher wollen wir uns mit den Tief- und HochTemperatur-Asymptoten explizit befassen. Bei tiefen Temperaturen stellt (3.109) schon eine legitime Entwicklung dar T << θr : Zrot = 1 + 3e−θr /T + 5e−3θr /T + ..., (3.111) 82 A. Klümper da nur wenige Rotationen angeregt sind. Bei hohen Temperaturen sind (fast) alle Terme in der Reihe (3.109) gleichbedeutend und die Variation zweier aufeinander folgender Terme gering. Daher bietet sich eine Auswertung der Reihe durch ein Integral mit Korrekturtermen à la Eulersche Summenformel an Z ∞ ∞ X 1 1 djf (j) + f (0) − f ′ (0) + .... (3.112) f (j) = 2 12 0 j=0 Es gilt in unserem Fall Z ∞ Z ∞ T d j(j+1) θr T djf (j) = 2 dj(−) e− 2 T = 2 , θ dj θ r 0 r 0 µ ¶ µ ¶ 1 1 ′ 1 2 1 θr θr = +O f (0) − f (0) = − +O 2 12 2 12 T µT ¶ 3 1 θr T Zrot = 2 + + O θr 3 T (3.113) woraus folgt Frot = −N kB T ( Hieraus folgt direkt Srot = − ¡ ¢ r /T 3e−θr /T + O e−2θ ³¡ ¢2, ´ T << θr , θr 1 θr ln 2T , T >> θr . θr + 6 T + O T ∂Frot = N kB ∂T und Erot = Frot + T Srot = N kB sowie die Wärmekapazität Crot = T ∂Srot ∂T ½ ½ 3 θTr e−θr /T , T << θr , ln 2T T >> θr , θr + 1, 3θr e−θr /T , T << θr , T >> θr , T − 61 θr , ¡ ¢ 3 θr 2 e−θr /T , T ³ ¡ ¢2 ´ = N kB 1 + O θTr , T << θr , T >> θr . Gesamtverlauf von Crot : Cr NkB 1 2 3 T/ θ r (3.114) (3.115) (3.116) (3.117) Thermodynamik und Statistische Physik 83 Nun behandeln wir den Vibrationsanteil: Die zu summierende Reihe ist harmonisch und ergibt Zvib = ∞ X θv e−(n+1/2) T = n=0 1 θv T e− 2 1− θv e− T mit der charakteristischen Temperatur θv = = 1 ¡θ ¢ v 2 sinh 2T h̄ω . kB (3.118) (3.119) Wir erhalten direkt Fvib Svib Cvib · ´¸ ³ 1 θv − θTv = N kB T + ln 1 − e , 2T · ´¸ ³ 1 θv ∂Fvib − θTv , = N kB =− − ln 1 − e θv ∂T ( T¡ e ¢T2 − 1 θv ∂Svib e−θv /T , T << θv , T =T = N kB ¡ θ ¢2 1 v ∂T , T >> θv . 1 − 12 T (3.120) Wir wollen uns jetzt einen Überblick über Cges = Ctrans +Crot +Cvib verschaffen. Ganz allgemein gilt θr < θv . Daher wollen wir drei Temperaturbereiche betrachten: 3/2, T << θr < θv (aber nicht so tief, daß die Cges klassische Näherung zusammenbricht) ≃ (3.121) 5/2, θr << T << θv , N kB 7/2, θr < θv << T , Bei sehr niedrigen Temperaturen sind also nur Translationsfreiheitsgrade, nicht aber Rotationen und Vibrationen angeregt. Letztere kommen bei höheren Temperaturen vor: zunächst die beiden Rotationen des Moleküls. Oberhalb der charakteristischen Temperatur tragen zur mittleren Energie Erot = 2 · ( 21 kB T ) zwei Freiheitsgrade bei (Gleichverteilungssatz). Schließlich kommen die kinetische und die potentielle Energie der Schwingung mit je 21 kB T hinzu. Bei noch höheren Temperaturen dissoziiert das Molekül und jedes Atom trägt 32 kB T bei. 3.6 Allgemeines ideales Bosegas Als zweites Beispiel eines idealen Bosegases behandeln wir ein nichtrelativistisches Gas aus Bosonen mit endlicher Ruhemasse und erhaltener Teilchenzahl. Wir werden daher in der großkanonischen Gesamtheit mit einem von 84 A. Klümper 0 verschiedenen chemischen Potential µ arbeiten. Damit der Druck wie in (3.46) reell und die mittlere Besetzungszahl wie in (3.48) positiv ist, insbes. hnp=0 i = 1/(1/z − 1) ≥ 0, darf das chemische Potential nicht größer als 0 sein, d.h. µ ≤ 0 bzw. Fugazität z ≤ 1. Wir wollen nun wie schon beim Fermigas die Impulssumme im thermodynamischen Limes in ein Integral umschreiben. Wir wollen hier schon bemerken, daß diese Manipulation nur gerechtfertigt ist, wenn der Integrand nicht singulär ist. Wir werden den Fall z → 1− noch detailliert besprechen. Für z < 1 gilt (wir wollen den Fall der Fermionen mit beliebigem z weitestgehend mitbehandeln) i X h −βΦ = βpV = ± ln 1 ± e|−β[e(p)−µ] {z } p − βp2 · ze 2m 2 ¸ βp V =± d3 p ln 1 ± ze− 2m (2πh̄)3 µ ¶3 Z i h V 2m 2 3 −x2 d x ln 1 ± ze =± (2πh̄)3 Z β ∞ i h 2 V 4 =± 3√ dx x2 ln 1 ± ze−x , λ π 0 Z (3.122) wobei die Definition von λ (3.23) benutzt wurde und die Isotropie des Integranden in 3d. Wir entwickeln nun die Logarithmsfunktion und vertauschen Reihe und Integration Z ∞ i h 2 dx x2 ln 1 ± ze−x ± 0 | {z } P∞ (−1)l−1 l −lx2 = = ∓ = ∓ l=1 ∞ X (−1)l l (±z) e l (±z)l l=1 Z ∞ X (∓z)l l=1 l5/2 Z ∞ dx x2 e−lx 2 0 ∞ 2 dy y 2 e−y 0 } | R {z √ ∞ 2 π 1 dye−y = = 2 0 √ π = [∓g5/2 (∓z)], 4 4 (3.123) wobei die Funktion gν wie folgt erklärt ist gν (z) = ∞ X zl l=1 lν . Damit erhalten wir für das großkanonische Potential (3.124) Thermodynamik und Statistische Physik −βΦ = βpV = ∓ V g5/2 (∓z), λ3 85 (3.125) und für die Teilchenzahl N =− ∂Φ ∂βΦ V = −z = ∓ 3 g3/2 (∓z). ∂µ ∂z λ (3.126) Die Zustandsgleichung p = p(T, N/V ) folgt durch Auflösen von (3.126) nach z und Einsetzen in (3.125). Bei diesem Programm tritt sofort die Schwierigkeit auf, daß in (3.126) oder äquivalent in λ3 n = ∓g3/2 (∓z), (3.127) die linke Seite beliebig große Werte annehmen kann, aber die rechte Seite durch g3/2 (1) = ζ(3/2) = 2, 612... beschränkt ist (gν (1) = ζ(ν) Riemannsche Zetafunktion). 2,612... g3/2(z) 1 z Nimmt die linke Seite von (3.127) bei niedrigen Temperaturen und/oder hohen Dichten einen Wert an, der g3/2 (1) übersteigt, nimmt z einen Wert beliebig dicht bei 1 an (z > 1 ist nicht erlaubt). Für diese Situation ist der obige Übergang von der Impulssumme zum Integral nicht erlaubt, da der Integrand bei p = 0 singulär ist. Eine genauere Rechnung liefert N =− ∂βΦ V ∂Φ = −z = 3 g3/2 (z) + N0 , ∂µ ∂z λ (3.128) wobei N0 = hn0 i die Besetzungszahl des Impuls-p = 0-Zustandes ist, d.h. N0 = 1 z 1 . −1 (3.129) Üblicherweise ist N0 endlich, d.h. intensiv. Ist jedoch z = 1 − O(1/V ), dann ist N0 extensiv und (3.128) bzw. λ3 n = g3/2 (z) + λ3 kann gelöst werden für λ3 n > g3/2 (1) mit N0 , V (3.130) 86 A. Klümper N0 N0 = n − g3/2 (1)/λ3 und z = = O(1 − 1/V ). V N0 + 1 (3.131) Wir haben nun das interessante Phänomen, daß für λ3 n > g3/2 (1) ein endlicher Bruchteil N0 /N der Bosonen das tiefste (p = 0) Einteilchenniveau besetzt. Dieser Vorgang ist als Bose-Einstein-Kondensation bekannt und wurde 1924/25 vorhergesagt. Es handelt sich hierbei um einen Phasenübergang (2. Ordnung) mit kritischer Temperatur kB Tc (v) = 2πh̄2 /m , [vg3/2 (1)]2/3 v = V /N, (3.132) bzw. kritischer Teilchendichte vc (T ) = λ3 . g3/2 (1) (3.133) T Gasphase Phasengrenzline Tc (v)~v−2/3 Kondensat Mischphase v Der kondensierte Anteil ergibt sich aus (3.131) zu ( 0, Gasphase, N0 ³ ´3/2 = vg3/2 (1) = 1 − vvc , Mischphase, 1 − λ3 = 1 − TTc N (3.134) insbes. ist N0 /N = 1 für T = 0 unabhängig vom Volumen. N0 /N 1 N0 /N v fest 1 T fest Tc T vc v Die Herleitung von (3.125) bleibt von der Kondensation unberührt. Es tritt in der Impulssumme im Prinzip auch ein divergenter p = 0-Term auf, der jedoch nur logarithmisch divergiert. Der Beitrag zum Druck ist Thermodynamik und Statistische Physik lim V →∞ µ µ ¶ ¶ 1 1 ln(1 − z(V )) ∼ lim ln V = 0. V →∞ V V Die Zustandsgleichung wird explizit ½ kB T g5/2 (z), p= 3 g5/2 (1) = 1, 342..., λ Gasphase, Mischphase. 87 (3.135) (3.136) Im (p, T )-Phasendiagramm hat die Phasengrenzlinie ein p ∼ T 5/2 Verhalten. Das Gebiet links von dieser Kurve wird nicht erreicht, da der Druck bei noch so hoher Dichte den Druck der Mischphase nicht übersteigt. In der Mischphase wird 100%-Kondensation nur bei unendlicher Dichte erreicht (außer bei T = 0). p p Gasphase Phasengrenzline −5/3 "verboten" ~v ~T 5/2 Isotherme ~1/v Kondensat Mischphase Phasengrenzline v T Helium versus Bose-Einstein-Kondensation Häufig wird der λ-Übergang zwischen normalflüssiger und supraflüssiger Phase von He4 mit der Bose-Einstein-Kondensation in Verbindung gebracht. Um jedes Mißverständnis im Keim zu ersticken, sei hier direkt gesagt, daß dies falsch ist. Die He4 -Atome sind zwar Spin-0-Teilchen und damit Bosonen. He stellt jedoch kein ideales, sondern ein stark-wechselwirkendes System dar. Das (p, T )-Phasendiagramm, siehe Abschnitt 2.6, zeigt auch keine Ähnlichkeit mit dem des Bose-Einstein-Systems (s.o.). Ferner gibt es zwar in der suprafluiden Phase eine makroskopische Besetzung des p = 0-Zustandes, die jedoch nicht 100% erreicht, sondern nur etwa 6% bei T = 0. C(T) Tλ T Die spezifische Wärme divergiert am λ-Übergang mit einer logarithmischen Singularität, d.h. der Graph von C(T ) ähnelt dem Buchstaben λ, daher die Namensgebung. Die spezifische Wärme bei der Bose-Einstein-Kondensation 88 A. Klümper zeigt nicht diese Divergenz. Damit sind drei Unterschiede genannt! Modellmäßig faßt man die suprafluide Phase als 2-Flüssigkeitssystem auf mit – normaler Anteil, – suprafluider Anteil = Kondensat (nicht zu verwechseln mit dem BoseEinstein-Kondensat. Die folgende Deutung stammt von Landau. Das Kondensat ist der Grundzustand bei T = 0 und besitzt Entropie 0. Der Normalanteil besteht aus den Anregungen des Systems, d.h. einem Gas aus Quasiteilchen. Diese Quasiteilchen genügen der Bosestatistik, haben aber nicht direkt zu tun mit den He4 -Bosonen. Folgendes Anregungsspektrum wurde mittels Neutronenstreuung experimentell bestimmt und auch theoretisch abgeleitet e 10 kB 5 Steigung: vkrit 1 2 mit Verhalten bei den Minima 0 und p0 6= 0 p → 0: e(p) = u · p, (p = |~ p|), Phonon , p → p0 : e(p) ≃ ∆ + (p−p0 )2 2m∗ , p −1 h [A ] Roton, mit folgenden Daten ∆ = 8.5K, kB p0 = 1.9 · 108 cm−1 , h̄ m∗ = 0.16mHe4 . Der Hamiltonoperator lautet X H= e(p)np , np = 0, 1, 2, ... (Bosestatistik), (3.137) (3.138) p wobei die Zahl der Quasi-Bosonen nicht erhalten ist. Mit chemischem Potential µ = 0 ist die mittlere Energie X 1 , E= e(p)hnp i, hnp i = βe(p) e −1 p ≃ Eph + Erot . (3.139) Wie bei der Hohlraumstrahlung liefert der Phonon-Anteil einen T 4 -Beitrag, und wie alle Anregungen mit Lücke liefern die Rotonen ein Aktivierungsverhalten Thermodynamik und Statistische Physik π 2 (kB T )4 (T → 0) −→ cph ∼ T 3 , 30 (h̄u)3 ≃ e−∆/kB T −→ crot ∼ e−∆/kB T . 89 Eph = V Erot (3.140) Aus dem eigentümlichen Spektrum mit einem endlichen Wert für vkrit := min p e(p) (siehe auch die Figur), p (3.141) folgt, daß das Kondensat sich reibungsfrei durch ein Rohr bewegen kann, sofern nur die Fließgeschwindigkeit v kleiner ist als vkrit . Wir benutzen das Argument nach Landau und betrachten das System bei T = 0. Behauptung: Zeigt Materie in Ruhe elementare Anregungen mit Dispersion e = e(~ p) dann hat Materie mit Schwerpunktgeschwindigkeit ~v Anregungen mit Dispersion e~v = e(~ p) + ~v · p~. Beweis: In Ruhe, d.h. mit Fließgeschwindigkeit v = 0 hat (i) der Grundzustand, (ii) der Grundzustand + Anregung mit Impuls p die Energie (i) E = E0 , (ii) E = E0 + p2 + Eint , |2M {z } (3.142) =:e(p) wobei sich die Anregungsenergie aus kinetischer Energie (M ist die Gesamtmasse) und interner Anregung ergibt. Diese Überlegung wurde durchgeführt, um die einzelnen Beiträge zu e(p) zu ermitteln. Wir sind natürlich interessiert an Helium, das mit einer Geschwindigkeit v fließt. Hier sehen die Energien für Grundzustand und Anregung mit Impuls p wie folgt aus (i) (ii) (M v)2 , 2M (M~v + p~)2 + Eint , E = E0 + 2M 2 p2 (M v) + ~v p~ + + Eint = E0 + 2M |2M {z } E = E0 + q.e.d. (3.143) =e(p) s.oben Reibung findet statt, wenn es Anregungen gibt, die die Gesamt-Energie des Heliums erniedrigen (der Energiegewinn geht beispielsweise als Wärme in die Umgebung). Die Frage ist, kann ~v p~ + e(p) negativ werden? Wir stellen dies um ~v p~ + e(p) < 0 ⇔ e(p) < −~v p~ ≤ vp. (3.144) 90 A. Klümper Die Bedingung ist, daß es ein p gibt, so daß v > e(p)/p. Ist also v > vkrit (v < vkrit ) so gibt es (keine) Reibung! Für v < vkrit haben wir Superfluidität. Bei T > 0 sind schon Anregungen vorhanden. Diese können mit der Wand stoßen und (beliebig kleine) Energie und Impuls austauschen, was der Reibung des Normalteils entspricht. Von T = 0 bis zu einem Tλ , das mit obigem Hintergrund abgeschätzt werden kann, existiert ein makroskopisches Kondensat. Experimentelle Realisierung der Bose-Einstein-Kondensation Aufgrund der immer in realen Bosesystemen mit erhaltener Teilchenzahl vorkommenden Wechselwirkung wurde die Bose-Einstein-Kondensation erst 70 Jahre nach ihrer Vorhersage experimentell realisiert (Nobelpreis 2001 an Eric A. Cornell, Wolfgang Ketterle, Carl E. Wieman) – Gas aus 2000 spinpolarisierten Rb87 -Atomen, eingeschlossen in einer Quadrupol-Falle. Die Übergangstemperatur liegt bei 170 × 10−9 K. Trotz dieser extrem tiefen Temperaturen konnte ein Übergang in die feste Phase verhindert werden. Der gasförmige Zustand erwies sich als hinreichend metastabil, so daß die Kondensat-Phase für etwa 10 Sekunden aufrechterhalten werden konnte. Literatur: M. H. Anderson et al., Science 269, S. 198 (1995) – Gas aus 2 × 105 spinpolarisierten Li7 -Atomen, Übergangstemperatur bei 400 × 10−9 K (C.C. Bradley et al., Phys. Rev. Lett. 75, S. 1687 (1995)). – atomarer Wasserstoff mit > 108 Atomen, Übergangstemperatur bei 50µK (D. Kleppner et al., Phys. Rev. Lett. 81, S. 3811 (1998)). Stichworte: makroskopische Wellenfunktion, Materiewellen, makroskopische Quantenphänomene... 3.7 Verdünnte Systeme, Virialentwicklung Wir wollen uns der Berechnung wechselwirkender Systeme nähern vom Grenzfall starker Verdünnung. Hierfür ist die thermische de-Broglie-Wellenlänge λ klein gegen die Reichweite der Wechselwirkung r0 und den mittleren Abstand der Teilchen v 1/3 , letztere Längen sind jedoch durchaus vergleichbar. Wir können nun die klassische Entwicklung anwenden. Die Wechselwirkung wird beschrieben durch H= N X X p2i + v(ri − rj ). 2m i<j i=1 (3.145) Thermodynamik und Statistische Physik 91 Wir wollen die großkanonische Zustandssumme berechnen Zgk (T, V, µ) = ∞ X z N Zk (T, V, N ), (3.146) N =0 wobei wir nach (3.22) nur das Konfigurationsmittel Z 1 Zk = d3N xe−βU (x1 ,...,xN ) , N !λ3N (3.147) zu berechnen haben. Für kleine Dichten ist z = eβµ << 1 und wir können z als Entwicklungsparameter verwenden −βΦ = βpV = ln Zgk = ln[1 + zZ(1) + z 2 Z(2) + z 3 Z(3) + O(z 4 )] = zZ1 + z 2 Z2 + z 3 Z3 + O(z 4 ), (3.148) wobei Z1 = Z(N = 1) = V , λ3 1 Z2 = Z(2) − Z(1)2 , 2 Z3 = .... (3.149) Die erste Frage, die sich hier stellt, ist, ob Φ in dieser Entwicklung, d.h. alle Koeffizienten Zn extensiv sind. In obiger Darstellung ist beispielsweise Z2 ausgedrückt durch Terme, die O(V 2 ) sind. Wir werden jedoch bald sehen, daß sich diese Terme wegheben und das Ergebnis allein von der Ordnung O(V ) ist. Die Teilchenzahl ergibt sich nun ebenfalls als Reihe in z N =− ∂βΦ ∂Φ = −z = zZ1 + 2z 2 Z2 + 3z 3 Z3 + O(z 4 ). ∂µ ∂z (3.150) Zustandsgleichung In niedrigster Ordnung ergibt sich aus (3.150) iterativ N N z= = λ3 = nλ3 → zZ1 = N − 2Z2 Z1 V µ N Z1 ¶2 + O(n3 ). (3.151) Nun folgt aus (3.148) in der bis hier behandelten Ordnung pV = N − Z2 kB T µ N Z1 ¶2 + O(n3 ), (3.152) p = nkB T [1 + b(T )n + c(T )n2 + O(n3 )]. (3.153) βpV = oder auch Dies ist der Beginn der sogenannten Virialentwicklung der Zustandsgleichung nach Potenzen von n. Der Name rührt historisch von dem Virialsatz her, mit Hilfe dessen diese Entwicklung zuerst gewonnen wurde. Die Koeffizienten 92 A. Klümper a(T ) = 1, b(T ), c(T ) ... heißen Virialkoeffizienten. Der 2. Virialkoeffizient ist nach (3.149,3.152) gegeben durch ¸ · Z2 Z(T, V, 2) 1 b(T ) = −V 2 = −V . (3.154) − Z1 Z12 2 Mit Z(T, V, 2) = 1 1 2 λ6 Z d3 r1 d3 r2 e−βv(r1 −r2 ) = V 2λ6 Z d3 re−βv(r) , (3.155) wobei das Integral über r1 und r2 durch Einführen von Schwerpunkts- und Relativ-Koordinaten vereinfacht wurde. Man sieht nun Z 1 d3 rf (r), f (r) := e−βv(r) − 1, (3.156) b(T ) = − 2 wobei f auch als “Mayer”-f -Funktion bekannt ist. Man sieht nun explizit, daß für hinreichend schnell abfallende v(r) (und somit auch f (r)) das Integral in (3.156) existiert und insbesondere b(T ) intensiv ist, wie gewünscht. Die Zwei-Teilchen-Wechselwirkung bestimmt also eindeutig den 2. Virialkoeffizienten. Umgekehrt liefert die Ausmessung der Zustandsgleichung den 2. Virialkoeffizienten und somit Information über die Zwei-Teilchen-Wechselwirkung. Beispiel: Ein gutes Modell für reale Gase ist gegeben durch das LennardJones-Potential ·³ ´ ¸ σ 12 ³ σ ´6 v(r) = 4ǫ , (3.157) − r r mit zwei freien Parametern. (Herleitung: quantenmechanisch, Störungstheorie 2. Ordnung für zwei harmonische Oszillatoren mit Dipolkopplung der Auslenkungen ~x1 und ~x2 gemäß: const. ~x1 · ~x1 /R3 .) v(r) r Bei großen Abständen verhält sich diese Wechselwirkung attraktiv und entspricht der van-der-Waals-Wechselwirkung, die auf der Wechselwirkung induzierter Dipole basiert mit einem exakten Exponenten 6. Bei kurzen Abständen ist obiges v(r) stark repulsiv, der Exponent 12 ist lediglich ein bequemer Wert. Thermodynamik und Statistische Physik 93 Gas σ[A−1 ] ǫ/kB [K] He 2,56 10,2 Ne 2,78 34,9 Ar 3,4 120 Kr 3,6 171 Xe 4,1 221 Ein Vergleich von Rechnungen zu (3.157) und Messungen zu Edelgasen liefert die in der Tabelle angegebenen Daten. Beispiel: Wir wollen nun einen Fall betrachten, den wir etwas konkreter behandeln können: harte Kugeln. Hier ist die Wechselwirkung gegeben durch ½ ½ +∞, für r ≤ 2r0 , −1, für r ≤ 2r0 , v(r) = → f (r) = −|v(r)|, für r ≥ 2r0 , ∼ −βv(r), für r ≥ 2r0 , (3.158) wobei letzte Näherung für große Temperaturen oder große Abstände r gilt. In jedem Fall ist f (r) integrabel genau dann, wenn v(r) integrabel ist. Es gilt nun Z Z 1 1 d3 rf (r) − d3 rf (r), (3.159) b(T ) = − 2 |r|≤2r0 2 |r|≥2r0 wobei − 1 2 Z Z 1 1 4π (2r0 )3 d3 r = 2 |r|≤2r0 2 3 16π 3 r = 4 × Eigenvolumen der Kugel, (3.160) = 3 0 d3 rf (r) = |r|≤2r0 und 1 − 2 Z β d rf (r) ≃ 2 |r|≥2r0 3 Z d3 rv(r) < 0. (3.161) |r|≥2r0 Bemerkung: • Das Integral über f (r) existiert, falls v(r) algebraisch für große Abstände abfällt: v(r) ≃ 1/rα mit α > 3. Dies ist für die van-der-Waals-Wechselwirkung erfüllt, nicht jedoch für Coulomb-Potentiale von geladenen Teilchen (Plasmen, Elektrolyte). In diesen Fällen gibt es keine Virialentwicklung der Zustandsgleichung (sind diese Systeme überhaupt extensiv?). Statt dessen gilt √ p = nkB T [1 + γ n + ...], für kleine n, (3.162) was bei n = 0 nicht in eine Reihe in n entwickelbar ist. Dies ist kein Widerspruch zur Divergenz des Integrals für b(T ). Dieses Integral kann gedeutet 94 A. Klümper werden als Wert für limn→0 γ √ n n = ∞. • Die Entwicklung in z wie in (3.148) kann in systematischer Weise sehr übersichtlich dargestellt werden. Dies geschieht im Rahmen einer graphischen Störungstheorie, bei der algebraische Ausdrücke durch geeignete Symbole repräsentiert werden, z.B. Punkte i stehen für Integrationsvariable ri und Verbindungslinien zwischen zwei Punkten stehen für Faktoren f (ri − rj ). Der dargestellte Ausdruck muß schließlich über alle Variable integriert werden. Die Entwicklung von Zgk wird durch viele Graphen repräsentiert, die Entwicklung (3.148) des thermodynamischen Potentials umfaßt dagegen nur sogenannte verbundene Graphen. Dies macht auch die Extensivität des Potentials transparent. 3.8 Magnetische Erscheinungen Die magnetischen Phänomene bilden ein außerordentlich reichhaltiges Gebiet, das sich intensiver aktueller Forschung erfreut. Auch wenn Ihnen magnetische Phänomene seit langer Zeit vertraut sind und ein klassischer Begriffsapparat zur Beschreibung vorhanden ist, wird sich schnell zeigen, daß jedes magnetische Phänomen grundsätzlich quantenmechanischer Natur ist. Dies erklärt auch die andauernde Forschung trotz der frühen Entdeckung des Magnetismus. Wir betrachten nun eine allgemeine Beschreibung der Materie in einem äußeren ~ (= ∇ ~ × A). ~ Dieses greift an ein Elektron in zweifacher Weise Magnetfeld B an e~ 1 i ~ ri ). ri ))2 − µ ~ i · B(~ (3.163) (~ pi − A(~ Hel = 2m c Hierbei ist e die Ladung des Elekrons, c die Lichtgeschwindigkeit, und der Index i nummeriert die vorhandenen Elektronen. Die Ersetzung des Impulses durch den eichinvarianten Term ist die quantenmechanische Modellierung der klassischen Lorentzkraft, die die Elektronenbahn krümmt. Der zweite ~ ist die Zeeman-Energie, die einem magnetischen Dipol in einem Term µ ~i · B Magnetfeld B zukommt. Hier ist µ ~ = gµB · ~s, mit dem Bohrschen Magneton µB = |e|h̄/2mc, Landé-Faktor g = 2, 023... und Vektor der Spin-Operatoren ~s = 21 ~σ , wobei ~σ der Vektor der Pauli-Matrizen ist. Der Hamilton-Operator eines Systems aus Elektronen und Kernen wird nun zu H= X i i Hel + X Hkj + W, (3.164) j wobei Hkj die Energie des j-ten Kerns und W die Coulomb-Wechselwirkung aller Teilchen ist. Für viele Zwecke ist der Einfluß des Magnetfeldes auf die Thermodynamik und Statistische Physik 95 Kerne vernachlässigbar. Die Zeeman-Energie ist wegen der viel größeren Masse der Kerne um Größenordnungen kleiner als im Falle der Elektronen. Magnetische Ordnungserscheinungen werden also im wesentlichen auf die Elektronen zurückzuführen sein. Aus der Elektrodynamik und Quantenmechanik wissen Sie, daß das Magnetfeld in der Materie Ströme bewirkt, die ihrerseits eine Magnetisierung erzeugen. Es gilt für die Operatoren ~ = − ∂H , M ~ ∂B (3.165) ~ = hM ~ i = −h ∂H i mit einem leichten Mißbrauch der Notation für M bzw. M ~ ∂B (sowohl Operator als auch Erwartungswert). Die Mittelung ist mit dem DO des thermischen Gleichgewichtes durchzuführen. In kanonischer Gesamtheit gilt ~ ~ = − ∂H = 1 ∂ ln Sp e−βH = − ∂Φ(T, B) , (3.166) M ~ ~ ~ β ∂B ∂B ∂B wobei Φ = − β1 ln Z das thermodynamische Potential ist. Man erkennt, die Entsprechung des Paares (M, B) mit (N, µ). Wir definieren die magnetische Suszeptibilität χ durch χ := ∂M , ∂B (3.167) wobei χ und M extensiv sind, B intensiv. Wir wollen nun vier grundlegende magnetische Phänomene besprechen. Diamagnetismus Der Einfluß des Magnetfeldes auf die Teilchenbahnen der Ladungen läßt einen negativen Beitrag zur Suszeptibilität erwarten. Wir wollen uns zunächst davon überzeugen, daß eine Behandlung des Diamagnetismus nur quantenmechanisch erfolgen kann, m.a.W.: in der klassischen Statistik gibt es keinen Diamagnetismus (van-Leeuwensches Theorem). Der Beweis ist einfach und basiert auf (3.20) für die Zustandssumme und lautet in Gegenwart eines äußeren Magnetfeldes 1 Zkan,klassisch (T, B) = N! Z d3N pd3N x −βH({pi − e A(ri ),xi }) c e . (2πh̄)3N (3.168) Nach einer Variablensubstitution p′i := pi − ec A(ri ), wobei das Volumenelement invariant bleibt, erhalten wir 96 A. Klümper Zkan,kl. (T, B) = 1 N! Z d3N p′ d3N x −βH({p′i ,xi }) e = Zkan,kl. (T, 0), (2πh̄)3N (3.169) mit einer beliebigen Form von H, d.h. mit und ohne Wechselwirkung. Dieses durchsichtige, aber formale Argument ist auch anschaulich zu verstehen. Wir betrachten die (Kreis-) Bahnen der Ladungen in einem endlichen Volumen. Wir sehen, daß es an den Rändern zu Reflexionen kommt, so daß die Ladungen im Volumen im Gegenuhrzeigersinn, die Randteilchen jedoch effektiv im Uhrzeigersinn bewegen. Beide Beiträge kompensieren sich exakt. Der Diamagnetismus ist tatsächlich ein quantenmechanisches Phänomen, d.h. proportional zu h̄, und wurde erstmalig von Landau für ein ideales Fermigas behandelt (Landauscher Diamagnetismus). Dies soll in den Übungen nachvollzogen werden. Eine extreme Form des Diamagnetismus zeigen Supraleiter (siehe Festkörper-Physik, -Theorie): hier wird durch die induzierte Magnetisierung das äußere Feld vollständig kompensiert. Paramagnetismus Wir diskutieren hier den Einfluß des Zeeman-Terms auf unabhängige Spins (klassisches Gas paramagnetischer Moleküle; Festkörper: lokalisierte Spins an Gitterplätzen des Kristalls und ohne gegenseitige Wechselwirkung.) Jedes Molekül bzw. Ion habe einen Gesamtdrehimpuls h̄J mit ganz- oder halbzah~ des Drehimpulses h̄S z kann ligem J. Die z-Komponente (Projektion auf B) die Eigenwerte −J, −(J − 1), ..., J − 1, +J in Einheiten von h̄ annehmen, die zugehörigen Eigenwerte des Hamiltonoperators H=− N X gµB Siz B, (3.170) i=1 sind damit äquidistant verteilt. Die Zustandssumme ist leicht zu berechnen, " J # N X PN βgµ S z B Y X z −βH βgµ S B B i B Z = Sp e = = e i=1 e (3.171) {Siz } i=1 S z =−J Thermodynamik und Statistische Physik = " J X e βgµB S z B S z =−J #N " sinh 2J+1 2J y = y sinh 2J #N , 97 y = βgµB JB, wobei nur eine “endliche geometrische Reihe” beherrscht werden mußte J X j=−J zj = z (2J+1)/2 − z −(2J+1)/2 , z 1/2 − z −1/2 z = eβgµB B . Es folgt direkt das thermodynamische Potential # " sinh 2J+1 N 2J y , Φ(T, B) = − ln y β sinh 2J (3.172) (3.173) sowie die Magnetisierung M =− N X ∂Φ gµB Siz i = N gµB J · BJ (y), =h ∂B i=1 (3.174) wobei die “Brillouin-Funktion” BJ (y) definiert ist durch BJ (y) = 2J + 1 1 y 2J + 1 coth y− coth . 2J 2J 2J 2J (3.175) Die Brillouin-Funktion ist ungerade, mit coth x = 1/x + x/3 + O(x3 ) folgen die Eigenschaften BJ (y) = J +1 y + O(y 3 ), 3J BJ (∞) = 1, B1/2 (y) = 2 coth 2y − coth y = 1 B∞ (y) = coth y − , y 2(cosh2 y + sinh2 y) cosh y − = tanh y, 2 sinh y cosh y sinh y (3.176) mit einer schwachen Abhängigkeit von J. 1 B1/2 B00 T gross B klein 1 B gross T klein y Die Funktion B∞ entspricht dem Fall unendlich vieler Spineinstellungen, d.h. dem Fall eines klassischen Spins. Die Funktion B∞ heißt auch LangevinFunktion. 98 A. Klümper Für die Suszeptibilität unabhängiger Spins erhält man χ = N (gµB J)2 β · BJ′ (y), (3.177) speziell für den Fall der Nullfeld-Suszeptibilität (B = 0) χ(T, B = 0) = N (gµB )2 J(J + 1) . 3kB T (3.178) Diese Curie-Suszeptibilität wird bei kleinen Temperaturen beliebig groß, reflektiert also die beliebig leichte Ausrichtbarkeit der Spins. Bei hohen Temperaturen geht χ gegen 0, da thermische Unordnung der Ausrichtung entgegen wirkt. Eine Besonderheit von Spin-Systemen ist die Beschränktheit ihrer HamiltonOperatoren nach unten und oben. Für den Fall unabhängiger Spins ist das Spektrum sogar symmetrisch mit Minimum −E0 und Maximum +E0 , wobei E0 = N gµB JB. Für Temperatur T ist der Erwartungswert der Energie E N X gµB Siz Bi |{z} = −M B. E = hHi = −h i=1 (3.179) (3.174) Die Energie wächst also von −E0 bei T = 0 bis E = 0 bei T = ∞. Positive Werte werden nicht erreicht, es sei denn die Temperatur nimmt negative Werte an T < 0, für die die Thermodynamik wohldefiniert ist, d.h. Zustandssumme etc. existieren. relative Niveaubesetzung: exp(−β E) T>0 T<0 1 −E 0 T=00 +E E Eine Vorzeichenumkehr von T entspricht einer Vorzeichenumkehr von H, und dies im Fall eines wechselwirkungsfreien Systems einer Vorzeichenumkehr des Magnetfeldes. Ein thermodynamischer Zustand mit T < 0 läßt sich folglich erreichen, wenn ausgehend von T > 0 das Magnetfeld schnell umgekehrt wird bei Beibehaltung der Verteilung der Zustände. Diese Idee wurde erstmals 1951 mit den Kernspins von LiF erfolgreich durchgeführt. Dieser T < 0 Zustand blieb dank der langen Relaxationszeiten der Kernspins für einige Zeit erhalten. Thermodynamik und Statistische Physik 99 Pauli-Paramagnetismus Für die meisten realen Systeme ist statistische Unabhängigkeit der Spins nicht gegeben. Wir betrachten hier den Fall eines wechselwirkungsfreien Systems, konkret ein ideales Elektrongas mit der Einteilchen-Energie E(p, s) = p2 − gµB B · s, 2m (s = ±1/2). (3.180) Wir betrachten zunächst den Fall T = 0, d.h. den Grundzustand (für B > 0). Aufgrund des Pauliverbotes können wir nicht einfach alle Teilchen in den Einteilchen-Zustand mit p = 0 und s = +1/2 setzen. Wir müssen vielmehr nach und nach höhere p-Werte besetzen. Die zugehörigen Energien werden bald größer sein als die niedrigsten für s = −1/2. (Im obigen Fall “Paramagnetismus unabhängiger Spins” gab es zwar ein Analogon zu der Quantenzahl p, die Einteilchenenergie war jedoch unabhängig von (entartet in) dieser Quantenzahl.) E s=−1/2 B>0 s=+1/2 s=−1/2 B=0 Fermi−Kugeln p B=0 s=+1/2 B>0 Wir sehen also, daß es für B > 0 zwei Fermi-Kugeln zu Spin s = +1/2 und −1/2 gibt mit (natürlich) gleicher Fermi-Energie, aber verschiedenen FermiImpulsen pF (s = −1/2, B) < pF (B = 0) < pF (s = +1/2, B). Die Summe der besetzten Einteilchen-Zustände für s = ±1/2 ergibt die Teilchenzahl, die Differenz die Magnetisierung. Im Gegensatz zu obigem Fall haben wir hier keine vollständige Polarisierung, sondern nur einen gewissen Überschuß an s = +1/2 Elektronen. Die Eigenschaften bei T > 0 lassen sich mit dem bereitgestellten Werkzeug (“ideales Fermi-Gas”) bestimmen. Hier muß lediglich beachtet werden, daß das großkanonische Potential mit zwei verschiedenen EinteilchenDispersionen bestimmt werden muß. Im bisherigen Fall (B = 0) lief die Existenz zweier Spinrichtungen auf einen Entartungsfaktor 2 hinaus. Wechselwirkende Spins 100 A. Klümper Auch Spins, die in Festkörpern auf Ionen oder Atomen lokalisiert sind, können in aller Regel nicht als unabhängig voneinander angesehen werden. Zusätzlich zu (3.170) gibt es einen Wechselwirkungsterm, der oft in der Form N ~1 , ..., S ~N ) = − W (S 1 X X αβ α β Jij Si Sj , 2 i,j (3.181) α,β angesetzt wird. Hier bezeichnen i, j Gitterplätze und α, β die Komponenten ~ wobei der Gesamtspin halb- oder ganz-zahligen Werte der Spin-Vektoren S, annimmt, und die Komponenten die Drehimpuls-Algebra zu erfüllen haben. Der Hamiltonoperator stellt also ein respektables quantenmechanisches Diaαβ gonalisierungsproblem dar. Jij ist die jeweilige Wechselwirkungsstärke, die nicht so sehr auf magnetischer Dipol-Dipol-Wechselwirkung beruht, sondern als “Austausch-Wechselwirkung” elektrostatischer Natur ist. In der Quantenmechanik haben Sie ein Zwei-Kern–Zwei-Elektron–System kennengelernt, für welches sich in Abwesenheit der Elektron-Elektron-Wechselwirkung der Grundzustand 4-fach entartet ist. Bei Anwesenheit der Coulomb-Abstoßung spalten diese Niveaus auf in ein höherliegendes Triplett und ein niedrigerliegendes Singlett. Diese Aufspaltung wird durch eine effektive Spin-SpinWechselwirkung modelliert, die aus einem Wechselspiel von Coulomb-Wechselwirkung und dem Pauli-Verbot herrührt. Wir wollen nun nicht genauer den Geltungsbereich der konkreten Form der Wechselwirkung W , wie in (3.181) angesetzt, besprechen. Es sei kurz bemerkt, daß grundsätzlich höhere Ordnungs-Terme (biquadratisch,..) auftreten können, aber auch Drei-Spin-Terme etc. Zwei wichtige Spezialfälle werden auch heute noch intensiv untersucht. Das isotrope Heisenberg-Modell (α = β) ist N W =− 1X ~i S ~j . Jij S 2 i,j (3.182) Hier haben wir volle SU (2)-Symmetrie, aber es treten wie im allgemeinen Fall nichtkommutierende Terme auf. Das Spektrum ist schwierig zu berechen. Im Falle der Nächst-Nachbar-Wechselwirkung sind die niedrigliegenden Anregungen teilchenartig mit elementarer Energie-Impuls-Dispersion E(p) ≃ p2 (ferromagnetisches Vorzeichen) und E(p) ≃ p (antiferromagnetisches Vorzeichen), in beiden Fällen lückenlos. (Es gibt “Ausnahmen”!) Bei tiefen Temperaturen erwarten wir eine spezifische Wärme, die algebraisch von T abhängt, wie etwa bei Photonen, Phononen etc. Im extrem anisotropen Fall (α = β = z) sprechen wir vom Ising-Modell, das höchstens noch diskrete Symmetrien besitzt, aber ein klassisches Modell ist (im Sinne des Kommutierens aller Einzelterme in H): Thermodynamik und Statistische Physik 101 N W =− 1X Jij Siz Sjz . 2 i,j (3.183) Hier ist das Spektrum einfach zu bestimmen; es ist diskret, insbesondere ist der Grundzustand durch eine Lücke ∆ vom Rest des Spektrums getrennt. Daher erwarten wir bei tiefen Temperaturen ein thermisch aktiviertes Verhalten, z.B. C(T ) ≃ exp(−∆/kB T ). Die Eigenschaften des isotropen Heisenberg-Modells und des Ising-Modells bei endlicher Temperatur unterscheiden sich. Wir haben typischerweise Übergänge von einer ungeordneten Hochtemperatur-Phase zu einer geordneten Tieftemperatur-Phase bei endlicher Temperatur Tc > 0, wenn im isotropen Fall die Raumdimension d ≥ 3 und im Isingfall d ≥ 2 ist. Exakte Lösungen sind im wesentlichen nur für das Isingmodell bekannt mit d = 1 (T , B beliebig), und d = 2 (T beliebig, B = 0) nach Onsager 1944. 102 4 4.1 A. Klümper Phasenübergänge und kritische Systeme Vorüberlegungen Wir wollen uns nun mit den schon früher besprochenen Phasenübergängen intensiver beschäftigen. Dazu gehören der Gas-Flüssig-Übergang (s. Abschnitt 2.1), oder auch magnetische Phasenübergänge wie im letzten Kapitel angesprochen, und viele weitere. Das (p, T )-Phasendiagramm wie in Abschnitt 2.1 benutzt und analog andere Phasendiagramme zu intensiven Variablen haben den Nachteil, daß sie den Sprung in der Entropie und Volumen nicht erkennen lassen. Man benutzt zur Verdeutlichung dieser Größen ein (T, S) oder (p, V ) Diagramm. p Isotherme (T const.) T= Tc T>Tc kritischer Punkt T<Tc Phasen− gemisch Vfl V Vg Hier sind drei Isothermen eingezeichnet für T > Tc , T = Tc und T < Tc . Im letzteren Fall durchläuft die Isotherme einen Bereich mit Phasenkoexistenz. Hier wird der Anteil der betrachteten Substanz nach und nach von der einen in die andere Phase umgewandelt, wobei sich das Volumen und die Entropie ändern, aber der Druck konstant bleibt. Aus p = p(V ) ergibt sich auch die Volumenabhängigkeit der freien Energie. Wegen Z V ∂F p(V ′ )dV ′ , alles bei T const., (4.1) = −p, F (V ) − F (V0 ) = − ∂V V0 hat F (V ) zwischen Vf l und Vg , wo p = const., ein Segment linearen Verlaufes. F(V) Vfl G(p) Vg V0 Achsenabschnitt =G0 Steigung =−p0 V p0 p(T) p Aus F = F (V ) ergibt sich die freie Enthalpie G = G(p) = F + pV mit ∂F p = − ∂V , d.h. durch Legendre-Transformation. Praktisch wird diese Transformation so durchgeführt, daß bei einem Wert V0 die Sekante an den Graphen von F (V ) gebildet wird, die (negative) Steigung definiert den Druck Thermodynamik und Statistische Physik 103 p0 , der Ordinatenabschnitt definiert G0 (d.h. G für Druck p0 ). Alle Paare (p0 , G0 ) definieren die Funktion G = G(p). Beachte, daß dem linearen Segment von F = F (V ) ein Sprung in der ersten Ableitung von G = G(p) entspricht (wie sieht man dies anhand der graphischen Konstruktion?). Der singuläre Punkt liegt bei dem Druck p(T ), wobei p(...) die Koexistenzlinie im (p, T )-Diagramm bezeichnet. Die Legendre-Transformation kann umgekehrt werden. Die Funktionen p(V ), F (V ), und G(p) (alle bei derselben festen Temperatur T ) enthalten identische Information über das physikalische System und den Phasenübergang. Man beachte ferner, daß Größen wie cp , κT , α = ∞, im Phasengemisch, (4.2) da hier beispielsweise cp = ∆Q/∆T , wobei ∆Q die Wärmemenge ist die bei Temperaturänderung ∆T bei festem Druck (intensive Variable!) aufzuwenden ist, wir allerdings wissen, daß wir ∆Q =endlich haben mit ∆T = 0! Analog erfolgt die Begründung der anderen Größen. Anders sieht es aus, wenn wir Wärmekapazitäten etc. bei Konstanz von extensiven Variablen betrachten. Es gilt cV , κS endlich im Phasengemisch. (4.3) In obigen Figuren waren F (V ) konvex und G(p) konkav. Wir hatten diese Eigenschaft schon lokal gewonnen, da die zweite Ableitung von F nach V positiv ist ∂2F ∂2F ≥ 0, ≤ 0. (4.4) ∂V 2 ∂T 2 Konkavität von G(p) folgt gemäß allgemeiner Eigenschaften der LegendreTransformation. Es gilt übrigens ganz allgemein, daß thermodynamische Potentiale konvex/konkav sind bezüglich ihrer (natürlichen) extensiven/intensiven Variablen. Zum Aspekt der globalen Konvexität von F (V ) kommen wir noch zurück. 4.2 Van-der-Waals-Modell für Phasenübergänge Wir nutzen hier unser Ergebnis für die Virialentwicklung (3.153) harter Kugeln mit attraktiver Wechselwirkung (3.160,3.161) p = nkB T [1 + b(T ) n + c(T ) n2 + O(n3 )], |{z} |{z} =b− k a T B 2 =c ⇔ p + an = nkB T [1 + bn + cn2 + ...], (4.5) wobei b das vierfache Eigenvolumen der harten Kugeln ist und a ein gewisses Integral über die 2-Teilchen-Wechselwirkung. Wir können die rechte Seite in gleicher Ordnung in n (c haben wir nicht bestimmt) umschreiben zu 104 A. Klümper p + an2 = nkB T . 1 − bn (4.6) Dies wollen wir konsequent diskutieren. Die “physikalische” Rechtfertigung, also über das formale Argument hinausgehend, ist, daß (4.6) auch einige höhere Ordnungsbeiträge mitberücksichtigt, die in (4.5) unbestimmt geblieben sind. So kann (4.6) äquivalent geschrieben werden als p + an2 = N kB T , V − bN (4.7) was sich aus der idealen Gasgleichung ergibt, wenn dort V durch das effektive den Teilchen zur Verfügung stehende Volumen = V -ausgeschlossenes Volumen = V − N b ersetzt wird und p durch den effektiven, im Gas wirkenden Druck p + an2 ersetzt wird (der an den Behälterwänden gemessene Druck p ist um an2 kleiner, da die Randteilchen eine nach innen wirkende Kraft verspüren). Wir wollen keine wirklich ernsthafte Begründung zu (4.6) liefern, da diese Gleichung tatsächlich nur eine Approximation ist und in gewissenen Bereichen des Phasendiagramms falsch ist (aber in geeigneter Weise korrigiert werden kann). Wir diskutieren nun (4.6) p= a kB T − , v − b v2 v= 1 = spezifisches Volumen, n (4.8) Bei hinreichend hohen Temperaturen T ist p = p(V ) streng monoton fallend, wie im Fall T > Tc des (p, V )-Phasendiagramms des letzten Abschnitts. Es gibt auch eine kritische Temperatur Tc , bei der die Isotherme p = p(V ) einen horizontalen Wendepunkt besitzt ∂2p ∂p = = 0. ∂V ∂V 2 (4.9) Mit (4.8) folgen die Bestimmungsgleichungen 0= kB T 2a − 3, 2 (v − b) v 0= 2kB T 6a − 4, 3 (v − b) v (4.10) mit der Lösung vkrit = 3b, kB Tkrit = 8 a a → pkrit = , 27 b 27b2 (4.11) mit dem universellen Verhältnis pkrit vkrit 3 = , kB Tkrit 8 (4.12) Thermodynamik und Statistische Physik 105 in das nur meßbare Größen eingehen. Angesichts der einfachen Näherung, die zu diesem Ergebnis geführt hat, ist der Vergleich mit experimentellen Daten zu Gasen sphärischer Moleküle erstaunlich gut. Für T < Tkrit ergibt sich nun leider nicht wie im letzten Abschnitt ein Plateau, sondern ein nichtmonotones Verhalten (einfache rationale Funktionen “können nicht anders”). p D A p E C 0 B v Da allgemein κT = − V1 ³ ∂V ∂p ´ T > 0, müssen wir schließen, daß (4.8) nicht nur nicht das gewünschte Verhalten liefert, sondern sogar falsch ist (zwischen B und D). Da im Koexistenzbereich der Druck unabhängig vom Volumen ist, wollen wir die Kurve durch eine geeignete Horizontale mit einem zu bestimmenden Wert p0 korrigieren. Dies erfolgt mit Hilfe der MaxwellKonstruktion. Für die Koexistenzbedingung haben wir µfl (T, p) = µg (T, p). Aus F = −pV + µN folgt pV = µN −F . Wegen µfl (T, p) = µg (T, p) und p = p0 = const. haben wir p0 (Vg − Vfl ) = Ffl − Fg = |{z} auch mit unphys. F − Z Vg Vfl µ ∂F ∂V ¶ T dV = Z Vg p(V )dV. Vfl (4.13) Diese Bedingung fixiert p0 , Vfl , Vg , und kann geometrisch interpretiert werden als Gleichheit der Flächen die zwischen p = p(V ) und p0 liegen von A bis C und C bis E. Fazit: die van-der-Waals-Gleichung plus Maxwell-Konstruktion liefert ein qualitativ richtiges Verhalten für den Phasenübergang. Bemerkung: : Manchmal werden die Zweige A−B und D−E als metastabile Zustände, d.h. überhitzte Flüssigkeit und unterkühltes Gas, interpretiert. Bei Gelegenheit wollen wir mehr dazu sagen. 106 4.3 A. Klümper Ising-Modell in Molekularfeld-Näherung Wir hatten im letzten Kapitel wechselwirkende Spins betrachtet. Das Isingmodell berücksichtigt allein Wechselwirkung der z-Komponenten der Spinvektoren, ist also rein klassisch mit Hamilton-Operator bzw. -Funktion nach (3.170,3.183) N N X 1X z z gµB Siz B. (4.14) Jij Si Sj − H=− 2 i,j i=1 Für im wesentlichen positive Kopplungen Jij wird bei tiefen Temperaturen eine parallele Ausrichtung der Spins bevorzugt, d.h. der Grundzustand ist vollpolarisiert auch wenn B = 0. Dieser Zustand ist jedoch nicht eindeutig, sondern zweifach entartet. Damit haben wir spontane Magnetisierung (Ferromagnetismus). Das Vorzeichen der spontanen Magnetisierung ist offen bzw. durch das Vorzeichen des infinitesimalen Feldes bestimmt. Bei hohen Temperaturen gewinnt die Entropie, d.h. thermische Unordnung erzwingt M = 0 (Paramagnetismus). Wir haben also einen Phasenübergang 1. Ordnung bei T < Tc und B = 0, und 2. Ordnung bei T = Tc und B = 0. Für T > Tc und auch sonst weg von der Achse B = 0 ist die Abhängigkeit aller physikalischen Größen von T und B analytisch. B M T< Tc 2. Ordnung +MS T Tc 1. Ordnung T< Tc T> Tc −MS B keine Singularitaet T> Tc Wir wollen diesen Hamiltonoperator umschreiben, wobei wir benutzen Jii = 0 H=− N X i=1 N (gµB B + 1X Jij Sjz )Siz , 2 j=1 (4.15) dies sieht so aus, als ob auf den i-ten Spin ein zusätzliches “Magnetfeld” wirkt, das von den anderen Spins hervorgerufen wird. Nach Weiss kann der exakte Zusatzterm näherungsweise durch ein mittleres Zusatzfeld ersetzt werden N N X 1X Jij hSjz i, Jij Sjz → 2 j=1 j=1 (4.16) Zu beachten ist, daß in der Ersetzung der Faktor 21 fallengelassen wurde, da jeder Platz i in der Doppelsumme (4.15) zweimal vorkommt bzw. alle Terme, die ein Siz enthalten, genau zweimal den Zusatzterm wie links in Thermodynamik und Statistische Physik 107 (4.16) ergeben. Alternativ kann dies verstanden werden als Vernachlässigung von Fluktuationen bzw. Korrelationen Si · Sj = Si · hSj i + hSi i · Sj − hSi i · hSj i + (Si − hSi i) · (Sj − hSj i) . (4.17) {z } | Fluktuation →0 Mit den Abkürzungen I0 = N X Jij , (4.18) j=1 unabhängig von i wegen Translationsinvarianz etc., Θ := I0 J 2 , kB b := gµB B , JI0 m := hSjz i M = , gµB JN J (4.19) wobei J der Gesamt-Drehimpuls (-Spin) ist, bekommen wir auf der rechten Seite von (3.174) die Ersetzung gµB B → gµB B + I0 hS z i bzw. b → b + m, (4.20) und damit statt (3.174) m = BJ µ ¶ Θ (m + b) . T (4.21) Wir können uns schnell graphisch von der Lösbarkeit dieser Gleichung ein Bild machen. m 1 T<Tc BJ( θ m) T T>Tc m Für T > Tc := J+1 3J Θ (=Curie-Temperatur) bleibt für b = 0 nur die Lösung m = 0 (Paramagnetismus). Für T < Tc gibt es zusätzlich zu m = 0 auch noch eine Lösung mS (T /Θ) > 0. Diese Lösung bedeutet spontane Magnetisierung, d.h. Magnetisierung ohne ein dies erzwingendes Magnetfeld. Diese Lösung korrespondiert zu einer ferromagnetischen Phase (wir hatten stillschweigend I0 > 0 angenommen, für I0 < 0 hätten wir antiferromagnetische Ordnung erhalten). Die Idee des mittleren Feldes, oder auch Molekularfeld oder auch Methode des selbstkonsistenten Feldes, war äußerst wichtig für das grundsätzliche Verständnis von Phasenübergängen. Wir werden jedoch weitere Fragen stellen, insbesondere nach der Gültigkeit der Molekularfeldnäherung. Im nächsten 108 A. Klümper Abschnitt wollen wir untersuchen, ob die nichttriviale Lösung mit mS 6= 0 tatsächlich die thermodynamisch stabile ist. Außerdem wollen wir in der Nähe der kritischen Temperatur Θ die Singularitäten (2. Ordnung) näher untersuchen. Hier wollen wir kurz festhalten, daß für T < Θ ein Phasenübergang 1. Ordnung stattfindet bei B = 0: es gibt einen Sprung in der Magnetisierung von +mS zu −mS beim Wechsel von B = 0+ zu B = 0−. 4.4 Bogoliubov’sches Variationsprinzip In der (groß-) kanonischen Gesamtheit ist die freie Energie gegeben durch ¶¸ · µ 1 1 −βH (4.22) F = − ln Sp e = Sp ρ̂k H + ln ρ̂k , β β da ρ̂k = exp(−βH)/Sp exp(−βH). Dieses F ergibt sich aus der Minimierung des Funktionals F [ρ̂] über alle DO ρ̂, wobei · µ ¶¸ 1 F [ρ̂] = Sp ρ̂ H + ln ρ̂ , (4.23) β bei fest vorgegebenen H und T . Mit anderen Worten F [ρ̂] ≥ F [ρ̂k ] = F. (4.24) Gleichheit bzw. das Minimum wird natürlich für ρ̂ = ρ̂k erreicht. Beweis: Wir hatten schon die allgemeine Ungleichung (1.119) Sp ρ ln ρ ≥ Sp ρ ln ρ̄ (4.25) kennengelernt. Es folgt mit ρ = ρ̂ und ρ̄ = ρ̂k · µ ¶¸ 1 1 F [ρ̂] = Sp ρ̂ H + ln ρ̂ = Sp [ρ̂H] + Sp [ρ̂ ln ρ̂)] β β 1 1 ≥ Sp [ρ̂H] + Sp [ρ̂ ln ρ̂k ] = Sp [ρ̂H] + Sp [ρ̂(−βH − ln Z)] β β 1 = − ln Z = F. (4.26) β Die meisten Anwendungen dieses Variationsprinzips setzen den approximativen DO in der Form e−βHx , (4.27) ρ̂ = ρ̂x = Sp e−βHx an mit einem häufig korrelationsfreien Hamiltonoperator, der jedoch noch einen Variationsparameter x besitzt. Hier berechnet sich F [ρ̂] zu Thermodynamik und Statistische Physik · µ ¶¸ 1 F [ρ̂x ] = Sp ρ̂ H − Hx + Hx + ln ρ̂x = hH − Hx ix + FHx , β 109 (4.28) wobei h...ix Mittelung mit ρ̂x bezeichnet und FHx ganz einfach die freie Energie von Hx bei Temperatur T ist. Die Minimierung lautet natürlich ∂ Fx = 0, ∂x (4.29) die Methode ist auch als Hartree-Fock-Verfahren bekannt. Beispiel: Ising-Modell Wir wählen Hx = − und erhalten N X (gµB B + x)Siz , N X ∂Hx Siz , =− ∂x i=1 sowie (4.30) i=1 ¡ x −βH ¢ ¶ µ x Sp ∂H 1 ∂ ∂FHx −βHx ∂x e = − ln Sp e , = −βH x ) ∂x ∂x β Sp (e X ∂Hx ix = − hSiz ix = −N hS z ix =h ∂x i Nach Definition von H (4.14) und Hx (4.30) gilt N X X 1 Siz x − H − Hx = Jij Sjz . 2 i=1 j (4.31) (4.32) (4.33) Der Erwartungswert bezüglich ρx berechnet sich nun einfach, da ρx korrelationsfrei ist. Mit hSiz Sjz ix = hSiz ix hSiz ix = hS z i2x , (4.34) folgt direkt hH − Hx ix = − X NX 1X Jij hS z i2x + x Jij hS z i2x + N xhS z ix , hS z ix = − 2 i,j 2 j j (4.35) und auch F [ρ̂x ] = − NX Jij hS z i2x + N xhS z ix + FHx . 2 j Jetzt leiten wir F [ρ̂x ] nach x ab (4.36) 110 A. Klümper ∂ ∂ F [ρ̂x ] = (hH − Hx ix + FHx ) ∂x ∂x X N ∂hS z ix ∂hS z ix =− + N hS z ix + N x − N hS z ix Jij 2hS z ix 2 j ∂x ∂x X ∂hS z ix (4.37) = N x − Jij hS z ix ∂x j {z } | 0= =0 Also folgt x= X j Jij hS z ix = I0 JBJ (βJ(gµB B + x)). (4.38) Mit der Abkürzung (4.18) und (4.19) folgt aus der ersten Gleichung in (4.38) x = I0 hS z ix = I0 Jm, (4.39) Dies in (4.38) eingesetzt liefert 2 m = BJ (βI0 J (b + m)) = BJ µ ¶ Θ (b + m) , T (4.40) also die frühere Selbstkonsistenzbeziehung (4.21). Die freie Energie in HartreeFock-Näherung (4.36) ist mit (4.38) N N xhS z ix + FHx = I0 J 2 m2 + FHx 2" 2 ( )# 2J+1 Θ ( (b + m)) sinh 1 2J T . =N I0 J 2 m2 − kB T ln Θ (b+m)) 2 sinh T F [ρ̂x ] = (4.41) 2J Bemerkung: weitere Anwendungen findet das Variationsprinzip in der BCSTheorie der Supraleitung zur Entkopplung von 2-Teilchen-Wechselwirkungen (Bardeen-Cooper-Schrieffer). Thermodynamische Stabilität, kritisches Verhalten Wir wollen uns nun das Leben etwas erleichtern und den wichtigsten und qualitativ repräsentativen Fall J = 1/2 näher vornehmen. Der Quotient der hyperbolischen Funktionen in (4.41) vereinfacht sich zu einem cosh-Term und mit den Abkürzungen K := folgt aus f := β I0 , 4 h := β gµB B, 2 ¸ · 1 F = −kB T ln 2 cosh(Km + h) − Km2 , N 2 (4.42) (4.43) Thermodynamik und Statistische Physik 111 und die Selbstkonsistenzbeziehung (4.40) m = tanh(Km + h) (4.44) für die Größe m. In der Nähe des kritischen Punktes T = Tc , B = 0 sind m und h klein. Entwickeln der Selbstkonsistenzgleichung liefert 1 m = Km + h − (Km + h)3 + ... 3 (4.45) mit Lösungen für h = 0 m= ½ 0, ¢1/2 ¡ , ± 3 K−1 K3 T beliebig, nur für T < Tc . (4.46) Die freie Energie für B = 0 hat die Entwicklung f (T, B = 0) = −kB T { ln[2 cosh(Km)] | {z } 1 − Km2 } 2 2 1 =ln 2+ K2 m2 − 12 (Km)4 +... = −kB T (ln 2 + 1 4 4 K m + ...), 12 (4.47) wobei zuletzt (4.46) bzw. (K − 1)m = 13 (Km)3 benutzt wurde. Wir sehen insbesondere, daß die nichttriviale Lösung den niedrigeren Wert für das freieEnergie-Funktional liefert. Als nächstes betrachten wir die Nähe des kritischen Punktes. Hier zeigen die physikalischen Observablen als Funktionen von T und B singuläres Verhalten, das in führender Ordnung durch algebraische Funktionen mit charakteristischen, sog. kritischen Exponenten, beschrieben werden kann 2 ∂ f −α c(T ) = −T ∂T Wärmekapazität, 2 ≃ |T − Tc | β M (T ) ≃ (Tc − T ) , spontane Magnetisierung (T < Tc ), −γ (Nullfeld-) Suszeptibilität, χ(T ) =¯ ∂M ∂B ≃ |T − Tc | δ Beziehung von Magnetisierung und Feld, B ¯T =Tc ≃ M , wodurch die Exponenten α, β, γ, und δ definiert sind. Die Ergebnisse der Molekularfeldnäherung sind α = 0, β = 1/2, γ = 1, δ = 3. (4.48) Zur Herleitung beachte man, daß in (4.47) mit (4.46) der Parameter K eine analytische Funktion der Temperatur mit Ableitung ungleich 0 ist. Dies liefert einen Sprung in c(T ), d.h. α = 0, und β = 1/2. 112 A. Klümper M(T) c(T) β=1/2 α=0 Tc T Tc T Für γ und δ bemüht man (4.45) und leite ab nach B bzw. h (→ γ = 1). Für T = Tc bzw. K = 1 liefert (4.45) den Wert δ = 3. Die hier zitierten Ergebnisse sind unabhängig von der konkreten Form der Wechselwirkung. Betrachten wir reguläre Gitter (Kristalle), mit Spins an den Gitterplätzen und kurze Reichweite der Wechselwirkung, z.B. nur NächstNachbar-Wechselwirkung, so verbleibt neben der Wechselwirkungsstärke noch die Dimension d des Gitters als nichttrivialer Parameter. Die Werte d = 1, 2, 3, ... entsprechen Ketten, Schichten, Volumen, ... . Im Gegensatz zu dem Ergebnis der Molekularfeldtheorie (4.49) liefert die exakte Lösung des d = 2dimensionalen Ising-Modells nach Onsager (+Yang+...) α = 0(log), β = 1/8, γ = 7/4, δ = 15. (4.49) Hier bedeutet α = 0(log), daß die spezifische Wärme logarithmisch divergiert, also schwach c(T) α=0 (log) Tc T Diese Ergebnisse besagen, daß die Molekularfeldtheorie zur Beschreibung quantitativer Aspekte von Phasenübergängen versagt. Wir können jedoch hoffen, daß qualitative Aussagen, z.B. über die Topologie des Phasendiagramms, verläßlich sind. Wir werden jedoch im nächsten Abschnitt erfahren, daß auch dies nicht immer gesichert ist. Im Falle des d = 1-dimensionalen Ising-Modells liefert die exakte Lösung eine einheitliche Phase für T > 0, d.h. einen Phasenübergang bei Tc = 0, entgegen der Vorhersage der Molekularfeldtheorie mit endlichem Tc . Thermodynamik und Statistische Physik 113 4.5 Eindimensionale klassische Systeme und TransfermatrixZugang Transfermatrizen stellen eine ökonomische Verwaltung von Zustandssummen dar. Die Beschreibung durch Transfermatrizen ist sinnvoll bei lokalen Wechselwirkungen. Die grundsätzliche Idee beginnt mit folgender Identifizierung: Spinvariable ≡ Indizes, lokale Boltzmann-Gewichte ≡ Matrixelemente, Zustandssumme = Summe von Produkten von Mattrixelementen, = Matrix-Produkt. Vollständig lösbar ist die Thermodynamik eindimensionaler klassischer Modelle. Beispiel: 1d-Isingmodell mit Nächst-Nachbar-Wechselwirkung im äußeren Magnetfeld X ZN = e alle {σ1 ,...,σN } kurz: ~ σ N = X ~ σ = K P hi,ji σi σj +h P i σi P +h 2 (σi +σi+1 )] e| i=1 [Kσi σi+1 {z } Q Kσi σi+1 + h (σi +σi+1 ) i e 2 (4.50) =:τσi ,σi+1 wobei die 2 × 2-Matrix τ definiert wurde. Explizit erhalten wir für diese auch Transfermatrix genannte Größe µ K+h ¶ e e−K τ= , (4.51) e−K eK−h wobei Matrixindizes i = 1, 2 identifiziert wurden mit den Spinwerten +1, −1. Wir erhalten nun im Falle periodischer Randbedingung (σN +1 = σ1 ) ZN = X alle {σ1 ,...,σN } = X σ1 τσ1 ,σ2 · τσ2 ,σ3 · ... · τσN −1 ,σN · τσN ,σN +1 | {z } =τσN ,σ1 (period.Rdbg.) N (τ · τ · ... · τ )σ1 ,σ1 = Sp τ . (4.52) Bemerkung: – Summation über wiederholte Indizes wird zum Matrixprodukt, – Periodische Randbedingung führt auf Spurbildung, – die Symmetrisierung vor der Definition der Transfermatrix ist nicht nötig, macht τ jedoch selbstadjungiert, was manchmal bequem ist. 114 A. Klümper Die Zustandssumme ergibt sich nun aus den Eigenwerten λi von τ . Es seien (λ1 , λ2 , ...) der Größe nach geordnet, d.h. |λ1 | ≥ |λ2 | ≥ ... . Es gilt µ ¶N λ2 N N (4.53) + ..., ZN = λN 1 + λ2 + ... = λ1 1 + λ1 | {z } →0 wobei der Grenzprozeß stattfindet, wenn λ1 betraglich strikt größer ist als alle anderen Eigenwerte. Dies ist tatsächlich für alle 1-d Systeme erfüllt. Wir werden die Eigenwerte für das Isingmodell gleich angeben. Aus der letzten Beziehung folgt im thermodynamischen Limes f= F = −kB T ln λ1 . N (4.54) Die Eigenwerte von (4.51) sind i h p λ1,2 = eK cosh h ± sinh2 h + e−4K . (4.55) Man sieht, daß der größte Eigenwert (tatsächlich beide) als Funktion der Temperatur für alle T > 0 analytisch ist (die einzigen Singularitäten treten auf, wenn das Argument der Wurzelfunktion gleich 0 ist). Es gilt mittels Perron-Frobenius-Theorem (hier nicht ausgeführt) für alle eindimensionalen Systeme: kein Phasenübergang bei T > 0! Es gibt jedoch einen Phasenübergang bei T = 0 und B = 0 ½ = 0, für T > 0, lim M 6= 0, für T = 0, B→0± Magnetisierung M (4.56) c(T) Waermekapazitaet T=0 T>0 O(1/T2) B O(exp(−J/T)) T Bemerkung: Für höherdimensionale Systeme geht die Zahl der Eigenwerte der Transfermatrizen im thermodynamischen Limes gegen unendlich. Hier ist sind die Mathematik und Physik reichhaltiger. Korrelationsfunktionen im Transfermatrix-Zugang Seien Ari lokale Operatoren, d.h. lokal-wirkende Operatoren. Beispielsweise haben wir Ari = Thermodynamik und Statistische Physik 115 A(σri ) mit einer geeigneten Funktion A, im einfachsten Fall mit A(σri ) = σri . Dann heißt (4.57) C(r1 , ..., rn ) := hAr1 · ... · Arn i, Korrelationsfunktion oder auch n-Punkt-Funktion. Konkret ist C(r1 , r2 ) := hσr1 σr2 i, (4.58) die Spin-Spin-Korrelationsfunktion. Wir wollen die Bedeutung von Korrelationsfunktionen anhand dieses Beispiels erläutern. Offenbar mißt hσr1 σr2 i die Wahrscheinlichkeit, daß σr2 in + (−) Richtung zeigt, unter der Bedingung, daß auch σr1 in + (−) Richtung zeigt. In der paramagnetischen Hochtemperaturphase von magnetischen Systemen wird hσr1 σr2 i gegen 0 gehen, wenn |r1 − r2 | → ∞. In der ferromagnetischen Tieftemperaturphase (sofern das System ferromagnetisch ordnet) wird hσr1 σr2 i für |r1 − r2 | → ∞ gegen einen endlichen Grenzwert gehen. Dieser Grenzwert ist hσr1 ihσr2 i = hσi2 , d.h. die spontane Magnetisierung zum Quadrat. Man beachte folgenden feinen, aber wichtigen Punkt. Die Größe hσi ist im obigen Sinne eine 1-Punkt-Funktion und für B = 0 im strikten Sinne immer 0. Dies gilt sogar in der ferromagnetischen Phase wegen der Spinumkehr-Symmetrie des Hamiltooperators. Wir meinen häufig in der ferromagnetischen Phase mit der Größe hσi den Grenzwert limB→0+ hσi, dieser ist von 0 verschieden. Wenn wir die spontane Magnetisierung oder langreichweitige Ordnung messen wollen, haben wir entweder ein infinitesimales, symmetriebrechendes Feld anzulegen und die 1-Punkt-Funktion zu untersuchen, oder aber wir untersuchen die 2-PunktFunktion bei B = 0, aber im Limes unendlicher Separierung der Aufpunkte (d.h. |r1 − r2 | → ∞). Wir wollen nun u.a. für das 1-d Isingmodell die 2-Punkt-Funktion P P K ... A A e 1 r+1 P hA1 Ar+1 i = ~σ P , K ... ~ σe (4.59) berechnen. Mittels Transfermatrix P [A1 τσ1 ,σ2 τσ2 ,σ3 · ... · τσr ,σr+1 · Ar+1 · τσr+1 ,σr+2 ...] P hA1 Ar+1 i = ~σ ′ ~ σ [ohne A s] r N −r Sp [Aτ Aτ ] , (4.60) = Sp τ N wobei A (diagonale) Matrizen sind mit Einträgen Aσ,σ′ = A(σ)δ(σ, σ ′ ). Nun schieben wir zwei Darstellungen der Eins aus Eigenzuständen der Transfermatrix ein X 1= |ψi ihψi |, (4.61) i 116 A. Klümper und erhalten hA1 Ar+1 i = = N →∞ = P N −r r Aτ N −r |ψi i i hψi |Aτ A|ψi iλi P = N N i hψi |τ |ψi i i λi X −r r r hψ1 |Aτ A|ψ1 iλ1 = hψ1 |Aτ |ψj ihψj |A|ψ1 iλ−r 1 P |Aτ i hψ Pi X j r 2 |hψ1 |A|ψj i| · µ j λj λ1 ¶r (4.62) wobei u.a. benutzt wurde, daß im thermodynamischen Limes im Zähler wie im Nenner der Term mit i = 1 dominiert. Dies liefert µ ¶r λ2 2 2 . (4.63) +... hA1 Ar+1 i = |hψ1 |A|ψ1 i| + |hψ1 |A|ψ2 i| |{z} λ1 fällt weg für Ising Der erste Term beschreibt langreichweitige Ordnung (wenn von 0 verschieden), der zweite beschreibt den exponentiellen Abfall e−r/ξ mit Korrelationslänge 1 . (4.64) ξ= ln λλ21 Für das 1-d Isingmodell ist für A(σ) = σ keine langreichweitige Ordnung vorhanden, da in Standardbasis ψ1 = (1, 1), so daß der erste Term in (4.63) gleich 0 ist. Generell ist für alle 1-d Modelle das Verhalten der Korrelationsfunktionen C(r1 , r2 ) bei |r1 − r2 | → ∞ rein exponentiell. In höheren Dimensionen haben wir allgemein eine Ornstein-Zernike-Form, d.h. ein gemischt exponentiell-algebraisches Verhalten bei großen Anständen C(r1 , r2 ) = const. + e−r/ξ . rη′ (4.65) Bemerkung: – der größte Eigenwert liefert die freie Energie, – der nächstführende Eigenwert liefert die Korrelationslänge (bei Entartung mit größtem Eigenwert → Oberflächenspannung, hier nicht ausgeführt). 4.6 Monte-Carlo-Verfahren Wir wollen uns nun die Frage stellen, wie durch numerische Verfahren thermodynamische Erwartungswerte berechnet werden können. Natürlich haben wir hier zunächst wechselwirkende, klassische Modelle vor Augen. Das Paradebeispiel wird das 2-d Ising-Modell mit Nächst-Nachbar-Wechselwirkung J¯ (zunächst ohne Magnetfeld) sein mit Hamilton-”Operator” Thermodynamik und Statistische Physik H=− N X 1X Jij Siz Sjz = J¯ σi σj , 2 i,j <i,j> σi = ±1, 117 (4.66) ¯ also J<i,j> = 4J. Alle thermodynamischen Mittelwerte sind Summen über die erlaubten Konfigurationen. Wir könnten auf Idee Nr. 0 kommen und numerisch alle Konfigurationen, die zugehörigen Energien, die Boltzmann-Gewichte und dann Mittelwerte bestimmen. Wir überlegen uns aber schnell, daß bei einem System der linearen Ausdehnung L, insgesamt L×L Spins vorhanden sind, die je 2 Einstellrichtungen haben, also 2L·L Konfigurationen ermöglichen. M.a.W.: der Rechenaufwand steigt exponentiell mit der Systemgröße angesichts unseres Bestrebens L → ∞ gehen zu lassen. Dies ist hoffnungslos! Idee Nr. 1: wir würfeln einfach Zustände bzw. Konfigurationen aus. Dies kann z.B. dadurch geschehen, daß wir einen von den L2 vielen Spins auswürfeln, dann einen Spinflip durchführen und dies immer wieder und wieder durchführen. Für jede Konfiguration kann die Gesamtenergie bestimmt werden, der Boltzmannfaktor etc. Wir wollen diese Idee nicht wesentlich weiterverfolgen, da wir uns schnell klar werden, daß dieses “simple sampling” unabhängig von der thermodynamischen Bedeutung der einzelnen Konfigurationen arbeitet, d.h. viel Rechenzeit mit nichtrepräsentativen Zuständen verbringt, z.B. mit den vielen Zuständen zu hoher Energie. Idee Nr. 2: Wir wollen Konfigurationen nach ihrem Boltzmann-Gewicht auswürfeln (“importance sampling”). Dies geschieht im Metropolis-Algorithmus. Wir wollen eine Reihe von Konfigurationen generieren (i1 , i2 , ...), wobei wir mit einem (nahezu) beliebigen i1 starten und iterativ vorgehen, d.h. aus in das in+1 erzeugen. Wir führen folgende 4 Schritte aus: – Bestimme aus i = in durch Spinflip (s.o.) ein j. Dieses j sowie i selbst sind Kandidaten für in+1 . – Würfel eine Zufallszahl w ∈ [0, 1]. – Wenn w < e−β(Ej −Ei ) setze in+1 := j, sonst in+1 := i. – Zurück zum ersten Schritt. In der Sequenz (i1 , i2 , ...) taucht jeder Zustand i mit der Wahrscheinlichkeit e−βEi /Z auf. Dies ist wie folgt einzusehen. Wir bezeichnen die Übergangswahrscheinlichkeit von Zustand i zu j mit P (i → j), die von j zu i mit P (j → i). Sei nun o.B.d.A. Ei ≤ Ej , dann gilt 118 A. Klümper P (i → j) = e−β(Ej −Ei ) , P (j → i) = 1. (4.67) Hier wurde nur vorausgesetzt, daß der Spinflip (1. Schritt wie oben) in gleicher Weise von i nach j führt wie umgekehrt. Die Exp-Faktoren ergaben sich aus der Wahrscheinlichkeit der Annahme der neuen Konfiguration. Also gilt (4.68) e−βEi P (i → j) = e−βEj P (j → i), sogar für beliebige Größenverhältnisse von Ei und Ej . Wir können uns nun die obige Sequenz (i1 , i2 , ...) so erzeugt denken, daß Übergänge zwischen den einzelnen Zuständen stattfinden und ein dynamisches Gleichgewicht herrscht, d.h. es gibt genausoviele Übergänge weg von i, wie zu i hin. Sei pi die Wahrscheinlichkeit für i, dann gilt X X pi P (i → j) = pj P (j → i). (4.69) j(6=i) j(6=i) Sei N die Anzahl der Zustände i, dann gibt es N homogene, lineare Gleichungen P obiger Art. Bis auf einen Skalenfaktor, der sich aus der Normierung i pi = 1 ergibt, ist dieses Gleichungssystem eindeutig lösbar. (Es geht tatsächlich noch die Bedingung ein, daß jeder Zustand, evtl. über Zwischenzustände, in jeden anderen übergehen kann; Ergodizität. Dies ist beim Spinflip gewährleistet.) Wir können uns eine Lösung leicht verschaffen. Offenbar ist das globale Gleichgewicht (4.69) erfüllt, wenn das detaillierte Gleichgewicht gilt pi P (i → j) = pj P (j → i), also folgt schon, daß pi e tung pi = e−βEi /Z. βEi (4.70) unabhängig von i ist und damit folgt die Behaup- Wir wollen an einige Ergebnisse für das 2-d Ising-Modell erinnern: ˆ die spezifische Wärme diver– nach Molekularfeldtheorie ist kB Tc = 4J, giert nicht. – exakte Lösung bzw. Kramers-Wannier-Dualität sinh 2Kc = 1, ˆ K = β J, (4.71) hieraus folgt kB Tc = 2.269.... Wir lassen das Program “Ising” laufen und diskutieren die Monte-Carlo-Läufe für verschiedene Systemgrößen. Siehe auch http://www.ruph.cornell.edu/sss/sss.html Spezielle Beachtung verdienen die Größen Thermodynamik und Statistische Physik 119 – h(M − hM i)2 i, liefert Suszeptibilität, – h(E − hEi)2 i, liefert Wärmekapazität. 4.7 Elementares zur Renormierungsgruppe (RG) Die Monte-Carlo-Simulationen des letzten Abschnitts zeigten charakteristische Konfigurationen mit unterschiedlichem Verhalten bei T > Tc (“Domänen” gleicher Ausrichtung der Spins mit endlichem Durchmesser), T = Tc (“Domänen” beliebig großer und kleiner Ausdehnung), T < Tc (“Domänen” makroskopischer Ausdehnung mit wenigen, endlichen Inseln entgegengesetzter Ausrichtung). Da am kritischen Punkt Domänen beliebiger Größe existieren, sieht jedes Bild auf beliebigen Längenskalen ähnlich aus. Dies ist oberhalb und unterhalb des kritischen Punktes völlig anders. Führen wir in den Bildern typischer Konfigurationen eine Skalenänderung durch, im einfachsten Fall durch extremes Dezimieren der Spins (4 → 1), so erhalten wir für T > Tc Bilder mit nur halb so größen Domänen, d.h. wie im Falle einer Temperatur höherer als T . Betrachten wir eine typische Konfiguration bei T < Tc , so führt die genannte Dezimierung auf ein Bild mit makroskopischen Domänen mit nur noch halb so großen Inseln entgegengesetzter Ausrichtung, d.h. wie im Falle einer Temperatur niedriger als T . In jedem Fall führt die Skalenänderung mit linearem Dezimierungsfaktor b > 1 weg vom kritischen Punkt, außer bei Start exakt bei Tc . Die schon eingeführte Korrelationslänge ξ entspricht dem mittleren Durchmesser von “Domänen”. Die genannten Beobachtungen legen folgende Frage nahe: Kann eine Skalenänderung exakt äquivalent zu einer Änderung der Temperatur und weiteren Wechselwirkungen sein? “Äquivalent” soll hier heißen, daß Zustandssumme und Korrelationsfunktionen (soweit an den nicht-dezimierten Spins auswertbar) übereinstimmen. Wir wollen ein einfaches Beispiel besprechen für welches die Antwort auf die obige Frage “ja” lautet. Beispiel: Eindimensionales Isingmodell mit Dezimierungsprozedur. 120 A. Klümper Dezimierungsprozedur mit b=2 1 2 3 4 5 6 Summation ueber Spins an Plaetzen 1’ 2’ 3’ Wir wollen die Zustandssumme einer Kette mit N Spins betrachten und die Summation über jeden zweiten Spin (b = 2) explizit durchführen. P P P 1 X K j σj σj+1 +h j σj +C j 1 ZN = N e 2 σ ,σ ,... 1 2 X = [P (σ1 , σ2 )P (σ2 , σ3 ) · ... · P (σN , σ1 )], (4.72) σ1 ,σ2 ,... wobei der Faktor 1/2N und C aus Bequemlichkeitsgründen eingeführt wurden und nur die Lage der Grundzustandsenergie betreffen; P (., .) ist definiert durch h 1 P (σi , σi+1 ) = eKσi σi+1 2 (σi +σi+1 )+C . (4.73) 2 Die Summation über σ2 , σ4 , ... führt zu X ′ ZN = [P ′ (σ1 , σ3 )P (σ3 , σ5 ) · ... · P (σN −1 , σ1 )] = ZN/2 , (4.74) σ1 ,σ3 ,... wobei P ′ (σ1 , σ3 ) = X P (σ1 , σ2 )P (σ2 , σ3 ). (4.75) σ2 =±1 Man überlegt sich leicht, daß auch P ′ vom Ising-Typ ist [im wesentlichen hat mit P auch P ′ die Symmetrie P (σ1 , σ2 ) = P (σ2 , σ1 ), also gibt es nur 3 verschiedene Funktionswerte, die für geeignete Änderung der 3 Parameter K, h, C reproduziert werden]. Die renormierten Wechselwirkungsparameter K ′ , h′ , C ′ sind ′ cosh(2K + h) cosh(2K − h) , cosh2 h cosh(2K + h) = e2h , cosh(2K − h) = e8C cosh(2K + h) cosh(2K − h) cosh2 h. e4K = ′ e2h e4C ′ Bei der hier nicht durchgeführten Rechnung wurde benutzt (4.76) Thermodynamik und Statistische Physik ′ ′ P (+, +) P (+, +)P (−, −) , e2h = , P (+, −)P (−, +) P (−, −) = P (+, +)P (−, −)P (+, −)P (−, +). 121 e4K = e4C ′ (4.77) Wir haben mit der Abbildung (4.76) eine Realisierung von Renormierungsgruppen-Transformationen Rb gefunden mit den Eigenschaften Rb : H → H, (4.78) wobei H der Raum der Wechselwirkungen bzw. Hamiltonfunktionen (hier 3-dim. für Ising-Kette, im allgemeinen ∞-dimensional, siehe unten) und – b > 1 und R beschreibt eine Reduktion von N auf N ′ = N/bd viele Freiheitsgrade (d= Raumdimension), – Rb ist im thermodynamischen Limes wohldefiniert und differenzierbar, – “Unitarität”; d.h. freie Energie pro Freiheitsgrad f [H] = b−d f [H ′ ] ′ ′ Grund: ln ZN /N = b−d ln ZN ′ /N , – Korrelationslänge ξ ′ = ξ/b, – Halbgruppeneigenschaft, Rb1 ◦ Rb2 = Rb1 b2 , für “erlaubte” Skalenfaktoren, (die Inverse existiert nicht!). Unter dem Renormierungsgruppen-Fluß versteht man die Menge aller Trajektorien, die sich durch wiederholtes Anwenden von Rb auf ein festes Startelement ∈ H ergeben. Beispiel: 1-d Isingmodell in geeigneten Variablen K, h 1−e−2h B= ∞ Linie trivialer FP’s 1 T= ∞ 0 1 e−2K kritischer FP In Raumdimensionen d > 1 treffen wir auf die Komplikation, daß im Gegensatz zu d = 1 H nicht endlichdimensional gewählt werden kann. Die RGProzedur generiert ausgehend von einfachen Nächst-Nachbar-Wechselwirkungen (“Bond”-Wechselwirkung) unter anderem längerreichweitige Wechselwirkungen und Mehr-Spin-Wechselwirkungen. Dies wird anhand des Vergleiches von d = 1 und d = 2 klar. 122 A. Klümper Vergleich d=2 d=1 Summation ueber Zentralspin 11111111 00000000 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 "Bond"−Wechselwirkung "Bond"− und Plaquetten−Wechselwirkung In den mathematischen Gründen ist der Unterschied wie folgt zu finden. Wir hatten schon bei d = 1 gesehen, daß die renormierte Wechselwirkung für alle 4 verschiedenen Spin-Konfigurationen nur 3 unabhängige Boltzmanngewichte liefert, was auf 3 Gleichungen für die 3 “Bond”-Wechselwirkungsparameter hinausläuft und exakt lösbar ist. Für d = 2 gibt es 16 Spin-Konfigurationen mit etwas weniger unabhängigen Boltzmanngewichten, aber deutlich mehr als 3! Dies führt auf ein überbestimmtes Gleichungssystem, was typischerweise nicht lösbar ist. Bemerkung: Es gibt jedoch in d = 2 Ausnahmefälle, bei denen “mysteriöserweise” keine Überbestimmung vorliegt (→ Integrabilität). Das feldfreie Isingmodell kann als derartiges Beispiel angesehen werden. Wir wollen hier nur noch bemerken, daß es verschiedene Näherungsverfahren der Konstruktion von RG’s gibt. Allen diesen Verfahren ist gemeinsam, daß mit einer endlichen Anzahl von Kopplungen gearbeitet wird. Beispiele von Ortsraum-RG (“real space” RG) sind Kumulanten-Verfahren, Finite-Cluster, (Ortsraum-RG’s Migdal-Kadanoff, b nimmt diskrete Werte an) Monte-Carlo (→ präzise Exponenten). Anstelle von Spin-Variablen mit Ortsindizes können wir in den Wechselwirkungen alternativ Spin-Variable mit Impulsindizes haben. Dies läßt sich immer durch eine Fourier-Transformation erreichen. Der Vorteil dieser Darstellung ist, daß Impulsindizes ein Kontinuum überstreichen. Wenn wir mit Spin- Thermodynamik und Statistische Physik 123 Systemen auf einem regulären Gitter arbeiten, liegen die Impulse nicht nur dicht, sondern ferner in einem kompakten geometrischen Objekt (BrillouinZone, = Quadrat beim Quadratgitter). Die Dezimierung wird nun geschickterweise über die Freiheitsgrade zu den größten Impulsen bzw. über den Rand der Brillouin-Zone durchgeführt. Diese Verfahren sind sogenannte ImpulsraumRG bzw. feldtheoretische Verfahren mit b kontinuierlich und beliebig dicht an b = 1. Beispiele sind ǫ-Entwicklung, (Impulsraum-RG’s, b bei 1) Callan-Symanzik-Gleichung. Wir wollen wegen der Kürze der verfügbaren Zeit uns nicht mit der Herleitung von RG’s beschäftigen. Stattdessen fragen wir uns, welche Eigenschaften des physikalischen Systems aus welcher Information zu der RG folgen. Wir wollen verstehen Skalengesetze, (für kritische Exponenten) Universalität, (Unabhängigkeit der Exp. von mikroskop. Details). Die Wirkung einer RG-Transformation ist auf – nichtkritische Systeme: ξ ′ = ξ/b < ξ, d.h. die fortgesetzte Anwendung führt immer weiter weg vom kritischen Punkt, – kritische Systeme: ξ ′ = ξ/b = ∞, bleibt kritisch. Der Fluß der RG wird durch Fixpunkte regiert (FP), für die gilt ξ ′ = ξ als auch ξ ′ = ξ/b mit Lösung für ξ: ξ = 0 (“Hochtemperatur”-FP) oder ξ = ∞ (kritischer FP) Wir interessieren uns für die letzteren Fixpunkte. Wir formulieren die plausible Annahme: Der Raum H zerfällt in verschiedene Bereiche, die durch verschiedene Fixpunkte regiert werden, d.h. die durch den RG-Fluß von diesen FP’s erreicht werden. Der Existenz von wenigen Fixpunkten entspricht die Aussage der Universalität. Wir wollen nun zeigen, daß die kritischen Eigenschaften der Systeme durch die Eigenschaften der RG-Transformation in der Nähe der nichttrivialen FP’s bestimmt sind. Sei H ∗ ein Fixpunkt und H = H ∗ + g · Q ein benachbartes (gestörtes) System, wobei Q ∈ H die Störung und g die Kopplungsstärke ist; g wird als kleiner (reeller) Parameter angesehen. Wir linearisieren nun Rb bei H ∗ durch das Differential Lb H ′ := Rb [H] = Rb [H ∗ + gQ] = Rb [H ∗ ] +g · Lb Q. | {z } =H ∗ Wir suchen nun nach Eigenvektoren Qj von Lb (4.79) 124 A. Klümper Lb Qj = Λj (b) · Qj , (4.80) wobei Qj unabhängig von b ist, da Qj für alle Lb mit beliebigem b als simultaner Eigenzustand gewählt werden kann. Dies gilt wegen der Kommutativität aller Lb (4.81) Lb1 ◦ Lb2 = Lb1 b2 = Lb2 ◦ Lb1 , insbesondere folgt für die b-Abhängigkeit der Eigenwerte Λj (b1 )Λj (b2 ) = Λj (b1 b2 ) =⇒ Λj (b) = bλj , (4.82) mit einem geeigneten λj . Wir können nun einen beliebigen Punkt H(∈ H) nach dem vollständigen Satz Qj entwickeln X H = H∗ + gj · Qj , (4.83) j wobei die Qj auch als Skalen-“Operatoren” und die gj als Skalenfelder bezeichnet werden. Das Verhalten der freien Energie in der Nähe eines Fixpunktes nach l-maliger Iteration der RG lautet f (g1 , g2 , ...) = b−dl f (bλ1 l g1 , bλ2 l g2 , ...). (4.84) Wir beobachten unterschiedliches Verhalten je nach λj – λj > 0: hier wächst gj beständig, der RG-Fluß trägt den Punkt vom Fixpunkt weg: relevante Störung, – λj < 0: hier schrumpft gj beständig, irrelevante Störung, – λj = 0: marginale Störung Beispiel: relevante Skalenfelder sind üblicherweise Temperatur und Magnetfeld bzw. die einheitenlosen Größen t := (T − Tc )/Tc ≡ g1 und h ≡ g2 . Irrelevant sind üblicherweise symmetrieerhaltende Übernächste-Nachbar-Wechselwirkungen etc. (siehe Universalität). Im folgenden nehmen wir an λj < 0 für alle j > 2. Herleitung der Skalengesetze Wir wählen l derart, daß bλ1 l = 1/t, d.h. bl = t−1/λ1 ´ ³ gj h ... , (4.85) f (t, h, ...gj ...) = td/λ1 f 1, λ /λ , ... λj /λ1 t 2 1 |t {z } →0 fuer t→0 analog folgert man Thermodynamik und Statistische Physik f (t, h) = hd/λ2 f µ t hλ1 /λ2 ¶ ,1 . 125 (4.86) Durch entsprechend häufiges Ableiten nach t und h erhält man den Zusammenhang von kritischen Exponenten und den Eigenwerten der RG d , λ1 d − λ2 β= , λ1 2λ2 − d γ= , λ1 1 d − λ2 = . δ λ2 2−α= (4.87) Wir wollen nun die kritischen Exponenten der Korrelationsfunktionen finden. Dazu müssen wir die RG anwenden auf ein Modell mit räumlich inhomogenem Feld h(r): homogen auf Längen ∆r >> 1, d.h. viel größer als mikroskopische Längenskalen; Variation auf Längen r >> ∆r. ∆r ∆r r ∆r ∆r Transformierte Koordinaten r und Magnetfeld h r′ = r/b, h′ (r′ ) = bλ2 h(r). (4.88) Die (logarithmierte) Zustandssumme ln Z(= ln Z ′ ) zu Feld h(r) ist erzeugende Funktion der Zwei-Punkt-Funktion C(r, t) (mit Temperaturvariable t) ∂ ∂ ln Z ∂h0 ∂hr ∂ ∂ = b2λ2 ′ ln Z ′ ∂h0 ∂h′r′ ¶2d µ ∆r C(r′ , t′ ) = b2λ2 b = b2(λ2 −d) (∆r)2d C(r/b, tbλ1 ). (∆r)2d C(r, t) = (4.89) Es folgt direkt C(r, t) = b2(λ2 −d) C(r/b, tbλ1 ). (4.90) 126 A. Klümper Durch Vergleich mit e−r/ξ e−r/ξ bzw. , (4.91) 2x r 2 rd−2+η wobei die Exponenten des algebraischen Anteils definitionsmäßig mit x2 bzw. η geschrieben wurden. Man erhält C(r, t) = 1 , λ1 x2 = d − λ2 bzw. d − 2 + η = 2(d − λ2 ). (4.92) P Ganz allgemein ist jedes Qj (= r φj (r)) Summe von lokalen Termen, die zugehörigen Korrelationsfunktionen hφj (0)φj (r)i können genauso behandelt werden wie der Fall j = 2 ξ(t′ ) = bξ(t) =⇒ ξ(t) ∼ |t|−ν , Cj (r) = hφj (0)φj (r)i ∼ mit xj = d − λj . 1 , r2xj ν= am kritischen Punkt, (4.93) Im üblichen Sprachgebrauch heißen C1 und C2 Energie-Energie- und SpinSpin-Korrelation. Mit (4.87,4.92) haben wir die sogenannten Skalenrelationen gefunden α, β, γ, δ, ν, η ↔ λ 1 , λ2 ↔ x1 , x2 . (4.94) Der erste Satz Exponenten beschreibt das physikalische Verhalten des Systems bei Abweichungen vom kritischen Punkt, der zweite Satz Zahlen charakterisiert die Eigenwerte der RG, der dritte Satz Exponenten beschreibt das Verhalten des Systems exakt am kritischen Punkt. Eine mögliche Anwendung der Skalenrelationen kann wie folgt aussehen. Wir sind beispielsweise an dem ersten Satz Exponenten interessiert, können aber den zweiten (oder dritten) Satz einfacher berechnen. Eine weitere Anwendung ist die Eliminierung der Größen λ1 und λ2 in (4.87), was von 6 Relationen genau 4 übrig läßt. Diese Skalenrelationen im engeren Sinne sind γ = ν(2 − η), α + 2β + γ = 2, γ = β(δ − 1), νd = 2 − α, (“Hyperskalen-Relation”). (4.95) Wir wollen diese Relationen an Hand einiger wichtiger Modelle überprüfen α β γ δ η ν Ising d = 2 0 (log) 1/8 7/4 15 1/4 1 Ising d = 3 0,11 0,32 1,24 4,8 0,05 0,63 klass. Heisenberg d = 3 -0,12 0,36 1,37 4,6 0,04 0,7 MFA, beliebiges d 0 1/2 1 3 0 1/2 Thermodynamik und Statistische Physik 127 Wir bemerken, daß die Skalenrelationen für alle aufgelisteten Modelle erfüllt sind, bis auf die Molekularfeldapproximation (MFA). Hier ist die Hyperskalenrelation genau für d = 4 erfüllt. Wir schließen daher, daß die MFA zur Beschreibung des kritischen Verhaltens ungeeignet ist. Dieser weitere Widerspruch (zu Skalenrelationen der RG) zusammen mit dem Widerspruch zur exakten Lösung des d = 2 Isingmodells sollte das MFA-Verfahren endgültig dikreditieren. Wir wollen aber einen amüsanten Schwenk nicht verschweigen: Die Inkonsistenz von MFA und Hyperskalenrelation bei d < 4 liegt am Versagen der MFA. Bei d > 4 jedoch ist die MFA korrekt (!), unsere Ableitung der Skalenrelationen ist für d > 4 zu naiv!. Wir wollen hier nur auf die Auflösung des Rätsels hinweisen, aber nicht ausführen. Für d > 4 ist die Betrachtung der irrelevanten Skalenfelder wichtig (“gefährliche irrelevante Operatoren”)! Im Gegensatz zu d < 4 ist für ein gewisses j die freie Energie f (gj → 0) singulär! Wir bemerken die Universalität des kritischen Verhaltens: kritische Exponenten hängen nicht von den vielen mikroskopischen Details der Wechselwirkung ab, da am kritischen Punkt die Korrelationslänge des Systems divergiert. “Irrelevant” sind Parameter wie Reichweite der Wechselwirkung (solange endlich), Mehrspinwechselwirkung (solange symmetrieerhaltend) und Kristallgitterstruktur. “Relevant” sind die Dimensionalität d des Raumes, die Anzahl n der Komponenten des lokalen Ordnungsparameters bzw. Feldes und Symmetrie der Wechselwirkung. 4.8 Das Ginzburg-Landau-Modell Wir wollen im Sinne der zuletzt angesprochenen Irrelevanz der Kristallstruktur ein phänomenologisches, kontinuierliches Modell betrachten. Wir verstehen hier “Kontinuum” im räumlichen Sinne, d.h. wir betrachten eine sog. Ordnungsparameterdichte m(x), die auf Längenskalen klein gegen Systemabmessungen, aber groß gegen die Gitterkonstante definiert ist. Ferner soll diese Ordnungsparameterdichte kontinuierliche, reelle Werte in einem gewissen (möglicherweise unendlichen) Intervall annehmen. Es gibt auch Verallgemeinerungen auf mehrkomponentige reelle und auch komplexe m(x). ~ Es gibt ein (Freies-)Energie-Funktional F[m, B], das jeder Realisierung bzw. Konfiguration m(x) und jedem auch inhomogenem Magnetfeld B(x) eine (reelle) Zahl zuordnet. Die Freie Energie bzw. Zustandssumme ist dann durch ein Funktionalintegral über alle Funktionen m(x) gegeben e −F (T,B)/kB T =Z= Z (Dm) | {z } Funktionalintegral e−F [m,B] , (4.96) 128 A. Klümper wobei im folgenden erklärt werden muß, wie derartige Integrale definiert sind. Wir bemerken zunächst, daß typischerweise das Funktional F lokal und von Integralform ist Z F[m, B] = dd xφ(m(x), B(x)), (4.97) wobei wir ganz allgemein eine Entwicklung nach Potenzen und Gradienten in m(x) vorliegen φ(m(x), B(x)) = 1 B(x) 1 1 |∇m(x)|2 − m(x) + A(T )m2 (x) + B(T )m4 (x) + ... 2 kB T 2 4 | {z } =:h(x) (4.98) Dies ist die Landausche Freie Energie, wobei der Koeffizient vor dem Gradiententerm durch Normierung des Feldes m(x) auf 1/2 gesetzt wurde, ungerade Ordnungen in ∇ und m wegen Paritäts- und Spinumkehr-Invarianz nicht auftreten können. Höhere Ordnungen sind vernachlässigt worden, da sie sich im Sinne der RG als irrelevant herausstellen (hier nicht gezeigt). Die Temperatur T geht in die Koeffizienten A(T ) und B(T ) ein. Wir werden uns bald mit der Auswertung des Modells (4.96) befassen, wollen aber schon anmerken, daß (4.96) das kritische Verhalten beispielsweise des Isingmodells richtig beschreibt, die sog. Landau-Näherung “falsch” ist. Wir wollen nun zwei mögliche Herleitungen von (4.96) besprechen und dabei das Funktionalintegral definieren. I) Mittelungen über Zellen Wir zerlegen das System in Zellen, die groß gegenüber mikroskopischen Abständen sind, aber klein im Vergleich zum Gesamtsystem. Für jede Konfiguration der Spinvariablen σi auf den Gitterplätzen i definieren wir den lokalen Ordnungsparameter m = m(x), indem wir für jede Zelle mit Ortsvektor x das arithmetische Mittel der enthaltenen Spins σi bestimmen. Dies liefert kontinuierliche Werte für m(x) auch bei diskreten Werten für σi . m(x) σi Es ist klar, daß jeder Spinkonfiguration genau eine Funktion m = m(x) zugeordnet wird. Umgekehrt gibt es zu jeder Funktion m mehrere Spinkonfigurationen, diese Anzahl heiße W [m]. Die typische Energie der Spinkonfigu- Thermodynamik und Statistische Physik 129 rationen zu m ist E[m, B], wobei B das (inhomogene) Magnetfeld ist. Die Zustandssumme ist Z ¡ −βH ¢ Z = Sp e−βH = (Dm) e | {z m} | R{z } Summe ueber alle Q ∞ Spinkonfigurationen := dm(x) passend zu m x −∞ Z −βE[m,B] = (Dm)W [m]e , (4.99) wobei hier der Integrand zu festem m = m(x) gemäß unserer Vorüberlegungen umgeschrieben wurde. Der letzte Ausdruck hat die gewünschte Form, wenn wir setzen F[m, B] = βE[m, B] − ln W [m]. (4.100) Es ist plausibel, daß E und ln W als Integrale über geeignete Funktionen von m(x) dargestellt werden können. Es ist auch klar, daß die Koeffizienten der Landauschen freien Energie ganz allgemein temperaturabhängig sind. Wir sind hier recht formal vorgegangen. Wir können uns physikalisch fragen, warum es Sinn macht, eine Dichte des Ordnungsparameters einzuführen bzw. in einem Zwischenschritt m(x) festzuhalten? Wir erwarten einfach, daß Ordnungsparameter erhalten sind und langsam fluktuieren. Die schnellen Fluktuationen wurden aufsummiert und definieren W (und auch E). Die langsamen Fluktuationen, die am kritischen Punkt besonders wichtig sind, werden durch die effektive Kontinuumstheorie beschrieben. Wir werden häufig Funktionalintegrale definieren und auswerten, indem wir ein effektives Gitter (wie oben) zu Grunde legen. Dann müßten wir den Kontinuumslimes durchführen, was für uns nicht so wichtig ist, da wir ohnehin an Gittermodellen interessiert sind. Kritische Exponenten hängen nicht ab von der Größe der Gitterkonstanten a. Wichtiger als der formale Kontinuumslimes a → 0 ist der thermodynamische Limes, da jedes endliche System analytisch ist, d.h. keine Kritikalität zeigt. II) Kac-Hubbard-Stratonovich-Transformation Wir können, ausgehend von einem Isingmodell mit diskreten Spins, auch unter Beibehalten des diskreten Gitters ein Modell mit kontinuierlich variierenden Feldern herleiten. Dies wird erreicht durch gewisse Gauß-Integrale über kontinuierliche Hilfsvariable, wodurch die bilinearen Ausdrücke der Isingspins entkoppelt werden. Details werden wir nicht besprechen. Wir wollen anmerken, daß die hier angedeutete Prozedur vollständig beherrscht wird und alle Terme, die oben auf Grund von Universalität bzw. Irrelevanz ignoriert wurden, einfach beherrscht werden. 130 A. Klümper Landau-Näherung Wir wollen nun eine einfache Näherungauswertung von (4.96-4.98) besprechen. Diese Näherung ist die Sattelpunktsintegration in dem Sinne, daß das Integral durch den Integranden am Maximum ersetzt wird. Das Minimum von F[m, B] bezüglich m ergibt sich aus den EulerLagrange-Gleichungen ∂ ∂φ ∂φ = , (4.101) ∂x ∂∇m ∂m was unter Vernachlässigung höherer Ordnungsterme ∂ 2 m(x) = −h(x) + A(T )m(x) + B(T )m3 (x) + ..., ∂x2 (4.102) liefert. Alternativ kann man diese Gleichungen erhalten, indem wir eine partielle Integration in (4.97) durchführen und erhalten · ¸ Z 1 1 d 2 2 F[m, B] = d x − m(x)∇ m(x) − h(x)m(x) + A(T )m (x) + ... . 2 2 (4.103) Wenn wir hier die Variation nach m(x) durchführen, beachten wir, daß auch der Laplace-Term zweimal den gleichen Beitrag liefert, wie jeder Term bilinear in m(x). Dies ergibt (4.102). Nennen wir die Lösung zu (4.102) m̄(x), so ergibt sich die freie Energie in Landauscher Näherung als − ln Z = βF (T, B) = F(m̄, B). (4.104) Wir lösen (4.102) zunächst für den Fall eines räumlich homogenen Magnetfeldes und überzeugen uns davon, daß die Landau-Näherung der Molekularfeldtheorie entspricht. Wir können von einem räumlich homogenen m ausgehen mit Gradient 0, damit folgt 0 = −h + A(T )m + B(T )m3 . (4.105) Dies ist die aus (4.45) bekannte Selbstkonsistenzbeziehung in der Nähe des kritischen Punktes. Wir lernen hieraus unter anderem, daß die kritische Temperatur (in der betrachteten Näherung) durch den Nulldurchgang A(Tc ) = 0 bestimmt ist. Wir wollen nun nicht unsere alten Rechnungen reproduzieren, sondern vielmehr die bisher nur zitierten Ergebnisse für die Korrelationsfunktion ableiten. Dazu benutzen wir die logarithmierte Zustandssumme für ein inhomogenes äußeres Feld als erzeugende Funktion G(x) := hm(0)m(x)i − hm(0)ihm(x)i = δ δ ln Z, δh(0) δh(x) (4.106) Thermodynamik und Statistische Physik 131 und mit (4.104) G(x) = − δ δ δ F(m̄) = m̄(x). δh(0) δh(x) δh(0) (4.107) R Wir haben bei der Ableitung von F(m̄, B) = dd xφ(m(x), B(x)) nach h(0) = B(0)/kB T nur den Term berücksichtigt, der sich bei der expliziten Ableitung nach dem zweiten Argument ergibt. Die Ableitung nach dem ersten Argument lieferte δF δm = 0, δm |{z} δh(x) (4.108) =0 wobei das Ergenis 0 ist wegen der Minimalitätseigenschaft bezüglich Variation nach m. Wir wenden die Variationsableitung auf (4.102) an ∂ 2 G(x) = −δ(x) + A(T )G(x) + ... µ ∂x2 2 ¶ ∂ ⇔ − 2 + A G(x) = δ(x). ∂x (4.109) Die letzte Gleichung lösen wir per Fourier-Transformation 1 G(~x) = (2π)d Z ~ dd k e−|x|/ξ eik~x ∼ , k2 + A xd−2 1 ξ=√ , A (4.110) wobei die Asymptotik für große x zu verstehen ist. Dieses Ergebnis hatten wir schon früher zitiert mit den kritischen Exponenten η = 0 und ν = 1/2, wobei hier von einer Nullstelle erster Ordnung in A(T ) bei Tc ausgegangen wurde. Wir wollen hier einen Überblick gegeb über das Phasendiagramm des GinzburgLandau-Modells in Landau-Näherung. Für B > 0 erhalten wir einen Phasenübergang 2. Ordnung, wenn A = 0 ist. Für B < 0 brauchen wir zur Wohldefiniertheit von (4.96-4.98) einen positiven Term 6. Ordnung (Cm6 (x)). Hier stellt sich ein Phasenübergang 1. Ordnung ein. Der Grenzpunkt der Linien 1. Ordnung und 2. Ordnung ist der sog. trikritische Punkt mit seinen eigenen kritischen Exponenten. In Landau-Näherung sind dies α = 1/2, β = 1/4, γ = 1, δ = 5, und wie gehabt η = 0, ν = 1/2. 132 A. Klümper B 2. Ordnung trikritischer Punkt A 1. Ordnung Wir wollen uns mit der Frage beschäftigen, für welche Raumdimensionen d die kritischen Exponenten der Landau-Näherung für den Phasenübergang 2. Ordnung und den trikritischen Punkt korrekt sind. Es wird sich zeigen, daß dies für hinreichend hohe Dimension erfüllt ist. Die Minimaldimension, die dies liefert heißt obere kritische Dimension. Das Ginzburg-Kriterium Die Landau-Näherung ist eine Sattelpunktintegration, d.h. sie vernachlässigt Abweichungen von der stationären Konfiguration (stationärer Weg). Im Rahmen der Molekularfeldtheorie sind es die Korrelationen zwischen Nächst-Nachbar-Spins, die vernachlässigt werden. Wir werden noch sehen, wie derartige Fluktuationen quantitativ behandelt werden. Wir wollen uns hier mit einer qualitativen Überlegung von den Konsequenzen dieser Rechnungen ein Bild machen. Innerhalb der Landau-Näherung ist es sicher legitim zu verlangen, daß Fluktuationen einen gewissen Grenzwert nicht überschreiten sollten, damit diese “Theorie” wenigstens in sich “stimmig” ist. Wir nehmen als Maß für Fluktuationen den Wert der SpinSpin-Funktion bei einem räumlichen Abstand, der der Korrelationslänge ξ entspricht, d.h. G(ξ). Dieser Wert ist zu vergleichen mit dem Mittelwert des Ordnungsparameters zum Quadrat m̄2 . Dies ist natürlich nur in der Tieftemperaturphase sinnvoll. Unsere Berechnung von G(x) galt der Hochtemperaturphase, d.h. (4.110) ist für A > 0 gültig. Tatsächlich ist auch die Tieftemperaturphase erfaßt, wenn in (4.110) A durch |A| ersetzt wird. Thermodynamik und Statistische Physik 133 Das Ginzburg-Kriterium für die Gültigkeit der Landau-Näherung ist d−4 G(ξ) ξ 2−d |A|(d−2)/2 << 1 ⇔ << 1 ⇔ = |A| 2 << 1, 2 2 m̄ m̄ |A| (4.111) dies bedeutet, daß für d < 4 der Parameter A nicht zu klein bzw. die Temperatur nicht zu nah an der kritischen Temperatur liegen darf. Für d > 4 gibt es diese Beschränkung nicht. Folglich dürfen wir annehmen, daß die kritischen Exponenten der Molekularfeldtheorie (4.49) (nur) für d > 4 korrekt sind, d.h. die obere kritische Dimension ist 4. Wenn wir das Ginzburg-Kriterium auf die Landau-Näherung zum trikritischen Punkt (d.h. A = B = 0) anwenden, finden wir als obere kritische Dimension 3. Korrekturen zur Landau-Näherung Wir berücksichtigen in F[m, B] genau die Terme 2. Ordnung in m (für beliebiges B und insbesondere in der Tieftemperaturphase müßten wir um den Sattelpunkt entwickeln.), dies führt zu (4.103). Mittels des eindimensionalen Gauß-Integrals Z ∞ K 2 dΦ 1 η2 √ e− 2 Φ +ηΦ = √ e 2K , (4.112) 2π K −∞ zeigt man für hermitische Operatoren K in einem n-dimensionalen Raum mittels unitärer Transformation Z −1 1 1 1 e 2 hη|K ηi , (4.113) (DΦ)e− 2 hΦ|KΦi+hη|Φi = √ detK wobei hier Φ und η n-dimensionale reelle Vektoren sind. In (4.103) ist K = −∇2 + A; wenn wir ein endliches Volumen V und Gitterkonstante a voraussetzen, sind die Eigenvektoren durch ebene Wellen der ~ Ortsvariablen x gegeben eik~x mit Eigenwert k 2 + A. Y detK = (k 2 + A), Zk , hh|K −1 hi = dd x h(x) (−∇2 + A)−1 h(x) |{z} P 1 i~ k~ x =V | = V1 P k {z k e h̃(k) x (k 2 +A)−1 h̃(k) ei~k~ } 1X 1 X h̃(−k)h̃(k) ln Z = − , log(k 2 + A) + 2 2V k2 + A k k (4.114) 134 A. Klümper wobei die k-Summen im wesentlichen wie schon früher durchzuführen sind, d.h. mit einer Diskretisierung (∆k)d = (2π)d /V mit dem d-dimensionalen Volumen V . Wegen des zugrundegelegten Gitters mit Gitterkonstanten a gibt es eine obere Schranke |k| ≤ Λ := 2π a . Wenn wir zunächst den feldfreien Fall betrachten erhalten wir Z kB T V kB T X dd k log(k 2 + A). log(k 2 + A) = F (T ) = 2 2(2π)d (4.115) k Derartige Integrale haben zwei mögliche Arten von Singularitäten – Λ → ∞, d.h. Ultraviolett (UV) – A → 0, d.h. Infrarot (IR) Für das kritische Verhalten ist das IR-Verhalten maßgeblich. Leiten wir F (T ) zweimal nach T ab, treffen wir auf folgendes Integral C∼ Z 0 Λ dd k , (k 2 + A)2 (4.116) mit dem Verhalten – d ≤ 4: divergent für A → 0 (logarithmisch für d = 4), – d > 4: konvergent! Wir sehen, daß für d ≤ 4 die Korrektur größer ist als das Ergebnis in 0. Ordnung. Dies gilt auch für höhere Korrekturen (Loop-Entwicklung). Für d > 4 scheint Störungstheorie – wenigstens Ordnung für Ordnung – sinnvoll zu sein. Wir betrachten nun (4.98) mit strikt quadratischen Termen, was das sog. Gauß-Modell definiert. Der Vorteil des Gauß-Modells ist, daß die obige Rechnung die vollständige Lösung darstellt, der Nachteil ist die Abwesenheit einer Tieftemperaturphase (dies stellr eine Pathologie des Modells dar). Wir fassen zusammen Z Λ/√A d−4 d−4 dd y ∼t 2 , d<4: C∼t 2 2 2 (y + 1) {z } |0 konvergent d = 4 : C ∼ const. + log t ∼ log t, d > 4 : C ∼ const. (4.117) wobei t = T − Tc wie schon früher definiert. Wir wollen nun die 2-Punkt-Korrelationsfunktionen berechnen. Dazu bemühen wir wieder die Fourierdarstellung Thermodynamik und Statistische Physik 1 X ikx e m̃(k), V k 1 X ikx e h̃(k), h(x) = V 135 m(x) = (4.118) k womit das Funktional des Gauß-Modells die Form ¸ · 1 X 1 2 F[m, B] = m̃(−k) (k + A)m̃(k) − h̃(−k)m̃(k) , V 2 (4.119) k annimmt. hm(x)m(y)i = 1 X i(kx+py) e hm̃(k)m̃(p)i V2 (4.120) k,p Wir wissen außerdem hm̃(k)m̃(p)i = V 2 ¯ ∂ 2 ln Z δk,−p ¯ =V 2 , ¯ k +A h̃=0 ∂ h̃(−k)∂ h̃(−p) (4.121) wobei das erste Gleichheitszeichen nach Definition und das zweite mit dem konkreten Ergebnis (4.114) gilt. Die letzte Beziehung zusammengefaßt mit (4.119) liefert zufällig (!?) genau die Formel in (4.110). 136 5 A. Klümper Vermischtes Wir wollen hier einige nicht ganz unwesentliche Fakten und Zusammenhänge nachtragen, die aus Zeitgründen nicht an ihren logischen Stellen im Hauptteil der Vorlesung besprochen wurden. 5.1 Chemische Reaktionen Wir wollen Gase betrachten, die aus mehreren Teilchensorten bestehen. Die unterschiedlichen Spezies werden mit i indiziert. Wir wollen das Gleichgewicht untersuchen. Unter gewissen Voraussetzungen können wir vom idealen Gas sprechen, d.h. von nichtwechselwirkenden Teilchen, die aber dennoch chemisch reagieren können (d.h. Limes schwacher Wechselwirkung). Als Beispiel nennen wir 2H2 + O2 − 2H2 O = 0, (5.1) oder allgemein X νi Ai = 0, (5.2) i wobei νi irgendwelche ganzen Zahlen und Ai “chemische Sysmbole” sind, die die Teilchen charakterisieren. Beachte, daß (5.2) nur Auskunft gibt über die Änderung der Teilchenzahlen, nicht aber über den Energiegewinn bzw. Verlust. Wir wollen jeder Teilchensorte i ein chemisches Potential µi zuordnen, das konjugiert ist zur Teilchenzahl Ni . Wir wollen direkt anmerken, daß nicht jede Teilchenzahl separat erhalten ist, da Reaktionen mit ∆Ni /νi = unabhngig von i, (5.3) erlaubt sind. Streng genommen gibt es zu einer nichterhaltenen Größe keine intensive Variable wie in Kapitel 1 besprochen. Wir hatten schon im Fall des Photonengases gesehen, daß wir konsistent arbeiten können, indem wir zwar vom chemischen Potential µ sprechen, aber in den entsprechenden großkanonischen Ausdrücken immer µ = 0 einsetzen. Im mehrkomponentigen Fall führt dies zu X νi µi = 0, (5.4) i und die entsprechende (großkanonische) Zustandssumme liefert wie im Fall des Photonengases das Gewünschte. Eine etwas weniger formale Argumentation könnte so lauten: wir arbeiten mit der freien Enthalpie G(T, p, Ni ) mit den Teilchenzahlen Ni (die nicht alle unabhängig sind). Da im Gleichgewicht G den minimalen Wert annimmt, muß gelten Thermodynamik und Statistische Physik dG ¯¯ = 0, ¯ dN1 p,T 137 (5.5) wobei mit N1 auch alle anderen Ni variiert werden unter der Nebenbedingung (5.3). Wir finden dann à ! X ∂G dNi X dG = = const. µi νi . (5.6) 0= dN1 ∂Ni dN1 i i In Verallgemeinerung zu (3.37) finden wir für ein mehrkomponentiges ideales Gas X zi zi = eβ(µi −ǫi ) , (5.7) ln Zgk,klass (T, V, µi ) = V 3, λ i i wobei die de Broglie-Wellenlänge über die Masse von der Teilchenspezies abhängen mag und die Fugazität zi nicht nur durch das “von außen manipulierbare” chemische Potential µi , sondern auch von einem Wert ǫi abhängt, der die intrinsische Energie der Komponente i berücksichtigt. Beachte, daß µi zur Teilchenzahl konjugiert ist, aber Relationen wie (5.2) nichts über die energetischen Verhältnisse aussagen. Dies wird durch ǫi kontrolliert. Es gilt Ni = ∂ ln Zgk zi = V 3 ⇒ βµi = ln ni + βǫi + 3 ln λi . {z } | ∂βµi λi (5.8) =:βκi (T ) Mit (5.4) folgt das Massenwirkungsgesetz Y X nνi i = exp(−β νi κi ) = K(T ), i (5.9) i wobei die rechte Seite nur eine Funktion der Temperatur ist. 5.2 Osmotischer Druck Wir betrachten Lösungen bestehend aus Lösungsmittel und gelöster Stoff mit niedriger Konzentration c, wobei für das chemische Potential des Lösungsmittels µ̄ die Beziehung (??) gilt µ̄(T, p, c) = µ(T, p) − kB T c, (5.10) wobei µ das chemische Potential des reinen Lösungsmittels ist. Wir betrachten nun zwei Lösungen mit unterschiedlichen Drücken p1 , p2 und Konzentrationen c1 , c2 , die durch eine semipermeable Membran getrennt sind, d.h. durchlässig für das Lösungsmittel, nicht für den gelösten Stoff. Wegen des sich einstellenden Gleichgewichtes muß das chemische Potential 138 A. Klümper des Lösungsmittels auf beiden gleich sein, d.h. µ̄(T, p1 , c1 ) = µ̄(T, p2 , c2 ), oder mit (5.10) µ(T, p1 ) − kB T c1 = µ(T, p2 ) − kB T c2 , (5.11) und mit Druck ∂µ ∂p = V /N = v folgt für die Druckdifferenz bzw. den osmotischen ∆p = ∆c 5.3 kB T . v (5.12) Rotationsfreiheitsgrade von Molekülen identischer Atome Wir hatten in (3.109) den Fall der Rotationsfreiheitsgrade eines zweiatomigen Moleküls behandelt, wobei wir Fragen nach der Symmetrie der Wellenfunktion außer Acht gelassen hatten. In Zrot = ∞ X (2j + 1)e− j(j+1) θr 2 T , (5.13) j=0 korrespondieren tatsächlich gerade (ungerade) j zu einem symmetrischen (antisymmetrischen) Ortsanteil der Wellenfunktion bezüglich Vertauschung der Kernpositionen. Die Gesamtwellenfunktion sollte eine wohldefinierte Symmetrie besitzen. Im Falle des Wasserstoff-Moleküls sind die Kerne Protonen und damit Fermionen. Die Gesamtwellenfunktion des Rotationsfreiheitsgrades besteht aus dem Orts- und Spinanteil! Für den letzteren ist zu beachten, daß sich die Kernspins, je Spin S = 1/2, zu einem symmetrischen Triplett J = 1 und einem antisymmetrischen Singulett J = 0 kombinieren. Eine antisymmetrische Gesamtwellenfunktion ist daher realisiert durch j gerade, J = 0 und j ungerade, J = 1. Daher ist (5.13) zu ersetzen durch Zrot = 3 · ∞ X j ungerade (2j + 1)e− j(j+1) θr 2 T +1· ∞ X (2j + 1)e− j(j+1) θr 2 T , (5.14) j gerade wobei die Entartungsfaktoren 3 und 1 sich aus der Multiplizität des Spinanteils ergeben. Bemerkung: Wasserstoff mit J = 1(0) wird Ortho- (Para-) Wasserstoff genannt. Die Umwandlung ineinander ist schwierig. 5.4 Globale Konvexität der thermodynamischen Potentiale Wir betrachten stellvertretend für alle Potentiale die freie Energie F (T, V, N ) und berücksichtigen in der weiteren Notation nur noch die Abhängigkeit von Thermodynamik und Statistische Physik 139 den extensiven Variablen. Wir wollen zeigen, daß in Abhängigkeit dieser Variablen F konvex ist. Geben wir N Teilchen in einem Volumen V vor, so ist F das Minimum des freien Energiefunktionals wie zuletzt in Abschnitt 4.4 besprochen. Eine obere Schranke für F (V, N ) ergibt sich aus folgender Konstruktion. Wir zerlegen V in zwei Teile V1 und V2 , ebenso die Teichenzahl N in N1 und N2 F (V, N ) ≤ F (V1 , N1 ) + F (V2 , N2 ). (5.15) Unter Berücksichtigung der Extensivität haben wir F (V, N ) = V f (N/V ) und damit µ ¶ µ ¶ µ ¶ N V1 V2 N1 N2 f ≤ f + f . (5.16) V V V1 V V2 Dies ist von der Form f (c1 x1 + c2 x2 ) ≤ c1 f (x1 ) + c2 f (x2 ), der definierenden Eigenschaft von Konvexität. Index n-Punkt-Funktion 114 1. Hauptsatz der Thermodynamik 2. Hauptsatz der Thermodynamik 3. Hauptsatz 50 30 31 abgeschlossenen System 12 absolute Temperatur 34 absoluten Temperatur 18 adiabatische 20 Besetzungszahlen 69 Boltzmann-Gewichte 20 Bose-Einstein-Kondensation 85 Bose-Verteilungsfunktion 71 Brillouin-Funktion 96 Carnot-Maschinen 32 chemischen Potentiale 22 chemisches Potential 21 Clausius-Clapeyron 55 Curie-Suszeptibilität 97 Dampfdruckerniedrigung 59 detaillierte Gleichgewicht 117 Diamagnetismus 95 Dichteoperators 6 Duhem-Gibbs 23 Einatomiges (strukturloses) Gas 72 Ensemble 9 entartetes Fermigas 80 Enthalpie 42 Entropie 24 Ergodenproblem 10 Euler-Lagrange-Gleichungen 129 Expansion ins Vakkum 48 Extremaleigenschaften 25 Fermi-Energie 80 Fermi-Impuls 80 Fermi-Temperatur 80 Fermi-Verteilungsfunktion 71 ferromagnetischen Phase 106 Ferromagnetismus 105 Fixpunkt 122 Freie Energie 41 Freie Enthalpie 42 Funktionalintegral 126 Gauß-Modell 133 Gefrierpunktserniedrigung 59 gemischten Zustandes 5 Gibb’sche Phasenregel 57 Ginzburg-Kriterium 131 Ginzburg-Landau-Modell 126 Gleichgewichtsbedingungen 39 Gleichgewichtszustand 12 Gleichverteilungssatz 66 großkanonische Zustandssumme 13 großkanonischen Gesamtheit 13 Großkanonisches Potential 43 Hartree-Fock-Verfahren 108 He4 87 Helizität 77 Hohlraumstrahlung 77 idealen Gase 68 Idealisierung 61 importance sampling 116 Impulsraum-RG 122 Infrarot (IR) 133 Integrabilitätsbedingung 45 irrelevant 123 Ising-Modell 100 Thermodynamik und Statistische Physik isotrope Heisenberg-Modell 100 Jacobi-Determinante 46 Joule-Thomson-Prozeß 49 kanonischen Dichteoperator 14 kanonischen Gesamtheit 14 kanonischen Zustandssumme 14 klassische Näherung 61 Koexistenz 51 Kompressibilität 44 konkav 102 konvex 102 Korrelationsfunktion 114 Kreisprozeß 31 kritischen Exponenten 110 Landau 87, 95 Landau-Näherung 129 Langevin-Funktion 97 langreichweitige Ordnung 114 Laplace-Transformation 19 latente Wärme 55 Legendre-Transformation 20 Lennard-Jones-Potential 92 Linksprozesse 37 Liouville-Gleichung 8 magnetische Suszeptibilität 94 makroskopisches System 5 Makrozustand 9 marginal 123 Massenwirkungsgesetz 136 Maxwell-Konstruktion 104 Metropolis-Algorithmus 116 mikrokanonische Gesamtheit 15 Mikrozustand 5 Molekularfeld 106 Molekularfeldtheorie 129 Näherungsverfahren 61 Nernst’sches Theorem 50 Nullpunktsdruck 83 obere kritische Dimension 131 Ordnung 60 Ordnungsparameter 126 Ordnungsparameterdichte 126 Ornstein-Zernike-Form 115 141 Ortsraum-RG 121 Osmotischer Druck 136 Paramagnetismus 96 Pauli-Paramagnetismus 98 Phasen 51 Phasengleichgewichte 51 Phasengleichgewichtes 57 Phasenkoexistenz 51 Photonen 77 Planck 78 Poissonklammer 62 Projektor 5 Prozeß 29 quantenmechanischen Zustand 5 quasi-statische 20 Quasistatischer (qs) Prozeß 29 Quasiteilchennäherung 61 Raoult’sches Gesetz 59 Rayleigh-Jeans 79 Rechtsprozesse 37 reinen Zustand 5 relevant 123 Renormierungsgruppen-Transformationen 119 Renormierungsgruppe 118 Renormierungsgruppen-Fluß 120 reversibel 32 Reversibilität 32 Rotationsanteil 74 Sattelpunkts-Integration 19 selbstkonsistenten Feldes 106 Siedepunktserhöhung 59 simple sampling 116 Skalen-“Operatoren” 123 Skalenfelder 123 Skalengesetze 122 Skalenrelationen 125 Sommerfeld-Entwicklung 83 Sommerfeld-Konstante 83 spezifische Wärme 44 Spinflip 116 spontane Magnetisierung 106 statistisch unabhängig 11 Statistische Gesamtheit 9 Statistische Gesamtheiten 8 142 A. Klümper Statistische Physik 4 Statistische Unabhängigkeit 11 Stefan-Boltzmann-Konstante 77 Supraleiter 95 symmetriebrechendes Feld 114 Temperatur 17 Thermische de-Broglie-Wellenlänge 65 thermischen Gleichgewichtes 12 Thermischer Ausdehnungskoeffizient 44 Thermodynamik 4 Thermodynamische Potentiale 40 thermodynamische Potentiale 22 Transfermatrix 112 Ultraviolett (UV) 133 Unerreichbarkeit 50 Universalität 122 Van-der-Waals-Modell 102 van-der-Waals-Wechselwirkung 92 van-Leeuwensches Theorem 95 verbundene Graphen 93 verdünnte Lösungen 58 Verteilungsfunktion 7 Vibrationsanteil 76 Virialsatz: 66 vollständiges Differential 30 von-Neumann-Gleichung 7 Wärmefluß 40 Wärmekapazität 44 Wahrscheinlichkeit 11 Wechselwirkende Spins 99 Weiss 105 Wien 79 Wien’sches Verschiebungsgesetz Wirkungsgrad 31 Zeitentwicklung 8 Zustandsgleichung 29 79