Statistische Mechanik und Thermodynamik Vorlesung SS 2004 (für Studenten ab 6. Fachsemester) Literatur W. Brenig, Statistische Theorie der Wärme Band 1 Gleichgewicht, Springer, Berlin 1996 H. Haug, Statistische Physik, Vieweg 1997 K. Huang Statistische Mechanik I, II Bibliographisches Institut, Mannheim 1964 L. Landau, E. Lifshitz Lehrbuch der Theoretischen Physik Band V, Statistische Physik, Akademie Verlag, Berlin 1983 F. Reif, Statistische Physik und Theorie der Wärme, de Gruyter, Berlin 1987 L.E. Reichl A Modern Course in Statistical Physics, Arnold Publ., Great Britain, 1980 F. Schwabl Statistische Mechanik, Springer, Berlin, 2000 Voraussetzung Grundkenntnisse in Klassischer Mechanik und Quantenmechanik Stand: 15.7.04 1 Inhaltsverzeichnis 1 Grundbegriffe der Statistik 1.1 Wahrscheinlichkeit . . . . 1.2 Zufallsvariable . . . . . . . 1.3 Binomialverteilung . . . . 1.4 Zentraler Grenzwertsatz . 1.5 Gesetz der großen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 7 9 13 15 2 Vielteilchensysteme 16 3 Zeitmittelwerte 16 4 Statistische Ensemble – klassisch 18 5 Liouville-Gleichung 19 6 Statistische Ensemble – quantenmechanisch 22 7 Von Neumann-Gleichung 24 8 Thermodynamisches Gleichgewicht 25 9 Maxwellsche Geschwindigkeitsverteilung 28 10 Volumen der Energieschale und Zustandsdichte für ein ideales Gas 29 11 Entropie 32 12 Entropie des idealen Gases 34 13 Mischungsentropie 35 14 Temperatur 37 15 Energieschwankungen 39 16 Kanonisches Ensemble 40 17 Gleichverteilungssatz 43 18 Paramagnetismus 47 19 1-dimensionales Ising Modell und Transfer-Matrix Methode 50 20 Arbeit äußerer Kräfte und Druck 54 21 van der Waals Gleichung 58 2 22 Hauptsätze der Thermodynamik 63 23 Thermodynamische Prozesse 23.1 Joulsches Experiment der freien Expansion 23.2 Joule-Thomson-Prozeß . . . . . . . . . . . 23.3 Adiabatische Entspannung von Gasen . . . 23.4 Adiabatische Entmagnetisierung . . . . . . 23.5 Thermodynamische Kreisprozesse . . . . . eines . . . . . . . . . . . . Gases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 66 68 69 70 71 24 Chemisches Potential und Gibbssche freie Enthalpie 74 25 Gleichgewichtsbedingungen als Extrema von thermodynamischen Potentialen 76 26 Gleichgewicht unter Energie- und Teilchenaustausch 77 27 Chemische Reaktionsgleichgewichte und Massenwirkungsgesetz 78 28 Koexistenz von Phasen 28.1 Wieviele Phasen können koexistieren? . . . . . . . . . . . . . . . . . . . . . . 28.2 Koexistenzkurven. Clausius Clapeyronsche Gleichung . . . . . . . . . . . . . 80 80 83 29 Großkanonische Verteilung 85 30 Ideale Quantengase 87 31 Freies Elektronengas 91 32 Paulischer Paramagnetismus des freien Elektronengases 95 33 Diamagnetismus des freien Elektronengases 97 34 Einige astrophysikalische Anwendungen der Theorie des idealen Fermi-Gases 98 35 Thermische Strahlung: Photonengas 102 36 Phononengase 104 36.1 Einstein Näherung für optische Phononen: . . . . . . . . . . . . . . . . . . . 106 36.2 Debye Näherung für akustische Zweige: . . . . . . . . . . . . . . . . . . . . . 106 37 Massives Bose-Gas und Bose-Einstein Kondensation 108 3 38 Molekularfeldtheorie kritischer Phänomene 38.1 Phasenübergänge 1. und 2. Ordnung . . . . 38.2 Molekularfeldtheorie . . . . . . . . . . . . . 38.3 Molekularfeldtheorie kritischer Phänomene . 38.4 Ginzburg-Kriterium . . . . . . . . . . . . . . 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 116 117 120 121 1 Grundbegriffe der Statistik In der statistischen Mechanik werden Vielteilchensysteme behandelt, deren Bewegungsgleichungen im allgemeinen nicht lösbar sind. Stattdessen können solche Systeme mit statistischen Methoden analysiert werden. Daher ist es erforderlich, daß wir uns zunächst mit einigen Grundbegriffen der Statistik vertraut machen, was in diesem Paragraphen geschehen soll. 1.1 Wahrscheinlichkeit 1. Intuitive Definition: Betrachten wir ein beliebig oft wiederholbares Experiment, dessen Ergebnis in zufälliger Weise variiert, wie z.B. Würfeln und Ablesen der Augenzahl des Würfels. Nennen wir das Ergebnis einer jeden Wiederholung des Experiments ein Ereignis und sei A ein mögliches Ereignis. Falls bei N Wiederholungen des Experiments NA mal das Ergebnis A auftritt, und das Verhältnis NA /N für N → ∞ gegen einen Grenzwert konvergiert, heißt NA P (A) = lim N →∞ N die Wahrscheinlichkeit des Ereignisses A. Falls P (A) = 0 bzw. P (A) = 1 kommt A in der unendlichen Folge von Wiederholungen “fast nie” bzw. “fast immer” vor. Ereignisse können sich gegenseitig entweder ausschließen oder auch nicht, was man durch Mengenkreise darstellen kann: A B (Ereignisse A, B schließen sich gegenseitig aus) A ∩ B = A B (Ereignisse A, B schließen sich gegenseitig nicht aus) A ∩ B 6= Die Ereignisse faßt man daher nützlicherweise als Mengen auf. Seien z.B. A und B zwei mögliche Ereignisse, die sich nicht aussschließen müssen. Z.B. könnten A bzw. B bedeuten, daß beim Wurf mit zwei Würfeln mindestens eine 1 bzw., mindestens eine 2 gewürfelt wird. Dann ist A ∪ B das Ereignis “entweder A oder B” (im Beispiel also: mit 2 Würfeln wird entweder mindestens eine 1 oder mindestens eine 2 gewürfelt), und A∩B ist das Ereignis “sowohl A als auch B” (im Beispiel: es wird sowohl eine 1 als auch eine 2 gewürfelt). Die Wahrscheinlichkeitstheorie wird nun mathematisch axiomatisch begründet als die Theorie von (positiven) Maßen auf Mengen (A.N. Kolmogorov). Die intuitive Definition ist dann eine Folgerung aus den Axiomen als das sog. Gesetz der großen Zahlen. 2. Axiomatische Definition: (a) Jedem zufälligen Ereignis A ist eine reelle Zahl P (A) mit 0 ≤ P (A) ≤ 1 zugeordnet, welche Wahrscheinlichkeit von A heißt. (b) Die Wahrscheinlichkeit des sicheren Ereignisses E ist 1: P (E) = 1 (c) Additionsaxiom: Sind A1 , A2 , A3 , . . . zufällige Ereignisse, die paarweise unvereinbar sind, d.h. für alle i, j mit i 6= j gilt Ai ∩ Aj = φ wo φ die Nullmenge ist, so gilt X P (∪i Ai ) = P (Ai ) . i 5 Es folgt hieraus wegen E = E ∪ φ und E ∩ φ = φ, daß 1 = P (E) = P (E ∪ φ) = P (E) + P (φ) = 1 + P (φ), woraus folgt P (φ) = 0. Außerdem, wenn Ā das Ereignis “nicht A” ist, A ∪ Ā = E, A ∩ Ā = φ, so folgt P (A ∪ Ā) = P (Ā) + P (A) = 1 → P (Ā) = 1 − P (A). Die Wahrscheinlichkeit für ein Ereignis kann davon abhängen, ob ein anderes Ereignis eingetreten ist oder nicht. Man beschreibt dies durch die bedingte Wahrscheinlichkeit P (A|B) für Ereignis A, vorausgesetzt daß Ereignis B eingetreten ist. Sie ist definiert durch P (A ∩ B) P (B) P (A ∩ B) P (B|A) = P (A) P (A|B) = (falls P (B) 6= 0) (falls P (A) 6= 0) . Hieraus ergibt sich die Multiplikationsregel der Wahrscheinichkeitsrechnung P (A ∩ B) = P (B)P (A|B) = P (A)P (B|A) , d.h. die Wahrscheinlichkeit dafür, daß bei 2 Ereignissen sowohl das eine als auch das andere eintreten, ist gleich dem Produkt der Wahrscheinlichkeit eines der Ereignisse mit der Wahrscheinlichkeit des anderen, bedingt daß das erstere eingetreten ist. Für Ereignisse A, B, die sich gegenseitig ausschließen, A∩B = φ, gilt P (A∩B) = P (φ) = 0 und somit auch P (A|B) = 0. Zwei Ereignisse A, B heißen statistisch unabhängig voneinander, wenn P (A|B) = P (A) . Dann gilt speziell P (A ∩ B) = P (A)P (B) , d.h. für statistisch unabhängige Ereignisse multiplizieren sich die Wahrscheinlichkeiten. Zwei Sätze lassen sich leicht beweisen: Es seien Ai , i = 1, 2, . . . n paarweise unvereinbare Ereignisse, Ai ∩ Aj = 0 falls i 6= j, von denen eines mit Sicherheit eintritt, ∪iAi = E. Für ein beliebiges zufälliges Ereignis B, dessen Eintreten davon abhängen kann, welches der Ereignisse Ai vorher eingetreten ist, gilt dann B = B ∩ (∪i Ai ) = ∪i (B ∩ Ai ) und daher mit der Additionsregel für Wahrscheinlichkeiten, die wegen (B ∩ Ai ) ∩ (B ∩ Aj ) = B ∩ (Ai ∩ Aj ) = B ∩ φ = 0 anwendbar ist, (a) P (B) = P (∪i (B ∩ Ai )) = X i P (B ∩ Ai ) = X P (Ai )P (B|Ai ) i (Satz von der totalen Wahrscheinlichkeit) . Weiter gilt wegen P (Ai ∩ B) = P (Ai |B)P (B) = P (B|Ai )P (Ai ) unter Benutzung des Satzes (a) für P (B) P (Ai )P (B|Ai ) (Formel von Bayes) . (b) P (Ai |B) = P i P (Ai )P (B|Ai ) 6 Die Bayessche Formel zeigt, wie sich die a priori Wahrscheinlichkeit P (Ai ) für ein Ereignis Ai nachträglich ( a posteriori) verändert, wenn ein weiteres Ereignis B, das von Ai nicht unabhängig ist, eintritt. Betrachten wir hierzu ein zugegeben etwas extremes Beispiel: Die Analyse der Struktur des Universums zeigt bis in verblüffende feine Einzelheiten hinein, daß unser Universum so aufgebaut und feinabgestimmt ist, daß intelligentes Leben möglich ist. Sollten wir uns hierüber wundern? Offenbar ja, denn die Wahrscheinlichkeit, daß dies zufällig möglich ist, erscheint verschwindend klein! Allerdings: statistisch gesehen nein! Denn sei P (A1 ) die unbekannte aber mit Sicherheit winzig kleine a priori Wahrscheinlichkeit, daß das Universum gerade so beschaffen ist, daß intelligentes Leben im Universum möglich ist; sei A2 = Ā1 das zu A1 komplementäre Ereignis, daß kein intelligentes Leben im Universum möglich ist; sei weiter B das Ereignis, daß (unsere) die menschliche, intelligente Lebensform im Universum auftritt. Dann tritt nach Satz (a), da sich A1 und A2 gegenseitig ausschließen, doch eines der beiden Ereignisse mit Sicherheit ein, P (B) = P (A1 )P (B|A1 ) + P (A2 )P (B|A2 ) . Es ist aber P (B|A2 ) = P (B|Ā1 ) = 0, da B sicher nicht auftritt, falls A1 , die Möglichkeit für intelligentes Leben im Universum, nicht vorher eingetreten ist. Unsere Beobachtung von A1 setzt andererseits ein Bewußtsein und intelligente Meßverfahren, also das Ereignis B, voraus. Wir beobachten also nicht etwa P (A1 ), sondern P (A1 |B) und erhalten nach Bayes P (A1 )P (B|A1 ) P (A1 |B) = = 1. P (A1 )P (B|A1 ) + P (A2 )P (B|A2 ) Unsere Beobachtung von A1 , unter der Vorraussetzung daß B nachträglich eingetreten ist, war also mit Sicherheit zu erwarten, gleichgültig wie winzig klein P (A1 ) auch sein mag. Das Beispiel ist extrem und daher auch trivial, da P (B|A2 ) = 0 war, so daß P (A1 |B) = 1 resultierte. Doch würde sich P (A1 |B) auch dann noch drastisch von P (A1 ) unterscheiden, wenn P (B|A2 ) ungleich 0, doch klein gegen P (A1 ) wäre. 1.2 Zufallsvariable Dies sind Größen, die in einem beliebig oft in statistisch unabhängiger Weise wiederholbaren Experiment zufällige Werte aus einem diskreten oder kontinuierlichen Wertevorrat annehmen können. Die verschiedenen Werte schließen sich gegenseitig aus. Mit Sicherheit wird einer der Werte angenommen. Sei X die Zufallsvariable und, bei diskretem Wertevorrat {x1 , x2 , . . .} X fX (xi ) ≥ 0 mit fX (xi ) = 1 , i die Wahrscheinlichkeit daß X den Wert xi annimmt. Das n-te Moment von X ist der Mittelwert X xni fX (xi ) . hX n i = i 7 Die Varianz oder mittlere quadratische Schwankung von X ist definiert als 2 σX = h(X − hXi)2 i = hX 2 i − 2hXihXi + hXi2 = hX 2 i − hXi2 . q Die Wurzel daraus, σX = hX 2 i − hXi2 , ist die “Standardabweichung“. Bei kontinuierlichem R Wertevorrat {x} von X heißt fX (x) ≥ 0 mit dxfX (x) = 1 die Wahrscheinlichkeitsdichte von X und es ist Z n hX i = dxxn fX (x) . Es ist wichtig, die Zufallsvariable X und ihren Wertevorrat {x} begrifflich auseinanderzuhalten. Die Fouriertransformierte von fX (x) heißt charakteristische Funktion φX (k) = heikX i = = ∞ X Z dxeikx fX (x) (ik)n n hX i , n=0 n! durch Entwicklung der Exponentialfunktion in eine Potenzreihe. Aus φX (k) erhält man die Momente durch Differentiation: φX (0) = 1 n hX i = i −n dn φ (k) . X n dk k=0 Entwickelt man den Logarithmus der charakteristischen Funktion nach k, so erhält man die sog. Kumulanten Cn (X) von X ∞ X (ik)n Cn (X) n=0 n! ln φX (k) = mit Cn (X) = i−n Speziell erhält man dn ln φ(k) . n dk k=0 C0 (X) = 0 C1 (X) = hXi 2 C2 (X) = hX 2 i − hXi2 = hX 2 i − C12 (X) = σX C3 (X) = hX 3 i − 3hX 2 ihXi + 2hXi3 = hX 3 i − 3C2 (X)C1 (X) − C13 (X) etc. . Mit X sind natürlich auch alle Funktionen von X, sagen wir Y = H(X), Zufallsvariable. fY (y|x)dy = δ(y − H(x))dy ist die bedingte Wahrscheinlichkeit für Y im Intervall dy bei y, falls X den Wert x annimmt. Dann ist (nach dem Satz von der totalen Wahrscheinlichkeit) fY (y) = Z dxfY (y|x)fX (x) = hδ(y − H(X))i 8 die Wahrscheinlichkeitsdichte von Y . Diese läßt sich durch Integration über die δ-Funktion auswerten zu X fx (xi (y)) fY (y) = 0 i |H (xi (y)|) wobei mit xi (y) die Lösungen der Gleichung y = H(x) bezeichnet seien. Hat man mehrere (n) Zufallsvariable so kann man ihren simultanen Werten gemeinsame Wahrscheinlichkeiten oder, bei kontinuierlichem Wertevorrat, gemeinsame Wahrscheinlichkeitsdichten Z f (x1 , x2 , . . . , xn ) ≥ 0 mit dn xf (x1 , . . . , xn ) = 1 zuordnen. Die Momente und Varianzen der Xi sind wie bisher definiert, aber mit Integralen über dn x. Die Kovarianz von Xi und Xj ist definiert als cov (Xi , Xj ) = Z dn x(xi − hXi i)(xj − hXj i)f (x1 , . . . , xn ) = hXi Xj i − hXi ihXj i . Die Korrelation von Xi und Xj ist definiert als cor (Xi , Xj ) = cov (Xi , Xj ) , σX i σX j mit cor (Xi , Xj ) = cor (Xj , Xi ); |cor (Xi , Xj )| ≤ 1. Für zwei unabhängige Zufallsvariable X, Y gilt f (x, y) = fX (x)fY (y) hXY i = hXihY i 2 2 σX+Y = σX + σY2 cov (X, Y ) = 0 = cor (X, Y ) . Aus der gemeinsamen Wahrscheinlichkeitsdichte für x1 , x2 , ...xn folgt die für x1 , x2 , ...xn−1 durch Integration über xn etc., und schließlich die jeder einzelnen Zufallsvariablen durch Integration über alle andern, z.B. fX1 (x1 ) = Z dx2 . . . dxn f (x1 , x2 , . . . , xn ) . Durch Fouriertransformation bezüglich aller Zufallsvariablen erhält man die mehrdimensionalen charakteristischen Funktionen etc. 1.3 Binomialverteilung Ein häufiger Fall ist, daß eine Zufallsvariable nur 2 Werte annehmen kann, z.B. 0 oder 1, -1 oder 1, ↑ oder ↓. Natürlich sind diese drei Beispiele abgesehen von Bezeichnungen äquivalent. Nehmen wir den Fall X mit x1 = 1, x2 = −1 und fX (1) = p, fX (−1) = q = 1 − p. Die Wahrscheinlichkeit, daß bei N -maliger Messung der Wert x1 n1 mal und der Wert x2 (N − n1 ) mal in einer ganz bestimmten Reihenfolge auftritt, ist nach der Multiplikationsregel für unabhängige Ereignisse pn1 q N −n1 9 unabhängig von der Reihenfolge. Bei N Messungen gibt es N !/(n1 !(N − n1 )!) verschiedene Reihenfolgen von n1 Ereignissen +1 und n2 = N − n1 Ereignissen -1. Diese zählt man ab, indem man zunächst alle Permutationen der N Ereignisse bildet, deren Anzahl ist N !, und dann berücksichtigt, daß die Permutationen der n1 Ereignisse +1 untereinander und der n2 = N − n1 Ereignisse -1 untereinander keine neuen Reihenfolgen liefern, so daß das Ergebnis mit dem Produkt von deren Anzahl, n1 !n2 !, zu dividieren ist. Verschiedene Reihenfolgen schließen sich gegenseitig aus und haben die gleiche Wahrscheinlichkeit pn1 q n2 . Nach der Additionsregel für Wahrscheinlichkeiten erhalten wir also für die Wahrscheinlichkeit von n1 Ereignissen +1 und n2 Ereignissen -1 unabhängig von der Reihenfolge die Binomialverteilung PN (n1 ) = N! pn1 q N −n1 . n1 !(N − n1 )! Wir bezeichnen die Funktion auf der rechten Seite im folgenden auch als PN (n1 ; p, q) und fassen sie dann nicht nur als Funktion von n1 sondern auch der dann als unabhängig angesehenen Variablen p und q auf. Als Funktion von n1 und für p + q = 1 ist PN (n1 ) richtig auf 1 normiert. N X PN (n1 ) = (p + q)N = 1 n1 =0 nach dem für die N -te Potenz verallgemeinerten binomischen Lehrsatz. Die ersten beiden Momente sind N X N X ∂ ∂ = Np hn1 i = n1 PN (n1 ) = p Pn (n1 ; p, q) = p (p + q)N ∂p ∂p n1 =0 n1 =0 q=1−p hn21 i = N X n21 PN (n1 ) = n1 =0 N X n1 =0 ∂ p ∂p !2 ∂ PN (n1 ; p, q) = p ∂p besitzt, was die Varianz !2 N (p + q) q=1−p = (N p)2 + N (p − p2 ) σ 2 = hn21 i − hn1 i2 = N p(1 − p) ergibt und die relative Standardabweichung σ 1 =√ hn1 i N s 1−p → 0 für N → ∞ . p In der folgenden Figur sind die Binomialverteilungen für N = 10 und p = 1/2 sowie p = 1/10 dargestellt. 10 P(n) 0.3 0.2 0.1 0 0 2 4 6 8 10 n Binomial-Verteilungen für N = 10 und p = 1/2 sowie p = 1/10 Für größer werdende N ist die Binomialverteilung zunehmend schärfer um ihren Mittelwert hn1 i = N p verteilt, d.h. der tatsächliche Wert von n1 /N in einer Folge von N Messungen liegt für größer werdende N immer dichter beim Mittelwert p = hn1 i/N und stimmt im Limes N → ∞ mit Wahrscheinlichkeit 1 mit diesem überein. Dies ist ein Beispiel für das “Gesetz der großen Zahlen“, p = limN →∞ n1 /N ist tatsächlich die Wahrscheinlichkeit für das Ereignis +1. Grenzfälle der Binomialverteilung sind die Gaußverteilung (im Limes N groß, pN groß) und die Poissonverteilung (im Limes N groß, pN fest). In beiden Fällen benutzen wir die Stirlingsche Formel: für n > 10 n √ n . n! ≈ 2πn e Für N groß, N p groß können wir diese Näherung für N !, n1 ! und (N − n1 )! benutzen und erhalten " #1/2 n1 N p 1 − p N −n1 PN (n1 ) ' NN . 2πn1 (N − n1 ) n1 N − n1 Das Maximum von PN (n1 ) finden wir aus ∂ ln PN (n1 ) =0 ∂n1 bei n1 max = pN = hn1 i . Außerdem finden wir nach weiterer Rechnung ∂ 2 ln PN (n1 ) 1 1 = − = − 2 ∂n1 p(1 − p)N σ2 n1 =n1 max die Taylor Reihe 1 − 2p ∂ 3 ln PN (n1 ) = 2 2 3 ∂n1 N p (1 − p)2 n1 =n1 max ln PN (n1 ) = ln PN (pN ) − 1 1 − 2p 1 (n1 − pN )2 + (n1 − pN )3 + ... 2 N p(1 − p) 3! N 2 p2 (1 − p)2 11 Für N →q∞ ist der Korrekturterm (und die höheren Terme) vernachlässigbar, falls |n1 − pN | = O( N p(1 − p)) (was aus der Abschätzung durch die Varianz folgt) (N p(1−p)/|1− 2p|)2/3 (was aus dem Korrekturterm 3. Ordnung folgt) und wir erhalten die Gaußverteilung " # (n1 − pN )2 exp − . PN (n1 ) = q 2N p(1 − p) 2πN p(1 − p) 1 Sie ist durch Mittelwert und Varianz vollständig festgelegt. Alle Kumulanten 3. und höherer Ordnung verschwinden für die Gaußverteilung. Für N groß, N p = hn1 i fest (also p ∼ N −1 sehr klein) verwenden wir zur Vereinfachung der Binomialverteilung Stirlings Formel nicht für n1 ! (da n1 nicht mehr groß sein muß), sondern nur für N N e−n1 N! ' N −n1 + 1 (N − n1 )! 2 N N −n1 1 − nN1 was sich für n1 /N 1 mit (1 − n1 /N )N −n1 +1/2 ' (1 − läßt durch N n1 . Also ergibt sich PN (n1 ) ' n N ) N ' e−n1 weiter approximieren (pN )n1 −pN e , n1 ! die Poissonverteilung. Sie ergibt sich also aus der Binomialverteilung für große N , falls die Wahrscheinlichkeit p für eines der beiden alternativen Ereignisse sehr klein wird. Sie ist schon durch ihren Mittelwert völlig festgelegt. Die Varianz und der Mittelwert sind durch hn21 i − hn1 i2 = hn1 i verknüpft. Die Poissonverteilungen mit hn1 i = 5 und hn1 i = 1 sind in der folgenden Figur wiedergegeben. 0.35 P(n) 0.3 0.25 0.2 0.15 0.1 0.05 0 0 2 4 6 8 n 10 Poisson-Verteilung für < n >= 1 und < p >= 5 12 Betrachten wir als Anwendung die Teilchenzahlfluktuationen in einem kleinen Volumenelement ∆V eines Gases mit Teilchenzahldichte n = N/V . Ein Gasatom ist entweder in ∆V (mit Wahrscheinlichkeit p 1, falls ∆V V ) oder nicht, also ein Fall für die Poissonverteilung. Genauer: die Wahrscheinlichkeit für ein Gasatom in ∆V zu sein ist p = ∆V /V 1. Dann ist (pN )N1 −pN e PN (N1 ) = N1 ! die Wahrscheinlichkeit N1 Atome in ∆V zu finden. Der Mittelwert ist natürlich hN1 i = pN = ∆V · N/V . Die quadratische Schwankung hat für die Poissonverteilung denselben Wert wie der Mittelwert N hN12 i − hN1 i2 = ∆V · = hN1 i . V Dies ergibt für die relative Schwankung q hN12 i − hN1 i2 hN1 i =q 1 ∆V N/V =q 1 hN1 i . Später werden wir sehen, daß dies Resultat charakteristisch ist für die relativen Schwankungen aller makroskopischen (“thermodynamischen”) Größen in einem System: sie skalieren immer proportional zu 1 durch Wurzel aus der Teilchenzahl. 1.4 Zentraler Grenzwertsatz Dieser Satz lautet: Eine Zufallsvariable Y , die sich additiv aus N unabhängigen Zufallsvariablen Xi über N 1 X Y = Xi N i=1 zusammensetzt, deren Wahrscheinlichkeitsverteilungen endliche Momente hXin i besitzen, ist im Grenzfall N → ∞ Gauß-verteilt (auch “normal verteilt” genannt) mit Mittelwert hY i = N 1 X hXi i ≡ hXi i N i=1 und mittlerer quadratischer Schwankung σY2 = 1 X 2 1 2 σX i ≡ σX , 2 N i N i 2 wobei hXi i und σX die über alle Xi gemittelten Mittelwerte sind. (Also nochmal aufgei passt: Im allgemeinen Fall haben wir es hier mit zwei verschiedenen Mittelungsprozessen zu tun: Der erste ist die jetzt schon vertraute Mittelung für jede einzelne der N verschiedenen 2 Zufallsvariablen, was Mittelwerte wie hXin i und σX ergibt. Der zweite ist eine nochmalige i Mittelung dieser Mittelwerte über die N verschiedenen Variablen. Für diese Mittelung verwenden wir den Querstrich über der gemittelten Größe als Symbol. In dem speziellen (aber 13 häufig vorkommenden) Fall, daß alle N -Zufallsvariable die gleichen Mittelwerte haben, kann die zweite Mittelung natürlich entfallen, da sie nichts neues ergibt.) Insbesondere geht das Verhältnis von Standardabweichung von Y zum Mittelwert von Y , falls letzterer von Null verschieden ist, proportional zu N −1/2 gegen 0. Der Beweis ist einfach: 1 X fY (y) = hδ(Y − Xi )i N i ist die Verteilung von Y . Die zugehörige charakteristische Funktion ist φY (k) = Z k eiky fY (y)dy = hei N P i Xi i= N Y i=1 k hei N Xi i = N Y φXi (k/N ) , i=1 wobei wir im 3. Schritt die statistische Unabhängigkeit der Xi benutzen. Durch TaylorEntwicklung von 2 hXi i 1 k 2 σX i ln (φXi (k/N )) = ik − + iO((k/N )3 ) , N 2 N2 wobei wir voraussetzen, daß sämtliche Kumulanten der Xi existieren, erhalten wir ( 1 k2 X 2 ik X hX1 i − φY (k) = exp σ + iN · O((k/N )3 ) N i 2 N 2 i Xi ) . Für N → ∞, |k| ≤ O(N 2/3 ) ist der dritte Term im Exponenten gegen den zweiten vernachlässigbar klein (obwohl auch der zweite Term gegen 0 strebt für N → ∞), und das vorstehende Resultat strebt asymptotisch für große N gegen 1 2 2 σY φY (k) = eikhY i− 2 k mit den behaupteten Ausdrücken für hY i und σY2 . Die Fouriertransformation Z dk −iky PY (y) = e φY (k) , 2π zu der nur k-Werte der Größenordnung k = O( 1 O(N 1/2 ) )= q ≤ O(N 2/3 ) 2 σY σ Xi wesentlich beitragen, liefert die behauptete Gaußverteilung für Y ! 1 (y − hY i)2 PY (y) = √ . exp − 2σY2 2πσY Der zentrale Grenzwertsatz erklärt das häufige Auftreten von Gaußverteilungen in der Natur und in vielen statistischen Problemen. Eine einfache Anwendung ist die im vorigen Abschnitt etwas mühsam abgeleitete Gaußsche Näherung für die Binomialverteilung PN (n1 ). Denn n1 ist der Wert der Zufallsvariablen Y = N X 1 (1 + Xi ) , i=1 2 wobei die Xi mit den Werten +1 (mit Wahrscheinlichkeit p) und -1 (mit Wahrscheinlichkeit q = 1−p) N unabhängige Zufallsvariable sind. Nach dem zentralen Grenzwertsatz ist also Y , und damit n1 , für N → ∞ Gauß-verteilt mit hY i = (1/2)N (1+hXi i) = (1/2)N (1+p−1+p) = 2 2 N p und σY2 = (N/4)σX , wobei σX = hX 2 i − hXi2 = 1 − (2p − 1)2 = 4p(1 − p), was unser i früheres Ergebnis reproduziert. 14 1.5 Gesetz der großen Zahlen Das Gesetz der großen Zahlen besagt folgendes: Hat ein Ereignis A, die Wahrscheinlichkeit P (A) dann geht bei N unabhängigen Versuchen der Bruchteil NA /N , bei denen das Ereignis A eintritt im Limes N → ∞ gegen P (A), NA = P (A) . N →∞ N lim Genau diese Eigenschaft liegt der anfangs gegebenen intuitiven Definition der Wahrscheinlichkeit zugrunde. Sie ermöglicht uns die praktische Schätzung von Wahrscheinlichkeiten durch hinreichend viele Stichproben. Sie läßt sich als Satz aus den Axiomen der Wahrscheinlichkeitsrechnung ableiten. Beginnen wir mit der Anwendung des zentralen Grenzwertsatzes auf dies Problem. Führen wir dazu für jeden der N statistisch unabhängigen Versuche eine Zufallsvariable Xi , i = 1, 2, . . . , N ein mit Xi = 1, falls im i-ten Versuch A eintritt, also mit Wahrscheinlichkeit P (A), und Xi = 0 falls Ā, d.h. “nicht A” eintritt, also mit Wahrscheinlichkeit 1 − P (A). Der Mittelwert von X ist hXi = P (A), die mittlere quadratische Schwankung σx2i = hXi2 i − hXi i2 = P (A)(1 − P (A)). Dann ist N NA 1 X = Xi N N i=1 und nach dem zentralen Grenzwertsatz ist NA /N Gauß-verteilt um den Mittelwert hNA i/N = N · P (A)/N = P (A) mit der q Standardabweichung √ −2 2 1/2 σ(N ) = (N · N · σXi ) = P (A)(1 − P (A))/ N . Eine wichtige Ungleichung der Statistik, die Tchebycheff-Ungleichung, besagt, daß für eine Zufallsvariable X die Wahrscheinlichkeit P (|x − hXi| ≥ ε), daß X von seinem Mittelwert um mindestens ε abweicht, nach oben abgeschätzt werden kann durch das Verhältnis der Varianz zu ε2 : σ2 P (|x − hXi| ≥ ε) ≤ X2i Tchebycheff-Ungleichung ε Der Beweis der Tchebycheff-Ungleichung gelingt mit folgenden einfachen Abschätzungen 2 σX = Z ≥ ≥ε +∞ dx(x − hXi)2 fX (x) −∞ Z hXi−ε −∞ 2 Z + hXi−ε −∞ Z ∞ hXi+ε + Z ! (x − hXi)2 fX (x)dx ∞ hXi+ε ! fX (x)dx = ε2 P (|x − hXi| ≥ ε) , woraus sich nach Division mit ε2 die Ungleichung ergibt. Auf unseren Fall angewandt besagt die Tchebycheff-Ungleichung, daß 0≤P | NA P (A)(1 − P (A)) − P (A)| ≥ ε ≤ →0 N ε2 N für N → ∞ , d.h. die Verteilung von NNA zieht sich für N → ∞ beliebig scharf um den Mittelwert P (A) zusammen, womit das Gesetz der großen Zahlen bewiesen ist. 15 2 Vielteilchensysteme Ziel der statistischen Mechanik ist, wie schon erwähnt, die Beschreibung von Vielteilchensystemen, sowohl klassisch als auch quantenmechanisch. Beispiele solcher Vielteilchensysteme sind Gase, z.B. reine Gase aus Molekülen, z.B. Sauerstoff O2 oder Atomen, z.B. Helium He, oder Gasgemische, z.B. Luft – ein Gemisch aus Stickstoff N2 , Sauerstoff O2 und Kohlendioxyd CO2 und einiger weiterer Restgase, oder Flüssigkeiten, z.B. Wasser H2 O, oder Festkörper, z.B. Eis H2 O, oder Elektronen in Metallen oder Halbleitern, oder magnetische Substanzen, deren mikroskopische Bausteine magnetische Momente tragen, die mit den Drehimpulsen der Atomhülle und der Atomkerne verbunden sind. In solchen Vielteilchensystemen ist die Zahl der Teilchen typischerweise sehr groß. Eine Größenordnung gibt die Loschmidtsche Zahl L = 6, 02 × 1023 , welche bekanntlich die Zahl der Moleküle in ein Mol einer Substanz angibt (also z.B. in 2g H2 oder 32g O2 oder 18g H2 O). Oft ist es kein schwieriges Problem, die Bewegungsgleichungen wenigstens anzugeben, wenngleich uns deren Lösung im allgemeinen nicht möglich ist. Klassisch müssen wir dazu die Hamilton-Funktion H(q, p) in geeigneten generalisierten Koordinaten und Impulsen aufstellen, indem wir die gesamte kinetische Energie T (q, p) und potentielle Energie U (q, p) der Wechselwirkung mit äußeren Feldern (z.B. Schwerkraft, elektrische und magnetische Felder, Wände eines einschließenden Behälters) und der inneren Wechselwirkung zur Gesamtenergie E = H(q, p) = T (q, p) + U (q, p) aufaddieren und die Hamiltonschen Gleichungen aufstellen q̇i = ∂H(q, p) ∂pi i = 1, 2, . . . , f ṗi = − (2.1) ∂H(q, p) . ∂qi Zur Lösung brauchen wir die Kenntnis von q1 (0), . . . , pf (0), die wir uns praktisch, z.B. durch Messung, nicht verschaffen können. Quantenmechanisch wird H(q, p) zum Hamiltonoperator durch die Quantisierungsregel (wenn speziell die qi kartesische Koordinaten sind, was wir für diesen Zweck der Einfachheit halber voraussetzen) h̄ ∂ pi = i ∂qi und statt (2.1) haben wir die Vielteilchen-Schrödingergleichung ! h̄ ∂ ih̄ψ̇(q1 , q2 , . . . , qf , t) = H q, ψ(q1 , q2 , . . . , qf , t) i ∂q zu lösen. Zur Lösung brauchen wir hier die Kenntnis von ψ(q1 , q2 , . . . , qf , 0), die auch wiederum unmöglich zu beschaffen ist. 3 Zeitmittelwerte Wenn f sehr groß wird, z.B. f ' 1023 , ist es impraktikabel, klassisch und quantenmechanisch, die erforderlichen Anfangsbedingungen zu bestimmen, etwa durch Messung aller q’s 16 und p’s, oder durch Messung des quantenmechanischen Zustands des Vielteilchensystems, etwa durch Messung eines vollständigen Satzes von kommutierenden Observablen (z.B. alle Orte und Spins). Ebenso impraktikabel ist die daran anschließende Lösung des Vielteilchenproblems. Schließlich, selbst wenn diese beiden Schritte doch bewältigt werden könnten, wäre die Lösung am Ende praktisch wertlos, da sie Auskunft über die {qi (t), pi (t)} oder über ψ(q1 , . . . , qf , t) geben würde, die für sehr viele Teilchen im einzelnen nicht meßbar sind! Wir müssen also einen Weg finden, wie wir die begrenzte Information über unser Vielteilchensystem, welche der Messung zugänglich ist, direkt aus H(q, p) (und eventuell weiteren Konstanten der Bewegung) extrahieren können, ohne die Bewegungsgleichungen im einzelnen zu lösen. Doch welche Größen kann man in Vielteilchensystemen messen? Meßbare Größen in der klassischen Physik sind allgemein Phasenraumfunktionen A(q1 , . . . , qf , p1 , . . . , pf ) = A(q, p). Diese werden zeitabhängig A(q(t), p(t)), da sich die qi (t), pi (t) gemäß der Hamiltonschen Gleichungen zeitlich ändern. Eine Messung von A(q(t), p(t)) in einem Vielteilchensystem kann jedoch im allgemeinen den sehr raschen zeitlichen Änderungen von A(q(t), p(t)) nicht folgen. Im Experiment wird daher nur ein zeitlicher Mittelwert von A(q(t), p(t)) gemessen A(t) ∆T = 1 ∆T Z t t−∆T A(q(t), p(t))dτ . Die Größe von ∆T wird dabei zunächst natürlich vom Meßverfahren abhängen. Je größer ∆T ist, desto weniger zeitliche Details der Funktion A(q(t), p(t)) kann die Messung auflösen. In jedem thermodynamischen System (mit der wichtigen Ausnahme von Gläsern) gibt es eine sytemabhängige Zeitskala τrelax , so daß für ∆T τrelax die gemessenen Zeitmittelwerte sogar ganz unabhängig von der Zeit werden. Wir sprechen dann von (automatisch zeitunabhängigen) Gleichgewichtsmittelwerten. Für ∆T < τrelax kann dagegen die Messung noch die zeitabhängige Relaxation des Zeitmittelwerts auf seinen Gleichgewichtswert auflösen, wenn auch t < τrelax gilt (wobei der Zeitpunkt t = 0 ausgezeichnet ist als Zeitpunkt, zu dem ein Anfangszustand vorgegeben sei). Ist dagegen zwar ∆T < τrelax , aber t τrelax , so hat zwar einerseits der gemessene Mittelwert genügend Zeit t, auf seinen zeitunabhängigen Wert zu relaxieren, doch ist andererseits die zeitabhängige Messung mit ∆T < τrelax in der Lage, die Fluktuationen von A(q(t), p(t)) um seinen Gleichgewichtsmittelwert herum, die ebenfalls auf der charakteristischen Zeitskala τrelax erfolgen, bis zu einem gewissen Grad (nämlich bis zur Zeitskala ∆T ) aufzuloesen. Es zeigt sich, daß es in vielen thermodynamischen Systemen (Ausnahmen existieren) für die Wahl von ∆T ein Zeitskalenfenster τstoß ∆T τrelax gibt, in dem die Zeitmittelwerte sogar praktisch unabhängig von der Wahl von ∆T werden. Ginge man aber mit ∆T sogar noch unter die untere Grenze dieses Intervalls (was in der Praxis schwer möglich ist), so würde die Messung die komplizierte mikroskopische Stoßdynamik der mikroskopischen Konstituenten des Systems zeitlich aufloesen können. (Zuweilen gelingt dies mit der (in der Arbeitsgruppe von der Linde perfektionierten) Technik ein System bei t = 0 mit einem ultrakurzen Laserimpuls (Dauer∼ ∆T von der Größenordnung 10−13 s = 1fs) anzuregen und seinen Zustand kurz danach (zur Zeit t) mit einem ebenso kurzen Laserimpuls wieder abzufragen.) Man nennt τstoß die charakteristische Stoßzeit des Systems, und wir werden im folgenden immer annehmen, daß ∆T >> τstoß . Bei quantenmechanischer Beschreibung interessiert man sich für Erwartungswerte von Operatoren A(q, h̄i ∂/∂q), (wir schreiben q und meinen alle Koordinaten, die Integration über 17 alle q soll die Summation über die Spineinstellungen mit symbolisieren) Z dq1 . . . Z ! h̄ ∂ ψ(q, t) = hψ(t)|A|ψ(t)i . dqf ψ (q, t)A q, i ∂q ∗ Wiederum ist es im allgmeinen unmöglich, die Zeitabhängigkeit von hψ(t)|A|ψ|(t)i im einzelnen aufzulösen und nur Zeitmittelwerte ∆T hψ(t)|A|ψ(t)i 1 = ∆T Z t t−∆T hψ(τ )|A|ψ(τ )idτ sind von Interesse. Wie berechnet man solche Mittelwerte klassisch oder quantenmechanisch? 4 Statistische Ensemble – klassisch Die Grundidee (L. Boltzmann, J.W. Gibbs) ist die Ersetzung des Mittelwerts eines Systems über ein Zeitintervall ∆T von τ , t − ∆T ≤ τ ≤ t A(t) ∆T 1 = ∆T Z t t−∆T A(q(τ ), p(τ ))dτ (4.1) durch den Mittelwert über (unendlich) viele Systeme zu einem Zeitwert: A(t) ∆T → hA(t)i = Z df qdf p%(q, p, t)A(q, p) . (4.2) Man nennt die vielen Systeme, die hier zu Berechnung des Mittelwerts hilfsweise eingeführt werden, ein Ensemble von Systemen, welches das tatsächlich vorliegende eine physikalische System repräsentiert. %(q, p, t) ist eine Wahrscheinlichkeitsdichte im Phasenraum (oder ΓRaum), d.h. eine positive Funktion der qi , pi , wobei %(q, p, t)df qdf p die Wahrscheinlichkeit (d.h. die relative Häufigkeit) ist, mit der ein System mit (q, p)-Werten im Volumenelement dVΓ = df qdf p bei q, p im Ensemble vorkommt. (Die entsprechende quantenmechanische Größe betrachten wir weiter unten.) Wegen h1i = 1 ist %(q, p, t) normiert. %(q, p, t) heißt ∆T (Gibbssche) Phasenraumdichte. Gibt es ein %(q, p, t), so daß A(t) = hA(t)i? Formal läßt sich unschwer ein solches %(q, p, t) angeben als 1 Zt %∆T (q, p, t) = dτ δ (2f ) (q − q(τ ), p − p(τ )) . ∆T t−∆T (4.3) Wir konstruieren das Ensemble also, indem wir die Trajektorie des Systems im Phasenraum für t − ∆T ≤ τ ≤ t gleichförmig mit konstanter Dichte belegen. Indem wir diesen Ausdruck in die Formel für hA(t)i einsetzen, die Integrationen über df qdf p mit der Zeitintegration vertauschen und mit Hilfe der 2f -dimensionalen δ-Funktion ausführen, erhalten wir die For∆T ∆T zurück, woraus also A(t) = hA(t)i folgt. Wir erkennen in der formalen mel für A(t) (weil praktisch nicht durchführbaren) Vorschrift (4.3) ein Beispiel für die Konstruktion der Wahrscheinlichkeitsdichte fY (y) = hδ(Y − fX (x))i aus fX (x). Im gegenwärtigen Fall sind die Wahrscheinlichkeiten von p, q durch die Häufigkeit ihres zeitlichen Auftretens gegeben. Die Einführung von % bedeutet den Übergang von einer deterministischen Beschreibung zu einer statistischen. 18 5 Liouville-Gleichung In der Ensemble-Beschreibung, die wir im letzten Abschnitt einführten, verlagert sich das Interesse von den praktisch nicht konstruierbaren Lösungen der Bewegungsgleichungen qi (t), pi (t), i = 1, 2, . . . , f auf die Phasenraumdichte (4.3), die wir durch Verschiebung der Integrationsvariablen τ um t auch schreiben können als %∆T (q, p, t) = 1 ∆T Z 0 −∆T dτ δ 2f (q − q(t + τ ), p − p(t + τ )) . (5.1) Welche Bewegungsgleichung hat die Phasenraumdichte? Betrachten wir ein System mit f Freiheitsgraden. Durch Bildung der Zeitableitung finden wir durch Differentiation unter dem τ -Integral und Ausnützen der Kettenregel Z f 1 X ∂ ∂%∆T (q, p, t) dτ q̇i (t + τ )δ 2f (q − q(t + τ ), p − p(t + τ )) =− ∂t ∆T i=1 ∂qi Z ∂ 2f dτ ṗi (t + τ )δ (q − q(t + τ ), p − p(t + τ )) . + ∂pi Für q̇i und ṗi setzen wir die Hamiltonschen Gleichungen ein q̇i = ∂H ∂H , ṗi = − . ∂pi ∂qi Schließlich verwenden wir, daß in Faktoren der δ-Funktion qi (t + τ ) bzw. pi (t + τ ) durch die von τ und t unabhängigen qi bzw. pi ersetzt werden können, da nur dort wo diese Ersetzung möglich ist, die δ-Funktion nicht verschwindet. Solche nur von q, p und nicht mehr von τ abhängige Faktoren können wir vor das τ -Integral ziehen. Wir erhalten f X ∂ ∂%∆T (q, p, t) =− ∂t i=1 ∂qi ! f X ∂ ∂H %∆T (q, p, t) + ∂pi i=1 ∂pi ! ∂H %∆T (q, p, t) . ∂qi Diese Gleichung hat natürlich allgemeinere Lösungen als nur solche der Form (5.1). Wir lassen daher im folgenden den Index ∆T weg und betrachten die Gleichung allgemein. Es ist eine Kontinuitätsgleichung im Phasenraum 2f ∂% X ∂ + vi % = 0 ∂t i=1 ∂xi mit xi = qi , xf +i = pi , vi = q̇i = ∂H ∂H , vf +i = ṗi = − ∂pi ∂qi i = 1, 2, . . . , f . Die Kontinuitätsgleichung drückt einfach nur die Erhaltung der Wahrscheinlichkeit in differentieller Weise aus. Nichtdifferentiell formuliert lautet dieser Erhaltungssatz: Die Wahrscheinlichkeit einen Zustand in einem endlichen Phasenraumvolumen VΓ vorzufinden, kann 19 sich nur ändern, wenn es einen Wahrscheinlichkeitsfluß durch die Oberfläche ∂VΓ des Volumens hindurch gibt d dt Z VΓ dVΓ %(q, p, t) = − Z ∂VΓ dFΓ · v%(q, p, t) , wobei dFΓ das (2f −1)-dimensionale Oberflächenelement von ∂VΓ mit nach außen gerichteter Normalen ist, und v = {ẋi ; i = 1, . . . , 2f } der Geschwindigkeitsvektor im Phasenraum. Die Strömungsgeschwindigkeit im Phasenraum vi , i = 1, 2, . . . , 2f hat die wichtige Eigenschaft 2f X i=1 f X ∂ ∂2H ∂2H vi = − ∂xi ∂pi ∂qi i=1 ∂qi ∂pi ! = 0 (Liouvillescher Satz) . In der Hydrodynamik gilt ein vollkommen analoges Gesetz im 3-dimensionalen Raum für die Strömungsgeschwindigkeit v von inkompressiblen Flüssigkeiten ∇·v =0 inkompressible Strömung. Sie besagt, daß die Flüssigkeitsteilchen, die anfangs ein Volumen der Größe V ausfüllen, für alle späteren Zeiten immer ein Volumen mit dem gleichen Inhalt V ausfüllen V V t>0 t=0 Mitschwimmendes Flüssigkeitsvolumen in einer inkompressiblen Strömung In vollständiger Analogie hierzu lassen sich die verschiedenen Ensemble-Mitglieder, Punkte im Phasenraum, als Teilchen einer Flüssigkeit im Phasenraum auffassen mit Teilchendichte %(q, p, t). Die Teilchendichte ändert sich zeitlich, weil die Punkte (aufgrund der Hamiltonschen Gleichungen) mit der Strömungsgeschwindigkeit vi , i = 1, 2, . . . , 2f durch den PhaP senraum strömen. Wegen 2f i=1 ∂vi /∂xi = 0 ist diese Strömung inkompressibel, d.h. die Phasenraumpunkte aus einem anfangs gegebenen Volumenelement ∆VΓ füllen zu allen späteren Zeiten ein Volumen des Inhalts ∆VΓ aus. Zum Beweis der letzteren Aussage betrachten wir allgemein in n-Dimensionen ein ndimensionales Volumen V mit (n − 1)-dimensionaler Oberfläche ∂V , Oberflächenelement dn−1 σ und n-dimensionalem nach außen gerichteten Normalvektor n. Die Oberfläche möge sich lokal mit der Strömungsgeschwindigkeit v verschieben, von der wir annehmen, daß sie Pn i=1 ∂vi /∂xi = 0 erfülle. Nur die Normalverschiebung der Oberfläche ∂V kann eine Volumenänderung bewirken. Geometrisch ist klar, daß die Normalverschiebung von dσ um die 20 Strecke n · vdt eine Volumenänderung von dσn · vdt bewirkt. Die gesamte Volumenänderung ergibt sich durch Aufintegration über die Oberfläche, also, nach Division mit dt dV = dt Z ∂VΓ dσn · v . Mit Hilfe des Gaußschen Satzes ergibt sich wie behauptet dV = dt Z V dn x X i ∂vi = 0. ∂xi Mit Hilfe der Liouville-Gleichung läßt sich die Kontinuitätsgleichung für %(q, p, t) etwas umformen. Sie lautet dann f ∂H ∂% ∂% X ∂H ∂% + − ∂t i=1 ∂pi ∂qi ∂qi ∂pi ! = 0 (Liouville-Gleichung) oder, in der Schreibweise mit Poisson-Klammer {A, B} = f X i=1 ∂A ∂B ∂A ∂B − ∂qi ∂pi ∂pi ∂qi ! ∂% − {H, %} = 0 . ∂t Auf der linken Seite der Liouville-Gleichung erscheint nun gerade die totale Zeitableitung von %, und wir finden demzufolge, daß d% = 0 (Liouville-Gleichung) dt ist, d.h. % erweist sich allgemein als eine explizit zeitabhängige Konstante der Bewegung. In der Sprache der Hydrodynamik: % ist im lokal mitschwimmenden Koordinatensystem zeitlich konstant, was wiederum die Inkompressibilität der Strömung ausdrückt. Diese Eigenschaft erweist sich als von ganz zentraler Bedeutung für die statistische Mechanik. Sie erlaubt es nämlich, einfache zeitunabhängige Lösungen für % anzugeben. Z.B. in Systemen, denen nur ein endliches Volumen VΓ des Phasenraums zugänglich ist, z.B. aufgrund des Energieerhaltungssatzes H = E = const ist offenbar %= const 0 im zugänglichen Teil des Phasenraums sonst eine zeitunabhängige Lösung. Die Konstante ergibt sich durch Normierung Z VΓ %df qdf p = 1 als const. = 1/VΓ . Diese konstante Lösung ordnet jeder Volumenzelle df qdf p des zugänglichen Teils des Phasenraums die gleiche Wahrscheinlichkeit P (df qdf p) = 21 df qdf p VΓ zu. Ist das dem System zugängliche Phasenraumvolumen nicht beschränkt, VΓ = ∞, ist diese Lösung nicht brauchbar. Doch ist jede Funktion % von zeitunabhängigen Erhaltungsgrößen, z.B. % = f (H(q, p)), eine zeitunabhängige Lösung von d%/dt = 0. Wir werden auf solche zeitunabhängigen Lösungen bei der Diskussion thermodynamischer Gleichgewichte zurückgreifen. Zuvor jedoch werden wir die entsprechende quantenmechanische Beschreibung analog zur klassischen entwickeln. 6 Statistische Ensemble – quantenmechanisch Nun entwickeln wir in analoger Weise die Bildung von Mittelwerten in der Quantenstatistik. Ausgangspunkt ist der zeitliche Mittelwert des quantenmechanischen Erwartungswerts hψ(t)|A|ψ(t)i ∆T Z 1 = ∆T t t−∆T hψ(τ )|A|ψ(τ )idτ . (6.1) Durch Einschieben eines vollständigen Orthonormalsystems {|ni} mit Hilfe seiner Vollständigkeitsrelation X |nihn| = 1 n 23 (wobei im Symbol n sehr viele (∼ 10 ) Qantenzahlen zusammengefaßt sein können) können wir (6.1) umschreiben in ∆T hψ(t)|A|ψ(t)i = 1 ∆T Z t t−∆T dτ X (hψ(τ )|A|ni)(hn|ψ(τ )i) . n Durch Umordnen der beiden eingeklammerten Faktoren unter der Summe sowie Vertauschen der Reihenfolge der Integration über τ mit der Summation über n erhalten wir ∆T hψ(t)|A|ψ(t)i = X n hn|%(t)A|ni mit dem sog. statistischen Operator %(t) = Z 1 ∆T t t−∆T dτ |ψ(τ )ihψ(τ )| . (6.2) Er tritt an die Stelle der Phasenraumdichte %(q, p) in der klassischen Beschreibung. Mit Hilfe des statistischen Operators %(t) kann nun der gewünschte Mittelwert von A unabhängig von der orthonormalen Basis {|ni} geschrieben werden ∆T hψ(t)|A|ψ(t)i = T r%(t)A ≡ hA(t)i . Erinnern wir uns an (oder lernen wir hier neu) zwei wichtige Eigenschaften der Spurbildungsoperation T r: (1.) Die Spur eines Operators ist unabhängig vom Orthonormalsystem, das zur Ausführung benutzt wird: Seien |ni1 , |mi2 zwei verschiedene Orthonormalsysteme mit X n |ni1 1 hn| = 1 = 22 X m |mi2 2 hm| und sei B ein beliebiger Operator, für den die im folgenden auftretenden Summen existieren: Dann ist X n 1 hn|B|ni1 = XX n m 1 hn|B|mi2 2 hm|ni1 . Nach Vertauschen der Reihenfolgen der Summen über n und m X n 1 hn|B|ni1 = XX m n 2 hm|ni1 1 hn|B|mi2 . Die Summe über n kann man mit Hilfe der Vollständigkeitsrelation ausgeführt werden und wir erhalten X X 2 hm|B|mi2 ≡ T r B . 1 hn|B|ni1 = m n (2.) Unter der Spurbildung sind Operatoren zyklisch permutierbar, z.B. T r ABC = T r CAB = T r BCA , denn T r ABC = = n X hn|ABC|ni = XX m n XX n m hn|AB|mihm|C|ni hm|C|nihn|AB|mi = = T r CAB etc. X m hm|CAB|mi Dabei haben wir im 3. Schritt die Reihenfolge der Summationen über n und m vertauscht. Der statistische Operator %(t) beschreibt ein quantenmechanisches Ensemble, auch ein “Gemisch von Zuständen” genannt oder kurz ein “gemischter Zustand“: An die Stelle einer Wellenfunktion |ψ(t)i (nun auch “reiner Zustand“ genannt) tritt ein Ensemble von (unendlich) vielen Zuständen, hier alle Zustände |ψ(τ )i für t−∆T ≤ τ ≤ t. Erwartungswerte in gemischten Zuständen sind so zu berechnen, daß zunächst der quantenmechanische Erwartungswert mit jeder Wellenfunktion berechnet wird, die Mitglied des Ensembles ist; dann wird der Mittelwert über das Gemisch gebildet, wobei jeder quantenmechanische Erwartungswert mit dem Gewicht eingeht (hier mit dτ /∆T ), mit dem die betreffende Wellenfunktion im Ensemble vertreten ist. Diese Vorschrift ist letztlich Inhalt der allgemeinen Formel hAi = T r%A. Man beachte, daß die verschiedenen im Ensemble vertretenen Wellenfunktionen nicht notwendig Rt dτ |ψ(τ )ihψ(τ )| aufeinander orthogonal zu sein brauchen; in unserem Fall %(t) = 1/∆T t−∆T sind z.B. die |ψ(τ )i für verschiedene τ im allgemeinen nicht orthogonal. Statistische Operatoren % haben allgemein folgende Eigenschaften: (1) % ist hermitisch, % = %† (2) % ist positiv semi-definit, d.h. alle Eigenwerte (diskret oder kontinuierlich, sind ≥ 0) (3) T r% = 1 23 Wegen (1) hat % eine Spektralzerlegung nach Eigenzuständen, z.B. für diskretes Spektrum von % X pi |iihi|, hi|ji = δi,j . %= i Die Eigenschaft (2) ist zu fordern, damit für jeden Zustand |ϕi der Erwartungswert h|ϕihϕ|i = T r%|ϕihϕ| = hϕ|%|ϕi = w(|ϕi) interpretiert werden kann als Wahrscheinlichkeit w(|ϕi) den Zustand |ϕi, in dem mit % beschriebenen Ensemble vorzufinden. Denn zum einen erfordert diese Interpretation, mit |ϕi = |ii, X pj |hi|ji|2 = pi ≥ 0 , hi|%|ii = j daß die pi positive Wahrscheinlichkeiten sind, zum andern wird dann w(|ϕi)hϕ|%|ϕi = X i pi |hϕ|ii|2 . Auf der rechten Seite ist, wie aus der Quantentheorie bekannt, |hϕ|ii|2 allgemein die Wahrscheinlichkeit den Zustand |ϕi vorzufinden, falls der Zustand |ii vorliegt, wobei sich die |ii wegen ihrer Orthogonalität gegenseitig ausschließen, zum andern ist pi wie gerade gezeigt, die Wahrscheinlichkeit mit der |ii im Ensemble vertreten ist. Nach dem Satz von der totalen Wahrscheinlichkeit ist also hϕ|%|ϕi wirklich die gesamte Wahrscheinlichkeit |ϕi im Ensemble vorzufinden. 7 Von Neumann-Gleichung Wir suchen nun die Bewegungsgleichung der %(t) genügt. Dazu verschieben wir in (6.2) die Integrationsvariable τ und bringen es in die Form 1 Z0 %(t) = dτ |ψ(t + τ )ihψ(t + τ )| . ∆T −∆T Durch Differentiation nach t, die auf der rechten Seite unter dem Integral ausgeführt wird, und Zuhilfenahme von 1 H|ψ(t + τ )i ih̄ −1 hψ(t + τ )|H, hψ̇(t + τ )| = ih̄ |ψ̇(t + τ )i = und indem wir H, das von τ nicht abhängt, nach links, bzw. rechts, aus dem Integral herausziehen, ergibt sich 1 %̇(t) = (H%(t) − %(t)H) , ih̄ was auch in der Form ih̄%̇ = [H, %] (vonNeumann-Gleichung) 24 geschrieben werden kann. Durch die Ersetzung 1 (h̄→0) [H, %] −→ {H, %} , ih̄ welche, wie stets, Kommutatoren in klassische Poisson-Klammern überführt, finden wir die klassische Liouville-Gleichung wieder, wenn wir den klassischen Limes des statistischen Operators mit der klassischen Phasenraumdichte identifizieren. Die von-Neumann-Gleichung ist also das quantenmechanische Analogon der Liouville-Gleichung. Es ist übrigens bemerkenswert, daß die Herleitung der von-Neumann-Gleichung beträchtlich einfacher ist als die der Liouville-Gleichung. 8 Thermodynamisches Gleichgewicht Betrachten wir nun ein Vielteilchensystem, das in einen Behälter fest eingeschlossen und von der Umgebung vollständig isoliert ist. Ein derartiges System heißt abgeschlossen. Erfahrungsgemäß geht ein abgeschlossenes System, das sich selbst überlassen bleibt, nach einer gewissen systemabhängigen Relaxationszeit τrelax τstoß in einen dynamischen Zustand ∆T ∆T über, in dem die zeitabhängigen Zeitmittelwerte A(t) bzw. hψ(t)|A|ψ(t)i für hinreichend große ∆T (∆T /τrelax 1) konvergieren (d.h. nicht nur von ∆T , sondern auch von t unabhängig werden). 1 ∆T →∞ ∆T A = lim hψ|A|ψi = lim Z t Z ∆T →∞ t−∆T t t−∆T A(q(τ ), p(τ ))dτ hψ(τ )|A|ψ(τ )idτ . Dennoch bleiben sogar für t τrelax die ungemittelten Größen A(q(t), p(t)) und hψ(t)|A|ψ(t)i, ∆T und wie bei den Zeitmittelwerten schon diskutiert, bis zu einem gewissen Grad auch A(t) für ∆T τrelax selbst in diesem Zustand zeitabhängig und fluktuieren um ihre zeitlichen Mittelwerte. Es handelt sich um einen Gleichgewichtszustand, der aber dennoch dynamisch ist, man spricht vom thermodynamischen Gleichgewicht. Den Übergang eines Systems ins thermodynamische Gleichgewicht behandelt die sog. kinetische Theorie mit Hilfe von sog. kinetischen Gleichungen (Boltzmann-Gleichung, Master-Gleichung, Fokker-Planck–Gleichung, Langevin-Gleichung). Den thermodynamischen Gleichgewichtszustand selbst behandelt die Statistische Mechanik des thermodynamischen Gleichgewichts, der wir uns nun zuwenden. Wie kann man die zeitunabhängigen Zeitmittelwerte Ā bzw. hψ(t)|A|ψ(t)i im thermodynamischen Gleichgewicht berechnen? Nehmen wir an, unser klassisches abgeschlossenes System habe die Gesamtenergie E. Dann bewegt es sich im Phasenraum auf der festen Energiehyperfläche H(q, p) = E. Nehmen wir weiter an, daß die Gesamtenergie für unser System das einzige Integral der Bewegung ist, welches eine derartige Hyperfläche im Phasenraum bildet. (Solche Integrale der Bewegung heißen “isolierend“. Sie ordnen jedem Phasenraumpunkt (q, p) einen eindeutigen Wert des Bewegungsintegrals zu. Die meisten der 2f − 1 zeitunabhängigen Integrale der Bewegung (Integrationskonstanten) eines Systems mit f Freiheitsgraden sind dagegen nichtisolierend, d.h. ordnen ein- und demselben Phasenraumpunkt mehrere, evtl. gar unendlich viele Werte zu und definieren keine Phasenraumhyperfläche). Für ein abgeschlossenes Vielteilchensystem in einem festen Behälter (dessen Wände 25 die Drehimpulserhaltung und Impulserhaltung aufheben) ist dies eine sehr plausible (wenn auch schwer streng beweisbare) Annahme. In diesem Fall bewegt sich der Systempunkt auf der Energiehyperfläche mehr oder weniger ungehindert. Das System wird ergodisch genannt, wenn der Systempunkt im Laufe seiner Bewegung tatsächlich jedes beliebig kleine Flächenelement auf der Hyperfläche durchläuft. Birkhoffs Ergodentheorem von 1931 besagt, daß ein System dann und nur dann ergodisch ist, wenn für alle Phasenraumpunkte (evtl. mit Ausnahme einer Punktmenge von verschwindendem Lesbeque-Maß df qdf p) der Zeitmittelwert Ā von Phasenraumfunktionen existiert und gleich dem Mittelwert hAi über das Ensemble 1 Ā = hAi = Σ(E) Z Γ A(q, p)δ(H(q, p) − E)df qdf p (8.1) ist, mit dem Flächeninhalt der Energiehyperfläche Σ(E) = Z Γ δ(H(q, p) − E)df qdf p . Die spezielle zugehörige Phasenraumdichte %(q, p) = 1 δ(H(q, p) − E) Σ(E) (8.2) ist von q, p nur über die Erhaltungsgröße H(q, p) abhängig und daher wie wir sahen automatisch eine zeitunabhängige Lösung der Liouville-Gleichung. Sie definiert das mikrokanonische Ensemble. Für ein System mit zusätzlichen isolierenden Integralen Ci (q, p) = Ci verallgemeinert sich das Ergodentheorem entsprechend mit dem verallgemeinerten mikrokanonischen Ensemble n Y 1 %(q, p) = δ(H(q, p) − E) δ(Ci (q, p) − Ci ) . Σ(E, C1 , . . . , Cn ) i=1 Gleichung (8.1) löst nun endlich unser Problem, wie wir für ein abgeschlossenes System im thermodynamischen Gleichgewicht die meßbaren zeitunabhängigen Zeitmittelwerte Ā berechnen können ohne die mikroskopischen Bewegungsgleichungen zu lösen: Wir müssen nur die Hamiltonfunktion H(q, p) kennen, damit die Phasenraumdichte (8.2) des mikrokanonischen Ensembles bilden und Mittelwerte der Form (8.1) durch Integration über den Phasenraum auswerten. Die Form (8.2) von %(q, p) im Gleichgewicht ist die einzig mögliche, welche den Bedingungen genügt 1) %(q, p) = 0 falls H(q, p) 6= E 2) %(q, p) ≥ 0 3) %(q, p) = f (H(q, p)) 4) R Γ %(q, p)df qdf p = 1. Im praktischen Umgang ist allerdings die δ-Distribution manchmal unhandlich. Man rechnet dann bequemer und ohne Verlust an Genauigkeit, wenn man sie durch eine auf 1 normierte Rechtecksfunktion der kleinen, endlichen Breite ∆E ersetzt δ(H(q, p) − E) → δ∆E (H(q, p) − E) = 26 1 ∆E 0 0 ≤ H − E ≤ ∆E sonst . Dann erhält man für %(q, p) des mikrokanonischen Ensembles 1 ∆E·Σ(E) mit %(q, p) = 0 0 ≤ H(q, p) − E ≤ ∆E (8.3) sonst Σ(E)∆E = Z dVΓ gleich dem Phasenraumvolumen der Energieschale (0 ≤ H(q, p) − E ≤ ∆E). Nach dieser “Aufweichung” der δ-Funktion sind in unserem Ensemble Systeme mit allen Energien H(q, p) im Intervall (E, E + ∆E) vertreten. Dies ist nicht schlimm. Zwar hat unser ursprüngliches physikalisches System nur einen Energiewert E, doch ist dieser Wert weder genau bekannt noch genau auf einen vorgegebenen Wert einstellbar. Von Interesse sind daher nur Eigenschaften, die sich nicht ändern, wenn eine hinreichend kleine endliche Energieunschärfe ∆E 6= 0 zugelassen wird. In der neuen Form für %(q, p) ist nun der zugängliche Teil des Phasenraums die Energieschale E ≤ H(q, p) ≤ E + ∆E. In der Energieschale ist %(q, p) = const , außerhalb ist %(q, p) = 0. Das Volumen der Energieschale ist die Dicke der Schale ∆E mal dem Inhalt der Energiehyperfläche Σ(E), also ∆E · Σ(E). Betrachten wir nun sofort auch Quantensysteme wiederum unter der Annahme, daß das System abgeschlossen sei, und die Energie, d.h. der Hamiltonoperator, die einzige relevante Erhaltungsgröße ist. Dies heißt strikt genommen, daß keine Entartung der Eigenwerte des Hamiltonoperators auftritt. Allerdings ist diese Aussage ohne große praktische Relevanz, denn für Vielteilchensysteme liegen die Energieniveaus außerordentlich dicht nebeneinander. Daher müßte man die Energienievaus mit unvorstellbarer Genauigkeit vermessen, um sie unterscheiden zu können: ein hoffnungsloses Unterfangen. Stattdessen führen wir eine “Grobkörnung“ (coase-graining) der Energieachse in kleine Zellen der Größe ∆E ein (∆E E vorausgesetzt) und zählen alle Energienieveaus in der Energieschale als effektiv entartet. Wenn H die einzige Erhaltungsgröße ist, kann jedenfalls der statistische Operator für ein zeitunabhängiges Gleichgewichtsensemble gemäß der von-Neumann-Gleichung nur von H abhängen und ist demzufolge diagonal in der Energiedarstellung H|ε, qεi = ε|ε, qε i . Hier soll ε die Energie unserer Energiezellen angeben und q möge die vielen Zustände mit Energien innerhalb der gleichen Energiezelle (also die effektiv entarteten Energieeigenzustände) durchnumerieren. Der statistische Operator hat dann die Form % = %(H) = XX ε qε %(ε)|ε, qε ihε, qε | , wobei %(ε) innerhalb einer Energiezelle als konstant, also als von qε unabhängig, angenommen werden kann: alle effektiv entarteten Energieeigenzustände sind gleich wahrscheinlich. Betrachten wir abgeschlossene Systeme mit fester Energie, dann ist %(ε) = 0 für ε 6= E %(ε) ≥ 0 , 27 was eindeutig %(ε) festlegt auf %(ε) = mit ∆EΣQ (E) = X 1 ∆EΣQ (E) E ≤ ε ≤ E + ∆E 0 sonst 1 = Zahl der Zustände in der Energieschale E, E + ∆E . qε Alle Zustände in einer Energieschale sind also gleich wahrscheinlich. Die Größe ΣQ (E) ist die Zahl der Energieeigenzustände pro Energieeinheit und wird Zustandsdichte des Systems genannt. Der Index Q soll in Erinnerung halten, daß es die quantenmechanische Zustandsdichte ist. Es ist die vielleicht wichtigste physikalische Größe zur Charakterisierung eines Vielteilchensystems. Eine kürzere Form, den gleichen statistischen Operator anzugeben, ist für ∆E → 0 1 δ(H − E) %= ΣQ (E) mit der Zustandsdichte ΣQ (E) = T rδ(H − E) . 9 Maxwellsche Geschwindigkeitsverteilung Betrachten wir als erste Anwendung des mikrokanonischen Ensembles ein beliebiges abgeschlossenes klassisches Vielteilchensystem, von dem wir nur verlangen, daß die kinetische Energie die Form hat N X p2i Ekin = , p i = m i vi i=1 2mi und die potentielle Energie nicht von den Impulsen p abhängt. Z.B. für ein System mit 2-Teilchen Wechselwirkung H = Ekin + X i 0 1X U (~xi ) + U (~xi , ~xj ) . 2 i,j Wir fragen nach der Geschwindigkeitsverteilung für ein beliebig herausgegriffenes Teilchen i P (v) = hδ (3) (vi − v)i im thermodynamischen Gleichgewicht. Die Mittelung ist hier über das Gleichgewichtsensemble, also die mikrokanonische Verteilung, vorzunehmen, also 1 P (v) = Σ(E) Z dVΓ δ (3) pi − v δ(H(q, p) − E) . mi Bei Ausführung des Phasenraumintegrals sorgt die erste δ-Funktion dafür, daß der Impuls für das i-te Teilchen auf dem festen Wert mi v bleibt. Daher steht nur die restliche Energie E − 21 mi v 2 für die zu mittelnde Teilchenbewegung zur Verfügung. Die Integration über die Koordinaten und die Impulse aller andern Teilchen liefert in sehr guter Näherung, da es auf 28 1 Teilchen unter ∼ 1023 nicht ankommt, wiederum E − 21 mi v2 P , aber für die leicht verschobene Energie 1 P (v) = const (E)Σ(E − mi ) . 2 1 2 Da 2 mi v E und 1 N , können wir den Logarithmus von Σ(E) bis zum ersten Glied entwickeln und dann abbrechen ∂ ln Σ(E) 1 1 mi v 2 . ln Σ(E − mi v2 ) = ln Σ(E) − 2 ∂E 2 Der Koeffizient β = ∂ ln Σ(E)/∂E hängt nur von der Energie des Systems ab, ist also für alle Atome gleich. (Wir werden ihn später als die inverse absolute Temperatur identifizieren.) Also erhalten wir das Ergebnis 1 P (v) = const e− 2 βmi v mit 2 Maxwellsche Geschwindigkeitsverteilung const = q (mi β)3 q (2π)3 2 2 2 aus der Normierung und den Mittelwerten hvi i = 0, hvix i = hviy i = hviz i = 1/mβ, hvi2 i = 3/mi β. Definieren wir die absolute Temperatur T durch die gewohnte Relation (m/2)hvi2 i = (3/2)kB T , dann wird 1 ∂ ln Σ(E) β= = . kB T ∂E Der Vergleich mit der thermodynamischen Definition des Inversen der absoluten Temperatur als Energieableitung der Entropie S(E), 1/T = ∂S(E)/∂E, zeigt, daß wir die Entropie statistisch offenbar definieren sollten als S(E) = kB ln ∆EΣ(E) , wobei wir den Faktor ∆E aus Dimensionsgründen wieder eingefügt haben. Dies ist in der Tat die zuerst von Boltzmann gegebene statistische Entropiedefinition, auf die wir in § 11 zurückkommen werden. Sie ist, wegen Σ(E) = (1/∆E)eS(E)/kg , ein logarithmisches Maß für das (extrem rasche) Anwachsen der Zustandsdichte (quantenmechanisch) bzw. des Volumens der Energieschale (klassisch) mit der Energie. 10 Volumen der Energieschale und Zustandsdichte für ein ideales Gas Ein ideales einatomiges Gas von N Atomen mit Atommasse m hat die einfache Hamiltonfunktion 3N X p2i . H= i=1 2m Um Ergodizität annehmen zu können, müssen wir eine nicht verschwindende Wechselwirkung zwischen den Teilchen zulassen, die aber einen so kleinen Beitrag zur Gesamtenergie leisten möge, daß er im Vergleich zur kinetischen Energie vernachlässigbar sei. Ist das Gas in ein 29 Volumen V eingeschlossen, so gilt (bei kubischem Behälter der Länge L = V 1/3 ) für die Atomkoordinaten 0 ≤ xi ≤ L. Daher ist Σ(E) = V N Z +∞ −∞ dp1 . . . Z +∞ −∞ X dp3N δ i p2i −E 2m ! = 3N 1 N V (2mE) 2 S3N −1 . E Um die Oberfläche Sn−1 der n-dimensionalen Einheitskugel zu berechnen, betrachten wir das Gaußintegral Z Z +∞ −∞ dx1 . . . +∞ −∞ 1 dxn e− 2 Pn i=1 x2i = (2π)n/2 und qP führen dies in n-dimensionalen Kugelkoordinaten aus. Die linke Seite gibt, mit r = n 2 i=1 xi , Sn−1 Das Radialintegral ergibt mit u = 1 2 r , 2 Z ∞ 0 r n−1 dr = (2u) 2 n−2 2 Z ∞ 0 u 1 2 r n−1 e− 2 r dr . n−2 2 n−2 2 e −u du du = 2 also Sn−1 = 2(π)n/2 /Γ n−2 2 Γ n 2 n 2 , . Damit erhalten wir das Ergebnis Σ(E) = 3N 1 N π 3N/2 V (2mE) 2 · 2 3N . E Γ( 2 ) Da N sehr groß ist, N ∼ 1023 , nimmt Σ(E) als Funktion von E und V enorm rasch zu. Dies ist typisch für alle Vielteilchensysteme, nicht nur für das ideale Gas. Berechnen wir nun die analoge Größe, die Zahl der Zustände in der Energieschale E, E + ∆E, auch quantenmechanisch. Die Energieeigenwerte für die im Kasten V = L3 eingesperrten wechselwirkungsfreien Gasatome bei zyklischen Randbedingungen sind ε= N X h̄k2i . i=1 2m (10.1) Die Energieeigenfunktionen für alle N -Teilchen zusammen in einem kubischen Kasten der Länge L mit zyklischen Randbedingungen sind ϕε,k = 1 V N/2 mit Impulsquantenzahlen kj = N Y j=1 2π nj L 30 eikj ·x wobei die 3-dimensionalen Vektoren nxj nj = nyj nzj ganzzahlige Komponenten haben und ein kubisches Gitter mit Gitterkonstante 1 bilden. Die kj erfüllen dabei die Bedingung (10.1) für vorgegebenen Energieeigenwert ε = E. Sie spielen die Rolle der Quantenzahlen q in der allgemeinen Formulierung. Also ist die Zahl der Zustände pro Energieintervall in der Energieschale E ΣQ (E) = 0 X ... 0 X kN k1 h̄2 k2i δ E− i=1 2m N X ! , wobei die Summen durch die Nebenbedingungen eingeschränkt sind, daß Zustände, die sich nur durch Permutationen der N Werte der ki unterscheiden für ununterscheidbare Teilchen wegen der Symmetrie der Wellenfunktion nicht gesondert zu zählen sind. Von dieser Einschränkung befreien wir uns, indem wir solche Zustände zunächst mehrfach zählen und dafür das Ergebnis mit der Zahl der Permutationen N ! durchdividieren. Allerdings ist dies nur die richtige Zahl von Permutationen, wenn keine Quantenzustände mehrfach besetzt q sind, was für hinreichend große Energie E, so daß ∆p ' 2mE/N h/∆x = h/(L/N 1/3 ), in guter Näherung erfüllt ist. Wir formen um X ki = X ni 3 ∆ ni ≈ Z d 3 ni , wobei wir ∆3 ni = 1 eingesetzt haben, da wegen der Quantisierung gerade 1 Quantenzustand nj auf eine Volumenzelle ∆3 ni = 1 kommt. Schließlich haben wir die Summe durch ein Integral approximiert, was für große Impulsquantenzahlen |ni | 1, also im semiklassischen Limes (h̄ sehr klein gegen alle relevanten klassischen Größen von gleicher Dimension), erlaubt ist. Mit L 3 3 3 d ni = d ki 2π gilt schließlich 1 ΣQ (E) = N! V (2π)3 !N Z 3 d k1 . . . Z h̄2 k2i d kN δ E − i=1 2m 3 N X ! . Indem wir die Impulse pi = h̄ki als neue Integrationsvariable einführen sehen wir, daß sich ΣQ (E) vom klassischen Σ(E) nur durch einen Faktor unterscheidet ΣQ (E) = Σ(E) , N !(2πh̄)3N dessen N -Abhängigkeit allerdings extrem stark und äußert wichtig ist zur Vermeidung des sog. Gibbs’schen Paradoxons der klassischen Physik. Wir kommen darauf bei der Diskussion der Mischungsentropie zurück. Tatsächlich läßt sich diese Betrachtung für das ideale Gas für beliebige Hamiltonfunktion für identische Teilchen, auch mit Wechselwirkung wiederholen 31 und man findet die allgemeine Beziehung für die semiklassische Zustandsdichte ΣQ (E) = T rδ(E − H) und den Flächeninhalt der klassischen Energieschale Σ(E) ∆EΣQ (E) = ∆EΣ(E) . (2πh̄)3N N ! Sie zeigt, daß ein Quantenzustand semiklassisch ein Phasenraumvolumen (2πh̄)3N einnimmt. 11 Entropie Die Mitglieder eines Ensembles (klassisch repräsentiert durch Punkte im Phasenraum mit der Punktdichte %(q, p, t)) bewegen sich unabhängig voneinander, also im Phasenraum wechselwirkungsfrei. Sie lassen sich also anschaulich mit den Atomen eines idealen Gases vergleichen, die sich, ebenfalls wechselwirkungsfrei im allerdings nur 3-dimensionalen Raum bewegen. Ebenso wie die Atome eines Gases jedes ihnen zugängliche Volumen im Laufe der Zeit mit gleicher mittlerer Teilchendichte ausfüllen, so erfüllen auch die Ensemblepunkte im Phasenraum jedes ihnen zugängliche Phasenraumvolumen mit konstanter Dichte %(q, p), wie das mikrokanonische Ensemble zeigt. Dieses anchauliche Bild legt die Vermutung nahe, daß abgeschlossene Vielteilchensysteme nur solche Zustandsänderungen von selbst durchlaufen werden, bei denen das von den Ensemblepunkten ausgefüllte Phasenraumvolumen zunimmt (oder gleichbleibt) und daß im thermodynamischen Gleichgewicht das ausgefüllte Phasenraumvolumen maximal ist. Betrachten wir dazu ein Beispiel: Ein ideales Gas wird sich nach Herausziehen einer Trennwand in ein vorher evakuiertes Volumen spontan ausdehnen. In welches Phasenraumvolumen breiten sich dabei die Systempunkte des Ensembles im Phasenraum aus? Trennwand V/2 V/2 ideales Gas Vakuum Gedankenexperiment zur Expansion eines wechselwirkungsfreien Gases Das physikalische Volumen verdoppelt sich von V /2 auf V , doch E und N ändern sich nicht, da das System abgeschlossen ist. Dabei nimmt das zugängliche Phasenraumvolumen ∆EΣ(E, V /2, N ) wegen Σ(E, V, N ) ∼ V N um den Faktor 2N zu ∆EΣ(E, V, N ) ∼ V N N = 2 ∆E P V E, , N ∼ 2N (V /2)N . 2 Für N ∼ 1023 ist 2N eine unvorstellbar große Zahl. Wegen der Zunahme exponentiell mit N fand es L. Boltzmann sinnvoll, allgemein den Logarithmus des vom Ensemble ausgefüllten 32 Phasenraumvolumens S = kB log[∆E P Q (E, V, N )] (11.1) als Maß für die Unordnung im System zu betrachten und damit die (Boltzmannsche) Entropie zu definieren. Hierbei ist kB die vom Maßsystem abhängige Boltzmann Konstante. Demnach nimmt in unserem Beispiel des von V /2 auf V expandierenden abgeschlossenen Gases die Entropie zu um ∆S = kB N ln 2. Allgemein kann in einem abgeschlossenen System die Boltzmannsche Entropie bei einem von selbst ablaufenden Übergang von einem Gleichgewichtszustand zu einem andern nach Aufhebung einer Einschränkung von selbst nur zunehmen, da im mikrokanonischen Ensemble stets das maximal zur Verfügung stehende Phasenraumvolumen ausgefüllt wird. Eine zeitabhängige Variante der Boltzmannschen Entropie läßt sich analog zu (11.1) definieren, wenn die gesamte Zahl der Zustände in der Energieschale ∆EΣQ (E, V, N ) im Argument des Logarithmus ersetzt wird durch die kleinere oder höchstens gleiche Zahl der davon tatsächlich im Ensemble enthaltenen Zustände. Wir werden von der zeitabhängigen Boltzmannschen Entropie hier jedoch keinen Gebrauch machen, bemerken aber, daß sie das “H-Theorem” befriedigt, nämlich dS(t) ≥ 0. dt Neben der Boltzmannschen Entropiedefinition gibt es weitere, insbesondere die Gibbssche Entropie SG = −kB T r% ln % bzw. klassisch SG = −kB Z df qdf p%(q, p, t) ln[%(q, p, t)(2πh̄)f CN ] , wobei CN ein kombinatorischer Faktor ist, der die Ununterscheidbarkeit identischer Teilchen berücksichtigt und für N ununterscheidbare Teilchen gegeben ist durch CN = N !. Setzt man für %(q, p, t) speziell die mikrokanonische Verteilung (8.3) ein, so geht SG über in SG = kB ln[∆E · Σ(E)/CN · (2πh̄)f ] = S . Gleichzeitig ist dies der maximal mögliche Wert von SG unter der Bedingung, daß %(q, p, t) nur im zugänglichen Teil des Phasenraums, also in der Energieschale, ungleich Null ist. Denn nehmen wir an, daß %(q, p, t) in der Energieschale ∂E eine beliebige normierte Funktion ist R f f f und außerhalb verschwindet, so liefert die Variation von S G = −kB d qd p% ln[%(2πh̄) CN ] R nach % unter Beachtung der Nebenbedingung ∂E %df qdf p = 1 mit dem Lagrange-Parameter λ Z ∂E df qdf pδ%{−kB ln[%(2πh̄)f CN ] − kB + λ} = 0 . Da δ% beliebig ist, muß der Faktor von δ% verschwinden. Die Lösung ist %= λ/k −1 B e (2πh̄)f CN = const in ∂E 0 sonst , also das mikrokanonische Ensemble. Die Konstante const. (und damit auch λ) ergibt sich wie früher aus der Normierung, also als const = (1/∆EΣ(E)). Da SG ein konvexes Funktional von % ist (d.h. nach unten gekrümmt mit überall negativer 2. Funktionalableitung, 33 was man am leichtesten einsieht, wenn man sich klarmacht, daß −x ln x als Funktion von x überall nach unten gekrümmt ist, da −x schneller fällt als ln x anwächst), ist das Extremum ein Maximum. Anders als die Boltzmannsche Entropie ist die Gibbssche Entropie SG für beliebige %(q, p, t) definiert, doch hat sie einen ganz gravierenden Schönheitsfehler: da %(q, p, t) allgemein eine zeitabhängige Konstante der Bewegung ist, ändert sich SG unter der Hamiltonschen Dynamik nicht in der Zeit, SG (t) = const . Am leichtesten läßt sich dies quantemechanisch mit der von-Neumann-Gleichung zeigen. SG ist also kein sehr geeignetes Maß für den heuristischen Begriff “Unordnung“, da es anders als die Unordnung nicht von selbst wächst. Stattdessen ist SG interpretierbar als “Unkenntnis” oder negative “Information“ die aus einem andern Grunde sehr nützlich ist: So wie die Boltzmannsche Entropie S für abgeschlossene Systeme das Maximum der Gibbsschen Entropie über alle möglichen % ist, und das maximierende mikrokanonische Ensemble somit die maximale Unkenntnis des Systems bei gegebener Energie und evtl. weiterer isolierender Bewegungskonstanten ausdrückt, so ist das auch noch für nicht-abgeschlossene Systeme der Fall, wie wir etwas später sehen werden, wo die Maximierung der Unkenntnis SG über die Ensembles andere kanonische Gleichgewichtsensembles liefert, für die SG wiederum gleich wird zur Boltzmannschen Entropie. 12 Entropie des idealen Gases Für die Thermodynamik ist die Boltzmannsche Entropiedefinition die entscheidende. Werten wir die Boltzmannsche Entropie für ein einatomiges ideales Gas aus. Da N ∼ 1023 1 verwenden wir die Stirlingsche Formel √ N N N ! ' 2πN e s 3N 3N 3N 3N 1 2 −1 Γ ' 2π −1 − 2 2 2e e und erhalten aus S= 3N 2∆EV N (2mE) 3N 2 π 2 kB ln EN !(2πh̄)3N Γ 3N 2 durch Einsetzen S = kB ln Damit erhalten wir 4m∆E √ 2πN r 2π 3N 2 −1 eV (2πh̄)3 N ( !N 2meE 3 N −1 2 V 3 E e5/2 m3/2 S = kB N ln + ln + ln 3 3 N 2 N π 2 h̄ 33/2 √ 1 6∆E . +O +kB ln πE N 34 ) ! 3N −1 2 π 3N 2 . Da N ∼ 1023 interessieren wir uns nur für den führenden Term für große N , der proportional zu N wird, falls V /N und E/N festgehalten werden, und der in der ersten Zeile angegeben ist. Der nächste Term, der explizit in der zweiten Zeile angegeben ist, wächst höchstens noch logarithmisch mit N (falls wir uns ∆E festgehalten oder proportional zu N 1/2 denken und bedenken, daß E proportional zur Teilchenzahl skaliert), und ist in jedem Fall im Limes N → ∞, V /N und E/N fest (thermodynamischer Limes) und ist relativ zum führenden Term vernachlässigbar. Der konstante Anteil s00 der Entropie pro Gasatom s = S/N , auch Entropiekonstante genannt, ist s00 = kB ln e5/2 m3/2 . π 3/2 33/2 h̄3 Wir können an unserem Ergebnis nochmals kontrollieren, daß bei Verdopplung des Volumens bei konstanter Energie und Teilchenzahl (d.h. also im abgeschlossenen System) die Entropie pro Gasatom um kB ln 2 zunimmt. Die Unordnung hat also zugenommen (die Gasatome sind nun über ein größeres Volumen verstreut) und unsere Information hat abgenommen (wir wissen weniger genau, wo jedes Gasatom ist) und zwar um 1 Bit pro Gasatom. 13 Mischungsentropie Betrachten wir eine Mischung von 2 idealen einatomigen Gasen, deren Atommassen verschieden sind. Die Hamiltonfunktion lautet nun in offensichtlicher Notation H= 2 3N X Xk k=1 i=1 p2ki . 2mk Wir beginnen mit der Berechnung des Volumens der Energieschale Σ1,2 (E, V, N1 , N2 ) = V N1 +N2 Z +∞ −∞ dp11 . . . Z +∞ −∞ Nk 2 X X p2ki − E . dp2(3N2 ) δ k=1 i=1 2mk Durch Herausziehen √ des Faktors E aus der δ-Distribution und Umskalieren der Integrationsvariablen in pki = 2mk Ezki geht Σ12 über in Σ1,2 (E, V, N1 , N2 ) = V N1 +N2 (2m1 E) 3N1 2 (2m2 E) E 3N1 2 S3(N1 +N2 )−1 , wobei wie früher Sn−1 die Oberfläche der n-dimensionalen Einheitskugel bezeichnet. Wir P sehen, daß bis auf die unterschiedlichen Atommassen 12 nur von der Summe der Teilchenzahlen abhängt. Führen wir die effektive von den Konzentrationen c1 = N1 N1 + N 2 , c2 = N2 N1 + N 2 abhängige Masse ein, so gilt m = mc11 · mc22 Σ12 (E, V, N1 , N2 ) = Σ(E, V, N1 + N2 ) , 35 (13.1) wobei Σ der Flächeninhalt der Energiefläche für ein einkomponentiges Gas mit effektiver Masse m ist. Ein wichtiger Unterschied des Gasgemisches zum 1-komponentigen Gas tritt erst P auf, wenn wir vom Volumen der Energieschale zur Zustandsdichte ΣQ übergehen. Denn anstelle des kombinatorischen Faktors 1/N !, der die Ununterscheidbarkeit aller Atome im 1 , da nur die Atome innerhalb 1-komponentigen Gas berücksichtigt, tritt nun der Faktor N1 !N 2! jeder Komponente ununterscheidbar sind. Also gilt ΣQ12 (E, V, N1 , N2 ) = P 12 (E, V, N1 + N2 ) N1 !N2 !(2πh̄)3(N1 +N2 ) . Durch Erweiterung mit N ! und Benutzen von (13.1) finden wir ΣQ12 (E, V, N1 , N2 ) = (N1 + N2 )! P Q (E, V, N1 + N2 ) , N1 !N2 ! wobei ΣQ die Zustandsdichte für ein einkomponentiges Gas mit effektiver Masse m ist. Durch Bildung des Logarithmus finden wir die Entropie S12 des Gasgemisches S12 (E, V, N1 , N2 ) = S1 (E, V, N1 + N2 ) + Smisch als Entropie S1 eines einkomponentigen Gases mit effektiver Masse m (die aber nur in die Entropiekonstante s00 eingeht) und einem Zusatzanteil Smisch = kB ln (N1 + N2 )! ' kB {(N1 + N2 ) ln (N1 + N2 ) − N1 ln N1 − N2 ln N2 + O(ln N )} N1 !N2 ! = −kB (N1 + N2 )(c1 ln c1 + c2 ln c2 ) , der als Mischungsentropie bezeichnet wird. Hier haben wir natürlich wieder Stirling’s Formel benutzt. Für eine binäre Mischung mit c1 = x, c2 = 1 − x zeigt die folgende Figur die Mischungsentropie als Funktion von x 1 s/k ln2 0.8 0.6 0.4 0.2 0 0 0.2 0.4 x 0.6 0.8 1 Mischungsentropie pro Molekül in Einheiten kln(2) Tatsächlich rührt dieser (wegen 0 ≤ ci ≤ 1) stets positive Anteil zur Entropie jedes mehrkomponentigen Systems von der zusätzlichen Unordnung her, die bei der Vermischung verschiedener Atomsorten entsteht. Ihr Ursprung liegt in der Unterscheidbarkeit der vermischten Teilchen. Ohne die Division des Flächeninhalts der Energieschale eines reinen Gases mit dem 36 nur quantenmechanisch begründeten Faktor N !, der von der Symmetrie der Wellenfunktion für ununterscheidbare Teilchen herrührt, hätte schon das einatomige Gas eine enorme Mischungsentropie kB N ln N . Tatsächlich müßte diese auftreten, wenn die Gasatome alle unterscheidbar wären. Die klassisch unverständliche Abwesenheit der Mischungsentropie in Gasen identischer Atome wurde vor der Entwicklung der Quantentheorie identischer Teilchen von Gibbs bemerkt. Dies “Gibbssche Paradoxon“ wurde erst später durch die Quantentheorie aufgelöst. Die Mischungsentropie, die also letzten Endes quantenmechanischen Ursprungs ist (da sie von dem fundamentalen Unterschied herrührt zwischen identischen Teilchen und nicht-identischen, somit unterscheidbaren Teilchen, den es nur in der Quantentheorie gibt), steckt hinter so wichtigen Tatsachen wie dem Massenwirkungsgesetz und dem osmotischen Druck, die später behandelt werden. 14 Temperatur Betrachten wir zwei zunächst getrennte Systeme mit Energien E1 , E2 . Solange beide Systeme abgeschlossen sind, behalten sie ihre Energien E1 und E2 bei. Die Energiehyperflächeninhalte P P der beiden Systeme seien 1 (E1 ) und 2 (E2 ). Nun bringen wir beide Systeme miteinander in Kontakt, so daß sie Energie austauschen können, ohne daß sich ihre Volumina oder ihre Teilchenzahlen oder weitere Variable (z.B. Magnetfeld) dabei ändern. Es wird also keine Arbeit geleistet, nur kinetische Energie ausgetauscht, die in der Energie der ungeordneten Bewegung der beiden Vielteilchensysteme steckt. Dieser Energieaustausch findet statt, indem die Teilchen aus den beiden Teilsystemen an ihrer Kontaktfläche miteinander zusammenstoßen. Man spricht dann auch von Wärmeaustausch und von thermischem Kontakt zwischen beiden Teilsystemen. Nach hinreichend langer Zeit wird ein neuer thermodynamischer Gleichgewichtszustand erreicht. Da das Gesamtsystem noch immer abgeschlossen ist, können wir das mikrokanonische Ensemble für den Gleichgewichtszustand des Gesamtsystems %= verwenden. Der Flächeninhalt P P δ(H1 + H2 − E) P (E) (E) der Gesamtenergiehyperfläche ist gegeben durch (E) = Z dVΓ1 Z dVΓ2 δ(H1 + H2 − E) . dVΓ1 , dVΓ2 sind die Volumenelemente in den Phasenräumen der beiden Teilsysteme. Wir haben hier die Wechselwirkungsenergie zwischen beiden Teilsystemen vernachlässigt, was erlaubt ist, weil ihr Kontakt nur auf einen Teil ihrer Oberfläche beschränkt ist und wir hier nur an Volumeneffekten interessiert sind. Betrachten wir zunächst die Wahscheinlichkeitsverteilung der Energie E1 im Teilsystem 1. Im mikrokanonischen Ensemble des Gesamtsystems gilt Z Z 1 P (E1 ) = hδ(H1 − E1 )i = dVΓ1 dVΓ2 δ(H1 − E1 )δ(H1 + H2 − E) Σ(E) P P eS(E1 ,E)/kB 1 (E1 ) 2 (E − E1 ) ∼ S(E)/k = e∆S(E1 ,E)/kB . = B Σ(E) e 37 (14.1) Hierbei haben wir die Entropie S(E1 , E) = kB ln(δE)2 Σ2 (E − E1 )Σ1 (E1 ) des Gesamtsystems der Energie E bei festgehaltenem E1 definiert, mit ∆S(E1 , E) = S(E1 , E) − S(E) . Die Wahrscheinlichkeitsverteilung ist richtig normiert, da Σ(E) = Z E 0 dE1 P 2 (E − E1 ) P 1 (E1 ) . P Diese Verteilung hat ein extrem scharfes Maximum, da 1 (E1 ) mit wachsendem E1 enorm P rasch zunimmt, während 2 (E − E1 ) ebenso rasch abnimmt. Wir können daher in hervorragender Näherung den Logarithmus der Verteilung um sein Maximum entwickeln. Zunächst bestimmen wir nur den Ort des Maximums. Zur Breite der Verteilung kehren wir erst etwas später zurück. Der Maximalwert der Verteilung wird angenommen für die Energie E1 max die sich aus P P 1 ∂ 1 (E1 ) ∂ 2 (E2 ) 1 = P (14.2) P ∂E1 V1 ,N1 ∂E2 V2 ,N2 1 (E1 ) 2 (E2 ) mit E = E1 + E2 ergibt. Wegen der extremen Schärfe des Maximums (siehe weiter unten) stimmt E1 max mit dem Mittelwert hE1 i praktisch überein. Die Gleichgewichtsbedingung (14.2) für Wärmeaustausch läßt sich unmittelbar durch die Entropie ausdrücken als ∂S1 (E1 , V1 , N1 )) ∂S2 (E2 , V2 , N2 )) = , ∂E1 ∂E2 V1 ,N2 V2 ,N2 wobei Volumen und Teilchenzahl und eventuell weitere Variable festgehalten werden bei der Differentiation. Da S und E beide “extensiv“ sind, d.h. proportional zur Teilchenzahl, ist der Differentialquotient ∂S/∂E, der im thermischen Gleichgewicht für beide Systeme gleich sein muß, von N unabhängig, d.h. “intensiv“. Wir nennen das Inverse dieser intensiven Größe die absolute Temperatur T , 1 ∂S(E, V, N ) = T ∂E V,N Definition der absoluten Temperatur (V, N stehen hier und im folgenden auch stellvertretend für alle weiteren Variablen von denen Σ(E, V, N, . . .) sonst noch abhängt) und die Gleichgewichtsbedingung für thermischen Kontakt lautet T1 = T 2 . Zwei absolut verschiedene physikalische Systeme haben also im thermischen Gleichgewicht (d.h. Gleichgewicht bei Energieaustausch; thermischem Kontakt) mindestens eines gemeinsam: ihre Temperatur. Bei mehr als 2 Teilsystemen verallgemeinert sich die bisherige Betrachtung auf T1 = T 2 = T 3 = . . . = T , d.h. wenn Teilsysteme 1 und 2 im thermischen Gleichgewicht sind, sowie 1 und 3, so sind automatisch auch 2 und 3 im thermischen Gleichgewicht. Dieser Befund, der hier aus der Statistischen Mechanik hergeleitet wurde, wird auch manchmal “0. Hauptsatz der Thermodynamik” genannt. Auf ihm beruht die Möglichkeit der objektiven Temperaturmessung. 38 Wenden wir als Beispiel unsere Temperaturdefinition auf das ideale 1-atomige Gas an. Die Energieabhängigkeit seiner Entropie ist enthalten in E 3 S = N kB ln + . . . , 2 N woraus sich ∂S 1 3 E = kB = T ∂E V,N 2N oder 3 E = N kB T 2 ergibt, d.h. jedes Gasatom trägt mit (3/2)kB T zur Energie des Gases bei. Ist ν die Molzahl unserer Gasmenge, so ist N = νL wo L die Loschmidtsche Zahl ist. Mit der idealen Gaskonstanten R = kB L finden wir also für das 1-atomige Gas die sog. kalorische Zustandsgleichung 3 E = νRT . 2 Da in dieser Rechnung S eine Funktion von E, V, N (oder ν) ist, müssen wir auch seine Ableitung 1/T als Funktion dieser Größen auffassen. Es ist also bei nochmaliger Ableitung nach E bei festem V, N 1 2 1 ∂T = = = . ∂E V,N ∂E/∂T |V, N 3N kB CV Das Inverse, die Energieänderung durch Temperaturänderung bei festem Volumen heißt Wärmekapazität CV bei festem Volumen, CV /N heißt spezifische Wärme cv . Für das ideale 1atomige Gas ist also 3 cv = k B . 2 15 Energieschwankungen Kehren wir nun zur Energieverteilung (14.1) im Teilsystem E1 zurück und entwickeln ln P (E1 ) aus (14.1) bis zum quadratischen Glied um sein Maximum ln P (E1 ) = const − 1 (E1 − hE1 i)2 + . . . . 2σE2 1 Der Koeffizient des quadratischen Gliedes ist das Inverse der Varianz der Energieschwankungen P P 1 ∂ 2 ln 1 ∂ 2 ln 2 − 2 = + . σE 1 ∂E12 ∂E22 E2 =E−E1 Betrachten wir die beiden Terme der rechten Seite für sich. Allgemein gilt P ∂ 2 ln ∂E 2 V,N ∂ 1 ∂E T ∂T ∂E 1 ∂ 2 S 1 = = 2 kB ∂E V,N kB 1 =− kB T 2 V,N ! V,N −1 ∂E = − kB T 2 ∂T V,N 39 =− 1 . kb T 2 N c V Die Temperaturableitung der Energie bei konstantem Volumen (und Teilchenzahl) ist die schon erwähnte Wärmekapazität bei konstanten Volumen CV . Also ist 1 1 1 + . = 2 2 σE 1 k B T CV 1 k B T 2 CV 2 Meist (aber nicht immer!) ist das Teilsystem 2, das Energiereservoir oder Wärmebad, viel größer als Teilsystem 1. Dann ist N2 N1 , CV 2 CV 1 und σE2 1 ist gegeben durch σE2 1 = kB T 2 CV 1 . Z.B. für ein ideales einatomiges Gas σ 2 = (3/2)(kB T )2 N = 2E 2 /3N . Dies ist ein wunderbares Resultat: Eine rein makroskopische Messung von Temperatur und Wärmekapazität gibt uns Auskunft über eine rein statistische Eigenschaft, die Stärke der Energieschwankungen in einem System. Da CV 1 ebenso wie hE1 i extensiv ist, also proportional zu Teilchenzahl N1 , ist die relative Standardabweichung der Energie 1 σE 1 ∼√ hE1 i N1 und wird für makroskopische Systeme (N1 ∼ 1023 ) unmeßbar klein, außer in der unmittelbaren Umgebung von kritischen Punkten, an denen, wie wir später sehen werden, die spezifische Wärme und somit auch σE12 divergiert. Fassen wir zusammen: Ein System 1 im Kontakt mit einem zweiten hat eine Entropie S(E1 , E), die von der Gesamtenergie E beider Systeme aber außerdem auch von E1 abhängt. Letztere Energie kann bei kleinen Systemen 1 fluktuieren. Der Gleichgewichtszustand wird durch das Maximum von S(E1 , E) bezüglich E1 festgelegt und liefert die Zustandsgleichung, welche die Temperatur mit anderen Systemvariablen verknüpft: ∂S(E1 , E) =0. ∂E1 Die Fluktuationen von E1 werden durch die Boltzmann-Einsteinsche Formel 1 e∆S(E1 ,E)/kB 1 eS(E1 ,E /kB 1 (E1 − Ē1 )2 q = ' P (E1 ) = exp − ∆EeS(E)/kB ∆E 2 σE2 2πσE2 ! , beschrieben mit σE2 = kB T 2 N cV 1 . 16 Kanonisches Ensemble Wie wir sahen ist ein System, das im thermischen Gleichgewicht mit einem anderen System steht, nicht mehr abgeschlossen. Auch im thermodynamischen Gleichgewicht hat es keine feste Energie mehr, sondern seine Energie kann schwanken, indem es Energie aus dem andern System aufnimmt oder an dieses abgibt. Welches Ensemble, welche Phasenraumdichte beschreibt ein solches System im thermodynamischen Gleichgewicht? 40 Für die gesamte Phasenraumdichte setzen wir wie immer das mikrokanonische Ensemble an %(q1 , . . . , pf , Q1 , . . . , Pf 0 ) = δ(H1 (q, p) + H2 (Q, P ) − E) sum(E) unter Vernachlässigung der Wechselwirkungsenergie (aus den gleichen Gründen). Die Phasenraumdichte des durch die qi , pi beschriebenen Teilsystems ergibt sich hieraus durch Integration über die Variablen Q1 , . . . Pf 0 des als “Energiereservoir” oder “Wärmebad” fungierenden zweiten und als viel größer angenommenen Systems. Die gewünschten Integrationen werden leicht ausgeführt, wenn wir zuvor wieder substituieren δ(H1 + H2 − E) = Z E 0 dE1 δ(H1 − E1 )δ(H2 − E + E1 ) . Wir finden dann unmittelbar Z P − E1 ) Σ(E) 0 P (E − H1 (q1 , . . . , pf )) . = 2 Σ(E) %1 (q1 , . . . , pf ) = E dE1 δ(H1 − E1 ) 2 (E (16.1) Tatsächlich wird %1 für das Teilsystem allein eine Funktion der Erhaltungsgrößen H1 (q1 , . . . , pf ) und ist damit eine zeitunabhängige Lösung der Liouville-Gleichung. Ist das Energiereservoir, d.h. Teilsystem 2, viel größer als Teilsystem 1 so ist die Energie H1 − hE1 i für alle im Ensemble vertretenen Zustände viel kleiner als E2 = E − hE1 i und wir können entwickeln ln Hierbei ist P 2 (E − H1 ) = ln P 2 (E2 ) − H1 − hE1 i 1 (H1 − hE1 i)2 − +... . kB T 2 2kB T 2 CV 2 P P ∂ 2 ln 2 (E2 ) 1 −1 1 ∂ ln 2 (E2 ) , = = . 2 kB T ∂E2 ∂E2 k B T 2 CV 2 V2 ,N2 V2 ,N2 Wenn die Wärmekapazität CV 2 des Wärmebads bei der Energie E2 = E − hE1 i sehr groß ist, kB CV 2 T 2 (H1 − hE1 i)2 ∼ kB CV 1 T 2 , dann ist der Term quadratisch in (H1 − hE1 i) in der Entwicklung vernachlässigbar. Dann gilt %1 (q1 , . . . , pf ) = 1 −βH1 (q1 ,...,pf ) e Z kanonisches Ensemble (16.2) wobei β ≡ 1/kB T . Unsere Herleitung zeigt, daß der Normierungsfaktor Z geschrieben werden kann als Σ(E)e−βhE1 i P Z=P = 1 (hE1 i)e−βhE1 i , (16.3) 2 (E − hE1 i) doch berechnet wird es nicht hieraus, sondern aus der Normierung von %1 (qq , . . . , pf ) Z was Z= Z dq1 . . . dpf %(q1 , . . . , pf ) = 1 dq1 . . . dpf e−βH1 (dq1 ...dpf ) = Z(β, V, N ) 41 (16.4) ergibt. Ähnlich wie schon beim mikrokanonischen Ensemble wird die Teilchenzahlabhängigkeit von Z durch diese klassische Formeln noch nicht richtig wiedergegeben, da die quantenmechanisch bedingte Ununterscheidbarkeit von identischen Teilchen nicht berücksichtigt wird. Um diese in den Ausdruck für Z einzubauen, teilen wir den Phasenraum in kleine Zellen der Größe ∆q1 . . . ∆pf = (2πh̄)f ein, ersetzen H(q, p) durch einen konstanten Wert in jeder Zelle, und normieren die Phasenraumdichte 1 −βH %1 = e Zq nun durch Summation über die Zellen, wobei wir Zustände, die nur durch Permutation identischer Teilchen unterschieden sind, nur einmal zählen. Also, indem wir uns von letzterer Einschränkung durch Einführung eines kombinatorischen Faktors CN befreien, 1 X −βH1 e CN (Zellen) Z 1 dq1 . . . dpf e−βH1 . = f CN (2πh̄) Z= Der kombinatorische Faktor für identische Teilchen ist CN = N ! Die analogen quantenmechanischen Gleichungen lauten 1 −βH1 e Z Z = T re−βH1 . %1 = (16.5) Ihre Herleitung verläuft ganz analog, wobei Phasenraumintegrale durch Spuren über die Hilberträume der entsprechenden Teilsysteme zu ersetzen sind. Z heißt kanonisches Zustandsintegral (klassisch) oder kanonische Zustandssumme (quantenmechanisch). Aus Z als Funktion von β ergeben sich durch Differentiation: ∂ ln Z ∂β ∂2 ln Z . = ∂β 2 hE1 i = − σE2 1 Zur Deutung von Z können wir auf (16.3) zurückgreifen, wenn wir zuvor Σ(E) für das Gesamtsystem aus Gl. (14.2) auswerten, indem wir das Integral durch den Maximalwert des Integranden multipliziert mit der Breite des Maximums ∆E approximieren Σ(E) ' P P ∆E 2 (E − E1 max ) 1 (E1 max ). Also erhalten wir Z = ∆E P 1 (E1 max )e −βE1 max und daraus bis auf Größen, die im thermodynamischen Limes vernachlässigbar sind kB ln Z = S1 (E1 max , V1 , N1 ) − 42 E1 max . T Hierbei ist E1 max die mittlere Energie im Teilsystem 1, die sich im Prinzip durch Lösung der Gleichgewichtsbedingung (14.2), also durch Vorgabe seiner Temperatur T , ergibt. Im folgenden schreiben wir daher statt E1 max nur E1 . Also ist die Temperatur (nicht die Energie) hier die unabhängig vorgebbare Variable (durch Vorgabe der Temperatur des Wärmebads). Wir können aus der durch −kB T ln Z gegebenen Funktion −kB T ln Z = −T S1 (E1 , V1 , N1 ) + E1 die Energie E1 mit Hilfe der Beziehung 1 ∂S1 = T ∂E1 eliminieren. Dies ist eine Legendre-Transformation und die entstehende Funktion F (T, V1 , N1 ) F (T, V1 , N1 ) = E1 (T, V1 , N1 ) − T S1 (E1 (T, V1 , N1 ), V1 , N1 ) ist in der Thermodynamik bekannt als freie Energie (genauer: Helmoltzsche freie Energie). Offenbar gilt also F (T, V1 , N1 ) = −kB T ln Z(β, V1 , N1 ) . Die Variablen T, V1 , N1 heißen die “natürlichen“ Variablen von F . Es sind wunderschönerweise die selben Variablen von denen auch Z abhängt. Die Auswertung der kanonischen Zustandssumme liefert also direkt die freie Energie als Funktion ihrer natürlichen Variablen. Analog sind die extensiven Variablen E, V, N die natürlichen Variablen der Entropie S = S(E, V, N ), deren statistische Bestimmung durch S = kB ln ∆EΣQ (E, V, N ) sie ebenfalls als Funktion ihrer natürlichen Variablen liefert. Die Ableitung von S nach seiner natürlichen Variablen E liefert die Temperatur T −1 = ∂S/∂E. Die Ableitung von F nach seiner natürlichen Variablen bei festem V, N liefert −S gemäß dF = dE − T dS − SdT = −SdT (falls V, N fest) da dE = T dS (falls V, N fest), also ∂F = −S . ∂T V,N Eine sehr einfache Anwendung des kanonischen Ensembles ist die Herleitung der Maxwellschen Geschwindigkeitsverteilung. Eine damit eng verknüpfte noch allgemeinere Aussage der klassischen statistischen Mechanik behandeln wir als nächstes. 17 Gleichverteilungssatz Der Gleichverteilungssatz der klassischen statistischen Mechanik lautet: Jede kanonische Koordinate und jeder kanonische Impuls, der quadratisch in die Hamiltonfunktion eingeht, trägt zur mittleren Energie den Betrag (1/2)kB T bei und zur Wärmekapazität cv den Betrag kB /2. Der Beweis ist mit Hilfe des kanonischen Ensembles leicht geführt: Man spaltet dazu die Hamiltonfunktion in den quadratischen Teil und den Rest auf, H = Hquadr. + HRest . Für die Zustandssumme bedeutet dies eine entsprechende Faktorisierung Z = Zquadr. · ZRest , 43 was zur Aufspaltung F = −kB T ln Z = Fquadr. + FRest führt. Der Beitrag vom quadratischen Teil der Hamiltonfunktion ist dabei Fquadr. = −kB T ln Zquadr. . Die Temperaturabhängigkeit von Zquadr. wertet man am leichtesten aus, indem man durch Reskalierung aller in die Hamiltonfunktion quadratisch eingehenden Variablen q oder p q= q kB T Q , p= q kB T P den Integranden exp(−βHquadr. (q, p)) = exp(−Hquadr. (Q, P )) temperaturunabhängig macht. Im Volumenelement bedeutet dies fq dVΓquadr. (q, p) = (kB T ) 2 dVΓquadr. (Q, P ) , wobei dVΓquadr. (q, p) das Volumenelement für die quadratisch eingehenden Variablen ist und fq die Gesamtzahl der quadratisch eingehendenn q’s und p’s, also die Dimension von dVΓquadr. (q, p). Daher hat Zquadr. die Form Zquadr. (T, V, N ) = (kB T )fq /2 Z̃quadr. (V, N ) , wobei Z̃quadr. (V, N ) unabhängig von der Temperatur ist. Also gilt Fquadr. (T, V, N ) = − kB T fq ln kB T − kB T ln Z̃quadr. (V, N ) 2 und Squadr. = − kB kB ∂Fquadr. = fq ln kB T − fq ∂T 2 2 +kB ln Z̃quadr. (V, N ) kB fq ∂Squadr. CV quadr. = = T ∂T V 2 T was CV quadr. /fq = kB /2 liefert, wie behauptet, und nach Integration bezüglich T hE quadr. i = kB T fq . 2 Den Erwartungswert hEquadr. i kann man auch direkter bestimmen aus hEquadr. i = − fq ∂ ln Zquadr. = kB T , ∂β 2 woraus ebenfalls CV quadr. = fq kB /2 folgt. Eine Anwendung des Gleichverteilungssatzes ist die Berechnung der spezifischen Wärme von Festkörpern bei so hohen Temperaturen, daß die klassische statistische Mechanik anwendbar ist. Die Atome des Kristalls führen in guter Näherung harmonische Schwingungen um 44 ihre Gleichgewichtslagen aus, d.h. sämtliche 3N Koordinaten und 3N Impulse gehen in die Hamiltonfunktion quadratisch ein. Dies ergibt nach dem Gleichverteilungssatz 1 CV = kB · 6N = 3N kB 2 (Dulong Petitsche Regel) . Diese “Dulong Petitsche Regel“ ist empirisch recht gut bestätigt. Harmonische Schwingungen (dies stets mit Impuls und Koordinate quadratisch in die Hamiltonfunktion eingehen) sind nur dann klassisch behandelbar, wenn ihre Frequenz ω die Bedingung h̄ω hEiklass = kB T erfüllt. Andernfalls, für kB T <h̄ω, ist die Schwingung “eingefroren“ und nimmt nicht mehr ∼ an der gleichförmigen Energieverteilung (Äquipartition) teil. Um dies zu sehen, berechnen wir die Wärmekapazität eines harmonischen Oszillators quantenmechanisch. Aus 1 % = e−βH Z 2 2 2 folgt mit H = p /2m + (m/2)ω q Z = T re−βH = X n hn|e−βH |ni unter Verwendung des vollständigen Systems von Eigenzuständen |ni des Hamiltonoperators 1 |ni H|ni = h̄ω n + 2 Z= ∞ X 1 e−βh̄ω(n+ 2 ) = n=0 Also hEi = − e−βh̄ω/2 . 1 − e−βh̄ω 1 ∂ ln Z = h̄ω hni + ∂β 2 mit hni = 1 eβh̄ω Für die spezifische Wärme liefert dies ∂hEi C= = kB ∂T −1 . βh̄ω/2 sinh βh̄ω 2 !2 mit folgendem Temperaturverlauf, wobei kB T in Einheiten von h̄ω genommen wird 45 1 C/k 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 kT Spezifische Wärme C/k einer harmonischen Schwingung Wir sehen, daß für kB T h̄ω der Beitrag C der harmonischen Schwingung zur spezifischen Wärme den klassischen Wert 2kB /2 gemäß dem Gleichverteilungssatz annimmt, aber auch wie die beiden “Schwingungsfreiheitsgrade“ fq = 2 für kB T <h̄ω aus der spezifischen ∼ Wärme herausfallen. Ähnliches gilt für die Rotationsfreiheitsgrade, z.B. in Gasmolekülen, deren kinetische Energie der Rotation sich schreiben läßt als Hrot = 3 1X Θi ωi2 , 2 i=1 wobei die Θi die Hauptträgheitsmomente und die ωi die Winkelgeschwindigkeiten um die Hauptträgheitsachsen sind. Solange keine der Rotationen ausgefroren ist, und falls die nichtlineare Kopplung zwischen Rotationen und Vibrationen (durch Veränderung der Trägheitsmomente durch die Vibrationen) vernachlässigbar sind, nimmt jedes derartige Gasmolekül mit 3 zusätzlichen “Rotationsgraden“ fq = 3 an der Energiepartition teil. Quantenmechanisch haben die ersten Rotationsniveaus Energien der Größe h̄2 /2Θi . Äquipartition kann man daher annehmen falls kB T h̄2 /2Θi . Andernfalls werden auch die Rotationsfreiheitsgrade ausgefroren. Insbesondere bei hantelförmigen Molekülen ist das Trägheitsmoment um die Achse parallel zur Hantel verschwindend klein, die Rotation um diese Achse ist also stets ausgefroren. Gase wie N2 , O2 haben Moleküle mit 3 Translationsimpulskomponenten, 2 Streckschwingungskoordinaten (Koordinate und Impuls) und 2 Drehimpulskoordinaten die (näherungsweise) quadratisch in die Hamiltonfunktion eingehen. Ihre spezifische Wärme bei sehr hohen Temperaturen beträgt daher cv = 7kB T /2, die für T ≤ h̄ω/kB (ω= Frequenz der Streckschwingung) auf cv = 5kB T /2 abfällt und dann für T ≤ h̄2 /2ΘkB auf cv = 3kB T /2 ausfriert. Bei Zimmertemperatur sind meist die Schwingungsbeiträge schon ausgefroren, die Rotationsbeiträge dagegen noch nicht. Ein Gas wie CO2 hat noch immer hantelförmige Moleküle, doch gibt es eine symmetrische und eine unsymmetrische Streckschwingung mit je 2 Schwingungsfreiheitsgraden und zwei unabhängige Knickschwingungen transversal zur Hantelachse nochmals mit je 2 Schwingungsfreiheitsgraden, was eine spezifische Wärme cv = 13kB T N/2 bei sehr hohen Temperaturen ergibt. Planare 3-atomige und komplizierte 3-dimensionale Moleküle haben 3 Rotationsfreiheitsgrade und cv = 6kB T /2 bei Temperaturen, für die die Schwingungsfreiheitsgrade nicht aber die Rotationsfreiheitsgrade 46 ausgefroren sind. 18 Paramagnetismus Betrachten wir ein Gas von Molekülen mit magnetischen Momenten µ in einem äußeren Magnetfeld H. Die magnetische Energie eines Moleküls ist die Zeeman-Energie hz = −µ · H . m ist proportional zum Gesamtdrehimpuls h̄J des Moleküls µ = gµo J, wobei g der LandéFaktor ist und µ0 = eh̄/2me c das Bohrsche Magneton mit der Elektronenmasse me . Zeigt H in z-Richtung gilt hz = −gµ0 Jz H . Jz = m kann 2J + 1 Werte zwischen −J und J annehmen. Der Mittelwert der magnetischen Energie pro Molekül wird daher hhz i = J 1 X ∂ ln Z hz e+βgµ0 mH = − Z m=−J ∂β mit Z= X e βgµ0 mH m 1 − e−(2J+1)βgµ0 H =e 1 − e−βgµ0 H sinh[(J + 12 )βgµ0 H] . = sinh[ 12 βgµ0 H] βgµ0 mJH Dies ergibt E/N = hhz i = − 1 1 gµ0 H (2J + 1) coth[ J + βgµ0 H] − coth[ βgµo H] 2 2 2 mit den beiden Grenzfällen hhz i → −gµ0 HJ (kB T Jgµo H) 1 (gµ0 H)2 J(J + 1) (kB T Jgµo H) . hhz i → − 3 kB T Die mittlere Zeeman-Energie pro Spin als Funktion von Temperatur und Magnetfeldstärke zeigt die folgende Figur: 47 0 -2 -4 E/N -6 -8 -10 0 -10 -5 5 10 kT 0 gµH 5 15 20 10 Mittlere Energie pro Spin als Funktion von T und H für J = 1 wobei in der Figur µ0 als µ abgekürzt wird und für alle Achsen die gleiche willkürliche Energieeinheit gewählt wird. In beiden Grenzfällen strebt der magnetische Anteil zur spezifischen Wärme ∂hhz i ch = ∂T gegen Null ch → 0, mit einem Maximum für kB T ∼ (1/2)Jgµ0H. 0.6 0.5 c/k 0.4 0.3 0.2 0.1 0 0 0 2 5 4 10 kT 6 15 gµH 8 20 10 Spezifische Wärme c als Funktion von T und H für J = 1 Die mittlere Magnetisierung pro Molekül können wir ebenfalls aus Z berechnen mit hµz i = gµ0 hJz i = 1 ∂ ln Z hhz i =− , β ∂H H was die Grenzfälle hµz i → gµ0 J (kB T Jgµ0 H) 48 hµz i → − 1 (gµ0 )2 HJ(J + 1) (kB T Jgµo H) 3 kB T ergibt. Die mittlere Magnetisierung pro Spin in Einheiten gµ0 für verschiedene Werte von J zeigt die nächste Figur: 2 <m> 1.5 1 0.5 0 1 2 3 4 gHµ/kT 5 6 Mittlere Magnetisierung pro Spin für J = 1/2, 1, 3/2, 2 Die magnetische Suszeptibilität des Gases pro Molekül erhalten wir damit als ∂hµz i 1 ∂ 2 ln Z 1 ∂hhz i = = − 2β 2 ∂H β ∂H H ∂β T kB T ∂hhz i = 2 ch . = 2 H ∂(kB T ) H χ= die wir ebenfalls auftragen 5 4 χ 3 2 1 1 1.5 2 2.5 0 0 1 2 3 4 5 0 0.5 gµH 6 3 kT Suszeptibilität χ/(gµ)2 als Funktion von T und H für J = 1 49 Insbesondere gilt für kB T Jgµ0 H χ= gµ20 J(J + 1) . 3kB T Die Abhängigkeit χ = D/T ist als Curiesches Gesetz bekannt mit der Curieschen Konstanten D. Wir sehen, daß das Curiesche Gesetz einhergeht mit einer Magnetfeldabhängigkeit der Wärmekapazität 2N DH ∂CH = , (18.1) ∂H T T2 aus deren Messung man die Curiesche Konstante für ein gegebenes Gas bestimmen kann. Paramagnetismus kann von einem nichtverschwindenden Gesamtdrehimpuls der Elektronenhülle stammen, in welchem Fall |µ| von der Größenordnung des Bohrschen Magnetons ist, oder, falls dieser verschwindet, vom Kernspin mit einem viel (etwa 1000-mal) kleineren magnetischen Moment. Kernspins richten sich daher im Magnetfeld erst bei einer ca. 1000-mal kleineren Temperatur kB T <Jgµ0 H aus als Elektronenspins oder Drehimpulse der Elektro∼ nenhülle. Diese Eigenschaft macht man sich bei dem später zu diskutierenden Kühlverfahren durch adiabatische Entmagnetisierung zunutze. Eine Besonderheit von Spinsystemen ist es, daß die Energie nach unten und auch nach oben beschränkt ist. Die Entropie nimmt für große Energien wieder ab, 1 0.8 0.6 S/kN ln(2J+1) 0.4 0.2 -1 -0.5 00 0.5 E/NgµH 1 Entropie s(e, H) für |T | < 4gµH im Fall J = 1 was zu negativen Temperaturen führt. Diese sind in gewisser Weise noch heißer als T = ∞, denn von kleinen zu großen Energien durchläuft man erst T von 0 bis ∞ und dann anschließend von −∞ bis −0. 19 1-dimensionales Ising Modell und Transfer-Matrix Methode Das Ising-Modell ist zunächst ein klassisches Modell für einen Ferromagneten mit einer eventuell durch das Kristallgitter vorgegebenen leichten Richtung der Magentisierung. Darüber 50 hinaus kann es zur Modellierung einer Unzahl von Vielteilchensystemen verwendet werden. Mikroskopisch besteht der Magnet in diesem Modell aus Spins mit dem Wert s = 1/2, die auf einem regelmäßigen Kristallgitter gegebener Symmetrie (z.B. ein kubisches Gitter) angeordnet sind. Die Spins haben nur 2 Einstellmöglichkeiten in die magnetisch leichte Richtung ms = 1/2 und ms = −1/2. Nächst benachbarte Spins auf dem Kristallgitter können wechselwirken, und zwar erhält man Energieabsenkung um −J bei Parallelstellung und Energieerhöhung um +J bei Antiparallelstellung. J wäre quantenmechanisch proportional zum Überlappungsintegral der Elektronenwellenfunktionen in den d-Schalen benachbarter Atome des ferromagnetischen Materials: Bei Parallelstellung der benachbarten Elektronenspins werden diese Elektronen wegen des Pauli-Prinzips auf Abstand gehalten, wodurch ihre positive Coulombenergie verringert, also abgesenkt wird. Führen wir an jedem Gitterpunkt i eine Spinzufallsvariable si = 2msi mit den möglichen Werten +1, -1 ein, so schreibt sich die Energie des Ising-Modells in einem äußeren Magnetfeld Hz entlang der magnetisch leichten Richtung X JX si H=− si sj − h 2 hiji i mit h = 1/2gµoHz . Hierbei bedeutet hiji in der Doppelsumme, daß nur über Paare von nächsten Nachbarn auf dem Gitter summiert wird. Es gibt natürlich Verallgemeinerungen des Ising-Modells, wo jeder Spin statt 2 nun p > 2 Einstellmöglichkeiten hat (Potts-Modell), oder wo auch übernächste Nachbarwechselwirkungen betrachtet werden, oder wo das Austauschintegral negativ ist, oder oszilliert vom nächsten zum übernächsten Nachbarn etc. Außerdem kann das Ising-Modell zur Beschreibung von Gittergasen verwendet werden, in denen Atome nur auf den Punkten eines festen Gitters sitzen können, die entweder besetzt sind, pi = (1 + si )/2, oder nicht pi = (1 − si )/2. Das 1-dimensionale Ising-Modell wurde schon von Ising exakt gelöst. Das zweidimensionale Ising-Modell ohne äußeres Magnetfeld, Hz = 0, konnte in einer spektakulären Arbeit von Onsager exakt gelöst werden. Die Lösung des zweidimensionalen Modells mit Hz 6= 0 wurde später von Yang gegeben. Das 3-dimensionale Ising-Modell ist dagegen bis heute nur näherungsweise lösbar. Betrachten wir hier die Lösung des 1-dimensionalen Ising-Modells mit Hilfe der Transfer-Matrix Methode, die leicht abgewandelt auf alle 1-dimensionalen Systeme mit kurzreichweitiger Wechselwirkung anwendbar ist. Die Hamiltonfunktion lautet: H = −J N X k=1 sk sk+1 − h N X sk k=1 wobei wir N Gitterplätze auf einer geschlossenen linearen Kette angenommen haben (zyklische Randbedingungen). Die auszuwertende Zustandssumme im kanonischen Ensemble hat die Form " # Z= X s1 ... X sN exp β N X (Jsk sk+1 + hsk ) , k=1 wobei sn+1 = s1 angenommen wird (zyklische Randbedingung). In 1-dimensionalen Systemen können wir uns bei der Ausführung der Summen z.B. von links nach rechts durch das Gitter hindurcharbeiten. Zur Auswertung definieren wir die symmetrische reelle Matrix Qss0 = hs|Q|s0 i 51 in bewußt quantenmechanisch inspirierter Notation, welche die Zustandssumme in die Form bringt X X . . . hs1 |Q|s2 ihs2 |Q|s3 i . . . hsN |Q|s1 i . Z= s1 sN Offenbar leistet die Wahl 0 Qss0 = eβJss + βh (s+s0 ) 2 = eβJ+βh e −βJ e−βJ e βJ−βh (19.1) 0 genau dieses. Denn im Produkt steuert dies Qss0 den richtigen Term eβJss bei jeweils der Hälfte von βhs und βhs0 im Exponenten, wobei aber jedes s und s0 als erster und als zweiter Matrix-Index vorkommt. Qss0 heißt Transfer-Matrix, weil sie in der Zustandssumme einen Transfer von einem Gitterplatz zum nächsten auf unserer 1-dimensionalen Kette bewirkt. Tatsächlich kann man die Summen über s2 , s3 , . . . , sn in (19.1) nun sofort ausführen mit dem Ergebnis X Z = hs1 |QN |s1 i = T rQN . s1 Die Zustandssumme ist also als Spur der N -ten Potenz (N =Zahl der Gitterplätze) der Transfer-Matrix gegeben. Die Wechselwirkung steckt allein in den Matrixelementen. Die Faktoren von QN wechselwirken dagegen untereinander nicht. Diagonalisieren wir die TransferMatrix, so erhalten wir die beiden Eigenwerte λ± = e βJ cos βh ± q 2 cosh βh − 2e−2βJ sinh 2βJ , wobei λ+ > λ− . Die freie Energie pro Spin erhalten wir aus ln Z(T, h, N ) . N →∞ N f (T, h) = −kB T lim Die Zustandssumme ergibt sich als N Z = T rQN = λN + + λ− , also N f (T, h) = −kB T lim N −1 ln(λN + + λ− ) , N →∞ = −kB T ln λ+ . Im thermodynamischen Limes wird also die freie Energie pro Teilchen proportional zum Logarithmus des größten Eigenwerts der Transfer-Matrix. Dies ergibt explizit: f (T, h) = −J − kB T ln cosh βh + q 2 cosh βh − 2e−2βJ sinh 2βJ woraus sich Entropie pro Spin s = −∂f (h, T )/∂T ), spezifische Wärme pro Spin ch = und Suszeptibilität pro T ∂s/∂T = −T ∂ 2 f (h, T )/∂T 2 Magnetisierung pro Spin m = ∂f δh T 52 Spin χ = ∂m/∂h = −∂ 2 f /∂h2 durch Differentiationen ergibt. Für die Magnetisierung finden wir ∂f sinh βh m=− =q ∂h cosh2 (βh) − 2e−2βJ sinh 2βJ und für die Suszeptibilität bei h = 0 χ= ∂m = β(1 − 2e−2βJ sinh βJ)1/2 . ∂h Die Isothermen m = m(T, h) für feste Werte von T zeigt die nächste Figur: 1 <m> 4 3 2 0.4 0.5 0 -0.5 -1 -4 -2 0 2 4 gµH / 2J Magnetisierung m pro Spin in Einheiten von gµ/2 für kT /J = 0.4, 2, 3, 4 Die Einheit m = 1 entspricht physikalisch mphys = 21 gµ0 . Das eindimensionale System hat (anders als 3-dimensionale uniaxiale Ferromagnete) keinen Phasenübergang für endliche Temperaturen T > 0. Dies gilt allgemein für 1-dimensionale Vielteilchensysteme mit kurzreichweitiger Wechselwirkung. Doch findet man für T → 0, h → 0, daß die freie Energie und die aus ihr abgeleiteten Größen singulär wird. Einen solchen Punkt im Zustandsraum nennt man einen kritischen Punkt. Betrachten wir den kritischen Punkt des 1-dimensionalen Ising-Modells für T = 0, h = 0 genauer. Im Grundzustand zeigen bei verschwindendem äußeren Magnetfeld alle Spins nach oben oder unten. Um einen einzelnen Spin umzudrehen, braucht man eine Energie von 4J, da die Wechselwirkungsenergie für zwei Nachbarn aufgebracht werden muß. Der Boltzmann-Faktor für einen einzelnen Spin-Flip ist also x = e−4βJ . Die freie Energie ist eine Funktion von y = (βh) und x q F + NJ = g(x, y) = − ln cosh yh + sinh2 y + x . N kB T g(x, y) nicht analytisch in x für x → 0, sondern (für y → 0, d.h. → 0) s g(x, y) = gsing (x, y) = −|y| 1 + x . y2 Außerdem hat m = M/N einen Sprung für T = 0 bei y = 0(h = 0) (kB T )msing = − sgn(y) ∂gsing y =q =√ 2 ∂y x+y 1 + (yx2 )2 53 und 2 (kB T ) χsing ∂msing ∂msing sgn(y) = (kB T ) = (kT ) = √ ∂h T ∂y x x 2 (y)2 +1 x !−3/2 eine Singularität für y → 0, x → 0. Tatsächlich ist (F + N J)/N kB T für T → 0, d.h. x → 0, √ ˜ y2 ) mit g̃(u) = 1 + u und h → 0 eine Skalenfunktion g(x, y) = −|y|g̃(x/y 2 ) = −x1/2 g̃( x √ ˜ g̃(v) = 1 + v in x und y und x = 0, y = 0 ein kritischer Punkt. 20 Arbeit äußerer Kräfte und Druck Statt durch thermische Kontakte kann der Abschluß eines Systems auch dadurch aufgehoben werden, daß es zwar thermisch isoliert bleibt, aber äußere Kräfte auf es einwirken. Z.B. können wir, wie in den beiden vorangehenden Abschnitten, ein äußeres Magnetfeld anlegen und ändern oder die Wände des Behälters verschieben. Im ersten Fall sprechen wir von magnetischer Arbeit, im zweiten von Volumenarbeit. In all diesen Fällen verändern wir Parameter λ, die in die Hamiltonfunktion eingehen. Wir können diese Parameter natürlich schnell verändern oder sehr langsam (“quasistatisch“), insbesondere auch so langsam, daß stets das System im Gleichgewicht bleibt, welches dann durch das mikrokanonische Ensemble des abgeschlossenen Systems mit dem augenblicklich vorliegenden Wert der sich (langsam) ändernden Parameter ist. Solche Parameteränderungen heißen “quasistatisch-reversibel“, da sie jeder Zeit umkehrbar sind. Bei einer “quasistatisch reversiblen” kurz: adiabatischen Änderung von Parametern λ in einem Hamiltonschen System ändert sich einerseits die Hamiltonfunktion H(q, p, λ) mit λ, andererseits auch die gesamt Energie des mechanischen Systems, E = E(λ). D.h. bei der Parameteränderung wird Arbeit an dem System, oder von dem System, geleistet. Wie bestimmt man E(λ) für ein mechanisches System? Im Prinzip hat man so vorzugehen, daß man die (für festgehaltenes λ) erhaltene Energie des Systems, die Hamiltonfunktion H(q, p, λ), durch adiabatische Invarianten wie in integrablen Systemen, die Wirkungsintegrale Z 1 Ii = Σfε=1 pε dqε , 2π Ci ausdrückt 1 H(q, pλ) = H(I, λ). Die sich ergebende Funkton E(λ) = H(I, λ) bestimmt die λ-Abhängigkeit der Gesamtenergie. Demzufolge ändert sich bei einer adiabatischen Zustandsänderung die mikrokanonische Verteilung gemäß 1 %(q, p, λ) = δ(H(q, p, λ) − E(λ)), Σ(E(λ), λ) d.h. es verschieben sich also sowohl die Hamiltonfunktion, als auch die Energie. Dabei gilt für jeden instantanen Wert von λ die Energieerhaltung in der quasistatischen Form H(q, p, λ) = E(λ) 1 Wir müssen dies nie wirklich praktisch auch tun. Wichtig ist allein, daß wir dies tun könnten, so daß E(λ) im Prinzip so definierbar ist. 54 für den jeweiligen instantanen Wert von λ, aber eben mit λ-abhängigem E(λ). Wie ändert sich die Entropie bei einer adiabatischen Zustandsänderung? S(λ) = kB ln mit Σ(E(λ), λ) = Also ∂ ∂S kB dS = =P (E(λ), λ) ∂λ ∆E Σ(E(λ), λ) CF DN (2πh̄)f Z dVΓ δ(H(q, p, λ) − E(λ)). P (E(λ), λ) kB = ∂λ Σ(E(λ), λ) Berechnen wir die Terme der rechten Seite: ∂Σ(E, λ) =− ∂E λ Z ! ∂Σ ∂E(λ) ∂Σ . + ∂E λ ∂λ ∂λ E dVΓ δ 0 (H(q, p, λ) − E) Z ∂Σ(E, λ) ∂H(q, p, λ) = + dVΓ δ 0 (H(q, p, λ) − E) ∂λ E ∂λ Z ∂E(λ) = dVΓ δ 0 (H(q, p, λ) − E) . ∂λ Setzen wir dies ein, so finden wir dS = ∂S dλ = 0 , ∂λ d.h. die Entropie ändert sich nicht bei adiabatischen Zustandänderungen, sie ist eine adiabatische Invariante. Quasistatisch-reversible Prozesse in thermisch isolierten Systemen verlaufen also mit dS = 0 und heißen “adiabatisch“. Durch Umkehrung der Parameteränderung können wir die gleiche Folge von Gleichgewichtszuständen in umgekehrter Richtung durchlaufen, wobei die vorher dem System zugeführte Energie nun wieder abgegeben wird. Die reversible Energieänderung für ein thermisch isoliertes System bei einer Parameteränderung dλ können wir aus der Bedingung dS = 0 berechnen, wenn wir die Entropie aus S = kB ln Σ(E, V, N, λ) berechnet haben, wobei die Abhängigkeit von λ von der λ-Abhängigkeit der Hamiltonfunktion herrührt. Werden V, N konstant gehalten, so gilt nämlich 0 = dS = woraus ∂S ∂S dE + dλ , ∂E ∂λ ∂E ∂S = −T . ∂λ S,V,N ∂λ E,V,N Wenn insbesondere der Parameter λ mit dem Volumen identifiziert wird, so ändert sich die Energie durch Volumenarbeit d− A = −pdV am System. Der Querstrich an d− A soll daran erinnern, daß die Arbeit vom Weg abhängt, d− A also nicht das Differential einer Funktion A ist. Für einen adiabatischen Prozeß (dS = 0) 55 ist die Energieänderung dE = d− A = −pdV . In diesem Fall ist also der Druck p definiert durch ∂E p=− ∂V S,N und läßt sich bei Kenntnis von S = kB ln Σ(E, V, N ) als Funktion von E, V, N berechnen aus ∂S . p=T ∂V E,N Als Beispiel betrachten wir das ideale 1-atomige Gas. Die Volumenabhängigkeit seiner Entropie ist in V S = kB N ln + . . . N enthalten, woraus sich durch Differentiation p= kB N T V ergibt, also die bekannte Zustandsgleichung des idealen Gases. Wir können den Druck auch durch Auswertung der kanonischen Zustandssumme Z aus ln Z berechnen, denn aus F = E − TS dF = dE − T dS − SdT folgt, falls nur T und V variiert werden (also N und alle weiteren λ konstant bleiben) dF = dE − T also ∂S ∂S dE − T dV − SdT = −pdV − SdT , ∂E ∂V ∂ ln Z(β, V, N, λ) ∂F = kB T p=− ∂V T,N,λ ∂V T,N,λ und allgemein ∂E ∂S ∂F ∂ ln Z = −T = = −k T . B ∂λ S,V,N ∂λ E,V,N ∂λ T,V,N ∂λ T,V,N Können zwei thermisch isolierte Systeme Volumen miteinander austauschen, z.B. über eine thermisch isolierende aber bewegliche Trennwand, so zeigt eine Betrachtung ganz analog zum Energieaustausch, daß Σ(E) ∂S1 ∂S2 = ∂V1 ∂V2 also p p = T 1 T 2 56 die Gleichgewichtsbedingung ist. Besteht außerdem noch thermischer Kontakt, so gilt im Gleichgewicht zusätzlich T1 = T2 und es besteht auch ein Druckgleichgewicht p1 = p2 . Wie stark ein System auf Druckänderungen reagiert wird durch die Kompressibilitäten adiabatische Kompressibilität isotherme Kompressibilität 1 ∂V κS = − V ∂p S 1 ∂V κT = − V ∂p T charakterisiert. Weitere Größen, welche die Antwort eines Systems auf Temperaturänderungen charakterisieren, sind neben der schon bekannten Wärmekapazität CV ∂E ∂S CV = = T ∂T V,N ∂T V,N (wegen dE|V,N = T dS|V,N ) die Wärmekapazität bei konstantem Druck ∂H ∂S = Cp = T ∂T p,N ∂T p,N (mit der Enthalpie H = E + pV ) und der thermische Volumenausdehnungskoeffizient 1 ∂V αp = . V ∂T p,N Folgende Identitäten lassen sich durch Umrechnung der partiellen Ableitungen herleiten κT (Cp − CV ) = T V αp2 Cp (κT − κS ) = T V αp2 und daraus κT Cp = . CV κS Leiten wir als Beispiel die erste der obigen Identitäten ab: ∂E ∂V ∂E ∂H = + p = + Cp = ∂T p,N ∂T p,N ∂T p,N ∂T V,N = CV − V Nun ist ! ∂E + p αp . ∂V T ∂E +p ∂V T ∂E ∂E ∂E ∂S ∂S = + = −p + T ∂V T ∂V S ∂S V,N ∂V T ∂V T und, gemäß einer “Maxwell-Relation“ ∂S ∂ ∂F ∂ ∂F ∂p =− . =− = ∂V T ∂V ∂T ∂T ∂V ∂T V 57 ! ∂V ∂T p,N Also ist ∂p ∂E = −p + T . ∂V T ∂T V Aus der Zustandsgleichung V = V (T, p) folgt bei konstantem Volumen ∂V ∂V dV = dT + dp = 0 , ∂T p ∂p T daß αp ∂p . =− ∂T V κT Also ist αp ∂E = −p − T ∂V T κT und schließlich Cp − C V = T V 21 αp2 . κT van der Waals Gleichung Betrachten wir ein klassisches Gas von wechselwirkenden Teilchen mit einem harten Kern mit Radius a/2 und einer sehr langreichweitigen anziehenden Wechselwirkung −W (|xi − xj |) und einem harten Kern bei kurzen Abständen a/2. Dichte des Gases und Reichweite der Wechselwirkung seien so groß, daß immer viele Teilchen untereinander wechselwirken. Die Zustandsumme ist Z(T, V, N ) = 1 N !(2πh̄)3N mit V (|xi − xj |) = V 0 Z d3N pd3N x e ∞ −β X p2 i +1 2m 2 i X i,j |xi − xj | ≤ a V (|xi −xj 1) . −W (|xi − xj |) |xi − xj | > a a r Form des Wechselwirkungspotentials in der Herleitung der van der Waals Gleichung 58 Durch Ausführen der Impulsintegrale reduziert sich das Zustandsintegral auf 1 1 Z(T, V, N ) = N ! λ3N T Z d 3N xe − β2 X i,j V (|xi −xj |) mit der thermischen deBroglie Wellenlänge λT = 2πh̄2 mkB T !1/2 . Nun folgen eine Reihe von Näherungen, die qualitativer Natur sind. Ziel ist eine Zustandsgleichung herzuleiten, die qualitativ Vielteilchensysteme im ganzen Bereich zwischen dem idealen Gas, für geringe Dichte und hohe Temperaturen und Flüssigkeiten, für hohe Dichte und tiefe Temperaturen beschreibt. Wir führen dazu eine Zelleneinteilung des Gasvolumens in unterscheidbare Zellen mit Volumen ∆ durch, so daß stets viele Teilchen Nα in jeder Zelle α sind. Innerhalb jeder Zelle vernachlässigen wir die langreichweitige anziehende Wechselwirkung. Jede Zelle trägt mit einem Faktor γ(Nα ) = (∆ − Nα δ)Nα R zum Integral dq1 . . . dq3N bei, wobei δ das Volumen 4πa3 /3 des harten Kerns ist. Außerdem Q gibt N !/ α Nα ! verschiedene Arten N ununterscheidbare Teilchen auf unterscheidbare Zellen zu verteilen, so daß in jeder Zelle Nα Teilchen sind. Die Ununterscheidbarkeit der Teilchen wird durch Division mit N ! schon berücksichtigt. Zwischen den Zellen herrscht dann die P P anziehende Wechselwirkung −Wαα0 Nα Nα0 . Wir erhalten (mit 0 . . . = δN,P Nα . . .) α Z(T, V, N ) = 0 X 1 1 N! Q 3N N ! (λT ) {Nα } α Nα0 Y α ! β γ(Nα ) e 2 P αα0 Wαα0 Nα Nα! woraus mit Stirlings Formel wird Z(T, V, N ) = mit φ({Nα }) = X α ( 0 1 X eφ({Nα }) 3N λT {Nα } ∆ − Nα δ βX Nα ln + Nα + Wαα0 Nα Nα0 Nα 2 α0 ) . Die Summen über Nα werden vom großen Term dominiert, wenn die Nα alle groß sind. ExP trema von φ unter der Nebenbedingung α Nα = N erfüllen mit dem Lagrange-Parameter χ X ∂ (φ({Nα }) − χ N α0 ) = 0 ∂Nα 0 α oder ln X ∆ − Nα δ Nα δ − +β Wαα0 Nα0 = χ . Nα ∆ − Nα δ α0 Eine räumlich homogene Lösung, welche die Nebenbedingung erfüllt, ist natürlich Nα = N ∆/V , χ = ln V − Nδ Nδ N − + β W0 N V − Nδ V 59 mit W0 = X Wαα0 ∆ = α0 Z d3 rw(r) . Die freie Energie im thermodynamischen Limes ist mit n = N/V = 1/v ln Z(β, V, N ) = −kB T lim φmax /N + 3kB T ln λT (T ) (21.1) N,V →∞ N,V →∞ N ) ( β 1 − nδ = −kB T ln + 1 + nW0 + 3kB T ln λT (T ) . (21.2) n 2 f (n, T ) = −kB T lim Die Zustandsgleichung ergibt sich aus ∂f (n) ∂F =− p=− ∂V T,N ∂(1/n) T = 1 nkB T − n2 W 0 . (1 − nδ) 2 Diese Zustandsgleichung läßt sich umschreiben in die Form ! aN 2 p + 2 (V − N b) = N kB T V mit a = W0 /2, b = δ und ist als van der Waalsche Zustandsgleichung bekannt. Die hier gegebene Ableitung stammt von L.S. Ornstein, Doktorarbeit, Leiden 1908. Die Isothermen im (p, V )-Diagramm zeigt die nächste Figur 0.14 0.12 0.1 kritischer Punkt 0.08 2 pb /a Isotherme T/Tc =.85 0.06 0.04 B 0.02 C D A 0 2 4 6 8 10 v/b Isothermen des van der Waals Gases zwischen T /T c = 0.8 und 1.15 Die niedrigste eingezeichnete Isotherme (für T = 0.8Tc ) ist teilweise unphysikalisch, da negative Drucke auftreten, die in der Figur abgeschnitten wurden. Für T < Tc = (8/27)(a/kB b) haben die Isothermen einen Teil mit (∂p/∂v)T > 0, wo also bei Reduzierung des Volumens 60 der Druck abnimmt, was rein intuitiv auf eine Instabilität hinweist! Unsere räumlich homogene Lösung ist allerdings nur dann korrekt, wenn sie auch wirklich dem absoluten Maximum von φ (d.h. dem absoluten Minimum) entspricht. Das kann nur dann der Fall sein, wenn wenigstens ein lokales Maximum von φ vorliegt, d.h. wenn ∂ 2 φmax /V <0 ∂n2 ist, was äquivalent ist zu ∂p(T, n) ∂p(T, v) 2 ∂ 2 nf (n, T ) = =− v 0<n 2 ∂n ∂n ∂v max d.h. also zu (∂p/∂v)T < 0. Doch reicht diese Bedingung für ein globales Maximum von φ noch nicht aus. Denn im Bereich T < Tc gibt es auch bei gleichem Druck inhomogene Lösungen, wo zwei homogene Lösungen aus dem lokal stabilen Bereich räumlich koexistieren. Eine ausführliche Diskussion im Rahmen der hier betrachteten Herleitung gibt N.G. van Kampen, Phys. Rev. 135A, 362 (1964). Hier geben wir uns mit einer vereinfachten (aber allgemeiner anwendbaren) Betrachtung zufrieden.Tragen wir zunächst unser bisheriges Ergebnis für f (N/V, T ) als Funktion von v = V /N für festes T < Tc auf. Wendepunkte -0.7 A B -0.8 Fb / Na -0.9 -1 2 4 6 8 v/b 10 12 14 16 Freie Energie F/N des van der Waals Gases für T /T c = 0.85 Aus diesem Diagramm und dem Diagramm der Isothermen p = −∂F/∂V lesen wir ab, daß F (V ) zwei Wendepunkte hat, welche den Punkten A und B entsprechen, und eine stark negative Steigung für V → N b und Steigung 0 für V → ∞. Dabei fällt F (V ) für alle V > N b monoton mit wachsendem V , da p = −∂F/∂V > 0. Damit stets Stabilität gewahrt ist, ∂p/∂V < 0, sollte ∂p/∂V = −∂ 2 F/∂V 2 < 0 überall gelten, d.h. F sollte eine nach unten konvexe Funktion sein. Wenn wir 2 koexistierende Lösungen (“Phasen“) im stabilen Bereich einführen, die nach dem gerade festgestellten 2 verschiedenen Punkten auf dem nach unten konvexen Teil der F -Kurve entsprechen müssen, also dem Bereich außerhalb des Intervalls (A, B), so wird die F -Kurve in dem Bereich zwischen diesen Punkten durch die gerade Verbindungslinie zwischen beiden Punkten ersetzt, da sich in diesem Bereich das Volumen 61 und die freie Energie ändern, indem Teilchen von einer Phase in die anderen übergehen und es gilt N1 N2 V = + , F = f 1 N1 + f 2 N2 , N = N 1 + N 2 . n1 n2 Hierbei beziehen sich die Indizes 1, 2 auf die koexistierende Phasen. Elimination von N1 , N2 aus diesen Gleichungen liefert die behauptete lineare Funktion für F im Koexistenzbereich F = n1 f1 (n2 V − N ) − n2 f2 (n1 V − N ) . n2 − n 1 Damit nun längs der gesamten F -Kurve Stabilität herrscht (und in unserer Rechnung φ wirklich maximiert wird) müssen, die beiden koexistierenden Phasen so eingeführt werden, daß die gesamte F -Kurve nach unten konvex wird. Die entsprechende Konstruktion ist eindeutig und heißt “Bildung der konvexen Hülle“ der Kurve. Das Ergebnis ist -0.7 konvexe Hülle C A B -0.8 Fb/Na D -0.9 -1 2 4 6 8 10 12 14 16 v/b Freie Energie F/N des van der Waals Gases für T /T c = 0.85 Per Konstruktion liegt nun F im 2-Phasengebiet unter dem F der 1-Phasenzustände, d.h. die Koexistenz der beiden Phasen bildet das wahre Minimum von F . Man macht sich leicht klar, daß die beschriebene Konstruktion im p−V -Diagramm der bekannten Maxwell-Konstruktion R äquivalent ist, denn CD pdV über die 1-Phasen-Zustände und die Koexistenzlinie muß gleich sein, damit in C und D die konvexe Hülle die ursprüngliche F -Kurve berührt. C und D sind die koexistierenden Phasen, A und B sind die “Spinodalpunkte“ bis zu denen man höchstens Flüssigkeiten überhitzen (B) und Gase unterkühlen kann (A), bevor endgültig auch lokal Instabilität (∂p/∂V |T > 0) einsetzt. 62 22 Hauptsätze der Thermodynamik Wir sind nun in der Lage, die Hauptsätze der Thermodynamik auf statistischer Grundlage zu formulieren: 0. Hauptsatz Sind zwei Systeme mit einem dritten im thermischen Gleichgewicht, so sind sie auch untereinander im thermischen Gleichgewicht. Dieser Satz wurde im “Temperatur“ Abschnitt aus der statistischen Gleichgewichtsbedingung beim thermischen Kontakt zweier Systeme bewiesen: Aus P P ∂ ln 1 ∂ ln 3 = ∂E1 ∂E3 P P ∂ ln 3 ∂ ln 2 = ∂E2 ∂E3 folgt trivialer Weise P ∂ ln ∂E1 1 P ∂ ln 2 = . ∂E2 1. Hauptsatz (Energiesatz) Jeder Systemzustand besitzt eine mittlere Energie E, welche in abgeschlossenen Systemen gleich der Gesamtenergie ist und erhalten bleibt. In nicht abgeschlossenen Systemen ändert sich die mittlere Energie sowohl durch Arbeit, die am System geleistet (positiv gezählt) oder vom System verrichtet (negativ gezählt) wird, als auch durch Energieübertrag (positiv, falls dem System zugeführt) bei thermischem Kontakt. Der Energieübertrag bei thermischem Kontakt heißt die übertragene Wärmemenge. Differentiell dhEi = d− A + d− Q . Hierbei drückt die Notation d− aus, daß die betreffenden Größen zwar differentiell klein aber wegabhängig sind, d.h. nicht die Differentiale von Funktionen. Der erste Hauptsatz drückt nur den Energiesatz aus. Arbeit wird geleistet, wenn Parameter λ, die in die Hamiltonfunktion eingehen, wie z.B. das Volumen V (Volumenarbeit), Teilchenzahlen Ni (chemische Arbeit) oder Magnetfeld H (magnetische Arbeit) geändert werden, so daß sich die Hamiltonfunktion ändert d− A = Z dVΓ (dH(q, p, λ))%(q, p, λ) = * ∂H ∂λ + dλ . Wärme wird übertragen, wenn sich die Verteilungsfunktion ändert, was auch zu einer Änderung der mittleren Energie führen kann − dQ= Z dVΓ H(q, p, λ)d%(q, p, λ) . Beide Größen zusammen liefern die Änderung der mittleren Energie, dhEi = d Z dVΓ H(q, p)%(q, p) . 63 Im thermischen Gleichgewicht zwischen zwei Systemen ist der Wärmeübetrag reversibel, da Energie bei Schwankungen zwischen beiden Systemen hin- und herfließt. In diesem Fall ist, ohne Arbeitsleistung, wie wir sahen dhEi = d− Q = d− Qrev = T dS mit der Boltzmannschen Entropie S = kB ln P Q (E) . Kontrollieren wir, daß die statistische Definition des Wärmeübetrags R d− Q = dVΓ H(q, p, λ)d%(q, p, λ) sich im reversiblen Fall auf T dS reduziert: Ändern wir durch reversiblen Wärmeübertrag die Temperatur um dT , so ändert sich die kanonische Verteilung nicht in ihrer Form, sondern nur durch Verschiebung der Temperatur um dT , also d%(q, p)rev 1 ∂ ln Z = H+ 2 kB T ∂β ! e−βH dT . Z Mit ∂ ln Z/∂β = −hEi ergibt sich daraus − d Qrev = Z 1 dT (hE 2 i − hEi2 ) = CV dT kB T 2 ∂E = dE|V =const = dS = T dS , ∂S V dVΓ Hd%(q, p)rev = womit die Kontrolle durchgeführt ist. Wird zusätzlich am System reversibel quasistatisch Arbeit verrichtet, wird, wie wir sahen, die Entropie dadurch nicht zusätzlich verändert, und entsprechend dem ersten Hauptsatz gilt dhEi = T dS + d− Arev Liegt kein Gleichgewicht vor, und auch bei nicht quasistatischer Arbeitsleistung, nimmt S = kB ln ΣQ (E) durch Vergrößerung des erreichbaren Phasenraumvolumens zusätzlich irreversibel zu, d.h. dS = 1 d− Qrev d− Q dhEi − d− Arev = > T T T oder kurz d− Qrev > d− Q . Entsprechend gilt d− Arev < d− A, da d− Arev + d− Qrev = dE = d− A + d− Q. Diese statistisch begründeten Aussagen machen zusammen den 2. Hauptsatz aus, der den zentralen Kern der Thermodynamik bildet und lautet: 2. Hauptsatz Jedem Systemzustand ist eine Funktion zugeordnet, die Entropie S, mit den Eigenschaften (a) Bei reversiblem Wärmeaustausch ist dS = d− Qrev /T 64 (b) Bei beliebigem Wärmeaustausch ist dS ≥ d− Q/T und nimmt insbesondere in abgeschlossenen Systemen (d− Q = 0) zu oder bleibt gleich. Schließlich gibt es eine letzte allgemeine Eigenschaft der Entropie, die zusammengefaßt wird im sogenannten 3. Hauptsatz Für T → 0 strebt die Entropie gegen eine von Details des Systems unabhängige Konstante s0 : S(T ) = s0 . lim lim T →0 N →0 N Diese Aussage folgt ebenfalls unmittelbar aus der statistischen Definition der Entropie. Dazu müssen wir bedenken, daß der Grenzfall T → 0 der gleiche Grenzfall ist, in dem die Energie E des Systems gegen die Energie E0 des Grundzustands strebt T → 0 ⇐⇒ E → E0 . Ist der Grundzustand nicht entartet, so ist s0 = s(E0 ) = +kB ln 1 = 0 . Nun kann allerdings in Vielteilchensystemen der Grundzustand durchaus entartet sein (mit Entartungsgrad g(E0 )) und s0 = kB ln g(E0 ) . Doch ist der Entartungsgrad in der Regel keine exponentiell mit der Teichenzahl wachsende Funktion, sondern typisch wäre g(E0 ) < KN α mit von N unabhängigen Exponenten α und Konstanten K, die vom System abhängen. Also ist S 1 < kB lim (α ln N + ln K) = 0 . T →0 N →0 N N →∞ N 0 < s0 = lim lim Daher gilt auch in diesem Fall s0 = 0. Schließlich kann noch der Fall eintreten, wo das System Freiheitsgrade besitzt, die so schwach an andere Freiheitsgrade gekoppelt sind, daß diese selbst bei den kleinsten erreichten Temperaturen noch nicht ordnen und daher eine endliche Entropie liefern, die im thermodynamischen Limes proportional zur Teilchenzahl ist. Ein Beispiel sind die Spins von Atomkernen, welche z.B. in einem Festkörper noch völlig ungeordnet sein können, wenn schon alle anderen Freiheitsgrade (z.B. die Position der Atome im Kristallgitter, die Richtung der Elektronenspins) geordnet sind. Die von solchen Freiheitsgraden herrührende Restentropie s0 6= 0 ist dann aber universell für das System, da sie von allen anderen Freiheitsgraden, die geordnet sind, nicht mehr abhängt. Außerdem ist anzunehmen, daß auch diese Restentropie bei noch weiterer Abkühlung ebenfalls verschwindet. 65 23 Thermodynamische Prozesse In diesem Abschnitt betrachten wir mit Hilfe der Hauptsätze der Thermodynamik und einiger Zustandsgleichungen für die verwendeten Materialien einige charakteristische thermodynamische Prozesse. Einige davon (Joule-Thomson Prozeß, Carnot-Prozeß, adiabatische Entmagnetisierung) sind für Kühlverfahren bzw. deren Umkehrung-Wärmepumpen (z.B. bei der Schwimmbadheizung) von praktischem Interesse. 23.1 Joulsches Experiment der freien Expansion eines Gases Wir betrachten ein Gas, das durch eine Trennwand auf einen Teil eines Behälters eingeschränkt sei. Der gesamte Behälter sei gegenüber der Außenwelt isoliert. Wir analysieren nun die Zustandsänderung des Gases, die eingetreten ist, falls es nach Öffnen eines Ventils in den Rest des Behälters irreversibel ausgeströmt ist. (Gay-Lussac 1807, Joule 1843). Der betrachtete Prozeß ist weder quasistatisch noch reversibel. Da der Behälter thermisch isoliert ist, gilt ∆Q = 0, also ist ∆S ≥ ∆Q = 0 positiv. Da das System abgeschlossen ist, gilt für die Energieänderung zwischen Anfangs- und Endzustand ∆E = 0. Betrachten wir zunächst nur eine differentielle Zustandsänderung der beschriebenen Art, d.h. das zusätzliche Volumen, in welches das Gas ausströmen kann, sei differentiell klein. Dann gilt für die Temperaturänderung zwischen Anfangs- und Endzustand ∂T dV . dT = ∂V E,N Der Proportionalitätsfaktor soll durch die Zustandsgleichung des Gases ausgedrückt werden. Aus ∂E ∂E dE = dT + dV = 0 (abgeschlossenes System) ∂T V ∂V T gewinnen wir die Aussage ∂T 1 ∂E =− . ∂V E,N CV ∂V T,N Ferner gilt wegen dE = T dS − pdV ∂E ∂S =T −p. ∂V T,N ∂V T,N Schließlich nutzen wir aus, daß ∂S/∂V |T,N proportional zu einer gemischten 2. Ableitung der freien Energie F (T, V, N ) ist ∂ 2 F ∂2F ∂S = − =− ∂V T,N ∂V ∂T N ∂T ∂V N ∂p = . ∂T V,N Thermodynamische Relationen dieses Typs heißen “Maxwell Relationen”. Listen wir noch einige auf: ∂ 2 F ∂2F = ∂V ∂T N ∂T ∂V : N ∂S ∂p = ∂V T,N ∂T V,N 66 ∂2E ∂S∂V ∂2E ∂T ∂V N N ∂ 2 E ∂p ∂T = = :− ∂V ∂S N ∂S V,N ∂V S,N ∂ 2 E : = ∂V ∂T N ∂S ∂2S +T ∂V T,N ∂T ∂V 2 ∂ S ∂T ∂V bzw. T N V,N ! = = ∂p ∂CV − = ∂T V,N ∂V ∂CV ∂V = N ∂ p ∂T 2 2 bzw. T ∂CV ∂V T,N T,N T,N usw. Wir erhalten also für den Ausströmungsversuch ins Vakuum ∂T 1 = ∂V E,N CV ∂p p−T ∂T V,N −T 2 ∂ CV ∂T p T . V,N Für ein ideales Gas ist p/T = N kB V unabhängig von T bei festem N, V . Daher liefert der Ausströmungsversuch keine Temperaturänderung für ein ideales Gas, im Einklang damit, daß E = N cv T gilt, also T = E/N cv unabhängig von V für festes E. Physikalisch rührt dies von der fehlenden Wechselwirkung zwischen den Gasatomen her, die ihre Energie unabhängig von ihrem mittleren Abstand macht. Die Entropie des idealen Gases nimmt bei diesem Prozeß wie schon früher erwähnt stark zu, nämlich um dS = (∂S/∂V )E dV = Tp dV = NVkB dV . Für ein van der Waals Gas ist p N kB aN 2 = − T (V − N b) V 2 T also und ∂ ∂T p T = V,N aN 2 V 2T 2 ∂T aN 2 =− 2 . ∂V E,N V CV Die Volumenabhängigkeit der spezifischen Wärme CV des van der Waals Gases (oberhalb von dessen kritischen Punkt) gewinnen wir ebenfalls aus seiner Zustandsgleichung als ∂CV ∂V =T T,N ∂2p = 0. ∂T 2 d.h. die Wärmekapazität des van der Waals Gases ist wie beim idealen Gas von seiner Teilchenzahl, nicht aber von seinem Volumen abhängig. Für den Ausströmungsversuch in ein endliches Volumen ∆V können wir die Temperaturänderung durch Integration über V mit CV = const bestimmen zu ∆T = −aN 2 ∆V . CV V (V + ∆V ) 67 Bei einem wirklichen Versuch ist die Temperaturänderung geringer wegen der endlichen Wärmekapazität CB des Behälters. Die gesamte Energieänderung ist dann dE = ! ∂E ∂E + CB dT + dV = 0 , ∂T V ∂V T d.h. in den bisherigen Beziehungen ist zu ersetzen CV → C V + C B was ∆T verringern wird. 23.2 Joule-Thomson-Prozeß Die kontrollierte Entspannung eines thermisch isolierten Gases von einem Druck p1 auf einen kleineren Druck p2 durch eine Drossel, d.h. eine poröse Trennwand, heißt Drosselpropzeß, oder Joule-Thomson-Prozeß. Schematisch läuft der Prozeß wie folgt ab Drossel p1, T1 p2, T2 Joule-Thomson Prozeß Auch dieser Prozeß ist weder quasistatisch, da er im allgemeinen bei endlicher Druckdifferenz abläuft, noch reversibel. Die Arbeit und damit die Energie, welche pro Mol des umgesetzten Gases dem System zugeführt wird, ist ∆a = +p1 v1 − p2 v2 = e2 − e1 , wobei die molaren extensiven Größen durch kleine Buchstaben symbolisiert sind, und das Volumen des Gases links um |v1 | abnimmt, rechts um |v2 | zunimmt. Also ist bei dem Prozeß die Zustandsfunktion H = E + pV pro umgesetztes Mol konstant. H heißt Enthalpie. Es ist eine Legendre-transformierte Energie mit dem Differential dH = dE + pdV + V dp = T dS − pdV + pdV + V dp = T dS + V dp . Die natürlichen Variablen von H sind daher S, p und N . Die Temperaturänderung beim Joule-Thomson-Prozeß bei differentiellem Druckunterschied p1 − p2 = −dp > 0 bestimmt sich aus ∂H ∂H dH = dT + dp = 0 . ∂T p ∂p T Wegen dH = T dS + V dp ist ∂S ∂H =T = Cp . ∂T p ∂T p 68 Außerdem ist (∂H/∂p)T = T (∂S/∂p)T + V = −T (∂V /∂T )p + V , wobei die Maxwellsche Relation (∂S/∂p)T = −(∂V /∂T )p benutzt wurde. Zusammengenommen erhalten wir T 2 ∂V /T ∂T = . ∂p H Cp ∂T p Für ein ideales Gas gilt also ∂T =0, ∂p H d.h. die Temperatur eines idealen Gases ändert sich beim Drosselprozeß nicht. Dagegen nimmt die Entropie auch bei diesem Prozeß zu um V |dp| ∂S dp = − dp = N kB . dS = ∂p H T p Daran erkennen wir die Irreversibilität des Prozesses. Denn d− Q = 0 ist ja erfüllt, und wäre der Prozeß reversibel, dann wäre 0 = d− Q = d− Qrev = T dS. Für ein van der Waals Gas findet man mit der Annahme CV = (3/2)N kB ∂T 1 2a = ∂p H kB kB T V − Nb V !2 5 −3a − b / − 2 kB T V V − Nb V !2 . Für kleine Dichten N/V kB T /a, N/V b−1 vereinfacht sich dies auf (∂T /∂p)H ' (4a/kB T − 2b)/5kB . Für kleine Temperaturen kB T < b/2a ist (∂T /∂p)H > 0 und der Drosselversuch führt zur Kühlung. Allerdings wechselt der Koeffizient bei hohen Temperaturen b 2 T > Tinv = (2a/kB b), genauer kB Tinv = 2a ( V −N ) , oder mit nochmaligem Gebrauch der b V van der Waals Gleichung 2 p= b s 2akB Tinv 3 kB Tinv a − − 2, b 2 b b sein Vorzeichen, und beim Drosselversuch tritt Erwärmung ein. Der maximale Druck, bei dem Inversion eintritt wird, bei max kB Tinv = 8a 9b 2 erreicht und beträgt pmax inv = a/3b . Die Inversion des Joule-Thomson-Kühleffekts bei hohen Temperaturen wird wirklich bemax max max obachtet (für CO2 gemessen: Tinv = 1500K, Tinv |vdw = 911K; für H2 : Tinv = 202K max Tinv |vdw = 99K. Der Joule-Thomson-Prozeß wird zur technischen Verflüssigung von Gasen (nach Vorkühlung unter die Inversionstemperatur) verwendet. 23.3 Adiabatische Entspannung von Gasen Ein Gas wird in einem thermisch isolierten Behälter quasistatisch entspannt, wobei es reversibel Arbeit leistet. Bei diesem Prozeß ist die Entropie konstant da 0 = d− Q = d− Qrev = T dS und die Energie nimmt ab dE = −pdV . 69 Die Temperaturänderung ergibt sich aus ∂S ∂S dS = dT + dp = 0 (adiabatischer Prozeß) , ∂T p ∂p T also ∂T T ∂S T ∂V =− =+ . ∂p S Cp ∂p T Cp ∂T p,N Für ein ideales Gas liefert dies N kB T ∂T =+ ∂p S Cp p was integriert die Adiabatengleichungen ergibt: T = T0 p p0 ! N kB Cp , p p0 V = V0 ! N kB −1 Cp T = T0 1− NCkp B , die mit der aus der Zustandsgleichung folgenden Relation Cp − CV = N kB noch auf verschiedene andere Formen gebracht werden können. Für ein van der Waals Gas oberhalb der kritischen Temperatur ist (∂V /∂T )p,N > 0 und adiabatische Entspannung führt zur Abkühlung. 23.4 Adiabatische Entmagnetisierung Ein paramagnetisches Salz wird im äußeren Magnetfeld bei fester Temperatur T0 magnetisiert, dann thermisch isoliert und quasistatisch entmagnetisiert, indem das äußere Magnetfeld langsam bis auf 0 zurückgefahren wird. Bei diesem letzteren Prozeß ist wiederum dS = 0 und es gilt ∂S ∂S dS = dT + dH = 0 . ∂T H ∂H T Der Prozeß und die Berechnung des Temperaturkoeffizienten (∂T /∂H)S sind weitgehend analog zur adiabatischen Entspannung eines Gases. Wir erhalten analog zu dort mit dE = T dS − hM idH ∂T T ∂S T ∂hM i =− =− . ∂H S CH ∂H T CH ∂T H,N Für ein paramagnetisches Salz dessen Magnetisierung hM i dem Curieschen Gesetz genügt hM i = finden wir wobei nach (18.1) ND H , T ∂T DH >0, =+ ∂H S cH (T, H)T cH (T, H) = cV (T, 0) + 70 N DH 2 . T2 Adiabatische Entmagnetisierung von elektronischem Paramagnetismus kann als Vorkühlmethode verwendet werden, um dann im 2. Schritt ein vorgekühltes System mit Kernspinparamagnetismus ebenfalls adiabatisch zu entmagnetisieren. Ein qualitatives mikroskopisches quantenmechanisches Bild der beiden Prozesse isotherme Magnetisierung – adiabatische Entmagnetisierung, sieht wie folgt aus: Ein paramagnetisches Salz von (praktisch wechselwirkungsfreien) Atomen z.B. mit Spin J = 3/2 hat bei hoher Temperatur T0 und kleinem Magnetfeld H0 vier praktisch gleich besetzte Energieniveaus pro Atom (a) . e (a) e (b) S = const. T = const. P(h) T, H (c) e P(h) T, H’>H P(h) T’<T, H Kühlung durch isotherme Magnetisierung und adiabatische Entmagnetisierung Bei isothermer Magnetisierung steigen die Abstände der Niveaus und es bildet sich bei gleicher Temperatur eine Boltzmann-Verteilung mit schwächerer Besetzung der höheren Niveaus aus (b). Adiabatische Entmagnetisierung bedeutet Reduzierung von H ohne Änderung der Besetzung der Niveaus (c). Es resultiert eine Boltzmann-Verteilung mit T1 < T0 . 23.5 Thermodynamische Kreisprozesse Thermodynamische Kreisprozesse sind Sequenzen von Zustandsänderungen, bei denen der Endzustand des Systens mit seinem Anfangszustand übereinstimmt. Bei einem thermodynamischen Kreisprozeß gilt für alle Zustandsgrößen Z wie z.B. Energie E, Entropie S, Volumen V , Teilchenzahl N , Temperatur T , Druck p, freie Energie F , Enthalpie H, Magnetisierung M etc. daß I dZ = 0 , wobei das Integral der Änderungen der Zustandsgrößen über den durchlaufenen Kreisprozeß zu erstrecken ist. Zwei Kreisprozesse, die nicht existieren, sind gerade deshalb besonders wichtig: Das Perpetuum mobile 1. Art ist ein Kreisprozeß ohne Wärmeaustausch, d− Q = 0, H − H H der Arbeit leistet, − d A > 0. Das ist unmöglich, da für d− Q = 0 gilt d− A = d− E = 0. Ein Perpetuum mobile H2. Art ist ein Kreisprozeß, der ein Wärmereservoir abkühlt und Arbeit H − H − − leistet, also 0 < −H d A = (d HQ − dE) = dHQ. Er ist unmöglich, da nach dem 2. HauptH satz 0 = dS > d− Q/T = T1 d− Q, woraus d− Q < 0 folgt. Ein spezieller auch technisch wichtiger Kreisprozeß ist der bekannte Carnot-Prozeß, mit dessen Hilfe durch allmähliche 71 Abkühlung eines heißen Wärmereservoirs und Erwärmung eines kühleren Wärmereservoirs von einem komprimierbaren und expandierbaren System Arbeit geleistet werden kann. Ein Zyklus dieses Prozesses besteht aus 4 Phasen: Zuerst wird das System bei der kühleren Temperatur T1 unter Zufuhr von Arbeit ∆A1 isotherm komprimiert, sodann thermisch isoliert und unter weiterer Zufuhr von Arbeit ∆A2 adiabatisch komprimiert solange bis es sich auf die Temperatur T2 des heißeren Wärmereservoirs erwärmt hat, dann wird es im thermischen Kontakt diesem zweiten Wärmebad bei der Temperatur T2 isotherm entspannt, wobei es die Arbeit −∆A3 leistet und schließlich wieder thermisch isoliert und unter weiterer Arbeitsleistung −∆A4 adiabatisch auf sein ursprüngliches Volumen und seine ursprüngliche Temperatur T1 expandiert. Die gesamte geleistete Arbeit ist −∆A = − I d− A = 4 X ∆Ai . i=1 Von technischem Interesse ist der Wirkungsgrad η dieses Prozesses, der definiert ist als das Verhältnis insgesamt der geleisteten Arbeit −∆A zur Wärmeenergie ∆Q2 , die bei der höheren Temperatur T2 (während der isothermen Expansionsphase) aufgenommen wurde. Da während der isothermen Kompression eine Wärmemenge −∆Q1 an das kühlere Wärmereservoir abgegeben wird, kann −∆A nicht so groß werden wie ∆Q2 , sondern es gilt, weil es sich um einen Kreisprozeß handelt, ∆E = I dE = ∆A + ∆Q1 + ∆Q2 = 0 also η= −∆A ∆Q1 = 1+ . ∆Q2 ∆Q2 Die Existenz der Entropie als Zustandsgröße erlaubt es, eine universelle obere Grenze für η abzuleiten, die als Carnotscher Wirkungsgrad ηc bekannt ist. Sind nämlich sämtliche Zustandsänderungen quasistatisch und reversibel, so gilt während der adiabatischen Phasen des Prozesses 0 = d− Q = d− Qrev = T dS und während der isothermen Phasen des Prozesses ∆Q1,2 = T1,2 ∆S1,2 und, wegen ∆S = 0 für den Kreispropzeß, ∆S1 = −∆S2 ∆Q1 T1 =− ∆Q2 T2 also T1 T2 unabhängig von der Arbeitssubstanz! Ein realer Prozeß läuft natürlich nicht quasistatisch und reversibel. In den wärmeisolierten Phasen des Prozesses gilt dann ηc = 1 − 0 = d− Q < T dSis 72 und während der isothermen Phasen ∆Q1,2 < T1,2 ∆S1,2 . Aus der Bedingung ∆Sis + ∆S1 + ∆S2 = 0 mit der Entropiezunahme ∆Sis > 0 während der wärmeisolierten Phase, folgt nun ∆Q1 ∆Q2 + < ∆S1 + ∆S2 = −∆Sis < 0 T1 T2 und daher, wegen ∆Q2 > 0, T1 > 0 ∆Q1 ∆Q2 + < 0, T1 T2 also η =1+ ∆Q1 T1 < ∆Q2 T2 ∆Q1 T1 <1− = ηc . ∆Q2 T2 Bekanntlich kann man den Carnotschen Wirkungsgrad für ein ideales Gas als Arbeitssubstanz auch ohne Einführung der Entropie explizit leicht ausrechnen. Die Existenz der Entropie als zusätzliche Zustandsgröße folgt dann rein phänomenologisch aus der phänomenologischen Formulierung des 2. Hauptsatzes als Unmöglichkeit eines perpetuum mobiles 2. Art: es gibt keine periodisch arbeitende Maschine (Kreisprozeß), die nichts anderes bewirkt, als die Abkühlung eines Wärmereservoirs und das Leisten von Arbeit. Denn nach diesem Satz muß zum einen jeder reversible Kreisprozeß zwischen T1 und T2 genau den Carnotschen Wirkungsgrad haben, andernfalls könnte man ein perpetuum mobile 2. Art bauen, indem man den besseren Prozeß Arbeit leisten läßt und mit dem umgekehrt geschalteten Carnot-Prozeß die Wärme −∆Q1 ins heißere Wärmebad zurückpumpt (d.h. man benutzt in diesem Fall den Carnot-Prozeß zur Kühlung des kühleren Reservoirs (Kühlschrank!) und zur Heizung des wärmeren Reservoirs (Schwimmbadheizung mit Wärmepumpen)). Zum andern kann man jeden Kreisprozeß in infinitesimale Carnot-Prozesse zerlegen oder jedenfalls zerlegt denken. p Adiabaten Isothermen V Beliebiger Kreisprozeß überdeckt von Carnot-Prozessen 73 H Für jeden kleinen Carnot-Prozeß gilt aber dS = 0. Nimmt man alle Carnot-Prozesse zusammen, so heben sich die inneren Beiträge weg und es bleibt nur noch das Integral über dem ursprünglichen beliebigen Kreisprozeß, für den also gelten muß I dS = 0 mit einer Zustandsfunktion S, deren Differential definiert ist durch d− Qrev . T Diese Beziehung ist fundamental, sie ist aber mit viel Verstand zu benutzen. Sie besagt nicht, daß dS nur für reversible Zustandsänderungen, an deren Anfang und Ende thermodynamische Gleichgewichtszustände liegen, definiert ist. Tatsächlich is dS für beliebige Zustandsänderungen definiert. Sie besagt stattdessen: Um dS für eine beliebige irreversible Zustandsänderung mit beliebigem d− Q zu bestimmen, führe man zum Vergleich eine Zustandsänderung mit dem gleichen Ergebnis auch reversibel durch und messe (oder berechne) die dabei aufgenommene Wärmemenge d− Qrev . Tatsächlich ist d− Qrev > d− Q. Dann ist dS = d− Qrev /T , also dS > d− Q/T . dS = 24 Chemisches Potential und Gibbssche freie Enthalpie Auch die Teilchenzahl N (oder Ni in mehrkomponentigen Systemen) ist ein Parameter, der von außen änderbar ist. Dies geschieht, wenn zwei Systeme miteinander Teilchen derselben Sorte austauschen können, z.B. durch eine Membran. Die Größe ∂E µi = ∂Ni S,V heißt chemisches Potential der Teilchensorte i. Da die Teilchenzahlen Ni Beispiele für die ∂S Parameter λ des §20 sind, gilt insbesondere (wegen 0 = dS = dE dN ) + ∂N T E,V µi = −T ∂S ∂Ni = E,V ∂F ∂Ni T,V = −kB T ∂ ln Z ∂Ni . T,V Damit kennen wir nun auch die Ableitung der Entropie nach ihren letzten natürlichen Variablen Ni und es gilt die fundamentale Relation für dS dS = 1 p 1X dE − dV − µi dNi . T T T i Die Entropie ist extensiv, d.h. eine homogene Funktion ersten Grades ihrer natürlichen Variablen E, V, Ni . Es gilt daher auch die Eulersche Gleichung für homogene Funktionen ersten Grades X ∂S ∂S ∂S E+ V + Ni S= ∂E ∂V i ∂Ni X µi E p = + V − Ni . T T i T 74 Insbesondere für einkomponentige Systeme, wo nur ein µ auftritt, können wir nach µ auflösen µ= E pV TS + − . N N N (24.1) Die Funktion G = E + pV − T S = F + pV heißt Gibbssche freie Enthalpie (im Unterschied zur Enthalpie H = E + pV ). Sie entsteht durch eine zweifache Legendre-transformation aus E(S, V, N ), welche ihre natürlichen Variablen T , p einführt, neben der Variablen N . Doch ist die Abhängigkeit von N trivial, da G extensiv, N extensiv und T, p intensiv sind. Also ist notwendig G = N f (p, T ) für einkomponentige Systeme und G = µ(T, p) . µ= N Speziell für das ideale einatomige Gas erhalten wir 3kB 3 5 ln µ = kB T (1 − ln kB T ) + kB T ln p − T s00 + 2 2 2 ! . Im Falle des Vorliegens von mehreren Komponenten Ni gilt mit G = E + pV − T S für die Gibbssche freie Enthalpie X G= µi N i . i Die Bildung des Differentials von G dG = dE + pdV + V dp − T dS − SdT = liefert mit der Relation T dS = dE + pdV − X X (µi dNi + Ni dµi ) i µi dNi i das Differential von G(T, p, N ) dG = −SdT + V dp + X µi dNi i sowie die Gibbs-Duhem Relation 0 = SdT − V dp + X Ni dµi . i Insbesondere für einkomponentige Systeme liefert die Gibbs-Duhem Relation S ∂µ =− ∂T p N , ∂µ V . = ∂p T N Als kleine Anwendung berechnen wir die Entropie eines einatomigen idealen Gases als Funktion von Druck und Temperatur 5 ∂µ = N kB ln T − kB N ln p + N s0 S = −N ∂T p 2 75 mit der sog. Entropiekonstanten für ein einatomiges Gas 5 3 s0 = s00 + kB ln kB + kB ln 3/2 2 2 5/2 (ekB ) (2πm)3/2 = kB ln . (2πh̄)3 ∂S mit unserem früheren Für ein Gemisch idealer Gase liefert die Beziehung µi = −T ∂N i E,V Ergebnis für S X 3 E Ni V 0 Ni ln X S = kB N ln + ln + s0 + kB N 2 N Nk i k nach Einsetzen der mittleren Masse m = nach Ni Q j mj c j , c j = N j / P k Nk in s00 und Differentiation 5 Ni 3 ln E/N + s00i ) + kB T + kB T ln 2 2 N Ni . = µi0 (T, P ) + kB T ln N µi = −kB T (ln V /N + Die letzte Beziehung folgt nach Einsetzen der Zustandsgleichugen 3 E = N kB T 2 , V = N kB T /p und unter Verwendung der Bezeichnung µi0 (T, p) für das chemische Potential der reinen Gaskomponente i bei gleichem Druck und gleicher Temperatur. Interessant ist, daß die (temperaturunabhängige) Mischungsentropie pro Teilchen −kB ln Ni /N das chemische Potential jeder Komponente verändert, und zwar stets proportional zur Temperatur absenkt. 25 Gleichgewichtsbedingungen als Extrema von thermodynamischen Potentialen Betrachten wir den ersten Hauptsatz in einem p − V System dE = −pdV + d− Q und die allgemeine Formulierung des zweiten Hauptsatzes T dS > d− Q zusammen T dS > dE + pdV . (25.1) Dann sehen wir, daß in abgeschlossenen Systemen (V = const , E = const ) nur solche Prozesse ablaufen, bei denen die Entropie zunimmt, dS > 0. Insbesondere ist im thermodynamischen Gleichgewicht in solchen Systemen dann S = max (E, V = const ) . 76 Ist dagegen das System im thermischen Kontakt mit einem Wärmebad der Temperatur T , so ist T = const , V = const die relevante Nebenbedingung und die Ungleichung (25.1) kann in die Form d(E − T S) ≡ dF > 0 also F = min (T, V = const ) gebracht werden. Also nimmt die freie Energie in einem System mit T , V = const solange ab, bis das (absolute) Minimum von F zu gegebenem T , V erreicht ist, wo das System im Gleichgewicht ist. Ist schließlich das System im Temperatur- und Druckgleichgewicht mit der Umgebung, so ist p, T const. und (25.1) reduziert sich auf d(E + pV − T S) ≡ dG < 0 d.h. die Gibbssche freie Enthalpie ist im Gleichgewicht bei p, T = const minimal G = min 26 (p, T = const ) Gleichgewicht unter Energie- und Teilchenaustausch Die Gleichgewichtsbedingungen lauten in diesem Fall ∂S2 ∂S1 = ∂E1 V1 ,N1 ∂E2 V2 ,N2 und ∂S1 ∂S2 = , ∂N1 E1 ,V1 ∂N2 E2 ,V2 woraus T1 = T2 und µ1 = µ2 für alle Teilsysteme 1, 2, die am Austausch beteiligt sind, folgt. Eine Anwendung ist die Osmose, bei der 2 Teilsysteme A, B im Temperaturgleichgewicht durch eine Membran die Moleküle eines Lösungsmittels (1), z.B. H2 O, frei austauschen können, nicht aber die größeren Moleküle des gelösten Stoffes (2). Es gilt also im Gleichgewicht für das dynamische Potential des Lösungsmittels (A) (B) µ1 (T, p(A) ) = µ1 (T, p(B) ) , (26.1) während das chemische Potential des gelösten Stoffes in den beiden getrennten Teilen des Systems verschieden ist. Sei z.B. im Teilsystem (A) eine verdünnte Lösung vorhanden, für die das chemische Potential des Lösungsmittels nur durch den Mischungsterm vom chemischen Potential des reinen Lösungsmittels abweicht. (A) µ1 (T, p(A) , c1 ) ' µ10 (T, p(A) ) + kB T ln c1 . Sei weiter im Teilsystem (B) nur das reine Lösungsmittel vorhanden (B) µ1 (T, p(B) ) = µ10 (T, p(B) ) . 77 (26.2) Aus der Gleichgewichtsbedingung erhalten wir für c1 = 1 − c2 , c2 1 durch Taylorentwicklung nach den kleinen Größen p(A) − p(B) , c2 bis zum Glied erster Ordnung (p (A) −p (B) ∂µ10 ) (A) − kB T c2 = 0 . ∂p T Aus der Gibbs-Duhem Gleichung entnehmen wir ∂µ10 V (A) , = ∂p(A) T N1 woraus wir mit c2 = N2 /N für den osmotischen Druck pos = pA − pB = N2 kB T V (A) erhalten. Die gelösten Teilchen erzeugen also in einer Lösung einen zusätzlichen Druck, den osmotischen Druck, der speziell in einer stark verdünnten Lösung gerade gleich dem entsprechenden Druck eines idealen Gases aus den gelösten Teilchen bei gleicher Teilchendichte und Temperatur ist. Osmotische Druckdifferenzen sind besonders in biologischen Systemen allgegenwärtig. ----------------- Massendichte mn = n1 m1 + n2 m2 h = p / (mng) ------------------- A B c1 c1 = 1 c2 Semipermeable Membran (durchlässig für 1) Osmotischer Druck in einem System im Schwerefeld 27 Chemische Reaktionsgleichgewichte und Massenwirkungsgesetz Betrachten wir nun Umwandlungen von Atomen oder Molekülen in chemischen Reaktionen, z.B. − νA A − νB B * ) νC C + ν D D . Die νi sind ganze Zahlen und heißen stöchiometrische Koeffizienten, die wir links negativ und rechts positiv zählen werden, da wir annehmen, daß die Reaktion von links nach rechts 78 verläuft (A, B verschwinden, C, D entstehen), bevor ein chemisches Gleichgewicht besteht, in dem sich die mittleren Konzentrationen cA , cB , cC , cD nicht mehr ändern. Für jede chemische Reaktion definieren wir eine eigene Reaktionslaufzahl ξ. Bei Änderung von ξ um +1 sollen gemäß der Reaktion νi -Mole des Stoffes i entstanden (νi > 0) oder verschwunden (νi < 0) sein, also mit der Loschmidtschen Zahl L dNi = νi Ldξ . (27.1) Im folgenden wird immer Druck- und Temperaturgleichgewicht angenommen. Die Wärmetönung ∆qp der Reaktion bei konstantem Druck ist dann die Wärmeenergie bezogen auf die Teilchenzahl, die man zuführen (∆qp > 0 endotherm) oder abführen (∆qp < 0 exotherm) muß, um bei ∆ξ = 1 die Temperatur konstant zu halten. Die Gleichgewichtsbedingungen für das chemische Gleichgewicht (bei p, T konstant) folgen aus G = min unter einer Nebenbedigung (27.1) für jede chemische Reaktion. Dies liefert für jede Reaktion X i X ∂G ∂G dNi = νi Ldξ = 0 , ∂Ni i ∂Ni woraus wir folgern, daß für jede Reaktion im Gleichgewicht gilt X ν i µi = 0 . (27.2) i Werten wir diese Relationen für ideale Mischungen (Reaktionen in idealen Gasen oder verdünnten idealen Lösungen) aus: Für die Wärmetönung bei konstantem Druck können wir den 1. Hauptsatz anwenden. Für ideale Mischungen ist die Energieänderung ∆E = X i νi ei L∆ξ = L(∆qp − p X νi vi )∆ξ . i Wir schreiben hier auf die Teilchenzahl bezogene Größen ei , vi klein. Auf der rechten Seite der Energiebilanz muß außer der Wärmetönung auch die wegen p = const zugeführte Volumenarbeit berücksichtigt werden. Wir lösen nach ∆qp auf und erhalten ∆qp = X νi hi (T, p) , i wobei hi (T, p) die Enthalpie der reinen Komponente i ist. Die Gleichgewichtsbedingung werten wir für ideale Mischungen aus, indem wir ansetzen µi (T, p, c1 , c2 , . . .) = µi0 (T, p) + kB T ln ci . Wir erhalten damit aus (27.2) sofort für jede chemische Reaktion im System eine Gleichung Y i cνi i = exp − P i νi µi0 (T, p) kB T ! = Kc (T, p) (Massenwirkungsgesetz) , wobei die hiermit definierten Gleichgewichtskonstanten Kc (T, p) (für jede Reaktion eine eigene!) nur noch von Druck und Temperatur abhängen. Für die Druck- und Temperaturabhängigkeit von Kc (T, p) liefert die Gibbs-Duhem Relation 1 X ∂µi0 (T, p) ∂ ln Kc (T, p) 1 X ∆V =− =− νi νi vi = − ∂p kB T i ∂p kB T i RT T 1 X ∂(µi0 (T, p)/T ) ∂ ln Kc (T, p) µi0 1 X 1 ∂µi0 =− νi = νi − 2 ∂/T kB i ∂T kB T i T T ∂T p 79 ! , wobei ∆V die Volumenänderung bei ∆ξ = 1 ist und R = kB L die ideale Gaskonstante. Mit und ∂µi0 = −si ∂T µi0 + T si = hi X νi hi = ∆qp i bleibt schließlich ∆Qp ∂ ln Kc (T, p) , = ∂T RT 2 p wobei ∆Qp = L · ∆qp bedeutet. Durch Messung der Volumenänderung ∆V als Funktion des Druckes bei fester Temperatur T0 und der Wärmetönung ∆Qp bei festem Druck p als Funktion der Temperatur kann man die Gleichgewichtskonstante Kc (T, p) bis auf eine Konstante bestimmen aus ln 28 −1 Z p 1 ZT ∆Qp (T, p) Kc (p, T ) = . dp∆V (p, T0 ) + dT Kc (p0 , T0 ) RT0 p0 R T0 T2 Koexistenz von Phasen Am Beispiel der van der Waals Gleichung sahen wir, daß Teilchen in verschiedenen Phasen koexistieren. Betrachten wir das Gleichgewicht dieser Koexistenz unter Teilchenaustausch, wobei keine chemischen Reaktionen ablaufen sollen. 28.1 Wieviele Phasen können koexistieren? Sei k die Zahl der Stoffe oder Komponenten und p die Zahl der koexistierenden Phasen. Sei ferner ciq die Konzentration der Komponente i in der Phase q, P Niq ciq = Pk . j=1 Njq Pro Phase gibt es also wegen i ciq = 1 genau (k − 1) unabhängige Konzentrationen. Das System hat also 2 + p(k − 1) Variable, nämlich p, T und die ciq . Dem stehen die Gleichgewichtsbedingungen q = 1, 2, . . . , p µiq = µi i = 1, 2, . . . , k gegenüber, was nach Elimination der k unbekannten µi noch (p − 1)k unabhängige Gleichungen sind. Diese sind nicht überbestimmt, falls (p − 1)k ≤ 2 + p(k − 1) , woraus p≤k+2 folgt. Dies ist die Gibbssche Phasenregel. Die Differenz f = k + 2 − p gibt die Zahl der thermodynamischen Freiheitsgrade an. Z.B. für einkomponentige Systeme ist bei einer Phase 80 f = 2, d.h. p und T sind frei wählbar. Bei Koexistenz von zwei Phasen ist f = 1, d.h. es existiert eine Relation zwischen p und T , p = p(T ). Bei Koexistenz von 3 Phasen ist schließlich f = 0, d.h. p, T sind festgelegt (Tripelpunkt). Z.B. Phasendiagramm eines 1Komponenten-Systems Schmelzkurve p fest kritischer Punkt flüssig Tripel-Punkt Dampfdruckkurve gasförmig Sublimationskurve T Phasendiagramm eines 1-Komponentensystems Betrachten wir noch einige Beispiele von Phasendiagrammen: (i.) Koexistenz verschiedener Mischungen eines binären Systems kritischer Punkt T p = const Tc II I B A Koexistenz von 2 Phasen c 0 1c c1 1 Phasendiagramm einer binären Mischung T > Tc : Phase für 0 ≤ c1 ≤ 1, d.h. die Komponenten sind in beliebigem Verhältnis mischbar 81 T < Tc : Bei allmählicher Erhöhung von c1 angefangen bei c1 = 0 durchläuft man nacheinander: (a) Reine Phase I (reich an Komponente 2, arm an Komponente 1). Hier f = 3; (p, T, c1 ) sind beliebig variierbar. (b) Koexistenz von Phase I und Phase II, deren Zusammensetzung c1 , c2 durch die Koexistenzkurve bei gegebenem p, T (f = 2) festgelegt ist. (c) Reine Phase II (reich an Komponente 1, arm an Komponente 2) (ii.) Koexistenz binärer Mischungen in verschiedenen Aggregatzuständen (z.B. flüssig-gasförmig) p = const T T2 Taukurve Gas (f = 3) Koexistenz Siedekurve (f = 2) T1 Flüssigkeit (f = 3) 0 c 1 Gas c 1 flüssig 1 c 1 Koexistenz einer binären Flüssigkeit mit ihrem Dampf Die Deutung des Diagramms ist analog zum vorherigen Beispiel. Eine Mischung bei cf1 ` erzeugt bei Verdampfen einen Dampf mit cg1 + cf1 ` . Daher ändert sich die Konzentration in einer siedenden Mischung im Laufe der Zeit unter gleichzeitiger Änderung der Siedetemperatur. (iii.) Kompliziertere Phasendiagramme binärer Mischungen: Der Punkt E heißt eutektischer Punkt. Dort gilt f = 1, z.B. ist der Druck variierbar. 82 p = const T Gas f = 3 II + Gas I + Gas I flüssig f=3 f=2 f=2 II flüssig f=3 E eutektischer Punkt f=1 I + II f=2 c1 0 1 binäres System, das ich flüssig “nicht” mischt 28.2 Koexistenzkurven. Clausius Clapeyronsche Gleichung Betrachten wir die Koexistenz von 2 Phasen (1) und (2) in einem 1 komponentigen System, also f = k + 2 − p = 1. Längs der Koexistenzkurve gilt µ(1) (p, T ) = µ(2) (p, T ) ⇒ p = p(T ) . Durch Differentiation längs der Koexistenzkurve erhalten wir ∂µ(1) ∂µ(1) ∂µ(2) ∂µ(2) dp + dT = dp + dT . ∂p T ∂T p ∂p T ∂T p Für jede Phase gilt die Gibbs-Duhem Gleichung, wonach dµ = − also und wir erhalten V S dT + dp N N ∂µ = −s , ∂T p ∂µ =v ∂p T ∂p ∆s ∆S s(2) − s(1) = = , = (2) (1) ∂T koex v −v ∆v ∆V wobei ∆S= Entropieänderung pro Mol bei Umwandlung von Phase 1 nach 2. ∆V = Volumenänderung pro Mol bei dieser Umwandlung. Die Größe ∆S läßt sich auf verschiedene Weisen ausdrücken, z.B. 1 1 ∆S = ∆Qrev = ∆H , T T 83 wobei Qrev die Wärmemenge ist, die man bei reversibler Umwandlung eines Mols bei der Temperatur T und dem Druck p dem System zuführen muß. Daher gilt 1 ∆H dp ∆S = = dT koex ∆V T ∆V (Clausius Clapeyronsche Gleichung) . Betrachten wir einige Beispiele: (i.) Dampfdruckkurve: Das Volumen pro Teilchenzahl der flüssigen Phase kann gegen das der Gasphase vernachlässigt werden. ∆v = vGas − vFlßsig ≈ kB T p (vFlßsig vGas ) . Für die spezifische Verdampfungsenthalpie ∆h können wir ansetzen ∆h ≈ ∆h0 , wobei ∆h0 eine spezifische Bindungsenergie in der Flüssigkeit ist und näherungsweise als konstant betrachtet werden kann. Dann gilt ∆h0 p dp = dT kB T 2 ∆h0 p = const exp − kB T ; ! . Die Steigung der Dampfdruckkurve ist stets positiv, da ∆h > 0, ∆v > 0. Die spezifische Wärme vom Dampf in Koexistenz mit der Flüssigkeit unterscheidet sich drastisch von der reinen Dampfphase: Ckoex = =T ! d− Qrev dT ∂∆S ∂T p = ∆Cp − T =T koex d∆S dT ! koex ! ∂∆S dp +T ∂p T dT koex ∂∆V 1 ∆H . . ∂T T ∆V p Approximieren wir ∆V ≈ V , (∂∆V /∂T )p ≈ V /T (ideales Gas). so ergibt sich Ckoex = ∆Cp − ∆H . T Ckoex kann sogar negativ werden, falls nämlich ∆H > T ∆Cp , d.h. der Dampf wird dann heißer bei Entzug von Wärme, wenn nämlich der Wärmenentzug zur Kondensation in die Flüssigkeit führt und dabei mehr Wärme frei wird, als dem System entzogen wurde, was den Prozeß explosionsartig verstärken kann, falls nun noch mehr Wärme dem System entzogen wird. Offensichtlich ist es sehr wichtig, auf solche thermodynamischen Zusammenhänge zu achten, wenn man z.B. in Kraftwerken Unfälle vermeiden will! 84 (ii.) Schmelzkurve: Betrachten wir die Steigung dieser Kurve. ∆h > 0 für Übergang ‘fest−→flüssig’, aber > ∆v < 0 kommt beides vor, d.h. Schmelzkurven existieren mit positiver oder negativer Steigung. Insbesondere bei H2 O ist ∆v < 0 für ‘Eis−→Wasser’, denn Eisberge schwimmen, wie wir alle aus dem Film Titanic wissen, was wegen ∆h > 0 zu einer abfallenden Schmelzkurve führt. (iii.) Sublimationskurve: dp > 0. Der Verlauf der Da für ‘fest−→gasförmig’ stets ∆h > 0, ∆v > 0 ist immer dT Sublimationskurve ist ähnlich zu dem der Dampfdruckkurve nur viel steiler ansteigend, da die Sublimationswärme viel größer ist als die Verdampfungswärme. 29 Großkanonische Verteilung Eine einfache Verallgemeinerung der Rechnung die zu (14.1) führte liefert für Systeme mit Teilchenaustausch, für die N1 schwankt %1 (q1 . . . p3N1 , N1 ) = P 2 (E − H1 , N − N 1 ) Σ(E) und für die Energie und Teilchenzahlverteilung P (E1 , N1 ) = P 1 (E1 , N1 ) P 2 (E − E1 , N − N1 ) . Σ(E, N ) Das Maximum von P (E1 , N1 ) liefert die Gleichgewichtsbedingungen 1 1 = , T1 T2 die wir schon kennen, und zusätzlich P P ∂ ln 1 ∂ ln 2 = , ∂N1 ∂N2 die gleichbedeutend sind mit µ2 µ1 = . T1 T2 Entwickeln wir den Ausdruck für %1 um den Gleichgewichtspunkt und brechen schon nach dem linearen Glied ab (was erlaubt ist, falls Cv1 Cv2 und κT 1 hN1 i2 /V1 κT 2 hN2 i2 /V2 ), so erhalten wir %1 (q1 , . . . , p3N1 , N1 ) = 1 −β(H1 −µN1 ) e Zg (großkanonisches Ensemble) , wobei Zg aus der Normierung bestimmt ist Zg = X eβµN1 Z(β, V, N1 ) N1 85 und gleichzeitig mit der Zustandsdichte verknüpft ist über Zg = P Σ(E)e−β(hE1 i−µhN1 i) P = ∆E1 1 (hE1 i, hN1 i)e−β(hE1 i−µhN1 i) . 2 (E − hE1 i, N − hN1 i Daraus erhalten wir das sogenannte großkanonische Potential Ω(T, V, µ) −Ω(T, V, µ) ≡ kB T ln Zg = T S − hE1 i + µhN1 i = pV , wobei wir im letzten Schritt (24.1) verwendet haben. Man beachte, daß wegen der Extensivität von Ω und V und der Intensivität von p, T , µ die ganze V -Abhängigkeit von Ω = −V p(T, µ) im Faktor V steckt, während p nur noch von T und µ abhängt. Weiter folgt aus −dΩ = T dS + SdT − dE + µdN + N dµ, unter Benutzung von T dS = dE + pdV − µdN , daß ∂p ∂Ω ∂p ∂Ω ∂Ω = −V = −S ; = −p − V = −p ; = −N . ∂T V,µ ∂T V,µ ∂V T,µ ∂V T,µ ∂µ T,V Aus Zg bekommt man unmittelbar den Druck p= kB T ln Zg (β, V, µ) , V in den natürlichen Variablen T, µ. Weitere unmittelbar zugängliche Größen sind ∂ ln Zg ∂hEi 1 ∂ 2 ln Zg hEi = − , σE2 = − = = ∂β βµ,V ∂β βµ,V k B T 2 CV ∂β 2 βµ,V ∂ ln Zg ∂ 2 ln Zg ∂hN i 2 hN i = kB T = k T , σN = (kB T )2 . B ∂µ β,V ∂µ2 β,V ∂µ T,V Die letztere Größe ist interessant, weil sie uns die Breite der Teilchenzahlverteilung gibt. Durch Umformen von Ableitungen kann man zeigen ∂hN i hN i ∂hN i hN i2 κT = = ∂µ T,V V ∂p T,V V denn ∂hN i ∂p hN i ∂hN i ∂hN i = = ∂µ T,V ∂p T,V ∂µ T,V ∂p T,V V (nach Gibbs-Duhem) hN i2 hN i3 ∂(V /hN i) V ∂(hN i/V ) = − = hN i ∂p V V2 ∂p T,V T,V = hN i2 κT . V Wir stellen fest, daß 2 σN = kB T hN i2 κT ∼ N . V 86 Also ist σN /N ∼ N −1/2 wieder verschwindend klein, außer in der Nähe von kritischen Punkten, wo die isotherme Kompressibilität divergiert. Für ein ideales Gas ist 1 V 1 ∂V = = κT = − V ∂p T p hN ikB T 2 also σN = hN i: ein Ergebnis, das auf eine Poissonverteilung hinweist und das wir schon von § 1c her kennen. Für das van der Waals in der Nähe des kritischen Punkts und für T >Tc gilt ∼ p − pc = const 1 (vc − v)3 + const 2 (T − Tc )(vc − v) ∂p = −3const 1 (vc − v)2 − const 2 (T − Tc ) ∂v T woraus also 1 1 ∂v , ' κT = − v ∂p T 3vc (const 1 (vc − v)2 + const 2 (T − Tc )) 2 1 1 σN ∼ κT ∼ ∼ 2 N (vc − v) (p − pc )2/3 1 ∼ für v = vc folgt . T − Tc für T = Tc Man nennt Potenzgesetze in der Nähe des kritischen Punkts wie (p − pc ) ∼ (vc − v)δ oder 1 κT ∼ (T −T γ Skalengesetze und die Exponenten γ, δ (und eine Reihe weiterer ähnlicher c) Exponenten) “kritische Exponenten“. Experimentell haben diese nicht den von der van der Waals Gleichung und ähnlichen “mean-field“ oder “Molekularfeld“-Theorien vorhergesagten Wert, sondern weichen im 10%-Bereich davon ab. Dies wird durch die Theorie kritischer Phänomene erklärt, zu der öfters Spezialvorlesungen angeboten werden. 30 Ideale Quantengase Ideale Gase sind Gase von wechselwirkungsfreien Teilchen. Von Quantengasen sprechen wir, wenn die Unschärferelation eine wichtige Einschränkung darstellt, d.h. wenn ∆x · ∆px für 1/3 ein √ einzelnes Teilchen nicht mehr sehr viel größer als 2πh̄ ist. Mit ∆x ' (V /N ) , ∆px ' kB T · 2m ist also für Quantengase die Ungleichung λdB verletzt, wobei λdB = q 3 v u u t V /N 2πh̄2 mkB T die “thermische deBroglie Wellenlänge“ ist. Seien die Energieniveaus eines Teilchens εν . Hierbei sind die ν Quantenzahlen eines Teilchens. 87 Z.B. für ein Teilchen in einem kubischen Kasten der Länge L mit zyklischen Randbedingungen νx 2 2 h̄ kν 2π , kν = ν y . εν = 2m L νz Hier, wie auch im nächsten Beispiel, sind νxi , νyi , νzi ganzzahlige 1-Teilchen Quantenzahlen. Für ein Teilchen in einem harmonischen Fallenpotential gilt εν = h̄ (ωx (νx + 1/2) + ωy (νy + 1/2) + ωz (νz + 1/2)) oder für ein Elektron in einem Kristall mit Energiebändern gilt εν = ε` (k) , wobei ` die Energiebänder durchnumeriert und k Werte innerhalb der 1. Brillouin-Zone annimmt, die wie im ersten Beispiel quantisiert sind, wenn der Kristall ein endliches Volumen V ausfüllt. Meist sind nur zwei der Energiebänder von Interesse, das letzte gefüllte Band oder Valenzband und das erste ganz oder teilweise gefüllte Leitfähigkeitsband. In jedem Fall läßt sich die Energie des Systems schreiben als E= X ε ν nν , ν wobei die ganzen Zahlen nν die Zahl der Teilchen im 1-Teilchen-Zustand ν angibt. Die nν sind nun die mikroskopischen Variablen. Für Fermionen gilt das Pauli-Prinzip, welches besagt, daß nν = 0, 1 Pauli-Prinzip, Fermionen . Für Bosonen hingegen ist nν = 0, 1, 2, . . . . Weiter müssen wir unterscheiden zwischen masselosen Teilchen wie Neutrinos (Fermionen) und Photonen, Phononen auf der einen Seite und massiven Teilchen wie Elektronen, Atomen etc. auf der andern. Für masselose Teilchen kostet es keine Energie, um die Teilchenzahl zu verändern, d.h. die Teilchenzahl ändert sich von selbst und ist keine unabhängige Systemvariable. Anders für massive Teilchen: hier ist die Teilchenzahl eine Erhaltungsgröße, solange keine chemischen Reaktionen oder relativistische Teilchen-Erzeugungs- und Vernichtungsprozessedie Teilchenzahl ändern. Im Fall massiver Teilchen gilt also N= X nν massive Teilchen . ν Im großkanonischen Ensemble gilt %({nν }) = mit Zg = X {nν } 1 −β P (εν nν −µnν ) ν e Zg e−β P ν (εν −µ) 88 nν . Uns interessieren Größen wie pV = kB T ln Zg , die mittlere Teilchenzahl X hN i = ν hnν i und natürlich auch die mittleren Besetzungszahlen hnν i selbst; die mittlere Energie hEi = die Entropie X ν εν hnν i , ∂ hEi − µhN i S= kB T ln Zg = kB T ln Zg + ∂T T V,µ und z.B. bei Spin-behafteten Teilchen wie Elektronen die mittlere Magnetisierung hMi = X ν gµB sν hnν i , wobei sν der mit dem Zustand |νi verknüpfte Spineigenwert ist. All diese Größen ergeben sich durch Differentiation direkt aus Zg , das wir leicht auswerten aus Zg = YX e−βn(εν −µ) = (ν) n ln Zg = ∓ X ν Y (ν) ln 1 ∓ e −β(εν −µ) 1 ∓ e−β(εν −µ) ∓1 , wobei hier und im folgenden das obere (untere) Vorzeichen für Bosonen (Fermionen) gilt. Dann können wir nach εν differenzieren, um hnν i = − 1 1 ∂ ln Zg = β(εν −µ) β ∂εν e ∓1 zu erhalten. n (ε) kT µ ε Fermi-Dirac Verteilung bei endlicher Temperatur 89 Für massive Fermionen ist die Fermi-Energie εF als Funktion der Teilchenzahl definiert durch ν X ν Θ(εF − εν ) = N , woraus wegen limβ→∞ (eβ(εν −µ) + 1)−1 = Θ(µ − εν ) folgt µ(T = 0) = εF . Die mittlere Besetzungszahl hnν i = n(εν ) eines Zustands ν mit Energie εν gibt noch nicht die mittlere Zahl von Teilchen bei der Energie εν an, da letztere auch noch von der Zahl der Zustände bei der Energie εν abhängt. Die mittlere Zahl von Teilchen pro Volumeneinheit pro Energieeinheit ist N (ε) = g(ε)n(ε), wo g(ε)dε = Zahl der Zustände pro Volumeneinheit im Energieintervall dε (g(ε) = Zustandsdichte). Z.B. in einem Kristall ist die 1-Teilchen Zustandsdichte g(ε) für die Valenzelektronen qualitativ von der Form Fermiverteilung n(E) Zustandsdichte g(E) Isolator Halbleiter Metall n g g µ µ Valenzband µ E Leitungsband Fermi-Verteilung n und Zustandsdichte g in verschiedenen Typen von Festkörpern Daraus ergibt sich die mittlere Zahl von Elektronen pro Energieinheit als dN (ε) g(ε) = g(ε)n(ε) = β(ε−µ) . dε e +1 Die Fermi-Energie εF N = µ(T = 0, N ) ergibt sich aus N= X ν Θ(εF − εν ) = Z dεg(ε)Θ(εF − ε) = Z εF εv0 dεg(ε) , wobei εv0 der Boden des Valenzbandes und N die Zahl der Valenzelektronen ist. Liegt εF innerhalb eines Bandes, so hat man ein Metall. Ist dagegen das oberste Band gefüllt, das nächste leer, so hat man einen Isolator (falls die Bandlücke kB T ) oder einen Halbleiter (falls die Bandlücke <kB T ) vor sich. In einem reinen Kristall legt man dann εF per Defini∼ tion in die Mitte zwischen Valenz- und Leitfähigkeitsband. In einem dotierten Kristall gibt es auch zwischen den Bändern Energieniveaus durch Störstellen. Dann wird die Lage von εF bestimmt durch die Energie der gerade noch besetzten und der gerade nicht mehr besetzten Störstellen-Niveaus (Akzeptor-Niveaus falls die Fremdatome weniger Valenzelektronen haben, also Elektronen aus dem Valenzband aufnehmen können, und Donator-Niveaus falls die 90 Fremdatome zusätzliche Valenzelektronen haben, und Elektronen ans Leitungsband abgeben können). Mit der Zustandsdichte g(ε) schreiben sich die interessierenden Erwartungswerte R P durch Ersetzen von ν . . . → dεg(ε) . . . als pV = kB T hN i = hEi = Z Z Z g(ε)dε ln 1 + e−β(ε−µ) g(ε)dε 1 eβ(ε−µ)+1 g(ε)d(ε) ε eβ(ε−µ) + 1 etc. Im Fall masseloser Teilchen entfällt hN i als unabhängige Variable und wir setzen einfach µ = 0. Dies bedeutet den Übergang zum kanonischen Ensemble. Für εν kB T ist hnν i 1 und hnν i ' e−β(εν −µ) ist die klassische Boltzmann-Verteilung. Doch für εν − µ <kB T ist die quantenmechanische ∼ von der klassischen Verteilung wesentlich verschieden. 31 Freies Elektronengas Überraschend viele Eigenschaften von Metallen bei tiefen Temperaturen lassen sich verstehen, wenn man die Elektronen trotz ihrer Coulombwechselwirkung als ein Gas von wechselwirkungsfreien Teilchen auffaßt. Daß die Coulombwechselwirkung hier trotz ihrer Stärke und ihrer Langreichweitigkeit in vieler Hinsicht nur eine zweitrangige Rolle spielt, liegt an der Eigenschaft der Abschirmung: Die Elektronen bewegen sich vor einem Hintergrund von positiv geladenen Ionenrümpfen. Betrachten wir ein herausgegriffenes Elektron. Auf kurzen Abständen hat es eine stark abstoßende Wechselwirkung mit den anderen Elektronen, so daß in der unmittelbaren Umgebung des Elektrons mit geringer Wahrscheinlichkeit weitere Elektronen gefunden werden. Daher überwiegt in dieser Zone die positive Hintergrundladung. Die weiter entfernten Elektronen sehen daher nur die wegen der positiven Hintergrundladung abgeschirmte Ladung des Elektrons. Das Ergebnis ist eine sog. abgeschirmte Coulombwechselwirkung mit dem Potential U (r) = e2 e−κr /r, wobei 1/κ die Abschirmlänge ist. Die Vielteilchentheorie eines wechselwirkenden Coulombgases liefert dafür κ = (ne2 /kB T )1/2 . Damit erhält die effektive Wechselwirkung eine endliche Reichweite und kann in dieser Form in vielen Fällen als kleine Störung angesehen werden. Im folgenden betrachten wir daher ein wechselwirkungsfreies Elektronengas. P V R 3 h̄2 2 kν , falls kein Magnetfeld anliegt und ν . . . → 2 (2π) d k. Der Faktor 2 Hier ist εν = 2m 3 berücksichtigt die beiden verschiedenen Spineinstellungen pro Zustand. Wir erhalten hEi = 2 V (2π)3 Z d3 k hN i = 2 V (2π)3 Z d3 k V pV = 2 (2π)3 Z 3 h̄2 k 2 /2m 2 2 exp(β h̄2mk − βµ) + 1 h̄2 k 2 /2m 2 2 exp(β h̄2mk − βµ) + 1 d k ln 1 + e 91 2 2 −( βh̄2mk −µ) Z 2 2 ∞ 4πV 2 −( βh̄2mk −µ) = 2kB T dk k ln 1 + e (2π)3 0 Z 1 kB T V βh̄2 ∞ . dk k 4 = 2 2 3 k βh̄ π 3m 0 − βµ) + 1 exp( 2m Die auftretenden Integrale lassen sich durch Reihenentwicklung (z −1 exp(βh̄2 k 2 /2m) + 1)−1 = ∞ X (−z)n e−nβh̄ 2 2 k /2m n=1 mit z = eβµ und gliedweise Integration durch die “Fermifunktionen” fα (z) = ∞ X (−1)`+1 z ` 2 = `α Γ(α) `=1 Z ∞ 0 dx x2α−1 z −1 ex2 + 1 ausdrücken, und zwar kB T V f5/2 (eβµ ) λ3dB 3 V kB T 3 hEi = 2 f5/2 (eβµ ) = pV 3 2 λdB 2 V hN i = 2 3 f3/2 (eβµ ) . λdB pV = 2 Es gilt fα−1 = z∂/∂zfα (z). Die Größe z = eβµ heißt “Fugazität“ und wird oft anstelle von µ als unabhängige Variable benutzt. Hochtemperaturlimes z 1: Im klassischen Grenzfall wird µ negativ, dann wird also z klein. Mit der Reihenentwicklung für fα (z) ergibt sich 2 hN i = 3 V λdB eβµ − 1 2 e2βµ + . . . 3/2 λ3dB hN i 1 λ6dB hN i2 µ = kB T ln + 3/2 +... 2V 2 (2V )2 1 2βµ kB T βµ e − 5/2 e + . . . p=2 3 λdB 2 ! λ3dB hN i kB T hN i 1 + 5/2 +... . = V 2 (2V ) ! Im klassischen Grenzfall ergibt sich also die Zustandsgleichung des idealen Gases. Wegen der Kleinheit der Elektronenmasse ist jedoch ein Elektronengas in Metallen bei Zimmertemperatur schon ein Quantengas. ! hEi 3 λ3dB hN i = kB T 1 + 5/2 +... hN i 2 2 (2V ) ! 3 λ3dB hN i cV = kB 1 − 7/2 +... . 2 2 (2V ) 92 Tieftemperaturlimes z 1: Für T → 0 geht exp βh̄2 k 2 /2m − βµ + 1 und −1 → Θ(µ − h̄2 k 2 /2m) −1 ∂ h̄2 h̄2 ∂ 2 2 2 2 Θ(µ − h̄ k /2m) = − δ(µ − h̄2 k 2 /2m) . → − exp βh̄ k /2m − βµ + 1 2 ∂k 2m ∂µ 2m Daher findet man mit Hilfe von partieller Integration (oder direkt durch Benutzung der asymptotischen Entwicklungen) ! 4 ∂ π2 z f5/2 (z) = f3/2 (z) ' √ (ln z)3/2 + (ln z)−1/2 + . . . ∂z 3 π 8 ! 8 5π 2 5/2 1/2 f5/2 (z) ' √ (ln z) + (ln z) + . . . ): 15 π 8 ! 8 π2 1 3/2 3 hN i = √ +... (βµ) + λdB V 3 π 8 (βµ)1/2 π2 µ = εF (N ) 1 − 12 kB T εF (N ) !2 + . . . . µ / εF 1 kT/ ε 0 0.5 1.0 1.5 F -1 Chemisches Potential des Fermi-Gases Mit der von der Teilchendichte n-abhängigen Fermi-Energie (und dem zugehörigen FermiImpuls) !2/3 p2f 6π 2 N h̄2 ≡ , εF (N ) = 2m V (2s + 1) 2m wobei s der Spin ist, also s = 1/2 für Elektronen. ! kB T 8 5π 2 √ p=2 3 (βµ)5/2 + (βµ)1/2 + . . . λdB 15 π 8 ! 1 5π 2 2 εF (N ) +... 1+ = 5 v 12 β 2 ε2F (N ) 93 P Isochore V=const T Isochore des idealen Fermi-Gases ! 5π 2 3 3 εF (N ) hEi 1 1+ = p= +... 2 2 hN i 2 5 v 12 β εF (N ) !! kB T kB π 2 kB T 1 ∂E = 1+O cV = hN i ∂T V 2 εF (N ) εF Z T cV k2 π2 T S = dT = B +... hN i 2 εF (N ) 0 T Cv 3 NK 2 Cv ~ T/T F T Spezifische Wärme des idealen Fermi-Gases Für eine normale Fermiflüssigkeit geht also die spezifische Wärme cV → 0 und die Entropie s → 0 für T → 0 proportional zu T . Ein ideales Fermi-Gas hat selbst bei Temperatur T = 0 noch einen positiven Druck, der rein quantenmechanischer Natur und eine Folge des Pauli-Prinzips ist. 94 32 Paulischer Paramagnetismus des freien Elektronengases Ein freies Elektronengas (ideales Fermi-Gas) zeigt im homogenen Magnetfeld 2 verschiedene magnetische Effekte, die sich gegenseitig teilweise kompensieren: 1. Diamagnetismus: hervorgerufen durch die Quantisierung der Bahnbewegung auf Landau-Niveaus. 2. Paramagnetismus: hervorgerufen durch die Ausrichtung der Elektronenspins im Magnetfeld. Der 1-Teilchen Hamiltonoperator ist e 1 (p − A)2 − µ · B . 2m c Wir betrachten in diesem Abschnitt den Spin-Anteil, im nächsten Abschnitt den BahnAnteil. Also reduziert sich H auf H= p2 −µ·B 2m p2 1 eh̄ εps = − sgµ0 B s = ±1 , µ0 = , g = 2. 2m 2 2mc In Besetzungszahl-Darstellung X H= εp,s np,s H= p,s Großkanonische Zustandssumme: Zg = X e−β {n} = P YY p p,s (εps −µ)nps 1 + e−β(εps −µ) s −pV = Ω = −kB T ln Zg ≡ kB T = Ω0 (µ+ ) + Ω0 (µ− ) , XX s ln 1 + e−β(εps −µ) p wobei Ω0 (µ) das großkanonische Potential für B = 0 ist für eine Spineinstellung Ω0 (µ) = X p2 ln(1 + e−β( 2m −µ) ) p und µ± = µ ± µ 0 B . Wir haben als für die beiden Spineinstellungen gesonderte chemische Potentiale µ+ , µ− . ∂ 1 ∂ ln Zg = − (Ω0 (µ+ ) + Ω0 (µ− )) β ∂µ ∂µ ∂ ∂ =− Ω0 (µ+ ) − Ω0 (µ− ) ∂µ+ ∂µ− = hN+ i + hN− i hN i = 95 P mit hN± i = p hnp± i. Das Elektronengas verhält sich also wie 2 verschiedene Elektronengase mit 2 verschiedenen chemischen Potentialen entsprechend den Spineinstellungen. Für jedes einzelne der beiden Elektronengase gilt für T → 0 π2 µ± = εF (N± ) 1 − 12 h̄ = 2m kB T εF (N± ) !2 !2/3 6π 2 N± V Aus π2 1 − 12 + . . . kB T 2m h̄2 µ± ≈ εF (N± )(1 − h̄2 2µ0 B = 2m 6π 2 V π2 − 12 !2/3 " kB T 2m h̄2 2/3 2/3 N+ − 1 2/3 N+ 2/3 N− !2 − 1 2/3 N− M= π2 ( kB T ) 2 12 εF (N± ) !4/3 + . . . . + . . .) 2/3 (N+ − N− ) V 6π 2 1/3 Für |N+ − N− | 1 folgt Also V 6π 2 N± µ+ − µ− = 2µ0 B folgt für tiefe Temperaturen: !2 # 1 1 +... . − 2/3 2/3 N+ N− 2 N −1/3 = (N+ − N− ) 3 2 2 N −5/3 (N+ − N− ) . =− 3 2 µ0 (N+ − N− ) = χB V mit der Suszeptibilität 2µ2 2m V χ= 0 2 V h̄ 6π 2 2/3 π2 3µ20 N = 1− 2εF (N ) V 12 Für hohe Temperaturen 3 N 2 2 1/3 kB T εF (N ) π2 + 12 !2 2mkB T h̄2 !2 V 6π 2 4/3 N 2 + . . . . µ± ≈ kB T ln λ3 N ± V N± 1 ' 3 eµ± /kB T V λ V µ0 B V ≈ 2 3 eβµ N = N+ + N− = 3 eβµ 2 cosh λ kB T λ µ+ µ− µ0 µ0 (N+ − N− ' 3 e kB T − e kB T M= V λ 96 −5/3 −1 + . . . µ0 k µ T µ0 B e B 2 sinh 3 λ kB T µ0 N µ0 B 2 ≈ 2V kB T = also χ= µ20 N kB T V χ kT/E F 1 Paramagnetische Suszeptibilität χ als Funktion der Temperatur in Einheiten der Fermi-Energie 33 Diamagnetismus des freien Elektronengases Wir wissen, daß die einzelnen Elektronen quantisierte Landau-Niveaus einnehmen mit Energien p2 eh̄B ε(pz , `) = z + (` + 1/2) ` = 0, 1, 2, . . . 2m mc Jedes Landau-Niveau ist entartet, da es alle klassischen Kreisbahnen mit p2x + p2y eh̄B eh̄B ` < < (` + 1) (33.1) mc 2m mc enthält. Also ist der Entartungsgrad des `-ten Landau-Niveaus g` = 2 X px ,py 2L2 Z V 2/3 eh̄B = dp dp = 2 ≡ g. π2m x y 2 2 2 h mc (2π) h̄ (33.1) Großkanonische Zustandssumme: Zg = X {n} e −β P p,`,α (εp,` −µ)np,`α = X {n} e −βg P p,` (εp,` −µ)np,` α numeriert die g-entarteten Subniveaus von εp,` durch np,`,α ist die Besetzungszahl des Subniveaus α von εp,` . Wir erhalten wie üblich ln Zg = g X ln(1 + e−β(εp,` −µ) ) p,` Z +∞ ∞ p2 2V 2/3 eh̄B X L + eh̄B (`+1/2)−µ) −β( 2m mc = ). π · 2 dp ln(1 + e 2 2 c `=0 2πh̄ −∞ (2π) h̄ 97 Für hohe Temperaturen ergibt sich durch Entwicklung des Logarithmus unter dem Integral nach der Exponentialfunktion eh̄B V eh̄B q 1 2πmkB T e−β( 2mc −µ) ln Zg ≈ 4 3 π . eh̄B h c 1 − e− mc β Die Magnetisierung ist definiert durch hM i = + Für kleine B Daraus 1 ∂ ln Zg . βV ∂B 1 1 ln Zg ≈ 2V eβµ 3 1 − λ 6 eh̄ 2mc !2 2eβµ · 2 hM i = − 6 · k B T λ3 eh̄ 2mc !2 B kB T 2 + . . . . B = χdia B . Benutzen wir die Gleichung für hN i 2eβµ ≈ λ3 hN i V so erhalten wir das einfache Resultat, für kB T χdia hN i ≈− 3V kB T eh̄ 2mc eh̄B mc !2 1 = − χpara . 3 Wir schließen, daß der Paramagnetismus des Elektronengases zwar durch den entgegengesetzten Diamagnetismus abgeschwächt wird, aber überwiegt. Bei tiefen Temperaturen hängt χdia in unstetiger Weise, oszillatorisch, von B ab (DeHaas– VanAlphen-Effekt). Die unstetigen Änderungen treten immer dann auf, wenn ein LandauNiveau mit wachsendem B die Fermi-Energie überstreicht, da sich dann dieses oberste besetzte Landau-Niveau plötzlich entleert und sich damit die Besetzungszahl dieses Niveaus in unstetiger Weise ändert. Da g ∼ B zunimmt, gehen die Elektronen in die verbleibenden tiefer liegenden Landau-Niveaus. 34 Einige astrophysikalische Anwendungen der Theorie des idealen Fermi-Gases Wichtige Fermi-Gase sind: Elektronen in Metallen, Elektronen und Löcher in Halbleitern, Nukleonen in Atomkernen, Neutronen in Neutronensternen, Elektronen in weißen Zwergen, 3 He als Gas und Flüssigkeit. Eine wichtige Kenngröße für diese Systeme ist die Fermitemperatur εF h̄2 TF = = kB 2mkB 6π 2 2S + 1 98 !2/3 N V 2/3 . Sie hängt von der Masse der Fermionen ab (kleines m heißt großes TF ) und vor der Teilchendichte (große Teilchendichte heißt großes TF ). Typische Fermitemperaturen sind: Metall: Die Dichte der Leitungelektronen ist ca. 1 pro Gitterzelle (allgemein die chemische Wertigkeit des Metallatoms pro Gitterzelle) 1023 N ' , V cm3 TF ' 106 K Halbleiter: TF kann in Bereich der Zimmertemperatur liegen oder kleiner sein. Nukleonen in Atomkernen und Neutronen in Neutronensternen: TF ' 3 × 1011 K εF ' 30M eV , Elektronen in weißen Zwergen: 1030 N ' , V cm3 TF ' 1011 K εF ' 20M eV dies sind Sterne der Größe etwa der Sonne, deren Wasserstoff zu Helium fusioniert ist. % ' 107 g/cm3 , T ' 107 K TF . In flüssigem 3 He ist das mittlere Volumen pro Atom ca 46,3Å3 , woraus TF ' einige ◦ K folgt. Die Tatsache, daß Metallelektronen bei Zimmertemperatur entartete Fermi-Gase sind hat wichtige Konsequenzen: Der Beitrag der Metallelektronen zur spezifischen Wärme ist proportional zu T /TF und etwa um diesen Faktor kleiner, als der Beitrag des Gitters bei Zimmertemperatur. Wir werden sehen, daß der Beitrag des Gitters (der Phononen) verschwindet wie T 3 für T → 0. Dann dominiert der lineare Beitrag in T der Leitungselektronen. Um astrophysikalische Anwendungen zu betrachten, wollen wir das Fermi-Gas auch relativistisch behandelt, d.h. q εp = p 2 c2 + m 2 c4 . Die Energie des Grundzustands wird dann E0 = 2 X q p 2 c2 + m 2 c4 = |p|<pF 2V h3 Z pF 0 q 4πp2 dp p2 c2 + m2 c4 . Für pF mc: 2V E0 = 3 h ! 4π 3 4π p5F 4πV pF mc2 + + . . . = N · mc2 + 3 p5F + . . . 3 5 2m 5h m Für pF mc (hochrelativistischer Grenzfall) m4 c 5 1 p F E0 = 2 3 V π h̄ 4 mc 3π 2 N pF = h̄ V 4 !1/3 . 99 1 + 1 pF 2 mc + . . . Der Druck bei T = 0 ist m4 c 5 ∂F ∂E0 = p0 = − =− ∂V T =0 ∂V 12π 2h̄3 pF mc 4 1 − 1 pF 2 mc + . . . . Der Druck im Zentrum eines Sterns mit Radius R muß im Gleichgewicht die Gravitationsenergie pro Volumeneinheit aufwiegen, also mit der Gravitationskonstanten γ, p0 = α γM 2 mit einem dimensionslosen Proportionalitätsfaktor α = O(1) R4 (bei inkompressibler Materie und nicht-relativistischer Gravitation findet man z.B. α = 1/3 (3/8π)). Da pF ∼ NR und V ∼ R3 erhält man eine Gleichung der Form N 4/3 C2 R 2 C1 4 1 − 2/3 R N ! C3 N 2 = R4 mit C1 = π −2/3 35/3 c h̄(3π 2 )4/3 N 1/3 = ch̄ 4/3 12π 2 214/3 4π 3 C2 = 2/3 4π 3 2 2 h̄ (3π )2/3 m2 c 2 = π −2/3 3−4/3 24/3 m2 c 2 h̄2 C3 = αγm20 wobei m0 die Masse eines Nukleons (Proton oder Neutron) ist. Dagegen ist m die Masse desjenigen Teilchens, dessen Fermi-Entartung den stabilisierenden Druck liefert (Elektronenmasse bei weißen Zwergen, Neutronenmasse bei Neutronensternen). Die Lösung für R ist N 1/3 C3 2/3 1/2 √ R= 1− , N C1 C2 falls C1 3/2 . C3 Andernfalls gibt es keine stabile Gleichgewichtslage. Die Zahl N< C1 NC = C3 3/2 = 35/3 ch̄ 14/3 2/3 2 π αγm20 !3/2 ' ch̄ γm20 !3/2 gibt eine kritische Schranke an. Überschreitet die Teilchenzahl eines Sterns diese Schranke (Chandrasekhar-Schranke), so kollabiert er (Gravitationskollaps). Setzt man für m0 die Masse des Protons ein, so erhält man h̄c ' 1039 γm2p 100 und Mc = m 0 N c ' M Θ Sonnenmasse . Also: Massen, die wesentlich schwerer sind als die Sonne, können keine stabilen Sterne mehr bilden und kollabieren (Gravitationskollaps). Für kleinere Dichten genügt die nichtrelativistische Rechnung. Die Gleichgewichtsbedingung p0 = α liefert dann mit p0 = 2 2 pf 5 2mV γM 2 γm20 N 2 = α R4 R4 N 1 2 N 2 2 1/3 4π 3 h̄ (3π ) 5 2m 3 R 4π 3 !4/3 N R3 2/3 woraus N 1/3 R = C4 2 3(3π 2 )1/3 34/3 folgt, mit C4 = 5 2α4π(4π)4/3 γm20 N 2 =α R4 h̄2 γm m20 ! ' h̄2 γm m20 ! . Weiße Zwerge werden durch den Nullpunktsdruck des Elektronengases stabilisiert und bestehen hauptsächlich aus Helium, also m = mel m0 = mHe . Ihre Teilchendichte bei gegebener TeilchenzahlN ist also N ' R3 γm m20 h̄2 !3 N2 . Wird das stabilisierende Elektron durch Vergrößerung von N auf den Raum des Atomkerns eingeschränkt, bilden sich durch inversen β-Zerfall Neutronen, welche nun die Rolle des stabilisierenden Fermi-Gases übernehmen, d.h. nun ist m = mNeutron . Damit steigt die Gleichgewichtsdichte um einen Faktor mNeutron mel 3 ' 106 an, d.h. der Radius kollabiert auf 1/100 (Supernova) und es bildet sich ein Neutronenstern. Wird N weiter erhöht, bei wesentlich über 1039 hinaus, dann wird das Neutronengas extrem relativistisch und kann schließlich den Gravitationskollaps nicht mehr verhindern, wenn die Chandrasekhar-Grenze überschritten wird. Es bildet sich ein schwarzes Loch. 101 35 Thermische Strahlung: Photonengas Photonen sind die Teilchen eines Vektorfeldes und tragen daher den Spin 1. Allerdings haben sie wegen der Transversalität elektromagnetischer Wellen nur zwei Spineinstellungen, welche den beiden Polarisationsrichtungen von Licht entsprechen. Ihre Ruhemasse ist Null. Gemäß der speziellen Relativitätstheorie bewegen sich masselose Teilchen stets mit Lichtgeschwindigkeit, sind also stets relativistisch zu behandeln. Photonen werden bei Emission elektromagnetischer Strahlung frei erzeugt und bei Absorption vernichtet. Da für Photonen keine Teilchenzahlerhaltung gilt, ist die einzige Einschränkung, der das Gleichgewichtsensemble unterliegt, die Energieerhaltung, d.h. bei Energieaustausch ist im Gleichgewicht die Temperatur vorgegeben durch das Wärmebad und die Energie liegt nur im Mittel fest. hEi = X k h̄ωk hb+ kλ bkλ i . Hier sind bkλ und b+ kλ die Vernichtungs- und Erzeugungsoperatoren der Schwingungsquanten des Lichtfelds mit Wellenvektor k und Polarisationsindex λ (z.B. λ = + für rechtszirkular und λ = − für linkszirkular). Die Winkelfrequenz ωk = ck ist im Vakuum unabhängig von λ. Also gilt im Gleichgewicht für den statistischen Operator X 1 % = exp −β h̄ωk b+ kλ bkλ Z kλ ! . In Photonenzahldarstellung mit b+ kλ bkλ |{n}i = nkλ |{n}i gilt %= X W ({n})|{n}ih{n}| {n} 1 −β P h̄ωk nkλ kλ . e Z Die mittlere Besetzungszahl der Mode (q, κ) ist mit W ({n}) = hnqκ i = X = X 1 −β Pk,λ h̄ωk nkλ nq,κ e Z {n} nq,κ =− 1 −βh̄ωk nqκ e nq,κ Zq,κ 1 ∂ ln Zq,κ , h̄ωk ∂β 1 . 1 − e−βh̄ωq Damit ergibt sich die Plancksche mittlere Photonenzahl wobei Zqκ = hnqκ i = 1 eβh̄ωq −1 . Um die mittlere spektrale Energiedichte u(ω)dω der thermischen Strahlung zu bestimmen in einem (gegenüber der mittleren Wellenlänge) großen Volumen V = L3 , müssen wir die Moden im Frequenzintervall dω um ω abzählen. Ist ihre Anzahl V g(ω)dω, so ist u(ω) = h̄ω g(ω)dω . −1 eβh̄ω 102 Die Anzahl V g(ω)dω für großes V ist gleich dem doppelten (wegen der beiden Polarisationsrichtungen) Volumen 4πn2 dn im n-Raum, welches über k = 2π n dem Volumen der L Kugelschale im k-Raum entspricht, mit Radius |k| = ω/c und Dicke d|k| = dω/c. Also L V g(ω)dω = 2 2π 3 4π ω 2 dω . c2 c Das Volumen V hebt sich heraus, wie es für die Existenz des Grenzübergangs V → ∞ erforderlich ist, und wir erhalten für die Modendichte (Anzahl der Moden pro Volumen und Frequenzeinheit) der elektromagnetischen Strahlung g(ω)dω = ω2 dω . π 2 c3 Damit haben wir die Plancksche Strahlungsformel für thermische Strahlung abgeleitet. Das heute wichtigste Beispiel ist die elektromagnetische kosmische Hintergrundstrahlung mit T = 2.7 ◦ K. Bestimmen wir die mittlere Photonenzahl pro Volumeneinheit der thermischen Strahlung. Da keine Teilchenzahlerhaltung gilt, ist sie wie schon erwähnt kein unabhängiger Parameter, welcher den Gleichgewichtszustand einschränkt und festlegt, sondern sie ist eine eindeutige Funktion der Temperatur T , des einzigen Parameters, von dem (neben dem Volumen) der Gleichgewichtszustand abhängt: hN i = Z ∞ 1 X 1 . hnkλ i = g(ω)dω βh̄ω V k,λ e −1 0 Hierbei haben wir den Limes V → ∞ gebildet, in dem die diskrete Summe über k in ein Integral über das im Limes kontinuierliche Modenspektrum übergeht, mit der gerade bestimmten Modendichte g(ω). Durch Entwicklung der Planckschen Besetzungszahl in eine geometrische Reihe und Einführung der Integrationsvariablen nβh̄ω = x erhalten wir hN i 1 = 2 V π (βh̄c)3 Z ∞ 0 ∞ X 1 2 x e dx = 2 3 π n=1 n 2 −x kB h̄c !3 P T 3 ζ(3) , −p wo ζ(p) = ∞ die Riemannsche ζ-Funktion ist. Es ist ζ(3) = 1.202 . . . .. Für T → 0 n=1 n nimmt also die Photonenzahldichte proportional zu T 3 ab. 4 Die mittlere Energiedichte ergibt sich ganz analog in den folgenden Schritten mit ζ(4) = π90 1 X hEi = h̄ωk hb+ kλ bkλ i V V k,λ = = 1 X h̄ωk hnkλ V k,λ Z ∞ 0 g(ω) h̄ω dω −1 eβh̄ω ∞ 1 (kB T )4 Z ∞ 3 −x X x e dx = 2 3 4 π (h̄c) 0 n=1 n = 3! (kB T )4 2π 2 (kB T )4 ζ(4) = . π 2 (h̄c)3 30(h̄c)3 103 Die spezifische Wärme cv des Photonengases ist also 4kB π 2 ∂ hEi = cv = (kB T )3 3 ∂T V V 15(h̄c) und die Entropie S = V Z T 0 dT 0 cv (T 0 ) 8kB 2π 4 hN i 3 = ζ(4)(k T ) = . B T0 π 2 (h̄c)3 45 V Es ist interessant, sich die Entropiedichte des Weltalls aufgrund der kosmischen Hintergrundstrahlung zu überlegen, und diese mit der Nukleonendichte (∼ 1/m3 ) zu vergleichen, was ein Verhältnis von ca 109 ergibt. Das Ergebnis besagt, daß das Universum im Verhältnis zu seinem Materieinhalt eine enorm hohe Entropie besitzt. Würde man es adiabatisch wieder zurückkomprimieren auf eine mittlere Dichte, die der von normaler Materie entspricht, hätte die kosmische Hintergrundstrahlung eine Temperatur von T ∼ 1010 K. Den Druck des Photonengases finden wir schließlich aus 1 hEi ∂hEi =+ p=− . ∂V S 3 V Letztere Relation folgt auch aus der Elektrodynamik (z.B. indem man benutzt, daß der Druck der isotrope Anteil des Spannungstensors ist, und man den Maxwellschen Spannungstensor benutzt) 36 Phononengase Ein Festkörper aus N -Atomen (f = 3N ), bei kleiner Auslenkung aus den Ruhelagen, hat 3N -Normalschwingungen mit den Frequenzen ω1 , ω2 . . . ω3N . Die quantisierte Version dieser Normalschwingungen heißen Phononen. Ein Kristall mit einem Atom pro Elementarzelle besitzt nur akustische Phononen d.h. Gitterschwingungen, deren Frequenzen ω(k) gegen Null gehen für k → 0. Grenze der Brillouin-Zone Ω(k) k in eine feste Richtung im k-Raum Dispersionsrelation akustischer Phononen 104 Phononen sind ein Vektorfeld, haben also Spin 1. Die 3 Spineinstellungen entsprechen 3 unabhängigen Polarisationsrichtungen, eine longitudinale und zwei transversale. Die Dispersionsrelation für verschiedene Polarisationsrichtungen stimmen im allgemeinen nicht überein. Also hat man 3 Zweige von akustischen Phononen. Hat man einen Kristall mit mehreren Atomen pro Elementarzelle p Stück), so können diese Atome entweder miteinander, d.h. in Phase schwingen – was wieder zum 1-atomigen Fall zurückführt (also zu akustischen Phononen, oder sie schwingen gegeneinander, was zu optischen Phononen führt (3(p − 1) verschiedene Zweige) z.B. 2 Atome pro Elementarzelle (N aCl). Ω (k) Grenze der Brillouin-Zone optische Zweige akustische Zweige ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| k N/p diskrete Werte von k, z.B. (k 1, k 2, k3 ) = (2 π / L) (n 1, n2 , n3 ) Akustische und optische Phononen in einem Kristall aus N -Atomen mit Volumen L 3 und p = 2 Atomen pro Einheitszelle In einem endlichen Kristall mit N/p Einheitszellen: N/p diskrete k-Werte, kl = 2π l. Optische L Phononen haben eine Frequenzlücke ω0 bei k = 0. Sie sind für kB T h̄ω0 praktisch nicht angeregt. Bei tiefen Temperaturen sind also vor allem akustische Phononen wichtig, und hier vor allem langwellige akustische Phononen, für die ωs (k) = cS k. Der Hamiltonoperator in Besetzungszahl-Darstellung lautet H= XX n̂lλ + l λ 1 h̄ωλ (kl ) 2 in Zukunft ωλ (kl ) = ωlλ . Hierbei soll λ über alle 3p Phononenzweige laufen (akustische und optische). Wiederum gibt es keine Teilchenzahlerhaltung, da Phononen beliebig erzeugt und vernichtet werden: µ = 0. Zg = X = Y {n} exp −β e − 21 βh̄ωlλ l,λ X l,λ h̄ωlλ nlλ + 1 . 1 − e−βh̄ωlλ 1 2 Daraus hnlλ i + 1/2 = − 1 ∂ 1 1 ln Zg = βh̄ω + lλ h̄β ∂ωlλ e −1 2 105 hEi = E0 + X 1X h̄ωlλ . h̄ωlλ + βh̄ω 2 l,λ e lλ − 1 l,λ Spezifische Wärme X h̄ωlλ /kB T ∂hEi = kB Cv = ∂T eβh̄ωlλ − 1 l,λ 36.1 !2 eβh̄ωlλ . Einstein Näherung für optische Phononen: Die 1. Brillouin Zone wird durch eine Kugel um k = 0 mit gleichem Volumen (im k-Raum) ersetzt. Die Frequenz eines jeden optischen Zweiges wird durch eine Konstante ωEi ersetzt P (i = 1 . . . 3(p − 1)). Dann ist l ausführbar und gibt einfach die Zahl der Einheitszellen im Kristall an: N/p (p= Zahl der Atome pro Einheitszelle). Also Cv = 3(p−1) h̄ωEi ∂ N X · . βh̄ωEi ∂T p i=1 e −1 Jeder optische Zweig trägt also bei mit N h̄ωEi Cvi = k B p kB T !2 eh̄ωEi /kB T . (eh̄ωEi /kB T − 1)2 Man sieht, wie Cv exponentiell gegen 0 geht für T → 0. Die Näherung ωEi konstant zu setzen ist natürlich nur gut für enge optische Zweige. N h̄ωEi Cvi −→ kB p kB tT !2 e−h̄ωEi /kB T für T → 0 Wir sehen, wie der Beitrag optischer Phononen zur spezifischen Wärme exponentiell gegen N kB und Null geht für T → 0. Für T → ∞: Cvi → p X optische Zweige Cvi = 3p − 1 N kB p (Dulong-Petit) In diesem Limes ergibt sich also das Ergebnis des Gleichverteilungssatzes. 36.2 Debye Näherung für akustische Zweige: Die 1. Brillouin-Zone wird durch eine Kugel gleichen Volumens im k-Raum ersetzt (Radius kD ). Die Frequenz eines jeden akustischen Zweigs wird ersetzt durch ωkλ = cλ k . Bestimmen wir kD : Da X 1= Zahl der Einheitszellen im Kristall k = N p p = Zahl der Atome pro Einheitszelle 106 (Achtung: p nicht mit dem Druck verwechseln, der im folgenden nicht vorkommt), und X k 1→ Z kD V Z 3 V V 4π 3 2 d k = 4π k k dk = (2π)3 (2π)3 (2π)3 3 D 0 ist p 3 N = 2 kD V 6π kD = Debyesche Wellenzahl ωDλ = cλ kD = Debye Frequenz kB ΘDλ = h̄ωDλ : Debye Temperatur Dann erhält man für jeden akustischen Zweig λ den Beitrag zur spezifischen Wärme ∂ X h̄ωkλ ∂T k eβh̄ωkλ − 1 h̄cλ k ∂ V Z kD 4πk 2 βh̄c k = dk 3 ∂T (2π) 0 e λ −1 Cv(λ) = mit der Substitution x= h̄cλ k kB T V = 6π 2 N 3 pkD und wird daraus cv(λ) C (λ) T 3 = v = kB N p ΘDλ 3 Z ΘDλ /T 0 | T x4 e x 4π 4 kB dx → x 2 (e − 1) 5p ΘDλ {z } für T →0: 154 π4 3 . Für T → 0 erhält man für den Beitrag der akustischen Phonen zur spezifischen Wärme cv = mit Für T ΘD : 1 12π 4 T kB p 5 ΘD 3 3 1 1X 1 kB ΘD = h̄ωD = h̄c̄kD , ¯3 ≡ . 3 λ=1 c3λ c Cv → 3N kB p Dulong Petit Den Verlauf des Beitrags akustischer Phononen zur spezifischen Wärme eines Kristalls (für p = 1) zeigt die folgende Figur 107 ~ Typische Debye-Temperaturen sind: Eisen ΘD = 420 ◦ K mittlerer Wert C (Diamant) ΘD = 1860 ◦ K sehr hoch. Je härter ein Material, desto höher c̄ und damit auch ΘD . Vergleich der Debye Näherung für tiefe Temperaturen mit der Theorie des Photonengases: (1) Die mittlere Schallgeschwindigkeit tritt an die Stelle der Lichtgeschwindigkeit. (2) Ein zusätzlicher Faktor 2/3 tritt für das Photonengas auf, da ein Ast fehlt (es gibt keine longitudinalen Photonen). (3) Das Wellenzahl-Integral für das Photonengas geht nach ∞, nicht bis kD , da es keine Gitterstruktur des leeren Raumes gibt im Photonengas (mindestens nicht bis hin zu den kleinsten bis heute zugänglichen Längenskalen). D.h. im Kristall gibt es nur endlich viele (3N ) Gitterschwingungen, im Vakuum dagegen unendlich viele elektromagnetische Schwingungen (“Moden“ des elektromagnetischen Feldes). 37 Massives Bose-Gas und Bose-Einstein Kondensation (Literatur: K. Huang, Band II, Kapitel XII) Im Jahre 1924 sagten der (vorher völlig unbekannte) indische Physiker Bose, und später dadurch angeregt der damals schon weltberühmte Einstein die Kondensation eines idealen Gases bei tiefen Temperaturen in einen rein quantenmechanisch bestimmten Zustand, das Bose-Einstein Kondensat, voraus. Heute weiß man, daß nur Teilchen mit ganzzahligem Spin der von Bose und Einstein zuerst benutzten Statistik folgen, sie heißen daher Bosonen. Seit Boses und Einsteins Vorhersage gab es viele Versuche, die Bose-Einstein Kondensation im Labor zu realisieren oder beobachtete Systemeigenschaften damit in Verbindung zu bringen oder zu erklären. Doch erst 1995 gelang es kurz nacheinander zwei amerikanischen Gruppen, Bose-Einstein Kondensate in verdünnten, nahezu idealen Gasen von Alkaliatomen zu realisieren. Das Rennen gewann eine Gruppe um C. E. Wieman und E. A. Cornell am JILA in Boulder/ Colorado, denen es gelang, einige Tausend Rb87 -Atome im 5S1/2 , F = 2, 108 mF = −2 Zustand in einer Magnetfalle bis auf eine Temperatur von ca. 100nK abzukühlen, wobei Bose-Einstein Kondensation im quantenmechanischen Grundzustand der Falle bei TBE = 170nK beobachtet wurde. Dicht gefolgt wurde dieser Erfolg von einer Gruppe um W. Ketterle am MIT in Boston, die andere Magnetfallen und Na23 -Atome im 3S1/2 , F = 1, mF = −1 Zustand benutzen, die bis auf ca 2µK abgekühlt werden, wo sie ebenfalls ein BoseEinstein Kondensat bilden. In den MIT Experimenten handelt es sich um Kondensate von 106 −107 Atomen. Ein drittes etwa zeitgleiches Experiment mit Lithium Atomen (Li7 ) wurde von R. G. Hulet et al an der Rice University in Houston durchgeführt. Auch dieses Experiment zeigt inzwischen in klarer Weise Bose-Einstein Kondensation für die Atome im 2S1/2 , F = 2, mF = −2 Zustand. Während sich sowohl Rb-Atome als auch Na-Atome schwach abstoßen, ziehen sich Li-Atome schwach an, was für die Bose-Einstein Kondensation einen wichtigen Unterschied macht. Diese kurz nacheinander erzielten Erfolge beruhen auf experimentellen Fortschritten bei der Konstruktion von Magnetfallen, und der Kühltechnik für Atomgase in solchen Fallen. Die verwendete Kühltechnik ist eine Kombination von Laserkühlung, mit der Atome bis auf ca 100µK vorgekühlt werden, und anschließender Verdampfungskühlung auf die benötigte Endtemperatur. Die Realisierung von Bose Einstein Kondensaten im Labor hat das Interesse an der Theorie dieses Phänomens neu belebt – u.a. auch in meiner Arbeitsgruppe. Betrachten wir ein ideales Bose-Gas von Atomen der Masse m im thermodynamischen Gleichgewicht bei der Temperatur T in einem festen Volumen V , das wir zunächst als endlich voraussetzen. Wir nehmen der Einfachheit halber an, daß die Atome Spin S = 0 haben. Für den Hamiltonoperator X εk a+ H= k ak k und Nop = X a+ k ak k lautet das großkanonische Ensemble %G = 1 −β P a+ ak (εk −µ) k k e . ZG Es führt in der schon bekannten Weise auf die Plancksche mittlere Besetzungszahl hnk (β, µ)i = eβ(εk −µ) − 1 −1 . Da hnk i ≥ 0 für alle k gilt, und insbesondere auch für k = 0, muß für das massive ideale P Bose-Gas µ < ε0 sein. Zur Fixierung von µ (in D Dimensionen) ist hN i = k hnk i zu erfüllen. Unser Ziel ist es, die Besetzungszahl im energetisch tiefsten Einteilchenzustand k = 0, ε0 = 0 zu bestimmen. Daher spalten wir die Summe auf in hN i = hN0 i + mit hN0 i = z , 1−z X k6=0 hnk i z = eβµ = e−β|µ| , hnk i = z/(eβεk − z). Für endliches Volumen muß die Summe im allgemeinen numerisch ausgewertet werden. Doch 109 für kB T sehr viel größer als der größte Abstand benachbarter 1-Teilchenniveaus (der wie R P −2/3 V skalt) können wir zum Integral übergehen, k → dεg(ε). Es ist von einigem Interesse die folgende Diskussion für beliebige Dimension D zu führen, nicht nur für D = 3. Für ein D-dimensionales Volumen V = LD für Λ L, wobei Λ= q 2πh̄2 β/m die thermische deBroglie Wellenlänge ist, gilt X k V → (2π)D mit X k6=0 Z V SD−1 d k→ (2π)D D V g(ε) = 2 m πh̄2 hnk i = V SD−1 Z ∞ 0 SD−1 =V (2π)D Z D ∞ 0 dkk D−1 = Z ∞ 0 g(ε)dε D SD−1 ε 2 −1 , 1 k D−1 dk D −1 βε (2π) z e k − 1 2m βh̄2 !D/2 Z ∞ 0 xD−1 dx . z −1 ex2 − 1 Hierbei ist SD−1 das Volumen der (D −1)-Sphäre (d.h. der (D −1)-dimensionalen Oberfläche der D-dimensionalen Einheitskugel) SD−1 = 2π D/2 . (D/2 − 1)! Durch Entwicklung des Integranden in eine geometrische Reihe und Übergang zur Integrationsvariablen y = (n − 1)x2 erhalten wir hN i − hN0 i 1 = V (2π)D/2 D2 − 1 ! m βh̄2 !D/2 Z ∞ 0 D dye−y y 2 −1 ∞ X zn = Λ−D gD/2 (z) . (37.1) D/2 n n=1 Für D = 3 ist also g3/2 (z) relevant. Den Verlauf dieser Funktion zeigt die folgende Figur g 3/2 (z) 2.612 0 1 110 z Die Funktionenschar gp (z) ist definiert durch gp (z) = ∞ X zn p n=1 n (Re(p) > 1, |z| ≤ 1) . Für reelle p > 1 ist gp (z) auf der reellen z-Achse im Intervall 0 < z ≤ 1 monoton wachsend und erreicht seinen Maximalwert gp (1) = ζ(p)(p > 1) für z = 1, d.h. µ = 0. Die Funktionen gp (z) haben die folgenden asymptotischen Entwicklungen für z = e−α , α → 0: p = 1: p = 2: p > 0, Hier kann man das Integral exakt auswerten mit dem Ergebnis g1 (e−α ) = − ln(1 − e−α ) Asymptotisch für α → 0 gilt g2 (e−α ) ∼ ζ(2) − α(1 − ln α) + 0(α2 ) nicht ganzzahlig P (−α)k gp (e−α ) ∼ ζ(p) + Γ(1 − p)αp−1 + ∞ k=1 ζ(p − k) k! speziell für p = 3/2 g3/2 (e−α ) ∼ 2.612.. − 3.545..α1/2 + 1.460..α + 0(α)2 Man findet diese Darstellungen (die auch für die analytische Fortsetzung für α < 0 verwendet werden können) über die Mellin-Transformierte Gp (s) = Z ∞ 0 gp (e−α )αs−1 = ζ(p + s)Γ(s) , die in der komplexen s-Ebene definiert ist und deren Umkehrung gp (e−α ) = 1 2πi Z c+i∞ c−i∞ dsα−s ζ(p + s)Γ(s) , wobei der Integrationsweg s = c rechts aller Singularitäten von Gp (s) verläuft. D > 2: Liegt hN i/V unter einem kritischen Wert, so ist die Gleichung (37.1) lösbar und liefert z = e−β|µ| als Funktion von hN i/V . Dies ist für hinreichend hohe Temperaturen, oder bei jeder gegebenen Temperatur bei hinreichend kleinen Teilchenzahldichten, stets der Fall. Liegt jedoch die mittlere Teilchendichte hN i/V über dem temperaturabhängigen kritischen Wert Nc /V = ζ(D/2)/ΛD = const T D/2 , m 3/2 (für D = 3: Nc /V = 2.612 . . . ( 2πh̄ (kB T )3/2 ) der bis auf einen numerischen Faktor der 2) Größenordnung 1 gleich dem inversen deBroglie-Volumen ΛD ist, so ist µ = 0 und es sammeln sich alle überschüssigen Teilchen im 1-Teilchen Grundzustand k = 0, ε0 = 0 an. Dies ist die Bose-Einstein Kondensation. Es gibt im Prinzip zwei Möglichkeiten, in einem Bose-Gas die Bose-Einstein Kondensation zu erzwingen 1. Erniedrigung der Temperatur bei fester Teilchendichte unter die von der Teilchendichte abhängige kritische Temperatur k B Tc = N V ζ(D/2) 111 !2/D 2πh̄2 m oder 2. Erhöhung der Teilchendichte bei fester Temperatur über den temperaturabhängigen kritischen Wert Nc /V . Wegen z = 1 für T < Tc oder hN i > Nc ist hN i − hN0 i = V Λ −D T ζ(D/2) = Nc = hN i Tc D/2 , so daß wir hN0 i, im thermodynamischen Limes V → ∞, hN i/V fest, darstellen können in den Formen 0 T > Tc (hN i < Nc ) hN0 i D/2 = 1 − T hN i→∞ hN i = 1 − NNc T < Tc Tc lim (hN i > Nc ) Hier haben wir benutzt, daß z < 1 für T > Tc und daher limhN0 i/V = lim(z/V (1 − z)) = 0. Für großes aber endliches Volumen V (und entsprechend endliche Teilchenzahl hN i) erfährt der im Limes scharfe Übergang eine Abrundung, weil z nun über einen endlichen Übergangsbereich hinweg gegen 1 strebt. Isotherme in der (|µ|, hN i) Ebene bei endlichem Volumen In endlichen Systemen gibt es also keine vollkommen scharfe Phasenübergänge. Dies muß so sein, da in endlichen Systemen Mittelwerte keine Singularitäten aufweisen können. Um den Übergangsbereich aufzulösen, müssen wir die Bestimmungsgleichung für z ΛD hN i ΛD z = gD/2 (z) + V V 1−z (37.4) für endliches aber großes V lösen. Hierbei wird sich eine Lösung für z ergeben, die für hN i > Nc und 0 < (Nc − hN i)/hN i 1 dicht unter z = 1 liegt. Setzen wir also z = e−β|µ| = 112 1 − β|µ| + 21 β 2 µ2 + . . . und entwickeln obige Gleichung nach β|µ|, so nimmt sie die Form an für 2 < D < 4 ! D−2 ΛD 1 D |βµ| 2 + O(β|µ|) . +Γ 1− V β|µ| 2 √ Speziell für D = 3 ist z.B. Γ(1 − D/2) = −2 π < 0. Wir erhalten also glatte Isothermen c = F (β|µ|), die hier dargestellt sind. der Form hN i−N V Im Limes V → ∞, hN i/V fest, schmiegt sich diese Isotherme für D > 2 immer mehr der gestrichelten Kurve an falls µ = −|µ| 6= 0, wo also dann hN i > Nc in diesem Limes |µ| = 0 ist: D.h. im Limes V → ∞ ergibt sich wieder der scharfe Phasenübergang. Für D = 2 hat die Funktion gD/2 (z) die geschlossene Form Λ D hN i − Nc V = g1 (z) = − ln(1 − z) . In diesem Fall tritt auch im Limes V → ∞, hN i/V fest, keine Bose-Einstein Kondensation ein. Die Gleichung (37.4) ist nämlich selbst im Grenzfall V → ∞, in dem der letzte Term auf der rechten Seite N0 /V gegen 0 tendiert, für beliebig große Teilchendichten immer lösbar. i Im Grenzfall Λ2 hN 1 ergibt sich z.B. das Ergebnis V −βµ ' e− Λ2 hN i V D=2, womit die Besetzungszahl im Grundzustand asymptotisch geht wie N0 ' e Λ 2 hN i/V D=2, so daß N0 /hN i = 0 im thermodynamischen Limes V → ∞, hN i/V = const . Im ganzen Bereich D ≤ 2 tritt keine Bose-Einstein Kondensation auf. Zwar ist gD/2 (z) nicht in geschlossener Form bekannt, doch kann man für ΛD hN i/V die asymptotische Entwicklung für z → 1 benutzen, und wir erhalten im thermodynamischen Limes Λ D hN i V D 'Γ 1− 2 woraus −βµ ' Γ 1− D 2 ΛD hN i V 1 (β|µ|)1−D/2 2 2−D ∼ 1 N0 D<2, D<2 folgt. Kehren wir nun zum Fall D = 3 im thermodynamischen Limes zurück und diskutieren dessen thermodynamische Eigenschaften 1. Fugazität z = eβµ : Für T < Tc , N > Nc ergab sich z = 1. Für T > Tc ist der Beitrag des Grundzustands in Gl. (37.4) im thermodynamischen Limes vernachlässigbar, und wir erhalten für z → 1 Λ3 hN i − Nc ' −2Γ(1/2)(ln z −1 )1/2 + O(ln z −1 ) V !2 3 Λ (N − hN i) T > Tc c √ z = eβµ ' exp − hN i < Nc 2 πV 113 P 2. Energie E = k εk hnk i: Beim Übergang zum Integral braucht in diesem Fall, im Gegensatz zur Berechnung der mittleren Teilchenzahl, der Grundzustand nicht abgespalten zu werden, da er selbst im Bose-Einstein kondensierten Zustand nicht zur Energie beiträgt (ε0 = 0). Die Auswertung des Integrals nach der schon bekannten Methode liefert hEi = 3 2 V g (z) βΛ3 5/2 T > Tc , hN i < Nc V g (1) 2 βΛ3 5/2 T < Tc , hN i > Nc 3 . Durch Differentiation nach V , bei festgehaltenen Besetzungszahlen der 1-Teilchenzustände, und nach T bei konstanten V , gewinnen wir aus diesem Ergebnis den Druck und die spezifische Wärme cV . 1 ∂hEi ∂hEi . |s , c V = p=− ∂V V ∂T V Aus den Energieeigenwerten E{n} = X 2π 2 L n folgt mit L = V 1/3 h̄2 n2 nn 2m ∂E{n} 2 |{n} = − E{n} . ∂V 3V Daher gilt 1 2hEi βΛ p= = 3V 1 3 g5/2 (z) T > Tc , hN i < Nc g (1) βΛ3 5/2 T < Tc , hN i > Nc Die Isothermen sind im folgenden dargestellt. p Übergangskurve A B T Isothermen bei BEC 114 . Die Übergangskurve, zunächst in der (T, P )-Ebene, erhalten wir, indem wir z = 1 setzen. Sie ist gegeben durch kB T m p= 3 g5/2 (1) = (kB T )5/2 Λ (T ) 2πh̄ 3/2 g5/2 (1) . Auch im Bose-Einstein kondensierten Gebiet hN i/V > (N/V )c sind sämtliche Isochoren (Kurven mit V =const) durch diese eine Kurve gegeben, wobei die Isochoren dann aber bei der jeweiligen kritischen Temperatur Tc (N/V ) enden, während auf der Übergangskurve hN i/V = Nc (T )/V nicht konstant bleibt, sondern sich T -abhängig einstellt. In der (V, p)-Ebene ergibt sich die Übergangskurve aus Tc = Tc (N/V ) als hN i V p= !5/3 2πh̄2 ζ(5/2) . m (ζ(3/2))5/3 Die explizite Form der Isothermen für V /hN i > (V /N )c in der Nähe der Übergangskurve folgt aus der asymptotischen Darstellung von g5/2 (z) und g3/2 (z) für z → 1, g5/2 (z) ' ζ(5/2) − ζ(3/2)(1 − z) + O (1 − z)3/2 für die Isothermen ergibt sich !2 !3 N − hN i Λ3 (Nc − hN i) 1 c . √ + O ζ(5/2) − ζ(3/2) p' βΛ3 2 πV V Um die spezifische Wärme cV aus hEi zu berechnen, brauchen wir die Ableitung ∂g5/2 (z) ∂T ! N V dg5/2 (z) = dz ∂z ∂T ! . N V Allgemein gilt dgn (z)/dz = gn−1 (z)/z. Um auch (∂z/∂T )N/V zu bestimmen, lösen wir die Identität ! ! ∂(N/V ) ∂z 1 3 1 0= = g3/2 (z) + 3 g1/2 (z) ∂T 2 Λ3 T Λ z ∂T N N V V nach der gesuchten Größe auf. Damit erhalten wir schließlich h 15 V 3 4 Λ g5/2 (z) − CV = kB 15 2 3 (g3/2 (z)) 5 g1/2 (z) V ζ(5/2) 4 Λ3 i T > Tc . T < Tc Durch Anwendung der asympotischen Entwicklungen ist es wieder möglich CV auch für T > Tc explizit als Funktion von T darzustellen. 115 3 2 - ~ T Spezifische Wärme als Funktion der Temperatur Die Entropie schließlich kann durch die Integralbeziehung S= Z T 0 dt CV T ausgewertet werden. Für T < Tc ergibt sich wegen CV ∼ T 3/2 unmittelbar 5 hEi 2 S = CV = 3 3 T T < Tc . Die spezifische Wärme CV (T ) hat bei T = Tc eine Singularität, nämlich einen Sprung in der (g (z))2 asymptotisch entwickelt und Ableitung, der sich berechnen läßt, indem g5/2 (z) − 53 g3/2 1/2 (z) nach T differenziert wird, unter Benutzung des schon hergeleiteten Ausdrucks für dz/dT . 38 Molekularfeldtheorie kritischer Phänomene (Literatur: W. Brenig, Kapitel 43, 44, 45) 38.1 Phasenübergänge 1. und 2. Ordnung Wir kennen schon die verschiedenen Phasen fest, flüssig, gasförmig. Im festen Zustand gibt es weitere unterschiedliche Phasen, die sich bezüglich anderer Eigenschaften unterscheiden, z.B. verschiedene Kristallarten ein und derselben Substanz, ferromagnetische, antiferromagnetische, ferroelektrische, supraleitende Phasen. Verschiedene Phasen unterscheiden sich durch Symmetrien, z.B. zeichnet die ferromagnetische und auch die antiferromagnetische Phase eine bestimmte Richtung (die Richtung der Magnetisierung (Ferromagnet) oder der alternierenden Magnetisierung (Antiferromagnet) aus. Innerhalb einer Phase sind alle Zustandsänderungen immer stetig, ohne Singularitäten. Phasenübergänge sind natürlich Übergänge zwischen verschiedenen Phasen. Diese können unstetig in ersten Ableitungen der freien Enthalpie (Phasenübergänge 1. Ordnung) oder stetig in diesen ersten Ableitungen der freien Enthalpie verlaufen (Phasenübergänge 2. Ordnung). Nehmen wir an, ein Phasenübergang verläuft zwischen zwei Phasen A,B, von denen die Phase A weniger symmetrisch sei als B, und zwar so, 116 daß A nur noch eine Untersymmetrie von B aufweist. Z.B. sei in B keine Richtung ausgezeichnet, d.h. man hat volle Rotationssymmetrie, während in A eine Richtung ausgezeichnet sei, so daß A nur noch Rotationssymmetrie um eine Achse in der Vorzugsrichtung besitzt. Dies ist eine Untersymmetrie der Symmetrie in B, d.h. die Symmetriegruppe von A ist eine Untergruppe der Symmetriegruppe von B. Dann muß der Phasenübergang von A nach B (und von B nach A) stetig verlaufen, denn am Übergangspunkt muß die Symmetriegruppe von A mit der von B übereinstimmen, was nur dann sein kann, wenn ein Parameter in A am Übergangspunkt stetig gegen 0 geht, womit A stetig in B übergeht. Solche stetigen Phasenübergänge, d.h. Phasenübergänge 2. Ordnung, treten an sog. kritischen Punkten oder an Linien von kritischen Punkten auf. Ein Beispiel ist der flüssig-gasförmige Übergang. Er ist unstetig (1. Ordnung) für T < Tc . D.h. am Phasenübergang ändert sich z.B. das spezifische Volumen unstetig. Für T = Tc ist dagegen die Änderung des spezifischen Volumens bei p = pc stetig, der Phasenübergang ist dort von 2. Ordnung. Ein anderes Beispiel ist ein Ferromagnet. Liegt kein äußeres Magnetfeld an, so ist oberhalb der Curie-Temperatur Tc keine Vorzugsrichtung ausgezeichnet. Kühlt man ab, so hat das System bei Tc einen kontinuierlichen Phasenübergang, bei dem spontan eine Magnetisierung hMi entsteht, die bei T = Tc Null ist, aber für T ≤ Tc stetig von Null auf einen endlichen Gleichgewichtswert anwächst. Legt man dagegen ein äußeres Magnetfeld an, so ist für T < Tc die Magnetisierung eine unstetige Funktion des äußeren Magnetfeldes, da sie sich sprunghaft ändert, z.B. von +|Mz | zu −|Mz |, wenn das Magnetfeld in z-Richtung stetig reduziert wird, so daß es sein Vorzeichen wechselt. Der Phasenübergang ist nun 1. Ordnung. Das Verhalten von Systemen in der Umgebung von kritischen Punkten ist besonders faszinierend: Wie kommt es zur spontanen Symmetriebrechung? Wie findet das System in der weniger symmetrischen Phase z.B. seine Vorzugsrichtung? Man kann erwarten, daß große Fluktuationen auftreten werden, wenn das System hin- und hergerissen ist zwischen den verschiedenen Möglichkeiten, die alle gleichberechtigt sind, bis es sich schließlich für eine wie auch immer entscheidet. Die physikalischen Phänomene, die dabei auftreten, nennt man kritische Phänomene. Hier behandeln wir diese in einer einfachen, aber nur im 10% Bereich richtigen Theorie: der Molekularfeldtheorie. 38.2 Molekularfeldtheorie Betrachten wir einen uniaxialen Ferromagneten mit Hamiltonfunktion (für Spin 1/2) H = −µB gB X n sz (n) − 1 X Jnn0 sz (n)sz (n0 ) . 2 hn,n0 i (38.1) Wegen der Wechselwirkung handelt es sich um kein 1-Teilchen Problem mehr. Die Idee der Molekularfeldtheorie ist es, das Problem (38.1) durch ein effektives 1-Teilchenproblem zu ersetzen, indem man jeden Spin im effektiven Feld alle übrigen Spins betrachtet. Dabei müssen allerdings Fluktuationen vernachlässigt werden. Mit − 12 X Jnn0 sz (n)sz (n0 ) hn,n0 i '− 1 X 1 X (Jnn0 hsz (n)isz (n0 ) + Jnn sz (n)hsz (n0 )i) + Jnn0 hSz (n)ihSz (n0 )i 2 hn,n0 i 2 hn,n0 i 117 =− 1 J hM i2 hM i X sz (n) + J µB gN n 2 (µB g)2 N wobei J= X Jnn0 hM i = N hsz (n)i µB g , n0 erhalten wir näherungsweise ! V hM i X sz (n) + W H ' Heff = −µB g B + W V 2 n wobei W = hM i V !2 J . n(µB g)2 Der letzte Term in Heff ist unabhängig von der Spinvariablen sz (n) und fällt in der kanonischen Verteilung bei der Normierung weg. Für dieses 1-Teilchenproblem können wir nun die mittlere Magnetisierung berechnen aus hM i = N µB g und erhalten sz (n) −βHeff e Z {sz (n)} X " hM i hM i = µB gN tanh βµB g B + W V !# , was wir nach B auflösen können kB T B= artanh µB g hM i µB gN ! −W hM i V M Ms M∞ T T= c T>Tc T<Tc B -M∞ Magnetisierung in der Molekularfeld-Theorie Am kritischen Punkt gilt ∂B ∂2B =0 , =0 ∂M ∂M 2 was hM ic = 0, kB Tc = (µB g)2 nW = J ergibt. Auch die van der Waalssche Zustandsgleichung ist eine Molekularfeldtheorie: Jedes Atom 118 bewegt sich im Potentialfeld aller anderen, was zu einer globalen Verringerung des effektiven Volumens führt v → v − b, wegen der harten Kerne der Atome (Parameter b), und zu einer Erhöhung des effektiven Drucks p → p + a/v 2 wegen der globalen attraktiven Wechselwirkung. An die Stelle des “Ordnungsparameters“ hM i/V tritt die Teilchendichte n − nc , an die Stelle der zugehörigen “generalisierten Kraft“ B (mit dF = BdhM i) tritt das chemische Potential µ (mit dF = µd(n − nc )). Für das van der Waals Gas gilt V # " bn λ3 (T )n + − 2an . µ = kB T ln dB 1 − bn 1 − bn Am kritischen Punkt gilt ∂2µ ∂µ =0 , =0 ∂n ∂n2 was nc = 1/(3b), kB Tc = 8a/(27b) ergibt, und aufgetragen. Entwickeln wir um den kritischen Punkt: 9 µ − µc (T ) = 2aτ (n − nc ) + ab2 (n − nc )3 2 wobei " λ3 µc (T ) = kB T ln dB 2b T −1 τ= Tc und ! # 1 2a + − 2 3b M 2 W M . + B = Wτ V 3(nµB )2 V Die Dichte der freien Energie in der Nähe des kritischen Punktes hat dann die Form, wegen ∂f ∂f µ = ∂n , bzw. B = ∂(M/V . Hier ist f definiert als f = F/V und nicht wie früher in Kap. 21 ) als f = F/N . Also nf (Kap. 21)−→ f . f = f0 + µc (t)(n − nc ) + aτ (n − nc )2 + bzw. f = f0 + Führen wir f˜ ein mit µ − µc (T ) = W M τ 2 V ∂ f˜ , ∂n 2 + W 12(µB n)2 9 2 ab (n − nc )4 8 M V 4 . dann ist 9 f˜ = f0 + aτ (n − nc )2 + ab2 (n − nc )4 8 Als nächstes betrachten wir die Verallgemeinerung auf den inhomogenen Fall: Addieren wir a`2 (∇n)2 /2 bzw. W `2 (∇hM i/V )2 /2 zur freien Energiedichte. Höhere Gradiententerme sind natürlich auch möglich, werden aber bei langwelligen Schwankungen kleiner sein. ` ist eine Länge und parametrisiert die Reichweite der Wechselwirkung. Führen wir allgemein ein Ordnungsparameter-Feld ϕ(x) ein mit ϕ2 (x) = 2 2 a` (n − nc ) /kB Tc W `2 M 2 /(V 2 kB Tc ) 119 dann schreibt sich die freie Energie als F − F 0 = k B Tc Z κ g 1 d x (∇ϕ)2 + ϕ2 (x) + ϕ4 (x) − hϕ(x) 2 2 4 3 mit κ = τ /`2 ξ = `/|τ |1/2 , wobei h= , τ= T − Tc Tc (µ − µc ) · const B · const Die Entropie S = −∂F/∂T erhält man, wenn man nach der T -Abhängigkeit in κ differenziert als kB Z S − S 0 = − 2 ϕ2 d 3 x . 2` 38.3 Molekularfeldtheorie kritischer Phänomene Der Ordnungsparameter ϕ fluktuiert mit der Wahrscheinlichkeitsverteilung W ({ϕ}) ∼ exp(−F ({ϕ})/κB T ). Wir vernachlässigen jedoch die Fluktuationen und ersetzen Mittelwerte durch wahrscheinlichste Werte, die sich aus F = min, d.h. δF = 0 ergeben. Bei Variation δϕ(x) ergibt δF = 0 δF = kB Tc Z n o d3 xδϕ(x) −∇2 ϕ + κϕ + gϕ3 − h = 0 . Also h(x) = (κ − ∇2 )hϕi + ghϕi3 . Für h=0 hϕi = 0 r hϕi = ± |κ| g =± r ,κ>0 |τ | `2 g ,κ<0 spontane Symmetriebrechung hϕi ist stetig bei T = Tc . Für die Entropie kB V |τ | T < Tc 2`4 g ! ! ∂S ∂S kB V − = 4 . ∂T T →Tc −0 ∂T T →Tc +0 2` g S − S0 = − ∆C = Die spezifische Wärme macht einen Sprung. Kritische Isotherme: Für T = Tc gilt h = ghϕi3 . Daher erhält man für die Suszeptibilität für T = Tc χ= 1 ∂hϕi 1 1 = ∂h = = 1/3 2/3 2 ∂h 3ghϕi 3g h ∂hϕi 120 d.h. χ divergiert für h → 0 wie h−2/3 . Suszeptibilität bei räumlich inhomogenem Feld δh(r) = Z d3 k ik·x e δh(k) . (2π)3 Durch Fouriertransformation Für k → 0 δh(k) = (k 2 + κ + 3ghϕi2 )δϕ(k) ≡ χ−1 (k)δϕ(k) 1 T > Tc k2 +κ χ(k) = 1 T < Tc k 2 +2|κ| χ(k) → χ(0) = 1 κ T > Tc 1 2|κ| T < Tc Für Ferromagneten ist dies das Curie-Weissche Gesetz, das also für alle Phasenübergänge 2. Ordnung (in Molekularfeldnäherung) gilt. 2 2 2 −1/2 Für k 6= 0: χ(k) = q hängt nur von k /κ = ξ k ab, wobei ξ = |κ| `/ |τ | die für T → Tc divergierende Korrelationslänge im System ist. Die Divergenz der Korrelationslänge am kritischen Punkt ist gewissermaßen die “Ursache“ für die am kritischen Punkt auftretenden Singularitäten. Insbesondere ist dies auch der Grund für das Anwachsen der Streuintensität von Licht am kritischen Punkt. 38.4 Ginzburg-Kriterium Aber sind Fluktuationen wirklich vernachlässigbar? Betrachten wir zunächst die Fluktuationen von ϕ(x) = hϕ(x)i + δϕ(x). Wegen T δ ln Z Tc δh(x) 2 δ 2 ln Z T 2 h(δϕ(x)) i = lim x0 →x Tc δh(x0 )δh(x) δhϕ(x)i ' lim 0 x →x δh(x0 ) = lim χ(x − x0 ) 0 hϕ(x)i = x →x = 1 (2π)d Z dd kχ(k) . (38.2) Wir benutzen hier einen für die Theorie kritischer Phänomene wichtigen Trick: Wir untersuchen das Problem zunächst in beliebigen Dimensionen d. In das Integral (38.2) setzen wir 1 χ(k) = 2 k + |κ| 121 ein, wobei = 1 für T > Tc oder = 2 für T < Tc ist. Also h(δϕ)2 i = 1 1 Z kc d d k 2 . d (2π) 0 k + |κ| Dabei ist kc = (Gitterkonstante)−1 ein “Cut-off“, der von den mikroskopischen Gitterstruktur des Systems herrührt. Das Integral konvergiert bei k = 0 auch für |κ| = 0, falls d − 1 − 2 > −1, also d > 2 ist – auch untere kritische Dimension genannt. Nun wollen wir untersuchen, wann diese Fluktuationen in der eigentlich vorliegenden exakten MittelwertGleichung 1 T h= 2 − 1 hϕi + ghϕ3 i ` Tc vernachlässigbar sind, so daß näherungsweise, wie in der Molekularfeldtheorie angenommen, hϕ3 i ' hϕi3 gilt, d.h. die bisher betrachtete Gleichung in Molekularfeldnäherung (in der wir nun κm statt κ schreiben) 1 h' 2 ` T −1 Tcm hϕi + ghϕi3 ≡ κm hϕi + ghϕi3 . Mit ϕ = hϕi + δϕ gilt für kleine Gaußsche Fluktuationen hϕ3 i ' hϕi3 + 3hϕihδϕ2 i, wobei wir hδϕ3 i vernachlässigt haben. Also h= 1 `2 T − 1 + 3ghδϕ2 i hϕi + ghϕi3 ≡ κhϕi + ghϕi3 . Tcm Jetzt sehen wir, daß sich die wirkliche kritische Temperatur, definiert durch das Verschwinden des neuen Vorfaktors κ von hϕi, etwas verschiebt durch die Fluktuationsbeiträge, und zwar ist Tc = 1 − 3g`2 hδϕ2 (Tc )i . Tcm Diese Verschiebung macht die Molekularfeldtheorie noch nicht ungültig. Um sie verläufig zu retten, müssen wir nur die kritische Temperatur Tc als verschieden von Tcm zulassen. Führen wir also τ = TTc − 1 als neue reduzierte Temperatur ein. Dann lautet unsere durch kleine Fluktuationsbeiträge korrigierte Zustandsgleichung 1 h= 2 ` T Tc −1 + 3g hδϕ2 (T )i − hδϕ2 (Tc )i hϕi + ghϕi3 . Tc Tcm Unser Koeffizient κ ist durch den Vorfaktor von hϕi gegeben. Er geht nun auch in die Formel 1 für χ(k) = k2 +|κ| und für hδϕ2 i ein. Also haben wir die Beziehung Z kc Tc 1 3g 1 1 T d −1 + d k − κ= 2 ` Tc Tcm (2π)d k 2 + |κ| k 2 Z kc Tc 1 T 3g|κ| 1 = 2 −1 − dd k 2 . d ` Tc Tcm (2π) (k + |κ|)k 2 ! Allerdings: Nur wenn das Integral konvergiert für |κ| → 0 ergibt sich wirklich κ ∼ TTc − 1 im Einklang mit der Molekularfeldtheorie. Dies ist erfüllt für Dimension d > 4. In Dimension 122 d < 4 dagegen bricht die Molekularfeldtheorie hinreichend dicht am kritischen Punkt (also für kleine |τ |) zusammen. Wie dicht darf man an τ = 0 herangehen, ehe das passiert? Offenbar muß gelten (Ginzburg Kriterium) 3g (2π)d bzw. für τ → 0 Z kc 0 dd k k 2 (k 2 1 1 + |κ|) d 3g|τ /`2 | 2 −2 · J 1 wobei (wohl gemerkt für d < 4) J= Z ∞ 0 dd x 1 x2 (x2 + ) eine Konstante ist. Für d = 3 also wird der kritische Bereich, in dem die Molekularfeldtheorie versagt, umso enger, je größer `2 ist (langreichweitige Wechselwirkung) und je kleiner g ist. Innerhalb des kritischen Bereichs muß die Molekularfeldtheorie durch die moderne Renormierungsgruppentheorie kritischer Phänomene ersetzt werden (siehe Z.B. D. J. Amit, Field Theory, the Renormalization Group, and Critical Phenomena, McGraw-Hill, Düsseldorf 1978). 123